You are on page 1of 890

Principi di Matematica ed Economia1

Erio Castagnoli Massimo Marinacci Elena Vigna

1 Dicembre 2011

1 Appunti per uso esclusivo degli studenti del corso di Matematica generale dellUniversit
Bocconi. Queste note servono per integrare gli appunti presi a lezione e non sostituiscono in
alcun modo il libro di testo. Si tratta di appunti e in quanto tali saranno via via aggiornati e
corretti (invitiamo gli studenti a segnalarci ogni sErio errore). Ringraziamo Simone Cerreia-
Vioglio, Margherita Cigola, Fabio Maccheroni e Fabio Tonoli per i loro preziosi commenti.
2
Indice

I Strutture 15
1 Insiemi e numeri 17
1.1 Insiemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.1 Sottoinsiemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.2 Operazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.3 Propriet delle operazioni . . . . . . . . . . . . . . . . . . . . . 23
1.2 Numeri: introduzione intuitiva . . . . . . . . . . . . . . . . . . . . . . . 25
1.3 Struttura degli interi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.3.1 Divisori e algoritmi . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.3.2 Numeri primi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.4 Struttura dordine di R . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.4.1 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.4.2 Estremi superiore e inferiore . . . . . . . . . . . . . . . . . . . . 42
1.4.3 Densit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.5 Potenze e logaritmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.5.1 Potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.5.2 Potenze con esponente reale . . . . . . . . . . . . . . . . . . . . 47
1.5.3 Logaritmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.6 Numeri, dita e circuiti . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.7 La retta reale estesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2 Struttura cartesiana e Rn 57
2.1 Prodotti cartesiani e Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.2 Operazioni in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.3 Struttura dordine in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.4 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4.1 Incertezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4.2 Scelte statiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4.3 Scelte intertemporali . . . . . . . . . . . . . . . . . . . . . . . . 67
2.5 Ottimi secondo Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.5.1 Scatola di Edgeworth . . . . . . . . . . . . . . . . . . . . . . . . 71

3
4 INDICE

3 Struttura lineare 77
3.1 Sottospazi vettoriali di Rn . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.2 Indipendenza e dipendenza lineari . . . . . . . . . . . . . . . . . . . . . 80
3.3 Combinazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.4 Sottospazi generati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.5 Basi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.6 Basi di sottospazi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.7 Titoli nanziari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

4 Struttura euclidea 97
4.1 Valore assoluto e norma . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.1 Prodotto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.2 Valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.3 Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.2 Ortogonalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

5 Struttura topologica 107


5.1 Distanze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.2 Intorni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.3 Tassonomia dei punti di Rn . . . . . . . . . . . . . . . . . . . . . . . . 113
5.3.1 Punti interni e di frontiera . . . . . . . . . . . . . . . . . . . . . 113
5.3.2 Punti di accumulazione . . . . . . . . . . . . . . . . . . . . . . . 116
5.4 Insiemi aperti e chiusi . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.5 Stabilit insiemistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
5.6 Insiemi compatti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.7 Chiusura e convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6 Far di conto: Analisi combinatoria 129


6.1 Generalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.2 Permutazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.3 Disposizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.4 Combinazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
6.5 Binomio di Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

II Funzioni 139
7 Funzioni 141
7.1 Il concetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
7.2 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2.1 Incertezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2.2 Scelte statiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2.3 Scelte intertemporali . . . . . . . . . . . . . . . . . . . . . . . . 153
7.3 Propriet generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
INDICE 5

7.3.1 Controimmagini e curve di livello . . . . . . . . . . . . . . . . . 154


7.3.2 Algebra delle funzioni . . . . . . . . . . . . . . . . . . . . . . . . 160
7.3.3 Composizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
7.4 Classi di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
7.4.1 Funzioni iniettive, suriettive e biiettive . . . . . . . . . . . . . . 163
7.4.2 Funzioni inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
7.4.3 Funzioni limitate . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7.4.4 Funzioni monotone . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.4.5 Funzioni separabili . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.5 Funzioni elementari su R . . . . . . . . . . . . . . . . . . . . . . . . . . 176
7.5.1 Polinomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
7.5.2 Funzioni esponenziali e logaritmiche . . . . . . . . . . . . . . . . 177
7.5.3 Funzioni trigonometriche e periodiche . . . . . . . . . . . . . . . 179
7.6 Domini e restrizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
7.7 Funzioni biiettive e cardinalit . . . . . . . . . . . . . . . . . . . . . . . 186
7.7.1 Cardinalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
7.7.2 Un vaso di Pandora . . . . . . . . . . . . . . . . . . . . . . . . . 191

8 Applicazione: funzioni di insieme e probabilit 195


8.1 Misure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
8.2 Probabilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
8.3 Variabili aleatorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
8.4 Probabilit semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
8.5 Utilit attesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
8.6 Lotterie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
8.7 Atti o lotterie? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

9 Successioni 213
9.1 Il concetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
9.2 Lo spazio delle successioni . . . . . . . . . . . . . . . . . . . . . . . . . 216
9.3 Applicazione: scelte intertemporali . . . . . . . . . . . . . . . . . . . . 218
9.4 Immagini e classi di successioni . . . . . . . . . . . . . . . . . . . . . . 218
9.5 Limiti: esempi introduttivi . . . . . . . . . . . . . . . . . . . . . . . . . 221
9.6 Limiti e comportamento asintotico . . . . . . . . . . . . . . . . . . . . 221
9.6.1 Convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
9.6.2 Divergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
9.6.3 Limiti per eccesso e per difetto . . . . . . . . . . . . . . . . . . 226
9.6.4 Topologia di R e denizione generale di limite . . . . . . . . . . 226
9.7 Propriet dei limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
9.7.1 Monotonia e convergenza . . . . . . . . . . . . . . . . . . . . . . 230
9.7.2 Algoritmo di Erone . . . . . . . . . . . . . . . . . . . . . . . . . 231
9.7.3 Il Teorema di Bolzano-Weierstrass . . . . . . . . . . . . . . . . . 234
9.8 Algebra dei limiti e limiti notevoli . . . . . . . . . . . . . . . . . . . . . 236
6 INDICE

9.8.1 Le (molte) certezze . . . . . . . . . . . . . . . . . . . . . . . . . 236


9.8.2 Alcuni limiti notevoli . . . . . . . . . . . . . . . . . . . . . . . . 239
9.8.3 Forme di indeterminazione . . . . . . . . . . . . . . . . . . . . . 240
9.8.4 Tabelle riassuntive . . . . . . . . . . . . . . . . . . . . . . . . . 243
9.8.5 Ma quante sono le forme di indeterminazione? . . . . . . . . . . 244
9.9 Criteri di convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
9.10 La condizione di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . 250
9.11 Il numero di Nepero . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
9.12 Ordini di convergenza e di divergenza . . . . . . . . . . . . . . . . . . . 255
9.12.1 Equivalenza asintotica . . . . . . . . . . . . . . . . . . . . . . . 258
9.12.2 Terminologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
9.12.3 Scale di inniti . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
9.12.4 La formula di De Moivre-Stirling . . . . . . . . . . . . . . . . . 263
9.12.5 Distribuzione dei numeri primi . . . . . . . . . . . . . . . . . . . 264
9.12.6 Termine di errore . . . . . . . . . . . . . . . . . . . . . . . . . . 267
9.13 Successioni in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
9.14 Valori limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272

10 Applicazione: prezzi e aspettative 277


10.1 Un mercato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
10.2 Ritardi nella produzione . . . . . . . . . . . . . . . . . . . . . . . . . . 279
10.3 Formazione delle aspettative . . . . . . . . . . . . . . . . . . . . . . . . 280
10.4 Pigre, ma corrette . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
10.5 Aspettative razionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
10.6 Convergenza dei prezzi . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
10.7 Aspettative adattive . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

11 Serie numeriche 293


11.1 Il concetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
11.1.1 Tre classiche serie . . . . . . . . . . . . . . . . . . . . . . . . . . 295
11.1.2 Utilit intertemporale con orizzonte innito . . . . . . . . . . . 297
11.2 Propriet elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
11.3 Serie con termini positivi . . . . . . . . . . . . . . . . . . . . . . . . . . 298
11.3.1 Criterio di convergenza del confronto . . . . . . . . . . . . . . . 298
11.3.2 Criteri di convergenza del rapporto: preludio . . . . . . . . . . . 304
11.3.3 Criteri di convergenza del rapporto . . . . . . . . . . . . . . . . 305
11.3.4 Criteri di convergenza della radice . . . . . . . . . . . . . . . . . 309
11.3.5 Potenza del criterio della radice . . . . . . . . . . . . . . . . . . 311
11.3.6 Un primo sviluppo in serie . . . . . . . . . . . . . . . . . . . . . 313
11.4 Serie con termini di segno qualsiasi . . . . . . . . . . . . . . . . . . . . 315
11.4.1 Convergenza assoluta . . . . . . . . . . . . . . . . . . . . . . . . 315
11.4.2 Rivisitazione dei criteri di convergenza . . . . . . . . . . . . . . 318
11.4.3 Serie con i segni alternati . . . . . . . . . . . . . . . . . . . . . . 319
INDICE 7

11.4.4 Il criterio di condensazione di Cauchy . . . . . . . . . . . . . . . 321


11.5 Serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
11.6 Propriet associativa e commutativa . . . . . . . . . . . . . . . . . . . 325
11.6.1 Incidenti storici . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
11.6.2 La retta via . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
11.7 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
11.7.1 Rappresentazione dei numeri . . . . . . . . . . . . . . . . . . . . 332
11.7.2 Applicazione alla teoria degli insiemi . . . . . . . . . . . . . . . 334

12 Limiti di funzioni 337


12.1 Esempi introduttivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
12.2 Funzioni scalari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
12.2.1 Limiti bilaterali . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
12.2.2 Limiti unilaterali . . . . . . . . . . . . . . . . . . . . . . . . . . 348
12.2.3 Relazioni tra limiti unilaterali e bilaterali . . . . . . . . . . . . . 350
12.2.4 Gran nale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
12.3 Funzioni di vettore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
12.4 Propriet dei limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
12.5 Algebra dei limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359
12.5.1 Forme di indeterminazione . . . . . . . . . . . . . . . . . . . . . 359
12.6 Limiti elementari e limiti notevoli . . . . . . . . . . . . . . . . . . . . . 361
12.6.1 Limiti elementari . . . . . . . . . . . . . . . . . . . . . . . . . . 361
12.6.2 Limiti notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
12.7 Ordini di convergenza e di divergenza . . . . . . . . . . . . . . . . . . . 364
12.7.1 Equivalenza asintotica . . . . . . . . . . . . . . . . . . . . . . . 366
12.7.2 Terminologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368
12.7.3 Il solito bestiario . . . . . . . . . . . . . . . . . . . . . . . . . . 369

13 Funzioni continue 371


13.1 Discontinuit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375
13.2 Operazioni e composizione . . . . . . . . . . . . . . . . . . . . . . . . . 378
13.3 Zeri ed equilibri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
13.3.1 Zeri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
13.3.2 Equilibri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
13.4 Teorema dei valori intermedi . . . . . . . . . . . . . . . . . . . . . . . . 383
13.5 Monotonia e continuit . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
13.6 Limiti e continuit delle applicazioni . . . . . . . . . . . . . . . . . . . 385
13.7 Continuit uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387

III Analisi lineare e non lineare 391


14 Funzioni e applicazioni lineari 393
14.1 Funzioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
8 INDICE

14.1.1 Denizione e prime propriet . . . . . . . . . . . . . . . . . . . 393


14.1.2 Rappresentazione . . . . . . . . . . . . . . . . . . . . . . . . . . 395
14.1.3 Monotonia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396
14.2 Matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
14.2.1 Operazioni tra matrici . . . . . . . . . . . . . . . . . . . . . . . 399
14.2.2 Prodotto tra matrici . . . . . . . . . . . . . . . . . . . . . . . . 402
14.2.3 Applicazione: matrice di Leontie . . . . . . . . . . . . . . . . . 406
14.3 Applicazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
14.3.1 Denizione e prime propriet . . . . . . . . . . . . . . . . . . . 407
14.3.2 Rappresentazione . . . . . . . . . . . . . . . . . . . . . . . . . . 410
14.3.3 Matrici e operazioni . . . . . . . . . . . . . . . . . . . . . . . . 411
14.4 Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
14.4.1 Applicazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . 413
14.4.2 Rango di matrici . . . . . . . . . . . . . . . . . . . . . . . . . . 417
14.4.3 Propriet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
14.4.4 Procedimento gaussiano di eliminazione . . . . . . . . . . . . . . 422
14.5 Applicazioni invertibili . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
14.5.1 Invertibilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
14.5.2 Matrici inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
14.6 Determinanti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
14.6.1 Denizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
14.6.2 Propriet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
14.6.3 Teorema di Laplace . . . . . . . . . . . . . . . . . . . . . . . . . 436
14.6.4 Inverse e determinanti . . . . . . . . . . . . . . . . . . . . . . . 441
14.6.5 Procedimento di Kronecker . . . . . . . . . . . . . . . . . . . . 444
14.7 Sistemi lineari quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . 446
14.8 Sistemi lineari generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
14.9 Risoluzione di sistemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
14.9.1 Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
14.9.2 Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456
14.10Il Teorema fondamentale della Finanza . . . . . . . . . . . . . . . . . . 459
14.10.1 Portafogli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
14.10.2 Intermezzo: Il Teorema di Hahn-Banach . . . . . . . . . . . . . 461
14.10.3 Valore di mercato . . . . . . . . . . . . . . . . . . . . . . . . . . 463
14.10.4 Legge del prezzo unico . . . . . . . . . . . . . . . . . . . . . . . 464
14.10.5 Arbitraggio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467
14.10.6 Teorema di rappresentazione dellarbitraggio . . . . . . . . . . . 470
14.10.7 Calcolo dei prezzi di non arbitraggio . . . . . . . . . . . . . . . 472
14.10.8 Rendimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475
INDICE 9

15 Funzioni concave 477


15.1 Insiemi convessi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477
15.1.1 Politopi e poligoni . . . . . . . . . . . . . . . . . . . . . . . . . 479
15.1.2 Coni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
15.2 Funzioni concave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485
15.3 Propriet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490
15.3.1 Funzioni concave e insiemi convessi . . . . . . . . . . . . . . . . 490
15.3.2 Disuguaglianza di Jensen e continuit . . . . . . . . . . . . . . . 494
15.4 Funzioni quasi concave . . . . . . . . . . . . . . . . . . . . . . . . . . . 497
15.5 Principio di diversicazione . . . . . . . . . . . . . . . . . . . . . . . . 501
15.6 Rischio e concavit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
15.6.1 Unicit e cardinalit . . . . . . . . . . . . . . . . . . . . . . . . 505
15.6.2 Avversione al rischio . . . . . . . . . . . . . . . . . . . . . . . . 507
15.6.3 Premio al rischio . . . . . . . . . . . . . . . . . . . . . . . . . . 510
15.7 Gran nale: lequazione di Cauchy . . . . . . . . . . . . . . . . . . . . 512
15.7.1 Varianti notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . 513
15.7.2 Capitalizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . 515

16 Funzioni omogenee 519


16.1 Omogeneit e rendimenti di scala . . . . . . . . . . . . . . . . . . . . . 519
16.2 Omotetia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524
16.3 Omogeneit e quasi concavit . . . . . . . . . . . . . . . . . . . . . . . 526

17 Problemi di ottimo 529


17.1 Generalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529
17.1.1 La fortuna del principiante . . . . . . . . . . . . . . . . . . . . . 533
17.1.2 Propriet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535
17.1.3 Consumo e produzione . . . . . . . . . . . . . . . . . . . . . . . 536
17.2 Esistenza: Teorema di Weierstrass . . . . . . . . . . . . . . . . . . . . . 542
17.3 Esistenza: Teorema di Tonelli . . . . . . . . . . . . . . . . . . . . . . . 545
17.3.1 Coercivit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545
17.3.2 Supercoercivit . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
17.4 Estremi locali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
17.5 Concavit e quasi concavit . . . . . . . . . . . . . . . . . . . . . . . . 553
17.6 Consumo e produzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 556
17.6.1 Consumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556
17.6.2 Produzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 557
17.7 Assicurazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558
17.8 Minimi quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
17.8.1 Sistemi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
17.8.2 Statistica descrittiva . . . . . . . . . . . . . . . . . . . . . . . . 562
17.9 Proiezioni e approssimazioni . . . . . . . . . . . . . . . . . . . . . . . . 565
17.9.1 Teorema della proiezione . . . . . . . . . . . . . . . . . . . . . . 565
10 INDICE

17.9.2 Proiezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567


17.9.3 Minimi quadrati e proiezioni . . . . . . . . . . . . . . . . . . . . 569
17.10Approfondimento semicontinuo . . . . . . . . . . . . . . . . . . . . . . 571

IV Calcolo dierenziale 577


18 Derivate 579
18.1 Denizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 579
18.1.1 Osservazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582
18.2 Interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . . . . 582
18.3 Funzione derivata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586
18.4 Derivate unilaterali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586
18.5 Derivabilit e continuit . . . . . . . . . . . . . . . . . . . . . . . . . . 588
18.6 Derivate delle funzioni elementari . . . . . . . . . . . . . . . . . . . . . 589
18.7 Algebra delle derivate . . . . . . . . . . . . . . . . . . . . . . . . . . . . 591
18.8 La regola della catena . . . . . . . . . . . . . . . . . . . . . . . . . . . 595
18.9 Derivata di funzioni inverse . . . . . . . . . . . . . . . . . . . . . . . . 596
18.10Formulario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599
18.11Dierenziabilit e linearit . . . . . . . . . . . . . . . . . . . . . . . . . 601
18.11.1 Dierenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602
18.11.2 Dierenziabilit e derivabilit . . . . . . . . . . . . . . . . . . . 604
18.11.3 Dierenziabilit e continuit . . . . . . . . . . . . . . . . . . . . 605
18.12Derivate di ordine superiore . . . . . . . . . . . . . . . . . . . . . . . . 606

19 Derivazione parziale 609


19.1 Generalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 609
19.1.1 Ceteris paribus: utilit e produttivit marginali . . . . . . . . . 616
19.2 Dierenziale totale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617
19.3 Regola della catena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 620
19.4 Derivate parziali di ordine superiore . . . . . . . . . . . . . . . . . . . . 621
19.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625
19.5.1 Teorema di Dini . . . . . . . . . . . . . . . . . . . . . . . . . . . 625
19.5.2 Saggi marginali . . . . . . . . . . . . . . . . . . . . . . . . . . . 630
19.5.3 Estensioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633

20 Propriet dierenziali 637


20.1 Estremi e punti critici . . . . . . . . . . . . . . . . . . . . . . . . . . . 637
20.1.1 Preambolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637
20.1.2 Teorema di Fermat . . . . . . . . . . . . . . . . . . . . . . . . . 638
20.1.3 Punti stazionari . . . . . . . . . . . . . . . . . . . . . . . . . . . 640
20.1.4 Problemi di ottimo libero . . . . . . . . . . . . . . . . . . . . . 641
20.2 Teorema del valor medio . . . . . . . . . . . . . . . . . . . . . . . . . . 642
20.3 Monotonia e derivabilit . . . . . . . . . . . . . . . . . . . . . . . . . . 646
INDICE 11

20.3.1 Monotonia scalare . . . . . . . . . . . . . . . . . . . . . . . . . . 646


20.3.2 Monotonia vettoriale . . . . . . . . . . . . . . . . . . . . . . . . 650
20.4 Una condizione su ciente per estremi locali . . . . . . . . . . . . . . . 651
20.4.1 Ricerca di estremi locali . . . . . . . . . . . . . . . . . . . . . . 654
20.4.2 Ottimi liberi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656
20.5 Teorema e regola di de lHospital . . . . . . . . . . . . . . . . . . . . . 657
20.5.1 Forme di indeterminazione 0=0 e 1=1 . . . . . . . . . . . . . . 657
20.5.2 Altre forme di indeterminazione . . . . . . . . . . . . . . . . . . 660
20.5.3 Dimostrazione del Teorema di de lHospital . . . . . . . . . . . . 662

21 Approssimazione 665
21.1 Approssimazione polinomiale di Taylor . . . . . . . . . . . . . . . . . . 665
21.2 Proposizione omnibus per estremi locali . . . . . . . . . . . . . . . . . . 673
21.3 Procedura omnibus di ricerca di estremi locali . . . . . . . . . . . . . . 675
21.3.1 Caso di funzioni due volte derivabili . . . . . . . . . . . . . . . . 675
21.3.2 Caso di funzioni derivabili innite volte . . . . . . . . . . . . . . 676
21.3.3 Caso generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677
21.3.4 Commenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678
21.4 Formula di Taylor: caso vettoriale . . . . . . . . . . . . . . . . . . . . . 679
21.4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . 679
21.4.2 Formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 683
21.4.3 Condizioni del secondo ordine . . . . . . . . . . . . . . . . . . . 684

22 Concavit e dierenziabilit 687


22.1 Caso scalare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687
22.1.1 Corde e tangenti . . . . . . . . . . . . . . . . . . . . . . . . . . 695
22.2 Caso vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697

23 Complementi 701
23.1 Studio di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701
23.1.1 Flessi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701
23.1.2 Asintoti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703
23.1.3 Studio di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . 706
23.1.4 Versiera di Agnesi . . . . . . . . . . . . . . . . . . . . . . . . . . 712
23.2 Calcolo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 713
23.2.1 Dierenze nite . . . . . . . . . . . . . . . . . . . . . . . . . . . 714
23.2.2 Un teorema di Cesro . . . . . . . . . . . . . . . . . . . . . . . 717
23.2.3 Convergenza in media . . . . . . . . . . . . . . . . . . . . . . . 720
23.2.4 Innita pazienza . . . . . . . . . . . . . . . . . . . . . . . . . . 722
12 INDICE

V Calcolo integrale 725


24 Integrale secondo Riemann 727
24.0.5 Plurirettangoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728
24.1 Denizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 730
24.1.1 Funzioni positive . . . . . . . . . . . . . . . . . . . . . . . . . . 730
24.1.2 Funzioni di segno qualsiasi . . . . . . . . . . . . . . . . . . . . . 734
24.1.3 Tutto si tiene . . . . . . . . . . . . . . . . . . . . . . . . . . . . 737
24.2 Criteri di integrabilit . . . . . . . . . . . . . . . . . . . . . . . . . . . 740
24.3 Classi di funzioni integrabili . . . . . . . . . . . . . . . . . . . . . . . . 743
24.3.1 Funzioni a scala . . . . . . . . . . . . . . . . . . . . . . . . . . . 744
24.3.2 Approccio analitico e approccio geometrico . . . . . . . . . . . . 747
24.3.3 Integrabilit delle funzioni continue e delle funzioni monotone . 750
24.4 Propriet dellintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 751
24.5 Teorema fondamentale del Calcolo integrale . . . . . . . . . . . . . . . 755
24.5.1 Funzioni primitive . . . . . . . . . . . . . . . . . . . . . . . . . 756
24.5.2 Formulario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 759
24.5.3 Il Primo Teorema fondamentale del calcolo integrale . . . . . . . 760
24.5.4 Il Secondo Teorema fondamentale del calcolo integrale . . . . . . 762
24.6 Propriet dellintegrale indenito . . . . . . . . . . . . . . . . . . . . . 765
24.7 Cambiamento di variabile . . . . . . . . . . . . . . . . . . . . . . . . . 767
24.8 Integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 770
24.8.1 Intervalli illimitati dintegrazione . . . . . . . . . . . . . . . . . 770
24.8.2 Funzioni illimitate . . . . . . . . . . . . . . . . . . . . . . . . . 781
24.9 Criterio integrale di convergenza per le serie . . . . . . . . . . . . . . . 782
24.10Gran nale: Riemann e i numeri primi . . . . . . . . . . . . . . . . . . 784

VI Ottimizzazione 791
25 Anteprima 793

26 Ottimizzazione locale vincolata 797


26.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 797
26.2 Il problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 797
26.3 Un vincolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 798
26.4 Metodo di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802
26.5 Problema del consumatore . . . . . . . . . . . . . . . . . . . . . . . . . 807
26.6 Pi vincoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 811

27 Programmazione matematica 821


27.1 Programmazione dierenziale . . . . . . . . . . . . . . . . . . . . . . . 821
27.1.1 Anatomia di C . . . . . . . . . . . . . . . . . . . . . . . . . . . 822
27.2 Metodo di eliminazione . . . . . . . . . . . . . . . . . . . . . . . . . . . 823
INDICE 13

27.2.1 Primo caso: interno non vuoto . . . . . . . . . . . . . . . . . . . 823


27.2.2 Ubi maior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 826
27.2.3 Secondo caso: vincoli di uguaglianza . . . . . . . . . . . . . . . 826
27.3 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 833
27.3.1 Problema del consumatore . . . . . . . . . . . . . . . . . . . . . 833
27.3.2 Problema del produttore . . . . . . . . . . . . . . . . . . . . . . 835
27.4 Programmazione dierenziale concava . . . . . . . . . . . . . . . . . . . 837
27.5 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 839
27.5.1 Problema del produttore . . . . . . . . . . . . . . . . . . . . . . 839
27.5.2 Minimi quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . 840
27.5.3 Assicurazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 841

28 Applicazione: investimento 845


28.1 Scelta intertemporale aleatoria . . . . . . . . . . . . . . . . . . . . . . . 845
28.2 Carpe diem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 846
28.3 Il Problema dellinvestitore . . . . . . . . . . . . . . . . . . . . . . . . . 848
28.4 Risoluzione del problema . . . . . . . . . . . . . . . . . . . . . . . . . . 849
28.5 Prezzi dei titoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852

VII Appendici 855


A Richiami di trigonometria 857
A.1 Generalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 857
A.2 Concerto darchi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 859
A.3 Perpendicolarit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 861

B Elementi di logica 863

C Cenni sulle coniche 869


C.1 I classici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 870
C.2 Le coniche in generale . . . . . . . . . . . . . . . . . . . . . . . . . . . 873

D DizionErio biograco 875


14 INDICE
Parte I

Strutture

15
Capitolo 1

Insiemi e numeri

1.1 Insiemi
Un insieme (o aggregato) una collezione qualsiasi di oggetti (qualsiasi). Vi sono due
modi per descrivere un insieme: elencarne direttamente gli elementi, oppure speci-
carne una propriet che li accomuna. Il secondo modo pi usuale del primo; per
esempio,
f11; 13; 17; 19; 23; 29g (1.1)
si pu descrivere come linsieme dei numeri primi tra 10 e 30. Le sedie della vostra
cucina formano un insieme di oggetti, le sedie appunto, accumunati dalla propriet
di far parte della vostra cucina. Le sedie della vostra camera da letto formano un
altro insieme, cos come le lettere dellalfabeto latino formano un insieme, distinto
dallinsieme delle lettere dellalfabeto greco (e dalle sedie o dai numeri di poco fa).
Gli insiemi si indicano abitualmente con lettere maiuscole: A, B, C, e cos via; i
loro elementi si indicano invece con lettere minuscole: a, b, c, e cos via. Per indicare
che un elemento a appartiene allinsieme A si scrive
a2A
dove 2 il simbolo di appartenenza. Al contrario, per indicare che un elemento a non
appartiene allinsieme A si scrive a 2
= A.
Osservazione fuori busta. Il concetto di insieme, apparentemente introdotto nel
1847 da Bernhard Bolzano, per noi un concetto primitivo, cio non pu essere denito
ricorrendo a nozioni pi semplici. La situazione simile a quella della geometria
Euclidea, in cui punti e linee sono concetti primitivi di signicato intuitivo che si
suppone noto al lettore. H

1.1.1 Sottoinsiemi
Le sedie della vostra camera da letto sono un sottoinsieme delle sedie della vostra casa:
una sedia che appartiene alla vostra camera da letto appartiene anche alla vostra casa.

17
18 CAPITOLO 1. INSIEMI E NUMERI

In generale, un insieme A sottoinsieme di un insieme B quando tutti gli elementi di


A sono anche elementi di B. In questo caso si scrive A B. Formalmente,

Denizione 1 Dati due insiemi A e B, si dice che A sottoinsieme di B, in simboli


A B, se tutti gli elementi di A sono anche elementi di B, ossia se x 2 A implica
x 2 B.

Per esempio, si indichi con A linsieme (1.1) e sia

B = f11; 13; 15; 17; 19; 21; 23; 25; 27; 29g (1.2)

linsieme dei numeri dispari tra 10 e 30. Si ha A B.

Gracamente, la relazione A B si pu illustrare come

4 A B
2

-2 A

-4
B

-6
-6 -4 -2 0 2 4 6

Inclusione di insiemi

usando i cosiddetti diagrammi di Venn per rappresentare gracamente gli insiemi A e


B: si tratta di una maniera ingenua, ma e cace, di visualizzare insiemi.

Quando si ha sia A B sia B A, ossia x 2 A se e solo se x 2 B, i due insiemi A


e B sono uguali; in simboli A = B. Per esempio, consideriamo lequazione di secondo
grado x2 3x + 2 = 0. Sia A linsieme delle sue soluzioni e sia B linsieme formato
dai numeri 1 e 2. facile vedere che1 A = B.
Quando A B ma non A = B si scrive A B e si dice che A sottoinsieme
proprio di B.
Gli insiemi costituiti da un unico elemento sono detti singoletti.

Nota Bene. Sebbene i due simboli 2 e siano concettualmente ben distinti e non
debbano essere quindi confusi, esiste tra loro uninteressante relazione. Si consideri
1
Si rimanda a G. Osimo et al. (2009) per richiami sulle equazioni di secondo grado.
1.1. INSIEMI 19

infatti linsieme formato da un unico elemento a, ossia linsieme fag. Si tratta di un


insieme particolare, ma del tutto legittimo2 . Tramite i singoletti, possiamo stabilire la
relazione
a 2 A se e solo se fag A
tra 2 e . O
OfB. In queste note di solito deniremo gli insiemi tramite propriet dei loro oggetti.
Per i nostri ni tale nozione ingenuadi insieme su ciente. Lingenuit dellapproc-
cio evidenziata dai classici paradossi che, tra la ne Ottocento e linizio Novecento,
furono scoperti da Cesare Burali Forti (1861-1931) e Bertrand Russell (1872-1970). Si
tratta di paradossi che nascono dal considerare insiemi di insiemi, cio insiemi i cui
elementi sono a lora volta insiemi. Come Burali Forti, usando la nozione ingenua di
insieme deniamo linsieme di tutti gli insiemi, cio linsieme i cui elementi sono
accumunati dalla propriet di essere insiemi. Se esistesse questo insieme universale
U , potremmo per formare anche linsieme fB : B U g formato da U e da tutti i suoi
sottoinsiemi. Ma, come mostrer il Teorema 89 di Cantor, questo ulteriore insieme
non appartiene a U , il che contraddice luniversalit di U .
Tra le varie caratteristiche bizzarre di un insieme universale vi di appartenere a
s stesso, cio U 2 U , caratteristica del tutto controintuitiva (come osserv Russell,
il genere umano, per esempio, non un uomo). Con Russell, consideriamo quindi
linsieme A costituito dagli insiemi con la propriet di non appartenere a s stessi. Se
A2 = A, cio se A non appartiene a s stesso, allora A appartiene a s stesso perch un
insieme che soddisfa la propriet di non contenere s stesso. Daltra parte, se A 2 A,
cio se A contiene s stesso, allora A 2 = A, e cadiamo di nuovo in contraddizione. la
celebre antinomia di Russell.
Questi paradossi si possono arontare e risolvere con una teoria non ingenua degli
insiemi, in particolare nella teoria di Zermelo-Fraenkel. Per fortuna, nella pratica
matematica, e a maggior ragione in queste note introduttive, si possono ignorare
gli aspetti fondazionali senza correre troppi pericoli (tanto pi che il loro studio
richiederebbe un corso, e per nulla banale, a s). H

1.1.2 Operazioni
Vi sono tre operazioni di base tra insiemi: unione, intersezione e dierenza. Come
vedremo, esse considerano due assegnati insiemi e, a partire da essi, formano un nuovo
insieme.
La prima operazione che consideriamo lintersezione di due insiemi A e B. Come
suggerisce il termine intersezione, con essa si selezionano tutti gli elementi che
appartengono simultaneamente a entrambi gli insiemi A e B.
2
Si badi che a e fag non sono aatto la stessa cosa; a un elemento e fag un insieme, seppur
costituito da un solo elemento. Per esempio, linsieme A dei paesi della Terra con la bandiera di un
solo colore aveva (sino al 2011) un solo elemento, la Libia, ma non la Libia: Tripoli non la
capitale di A.
20 CAPITOLO 1. INSIEMI E NUMERI

Denizione 2 Dati due insiemi A e B, la loro intersezione A \ B linsieme di tutti


gli elementi che appartengono sia ad A sia a B, ossia x 2 A \ B se x 2 A e x 2 B.

Loperazione si pu illustrare gracamente nel seguente modo:

Intersezione di insiemi.

Per esempio, sia A linsieme dei mancini e B linsieme dei destrimani in Italia. Lin-
tersezione A \ B linsieme degli italiani ambidestri. Se, invece, A linsieme delle
auto a benzina e B delle auto a metano, la loro intersezione A \ B linsieme delle
auto bifuel, a benzina e a metano.

Pu accadere che due insiemi non abbiano alcun elemento in comune. Per esempio,
sia
C = f10; 12; 14; 16; 18; 20; 22; 24; 26; 28; 30g (1.3)
linsieme dei numeri pari tra 10 e 30. Esso non ha alcun elemento in comune con
linsieme B in (1.2). In questo caso si parla di insiemi disgiunti, ossia che non hanno
alcun elemento in comune. Tale nozione ci d loccasione per introdurre un insieme
molto particolare, ma fondamentale.

Denizione 3 Linsieme vuoto, indicato con ;, linsieme privo di elementi3 .

Come primo uso della nozione, osserviamo che due insiemi A e B sono disgiunti
quando hanno intersezione vuota, cio A \ B = ;. Per esempio, per gli insiemi B e C
in (1.2) e (1.3), si ha B \ C = ;.
La scrittura A 6= ; sta ad indicare che linsieme A non vuoto, ovvero che contiene
almeno un elemento.
3
C chi pensa che gli insiemi vuoti non esistano. Egli deve ammettere allora che linsieme di tali
insiemi vuoto.
1.1. INSIEMI 21

Linsieme vuoto si considera convenzionalmente sottoinsieme di qualsiasi insieme,


ossia ; A per ogni insieme A.

immediato mostrare che A \ B A e che A \ B B. Il prossimo risultato


pi sottile e stabilisce unutile propriet che lega e \.

Proposizione 1 Si ha A \ B = A se e solo se A B.

Dim. Se: sia A B. Vogliamo dimostrare che A \ B = A. Quando si deve


mostrare unuguaglianza di due insiemi, bisogna sempre considerare separatamente le
due opposte inclusioni, in questo caso A \ B A e A A \ B.
La prima inclusione A \ B A banalmente vera. Infatti, se x 2 A \ B, per
denizione x appartiene sia ad A sia a B. In particolare x 2 A e ci basta per
concludere che A \ B A.
Dimostriamo la seconda inclusione: A A \ B. Sia x 2 A. Poich, per ipotesi,
A B, ogni elemento di A appartiene anche a B. Da x 2 A segue quindi che x 2 B,
ossia che x appartiene sia ad A sia a B: dunque x 2 A \ B e ci prova che A A \ B.
Abbiamo mostrato che valgono entrambe le inclusioni A \ B AeA A \ B;
possiamo quindi concludere che A \ B = A, il che completa la dimostrazione del Se.

Solo se: sia A \ B = A. Vogliamo dimostrare che A B, ossia che, se x 2 A,


allora x 2 B. Sia x 2 A. Poich per ipotesi A \ B = A, ne segue che x 2 A \ B. In
particolare ci signica che x appartiene a B, che quanto dovevamo provare.

La prossima operazione che consideriamo lunione. Anche qui il termine unione


gi suggerisce come in questa operazione siano riuniti assieme tutti gli elementi di
entrambi gli insiemi.

Denizione 4 Dati due insiemi A e B, la loro unione A [ B linsieme di tutti gli


elementi che appartengono a A oppure4 a B, ossia x 2 A [ B se x 2 A oppure x 2 B.

Si noti che un elemento pu appartenere ad entrambi gli insiemi (a meno che gli
insiemi siano disgiunti). Per esempio, se come prima A linsieme dei mancini e B
quello dei destrimani in Italia, linsieme unione contiene tutti gli italiani con almeno
una mano, e vi sono individui (gli ambidestri) che appartengono ad entrambi gli insiemi
.
immediato mostrare che A A [ B e che B A [ B. Ne consegue che
A \ B A [ B.

Gracamente lunione si rappresenta nel seguente modo:


4
La congiunzione oppure intesa nel senso debole del vel latino, e non dellaut (cio x
appartiene ad A o x appartiene a B o entrambe le cose).
22 CAPITOLO 1. INSIEMI E NUMERI

4 AB
2

-2 A
B
-4

-6
-2 0 2 4 6 8 10

Unione di insiemi

Lultima operazione che consideriamo la dierenza.

Denizione 5 Dati due insiemi A e B, la loro dierenza A B linsieme di tutti


gli elementi che appartengono a A ma non a B, ossia x 2 A B se sia x 2 A sia
x2 = B.

Linsieme dierenza5 A B si forma quindi eliminando da A tutti gli elementi che


appartengono (anche) a B. Gracamente:

2 A- B
1

-1 B
A
-2

-3
-3 -2 -1 0 1 2 3 4 5

Dierenza di insiemi.

5
La dierenza insiemistica A B si indica spesso con la scrittura AnB.
1.1. INSIEMI 23

Per esempio, torniamo agli insiemi A e B individuati in (1.1) e (1.2). In tal caso,

B A = f15; 21; 25; 27g ;

ossia B A linsieme dei numeri dispari non primi tra 10 e 30. Si noti che: (i)
quando A e B sono disgiunti, si ha A B = A e B A = B, (ii) A B equivale
a A B = ; poich togliendo da A tutti gli elementi che appartengono anche a B si
priva A di tutti i suoi elementi, ossia si rimane con linsieme vuoto.

In molti casi vi un insieme generale di riferimento del quale si considerano vari sot-
toinsiemi. Per esempio, per un demografo tale insieme pu essere lintera popolazione
italiana della quale si possono considerare vari sottoinsiemi secondo le propriet de-
mograche che interessano: per esempio, let una classica variabile demograca con
la quale suddividere la popolazione in sottoinsiemi.
Linsieme generale di riferimento chiamato insieme universale o, pi comune-
mente, spazio. Non esiste una notazione consolidata per tale insieme (che quasi
sempre sottinteso), che temporaneamente indichiamo come S. In questo caso, preso
un suo sottoinsieme A qualsiasi, la dierenza S A si indica con Ac ed detta insieme
complementare di A.
Per esempio, se S linsieme di tutti gli italiani e A linsieme di tutti gli italiani
che hanno almeno 65 anni det, linsieme complementare Ac costituito da tutti gli
italiani con meno di 65 anni det.

immediato vericare che, per ogni A, si ha A [ Ac = S e A \ Ac = ;. Vale inoltre


la

Proposizione 2 Se A un sottoinsieme di uno spazio S si ha (Ac )c = A.

Dim. Poich dobbiamo vericare unuguaglianza tra insiemi, al pari di quanto fatto
nella dimostrazione della Proposizione 1, occorre considerare separatemente le due
inclusioni (Ac )c A e A (Ac )c .
Se a 2 (Ac )c , allora a 2
= Ac e quindi a 2 A. Ne segue che (Ac )c A.
Viceversa, se a 2 A allora a 2 = Ac e quindi a 2 (Ac )c ; dunque A (Ac )c .

Da ultimo, si prova senza di colt che A B = A \ B c . Infatti x 2 A B signica


= B, cio che x 2 A e x 2 B c .
che x 2 A e x 2

1.1.3 Propriet delle operazioni


Proposizione 3 Le operazioni di unione e intersezione sono:

(i) commutative, ossia, per ogni coppia di insiemi A e B, si ha A \ B = B \ A e


A [ B = B [ A;
(ii) associative, ossia, per ogni terna di insiemi A, B e C, si ha A [ (B [ C) =
(A [ B) [ C e A \ (B \ C) = (A \ B) \ C.
24 CAPITOLO 1. INSIEMI E NUMERI

Lasciamo al lettore la semplice dimostrazione del risultato. La propriet (ii) per-


mette di scrivere A [ B [ C e A \ B \ C e quindi di estendere senza ambiguit le
operazioni di unione e di intersezione a un arbitrario numero (nito) di insiemi:
[n \n
Ai e Ai :
i=1 i=1

possibile estendere tali operazioni anche a inniti insiemi. Se A1 ; A2 ; ; An ;


sono inniti insiemi, la loro unione
[1
An
n=1

linsieme degli elementi che appartengono ad almeno uno degli An , cio

[
1
An = fa : a 2 An per almeno un indice ng
n=1

La loro intersezione \1
An
n=1

linsieme degli elementi che appartengono a ogni An , cio

\
1
An = fa : a 2 An per ogni indice ng :
n=1

T
1
Esempio 1 Sia An linsieme dei numeri pari n. Si ha An = f0g poich 0
n=1
S
1
lunico pari tale che 0 2 An per ogni n 1. Inoltre, An = f2n : n intero positivog,
n=1
S
1
ossia An linsieme di tutti i numeri pari. N
n=1

Volgiamo lattenzione alle relazioni tra le operazioni di intersezione e unione. Si


noter la simmetria tra le propriet (1.4) e (1.5), nelle quali \ e [ sono scambiate tra
loro.

Proposizione 4 Le operazioni di unione e intersezione sono tra loro distributive,


ossia, dati tre insiemi A, B e C, si ha

A \ (B [ C) = (A \ B) [ (A \ C) (1.4)

e
A [ (B \ C) = (A [ B) \ (A [ C) : (1.5)
1.2. NUMERI: INTRODUZIONE INTUITIVA 25

Dim. Mostriamo solo la (1.4). Occorre considerare separatemente le due inclusioni


A \ (B [ C) (A \ B) [ (A \ C) e (A \ B) [ (A \ C) A \ (B [ C).
Se x 2 A \ (B [ C), allora x 2 A e x 2 B [ C, cio (i) x 2 A e (ii) x 2 B oppure
x 2 C. Ne segue che x 2 A \ B oppure x 2 A \ C, cio x 2 (A \ B) [ (A \ C), e
perci A \ (B [ C) (A \ B) [ (A \ C).
Viceversa, se x 2 (A \ B) [ (A \ C), allora x 2 A \ B oppure x 2 A \ C, cio x
appartiene ad A e ad almeno uno tra B e C e quindi x 2 A \ (B [ C). Ne segue che
(A \ B) [ (A \ C) A \ (B [ C).

Diamo un concetto che si rivela importante in molte applicazioni.

Denizione 6 Una famiglia

fA1 ; A2 ; : : : ; An g = fAi gni=1

di sottoinsiemi di un insieme A detta partizione di A se i sottoinsiemi sono a due


a due Sdisgiunti, ossia Ai \ Aj = ; per ogni i 6= j, e se la loro unione coincide con A,
ossia ni=1 Ai = A.

Esempio 2 Sia A linsieme di tutti gli italiani in un dato giorno, per esempio oggi.
I suoi sottoinsiemi A1 , A2 e A3 costituiti rispettivamente dai cittadini in et scolare
o prescolare (da 0 a 17 anni), dei cittadini in et lavorativa (da 18 a 64 anni) e dagli
anziani (dai 65 anni in poi) ne costituiscono una partizione. N

Concludiamo con le cosiddette leggi di de Morgan per la complementazione.

Proposizione 5 Dati due sottoinsiemi A e B di uno spazio S, si ha (A [ B)c =


Ac \ B c e (A \ B)c = Ac [ B c .

Dim. Dimostriamo soltanto la prima. Al solito, per dimostrare un uguaglianza tra


insiemi, occorre considerare separatamente le due inclusioni che la compongono. (i)
(A [ B)c Ac \ B c . Se x 2 (A [ B)c , allora x 2= A [ B, cio x non appartiene n ad
A n a B. Ne segue che x appartiene simultaneamente ad Ac e a B c e quindi alla loro
intersezione. (ii) Ac \ B c (A [ B)c . Se x 2 Ac \ B c allora x 2
=Aex2 = B e perci x
non appartiene nemmeno alla loro unione.

Le leggi di de Morgan mostrano che, prendendo i complementi, [ e \ si scambiano


tra loro. Spesso tali leggi sono scritte nella forma equivalente A [ B = (Ac \ B c )c e
A \ B = (Ac [ B c )c .

1.2 Numeri: introduzione intuitiva


Per quanticare le grandezze di interesse nelle applicazioni economiche (quali, per
esempio, le quantit scambiate di beni e i loro prezzi) abbiamo bisogno di un adeguato
insieme di numeri. Di ci ci occupiamo nella presente sezione.
26 CAPITOLO 1. INSIEMI E NUMERI

I numeri naturali
0; 1; 2; 3;
non hanno bisogno di presentazione; il loro insieme sar indicato con il simbolo N.
Linsieme N dei naturali chiuso rispetto alle operazioni fondamentali di addizione
e moltiplicazione:

(i) m + n 2 N tutte le volte che m; n 2 N;

(ii) m n 2 N tutte le volte che m; n 2 N.

Non invece chiuso rispetto alle operazioni fondamentali di sottrazione e di di-


visione: per esempio, n 5 6 n 5=6 sono numeri naturali. quindi chiaro che N
inadeguato come insieme di numeri per quanticare grandezze economiche: la con-
tabilit di unazienda un primo ovvio esempio nel quale la chiusura rispetto alla
sottrazione cruciale (altrimenti, come si potrebbero quanticare le perdite?).

I numeri interi (o interi relativi)6

; 3; 2; 1; 0; 1; 2; 3;

costituiscono un primo allargamento, indicato col simbolo Z, dellinsieme N. Esso


porta a un insieme chiuso rispetto sia alle operazioni di addizione e di moltiplicazione
sia alloperazione di sottrazione. Infatti, ponendo m n = m + ( n),7 si ha

(i) m n 2 Z tutte le volte che m; n 2 Z;

(ii) m n 2 Z tutte le volte che m; n 2 Z.

Formalmente, linsieme Z si pu scrivere a partire da N come

Z = fm n : m; n 2 Ng

Proposizione 6 N Z.

Dim. Sia m 2 N. Si ha m = m 0 2 Z poich 0 2 N.

Rimane unoperazione fondamentale rispetto alla quale Z non chiuso: la divi-


sione. Infatti, per esempio, 1=3 non un numero intero. Per porre rimedio a tale
6
Ci piace ricordare come nellIndia antica si distinguessero i numeri positivi dai negativi scrivendoli
rispettivamente in rosso e in nero. La convenzione seguita era opposta allattuale prassi bancaria
secondo la quale un conto corrente con saldo negativo in rosso.
7
La sottrazione m n non altro che la somma di m col negativo n di n. Al riguardo, si ricordi
la nozione di somma algebrica.
1.2. NUMERI: INTRODUZIONE INTUITIVA 27

importante carenza degli interi (se vogliamo dividere 1 torta tra 3 invitati, come possi-
amo quanticare le loro porzioni se abbiamo a disposizione solo Z?), si ha un ulteriore
allargamento allinsieme dei numeri razionali, indicato col simbolo Q, e dato da
nm o
Q= : m; n 2 Z con n 6= 0 :
n
In altre parole linsieme dei razionali costituito da tutte le frazioni con numeri interi
sia a numeratore sia a denominatore (non nullo).

OfB. Ogni razionale non periodico (cio con un numero nito di decimali) ammette
due rappresentazioni decimali. Per esempio, 1 = 0; 9 poich 1 0; 9 = 0; 0 = 0, oppure,
se si preferisce, perch
1
0; 9 = 3 0; 3 = 3 = 1:
3
In modo analogo, 2; 5 = 2; 49, 51; 2 = 51; 19, e cos via. In breve il periodico di 9
non ha una sua autonomia. I razionali periodici e gli irrazionali hanno invece una sola
rappresentazione decimale (che innita).
La cosa non una mera curiosit: se 0; 9 non fosse uguale a 1, si potrebbe aermare
che 0; 9 il numero che immediatamente precede 1 (senza che ve ne siano altri in
mezzo), il che violerebbe una notevole propriet che discuteremo tra breve. H

Proposizione 7 Z Q.

Dim. Sia m 2 Z. Si ha m = m=1 2 Q poich 1 2 Z.

Linsieme dei razionali chiuso rispetto a tutte le quattro operazioni fondamentali:

(i) m n 2 Q tutte le volte che m; n 2 Q;


(ii) m n 2 Q tutte le volte che m; n 2 Q;
(iii) m=n 2 Q tutte le volte che m; n 2 Q con n 6= 0:

Linsieme dei razionali sembra dunque attrezzato con tutto quanto possa servire.
Ma alcune semplici considerazioni sulla moltiplicazione ci porteranno a inaspettate
scoperte. Se q un razionale, come ben noto, la scrittura q n con n 1 intero signica
q q q:
| {z }
n volte

Si conviene che q 0 = 1 per ogni q 6= 0. Di per s la scrittura q n , detta potenza di base


q ed esponente n, un mero articio di notazione per scrivere in modo pi compatto la
moltiplicazione ripetuta di un medesimo fattore. Tuttavia, preso un razionale q > 0,
naturale considerare il percorso inverso, ossia determinare il numeropositivo indicato
1 p
con q n o, equivalentemente, con n q, e chiamato radice di ordine n di q, tale che
1 n
qn = q.
28 CAPITOLO 1. INSIEMI E NUMERI
p
Per esempio8 , 25 = 5 poich 52 = 25. Per rendersi conto dellimportanza delle radici,
si consideri la seguente semplicissima gura geometrica:

-1

-2

-3
-3 -2 -1 0 1 2 3 4 5

p
Per il Teorema di Pitagora, la lunghezza dellipotenusa 2. Per quanticare enti
geometrici del tutto elementari abbiamo quindi bisogno delle radici. Ecco la, per alcuni
tragica, sorpresa9 .
p
Teorema 8 22
= Q.
p
Dim. Si
p supponga, per assurdo, che 2 2 Q. Esistono allora m; n 2 Z tali che
m=n = 2, e quindi
m 2
= 2: (1.6)
n
Supponiamo che m=n sia gi ridotta ai minimi termini, ossia che m e n non ab-
biano fattori in comune10 . Ci signica che m e n non possano essere entrambi pari
(diversamente, 2 sarebbe un loro fattore comune).
La (1.6) implica
m2 = 2n2 (1.7)
e quindi m2 pari. Siccome il quadrato di un dispari dispari, anche m pari
(diversamente, se m fosse dispari, anche m2 lo sarebbe). Quindi, esiste un intero
k 6= 0 tale che
m = 2k (1.8)
Dalla (1.7) e (1.8) segue che
n2 = 2k 2 :
8 p p
La radice quadrata 2 q si indica pi semplicemente con q, omettendo lindice 2.
9
Per la losoa pitagorica, in cui le proporzioni (ossia, i numeri razionali) erano centrali, la scoperta
della non razionalit delle radici fu un evento traumatico. Rimandiamo il lettore curioso a K. von
Fritz, The Discovery of Incommensurability by Hippasus of Metapontum, Annals of Mathematics,
46, 242-264, 1945.
10
Per esempio, 14=10 non ridotta ai minimi termini perch numeratore e denominatore hanno in
comune il fattore 2. Invece, 7=5 ridotta ai minimi termini.
1.2. NUMERI: INTRODUZIONE INTUITIVA 29

Dunque n2 pari, e quindi n pari. In conclusione, sia m sia n sono pari, il che,
come prima osservato, contraddice
p lipotesi che m=n sia ridotta ai minimi termini. La
contraddizione mostra che 2 2= Q.

questo uno dei grandi teoremi della matematica greca e la sua dimostrazione
da parte della scuola pitagorica, tra il VI e il V secolo a. C., fu un punto di svolta
nella storia della Matematica. Lasciando da parte gli aspetti losoci, dal punto di
vista matematico esso mostra la necessit di un ulteriore allargamento dellinsieme dei
numeri necessari a quanticare gli enti geometrici (nonch le grandezze economiche,
come risulter chiaro nel seguito).
Per introdurre a livello intuitivo questultimo allargamento11 , consideriamo la clas-
sica retta reale:

-1

-2

-3
-3 -2 -1 0 1 2 3 4 5 6

facile vedere come su di essa si possano rappresentare i numeri razionali:

-1

-2

-3
-4 -2 0 2 4 6

I numeri razionali non esauriscono per la retta reale. Per esempio, anche radici
11
Per una trattazione rigorosa si rimanda al primo capitolo di W. Rudin, Principles of mathematical
analysis, McGraw-Hill, 1976.
30 CAPITOLO 1. INSIEMI E NUMERI
p
come 2 o altri numeri non razionali, come , devono trovare una loro rappresentazione
sulla retta reale12 :

-1

-2

-3
-4 -2 0 2 4 6 8

Indichiamo con R linsieme di tutti i numeri rappresentabili sulla retta reale, i cui
elementi sono detti numeri reali.
Naturalmente Q R: vi sono molti numeri reali, detti irrazionali, che non sono
razionali. Moltissime radici, , il numero e sono esempi di numeri irrazionali. In realt
si pu mostrare che la maggior dei numeri reali irrazionale. Sebbene una trattazione
rigorosa dellargomento ci porterebbe troppo lontano, il prossimo semplice risultato
gi una chiara indicazione della numerosit degli irrazionali.
Proposizione 9 Dati due reali qualsiasi a < b, esiste un irrazionale c 2 R tale che
a < c < b.
Dim.13 Per ogni naturale n 2 N si ponga
p
2
cn = a +
n
Si ha cn > a per ogni n, ed facile vericare che ogni cn irrazionale. Inoltre
p
2
cn < b () n >
b a
p
Sia dunque n 2 N qualsiasi naturale tale che n > 2= (b a) (tale n esiste per la
propriet archimedea dei reali che vedremo tra breve nella Proposizione 17). Poich
a < cn < b, la dimostrazione completa.

In conclusione, R sar linsieme di numeri che considereremo nel resto del corso, e
si rivela adeguato per la gran parte delle applicazioni economiche14 .
12
In realt, pur essendo la cosa piuttosto intuitiva, si tratta di un postulato, detto di continuit
della retta.
13
Suggerita da Simone Cerreia-Vioglio.
14
Un importante ulteriore allargamento, del quale non ci occuperemo, linsieme C dei numeri
complessi.
1.3. STRUTTURA DEGLI INTERI 31

1.3 Struttura degli interi


In questa e nelle prossima sezione studiamo alcune elementari, ma non banali, pro-
priet dei numeri interi. Il risultato principale che presenteremo il Teorema Fonda-
mentale dellAritmetica, che mostra il ruolo centrale dei numeri primi nella struttura
dellinsieme degli interi.

1.3.1 Divisori e algoritmi


In questa prima sottosezione presenteremo alcune nozioni necessarie alla sottosezione
successiva sui numeri primi. Nel far ci incontreremo e cominceremo a conoscere la
nozione di algoritmo, di grande importanza nelle applicazioni.
Cominciamo con lintrodurre in modo rigoroso alcune nozioni che, nella loro essen-
za, ci sono note forse n dalle scuole elementari. Un numero intero n divisibile per
un numero intero p 6= 0 se esiste un terzo numero intero q tale che n = pq. In simboli,
si scrive p j n e si legge p divide n.

Esempio 3 Il numero intero 6 divisibile per il numero intero 2, cio 2 j 6, perch il


numero intero 3 tale che 6 = 2 3. Daltra parte, 6 anche divisibile per 3, cio
3 j 6, perch il numero intero 2 tale che 6 = 2 3. N

Sempre dalle scuole elementari sappiamo come dividere tra loro due numeri interi,
usando resti e quozienti. Per esempio, se n = 7 e m = 2, si ha n = 3 2 + 1, con
quoziente 3 e resto 1. Il prossimo semplice risultato formalizza questa procedura e
mostra che essa vale per ogni coppia di interi (cosa che alle elementari davamo per
scontata, ma ora siamo grandi e non dobbiamo dare pi nulla per scontato).

Proposizione 10 Dati due numeri interi qualsiasi m e n, con m positivo15 , esiste


una e una sola coppia di interi q e r tali che

n = qm + r

con 0 r < m.

Dim. Nellenunciato si aermano due distinte propriet: lesistenza della coppia


(q; r) e la sua unicit. Cominciamo col dimostrare lesistenza. Consideriamo solo
il caso n 0 (per n < 0 basta cambiare di segno). Consideriamo linsieme A =
fp 2 N : p n=mg. Poich n 0, linsieme A non vuoto perch contiene, almeno, il
numero zero. Sia q il pi grande elemento di A. Per denizione, qm n < (q + 1) m.
Posto r = n qm, si ha quindi

0 n qm = r < (q + 1) m qm = m:

Abbiamo quindi dimostrato lesistenza della coppia q e r desiderata.


15
Un numero intero m si dice positivo se m 1.
32 CAPITOLO 1. INSIEMI E NUMERI

Mostriamo ora lunicit. Per contraddizione, siano (q 0 ; r0 ) e (q 00 ; r00 ) due coppie


distinte tali che
n = q 0 m + r0 = q 00 m + r00 ; (1.9)
con 0 r0 ; r00 < m. Poich q 0 6= q 00 , senza perdita di generalit supponiamo che q 0 < q 00 ;
ossia,
q0 + 1 q 00 (1.10)
poich q 0 e q 00 sono numeri interi. Da (1.9) segue che (q 00 q 0 ) m = r0 r00 . Siccome
(q 00 q 0 ) m 0, si ha 0 r00 r0 < m. Quindi,
(q 00 q 0 ) m = r0 r00 < m;
il che implica q 00 q 0 < 1, ossia q 00 < q 0 + 1. Ma ci contraddice la (1.10). La
contraddizione mostra che lassunzione di coppie (q 0 ; r0 ) e (q 00 ; r00 ) distinte falsa.

Massimo comune divisore


Dati due numeri interi positivi m e n, il loro massimo comune divisore, indicato
mcd (m; n), il pi grande divisore comune a entrambi i numeri. Il prossimo risultato,
dimostrato da Euclide nei suoi Elementi, mostra quel che nelle scuole elementari si
dava per scontato, ossia che ogni coppia di interi possiede un unico massimo comune
divisore.
Teorema 11 (Euclide) Ogni coppia di numeri interi positivi ha uno e un solo mas-
simo comune divisore.
Dim. Come la Proposizione 10, anche questo un risultato di esistenza e unicit. Lu-
nicit ovvia; mostriamo quindi lesistenza. Siano m e n due interi positivi qualsiasi.
Grazie alla Proposizione 10, esiste ununica coppia (q1 ; r1 ) tale che
n = q1 m + r 1 , (1.11)
dove 0 r1 < m. Se r1 = 0, si ha mcd (m; n) = m e la dimostrazione si conclude. Se
r1 > 0, si itera la procedura applicando a m la Proposizione 10. Si ha quindi ununica
coppia (q2 ; r2 ) tale che
m = q2 r1 + r2 , (1.12)
dove 0 r2 < r1 . Se r2 = 0, allora mcd (m; n) = r1 . Infatti, la (1.12) implica r1 j m.
Inoltre, grazie alla (1.11) e (1.12), si ha
n q1 m + r 1 q1 q 2 r 1 + r 1
= = = q1 q2 + 1;
r1 r1 r1
e perci r1 j n. Quindi r1 divisore sia di n sia di m. Rimane da mostrare che il pi
grande di tali divisori. Supponiamo p sia un intero positivo tale che p j m e p j n. Per
denizione, esistono due interi positivi a e b tali che n = ap e m = bp. Si ha
r1 n q1 m
0< = =a q1 b.
p p
1.3. STRUTTURA DEGLI INTERI 33

Quindi r1 =p un intero positivo, il che implica r1 p. In conclusione, mcd (m; n) = r1


se r2 = 0. In questo caso, la dimostrazione si conclude.
Se r2 > 0, si itera la procedura applicando al resto r2 la Proposizione 10. Si ha
quindi ununica coppia (q3 ; r3 ) tale che

r 1 = q3 r 2 + r 3 ,

dove 0 r3 < r2 . Se r3 = 0, procedendo come sopra si mostra che mcd (m; n) = r2 ,


e la dimostrazione si conclude. Se r3 > 0, si itera la procedura. Di iterazione in
iterazione, si costruisce una successione di interi positivi r1 > r2 > > rk . Poich
una successione decrescente di interi positivi non pu che essere nita: esiste un k 1
tale che rk = 0. Procedendo come sopra si mostra che mcd (m; n) = rk 1 , il che
completa la dimostrazione dellesistenza di mcd (m; n).

Dal punto di vista metodologico questa dimostrazione un bellesempio di di-


mostrazione costruttiva, in quanto basata su un algoritmo (detto di Euclide) che con
un numero nito di iterazioni determina lente matematico di cui si stabilisce lesisten-
za, cio il massimo comune divisore. La nozione di algoritmo fondamentale perch,
quando esiste, rende computabili gli enti matematici. Infatti, in linea di principio un
algoritmo pu essere automatizzato tramite un opportuno programma di computer
(per esempio, lalgoritmo di Euclide permette di automatizzare la ricerca dei massimi
comuni denominatori).
Lalgoritmo di Euclide il primo algoritmo che incontriamo ed molto importante
in Teoria dei numeri. Merita di essere rivisto in dettaglio. Dati due interi positivi m
e n, lalgoritmo si articola nei seguenti k 1 passi:

Passo 1 n = q1 m + r1

Passo 2 m = q2 r1 + r2

Passo 3 r1 = q2 r2 + r3
.......

Passo k rk 2 = q2 r k 1 (ossia, rk = 0)

Lalgoritmo si arresta al passo k tale che rk = 0. In questo caso mcd (m; n) = rk 1 ,


come si visto nella dimostrazione.

Esempio 4 Consideriamo gli interi positivi 3801 e 1708. A prima vista non ovvio
quale sia il loro massimo comune divisore. Per fortuna, abbiamo a nostra disposizione
lalgoritmo di Euclide per determinarlo. Si procede come segue:

Passo 1 3801 = 2 1798 + 385

Passo 2 1708 = 4 385 + 168


34 CAPITOLO 1. INSIEMI E NUMERI

Passo 3 385 = 2 168 + 49

Passo 4 168 = 3 49 + 21

Passo 5 49 = 2 21 + 7

Passo 6 21 = 3 7

In sei passi abbiamo quindi scoperto che mcd (3801; 1708) = 7. N

La bont di un algoritmo dipende dal numero di passi, cio di iterazioni, che gli
occorronno per giungere alla soluzione. Un algoritmo tanto pi potente quante
meno iterazioni usa. Per lalgoritmo di Euclide si ha la seguente notevole propriet,
dimostrata da Gabriel Lam.

Teorema 12 (Lam) Dati due numeri interi m e n, il numero di iterazioni richi-


este dallalgoritmo di Euclide minore o uguale a cinque volte il numero di cifre di
min fm; ng.

Per esempio, se torniamo ai numeri 3801 e 1708, il numero di cifre qui rilevante 4.
Il Teorema di Lam ci garantisce a priori che lalgoritmo di Euclide avrebbe rischiesto
al pi 20 iterazioni. Ne abbiamo usate solo 6, ma grazie al Teorema di Lam prima di
iniziare gi sapevano che non ci avremmo comunque impiegato molto (e che, quindi,
valeva la pena tentare, sapendo di non rischiare di rimanere impantanati in un numero
estenuante di iterazioni).

1.3.2 Numeri primi


Tra i numeri naturali un ruolo preminente svolto dai numeri primi, che il lettore ha
gi probabilmente incontrato nelle scuole superiori.

Denizione 7 Un numero naturale n 2 si dice primo se divisibile solo per 1 e


per s stesso.

Un numero naturale non primo si dice composto. Indichiamo con P linsieme dei
numeri primi. Ovviamente, P N e N P linsieme dei numeri composti. I naturali

f2; 3; 5; 7; 11; 13; 17; 19; 23; 29g

sono i primi dieci numeri primi, come il lettore pu facilmente vericare.


Limportanza dei numeri primi comincia a emergere se osserviamo come i numeri
composti si possano esprimere come prodotto di numeri primi. Per esempio, il numero
composto 12 si pu scrivere come

12 = 22 3;
1.3. STRUTTURA DEGLI INTERI 35

mentre il numero composto 60 si pu scrivere come

60 = 22 3 5:

In generale, la rappresentazione primale di un numero composto n si pu scrivere come

n = p1n1 pn2 2 pnk k (1.13)

dove pi 2 P e ni 2 N per ogni i = 1; :::; k, con

p1 < p 2 < < pk e n1 > 0; :::; nk > 0.

Esempio 5 Per n = 12 si ha p1 = n1 = 2, p2 = 3 e n2 = 1; in questo caso k = 2.


Per n = 60 si ha p1 = n1 = 2, p2 = 3, n2 = 1, p3 = 5 e n3 = 1; in questo caso
k = 3.
Per n = 200 si ha
200 = 23 52
sicch p1 = 2, n1 = 3, p2 = 5 e n2 = 2; in questo caso k = 2.
Per n = 522 si ha
522 = 2 32 29
sicch p1 = 2, n1 = 1, p2 = 3, n2 = 2, p3 = 29 e n3 = 1; in questo caso k = 3. N

Quanto appena visto solleva due questioni: se ogni naturale ammetta una rappre-
sentazione primale (nora abbiamo solo studiato alcuni esempi particolari) e se tale
rappresentazione sia unica. Il prossimo risultato, il Teorema fondamentale dellarit-
metica, risolve entrambi i problemi mostrando che ogni intero ammette una e una sola
rappresentazione primale. In altre parole, ogni intero si pu esprime in modo univoco
come prodotto di numeri primi.
I numeri primi sono quindi gli atomidi N: non sono scindibili (in quanto divisibili
sono per 1 e per s stessi) e attraverso di essi si pu esprimere univocamente ogni altro
numero naturale. Limportanza del risultato, che mostra la centralit dei numeri primi,
ben testimoniata dal suo nome. La sua prima dimostrazione si trova nelle celebri
Disquisitiones Arithmeticae pubblicate nel 1801 da Carl Friederich Gauss, sebbene il
risultato fosse nella sua essenza gi noto a Euclide.

Teorema 13 (fondamentale dellaritmetica) Ogni numero naturale n > 1 am-


mette una e una sola rappresentazione primale (1.13).

Dim. Cominciamo col dimostrare lesistenza della rappresentazione. Procediamo per


contraddizione. Supponiamo quindi che esistano numeri naturali che non ammettanno
rappresentazione primale (1.13). Sia n > 1 il pi piccolo tra essi. Ovviamente, il
numero n composto. Esistono quindi due naturali p e q tali che n = pq con 1 <
p; q < n. Poich n il numero naturale pi piccolo che non ammette rappresentazione
36 CAPITOLO 1. INSIEMI E NUMERI

primale, i numeri p e q ammettono tale rappresentazione. In particolare, possiamo


scrivere
n0 n0 0
p = pn1 1 pn2 2 pnk k e q = q1 1 q2 2 qsns .
Si ha quindi
n0 n0 0
n = pq = pn1 1 pn2 2 pnk k q1 1 q2 2 qsns
Raccogliendo opportunamente i termini pi e qj , si pu scrivere n nella forma (1.13), e
perci n ammette rappresentazione primale, il che contraddice quanto assunto su n.
Ci completa la dimostrazione per contraddizione dellesistenza.
Procediamo per contraddizione anche per mostrare lunicit. Supponiamo quindi
che esistano numeri naturali che ammettano pi duna fattorizzazione. Sia n > 1 il pi
piccolo tra essi: tale n ammette almeno due diverse fattorizzazioni, sicch possiamo
scrivere
n0 n0 0
n = pn1 1 pn2 2 pnk k = q1 1 q2 2 qsns .
Siccome q1 un divisore di n, deve essere un divisore di almeno uno dei fattori p1 <
< pm . Per esempio, sia p1 un tale fattore. Essendo q1 e p1 entrambi primi, si ha
q1 = p1 . Quindi
n0 1 n0 0
pn1 1 1 pn2 2 pnk k = q1 1 q2 2 qsns < n;
il che contraddice la minimalit di n perch anche il numero pn1 1 1 pn2 2 pnk k ammette pi
fattorizzazioni. La contraddizione dimostra lunicit della rappresentazione primale.

Dal punto di vista metodologico si deve osservare che questa dimostrazione di


esistenza per contraddizione e, in quanto tale, non pu essere costruttiva. Infatti,
tale tipo di dimostrazioni si basa sul Principio del terzo escluso (una propriet
vera se e solo se non falsa) e la verit di una asserzione stabilita mostrandone
la non falsit. Ci rende spesso queste dimostrazioni brevi ed eleganti, ma, bench
logicamente ineccepibili16 , dal vago carattere metasico perch non danno un modo
per costruire gli enti matematici di cui stabiliscono lesistenza. In altri termini, non
danno un algoritmo con cui determinare tali enti.
In conclusione, invitiamo il lettore a confrontare questa dimostrazione di esistenza
con quella, costruttiva, del Teorema 11. Il loro confronto dovrebbe chiarire le dierenze
tra i due tipi fondamentali di dimostrazione di esistenza, costruttiva/diretta e non
costruttiva/indiretta.

Non un caso che la dimostrazione di esistenza del Teorema fondamentale dellar-


itmetica non sia costruttiva. Infatti, costruire algoritmi che permettano di fattorizzare
in numeri primi un numero naturale n (i cosiddetti test di fattorizzazione) oltremodo
complicato. Del resto, gi costruire algoritmi in grado perlomeno di stabilire se n
16
A meno di riutare il Principo del terzo escluso, come alcuni illustri matematici hanno fatto (ma,
si tratta di una posizione minoritaria, e comunque un aspetto metodologico molto sottile il cui
studio ora del tutto prematuro).
1.3. STRUTTURA DEGLI INTERI 37

primo o composto (test di primalit) estremamente complesso ed tuttora un attivo


campo di ricerca (tant che un risultato importante in questo ambito del 2002)17 .
Per intuire la di colt del problema si osservipche, se n composto,
p esistono due
naturali a; b > 1 tali che n = ab. Quindi, a n oppure b n (diversamente,
p
ab > n), e dunque esiste un divisore di n tra i naturali compresi tra 1 e n. Per
vericare se n pprimo o composto possiamo quindi limitarci a dividere n per tutti i
naturali tra 1 e n: se nessuno di essi risulta essere un divisore di n, concludiamo p
che n primo; diversamente, che n composto. La procedura richiede al pi n
operazioni (di divisione).
Forti di queste considerazioni, supponiamo di voler vericare se il numero 10100 +
1 primo o composto (si tratta di un numero p di 101 cifre, quindi grande ma non
grandissimo). La procedura richiede al pi 10 + 1 operazioni, ossia al pi circa 1050
100

operazioni. Supponiamo di possedere un potentissimo calcolatore in grado di svolgere


1010 (dieci miliardi) operazioni al secondo. Poich in un anno vi sono 31:536:000
secondi, cio circa 3 107 secondi, il nostro calcolatore in un anno in grado di svolgere
circa 3 107 1010 = 3 1017 operazioni. Per svolgere le operazioni che la procedura
potrebbe richiedere, il nostro calcolatore ha bisogno di

1050 1 33
= 10
3 1017 3

anni. meglio cominciare subito...

Si osservi che, se conosciamo la rappresentazione primale di due numeri naturali n


e m, possiamo facilmente determinare il loro massimo comune divisore. Per esempio,
da
3801 = 3 7 181 e 1708 = 22 7 61
segue subito che mcd (3801; 1708) = 7, il che conferma quanto gi determinato con
lalgoritmo di Euclide. Vista la grande di colt di fattorizzare i numeri naturali,
losservazione per di scarsa importanza dal punto di vista computazionale. perci
bene tenersi caro lalgoritmo di Euclide che in grado di calcolare, con ragionevole
e cienza grazie al Teorema di Lam, i massimi comuni denominatori senza dover
passare tramite alcuna fattorizzazione.

Ma quanti sono?
Vista limportanza dei numeri primi, naturale chiedersi quanti siano. Il prossimo
celeberrimo risultato, dovuto a Euclide, mostra che essi sono inniti. Dopo il Teorema
8, la seconda notevolissima gemma della matematica classica che abbiamo la fortuna
di incontrare nel volgere di poche pagine.
17
Una delle ragioni per cui lo studio di test di fattorizzazione un attivo campo di ricerca che la
di colt di fattorizzare i numeri naturali sfruttata dalla moderna crittograa per costruire codici
impenetrabili.
38 CAPITOLO 1. INSIEMI E NUMERI

Teorema 14 (Euclide) Esistono inniti numeri primi.

Dim. La dimostrazione per contraddizione. Supponiamo esista un numero nito di


numeri primi e indichiamoli con p1 < p2 < < pn . Si ponga

q = p1 p2 pn

e m = q + 1. Il numero naturale m maggiore di tutti i numeri primi, ed quindi


un numero composto. Per il Teorema fondamentale dellaritmetica, esso dunque
divisibile per almeno uno dei numeri primi p1 , p2 , ..., pn . Indichiamo tale divisore
con p. Entrambi i numeri naturali m e q sono quindi divisibili per p. Ne segue che
anche la loro dierenza, ossia il numero naturale 1 = m q, divisibile per p , il che
impossibile perch p > 1. La contraddizione mostra che lassunzione che esista un
numero nito di numeri primi falsa.

In conclusione, abbiamo visto alcune nozioni di base di Teoria dei numeri, la bran-
ca della Matematica che si occupa delle propriet dei numeri interi. uno dei campi
pi aascinanti e di cili della Matematica, con risultati di grande profondit, spes-
so relativamente facili da enunciare ma di cili da dimostrare. Lesempio classico al
riguardo il famoso Ultimo Teorema di Fermat, il cui enunciato molto semplice: se
n 3 non esistono tre numeri interi positivi x, y e z tali che xn + y n = z n . Grazie al
Teorema di Pitagora sappiamo che per n = 2 tali terne di interi esistono (per esempio,
32 + 42 = 52 ); lUltimo Teorema di Fermat aerma che n = 2 in realt lunico caso in
cui questa notevole propriet vale. Enunciato da Fermat, il teorema stato dimostrato
nel 1994 da Andrew Wiles dopo pi di tre secoli di inutili tentativi.

1.4 Struttura dordine di R


Volgiamo ora la nostra attenzione allinsieme R dei numeri reali, centrale per le appli-
cazioni. Unimportante propriet di R la possibilit di ordinare gli elementi tramite
la disuguaglianza . Il signicato intuitivo di tale disuguaglianza chiaro: dati due
reali a e b, si ha a b quando a grande almeno quanto b.
Consideriamo le seguenti propriet della disuguaglianza :

(i) riessivit: a a;

(ii) antisimmetria: se a beb a, allora a = b;

(iii) transitivit: se a beb c, allora a c;

(iv) completezza: per ogni coppia a; b 2 R, si ha a b oppure b a (o entrambe);

(v) indipendenza additiva: se a b, allora a + c b + c per ogni c 2 R.


1.4. STRUTTURA DORDINE DI R 39

(vi) indipendenza moltiplicativa: sia a b; allora

ac bc se c > 0

ac = bc = 0 se c = 0

ac bc se c < 0

(vii) separazione: dati due insiemi di numeri reali A e B, se a b per ogni a 2 A e


b 2 B, allora esiste c 2 R tale che a c b per ogni a 2 A e b 2 B.

Le prime tre propriet hanno unovvia interpretazione. La completezza garantisce


che, dati due numeri reali qualsiasi, essi possano sempre essere ordinati. Lindipen-
denza additiva fa s che lordinamento iniziale tra due reali a e b non sia alterato dal
sommare a entrambi uno stesso reale c. Lindipendenza moltiplicativa considera invece
la stabilit di tale ordinamento rispetto alla moltiplicazione.
Inne, la separazione permette di separare due insiemi tra loro ordinati da
ossia tali che ogni elemento delluno maggiore o uguale a ogni elemento dellaltro
tramite un numero reale c, detto elemento separatore 18 .

La forma stretta a > b della disuguaglianza debole indica che a strettamente


pi grande di b. In termini di si ha a > b se e solo se b a, cio la disuguaglianza
stretta si pu vedere come negazione della disuguaglianza debole (di verso opposto).
In ogni caso, il lettore pu vericare che transitivit e indipendenza, additiva e molti-
plicativa, valgono anche per la disuglianza stretta, sostituendo con >. Lasciamo al
lettore vericare che le altre propriet della disuglianza non valgono, invece, per >.

La struttura dordine, caratterizzata dalle propriet (i)-(vii), fondamentale in


R. Prima di iniziarne lo studio, introduciamo grazie a e > alcuni sottoinsiemi
fondamentali di R:

(i) gli intervalli chiusi limitati [a; b] = fx 2 R : a x bg;

(ii) gli intervalli aperti limitati (a; b) = fx 2 R : a < x < bg;

(iii) gli intervalli semichiusi (o semiaperti) limitati (a; b] = fx 2 R : a < x bg e


[a; b) = fx 2 R : a x < bg.

Sono inoltre importanti


18
Si noti che
p la propriet vale anchepper N e Z, ma non per Q. Per esempio, gli insiemi A =
q 2 Q : q < 2 e B = q 2 Q : q > 2 non hanno un elemento separatore razionale, come il
lettore potr vericare alla luce di quanto vedremo nella Sezione 1.4.3.
40 CAPITOLO 1. INSIEMI E NUMERI

(iv) gli intervalli illimitati 19 [a; 1) = fx 2 R : x ag e (a; 1) = fx 2 R : x > ag,


nonch i loro analoghi ( 1; a] e ( 1; a). In particolare, la semiretta positiva
[0; 1) spesso indicata con R+ , mentre R++ indica (0; 1), ossia la semiretta
positiva privata dellorigine.

Luso degli aggettivi aperto, chiuso e illimitato diverr chiaro nel Capitolo 5. Per
semplicit di notazione, nel seguito (a; b) star ad indicare sia un intervallo aperto
limitato sia gli illimitati (a; 1), ( 1; b) e ( 1; 1) = R. Analogamente, con (a; b]
e [a; b) si indicheranno sia gli intervalli semichiusi limitati sia gli illimitati ( 1; b] e
[a; 1).

1.4.1 Massimi e minimi


Denizione 8 Sia A R un insieme non vuoto di numeri reali. Un numero h 2 R
si dice maggiorante di A se pi grande (meglio, non pi piccolo) di ogni elemento di
A, ossia se20
h x 8x 2 A;
mentre si dice minorante di A se pi piccolo (meglio, non pi grande) di ogni
elemento di A, ossia se
h x 8x 2 A:

Per esempio, se A = [0; 1], il numero 3 un maggiorante e il numero 1 un mino-


rante poich 1 x 3 per ogni x 2 [0; 1]. In particolare, linsieme dei maggioranti
di A lintervallo [1; 1) e linsieme dei minoranti lintervallo ( 1; 0].
Indicheremo con A linsieme dei maggioranti di A e con A linsieme dei minoranti.
Nellesempio appena visto, A = [1; 1) e A = ( 1; 0].

Facciamo alcune semplici osservazioni:

(i) Maggioranti e minoranti possono non appartenere allinsieme A: il maggiorante


3 e il minorante 1 di [0; 1] ne sono un esempio.

(ii) Maggioranti e minoranti possono non esistere. Per esempio, per linsieme dei
numeri pari
f0; 2; 4; 6; g (1.14)
non esiste alcun reale che sia pi grande di tutti: linsieme non ha maggioranti.
Analogamente, linsieme
f0; 2; 4; 6; g (1.15)
19
Quando non vi sia pericolo di equivoci, scriveremo semplicemente 1 in luogo di +1. Il simbolo
1 fu introdotto nella Matematica da John Wallis nel Seicento e richiama una curva detta lemniscata
e una specie di cappello o di aureola (simbolo di forza) posto sul capo di alcune gure dei tarocchi:
in ogni caso non un 8 coricato
20
Il quanticatore universale 8 si legge per ogni. Quindi, la scrittura 8x 2 A si legge per ogni
elemento x appartenente allinsieme A.
1.4. STRUTTURA DORDINE DI R 41

non ha minoranti, mentre linsieme degli interi Z un semplice esempio di insieme


che non ha n maggioranti n minoranti.

(iii) Se h un maggiorante, lo anche ogni h0 > h, e, analogamente, se h un


minorante, lo anche ogni h00 < h. Quindi, se esistono, maggioranti e minoranti
non sono unici.

Usando maggioranti e minoranti, diamo una prima classicazione degli insiemi della
retta reale.

Denizione 9 Un insieme non vuoto A R si dice:

(i) superiormente limitato se ha un maggiorante, ossia se A 6= ;;

(ii) inferiormente limitato se ha un minorante, ossia se A 6= ;;

(iii) limitato se sia superiormente sia inferiormente limitato.

Per esempio, lintervallo chiuso [0; 1] limitato poich sia superiormente sia infe-
riormente limitato, mentre linsieme (1.14) dei pari inferiormente, ma non superior-
mente, limitato (infatti, abbiamo visto come non abbia maggioranti). Analogamente,
linsieme (1.15) superiormente, ma non inferiormente, limitato.
Si noti che questa classicazione degli insiemi non esaustiva: esistono insiemi che
non ricadono in alcuno dei punti (i)-(iii) della precedente denizione. Per esempio,
Z non ha n maggioranti n minoranti in R, e quindi non soddisfa nessuno dei punti
(i)-(iii). Tali insiemi si dicono illimitati.

Introduciamo ora una fondamentale classe di maggioranti e minoranti.

Denizione 10 Dato un insieme non vuoto A R, un elemento x^ di A si dice


massimo di A se il pi grande elemento di A, ossia se

x^ x 8x 2 A;

mentre si dice minimo di A se il pi piccolo elemento di A, ossia se

x^ x 8x 2 A:

La caratteristica cruciale della denizione la richiesta che massimo e minimo


appartengano allinsieme A considerato. immediato vedere come massimi e minimi
siano, rispettivamente, particolari maggioranti e minoranti. In eetti, essi non sono
altro che maggioranti e minoranti che appartengono allinsieme A.

Esempio 6 Lintervallo chiuso [0; 1] ha minimo 0 e massimo 1. N


42 CAPITOLO 1. INSIEMI E NUMERI

Molte applicazioni economiche vertono sulla ricerca dei massimi o dei minimi di
opportuni insiemi di possibilit alternative. Purtroppo, si tratta di nozioni piuttosto
fragili perch spesso gli insiemi non ammettono massimi o minimi.

Esempio 7 Lintervallo semichiuso [0; 1) ha minimo 0, ma non ha massimo. Infatti,


supponiamo per contraddizione che esista un massimo x^ 2 [0; 1), ossia che valga x^ x
per ogni x 2 [0; 1). Si ponga
1 1
x~ = x^ + 1:
2 2
Poich x^ < 1, si ha x^ < x~. Ma immediato vedere che x~ 2 [0; 1), il che contraddice il
fatto che x^ sia massimo di [0; 1). N

Ragionando in modo analogo si vede che:

(i) lintervallo semichiuso (0; 1] ha massimo 1 ma non ha minimo;

(ii) lintervallo aperto (0; 1) non ha n minimo n massimo.

Quando esistono, massimi e minimi sono unici:

Proposizione 15 Un insieme A R ha al pi un solo massimo e un solo minimo.

Dim. Siano x^1 ; x^2 2 A due massimi di A. Mostriamo che x^1 = x^2 . Poich x^1 un
massimo, si ha x^1 x per ogni x 2 A. In particolare, poich x^2 2 A, si ha x^1 x^2 .
Analogamente, x^2 x^1 perch anche x^2 un massimo, e quindi x^1 = x^2 . In modo
simile si mostra lunicit del minimo.

Il massimo di un insieme A si indica con max A, e il suo minimo con min A. Per
esempio, per A = [0; 1], si ha max A = 1 e min A = 0.

1.4.2 Estremi superiore e inferiore


Poich massimi e minimi sono essenziali nelle applicazioni (e non solo in esse), la
loro fragilit un problema sostanziale. Per alleviare tale problema cerchiamo un
surrogato, cio una nozione concettualmente simile, ma meno fragile, cos da averla
a disposizione anche quando non si hanno massimi o minimi.
Consideriamo prima i massimi21 . Losservazione dalla quale partire che il massi-
mo, quando esiste, il pi piccolo dei maggioranti, ossia

max A = min A : (1.16)

Sia x^ 2 A il massimo di A. Se h un maggiorante di A, si ha infatti h x^ poich


x^ 2 A. Daltra parte, x^ a sua volta un maggiorante e si ha quindi luguaglianza
(1.16).
21
Come gi menzionato, in Economia i massimi hanno un ruolo di primaria importanza.
1.4. STRUTTURA DORDINE DI R 43

Esempio 8 Abbiamo visto che linsieme dei maggioranti di [0; 1] lintervallo [1; 1).
In questo esempio luguaglianza (1.16) prende la forma max [0; 1] = min [1; 1). N
Quando esiste, il massimo quindi il pi piccolo dei maggioranti. Ma, il pi
piccolo dei maggioranti, ossia min A , pu esistere anche quando il massimo non esiste.
Per esempio, consideriamo A = [0; 1): il massimo non esiste, ma il pi piccolo dei
maggioranti esiste ed 1, cio min A = 1.
Tutto ci candida il pi piccolo dei maggioranti a essere il surrogato del massimo di
cui siamo alla ricerca. In eetti, nellesempio appena visto, il punto 1 , in mancanza
di un massimo, il valore che pi gli vicino in spirito.
Ragionando in modo analogo, il pi grande dei minoranti, ossia max A , il can-
didato naturale a surrogare il minimo, quando questi non esista. Motivati da quanto
precede, diamo la seguente denizione.
Denizione 11 Dato un insieme non vuoto A R, si dice estremo superiore di A il
pi piccolo dei maggioranti di A, ossia min A , ed estremo inferiore il pi grande dei
minoranti di A, ossia max A .
Grazie alla Proposizione 15, sia lestremo superiore sia linferiore di A, quando
esistono, sono unici. Li indichiamo con la notazione sup A e inf A. Per esempio, se
A = (0; 1), si ha inf A = 0 e sup A = 1.
Come s gi detto, se inf A 2 A, esso ne il minimo e, se sup A 2 A, ne il
massimo.
Sebbene gli estremi superiore e inferiore possano esistere in assenza di massimi e
minimi, anchessi non sempre esistono.
Esempio 9 Consideriamo linsieme A dei numeri pari in (1.14). In questo caso A = ;
e lestremo superiore non esiste. Pi in generale, se A non superiormente limitato, si
ha A = ; e lestremo superiore non esiste. In modo analogo, gli insiemi che non sono
inferiormente limitati non hanno estremo inferiore22 . N
Abbiamo trovato un ragionevole surrogato per le nozioni sia di massimo sia di
minimo, ossia lestremo superiore e linferiore. Tuttavia, per essere utili, occorre che
essi esistano per una classe su cientemente ampia di insiemi; diversamente, se anche la
loro esistenza fosse spesso problematica, sarebbero di ben poco aiuto come surrogati23 .
Per fortuna, il prossimo importante risultato, il Teorema di completezza dei reali,
garantisce lesistenza degli estremi per unampia classe di insiemi, mostrando che gli
insiemi del tipo visto nellultimo esempio sono in eetti gli unici per i quali non esistono
gli estremi.
22
Qualora A non ammetta estremo superiore, si usa scrivere sup A = +1 e, qualora non ammetta
estremo inferiore, inf A = 1. Si pone inoltre convenzionalmente sup ; = 1 e inf ; = +1. Ci
motivato dalla circostanza che ogni numero reale da considerare simultaneamente un maggiorante
e un minorante di A: naturale allora concludere che sup ; = inf ; = inf R = 1 e inf ; = sup ; =
sup R = + 1.
23
Lutilit di un surrogato dipende sia da quanto bene esso approssimi loriginale sia da quanto
ampia sia la sua disponibilit.
44 CAPITOLO 1. INSIEMI E NUMERI

Teorema 16 (di completezza dei reali) Ogni insieme A R non vuoto e superi-
ormente limitato possiede estremo superiore; se A non vuoto e inferiormente limitato
possiede estremo inferiore.
Dim. Ci limitiamo alla prima aermazione. Dire che A superiormente limitato
signica che ammette qualche maggiorante, cio che A non vuoto. Poich a h per
ogni a 2 A e ogni h 2 A , per la propriet di separazione esiste un elemento separatore
c 2 R tale che a c h per ogni a 2 A e ogni h 2 A . Poich c a per ogni a 2 A,
si ha che c un maggiorante di A, sicch c 2 A . Ma, da c h per ogni h 2 A segue
che c = min A , ossia c = sup A. Ci prova lesistenza dellestremo superiore di A.

Quindi, eccetto gli insiemi non superiormente limitati, tutti gli altri insiemi in R
ammettono estremo superiore. Analogamente, eccetto gli insiemi non inferiormente
limitati, tutti gli altri insiemi in R hanno estremo inferiore. Ci conferma che gli
estremi superiori e inferiori sono in eetti ottimi surrogati, sulla cui esistenza possiamo
contare per unamplissima classe di insiemi di R.
Si osservi che, grazie al Teorema di completezza dei reali, tutti gli insiemi limitati
hanno estremo sia superiore sia inferiore.

1.4.3 Densit
La struttura dordine utile anche per chiarire i rapporti tra gli insiemi N, Z, Q e R.
Come prima cosa rendiamo rigorosa una intuizione naturale: per quanto grande sia un
numero reale, esiste sempre un numero naturale pi grande. Si tratta della cosiddetta
propriet archimedea dei reali.
Proposizione 17 Per ogni reale a 2 R esiste un naturale n 2 N tale che n a.
Dim. Sia a 2 R. Poich linsieme N non superiormente limitato, a non un suo
maggiorante. Esiste quindi n 2 N tale che n a.

La prossima propriet evidenzia una dierenza fondamentale tra le strutture di N


e Z, da una parte, e di Q e R, dallaltra. Se prendiamo un numero intero, possiamo
parlare in modo molto naturale di predecessore e successore. In particolare, se m 2 Z,
il suo predecessore lintero m 1, mentre il suo successore lintero m + 1 (per
esempio, il predecessore di 317 316 e il suo successore 318). In altre parole, Z ha
un ritmodiscreto.
Al contrario, non possiamo parlare di predecessori e successori in Q o in R. Con-
sideriamo prima Q. Dato un razionale q = m=n, sia q 0 = m0 =n0 un razionale qualsiasi
tale che q 0 > q. Si ponga
1 0 1
q 00 = q + q:
2 2
Il numero q 00 razionale poich
1 m0 1 m 1 m0 n + mn0
q 00 = + =
2 n0 2 n 2 nn0
1.4. STRUTTURA DORDINE DI R 45

e risulta
q < q 00 < q 0 : (1.17)
Non esiste quindi il pi piccolo razionale maggiore di q. Analogamente, facile vedere
come non esista il pi grande razionale minore di q. I razionali non ammettono quindi
n predecessori n successori.
In modo del tutto simile si mostra che, dati due reali qualsiasi a < b, esiste un
reale c tale che a < c < b. Infatti
1 1
a< a+ b<b
2 2
Anche i reali non ammettono quindi n predecessori n successori. Il ritmo di razionali
e reali , per cos dire, serrato, senza interruzioni discrete. Tale propriet di Q e R
detta densit. A dierenza di N e Z, che sono insiemi discreti, Q e R sono insiemi
densi, privi di buchi.

Concludiamo con unimportante relazione di densit tra Q e R. Abbiamo osservato


come si possa dimostrare che la gran parte dei reali non sia razionale, ossia come
gran parte dei punti sulla retta sia rappresentata da numeri irrazionali. Tuttavia, i
razionali sono un sottoinsieme denso, e quindi molto signicativo, dei reali perch,
come mostra il prossimo risultato, nella disuguaglianza a < c < b, con a; b 2 R, si pu
sempre scegliere c tra i razionali: tra due reali qualsiasi si pu cio sempre inlare
un razionale.

Proposizione 18 Dati due reali qualsiasi a < b, esiste un razionale q 2 Q tale che
a < q < b.

La propriet in discorso si pu enunciare aermando che Q denso in R. Nella


dimostrazione si usa la nozione di parte intera [a] di un reale a 2
p R, cio il pi grande
intero n 2 Z tale che n a. Per esempio, [ ] = 3, [5=2] = 2, 2 = 1, [ ] = 4 e
cos via. Il lettore pu vericare che

[a + 1] = [a] + 1

poich, per ogni n 2 Z, si ha n a se e solo se n + 1 a + 1. Inoltre, [a] < a quando


a2= Z.

Dim. Siano a; b 2 R, con a < b. Per semplicit, distinguiamo tre casi.

Caso 1: Sia a + 1 = b. Se a 2 Q il risultato segue dalla (1.17). Sia a 2


= Q, e quindi
a+12= Q. Si ha
[a] a < [a] + 1 = [a + 1] < a + 1 (1.18)
e quindi q = [a] + 1 il razionale cercato.

Caso 2: Sia b a > 1, cio


a<a+1<b
46 CAPITOLO 1. INSIEMI E NUMERI

Dal Caso 1 segue che lesistenza di q 2 Q tale che a < q < a + 1 < b.

Caso 3: Sia b a < 1. Grazie alla propriet archimedea dei reali, esiste n 2 N; n 6= 0;
tale che
1
n ;
b a
sicch nb na = n (b a) 1. Allora, per quanto appena visto nei casi 1 e 2, esiste
q 2 Q tale che na < q < nb. Quindi,

q
a< <b
n

il che completa la dimostrazione perch q=n 2 Q.

OfB. Per il (pi di cile) caso 3, presentiamo una dimostrazione alternativa che prende
in esame diversi casi, a seconda che almeno uno dei reali sia razionale, oppure che siano
entrambi irrazionali.
Per esempio, siano a 2 Q e b 2 = Q, e sia = b a con 0 < < 1: Chiaramente,
n
esiste n 0 tale che > 10 (che vale infatti per ogni n > log10 (1= )). Allora,
preso q = a + 10 n , si ha q 2 Q e inoltre a < q < b. ll fatto che q 2 Q ovvio, dato
che si tratta di somma di due razionali. Inne, a < a + 10 n = q < a + = b: Il caso
di b razionale e a irrazionale si dimostra analogamente.
Pi delicato il caso in cui a e b sono entrambi irrazionali. In tale evenienza, sia
= b a < 1, e sia n 0 tale che > 10 n : Allora, preso q = [a 10n ] 10 n + 10 n ,
si ha q 2 Q e inoltre a < q < b. Il fatto che q sia razionale ovvio, dato che si tratta
della somma di due razionali. Dimostriamo che a < q < b. Infatti, si ha

q = [a 10n ] 10 n
+ 10 n
a 10n 10 n
+ 10 n
= a + 10 n
<a+ = b;

dove abbiamo usato la prima delle due disuguaglianze in (1.18). Inne si ha

q = [a 10n ] 10 n
+ 10 n
= 10 n
([a 10n ] + 1) > 10 n
(a 10n ) = a;

dove abbiamo usato la seconda delle disuguaglianze in (1.18). Abbiamo quindi di-
mostrato che a < q < b.
La dimostrazione ha il pregio di mostrare come si possa costruire un numero
razionale che giace tra due irrazionali: in particolare, il numero razionale che si in-
serisce tra di loro si costruisce secondo quanto lintuizione suggerirebbe di fare. Si
prendono tutte le cifre decimali comuni ai due numeri, si azzerano le restanti ( ci
che si ottiene facendo [a 10n ] 10 n ) e si aggiunge una quantit positiva, razionale e pi
piccola della dierenza tra i due numeri ( ci che si fa aggiungendo 10 n ). Il numero
risultante per costruzione razionale ed incluso tra i due irrazionali considerati. H
1.5. POTENZE E LOGARITMI 47

1.5 Potenze e logaritmi


1.5.1 Potenze
1
Dato n 2 N, abbiamo gi ricordato il signicato di q n con q 2 Q e di q n con 0 < q 2 Q.
1
In modo del tutto analogo si deniscono an con a 2 R e e a n con 0 < a 2 R. Pi in
generale, si pone
1 m 1
a n = n e a n = (am ) n
a
per m; n 2 N e 0 < a 2 R. Abbiamo quindipdenito la potenza ar di base reale positiva
m
ed esponente razionale. Talvolta si scrive n am in luogo di a n .
Dato 0 < a 2 R, vogliamo ora estendere questa nozione al caso ax con x 2 R, ossia
con esponente reale. Prima di farlo, vediamo due importanti osservazioni.

NB. Abbiamo denito ar soltanto per a > 0. Ci per evitare pericolosi q e imbarazzanti
3 p
equivoci. Si pensi, per esempio, a ( 5) 2 . Essa si potrebbe riscrivere 2 ( 5)3 = 2 125
p 3
oppure come 2 5 che non esistono (tra i reali). Ma si potrebbe scrivere anche
3 6
q p
( 5) = ( 5) che, a sua volta, si pu riesprimere come 4 ( 5)6 = 4 15:625 che
2 4

p 6
esiste e vale circa 11; 180339 oppure come 4 5 che non esiste. O

NB. Consideriamo la radice p 1


a = a2
p
largamente noto che ogni numero positivo possiede due radici: per esempio 9 =
3. La doppia possibilit si usa qualicare radice algebrica; lunico valore positivo
della radice si dice invece radice aritmetica: per esempio 3 e 3 sono le due radici
algebriche di 9, mentre 3 ne lunica radice aritmetica.
Nel seguito le radici di ordine pari saranno sempre intese in senso aritmetico (e
quindi con un solo valore). Si tratta, del resto, della convenzione pi abituale: per
esempio, nella classica formula risolutiva
p
b b2 4ac
x= ;
2a
di unequazione ax2 +bx+c = 0 di secondo grado, la radice intesa in senso aritmetico
(se fosse in senso algebrico non vi sarebbe alcuna necessit di scrivere , perch la
radice sarebbe gi di per s doppia). O

1.5.2 Potenze con esponente reale


Riprendiamo il lo del discorso, estendiamo la nozione di potenza al caso ax , con
0 < a 2 R e x 2 R. Purtroppo, i dettagli di questa estensione sono tediosi. Ci
accontentiamo di dire che ax , se a > 1, non altro che lestremo superiore dellinsieme
di tutti i valori aq al variare di q tra i razionali tali che q x. Formalmente,
48 CAPITOLO 1. INSIEMI E NUMERI

ax = sup faq : q x con q 2 Qg . (1.19)


In modo analogo si denisce ax per 0 < a < 1. Valgono le seguenti propriet, che,
grazie alla (1.19), seguono dalle analoghe propriet che valgono quando lesponente
razionale.

Lemma 19 Sia a > 0 e x; y 2 R. Si ha ax > 0 per ogni x 2 R. Inoltre:

(i) ax ay = ax+y e ax =ay = ax y ;

(ii) (ax )y = axy ;

(iii) ax bx = (ab)x e ax =bx = (a=b)x ;

(iv) se x > y si ha
ax > a y se a > 1

ax < a y se a < 1

ax = ay = 1 se a = 1

Tra le basi a > 0 la pi importante il numero e. Come vedremo, la potenza ex


gode di notevolissime propriet.

1.5.3 Logaritmi
Le operazioni di addizione e di moltiplicazione sono commutative (a + b = b + a e
ab = ba) e hanno perci una sola operazione inversa, rispettivamente la sottrazione e
la divisione:

(i) se a + b = c allora b = c aea=c b

(ii) se ab = c allora b = c=a e a = c=b, con a; b 6= 0.

Loperazione di potenza ab , con a > 0, non invece commutativa: ab ben diversa


da ba e quindi essa possiede due distinte operazioni inverse.
Sia ab = c. La prima operazione inversa (assegnati c e b, individuare a) detta
radice b-esima di c: p
a = b c = c1=b :
La seconda (assegnati c e a, risalire a b) detta logaritmo 24 in base a di c:

b = loga c.
24
Il nome un omaggio al grande matematico arabo Al-Khuwarizmi (o Al-Quwarizmi). Un altro
omaggio algoritmo.
1.5. POTENZE E LOGARITMI 49

Si noti che, oltre a dover essere a > 0 e c > 0, devessere anche a 6= 1 perch 1b = c
impossibile salvo quando c = 1.

Il logaritmo una nozione fondamentalissima, ubiqua in matematica e in tutte le


sue applicazioni. Come abbiamo appena visto, si tratta di una nozione molto semplice:
il numero b = loga c non altro che lesponente da attribuire ad a per ottenere c, cio
aloga c = c:
Le propriet dei logaritmi derivano facilmente dalle propriet delle potenze viste
nel Lemma 19.
Lemma 20 Siano a > 0 e c; d > 0, con a 6= 1. Si ha:
(i) log1=a c = loga c;
1
(ii) logak c = k
loga c per ogni 0 6= k 2 R;
(iii) loga (cd) = loga c + loga d;
(iv) loga (c=d) = loga c loga d;
(v) loga ck = k loga c per ogni k 2 R.
(vi) loga c = logb c= logb a ( cambiamento di base).
b
Dim. (i) Se (1=a)b = c, allora a b = c. (ii) Se ak = c, allora akb = c e perci
lesponente da dare ad ak per ottenere c 1=k dellesponente da dare ad a. (iii)
Siano ax = c, ay = d e az = cd: dato che cd = ax ay = ax+y segue lasserto. (iv)
La dimostrazione analoga alla precedente. (v) Siano ax = c e ay = ck : dato che
ck = (ax )k = akx segue lasserto25 . (vi) Siano ax = c, by = c e bz = a: si ha allora
ax = (bz )x = bzx = c = by e perci zx = y cio x = y=z.

Alla luce della propriet (vi) di cambiamento di base, si pu prendere come base
dei logaritmi sempre lo stesso numero, per esempio 10, perch
log10 c
loga c = :
log10 a
In realt, come per le potenze ax , anche per i logaritmi la base largamente pi
comune il numero e, che verr introdotto nel Capitolo 9. In tal caso si scrive sem-
plicemente log x in luogo di loge x. A cagione della sua importanza, log x anche
chiamato logaritmo naturale di x, il che porta alla notazione ln x talvolta usata in
alternativa a log x.

Il prossimo risultato evidenzia i legami strettissimi esistenti tra logaritmi e potenze,


che possono vedersi come nozioni tra loro inverse.
25
Per esempio, con a 6= 1, loga x2 = 2 loga x per x > 0. Si osservi che loga x2 esiste per ogni x 6= 0,
mentre 2 loga x esiste soltanto per x > 0.
50 CAPITOLO 1. INSIEMI E NUMERI

Proposizione 21 Dato a > 0, a 6= 1, si ha

loga ax = x 8x 2 R

e
aloga x = x 8x > 0.

Lasciamo al lettore la semplice dimostrazione.

1.6 Numeri, dita e circuiti


Il modo pi abituale di scrivere i numeri utilizza la cosiddetta rappresentazione
decimale. Si sono scelti dieci segni graci

0; 1; 2; 3; 4; 5; 6; 7; 8; 9 (1.20)

le cifre, e con esse, utilizzando la notazione posizionale, ogni numero naturale pu


essere scritto tramite alcune cifre che, da destra a sinistra, ne indicano rispettivamente
le unit, le decine, le centinaia, le migliaia, ecc..
Cos, per esempio 4357 signica 4 migliaia, 3 centinaia, 5 decine e 7 unit. I
numeri naturali risultano cos scanditi dalle potenze di 10, ognuna delle quali determina
laggiunta di una cifra: la scrittura 4357 labbreviazione di

4 103 + 3 102 + 5 101 + 7 100 :

Per la notazione posizionale assolutamente fondamentale luso dello 0 per indicare


una casella vuota: per esempio, nella scrittura 4057 lo zero indica lassenza di centinaia,
cio
4 103 + 0 102 + 5 101 + 7 100 :
I numeri non interi si rappresentano in maniera del tutto analoga scandendoli
rispetto alle potenze di 1=10 = 10 1 : cos, per esempio 0; 501625 labbreviazione di
1 2 3 4 5
5 10 + 0 10 + 1 10 + 6 10 + 2 10 + 5 10 6 :

La scelta della rappresentazione decimale dipesa dalla circostanza che abbiamo


dieci dita, ma ovviamente non lunica possibile. Alcune popolazioni americane con-
tavano sulle mani ma utilizzando, anzich le dieci dita, gli otto spazi tra esse. Essi
avrebbero scelto soltanto 8 cifre, che senza fantasia supponiamo essere

0; 1; 2; 3; 4; 5; 6; 7

e avrebbero scandito i vari numeri interi sulla base delle potenze di 8, cio 8, 64, 512,
4096, . . . Avrebbero scritto il nostro decimale 4357 come

1 4096 + 0 512 + 4 64 + 0 8 + 5 = 1 84 + 0 83 + 4 82 + 0 81 + 5 80 = 10405


1.6. NUMERI, DITA E CIRCUITI 51

e il decimale 0; 501625 come

1 2
4 0; 125 + 1 0; 0015625 = 4 8 +1 8 = 0; 41:
In generale, data una base b e linsieme di cifre

Cb = fc0 ; c1 ; :::; cb 1 g

per rappresentare gli interi tra 0 e b 1, ogni numero naturale n si scrive in base b
come
dk dk 1 d1 d0
dove k un opportuno numero naturale e

n = dk bk + dk 1 bk 1
+ + d1 b + d0

con di 2 Cb per ogni i = 0; :::; k.


Per esempio, consideriamo la base duodecimale, con cifre

0; 1; 2; 3; 4; 5; 6; 7; 8; 9; |;

In questo caso abbiamo usato i simboli | e per le due cifre addizionali di cui abbiamo
bisogno rispetto al caso decimale. Il numero duodecimale

9|02 = 9 124 + | 123 + 0 122 + 12 + 2

si converte in numerazione decimale come

9|02 = 9 124 + | 123 + 0 122 + 12 + 2


= 9 124 + 10 123 + 0 122 + 11 12 + 2
= 188630

facendo uso della tabella di conversione


Duod. 0 1 2 3 4 5 6 7 8 9 |
Dec. 0 1 2 3 4 5 6 7 8 9 10 11

Si noti come la rappresentazione duodecimale 9|02 usi meno cifre di quella decimale
188630, ossia cinque invece di sei. Daltra parte, la numerazione duedicimale necessita
di 12 simboli da usare come cifre, invece dei 10 di quella decimale. un tipico trade
o che si aronta nella scelta della base con cui rappresentare i numeri: basi maggiori
permettono di rappresentare i numeri con meno cifre, ma richiedono un pi complesso
insieme di cifre. La risoluzione del trade o, e la conseguente scelta della base, dipende
dalle caratteristiche dellapplicazione di interesse.
Per esempio, in ingegneria eletronica importante avere un insieme semplicissimo
di cifre, con due soli elementi, perch calcolatori e apparecchi elettronici dispongono
in maniera naturale di due sole cifre (circuito aperto o chiuso, polarit positiva o
52 CAPITOLO 1. INSIEMI E NUMERI

negativa). Per tale ragione in questo ambito diusissima la base 2, la pi economica


tra le basi in termini di complessit dellinsieme di cifre C2 , che consta delle solo cifre
0 e 1 (detti bit, dallinglese binary digits)
In rappresentazione binaria, i vari interi si scrivono come

Dec. 0 1 2 3 4 5 6 7 8 9 10 11 16
Bin. 0 1 10 11 100 101 110 111 1000 1001 1010 1011 10000

dove per esempio, in binario

11 = 1 23 + 0 22 + 1 21 + 1 20

e in decimale
11 = 1 101 + 1 100
Lestrema economicit su C2 permessa dalla base 2 ha come costo il gran numero di
bit richiesto dalla rappresentazione binaria dei numeri. Per esempio, dove 16 consta di
due cifre decimali il corrispettivo binario 10000 usa cinque bit, dove 201 usa tre cifre
il corrispettivo binario 11001001 usa otto bit, dove 2171 usa quattro il corrispettivo
binario 100001111011 usa dodici bit, e cos via. Rapidamente la rappresentazione
binaria richiede un numero di bit che solo un computer in grado di digerire.

Dal punto di vista puramente matematico, la scelta della base del tutto conven-
zionale e passare da una base a unaltra facile (bench estremamente tedioso)26 . Le
basi 2 e 10 sono oggi di gran lunga le basi pi importanti, ma nel passato si sono
utilizzate come basi anche 20 (il numero delle dita di mani e piedi; ne resta traccia
nel francese dove tuttora si dice quattro-venti per ottanta e quattro-venti-dieci
per novanta), nonch 16 (gli spazi tra le dita di mani e piedi) e 60 (comodo perch
divisibile per 2, 3, 4, 5, 6, 10, 12, 15, 20 e 30; ne resta ben pi che un ricordo nel come
suddividiamo ore e minuti o nella misurazione degli angoli).

La notazione posizionale stata usata a livello di calcolo manuale dalla notte dei
tempi (si pensi ai conti svolti con labaco), ma una conquista relativamente recente
nella scrittura, resa possibile dalla fondamentale innovazione dello zero e di eccezionale
importanza per lo sviluppo della Matematica e delle sue moltissime applicazioni, com-
merciali, scientiche e tecnologiche. Iniziatasi in India (sembra intorno al V secolo),
la notazione posizionale stata sviluppata nellAlto Medioevo nel mondo arabo, da
cui il nome di numeri arabi spesso usato per le cifre (1.20), ed giunta in Occidente
26
Anche le operazioni su numeri scritti con una rappresentazione non decimale non presentano
di colt. Per esempio 11 + 9 = 20 si svolge in modo binario come

1011+
1001 =
10100

Basta ricordare che il riporto si fa a 2 e non pi a 10.


1.7. LA RETTA REALE ESTESA 53

grazie ai mercanti italiani tra lundicesimo e il dodicesimo secolo. In particolare, il


glio di uno di essi, Leonardo da Pisa (ca. 1170-1240), detto Fibonacci, fu il maggiore
matematico del Medioevo e autore nel 1202 di un celeberrimo trattato, il Liber Abaci,
la pi celebre tra le prime esposizioni della notazione posizionale in Occidente. Sino
ad allora si usava la numerazione romana

I; II; III; IV; V; :::; X; :::; L; :::; C; :::M; :::

che non era posizionale e che rendeva macchinosa lesecuzione anche delle pi banali
operazioni (si provi prima a sommare CXL e M CL, e poi 140 e 1150).
Chiudiamo con lincipit del primo capitolo del Liber Abaci, con la straordinaria
innovazione che il libro portava in Occidente:

Novem gure indorum he sunt

9; 8; 7; 6; 5; 4; 3; 2; 1

Cum his itaque novem guris, et cum hoc signo, quod arabice zephirum
appellatur, scribitur quilibet numerus, ut inferius demonstratur. [...] ut in
sequenti cum guris numeris super notatis ostenditur.

M I M M XXIII M M M XXII M M M XX M M M M M DC MMM


1001 2023 3022 3020 5600 3000

... Et sic in reliquis numeris est procedendum.27

1.7 La retta reale estesa


Nella teoria dei limiti che ci occuper tra breve molto utile considerare la retta reale
estesa, che si ottiene aggiungendo alla retta reale i due punti ideali +1 e 1. Si
ottiene in tal modo linsieme R [ f 1; +1g, indicato col simbolo R. La struttura
dordine di R si estende in modo ovvio su R ponendo 1 < a < +1 per ogni a 2 R.

Le operazioni denite in R possono essere parzialmente estese a R. In particolare,


oltre alle usuali regole di calcolo in R, sulla retta reale estesa valgono le seguenti
ulteriori regole, dette di aritmetizzazione parziale di +1 e 1:

(i) somma con un numero reale:

a + 1 = +1; a 1= 1 8a 2 R (1.21)
27
I nove segni indiani sono ... Con questi nove segni, e col segno 0, che gli arabi chiamano zero, si
scrive un qualsiasi numero, come si mostra nel seguito. [...] i numeri di cui sopra sono qui di seguito
mostrati con i segni ... E cos si continua con i rimanenti numeri.
54 CAPITOLO 1. INSIEMI E NUMERI

(ii) somma tra inniti dello stesso segno:

+1 + 1 = +1 e 1 1= 1

(iii) prodotto con uno scalare non nullo:

a (+1) = +1 e a ( 1) = 1 8a > 0
a (+1) = 1 e a ( 1) = +1 8a < 0

(iv) prodotto tra inniti:


(
+1 (+1) = 1 ( 1) = +1
+1 ( 1) = 1 (+1) = 1

con, in particolare,

(+1)a = +1 se a > 0 e (+1)a = 0 se a < 0

(v) quoziente:
a a
= =0 8a 2 R
+1 1
(vi) potenza di un numero reale:
8 +1
> a = +1 se a > 1
>
>
>
< a+1 = 0 se 0 < a < 1
>
> a 1
=0 se a > 1
>
>
: 1
a = +1 se 0 < a < 1

(vii) potenza tra inniti: (


(+1)+1 = +1
1
(+1) =0

Mentre la somma di inniti con lo stesso segno ben denita, per esempio la somma
di due inniti positivi a sua volta un innito positivo, la somma di inniti di segno
diverso non denita. , per esempio, il caso per la somma +1 1, il cui risultato
non denito. Si tratta di un primo esempio di operazione indeterminata in R. In
particolare, sono indeterminate le seguenti operazioni:

(i) somme di inniti con segno diverso:

+1 1 e 1+1 (1.22)
1.7. LA RETTA REALE ESTESA 55

(ii) prodotti tra 0 e innito:


1 0 e 0 ( 1) (1.23)

(iii) quozienti con numeratore e denominatore entrambi nulli o entrambi inniti:


1 0
e (1.24)
1 0

(iv) le potenze:
11 ; 00 ; (+1)0 (1.25)

Le operazioni indeterminate (i)-(iv) sono chiamate forme di indeterminazione, e


svolgeranno una parte di rilievo nella teoria dei limiti.

OfB. Come abbiamo detto, la pi naturale immagine geometrica di R la retta (reale):


ad ogni punto corrisponde un numero e, viceversa, ad ogni numero corrisponde un pun-
to. Se prendiamo un segmento chiuso (e ovviamente limitato) possiamo trasportare
tutti i numeri dalla retta al segmento come mostra la gura che segue:

0
O
-1

-2
-3 -2 -1 0 1 2 3 4 5

Tutti i numeri reali che trovavano posto sulla retta trovano posto anche sul seg-
mento, estremi esclusi (qualcuno sta un po pi stretto, ma ci stanno proprio tut-
ti!). Anzi, avanzano due punti, gli estremi del segmento, ai quali naturale associare
rispettivamente +1 e 1. Limmagine geometrica di R cos un segmento chiuso.H
56 CAPITOLO 1. INSIEMI E NUMERI
Capitolo 2

Struttura cartesiana e Rn

2.1 Prodotti cartesiani e Rn


Supponiamo di voler classicare un vino secondo due caratteristiche, invecchiamento
e gradazione alcolica. Per esempio, supponiamo di leggere su unetichetta: 2 anni di
invecchiamento e 12 gradi. Possiamo scrivere

(2; 12) :

Guardiamo unaltra etichetta e leggiamo: 1 anno di invecchiamento e 10 gradi. In


questo caso possiamo scrivere
(1; 10) :
Le coppie (2; 12) e (1; 10) sono dette coppie ordinate ed in esse si distingue il primo
elemento, linvecchiamento, dal secondo, la gradazione alcolica: in una coppia ordinata
perci cruciale la posizione.
Sia A1 linsieme dei possibili anni di invecchiamento e sia A2 linsieme delle possibili
gradazioni. Si pu scrivere

(2; 12) 2 A1 A2 ; (1; 10) 2 A1 A2 :

Indichiamo un generico elemento di A1 con a1 e con a2 uno di A2 . Per esempio, in


(2; 12) si ha a1 = 2 e a2 = 12.

Denizione 12 Dati due insiemi A1 e A2 , il prodotto cartesiano A1 A2 linsieme


di tutte le coppie ordinate (a1 ; a2 ) con a1 2 A1 e a2 2 A2 .

Nellesempio, abbiamo A1 N e A2 N, ossia gli elementi di A1 e A2 sono numeri


naturali. Pi in generale, possiamo pensare che A1 = A2 = R, cosicch gli elementi di
A1 e A2 sono numeri reali qualsiasi, sebbene con una possibile diversa interpretazione
a seconda della posizione. In questo caso A1 A2 = R R = R2 e la coppia (a1 ; a2 )
si pu rappresentare con un punto nel piano:

57
58 CAPITOLO 2. STRUTTURA CARTESIANA E RN

y
3

1 a
2

0
O a x
1

-1

-2
-3 -2 -1 0 1 2 3 4 5

Punto (a1 ; a2 ) del piano.

Una coppia ordinata di numeri reali (a1 ; a2 ) 2 R2 si chiama vettore.


Tra i sottoinsiemi di R2 sono di particolare importanza:
(i) f(a1 ; a2 ) 2 R2 : a1 = 0g, ossia linsieme delle coppie ordinate del tipo (0; a2 ). Si
tratta dellasse delle ordinate.
(ii) f(a1 ; a2 ) 2 R2 : a2 = 0g, ossia linsieme delle coppie ordinate del tipo (a1 ; 0). Si
tratta dellasse delle ascisse.
(iii) f(a1 ; a2 ) 2 R2 : a1 0 e a2 0g, ossia linsieme delle coppie ordinate (a1 ; a2 )
con entrambe le componenti positive. Si tratta del primo quadrante del piano
cartesiano. In modo analogo si deniscono gli altri quadranti:

y
3

II I
1

0
O x
-1

III IV
-2
-3 -2 -1 0 1 2 3 4 5
2.1. PRODOTTI CARTESIANI E RN 59

(iv) f(a1 ; a2 ) 2 R2 : a21 + a22 = 1g e f(a1 ; a2 ) 2 R2 : a21 + a22 1g, ossia rispettivamente
la circonferenza e il cerchio con centro lorigine e raggio unitario .

Poco sopra abbiamo classicato i vini usando due caratteristiche, invecchiamen-


to e gradazione alcolica. Consideriamo adesso un prodotto un po pi complicato,
per esempio un portafogli di titoli. Supponiamo che esistano quattro diversi titoli
acquistabili sul mercato. Un portafogli descritto dalla quaterna ordinata
(a1 ; a2 ; a3 ; a4 ) ;
dove a1 il denaro investito nel primo titolo, a2 limporto investito nel secondo titolo,
e cos via. Per esempio,
(1000; 1500; 1200; 600)
indica un portafogli in cui 1000 euro sono stati investiti nel primo titolo, 1500 nel
secondo, e cos via. La posizione fondamentale: il portafogli
(1500; 1200; 1000; 600)
ben diverso dal precedente bench le somme di denaro investite nei vari titoli siano
le stesse.
Siccome le quantit di denaro sono numeri non necessariamente interi, e possono
anche essere negative in caso di vendite allo scoperto, naturale pensare che A1 =
A2 = A3 = A4 = R, dove Ai linsieme delle possibili somme investibili nel titolo
i = 1; 2; 3; 4. Si ha
(a1 ; a2 ; a3 ; a4 ) 2 A1 A2 A3 A4 = R 4 :
In particolare,
(1000; 1500; 1200; 600) 2 R4 :
In generale, considerando n insiemi A1 ; A2 ; ; An possiamo dare la seguente

Denizione 13 Dati n insiemi A1 ; A2 ; An , il loro prodotto cartesiano


A1 A2 An ;
n
indicato con i=1 Ai ,
linsieme di tutte le n-uple ordinate (a1 ; a2 ; :::; an ) con a1 2
A1 ; a2 2 A2 ; ; an 2 An .

I vari a1 ; a2 ; ; an sono detti componenti (o elementi) di a.


Quando A1 = A2 = = An = A, si scrive
A1 A2 An = A A A = An ;
in particolare se A1 = A2 = = An = R il prodotto cartesiano si indica con Rn , che
cos linsieme di tutte le n-uple (ordinate) di numeri reali. In altre parole,
Rn = R
| R {z R}
n volte
60 CAPITOLO 2. STRUTTURA CARTESIANA E RN

Un elemento
x = (x1 ; x2 ; :::; xn ) 2 Rn
chiamato vettore 1 . Il prodotto cartesiano Rn si dice spazio euclideo (n-dimensionale).
Per n = 1, Rn la retta reale R, per n = 2, R2 il piano, e cos via. Cos come
per R e R2 , anche i vettori in R3 ammettono una rappresentazione graca:

1 z
0.9

0.8
a
3
0.7

0.6

0.5
a
2
0.4 O
0.3 a
1
0.2 y
x
0.1

0
0 0.2 0.4 0.6 0.8 1

Vettore (a1 ; a2 ; a3 ) nello spazio.

che invece non pi possibile in Rn con n 4. La rappresentazione graca pu aiutare


lintuizione, ma, dai punti di vista teorico e di calcolo, non ha alcuna importanza perch
i vettori di Rn , con n 4, sono enti del tutto ben deniti: essi si rivelano fondamentali
nelle applicazioni economiche, come vedremo nella Sezione 2.4.
Nel seguito indicheremo sempre le componenti di un vettore con la stessa lettera us-
ata per il vettore accompagnandola da un indice: per esempio a3 la terza componente
del vettore a, y7 la settima del vettore y, ecc. ecc.

2.2 Operazioni in Rn
Consideriamo due vettori in Rn :

x = (x1 ; x2 ; ::; xn ) ; y = (y1 ; y2 ; :::; yn ) :

Deniamo il vettore somma x + y come

x + y = (x1 + y1 ; x2 + y2 ; :::; xn + yn ) :
1
Per i numeri reali usiamo la lettera x invece di a.
2.2. OPERAZIONI IN RN 61

Per esempio, per i due vettori x = (7; 8; 9) e y = (2; 4; 7) in R3 , si ha

x + y = (7 + 2; 8 + 4; 9 + 7) = (9; 12; 16) :

Si noti come x + y 2 Rn : tramite la somma si costruito un nuovo elemento di Rn .


Sia ora 2 R e x 2 Rn . Si chiama prodotto dello scalare2 per il vettore x il
vettore x denito come
x = ( x1 ; x2 ; :::; xn ) :
Per esempio, con = 2 e x = (7; 8; 9) 2 R3 , abbiamo

2x = (2 7; 2 8; 2 9) = (14; 16; 18) :

Anche x 2 Rn , ossia anche con la moltiplicazione scalare si costruito un nuovo


elemento di Rn .

Notazione. Se x = ( x1 ; x2 ; :::; xn ), si ha x = ( 1) x e x y = x + ( 1) y.
Porremo inoltre 0 = (0; 0; :::; 0), dove il grassetto distingue il vettore 0 di zeri dallo
scalare 0.

Abbiamo quindi introdotto in Rn due operazioni, laddizione e la moltiplicazione


scalare che estendono le corrispondenti operazioni tra numeri reali. Vediamone le
propriet. Cominciamo con laddizione.

Proposizione 22 Siano x, y e z tre vettori arbitrari in Rn . Si ha:

(i) x + y = y + x (propriet commutativa),

(ii) (x + y) + z = x + (y + z) (propriet associativa),

(iii) x + 0 = x (esistenza dellelemento neutro per la somma),

(iv) x + ( x) = 0 (esistenza dellopposto di ogni vettore).

Dim. Mostriamo la (i), lasciando le altre al lettore. Si ha

x + y = (x1 + y1 ; x2 + y2 ; :::; xn + yn ) = (y1 + x1 ; y2 + x2 ; :::; yn + xn ) = y + x;

come desiderato.

Consideriamo ora la moltiplicazione scalare.

Proposizione 23 Siano x; y 2 Rn e ; 2 R. Si ha:

(i) (x + y) = x + y (propriet distributiva per laddizione di vettori),


2
Un numero reale spesso detto scalare.
62 CAPITOLO 2. STRUTTURA CARTESIANA E RN

(ii) ( + ) x = x + x (propriet distributiva per laddizione di scalari),

(iii) 1x = x (esistenza dellelemento neutro per la moltiplicazione scalare),

(iv) ( x) = ( ) x (propriet associativa).

Dim. Mostriamo la (ii): le altre sono lasciate al lettore. Si ha

( + ) x = (( + ) x1 ; ( + ) x2 ; :::; ( + ) xn )
= ( x1 + x1 ; x2 + x2 ; :::; xn + xn )
= ( x1 ; x2 ; :::; xn ) + ( x1 ; x2 ; :::; xn ) = x + x

come desiderato.

Lultima operazione in Rn che consideriamo il prodotto interno. Dati due vettori


x e y in Rn , il loro prodotto interno, indicato come x y, denito come

x y = x1 y1 + x2 y2 + + xn yn ;

ossia, in notazione pi compatta3 ,


X
n
x y= xi yi :
i=1

Altre notazioni molto diuse per il prodotto interno sono (x; y) e hx; yi.
Per esempio, per i vettori x = (1; 1; 5; 3) e y = ( 2; 3; ; 1) di R4 , si ha

x y = 1 ( 2) + ( 1) 3 + 5 + ( 3) ( 1) = 5 2:

Il prodotto interno unoperazione che dierisce dalla somma e dalla moltiplicazione


scalare in un aspetto strutturale: mentre queste ultime hanno come risultato un nuovo
vettore di Rn , il risultato del prodotto interno uno scalare. Il prossimo risultato
raccoglie le principali propriet del prodotto interno: lasciamo al lettore la semplice
dimostrazione.

Proposizione 24 Siano x, y e z tre vettori in Rn . Si ha:

(i) x y = y x ( propriet commutativa),

(ii) (x + y) z = (x z) + (y z) ( propriet distributiva),

(iii) x z= (x z) ( propriet distributiva).

Si noti che le due propriet distributive si possono compendiare nellunica propriet


( x + y) z = (x z) + (y z).
3
Pn
Dati n numeri reali ri , la loro somma r1 + r2 + + rn si indicaQcon la sommatoria i=1 ri .
n
Analogamente, il loro prodotto r1 r2 rn si indica con la produttoria i=1 ri .
2.3. STRUTTURA DORDINE IN RN 63

2.3 Struttura dordine in Rn


La struttura dordine di Rn si basa su quella di R: pur essendone unestensione,
presenta alcune interessanti novit. Cominciamo con il denire lordine su Rn : dati
due vettori x = (x1 ; x2 ; ::; xn ) e y = (y1 ; y2 ; ::; yn ) in Rn , scriviamo

x y

quando xi yi per ogni i = 1; 2; : : : ; n. In particolare, si ha x = y se e solo se si ha


sia x y sia y x.
In altre parole, ordina due vettori considerando tutte le componenti e applicando
loro lordine di R studiato nella Sezione 1.4. Per esempio, x = (0; 3; 4) y =
(0; 2; 1). Quando n = 1, lordine diventa quello classico su R.

Lo studio delle propriet di base della disuguaglianza rivela una prima impor-
tante novit: quando n 2, lordine non soddisfa la completezza. Si dice perci
che un ordine parziale (a dierenza dellordine in R che completo). Infatti,
siano per esempio x = (0; 1) e y = (1; 0) in R2 : non si ha n x y n y x. molto
facile trovare vettori non confrontabili in Rn . La gura mostra i vettori di R2 che sono
oppure del vettore x = (1; 2).

5
y
4

2
2
1

0
O 1 x

-1

-2
-2 -1 0 1 2 3 4 5

In giallo i punti maggiori di x = [1; 2], in azzurro


quelli minori. Le due aree bianche sono i punti
non confrontabili con x.

Per il resto, facile vericare che su Rn continua a godere delle propriet gi viste
per n = 1, ossia:

(i) riessivit: x x;
64 CAPITOLO 2. STRUTTURA CARTESIANA E RN

(ii) transitivit: se x yey z, allora x z;

(iii) indipendenza: se x y, allora x + z y + z per ogni z 2 Rn .;

(iv) separazione: dati due insiemi di numeri reali A e B in Rn , se a b per ogni


a 2 A e b 2 B, allora esiste c 2 Rn tale che a c b per ogni a 2 A e b 2 B.

Unaltra nozione che diventa sorprendentemente delicata quando n 2 la forma


della disuguaglianza stretta. Tale nozione delicata perch, dati due vettori x =
(x1 ; x2 ; :::; xn ) e y = (y1 ; y2 ; :::; yn ) di Rn , si possono vericare due casi:

Tutte le componenti di x sono delle corrispondenti componenti di y, ed alcune


siano strettamente maggiori; cio xi yi , per ogni i = 1; 2; :::n ed esiste j tale
che xj > yj .

tutte le componenti di x sono strettamente maggiori delle corrispondenti com-


ponenti di y, cio xi > yi per ogni i = 1; 2; :::n:

Nel primo caso si parla di disuguaglianza stretta, in simboli x > y, nel secondo caso
si parla di disuguaglianza forte, in simboli x y.

Esempio 10 Per x = (1; 3; 4) e y = (0; 1; 2) in R3 , si ha x y. Per x = (0; 3; 4)


e y = (0; 1; 2) si ha x > y ma non x y perch x ha solo due componenti su tre
strettamente maggiori delle corrispettive componenti di y. N

Dati due vettori x; y 2 Rn , si ha

x y)x>y)x y

Abbiamo cos tre nozioni di disuguaglianza tra vettori in Rn , via via pi stringenti:

(i) una nozione debole, , che permette luguaglianza tra i due vettori;

(ii) una nozione intermedia, >, che richiede almeno una disuguaglianza stretta tra
le componenti;

(iii) una nozione forte, , che richiede la disuguaglianza stretta tra tutte le compo-
nenti dei due vettori.

Quando n = 1, sia > sia si riducono al classico > su R visto nella Sezione 1.4.
Inoltre, gli stessi simboli rovesciati, cio ; <; , si usano nel caso opposto.
Un caso particolarmente importante il confronto tra un vettore x e il vettore nullo
0. Si ha la seguente terminologia:

(i) se x 0, cio tutte le componenti di x sono positive, il vettore x si dice positivo;


2.3. STRUTTURA DORDINE IN RN 65

(ii) se x > 0, cio tutte le componenti di x sono positive e almeno una di esse
strettamente positiva, il vettore x si dice strettamente positivo;

(iii) se x 0, cio tutte le componenti di x sono strettamente positive, il vettore x


si dice fortemente positivo.

NB. La notazione e terminologia che abbiamo introdotta non lunica possibile. Alcu-
ni autori usano per esempio =; >; > in luogo di >; >; , mentre altri autori chiamano
non negativi i vettori che noi chiamiamo positivi, e cos via. Al di l della scelta
della notazione, che ha una forte componente di gusto personale, il signicato delle
nozioni introdotte dovrebbe risultare chiaro. O

Insieme alla non completezza di , la presenza di due diverse versioni della disug-
uaglianza stretta la novit pi signicativa che si ha in Rn per n 2 rispetto al caso
speciale R, cio n = 1, della Sezione 1.4.

Concludiamo questa sezione generalizzando gli intervalli visti in R nella Sezione


1.4. Dati a; b 2 Rn , abbiamo:

(i) lintervallo chiuso limitato

[a; b] = fx 2 Rn : a x bg = fx 2 Rn : ai xi bi g ;

(ii) lintervallo aperto limitato

(a; b) = fx 2 Rn : a x bg = fx 2 Rn : ai < xi < bi g ;

(iii) gli intervalli semichiusi (o semiaperti) limitati

(a; b] = fx 2 R : a x bg e [a; b) = fx 2 R : a x bg .

Si hanno inoltre

(iv) gli intervalli illimitati [a; 1) = fx 2 Rn : x ag e (a; 1) = fx 2 R : x ag,


n
nonch i loro analoghi ( 1; a] e ( 1; a). In particolare, [0; 1) = fx 2 R : x 0g
spesso indicato con Rn+ , mentre Rn++ indica (0; 1) = fx 2 Rn : x 0g. In
modo analogo si deniscono Rn = fx 2 Rn : x 0g e Rn = fx 2 Rn : x 0g.

NB. (i) Gli intervalli in Rn si possono esprimere come prodotti cartesiani di intervalli
in R; per esempio,
[a; b] = ni=1 [ai ; bi ] :
(ii) Nelle nozioni appena viste di intervallo abbiamo usato le disuguaglianze o .
Sostituendole con la disuguaglianza < otteniamo altri possibili intervalli che, tuttavia,
sono ben poco rilevanti per i nostri ni. O
66 CAPITOLO 2. STRUTTURA CARTESIANA E RN

2.4 Applicazioni
2.4.1 Incertezza
Consideriamo una monetina, il cui lancio ha come possibili esiti testa T o croce C. Il
primo lancio ha come insieme degli esiti 1 = fC; T g, il secondo 2 = fC; T g, e cos
via: si ha allora i = fC; T g per ogni possibili lancio. Supponiamo di lanciare due
volte la monetina. Linsieme degli esiti possibili dato dal prodotto cartesiano

1 2 = fC; T g fC; T g = f(C; T ) ; (C; C) ; (T; C) ; (T; T )g :

Pi in generale, se lanciamo n volte la monetina, linsieme degli esiti dato dal prodotto
cartesiano
n
i=1 i = fC; T g fC; T g = fC; T gn
= f(C; C; ; C) ; (C; T; ; C) ; ; (T; T; ; T )g

Luso dei prodotti cartesiani per modellare tutti i possibili esiti di un fenomeno aleato-
rio (in questo caso il lancio di una monetina) fondamentale nel Calcolo delle proba-
bilit.

2.4.2 Scelte statiche


Consideriamo un consumatore che debba scegliere quanti chili di mele e di patate
acquistare al mercato. Per comodit analitica assumiamo che tali beni siano innita-
mente divisibili, cosicch il consumatore possa acquistarne una quantit reale positiva
qualsiasi (per esempio, 3; 5 kg. di mele e kg. di patate). In questo caso, R+ linsieme
sia delle possibili quantit di mele sia di patate acquistabili. Linsieme dei panieri di
mele e patate che il consumatore pu acquistare quindi

R2+ = R+ R+ = f(x1 ; x2 ) : x1 ; x2 2 R+ g ;

ossia gracamente dai punti del primo quadrante del piano. In generale, un consuma-
tore deve scegliere tra pi di due beni: qualora egli debba scegliere tra n beni, linsieme
dei panieri dato dal prodotto cartesiano

Rn+ = R+ R+ = f(x1 ; x2 ; ::; xn ) : xi 2 R+ per i = 1; 2; ; ng :

Nella Teoria della produzione, un vettore in Rn+ rappresenta invece una possibile
congurazione di n input per il produttore. In questo caso il vettore x = (x1 ; x2 ; ::; xn )
indica che il produttore ha a disposizione x1 unit del primo input, x2 unit del secondo,
..., e xn unit dellultimo.
2.5. OTTIMI SECONDO PARETO 67

2.4.3 Scelte intertemporali

Abbiamo appena visto come, nella teoria del consumatore, un vettore x = (x1 ; x2 ; ::; xn )
sia interpretabile come un paniere in cui xi la quantit del bene i-esimo, ossia x1
la quantit del bene 1, x2 la quantit del bene 2, e cos via. Ma, in unaltra
possibile interpretazione, vi un unico bene e x = (x1 ; x2 ; ::; xn ) indica la quantit di
esso disponibile in vari periodi, ossia xi la quantit del bene disponibile nelli-esimo
periodo. Per esempio, se il bene sono mele, x1 la quantit di mele nel periodo 1, x2
la quantit di mele nel periodo 2, e cos via no a xn che la quantit di mele nel
periodo n-esimo.
In questo caso, Rn+ indica lo spazio di tutti i panieri intertemporali di un dato bene
su n periodi; spesso si usa la notazione pi evocativa RT , dove T il numero di periodi
e xt la quantit di bene nel periodo t, con4 t = 1; 2; : : : ; T .

Naturalmente, invece di un unico bene su pi periodi, possiamo considerare un


paniere di beni su pi periodi. Similmente, in un problema intertemporale di pro-
duzione, avremo vettori di input su pi periodi. Tali situazioni si modellano con
matrici, una nozione molto semplice della quale parleremo nel Capitolo 14. Molte
applicazioni si limitano comunque a un unico bene, e quindi RT uno spazio molto
importante nella Teoria delle scelte intertemporali. Un esempio fondamentale si ha
quando lunico bene la moneta, per cui x = (x1 ; x2 ; :::; xt ; :::; xT ) 2 RT rappresenta
la quantit di moneta in diversi periodi: in tal caso x detto usso di cassa.

2.5 Ottimi secondo Pareto


Il concetto di massimo di un insieme di R, dato nella Denizione 10 pu essere
equivalentemente riformulato cos:

Lemma 25 Dato un insieme A R, il punto x^ 2 A massimo di A se e solo se non


esiste alcun x 2 A tale che x > x^.

evidente infatti che chiedere che tutti i punti di A siano x^ esattamente lo


stesso che chiedere che nessuno sia > x^. Analoga rilettura si pu dare per i minimi.

4
La notazione t = 1; 2; : : : ; T equivalente a t 2 f1; 2; : : : ; T g, cosi come la notazione i = 1; 2; : : : ; n
equivalente a i 2 f1; 2; : : : ; ng. La scelta tra esse di pura comodit.
68 CAPITOLO 2. STRUTTURA CARTESIANA E RN

3
Max A
2

1 A
0 ( ) ( ]
-1

-2

-3
-4 -2 0 2 4 6

Volgiamo ora lattenzione a sottoinsiemi di Rn e allordine parziale vigente su di


esso. Possiamo estendere la nozione di massimo nel seguente modo.

Denizione 14 Dato un insieme A Rn un punto x^ 2 A si dice massimo di A se


x^ x per ogni x 2 A.

In modo analogo si denisce il minimo. Vale inoltre lanalogo della Proposizione


15: il massimo (minimo) di un insieme A Rn , se esiste, unico (la dimostrazione
simile).
Purtroppo, le nozioni di massimo e minimo si rivelano quasi inutili nelle applicazioni
visto che gran parte dei sottoinsiemi di Rn non possiede n massimi n minimi poich
lordine soltanto parziale in Rn . molto pi procuo seguire invece lordine di idee
abbozzato con il Lemma 25. Infatti, la caratterizzazione ivi stabilita equivalente alla
usuale denizione di massimo in R, ma pi generale in Rn ove, per giunta, abbiamo
due possibilit potendo usare i due segni di o di > per negare il . Ci motiva la
prossima denizione, di grande importanza nelle applicazioni economiche.

Denizione 15 Sia A Rn . Un punto x^ 2 A detto:

(i) ottimo paretiano debole di A, o massimale debole, se non esiste alcun x 2 A


tale che x x^;

(ii) ottimo paretiano di A, o massimale, se non esiste alcun x 2 A tale che x > x^.

In modo analogo si possono denire i minimali (eventualmente forti), anchessi


detti ottimi paretiani (eventualmente forti)5 .

Un ottimo paretiano x^ lo anche in senso debole: se non esiste alcun x 2 A tale


che x > x^, a fortiori non esiste alcun x 2 A tale che x x^. Il viceversa non vale:
5
Gli ottimi, come gli angeli, non hanno sesso. Bench sarebbe preferibile parlare di massimi
e di minimi paretiani, purtroppo la tradizione non distingue tra essi chiamandoli entrambi ottimi
paretiani, lasciando che la loro natura sia chiarita dal contesto.
2.5. OTTIMI SECONDO PARETO 69

Esempio 11 Sia A = [0; 1] [0; 1] il quadrato di vertici (0; 0), (0; 1), (1; 0) e (1; 1). Il
vertice (1; 1) lunico ottimo paretiano di A, mentre sono ottimi paretiani deboli tutti
i punti che giacciono sia sul lato di vertici (1; 0) e (1; 1) sia sul lato di vertici (1; 1) e
(0; 1). Nella seguente gura sono indicati in rosso gli ottimi paretiani deboli, di cui
(1; 1) lunico ottimo paretiano.

Grazie al Lemma 25, le nozioni di massimo e massimale sono equivalenti in R. Ci


non pi vero in Rn con n > 1, ove la nozione di massimo (molto) pi forte di quella
di massimale.

Lemma 26 Dato un insieme A Rn , il punto di massimo, se esiste, lunico


massimale.

Dim. Sia x^ 2 A il punto di massimo di A. Sia x 2 A con x 6= x^. Poich x non di


massimo, si ha x^ x. Quindi, x non punto massimale.

Il punto (1; 1) nellultima gura il punto di massimo, che anche lunico punto
massimale. In modo analogo linsieme della prossima gura possiede un massimo (che
quindi anche lunico massimale),
70 CAPITOLO 2. STRUTTURA CARTESIANA E RN

2
2

0
O 1
-1

-2
-3 -2 -1 0 1 2 3 4

Il Lemma 26 non vale per i massimali deboli, che possono coesistere con un massimo.
La gura dellEsempio 11 ne prova, cos come la prossima, che ha un massimo (che
anche lunico massimale) e inniti massimali deboli, segnati in rosso

2
2

0
O 1
-1

-2
-2 -1 0 1 2 3 4 5

Il Lemma 26 ha quindi stabilito che il massimo di un insieme, quando esiste, lunico


massimale; cio
massimo =) massimale
Il converso , per, falso: esistono punti massimali che non sono massimi; cio,

massimale ; massimo
2.5. OTTIMI SECONDO PARETO 71

La prossima gura mostra un insieme di R2 che possiede due massimali che non sono
massimi dellinsieme.

0
-1 O
-1
-1

-2
-2 -1 0 1 2 3 4 5

Per i due massimali x0 = (1; 2) e x00 = (2; 1) della gura non si ha x0 x e x00 x
0 00
per ogni x 2 A. Tuttavia, si ha x xex x per ogni x 2 A che sia confrontabile,
0 00
rispettivamente, con x o x . La mancanza di un massimo qui dovuta alla non
confrontabilit di tutti gli elementi dellinsieme, ossia al fatto che lordine soltanto
parziale in Rn quando n > 1.
La gura illustra unaltra dierenza fondamentale tra massimo e massimale in Rn
con n > 1: il massimo di un insieme, se esiste, unico, mentre un massimale pu non
essere unico (anzi, molto spesso, non lo ).

In conclusione, la parzialit dellordine su Rn rende la nozione di punti di massi-


mo (e minimo) casi particolari meno importanti, in quanto meno applicabili, della pi
generale e importante nozione di punti massimali (e minimali), che fondamentale in
Rn .

Chiudiamo osservando che, naturalmente, i massimali (anche deboli) possono non


esistere, come mostra il prossimo semplice esempio.

Esempio 12 Si consideri il graco della funzione f : R ! R data da f (x) = x. Il


graco un sottoinsieme di R2 privo di punti sia massimali deboli sia minimali deboli
(e quindi anche di punti massimali e minimali). N

2.5.1 Scatola di Edgeworth


Gli ottimi paretiani sono fondamentali per lEconomia. Pensiamo, per esempio, che
i vari vettori dellinsieme A Rn identichino i protti conseguibili da n individui.
72 CAPITOLO 2. STRUTTURA CARTESIANA E RN

I punti di ottimo paretiano (massimali) rappresentano le situazioni dalle quali non ci


si pu allontanare senza diminuire il protto di almeno uno degli individui. In altri
termini, gli n individui non hanno nulla in contrario a restringere A allinsieme dei
suoi ottimi paretiani (nessuno ci perde); il vero problema di conitto dinteresse sorge
quando si deve selezionare un punto tra questi ultimi.
Il concetto di ottimo paretiano porta a restringere un insieme A di possibilit
alternative con il consenso unanime e perci a delimitarne il vero sottoinsieme critico.
questo il grande pregio di tale nozione, semplice ma ingegnosa, che spesso su ciente
a identicare un sottoinsieme criticomolto pi piccolo dellinsieme di partenza A.6

Una classica applicazione dellottimalit paretiana la scatola di Edgeworth. Sic-


come faremo uso di nozioni che introdurremo nel Capitolo 7, preferibile rileggere la
presente applicazione dopo tale capitolo.
Consideriamo due agenti, Alberto e Barbara, che debbano dividere tra loro quantit
unitarie di due beni innitamente divisibili (per esempio, un chilo di farina e un litro
di vino). Vogliamo modellare il problema di divisione (verosimilmente determinato da
una contrattazione tra le parti) e vedere se, grazie allottimalit di Pareto, possiamo
dire qualcosa di non banale a riguardo.
Ogni coppia x = (x1 ; x2 ), con x1 2 [0; 1] e x2 2 [0; 1], una possibile assegnazione
dei due beni a uno dei due litiganti: in altre parole, il prodotto cartesiano [0; 1] [0; 1]
le descrive tutte. I due agenti devono accordarsi sulle assegnazioni (a1 ; a2 ) di Alberto
e (b1 ; b2 ) di Barbara. Naturalmente devessere

a1 + b1 = a2 + b2 = 1: (2.1)

Per completare la descrizione del problema, dobbiamo dire quali sono i desiderata
dei due agenti. A tal ne, supponiamo che essi abbiano funzioni di utilit ua ; ub : [0; 1]
[0; 1] ! R identiche, e che, per semplicit, supponiamo siano del tipo Cobb-Douglas
p
ua (x1 ; x2 ) = ub (x1 ; x2 ) = x1 x2 (si veda lEsempio 75). Le curve di indierenza si
possono inscatolarenel seguente modo

6
Per lottimalit paretiana essenziale che gli agenti considerino unicamente le loro alternative
(panieri di beni, protti, ecc.), senza badare a quelli dei loro pari. In altre parole, che essi non provino
invidia o simili emozioni sociali. Per rendersene conto, si pensi a una trib di invidiosi, il cui capo
decidesse di raddoppiare le razioni di cibo di met dei membri della trib, lasciando invariate quelle
degli altri membri. La nuova allocazione susciterebbe vivaci proteste da parte degli invariatibench
nulla sia cambiato per loro.
2.5. OTTIMI SECONDO PARETO 73

11
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
0
0 0.2 0.4 0.6 0.8 1
1

Scatola di Edgeworth.

che appunto la classica scatola di Edgeworth. Grazie alla condizione (2.1), possiamo
pensare a un punto (x1 ; x2 ) 2 [0; 1] [0; 1] come allassegnazione di Alberto. Anzi,
possiamo in realt identicare ogni possibile suddivisione tra i due agenti con le as-
segnazioni (x1 ; x2 ) di Alberto; infatti, le assegnazioni di Barbara (1 x1 ; 1 x2 ) sono
univocamente determinate una volta note quelle di Alberto.

Ogni assegnazione (x1 ; x2 ) ha utilit ua (x1 ; x2 ) per Alberto e ub (1 x1 ; 1 x2 )


per Barbara. Sia

A = (ua (x1 ; x2 ) ; ub (1 x1 ; 1 x2 )) 2 R2+ : (x1 ; x2 ) 2 [0; 1] [0; 1]

linsieme di tutti i proli di utilit dei due contendenti determinati dalla suddivisione
dei due beni.
Guardando la scatola di Edgeworth, il lettore si convincer facilmente che linsieme
degli ottimi paretiani di A identicato dalla diagonale

D = (d; d) 2 R2+ : d 2 [0; 1]

della scatola, ossia dal luogo dei punti di tangenza delle curve di indierenza (detta
curva dei contratti). Per dimostrarlo in modo rigoroso, ci occorre il prossimo semplice

Lemma 27 Dati x1 ; x2 2 [0; 1], si ha


p p
1 x1 x2 (1 x1 ) (1 x2 ); (2.2)

e luguaglianza vale se e solo se x1 = x2 .


74 CAPITOLO 2. STRUTTURA CARTESIANA E RN

Dim. Poich x1 ; x2 2 [0; 1], semplici manipolazioni portano alla catena di equivalenze:
p p p 2
1 x1 x2 (1 x1 ) (1 x2 ) () (1 x1 x2 ) (1 x1 ) (1 x2 )
2
x1 + x2 p x1 + x2
() x1 x2 () x1 x2 () (x1 x2 )2 0.
2 2

Lultima disuguaglianza sempre vericata e possiamo concludere che vale la (2.2).


Inoltre le precedenti equivalenze portano a concludere che
p p
1 x1 x2 = (1 x1 ) (1 x2 ) () (x1 x2 )2 = 0;

il che pu vericarsi se e solo se x1 = x2 .

Forti del lemma, mostriamo rigorosamente quanto il graco ha suggerito.

Proposizione 28 Un prolo (ua (x1 ; x2 ) ; ub (1 x1 ; 1 x2 )) 2 A un ottimo pare-


tiano di A se e solo se (x1 ; x2 ) 2 D.

Dim. Cominciamo col mostrare che, per qualsiasi suddivisione di beni (x1 ; x2 ) 2
= D,
ossia tale che x1 6= x2 , esiste (d; d) 2 D tale che

(ua (d; d) ; ub (1 d; 1 d)) (ua (x1 ; x2 ) ; ub (1 x1 ; 1 x2 )) : (2.3)

Per Alberto, si ha
p p p
ua ( x1 x2 ; x1 x2 ) = x1 x2 = ua (x1 ; x2 )
p p
e quindi x1 x2 ; x1 x2 per lui indierente a (x1 ; x2 ). Grazie al Lemma 27, per
Barbara si ha
p p p p
ub (1 x1 x2 ; 1 x1 x2 ) = 1 x1 x2 > (1 x1 ) (1 x2 ) = ub (1 x1 ; 1 x2 ) ,
p
dove la disuguaglianza stretta poich x1 6= x2 . Quindi, ponendo d = x1 x2 , vale la
(2.3).
Ne segue che le suddivisioni (x1 ; x2 ) al di fuori della diagonale non sono ottimi
paretiani. Rimane da mostrare che le suddivisioni sulla diagonale lo sono. Sia (d; d) 2
D e supponiamo, per contra, che esista (x1 ; x2 ) 2 [0; 1] [0; 1] tale che

(ua (x1 ; x2 ) ; ub (1 x1 ; 1 x2 )) (ua (d; d) ; ub (1 d; 1 d)) . (2.4)

Senza perdita di generalit7 , supponiamo che

ua (x1 ; x2 ) > ua (d; d) e ub (1 x1 ; 1 x2 ) ub (1 d; 1 d)


7
Un argomento simile vale quando ua (x1 ; x2 ) ua (d; d) e ub (1 x1 ; 1 x2 ) > ub (1 d; 1 d).
2.5. OTTIMI SECONDO PARETO 75

ossia,
p p p p
x1 x2 > dd = d e (1 x1 ) (1 x2 ) (1 d) (1 d) = 1 d:

Quindi p
p
1 x1 x2 < 1 d (1 x1 )(1 x2 );
il che contraddice la (2.2). Ne segue che non esiste alcun (x1 ; x2 ) 2 [0; 1] [0; 1] per
cui vale la (2.4). Ci completa la dimostrazione.

Grazie alla Proposizione 28, possiamo dire che, se gli agenti massimizzano le loro
utilit Cobb-Douglas, la contrattazione si risolver in una divisione dei beni sulla
diagonale della scatola di Edgeworth, ossia tale che ogni agente abbia unugual quantit
di entrambi i beni.
Naturalmente, la Proposizione 28 non pu dire alcunch su quale dei punti della
diagonale sia poi eettivamente determinato dalla contrattazione. Linsieme D per
un sottoinsieme molto piccolo di A: grazie alla nozione di ottimo paretiano, siamo
comunque riusciti a dire qualcosa di non banale sul problema di divisione.
76 CAPITOLO 2. STRUTTURA CARTESIANA E RN
Capitolo 3

Struttura lineare

In questo capitolo riprendiamo e approfondiamo lo studio della struttura lineare di


Rn cominciato nella Sezione 2.2. Lo studio di tale struttura fondamentale di Rn , che
continueremo nel Capitolo 14 sulle funzioni lineari, parte dellAlgebra lineare.

3.1 Sottospazi vettoriali di Rn


Le Proposizioni 22 e 23 avevano mostrato come le operazioni di somma e moltipli-
cazione scalare su Rn godano delle seguenti propriet, per ogni x; y; z 2 Rn e ogni
; 2 R:

(v1) x + y = y + x (propriet commutativa)

(v2) (x + y) + z = x + (y + z) (propriet associativa)

(v3) x + 0 = x (esistenza dellelemento neutro per la somma)

(v4) x + ( x) = 0 (esistenza dellopposto di ogni x)

(v5) (x + y) = x + y (propriet distributiva)

(v6) ( + ) x = x + x (propriet distributiva)

(v7) 1x = x (esistenza dellelemento neutro per la moltiplicazione scalare)

(v8) ( x) = ( )x (propriet associativa)

Come il lettore vedr in corsi successivi, per questa ragione Rn un esempio di


spazio vettoriale, che, in generale, un insieme dove si deniscono due operazioni di
somma e moltiplicazione scalare che godono delle propriet (v1)-(v8).1 Per esempio,
nel Capitolo 14 si vedr un altro esempio di spazio vettoriale, quello delle matrici.
1
La nozione di spazio vettoriale centrale in Matematica. Per comprenderla appieno occorre per
andare oltre Rn e non rientra, perci, nello scopo del libro.

77
78 CAPITOLO 3. STRUTTURA LINEARE

Chiamiamo sottospazi vettoriali di Rn i suoi sottoinsiemi che ben si comportano


rispetto a tali operazioni:

Denizione 16 Un sottoinsieme non vuoto V di Rn si dice sottospazio vettoriale se


chiuso2 rispetto alle operazioni di somma e moltiplicazione scalare.

Si lascia al lettore la facile verica che le operazioni soddisfano in V le propriet


(v1)-(v8) per per ogni x; y; z 2 V e ogni ; 2 R. Al riguardo si osservi che lorigine
appartiene a ogni sottospazio vettoriale V , cio 0 2 V , poich 0x = 0 per ogni vettore
x.

La seguente caratterizzazione utile nel vericare se un sottoinsieme di Rn un


sottospazio vettoriale.

Proposizione 29 Un sottoinsieme non vuoto V di Rn un sottospazio vettoriale se


e solo se
x+ y 2V (3.1)
per ogni ; 2 R e ogni x; y 2 V .

Dim. Solo se. Sia V un sottospazio vettoriale e siano x; y 2 V . Poich V chiuso


rispetto alla moltiplicazione scalare si ha x 2 V e y 2 V . Ne segue che x + y 2 V
essendo V chiuso rispetto alla somma.
Se. Ponendo = = 1 nella (3.1) si ottiene x + y 2 V , mentre, ponendo
= 0, si ottiene x 2 V e quindi V chiuso rispetto alle operazioni di somma e
moltiplicazione scalare ereditate da Rn .

Ponendo = = 0, la (3.1) implica che 0 2 V . Ogni sottospazio vettoriale


contiene quindi lorigine 0.

Esempio 13 Sia m ne

M = fx 2 Rn : x1 = = xm = 0g :

Per esempio, se n = 3 e m = 2, si ha M = fx 2 R3 : x1 = x2 = 0g. Il sottoinsieme M


un sottospazio vettoriale. Siano infatti x; y 2 M e ; 2 R. Si ha:

x + y = ( x1 + y1 ; :::; xn + yn ) = (0; :::; 0; xm+1 + ym+1 ; :::; xn + yn ) 2 M:

In particolare, lasse delle ordinate in R2 , che corrisponde a M = fx 2 R2 : x1 = 0g,


un sottospazio vettoriale di R2 . N
2
Si ricordi che un insieme chiuso rispetto a un operazione quando il risultato delloperazione
appartiene allinsieme.
3.1. SOTTOSPAZI VETTORIALI DI RN 79

Esempio 14 Sia M linsieme di tutti gli x 2 R4 tali che


8
< 2x1 x2 + 2x3 + 2x4 = 0
x1 x2 2x3 4x4 = 0
:
x1 2x2 2x3 10x4 = 0

In altre parole, M linsieme delle soluzioni del sistema indicato. Esso un sottospazio
vettoriale; infatti, il lettore pu vericare che, dati x; y 2 M e ; 2 R, si ha x+ y 2
M.
Svolgendo i calcoli3 si scopre che i vettori

10 2
t; 6t; t; t (3.2)
3 3

risolvono il sistema per ogni t 2 R, sicch

10 2
M= t; 6t; t; t :t2R .
3 3
N

Se V1 e V2 sono due sottospazi vettoriali, si pu mostrare che anche la loro inter-


sezione V1 \ V2 un sottospazio vettoriale. Pi in generale vale la

Proposizione 30 Lintersezione di una collezione qualsiasi di sottospazi vettoriali di


Rn a sua volta un sottospazio vettoriale.

Dim. Sia fVi g una collezione


T qualsiasi di sottospazi vettoriali di Rn . Siccome
T 0 2
Vi per ogni i, si ha che i Vi 6= ;. Sia x; y 2 V e ; 2 R. Siccome x; y 2 i Vi , si
ha x; y 2 Vi per ogni i e quindi v + w 2 Vi per ogni i poich ogni Vi sottospazio
3
Per completezza riportiamo i calcoli. Consideriamo x4 come un parametro e risolviamo il
sistema in x1 , x2 e x3 : ovviamente otterremo soluzioni che dipendono dal valore del parametro x4 .
8 8
< 2x1 x2 + 2x3 + 2x4 = 0 < 2x1 x2 = 2x3 2x4
x1 x2 2x3 4x4 = 0 ) x1 x2 = 2x3 + 4x4 )
: :
x1 2x2 2x3 10x4 = 0 x1 2x2 2x3 10x4 = 0
8 8
< 2 (x2 + 2x3 + 4x4 ) x2 = 2x3 2x4 < x2 = 6x3 10x4
x1 + ( 2x3 2x4 2x1 ) = 2x3 + 4x4 ) x1 = 4x3 6x4 )
: :
x1 2x2 2x3 10x4 = 0 x1 2x2 2x3 10x4 = 0
8 8
< x2 = 6x3 10x4 < x2 = 6x3 10x4
x1 = 4x3 6x4 ) x1 = 4x3 6x4 )
: :
( 4x3 6x4 ) 2 ( 6x3 10x4 ) 2x3 10x4 = 0 x3 = 32 x4
8 2
8
< x2 = 6 3 x4 10x4 < x2 = 6x4
x1 = 4 2
x
3 4 6x4 ) x1 = 103 x4
: :
2
x3 = 3 x4 x3 = 32 x4

In conclusione, tutti e solo i vettori di R4 della forma (3.2) sono soluzioni del sistema per ogni t 2 R.
80 CAPITOLO 3. STRUTTURA LINEARE
T T
vettoriale di Rn . Dunque, v + w 2 i Vi e quindi i Vi un sottospazio vettoriale
di Rn .

Al contrario dellintersezione, lunione di sottospazi vettoriali non in generale un


sottospazio vettoriale, come mostra il prossimo esempio.
Esempio 15 Gli insiemi V1 = fx 2 R2 : x1 = 0g e V2 = fx 2 R2 : x2 = 0g sono en-
trambi due sottospazi vettoriali di R2 . Risulta
V1 [ V2 = x 2 R2 : x1 = 0 oppure x2 = 0
che non un sottospazio vettoriale di R2 . Infatti,
(1; 0) 2 V1 [ V2 e (0; 1) 2 V1 [ V2
ma (1; 0) + (0; 1) = (1; 1) 2
= V1 [ V2 . N

3.2 Indipendenza e dipendenza lineari


Nel capitolo adotteremo la notazione xi = (xi1 ; :::; xin ) 2 Rn dove lapice identica vet-
tori diversi e i pedici le loro componenti. Usiamo subito tale notazione nella prossima
fondamentale denizione:
m
Denizione 17 Un insieme nito di vettori fxi gi=1 di Rn detto linearmente in-
dipendente se, per ogni insieme f i gm
i=1 di numeri reali,
1 2 m
1x + 2x + + mx = 0 =) 1 = 2 = = m =0
m
Linsieme fxi gi=1 invece detto linearmente dipendente se non linearmente in-
dipendente, ossia se esiste un insieme f i gmi=1 di numeri reali, non tutti nulli, tali
che
1 2
1x + 2x + + m xm = 0
Esempio 16 In Rn consideriamo i vettori
e1 = (1; 0; :::; 0)
e2 = (0; 1; 0; :::; 0)

en = (0; 0; :::; 0; 1)
detti vettori (o versori) fondamentali di Rn . Linsieme fe1 ; :::; en g linearmente
indipendente. Si ha infatti
1 n
1e + + ne =( 1 ; :::; n)

e quindi 1e
1
+ + ne
n
= 0 implica 1 = = n = 0. N
3.2. INDIPENDENZA E DIPENDENZA LINEARI 81

m
Esempio 17 Tutti gli insiemi di vettori fxi gi=1 di Rn che contengono lorigine 0 sono
linearmente dipendenti. Infatti, senza perdita di generalit poniamo x1 = 0. Preso un
insieme f i gm
i=1 di numeri reali con 1 6= 0 e i = 0 per i = 2; :::; m si ha
1 2 m
1x + 2x + + mx =0
m
il che dimostra la lineare dipendenza dellinsieme fxi gi=1 . N
Prima di proseguire con gli esempi dobbiamo chiarire una questione lessicale.
Sebbene lindipendenza e la dipendenza lineare siano propriet da riferire a un in-
m
sieme di vettori fxi gi=1 , spesso si attribuisce ai singoli vettori, parlando di insiemi
di vettori linearmente indipendenti (dipendenti) invece di un insieme linearmente
indipendente (dipendente) di vettori.
Esempio 18 In R3 , i vettori
x1 = (1; 1; 1) ; x2 = (3; 1; 5) ; x3 = (9; 1; 25)
sono linearmente indipendenti. Infatti
1 2 3
1x + 2x + 3x = 1 (1; 1; 1) + 2 (3; 1; 5) + 3 (9; 1; 25)
= ( 1 + 3 2 + 9 3; 1 + 2 + 3; 1 + 5 2 + 25 3)

1 2 3
e quindi 1x + 2x + 3x = 0 signica
8
< 1+3 2+9 3 =0
1+ 2+ 3 = 0
:
1 + 5 2 + 25 3 = 0

che un sistema di equazioni la cui unica soluzione ( 1; 2; 3) = (0; 0; 0). Pi in


generale, per vericare se k vettori
x1 = x11 ; :::; x1m ; x2 = x21 ; :::; x2m ; ; xk = xk1 ; :::; xkm
sono linearmente indipendenti in Rn basta risolvere il seguente sistema
8 1 2
>
> 1 x1 + 2 x1 + + k xk1 = 0
< 1 2
1 x2 + 2 x2 + + k xk2 = 0
>
>
: 1 2
1 xm + 2 xm + + k xkm = 0
Se ( 1 ; :::; k ) = (0; :::; 0) lunica soluzione, allora i vettori sono linearmente indipen-
denti in Rn . Per esempio, consideriamo in R3 i due vettori x1 = (1; 3; 4) e x2 = (2; 5; 1).
Il sistema da risolvere 8
< 1+2 2 =0
3 1+5 2 =0
:
4 1+ 2=0
che ha lunica soluzione ( 1; 2) = (0; 0). I due vettori x1 e x2 sono perci linearmente
indipendenti. N
82 CAPITOLO 3. STRUTTURA LINEARE

Esempio 19 Consideriamo i vettori

x1 = (2; 1; 1) ; x2 = ( 1; 1; 2) ; x3 = (2; 2; 2) ; x4 = (2; 4; 10)

Per vericare se questi vettori sono linearmente indipendenti in R3 , risolviamo il


sistema 8
< 2 1 2+2 3+2 4 = 0
1 2 2 3 4 4=0
:
1 2 2 2 3 10 4 = 0
Come abbiamo visto precedentemente, esso risolto dai vettori
10 2
t; 6t; t; t (3.3)
3 3
per ogni t 2 R e quindi, (0; 0; 0; 0) non lunica soluzione del sistema ed i vettori x1 ,
x2 , x3 e x4 sono perci linearmente dipendenti. Infatti, posto per esempio t = 1 in
(3.3), si ha che la quaterna
10 2
( 1; 2; 3; 4) = ; 6; ;1
3 3
1 2 3 4
un insieme di coe cienti reali non tutti nulli tale che 1x + 2x + 3x + 4x = 0.
N

I sottoinsiemi conservano lindipendenza lineare:

Proposizione 31 I sottoinsiemi di un insieme linearmente indipendente sono, a loro


volta, linearmente indipendenti.

La semplice dimostrazione lasciata al lettore, che anche invitato a vericare,


come esercizio, che se si aggiunge un vettore (pi duno) a un insieme linearmente
dipendente, linsieme rimane tale.

3.3 Combinazioni lineari


m
Denizione 18 Un vettore x 2 Rn si dice combinazione lineare dei vettori fxi gi=1 di
Rn se esistono m coe cienti reali f i gm
i=1 tali che

1 m
x= 1x + + mx

Esempio 20 In R3 consideriamo i due vettori e1 = (1; 0; 0) e e2 = (0; 1; 0). Un vettore


di R3 combinazione lineare di e1 e e2 se e solo se ha la forma ( 1 ; 2 ; 0) per 1 ; 2 2 R.
Infatti, ( 1 ; 2 ; 0) = 1 e1 + 2 e2 . N

Laver introdotto la nozione di combinazione lineare permette di enunciare una


notevole caratterizzazione della dipendenza lineare.
3.3. COMBINAZIONI LINEARI 83

Teorema 32 Un insieme nito S di Rn linearmente dipendente se e solo se esiste


almeno un elemento di S che combinazione lineare di altri elementi di S.
m
Dim. Solo se. Sia S = fxi gi=1 un insieme linearmente dipendente di Rn . Sia
2 k m il pi piccolo numero naturale tra 2 ed m tale che linsieme x1 ; :::; xk sia
m
linearmente dipendente. Male che vada, k uguale ad m poich per ipotesi fxi gi=1
linearmente dipendente. Per la denizione di dipendenza lineare, esistono quindi
k coe cienti reali f i gki=1 , non tutti nulli, tali che
1 2 k
1x + 2x + + kx =0

Si ha k 6= 0 perch altrimenti x1 ; :::; xk 1 sarebbe un insieme linearmente dipen-


dente, contraddicendo il fatto che k il pi piccolo numero naturale tra 2 ed m tale che
x1 ; :::; xk un insieme linearmente dipendente. Visto che k 6= 0, possiamo scrivere

1 2 k 1
xk = x1 + x2 + + xk 1
k k k

e quindi xk combinazione lineare dei vettori x1 ; :::; xk 1


. In altre parole, il vettore
xk di S combinazione lineare di altri elementi di S.
m
Se. Supponiamo che il vettore xk di un insieme nito S = fxi gi=1 sia combi-
nazione lineare di altri elementi di S. Senza perdita di generalit, assumiamo k = 1.
Esiste un insieme f i gmi=2 di coe cienti reali tali che

x1 = 2x
2
+ + mx
m

Deniamo i coe cienti reali f i gm


i=1 come segue

1 i=1
i =
i i 2

Per
Pm costruzione, f i gmi=1 un insieme di coe cienti reali non tutti nulli tali che
i
i=1 i x = 0. Infatti

X
m
i
ix = x1 + 2x
2
+ 3x
3
+ + mx
m
= x1 + x1 = 0
i=1

m
Ne segue che fxi gi=1 un insieme linearmente dipendente.

Esempio 21 Consideriamo in R3 i vettori x1 = (1; 3; 4), x2 = (2; 5; 1) e x3 = (0; 1; 7).


Si ha che x3 = 2x1 x2 , e quindi si pu applicare il Teorema 32 allinsieme fx1 ; x2 ; x3 g
ponendo k = 3. Ne segue che fx1 ; x2 ; x3 g un insieme linearmente dipendente.
immediato vericare come anche ognuno dei vettori nellinsieme fx1 ; x2 ; x3 g sia com-
binazione lineare degli altri due. Il prossimo esempio mostrer come ci non valga per
tutti gli insiemi di vettori linearmente dipendenti. N
84 CAPITOLO 3. STRUTTURA LINEARE

Esempio 22 Consideriamo in R3 i vettori x1 = (1; 3; 4), x2 = (2; 6; 8) e x3 = (2; 5; 1).


Si ha che x2 = 2x1 e quindi si pu applicare il Teorema 32 allinsieme fx1 ; x2 ; x3 g
ponendo k = 2. I tre vettori sono perci linearmente dipendenti. Si noti come x3
non sia combinazione lineare di x1 e x2 , ossia non esistono 1 ; 2 2 R tali che x3 =
1 2
1 x + 2 x . In conclusione, il Teorema 32 assicura che, in un insieme di vettori
linearmente dipendenti, alcuni di essi sono combinazione lineare di altri, ma non
detto che la propriet valga per tutti i vettori dellinsieme. Per esempio, tale propriet
valeva per tutti i vettori nei due esempi precedenti, ma non in questultimo. N

Il prossimo risultato unimmediata, ma fondamentale, conseguenza del Teorema


32.

Corollario 33 Un insieme nito S di Rn linearmente indipendente se e solo se


nessuno dei vettori nellinsieme S combinazione lineare di altri vettori in S.

3.4 Sottospazi generati


Sia fVi g la collezione di tutti i sottospazi vettoriali che contengono un insieme S di
vettori di Rn . La collezione non vuota perch, banalmente, Rn contiene S ed quindi
un
T elemento della collezione. Grazie alla Proposizione 30, lintersezione complessiva
n
V
i i di tutti tali sottospazi
T , a sua volta, un sottospazio vettoriale di R che contiene
S. Lintersezione i Vi quindi il pi piccolo (nel senso dellinclusione)Tsottospazio
vettoriale di Rn che contiene T S: per ogni tale sottospazio V si ha infatti i Vi V .
Il sottospazio vettoriale i Vi importantissimo ed detto sottospazio vettori-
ale generato da S, indicato con span S. In altre parole, span S il pi piccolo
allargamentodi S con la propriet di essere un sottospazio vettoriale.

Il prossimo importante risultato mostra come span S abbia una rappresentazione


concretain termini di combinazioni lineari di S.

Teorema 34 Sia S un sottoinsieme di Rn . Un vettore x 2 Rn appartiene a span S


se e solo se combinazione lineare di vettori di S, ossia se e solo se esiste un insieme
nito fxi gi2I di S ed un insieme f i gi2I di coe cienti reali tali che
X
i
x= ix
i2I

Dim. Se. Sia x 2 Rn una combinazione lineare di un insieme nito fxi gi2I di vettori
i 1 n n
di S. Per semplicit, poniamo fx Pgni2I = ifx ; :::; x g. Esiste quindi un insieme f i gi=1
di coe cienti reali tali che x = i=1 i x . Per la denizione di sottospazio vettoriale,
abbiamo 1 x1 + 2 x2 2 span S poich x1 ; x2 2 span S. A sua volta, ( 1 x1 + 2 x2 ) 2
spanPS implica ( 1 x1 + 2 x2 ) + 3 x3 2 span S, e cos continuando, si ottiene che
x = ni=1 i xi 2 span S, come desiderato.
3.4. SOTTOSPAZI GENERATI 85

Solo se. Sia V linsieme di tutti i vettori x di Rn esprimibili come combinazioni


lineari di vettori di S, ossia x 2 V se esistono insiemi niti fxi gi2I S e f i gi2I R
P
tali che x = ni=1 i xi . facile vedere come V sia un sottospazio vettoriale di Rn
contenente S. Ne segue che span S V e quindi ogni x 2 span S combinazione
lineare di vettori di S.

Prima di illustrare il Teorema 34 con un alcuni esempi, ne enunciamo una semplice


conseguenza.

Corollario 35 Sia S un sottoinsieme di Rn . Se x 2 Rn combinazione lineare di


vettori di S, allora span S = span (S [ fxg).

Esempio 23 Sia S = x1 ; :::; xk Rn . Per il Teorema 34 si ha


( )
X
k
span S = x 2 Rn : x = ix
i
con i 2 R per ogni i = 1; :::; k
i=1
( k )
X
i
= ix : i 2 R per ogni i = 1; :::; k
i=1

Esempio 24 Sia S = f(1; 0; 0) ; (0; 1; 0) ; (0; 0; 1)g R3 . Si ha

span S = x 2 R3 : x = 1 (1; 0; 0) + 2 (0; 1; 0) + 3 (0; 0; 1) con i 2 R per ogni i = 1; 2; 3


= f( 1 ; 2 ; 3 ) : i 2 R per ogni i = 1; 2; 3g = R3 :

Pi in generale, sia S = fe1 ; :::; en g Rn . Abbiamo


( )
X
n
span S = x 2 Rn : x = ie
i
con i 2 R per ogni i = 1; :::; n
i=1
= f( 1 ; :::; n) : i 2 R per ogni i = 1; :::; ng = Rn

Esempio 25 Se S = fxg, si ha span S = f x : 2 Rg. Per esempio, sia x = (2; 3) 2


R2 . Si ha:
span S = f(2 ; 3 ) : 2 Rg

ossia span S non altro che la retta passante per il punto x.


86 CAPITOLO 3. STRUTTURA LINEARE

y
6

3
2

0
O 2 x

-2

-4
-6 -4 -2 0 2 4 6

3.5 Basi
Per il Teorema 34, il sottospazio generato da un sottoinsieme S di Rn consiste di tutte
le combinazioni lineari dei vettori in S. Supponiamo che S sia un insieme linearmente
dipendente. Per il Teorema 32, alcuni vettori in S sono a loro volta esprimibili come
combinazioni lineari di altri elementi di S. Per il Corollario 35, tali vettori sono perci
ridondanti ai ni della generazione di span S. Infatti, se un vettore x in span S
combinazione lineare di vettori di S, per il Corollario 35 si ha

span S = span (S fxg)

dove S fxg linsieme S privato del vettore x.


Un insieme S linearmente dipendente contiene quindi alcuni elementi ridondanti ai
ni della generazione di span S. Ci non accade se, invece, S un insieme linearmente
indipendente, nel qual caso, per il Corollario 33, nessun vettore di S esprimibile come
combinazione lineare di altri elementi di S. In altre parole, quando S linearmente
indipendente, tutti i suoi vettori sono essenziali ai ni della generazione di span S.
Le considerazioni fatte ci portano ad introdurre la nozione di base.

Denizione 19 Un sottoinsieme nito S di Rn una base di Rn se S un insieme


linearmente indipendente tale che span S = Rn .

Se S una base di Rn si ha quindi:

1. ogni x 2 Rn rappresentabile come combinazione lineare di vettori in S.

2. tutti i vettori di S sono essenziali ai ni di questa rappresentazione: nessuno


ridondante.
3.5. BASI 87

Tale essenzialit di una base ai ni della rappresentazione come combinazioni


lineari degli elementi di Rn risulta evidente nel seguente risultato:
Teorema 36 Un sottoinsieme nito S di Rn una base di Rn se e solo se ogni x 2 Rn
si scrive in un sol modo come combinazione lineare di vettori in S.
Dim. Solo se. Sia S = fx1 ; :::; xm g una base di Rn . Supponiamo esistano due
insiemi di coe cienti reali f i gm m
i=1 e f i gi=1 tali che

X
m X
m
i i
x= ix = ix
i=1 i=1

Si ha quindi
X
m
i
( i i) x =0
i=1
ed essendo i vettori in S linearmente indipendenti, risulta i i = 0 per ogni i =
1; :::; m, ossia i = i per ogni i = 1; :::; m.
Se. Sia S = fx1 ; :::; xm g e supponiamo che ogni x 2 Rn si scriva in maniera
unica come combinazione lineare di vettori in S. Ovviamente, per il Teorema 34, si
ha Rn = span S. Resta da dimostrare che S un insieme linearmente indipendente.
Supponiamo che i coe cienti reali f i gm i=1 siano tali che

X
m
i
ix =0
i=1

Siccome si ha anche
X
m
0xi = 0
i=1
concludiamo che i = 0 per ogni i = 1; :::; m poich per ipotesi il vettore 0 si scrive in
un sol modo come combinazione lineare di vettori in S.
Esempio 26 La base canonica di Rn data dai vettori fe1 ; :::; en g. Ogni x 2 Rn si
scrive in maniera unica come combinazione lineare di questi vettori. In particolare:
X
n
1 n
x = x1 e + + xn e = xi ei (3.4)
i=1

ossia i coe cienti della combinazione lineare sono le componenti del vettore x. N
Ogni vettore di Rn ricostruibile come combinazione lineare dei vettori di una
base di Rn . In un certo senso, una base perci il codice genetico per uno spazio
vettoriale, contenente tutte le informazioni necessarie per identicarne gli elementi.
Poich ci sono pi basi di Rn , tali informazioni genetiche sono quindi sintetizzabili
in diversi insiemi di vettori. perci importante capire quali sono le relazioni tra le
diverse basi. Esse sono messe in luce dal prossimo teorema, le cui notevoli implicazioni
lo rendono il Deus ex machina del capitolo.
88 CAPITOLO 3. STRUTTURA LINEARE

Teorema 37 Per ogni insieme linearmente indipendente x1 ; :::; xk di Rn , con k


n
n, esistono n k vettori xk+1 ; :::; xn tali che linsieme complessivo fxi gi=1 una
base di Rn .

In ragione della sua importanza, diamo due diverse dimostrazioni del risultato. La
prima pi semplice, ma anche pi lunga e tediosa.

Dim. 1 Dimostriamo il teorema per induzione. Cominciamo perci con k = 1, ossia


da un singoletto fx1 g. Vogliamo mostrare che esistono n 1 vettori che aggiunti a x1
formano una base di Rn . Sia fy 1 ; :::; y n g una base di n elementi di Rn (per esempio,
quella formata dai versori fondamentali). Esistono coe cienti f i gni=1 R tali che

X
n
1 i
x = iy (3.5)
i=1

Siccome x1 6= 0, non tutti i coe cienti sono nulli (perch x1 6= 0?). Supponiamo, per
esempio, che 1 6= 0. Si ha

1 X
n
1 1 1 i
y = x iy
1 1 i=2

e quindi, per ogni insieme di coe cienti f i gni=1 R,


" #
Xn Xn
1 1 X n
1
X
n
1
i i i
iy = iy + 1 x1 iy
i
= 1
x + i yi
i=1 i=2 1 1 i=2 1 i=2 1

Ne segue che span (x1 ; y 2 ; :::; y n ) = span (y 1 ; y 2 ; :::; y n ), e dunque span (x1 ; y 2 ; :::; y n ) =
Rn . Mostriamo ora che i vettori fx1 ; y 2 ; :::; y n g sono linearmente indipendenti, cos da
poter concludere che fx1 ; y 2 ; :::; y n g una base di Rn .
Siano f i gni=1 R coe cienti tali che

X
n
1 i
1x + iy =0 (3.6)
i=2

Vogliamo mostrare che 1 = = n = 0. Si supponga che 1 6= 0. Si ha

X
n
1 i
x = yi
i=2 1

Pn
Daltra parte, per la (3.5) si ha x1 = i=1 iy
i
, e quindi

i
1 =0 e i = 8i = 2; :::; n
1
3.5. BASI 89

poich per il Teorema 36 il vettore x1 si scrive in maniera unica come combinazione


n
lineare della base fy i gi=1 .
Ma 1 = 0 contraddice lassunzione 1 6= 0 e siamo giunti a una contraddizione.
Concludiamo che 1 = 0. A questo punto, posto 1 = 0, la (3.6) si riduce a
X
n
i
iy =0
i=2

Siccome fy 2 ; :::; y n g un insieme linearmente indipendente (perch?), si ha quindi


2 = = n = 0, il che completa la dimostrazione che fx1 ; y 2 ; :::; y n g un in-
sieme linearmente indipendente di Rn e quindi una sua base. Il caso k = 1 dunque
dimostrato.
Supponiamo ora che il teorema sia vero per ogni insieme di k 1 vettori; vogliamo
mostrare che il teorema vero per ogni insieme di k vettori. Sia quindi x1 ; :::; xk un
insieme di k vettori linearmente indipendenti. Il sottoinsieme x1 ; :::; xk 1 linear-
mente indipendente ed ha k 1 elementi. Per lipotesi induttiva, esistono n (k 1)
vettori yek ; :::; yen tali che x1 ; :::; xk 1 ; yek ; :::; yen una base di Rn . Pertanto, esistono
coe cienti f i gni=1 R tali che

X
k 1 X
n
k i
x = ix + ei
iy (3.7)
i=1 i=k

Siccome i vettori x1 ; :::; xk 1 sono linearmente indipendenti, almeno uno dei coe -
P
cienti f i gni=k diverso da zero. Altrimenti si avrebbe xk = ki=11 i xi e il vettore xk
sarebbe combinazione lineare dei vettori x1 ; :::; xk 1 , il che per il Corollario 33 non
pu accadere. Sia, per esempio, k 6= 0. Si ha

1 X
k 1 X
n
i i
yek = xk + xi + yei
k i=1 k i=k+1 k

Per ogni insieme di coe cienti f i gni=1


R abbiamo
" #
X
k 1 X
n X
k 1
1 k X
k 1 X
n X
n
i i i i i i i
ix + e =
iy ix + k x + x + ye + ei
iy
i=1 i=k i=1 k i=1 k i=k+1 k i=k+1

X
k 1
k k
X
n
k
i i
= i xi + xk + i yei
i=1 k k i=k+1 k

e quindi

span x1 ; :::; xk ; yek+1 ; :::; yen = span x1 ; :::; xk 1 ; yek ; :::; yen = Rn

Rimane da mostrare che i vettori x1 ; :::; xk ; yek+1 ; :::; yen sono linearmente indipen-
denti.
90 CAPITOLO 3. STRUTTURA LINEARE

Siano f i gni=1 R coe cienti tali che

X
k X
n
i
ix + ei
iy =0 (3.8)
i=1 i=k+1

Vogliamo mostrare che 1 = = n = 0. Si supponga che k 6= 0. Si ha

X
k 1 X
n
k i i i
x = x + yei
i=1 k i=k+1 k

Essendo x1 ; :::; xk 1 ; yek ; :::; yen una base di Rn , il vettore xk si scrive in un sol modo
come loro combinazione lineare, e quindi la (3.7) implica che

i
i = per i = 1; :::; k 1 e i = k + 1; :::; n
k

mentre k = 0. Ci contraddice lassunzione k 6= 0 fatta precedentemente, il che ci


porta a concludere che k = 0. La (3.8) si riduce a

X
k 1 X
n
i
ix + ei
iy =0
i=1 i=k+1

ma i vettori x1 ; :::; xk 1 ; yek+1 ; :::; yen sono linearmente indipendenti (perch?), e quin-
di possiamo concludere che

1 = = k 1 = k+1 = = n =0

che mostra che x1 ; :::; xk ; yek ; :::; yen sono linearmente indipendenti e sono dunque una
base di Rn .

La seconda, pi ingegnosa, dimostrazione si basa sul seguente

Lemma 38 Siano fb1 ; :::; bn g una base di Rn . Se

x = c 1 b1 + : : : + c n bn

con ci 6= 0, allora fb1 ; :::; bi 1 ; x; bi+1 ; :::; bn g una base di Rn .

Si osservi che il risultato stato implicitamente usato anche nella precedente


dimostrazione4 .
4
Pi precisamente, stato usato al passo k = 1 dove dalla base y 1 ; y 2 ; :::; y n stata ricavata
la base x1 ; y 2 ; :::; y n , nonch al passo k 1 dove dalla base x1 ; :::; xk 1 ; yek ; yek+1 ; :::; yen stata
ricavata la base x1 ; :::; xk ; yek+1 ; :::; yen .
3.5. BASI 91

Dim. Senza perdita di generalit supponiamo che c1 6= 0. Dimostriamo che fx; b2 ; :::; bn g
una base di Rn . Poich c1 6= 0, si pu scrivere

1 c2 2 cn n
b1 = x b ::: b
c1 c1 c1

e quindi, per ogni scelta dei coe cienti f i gni=1 R, si ha


" #
X
n X
n
1 Xn
ci i 1
X
n
1 ci
i i
ib = ib + 1 x b = x+ i bi
i=1 i=2
c1 c
i=2 1
c1 i=2
c1

Ne segue che
span x; b2 ; :::; bn = span b1 ; b2 ; :::; bn = Rn
Resta da mostrare che linsieme fx; b2 ; :::; bn g linearmente indipendente, cos da
poter concludere che una base di Rn . Siano f i gni=1 R coe cienti per i quali

X
n
i
1x + ib = 0: (3.9)
i=2

Se 1 6= 0 risulta
X
n X
n
i i
x= bi = 0b1 + bi :
i=2 1 i=2 1

Dato che x si pu scrivere in un sol modo come combinazione lineare dei vettori della
n
base fbi gi=1 , possiamo concludere che c1 = 0, il che assurdo. Ci signica che 1 = 0
e la (3.9) si semplica in
X n
1 i
0b + i b = 0:
i=2

Essendo fb1 ; : : : ; bn g una base, risulta 2 = ::: = n =0= 1.

Dim. 2 del Teorema 37 Il Teorema vale per k = 1. Infatti, consideriamo Pn un


5
singoletto fxg, con x 6= 0, e la base canonica fe ; :::; e g di R . Poich x = i=1 xi ei ,
1 n n

esiste almeno un indice i tale che xi 6= 0. Per il Lemma 38, fe1 ; :::; ei 1 ; x; ei+1 ; :::; en g
una base di Rn .
Poich il Teorema vale per k = 1, sia 1 < k n il pi piccolo intero per il
quale la propriet del Teorema falsa. Per il Lemma 38, 1 < k n ed esiste un
1 k
insieme x ; :::; x linearmente indipendente tale che non esistono n k vettori di
Rn che, aggiunti a x1 ; :::; xk , formano una base di Rn . Dato che x1 ; :::; xk 1 , a
5
Si noti che un singoletto fxg linearamente indipendente quando x = 0 implica = 0, il che
equivale a richiedere x 6= 0.
92 CAPITOLO 3. STRUTTURA LINEARE

sua volta, linearmente indipendente, per la minimalit di k vi sono xk ; :::; xn tali che
x1 ; :::; xk 1 ; xk ; :::; xn formano una base di Rn . Ma allora

xk = c1 x1 + + ck 1 xk 1
+ ckk xk + + cnn xn

Dato che x1 ; :::; xk linearmente indipendente non pu accadere che ck = =


cn = 0 e perci cj 6= 0 per qualche indice j 2 fk; :::; ng. Per il Lemma 38

x1 ; :::; xk 1 ; xk ; :::; xj 1 ; xk ; xj+1 ; :::; xn

una base di Rn : assurdo.

Il prossimo risultato una semplice, ma importante, conseguenza del Teorema 37.

Corollario 39 (i) Ogni insieme linearmente indipendente di Rn con n elementi una


sua base.

(ii) Ogni insieme linearmente indipendente di Rn ha al pi n elementi.

Dim. (i) Basta porre k = n nel Teorema 37. (ii) Sia S un insieme linearmente indipen-
dente in Rn . Consideriamo prima il caso di S nito e poniamo quindi S = x1 ; :::; xk .
Vogliamo mostrare che k n. Per contraddizione, si supponga k > n. Allora,
fx1 ; :::; xn g a sua volta un insieme linearmente indipendente e per laermazione (i)
una base di Rn . Quindi, i vettori xn+1 ; :::; xk sono combinazione lineare dei vettori
fx1 ; :::; xn g, il che, per il Corollario 33, contraddice il fatto che i vettori x1 ; :::; xk
siano linearmente indipendenti. Quindi k n, il che completa la dimostrazione.

Siamo nalmente giunti al risultato principale della sezione.

Teorema 40 Ogni base di Rn ha lo stesso numero n di elementi.

In altre parole, bench linformazione genetica di Rn sia codicabile in diversi


insiemi di vettori, ossia in diverse basi, tali insiemi hanno lo stesso numero (e nito)
di elementi, cio la stessa lunghezza. Il numero n pu quindi vedersi come la di-
mensione dello spazio Rn ; del resto naturale pensare che uno spazio Rn sia tanto pi
grandequanti pi elementi hanno le sue basi, ossia quanto pi grande la quantit
di informazioni che occorre per identicare i suoi elementi.
In conclusione, il numero n che emerge dal Teorema 40 indica la dimensionedi Rn
e, in un certo senso, ne giustica lapice n. In particolare, tale nozione di dimensione
rende rigorosa lidea intuitiva che lo spazio Rn pi grande dello spazio Rm quando
m < n. Esso pi grande perch occorre maggior informazione, cio basi di maggior
cardinalit, per codicarne gli elementi.

Dim. Supponiamo che Rn abbia una base di n elementi. Per la parte (ii) del Corollario
39, ogni altra base di Rn pu avere al pi n elementi. Sia x1 ; :::; xk una generica altra
3.6. BASI DI SOTTOSPAZI 93

base di Rn . Mostriamo che non pu essere k < n, cos da poter concludere che k = n.
Supponiamo che k < n. Per il Teorema 37 esisterebbero n k vettori xk+1 ; :::; xn
tali che linsieme x1 ; :::; xk ; xk+1 ; :::; xn sarebbe una base di Rn . Ci contraddice
per lassunzione che x1 ; :::; xk sia una base di Rn poich i vettori xk+1 ; :::; xn
non sono combinazione lineare dei vettori x1 ; :::; xk , essendo fx1 ; :::; xn g un insieme
linearmente indipendente. In conclusione, non si pu avere k < n e quindi k = n.

3.6 Basi di sottospazi


Le nozioni introdotte nella sezione precedente per Rn si estendono in modo naturale
ai suoi sottospazi vettoriali V . Infatti, anche per essi siamo interessati a sottoinsiemi
niti che ne racchiudano tutta linformazione essenziale.

Denizione 20 Sia V un sottospazio vettoriale di Rn . Un sottoinsieme nito S di V


una base di V se S un insieme linearmente indipendente tale che span S = V .

Anche le basi di sottospazi vettoriali permettono di rappresentare ogni vettore del


sottospazio come loro combinazione lineare, e tale rappresentazione essenziale, priva
di ridondanze.
I risultati della sezione precedente si generalizzano facilmente6 . Cominciamo con
il Teorema 36.

Teorema 41 Sia V un sottospazio vettoriale di Rn . Un sottoinsieme nito S di V


una base di V se e solo se ogni x 2 V si scrive in un sol modo come combinazione
lineare di vettori in S.

Esempio 27 (i) Lasse delle ascisse M = fx 2 R2 : x2 = 0g un sottospazio vettoriale


di R2 . Il singoletto fe1 g M una sua base. (ii) Il piano M = fx 2 R3 : x3 = 0g
un sottospazio vettoriale di R3 . Linsieme fe1 ; e2 g M una sua base. N

Poich V sottoinsieme di Rn , esso avr al pi n vettori linearmente indipendenti.


In particolare, vale la seguente generalizzazione del Teorema 37.

Teorema 42 Sia V un sottospazio vettoriale di Rn con una base di m n elementi.


Per ogni insieme linearmente indipendente di vettori v 1 ; :::; v k , con k m, esistono
m
m k vettori v k+1 ; :::; v m tali che linsieme complessivo fv i gi=1 una base di V .

A sua volta, il Teorema 42 porta alla seguente estensione del Teorema 40.

Teorema 43 Ogni base di un sottospazio vettoriale di Rn ha lo stesso numero di


elementi.
6
Le dimostrazione dei risultati della sezione sono lasciate al lettore perch analoghe a quelle
dellultima sezione.
94 CAPITOLO 3. STRUTTURA LINEARE

Sebbene, alla luce del Teorema 40, il risultato non sia una sorpresa, rimane di
grande eleganza perch mostra come, al di l della loro diversit, le basi condividono
una caratteristica fondamentale qual la cardinalit.
Ci motiva la prossima denizione, implicita nella discussione che ha seguito il
Teorema 40.
Denizione 21 La dimensione di un sottospazio vettoriale V di Rn il numero di
elementi di ogni sua base.
Per il Teorema 43 tale numero unico, e lo indichiamo con dim V . La nozione
di dimensione rende interessante questa sezione (che altrimenti sarebbe una mera
rivisitazione dei risultati della sezione precedente), come mostrano i prossimi esempi.
Esempio 28 Nel caso speciale V = Rn si ha dim Rn = n, il che rende rigorosa la
discussione che ha seguito il Teorema 40. N
Esempio 29 (i) Lasse delle ascisse un sottospazio vettoriale di dimensione uno di
R2 . (ii) Il piano M = fx = (x1 ; x2 ; x3 ) 2 R3 : x1 = 0g un sottospazio vettoriale di
dimensione due di R3 : N
Esempio 30 Se V = f0g, ossia se V il sottospazio vettoriale banale costituito dalla
sola origine 0, si pone dim V = 0. Daltra parte, V non contiene vettori linearmente
indipendenti (perch?) e ha quindi come base linsieme vuoto f;g. N

3.7 Titoli nanziari


Consideriamo un mercato nanziario sul quale sono quotate attivit nanziarie (titoli).
Il mercato osservato in due sole date: 0 (oggi) e 1 (una data futura). Ciascuna attivit
nanziaria aleatoria: il suo pagamento nale in data 1 assume valori (potenzialmente
diversi) in m diversi stati del mondo che diremo ! 1 ; ! 2 ; : : : ; ! m ; chiameremo
= f! 1 ; ! 2 ; : : : ; ! m g
il loro insieme. Ogni titolo si pu descrivere come un vettore
y = (y1 ; y2 ; :::; ym )
di Rm , dove yi il pagamento nale del titolo in data 1 qualora si realizzi lo stato ! i .
Esempio 31 Supponiamo che i pagamenti dei titoli dipendano dallo stato dellecono-
mia, che pu essere di tre tipi:
! 1 = recessione, ! 2 = stasie ! 3 = crescita
Ogni titolo si pu descrivere come un vettore
y = (y1 ; y2 ; y3 )
di R3 , in cui yi il pagamento del titolo nel caso la stato ! i si realizzi, per i = 1; 2; 3.
N
3.7. TITOLI FINANZIARI 95

Supponiamo che sul mercato siano quotati n titoli

L = y 1 ; :::; y n Rm

dove L sta per listino7 . Indichiamo con

y k = (y1k ; :::; ymk ) 2 Rm

uno di tali titoli, per k = 1; 2; :::; n, sicch yik il pagamento nale del k-esimo titolo
qualora si realizzi lo stato ! i . Il mercato aperto in data 0 per operazioni di com-
pravendita dei titoli quotati. Facciamo lipotesi che il mercato sia perfetto: tutti
i titoli si possono acquistare o vendere allo scoperto in qualunque quantit (anche
enorme o piccolissima) allo stesso prezzo (i prezzi dacquisto coincidono cos con i
prezzi di vendita: non vi sono cio n dierenze denaro-lettera, n costi di transazione
o imposte e nemmeno sconti di quantit).
Una combinazione lineare di titoli
Xn
xk y k
k=1

detta portafogli e signica acquistare (se xs > 0) o vendere (se xs < 0) xk unit dei
vari titoli. Sia w 2 Rm un prolo di pagamenti nei vari stati. Se il vettore w tale che
Xn
w= xk y k
k=1

si usa dire che il portafogli identicato dalla combinazione lineare dei titoli quotati
con pesi xk , o brevemente dal vettore

x = (x1 ; x2 ; : : : ; xn ) 2 Rn

replica il vettore w. In altre parole, i vettori di Rm replicati da portafogli sono tutti


i proli di pagamenti aleatori che si possono costruire sul mercato tramite opportune
operazioni di compravendita degli n titoli quotati. Il sottospazio vettoriale generato
dai titoli quotati contiene tutti e soli i vettori di pagamenti replicabili. Indichiamolo
con M (come mercato):
M = span L
Linsieme dei pagamenti aleatori replicabili sul mercato formano dunque un sottospazio
vettoriale di Rm .

Se gli n titoli del listino sono linearmente dipendenti, alcuni di essi sono inutili
perch risultano replicabili (cio ricostruibili) attraverso portafogli degli altri titoli.
Per esempio, dei tre titoli con i vettori

(3; 7; 4) ; ( 1; 2; 1) ; (18; 40; 10) 2 R3


7
Per listino intendiamo quindi linsieme dei titoli quotati.
96 CAPITOLO 3. STRUTTURA LINEARE

di pagamenti nali, lultimo superuo: pu essere ottenuto con il portafogli composto


da 4 unit del primo titolo e da 6 unit del secondo.
Quindi, se i vettori y 1 ; y 2 ; : : : ; y n sono linearmente dipendenti, il loro insieme pu
essere ristretto a un pi piccolo insieme

fyi gi2I L

di vettori linearmente indipendenti tali che

M = span fyi gi2I (3.10)

Sia 1 h n il massimo numero di tali vettori linearmente independenti, cio h = jIj.


Il sottospazio vettoriale M ha dimensione h. In particolare:

(i) se h = m dalla (3.10) segue che M = Rm , i vettori generano tutto Rm . In


questo caso, con portafogli di titoli quotati, si pu ottenere qualsiasi vettore di
pagamenti nali: il mercato detto completo.

(ii) Se h < m, il mercato M un sottospazio vettoriale proprio, di dimensione h, di


Rm e non tutti i vettori di pagamenti nali sono replicabili attraverso portafogli:
il mercato detto incompleto. Intuitivamente, la dierenza m h indica il grado
di incompletezza del mercato.

Siamo quindi giunti a una prima fondamentale classicazione dei mercati nanziari,
basata sulle nozioni di algebra lineare studiate.
Nel Capitolo 14 proseguiremo lo studio dei mercati nanziari qui intrapreso. Da
ultimo, osserviamo che i vettori fondamentali fe1 ; e2 ; :::; em g di Rm rappresentano titoli
(in genere ttizi) che pagano 1 euro se si vericher un ben preciso stato del mondo.
Essi sono detti titoli elementari (o secondo Arrow) e rappresentano assicurazioni per-
fette contro i vari stati del mondo: il generico ei 2 Rm paga 1 se si verica ! i oppure
0 negli altri stati del mondo. Essi generano lintero spazio Rm , cio M = Rm , e quindi
formano un mercato completo che replica tutti i vettori w 2 Rm . Bench ttizi, nella
Sezione 14.10 vedremo che i titoli elementari sono importanti per discutere di sistemi
di prezzo di mercato.
Capitolo 4

Struttura euclidea

4.1 Valore assoluto e norma


4.1.1 Prodotto interno
Le operazioni di somma e moltiplicazione scalare e loro propriet determinano la strut-
tura lineare di Rn . Loperazione di prodotto interno e le sue propriet caratterizzano
invece la struttura euclidea di Rn , che studieremo nel capitolo.
Ricordiamo dalla Sezione 2.2 che il prodotto interno x y di due vettori in Rn
denito come
X
n
x y = x1 y1 + x2 y2 + + xn yn = xi yi
i=1

e che esso commutativo, x y = y x, e distributivo, ( x + y) z = (x z)+ (y z).


Si noti, inoltre, che
X n
x x= x2i 0
i=1

La somma dei quadrati delle coordinate di un vettore non altro che il prodotto interno
del vettore per s stesso. Questa semplice osservazione sar centrale nel capitolo perch
permetter di denire la fondamentale nozione di norma usando il prodotto interno.
Al riguardo si osservi che x x = 0 se e solo se x = 0: la somma di quadrati nulla se
e solo se sono nulli tutti gli addendi.

Prima di studiare la norma introduciamo il valore assoluto, che la versione scalare


della norma e che il lettore forse gi conosce.

4.1.2 Valore assoluto


Il valore assoluto jxj di un numero x 2 R

x se x 0
jxj =
x se x < 0

97
98 CAPITOLO 4. STRUTTURA EUCLIDEA

Per esempio, j5j = j 5j = 5. Il valore assoluto gode delle seguenti propriet elementari
che lasciamo vericare al lettore:

(i) jxj 0 per ogni x 2 R;

(ii) jxj = 0 se e solo se x = 0;

(iiii) jxyj = jxj jyj per ogni x; y 2 R.

(iv) jx + yj jxj + jyj per ogni x; y 2 R.

La propriet (iv) detta disuguaglianza triangolare. Unaltra propriet importante


del valore assoluto
jxj < c () c < x < c, 8c > 0 (4.1)
p
Ricordiamo che abbiamo gi convenuto di considerare solo
p la radice positiva x di
x, x 0 (la cosiddetta radice aritmetica): per esempio, 25 = 5. Formalmente, ci
equivale ad assumere
p
x2 = jxj 8x 2 R (4.2)

Lasciamo al lettore la verica di (4.1) e (4.2).

4.1.3 Norma
La norma generalizza la nozione di valore assoluto a Rn . In particolare, la norma
(euclidea) di un vettore x 2 Rn , indicata con kxk, data da

1
q
kxk = (x x) 2 = x21 + x22 + + x2n

Quando n = 1, la norma si riduce al valore assoluto; infatti, grazie alla (4.2) si ha


p
kxk = x2 = jxj 8x 2 R
q p
Per esempio, se x = 4 si ha kxk = ( 4)2 = 16 = 4 = j 4j = jxj. Quindi, la
norma in Rn eettivamente generalizza il valore assoluto in R.

Geometricamente la norma di un vettore non altro che la lunghezza del segmento


che lo rappresenta.
p Per n = 2 tale lunghezza, per il Teorema di Pitagora, infatti
proprio kxk = x1 + x22 .
2
4.1. VALORE ASSOLUTO E NORMA 99

1 x
2
||x||
0
O x
1

-1

-2
-3 -2 -1 0 1 2 3 4 5

Norma del vettore x:

Per n = 3 vale una simile interpretazione geometrica, che ovviamente si perde per
n 4.
p p
Esempio 32 (i) se x = (1; 1) 2 R2 , si ha kxk = 12 + ( 1)2 = 2;

(ii) se x = (a; a2 ) 2 R2 , con a 2 R, si ha


q p p
kxk = a2 + (a2 )2 = a2 + a4 = jaj 1 + a2
p p
(iii) se x = (a; 2a; a) 2 R3 , si ha kxk = a2 + (2a)2 + ( a)2 = jaj 6;
p
(iv) se x = 2; ; 2; 3 2 R4 , si ha
q
p 2 p p
kxk = 22 + 2 + 2 + 32 = 4 + 2 + 2 + 9 = 15 + 2

La norma gode di alcune propriet elementari che estendono a Rn quelle viste per
il valore assoluto. Il prossimo risultato raccoglie le pi semplici.

Proposizione 44 Siano x; y arbitrari vettori in Rn e 2 R. Allora:

(i) kxk 0;

(ii) kxk = 0 se e solo se x = 0;


100 CAPITOLO 4. STRUTTURA EUCLIDEA

(iii) k xk = j j kxk.

Dim. Verichiamo perpesempio la (ii), lasciando al lettore le altre. Se x = 0 =


(0; 0; :::; 0), si ha kxk = 0 + 0 + + 0 = 0; viceversa, se kxk = 0, si ha

0 = kxk2 = x21 + x22 + + x2n (4.3)

Siccome x2i 0 per ogni i = 1; 2; ; n, da (4.3) segue che x2i = 0 per ogni i =
1; 2; ; n poich una somma di numeri non negativi nulla solo se sono tutti nulli.

La propriet (iii) estende la propriet jxyj = jxj jyj del valore assoluto. La cele-
bre disuguaglianza di Cauchy-Schwarz una diversa, e pi sottile, estensione di tale
propriet.

Proposizione 45 (Cauchy-Schwarz) Risulta, per ogni x; y 2 Rn ,

jx yj kxk kyk (4.4)

Vale luguaglianza se e solo se i vettori x e y sono linearmente dipendenti.

La (4.4) la disuguaglianza di Cauchy-Schwarz.

Dim. Se x = 0 oppure y = 0, si ha banalmente jx yj = kxk kyk = 0. Supponiamo


perci che entrambi i vettori non siano nulli. Per ogni t 2 R, si ha
X
n
2
X
n X
n X
n
(x ty) (x ty) = (xi tyi ) = x2i 2t 2
xi yi + t yi2 0
i=1 i=1 i=1 i=1

Ponendo Pn
xi yi
t = Pi=1
n 2
i=1 yi
si ha
X Pn X Pn
xi yi X 2
n n 2 n
x i y i
0 x2i i=1
2 Pn 2 xi yi + Pn 2 i=1
yi
i=1 i=1 yi i=1 i=1 yi i=1
Xn P 2 P 2
( ni=1 xi yi ) ( ni=1 xi yi )
= x2i 2 Pn 2 + Pn 2
i=1 i=1 yi i=1 yi
0 !2 1
X
n Pn 2 X n X n Xn X n
( i=1 xi yi )
= x2i Pn 2 = yi2 @ x2i yi2 xi yi A
i=1
y
i=1 i i=1 i=1 i=1 i=1

Pn
Poich i=1 yi2 > 0, si ha quindi
!2
X
n X
n X
n
x2i yi2 xi yi 0
i=1 i=1 i=1
4.1. VALORE ASSOLUTO E NORMA 101

cio !2
X
n X
n X
n
xi yi x2i yi2
i=1 i=1 i=1

Prendendo la radice di entrambi i membri:


v !2 v v v
u n u n u n u n
Xn u X uX X n
uX uX
xi yi = t x i yi t x2i yi2 = t x2i t yi2 = kxk kyk
i=1 i=1 i=1 i=1 i=1 i=1

si ottiene la (4.4).

La disuguaglianza vale come uguaglianza quando y = 0 oppure x = 0 oppure


quando xi tyi = 0 per ogni i = 1; 2; : : : ; n, cio quando i due vettori sono uno
multiplo dellaltro: in breve, quando uno dei due vettori multiplo dellaltro secondo
un coe ciente eventualmente nullo. Come il lettore pu vericare, ci accade se e solo
se essi sono linearmente dipendenti.

La disuguaglianza di Cauchy-Schwarz ci consente di dimostrare la disuguaglianza


triangolare, completando in tal modo lestenzione alle norme delle propriet (i)-(iv)
del valore assoluto.

Corollario 46 Risulta, per ogni x; y 2 Rn ,

kx + yk kxk + kyk (4.5)

La (4.5) la disuguaglianza triangolare per la norma.

Dim. Quadrando, la (4.5) diventa

kx + yk2 kxk2 + kyk2 + 2 kxk kyk ;

cio ! 21 ! 12
X
n X
n X
n X
n X
n
(xi + yi )2 x2i + yi2 + 2 x2i yi2 ;
i=1 i=1 i=1 i=1 i=1

ovvero, semplicando,
! 12 ! 12
X
n X
n X
n
xi yi x2i yi2
i=1 i=1 i=1

che vera per la disuguaglianza di Cauchy-Schwarz.


p p
Un vettore di norma unitaria detto versore. Nella gura i vettori 2=2; 2=2
p
e 3=2; 1=2 sono due versori di R2 :
102 CAPITOLO 4. STRUTTURA EUCLIDEA

x
2
y

0
O
-1

-2
-3 -2 -1 0 1 2 3 4 5

Si noti che, per ogni x 6= 0, il vettore


1
v= x
kxk
un versore: si tratta semplicemente di normalizzare x dividendolo per la sua
lunghezza. In particolare
e1 = (1; 0; 0; ::; 0)
e2 = (0; 1; 0; :::; 0)

en = (0; 0; :::; 0; 1)
sono i versori fondamentali di Rn introdotti nel Capitolo 3. Per vedere la ragione del
loro impegnativo aggettivo, si osservi che in R2 essi sono
e1 = (1; 0) e e2 = (0; 1)
e giacciono sullasse delle ascisse e delle ordinate, rispettivamente. In particolare, i
quattro versori f e1 ; e2 g sono i versori che appartengono agli assi cartesiani di R2 .
In R3 i versori fondamentali sono
e1 = (1; 0; 0) ; e2 = (0; 1; 0) e e3 = (0; 0; 1)
e anche in questo caso i sei versori f e1 ; e2 ; e3 g sono i versori che appartengono
agli assi cartesiani di R3 .

4.2 Ortogonalit
La Sezione A.3 dellappendice mostra come due vettori x e y del piano si possano
vedere come perpendicolari quando il loro prodotto interno nullo, cio x y = 0. Ci
suggerisce la:
4.2. ORTOGONALIT 103

Denizione 22 Due vettori x; y 2 Rn si dicono ortogonali (o perpendicolari) quando

x y=0

Quando x e y sono ortogonali si scrive x?y. Dalla commutativit del prodotto


interno segue che x?y equivalente a y?x.

Esempio 33 (i) Due versori fondamentali sono ortogonali. Per esempio, per e1 ed e2
in R3 si ha
e1 e2 = (1; 0; 0) (0; 1; 0) = 0
p p p
(ii) I vettori 2=2; 6=2 e 3=2; 1=2 sono ortogonali:
p p ! p ! p p
2 6 3 1 6 6
; ; = + =0
2 2 2 2 4 4

La nozione di ortogonalit centrale, come ben illustra il celeberrimo:

Teorema 47 (Pitagora) Siano x; y 2 Rn . Se x?y,

kx + yk2 = kxk2 + kyk2 :

Dim. Si ha

kx + yk2 = (x + y) (x + y) = kxk2 + x y + y x + kyk2 = kxk2 + kyk2

come desiderato.

Il classico Teorema di Pitagora il caso n = 2. Grazie alla nozione di ortogonalit


ne abbiamo la versione generale per Rn .

Lortogonalit si estende in modo naturale a insiemi di vettori.

Denizione 23 Un insieme di vettori fxi gki=1 di Rn si dice ortogonale se i suoi vettori


sono, a due a due, ortogonali.

Linsieme fe1 ; :::; en g dei versori fondamentali lesempio pi classico di insieme


ortogonale.

Una notevole propriet degli insiemi ortogonali la lineare indipendenza.

Proposizione 48 Un insieme ortogonale linearmente indipendente.


104 CAPITOLO 4. STRUTTURA EUCLIDEA

Dim. Sia fxi gki=1 un insieme ortogonale di Rn . Sia f i gki=1 un insieme di scalari tali
P
che ki=1 i xi = 0. Dobbiamo mostrare che 1 = 2 = = k = 0. Si ha
!
X
k X
k X
k
0 = ( j xj 0) = j xj i xi
j=1 j=1 i=1
! ! !
X
k X
k X
k
= 1 x1 i xi + 2 x2 i xi + + k xk i xi
i=1 i=1 i=1
! !
X
k X
k
2 2 2 2
= 1 x1 + 1 x1 i xi + 2 x2 + 2 x2 1 x1 + i xi
i=2 i=3
!
X
k 1
2 2
+ + k xk + k xk i xi
i=1
X
k
2 2 2 2
= 1 x1 + ( 1 x1 i xi ) + 2 x2 + 2 x2 1 x1
i=2
X
k X
k 1
2 2
+ ( 2 x2 i xi ) + + k xk + ( k xk i xi )
i=3 i=1
X
k
2 2
= i xi
i=1

Quindi,
X
k
2 2
0= i xi
i=1

il che implica 1 = 2 = = k = 0, come desiderato.

Un insieme ortogonale composto da vettori di norma unitaria, cio da versori,


detto ortonormale. Linsieme fe1 ; :::; en g dei versori fondamentali , per esempio,
ortonormale. In generale, dato un insieme ortogonale fxi gki=1 di vettori di Rn , linsieme
k
xi
kxi k i=1

ottenuto dividendo ogni elemento per la sua norma ortonormale. Infatti,

xi 1
= kxi k = 1
kxi k kxi k
e
xi xj 1
= xi xj = 0
kxi k kxj k kxi k kxj k
4.2. ORTOGONALIT 105

Esempio 34 Si considerino i seguenti tre vettori ortogonali di R3 :


x1 = (1; 1; 1) ; x2 = ( 2; 1; 1) ; x3 = (0; 1; 1)
Si ha p p p
x1 = 3 ; x2 = 6 ; x3 = 2
Dividendo ciascun vettore per la sua norma, si ottengono i vettori ortonormali:
x1 1 1 1 x2 2 1 1 x3 1 1
= p ;p ;p ; = p ;p ;p ; = 0; p ;p
kx1 k 3 3 3 kx2 k 6 6 6 kx3 k 2 2
In particolari, i tre vettori formano una base ortonormale. N
Le basi ortonormali di Rn , in primis quella composta dai versori fondamentali, sono
le pi importanti tra le basi di Rn poich per esse facile determinare i coe cienti
delle combinazioni lineari che rappresentano i vettori di Rn :
Proposizione 49 Sia fx1 ; x2 ; :::; xn g una base ortonormale di Rn . Per ogni y 2 Rn ,
si ha
Xn
1 1 2 2 n n
y = (y x )x + (y x )x + + (y x )x = (y xi )xi
i=1

I coe cienti y xi si dicono coe cienti di Fourier.

Dim. Poich fx1 ; x2 ; :::; xn g una base, esistono n scalari 1; 2 ; :::; n tali che
X
n
i
y= ix
i=1

Per i = 1; 2; :::n il prodotto scalare y xj :


X
n
j i
y x = i (x xj )
i=1

Siccome fx1 ; x2 ; :::; xn g ortonormale si ha


0 se i 6= j
xi xj =
1 i=j
Quindi y xj = j, da cui segue lasserto.

Per la base canonica fe1 ; e2 ; :::; en g per ogni y = (y1 ; :::; yn ) 2 Rn si ha y ei = yi e


si ritrova cos la (3.4), cio
Xn
y= yi ei
i=1
Il prossimo esempio considera una diversa base ortonormale.
106 CAPITOLO 4. STRUTTURA EUCLIDEA

Esempio 35 Si consideri la base ortonormale di R3 dellultimo esempio:


1 1 1 2 1 1 1 1
x1 = p ;p ;p ; x2 = p ;p ;p ; x3 = 0; p ;p
3 3 3 6 6 6 2 2
Consideriamo, per esempio, il vettore y = (2; 3; 4). Poich
9 3 1
x1 y = p ; x2 y = p ; x3 y = p
3 6 2
si ha

y = x1 y x1 + x2 y x2 + x3 y x3
9 1 1 1 3 2 1 1 1 1 1
= p p ;p ;p +p p ;p ;p +p 0; p ;p
3 3 3 3 6 6 6 6 2 2 2
N

Chiudiamo mostrando che il Teorema di Pitagora si estende agli insiemi ortogonali.

Proposizione 50 Per un insieme ortogonale fxi gki=1 di vettori di Rn si ha


2
X
k X
k
xi = kxi k2
i=1 i=1

Dim. Dimostriamo il risultato per induzione. Gi sappiamo che il risultato vale per
k = 2. Supponiamo che esso valga per k 1, cio
2
X
k 1 X
k 1
xi = kxi k2 (4.6)
i=1 i=1
Pk 1
Mostriamo che ci ne implica la validit per k. Si osservi che, posto y = i=1 xi , si
ha y?xk . Infatti, !
X
k 1 X
k 1
y x= xi xk = xi xk = 0
i=1 i=1

Grazie al Teorema di Pitagora e alla (4.6) si ha:


2 2
X
k X
k 1
xi = xi + xk = ky + xk k2 = kyk2 + kxk k2
i=1 i=1
2
X
k 1
2
X
k 1
2 2
X
k
= xi + kxk k = kxi k + kxk k = kxi k2
i=1 i=1 i=1

come desiderato.
Capitolo 5

Struttura topologica

In questo capitolo daremo la fondamentale nozione di distanza tra punti di Rn e ne


studieremo le principali conseguenze.

5.1 Distanze
La norma, studiata nella Sezione 4.1, consente di denire la distanza in Rn . Cominci-
amo con n = 1, quando la norma prende la veste di valore assoluto jxj. Consideriamo
due punti x e y sulla retta, con x > y,

-1

-2

-3
-4 -2 0 2 4 6

Distanza tra x e y:

La distanza tra i due punti x y, ossia la lunghezza del segmento che li congiunge.
Daltra parte, se si prendono due punti qualsiasi x e y sulla retta, senza saperne lordine
(cio, se x y o x y), la distanza diventa

jx yj

107
108 CAPITOLO 5. STRUTTURA TOPOLOGICA

ossia il valore assoluto della loro dierenza. Infatti,

x y se x y
jx yj =
y x se x < y

e quindi il valore assoluto della dierenza fornisce la distanza tra i due punti indipen-
dentemente dal loro ordine. In simboli, possiamo scrivere

d (x; y) = jx yj 8x; y 2 R

In particolare, d (0; x) = jxj e quindi il valore assoluto, o, equivalentemente, la norma


di un punto x 2 R pu vedersi come la sua distanza dallorigine.
Consideriamo ora n = 2. Prendiamo due vettori x = (x1 ; x2 ) e y = (y1 ; y2 ) in R2 :

y
2
2

1 x
2

0
O y x
1 1

-1

-2
-3 -2 -1 0 1 2 3 4 5

Distanza tra x = (x1 ; x2 ) e y = (y1 ; y2 ) in R2 :

La distanza tra i due vettori x e y data dalla lunghezza del segmento che li congiunge.
Grazie al Teorema di Pitagora, tale distanza

q
d(x; y) = (x1 y1 )2 + (x2 y2 )2 (5.1)

poich lipotenusa del triangolo rettangolo che ha come cateti i segmenti che con-
giungono xi e yi per i = 1; 2.
5.1. DISTANZE 109

3
y
y
2
2

x x
1
2

0
O y x
1 1

-1

-2
-3 -2 -1 0 1 2 3 4 5

Osserviamo che la distanza (5.1) altro non che la norma del vettore x y (e anche
di y x), cio:
d (x; y) = kx yk
La distanza tra due vettori in R2 quindi data dalla norma della loro dierenza.
facile vedere che, applicando di nuovo il Teorema di Pitagora, anche la distanza tra
due vettori x e y in R3 data da
q
d(x; y) = (x1 y1 )2 + (x2 y2 )2 + (x3 y3 )2

e quindi si ha ancora:
d (x; y) = kx yk
A questo punto generalizziamo la nozione di distanza a n qualsiasi.

Denizione 24 Si dice distanza ( euclidea) d (x; y) tra due vettori x e y in Rn la


norma della loro dierenza: d (x; y) = kx yk.

In particolare, si ha d(x; 0) = kxk, ossia la norma kxk di un vettore x 2 Rn pu


vedersi come la sua distanza dal vettore 0, cio, come s gi detto, come la lunghezza
del segmento che rappresenta x.

Vale la seguente proposizione per distanze tra vettori di Rn , la cui semplice di-
mostrazione (basta applicare le denizioni) lasciata al lettore.

Proposizione 51 Siano x; y due arbitrari vettori in Rn . Allora:

(i) d (x; y) 0;

(ii) d (x; y) = 0 , x = y;
110 CAPITOLO 5. STRUTTURA TOPOLOGICA

(iii) d (x; y) = d (y; x);

(iv) d (x; y) d (x; z) + d (z; y) per ogni z 2 Rn .

Le (i)-(iv) sono tutte propriet naturali per la nozione di distanza. La (i) aerma
che una distanza sempre una quantit positiva, la (ii) che nulla solo quando i vettori
in esame sono uguali, mentre vettori diversi hanno sempre una distanza non nulla. La
(iii) aerma che la distanza una nozione simmetrica: nel misurarla non conta da
quale dei due vettori si parte. Inne, la (iv) la cosiddetta disuguaglianza triangolare:
per esempio, la distanza tra Milano (x) e Roma (y) non pu superare la somma delle
distanze tra Milano e qualsiasi altra localit z e tra tale z e Roma.

Esempio 36 (i) Se x = (1=3) e y = 1=3, si ha

1 1 2 2
d (x; y) = = = ;
3 3 3 3

(ii) se x = a e y = a2 con a 2 R, si ha d (x; y) = d (a; a2 ) = ja a2 j = jaj j1 aj;

(iii) se x = (1; 3) e y = (3; 1), si ha


p p p
d (x; y) = (1 3)2 + ( 3 ( 1))2 = 8 = 2 2;

(iv) se x = (a; b) e y = ( a; b), si ha


p p p
d (x; y) = (a ( a))2 + (b b)2 = (2a)2 + 0 = 4a2 = 2 jaj ;

(v) se x = (0; a; 0) e y = (1; 0; a), si ha


p p p
d (x; y) = (0 1)2 + (a 0)2 + (0 ( a))2 = 12 + a2 + a2 = 1 + 2a2 :

5.2 Intorni
Denizione 25 Si dice intorno (sferico) di centro x0 2 Rn e di raggio " > 0, e si
denota con B" (x0 ), linsieme

B" (x0 ) = fx 2 Rn : d (x; x0 ) < "g :

Lintorno B" (x0 ) quindi il luogo dei punti di Rn che hanno distanza da x0
strettamente minore di ". In R tale intorno lintervallo aperto (x0 "; x0 + "), cio

B" (x0 ) = (x0 "; x0 + ") :


5.2. INTORNI 111

Infatti si ha

fx 2 R : d(x; x0 ) < "g = fx 2 R : jx x0 j < "g


= fx 2 R : " < x x0 < "g = (x0 "; x0 + ")

avendo usato la (4.1), cio jxj < a , a < x < a.

Dunque in R gli intorni sono intervalli; si vede senza di colt che in R2 sono cerchi,
in R3 sfere, ecc.: i punti che distano meno di " da x0 formano infatti un cerchio, una
sfera, ecc. di centro x0 .

0 ( )
x0 - x0 x0 +
-1

-2

-3
-4 -2 0 2 4 6

Intorno di x0 2 R di raggio ":

2
x
0
1

0
O
-1

-2
-3 -2 -1 0 1 2 3 4 5

Intorno di x0 2 R2 di raggio ":


112 CAPITOLO 5. STRUTTURA TOPOLOGICA

Vediamo alcuni esempi di intorni. Per semplicit di notazione, scriveremo B" (x1 ; ::; xn )
in luogo di B" ((x1 ; ::; xn )).

Esempio 37 (i) Si ha B3 ( 1) = ( 1 3; 1 + 3) = ( 4; 2).

(ii) Si ha
3 3 1 5
B 3 (1) = 1 ;1 + = ; :
2 2 2 2 2

(iii) Le scritture B 1 (0) e B0 (1) sono prive di senso perch deve essere " > 0.

(iv) Si ha
q
B3 (0; 0) = B3 (0) = x 2 R2 : d(x; 0) < 3 = x 2 R2 : x21 + x22 < 3 =

= x 2 R2 : x21 + x22 < 9 :

(v) Si ha

B1 (1; 1; 1) = x 2 R3 : d (x; (1; 1; 1)) < 1


n p o
= x 2 R3 : (x1 1)2 + (x2 1)2 + (x3 1)2 <1
= x 2 R3 : (x1 1)2 + (x2 1)2 + (x3 1)2 < 1 :

Per esempio, il vettore (1=2; 1=2; 1=2) 2 B1 (1; 1; 1). Infatti


2 2 2
1 1 1 3
1 + 1 + 1 = < 1:
2 2 2 4

Si verichi che, invece, 0 = (0; 0; 0) 2


= B1 (1; 1; 1). N

OfB. Un punto possiede sempre inniti intorni: uno per ogni valore di " > 0. perci
fuorviante parlare dellintorno di un punto come se ve ne fosse uno solo. H

Per alcune nalit avremo occasione di utilizzare, esclusivamente in R, anche


mezzi intornidi un punto x0 ; precisamente:

Denizione 26 Lintervallo [x0 ; x0 + "), con " > 0, detto intorno destro di x0 2 R
di raggio ". Lintervallo (x0 "; x0 ], con " > 0, detto intorno sinistro di x0 di raggio
".

Con essi possiamo dare unutile caratterizzazione degli estremi superiore e inferiore
di un sottoinsieme di R.

Proposizione 52 Dato un insieme A di R, si ha a = sup A se e solo se:


5.3. TASSONOMIA DEI PUNTI DI RN 113

(i) a x per ogni x 2 A,


(ii) per ogni " > 0, esiste x 2 A tale che x > a ".
Dim. Solo se. Se a = sup A, la (i) ovviamente soddisfatta. Sia " > 0. Poich
sup A > a ", il punto a " non un maggiorante di A. Esiste quindi x 2 A tale che
x > a ".
Se Supponiamo che a 2 R soddis (i) e (ii). Grazie alla (i), a un maggiorante
di A. Grazie alla (ii), il pi piccolo dei maggioranti. Infatti, ogni b < a si pu scrivere
come b = a " ponendo " = a b > 0. Per la (ii), esiste x 2 A tale che x > a " = b.
Quindi, b non un maggiorante di A, che implica che non esistono maggioranti pi
piccoli di a.

In altre parole, il punto a 2 R estremo superiore di A R se e solo se un maggio-


rante di A e in ogni suo intorno sinistro cadono elementi di A. Una caratterizzazione
analoga vale per gli estremi inferiori, con intorni destri in luogo dei sinistri.

5.3 Tassonomia dei punti di Rn


La nozione di intorno permette di classicare i vettori di Rn in varie categorie, secondo
i loro rapporti con un dato insieme A Rn .

5.3.1 Punti interni e di frontiera


La prima fondamentale nozione di punto interno. Intuitivamente, un punto interno a
un insieme un punto dentroad esso, cio un punto tutto circondato da altri punti
dellinsieme (ovvero dal quale ci si pu allontanare in qualunque direzione rimanendo,
almeno per un po, nellinsieme).
Denizione 27 Sia A un sottoinsieme di Rn . Un punto x0 2 A detto punto interno
di A se, per qualche " > 0, B" (x0 ) A.
In altre parole, x0 punto interno di A se esiste almeno un intorno di x0 tutto
contenuto in A. Ci motiva laggettivo interno. Un punto di A quindi interno
se esso contenuto in A con tutto un suo intorno, per quanto piccolo possa essere.
Possiamo dire che i punti interni sono i punti che appartengono ad A in senso sia
insiemistico (x 2 A) sia topologico (esiste B" (x) A).

In modo analogo, un punto x0 2 Rn si dice esterno ad A se esso interno al


complementare Ac di A, ossia se, per qualche " > 0, B" (x0 ) contenuto in Ac : B" (x0 )\
A = ;. Un punto non in A quindi esterno quando non appartiene ad A con tutto un
suo intorno, per quanto piccolo possa essere.

Linsieme dei punti interni di A detto interno di A e si indica con int A. ovvio
che int A A.
114 CAPITOLO 5. STRUTTURA TOPOLOGICA

Esempio 38 Sia A = (0; 1). Ogni suo punto interno, cio int A = A. Sia infatti
x 2 (0; 1) e si consideri la pi piccola tra le distanze di x dai punti estremi a e b, ossia
min fd (0; x) ; d (1; x)g. Prendiamo " > 0 tale che

" < min fd (0; x) ; d (1; x)g

Si ha
B" (x) = (x "; x + ") (0; 1)
e quindi x punto interno di A. Poich x era un punto qualsiasi di A, ne segue che
int A = A. N

Esempio 39 Sia A = [0; 1]. Si ha int A = (0; 1). Infatti, procedendo come sopra
si vede che i punti in (0; 1) sono tutti interni, ossia (0; 1) int A. Rimangono da
considerare i punti estremi 0 e 1. Consideriamo 0. Ogni suo intorno ha la forma
( "; "), con " > 0, e quindi contiene anche punti di Ac . Ne segue che 0 2
= int A. In
modo analogo si mostra che 1 2 = int A. Concludiamo che int A = (0; 1).
Troviamo i punti esterni ad A = [0; 1]. Si ha

Ac = ( 1; 0) [ (1; +1)

e quindi int Ac = Ac , come il lettore pu facilmente vericare. Ne segue che i punti


esterni ad A sono i punti dellinsieme complementare Ac . N

Denizione 28 Sia A un sottoinsieme di Rn . Un punto x0 2 Rn detto di frontiera


per A se non n interno n esterno.

Un punto x0 quindi di frontiera per A allorquando in ogni suo intorno cadono sia
punti di A (perch non esterno) sia punti di Ac (perch non interno). Linsieme
dei punti di frontiera si indica con @A. Intuitivamente, la frontiera il bordodi un
insieme.

Si noti che la denizione di punto di frontiera residuale: un punto di frontiera


se non altro, cio se non n interno n esterno. Ci fa si che la classicazione
in punti interni, esterni e di frontiera sia esaustiva: dato un insieme A, ogni punto
x0 2 Rn necessariamente ricade in una di queste tre categorie.

Esempio 40 (i) Sia A = (0; 1). Data la natura residuale della denizione di punto di
frontiera, per determinare @A dobbiamo prima identicare i punti interni ed esterni.
Abbiamo visto che int A = (0; 1). Per trovare i punti esterni, osserviamo che Ac =
( 1; 0] [ [1; +1), sicch

int Ac = ( 1; 0) [ (1; +1)

I punti esterni ad A sono dunque quelli dellinsieme ( 1; 0) [ (1; +1). Ne segue che

@A = f0; 1g
5.3. TASSONOMIA DEI PUNTI DI RN 115

cio la frontiera di (0; 1) costituita dai due punti 0 e 1. Si noti che A \ @A = ;: in


questo esempio i punti di frontiera non appartengono allinsieme .
(ii) Sia A = [0; 1]. Nellultimo esempio abbiamo visto che int A = (0; 1) e che Ac
linsieme dei punti esterni di A. Quindi, @A = f0; 1g. In questo esempio si ha @A A,
linsieme contiene i propri punti di frontiera.
(iii) Sia A = [1; 0). Il lettore pu vericare che int A = (0; 1) e che tutti i punti di
( 1; 0) [ (1; +1) sono esterni. Quindi, @A = f0; 1g. In questo esempio, la frontiera
sta un pofuori e un podentro linsieme: il punto di frontiera 1 in A mentre il punto
di frontiera 0 non lo .
(iv) Se
A = (x1 ; x2 ) : x21 + x22 1 R2
tutti i punti tali che x21 + x22 < 1 sono interni, cio

int A = (x1 ; x2 ) : x21 + x22 < 1

mentre tutti i punti tali che x21 + x22 > 1 sono esterni. Quindi,

@A = (x1 ; x2 ) : x21 + x22 = 1

Linsieme A contiene tutti i propri punti di frontiera.


(v) Sia A = Q linsieme dei razionali, sicch Ac linsieme degli irrazionali. Grazie
alle Proposizioni 9 e 18, tra due razionali q < q 0 esiste un irrazionale a tale che
q < a < q 0 e tra due irrazionali a < b esiste un razionale q 2 Q tale che a < q < b. Il
lettore pu vericare che ci implica int A = int Ac = ;, e quindi @A = R. Lesempio
mostra che linterpretazione della frontiera come bordo pu in taluni casi non essere
calzante. Del resto, le nozioni matematiche hanno vita propria e dobbiamo essere
pronti a seguirle anche quando lintuizione fa difetto. N

Individuiamo unimportante sottoclasse dei punti di frontiera.

Denizione 29 Sia A un sottoinsieme di Rn . Un punto x0 2 A detto isolato se


esiste (almeno) un suo intorno che non contiene altri punti di A eccetto x0 stesso.

Quindi, un punto x0 2 A isolato se esiste almeno un suo intorno B" (x0 ) tale
che A \ B" (x0 ) = fx0 g. Come suggerisce la terminologia, i punti isolati sono punti
dellinsieme staccatidal resto dellinsieme.

Esempio 41 Sia A = [0; 1] [ f2g. Esso costituito dallintervallo chiuso unitario e,


in aggiunta, dal punto 2. Questultimo isolato. Infatti, sia B" (2) un intorno di 2 con
" < 1. Si ha A \ B" (2) = f2g. N

Come anticipato, i punti isolati sono di frontiera: la dimostrazione lasciata al


lettore.

Lemma 53 I punti isolati sono di frontiera.


116 CAPITOLO 5. STRUTTURA TOPOLOGICA

5.3.2 Punti di accumulazione


Denizione 30 Sia A un sottoinsieme di Rn . Un punto x0 2 Rn detto di accu-
mulazione per A se ogni intorno di x0 contiene almeno un punto di A distinto da
x0 .
Quindi, x0 punto di accumulazione di A se, per ogni " > 0, esiste qualche x 2 A
tale che1 0 < kx0 xk < ". Linsieme dei punti di accumulazione di A si indica
A0 ed detto insieme derivato. Si osservi che non si richiesto che il punto x0 di
accumulazione appartenga ad A.

NB. La Denizione 30 si pu equivalentemente esprimere dicendo che x0 2 Rn punto


di accumulazione per A se, per ogni " > 0, esiste un intorno B" (x0 ) di x0 tale che
B" (x0 ) \ (A fx0 g) 6= ;:
O

Come prima cosa, vediamo le relazioni dei punti di accumulazione con la classi-
cazione test vista. Ovviamente, i punti di accumulazione non sono mai esterni.
Inoltre:
Lemma 54 Sia A un sottoinsieme di Rn .
(i) Ogni punto interno di A di accumulazione, ossia int A A0 .
(ii) Un punto di frontiera di A di accumulazione se e solo se non isolato.
Dim. (i) Se x0 2 int A, esiste un intorno B"0 (x0 ) di x0 tale che B"0 (x0 ) A. Sia
B" (x0 ) un intorno qualsiasi di x0 . Lintersezione
B"0 (x0 ) \ B" (x0 ) = Bminf"0 ;"g (x0 )
a sua volta un intorno di x0 di raggio min f"0 ; "g > 0. Quindi Bminf"0 ;"g (x0 ) A
e, per completare la dimostrazione, basta considerare qualsiasi x 2 Bminf"0 ;"g (x0 ) tale
che x 6= x0 . Infatti, x appartiene anche allintorno B" (x0 ) ed distinto da x0 .

(ii) Se. Consideriamo un punto x0 di frontiera ma non isolato. Per denizione


di punto di frontiera, per ogni " > 0 si ha B" (x0 ) \ A 6= ;. Per denizione di punto
non isolato, per ogni " > 0 si ha B" (x0 ) \ A 6= fx0 g. Ci implica che per ogni
" > 0 si ha B" (x0 ) \ (A fx0 g) 6= ;, cio che x0 punto di accumulazione per
A. Solo se. Prendiamo un punto x0 sia di frontiera sia di accumulazione, ossia
x0 2 @A \ A0 . Ogni suo intorno B" (x0 ) contiene almeno un punto x 2 A distinto da
x0 , cio B" (x0 ) \ A 6= fx0 g. Ne segue che x0 non isolato.

Alla luce di questo risultato linsieme A0 dei punti di accumulazione costituito


dai punti interni di A e dai punti di frontiera non isolati di A.
1
La disuguaglianza 0 < kx0 xk equivale a x 6= x0 , ossia impone che x sia un punto di A distinto
da x0 .
5.3. TASSONOMIA DEI PUNTI DI RN 117

Esempio 42 (i) Se A = [1; 0) R, tutti e soli i punti dellintervallo [0; 1] sono di


0
accumulazione, cio A = [0; 1]. Si osservi come il punto 1 sia di accumulazione bench
non appartenga ad A.
(ii) Se A = f(x1 ; x2 ) 2 R2 : x21 + x22 1g, tutti i punti dellinsieme sono di accu-
mulazione, ossia A = A0 . N

Esempio 43 Sia A = f(x1 ; x2 ) 2 R2 : x1 + x2 = 1g. Linsieme A una retta nel pi-


ano. Si ha int A = ; e @A = A0 = A. Linsieme A non ha quindi alcun punto interno
(gracamente, si disegni un circoletto attorno a un punto di A: per quanto piccolo, non
c modo di includerlo tutto in A), mentre tutti i suoi punti sono sia di accumulazione
sia di frontiera.

Nella denizione di punto di accumulazione si richiesto che ogni suo intorno


contenga almeno un punto di A distinto da s stesso. In realt, come adesso mostriamo,
ne contiene necessariamente inniti.

Proposizione 55 Ogni intorno di un punto di accumulazione di A contiene inniti


punti di A.

Dim. Sia x un punto di accumulazione di A. Supponiamo per contra che esista un


intorno B" (x) di x contenente un numero nito di punti fx1 ; :::; xn g di A, salvo, al
pi, x stesso. Poich fx1 ; :::; xn g un insieme nito, la minima distanza

min d (x; xi )
i=1;:::;n

esiste ed strettamente positiva, ossia mini=1;:::;n d (x; xi ) > 0. Sia > 0 tale che <
mini=1;:::;n d (x; xi ) : evidente che 0 < < " in quanto < mini=1;:::;n d (x; xi ) < ":
Quindi B (x) B" (x): altres evidente, per costruzione, che per ogni i = 1; 2; :::n;
118 CAPITOLO 5. STRUTTURA TOPOLOGICA

si ha xi 2
= B (x): Dunque, se x 2 A si ha B (x) \ A = fxg; se invece x 2
= A si ha
B (x) \ A = ;: Indipendentemente dallappartenenza di x ad A; si ha

B (x) \ A fxg :

Quindi lunico punto di A che pu contenere B (x) , al pi, x stesso. Ma ci


contraddice lipotesi che x sia punto di accumulazione di A.

OfB. Il concetto di punto interno richiede che esista un suo intorno tutto formato
da punti dellinsieme: ci signica che ci si pu allontanare (almeno per un po) da
esso seguendo qualsiasi percorso che parte dal punto e rimanendo dentro linsieme
(insomma, si pu fare una passeggiatina in qualunque direzione senza mostrare il
passaporto): vedendo il percorso a rovescio, possiamo dire che ci si pu avvicinare al
punto, provenendo da qualunque direzione, rimanendo dentro linsieme.
Il concetto di punto di accumulazione, che non impone che il punto appartenga
allinsieme, richiede invece che ci si possa avvicinare quanto si vuole al punto saltel-
landosu punti dellinsieme (insomma, che, come quando si traversa un torrente saltel-
lando su sassi a oranti, ci si possa avvicinare quanto si vuole alla meta su sassitutti
appartenenti allinsieme) Questa idea della possibilit di avvicinarsi a un certo pun-
to rimanendo dentro un dato insieme risulter cruciale per la denizione di limite di
funzione. H

5.4 Insiemi aperti e chiusi


Introduciamo ora le fondamentali nozioni di insieme aperto e di insieme chiuso. Intu-
itivamente, il concetto di insieme aperto lastrazione dellidea di gura geometrica
priva del bordo, mentre il concetto di insieme chiuso lastrazione di gura geometrica
con il bordo (il concetto di frontiera , invece, lastrazione di bordo).

Denizione 31 Un sottoinsieme A Rn detto aperto se tutti i suoi punti sono


interni, cio se int A = A.

Esempio 44 Gli intervalli aperti (a; b) sono aperti (donde il nome). Infatti, sia x 2
(a; b) un punto qualsiasi di (a; b): mostriamo che interno. Sia

0 < " < min fd (x; a) ; d (x; b)g .

Si ha B" (x) (a; b) e quindi x punto interno di (a; b). Ne segue che (a; b) aperto.
N

Dato che gli intorni in R sono del tipo (a; b), essi sono tutti aperti. Il prossimo
risultato mostra che lapertura degli intorni vale in generale in Rn .

Lemma 56 Gli intorni in Rn sono aperti.


5.4. INSIEMI APERTI E CHIUSI 119

Dim. Sia B" (x0 ) un intorno di un vettore x0 2 Rn . Per mostrare che B" (x0 ) aperto
occorre mostrare che ogni suo punto interno. Sia x 2 B" (x0 ) un punto qualsiasi di
B" (x0 ). Dobbiamo dimostrare che x interno a B" (x0 ) : Sia

0< <" d (x; x0 ) (5.2)

Mostriamo che B (x) B" (x0 ) : Infatti, sia y 2 B (x) : Allora

d(y; x0 ) d(y; x) + d(x; x0 ) < + d (x; x0 ) < ";

dove lultima disuguaglianza segue da (5.2). Dunque, B (x) B" (x0 ), il che completa
la dimostrazione.

La prossima gura presenta un altro semplice insieme aperto di R2 .

4
x
2
3

0
O x
1

-1

-2
-3 -2 -1 0 1 2 3 4 5

Insieme aperto di R2 dato da


A = B1 (0; 0) f(0; 0)g.

Denizione 32 Linsieme
A [ @A
formato dai punti di A e dai suoi punti di frontiera detto chiusura2 di A e si indica
con A.
2
Per simmetria lessicale con chiusura, linterno di un insieme si sarebbe dovuto chiamare
apertura.
120 CAPITOLO 5. STRUTTURA TOPOLOGICA

ovvio che A A. La chiusura di A quindi un suo allargamento che ne


include tutti i punti di frontiera, ossia i bordi. Naturalmente, la nozione signicativa
quando i bordi non sono gi parte di A.

Esempio 45 (i) Se A = [0; 1) R, si ha A = [0; 1].


(ii) Se A = f(x1 ; x2 ) 2 R2 : x21 + x22 1g, si ha A = A. N

Esempio 46 Dato un intorno B" (x0 ) di un punto x0 2 Rn , si ha


B" (x0 ) = fx 2 Rn : d (x; x0 ) "g : (5.3)
la chiusura di un intorno si caratterizza per avere "in luogo di < ". N

Possiamo ora introdurre gli insiemi chiusi.

Denizione 33 Un sottoinsieme A di Rn detto chiuso se esso contiene tutti i propri


punti di frontiera, cio se A = A.

Un insieme quindi chiuso quando include i propri bordi.

Esempio 47 Linsieme A = [0; 1) R non chiuso poich A 6= A, mentre linsieme


A = f(x1 ; x2 ) 2 R2 : x21 + x22 1g chiuso poich A = A. N

Esempio 48 Gli intervalli chiusi [a; b] R sono chiusi (di qui il nome). Gli intervalli
illimitati (a; 1) e ( 1; a) sono aperti. Gli intervalli illimitati [a; 1) e ( 1; a] sono
chiusi. N

Esempio 49 Linsieme A = f(x1 ; x2 ) 2 R2 : x1 + x2 = 1g chiuso poich A = @A =


A0 = A. N

Le nozioni di insiemi aperti e chiusi sono tra loro speculari, come mostra il prossimo
basilare risultato.3

Teorema 57 Un insieme in Rn aperto se e solo se il suo complementare chiuso.

Dim. Solo se. Sia A aperto. Mostriamo che Ac chiuso. Sia x un arbitrario punto
di frontiera di Ac , ossia x 2 @Ac . Per denizione, x non interno n ad A n ad Ac .
Quindi, x 2= int A. Ma, A = int A siccome A aperto. Quindi x 2 = A, cio x 2 Ac . Ne
segue che @Ac Ac poich x era un punto arbitrario di @Ac . Quindi, Ac = Ac , il che
prova che linsieme complementare Ac chiuso.

Se. Sia Ac chiuso. Mostriamo che A aperto. Sia x un punto qualsiasi di A.


Poich x 2= Ac = Ac , il punto x non di frontiera per Ac ed quindi interno ad A
oppure interno ad Ac . Ma, poich x 2= Ac implica x 2 = int Ac , possiamo concludere che
x 2 int A. Quindi il punto x interno, il che implica che A aperto.
3
In molti testi si denisce chiuso un insieme il cui complementare aperto, e si dimostra come teo-
rema la conseguente propriet che ogni chiuso contiene la sua frontiera. In altre parole, la denizione
e il teorema sono scambiati rispetto allimpostazione da noi scelta.
5.4. INSIEMI APERTI E CHIUSI 121

Esempio 50 Gli insiemi niti A = fx1 ; x2 ; :::; xn g di Rn (e in particolare i singoletti)


sono chiusi. Per vericarlo si osservi che il complementare Ac aperto. Infatti sia
x 2 Ac e " > 0 tale che
" < d (x; xi ) 8i = 1; :::; n
Si ha B" (x) Ac e quindi x punto interno. Ne segue che Ac aperto. Lasciamo
vericare al lettore che int A = ; e @A = A. N

4
x
2
3

0 -1 2
O x
1
-1
-1

-2
-3 -2 -1 0 1 2 3 4 5

Insieme chiuso di R2 dato da


C = f(2; 1)g [ f(x1 ; x2 ) 2 R2 : x2 =
x21 g [ f(x1 ; x2 ) 2 R2 : (x1 + 1)2 + (x2 + 1)2 1=4g

Aperti e chiusi sono quindi due facce della stessa medaglia: dire che un insieme
chiuso/aperto equivale a dire che il suo complementare aperto/chiuso. Naturalmente,
vi sono molti insiemi che non godono di alcuna di queste propriet. Vediamone un
esempio semplicissimo.

Esempio 51 Linsieme A = [0; 1) R non n aperto n chiuso. Infatti, int A =


(0; 1) 6= A e A = [0; 1] 6= A. N

Vi un caso in cui la specularit di aperti e chiusi acquista una veste curiosa.

Esempio 52 Gli insiemi vuoto ; e tutto Rn sono simultaneamente aperti e chiusi.


Per il Teorema 57 basta mostrare che Rn sia aperto sia chiuso. Ma ci ovvio.
Infatti, Rn aperto poich, banalmente, ogni suo punto interno, ed chiuso perch
Rn coincide necessariamente con la propria chiusura. Si pu mostrare che ; e Rn sono
gli unici insiemi con tale doppia personalit. N
122 CAPITOLO 5. STRUTTURA TOPOLOGICA

Torniamo alla nozione di chiusura A. Il prossimo risultato mostra come essa si possa
equivalentemente vedere come laggiunta allinsieme A dei suoi punti di accumulazione
A0 . In altri termini, aggiungere i bordi equivale ad aggiungere i punti di accumulazione.

Proposizione 58 Si ha A = A [ A0 .

Dim. Dobbiamo dimostrare che A [ A0 = A [ @A. Cominciamo col mostrare che


A [ A0 A [ @A. Poich A A [ @A, occorre provare che A0 A [ @A. Sia x 2 A0 .
Per quanto osservato dopo la dimostrazione del Lemma 54, x interno o di frontiera,
e quindi x 2 A [ @A.
Rimane da mostrare che A [ @A A [ A0 . Poich A A [ A0 , occorre provare
che @A A [ A0 . Sia x 2 @A: Se x punto isolato, per denizione si ha che x 2 A:
Altrimenti, per il Lemma 54, si ha che x punto di accumulazione per A, cio x 2 A0 .
Quindi, x 2 A [ A0 .

Dallequivalenza appena mostrata segue, come corollario, che un insieme chiuso


quando contiene tutti i propri punti di accumulazione. Si tratta di una notevole
equivalenza.

Corollario 59 Un sottoinsieme A di Rn chiuso se e solo se contiene tutti i propri


punti di accumulazione.

Dim. Sia A chiuso. Per denizione, A = A e quindi, grazie alla Proposizione 58, si
ha A [ A0 = A, cio A0 A. Viceversa, se A0 A, si ha ovviamente A [ A0 = A.
Grazie alla Proposizione 58, si ha A = A [ A0 = A.

Esempio 53 Linclusione A0 A nel Corollario 59 pu essere stretta, nel qual caso


linsieme A A0 costituito dai punti isolati di A. Per esempio, sia A = [0; 1][f 1; 4g.
Linsieme A chiuso e si ha A0 = [0; 1]. Quindi A0 strettamente incluso in A e
linsieme A A0 = f 1; 4g costituito dai punti isolati di A. N

Come gi si rilevato, risulta sempre

int A A A: (5.4)

Il prossimo risultato mostra limportanza topologica di queste inclusioni.

Proposizione 60 Dato un insieme qualsiasi A in Rn , si ha:

(i) int A il pi grande insieme aperto contenuto in A;

(ii) A il pi piccolo insieme chiuso che contiene A.

Per dimostrare la proposizione ci occorre una semplice propriet dei punti di


accumulazione.
5.4. INSIEMI APERTI E CHIUSI 123

Lemma 61 Dati due insiemi A e B di Rn , si ha A0 B 0 se A B.

Dim. Supponiamo che A B. Sia x 2 A0 . Per ogni " > 0, si ha (B" (x) fxg)\A 6= ;.
Poich A B, ci implica (B" (x) fxg) \ B 6= ; per ogni " > 0, cio x 2 B 0 .

Dim. della Proposizione 60 . (i) Per prima cosa dimostriamo che linsieme int A dei
punti interni di A aperto. Sia x 2 int A. Per denizione, esiste un suo intorno B" (x)
contenuto in A, cio B" (x) A. Dimostriamo che tale intorno costituito da soli punti
interni di A. Supponiamo, per contra, che esista y 2 @A \ B" (x). Si ponga d = d(x; y).
Per denizione si ha d < ". Scelto un arbitrario raggio 0 < "0 < " d; facile vedere
che lintorno sferico di y di raggio "0 contenuto in B" (x), cio B"0 (y) B" (x) A.
Ma ci contraddice il fatto che y punto di frontiera di A. La contraddizione dimostra
che esiste B" (x) contenuto in int A, il che dimostra che int A aperto.
Lasciamo al lettore la verica che int A il pi grande aperto contenuto in A.

(ii) Cominciamo col dimostrare che la chiusura A un insieme chiuso. A tal ne


osserviamo che per un qualsiasi insieme A si ha int A = A @A = A \ (@A)c . Usando
le leggi di De Morgan e il fatto che A e Ac hanno la stessa frontiera, abbiamo:

(A)c = (A [ @A)c = Ac \ (@A)c = Ac \ (@Ac )c = int Ac

Per il punto (i), linsieme int Ac aperto, e quindi per il Teorema 57 linsieme A
chiuso.
Dimostriamo ora che A il pi piccolo chiuso che contiene A. Se A chiuso ci
banalmente vero poich A = A. Supponiamo che A non sia chiuso. Si consideri un
insieme A 6= A tale che A A A. Esiste quindi un punto di frontiera x di A
che non contenuto in A . Tale punto non pu essere un punto isolato di A perch
altrimenti apparterrebbe ad A e quindi a A . Per il Lemma 54, si ha dunque x 2 A0 .
Per il Lemma 61, ne segue che x punto di accumulazione anche per A . Allora A
non contiene tutti i suoi punti di accumulazione, e quindi non chiuso. In conclusione,
A il pi piccolo chiuso che contiene A.

Linsieme dei punti interni int A quindi il pi grande insieme aperto che approssi-
ma da dentro linsieme A, mentre la chiusura A il pi piccolo insieme chiuso che
approssima da fuorilinsieme A. La relazione (5.4) quindi il miglior panino topo-
logico che si possa avere per linsieme A con fetta inferiore aperta e fetta superiore
chiusa4 .

Risulta ora facile dimostrare una interessante e intuitiva propriet della frontiera
di un insieme.

Corollario 62 La frontiera di qualsiasi insieme in Rn un insieme chiuso.


4
Naturalmente, vi sono anche panini con fetta inferiore chiusa e fetta superiore aperta, come il
lettore vedr in corsi successivi.
124 CAPITOLO 5. STRUTTURA TOPOLOGICA

Dim. Sia A un insieme qualsiasi in Rn . Poich i punti esterni ad A sono interni al


suo complementare, si ha
(@A)c = int A [ int Ac
e quindi @A chiuso perch int A e int Ac sono aperti.

Il prossimo risultato, la cui dimostrazione lasciata al lettore, mostra che la


dierenza tra chiusura e interno di un insieme dato dai suoi punti di frontiera.

Proposizione 63 Per ogni sottoinsieme A Rn si ha @A = A int A.

Il risultato rende precisa lintuizione che gli aperti sono insieme privi di bordi.
Infatti, la Proposizione 63 implica che A sia aperto se e solo se @A \ A = ;. Daltra
parte, per denizione, un insieme chiuso se e solo se @A A, ossia quando include i
bordi.

5.5 Stabilit insiemistica


Abbiamo visto nel Teorema 57 come loperazione insiemistica di complementazione
abbia una funzione cruciale per aperti e chiusi. naturale chiedersi di quale stabilit
godano gli aperti e i chiusi rispetto alle altre operazioni insiemistiche di base, cio
lintersezione e lunione. Cominciamo col considerare il problema per gli intorni, i pi
semplici insiemi aperti.
Lintersezione di due (o pi, ma in numero nito di) intorni di x0 ancora un
intorno di x0 : infatti B"1 (x0 ) \ B"2 (x0 ) non altro che il pi piccolo dei due, cio

B"1 (x0 ) \ B"2 (x0 ) = Bminf"1 ;"2 g (x0 ) ;

e il risultato analogo vale per intersezioni di un numero nito di intorni. La cosa non
vale invece per intersezioni di inniti intorni: per esempio,

\
1
B 1 (x0 ) = fx0 g (5.5)
n
n=1

ossia lintersezione si riduce al singoletto fx0 g, che come osservato nellEsempio 50


chiuso. Quindi lintersezione di inniti intorni pu non essere un insieme T aperto. Per
vericare la (5.5), si osservi che un punto appartiene allintersezione 1 n=1 B1=n (x0 ) se
e soloTse appartiene ad ogni intorno B1=n (x0 ). Senzaltro ci vero per x0 , e quindi
x0 2 1 n=1 B1=n (x0 ). MostriamoT che lunico punto a godere di questa propriet. Per
contra, sia y 6= x0 tale che y 2 1 n=1 B1=n (x0 ). Poich y 6= x0 , si ha d (x0 ; y) > 0. Se
prendiamo n su cientemente grande, in particolare
1
n> ;
d (x0 ; y)
5.5. STABILIT INSIEMISTICA 125

il suo reciproco 1=n sar su cientemente piccolo da avere


1
0< < d (x0 ; y) .
n
T1
Quindi, y 2= B1=n (x0 ), il che contraddice
T l
ipotesi y 2 n=1 B1=n (x0 ). Ne segue che x0
lunico punto nellintersezione 1 B
n=1 1=n (x 0 ), ossia vale la (5.5).

Lunione di intorni di x0 invece sempre un intorno di x0 , anche se lunione


innita. Infatti
B"1 (x0 ) [ B"2 (x0 ) = Bmaxf"1 ;"2 g (x0 )
non altro che il pi grande dei due. Pi in generale, nel caso di inniti intorni B"i (x0 ),
se supi "i < +1 si pone " = supi "i e si ha
[
1
B"i (x0 ) = B" (x0 )
i=1

Per esempio
[
1
B 1 (x0 ) = B1 (x0 )
n
n=1

Quando, invece, supi "i = +1, si ha


[
1
B"i (x0 ) = Rn
i=1

Per esempio
[
1
Bn (x0 ) = Rn .
n=1

In ogni caso, lunione di intorni un insieme aperto.

Intersezioni nite di intorni sono quindi intorni, mentre unioni qualsiasi di intorni
sono intorni. Il prossimo risultato mostra che queste propriet di stabilit valgano per
tutti gli aperti.

Teorema 64 Lintersezione di un numero nito di aperti aperta. Lunione, anche


innita, di aperti aperta.
T
Dim. (i) Sia A = ni=1 Ai , con Ai tutti aperti. Ogni x 2 A appartiene a tutti gli Ai
ed interno a tutti (perch aperti),
T cio esistono suoi intorni B"i (x) Ai . Diciamo
B la loro intersezione, B = ni=1 B"i (x): esso ancora un intorno di x (con raggio
" = min f"1 ; :::; "n g) e, a maggior ragione, B Ai per ogni i = 1; 2; : : : ; n. Ma allora
B A ed un intorno S di x tutto contenuto in A. Quindi, A aperto.
(ii) Sia A = A , con che assume valori in un insieme nito o innito. Ogni
x 2 A appartiene ad almeno uno tra gli A , diciamolo A . Essendo tutti gli A aperti,
126 CAPITOLO 5. STRUTTURA TOPOLOGICA

esiste un intorno di x tutto contenuto in A e quindi, a maggior ragione, in A. Quindi,


A aperto.

Grazie al Teorema 57 e alle leggi di de Morgan, si mostra facilmente che propriet


speculari valgono per la chiusura, che si conserva per intersezioni qualsiasi, ma solo
per unioni nite.

Corollario 65 Lunione di un numero nito di chiusi chiusa. Lintersezione, anche


innita, di chiusi chiusa.

5.6 Insiemi compatti


Chiudiamo con una sezione, tanto breve quanto importante. Diamo per prima cosa
il concetto di insieme limitato. Per insiemi della retta reale la nozione stata gi
introdotta con la Denizione 9: un insieme A in R limitato quando sia inferiormente
sia superiormente limitato. Come il lettore pu facilmente vericare, ci equivale a
chiedere che esista una costante K > 0 tale che K < x < K per ogni x 2 A R,
cio
jxj < K 8x 2 A
La prossima denizione la naturale estensione a Rn di questa idea, dove il valore
assoluto sostituito dalla pi generale nozione di norma.

Denizione 34 Un sottoinsieme A di Rn limitato se esiste una costante K > 0


tale che
kxk < K 8x 2 A.

immediato vedere come tutti gli intorni B" (x) siano insiemi limitati, cos come
le loro chiusure (5.3). Invece, lintervallo (a; 1) un semplice esempio di insieme non
limitato (per questa ragione lo abbiamo chiamato intervallo illimitato).

Grazie alla limitatezza possiamo denire una classe di insiemi chiusi che si rivela
molto importante per le applicazioni.

Denizione 35 Un sottoinsieme A di Rn detto compatto se chiuso e limitato.

Per esempio, tutti gli intervalli chiusi e limitati in R sono compatti5 . Pi in gen-
erale, tutte le chiusure B" (x0 ) di intorni B" (x0 ) in Rn sono compatti. Per esempio,
linsieme
B1 (0) = (x1 ; :::; xn ) 2 Rn : x21 + + x2n 1
compatto in Rn . Tale classico insieme di Rn chiamato palla unitaria chiusa. La
ragione di tale terminologia evidente considerando il caso particolare n = 2:
5
Linsieme vuoto ;, per quanto banale, considerato un insieme compatto.
5.7. CHIUSURA E CONVERGENZA 127

4
x
2
3

0
O x
1

-1

-2
-3 -2 -1 0 1 2 3 4 5

Al pari dei chiusi, i compatti sono stabili per unioni nite e intersezioni qualunque,
come lasciamo provare al lettore6 .

Esempio 54 Gli insiemi niti A = fx1 ; x2 ; : : : ; xn g (e in particolare i singoletti) sono


insiemi compatti. Infatti, nellEsempio 50 avevamo mostrato che erano insiemi chiusi.
Poich sono ovviamente limitati, ne segue che sono compatti. N

Esempio 55 Gli insiemi di bilancio sono un fondamentale esempio di insieme com-


patto in Teoria del consumatore, come mostrer la Proposizione 280. N

5.7 Chiusura e convergenza


In questa sezione presentiamo unimportante caratterizzazione degli insiemi chiusi
attraverso le successioni, che saranno introdotte nel Capitolo 9.7

Teorema 66 Un insieme C in Rn chiuso se e solo se contiene il limite di ogni


successione convergente di suoi punti. Ossia, C chiuso se e solo se

fxn g C; xn ! x =) x 2 C (5.6)

Dim. Solo se. Sia C chiuso. Sia fxn g C una successione tale xn ! x. Vogliamo
mostrare che x 2 C. Supponiamo, per contra, che x 2 = C. Poich xn ! x, per ogni
" > 0 esiste n" 1 tale che xn 2 B" (x) per ogni n n" . Il punto x quindi di
accumulazione per C, il che contraddice x 2 = C perch C chiuso e quindi contiene
tutti i propri punti di accumulazione.
6
A questo proposito, il lettore osservi che, essendo linsieme vuoto compatto, lintersezione di due
insiemi compatti disgiunti linsieme (compatto) vuoto.
7
Pertanto, la sezione pu essere saltata in prima lettura, e letta solo dopo aver studiato le
successioni.
128 CAPITOLO 5. STRUTTURA TOPOLOGICA

Se. Sia C un insieme per il quale valga la propriet (5.6). Per assurdo, sia C
non chiuso. Allora esiste almeno un punto x di frontiera di C che non appartiene a C.
Siccome non pu essere isolato (altrimenti apparterrebbe a C), in virt del Lemma 54
x di accumulazione per C. In ogni intorno B1=n (x) cade certamente un punto di C:
chiamiamolo xn . La successione di tali xn converge a x 2
= C, contro la propriet (5.6).
Si arrivati a una contraddizione: quindi C chiuso.

Questa propriet molto importante: un insieme chiuso se e solo chiuso rispet-


to alloperazione di limite, cio se il prendere i limiti non fa mai uscire dallinsieme.
La propriet estremamente naturale per questioni economiche: un insieme chiuso
se (e solo se), allorquando ci si pu indenitamente avvicinare a un suo punto stando
nellinsieme, anche il punto appartiene allinsieme.
In un problema concreto sarebbe alquanto strano che, con punti dellinsieme, si
potesse arrivare arbitrariamente vicino a x senza per poterlo raggiungere: come lec-
care la vetrina di una pasticceria senza poter raggiungere le paste (vicinissime ma
irraggiungibili). Non a caso gli insiemi che compaiono nei modelli economici sono
quasi sempre chiusi.

Esempio 56 Consideriamo lintervallo chiuso C = [a; b]. Mostriamo che chiuso


usando il Teorema 66. Sia fxn g C tale che xn ! x 2 R. Grazie al Teorema 66, per
mostrare che C chiuso, basta mostrare che x 2 C. Poich a xn b, una semplice
applicazione del Criterio del confronto mostra che a x b, ossia che x 2 C.

Esempio 57 Consideriamo il rettangolo C = [a; b] [c; d] in R2 . Sia xk C tale


che xk ! x 2 R2 . Grazie al Teorema 66, per mostrare che C chiuso basta mostrare
che x = (x1 ; x2 ) 2 C. Per la (9.38), xk ! x implica xk1 ! x1 e xk2 ! x2 . Poich
xk1 2 [a; b] e xk2 2 [c; d] per ogni k, di nuovo una semplice applicazione del Criterio del
confronto mostra che x1 2 [a; b] e x2 2 [c; d], ossia x 2 C.
Capitolo 6

Far di conto: Analisi combinatoria

6.1 Generalit
LAnalisi combinatoria, che in s una piccola parte del tutto autonoma della Matem-
atica, si rivela piuttosto utile e ricorre in molte questioni sia teoriche sia applicative.
Cominciamo con un problema molto semplice. Abbiamo a disposizione tre paia
di pantaloni e cinque magliette. Supponendo che non vi siano coppie cromatiche che
feriscono il nostro senso estetico, in quanti modi ci possiamo vestire? La risposta
molto semplice: in 3 5 = 15 modi. Infatti, detti A; B; C i pantaloni e 1; 2; 3; 4; 5 le
magliette, gli abbinamenti possibili sono
A1 ; A2 ; A3 ; A4 ; A5
B1 ; B2 ; B3 ; B4 ; B5
C1 ; C2 ; C3 ; C4 ; C5:
La semplice regola del prodotto riposa sulla circostanza che la scelta di una cer-
ta maglietta non determina alcuna restrizione sulla scelta dei pantaloni. Non sono
necessarie altri discorsi per concludere che:
Qualora si debbano eettuare due scelte, la prima delle quali preveda n diverse
possibilit alternative e la seconda m, e se nessuna delle due comporta restrizioni
allaltra, il numero complessivo delle scelte nm.
Per esempio, se A e B sono due insiemi, rispettivamente con n e m elementi,
linsieme delle coppie ordinate (a; b) con a 2 A e b 2 B contiene nm elementi.
Ci che s detto si pu facilmente estendere al caso di pi di due scelte:
Qualora si debbano eettuare k scelte, nessuna delle quali comporti restrizioni
alle altre, il numero complessivo delle scelte il prodotto del numero di possibilit
di ciascuna scelta.
Esempio 58 Quante sono le possibile targhe italiane? Una targa del tipo AA
000 AA (due lettere, tre cifre, due lettere). Le lettere utilizzabili sono 22 (le lettere
dellalfabeto inglese escluse le I,O,Q,U per evitare equivoci) e le cifre ovviamente sono
10. Il numero di targhe (diverse) perci 22 22 10 10 10 22 22 = 234:256:000.N

129
130 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA

Esempio 59 La classica schedina del Totocalcio prevede di assegnare uno dei tre segni
1; ; 2 ai risultati di 13 partite. Il numero di schedine allora 3 3 3 = 313 =
1:594:323. N

6.2 Permutazioni
Denizione 36 Si chiamano permutazioni (semplici) di n oggetti tra loro distinti i
raggruppamenti che si possono formare con tutti tali oggetti, considerando diversi due
raggruppamenti1 quando dieriscono per lordine nel quale compaiono gli oggetti.

Se gli oggetti sono tre, a; b; c, le permutazioni sono sei:

abc ; acb ; bac ; bca ; cab ; cba:

Teorema 67 Il numero delle permutazioni di n oggetti n! = 1 2 n.

Il numero n! si dice fattoriale di n. Si pone convenzionalmente 0! = 1.

Dim. Al primo posto si pu mettere un oggetto qualsiasi: il primo posto pu quindi


essere occupato in n modi diversi. Al secondo posto si pu sistemare un oggetto
qualsiasi dei rimanenti: il secondo posto pu essere occupato in n 1 modi diversi.
Cos continuando, si vede che la terza posizione pu essere occupata in n 2 modi
diversi, ecc., nch lultima obbligata dovendo contenere lultimo oggetto rimasto.
Il numero delle permutazioni perci n (n 1) (n 2) 2 1 = n!.

Esempio 60 (i) Un mazzo di 52 carte pu essere rimescolato in 52! = 8; 0658 1067


maniere diverse.
(ii) Sei passeggeri possono occupare in 6! = 720 modi diversi uno scompartimento da
sei posti.
(iii) Dieci commensali possono sedersi in 9! = 362:880 modi diversi attorno a una
tavola rotonda. N

Il fattoriale di n cresce in modo estremamente rapido2 , come la seguente tabella


illustra:
n 0 1 2 3 4 5 6 7 8 9 10
n! 1 1 2 6 24 120 720 5:040 40:320 362:880 3:628:800

1
Sarebbe scorretto chiamarli insiemi perch, come sappiamo, in un insieme del tutto irrilevante
lordine nel quale si succedono i suoi elementi.
2
La scelta del punto esclamativo fu determinata proprio dalla sorpresa di quanto fosse veloce la
sua crescita. Pare che 60! sia gi superiore al numero degli atomi, stimato in 1080 , di tutto luniverso
osservabile.
6.2. PERMUTAZIONI 131

Assegnata una permutazione come fondamentale, possiamo contare il numero di


scambi (cio di inversioni di posto tra elementi contigui) che ogni altra permutazione
presenta rispetto ad essa.
Per esempio, sia abcde la permutazione dei cinque oggetti a; b; c; d; e assunta come
fondamentale. La permutazione cbeda presenta 6 scambi. Infatti c precede a e b per
un totale di 2 inversioni; b precede a per un totale di 1 inversione; e precede d e a per
un totale di 2 inversioni; d precede a per un totale di 1 inversione.
Una permutazione detta di classe pari o di classe dispari secondo che il numero
di scambi rispetto alla permutazione fondamentale sia pari o dispari.
piuttosto evidente che:

(i) scambiando tra loro due oggetti, la combinazione cambia classe;

(ii) il numero delle permutazioni di classe pari uguale al numero di permutazioni


di classe dispari: entrambe sono cio n!=2;

(iii) cambiando la permutazione fondamentale con unaltra di classe pari (dispari)


rispetto ad essa, le altre permutazioni non cambiano (cambiano) classe.

Esempio 61 Il giuoco del quindici una tavoletta con quindici tessere numerate
da 1 a 15 e una vuota:
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15
Il giuoco consiste nellottenere una diversa congurazione dei numeri facendo scivolare
le tessere (senza sradicarle) usando la casella vuota: in breve si tratta di passare
da una permutazione a unaltra. Si pu dimostrare che, partendo da unassegnata
permutazione, se ne pu ottenere qualsiasi altra della stessa classe (pari o dispari) ma
che impossibile ottenerne una di classe opposta. Per rendersi conto intuitivamente
del perch, si consideri il giuoco ridotto a tre tessere:

1 2
3

Si vede facilmente che da tale disposizione si possono ottenere soltanto le due seguenti,
rispettivamente con rotazioni antioraria e oraria:

1 2 2 2 3
! !
3 1 3 1
e
1 2 3 1 3 1
! ! ,
3 2 2
132 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA

cio che dalliniziale permutazione 123 si pu passare soltanto a 231 o a 312 (che sono
della stessa classe), ma non a 132, a 213 o a 321 (di classe opposta).
Il giuoco del quindici fu inventato negli Stati Uniti nel 1874 e divenne popolarissimo
allinizio del 900 quando Sam Loyd promise 1000 $ a chiunque fosse riuscito a invertire
le caselle 14 e 15, il che invogli milioni di persone a cimentarsi nellimpossibile impresa
(ignorando che fosse impossibile). H
Consideriamo ora il caso che tra gli n oggetti con i quali formare i vari raggruppa-
menti ce ne siano alcuni indistinguibili (uguali).
Per esempio, gli oggetti siano sei: a; a; b; b; b; c (i primi due e i secondi tre sono
indistinguibili). Se distinguessimo tutti gli oggetti utilizzando un diverso indice per
gli oggetti indistinguibili, a1 ; a2 ; b1 ; b2 ; b3 ; c, le loro permutazioni sarebbero 6!. Se ora
sopprimiamo lindice distintivo alle tre lettere b, esse possono essere permutate in
3! modi diversi nelle terne di posti da esse occupati. Tali 3! diverse permutazioni
(quando si scrive b1 ; b2 ; b3 ) non sono pi distinguibili (scrivendo b; b; b). Perci le diverse
permutazioni di a1 ; a2 ; b; b; b; c sono 6!=3!. Un analogo ragionamento mostra come,
togliendo lindice distintivo alle due lettere a, le permutazioni distinguibili si riducono
a 6!= (3!2!).
Con lo stesso argomento si prova il
Teorema 68 Il numero delle permutazioni, dette con ripetizione, di n oggetti dei
quali k1 uguali tra loro, k2 uguali tra
Ploro ma distinti dai precedenti, ..., kh uguali tra
h
loro ma diversi dai precedenti (con i=1 ki = n e ki 1 per ogni i = 1; 2; ; h)
n!
: (6.1)
k1 !k2 ! kh !
Si osservi che tale valore sempre intero.
Esempio 62 I possibili anagrammi della parola MAMMA sono
5! 120
= = 10;
3!2! 6 2
mentre quelli della parola MATEMATICA sono
10!
= 151:200:
2!3!2!
N
I valori in (6.1) sono detti coe cienti multinomiali. Un caso interessante rappre-
sentato da h = 2 nel quale vi sono soltanto due tipi di oggetti.
Corollario 69 Il numero delle permutazioni di n oggetti dei quali k uguali tra loro e
i rimanenti n k uguali tra loro, ma diversi dai precedenti,
n!
:
k! (n k)!
6.2. PERMUTAZIONI 133

Tale espressione, che si indica abitualmente con


n
;
k
detta coe ciente binomiale 3 e si legge n su k. In particolare
n n! n (n 1) (n k + 1)
= = :
k k! (n k)! k!
Si conviene che
n n!
= = 1:
0 0!n!
Valgono le seguenti semplici identit, che si provano senza alcuna di colt:
n n
(i) = per 0 k n;
k n k
n n n k
(ii) = .
k+1 k k+1
Si ha inoltre
n n 1 n 1
= + ;
k k 1 k
detta formula di Stifel. Essa aerma che
n
k
si pu ottenere cos: se ci si ssa su un oggetto, le permutazioni che lo contengono
sono
n 1
k 1
e quelle che non lo contengono sono
n 1
:
k
Esempio 63 (i) In un parcheggio sono occupati 15 dei 20 posti disponibili. Le
possibili posizioni dei 5 posti liberi (o, ed lo stesso, dei 15 occupati) sono
20
:
5
(ii) Si ripete un esperimento 100 volte: ogni volta si pu registrare un successo o
un insuccesso. Poniamo che vi siano stati 92 successie quindi 8 insuccessi:
il numero dei diversi modi nei quali ci pu essere accaduto
100 100
= .
92 8
N
3
Si osservi che vi un prodotto di k fattori sia a numeratore sia a denominatore.
134 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA

6.3 Disposizioni
Denizione 37 Si dice disposizione (semplice) di classe k di n oggetti ogni raggrup-
pamento di k oggetti scelti tra gli n, considerando diversi due raggruppamenti4 quando
contengano oggetti diversi oppure gli stessi oggetti in ordine diverso.

Per esempio, le disposizioni dei quattro oggetti a; b; c; d di classe 2 sono le 12


seguenti:
ab ; ac ; ad ; ba ; bc ; bd ; ca ; cb ; cd ; da ; db ; dc:
Il numero delle disposizioni di classe k di n oggetti si indica con Dn;k . Se k = n, le
disposizioni possono dierire solo per lordine e perci coincidono con le permutazioni:
Dn;n = n!.

Teorema 70 Risulta Dn;k = n (n 1) (n k + 1).

Dim. La prima posizione pu essere occupata in n modi diversi, la seconda in n 1,


..., lultima (la k-esima) in n k + 1.

Esempio 64 Le possibili estrazioni (cinquine) da una specica ruota nel giuoco del
lotto sono D90;5 = 90 89 88 87 86 = 5:273:912:160. Le possibili estrazioni da due
2
ruote sono D90;5 = 2; 7805 1019 e da dieci ruote D90;5
10
= 1; 6618 1097 . N

Denizione 38 Si dice disposizione con ripetizione di classe k di n oggetti tra loro


distinti ogni raggruppamento di k degli n oggetti, potendo ripetere una o pi volte gli
oggetti.

I vari raggruppamenti dieriscono cos o perch contengono oggetti diversi o perch


contengono gli stessi oggetti ma in ordine diverso o perch contengono gli stessi oggetti
ma con un diverso numero di ripetizioni.
Per esempio, le disposizioni con ripetizione dei quattro oggetti a; b; c; d di classe 2
sono le 16 seguenti:

aa ; ab ; ac ; ad ; ba ; bb ; bc ; bd ; ca ; cb ; cc ; cd ; da ; db ; dc ; dd:
r
Il numero delle disposizioni con ripetizione si indica con Dn;k .
r
Teorema 71 Risulta Dn;k = nk .

Dim. La prima posizione pu essere occupata in n modi diversi, la seconda ancora in


n modi (visto che si pu anche ripetere il primo oggetto), e cos via.

Si osservi che il caso delle disposizioni con ripetizione non altro che un caso parti-
colare di quello considerato in apertura nel quale si possono fare k scelte indipendenti
ognuna delle quali con n diverse modalit.
4
Ancora sarebbe scorretto chiamarli inisemi.
6.4. COMBINAZIONI 135

6.4 Combinazioni
Denizione 39 Si dice combinazione (semplice) di classe k di n (k n) oggetti
ogni raggruppamento di k degli n oggetti, considerando diversi due raggruppamenti che
dieriscano almeno per un oggetto5 (quindi ora non si tien conto dellordine).

Per esempio, le combinazioni dei quattro oggetti a; b; c; d di classe 2 sono le 6


seguenti:
ab ; ac ; ad ; bc ; bd ; cd:
Il numero delle combinazioni di n oggetti di classe k si indica con Cn;k . evidente che
Cn;n = 1 e che Cn;1 = n.

Teorema 72 Risulta
n
Cn;k = :
k

Dim. Ogni ssata combinazione d luogo a k! diverse disposizioni cambiando lordine


dei k oggetti che la compongono. Perci Dn;k = k!Cn;k e ne segue lasserto.

Pu apparire sospetto che il numero Cn;k coincida con il numero delle permutazioni
con ripetizione di n oggetti dei quali k uguali tra loro (diciamoli a) e gli altri n k
uguali tra loro ma diversi dei precedenti (diciamoli b). Ci si convince subito che
proprio cos: per contare le permutazioni basta contare in quanti modi si possono
n
disporre i k oggetti a negli n posti, che sono evidentemente : a questo punto la
k
posizione degli oggetti b obbligata (devono occupare i posti rimasti liberi).

Esempio 65 Nel giuoco del poker con un mazzo di 52 carte vi sono

52
= 2:598:960
5
diverse mani. Quante sono le possibili doppie coppie? Una doppia coppia una sequen-
za (non ordinata) del tipo AABBC. Per contarle opportuno scindere il problema in
piccoli passi:

(i) i due valori delle carte delle coppie (per esempio, 3 e fante, 5 e 9, ecc.) possono
essere scelti in 13
2
modi diversi;
4
(ii) i semi della prima coppia possono essere scelti in 2
modi;
4
(iii) i semi della seconda coppia possono ancora essere scelti in 2
modi;
5
Adesso si tratta di insiemi. Le combinazioni di n oggetti di classe k sono perci tutti i possibili
sottoinsiemi di k elementi delloriginario insieme di n elementi.
136 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA

(iv) lultima carta pu essere scelta in 44 modi diversi (dalle 52 carte dobbiamo
detrarre le 4 della doppia coppia e le altre 4 che condurrebbero a un full e non
a una doppia coppia).

Il numero complessivo perci

13 4 4 13 12 4 3 4 3
44 = 44 = 123:552:
2 2 2 2 3 2

Il lettore pu vericare che, delle 2:598:960 mani possibili, 1:098:240 contengono una
coppia, (123:552 una doppia coppia), 54:912 un tris, 10:200 una scala, 5:108 un colore,
3:744 un full, 624 un poker, 36 una scala a colore e 4 una scala reale. N

Denizione 40 Si dice combinazione con ripetizione di classe k di n oggetti tra loro


distinti ogni raggruppamento di k degli n oggetti, potendo ripetere una o pi volte gli
oggetti.

I vari raggruppamenti dieriscono cos perch contengono oggetti diversi o perch


contengono gli stessi oggetti con un numero diverso di ripetizioni (ancora non si tien
conto dellordine).
Per esempio, le combinazioni con ripetizione dei quattro oggetti a; b; c; d di classe
2 sono le 10 seguenti:

aa ; ab ; ac ; ad ; bb ; bc ; bd ; cc ; cd ; dd:
r
Indichiamo con Cn;k il numero delle combinazioni con ripetizione.

Teorema 73 Risulta

r n (n + 1) (n + k 1) n+k 1
Cn;k = = = Cn+k 1;k :
k! k

Dim. Scegliamo la seguente notazione: facciamo seguire al nome di un oggetto tanti


asterischi quante volte loggetto ripetuto (nessun asterisco quando loggetto non com-
pare). Per esempio, con i quattro oggetti a; b; c; d, invece di scrivere aaabbc schiveremo
a b c d. Abbiamo cos, per ogni raggruppamento, n + k simboli: gli n oggetti
(che necessariamente compaiono tutti) e k asterischi. In tal modo la prima posizione
obbligata (contiene necessariamente il primo oggetto a) e quindi le posizioni libere
sono n + k 1 che devono essere occupate da due tipi di simboli: gli n 1 oggetti
rimasti (nel loro ordine) e k asterischi. Ad ogni combinazione con ripetizione cor-
risponde perci una permutazione di n + k 1 oggetti dei quali n 1 uguali tra loro
e i rimanenti k uguali tra loro ma diversi dai precedenti. Quindi

r n+k 1 n+k 1
Cn;k = = = Cn+k 1;k :
k n 1
6.5. BINOMIO DI NEWTON 137

Estraiamo k palline da unurna che ne contiene n (oppure estraiamo un campione


di k oggetti da una popolazione di numerosit n). Quante sono le possibili diverse
estrazioni? Per rispondere alla domanda necessario rendere pi precisa la nozione di
estrazione. Possiamo considerare diverse due estrazioni se contengono palline diverse
oppure anche quando contengono le stesse palline, ma in ordine diverso. Nel primo
caso parleremo di estrazione senza ordine e nel secondo di estrazione con ordine.
Si parla poi di estrazione con reimmissione quando ogni pallina estratta reinlata
nellurna oppure di estrazione senza reimmissione nel caso opposto. Nei quattro casi
cos determinati si hanno le seguenti risposte alla precedente domanda:

(i) con reimmissione e con ordine: nk (disposizioni con ripetizione);


n+k 1
(ii) con reimmissione e senza ordine: k
(combinazioni con ripetizione);

(iii) senza reimmissione e con ordine: n (n 1) (n k + 1) (disposizioni semplici);


n
(iv) senza reimmissione e senza ordine: k
(combinazioni semplici).

6.5 Binomio di Newton


largamente noto che

(a + b)1 = a + b;
(a + b)2 = a2 + 2ab + b2 ;
(a + b)3 = a3 + 3a2 b + 3ab2 + b3 :

Pi in generale vale il

Teorema 74 (Tartaglia-Newton) Risulta

n n 1 n n 2 2 n
(a + b)n = an + a b+ a b + + abn 1
+ bn = (6.2)
1 2 n 1
Xn
n n k k
= a b :
k=0
k

Dim. Il prodotto
(a + b) (a + b) (a + b)
| {z }
n volte

si pu eseguire scegliendo uno dei due termini (a o b) in ciascuno degli n fattori e


facendo il prodotto dei termini cos scelti. Si sommano poi tutti i prodotti in tal modo
ottenuti.
138 CAPITOLO 6. FAR DI CONTO: ANALISI COMBINATORIA

Il prodotto an k bk si ottiene scegliendo n k volte il primo termine a e le rimanenti


n n
k volte il secondo termine b. Ci pu essere fatto in = modi diversi: il
n k k
n
fattore an k bk si ottiene perci in modi diversi. Ne segue lasserto.
k

La formula (6.2) detta del binomio di Newton e motiva il nome di coe cienti
n
binomiali per i valori di . In particolare
k

n
Xn
n k
(1 + x) = x :
k=0
k

Se prendiamo x = 1 oppure x = 1 si ottengono le notevoli relazioni

n n n n
+ + + + = 2n ;
0 1 2 n
e
n n n n n n 2n
+ + + = + + + = = 2n 1 :
0 2 4 1 3 5 2

Esempio 66 Un insieme di n oggetti possiede 2n sottoinsiemi. Infatti vi un solo


(1 = n0 ) sottoinsieme con 0 elementi (linsieme vuoto), n = n1 sottoinsiemi con un
solo elemento, n2 sottoinsiemi con due elementi, ..., un solo sottoinsieme (linsieme
stesso) con tutti gli n elementi (1 = nn ). N

Pi in generale, per la potenza di un polinomio, vale la formula


X n!
(a1 + a2 + + ah )n = ak 1 ak 2 akhh ;
k1 !k2 ! kh ! 1 2
dove la somma estesa a tutte le scelte di interi k1 ; k2 ; ; kh tali che k1 +k2 + +kh =
n. Essa detta polinomio di Leibnitz e si dimostra in modo analogo alla precedente e
motiva il nome di coe cienti multinomiali per i valori
n!
:
k1 !k2 ! kh !
Parte II

Funzioni

139
Capitolo 7

Funzioni

7.1 Il concetto
Consideriamo un fruttivendolo che allortomercato si trovi di fronte alla seguente tabel-
la che indica il prezzo unitario di un chilogrammo di noci in corrispondenza di varie
quantit (misurate in chilogrammi) di noci acquistabili dal proprio grossista:

Quantit Prezzo al kg
10 kg 4 euro
20 kg 3; 9 euro
30 kg 3; 8 euro
40 kg 3; 7 euro

In altre parole, se il fruttivendolo acquista 10 kg di noci le pagher 4 euro al kg, se ne


acquista 20 kg le pagher 3; 9 euro al kg, e cos via (stiamo assumendo che, a maggior
quantit acquistate, corrisponda un minor prezzo unitario).
La tabella un esempio di funzione di oerta, che associa a ogni quantit il
corrispettivo prezzo di acquisto: A = f10; 20; 30; 40g linsieme delle quantit e
B = f4; 3; 9; 3; 8; 2; 7g linsieme dei loro prezzi unitari: la funzione di oerta fa
corrispondere a ogni elemento dellinsieme A un elemento dellinsieme B.

In generale,

Denizione 41 Dati due insiemi qualsiasi A e B, una funzione denita su A e a


valori in B, indicata con f : A ! B, una regola che associa a ogni elemento
dellinsieme A uno, e un solo, elemento dellinsieme B.

Per indicare che allelemento a 2 A associato lelemento b 2 B si scrive b = f (a).

141
142 CAPITOLO 7. FUNZIONI

1.6

A B
1.4

a
1.2 f

1 b=f(a)

0.8

0.6

0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

La regola pu essere del tutto arbitraria; ci che interessa solo che essa associ ad
ogni elemento a di A un solo 1 elemento b di B. Altro non interessa sulla natura della
regola.

Si noti che perfettamente legittimo che a due diversi elementi di A sia associato
il medesimo elemento di B, ossia

1.6

A B
1.4
a
1
1.2

1 a b
2

0.8

0.6

0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

Legittimo

Non pu accadere invece che a uno stesso elemento di A siano associati pi elementi
di B, ossia
1
Abbiamo scritto in corsivo le parole pi importanti: la regola deve funzionare per ogni elemento
di A e, a ciascuno, associare un solo elemento di B.
7.1. IL CONCETTO 143

1.6

A B
1.4

a
1.2
b
1
1 b
2

0.8

0.6

0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

Illegittimo

Prima di passare ad alcuni esempi, introduciamo un podi terminologia. Le due


variabili, a e b, si chiamano tradizionalmente variabile indipendente e variabile dipen-
dente. Inoltre, linsieme A detto dominio della funzione, mentre linsieme B il suo
codominio.
Il codominio linsieme nel quale la funzione assume i propri valori, ma non nec-
essariamente contiene soltanto tali valori: pu anche essere pi grande. Al riguardo
importante la prossima nozione: dato a 2 A, lelemento f (a) 2 B detto immagine
di a. Preso un sottoinsieme qualsiasi C del dominio A, linsieme

f (C) = ff (x) : x 2 Cg B (7.1)

delle immagini dei punti in C detta immagine di C. In particolare, linsieme f (A)


di tutte le immagini di punti del dominio si dice (insieme) immagine della funzione.
indicato con Im f ed quindi il sottoinsieme del codominio costituito dagli elementi
che sono immagine di qualche elemento del dominio.
Si noti come ogni insieme che contiene Im f sia, in eetti, un lecito codominio della
funzione: se Im f B e Im f C, entrambe le scritture f : A ! B e f : A ! C sono
legittime. La scelta tra esse una mera questione di comodit. Per esempio, in questo
corso considereremo quasi sempre funzioni a valori reali, ossia f (x) 2 R per ogni x del
dominio di f : in questo caso la scelta naturale come codominio lintera retta reale e
di norma scriveremo f : A ! R.

Esempio 67 Sia A linsieme dei paesi della terra e B un insieme contenente alcuni
colori (almeno quattro). La funzione f : A ! B associ a ciascun paese il colore da
attribuirgli su una carta geograca: Im f linsieme dei colori eettivamente utilizzati
almeno una volta. N
144 CAPITOLO 7. FUNZIONI

Esempio 68 La legge che associa a ogni essere umano vivente la propria data di
nascita una funzione f : A ! B, dove A linsieme degli esseri umani e, per
esempio, B linsieme delle date degli ultimi 150 anni (un codominio su cientemente
grande per contenere tutte le possibili date di nascita). N

Vediamo un esempio di regola che non denisce una funzione.

Esempio 69 Consideriamo la regola che a ogni numero reale positivo x associa p p sia
la radice positiva sia la negativa (la cosiddetta radice algebrica), ossia f x; xg.
Per esempio, a 4 associa f 2; 2g. Tale regola non descrive una funzione f : R+ ! R
poich a ogni elemento del dominio diverso da 0 sono associati due diversi elementi
del codominio. N

Presentiamo ora alcune classiche funzioni f : A R ! R, dette funzioni di una


variabile (o scalari2 ).

Esempio 70 Sia f : R ! R denita come f (x) = x3 , per la quale la regola di


associare a ogni reale il suo cubo; ogni reale ha un unico cubo, e quindi la regola
denisce una funzione con Im f = f (R) = R.

Funzione x3

Esempio 71 Sia f : R ! R denita come f (x) = x2 , per la quale la regola di


associare a ogni reale il suo quadrato; ogni reale ha un unico quadrato che certamente
2
Nel seguito useremo talvolta la terminologia funzione scalare, che ha il pregio della brevit.
Ma, una terminologia meno diusa e che pu avere signicati diversi. Il lettore la usi perci con
accortezza.
7.1. IL CONCETTO 145

0 e quindi anche questa regola denisce una funzione con Im f = f (R) = R+ .

Funzione x2

Si osservi come in questo caso a due diversi elementi del dominio possa corrispondere
il medesimo elemento: per esempio, f (1) = f ( 1) = 1. N

p
Esempio 72 (i) Sia f : R+ ! R la funzione denita come f (x) = x, che associa a
ogni reale non negativo la sua radice (aritmetica). Il dominio la semiretta positiva e
inoltre Im f = R+ .

p
Funzione x

(ii) La funzione f : R++ ! R denita come f (x) = loga x, a > 0 e a 6= 1, che


associa a ogni reale strettamente positivo il suo logaritmo, ha come dominio R++ .
146 CAPITOLO 7. FUNZIONI

Inoltre, Im f = R.

Funzione log x

Esempio 73 (i) Sia f : R ! R denita come f (x) = jxj per ogni x 2 R. Graca-
mente

Funzione jxj

(ii) Sia f : R f0g ! R denita come f (x) = 1= jxj per ogni x 2 R. Gracamente
7.1. IL CONCETTO 147

1
Funzione jxj

Il dominio A = R f0g, la retta reale privata dellorigine, mentre Im f = R++ . N

Le funzioni f : A Rn ! R, dette funzioni di pi variabili (o di vettore), sono


fondamentali nelle applicazioni economiche. Vediamone alcuni esempi.

Esempio 74 (i) Sia f : R2 ! R denita come3

f (x1 ; x2 ) = x1 + x2

con la quale si associa a ogni x = (x1 ; x2 ) 2 R2 la somma delle componenti; ogni


x 2 R2 ha ununica tale somma, e quindi la regola denisce una funzione con Im f =
f (R2 ) = R.
(ii) La funzione f : Rn ! R denita come

X
n
f (x1 ; x2 ; ; xn ) = xi
i=1

generalizza a Rn la funzione f (x1 ; x2 ) = x1 + x2 , che il caso speciale n = 2. N

Esempio 75 (i) Sia f : R2+ ! R denita come


p
f (x1 ; x2 ) = x1 x2

che associa a ogni x = (x1 ; x2 ) 2 R2+ la radice del prodotto delle componenti; ogni
x 2 R2+ ha ununica tale radice, e quindi la regola denisce una funzione con Im f =
R+ .
3
Per essere coerenti con la notazione adottata per i vettori dovremmo scrivere f ((x1 ; x2 )); per
semplicit scriviamo, qui e nel seguito, f (x1 ; x2 ).
148 CAPITOLO 7. FUNZIONI

(ii) La funzione f : Rn+ ! R denita come


Y
n
f (x1 ; x2 ; ; xn ) = xi i
i=1
P
con gli esponenti i 0 di somma unitaria, ossia ni=1 i = 1, generalizza a Rn la
p
funzione f (x1 ; x2 ) = x1 x2 , che il caso speciale con n = 2 e 1 = 2 = 1=2. Questa
funzione usatissima in Economia col nome di funzione Cobb-Douglas. N

In Economia sono molto importanti anche le funzioni del tipo f : A R n ! Rm ,


dette applicazioni 4 . Vediamo alcuni esempi analitici5 .

Esempio 76 (i) Sia f : R2 ! R2 denita da

f (x1 ; x2 ) = (x1 ; x1 x2 ) ; 8 (x1 ; x2 ) 2 R2 .

Per esempio, se (x1 ; x2 ) = (2; 5), allora f (x1 ; x2 ) = (2; 2 5) = (2; 10) 2 R2 .

(ii) Sia f : R3 ! R2 denita da

f (x1 ; x2 ; x3 ) = 2x21 + x2 + x3 ; x1 x42 ; 8 (x1 ; x2 ; x3 ) 2 R3 .

Per esempio, se x = (2; 5; 3), allora

f (x1 ; x2 ; x3 ) = 2 22 + 5 3; 2 54 = (10; 623) .

OfB. Una funzione f : A ! B una sorta di macchinetta che trasforma ciascun


elemento a 2 A in un elemento b = f (a) 2 B.

b=f(a)

4
O anche funzioni vettoriali di vettore.
5
Nella Sezione 17.1 vedremo alcuni esempi economici di tali funzioni.
7.1. IL CONCETTO 149

Se in essa si inla qualsiasi elemento a 2 A, essa sputa fuori f (a) 2 B. Se si


inla un elemento a 2 = A, la macchinetta sinceppa e non produce nulla. Linsieme
immagine Im f = f (A) B semplicemente il catalogo di tutti gli elementi che
possono uscire dalla macchinetta.
In particolare, la macchinetta trasforma numeri in numeri per le funzioni scalari,
vettori di Rn in numeri per le funzioni di vettore, e vettori di Rn in vettori in Rm per
le applicazioni. H

Si osservi che i nomi delle variabili sono del tutto irrilevanti: si pu indierente-
mente scrivere a = f (b), oppure y = f (x), oppure s = f (t), oppure = f ( ), ecc., o
anche = f ( ): i nomi delle variabili sono semplici segnaposto e ci che conta solo
la sequenza di operazioni (quasi sempre numeriche) che conducono da a a b = f (a).
Scrivere b = a2 + 2a + 1 esattamente lo stesso che scrivere y = x2 + 2x + 1 oppure
s = t2 + 2t + 1 oppure = 2 + 2 + 1 oppure = 2 + 2 + 1: la funzione (il suo
nome f ) identicata dalle operazioni quadrato + doppio + 1 che permettono di
passare dalla variabile indipendente alla dipendente.

Chiudiamo questa sezione introduttiva rendendo rigorosa la nozione di graco di


una funzione, nora usata a livello intuitivo. Riprendiamo il graco della parabola x2 :

5
y
4

1
1

0
-1 O 1 x
-1

-2
-3 -2 -1 0 1 2 3 4

Il graco il luogo dei punti del piano del tipo (x; f (x)), al variare di x nel dominio
della funzione. Per esempio, i punti ( 1; 1), (0; 0) e (1; 1) appartengono al graco della
parabola.

Denizione 42 Il graco Gr f di una funzione f : A ! B linsieme

Gr f = f(x; f (x)) : x 2 Ag A B:

Il graco quindi un sottoinsieme del prodotto cartesiano A B. In particolare:


150 CAPITOLO 7. FUNZIONI

(i) Quando A R e B = R, il graco un sottoinsieme del piano R2 . Geometrica-


mente una linea (senza spessore) in R2 visto che ad ogni x 2 A corrisponde un
solo f (x).

5
y
4

0
O x
-1

-2
-3 -2 -1 0 1 2 3 4

Curva in R2

(ii) Quando A R2 e B = R, il graco un sottoinsieme dello spazio tridimensionale


R3 , cio una supercie (senza spessore)

Supercie in R3
7.2. APPLICAZIONI 151

7.2 Applicazioni
7.2.1 Incertezza
Consideriamo una scommessa basata sui lanci di una monetina. In particolare, sup-
poniamo che la monetina sia lanciata due volte e che la scommessa paghi 1 euro se
si ha testa in entrambi i lanci, mentre non paga alcunch in caso contrario. Come
possiamo rappresentare in modo rigoroso tale scommessa? Indichiamo testa con T e
croce con C, cosicch il prodotto cartesiano

1 2 = fC; T g fC; T g = f(C; T ) ; (C; C) ; (T; C) ; (T; T )g

introdotto nella Sezione 2.4.1 descrive i possibili esiti dei lanci6 .


Si ponga = 1 2 . Per comodit di notazione, indichiamo la coppia (C; T )
con CT , la coppia (C; C) con CC, e cos via. La scommessa descritta dalla funzione
f : ! R denita come f (T T ) = 1, f (CC) = 0, f (CT ) = 0 e f (T C) = 0. Lim-
magine Im f = f0; 1g indica le possibili vincite ottenibili con la scommessa. Invece, la
scommessa che paga 5 euro se si verica C nel secondo lancio e 2 in caso contrario
descritta dalla funzione g : ! R denita come g (T T ) = 2, g (CC) = 5, g (CT ) = 2
e g (T C) = 5.

Le funzioni f e g sono semplici esempi di variabili aleatorie, cio di funzioni a


valori reali denite su uno spazio di esiti che rappresentano i dierenti modi in cui
lincertezza si pu risolvere. La Sezione 8 approfondir questimportantissima nozione,
centrale nella modellizzazione dellincertezza. H

7.2.2 Scelte statiche


Poniamo che, come nella Sezione 2.4.2, i vettori in Rn+ abbiano il signicato di panieri
di beni. naturale pensare che il consumatore preferir alcuni panieri ad altri. Per
esempio, ragionevole ritenere che, se x > y (x pi abbondantedi y), x sia preferito
a y. In simboli, si scrive x % y, dove % la relazione di preferenza del consumatore
sui panieri.
In generale, si ipotizza che la preferenza % sui vari panieri di beni sia rappre-
sentabile da una funzione u : Rn+ ! R, detta funzione di utilit, tale che il paniere x
preferito a y se e solo se u (x) u (y), cio

x % y () u (x) u (y) (7.2)

In origine, intorno al 1870, i primi Marginalisti (in particolare Jevons, Menger e


Walras) interpretavano u (x) come il livello di benessere/soddisfazione prodotto dal
paniere x. Si dava quindi uninterpretazione siologica delle funzioni di utilit, che
6
Il simbolo per indicare gli esiti dei lanci comune nel calcolo delle probabilit, ove detto
insieme degli stati del mondo o spazio campionario.
152 CAPITOLO 7. FUNZIONI

quanticavano le emozioni che il consumatore provava nellavere dierenti panieri.


la cosiddetta interpretazione cardinalista delle funzioni di utilit che risale a Jeremy
Bentham (1748-1832) e al suo pain and pleasure calculus.7 In questo approccio le
funzioni di utilit, oltre a rappresentare la preferenza %, hanno un interesse intrinseco
di quanticazione di uno stato emotivo del consumatore, il suo grado di piacere indotto
dai panieri. Oltre al confronto u (x) u (y), anche lecito confrontare le dierenze

u (x) u (y) u (z) u (w)

che indicano che il paniere x pi intensamente preferito a y di quanto lo sia il paniere z


rispetto al paniere w. Inoltre, poich u (x) misura il grado di piacere che il consumatore
trae dal paniere x, nellinterpretazione cardinalista anche lecito confrontare queste
misure tra diversi consumatori, ossia fare confronti interpersonali di utilit.

Linterpretazione cardinalista entr in crisi a ne 800 per limpossibilit di misurare


in modo sperimentale i presunti aspetti siologici alla base delle funzioni di utilit8 .
Per questa ragione, con i lavori di inizio 900 di Vilfredo Pareto, sviluppati prima da
Slutsky nel 1915 e poi da Allen e Hicks negli anni Trenta9 , si aerma linterpretazione
ordinalista delle funzioni di utilit: pi modestamente si assume che esse siano solo
una mera rappresentazione numerica della preferenza % del consumatore. Secondo
tale interpretazione, ci che conta solo che lordinamento u (x) u (y) rappresenti la
prefenza per il paniere x rispetto a y, cio x % y ; non di interesse sapere se questo
rietta emozioni, pi o meno intense, del consumatore. In altri termini, nellapproccio
ordinalista la nozione fondamentale la preferenza %, mentre la funzione di utilit
ne una mera rappresentazione numerica. Non hanno pi signicato i confronti di
intensit (7.2) n i confronti interpersonali di utilit.
A livello sperimentale, la preferenza % del consumatore si rivela nelle scelte tra
panieri, molto pi semplici da osservare che emozioni o altri stati mentali.

Linterpretazione ordinalista si aermata come linterpretazione standard perch,


oltre al superiore contenuto empirico test menzionato, i lavori di Pareto mostrarono
come essa sia su ciente per sviluppare la Teoria del consumatore. Tuttavia, a livello
intuitivo molti economisti continuano a usare categorie cardinaliste per la loro plau-
sibilit introspettiva. Sia come sia, grazie alle funzioni di utilit possiamo arontare
il problema di un consumatore che deve scegliere un paniere in un assegnato insieme
A di Rn+ . Il consumatore sar guidato in tale scelta dalla propria funzione di utilit
u:A Rn+ ! R: u (x) u (y) indica che il consumatore preferisce il paniere x di
7
Si veda il suo Introduction to the Principles of Morals and Legislation, pubblicato nel 1789.
8
Intorno al 1901, cos il grande Henri Poincar scriveva a Walras: Posso dire che una sodisfazione
maggiore di unaltra, poich preferisco luna allaltra, ma non posso dire che la prima soddisfazione
due o tre volte pi grande dellaltra. Pur non disponendo di eccessive conoscenze economiche,
Poicar coglie con grande sensibilit il punto fondamentale.
9
Il lettore interessato allo sviluppo della Teoria dellutilit pu leggere G. J. Stigler, The
development of utility theory I, II, Journal of Political Economy, 58, 307-327 and 373-396, 1950.
7.2. APPLICAZIONI 153

beni al paniere y o che indierente tra i due. Limmagine Im u rappresenta tutti i


livelli di utilit ottenibili dal consumatore. Per esempio,
X
n
u (x) = xi
i=1

la funzione di utilit di un consumatore che ordina i panieri semplicemente secondo


la somma delle quantit dei beni che essi contengono. La classica funzione di utilit
Cobb-Douglas
Y
n
u (x) = xi i
i=1
Pn
con gli esponenti i > 0 tali che i=1 i = 1 (si veda lEsempio 75). Quando i = 1=n
per ogni i, si ha
! n1
Y
n
1 Y
n
u (x) = (xi ) =
n xi
i=1 i=1
secondo la quale i panieri sono ordinati secondo la radice n-esima del prodotto delle
quantit dei beni che contengono10 .
Tornando invece alla Sezione 2.4.2, consideriamo un produttore che debba decidere
la quantit di output da produrre. In tale decisione fondamentale la cosiddetta
funzione di produzione f : A Rn+ ! R. La funzione di produzione descrive quanto
output f (x) si ottiene partendo da un vettore x 2 Rn di input. Per esempio,
! n1
Yn
f (x) = xi
i=1

la funzione di produzione Cobb-Douglas in cui loutput pari alla radice n-esima del
prodotto degli input.

7.2.3 Scelte intertemporali


Come nella Sezione 2.4.3, si suppone dabitudine che il consumatore, sui possibili
proli x = (x1 ; x2 ; :::; xT ) intertemporali di consumo, abbia preferenze quanticate da
una funzione intertemporale di utilit U : A RT ! R. Per esempio, assumiamo che
il consumatore abbia una funzione di utilit ut : A R ! R, detta istantanea, per
il consumo xt di ogni periodo. In questo caso una possibile forma della funzione di
utilit intertemporale
X
T
T 1 t 1
U (x) = u1 (x1 ) + u2 (x2 ) + + uT (xT ) = ut (xt ) (7.3)
t=1
10
Si noti che, per unovvia propriet del prodotto, tutti i panieri con almeno una xi nulla hanno
utilit 0. Dal punto di vista economico, poco plausibile pensare che la nullit anche di una sola
componente di un paniere abbia conseguenze cos drastiche. Per questa ragione spesso si preferisce
denire la funzione Cobb-Douglas solo su Rn++ e cos faremo anche noi.
154 CAPITOLO 7. FUNZIONI

dove 2 (0; 1) un fattore soggettivo di sconto che dipende da quanto paziente


il consumatore. Quanto pi il consumatore paziente, ossia quanto pi disposto a
posporre il proprio consumo di una data quantit del bene, tanto pi alto il valore
di . Pi si avvicina a 1, pi ci si avvicina alla forma
X
T
U (x) = u1 (x1 ) + u2 (x2 ) + + uT (xT ) = ut (xt )
t=1

nella quale il consumo in ogni periodo valutato in modo paritetico. Al contrario, pi


si avvicina a 0, pi U (x) si avvicina a u1 (x1 ), ossia il consumatore estremamente
impaziente e non d quasi peso ai consumi futuri.

7.3 Propriet generali


7.3.1 Controimmagini e curve di livello
La nozione di controimmagine speculare a quella di immagine. Sia f : A ! B: dato
un punto y 2 B, la sua controimmagine, indicata con f 1 (y), linsieme
1
f (y) = fx 2 A : f (x) = yg

degli elementi del dominio che hanno y come immagine. Pi in generale, dato un
sottoinsieme D qualsiasi del codominio B, la sua controimmagine f 1 (D) linsieme
1
f (D) = fx 2 A : f (x) 2 Dg

degli elementi del dominio le cui immagini appartengono a D.


I prossimi esempi illustrano queste nozioni. Per brevit, considereremo come insie-
mi D solo intervalli e singoletti, ma analoghe considerazioni valgono per altri tipi di
insiemi.

Esempio 77 Consideriamo la funzione f : A ! B che a ogni essere umano associa


la data di nascita. Se y 2 B una possibile tale data, f 1 (y) linsieme degli esseri
umani che hanno y come data di nascita; in altre parole, gli esseri umani in f 1 (y)
sono coetanei. N

Esempio 78 Sia f : R ! R data da f (x) = x3 . Si ha Im f = R. Per ogni y 2 R si


ha n 1o
f 1 (y) = y 3
1
Per esempio, f (27) = 3. La controimmagine di un intervallo chiuso [a; b]
h 1 1i
f 1 ([a; b]) = a 3 ; b 3

Per esempio, f 1
([ 8; 27]) = [ 2; 3]. N
7.3. PROPRIET GENERALI 155

Esempio 79 Sia f : R ! R data da f (x) = x2 . Si ha Im f = R+ . La controimmagine


di ogni y 0
p p
f 1 (y) = f y; yg
mentre quella di ogni y < 0 f 1 (y) = ;. Per semplicit, indichiamo la controim-
magine di un intervallo aperto (a; b) come f 1 (a; b) in luogo di f 1 ((a; b)). Essa
8 p p p p
>
> b; a [ a; b se a 0
>
<
f 1 (a; b) = ; se b < 0
>
> p p
>
: b; b se a < 0 < b

Si osservi come nellultimo caso, quando a < 0; si abbia f 1 (a; b) = f 1 ([0; b)). Ci
dovuto al fatto che gli elementi tra a e 0 non hanno alcuna controimmagine. Per
esempio, se D = ( 1; 2), si ha

1
p p
f (D) = 2; 2

Si noti che
1 1 1
f (D) = f ([0; 2)) = f ( 1; 2)
ossia gli elementi negativi di D sono irrilevanti (poich non appartengono allimmagine
della funzione). N

Per una funzione f : A Rn ! R di pi variabili, con un appropriato termine


11
topograco , la controimmagine f 1 (k) spesso chiamato curva di livello di f in k (o
di quota k, con k 2 R). Tale terminologia, che esprime lidea che gli elementi di f 1 (k)
siano i punti del dominio nei quali la funzione raggiunge il livellok, particolarmente
calzante in parecchie applicazioni economiche, come vedremo tra breve. Le curve di
livello sono particolarmente utilizzate per le funzioni f : R2 ! R perch in tal caso se
ne pu dare una rappresentazione geometrica che pu rivelarsi illuminante.

Esempio 80 Sia f : R2 ! R data da f (x1 ; x2 ) = x21 + x22 . Per ogni k 0, la curva


di livello f 1 (k) il luogo dei punti di R2 di equazione

x21 + x22 = k
p
ossia la circonferenza di raggio k. Gracamente, le curve di livello si possono quindi
rappresentare come
11
Lespediente infatti lo stesso che conduce a rappresentare le montagne su una carta geograca
attraverso le cosiddette isoipse, cio le linee ideali che congiungono tra loro tutti i punti alla stessa
quota sul livello del mare. Per le funzioni di due variabili, il problema esattamente lo stesso: si pu
rappresentare una supercie in R3 attraverso le linee che congiungono i punti (x1 ; x2 ) per i quali la
funzione assume lo stesso valore k.
156 CAPITOLO 7. FUNZIONI

mentre il graco della funzione

Due diverse curve di livello di una stessa funzione non possono avere alcun punto
in comune, cio
f 1 (k1 ) \ f 1 (k2 ) = ; (7.4)
se k1 6= k2 . Infatti, se vi fosse un punto x 2 Rn che appartiene a entrambe le curve
di livelli k1 e k2 , sarebbe f (x) = k1 e f (x) = k2 con k1 6= k2 , ma ci vietato dal
concetto di funzione che impone che essa assuma un solo valore in ogni punto.
p
Esempio 81 Sia f : R2 ! R data da f (x1 ; x2 ) = 7x21 xp 2 . Per ogni k 0, la
1 2 2
curva di livello f (k) il luogo dei punti di R di equazione 7x1 x2 = k, ovvero
7.3. PROPRIET GENERALI 157

x2 = k 2 + 7x21 . Si tratta di una parabola che interseca lasse delle ordinate in k2.
Gracamente:

:
N
Esempio 82 La funzione f : R++ R ! R data da
s
x21 + x22
f (x1 ; x2 ) =
x1
denita soltanto per x1 > 0. Le sue curve di livello hanno equazioni
s
x21 + x22
= k cio x21 + x22 k 2 x1 = 0
x1
e quindi sono circonferenze, tutte passanti per lorigine e di centri (k 2 =2; 0), tutti
sullasse delle ascisse. Gracamente:

:
158 CAPITOLO 7. FUNZIONI

Si noti che, pur avendo tutte tali circonferenze lorigine come punto comune, le vere
curve di livello sono le circonferenze private dellorigine (perch in (0; 0) la funzione
non denita) e che esse non hanno alcun punto in comune. N
OfB. Ci limitiamo a funzioni di due variabili. La generica curva di livello di f ha
equazione
f (x1 ; x2 ) = k
Essa si pu riscrivere, in forma apparentemente pi complicata
y = f (x1 ; x2 )
y=k
ma tale riscrittura ben ne suggerisce il signicato geometrico:
(i) lequazione y = f (x1 ; x2 ) rappresenta una supercie in R3 ;
(ii) lequazione y = k rappresenta un piano orizzontale (contiene i punti (x1 ; x2 ; k) 2
R3 , cio tutti i punti di quotak);
(iii) il simbolo f geometricamente signica intersezione.
La curva di livello k appare allora come lintersezione tra la supercie rappresen-
tativa di f e un piano orizzontale.

Curva di livello di una supercie generica.

Dunque, alla buona, le varie curve di livello corrispondono a tagliare la supercie con
piani orizzontali (a vari livelli) e a rappresentare la forma delle fette cos ottenute
sul piano (x1 ; x2 ). H
7.3. PROPRIET GENERALI 159

Curve di indierenza
Vediamo una classica applicazione economica delle curve di livello. Data una funzione
di utilit u : A Rn+ ! R, le curve di livello
1
u (k) = fx 2 A : u (x) = kg

sono dette curve di indierenza. In altre parole, una curva di indierenza formata
da tutti i panieri x 2 Rn+ che hanno la stessa utilit k (e sono quindi indierenti per il
consumatore). Linsieme fu 1 (k) : k 2 Rg di tutte le curve di indierenza talvolta
chiamata mappa di indierenza.

Esempio 83 Consideriamo la semplice funzione di utilit Cobb-Douglas u : R2++ ! R


data da
1
u (x) = (x1 x2 ) 2
Per ogni k 0 si ha
n 1
o
1
u (k) = x 2 R2++ : (x1 x2 ) 2 = k = x 2 R2++ : x1 x2 = k 2
k2
= x 2 R2++ : x2 =
x1

Quindi, la curva di indierenza di livello k liperbole di equazione

k2
x2 =
x1
1
Al variare di k 0 otteniamo la mappa di indierenza fu (k)gk , cio:

8
y
7

6 k=3

5
k=2
4

2 k=1

0
O x
-1
0 0.5 1 1.5 2 2.5 3 3.5

N
160 CAPITOLO 7. FUNZIONI

Si noti come la propriet delle curve di indierenza di non intersecarsi non sia altro
che un caso speciale della propriet (7.4) valida per quasiasi famiglia di curve di livello.

Per una funzione di produzione f : A Rn+ ! R, le curve di livello


1
f (k) = fx 2 A : f (x) = kg

sono dette isoquanti. In altre parole, un isoquanto linsieme di tutti i vettori x 2


Rn+ di input che producono lo stesso output. Linsieme ff 1 (k) : k 2 Rg di tutti gli
isoquanti talvolta chiamato mappa degli isoquanti.
Inne, per una funzione di costo c : A R+ ! R, le curve di livello
1
c (k) = fx 2 A : c (x) = kg

sono dette isocosti. In altre parole, un isocosto linsieme di tutti i livelli di output
x 2 A che hanno lo stesso costo. Linsieme fc 1 (k) : k 2 Rg di tutti gli isocosti
talvolta chiamato mappa degli isocosti.

Curve di indierenza, isoquanti e isocosti sono tutti esempi di curve di livello, di


cui ereditano le propriet. Per esempio, il fatto che due curve di livello non abbiano
punti in comune la propriet (7.4) implica lanaloga classica propriet delle curve
di indierenza.

7.3.2 Algebra delle funzioni


Dati due insiemi A e B, indichiamo con B A linsieme di tutte le possibili funzioni
f : A ! B.12

Esempio 84 Nella sezione 7.2.1 linsieme R costituito da tutte le possibili scommesse


basate sul doppio lancio di una monetina. Ogni scommessa ha un prezzo che lo scom-
mettitore deve pagare per potervi partecipare. Ogni funzione F : R ! R rappresenta
un possibile sistema di prezzi per acquistare le scommesse relative al doppio lancio di
una monetina. Per esempio, siano f; g 2 R le due particolari scommesse viste nella
Sezione 7.2.1. Il prezzo loro assegnato dal sistema F di prezzi rispettivamente F (f )
e F (g). N

Dato un insieme A qualsiasi, consideriamo linsieme RA di tutte le possibili funzioni


f : A ! R a valori reali. In esso possiamo denire in modo naturale alcune operazioni
che associano a due funzioni qualsiasi in RA una nuova funzione ancora in RA .

Denizione 43 Date due funzioni qualsiasi f e g in RA , la funzione f +g lelemento


di RA per il quale
(f + g) (x) = f (x) + g (x) 8x 2 A:
12
Talvolta si usa la notazione A B invece di B A .
7.3. PROPRIET GENERALI 161

La funzione somma f + g : A ! R si costruisce quindi sommando, per ogni


elemento x del dominio A, le immagini f (x) e g (x) secondo le due funzioni. Siano,
per esempio, f e g le due scommesse della Sezione 7.2.1: la funzione somma f + g :
! R descrive la vincita complessiva di uno scommettitore che partecipa a entrambe
le scommesse. Per esempio, se lesito del lancio due volte testa, lo scommettitore
vincer (f + g) (T T ) = f (T T ) + g (T T ) = 1 + 2 = 3.

Esempio 85 Sia RR linsieme di tutte le funzioni f : R ! R. In particolare, consideri-


amo f (x) = x e g (x) = x2 . La funzione somma f +g denita da (f + g) (x) = x+x2 .
N

In modo analogo si deniscono:

(i) la funzione dierenza (f g) (x) = f (x) g (x) per ogni x 2 A;

(ii) la funzione prodotto (f g) (x) = f (x) g (x) per ogni x 2 A;

(iii) la funzione rapporto (f =g) (x) = f (x) =g (x) per ogni x 2 A, purch g (x) 6= 0.

Abbiamo introdotto quattro operazioni nellinsieme RA , basate sulle quattro op-


erazioni fondamentali sui reali. facile vedere che queste operazioni godono di pro-
priet analoghe a quelle delle operazioni fondamentali. Per esempio, la somma
commutativa, ossia f + g = g + f , e associativa, ossia (f + g) + h = f + (g + h).

NB. (i) Nella Denizione 43 e in quella delle altre operazioni le funzioni


p devono condi-
2
vidano lo stesso dominio A. Per esempio, se f (x) = x e g (x) = x, la somma f + g
priva di senso perch, per x < 0, la funzione g non denita. (ii) Il dominio A un
insieme qualunque: numeri, sedie o altro. Invece, essenziale che il codominio sia R
perch tra numeri reali che sappiamo svolgere le quattro operazioni fondamentali. O

7.3.3 Composizione
Consideriamo due funzioni f : A ! B e g : C ! D, con Im f C. Prendiamo un
punto qualsiasi x 2 A. Poich Im f C, limmagine f (x) appartiene al dominio C
della funzione g. Possiamo applicare la funzione g allimmagine f (x), ottenendo in
tal modo lelemento g (f (x)) di D. Infatti, la funzione g ha come proprio argomento
limmagine f (x) di x.
Abbiamo quindi associato a ogni elemento x dellinsieme A lelemento g (f (x))
dellinsieme D. Tale regola, detta di composizione, denisce tramite le funzioni f e g
una nuova funzione da A in D, indicata con g f . Formalmente:

Denizione 44 Siano A, B, C e D quattro insiemi qualsiasi e f : A ! B e g : C !


D due funzioni. Se Im f C, la funzione composta g f : A ! D denita da

(g f ) (x) = g (f (x)) 8x 2 A:
162 CAPITOLO 7. FUNZIONI

Si noti la condizione di incastro Im f C senza la quale la composizione non


possibile. Illustriamo la composizione con alcuni esempi.

Esempio 86 Siano f; g 2 RR date da f (x) = x2 e g (x) = x + 1. In questo caso A =


B = C = D = R, e la condizione di incastro banalmente soddisfatta. Consideriamo
g f . Dato x 2 R, risulta f (x) = x2 . La funzione g ha quindi come proprio argomento
x2 , sicch
g (f (x)) = g x2 = x2 + 1.
Ne segue che la funzione composta g f : R ! R data da (g f ) (x) = x2 + 1.
Consideriamo invece f g. Dato x 2 R, risulta g (x) = x + 1. La funzione f ha
quindi come proprio argomento x + 1, da cui

f (g (x)) = f (x + 1) = (x + 1)2 .

La funzione composta f g : R ! R dunque data da (f g) (x) = (x + 1)2 . N


p
Esempio 87 Consideriamo f : R+ ! R data da f (x) = x e g : R ! R data da
g (x) = x 1. In questo caso B = C = D = R e A = R+ . La condizione di incastro
soddisfatta per g f perch Im f = R+ R, ma non lo per f g perch Im g = R
non inclusa in R+ , che il dominio di f .
p
Consideriamo g pf . Dato x 2 R, si ha f (x) = x. La funzione g ha quindi come
proprio argomento x, da cui
p p
g (f (x)) = g x = x 1.
p
La funzione composta g f : R+ ! R data da (g f ) (x) = x 1. N

Esempio 88 Se nellesempio precedente consideriamo g~ : [1; +1) ! R data da


g~ (x) = x 1, la condizione di incastrop soddisfatta per f g~. In particolare,
f g~ : [1; +1) ! R data da x 1. Come vedremo tra breve nella Sezione
7.6, la funzione g~ la restrizione di g su [1; +1). N

Esempio 89 Sia A linsieme dei cittadini italiani e f : A ! R la funzione che a


ognuno associa il suo reddito per questanno e g : R ! R la funzione che a ogni
possibile reddito associa limposta dovuta. La funzione composta g f : A ! R fa
corrispondere a ogni italiano limposta da egli dovuta. Agli u ci tributari (e anche ai
cittadini) interessa, e molto, tale funzione composta. N

7.4 Classi di funzioni


In questa sezione introduciamo alcune importanti classi di funzioni.
7.4. CLASSI DI FUNZIONI 163

7.4.1 Funzioni iniettive, suriettive e biiettive


Dati due insiemi A e B qualsiasi, una funzione f : A ! B si dice iniettiva se
x 6= y =) f (x) 6= f (y) ; 8x; y 2 A; (7.5)
ossia se a elementi diversi del dominio f associa elementi diversi del codominio.

1.6

A B
1.4
a
1
1.2 b
1
b
3
1 a b
2 2

0.8

0.6

0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

Funzione iniettiva da A in B

Un semplice esempio di funzione iniettiva f (x) = x3 . Infatti, due reali distinti


hanno sempre cubi distinti, ossia x 6= y implica x3 6= y 3 per ogni x; y 2 R. Un classico
esempio di funzione non iniettiva f (x) = x2 : per esempio, ai due punti distinti 2 e
2 di R corrisponde il medesimo quadrato, ossia f (2) = f ( 2) = 4.
Si noti che la (7.5) equivalente alla contronominale13 :
f (x) = f (y) =) x = y 8x; y 2 A
che richiede che due elementi del dominio che condividono la stessa immagine siano
uguali.

Dati due insiemi qualsiasi A e B, una funzione f : A ! B si dice suriettiva se


Im f = B;
ossia se per ogni elemento y di B esiste un elemento x di A tale che f (x) = y. In
altre parole, una funzione suriettiva se ogni elemento del codominio immagine di
almeno un punto del dominio.
13
Date due propriet p e q, si ha p =) q se e solo se :q =) :p (: sta per non). Limplicazione
:q =) :p la contronominale dellimplicazione originaria p =) q. Si veda lAppendice B.
164 CAPITOLO 7. FUNZIONI

Esempio 90 La funzione f : R ! R data da f (x) = x3 suriettiva poich ogni


1 1
y 2 R immagine di y 3 2 R, ossia f y 3 = y. Daltra parte, la funzione f : R ! R
data da f (x) = x2 non suriettiva poich nessun y < 0 immagine di alcun punto
del dominio. N

Ricordando quanto sera detto sui codomini, si pu notare che una funzione f :
A ! B si pu sempre scrivere come f : A ! Im f , che ovviamente suriettiva (basta
prendere B = Im f ). Per esempio, se scriviamo la parabola x2 come f : R ! R+ essa
diventa suriettiva. Quindi, scegliendo in modo opportuno il codominio, ogni funzione
diventa suriettiva. Ci per non signica che la suriettivit sia una nozione priva di
interesse: come si vedr, spesso infatti linsieme B ssato (per varie ragioni) a priori
ed importante distinguere le funzioni che hanno B come immagine, ossia le suriettive,
da quelle la cui immagine solo contenuta in B.

Inne, dati due insiemi qualsiasi A e B, una funzione f : A ! B si dice biiettiva


o biunivoca se sia iniettiva sia suriettiva. In questo caso, si pu andare avanti e
indietrotra gli insiemi A e B usando la funzione f : da qualsiasi x 2 A si passa a un
unico y = f (x) 2 B, mentre da qualsiasi y 2 B si torna a un unico x 2 A tale che
y = f (x).

1.6

A B
1.4
a b
1 1
1.2

1 a b
2 2

0.8
a b
3 3

0.6

0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

Per esempio, la f : R ! R data da f (x) = x3 biiettiva. Nel caso di insiemi niti


abbiamo il seguente semplice, ma interessante, risultato ove jAj indica la cardinalit
di un insieme nito A, ossia il numero di elementi che lo compongono.

Proposizione 75 Siano A e B due qualsiasi insiemi niti. Esiste una biiezione f :


A ! B se e solo se jAj = jBj.

Dim. Se. Poniamo jAj = jBj = n e scriviamo A = fa1 ; a2 ; : : : ; an g e B =


fb1 ; b2 ; : : : ; bn g. Una biiezione f : A ! B denita come f (ai ) = bi per i = 1; 2; ; n.
7.4. CLASSI DI FUNZIONI 165

Solo se. Sia f : A ! B una biiezione. Per la iniettivit si ha jAj jBj. Infatti,
a ogni x 2 A corrisponde un diverso f (x) 2 B. Daltra parte, per la suriettivit si ha
jBj jAj. Infatti, per ogni y 2 B si ponga C (y) = fx 2 A : f (x) = yg. Se y1 6= y2
si ha C (y1 ) \ C (y2 ) = ;. Quindi, posto C = fC (y) : y 2 Bg, si ha jBj = jCj. Ma,
facile vedere che jCj jAj, da cui jBj jAj. In conclusione, si ha jAj = jBj.

Come vedremo nella Sezione 7.7, parafrasando una celebre battuta di David Hilbert,
questo risultato la porta del paradiso di Cantor.

7.4.2 Funzioni inverse


Dati due insiemi qualsiasi A e B, sia f : A ! B una funzione iniettiva. In tal caso, a
ogni elemento f (x) dellimmagine Im f corrisponde un unico elemento x 2 A tale che
f (x) = y. La funzione cos determinata detta funzione inversa di f . Formalmente:

Denizione 45 Sia f : A ! B una funzione iniettiva. La funzione f 1 : Im f ! A


denita da f 1 (y) = x se e solo se f (x) = y detta funzione inversa di f .

Si ha quindi
1
f (f (x)) = x 8x 2 A (7.6)
e
1
f f (y) = y 8y 2 Im f (7.7)
Le funzioni inverse eettuano il percorso inverso delle originarie: da x 2 A si arriva a
f (x) 2 B, e si torna indietro con f 1 (f (x)) = x.

1.6

A B
1.4

1.2

f
1 x y
-1
f
0.8

0.6

0.4
0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

Ha senso parlare di inversa solo per funzione iniettive. In particolare, quando la


funzione f anche suriettiva, ed quindi biiettiva, si ha f 1 : B ! A. In tal caso il
dominio dellinversa lintero codominio di f .
166 CAPITOLO 7. FUNZIONI

Esempio 91 (i) Sia f : R ! R la funzione biiettiva f (x) = x3 . Da y = x3 segue


1 1
x = y 3 . Linversa f 1 : R ! R data da f 1 (y) = y 3 , ovvero, vista lirrilevanza del
1
nome della variabile indipendente, f 1 (x) = x 3 .
(ii) Sia f : R ! R la funzione biiettiva f (x) = 3x . Da y = 3x segue x = log3 y.
Linversa f 1 : R ! R data da f 1 (y) = log3 y, ovvero f 1 (x) = log3 x. N

Esempio 92 Sia f : R ! R data da


8 x
< se x < 0
f (x) = 2 :
: 3x se x 0

Da y = x=2 segue x = 2y, mentre da y = 3x segue x = y=3. Quindi,


8
< 2y se y < 0
f 1 (y) = y :
: se y 0
3
N

Esempio 93 Sia f : R f0g ! R data da f (x) = 1=x. Da y = 1=x segue che


x = 1=y, e quindi f 1 : R f0g ! R data da f 1 (y) = 1=y. In questo caso f = f 1 .
Si noti come R f0g sia il dominio di f 1 sia limmagine di f N

Esempio 94 La funzione f : R ! R denita da


(
x se x 2 Q
f (x) =
x se x 2
=Q

pur orribile, iniettiva (e suriettiva) e quindi invertibile. N


1
facile rendersi conto che, quando esiste, linversa (g f ) della funzione com-
posta g f
f 1 g 1 (7.8)
cio la composta delle inverse, ma scambiate di posto: infatti da y = g (f (x)) si ricava
g 1 (y) = f (x) e nalmente f 1 (g 1 (y)) = x.

OfB. Nel vestirsi, prima ci si mettono le mutande (f ) e poi i pantaloni (g); nello
spogliarsi, prima ci si tolgono i pantaloni (g 1 ) e poi le mutande (f 1 ). H

OfB. Il graco della funzione f 1 lo stesso di f , una volta che si siano risistemati
gli assi cartesiani. La maniera pi semplice di vederlo di tracciare il graco di f su
un foglio di carta poco spessa, guardarlo in controluce dopo aver rotato gli assi di 900
in modo da scambiare ascisse e ordinate: ci che appare il graco di f 1 .
7.4. CLASSI DI FUNZIONI 167

5 5

y y
4 4

3 3

2 2

1 1

0 0
x x
O O
-1 -1

-2 -2
-3 -2 -1 0 1 2 3 4 -3 -2 -1 0 1 2 3 4

p 1
Funzione y = f (x) = 3
x Funzione x = f (y) = y 3

7.4.3 Funzioni limitate


Sia f : A ! R una funzione con dominio A qualsiasi e codominio la retta reale. Essa
si dice:

(i) superiormente limitata se la sua immagine Im f un insieme superiormente


limitato in R, ossia se esiste k 2 R tale che f (x) k per ogni x 2 A;

(ii) inferiormente limitata se la sua immagine Im f un insieme inferiormente limi-


tato in R, ossia se esiste k 2 R tale che f (x) k per ogni x 2 A;

(iii) limitata se sia superiormente sia inferiormente limitata.

Per esempio, la funzione f : R f0g ! R data da


1
f (x) =
jxj

inferiormente, ma non superiormente, limitata poich f (x) 0 per ogni x 2 R, men-


tre la funzione f : R ! R data da f (x) = x2 superiormente, ma non inferiormente,
limitata poich f (x) 0 per ogni x 2 R.
Il prossimo lemma ci d una semplice, ma molto utile, condizione di limitatezza.

Lemma 76 Una funzione f : A ! R limitata se e solo se se esiste k > 0 tale che

jf (x)j k 8x 2 A: (7.9)
168 CAPITOLO 7. FUNZIONI

Dim. Se f limitata, esistono k 0 ; k 00 2 R tale che k 0 f (x) k 00 . Sia k > 0 tale che
k k0 k 00 k. Ne segue che vale la (7.9). Viceversa, supponiamo che valga la
(7.9). Grazie alla (4.1), che vale anche per la , si ha k f (x) k, il che implica
che f limitata sia superiormente sia inferiormente.

La funzione denita da
8
>
< 1 se x 1
f (x) = 0 se 0 < x < 1
>
: 2 se x 0

limitata poich jf (x)j 2 per ogni x 2 R.

Abbiamo quindi una prima tassonomia delle funzioni a valori reali f : A ! R,


ossia degli elementi dello spazio14 RA . Si noti che tale tassonomia non esaustiva,
ossia esistono funzioni che non soddisfanno alcuna delle condizioni (i)-(iii): il caso,
per esempio, di f (x) = x.

7.4.4 Funzioni monotone


Introduciamo ora unimportante classe di funzioni f : A Rn ! R, ossia funzioni a
valori reali il cui dominio A un sottoinsieme di Rn .

Funzioni monotone su R
Cominciamo col caso n = 1, che di particolare importanza. Nel dettaglio

Denizione 46 Una funzione f : A R ! R si dice:

(i) crescente se
x > y ) f (x) f (y) x; y 2 A; (7.10)
strettamente crescente se

x > y ) f (x) > f (y) 8x; y 2 A; (7.11)

(ii) decrescente se
x > y ) f (x) f (y) 8x; y 2 A; (7.12)
strettamente decrescente se

x > y ) f (x) < f (y) 8x; y 2 A;


14
Si noti luso del termine spazio per indicare un insieme di riferimento (in questo caso linsieme di
tutte le funzioni di RA ).
7.4. CLASSI DI FUNZIONI 169

(iii) costante se esiste k 2 R tale che

f (x) = k 8x 2 A:

Si noti che una funzione costante se e solo se sia crescente sia decrescente.
In altre parole, la costanza equivale alla compresenza di entrambe le propriet di
monotonia. per questa ragione che abbiamo introdotto la costanza tra le forme
di monotonia. A breve vedremo che nel caso vettoriale la relazione tra costanza e
monotonia un popi sottile.

Le funzioni crescenti o decrescenti sono dette genericamente monotone. La stretta


monotonia si ha quindi qualora la disuguaglianza tra le immagini f (x) e f (y) stretta
per tutti i punti x 6= y del dominio. In altre parole, la stretta monotonia esclude la
possibilit che la funzione abbia tratti di costanza. Formalmente:

Proposizione 77 Una funzione f : A R ! R crescente strettamente crescente


se e solo se
f (x) = f (y) ) x = y 8x; y 2 A (7.13)
ossia se e solo se iniettiva.

Un analogo risultato vale per la stretta decrescenza. Le funzioni strettamente


monotone sono dunque iniettive, e quindi invertibili.

Dim. Solo se. Sia f strettamente crescente e sia f (x) = f (y). Supponiamo, per
contraddizione, che x 6= y: x > y oppure y < x. In entrambi casi, per la (7.11), si ha
f (x) 6= f (y), il che contraddice f (x) = f (y). Ne segue che x = y, come desiderato.
Se. Supponiamo valga la propriet (7.13). Sia f crescente. Mostriamo che lo
anche strettamente. Sia x > y. Per la crescenza, si ha f (x) f (y) ma non pu aversi
f (x) = f (y) perch dalla (7.13) seguirebbe x = y. Si ha quindi f (x) > f (y) come
desiderato.

Esempio 95 Le funzioni f : R ! R date da f (x) = x e f (x) = x3 sono strettamente


crescenti, mentre la funzione

x se x 0
f (x) =
0 se x < 0

crescente, ma non strettamente, poich costante per ogni x < 0. Lo stesso vale per
la funzione denita da
8
< x 1 se x 1
f (x) = 0 se 1<x<1 (7.14)
:
x+1 se x 1

che ha un tratto di costanza in [ 1; 1]. N


170 CAPITOLO 7. FUNZIONI

Si noti che nella (7.10) possiamo sostituire x > y con x y senza alcuna con-
seguenza poich si ha f (x) = f (y) se x = y. Quindi, la crescenza equivale a

x y ) f (x) f (y) (7.15)

Consideriamo limplicazione inversa,

f (x) f (y) ) x y (7.16)

che richiede che a maggiori valori dellimmagine corrispondano maggiori valori dellar-
gomento. Si osservi che ovviamente f (x) = f (y) equivale ad avere sia f (x) f (y)
sia f (y) f (x), che a loro volta, grazie alla (7.16), implicano x y e y x, ossia
x = y. Quindi, dalla (7.16) segue che

f (x) = f (y) ) x = y (7.17)

Alla luce della Proposizione 77, concludiamo che una funzione crescente che soddis-
fa anche limplicazione inversa (7.16) strettamente crescente. Il prossimo risultato
mostra che vero anche il converso, stabilendo cos uninteressante caratterizzazione
della stretta crescenza; lanalogo risultato vale per la stretta decrescenza.

Proposizione 78 Una funzione f : A R ! R strettamente crescente se e solo se

x y () f (x) f (y) 8x; y 2 A (7.18)

Dim. Grazie a quanto visto sopra, resta da dimostrare il Solo se, ossia che una
funzione strettamente crescente soddisfa la propriet (7.18). Poich una funzione
strettamente crescente crescente, limplicazione

x y ) f (x) f (y)

ovvia. Per mostrare la (7.18) resta da mostrare che

f (x) f (y) ) x y

Sia f (x) f (y) e supponiamo, per contraddizione, che x < y. La stretta crescenza
implica f (x) < f (y), il che contraddice f (x) f (y). Si ha quindi x y, come
desiderato.

Funzioni monotone su Rn
Le nozioni di monotonia viste nel caso n = 1 si generalizzano in modo naturale al caso
di n qualsiasi, ma con alcuni aspetti delicati legati alle due peculiarit del caso n 2,
ossia lincompletezza di e la presenza di due nozioni di disuguaglianza stretta: > e
. Per brevit, consideriamo la monotonia crescente (nozioni analoghe valgono per
la decrescente). La nozione di crescenza si estende in modo ovvio.
7.4. CLASSI DI FUNZIONI 171

Una funzione f : A Rn ! R si dice crescente se


x y ) f (x) f (y) 8x; y 2 A (7.19)
Si noti che la nozione non richiede nulla a vettori x e y non confrontabili, quali per
esempio (1; 2) e (2; 1) in R2 . Analogamente si d il concetto di funzione decrescente.
Ancora, f costante se esiste k 2 R tale che
f (x) = k 8x 2 A
Pi delicata lestensione in Rn della stretta monotonia visto che abbiamo due
distinti concetti di disuguaglianza stretta. Una funzione f : A Rn ! R si dice
strettamente crescente se
x > y ) f (x) > f (y) 8x; y 2 A
e fortemente crescente se crescente e
x y ) f (x) > f (y) 8x; y 2 A (7.20)
Si ha una semplice gerarchia tra queste nozioni:

Proposizione 79 Per una funzione f : A Rn ! R si ha:


stretta crescenza ) forte crescenza ) crescenza (7.21)

Si tratta quindi di nozioni di monotonia via via pi forti. Nelle applicazioni si


dovr scegliere la forma che pi pertinente per il problema studiato15 .

Dim. Una funzione fortemente crescente , per denizione, crescente. Rimane da


mostrare che la stretta crescenza implica la forte crescenza. Sia quindi f strettamente
crescente. Occorre mostrare che f crescente e soddisfa la (7.20). Se x y, si
ha x = y oppure x > y. Nel primo caso si ha f (x) = f (y). Nel secondo caso si
ha f (x) > f (y) e quindi f (x) f (y). La funzione quindi crescente. Inoltre, se
x y, a fortiori si ha x > y, e quindi f (x) > f (y). La funzione f quindi fortemente
crescente.

I conversi delle precedenti implicazioni non valgono. Una funzione crescente con
tratti di costanza un esempio di funzione crescente ma non fortemente. Quindi
crescenza ; forte crescenza
Inoltre, il prossimo esempio mostra che esistono funzioni fortemente crescenti ma non
strettamente crescenti, cio
forte crescenza ; stretta crescenza
15
Le nozioni di monotonia per funzioni di pi variabili studiate sono componente per componente,
cio si basano sul confronto delle componenti dei vettori che sono argomento delle funzioni. Nella
Sezione 22.2 vedremo brevemente unaltra nozione di monotonia per funzioni di pi variabili.
172 CAPITOLO 7. FUNZIONI

Esempio 96 La funzione di Leontief f : R2 ! R data da


f (x) = min fx1 ; x2 g
fortemente crescente ma non strettamente. Per esempio, x = (1; 2) e y = (1; 1) sono
tali che x > y ma f (x) = f (y) = 1. N
NB. Per le applicazioni f : Rn ! Rm con m > 1 le nozioni di monotonia viste nel caso
m = 1 assumono un signicato diverso, che per brevit non investigheremo, perch
le immagini f (x) e f (y) possono non essere confrontabili, nel qual caso non si ha n
f (x) f (y) n f (y) f (x). Per esempio, se f : R2 ! R2 tale che f (0; 1) = (1; 2)
e f (3; 4) = (2; 1), le immagini (1; 2) e (2; 1) non sono confrontabili. Lasciamo a corsi
successivi lo studio di nozioni di monotonia per applicazioni f : Rn ! Rm con m > 1.
O

Funzioni di utilit
Sia u : A ! R una funzione di utilit denita su un opportuno insieme A di panieri di
beni (in genere, A Rn+ come nella Sezione 2.4.2). Una sua trasformazione f u : A !
R, dove f : Im u R ! R, denisce unaltra funzione di utilit di stesso signicato
purch
u (x) u (y) () (f u) (x) (f u) (y) x; y 2 A (7.22)
In altri termini, la funzione f u ordina i beni allo stesso modo di u, cio
x % y () (f u) (x) (f u) (y) x; y 2 A
Per la Proposizione 78, f soddisfa la (7.22) se e solo se strettamente crescente.
Quindi, una trasformazione f u a sua volta una funzione di utilit se e solo se f
strettamente crescente. Per descrivere tale fondamentale propriet di invarianza delle
funzioni di utilit si dice che esse sono ordinali, cio uniche a meno di trasformazioni
monotone (strettamente crescenti). Si tratta di una propriet che sta alla base del-
lapproccio ordinalista, in cui le funzioni di utilit sono una mera rappresentazione
numerica della preferenza %, che la nozione fondamentale (si ricordi la discussione
nella Sezione 7.2.2).
Esempio 97 Consideriamo la funzione di utilit Cobb-Douglas u : Rn++ ! R data da
Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1
Pn
con ogni i 0e i=1 i = 1. Prendendo f (x) = log x, la trasformazione
X
n
f u= i log xi
i=1

una funzione di utilit equivalente a u. la versione logaritmica della funzione


Cobb-Douglas, spesso detta funzione di utilit log-lineare. N
7.4. CLASSI DI FUNZIONI 173

Le tre nozioni di monotonia su Rn (crescenza, forte crescenza e stretta crescenza)


sono molto importanti per le funzioni di utilit u : A Rn+ ! R. Siccome il loro
argomento x un paniere di beni, naturale assumere che il consumatore preferisca
vettori con quantit maggiori dei vari beni, cio pi meglio. A seconda di come si
declina tale motto, una delle tre forme di monotonia diventa appropriata.
Se in un vettore x 2 Rn ogni componente, ossia ogni tipo di bene, visto dal
consumatore come importante, naturale assumere che u sia strettamente crescente:
x > y ) u (x) > u (y) 8x; y 2 A
In questo caso su ciente incrementare la quantit di uno qualunque dei beni per
avere una maggiore utilit: pi di un bene qualsiasi, sempre meglio.
Se invece vogliamo contemplare la possibilit che qualche bene possa in realt essere
inutile per il consumatore, possiamo solo chiedere la crescenza di u:
x y ) u (x) u (y) 8x; y 2 A (7.23)
Infatti, se un bene inutile (come il vino per un astemio, oppure per un ubriaco,
che ne gi sazio), la disuguaglianza x y pu essere determinata proprio da una sua
maggior quantit, restando invariate tutte le altre; ragionevole allora che u (x) = u (y)
perch il consumatore non trae alcun benecio nel passare da y a x. In questo caso
pi di un qualsiasi bene, pu essere meglio o indierente.
Inne, il pi di un qualsiasi bene, sempre megliodella stretta monotonia si pu
indebolire nel senso della forte monotonia assumendo che pi di tutti i beni, sempre
meglio, cio
x y ) u (x) > u (y) 8x; y 2 A
In questo caso, si ha un miglioramento solo quando le quantit di tutti i beni aumen-
tano, non basta laumento della quantit di un solo bene. Tale forma di monotonia
riette una forma di complementarit tra i beni, per cui laumento delle quantit di
solo alcuni di essi pu rivelarsi superuo per il consumatore se rimangono invariate
le quantit di altri beni. Il caso estremo si ha con la perfetta complementarit alla
Leontief, di cui il classico esempio sono le coppie di scarpe, destra e sinistra16 .
Esempio 98 (i) La funzione di utilit Cobb-Douglas u : Rn++ ! R data da
Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1

strettamente crescente. Per la (7.21), anche fortemente crescente e crescente.


(ii) La funzione di utilit Leontief u : Rn++ ! R data da
u (x1 ; x2 ; ; xn ) = min fx1 ; :::; xn g
in cui i beni sono perfetti complementi, fortemente crescente. Per la (7.21), anche
crescente. Come s gi visto nellEsempio 96 non strettamente crescente. N
16
Einutile aumentare il numero delle scarpe destre senza aumentare in egual misura quello delle
scarpe sinistre (e viceversa).
174 CAPITOLO 7. FUNZIONI

Si osservi che consumatori con funzioni di utilit strettamente monotone oppure


fortemente monotone sono insaziabili perch incrementando in modo opportuno i
panieri si aumenta sempre la loro utilit. Tale propriet delle funzioni di utilit
talvolta chiamata non saziet, ed essa quindi comune sia alla stretta sia alla forte
monotonia. Lunica forma di monotonia che possa contemplare la possibilit di saziet
la crescenza (7.23): come osservato per il consumatore ubriaco, questa forma pi
debole di monotonia permette che un dato bene, quando supera un certo livello, non
determina pi ulteriori aumenti di utilit. Non pu invece accadere che lutilit scenda:
la (7.23) permetta che essa salga o rimanga costante, ma non che scenda. Quindi, se
un ulteriore bicchiere di vino determina un decremento dellutilit del consumatore
ubriaco, ci non modellabile con alcuna forma di crescenza, per quanto debole.

Costanza e monotonia
Oltre alla stretta monotonia, anche la relazione tra costanza e monotonia pi delicata
nel caso vettoriale che in quello scalare. Infatti, mentre anche nel caso vettoriale una
funzione costante sia crescente sia decrescente, il converso, che era banalmente vero
in R, diventa problematico a causa della possibile non confrontabilit di vettori in Rn .
Esempio 99 Sia A = fx 2 R2 : x1 + x2 = 0g il luogo dei punti della retta:

Tutti i punti su questa retta non sono tra loro confrontabili, sicch le denizioni di
crescenza e descrenza sono soddisfatte, pur se in modo vacuo, da tutte le funzioni
f : A R2 ! R. Tra esse, per esempio la funzione f (x) = x1 x2 non costante pur
essendo sia crescente sia decrescente. N
Per ristabilire il legame tra costanza e monotonia vista nel caso scalare occorre
considerare insiemi A che abbiamo la seguente propriet (o sue varianti).
Denizione 47 Un insieme A in Rn si dice direzionato ( per ) se per ogni x; y 2 A
esiste z 2 A tale che z x e z y.
7.4. CLASSI DI FUNZIONI 175

In altre parole, un insieme direzionato quando ogni coppia di suoi elementi ha un


minorante comune che appartiene allinsieme. una semplice propriet soddisfatta,
per esempio, da Rn , Rn+ , nonch dagli intervalli [a; b], (a; b), (a; b] e [a; b) di Rn visti
nella Sezione 2.3.

Proposizione 80 Una funzione f : A Rn ! R denita su un insieme direzionato


A costante se e solo se sia crescente sia decrescente.

Dim. Mostriamo il Se, essendo banale il converso. Sia f crescente e decrescente.


Vogliamo mostrare che costante. Siano x e y due elementi di A. Per ipotesi, esiste
z 2 A tale che z xez y, e quindi f (z) = f (x) e f (z) = f (y). Da ci segue
f (x) = f (y), come desiderato.

Il lettore pu vericare che questo risultato continua a valere se A direzionato


per , cio se se per ogni x; y 2 A esiste z 2 A tale che z x e z y.

7.4.5 Funzioni separabili


In Economia sono molto importanti le funzioni di pi variabili separabili, cio denibili
come somme di funzioni scalari.

Denizione 48 Una funzione f : A Rn ! R, con n 2, si dice separabile se


esistono n funzioni scalari gi : A R ! R tali che

X
n
f (x) = gi (xi ) 8x = (x1 ; :::; xn ) 2 A
i=1

La ragione dellimportanza di tale classe di funzioni


Pn di pi variabili nella sua
grande trattabilit. Lesempio pi banale f (x) = i=1 xi , per la quale le funzioni
gi sono lidentit: gi (x) = x. Vediamo alcuni altri esempi.

Esempio 100 La funzione f : R2 ! R data da

f (x) = x21 + 4x2 8x = (x1 ; x2 ) 2 R2

separabile con g1 (x1 ) = x21 e g2 (x2 ) = 4x2 . N

Esempio 101 La funzione f : Rn++ ! R, detta entropia, data da

X
n
f (x) = xi log xi 8x = (x1 ; :::; xn ) 2 Rn++
i=1

separabile con gi (xi ) = xi log xi . N


176 CAPITOLO 7. FUNZIONI

Esempio 102 La funzione di utilit intertemporale (7.3), cio

X
T
t 1
U (x) = ut (xt )
t=1

separabile con gt (xt ) = t


ut (xt ). N

Esempio 103 Anche nel caso statico le funzione di utilit separabili sono molto
importanti. Le funzioni di utilit usate dai primi Marginalisti erano infatti della forma
X
n
u (x) = ui (xi )
i=1

In altri termini, si assumeva che lutilit (intesa cardinalmente) di un paniere x fosse


scomponibile nellutilit delle quantit xi dei vari beni che lo compongono. unas-
sunzione restrittiva che ignora ogni possibile interdipendenza, per esempio di comple-
mentarit o sostituibilit, tra i diversi beni. A ragione della sua notevole trattabilit,
per lungo tempo rimase per la forma usuale delle funzioni di utilit nch, a ne
Ottocento, i lavori di Edgeworth e Pareto mostrarono come sviluppare la Teoria del
consumatore per funzioni di utilit non necessariamente separabili. N

Esempio 104 La trasformazione logaritmica


X
n
log u (x) = i log xi
i=1

della funzione di utilit Cobb-Douglas separabile. Lesempio mostra che talvolta


possibile ottenere versioni separabili di funzioni di utilit grazie a loro trasformazioni
strettamente monotone. Di solito, queste versioni separabili sono le pi comode dal
punto di vista analitico (cos , per esempio, il caso per questa versione separabile
della funzione Cobb-Douglas, la cosiddetta funzione di utilit log-lineare, pi comoda
da manipolare rispetto alla versione prodotto). N

7.5 Funzioni elementari su R


7.5.1 Polinomi
Un polinomio f (x) di grado n 1 ha la forma f (x) = a0 + a1 x + + an xn , con
ai 2 R per ogni 0 i n e an 6= 0. Sia Pn linsieme di tutti i polinomi di grado
minore o uguale ad n. Naturalmente,

P1 P2 Pn :

Esempio 105 Si ha f (x) = x + x2 2 P2 , mentre f (x) = 3x 10x4 2 P4 . N


7.5. FUNZIONI ELEMENTARI SU R 177

Esempio 106 Un polinomio f ha grado zero quando esiste a 2 R tale che f (x) = a
per ogni x. Le funzioni costanti si possono quindi intendere come polinomi di grado
zero. N

[
Linsieme di tutti di polinomi, di ogni grado, si indica con P, cio P = Pn .
n 0

7.5.2 Funzioni esponenziali e logaritmiche


Dato a > 0, la funzione f : R ! R denita come

f (x) = ax

si dice funzione esponenziale di base a.


Nel seguito utilizzeremo sistematicamente il numero e come base e chiameremo
f (x) = ex funzione esponenziale, senza ulteriori specicazioni. Talvolta essa si indica
come f (x) = exp x. Grazie alle propriet della potenza ex , la funzione esponenziale
ha una parte di primo piano in moltissimi campi dellAnalisi. Il suo graco :

5
y
4

0
O x
-1

-2
-3 -2 -1 0 1 2 3 4

Funzione ex

x
Molto importante anche la funzione esponenziale negativa f (x) = e , il cui graco
:
178 CAPITOLO 7. FUNZIONI

2
y
1

0
O x
-1

-2

-3

-4

-5
-3 -2 -1 0 1 2 3 4

x
Funzione e

Limmagine della funzione esponenziale linsieme (0; +1) degli scalari strettamente
positivi. Inoltre, grazie al Lemma 19-(iv), la funzione esponenziale ax :

(i) strettamente crescente se a > 1,

(ii) costante se a = 1,

(iii) strettamente decrescente se a > 1,

Purch a 6= 1, la funzione esponenziale strettamente monotona, e quindi iniettiva.


La sua inversa ha come dominio limmagine (0; +1) e, grazie alla Proposizione 21 della
Sezione 1.5, essa la funzione f : (0; 1) ! R denita come

f (x) = loga x

detta funzione logaritmica di base a > 0. Si noti che, per quanto appena osservato,
a 6= 1.

Lasserto della Proposizione 21, ossia che

loga ax = x 8x 2 R

e
aloga x = x 8x 2 (0; +1)
1
non sono quindi altro che le relazioni (7.6) e (7.7) delle funzioni inverse, cio f (f (x)) =
x e f (f 1 (y)) = y.
7.5. FUNZIONI ELEMENTARI SU R 179

In ragione dellimportanza del logaritmo naturale, chiameremo f (x) = log x =


loge x funzione logaritmica senza ulteriori specicazioni. Al pari della funzione espo-
nenziale, cui strettamente legata come vedremo tra poco, la funzione logaritmica
centrale in moltissimi campi. Il suo graco :

5
y
4

0
O x
-1

-2
-3 -2 -1 0 1 2 3 4

Funzione ln x

Chiudiamo con un risultato che riassume le propriet di monotonia di queste


funzioni elementari.

Lemma 81 Sia la funzione esponenziale ax sia la logaritmica loga x crescono con x


se a > 1 e decrescono se 0 < a < 1.

Dim. Per lesponenziale, si osservi che, quando a > 1, anche ah > 1 per ogni h > 0.
Quindi ax+h = ax ah > ax per ogni h > 0. Per la logaritmica, osservato che loga k > 0
se a > 1 e k > 1, si ha

h h
loga (x + h) = loga x 1 + = loga x + loga 1 + > loga x
x x

per ogni h > 0, come desiderato.

7.5.3 Funzioni trigonometriche e periodiche


Le funzioni trigonometriche, e pi in generale le periodiche, sono importanti in molte
applicazioni. Le introduciamo, rimandando il lettore allAppendice per un richiamo di
alcune nozioni elementari di trigonometria17 .
17
Per unintroduzione pi dettagliata alla materia, rimandiamo il lettore a testi di Matematica di
scuola media superiore.
180 CAPITOLO 7. FUNZIONI

Funzioni trigonometriche
La funzione seno f : R ! R, indicata come f (x) = sin x, il primo esempio di
funzione trigonometrica. Per ogni x 2 R si ha:
sin (x + 2k ) = sin x 8k 2 Z
Il graco della funzione seno :

4
y
3

- 2
0
O x
-1

-2

-3

-4
-4 -2 0 2 4 6

La funzione f : R ! R data da f (x) = cos x la funzione coseno. Per ogni x 2 R


si ha:
cos (x + 2k ) = cos x 8k 2 Z
Il suo graco :

4
y
3

-
0
O x
-1

-2

-3

-4
-4 -2 0 2 4 6

Inne, la funzione f : R 2
+ k ; k 2 Z ! R data da f (x) = tan x la funzione
tangente. Dalla (A.1) segue che
tan (x + k ) = tan x 8k 2 Z
7.5. FUNZIONI ELEMENTARI SU R 181

Il graco :

10
y
8

0
O x
-2

-4

-6

-8

-10
-4 -3 -2 -1 0 1 2 3 4

Le funzioni sin x, cos x e tan x sono monotone, e quindi invertibili, rispettivamente


negli intervalli [ =2; =2], [0; ] e ( =2; =2). Le loro funzioni inverse si indi-
cano rispettivamente con arcsin x, arccos x e arctan x. In particolare, restringendoci
allintervallo di stretta monotonia della funzione sin x, [ =2; =2] ; si ha
h i
sin x : ; ! [ 1; 1]
2 2
Quindi, la funzione inversa di sin x
h i
arcsin x : [ 1; 1] ! ;
2 2
e il suo graco :

3 y

O x
-1

-2

-3

-4 -3 -2 -1 0 1 2 3 4

Restringendoci a un intervallo [0; ] di stretta monotonia della funzione cos x si ha:


182 CAPITOLO 7. FUNZIONI

cos x : [0; ] ! [ 1; 1]

Quindi, la funzione inversa di cos x

arccos x : [ 1; 1] ! [0; ]

e il suo graco :

y
3

0
O x
-1

-2

-3

-4 -3 -2 -1 0 1 2 3 4

Restringendoci allintervallo ( =2; =2) di stretta monotonia della funzione tan x, si


ha:

tan x : ; !R
2 2

Quindi, la funzione inversa di tan x

arctan x : R ! ;
2 2

e il suo graco :
7.5. FUNZIONI ELEMENTARI SU R 183

3 y

O x
-1

-2

-3
-4 -3 -2 -1 0 1 2 3 4

immediato riconoscere che, per 2 (0; =2), risulta 0 < sin < < tan .

Funzioni Periodiche
Le funzione trigonometriche sono le pi classiche funzioni periodiche.

Denizione 49 Una funzione f : R ! R detta periodica di periodo p 2 R se, per


ogni x 2 R, si ha
f (x + kp) = f (x) 8k 2 Z

In particolare, per ci che s detto le funzioni sin x e cos x sono periodiche di peri-
odo 2 , mentre la funzione tan x ha periodo . I loro graci evidenziano la propriet
che caratterizza le funzioni periodiche, ossia di ripetersi intatti su ogni intervallo di
ampiezza p.

Esempio 107 Le funzioni sin2 x e log tan x sono periodiche di periodo . N

Vediamo un esempio di funzione periodica non trigonometrica.

Esempio 108 La funzione f : R ! R data da f (x) = x [x], detta mantissa (il


suo valore assoluto la parte decimale di x; per esempio f (2; 37) = 0; 37). Essa
periodica di periodo 1. N

Il lettore pu vericare che la periodicit preservata dalle operazioni fondamentali


tra funzioni. Ossia, se f e g sono due funzioni periodiche di stesso periodo p, anche le
funzioni date da af (x) + bg (x), f (x) g (x) e f (x) =g (x) sono periodiche di periodo p.
184 CAPITOLO 7. FUNZIONI

7.6 Domini e restrizioni


Nel primo paragrafo del capitolo abbiamo denito il dominio di una funzione come
linsieme su cui denita la funzione: il dominio di una funzione f : A ! B
linsieme A. Nei diversi esempi di funzioni di variabile reale presentati sinora abbiamo
identicato come dominio il pi grande insieme A R dove la funzione fppoteva essere
denita. Per esempio, per f (x) = x2 il dominio tutto R, per f (x) = x il dominio
R+ , per f (x) = log x il dominio R++ , e cos via. Per una funzione f di una o pi
variabili chiameremo dominio naturale (o campo desistenza) il pi grande insieme sul
quale f pu essere denita. Per esempio, R il dominio naturale di x2 , R+ quello di
p
x, R++ quello di log x, e cos via.
Ma, non vi nulla di speciale, a parte la massimimalit, nel dominio naturale: una
funzione pu essere denita su un qualsiasi sottoinsieme del dominio naturale. Per
esempio, possiamo considerare x2 soltanto per valori positivi di x, cos da avere una
funzione quadratica f : R+ ! R, oppure considerare log x solo per valori di x maggiori
di 1, cos da avere una funzione logaritmica f : [1; +1) ! R, e cos via.
In particolare, data una funzione f : A ! B talvolta importante considerarne
restrizioni su sottoinsiemi.
Denizione 50 Sia f : A ! B una funzione e sia C A. La funzione g : C ! B
denita da
g(x) = f (x) 8x 2 C
detta restrizione di f su C e si indica con fjC .
La restrizione fjC si pu quindi vedere come f ristretta sul sottoinsieme C di A.
Grazie al pi piccolo dominio, la funzione fjC pu godere di propriet diverse da quelle
della funzione originaria f .
Esempio 109 Sia g : [0; 1] ! R denita da g(x) = x2 . La funzione g si pu vedere
come restrizione sullintervallo [0; 1] della funzione f : R ! R data da f (x) = x2 ; cio
g = fj[0;1] . Grazie al suo dominio ristretto la funzione g gode di molte pi propriet
della funzione f . Per esempio: g strettamente crescente, mentre f non lo ; g
iniettiva (e quindi invertibile), mentre f non lo ; g limitata, mentre f solo
inferiormente limitata. Nel capitolo 17 introdurremo la nozione di massimo e minimo
di funzione: g possiede sia massimo sia minimo (globale), mentre f non possiede
massimi. N
Esempio 110 Sia g : R ! R denita da g(x) = x. La funzione g si pu vedere
come restrizione su ( 1; 0] sia di f : R ! R data da f (x) = jxj sia di h : R ! R
data da h(x) = x. Infatti, una funzione pu essere considerata la restrizione di
pi funzioni (anzi, di innite funzioni) ed il problema al quale siamo interessati a
indicarci quali tra esse sia pi opportuno considerare. In ogni caso, analizziamo le
dierenze tra g e f e quelle tra g e h. La funzione g iniettiva, mentre f non lo ;
g monotona decrescente, mentre f non lo . La funzione g inferiormente limitata,
mentre h non lo ; g possiede minimo globale, mentre h non possiede minimi. N
7.6. DOMINI E RESTRIZIONI 185

p
Esempio 111 La funzione f (x1 ; x2 ) = x1 x2 ha come dominio naturale R2+ [ R2 .
Tuttavia, quando vista come funzione di utilit di tipo Cobb-Douglas il suo dominio
ristretto a R2+ perch i panieri di beni hanno sempre componenenti positive. In-
oltre, poich f (x1 ; x2 ) = 0 quando anche sola una componente nulla, il che poco
plausibile, tali funzioni di utilit si considerano spesso solo su R2++ . Considerazioni
puramente economiche portano perci a restringere il dominio sul quale si studia la
p
funzione f (x1 ; x2 ) = x1 x2 . N

In modo analogo e speculare al concetto di restrizione, introduciamo ora il concetto


di estensione di una funzione (funzione estesa ad un dominio pi ampio di quello
iniziale).

Denizione 51 Sia f : A ! B una funzione e sia A C. Una funzione g : C ! B


tale che
g (x) = f (x) 8x 2 A

detta estensione di f a C.

Risulta evidente dalle denizioni appena date che restrizione ed estensione sono
due facce della stessa medaglia: g una estensione di f se e solo se f una restrizione
di g. In particolare, una funzione denita sul suo dominio naturale A unestensione
ad A di ogni sua restrizione. anche evidente che se una funzione possiede una
restrizione/estensione, ne possiede innite18 .

Esempio 112 La funzione g : R ! R denita da

1
x
se x 6= 0
g(x) =
0 se x = 0

una estensione della funzione f (x) = 1=x, che ha dominio naturale R f0g. N

Esempio 113 Sia g : R ! R denita da

x per x 0
g(x) =
log x per x > 0

una estensione della funzione f (x) = log x, che ha dominio naturale R++ . N
18
Potrebbe succedere che una funzione non possegga restrizioni o non possegga estensioni. Infatti,
sia f : A R ! R. Se A = fx0 g, cio se il dominio di f un singolo punto, allora f non possiede
restrizioni. Se invece A = R, f non possiede estensioni.
186 CAPITOLO 7. FUNZIONI

7.7 Funzioni biiettive e cardinalit


7.7.1 Cardinalit
Le funzioni biiettive sono fondamentali in Matematica come criterio di similarit. In
questa sezione ne vediamo un importante esempio per lo studio della cardinalit degli
insiemi inniti.
Cominciamo col considerare un insieme A nito, cio un insieme che contiene un
numero nito di elementi. Il numero di elementi si usa chiamare potenza o cardinalit
dellinsieme A, e si indica abitualmente con jAj.

Esempio 114 Linsieme A = f11; 13; 15; 17; 19g degli interi dispari tra tra 10 e 20
nito e jAj = 5. N

Grazie alla Proposizione 75, due insiemi niti hanno la stessa potenza se e solo se
i loro elementi si possono porre in corrispondenza biunivoca: per esempio, se abbiamo
sette tazzine e sette cucchiaini, possiamo accoppiare ogni tazzina a un cucchiaino. In
particolare, abbiamo il seguente ovvio lemma.

Lemma 82 Un insieme A nito se e solo se si pu porre in corrispondenza biunivoca


con un sottoinsieme del tipo f1; 2; :::; ng di N. In tal caso, jAj = n.

In altre parole, A nito se e solo se esistono un insieme f1; 2; :::; ng di naturali


e una funzione biiettiva f : f1; 2; :::; ng ! A. Linsieme f1; 2; :::; ng pu vedersi come
linsieme prototipodi cardinalit n, rispetto al quale tararetutti gli altri insiemi
niti di tale cardinalit attraverso opportune funzioni biiettive.

Il punto di vista funzionale per la cardinalit, basato sulle funzioni biiettive e sul-
lindividuazione di un insieme prototipo, nel caso nito poco pi di una curiosit.
Diventa per sostanziale quando si vuole estendere la nozione di cardinalit a insiemi
inniti. Fu questa una delle intuizioni fondamentali di Georg Cantor, che port alla
nascita della teoria degli insiemi inniti. Infatti, la possibilit di instaurare una cor-
rispondenza biunivoca tra insiemi inniti consente una loro classicazione e conduce
a scoprirne propriet poco intuitive.

Denizione 52 Un insieme detto (innito) numerabile se si pu porre in corrispon-


denza biunivoca con linsieme N dei numeri naturali.

In altri termini, A numerabile se esiste una funzione biiettiva f : N ! A, ovvero


se gli elementi dellinsieme si possono ordinare in sequenza: a0 ; a1 ; :::; an ; ::: (cio a 0
stato fatto corrispondere a0 , a 1 a1 , ecc.). Linsieme N dunque il prototipo degli
insiemi numerabili: ogni altro lo se risulta possibile accoppiare uno a uno (come le
tazzine e i cucchiaini di poco fa) i suoi elementi con quelli di N. Si usa dire che gli
elementi di un insieme siatto costituiscono uninnit numerabile. questa la prima
categoria di insieme innito che incontriamo.
7.7. FUNZIONI BIIETTIVE E CARDINALIT 187

Gli insiemi numerabili presentano qualche piccola sorpresa: per esempio, sempre
possibile porre in corrispondenza biunivoca un insieme numerabile con un suo sot-
toinsieme proprio innito. Per esempio, linsieme P dei numeri pari chiaramente un
sottoinsieme proprio di N e si potrebbe pensare che contenga metdei suoi elemen-
ti. Purtuttavia possibile instaurare una corrispondenza uno a uno con N facendo
corrispondere a ogni numero pari la sua met:
2n 2 P $ n 2 N
e quindi jP j = jNj. Gi Galileo si era reso conto di questa notevole peculiarit degli
insiemi inniti, che li distingue nettamente dagli insiemi niti, i cui sottoinsiemi pro-
pri hanno sempre cardinalit minore19 . In un celebre passaggio dei Discorsi e di-
mostrazioni matematiche intorno a due nuove scienze 20 , pubblicato nel 1638, egli os-
servava che i numeri naturali si possono mettere in corrispondenza biunivoca con i loro
quadrati ponendo n2 $ n, sicch i quadrati, che a prima vista sembrano costituire
un sottoinsieme piuttosto piccolo di N, in realt sono in egual numero dei naturali
per via della corrispondenza n2 $ n: ... e pur nel numero innito, se concepir lo
potessimo, bisognerebbe dire, tanti essere i quadrati quanti tutti i numeri insieme.
La chiarezza di Galileo nellesporre il problema degna del suo genio. Purtroppo le
nozioni matematiche a sua disposizione erano del tutto insu cienti a sviluppare le sue
intuizioni. Per esempio, la nozione di funzione, basilare per le idee di Cantor, comincia
ad apparire, peraltro in forma molto primitiva, solo alla ne del Seicento con i lavori
di Leibniz.

chiaro che lunione di un numero nito di insiemi numerabili a sua volta


numerabile, ma vale ben di pi:

Teorema 83 Lunione di uninnit numerabile di insiemi numerabili a sua volta


numerabile.

Dim. Indichiamo con A0 , A1 , A2 ,: : : ,An , ::: gli insiemi e con A la loro unione.
Disponiamo visivamente gli elementi dei vari insiemi come segue:
A0 = fa00 ; a01 ; a02 ; ; a0n ; g
A1 = fa10 ; a11 ; a12 ; ; a1n ; g
A2 = fa20 ; a21 ; a22 ; ; a2n ; g
e cos via. Chiamiamo ora altezza dei vari elementi aij (che non sono altro che gli
elementi dellunione A) semplicemente la somma i+j dei suoi indici. Possiamo disporli
19
Laccennata possibilit alla base di parecchie storielle. Per esempio, lHotel del Paradiso ha
uninnit numerabile di stanze, numerate progressivamente 1; 2; 3; . In un certo momento sono
tutte occupate, ma si presenta un nuovo ospite. Come trovargli posto? Basta chiedere a tutti di
spostarsi nella stanza successiva (1 ! 2; 2 ! 3; 3 ! 4, ecc.) ed ecco che si libera la stanza numero 1.
Si pu anche fare di meglio: chiedere a tutti di spostarsi nella stanza con il numero doppio di quella
attualmente occupata (1 ! 2; 2 ! 4; 3 ! 6, ecc.) e si liberano innite stanze, le dispari.
20
Il passaggio si trova in un dialogo tra Sagredo, Salviati e Simplicio nella prima giornata.
188 CAPITOLO 7. FUNZIONI

in sequenza uttilizzando tali altezze e, quando due diversi elementi abbiano la stessa
altezza, nellordine determinato dal loro primo indice21 . Si ottiene cos la sequenza

a00 ; a01 ; a10 ; a02 ; a11 ; a20 ; a03 ; a12 ; a21 ; a30 ; a04 ; :::

nella quale trovano posto tutti gli elementi di A.

Con un procedimento analogo si mostra che anche il prodotto cartesiano sia di


un numero nito sia di uninnit numerabile di insiemi numerabili numerabile. In
particolare ci signica che linsieme Q dei razionali numerabile. Scriviamo ogni
numero razionale come una frazione m=n con m; n interi naturali e gi ridotta ai
minimi termini, cio con m e n primi tra loro: per esempio 5 sar scritto 5=1 e non
potremo scrivere 6=4 o 12=8 ma solo 3=2. Basta ora dire altezza di m=n la somma
m + n e procedere esattamente come sopra, con la sola aggiunta di far precedere i
numeri negativi ai positivi di stessa altezza, per ottenere la sequenza

0 1 1 1 2 1 2 1 3 1 3
= 0; = 1; = 1; ; = 2; ; = 2; ; = 3; ; = 3;
|1 {z } | 1 {z 1 } | 2 1 {z 2 1 } | 3 1 {z 3 1 }
altezza 1 altezza 2 altezza 3 altezza 4

La propriet ora enunciata piuttosto sorprendente: i razionali sono ben di pi


dei naturali eppure esiste un modo di metterli reciprocamente in corrispondenza uno
a uno.
La potenza di N e di qualunque insieme numerabile si indica dabitudine con22
@0 ed detta potenza del numerabile. Possiamo quindi scrivere nel seguente modo la
notevole propriet dei razionali test provata:

Corollario 84 jQj = @0 .

A questo punto pu sorgere il sospetto che tutti gli insiemi inniti siano numerabili.
Il prossimo risultato mostra che non cos. Linsieme R dei reali non numerabile:
costituito cio da uninnit non numerabile, molto pi ricca di elementi di N.

Teorema 85 (Cantor) R non numerabile, ossia jRj > @0 .

Presentiamo due diverse dimostrazioni. La prima classica, ma basata sulla rap-


presentazione decimale dei reali in (0; 1) che non abbiamo ancora studiato (si veda la
Sezione 11.7.1); la seconda si basa sulle successioni, che vedremo nel prossimo capitolo.
Lasciamo al lettore la scelta della propria dimostrazione preferita.
21
Ci equivale a prendere progressivamente i vari elementi lungo le diagonali discendenti della
tabella innita sopra indicata.
22
@ (aleph) la prima lettera dellalfabeto ebraico.
7.7. FUNZIONI BIIETTIVE E CARDINALIT 189

Dim. 1 su ciente mostrare che j(0; 1)j > @0 . Infatti, essendo (0; 1) R, ci
ovviamente implica la non numerabilit di R. Per prima cosa osserviamo che j(0; 1)j
@0 . Infatti, linsieme
1
:n2N
1+n
ha la stessa cardinalit di N (stabilita dalla biiezione f (n) = 1=1 + n) ed inclusa in
(0; 1).
Poich j(0; 1)j @0 , per mostrare che j(0; 1)j > @0 basta mostrare che (0; 1) non
numerabile, cio j(0; 1)j 6= @0 . A tal ne, scriviamo tutti i numeri in (0; 1) ricorrendo
alla loro rappresentazione decimale: ogni x 2 (0; 1) si scriver come

x = 0; c0 c1 cn

con ci 2 f0; 1; :::; 9g, utilizzando sempre innite cifre (per esempio 3; 54 si scriver
3; 54000000 : : :).
Supponiamo per assurdo che (0; 1) sia numerabile: esisterebbe allora un modo di
ordinarli in sequenza

x0 = 0; c00 c01 c02 c03 c0n


x1 = 0; c10 c11 c12 c13 c1n
x2 = 0; c20 c21 c22 c23 c2n

e cos via. Prendiamo ora il numero x = 0; d0 d1 d2 d3 dn cos costruito: la


sua generica cifra decimale dn diversa da cnn (ma senza inniti 9 per evitare il 9
periodico che, come sappiamo, non esiste autonomamente). Esso appartiene a (0; 1)
ma fatalmente non allelenco scritto sopra perch dn 6= cnn (e quindi diverso dal
primo perch d0 6= c00 , dal secondo perch d1 6= c11 , ecc.). Se ne conclude che lelenco
scritto sopra non pu essere completo e perci i numeri di (0; 1) non si possono porre
in corrispondenza biunivoca con N. Lintervallo (0; 1) non quindi numerabile.

Dim. 2 Procediamo per contraddizione supponendo che esista una funzione biiettiva
f : N ! R. Grazie a essa costruiamo per induzione due successioni fxn g e fyn g tali
che
xn 1 < x n < y n < y n 1 (7.24)
per ogni n. In particolare, al primo passo si ponga f (1) < x1 < y1 . Per induzione, si
supponga che al passo n si abbia xn < yn . Si scelgano xn+1 e yn+1 secondo la seguente
regola:

(i) se f (n) 2
= (xn ; yn ), allora si pone xn < xn+1 < yn+1 < yn ;

(ii) se f (n) 2 (xn ; yn ), allora si pone f (n) < xn+1 < yn+1 < yn .
190 CAPITOLO 7. FUNZIONI

Le successioni cos denite soddisfanno la (7.24). Si ponga x = sup fxn : n 1g.


Si ha x 2 R poich linsieme fxn : n 1g superiormente limitato (per esempio, y1 ne
un maggiorante). Siccome f biiettiva, esiste nx 2 N tale che f (nx ) = x. Quindi,
xnx < f (nx ) < ynx il che implica x = f (nx ) < xnx+1 < ynx+1 < ynx , ma ci contraddice
il fatto che x sia un estremo superiore.

Linsieme R dei reali perci molto pi ricco di N e di Q. I numeri razionali, che


pure hanno, come s detto, un ritmo serrato, sono comparativamente pochissimi
rispetto ai reali: essi costituiscono una sorta di polvere nissima che si sovrappone ai
reali senza ricoprirli tutti ma risultando talmente ne da far s che tra due reali anche
vicinissimi ci siano inniti granelli di tale polvere.
La retta reale quindi un nuovo prototipo di insieme innito:

Denizione 53 Un insieme ha la potenza del continuo se si pu porre in corrispon-


denza biunivoca con linsieme R dei reali.

La potenza del continuo si indica con @1 . Anche in questo caso esistono sottoinsiemi
a prima vista molto pi piccoli di R che hanno la potenza del continuo. Vediamone
un esempio.

Proposizione 86 Lintervallo (0; 1) ha la potenza del continuo.

Dim. Nella prima dimostrazione del Teorema di Cantor si era mostrato che j(0; 1)j >
@0 . Si vuole ora mostrare che j(0; 1)j = @1 . Per far ci occorre mostrare che i numeri
di (0; 1) si possono porre in corrispondenza biunivoca con quelli di R. La biiezione
f : R ! (0; 1) denita da
1
f (x) =
2 + jxj
mostra che, in eetti, tale il caso (come il lettore pu vericare).

Si pu dimostrare che lunione o il prodotto cartesiano di un numero nito o di


uninnit numerabile di insiemi con la potenza del continuo ha, a sua volta, la potenza
del continuo. Ci ha la prossima notevole conseguenza

Teorema 87 Rn ha la potenza del continuo per ogni n 1.

Si tratta di unaltra notevole sorpresa, gi nel caso speciale del piano R2 , che pare
contenere molti pi punti di una retta. di fronte a risultati sorprendenti di questo
tipo che Cantor scrisse in una lettera a Dedekind lo vedo, ma non ci credo. In
realt, le sue intuizioni sulluso delle funzioni biiettive nello studio della cardinalit
degli insiemi inniti hanno aperto una nuova profonda area della Matematica, ricca
anche di implicazioni losoche.
7.7. FUNZIONI BIIETTIVE E CARDINALIT 191

7.7.2 Un vaso di Pandora


Le potenze @0 e @1 sono detti numeri cardinali inniti. La parte svolta dai numeri
naturali nel rappresentare la cardinalit degli insiemi niti ora svolta dai numeri
cardinali @0 e @1 per gli insiemi inniti N e R. Tant che i numeri naturali sono anche
chiamati numeri cardinali niti. I numeri cardinali

f0; 1; 2; :::; n; :::; @0 ; @1 g (7.25)

rappresentano quindi la cardinalit degli insiemi prototipi

;; f1g ; f1; 2g ; :::; f1; 2; :::; ng ; :::; N; R.

Guardando la (7.25) sorge spontaneo chiedersi se @0 e @1 siano gli unici numeri cardinali
inniti. Come vedremo tra breve, ci ben lungi dallesser vero. Ci apprestiamo infatti
a scoperchiare un vero e proprio vaso di Pandora (da cui per escono non mali ma
meraviglie).
Per far ci, indichiamo con 2A linsieme delle parti (o insieme potenza) di un
insieme qualsiasi A, ossia linsieme

2A = fB : B Ag

di tutti i suoi sottoinsiemi. La notazione 2A motivata dalla cardinalit dellinsieme


delle parti: infatti, se A un insieme nito di cardinalit n, il suo insieme delle parti
ha 2n elementi, come mostra la seguente proposizione.

Proposizione 88 Se jAj = n, allora 2A = 2n .

Dim. Lanalisi combinatoria svela immediatamente che 2A contiene linsieme vuoto,


n
1
insiemi con un elemento, n2 insiemi con due elementi,..., nn 1 insiemi con n 1
elementi e nn = 1 insiemi con tutti gli n elementi. Quindi,

n n n n
2A = 1+ + + ::: + +
1 2 n 1 n
Xn
n k n k
= 1 1 = (1 + 1)n = 2n ;
k=0
k

dove lultima eguaglianza ottenuta dalla formula di Newton per la potenza di un


binomio.

Nel nito, si ha evidentemente 2A > jAj. La disuguaglianza continua a valere


anche per insiemi inniti, come vuole il

Teorema 89 (Cantor) Per ogni insieme A, nito o innito, si ha 2A > jAj.


192 CAPITOLO 7. FUNZIONI

Dim. Siccome A 2 2A , si ha jAj j2A j. Supponiamo, per assurdo, che sia jAj = j2A j.
Esiste allora una biiezione tra A e 2A che ad ogni elemento a 2 A fa corrispondere un
elemento b = b (a) 2 2A e viceversa: a $ b. Si osservi che tale b, essendo elemento
di 2A , un sottoinsieme di A. Consideriamo ora tutti gli elementi a 2 A tali che il
corrispondente sottoinsieme b (a) non contenga a e diciamo S linsieme di tali b (a):
esso evidentemente un sottoinsieme di A. Consideriamo ora un generico elemento
c 2 A:

(i) se c 2
= S, allora b (c) contiene c e quindi c 2 S;

(ii) se c 2 S, allora b (c) non contiene c e quindi c 2


= S.

In ogni caso siamo giunti a un assurdo. Quindi jAj < j2A j:

Il Teorema di Cantor ore un modo molto semplice per fare un salto di cardinalit
a partire da un dato insieme A: basta considerarne linsieme delle parti 2A . Per
R
esempio, 2R > @1 , ma anche 22 > j2R j, e cos via. Possiamo quindi costruire una
successione innita di insiemi di cardinalit sempre pi grande e perci rappresentata
da numeri cardinali via via maggiori, s da arricchire la (7.25) come

f1; 2; :::; n; :::; @0 ; @1 ; :::; @n ; :::g : (7.26)

Ecco il vaso di Pandora di cui si diceva e che il Teorema 89 ha permesso di scoperchiare.


La vertiginosa (7.26) solo lincipit della teoria degli insiemi inniti, il cui studio, anche
solo introduttivo, ci porterebbe troppo lontano.
Prima di passare oltre, consideriamo per un ultimo celebre aspetto della teoria,
la cosiddetta ipotesi del continuo, di cui il lettore ha forse gi sentito parlare. Grazie
al Teorema 89, sappiamo che 2N > jNj. Daltra parte, si ha anche jRj > jNj per il
Teorema 85. Il prossimo risultato mostra che queste due disuguaglianze in realt si
riducono a una.

Teorema 90 2N = jRj.

La dimostrazione di questo notevole risultato rinviata alla Sezione 11.7, quando


il lettore avr a sua disposizione tutti gli strumenti matematici necessari.
Linsieme delle parti di N ha quindi la potenza del continuo. Lipotesi del continuo
aerma che non esiste alcun insieme A tale che

jNj < jAj < jRj ;

ossia che non esiste alcun insieme innito di cardinalit intermedia tra le potenze del
numerabile e del continuo. Un insieme che abbia cardinalit maggiore del numerabile
ha almeno la potenza del continuo.
La validit dellipotesi del continuo il primo tra i celebri problemi posti da David
Hilbert nel 1900 e rappresenta una delle questioni pi profonde della Matematica. Sia
7.7. FUNZIONI BIIETTIVE E CARDINALIT 193

come sia, con la notazione @1 = jRj, noi abbiamo implicitamente adottato tale ipotesi
perch essa giustica il considerare la potenza del continuo come il secondo numero
cardinale innito @1 dopo il primo @0 = jNj.
Lipotesi del continuo si pu quindi riformulare in modo suggestivo scrivendo

@1 = 2@0 ;

ossia il pi piccolo cardinale maggiore di @0 uguale alla cardinalit dellinsieme delle


parti di N o, equivalentemente, di qualsiasi insieme di cardinalit @0 (per esempio dei
razionali). Lipotesi generalizzata del continuo aerma che, per ogni n, si ha

@n+1 = 2@n ;

ossia che tutti i salti di cardinalit nella (7.26), e non solo il primo da @0 a @1 , si
ottengono sempre considerando gli insiemi delle parti. Quindi,
R 2R
@2 = 22 ; @3 = 22 ;

e cos via.
incredibile quale sia la profondit dei problemi aperti dalluso, al contempo rig-
oroso e intrepido (connubio tipico della grande Matematica e base della sua bellezza),
che Cantor ha fatto delle funzioni biiettive come principio fondamentale di similarit
tra insiemi rispetto alla loro numerosit23 .

23
Il lettore curioso di approfondire le sue conoscenze di Teoria degli insiemi pu consultare P.
Halmos, Naive set theory, Van Nostrand, 1960 oppure P. Suppes, Axiomatic set theory, Van Nostrand,
1960.
194 CAPITOLO 7. FUNZIONI
Capitolo 8

Applicazione: funzioni di insieme e


probabilit

8.1 Misure
Sia 2 linsieme delle parti di un insieme qualsiasi nito = f! 1 ; :::; ! n g, cio la
famiglia di tutti i sottoinsiemi di . Si ricordi dalla Proposizione 88 che la cardinalit
di 2n .

Denizione 54 Una funzione dinsieme : 2 ! R una legge che associa un


numero reale (A) ad ogni sottoinsieme A di , con (;) = 0.

Le funzioni di insieme sono quindi funzioni con dominio linsieme delle parti 2 e
codominio la retta reale.

Esempio 115 Sia = fa; b; cg un insieme di tre elementi. Si ha

2 = f;; fag ; fbg ; fcg ; fa; bg , fa; cg , fb; cg , g .

La funzione cos denita:

(;) = 0 ; (fag) = 4 ; (fbg) = 5 ; (fcg) = 3


(fa; bg) = 8 ; (fa; cg) = 6 ; (fb; cg) = 4 ; ( ) = 12

una funzione dinsieme. N

Esempio 116 Se la popolazione italiana, un sottoinsieme A di rappresenta


un gruppo di italiani. Una semplice funzione di insieme la misura di conteggio
: 2 ! R che conta il numero di componenti di ogni tale gruppo, cio

(A) = jAj 8A

195
196 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

Si noti che (;) = j;j = 0. Grazie ai dati dellultimo censimento, lISTAT ha deter-
minato che let di ogni italiano descritta dalla funzione : ! R, sicch (!)
let di ! 2 A. La funzione dinsieme : 2 ! R denita da
( P
!2A (!)
se ; =6 A
(A) = jAj
0 se A = ;

indica let media di ogni gruppo A di italiani. Per esempio, se A linsieme delle
donne, (A) la loro et media. Si noti come si sia dovuto denire separatamente
linsieme vuoto perch per esso il denominatore si annulla. N

Una funzione dinsieme : 2 ! R detta:

(i) positiva se (A) 0 per ogni A;

(ii) monotona se (A) (B) tutte le volte che A B;

(iii) additiva se (A [ B) = (A) + (B) quando A \ B = ;;

(iv) normalizzata se ( ) = 1.

Il signicato di queste propriet molto intuitivo. Per esempio, la misura di conteg-


gio positiva, monotona e additiva; non invece normalizzata. La funzione dinsieme
dellet media positiva, ma non gode delle rimanenti propriet: la monotonia non vale
perch allargando un gruppo let media pu sia aumentare sia diminuire; ladditivit
non vale:
P P P P P
!2A[B (!) !2A (!) + !2B (!) !2A (!) (!)
(A [ B) = = = + !2B
jA [ Bj jAj + jBj jAj + jBj jAj + jBj
P P
!2A (!) (!)
< + !2B = (A) + (B)
jAj jBj

purch A e B siano non vuoti; inne, ovvio che, in generale, non normalizzata.

Una funzione dinsieme che soddis le propriet (i) e (iii) detta misura. La misura
di conteggio una misura, e ci ne spiega il nome; la funzione dinsieme dellet media
non invece una misura. La propriet (ii) di monotonia implicata dalle altre due:

Proposizione 91 Ogni misura monotona.

Dim. Per ogni A; B con A B i due insiemi A B e B sono disgiunti. Si ha


allora
(A) = ((A B) [ B) = (A B) + (B) (B)
essendo (A B) 0 per la positivit di .
8.2. PROBABILIT 197

8.2 Probabilit
Le misure che godono anche della propriet (iv), cio che sono normalizzate, sono dette
misure di probabilit (o, pi brevemente, probabilit). In altre parole, una funzione
dinsieme P : 2 ! R una probabilit su se:

(i) P (A) 0 per ogni A;

(ii) P (A [ B) = P (A) + P (B) quando A \ B = ;;

(iii) P (;) = 0 e P ( ) = 1.

Indicheremo con P una misura di probabilit. Si noti che P (A) 2 [0; 1]: la prob-
abilit di un insieme sempre compresa tra zero e uno. Per tale ragione nel seguito
scriveremo P : 2 ! [0; 1].

Le misure di probabilit sono di importanza fondamentale nelle applicazioni per-


ch sono lingrediente centrale in ogni modelizzazione dellincertezza. Linsieme =
f! 1 ; :::; ! n g modella in tal caso tutti i possibili esiti nei quali si pu risolvere un fenom-
eno aleatorio: gli elementi ! i sono detti stati del mondo o eventi elementari e il loro
insieme spazio degli stati. Tale spazio informa su quali potranno essere le possibili
conclusioni della situazione aleatoria che interessa descrivere.

Ogni sottoinsieme di , cio ogni elemento di 2 , detto evento: si tratta di un


insieme del quale, una volta risolta la situazione aleatoria, si potr dire che si o non
si vericato. In particolare ; detto evento impossibile e evento certo.

Vediamo alcuni esempi di spazi di probabilit, che riprendono anche quelli gi visti
nelle Sezioni 2.4.1 e 7.2.1.

Esempio 117 Come visto nella Sezione 2.4.1, il lancio di una moneta determina due
soli stati del mondo:
= fC; T g
Linsieme delle parti formato da quattro eventi: ;; fT g ; fCg ; . Il lancio di due
monete determina quattro stati del mondo:

= 1 2 = fC; T g fC; T g = f(C; T ) ; (C; C) ; (T; C) ; (T; T )g

Linsieme delle parti costituito da sedici eventi. Per esempio,

A = f(T; T ) ; (T; C)g

levento la prima moneta ha mostrato testa, mentre

B = f(T; C) ; (C; T )g

levento le due monete hanno mostrato facce diverse. N


198 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

Esempio 118 (i) Il lancio di un dado determina sei stati del mondo:

= f1; 2; : : : ; 6g

Linsieme 2 costituito da 26 = 64 eventi; per esempio A = f1; 3; 5g levento


uscita una faccia dispari.
(ii) Si estrae una pallina da unurna che ne contiene 100 numerate da 1 a 100.
Linsieme costituito da 100 stati del mondo. Per esempio A = f1; 2; 3; 4; 5g
levento si estratta una pallina con un numero 5. N

evidente che le probabilit

P (!) = P (f!g) 8! 2

degli stati del mondo determinano compiutamente P su tutto 2 . Infatti ogni evento
A 2 2 costituito da alcuni stati del mondo (che sono ovviamente disgiunti) e perci
X
P (A) = P (!)
!2A

In particolare X
P (!) = P ( ) = 1:
!2

Assegnare una probabilit su 2 equivale dunque ad assegnarne i valori sui soli stati
del mondo e perci essa pu essere sintetizzata semplicemente con il vettore P 2 Rn+
dato da
P = (P (! 1 ) ; P (! 2 ) ; : : : ; P (! n ))
ovvero
P = (P1 ; P2 ; : : : ; Pn )
ponendo Pi = P (! i ). Le misure di probabilit
P P : 2 ! [0; 1] si possono quindi
identicare con i vettori P 2 Rn+ tali che ni=1 Pi = 1. Si tratta di unosservazione
tanto semplice quanto utile. Nel Capitolo 15 vedremo come linsieme dei vettori P 2
Rn+ sia un importante insieme di Rn+ , chiamato simplesso.

Esempio 119 Consideriamo lo spazio di stati

= f! 1 ; ! 2 ; ! 3 ; ! 4 g

Il vettore
P = (1=4; 1=4; 1=6; 1=3) 2 R4
identica la probabilit P : 2 ! [0; 1] data da
1 1 1
P (! 1 ) = P (! 2 ) = ; P (! 3 ) = ; P (! 4 ) =
4 6 3
e la probabilit degli altri dodici eventi si trova di conseguenza. N
8.2. PROBABILIT 199

Esempio 120 (i) Per il lancio di una moneta appare naturale prendere P (T ) =
P (C) = 1=2, cosicch
1 1
P = ;
2 2
(ii) Per il lancio di un dado appare naturale prendere P (i) = 1=6 per ogni i, e
quindi
1 1 1 1 1 1
P = ; ; ; ; ;
6 6 6 6 6 6
N

Vediamo alcune propriet della probabilit.

Teorema 92 Sia P una probabilit su 2 . Allora:

(i) P (Ac ) = 1 P (A);

(ii) P (A [ B) + P (A \ B) = P (A) + P (B).

La propriet (i) aerma che la probabilit di un evento e del suo complementare


sommano 1. In altre parole, una volta determinata la probabilit di A risulta au-
tomaticamente determinata quella dellevento complementare Ac . La propriet (ii)
generalizza ladditivit, che ne il caso particolare nel quale gli eventi A e B sono
disgiunti, sicch P (A \ B) = 0.

Dim. (i) A e Ac sono disgiunti e A [ Ac = ; perci P (A) + P (Ac ) = P ( ) = 1.


(ii) Visto che A = (A B) [ (A \ B) e che A B e A \ B sono disgiunti, risulta

P (A) = P (A B) + P (A \ B) ) P (A B) = P (A) P (A \ B)

e analogamente
P (B A) = P (B) P (A \ B) :

Ora si pu scrivere A [ B = (A B) [ (B A) [ (A \ B) e, essendo i tre eventi


disgiunti,

P (A [ B) = P (A B) + P (B A) + P (A \ B)
= P (A) P (A \ B) + P (B) P (A \ B) + P (A \ B)
= P (A) + P (B) P (A \ B)
200 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

8.3 Variabili aleatorie


Riprendiamo la nozione di variabile aleatoria gi brevemente incontrata nella Sezione
7.2.1.
Denizione 55 Una funzione f : ! R denita sullo spazio degli stati detta
variabile aleatoria.
Le variabili aleatorie, che sono anche chiamate variabili casuali o numeri aleatori,
sono funzioni che a ogni stato del mondo associano un numero reale.
Esempio 121 (i) Si ricordi lesempio di scommessa della Sezione 7.2.1. In una pi
semplice scommessa il giocatore vince 50 euro se dal lancio di una moneta esce testa
e perde 50 euro se esce croce. La funzione cos denita
f (T ) = 50 ; f (C) = 50 (8.1)
una variabile aleatoria che modella tale scommessa.
(ii) Limpianto di unazienda manifatturiera soggetto a tre tipi di guasti: di
piccola (a), media (b) e grossa (c) entit. Possiamo considerare quattro stati del
mondo:
= fa; b; c; dg
dove d = nessun guasto. Poniamo che il costo di riparazione dei tre tipi di guasto
sia rispettivamente 1:000, 3:000 e 10:000 euro e che, inoltre, essi causino uno, due o
cinque giorni di interruzione delle produzione con un mancato protto di 300 euro al
giorno. La variabile aleatoria f : ! R cos denita:
8 8
>
> 1:000 + 300 se ! = a >
> 1:300 se ! = a
< <
3:000 + 2 300 se ! = b 3:600 se ! = b
f (!) = =
>
> 10:000 + 5 300 se ! = c >
> 11:500 se ! = c
: :
0 se ! = d 0 se ! = d
esprime la perdita dellazienda nei vari stati del mondo.
(iii) Il pagamento di un titolo nanziario (per esempio, unobbligazione) dipende
dal vericarsi degli stati del mondo di uno spazio di stati = f! 1 ; :::; ! n g ed quindi
rappresentato da una variabile aleatoria f : ! R. H
Una variabile aleatoria f : = f! 1 ; :::; ! n g ! R e una probabilit P : 2 ! [0; 1]
si combinano nel valor medio (o speranza matematica)
X
n
f (! i ) P (! i ) (8.2)
i=1

indicato con EP (f ). In altre parole, il valore medio di f rispetto a P la somma


dei valori della variabile aleatoria nei diversi stati del mondo moltiplicati per le loro
probabilit. Si controlla subito che il valor medio lineare: se f; g sono variabili
aleatorie, risulta EP ( f + g) = EP (f ) + EP (g) per ogni ; 2 R.
8.3. VARIABILI ALEATORIE 201

Esempio 122 (i) Se la probabilit P assegna egual probabilit 1=2 a testa e croce, il
valore atteso della scommessa (8.1)

1 1
EP (f ) = f (T ) P (T ) + f (C) P (C) = 50 + ( 50) = 0
2 2
Le scommesse con valor medio nullo sono dette eque.
(ii) Se la probabilit P degli stati = fa; b; c; dg sono P (a) = P (b) = P (d) = 1=5
e P (c) = 2=5, la perdita media dellazienda

EP (f ) = f (a) P (a) + f (b) P (b) + f (c) P (c) + f (d) P (d)


1 1 2 1
= 1:300 + 3:600 + 11:500 + 0 = 5:120
5 5 5 5
H

Visto che stiamo considerando solo insiemi niti di stati del mondo, = f! 1 ; ! 2 ; : : : ; ! n g,
ogni variabile aleatoria su assume al pi n diversi valori

f (! i ) = xi 8i = 1; :::; n (8.3)

(alcuni dei quali possono coincidere). Una variabile aleatoria pu allora essere sem-
plicemente identicata con il vettore di Rn che ne elenca i valori:

x = (f (! 1 ) ; f (! 2 ) ; : : : ; f (! n )) = (x1 ; x2 ; : : : ; xn ) (8.4)

Con questa notazione il valor medio il prodotto interno dei due vettori P e x:

X
n
EP (f ) = P x = Pi x i
i=1

Esempio 123 Siano = f! 1 ; ! 2 ; ! 3 ; ! 4 ; ! 5 g e x = (5; 10; 8; 6; 4). Possiamo inter-


pretare tale variabile aleatoria come unattivit nanziaria che paga 5 euro se si ver-
ica ! 1 , 10 euro se si verica ! 2 , 8 euro se si verica ! 3 , 6 euro se si verica ! 4 e 4
euro se si verica ! 5 . Sia ancora

2 1 3 15 25
P = ; ; ; ;
10 10 10 100 100

lassegnazione di probabilit. Il valor medio

2 1 3 15 25 63
EP (f ) = ; ; ; ; (5; 10; 8; 6; 4) =
10 10 10 100 100 10

il pagamento medio dellattivit f . N


202 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

I titoli nanziari sono un notevole esempio di variabili aleatorie. Il pagamento di


un titolo nanziario (per esempio, unobbligazione) dipende dal vericarsi degli stati
del mondo di uno spazio . Lattivit quindi rappresentata da una variabile aleatoria
f : ! R, dove f (!) il pagamento del titolo se si verica lo stato ! 2 .
Nella Sezione 3.7 si era introdotto uno spazio = f! 1 ; :::; ! m g di possibili stati del
mondo che possono vericarsi al tempo 1, e i titoli erano stati modellati come vettori

y = (y1 ; ::; ym ) (8.5)

di Rm dove yk il pagamento del titolo qualora si verichi lo stato ! i 2 . Alla luce


della (8.3) ci del tutto coerente col considerare il titolo come variabile aleatoria:
infatti, se denotiamo con
yi = f (! i )
il valore che assume in ! i , per i = 1; : : : ; m, il titolo pu essere identicato con il
vettore in Rm che ne elenca i vari possibili pagamenti nali, cio col vettore (8.5) che
un esempio di scrittura (8.4).

La rappresentazione come vettori dei titoli spesso molto utile, come dimostra
lanalisi della Sezione 3.7. Non si deve per mai dimenticare la loro natura di variabili
aleatorie.

OfB. Il lettore attento avr anche osservato come tutto ci mostri che i vettori di uno
spazio euclideo Rm si possano vedere come funzioni a valori reali denite su un insieme
nito di cardinalit m. In corsi successivi losservazione sar di grande importanza.H

8.4 Probabilit semplici


La coppia ( ; P ) formata da uno spazio di stati del mondo e da una misura di proba-
bilit si dice spazio di probabilit. Esso descrive come lincertezza si pu risolvere e con
quali probabilit. Per ssare le idee sinora abbiamo considerato spazi di probabilit
con niti. Lestensione a spazi qualunque , per fortuna, ovvia:

Denizione 56 Una funzione di insieme P : 2 ! R si dice misura di probabilit


su se:

(i) P (A) 0 per ogni A;

(ii) P (A [ B) = P (A) + P (B) quando A \ B = ;;

(iii) P (;) = 0 e P ( ) = 1.

Quanto visto sinora il caso speciale di nito.


n
Esempio 124 Se = Rn , la misura di probabilit P : 2R ! [0; 1] assegna a ogni
sottoinsieme A di Rn la probabilit P (A). N
8.4. PROBABILIT SEMPLICI 203

La nozione di variabile aleatoria non presenta alcuna novit quando innito:


esse sono sempre funzioni f : ! R che a ogni stato del mondo ! 2 associano
la conseguenza f (!). Vi , tuttavia, unimportante complicazione: denire il valor
medio su spazi di cardinalit qualunque presenta sostanziali di colt, che volentieri
lasciamo a corsi successivi (di Teoria della misura e integrazione). Per evitare tali
problemi, dobbiamo restringerci alla seguente classe di misure di probabilit.

Denizione 57 Una misura di probabilit P : 2 ! [0; 1] si dice semplice se esiste


un evento nito E tale che
P (E) = 1

Bench denite su spazi di cardinalit qualunque, le probabilit semplici concen-


trano tutta la loro probabilit su un sottoinsieme nito di stati. Infatti, P ( E) =
P ( ) P (E) = 1 1 = 0.

Esempio 125 Se = R, la probabilit P : 2R ! [0; 1] tale che P ( 2) = 1=3 e


P ( ) = 2=3 una probabilit semplice su R. N

Tutte le probabilit sono semplici quando nito; il converso per del tutto
falso: come vedremo tra breve, esistono probabilit semplici molto importanti che sono
denite su spazi inniti. In altre parole, bench concentrino la probabilit su un evento
nito, le probabilit semplici formano unimportante classe di misure di probabilit su
spazi di cardinalit qualunque.

Sia dunque P una probabilit semplice su di cardinalit qualunque. Linsieme

f! 2 : P (!) > 0g

degli stati con probabilit strettamente positiva si dice supporto di P , indicato con
supp P . Il supporto formato dagli stati che eettivamente la misura di probabilit
ritiene possibili: gli stati al di fuori del supporto hanno probabilit nulla.

Lemma 93 Il supporto un insieme nito di probabilit uno.

Dim. Sia P una probabilit semplice. Per denizione esiste un evento nito E tale
che P (E) = 1. Quindi, P (!) = 0 se ! 2 = E, il che implica supp P E. Ne segue
che supp P un insieme nito. Inoltre, gli stati di E che non appartengono a supp P
hanno probabilit zero, cio P (!) = 0 se ! 2 E supp P . Grazie alladditivit ci
implica P (E supp P ) = 0, sicch

1 = P (E) = P (supp P [ (E supp P )) = P (supp P )+P (E supp P ) = P (supp P )

come desiderato.
204 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

Quindi, supp P un insieme nito e P (supp P ) = 1. Da ci segue che dato un


evento A qualsiasi
X
P (A) = P (A \ supp P ) = P (!)
!2A\supp P

In altre parole, la probabilit di un evento A la somma delle probabilit degli stati


del supporto che esso contiene.

La nozione di supporto permette di estendere in modo naturale la nozione di valor


medio a probabilit semplici:

Denizione 58 Il valor medio di una variabile aleatoria f : ! R rispetto a una


probabilit semplice P dato da
X
EP f = f (!) P (!)
!2supp P

Il valor medio considera la variabile aleatoria solo sugli stati del supporto, som-
mandone i valori pesati per le rispettive probabilit. Quando nito si ritrova la
nozione di valor medio (8.2) dellultima sezione.

Esempio 126 Secondo la probabilit P : 2R ! [0; 1] dellultimo esempio, il valor


medio di una variabile aleatoria f : R ! R
1 2
EP f = f ( 2) P ( 2) + f ( ) P ( ) = f ( 2) +f( )
3 3
N

Chiudiamo con una nota terminologica: nel seguito uno spazio di probabilit ( ; P )
si dir semplice se la probabilit P semplice.

8.5 Utilit attesa


In ambito deterministico le preferenze % di un decisore tra le diverse alternative di
un insieme di scelta A Rn sono descritte da una funzione di utilit u : A ! R.
Sinora abbiamo assunto che A fosse un sottoinsieme di Rn , dove con n = 1 di solito si
descrivono importi monetari e con n > 1 panieri di beni. Ma in linea di principio gli
elementi di A possono essere di natura assolutamente arbitraria. Per tale ragione, nel
seguito lo indicheremo con la lettera C, sicch u : C ! R la funzione di utilit, di cui
diamo in questa sezione uninterpretazione cardinalista: u (c) misura la soddisfazione
dellagente proveniente dalla conseguenza c 2 C.

Lincertezza rende aleatorie le alternative, il cui risultato non pi certo ma ,


invece, legato al vericarsi degli stati del mondo. Per esempio, mentre in ambito
8.5. UTILIT ATTESA 205

deterministico lagente considerava diversi importi monetari secondo una funzione di


utilit u : C R ! R, lincertezza gli richiede di poter considerare titoli nanziari
che pagano importi monetari diversi a seconda di quale stato del mondo si verichi.
In altre parole, linsieme C diventa ora la collezione delle possibili conseguenze che le
alternative aleatorie possono avere nei vari stati in . Tutto ci motiva la seguente
denizione:

Denizione 59 Una funzione f : ! C detta atto.

Nel caso C R di consequenze monetarie, ritroviamo la nozione di variabile aleato-


ria, qui interpretata come atto monetario (ossia come alternativa aleatoria che associa
importi di denaro ai diversi stati del mondo). Naturalmente, i titoli nanziari sono
lesempio fondamentale di atto monetario.

Sia F linsieme di tutti gli atti f : ! C. La preferenza % del decisore ora su


F: la scrittura f % g indica che egli preferisce latto f allatto g. La coppia (F; %)
rappresenta un problema di decisione in condizioni di incertezza.
Come rappresentiamo le preferenze % dellagente tra le alternative aleatorie in F?
In altre parole, come estendiamo la funzione di utilit u : C ! R sulle conseguenze a
un criterio di scelta V : F ! R sugli atti? Vi , per fortuna, una risposta semplice e
naturale a tale fondamentale questito: si ordinano gli atti in base alla loro cosiddetta
utilit attesa, cio al valor medio delle utilit degli importi:
X
EP u (f ) = u (f (!)) P (!) (8.6)
!2supp P

dove P una probabilit semplice sugli stati del mondo. In altre parole, si pone

V (f ) = EP u (f ) 8f 2 F

Secondo il Criterio dellutilit attesa, introdotto nel 1738 da Daniel Bernoulli, si ha

f % g () EP u (f ) EP u (g)

cio un atto preferito quando, in media, procura utilit maggiore. Ne consegue che
f e g sono indierenti se e solo se EP u (f ) = EP u (g).

La funzione u in (8.6) detta utilit Bernoulliana, in onore di Daniel Bernoulli. Nel


caso C R di consequenze monetarie, classici esempi di tali funzioni sono la lineare
u (c) = c, la quadratica u (c) = c2 , la potenza u(c) = c con 0 < < 1, lesponenziale
negativa u (c) = e c e la logaritmica u (c) = log c (questultima fu la funzione di
utilit originariamente proposta da Bernoulli). Secondo tali funzioni lutilit attesa
EP u (f )
X
n X
n X
n X
n X
n
c i Pi ; c2i Pi ; c i Pi ; e ci
Pi ; log (ci ) Pi
i=1 i=1 i=1 i=1 i=1
206 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

In particolare, nel caso di utilit lineare lutilit attesa


X
n
EP u (f ) = c i Pi
i=1

si dice valore atteso.

Una propriet molto naturale delle funzioni di utilit del denaro la stretta crescen-
za
c > c0 =) u (c) > u (c0 )
che assegna maggior utilit a maggiori quantit di denaro. Le utilit lineari ed espo-
nenziali negative soddisfano tale propriet su tutta la retta reale e possono quindi
considerare sia guadagni sia perdite. Per esempio la scommessa equa (8.1) ha utilit
attesa zero secondo lutilit lineare, mentre ha utilit attesa
1 50 1 1 50
EP u (f ) = e + e50 = e +e 50
2 2 2
secondo lesponenziale negativa. Al contrario, lutilit quadratica strettamente monotona
solo su [0; 1), ossia per importi positivi. Inne, lutilit logaritmica per sua natura
pu considerare solo importi strettamente positivi, mentre lutilit potenza solo importi
positivi.

8.6 Lotterie
Sia ( ; P ) uno spazio di probabilit qualsiasi. Consideriamo un atto f : ! C che
ad ogni stato associa una conseguenza (per esempio monetaria quando f un titolo
nanziario).
Dato c 2 C, la curva di livello
1
f (c) = f! 2 : f (!) = cg

raccoglie tutti gli stati che, tramite la variabile aleatoria f , hanno c come conseguenza.
Nel caso di un titolo nanziario, f 1 (c) linsieme degli stati dove il titolo paga la
somma c 2 C.
La curva di livello f 1 (c) un evento, ossia un sottoinsieme di . In quanto tale
si verica con probabilit
P f 1 (c)
In altre parole, la variabile aleatoria f fa s che la conseguenza c si verichi con
probabilit P (f 1 (c)).
Pi in generale, dato un insieme di conseguenze D C la sua controimmagine
f 1 (D) linsieme
f 1 (D) = f! 2 : f (!) 2 Dg
8.6. LOTTERIE 207

degli stati le cui conseguenze secondo f appartengono a D. Per un titolo nanziario,


se D per esempio un intervallo [a; b] la controimmagine f 1 ([a; b]) linsieme degli
stati dove il titolo paga la somma che appartiene allintervallo.
Anche la controimmagine f 1 (D) un evento, con probabilit
1
P f (D)
La variabile aleatoria f fa s che la conseguenza c appartenga allinsieme D con
probabilit P (f 1 (D)).
Tutto ci porta a considerare la funzione dinsieme pf : 2C ! [0; 1] denita da
1
pf (D) = P f (D) 8D C
che assegna una probabilit a ogni insieme di conseguenze D. Grazie alla Denizione
56 possiamo rendere rigoroso tutto ci.
Lemma 94 La funzione di insieme pf : 2C ! [0; 1] denita da
1
pf (D) = P f (D) 8D C
una misura di probabilit su C. Essa semplice se la probabilit P semplice.
Dim. Le propriet (i) e (iii) della Denizione 56 sono conseguenze del fatto che P
una misura di probabilit su e che f 1 (C) = e f 1 (;) = ;.
Per la (ii), siano C e D due sottoinsiemi disgiunti di C. Poich f 1 (C)\f 1 (D) = ;
e f 1 (C [ D) = f 1 (C) [ f 1 (D), si ha
1
pf (C [ D) = P f (C [ D) = P f 1 (C) [ f 1 (D)
1
= P f (C) + P f 1 (D) = pf (C) + pf (D)
come desiderato.
Rimane da mostrare la semplicit di pf quando P semplice. Poich il supporto
di P nito, la sua immagine f (supp P ) = ff (!) : ! 2 supp P g un insieme nito
in C. Per semplicit di notazione, si ponga A = f (supp P ). Si ha
1
pf (A) = P f (A) = P (f! 2 : f (!) 2 Ag) = P (supp P ) = 1
e quindi limmagine A prende le parti dellinsieme E nella Denizione 57. Ne segue
che pf una probabilit semplice.
La probabilit pf si dice probabilit o lotteria1 indotta da f su C. La nozione molto
importante di per s, come vedremo nel resto della sezione. Ma anche importante dal
punto di vista metodologico perch mostra la generalit della Denizione 56: bench
gli elementi di C non siano stati di natura ma conseguenze, tale denizione si applica
e permette di parlare di probabilit anche delle conseguenze2 .
1
Il termine lotteria ricorda le origini del Calcolo delle probabilit, che nacque verso la met del
Seicento con lo studio dei giochi dazzardo.
2
qui quantomai importante che il lettore vada oltre i simboli, in questo caso piuttosto che C,
e aerri lessenza matematica delle nozioni.
208 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

Esempio 127 Riprendendo lEsempio 121, dove C = R, la misura di probabilit


indotta pf : 2R ! [0; 1] con

pf (1:300) = P (a) ; pf (3:600) = P (b)


pf (11:500) = P (c) ; pf (0) = P (d)

descrive la probabilit delle perdite dellazienda dellEsempio 121. N

Esempio 128 La lotteria indotta da un titolo nanziario descrive le probabilit dei


diversi pagamenti del titolo. N

La lotteria pf informa su quali siano le probabilit delle varie conseguenze che latto
f determina. Atti diversi f : ! R e g : ! R possono indurre le stesse lotterie,
cio pf = pg , come mostra il prossimo semplice esempio.

Esempio 129 Si lancia una moneta. Le due scommesse

10 euro se ! = T 0 euro se ! = T
f (!) = ; g (!) =
0 euro se ! = C 10 euro se ! = C

sono due atti monetari su = fT; Cg. Se la probabilit P attribuisce probabilit 1=2
sia a T sia a C, si ha
8
1
>
> se c = 10
< 2
1
pf (c) = pg (c) = se c = 0
2
>
>
: 0 altrimenti

e quindi f e g inducono la stessa lotteria. N

Bench la lotteria pf contenga informazioni essenziali sullatto f , lesempio mostra


quali informazioni si perdono trascrivendo un atto come lotteria: non si sa pi qual
la conseguenza vinta nei vari stati del mondo, ma solo con quale probabilit essa
vinta. Nellesempio precedente, entrambe le scommesse si trascrivono con la stessa
probabilit sulle conseguenze cosicch non possibile sapere in quali casi si vincono
10 o 0 euro. Pi in generale, solo la conoscenza dellatto e dello spazio di probabilit
sottostante consente di capire la genesi delle probabilit che la lotteria assegna alle
diverse conseguenze: dal punto di vista della lotteria tali probabilit sono del tutto
esogene.

Quanto visto sinora, e in particolare la Denizione 94, vale per spazi di probabilit
( ; P ) qualsiasi. per giunto il momento di considerare i valor medi e dobbiamo
quindi restringerci al caso di spazi di probabilit semplici perch, grazie al Lemma 94,
essi garantiscono che le probabilit indotte siano anchesse semplici.
8.6. LOTTERIE 209

Sia dunque ( ; P ) uno spazio di probabilit semplice e sia C un insieme di con-


seguenze. Dato qualsiasi atto f : ! C, la probabilit indotta pf semplice ed
quindi ben denito il valor medio
X
Epf (u) = pf (c) u (c)
c2supp pf

della funzione di utilit u : C ! R.3 Il prossimo risultato fondamentale:


Teorema 95 Sia ( ; P ) uno spazio di probabilit semplice e sia C un insieme di
conseguenze. Per ogni atto f : ! C si ha
Epf (u) = EP (u f )
cio X X
pf (c) u (c) = u (f (!)) P (!) (8.7)
c2supp pf !2supp P

In altre parole, lutilit attesa EP (u f ) dellatto f rispetto alla probabilit di


base P uguale al valor medio Epf (u) della funzione di utilit rispetto alla probabilit
indotta. Per tale ragione il valor medio Epf (u) si dice utilit attesa della lotteria pf .
Dim. Poich P semplice, possiamo porre supp P = f! 1 ; :::; ! n g. Si ponga ci = f (! i )
per ogni i, cio f (supp P ) = fc1 ; :::; cn g. Supponiamo, per semplicit, che i valori ci
siano distinti tra loro4 . Ci implica
1
pf (ci ) = P f (ci ) = P (! i ) > 0 8i = 1; :::; n
mentre pf (c) = 0 se c 2
= f (supp P ). Ne segue che
supp pf = f (supp P ) = fc1 ; :::; cn g
e quindi:
X X
n X
n X
u (f (!)) P (!) = u (f (! i )) P (! i ) = u (ci ) pf (ci ) = P (c) u (c)
!2supp P i=1 i=1 c2supp pf

come desiderato.
Il teorema conferma limportanza delle lotterie: equivalente ordinare secondo lu-
tilit attesa gli atti o le lotterie indotte. Per lutilit attesa contano solo le conseguenze
che gli atti determinano e le probabilit con le quali si vericano. In altri termini, la
lotteria pf distilla dallatto f tutte le informazioni rilevanti per lutilit attesa.
Del resto, ragionevole che di un titolo nanziario interessi i pagamenti e le prob-
abilit con i quali essi si vericheranno e nullaltro. Due titoli nanziari che inducono
la stessa probabilit sui pagamenti sono indistinguibili dal punto di vista economico.
3
Il lettore attento avr gi osservato che, dal punto di vista formale, la funzione di utilit u : C ! R
una variabile aleatoria sullo spazio di probabilit (C; pf ).
4
Se ci non fosse, basterebbe raggruppare gli stati che hanno uguali conseguenze secondo f e
ripetere la dimostrazione per la partizione del supporto cos costruita. Lasciamo i dettagli al lettore
interessato.
210 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT

8.7 Atti o lotterie?


Alla luce di quanto appena discusso, nelle applicazioni spesso si considerano diretta-
mente le lotterie, senza specicare quali atti e spazi di probabilit le inducano. Un
titolo nanziario si descrive con una lotteria p su R, senza pi pedice che ci ricordi
latto f che la induce. In altre parole, le probabilit dei vari pagamenti sono specicate
in modo esogeno, senza alcuna modellizzazione della loro possibile genesi.

Esempio 130 La lotteria p su R tale che p (10) = p (50) = 1=2 descrive un titolo
nanziario che paga con egual probabilit 10 e 50 euro. N

In generale, dato un insieme C di conseguenze, sia (C) linsieme delle lotterie su


C con supporto nito. Consideriamo un decisore che ha una preferenza % su (C):
qui la scrittura p % q indica che egli preferisce la lotteria p alla lotteria q. La coppia
( (C) ; %) rappresenta un problema di decisione in condizioni di rischio. Lincertezza
espressa da una lotteria quindi chiamata rischio.
Secondo il Criterio dellutilit attesa:

p % q () Ep u (c) Eq u (c)

ossia le lotterie p; q 2 (C) si ordinano secondo le loro utilit attese.

Esempio 131 Consideriamo la lotteria p dellultimo esempio e la lotteria q su R tale


che q (5) = 1=3, q (20) = 1=6 e q (75) = 1=2 descrive un altro titolo nanziario, che
paga 5 euro con probabilit 1=3, 20 euro con probabilit 1=6 e 75 euro con probabilit
1=2. Il titolo nanziario p preferito al titolo q se e solo se
1 1 1 1 1
u (10) + u (50) u (5) + u (20) + u (75)
2 2 3 6 2
N

Luso delle lotterie ha un altro importante vantaggio. Supponiamo di dover con-


siderare titoli nanziari quotati su mercati diversi, per esempio un titolo americano
f : ! R e un titolo europeo g : 0 ! R. La diversit dei mercato fa s che gli
spazi di probabilit ( ; P ) e ( 0 ; P 0 ) rilevanti per i due titoli sono diversi. Tuttavia, le
lotterie pf e p0g che esse inducono vivono sul medesimo spazio di conseguenze R, cio
appartengono entrambe allo spazio delle lotterie (R), il che permette di confrontare
le loro utilit attese Epf u (c) e Ep0g u (g) e ordinarle di conseguenza. Risulta perci par-
ticolarmente comodo dal punto di vista modellistico descrivere tali titoli come lotterie
su R, senza specicare gli atti e spazi di probabilit sottostanti.

Detto ci, lesogeneit delle probabilit p (c) che caratterizza i problemi di decisione
in condizioni di rischio , al contempo, la forza e il limite di tale approccio. La forza
nella semplicit di una lotteria p 2 (C) rispetto alla specicazione di uno spazio
di probabilit ( ; P ) e di un atto f : ! C i quali, oltretutto, possono essere diversi
8.7. ATTI O LOTTERIE? 211

come appena visto per i titoli quotati su mercati diversi. Grazie alla (8.7), lutilit
attesa la stessa: la lotteria ha in s tutto ci che rilevante per tale criterio.
Daltro canto, lEsempio 129 mostra quali informazioni si perdono considerando
solo le lotterie p 2 (C). In particolare, solo la specicazione dello spazio di probabil-
it e degli atti permette di dar conto della genesi delle probabilit p (c), che le lotterie
p 2 (C) prendono invece a scatola chiusa. La modelizzazione con spazi di probabilit
e atti quindi pi impegnativa, ma anche molto pi informativa.
Riassumendo, vi un trade-o tra il modellare un problema di scelta aleatorio
come problema di decisione in condizioni di incertezza piuttosto che di rischio, ossia
con atti e non con lotterie. In alcuni casi la semplicit delle lotterie le rende la scelta
naturale, in altri casi invece la maggior completezza degli atti a essere rilevante. Sia
come sia, importante capire entrambe le possibili modelizzazione e, soprattutto, i loro
strettissimi legami: dietro la coppia ( (C) ; %) vi sempre un problema di decisione
in condizioni di incertezza, sia esso esplicitamente modellato o meno. Tale coppia la
forma ridottadel pi generale problema di decisione in condizioni di incertezza che
la sottende.
212 CAPITOLO 8. APPLICAZIONE: FUNZIONI DI INSIEME E PROBABILIT
Capitolo 9

Successioni

9.1 Il concetto
Una successione un elencodi inniti numeri reali, per esempio
f2; 4; 6; 8; :::g ; (9.1)
dove ogni numero occupa un posto dordine, cio segue (eccetto il primo) e precede
un altro numero reale. La prossima denizione formalizza lidea. Con N+ indichiamo
linsieme dei naturali privato dello 0.
Denizione 60 Una funzione f : N+ ! R si dice successione di numeri reali.
In altre parole, una successione una funzione che associa a ogni numero naturale
n 1 un numero reale f (n). Nellesempio (9.1), a ogni n si associa f (n) = 2n, ossia
n 7 ! 2n; (9.2)
e si ha cos la successione dei numeri pari. Limmagine f (n) si indica di solito con
xn . Con tale notazione, la successione dei numeri pari si denisce ponendo xn = 2n
per ogni n 1. Le immagini xn sono chiamate termini (o elementi) della successione.
Indicheremo con fxn g1 1
n=1 , o brevemente con fxn g, una generica successione .

Vi sono vari modi per denire una successione fxn g, ossia per descrivere la sot-
tostante funzione f : N+ ! R. Un primo modo descriverla in forma chiusa, cio
attraverso una formula: per esempio, quanto abbiamo fatto con la successione dei
pari usando la formula (9.2) per denirla. Altre formule denitorie sono per esempio
n 7 ! 2n 1; (9.3)
n 7 ! n2 ; (9.4)
1
n 7 ! p : (9.5)
2n 1
1
La scelta di far partire la successione da n = 1 invece di n = 0 una mera convenzione. In
contesti dove risultasse pi e cace partire da n = 0, perfettamente legittimo considerare successioni
1
fxn gn=0 .

213
214 CAPITOLO 9. SUCCESSIONI

La formula (9.3) d luogo alla successione dei numeri interi dispari

f1; 3; 5; 7; g; (9.6)

la formula (9.4) a quella dei quadrati

f1; 4; 9; 16; g;

mentre la (9.5) denisce la successione


1 1 1
1; p ; p ; p ; : (9.7)
2 4 8
Un altro modo importante per denire una successione per ricorrenza (o induzione
o ricorsione). Consideriamo la classica successione di Fibonacci

f0; 1; 1; 2; 3; 5; 8; 13; 21; 34; 55; g

nella quale ogni termine la somma dei due che lo precedono. Per esempio, nella
quarta posizione troviamo il numero 2, ovvero la somma 1 + 1 dei due termini che lo
precedono, e cos via. La sottostante funzione f : N+ ! R quindi

f (1) = 0 ; f (2) = 1
(9.8)
f (n) = f (n 1) + f (n 2) per n 2

Abbiamo quindi due valori iniziali, f (1) = 0 e f (2) = 1, e una regola ricorsiva che
permette di calcolare il termine di posizione n una volta che siano noti i due termini
precedenti. A dierenza delle successioni denite attraverso una formula chiusa, per
determinare il termine xn , si devono ora preventivamente costruire, usando la regola
ricorsiva, tutti termini che lo precedono. Per esempio, per calcolare il termine x100 nella
successione (9.6) dei dispari, basta sostituire n = 100 nella formula (9.3), trovando
cos x100 = 199. Invece, per calcolare il termine x100 nella successione di Fibonacci si
devono necessariamente dapprima ricostruire per ricorrenza i primi 99 termini della
successione. Infatti, vero che per determinare x100 basta conoscere i valori di x99 e
x98 e poi usare la regola x100 = x99 + x98 , ma per determinare x99 e x98 si devono prima
conoscere x97 e x96 , e cos via.
Quindi, la denizione ricorsiva di una successione consta di uno o pi valori iniziali
e di una regola di ricorrenza che, a partire da essi, permette di costruire i vari termini
della successione. I valori iniziali sono arbitrari. Per esempio, se in (9.8) scegliamo
f (1) = 2 e f (2) = 1 abbiamo la seguente successione di Fibonacci

f2; 1; 3; 4; 7; 11; 18; 29; 47; g

Esempio 132 Fissati a; b 2 R qualsiasi,

f (1) = a
:
f (n) = f (n 1) + b per n 2
9.1. IL CONCETTO 215

Il valore iniziale f (1) = a, a partire dal quale si pu ricostruire tutta la successione


attraverso la formula ricorsiva f (n) = f (n 1) + b. Tale successione chiamata
aritmetica con primo termine a e ragione b. Per esempio, se a = 2 e b = 4, si ha

f2; 6; 10; 14; 18; 22; g:

. N

Esempio 133 La successione con xn = 1=n, cio

1 1 1 1
1; ; ; ; ;
2 3 4 5

detta armonica2 , mentre la successione con xn = aq n 1 , cio

a; aq; aq 2 ; aq 3 ; aq 4 ;

detta geometrica di primo temine a e ragione q. N

Purtroppo non tutte le successioni si possono descrivere in forma chiusa o ricorsiva.


Lesempio pi noto in proposito la successione fpn g dei numeri primi, che innita
per il Teorema 14 di Euclide, ma della quale non si conosce alcuna descrizione esplicita.
In particolare:

(i) Dato n non si conosce alcuna formula che ci dica qual pn ; in altre parole, la
successione fpn g non denibile in forma chiusa.

(ii) Dato pn non si conosce alcuna formula che ci dica qual pn+1 ; in altre parole, la
successione fpn g non denibile per ricorrenza.

La situazione in realt ancor pi triste:

(iii) Dato un numero primo p qualsiasi non si conosce alcuna formula che ci dia un
numero primo q maggiore di p; in altre parole, la conoscenza di un numero primo
non d alcuna informazione sui numeri primi successivi.

Non si ha quindi la bench minima idea su come i numeri primi si susseguono,


cio di quale sia la forma della funzione f : N+ ! R che denisce tale successione.
Non ci resta che considerare via via tutti i naturali e determinare, ad uno ad uno, se
sono primi o composti attraverso i cosiddetti test di primalit cui si accennato nella
Sezione 1.3. Avendo a disposizione leternit potremo costruire, termine per termine,
la successione fpn g. Pi modestamente, nel breve tempo intercorso tra Euclide e noi
si sono costruite tavole di numeri primi che riportano i termini della successione fpn g
2
detta armonica perch 1=2; 1=3; 1=4; sono le posizioni nelle quali mettere un dito su una
corda vibrante per ottenere le diverse note.
216 CAPITOLO 9. SUCCESSIONI

no a numeri ormai molto elevati per noi, ma pur sempre inizie rispetto allinnit di
tutti i numeri primi.
OfB Circa losservazione (iii), per secoli si cercata una regola che, dato un numero
primo p, permettesse di trovarne uno pi grande q > p secondo una funzione q = f (p).
Un celebre esempio di tale ricerca dato dai numeri primi di Mersenne. Un numero
primo si dice di Mersenne se pu essere scritto nella forma 2p 1 con p primo. Si pu
mostrare che se 2p 1 primo, allora anche p lo . Per secoli si creduto (o sperato)
che valesse il, ben pi interessante, converso: p primo implica 2p 1 primo. Tale
congettura fu denitivamente smentita nel 1536 quando Hudalricus Regius dimostr
che
211 1 = 2047 = 23 89;
trovando quindi il primo controesempio a tale congettura: p = 11 non la soddisfa. In
ogni caso i numeri di Mersenne sono tra i pi importanti numeri primi. In particolare,
il pi grande numero primo noto al 2010

243112609 1

che ha 12837064 cifre ed un numero di Mersenne (la cui primalit stata determinata
nel 2008). H

9.2 Lo spazio delle successioni


Indichiamo con R1 lo spazio di tutte le successioni x = fxn g di numeri reali3 . In-
dichiamo quindi con x un generico elemento di R1 che, scritto in forma estesa,
diventa
x = fxn g = fx1 ; x2 ; : : : ; xn ; : : :g :
Le operazioni viste sulle funzioni nella Sezione 7.3.2 hanno come caso particolare
le operazioni sulle successioni, ossia tra elementi dello spazio R1 . In particolare, date
due successioni x = fxn g e y = fyn g in R1 , si hanno:

(i) la successione somma (x + y)n = xn + yn per ogni n 1;

(ii) la successione dierenza (x y)n = xn yn per ogni n 1;

(iii) la successione prodotto (xy)n = xn yn per ogni n 1;

(iv) la successione rapporto (x=y)n = xn =yn per ogni n 1, purch yn 6= 0.


3
Talvolta si ha a che fare con insiemi di vettori di lunghezza variabile: per esempio se i vettori
sono proli di consumo, potrebbe darsi che alcuni di essi abbiano durata 3, altri 5, altri ancora 12,
ecc.. Se non vi una durata massima, lunica possibilit di immaginare che tutti i proli di consumo
abbiano durata illimitata (siano cio successioni in R1 ), completando ciascuno con inniti zeri.
9.2. LO SPAZIO DELLE SUCCESSIONI 217

In vista della (i), per comodit di notazione, indicheremo la somma direttamente


come fxn + yn g invece che come f(x + y)n g, e lo stesso faremo per le altre operazioni4 .

Su R1 si ha una struttura dordine con caratteristiche simili a quelle viste per Rn .


In particolare, date x; y 2 R1 , si scrive:

(i) x y se xn yn per ogni n 1;

(ii) x > y se x y e x 6= y, ossia se x y ed esiste almeno una posizione n tale che


xn > y n ;

(iii) x y se xn > yn per ogni n 1.

Ancora, (iii) =) (ii) =) (i), cio

x y)x>y)x y 8x; y 2 R1

Le funzioni g : A R1 ! R denite su sottoinsiemi di R1 sono molto impor-


tanti. Grazie alla struttura dordine di R1 abbiamo una loro prima classicazione
per monotonia, analoga a quella vista per Rn nella Sezione 7.4.4. Una funzione
g : A R1 ! R si dice:

(i) crescente se
x y ) g (x) g (y) x; y 2 A; (9.9)

(ii) fortemente crescente se

x y ) g (x) > g (y) x; y 2 A;

(iii) strettamente crescente se

x > y ) g (x) > g (y) x; y 2 A:

Le controparti decrescenti di queste nozioni si deniscono in modo analogo. Ancora,


in particolare, g costante se esiste k 2 R tale che

g (x) = k 8x 2 A:

Per brevit omettiamo uno studio dettagliato di queste nozioni, e ci limitiamo a


osservare che la stretta crescenza implica le altre due propriet.
4
Si noti che, se f : N+ ! R e g : N+ ! R sono le funzioni sottostanti alle successioni fxn g e fyn g,
la (i) equivale a scrivere (x + y)n = (f + g) (n) = f (n)+g (n) per ogni n 1; analoghe considerazioni
valgono per le altre operazioni (ii)-(iv).
218 CAPITOLO 9. SUCCESSIONI

9.3 Applicazione: scelte intertemporali


Nella Sezione 2.4.3 avevamo visto come lo spazio euclideo RT potesse modellare un
problema di scelta intertemporale del consumatore su T periodi. Tuttavia in molte
applicazioni importante non ssare a priori un orizzonte nito T per il consumatore,
ma immaginare che abbia di fronte a s un orizzonte innito. In questo caso, nella
successione x = fx1 ; x2 ; : : : ; xt ; : : :g, il termine xt indica la quantit del bene consumata
al tempo t, con t = 1; 2; : : :.
Si tratta naturalmente di unidealizzazione, che per serve a modellare in modo
semplice le scelte intertemporali di agenti che non sono in grado di specicare lultimo
periodo T per loro rilevante (per esempio, in alcune scelte intertemporali la data
conclusiva quella del decesso dellagente, che non gli nota a priori).
In analogia a quanto visto nella Sezione 7.2.3, il consumatore ha preferenze sui
possibili proli x = fx1 ; x2 ; : : : ; xt ; : : :g di consumo intertemporale, i cosiddetti ussi
di consumo (consumption streams) quanticati da una funzione di utilit intertem-
porale U : R1+ ! R. Per esempio, se, come nella Sezione 7.2.3, assumiamo che il con-
sumatore abbia, per il consumo xt di ogni periodo, una funzione di utilit ut : R+ ! R,
detta istantanea, una possibile forma della funzione di utilit intertemporale
t 1
U (x) = u1 (x1 ) + u2 (x2 ) + + ut (xt ) +
dove 2 (0; 1) si pu interpretare come un fattore soggettivo di sconto che, come
abbiamo visto, dipende dal grado di pazienza del consumatore.
Le propriet di monotonia delle funzioni di utilit intertemporale U : R1 + ! R
sono analoghe a quelle delle funzioni di pi variabili. In particolare, la funzione U
crescente se
x y =) U (x) U (y) x; y 2 R1
+;

fortemente crescente se crescente e


x y =) U (x) > U (y) x; y 2 R1
+;

ed strettamente crescente se
x > y =) U (x) > U (y) x; y 2 R1
+:

A questo riguardo, valgono considerazioni analoghe a quelle fatte nella Sezione 7.4.4
per funzioni di utilit su Rn . In particolare, anche qui si ha
stretta crescenza ) forte crescenza ) crescenza

9.4 Immagini e classi di successioni


Si osservi che in una successione si possono ripetere pi volte i medesimi valori. Per
esempio, la successione con generico elemento xn = ( 1)n data da
f 1; 1; 1; 1; :::g ; (9.10)
9.4. IMMAGINI E CLASSI DI SUCCESSIONI 219

nella quale si ripetono i due soli valori 1 e 1. La successione costante, con generico
elemento xn = 2 per ogni n 1,
f2; 2; 2; :::g (9.11)
costituita da soli 2 (la corrispondente f quindi la funzione costante f (n) = 2 per
ogni n 1).
Al riguardo importante limmagine
Im f = ff (n) : n 1g
della successione, che consta proprio dei valori che la successione assume, al netto delle
ripetizioni. Per esempio, limmagine della successione (9.10) f 1; 1g, mentre per la
successione costante (9.11) il singoletto f2g. Limmagine d quindi uninformazione
molto importante perch indica quali valori la successione eettivamente assume, al
netto delle ripetizioni: come abbiamo visto, possono essere molto pochi e ripetersi
in continuazione lungo la successione. Daltra parte, la successione (9.6) dei dispari
non contiene alcuna ripetizione, e infatti la sua immagine costituita da tutti i suoi
termini, ossia Im f = f2n 1 : n 1g.

Tramite limmagine, nella Sezione 7.4.3 avevamo studiato varie nozioni di limitatez-
za per funzioni. Nel caso speciale delle successioni, ossia delle funzioni f : N+ ! R,
tali nozioni generali assumono la seguente forma: una successione fxn g si dice
(i) superiormente limitata se esiste k 2 R tale che xn k per ogni n 1;
(ii) inferiormente limitata se esiste k 2 R tale che xn k per ogni n 1;
(iii) limitata se sia superiormente sia inferiormente limitata, ossia se esiste k > 0
tale che jxn j k per ogni n 1.
Per esempio, la successione fxn g = f( 1)n g limitata, mentre quella dei dispari
(9.6) lo solo inferiormente.

Unaltra classe importante di successioni sono le monotone, che si deniscono in


modo analogo a quanto visto per le funzioni nella Sezione 7.4.4. In particolare, una
successione fxn g si dice:
(i) crescente se
xn+1 xn 8n 1;
strettamente crescente se
xn+1 > xn 8n 1;

(ii) decrescente se
xn+1 xn 8n 1;
strettamente decrescente se
xn+1 < xn 8n 1;
220 CAPITOLO 9. SUCCESSIONI

(iii) costante se sia crescente sia decrescente, ossia se esiste k 2 R tale che

xn = k 8n 1:

Una successione crescente o decrescente si dice monotona 5 . Per esempio, la suc-


cessione (9.6) dei dispari crescente, mentre la successione (9.7) decrescente.

Un concetto molto importante riguarda le propriet denitivamente godute da una


successione:

Denizione 61 Si dice che una successione possiede denitivamente una propriet


P se, a partire da un certo posto dordine n = nP , tutti i termini della successione
godono di P.

Ovviamente, il posto dordine n dipende dalla propriet P: abbiamo scritto infatti


n = nP .

Esempio 134 (i) La successione f2; 4; 6; 32; 57; 1; 3; 5; 7; 9; 11; g denitiva-


mente crescente: infatti, a partire dal sesto termine, la successione crescente.

(ii) La successione fng denitivamente 1:000: infatti, tutti i termini della


successione, a partire da quello di posto 1:000, sono 1:000.

(iii) La stessa successione anche denitivamente 1:000:000:000 e anche 10123 .

(iv) La successione f1=ng denitivamente minore di 1=1:000:000.

(v) La successione

f27; 65; 13; 32; ; 125; 32; 3; 3; 3; 3; 3; 3; 3; 3; g

denitivamente costante. N

OfB. Per godere denitivamente di una propriet, la successione, da piccola, pu


fare ci che vuole; limportante che da grande(ovvero da un certo posto dordine
in poi), metta la testa a posto. I peccati di giovent non interessano: importante
che, prima o poi, tutti i termini della successione godano della propriet. H
5
Per le successioni le nozioni di stretta monotonia sono poco importanti.
9.5. LIMITI: ESEMPI INTRODUTTIVI 221

9.5 Limiti: esempi introduttivi


Il concetto di limite nasce per formalizzare rigorosamente il concetto di come si com-
porta una successione per n sempre pi grande, ossia asintoticamente. In altre parole,
come per un romanzo giallo, ci si chiede come andr a nire. Per le successioni i cui
termini rappresentano i valori che una quantit economica assume in date successive,
in economia si parla di comportamento di lungo periodo(o tendenziale).
Cominciamo con alcuni esempi, per capire intuitivamente che cosa si intende per
limite di una successione. Consideriamo la successione (9.7)

1 1 1
1; p ; p ; p ; :
2 4 8
Proseguendo conpi valori, si pu vericare che, per valori di n sempre pi grandi, i suoi
termini xn = 1= 2n 1 si avvicinano sempre pi, si dice tendono, al valore L = 0.
In questo caso si dice che la successione tende a 0 e si scrive
1
lim p = 0:
n!1 2n 1

Per la successione (9.6) dei dispari

f1; 3; 5; 7; g;

i termini xn = 2n 1 della successione sono sempre pi grandi per valori sempre pi


grandi di n. In questo caso si dice che la successione diverge positivamente, e si scrive

lim (2n 1) = +1:


n!1

Specularmente, la successione dei dispari negativi xn = 2n+1 diverge negativamente:


in simboli
lim ( 2n + 1) = 1:
n!1

Inne, consideriamo la successione xn = ( 1)n :

f 1; 1; 1; 1; g:

Al variare dei valori di n essa continua a oscillare tra i valori 1 e 1, senza avvicinarsi
(denitivamente) ad alcun particolare valore. In questo caso si dice che la successione
oscillante o irregolare: non ammette limite.

9.6 Limiti e comportamento asintotico


Negli esempi introduttivi abbiamo identicato tre possibili comportamenti asintotici
dei termini di una successione:
222 CAPITOLO 9. SUCCESSIONI

(i) convergenza ad un valore L 2 R;


(ii) divergenza a +1 o a 1;
(iii) oscillazione.
Nei primi due casi si dice che la successione regolare: essa tende (si avvicina
asintoticamente) a un valore, eventualmente innito. Nellultimo caso si dice che la
successione irregolare (o oscillante). Nel resto della sezione formalizziamo lidea
intuitiva di tendere a un valore.

9.6.1 Convergenza
Cominciamo con la convergenza, cio col caso (i).
Denizione 62 Una successione fxn g converge a un punto L 2 R, in simboli xn ! L
o limn!1 xn = L, se per ogni " > 0 esiste n" 1 tale che
n n" =) jxn Lj < ": (9.12)
Il numero L si dice limite della successione.
Limplicazione (9.12) si pu riscrivere come
n n" =) d (xn ; L) < ":
Quindi, una successione fxn g converge a L quando, per ogni quantit ", quantunque
piccola (ma positiva), esiste un posto dordine n" (che dipende da "!) a partire dal
quale la distanza tra i termini xn della successione e il limite L sempre minore di ",
ossia d (xn ; L) < " per ogni n n" . Una successione fxn g che converge a un punto
L 2 R si dice convergente.
S detto che la posizione n" dipende da ". Inoltre, come dovrebbe risultare chiaro
dai prossimi Esempi 135 e 136, la scelta di n" non aatto univoca: se esiste una
posizione n" tale che jxn Lj < " per ogni n n" , lo stesso vale per qualsiasi posizione
successiva che pu anchessa essere scelta come n" . La scelta di quale tra queste
posizioni chiamare n" del tutto irrilevante: la denizione chiede che ne esista (almeno)
una. I due esempi che tra breve presenteremo dovrebbero chiarire la questione.
La denizione di convergenza si pu riscrivere anche con il linguaggio degli intorni.
Si tratta di una riscrittura molto importante dal punto di vista concettuale che merita
una menzione separata.
Denizione 63 Una successione fxn g converge a un punto L 2 R se per ogni intorno
B" (L) di L esiste n" 1 tale che
n n" ) xn 2 B" (L) ;
ovvero che
n n" ) L " < xn < L + ":
9.6. LIMITI E COMPORTAMENTO ASINTOTICO 223

In altre parole, una successione fxn g tende ad uno scalare L 2 R se la successione


cade denitivamente in ogni intorno B" (L) di L, per quanto piccolo possa essere.
Sebbene la Denizione 63 sia una mera riscrittura della Denizione 62, luso degli
intorni particolarmente e cace nel chiarire la natura della denizione di convergenza.

OfB. La denizione richiede che il cadere denitivamente dentro avvenga per ogni
intorno di L: decisivo dunque che ci accada per intorni arbitrariamente piccoli (
facile cadere in un intorno enorme, di cile in uno piccolo piccolo). H

Esempio 135 Consideriamo la successione f1=ng. Il naturale candidato a esserne il


limite 0. Verichiamo che cos. Sia " > 0. Si ha
1 1 1
0 < " () < " () n > :
n n "

Quindi, se prendiamo come n" un intero qualsiasi maggiore di 1=", per esempio6 n" =
[1="] + 1, abbiamo
1
n n" ) 0 < < ";
n
e quindi 0 eettivamente il limite della successione. Per esempio, se " = 10 100 , si ha
n" = 10100 + 1. Si noti che avremmo potuto scegliere come n" qualsiasi intero maggiore
di 10100 + 1. N
n p o
Esempio 136 Consideriamo la successione (9.7), cio 1= 2 n 1 . Anche qui il
naturale candidato a esserne il limite 0. Verichiamolo. Sia " > 0. Si ha
1 1 n 1 1 1
p 0 < " () n 1 < " () 2 2 > () n > 1 + 2 log2
2n 1 2 2 " "

e quindi, preso come n" qualsiasi intero maggiore di 1 + 2 log2 " 1 , per esempio n" =
2 + 2 [log2 " 1 ], si ha
1
n n" ) 0 < p <"
2n 1
100
e quindi 0 il limite della successione. Per esempio, se " = 10 si ha n" = 2 +
2 [log2 10100 ] = 2 + 200 [log2 10] = 602. N

Abbiamo visto due esempi di successioni che convergono a 0. Tali successioni sono
dette innitesime (o nulle). Grazie al prossimo risultato, il calcolo dei loro limiti ha
particolare importanza.

Proposizione 96 Una successione fxn g converge a un punto L 2 R se e solo se


d (xn ; L) ! 0.
6
Ricordiamo che [ ] denota la parte intera, presentata nella Sezione 1.4.3.
224 CAPITOLO 9. SUCCESSIONI

Dim. Solo se: sia limn!1 xn = L. Consideriamo la (nuova) successione di termine


yn = d(xn ; L): Dobbiamo dimostrare che limn!1 yn = 0, cio che per ogni " > 0 esiste
n" 1 tale che n n" implica jyn j < ". Daltra parte, siccome yn 0, ci equivale a
dimostrare che
n n" =) yn < ": (9.13)
Per ipotesi sappiamo che xn ! L. Quindi, dato " > 0, esiste n" 1 tale che d(xn ; L) <
" per ogni n n" , e quindi vale la (9.13).

Se: si supponga che limn!+1 d (L; xn ) = 0. Sia " > 0. Esiste n" 1 tale che
d (L; xn ) < " per ogni n n" . Quindi, xn 2 B" (L) per ogni n n" , come desiderato.

Possiamo quindi ridurre lo studio della convergenza di qualsiasi successione alla


convergenza a 0 della successione fd (xn ; L)gn 1 di numeri reali. In altre parole, per
vericare se xn ! L, basta vericare se d (xn ; L) ! 0.

Esempio 137 Consideriamo


1
xn = 1 + ( 1)n
n
e verichiamo che converge a L = 1. Si ha

( 1)n ( 1)n 1
d (xn ; 1) = 1 + 1 = = ! 0;
n n n

e quindi, per la Proposizione 96, si ha xn ! 1. N

Chiudiamo con unimportante osservazione: nellapplicare la Denizione 62 di con-


vergenza, dobbiamo sempre specicare un possibile limite L 2 R, per poi vericare,
grazie alla denizione, se eettivamente cos. Per alcune successioni specicare un
possibile candidato limite L pu non essere ovvio, rendendo problematica lapplicazione
della denizione. Ne riparleremo.

9.6.2 Divergenza
Consideriamo ora la divergenza, cominciando con la divergenza positiva. Lidea della
denizione simile, mutatis mutandis, alle precedenti.

Denizione 64 Una successione fxn g diverge positivamente, in simboli xn ! +1 o


limn!1 xn = +1, se per ogni scalare K 2 R esiste nK 1 tale che

n nK ) xn > K:
9.6. LIMITI E COMPORTAMENTO ASINTOTICO 225

In altre parole, una successione diverge positivamente quando denitivamente


maggiore di ogni K > 0. Poich la costante K pu essere presa arbitrariamente
grande, ci pu accadere soltanto se la successione non superiormente limitata.

OfB. La denizione richiede che la disuguaglianza valga per ogni scalare K: decisivo
che ci accada per valori arbitrariamente grandi di K ( facile essere > K quando K
piccolo, sempre pi di cile quanto pi K grande). H

Esempio 138 Consideriamo la successione dei numeri pari data da xn = 2n e veri-


chiamo che diverge positivamente. Sia K 2 R. Si ha
K
2n K () n
2
e quindi possiamo scegliere come nK qualsiasi intero maggiore o uguale a K=2. Per
esempio, se K = 10100 , si pu porre nK = 10100 =2. Quindi fxn g = f2ng diverge
positivamente. N

La denizione di divergenza negativa analoga.

Denizione 65 Una successione fxn g diverge negativamente, in simboli xn ! 1


o limn!1 xn = 1, se per ogni scalare K 2 R esiste nK 1 tale che

n nK =) xn < K:

In tal caso, la successione denitivamente minore di ogni K < 0: per quanto


la costante possa prendere valori negativi arbitrariamente grandi (in valore assoluto),
esiste una posizione oltre la quale tutti i termini della successione sono minori o uguali
della costante. Ci caratterizza la tendenza a 1 della successione.

Intuitivamente, la divergenza una forma di convergenza a innito. Il prossi-


mo semplice, ma importante, risultato evidenzia lo stretto legame tra convergenza e
divergenza.

Proposizione 97 Una successione fxn g, con xn > 0 denitivamente, diverge positi-


vamente se e solo se la successione f1=xn g converge a zero.

Un analogo risultato vale per la divergenza negativa. Si noti come lipotesi xn > 0
denitivamente sia irrilevante per una successione che diverge positivamente poich
denitivamente la successione soddisfa sempre questa condizione.

Dim. Se. Sia 1=xn ! 0. Sia K > 0. Per la Denizione 62, esiste n1=K 1
tale 1=xn < 1=K per ogni n n1=K . Quindi, xn > K per ogni n n1=K , e per la
Denizione 64 si ha xn ! +1.
Solo se. Sia xn ! +1 e sia " > 0. Per la Denizione 64, esiste n1=" tale che
xn 1=" per ogni n n1=" . Quindi, 0 < 1=xn < " per ogni n n1=" e quindi
1=xn ! 0.
226 CAPITOLO 9. SUCCESSIONI

OfB. Aggiungendo, togliendo, alterando (o comunque pasticciando) un numero nito


di termini di una successione, essa non cambia limite: se era regolare, lo rimane, e con
lo stesso limite; se era irregolare lo rimane. Ci ovviamente dipende dal fatto che il
limite richiede che una propriet (il tuarsi in un intorno arbitrariamente piccolo in
caso di convergenza oppure lessere maggiore di un numero arbitrariamente grande in
caso di divergenza) valga denitivamente. H

9.6.3 Limiti per eccesso e per difetto


Pu accadere che xn ! L 2 R e che denitivamente si abbia xn L. In questo caso
fxn g si avvicina dunque a L rimanendone alla destra. In tal caso si dice che fxn g
tende a L per eccesso e si scrive limn!1 xn = L+ oppure xn ! L+ oppure, ancor
meglio, xn # L. Si noti che le scritture xn # L e xn ! L+ sono pi informative della
xn ! L: oltre a dire che fxn g converge a L, le scritture xn # L e xn ! L+ ci dice che
ci avviene per eccesso.
Analogamente, se xn ! L 2 R e denitivamente xn L, si dice che fxn g tende a
L per difetto e si scrive limn!1 xn = L oppure xn ! L oppure xn " L.

Esempio 139 (i) Si ha 1=n # 0.


p p
(i) Si ha 1= 2n 1 # 0 perch 2n 1 > 0.
(ii) Si ha f1 1=ng " 1 perch 1 1=n < 1.
(iii) Si ha f1 + ( 1n ) n 1 g ! 1 ma non a 1+ o a 1 . N

Lasciamo al lettore la denizione rigorosa di limite per eccesso e per difetto in


termini di intorni destri e sinistri di L.

9.6.4 Topologia di R e denizione generale di limite


La topologia della retta reale pu essere estesa in modo naturale alla retta reale estesa
denendo gli intorni dei punti di innito nel seguente modo.

Denizione 66 Un intorno di +1 una semiretta del tipo (K; +1], con K 2 R.


Un intorno di 1 una semiretta del tipo [ 1; K), con K 2 R.

Un intorno di +1 formato quindi da tutti i punti maggiori di K, un intorno di


1 formato da tutti i punti minori di K. Chiaramente, per un intorno di +1,
il valore di K diventa particolarmente signicativo quando arbitrariamente grande,
mentre per un intorno di 1 il valore di K diventa particolarmente signicativo
quando di segno negativo e arbitrariamente grande in valore assoluto.

OfB. Un intorno B" (x) di un punto tanto pi piccolo quanto pi piccolo " >
0; un intorno (K; +1] di +1 tanto pi piccolo quanto pi grande K (e simili
considerazioni valgono per gli intorni [ 1; K) di 1). H
9.6. LIMITI E COMPORTAMENTO ASINTOTICO 227

Osservato che (K; +1] e che [ 1; K) sono aperti in R per ogni K 2 R, possiamo
dare un lemma che si riveler utile nel denire i limiti di successioni e di funzioni.

Lemma 98 Sia A un insieme in R.

(i) +1 punto di accumulazione di A se e solo se A non superiormente limitato.

(ii) 1 punto di accumulazione di A se e solo se A non inferiormente limitato.

Dim. Siccome la dimostrazione di (ii) analoga, basta mostrare (i). Se Sia A non
superiormente limitato, cio sia privo di maggioranti. Sia (K; +1] un intorno di +1
con K 2 R. Poich A privo di maggioranti, in particolare K non lo . Esiste quindi
x 2 A tale che x > K, cio x 2 (K; +1] \ A e x 6= +1. Ne segue che +1 punto di
accumulazione di A (in ogni intorno di +1 cadono infatti punti di A diversi da +1).
Solo se Sia +1 punto di accumulazione di A. Mostriamo che A non possiede
maggioranti. Supponiamo, per contra, che K 2 R sia un maggiorante di A. Poich
+1 punto di accumulazione di A, lintorno (K; +1] di +1 possiede un punto
x 6= +1 tale che x 2 A. Quindi K < x, il che contraddice il fatto che K sia un
maggiorante di A.

Gli insiemi A tali che (a; +1) A per qualche a 2 R formano una classe impor-
tante di insiemi non superiormente limitati. Grazie al Lemma 98, per essi +1 punto
di accumulazione. In modo simile, 1 punto di accumulazione per gli insiemi A
tali che ( 1; a) A per qualche a 2 R.

Usando la topologia di R possiamo dare una denizione generale di limite che


estende la Denizione 63 in modo da includere anche le Denizioni di divergenza 64 e
65. Osserviamo che nella prossima denizione, che unica tutte le possibili denizioni
di limite di successione, si ha che:

U (L) = B" (L) se L 2 R


U (L) = (K; +1] se L = +1
U (L) = [ 1; K) se L = 1

Denizione 67 Una successione fxn g in R converge a un punto L 2 R se per ogni


intorno U (L) di L esiste nU 1 tale che

n nU =) xn 2 U (L) :

Se L 2 R, ritorniamo alla Denizione 63. Se L = 1, grazie alla Denizione 66 di


intorno, la Denizione 67 diventa una riscrittura in termini di intorni delle Denizioni
64 e 65.
La denizione generale mostra quindi lunitariet delle nozioni che abbiamo vis-
to, confermando lo stretto legame tra convergenza e divergenza gi evidenziato dalla
Proposizione 97.
228 CAPITOLO 9. SUCCESSIONI

OfB. Osserviamo che se L 2 R, nU dipende da un raggio " > 0 qualsiasi (in particolare
piccolo a piacere), e si pu quindi scrivere nU = n" : Se, invece, L = +1, nU dipende da
un numero reale K qualsiasi (in particolare arbitrariamente grande) e si pu scrivere
nU = nK , con K > 0 senza perdit di generalit. Per ultimo, se L = 1, nU dipende
da un numero reale K negativo qualsiasi (in particolare arbitrariamente grande in val-
ore assoluto) e, senza perdere generalit, si pu porre nU = nK con K < 0. Del resto,
quando L nito decisivo che la propriet valga anche per valori arbitrariamente
piccoli di ", quando L = 1 invece decisivo che la propriet valga anche per valori
arbitrariamente grandi in valore assoluto di K. H

9.7 Propriet dei limiti


In questa sezione studiamo alcune propriet dei limiti. Il primo risultato, il Teorema
di unicit del limite, mostra che il limite di una successione, se esiste, unico.
Teorema 99 (Unicit del limite) Una successione fxn g converge al pi a un limite
L 2 R.
Dim. Supponiamo, per contraddizione, che esistano due limiti niti L0 ; L00 2 R tra
loro distinti, cio L0 6= L00 . Senza perdita di generalit, supponiamo che L00 > L0 .
Consideriamo " > 0 tale che
L00 L0
"< :
2
Risulta quindi
B" (L0 ) \ B" (L00 ) = ;
come il lettore pu vericare. Daltra parte, per la Denizione 63, esiste n0" 1 tale
che xn 2 B" (L0 ) per ogni n n0" , ed esiste n00" 1 tale che xn 2 B" (L00 ) per ogni
n n00" . Posto n" = max fn0" ; n00" g, si ha quindi sia xn 2 B" (L0 ) sia xn 2 B" (L00 )
per ogni n n" , ossia xn 2 B" (L0 ) \ B" (L00 ) per ogni n n" . Ma ci contraddice
B" (L ) \ B" (L00 ) = ;. Ne segue che L0 = L00 e perci il limite unico.
0

Poniamo che la successione ammetta un limite L nito e un altro +1. Per ogni
" > 0 e ogni K > 0, esistono n" e nK tali che simultaneamente dovrebbe essere
L " < xn < L + " 8n n" e xn > K 8n nK :
Basta ora prendere K = L + " per avvedersi che, per n max fn" ; nK g, le due
disuguaglianze non possono coesistere.
Gli altri casi si trattano in modo analogo.

Il prossimo risultato mostra che, quando una successione converge ad un punto


L 2 R, in ogni intorno di tale punto si trovano quasi tutti i punti della successione.
Proposizione 100 Una successione fxn g converge a L 2 R se e solo se ogni intorno
B" (L) di L contiene tutti i termini della successione, tranne al pi un numero nito
di essi.
9.7. PROPRIET DEI LIMITI 229

Dim. Supponiamo xn ! L. Per la Denizione 63, per ogni " > 0 esiste n" 1 tale
che xn 2 B" (L) per ogni n n" . Quindi, tranne al pi i valori xn con 1 n < n" ,
tutti gli elementi della successione appartengono a B" (L).
Viceversa, dato un intorno qualsiasi B" (L) di L, supponiamo che tutti i termini
della successione vi appartengano, tranne al pi un numero nito di essi. Indichiamo
con fxnk g, k = 1; 2; : : : ; m, linsieme degli elementi della successione che non apparten-
gono a B" (L). Detto n" = nm + 1, si ha che xn 2 B" (L) per ogni n n" . Poich ci
vero per ogni intorno B" (L) di L, per la Denizione 63 si ha che xn ! L.

Il prossimo classico risultato, il Teorema della permanenza del segno, mostra che
se una successione ha limite L non nullo, allora i termini della successione hanno
denitivamente lo stesso segno di L.

Teorema 101 (Permanenza del segno) Sia fxn g una successione che converge al
limite L 6= 0. Allora, esiste n 1 tale che xn ha lo stesso segno di L per ogni n n,
ossia
xn L > 0 8n n:
Analogamente, se xn ! +1 ( 1), allora esiste n tale che xn positiva (negativa)
per ogni n n.

Dim. Supponiamo L > 0 (largomento analogo vale se L < 0). Sia " 2 (0; L). Per la
Denizione 62 esiste n 1 tale che jxn Lj < " per ogni n n, ossia

0<L " < xn 8n n:

e si conclude che xn > 0 per ogni n n, come desiderato. Se xn ! 1, per denizione,


xn > K > 0 per n n.

Il Teorema della permanenza del segno rappresenta una propriet dei limiti rispetto
alla struttura dordine che vige in R. Diamo un altro semplice risultato dello stesso
tipo, lasciando la dimostrazione al lettore.

Proposizione 102 Siano fxn g e fyn g due successioni tali che xn ! L 2 R e yn !


H 2 R. Se denitivamente xn yn , allora L H.

Il converso non vale: siano per esempio L = H = 0, fxn g = f 1=ng e fyn g =


f1=ng. Si ha L H e xn < yn per ogni n. Tuttavia, se assumiamo L > H, il converso
vale nella seguente forma stretta:

Proposizione 103 Se fxn g e fyn g sono due successioni tali che xn ! L 2 R e


yn ! H 2 R, con L > H, allora denitivamente xn > yn .
230 CAPITOLO 9. SUCCESSIONI

9.7.1 Monotonia e convergenza


Il prossimo risultato d una semplice condizione necessaria per la convergenza.

Proposizione 104 Ogni successione convergente limitata.

Dim. Supponiamo xn ! L. Posto " = 1, esiste n1 1 tale che xn 2 B1 (L) per ogni
n n1 . Sia M una costante tale che M > max [1; d (x1 ; L) ; : : : ; d (xn1 1 ; L)]. Si ha
d (xn ; L) < M per ogni n 1, ossia jxn Lj < M per ogni n 1. Ci implica che

L M < xn < L + M

e quindi la successione limitata.

Grazie alla Proposizione 104, le successioni convergenti costituiscono un sottoin-


sieme delle limitate. Quindi, se una successione non limitata, non pu essere
convergente.

In generale, il converso della Proposizione 104 falso. Per esempio la successione


xn = ( 1)n limitata ma non converge. Tuttavia, per unimportante classe di suc-
cessioni, le monotone, vale il converso: per tale classe di successioni, la limitatezza
dunque condizione sia necessaria sia su ciente per la convergenza. Prima di enuncia-
re e dimostrare tale risultato, abbiamo bisogno di un altro importante teorema sulle
successioni limitate che mostra che ogni successione monotona regolare.

Teorema 105 Ogni successione monotona in R regolare; in particolare,

(i) converge se limitata;

(ii) diverge positivamente se crescente e non limitata;

(iii) diverge negativamente se decrescente e non limitata.

Dim. Sia fxn g una successione crescente in R (la dimostrazione nel caso di decrescenza
analoga). La successione fxn g pu essere limitata oppure non limitata superiormente
( infatti inferiormente limitata poich x1 xn per ogni n 1).
Supponiamo che sia limitata. Vogliamo mostrare che convergente. Sia E lim-
magine della successione. Per ipotesi, esso un sottoinsieme limitato di R. Per il
Teorema di completezza dei reali, esiste sup E. Poniamo L = sup E e mostriamo che
xn ! L. Sia " > 0. Dal fatto che L lestremo superiore di E scendono due con-
seguenze (si ricordi la Proposizione 52): (i) L xn per ogni n 1, (ii) esiste un
elemento xn" di E tale che xn" > L ". Poich fxn g una successione crescente, ne
segue che
L xn xn" > L " 8n n"
e quindi xn 2 B" (L) per ogni n n" , come desiderato.
9.7. PROPRIET DEI LIMITI 231

Se fxn g non superiormente limitata, per ogni K > 0 esiste un elemento xnK tale
che xnK > K. Essendo crescente, si ha xn xnK > K per ogni n nK e quindi essa
diverge a +1.

Il Teorema 105 garantisce dunque che ogni successione monotona non pu essere
irregolare. Siamo ora in grado di enunciare e dimostrare il teorema anticipato sopra
sulla equivalenza di limitatezza e convergenza per le successioni monotone.

Corollario 106 Una successione monotona convergente se e solo se limitata.

Dim. Sia fxn g una successione crescente in R: Se convergente, per la Proposizione


104 limitata. Se limitata, per il Teorema 105 convergente.

Chiudiamo con unosservazione ovvia ma utile: i risultati appena visti valgono, pi


in generale, per successioni che siano denitivamente monotone.

9.7.2 Algoritmo di Erone


2
Il
pcalcolo del quadrato a di un numero a molto semplice, mentre il calcolo della radice
a di un numero positivo a , in generale, molto meno semplice. Nel far ci ci soccorre
un bellissimo algoritmo di Erone pdi Alessandria, detto anche metodo babilonese.
La procedura per ottenere a, con a > 0 e a 6= 1, prevede la costruzione per
ricorrenza della successione fxn g ponendo7 x1 = a e

1 a
xn+1 = xn + 8n 2
2 xn
p
Teorema 107 (Erone) xn ! a.

La successione di Erone converge quindi alla radice quadrata di a. Per giunta,


come vedremo in alcuni esempi, la convergenza piuttosto rapida.

Dim. La successione (strettamente) decrescente, almeno a partire da n = 2, per le


seguenti ragioni:
(i) Si prova intanto che
p p
xn > a =) a < xn+1 < xn :
p
Infatti, se xn > a, si ha anche x2n > a cio xn > a=xn e perci

1 a 1
xn+1 = xn + < (xn + xn ) = xn :
2 xn 2
7
p
Si pu anche prendere x1 = b con b compreso tra a e a: in tal modo si accelera la convergenza
della successione.
232 CAPITOLO 9. SUCCESSIONI

2 p
Inoltre, dalla disuguaglianza (x2n a) > 0 che sempre vera per ogni xn 6= a, si
deduce progressivamente che
x4n + a2 a2
x4n 2x2n a + a2 > 0 ; > 2a ; x 2
n + > 2a
x2n x2n
2
a2 a
x2n + 2 + 2a > 4a ; xn + > 4a;
xn xn
cio, in denitiva, che
2
a 1 p
x2n+1
xn + = > a e quindi xn+1 > a:
xn 4
p
(ii) Quando
p a > 1, x1 = a >8 a. A maggior ragione, per il
p precedente punto (i),
anche x2 < a. Quando invece 0 < a < 1, x2 = 21 (a + 1) > a perch, quadrando,
si ottiene

(a + 1)2 > 4a ; a2 + 2a + 1 > 4a ; a2 2a + 1 > 0 ; (a 1)2 > 0

che certamente vera. p


In
p denitiva, x2 sempre > a. Ne segue, p per ci che si visto nel punto (i),
che a < x3 < x2 che a sua volta implica a < x4 < x3 e cos via. I p termini della
successione, a partire da secondo, sono perci decrescenti e maggiori di a.

In conclusione, la successione fxn g decrescente (almeno per n 2) e ammette


dunque limite L che, per come essa stata denita, deve soddisfare la relazione
1 a a a
L= L+ ; 2L = L + ; L= ; L2 = a
2 L L L
p
Perci L = a.
p
Esempio 140 (i) Calcoliamo 2 che sappiamo essere circa uguale a 1; 4142135. La
successione di Erone ha elementi:

x1 = 2;
1 2 3
x2 = 2+ == 1; 5;
2 2 2
1 3 2 17
x3 = + = ' 1; 4166667;
2 2 3=2 12
1 17 2 577
x4 = + = ' 1; 4142156;
2 12 17=12 408
1 577 2 665857
x5 = + = ' 1; 4142135:
2 408 577=408 470832
8
Se a = 1 chiaro che xn = 1 per ogni n.
9.7. PROPRIET DEI LIMITI 233
p
(ii) Calcoliamo 428356 ' 654; 48911:
x1 = 428356 ; x2 ' 214178; 5 ; x3 ' 107090; 24 ;
x4 ' 53547; 115 ; x5 ' 26777; 619 ; x6 ' 13396; 807 ;
x7 ' 6714; 3905 ; x8 ' 3389; 0936 ; x9 ' 1757; 743 ;
x10 ' 1000; 7198 ; x11 = 714; 3838 ; x12 ' 656; 9999 ;
x13 ' 654; 4939 ; x14 ' 654; 4891:
Prendendo x1 = b = 1:000 si ha unaccelerazione della convergenza:
x2 ' 714; 178 ; x3 ' 656; 9834 ; x4 ' 654; 4938 ; x5 ' 654; 4891:
p
(iii) Per 0; 13 ' 0; 3605551 si ottiene:
x1 = 0; 13 ; x2 ' 0; 565 ; x3 ' 0; 3975442 ;
x4 ' 0; 3622759 ; x5 ' 0; 3605592 ; x6 ' 0; 360555:
Si noti che, essendo 0; 13 < 1, la decrescenza non si ha dallinizio ma solo a
partire dal secondo termine. N

Lintuizione che sorregge la formula di Erone di ra nata eleganza. Essa si basa


su una successione di
prettangoli, tutti di area a, che si avvicinano al quadrato (di area
a e quindi) di lato a. Ln-esimo rettangolo ha il lato pi lungo pari a xn e il pi
corto necessariamente a a=xn (visto che larea devessere a): al colpo successivo il lato
pi lungo scorciato ponendolo pari a
1 a
xn+1 = xn + < xn :
2 xn
Si
p prosegue nch xn e a=xn tendono a coincidere: il valore comune non pu che essere
a.

y
4

2a/x n+1
a/x
n
1

0
O x x x
n+1 n

-1
-1 0 1 2 3 4 5
234 CAPITOLO 9. SUCCESSIONI

9.7.3 Il Teorema di Bolzano-Weierstrass


Esiste un parziale converso della Proposizione 104, il celebre Teorema di Bolzano-
Weierstrass. Per enunciarlo dobbiamo preliminarmente introdurre la nozione di sotto-
successione. Consideriamo una successione fxn g in R. Data una successione fnk g1k=1
strettamente crescente e che assume solo valori interi positivi, ossia tale che
n1 < n 2 < n 3 < < nk <
con ogni nk 1, la successione fxnk g1
k=1 detta sottosuccessione di fxn g. In altre
parole, la sottosucessione fxnk g una successione costruita a partire dalla successione
originaria fxn g prendendone soltanto i termini di posizione nk .
OfB. Una sottosuccessione si ottiene semplicemente buttando via un po di termini
(anche inniti) della successione, lasciandone per sopravvivere inniti. Ovviamente
se una successione regolare, ogni sua sottosuccessione regolare e con lo stesso limite:
ubi maior,.... H
Esempio 141 Si consideri la successione
1 1 1 1
1; ; ; ; : : : ; ; : : : (9.14)
2 3 4 n
con generico elemento xn = 1=n. Una sua sottosuccessione data da
1 1 1 1
1; ; ; ; : : : ; ;::: ;
3 5 7 2k + 1
nella quale fnk gk 1 la successione dei dispari f1; 3; 5; : : :g: tale sottosuccessione
stata costruita selezionando gli elementi di posto dispari delloriginaria.
Unaltra sottosuccesione di (9.14) data da
1 1 1 1
; ; ;:::; n;::: ;
2 8 16 2
dove questa volta fnk gk 1 formata delle potenze di 2, ossia f2; 22 ; 23 ; : : :g, costruita
selezionando gli elementi originari il cui posto una potenza di 2. N
Esempio 142 Si consideri la successione oscillante in R con generico elemento xn =
( 1)n . Una sua semplice sottosuccessione data da
f1; 1; 1; : : : ; 1; : : :g ;
in cui fnk gk 1 la successione dei pari: la sottosuccessione stata costruita selezio-
nando gli elementi di posto pari delloriginaria. Se avessimo selezionato quelli di posto
dispari avremmo costruito la sottosuccessione
f 1; 1; 1; : : : ; 1; : : :g :
Prendendo fnk gk 1 = f1000kg, cio selezionando soltanto gli elementi di posti 1:000,
2:000, 3:000, ... si ottiene ancora f1; 1; 1; : : : ; 1; : : :g. N
9.7. PROPRIET DEI LIMITI 235

Come mostra lultimo esempio, pu accadere che, mentre la successione originaria


irregolare, alcune sue sottosuccessioni siano convergenti. In altre parole, talvolta
possibile, selezionando in modo opportuno gli elementi, che si possa estrarre un
andamento convergente da uno irregolare. NellEsempio 142 abbiamo una successione
oscillante, dalla quale abbiamo selezionato una sottosuccessione costante prendendo
solo gli elementi di posizione pari (oppure solo di posizione dispari). Il prossimo
risultato, il Teorema di Bolzano-Weierstrass, mostra che ci sempre possibile purch
la successione sia limitata (come il caso della successione xn = ( 1)n , che ha come
immagine linsieme limitato f 1; 1g).

Teorema 108 (Bolzano-Weierstrass) Ogni successione limitata possiede una sot-


tosuccessione convergente.

In altre parole, da qualsiasi successione limitata fxn g, per quanto irregolare, si pu


estrarre una sottosuccessione fxnk g convergente, ossia tale che esista L 2 R per il
quale si abbia lim xnk = L. Il poter sempre estrarreun comportamento convergente
da una successione limitata qualsiasi rappresenta una propriet di grande rilievo.
La dimostrazione del Teorema di Bolzano-Weierstrass si basa sul prossima lemma.

Lemma 109 Ogni successione possiede una sottosuccessione monotona.

Dim. Sia fxn g una successione in R. Consideriamo due casi.


Caso 1: supponiamo che per ogni n 1 esista m > n tale che xm xn . Si ponga
n1 = 1. Sia n2 > n1 tale che xn2 xn1 ; sia n3 > n2 tale che xn3 xn2 , e cos
via. Si costruisce cos una sottosuccessione fxnk g monotona decrescente e il lemma
dimostrato nel Caso 1.
Caso 2: supponiamo che non valga il Caso 1, ossia che esista una posizione n 1
tale che per ogni m > n si abbia xm > xn . Sia I N linsieme di tutte le posizioni
con questa propriet. Se I un insieme nito, per tutte le posizione n > max I vale il
Caso 1. Considerando n > max I, si pu quindi costruire, procedendo come nel Caso
1, una sottosuccesione fxnk g monotona decrescente.
Supponiamo che, invece, I non sia nito, ossia che esistano innite posizioni n 1
tali che
m > n =) xm > xn : (9.15)
Poich sono inniti, indichiamo gli elementi di I come I = fn1 ; n2 ; : : : ; nk ; : : :g. Grazie
alla (9.15) si ha
xn1 < xn2 < < xnk < :
La sottosuccessione fxnk g quindi monotona crescente: anche nel Caso 2 abbiamo
provato lesistenza di una sottosuccessione monotona.

Dim. del Teorema di Bolzano-Weierstrass. Sia fxn g una successione con i


valori in un insieme compatto K in R. Per il Lemma 109, esiste una sottosuccessione
236 CAPITOLO 9. SUCCESSIONI

fxnk g monotona. Poich fxnk g K, tale sottosuccessione anche limitata. Grazie al


Teorema 105, essa convergente, come desiderato.
OfB. Il Teorema di Bolzano-Weiestrass aerma in sostanza che non si possono prendere
inniti numeri (gli elementi della successione) in un intervallo reale limitato in modo
che essi siano ben separati luno dallaltro: necessariamente essi si addensano in
prossimit di (almeno) un punto. H
Per le successioni non limitate possiamo aermare qualcosa di molto analogo:
Proposizione 110 Ogni successione non limitata possiede una sottosuccessione di-
vergente (a +1 quando non superiormente limitata, a 1 quando non inferior-
mente limitata9 ).
Dim. Se la successione non superiormente limitata, per ogni K > 0 esiste almeno
un elemento della successione maggiore di K. Indichiamo con xnK il pi piccolo valore
della successione fxn g che risulta > K: prendendo K = 1; 2; : : :, fxnK g chiaramente
una sottosuccessione di fxn g (tutti i suoi termini sono stati pescati tra quelli di fxn g)
e, per denizione, diverge a +1. Il caso di successione non inferiormente limitata si
tratta in modo analogo.
Perci
Proposizione 111 Ogni successione possiede una sottosuccessione regolare.
OfB. Possiamo dunque aermare che non vi modo di prendere inniti numeri reali
senza che essi si addensino da qualche parte (in prossimit di un numero, o di +1, o
di 1, cio di qualche punto di R). H

9.8 Algebra dei limiti e limiti notevoli


9.8.1 Le (molte) certezze
Nel calcolo dei limiti importante sapere come si comportano i limiti rispetto alle
operazioni tra successioni viste nella Sezione 9.2. Oltre che di interesse teorico, la
questione importante dal punto di vista computazionale perch il calcolo di limiti
pi complessi spesso si riduce, applicando le regole che vedremo nella Proposizione
112, al calcolo di limiti pi elementari o che coinvolgono i limiti notevoli che vedremo
tra breve.
Il prossimo risultato, basato sulle propriet della retta reale estesa, mostra che
in tutti i casi coperti dalle regole di aritmetizzazione parziale, escludendo cio le
forme che abbiamo dette di indeterminazione, i limiti si scambiano con le operazioni
fondamentali. La scrittura xn ! L 2 R indica che la successione fxn g converge a
L 2 R oppure diverge positivamente o negativamente.
9
Nel caso che non sia n inferiormente n superiormente limitata possiede sia una sottosuccessione
divergente a +1 sia una divergente a 1.
9.8. ALGEBRA DEI LIMITI E LIMITI NOTEVOLI 237

Proposizione 112 Sia xn ! L 2 R e yn ! H 2 R. Allora,

(i) xn + yn ! L + H, purch L + H non sia una forma di indeterminazione (1.22),


cio
+1 1 e 1+1

(ii) xn yn ! LH, purch LH non sia una forma di indeterminazione (1.23), cio

1 0 e 0 ( 1)

(iii) xn =yn ! L=H purch yn ; H 6= 0 e L=H non sia una forma di indeterminazione
(1.24), cio
1 0
e
1 0

Dim. (i) Sia xn ! L e yn ! H, con L; H 2 R. Ci signica che, per ogni " > 0,
esistono n1 e n2 tali che

L " < xn < L + " 8n n1 ;


H " < xn < H + " 8n n2 :

Sommandole membro a membro, si ha che, per n n3 = max fn1 ; n2 g,

L+H 2" < xn + yn < L + H + 2"

e, per larbitrariet di 2", ne segue che xn + yn ! L + H.


Sia ora xn ! L 2 R e yn ! +1. Ci signica che, per ogni " > 0 e per ogni
K > 0, esistono n1 e n2 tali che

L " < xn < L + " 8n n1


yn > K 8n n2 :

Sommandole, si ha che, per n n3 = max fn1 ; n2 g,

xn + yn > K + L "

e, per larbitrariet di K + L " > 0, ne segue che xn + yn ! +1. Gli altri casi di
limite innito si trattano in maniera analoga.

(ii) Sia xn ! L e yn ! H, con x; y 2 R. Ci signica che, per ogni " > 0, esistono
n1 e n2 tali che

L " < xn < L + " 8n n1 ;


H " < yn < H + " 8n n2 :
238 CAPITOLO 9. SUCCESSIONI

Inoltre, essendo convergente, fyn g limitata (si ricordi la Proposizione 104): jyn j b
per ogni n. Ora, per n n3 = max fn1 ; n2 g,

jxn yn LHj = jyn (xn L) + L (yn H)j jyn j jxn Lj + jLj jyn Hj < " (b + jLj)

e, per larbitrariet di " (b + jLj), si conclude che xn yn ! L H.


Se L > 0 e H = +1, oltre a risultare, per ogni " > 0,

L " < xn < L + " 8n n1 ;

risulta anche, per ogni K > 0, yn > K per n n2 . Ne segue che, per n n3 =
max fn1 ; n2 g,
xn yn > (L ") K
e, per larbitrariet di (L ") K > 0, si conclude che xn yn ! +1. Se L < 0 e
H = +1, xn yn < (L + ") K e quindi xn yn ! 1. Gli altri casi di limiti inniti si
trattano in modo analogo.

Lasciamo al lettore le (iii) e (iv).

Esempio 143 Siano xn = n= (n + 1) e yn = 1 + ( 1)n =n. Dato che xn ! 1 e yn ! 1,


si ha che xn + yn ! 1 + 1 = 2 e che xn yn ! 1. N

Esempio 144 Consideriamo xn = 2n e yn = 1 + ( 1)n =n. Dato che xn ! +1 e


yn ! 1, si ha che xn + yn ! +1 e che xn yn ! +1. N

Oltre che con le operazioni fondamentali, loperazione di limite si scambia anche


con la potenza (e la radice che ne un caso particolare) e il logaritmo. In realt, la
(13.8) del Capitolo 13 mostrer che questo scambio indolore avviene ben pi spesso,
cio per tutte le funzioni continue.

Proposizione 113 Escludendo le forme di indeterminazione (1.25), cio

11 ; 00 ; (+1)0

si ha10 :

(i) lim xn = (lim xn ) purch 2 R e xn > 0;


xn lim xn
(ii) lim = purch > 0;

(iii) lim loga xn = loga lim xn .


10
Dora in poi, non essendoci possibilit di equivoco, scriveremo semplicemente lim xn anzich
limn!1 xn . Il limite di una successione infatti denito soltanto per n ! 1 e perci la precisazione
pu essere ritenuta superua.
9.8. ALGEBRA DEI LIMITI E LIMITI NOTEVOLI 239

Dim. Ci limitiamo a provare il punto (iii), lasciando volentieri al lettore i rimanenti.


Sia lim xn = L; ci signica che, per ogni " > 0, esiste n" tale che

L " < xn < L + " 8n n" :

Quando a > 1, risulta allora

loga (L ") < loga xn < loga (L + ") 8n n" :

Il logaritmo cresce al crescere del suo argomento e perci loga (L + ") = loga L + con
> 0 e loga (L ") = loga L con > 0 e, detto il pi piccolo tra e

loga L < loga xn < loga L + 8n n"

e, per larbitrariet di (si osservi che sia sia sono arbitrariamente piccole quando
lo "), segue lasserto. Quando 0 < a < 1, il logaritmo decresce al crescere del suo
argomento e si ragiona in modo analogo.

9.8.2 Alcuni limiti notevoli


Vediamo due successioni fondamentali (in realt basterebbe considerare la prima per-
ch la seconda ne semplicemente il reciproco): dal loro comportamento si deducono,
grazie alle precedenti Proposizioni 112 e 113, moltissimi altri limiti. Per la successione
di generico termine xn = n risulta molto facilmente:

lim n = +1;

essendo n > K per ogni n [K] + 1.

Per la successione reciprocaxn = 1=n, si ha


1
lim =0
n
essendo 0 < 1=n < " per ogni n [1="] + 1.

Come abbiamo anticipato, dai due limiti elementari sopra indicati, ricordando le
Proposizioni 112 e 113, se ne deducono moltissimi altri:

(i) lim n = +1 per ogni > 0,

(ii) lim (1=n) = lim n = 0+ per ogni > 0; dunque


8
< +1 se >0
lim n = 1 se =0 :
: +
0 se <0
240 CAPITOLO 9. SUCCESSIONI

(iii) si ha: 8
< +1 se > 1
n
lim = 1 se = 1
: +
0 se 0 < < 1
e

+1 se > 1
lim log n =
1 se 0 < < 1
e molti altri ancora. Per esempio, si ha
7
lim 5n + n2 + 1 = +1 + 1 + 1 = +1;
nonch
3 1
lim n2 3n + 1 = lim n2 1 + 2 = +1 (1 0 + 0) = +1;
n n
e
5 7
n2 5n 7 n2 1 n n2 1 0 0 1
lim = lim 4 6
= = ;
2n2 + 4n + 6 n2 2 + n
+ n2
2+0+0 2
e
1
5 n
lim = [0 (5 0)] = 0;
2n2
e
n (n + 1) (n + 2) n n 1 + n1 n 1 + n2
lim = lim 1 2 4
(2n 1) (3n 2) (5n 4) 2n 1 2n 3n 1 3n
5n 1 5n
1 2
1+ n
1+ n 1 1 1
= lim 1 2 4
= =
30 1 2n
1 3n
1 5n
30 1 1 1 30

9.8.3 Forme di indeterminazione


Nella precedente sezione abbiamo evitato con cura le forme di indeterminazione poich
in tali casi non si pu aermare nulla in generale. Per esempio, il limite della somma di
due successioni i cui limiti sono inniti di segno opposto pu risultare nito, innito o
non esistere, come mostreranno i prossimi esempi. Tale limite risulta cos indetermi-
nato sulla base della sola informazione che i due addendi divergono rispettivamente
a +1 e a 1.
Cerchiamo di essere molto espliciti. In molti casi (tutti quelli coperti dalla ar-
itmetizzazione parziale) il limite di una successione ottenuta tramite unoperazione
su due altre successioni determinato soltanto dai limiti di tali due successioni (per
esempio, qualsiasi siano fxn g e fyn g, se esse tendono rispettivamente a 5 e a 3, il
limite di fxn + yn g 5 + ( 3) = 2 e il limite di fxn yn g 5 ( 3) = 15). In qualche
caso invece (e sono quelli che abbiamo detto di indeterminazione) linformazione sui
due limiti non su ciente; non c perci alcuna scorciatoia di calcolo del limite: non
rimane che tirarsi su le maniche e calcolarlo volta per volta.
9.8. ALGEBRA DEI LIMITI E LIMITI NOTEVOLI 241

Forma di indeterminazione 1 1
Consideriamo la forma di indeterminazione 1 1. Per esempio, il limite della somma
xn + yn delle successioni del tipo xn = n e yn = n2 ricade sotto questa forma di
indeterminazione il che vieta il ricorso ai precedenti risultati. Si ha per

xn + yn = n n2 = n (1 n)

ove n ! +1 e 1 n ! 1 cosicch, essendo del tipo +1 ( 1), xn + yn ! 1. Si


noti come, grazie a una semplicissima manipolazione algebrica, siamo riusciti a trovare
il modo di uscire dallindeterminazione.
Consideriamo xn = n2 e yn = n. Anche in questo caso limite della somma xn + yn
ricade sotto la forma di indeterminazione 1 1. Procedendo come appena visto, si
ha stavolta

lim (xn + yn ) = lim n (n 1) = lim n lim (n 1) = +1


1
Consideriamo ora xn = n e yn = n , ancora del tipo 1 1. Anche qui una
n
semplice manipolazione consente di trovare la via duscita:
1 1
lim (xn + yn ) = lim n + n = lim =0
n n

Consideriamo inne xn = n2 + ( 1)n n e yn = n2 , che, dato che xn n2 n=


n (n 1) diverge a +1, ancora una volta del tipo 1 1. Ora

lim (xn + yn ) = lim ( 1)n n

non esiste.
Dunque quando si presenta un caso del tipo 1 1, pu accadere che il limite
in discorso risulti +1 oppure 1 oppure che sia nito oppure che non esista. In
altre parole, pu accadere di tutto. La semplice constatazione che si tratta di 1 1
non consente di dir nulla del limite della somma11 . Nel caso 1 1 bisogna proprio
considerare le due successioni e, volta per volta, riuscire a trovare una maniera, che
molto spesso semplice, di aggirare lindeterminazione, come abbiamo visto negli
esempietti di poco fa. Lo stesso si pu ripetere per le altre forme di indeterminazione.

Forma di indeterminazione 0 1
Siano, per esempio, xn = 1=n e yn = n3 . Il limite del loro prodotto ha la forma 0 1,
e non possiamo quindi farci guidare dai precedenti risultati. Si ha per
1
lim xn yn = lim n3 = lim n2 = +1:
n
11
Se invece si fosse trattato di una forma del tipo 1 + a, anche senza sapere come sono fatte le due
successioni, avremmo potuto dire che il limite della loro somma 1.
242 CAPITOLO 9. SUCCESSIONI

1
Se xn = e yn = n,
n3
1 1
lim xn yn = lim 3
n = lim 2 = 0:
n n
Se xn = n3 e yn = 7=n3 ,
7
lim xn yn = lim n3 = lim 7 = 7
n3
Se xn = 1=n e yn = n(cos n + 2),

lim xn yn = lim(cos n + 2)

non esiste.
Ancora, solo il calcolo diretto del limite pu stabilirne il valore: la forma di
indeterminazione pu fornire risultati del tutto diversi.

Forme di indeterminazione 1=1 e 0=0


Siano, per esempio, xn = n e yn = n2 . Il limite del loro quoziente ha la forma 1=1,
ma
xn n 1
lim = lim 2 = lim = 0:
yn n n
Daltra parte, scambiando le parti di xn e yn , permane la forma di indeterminazione
1=1, ma
yn n2
lim = lim = lim n = +1;
xn n
con limite del tutto diverso dal precedente12 .
Vediamo un altro esempio relativo a 1=1. Se xn = n2 e yn = 1 + 2n2 , si ha

xn n2 1 1
lim = lim = lim 1 = :
yn 1 + 2n2 n2
+2 2

Ancora, Se xn = n2 (sin n + 7) e yn = n2 ,
xn
lim = lim (sin n + 7)
yn
che non esiste.
Ci vale naturalmente anche per la forma di indeterminazione 0=0. Per esempio,
sia xn = 1=n e yn = 1=n2 . Si ha
1
xn n
lim = lim 1 = lim n = +1;
yn n2
12
Poich xn =yn = 1= (yn =xn ), per i due limiti vale la Proposizione 97.
9.8. ALGEBRA DEI LIMITI E LIMITI NOTEVOLI 243

mentre, scambiando le parti di xn e yn , si ha

1
yn n2 1
lim = lim 1 = lim = 0:
xn n
n

Si osservi la semplice relazione tra le forme di indeterminazione 1=1 e 0=0: se il


limite del quoziente delle successioni fxn g e fyn g ricade sotto la forma di indetermi-
nazione 1=1, il limite del quoziente delle successioni f1=xn g e f1=yn g ricade sotto la
forma di indeterminazione 0=0, e viceversa.

9.8.4 Tabelle riassuntive


Possiamo riassumere in tre tabelle lalgebra dei limiti. Nelle tabelle la prima riga
indica il limite della successione fxn g, mentre la prima colonna indica il limite della
successione fyn g.
Cominciamo col limite della somma: le celle interne danno il risultato del limite
fxn + yn g; abbiamo scritto ?? in caso di forma di indeterminazione.

somma +1 L 1
+1 +1 +1 ??
H +1 L+H 1
1 ?? 1 1

Abbiamo due casi indeterminati su nove. Passiamo al prodotto: le celle interne danno
il risultato del limite fxn yn g :

prodotto +1 L>0 0 L<0 1


+1 +1 +1 ?? 1 1
H>0 +1 LH 0 LH 1
0 ?? 0 0 0 ??
H<0 1 LH 0 LH +1
1 1 1 ?? +1 +1

dove ci sono quattro casi indeterminati su venticinque. Inne, per il quoziente si ha la


seguente tabella, dove le celle interne danno il risultato del limite fxn =yn g:
244 CAPITOLO 9. SUCCESSIONI

quoziente +1 L>0 0 L<0 1


+1 ?? 0 0 0 ??
H>0 +1 L=H 0 L=H 1
0 1 1 ?? 1 1
H<0 1 L=H 0 L=H +1
1 ?? 0 0 0 ??

dove nella terza riga si ha ambiguit circa il segno dellinnito, a seconda che yn tenda
a 0 per eccesso o per difetto (se xn ! L > 0 e yn ! 0 allora xn yn ! 1, ecc., con
le abituali regole dei segni). Per esempio,

1 1
lim 1 = lim n = +1 e lim 1 = lim ( n) = 1:
n n

Abbiamo qui cinque casi indeterminati su venticinque.


Le tabelle rendono chiaro come nella maggior parte dei casi i precedenti risultati
siano e caci, lasciando solo relativamente pochi casi indeterminati.

OfB. Il caso 0 1 non una forma di indeterminazione. Esso ovviamente una


sigla per il lim xynn ove la base una successione (positiva, altrimenti la potenza non
denita!) tendente a 0 (anzi a 0+ ) e lesponente una successione divergente. Possiamo
porre senza imbarazzi 0+1 = 0: a buon senso, si tratta di moltiplicare 0 per s stesso
innite volte e si ottiene uno zero grande come un palazzo (uno zerissimo diceva
un illustre professore). La forma 0 1 reciproca della precedente e perci 0 1 = +1.
H

9.8.5 Ma quante sono le forme di indeterminazione?


Avevamo indicato sette forme di indeterminazione:
1 0
; ; 0 1 ; 1 1 ; 00 ; 10 ; 11
1 0
In realt sono tutte sostanzialmente riconducibili luna allaltra. Potremmo consider-
are, per esempio, 0 1 (o qualunque altra) come la forma di indeterminazione di base
e ad essa ridurre le altre:

(i) Se xn ; yn ! 1, il loro rapporto xn =yn si presenta nella forma 1=1, ma basta


scrivere il rapporto come
1
xn
yn
per avere la forma 0 1.
9.9. CRITERI DI CONVERGENZA 245

(ii) Se xn ; yn ! 0, il loro rapporto xn =yn si presenta nella forma 0=0, ma basta


ancora scrivere il rapporto come
1
xn
yn
per avere la forma 0 1.

(iii) Se xn ! 1 e yn ! 1, la loro somma xn + yn si presenta nella forma 1 1.


Si pu per scrivere
yn
xn + yn = 1 + xn ;
xn
se yn =xn non tende a 1, la forma non pi indeterminata e, se yn =xn ! 1 la
forma del tipo 0 1.

(iv) Per le ultime tre basta considerarne il logaritmo per mettersi nel caso 0 1:

log 00 = 0 log 0 = 0 ( 1) ; log 10 = 0 log 1 = 0 1; log 11 = 1 log 1 = 1 0:

Il numero e, che incontreremo tra breve, rappresenta il limite di una forma di


indeterminazione (la pi pregiata) del tipo 11 .

Il lettore provi a ricondurre tutte le forme di indecisione a 0=0 oppure a 1=1.

9.9 Criteri di convergenza


Il calcolo dei limiti oltremodo fastidioso e, in molti casi, presenta qualche di colt.
Soccorrono alcuni teoremi che forniscono condizioni su cienti per la convergenza: essi
sono detti criteri di convergenza 13 .
Cominciamo col classico Criterio del confronto, che mostra come quando due suc-
cessioni convergono allo stesso limite, tale il caso anche di qualsiasi successione i cui
termini sono presi in mezzotra quelli delle due successioni14 .

Teorema 114 (Criterio del confronto) Siano fxn g, fyn g e fzn g tre successioni.
Se, denitivamente,
yn xn zn (9.16)
e
lim yn = lim zn = L 2 R (9.17)
allora
lim xn = L
13
Criterio (test in inglese) sempre sinonimo di condizione su ciente.
14
Il Teorema detto spesso dei carabinieri: fxn g accompagnata dai due carabinieri fyn g e fzn g
(uno di qua e uno di l) ed costretta ad andare dove vanno loro.
246 CAPITOLO 9. SUCCESSIONI

Dim. Sia " > 0. Dalla (9.17) segue, per la Denizione 63, che esiste n1 tale che
yn 2 B" (L) per ogni n n1 , e che esiste n2 tale che zn 2 B" (L) per ogni n n2 .
Diciamo inne n3 il posto dordine a partire dal quale risulta yn xn zn . Posto
n = max fn1 ; n2 ; n3 g, si ha quindi sia yn 2 B" (L) sia zn 2 B" (L) sia yn xn zn per
ogni n n e, per la (9.16),

L " < yn xn zn < L + " 8n n

ossia xn 2 B" (L) per ogni n n e quindi xn ! L come desiderato.

Il tipico uso del risultato nel dimostrare la convergenza di una successione mostran-
do che essa pu essere intrappolatatra due opportune successioni convergenti.

Esempio 145 Consideriamo la successione xn = n 2 sin2 n. Dato che 1 sin n 1


per ogni n 2 N, si ha 0 sin2 n 1 per ogni n 1 e quindi

sin2 n 1
0 8n 1
n2 n2
Se consideriamo le successioni con yn = 0 e zn = 1=n2 , valgono le ipotesi (9.16) e (9.17)
con L = 0. Per il Criterio del confronto si ha lim xn = 0. N

1
Esempio 146 La successione con xn = n sin n converge a 0. Infatti

1 sin n 1
8n 1
n n n
ed entrambe le successioni 1=n ! 0. N

Lesempio che precede lascia intendere che, se fxn g una successione limitata e
yn ! 1, allora
xn
!0
yn
Infatti jM=yn j xn =yn jM=yn j dove M lestremo superiore di jxn j.

I due prossimi semplici e utilissimi teoremi introducono tecniche di analisi che


saranno utilizzate anche per la convergenza delle serie, come vedremo nel prossimo
capitolo.

Teorema 115 (Criterio del rapporto) Se esiste un numero q < 1 tale che, den-
itivamente,
xn+1
q (9.18)
xn
allora la successione fxn g tende a 0.
9.9. CRITERI DI CONVERGENZA 247

Si noti che la propriet (9.18) vale senzaltro se il rapporto xn+1 =xn ammette limite
ed esso minore di 1. Infatti, se il limite dei rapporti L < 1, essi sono denitivamente
minori di L + per ogni > 0 e si pu sempre prendere in modo che L + < 1.
Si badi che il teorema non richiede semplicemente che il rapporto jxn+1 =xn j sia < 1,
cio
xn+1
lim <1
xn
ma che ne sia discosto, cio che sia minore di un numero q a sua volta minore di 1.
Inoltre, ricordando che xn ! L se e solo se xn L ! 0, possiamo anche aermare
che
xn+1 L
< q ) xn ! L
xn L
Grazie a questa semplice osservazione il Criterio del rapporto (nonch il Criterio della
radice che vedremo tra breve) si applica allo studio della convergenza xn ! L, bench
enunciato solo per xn ! 0.

Dim. Poniamo che la disuguaglianza valga a partire da n = 1: se valesse da un certo


n in poi, basterebbe ricordare che la soppressione di un numero nito di termini non
altera il limite. Da
xn+1
q
xn
si deduce che jxn+1 j q jxn j e quindi, in particolare,

jx2 j q jx1 j ; jx3 j q jx2 j q 2 jx1 j ; ; jxn j qn 1


jx1 j ;

che si possono riscrivere

qn 1
jx1 j xn qn 1
jx1 j 8n 2

Visto che, essendo 0 < q < 1, q n 1


! 0, il risultato segue dal Criterio del confronto.

Il Criterio del rapporto permette di provare alcuni limiti fondamentali:

(i) Qualsiasi siano > 1 e k 2 R risulta


nk
lim n
=0 (9.19)

Infatti, posto
nk
xn = n

e prendendo il rapporto tra due termini consecutivi (il valor assoluto irrilevante
visto che tutti i termini sono positivi), si ha
k k
xn+1 (n + 1)k n
n+1 1 1 1 1
= n+1
= = 1+ ! <1
xn nk n n
248 CAPITOLO 9. SUCCESSIONI

(ii) Pi in generale si mostra, sempre con > 1, che


znk
zn ! +1 ) xn
!0

La (9.19) il caso speciale zn = n. Si indichi con pn = [zn ] la parte intera di zn ,


sicch pn zn < pn + 1. Si ha
k
znk (pn + 1)k pn + 1 pkn
xn
< pn
= pn
!0
pn

dato che (pn + 1)k =pkn ! 1 e pkn = pn


! 0 perch si tratta di una sottosuccessione
di nk = n .
(iii) Se k 2 R e yn ! +1, allora
logk yn
lim =0
yn
Basta porre yn = ezn e si ricade nel caso precedente. In particolare
logk n log n
lim = lim =0
n n
Ci che precede lascia intravedere una precisa gerarchia tra le seguenti classi di
successioni divergenti:
n
con >1 ; nk con k > 0 ; logk n con k > 0
Le pi forti sono le esponenziali, al loro interno graduate secondo la base ,
seguono le potenze, al loro interno graduate secondo lesponente k, e, buone ultime, le
logaritmiche, al loro interno graduate secondo lesponente k.
Per esempio,
5n 6 2n n123 + 7n87 n36 log n ! +1
ereditando il comportamento di 5n ,
n4 3n3 + 6n2 4 1
4 3 2
!
5n + 7n + 25n + 342 5
perch il numeratore eredita il comportamento di n4 e il denominatore di 5n4 . Tra
poco, nella Sezione 9.12, renderemo rigorose queste considerazioni sui limiti basate
sulla velocit di convergenza (o divergenza).

Teorema 116 (Criterio della radice) Se esiste un numero q < 1 tale che, almeno
denitivamente pn
jxn j q (9.20)
allora la successione fxn g tende a 0.
9.9. CRITERI DI CONVERGENZA 249

Anche per questo risultato si possono fare considerazioni simili a quelle viste per il
Criterio
np odel rapporto. In particolare, la propriet (9.20) vale senzaltro se la successione
n
jxn j ammette limite ed esso minore di 1, cio se
p
lim n jxn j < 1
Dim. Poniamo che la disuguaglianza valga a partire da n = 1. Da
pn
jxn j q
si trae immediatamente che jxn j q n cio che q n xn q n . Visto che, essendo
0 < q < 1, q n ! 0, il risultato segue dal Criterio del confronto.
Esempio 147 Sia
n
2n2 5n + 6
xn =
3n3 7n 3
Dato che s
n
n 2n2 5n + 6 2n2 5n + 6 2
= ! <1
3n3 7n 3 3n3 7n 3 3
si ha xn ! 0. N
p
Nel prossimo esempio si ha xn ! +1 e xn ! 1. Ci mostra limportanza della
n

disuguaglianza stretta q < 1 nella (9.20).


p
Esempio 148 Risulta n n ! 1 perch
p loga n
loga n n = loga n1=n = !0
n
con qualunque a > 1. N
Chiudiamo con un semplice esempio che mostra come sia il Criterio del rapporto
sia il Criterio della radice siano condizioni su cienti, ma non necessarie, per la con-
vergenza. Sebbene utili, non possono quindi essere sempre decisivi nel determinare la
convergenza di una successione.
Esempio 149 La successione di termine xn = 1=n converge a zero. Tuttavia, si ha
xn+1 n
= !1
xn n+1
e quindi il Criterio del rapporto non applicabile. Daltra parte, da quanto visto
nellultimo esempio, segue che
r
n 1 1
= p !1
n n
e quindi anche il Criterio della radice non applicabile. Nessuno dei due criteri
dunque utile per determinare la convergenza di questa semplice successione. N
Ulteriori propriet dei Criteri del rapporto e della radice saranno esaminate nello
studio delle serie (Sezione 11.3).
250 CAPITOLO 9. SUCCESSIONI

9.10 La condizione di Cauchy


Una successione convergente se ammette limito nito. Per stabilire la convergenza di
unassegnata successione si dovrebbe quindi calcolarne il limite, impresa che potrebbe
rivelarsi di coltosa. Per giunta il limite un oggetto, in un certo senso, estraneoalla
successione (in generale non un suo termine). Dunque, per accertare la convergenza
di una successione, ci si deve a dare a un estraneo che, per giunta, pu essere
di cile da calcolare.
Sarebbe preferibile avere una denizione di convergenza che si faccia bastare i
termini della successione. Per vedere come fare, basta la seguente semplice intuizione:
se una successione converge, i suoi elementi sono, almeno da un certo punto in poi,
tutti vicinissimi al limite. Ma, se sono tutti vicinissimi al limite, sono anche vicinissimi
tra loro. Ci che segue non fa che formalizzare lintuizione.

Teorema 117 (Cauchy) La successione fxn g convergente se e solo se a ogni " > 0
si pu associare un intero n" 1 tale che

jxn xm j < " 8n; m n" (9.21)

La condizione (9.21), che si pu riscrivere come d (xn ; xm ) < " per ogni n; m n,
detta condizione di Cauchy: il suo sussistere per ogni " > 0 dunque condizione
necessaria e su ciente di convergenza.

Dim. Necessit. Se xn ! L allora, per denizione, ad ogni " > 0 si pu associare


n" 1 tale che jxn Lj < " per ogni n n" . Ora, per n; m n" ,

jxn xm j = jxn L+L xm j jxn Lj + jxm Lj < " + " = 2"

e, per larbitrariet di 2", lasserto provato.


Su cienza. Se jxn xm j < " per ogni n; m n" , risulta, a maggior ragione,
jxn xn" j < " per n = n" + 1; n" + 2; : : : cio

xn" " < xn < xn" + " per n = n" + 1; n" + 2; : : :

Indichiamo ora con A linsieme dei numeri reali denitivamente minori degli elementi
della successione e con B linsieme dei numeri che ne sono denitivamente maggiori.

(i) A e B non sono vuoti: A contiene almeno il precedente xn" " e B almeno
xn" + ".

(ii) A e B sono disgiunti. Se vi fosse un numero che appartiene a entrambi, esso


dovrebbe essere a un tempo denitivamente minore e maggiore (strettamente)
degli elementi della successione, il che non pu essere.

(iii) sup A = inf B perch, come s detto sopra, xn" " 2 A e xn" + " 2 B per ogni
" > 0 e risulta (xn + ") (xn ") = 2" che arbitrariamente piccola.
9.11. IL NUMERO DI NEPERO 251

Diciamo z il valore comune di sup A e inf B. Mostriamo che xn ! z. Fissato


arbitrariamente un numero > 0, esistono a 2 A e b 2 B tali che b a < e perci
(essendo per certo a < z < b e quindi z <aeb<z+ )
z <a<b<z+
Ma i termini xn della successione sono denitivamente maggiori di a e denitivamente
minori di b e quindi, a maggior ragione,
z < xn < z +
che, per larbitrariet di , consente di aermare che z il limite della successione
fxn g.
OfB. Il Teorema appena visto, talora detto Criterio generale di convergenza, enuncia
s una fondamentale propriet delle successioni convergenti, ma in realt rappresenta
una propriet strutturale (di grande portata concettuale) dellinsieme dei numeri reali,
detta completezza.
Poniamo, per esempio (e come Pitagora), di conoscere soltanto i numeri razionali:
lo spazio sul quale ragioniamo dunque Q. Consideriamo la successione i cui elementi
(tutti razionali) sono le successive approssimazioni decimali di :
x1 = 3 ; x2 = 3; 1 ; x3 = 3; 14 ; x4 = 3; 141 ; x5 = 3; 1415 ; : : :
Essa rispetta la condizione di Cauchy: jxn xm j < min f10 n ; 10 m g che denitiva-
mente arbitrariamente piccolo. Tale successione per non converge (per noi che conos-
ciamo solo Q) ad alcun punto di Q: se conoscessimo R potremmo dire che converge a
(e non pu convergere ad altro perch il limite necessariamente unico). Dunque in
Q la condizione di Cauchy ( necessaria ma) non su ciente per la convergenza.
Vi sono spazi, come R, nei quali la condizioni di Cauchy su ciente per la con-
vergenza e altri, come Q, per i quali non lo (in ogni caso necessaria). I primi sono
detti completi e i secondi incompleti. Senza approfondire la questione, R il com-
pletamento di Q cio il pi piccolo spazio completo che lo contiene: e cacemente,
arricchendo Q con tutti i limiti(inesistenti in Q) delle successioni che rispettano la
condizione di Cauchy, si ottiene lo spazio completo R. H

9.11 Il numero di Nepero


Una successione fondamentale, che si presenta nella forma di indeterminazione 11 ,
n
1
1+ (9.22)
n
Dimostreremo tra breve che essa converge a un numero (irrazionale, anzi trascen-
dente15 ) che si indica dabitudine con e e che vale 2; 71828:::.
15
Un numero non razionale detto
p algebrico se radice di qualche equazione polinomiale con tutti
i coe cienti interi: per esempio, 2 algebrico dato che esso radice dellequazione x2 2 = 0. Sono
detti trascendenti i numeri irrazionali non algebrici.
252 CAPITOLO 9. SUCCESSIONI

Esso la base pi naturale dei logaritmi che in tal modo acquistano pregevoli
propriet. Dora in avanti si assumer senza eccezioni e come base dei logaritmi e
molto spesso come base delle potenze.

Teorema 118 La successione (9.22) convergente. Il suo limite si denota con e ed


detto numero di Nepero.

La dimostrazione si basa sulla seguente classica disuguaglianza.

Lemma 119 Se a > 1, con a 6= 0, risulta

(1 + a)n > 1 + an (9.23)

per ogni intero16 n > 1.

Dim La dimostrazione si fa per induzione. La disuguaglianza (9.23) vale per n = 2.


Infatti, per ogni a 6= 0 si ha:

(1 + a)2 = 1 + 2a + a2 > 1 + 2a:

Supponiamo, per induzione, che (9.23) valga per un certo valore n 2, cio si abbia:

(1 + a)n > 1 + an:

Intendiamo dimostrare che la (9.23) vale per n + 1. Si ha:

(1 + a)n+1 = (1 + a)(1 + a)n > (1 + a)(1 + an)


= 1 + a(n + 1) + a2 n > 1 + a(n + 1)

dove la prima disuguaglianza, dovuta allipotesi induttiva, vale solo per a > 1.
Abbiamo quindi dimostrato che (9.23) vale anche per n + 1, che era quanto si voleva
dimostrare.

Dim. del Teorema 118. Poniamo


n n+1
1 1
an = 1+ ; bn = 1+ 8n = 1; 2; :::
n n
Procediamo per passi successivi.

Passo 1: fbn g decrescente. Infatti, per n 2 si ha


" #n " #n
1 n+1
bn 1+ n 1 1 + n1 1 n+1
n
= n = 1+ = 1+ n
bn 1 1+ 1
n 1
n 1 + n1 1 n n 1
n 1
1 (n + 1) (n 1) 1+ n
= 1+ = 1 n
n n2 1+ n2 1
16
Per n = 1 vale banalmente luguaglianza.
9.11. IL NUMERO DI NEPERO 253

e, utilizzando la disuguaglianza (1 + a)n > 1 + an dimostrata nel Lemma 119 17


, si
vede che n
1 n n 1
1+ 2 >1+ 2 >1+ 2 >1+
n 1 n 1 n n
e perci bn =bn 1 < 1.

Passo 2: fan g crescente. Infatti


n
1 n n+1 n n 1 n n2 1 1 n
an 1+ n n n n2 1 n2
= n 1 = n 1 = 1 = 1
an 1 1+ 1
n
1 n
1 n
n 1

e, usando ancora la disuguaglianza di poco fa,


n
1 n 1
1 >1 =1
n2 n2 n
si vede che an =an 1 > 1.

Passo 3: bn > an per ogni n e, per di pi, bn an ! 0. Infatti


n+1 n n+1
1 1 1 1
bn an = 1+ 1+ = 1+ 1 1
n n n 1+ n
n+1
1 1 1
= 1+ = bn >0
n n+1 n+1
Dato che bn < b1 , risulta
bn b1
0 < bn an = < !0
n+1 n+1
Si conclude, che essendo le due successioni strettamente monotone, convergenti e
tali che la loro dierenza tende a 0, si ha sup an = inf bn = lim an = lim bn .

Risulta
a1 = 21 = 2 b1 = 22 = 4
3 2 9 3 3 27
a2 = 2
= 4
= 2; 25 b2 = 2
= 8
= 3; 375

11 10 11 11
a10 = 10
' 2; 59 b10 = 10
' 2; 85
e quindi il numero di Nepero compreso tra 2; 59 e 2; 85. Come gi abbiamo avvertito,
il numero e trascendente e vale 2; 71828:::.

Dal limite fondamentale appena indicato se ne deducono parecchi altri.


17 1
Osserviamo che 1< n2 1 6= 0 e che n 2:
254 CAPITOLO 9. SUCCESSIONI

(i) Se jxn j ! +1 (cio xn ! +1 oppure xn ! 1), si ha:


xn
k
lim 1 + = ek
xn
Per k = 1 la dimostrazione si pu fare facilmente considerando la parte intera di
xn . Per k qualsiasi, basta porre k=xn = 1=yn , col che
xn kyn yn k
k 1 1
1+ = 1+ = 1+ ! ek
xn yn yn

(ii) Se an ! 0 e an 6= 0, si ha:
lim (1 + an )1=an = e
Basta porre an = 1=xn per ritrovare il precedente caso (i).
(iii) Se an ! 0 e an 6= 0, si ha:
log (1 + an )
lim =1
an
Basta prendere il logaritmo nel limite precedente. Pi in generale:
logb (1 + an )
lim = logb e 80 < b 6= 1
an
(iv) Se c > 0, yn ! 0 e yn 6= 0:
c yn 1
lim = log c
yn
Basta porre cyn 1 = an (cosicch anche an ! 0) per avvedersi che
c yn 1 an
=
yn logc (1 + an )
e che quindi ci si riduce al (reciproco del) caso precedente nel quale il limite
1= logc e = loge c = log c.
(vi) Se 2 R e zn ! 0, con zn 6= 0, si ha:
(1 + zn ) 1
lim =
zn
Laermazione ovvia per = 1. Se 6= 1 si pone an = (1 + zn ) 1 ovvero
1 + an = (1 + zn ) cio log (1 + an ) = log (1 + zn ) (col che anche an ! 0). Si
ha allora
log (1 + an ) log (1 + zn ) log (1 + zn ) zn
= =
an (1 + zn ) 1 zn (1 + zn ) 1
log (1 + an ) log (1 + zn )
e, dato che !1e ! 1, ne segue lasserto.
an zn
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 255

Applichiamo quanto appena visto ad alcuni semplici limiti. Si ha:


n n
n+5 5
= 1+ ! e5
n n
nonch !
3 3
1 (1 + 1=n2 ) 1
n2 1+ 2 1 = !3
n 1=n2
e
1 log (1 + 1=n)
n log 1 + = !1
n 1=n
e
2n 1
! log 2
n

9.12 Ordini di convergenza e di divergenza


Alcune successioni convergono al proprio limite pi velocementedi altre. Per esem-
pio, consideriamo due successioni fxn g e fyn g entrambe divergenti a +1. Per esempio,
yn = n e xn = n2 . Intuitivamente, la successione fxn g diverge pi velocemente di fyn g.
Se le mettiamo a confronto tramite il loro rapporto
yn
xn
si ha
yn 1
lim = lim = 0
n xn n n

Ha quindi prevalso il denominatore che, nonostante anche il numeratore tenda a +1,


ha trascinato lintera frazione dalla sua parte, schiacciandola a zero. Dunque, la mag-
gior velocit di divergenza (ovvero di convergenza a +1) della successione fxn g si
manifesta nella convergenza a zero del rapporto yn =xn . Il rapporto sembra quindi es-
sere il naturale terreno di confronto per la velocit relativa di convergenza/divergenza
delle due successioni .

La prossima denizione formalizza tale intuizione, importante sia dal punto di vista
concettuale sia per il calcolo.

Denizione 68 Siano fxn g e fyn g due successioni, con i termini della prima deni-
tivamente diversi da zero.

(i) Se
yn
!0
xn
diciamo che fyn g trascurabile rispetto a fxn g; in simboli
yn = o (xn )
256 CAPITOLO 9. SUCCESSIONI

(ii) Se
yn
! k 6= 0 (9.24)
xn
diciamo che fyn g dello stesso ordine o che confrontabile con fxn g; in simboli

yn xn

(iii) In particolare quando k = 1, cio quando


yn
!1
xn

si dice che fyn g e fxn g sono asintotiche. In simboli,

yn xn

La classicazione comparativa. Per esempio, fyn g trascurabile rispetto a fxn g:


ci non signica che fyn g sia in s trascurabile ma che lo diventa quando accompa-
gnata da fxn g. La successione fn2 g trascurabile rispetto a fn5 g, ma, in assenza di
fn5 g, non per nulla trascurabile (tende allinnito!).
Si osservi, inoltre, che grazie alla Proposizione 97 si ha
yn xn
! 1 () !0
xn yn

cio se e solo se xn = o (yn ). Quindi, anche quando il rapporto diverge possiamo


applicare la classicazione appena vista, il caso non richiede unanalisi separata.

Riportiamo subito alcune semplici propriet di queste nozioni.

Lemma 120 Siano fxn g e fyn g due successioni con termini denitivamente diversi
da zero. Allora,

(i) la relazione di confrontabilit (in particolare ) sia simmetrica, cio yn xn


se e solo se xn yn , sia transitiva, cio zn yn e yn xn implicano zn xn .

(ii) la relazione di trascurabilit transitiva, cio zn = o (yn ) e yn = o (xn ) implica


zn = o (xn ).

Dim. La simmetria di segue da

yn xn 1
! k 6= 0 () ! 6= 0
xn yn k
Lasciamo al lettore la facile dimostrazione delle altre propriet.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 257

Si osservi da ultimo che


1 1
yn xn ()
yn xn
e in particolare
1 1
yn xn () (9.25)
yn xn
purch fxn g e fyn g siano denitivamente diverse da zero. In altre parole, confrontabil-
it e trascurabilit si preservano passando ai reciproci.

Consideriamo ora i casi, pi interessanti, dove entrambe le successioni sono inn-


itesime o divergenti. Cominciamo con due successioni fxn g e fyn g entrambe inn-
itesime, ossia limn!1 xn = limn!1 yn = 0. In questo caso, le successioni trascurabili
tendono pi velocemente a zero. Consideriamo per esempio xn = 1=n e yn = 1=n2 .
Intuitivamente, yn va a zero pi velocemente di xn . Infatti,
1
n2 1
1 = !0
n
n

ossia yn = o (xn ). Daltra parte, si ha


p s
n 1
p = 1 !1
n+1 1+ n
p p
e quindi le successioni innitesime xn = n + 1 e yn = n sono confrontabili.

Supponiamo ora che le le successioni fxn g1 1


n=1 e fyn gn=1 siano entrambe divergenti,
positivamente o negativamente, ossia limn!1 xn = 1 e limn!1 yn = 1. In questo
caso, successioni trascurabili tendono meno velocemente a innito (indipendemente dal
segno), ossia assumono valori via via pi grandi in valore assoluto meno rapidamente.
Per esempio, siano xn = n2 e yn = n. Intuitivamente, yn va a innito pi lentamente
di xn . Infatti,
yn n 1
= 2 = !0
xn n n
ossia yn = o (xn ). Daltra parte, lo stesso si ha se xn = n2 e yn = n perch non il
segno dellinnito che conta, ma la velocit di avvicinamento.

Il signicato di trascurabilit devessere quindi precisato a seconda che si consideri


convergenza a zero oppure a innito (cio divergenza). importante distinguere con
cura i due casi.

NB. (i) Aermare che una successione un o (1) signica semplicemente che essa tende
a 0: infatti, xn = o (1) signica che xn =1 = xn ! 0. (ii) Posto xn = n e yn = n+k, con
k > 0, le successioni fxn g e fyn g sono asintotiche. Infatti, per quanto grande possa
258 CAPITOLO 9. SUCCESSIONI

essere k, la divergenza a +1 delle due successioni render trascurabile il ruolo di k


dal punto di vista asintotico. Tale fondamentale punto di vista, centrale per la Teoria
delle successioni, non deve per far dimenticare che successioni asintotiche sono, in
generale, ben distinte tra loro (per ssare le idee, si ponga per esempio k = 10100 , cio
100 miliardi, e si considerino le successioni asintotiche xn = n e yn = n + 10100 ). O

9.12.1 Equivalenza asintotica


La relazione identica successioni che sono tra loro equivalenti dal punto di vista
asintotico. Infatti, facile vedere che yn xn implica che, dato L 2 R, si ha
yn ! L () xn ! L (9.26)
In dettaglio:

(i) se L 2 R, yn ! L se e solo se xn ! L;
(ii) se L = +1, yn ! +1 se e solo se xn ! +1;
(iii) se L = 1, yn ! 1 se e solo se xn ! 1;

Tutto ci porta a pensare che sia possibile sostituire xn con yn (o viceversa) nel
calcolo dei limiti. Tale possibilit allettante perch darebbe loccasione di sostituire
a una successione complicata una pi semplice che le asintotica.
Per rendere precisa lintuizione cominciamo con losservare che lequivalenza asin-
totica si conserva rispetto alle operazioni fondamentali.

Lemma 121 Se yn xn e zn wn , allora

(i) yn +zn xn +wn purch esista k > 0 tale che denitivamente18 jxn = (xn + wn )j
k;
(ii) yn zn xn wn ;
(iii) yn =zn xn =wn purch denitivamente zn 6= 0 e wn 6= 0.

Dim. (i) Si ha
yn + zn yn zn yn xn zn wn
= + = +
xn + wn xn + wn xn + wn xn xn + wn wn xn + wn
yn xn zn xn yn zn xn zn
= + 1 = +
xn xn + wn wn xn + wn xn wn xn + wn wn
Poich yn =xn ! 1 e zn =wn ! 1, si ha
yn zn
!0
xn wn
18
Per esempio, la condizione vale se fxn g e fwn g sono entrambe denitivamente positive.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 259

e quindi
yn zn xn yn zn xn yn zn
0 = k!0
xn wn xn + wn xn wn xn + wn xn wn
Per il Criterio del confronto,
yn zn xn
!0
xn wn xn + wn
e quindi, essendo zn =wn ! 1, si ha
yn + zn
!1
xn + wn
come desiderato.
(ii) e (iii) Si ha
yn zn yn zn
= !1
xn wn xn wn
e yn
zn yn wn yn wn
xn = = !1
wn
zn xn xn zn
poich yn =xn ! 1 e zn =wn ! 1.
Il prossimo semplicissimo lemma molto utile: nel calcolo di un limite bene
trascurare ci che trascurabile.
Lemma 122 Si ha
xn xn + o (xn )
Dim. Basta osservare che
xn + o (xn ) o (xn )
=1+ !1
xn xn

Grazie alla (9.26), si ha quindi


xn + o (xn ) ! L () xn ! L
Ci che trascurabile rispetto alla successione fxn g, ossia ci che o (xn ), asintoti-
camente irrilevante ed bene trascurarlo. Assieme al Lemma 121 ci implica:
xn + o (xn ) + yn + o (xn ) xn + yn (9.27)
e
(xn + o (xn )) (yn + o (xn )) xn yn (9.28)
nonch
xn + o (xn ) xn
(9.29)
yn + o (xn ) yn
Illustriamo queste utilissime equivalenze asintotiche con alcuni esempi, che inviti-
amo il lettore a leggere con particolare attenzione.
260 CAPITOLO 9. SUCCESSIONI

Esempio 150 Consideriamo il limite


n4 3n3 + 5n2 7
lim
2n5 + 12n4 6n3 + 4n + 1
Grazie alla (9.29) si ha

n4 3n3 + 5n2 7 n4 + o (n4 ) n4 1


= = !0
2n5 + 12n4 6n3 + 4n + 1 2n5 + o (n5 ) 2n5 2n
H

Esempio 151 Consideriamo il limite


2
lim n4 + n2 en en

Grazie alla (9.27) si ha


2 2 2 2
n4 + n2 en en = n4 + o n4 en + o en n4 en
2 2 2
= en + o en en ! 1

Esempio 152 Consideriamo il limite


1 3
lim n2 7n + 3 2 + 2
n n
Grazie alla (9.28) si ha

1 3
n2 7n + 3 2 + 2 = n2 + o n2 (2 + o (1)) 2n2 ! +1
n n
H

Esempio 153 Consideriamo il limite


n (n + 1) (n + 2) (n + 3)
lim
(n 1) (n 2) (n 3) (n 4)
Grazie alla (9.29) si ha

n (n + 1) (n + 2) (n + 3) n4 + o (n4 ) n4
= 4 =1!1
(n 1) (n 2) (n 3) (n 4) n + o (n4 ) n4
H
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 261

Esempio 154 Consideriamo il limite

n 1
lim e 7+
n

Grazie alla (9.28) si ha

n 1 n n
e 7+ =e (7 + o (1)) 7e !0
n
H

Grazie alla (9.25) si ha


yn xn zn wn
() (9.30)
zn wn yn xn

purch i rapporti siano (denitivamente) ben deniti e non nulli. Quindi, una volta
stabilita lasintoticit dei rapporti yn =zn e xn =wn , si ha automaticamente anche
lasintoticit dei loro reciproci zn =yn e wn =xn .

Esempio 155 Consideriamo il limite

e5n n7 4n2 + 3n
lim
6n + n8 n4 + 5n3

Grazie alla (9.29) si ha


n
e5n n7 4n2 + 3n e5n + o (e5n ) e5n e5
= = ! +1
6n + n8 n4 + 5n3 6n + o (6n ) 6n 6

Se, invece, consideriamo il limite reciproco

6n + n8 n4 + 5n3
lim 5n
e n7 4n2 + 3n

grazie alla (9.30) si ha


n
6n + n8 n4 + 5n3 6
!0
e5n n7 4n2 + 3n e5
H

In conclusione, un uso accorto delle (9.27)-(9.29) permette sovente di semplicare


in modo sostanziale il calcolo dei limiti. Ma, al di l del calcolo, si tratta di relazioni
illuminanti dal punto di vista concettuale.
262 CAPITOLO 9. SUCCESSIONI

9.12.2 Terminologia
In ragione della loro importanza, per il confronto sia di successioni innitesime sia di
successioni divergenti vi una terminologia specica. In particolare,

(i) se due successioni innitesime fxn g e fyn g sono tali che yn = o (xn ), la successione
fyn g detta innitesima di ordine superiore rispetto a fxn g;

(ii) se due successioni divergenti fxn g e fyn g sono tali che yn = o (xn ), la successione
fyn g detta innita di ordine inferiore rispetto a fxn g.

In altre parole, una successione innitesima di ordine superiore se tende a zero


pi velocemente, mentre innita di ordine inferiore se tende a innito pi lenta-
mente. Al di l della terminologia (peraltro non univoca), importa ricordare lidea di
trascurabilit che sta alla base della relazione yn = o (xn ).

9.12.3 Scale di inniti


Alla luce di quanto visto sugli ordini di convergenza, riproponiamo i risultati, in buona
parte gi ottenuti col criterio del rapporto, relativi al confronto tra successioni espo-
nenziali, f n g, potenza, nk , e logaritmiche, logk n 19 . Per prima cosa, si osservi
che esse sono innite quando > 1 e k > 0 e innitesime quando 0 < < 1 e k < 0.
Inoltre, si ha:

(i) Se > , allora n


= o( n
). Infatti, n
= n
= ( = )n ! 0.

(ii) nk = o ( n ) per ogni > 1, come gi provato col Criterio del rapporto. Si ha
n
= o nk se, invece, 0 < < 1.

(iii) Se k1 > k2 , allora nk2 = o nk1 . Infatti nk2 =nk1 = 1=nk1 k2


! 0.

(iv) logk n = o (n), come gi provato col Criterio del rapporto.

(v) Se k1 > k2 , allora logk2 n = o logk1 n . Infatti

logk2 n 1
k1
= k1 k2
!0
log n log n

Il prossimo lemma ripota due importanti confronti di inniti, che mostrano che gli
esponenziali sono inniti di ordine inferiore rispetto a quelli di tipo n! e nn . Si noti
che il lemma implica, grazie al Lemma 120, che n = o (nn ).

n
Lemma 123 Risulta = o (n!), con > 0, e n! = o (nn ).
19
Come annunicato nella Sezione 9.11, qui e nel resto del libro consideriamo solo logaritmi naturali.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 263

n
Dim. (i) Posto > 0, mostriamo che = o (n!). Si ponga
n
xn =
n!
sicch
n+1
xn+1 n!
= = !0
xn (n + 1)! n 1+n
n
Per il Criterio del rapporto, xn ! 0 e quindi = o (n!).

(ii) Mostriamo che n! = o (nn ). Ponendo

n!
xn =
nn
risulta
n
xn+1 (n + 1)! nn n 1 1
lim = lim = lim = lim n =
xn (n + 1)n+1 n! n+1 1 + n1 e

1
Poich e < 1, per il Criterio del rapporto si ha xn ! 0 e quindi n! = o (nn ).

I diversi ordini di innito e innitesimo sono talvolta organizzati secondo scale.


Se ci limitiamo agli inniti (considerazioni analoghe valgono per gli innitesimi), la
pi classica scala di inniti la logaritmico-esponenziale. Prendendo xn = n come
spartiacque, abbiamo la scala ascendente
2 k n
n; n2 ; :::; nk ; :::; en ; e2n ; :::; ekn ; :::; en ; :::; en ; :::; ee ; :::

e la scala discendente
1 1
n; n 2 ; ::; n k ; :::; log n; log2 n; :::; logk n; :::; log log n; log2 log n; :::; logk log n; :::

Esse danno dei campioni per il comportamento asintotico di un innito fxn g. Per
esempio, se xn log n, la successione fxn g asintoticamente logaritmica; se xn n2 ,
la successione fxn g asintoticamente quadratica, e cos via.
Sebbene per brevit omettiamo i dettagli, il Lemma 123 mostra che la scala
logaritmico-esponenziale pu essere notevolmente a nata con ordini di innito del
tipo n! e nn .

9.12.4 La formula di De Moivre-Stirling


Per illustrare luso degli o piccoli, presentiamo la formula di De Moivre-Stirling. Si trat-
ta di una formula, che oltre a essere molto sorprendente, usata in parecchi problemi
teorici e applicati. Essa riguarda il comportamento asintotico di n!.
264 CAPITOLO 9. SUCCESSIONI

Teorema 124 Si ha

log n! = n log n n + o (n)


1 p
= n log n n + log n + log 2 + o (1)
2
Abbiamo quindi due approssimazioni di log n!. La prima, un popi grossolana,
dovuta a De Moivre e ha un termine di errore di ordine o (n). La seconda, dovuta a
Stirling, pi accurata, con un termine di errore o (1), ma anche pi complessa20 .

Dim. Ci limitiamo a mostrare la prima uguaglianza. Ponendo xn = n!=nn , nella


dimostrazione del Lemma 123 si visto che
xn+1 1
lim =
xn e
Per la (11.17), risulta anche
p
n
p n! 1
lim n
xn = lim =
n e
p n
Si conclude allora che n= n n! = e (1 + o (1)), cio che n!=nn = e n
(1 + o (1)) , ovvero
che
n! = nn e n (1 + o (1)) n
Quindi log n! = n log n n n log (1 + o (1)). Poich log (1 + an ) an per an ! 0, si
pu scrivere che n log (1 + o (1)) n o (1) = o (n).
p
Se ne deduce che n! = nn e n 2 neo(1) , e quindi
n!
p = eo(1) ! 1
nn e n 2 n
Si ha perci la notevole formula
p
n! nn e n
2 n

che chiude in bellezza largomento.

9.12.5 Distribuzione dei numeri primi


Luso di o piccolo nasce alla ne dellOttocento nello studio della distribuzione dei
numeri primi. Nella Sezione 1.3 avevamo introdotto i numeri primi e mostrato col
Teorema fondamentale dellaritmetica la loro centralit, atomica, nellinsieme dei
numeri naturali. Con un celebre teorema di Euclide avevamo anche visto che esistono
20
Si ha o (1) =n ! 0, e quindi una successione che sia o (1) anche o (n). Per questo, come termine
di errore o (1) migliore di o (n).
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 265

inniti numeri primi, sicch possiamo parlare della loro successione fpn g. Ma, nella
Sezione 9.1 avevamo osservato come, purtroppo, sia impossibile descrivere esplicita-
mente questa successione. Ci ha portato a interrogarsi sulla distribuzione dei numeri
primi in N. Sia : N+ ! R la successione il cui termine (n) il numero di numeri
primi minori o uguali a n. Per esempio

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
(n) 0 1 2 2 3 3 4 4 4 4 5 5 6 6 6

e cos via. Naturalmente non possibile descrivere la successione perch ci equivar-


rebbe a poterlo fare per la sucessione dei numeri primi, il che abbiamo visto essere
impossibile. Ma, ci si pu chiedere se esista una successione fxn g descrivibile in for-
ma chiusa e asintotica a : in altre parole, se esista una successione ragionevomente
semplice che ben approssimi asintoticamente .
Intorno al 1800, Gauss e Legendre osservarono independentemente che la succes-
sione fn= log ng sembrava ben approssimare , come si pu vedere da questa tabella.
n (n)
n (n) log n n= log n

10 4 4; 3 0; 921
102 25 21; 7 1; 151
103 168 145 1; 161
104 1:229 1:086 1; 132
105 9:592 8:686 1; 104
1010 455:052:511 434:294:482 1; 048
1015 29:844:570:422:669 28:952:965:460:217 1; 031
1020 2:220:819:602:560:918:840 2:171:472:409:516:250:000 1; 023

Come si vede, il rapporto


(n)
n
log n

si mantiene prossimo a 1 per valori via via pi grandi di n. La congettura di Gauss e


Legendre aermava che ci accade perch asintotica a fn= log ng. La congettura
rimase irrisolta per circa un secolo nch fu dimostrata nel 1896 indipendentemente da
due grandi matematici, Jacques Hadamar e Charles de la Valle Poussin. Limportanza
del risultato rivelata dal suo nome, tanto semplice quanto impegnativo21 .
21
La non facile dimostrazione del toerema si basa su metodi di analisi complessa che non studiamo
in queste note. Si deve a una profonda intuizione di Bernard Riemann il sorprendente uso di nozioni
di Analisi complessa nello studio dei numeri primi. Solo nel 1949 due altri notevoli matematici, Paul
Erds e Atle Selberg, riuscirono a dare una dimostrazione di questo risultato basata su metodi di
Analisi reale.
266 CAPITOLO 9. SUCCESSIONI

Teorema 125 (dei numeri primi) Si ha


n
(n)
log n
Grazie al Teorema dei numeri primi, pur non potendo descrivere la successione
, possiamo dire che il suo comportamento asintotico simile a quello della semplice
successione fn= log ng. Bench non siamo in grado di descrivere la successione dei
numeri primi, possiamo per dire che, approssimativamente, il loro numero in ogni
dato intervallo di numeri naturali [m; n]
n m
(n) (m) =
log n log m

con grado di accuratezza via via migliore al crescere di n. un risultato, di sapore


statistico, di incredibile eleganza. Tanto pi alla luce della prossima notevolissima
conseguenza del Teorema dei numeri primi.

Teorema 126 Si ha
pn n log n (9.31)

La successione fpn g dei numeri primi quindi asintotica alla successione fn log ng.
Ln-esimo numero primo ha, approssimativamente, valore n log n. Per esempio, con-
sultando le esistenti tavole dei numeri primi si scopre che per n = 100 si ha pn = 541
mentre la sua stima n log n = 460 (arrotondando per difetto). Similmente:
pn
n pn n log n n log n

100 541 460 1; 176 1


1:000 7:919 6:907 1; 146 5
10:000 104:729 92:104 1; 137 1
100:000 1:299:709 1:151:292 1; 128 9
10:00:000 154:85:863 13:815:510 1; 120 9
10:000:000 179:424:673 161:180:956 1; 113 2
100:000:000 2:038:074:743 1:842:068:074 1; 106 4
1:000:000:000 22:801:763:489 20:723:265:836 1; 100 3

Come si vede, il rapporto tra pn e la sua stima n log n rimane stabilmente prossimo a
1.

Dim. Per il Teorema dei numeri primi si ha


log n
(n) !1
n
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 267

Quindi, ssato " > 0, esiste n" tale che


log n
(n) 1 <" 8n n" (9.32)
n

Poich pn ! 1, esiste n" tale che pn n" per n n" . Quindi, la (9.32) implica che

log pn
(pn ) 1 <" 8n n"
pn

Daltra parte si ha (pn ) = n, e quindi

log pn
n 1 <" 8n n"
pn
cio
log pn
n !1 (9.33)
pn
Da ci segue che
log pn
log n ! log 1 = 0
pn
cio log n + log log pn log pn ! 0. Poich log pn ! +1,
log n log log pn log n + log log pn log pn
+ 1= !0
log pn log pn log pn
Ma log log pn = log pn ! 0 (perch?), e quindi
log n
!1
log pn
Moltiplicando per la (9.33) si ottiene
n log n log pn log n
=n !1
pn pn log pn
il che prova la (9.31).

9.12.6 Termine di errore


Da un punto di vista metodologico lo studio della distribuzione dei numeri primi
pu essere inquadrato nel seguente modo: siamo interessati a una certa successione
incognita fxn g e linformazione che abbiamo su di essa data da unaltra successione
fyn g. Usando (e abusando) unanalogia statistica, fyn g uno stimatore di fxn g
mentre un singolo termine yn una stimadel corrispettivo termine xn .

Denizione 69 La successione fyn g si dice stima corretta di fxn g quando xn yn .


268 CAPITOLO 9. SUCCESSIONI

La condizione di asintoticit xn yn garantisce che lo stimatore sia, al limite,


corretto. Nel caso dei numeri primi appena visto, fxn g la successione dei numeri
primi e fyn g la successione n log n, oppure fxn g la successione f (n)g e fyn g
la successione n= log n. Grazie al Teorema dei numeri primi, n= log n uno stimatore
corretto di , mentre grazie al Teorema 126 n log n uno stimatore corretto della
successione dei numeri primi.
In questa prospettiva diventa importante studiare la successione fen g dei termini
di errore con
en = jxn yn j
Al riguardo, si osservi che da xn yn scende che xn = yn + o (yn ) e quindi

en = o (yn ) . (9.34)

La correttezza di per s garantisce dunque che la successione fen g sia trascurabile


rispetto a fyn g. Pur essendo confortante, si pu dire molto di pi. Per esempio,
supponiamo che fyn g sia la successione dei quadrati n2 . Se la successione incognita
p
2 2
fosse fxn g = fn p + ng, si avrebbe en = n, mentre se fosse fxn g = fn + ng, si
avrebbe
p en = n. In entrambipi casi si ha en = o (yn ), ossia la (9.34), ma anche
n = o (n). Il termine di errore n decisamente migliore di n.
Quindi, un primo problema della stima determinare qual il corretto termine di
errore in cui si incorre stimando fxn g con fyn g. Siccome non conosciamo fxn g (diver-
samente, la stima sarebbe banale), si tratta di un compito potenzialmente complicato.
per molto importante conoscere il corretto termine di errore perch ci consente
di determinare la bont dello stimatore fyn g, il che importante sia di per s, perch
descrive il grado di accuratezza delle sue stime, sia dal punto di vista comparativo
quando occorra confrontare diversi possibili stimatori di una medesima successione
incognita.

NB. Il fatto che il rapporto xn =yn tenda a 1 non implica aatto che le p dierenze
jxn yn j siano trascurabili. Negli esempi test visti, entrambi gli errori n e n diver-
gono positivamente. Comunque, grazie alla (9.34) sappiamo che quando fen g diverge,
tale divergenza di ordine inferiore rispetto a fyn g O

Nello studio dei termini di errore molto utile la seguente nozione di O grande.

Denizione 70 Date due successioni fxn g e fyn g, se esiste k > 0 tale che deniti-
vamente
jyn j k jxn j
diciamo che fyn g asintoticamente dominata da fxn g. In simboli xn = O (yn ).

Si noti che il valore della costante k lasciato indeterminato: conta soltanto che
tale costante esista. Il prossimo lemma mostra alcuni semplici legami tra le relazioni
, o e O.
9.12. ORDINI DI CONVERGENZA E DI DIVERGENZA 269

Lemma 127 (i) yn xn implica yn = O (xn ).

(ii) yn = o (xn ) implica yn = O (xn ).

Le condizioni yn xn e yn = o (xn ) sono quindi su cienti per xn = O (yn ) ma non


necessarie: un banale esempio yn = ( 1)n e xn = 1. Il limite yn =xn non esiste, e
quindi non si ha n yn xn n yn = o (xn ), purtuttavia si ha yn = O (xn ).

Dim. (i) se yn xn allora, per ogni " > 0, esiste n" tale che

yn
1 <" 8n n"
xn

Dunque jyn j = jxn j < 1 + " per ogni n n" , e quindi denitivamente jyn j (1 + ") jxn j.
(ii) se yn = o (xn ) allora, per ogni " > 0, esiste n" tale che

jyn j
<" 8n n"
jxn j

e perci jyn j = jxn j < " per ogni n n" , e quindi denitivamente jyn j " jxn j.

Vediamo un altro utile risultato.

Lemma 128 (i) yn = O (xn ) e xn = O (yn ) se e solo se esiste k > 0 tale che,
denitivamente,
1
jxn j jyn j k jxn j (9.35)
k
(ii) yn = O (xn ) e xn = O (yn ) implicano xn yn .

Dim. (i) yn = O (xn ) implica che esista k 0 > 0 tale che, denitivamente, jyn j k 0 jxn j,
mentre xn = O (yn ) implica che esista k 00 > 0 tale che, denitivamente, jxn j k 00 jyn j.
Ponendo k = max fk 0 ; k 00 g, si ottiene la (9.35). Lasciamo al lettore la dimostrazione
della (ii).

Il lemma mostra che la relazione yn = O (xn ) e xn = O (yn ) generalizza la relazione


di confrontabilit tra successioni, che richiede la convergenza della successione dei
rapporti yn =xn . Quando si ha questultima, grazie alla (i) si ha che xn yn equivale ad
avere sia yn = O (xn ) sia xn = O (yn ). Ma, anche in mancanza di tale convergenza, la
relazione yn = O (xn ) e xn = O (yn ) equivale alla (9.35) che una forma di confrontabil-
it per le due successioni, pur se un popi rozza della condizione yn =xn ! k 6= 0 che
denisce xn yn .

Denizione 71 Date due successioni fxn g e fyn g, se yn = O (xn ) e xn = O (yn ),


diciamo che fyn g dello stesso ordine o che confrontabile con fxn g; in simboli
yn xn .
270 CAPITOLO 9. SUCCESSIONI

Questa denizione di confrontabilit pienamente coerente con la precedente del-


la Denizione 68, di cui estende la portata non richiedendo la convergenza della
successione dei rapporti yn =xn . Abbiamo perci conservato la notazione .

Esempio 156 (i) Le successioni di termini xn = 1 e yn = ( 1)n sono confrontabili


(si prenda k = 1 nella (9.35)).

(ii) Le successioni di termini xn = n (2 + sin n), e yn = n sono confrontabili (si


prenda k = 3 nella (9.35)). N

Se con unanalogia pensiamo a come a una uguaglianza = e a o piccolo come a


una disuguaglianza stretta >, lO grande una sorta di disuguaglianza debole . Con
tale ordinamento possiamo classicare i termini di errore.

Denizione 72 La successione fyn g stima fxn g con termine di errore di ordine fzn g
se
xn = yn + O (zn )
ossia se en = O (zn ).

La condizione en = O (zn ) garantisce che lerrore sia al pi di ordine zn , ponendo


un limite allerrore nel quale si pu incorrere nello stimare xn con yn : la scrittura
O (zn ) ci dice qual il peggior errore che si pu vericare. Sono benvenute maggiori
informazioni sullerrore, che per esempio permettano di dire che en = o (zn ) o, ancor
meglio, che en zn . Spesso, per, stabilire che en = O (zn ) quanto di meglio si riesce
a fare. Naturalmente ci si aspetta che la successione zn di riferimento abbia un chiaro
comportamento asintotico: spesso si usano successioni di potenze, con zn = n per
2 R, oppure di logaritmi, con zn = log n per 2 R, oppure di esponenziali, con
zn = en per 2 R, o loro opportune combinazioni. Al variare di , abbiamo scale di
potenze, logaritmiche ed esponenziali per valutare gli errori.

Dati due stimatori fyn0 g e fyn00 g di una stessa successione fxn g con errori e0n e e00n ,
se:

(i) e0n = O (e00n ), cio se il termine di errore dello stimatore fyn0 g asintoticamente
dominato da quello di fyn00 g, allora fyn0 g uno stimatore migliore di fxn g rispetto
a fyn00 g;

(ii) e0n e00n , cio se il termine di errore dello stimatore fyn0 g confrontabile con
quello di fyn00 g, allora fyn0 g uno stimatore equivalente di fxn g rispetto a fyn00 g.

Esempio 157 Se entrambi gli errori sono inniti, cio e0n ! +1 e e00n ! +1, e se
e0n = o (e00n ) allora e0n innito di ordine inferiore di e00n (per esempio, e0n = n e e00n = n2 ).
Invece, se entrambi gli errori sono innitesimi, cio e0n ! 0 e e00n ! 0, e se e0n = o (e00n )
allora e0n innitesimo di ordine superiore di e00n (per esempio, e0n = 1=n2 e e00n = 1=n).
In tutti e due i casi, lo stimatore yn0 migliore di yn00 . N
9.13. SUCCESSIONI IN RN 271

La classicazione dei termini di errore ha presupposto la loro conoscenza, cosa


niente aatto banale visto che fxn g incognita. Ci siamo quindi posti in una situazione
idealizzata. Tuttavia linquadramento teorico utile anche nella determinazione del
termine di errore. Infatti, in tale questo processo si determinano valutazioni via via
pi accurate del termine di errore, e le nozioni test viste sono utili nel classicare
i miglioramenti. Torniamo ai numeri primi per illustrare tutto ci, lasciando alle
meditazioni del lettore la relativa analisi teorica.

Esempio 158 Consideriamo le successioni e n= log n del Teorema dei numeri primi.
Poich n= log n, la (9.35) diventa qui

n n
= +o (9.36)
log n log n

cio en = o (n= log n). Tuttavia si riusciti a dimostrare che esiste una costante
2 (1; 2) tale che
n n
= +O (9.37)
log n log n
cosicch en = O (n= log n). Questultima valutazione del termine di errore pi
accurata della precedente22 . Infatti, per denizione esiste k > 0 tale che
n n 1
en k =k
log n log n log 1 n

e quindi, poich > 1,


en 1
0 n k 1 !0
log n log n
Ne segue che en = o (n= log n). Ma, non valendo il viceversa (perch?), en = O (n= log n)
una valutazione pi accurata dellerrore rispetto a en = o (n= log n). N

9.13 Successioni in Rn
Prendiamo ora in esame successioni xk di vettori in Rn . Per esse diamo la seguente
denizione di limite che ricalca quella gi data per successioni in R. La dierenza
fondamentale che ogni elemento della successione un vettore xk = (xk1 ; xk2 ; :::; xkn ) 2
Rn e non uno scalare.

Denizione 73 Si dice che la successione xk in Rn tende a L 2 Rn , in simboli


xk ! L o lim xk = L, se per ogni " > 0 esiste n" 1 tale che

k n" =) kxk Lk < ":


22
Spesso ci che noi chiamiamo valutazione del termine di errore detto stima dellerrore. Si
dice allora che O (n= log n) una miglior stima dellerrore rispetto a o (n= log n).
272 CAPITOLO 9. SUCCESSIONI

In altre parole, xk ! L = (L1 ; L2 ; :::; Ln ) se la successione numerica xk L


converge a zero. Dato che
Xn q 2
k
x L = xki Li ;
i=1

si riconosce immediatamente che

xk x ! 0 () xki Li ! 0 8i = 1; 2; : : : ; n; (9.38)

cio se e solo se le successioni xki delle singole componenti i convergono alla compo-
nente Li del vettore L.
La convergenza di una successione di vettori dunque ricondotta alla convergenza
delle singole componenti e perci non presenta alcuna di colt n di comprensione n
di calcolo.

Esempio 159 Sia


1 1 2k + 3
1 + ; 2;
k k 5k 7
una successione in R3 . Dato che
1 1 2k + 3 2
1+ !1 , !0 e ! ;
k k2 5k 7 5
la successione converge a [1; 0; 2=5]. N

In maniera del tutto analoga si hanno le divergenze a +1 e a 1 quando tutte le


componenti dei vettori che formano la successione divergono rispettivamente a +1 o
a 1. Quando, inne, le singole componenti abbiano comportamenti diormi (alcune
convergono, altre divergono o sono irregolari) la successione di vettori non ammette
limite. Per brevit omettiamo i dettagli.

Notazione Le successioni di vettori si indicano con xk invece di fxn g sia per


evitare confusione con la dimensione n dello spazio Rn sia per poter indicare le singole
componenti xki di ogni vettore xk della successione.

9.14 Valori limite


Consideriamo una successione fxn g limitata di numeri reali, ossia tale che esista M > 0
per cui M xn M per ogni n. Consideriamo le successioni ausiliarie fyn g e fzn g
tali che
yn = sup xk e zn = inf xk
k n k n

Esempio 160 Per la successione f( 1)n g si ha yn = 1 e zn = 1 per ogni n, mentre


per la successione f1=ng si ha yn = 1=n e zn = 0 per ogni n. N
9.14. VALORI LIMITE 273

facile vericare che

M zn yn M 8n; (9.39)

sicch anche le due successioni ausiliarie sono limitate. Inoltre,

n1 < n2 ) sup xk sup xk e inf xk inf xk


k n1 k n2 k n1 k n2

e quindi fyn g decrescente e fzn g crescente. Grazie al Teorema 105, entrambe le


successioni fyn g e fzn g sono convergenti. Se indichiamo con y e z tali limiti, ossia
yn ! y e zn ! z, possiamo equivalentemente scrivere

lim sup xk = y e lim inf xk = z.


n!+1 k n n!+1 k n

I limiti y e z sono rispettivamente detti limite superiore e limite inferiore di fxn g e si


indicano rispettivamente con lim sup xn e lim inf xn .

Esempio 161 Per la successione irregolare f( 1)n g si ha

lim sup xn = 1 e lim inf xn = 1;

mentre per la successione convergente f1=ng si ha

lim sup xn = lim inf xn = lim xn = 0:

Lesempio ha mostrato due notevolissime propriet di questi limiti: essi esistono


sempre, anche quando la successione originale fxn g irregolare23 , e la convergenza
della successione fxn g equivale proprio alla loro uguaglianza: lim sup xn = lim inf xn
se e solo se esiste lim xn .

Proposizione 129 Sia fxn g una successione limitata di numeri reali. Si ha

1 < lim inf xn lim sup xn < +1: (9.40)

In particolare, fxn g converge a L 2 R se e solo se lim inf xn = lim sup xn = L.

Dim. Grazie alla (9.39), la (9.40) segue dalla Proposizione 102. Lasciamo al lettore
vericare la seconda parte dellenunciato.

Altre propriet interessanti, che lasciamo vericare al lettore, sono

lim inf xn = lim sup xn e lim sup xn = lim inf xn (9.41)


23
Essendo limitata, fxn g converge oppure oscilla, ma non diverge.
274 CAPITOLO 9. SUCCESSIONI

Si tratta di propriet di dualit perch mettono in relazione i limiti inferiori e superi-


ori delle successioni fxn g con quelli delle successioni gemelle f xn g. Per esempio,
questa semplice dualit permette di trovare in modo molto semplice quale veste as-
sumano per i limiti inferiori delle propriet stabilite per quelli superiori, e viceversa.
La prossima dimostrazione ne dar un esempio.
Unaltra interessante conseguenza della dualit di permettere di riscrivere la
disuguaglianza (9.40) come
lim inf xn lim inf xn

Il prossimo risultato raccoglie alcune semplici, ma utili, propriet dei limiti superiori
e inferiori. Grazie al risultato precedente, le analoghe propriet viste per successioni
convergenti sono implicate da questi risultati per i limiti superiori e inferiori.

Lemma 130 Siano fxn g e fyn g successioni limitate di scalari. Si ha:

(i) lim inf xn + lim inf yn lim inf (xn + yn ),


(ii) lim sup xn + lim sup yn lim sup (xn + yn ) ;
(iii) lim inf xn lim inf yn e lim sup xn lim sup yn se, denitivamente, si ha xn
yn .

Dim. (i) Per ogni n si ha


sup (xk + yk ) sup xk + sup xk .
k n k n k n

La (i) segue quindi dalla Proposizione 102. La (ii) segue dalla (i) usando le dualit
(9.41):

lim sup (xn + yn ) = lim inf (( xn ) + ( yn ))


lim inf ( xn ) lim inf ( yn ) = lim sup xn + lim sup yn
Lasciamo al lettore la dimostrazione della (iii).

Possiamo dare una caratterizzazione topologica di questi limiti; a tal ne introdu-


ciamo la nozione di valore limite.

Denizione 74 Si dice che L 2 R un valore limite di una successione fxn g se ogni


intorno di L contiene inniti termini della successione.

Se la successione convergente, esiste un unico valore limite: il limite della succes-


sione. Se la successione irregolare, i valori limite sono gli scalari ai quali si avvicinano
inniti termini della successione, pur senza che la successione vi converga. Del resto,
facile vedere che L un valore limite di fxn g se e solo se esiste una sottosuccessione
fxnk g che converge a L.
9.14. VALORI LIMITE 275

Esempio 162 (i) Lintervallo [ 1; 1] linsieme dei valori limite della successione
irregolare fsin ng , mentre f0; 1g linsieme dei valori limite della successione irregolare
f( 1)n g.
(ii) Il singoletto f0g lunico valore limite della successione convergente f1=ng. N

Il prossimo risultato mostra che linsieme dei valori limite incluso nellintervallo
determinato dai limiti superiore e inferiore.

Proposizione 131 Sia fxn g una successione limitata di scalari. Un punto x 2 R


un valore limite per la successione solo se x 2 [lim inf xn ; lim sup xn ].

Intuitivamente, una successione tanto pi irregolare quanto pi ampio linsieme


dei valori limite, che si riduce a un singoletto quando la successione converge. Alla
luce dellultimo risultato, la dierenza tra limiti superiori e inferiori, cio lampiezza
dellintervallo [lim inf xn ; lim sup xn ], un indice (piuttosto grezzo) di irregolarit di
una successione.

Grazie alla disuguaglianza lim inf xn lim inf xn , lintervallo [lim inf xn ; lim sup xn ]
si pu equivalentemente scrivere come

[lim inf xn ; lim inf xn ] :

Per esempio, per xn = sin n oppure xn = cos n,

[lim inf xn ; lim inf xn ] = [ 1; 1]

NB. Finora abbiamo considerato successioni limitate. In realt, tutto quanto si es-
tende in modo naturale a successioni qualsiasi, una volta che si permetta ai limiti
superiori e inferiori di assumere valore innito. Per esempio, per la successione fng,
che diverge positivamente. si ha lim inf xn = lim sup xn = +1; per la successione
f en g, che diverge negativamente, si ha lim sup xn = lim inf xn = 1, mentre per la
successione irregolare f( 1)n ng si ha lim inf xn = 1 e lim sup xn = +1, cosicch
[lim inf xn ; lim sup xn ] = R. Lasciamo al lettore lestensione a successioni qualsiasi di
quanto visto per le limitate. O
276 CAPITOLO 9. SUCCESSIONI
Capitolo 10

Applicazione: prezzi e aspettative

Di norma le decisioni economiche si basano su variabili il cui valore sar noto so-
lo in futuro. Al momento della decisione gli agenti devono perci basarsi sulle loro
aspettative soggettive circa tali valori. Per tale ragione le aspettative sono centrali nel-
lanalisi economia e limportanza di questa componente soggettiva uno degli aspetti
che maggiormente la distinguono dalle scienze naturali. Nel capitolo diamo una prima
illustrazione della loro importanza facendo uso delle nozioni sulle successioni imparate
nellultimo capitolo.

10.1 Un mercato
Consideriamo un mercato, che indicheremo con M , di un bene agricolo, per esempio
le patate. Esso descritto da una curva di domanda D : [k1 ; k2 ] ! R e da una curva
di oerta S : [k1 ; k2 ] ! R, con 0 k1 < k2 . Limmagine D (p) la quantit di patate
complessivamente domandata al prezzo p dai consumatori, mentre limmagine S (p)
la quantit di patate complessivamente oerta al prezzo p dai produttori. Si assume
che entrambe tali quantit rispondano istantaneamente a variazioni del prezzo p di
mercato: in particolare, ci signica che i produttori sono in grado di aggiustare in
modo istantaneo la propria produzione al prezzo p.
Per semplicit, consideriamo funzioni lineari di domanda e oerta, cio

D (p) = p (M)
S (p) = a + bp

con > 0, a 0 e ; b > 0. Siccome i consumatori domandano solo quantit positive,


si pu porre k2 = = > 0 (perch D (p) 0 se e solo se p = ); analogamente,
dato che i produttori orono solo quantit positive, si pu porre k1 = a=b (perch
S (p) 0 se e solo se p a=b). Ai prezzi dellintervallo

a
[k1 ; k2 ] = ; ; (10.1)
b

277
278 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

nel quale entrambe le quantit sono simultaneamente positive, vi possono essere scam-
bi: per questa ragione abbiamo considerato le funzioni di domanda e oerta come def-
inite soltanto su tale intervallo, sebbene dal punto di vista matematico siano denite
su tutta la retta reale.1

Denizione 75 Una coppia (p; q) 2 R2+ di prezzi e quantit si dice equilibrio del
mercato M se
q = D (p) = S (p) :

Per la nostra economia lineare, la condizione di equilibrio diventa

p = a + bp

sicch il prezzo e la quantit di equilibrio sono rispettivamente


a
p= (10.2)
+b
a b a
q = D (p) = p= = :
+b +b
Si noti che, in modo equivalente, si pu ricavare la quantit di equilibrio dalla curva
di oerta:
a b a
q = S (p) = a + p = a + b = :
+b +b
La coppia
a b a
;
+b +b
quindi lequilibrio del nostro mercato di patate, che corrisponde allintersezione tra
domanda e oerta

16

14
S(p)
12

10

8 D(p)

0
O k k p
1 2
-1 -0.5 0 0.5 1 1.5 2 2.5 3

1
Si noti che, a nch sia non vuoto lintervallo (10.1), si deve avere a=b = , cio a b,
che una ulteriore condizione che i coe cienti delle curve di domanda e oerta devono rispettare.
10.2. RITARDI NELLA PRODUZIONE 279

10.2 Ritardi nella produzione


Supponiamo che il mercato delle patate si ripeta periodicamente, per esempio ogni
mese. Indichiamo con t, t = 1; 2; : : :, un generico mese e con pt il prezzo in esso
vigente. Poniamo che

D (pt ) = pt (Mt )
S (pt ) = a + pt

descrivono il mercato, che indicheremo con Mt , delle patate in ogni t. Oltre allipotesi
di produzione istantanea gi assunta per il mercato M , lo studio dei mercati Mt si
basa su due ulteriori ipotesi: (i) in ogni t i produttori e i consumatori sono gli stessi,
sicch i coe cienti , , a e b rimangono costanti nel tempo, e (ii) il bene scambiato
in ogni t, le patate, deperibile e non conservabile sino a t + 1: le quantit domandate
in t + 1 e in t sono quindi indipendenti, e lo stesso vale per le quantit oerte.
La nozione di equilibrio considera ora tutti i mercati Mt e non solo un singolo
mercato M . Per questa ragione si richiede che domanda e oerta si equilibrino in ogni
data t, sicch in luogo della coppia (p; q) di scalari della Denizione 75 si ha ora una
coppia di successioni.

Denizione 76 Una coppia di successioni fpt g R1+ e fqt g R1


+ di prezzi e
quantit si dice equilibrio uniperiodale dei mercati Mt se

qt = D (pt ) = S (pt ) 8t 1:

immediato vedere che la successione fpt g dei prezzi di equilibrio costante:


a
pt = : (10.3)
+b
Ritroviamo quindi lo stesso prezzo di equilibrio (10.2) del mercato M . Del resto, grazie
alle ipotesi test assunte, i mercati Mt sono tra loro indipendenti e in ogni t si ha un
mercato identico a M .
Lipotesi di produzione istantanea delle patate su cui si regge tale equilibrio
per implausibile. Assumiamo, pi sensatamente, che i produttori siano in grado
di aggiustare la produzione solo dopo un periodo: la tecnologia a disposizione dei
produttori richiede che la quantit di produzione in t si decida in t 1 (per raccogliere
patate in t si devono seminare in t 1).
Al momento di decidere la produzione in t 1, i produttori non conoscono il futuro
prezzo pt di equilibrio, ma possono solo formarsi unaspettativa su di esso. Indichiamo
con Et 1 (pt ) tale aspettativa.
In questo caso il mercato in t, che diremo con ritardo e indicheremo con M Rt ,
ha la forma

D (pt ) = pt (MRt )
S (Et 1 (pt )) = a + bEt 1 (pt )
280 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

dove laspettativa Et 1 (pt ) sostituisce il prezzo pt come argomento della funzione di


oerta.

Denizione 77 Una terna di successioni di prezzi fpt g 2 R1 1


+ , di quantit fqt g 2 R+
e di aspettative fEt 1 (pt )g 2 R1
+ si dice equilibrio uniperiodale dei mercati M Rt con
ritardo se
qt = D (pt ) = S (Et 1 (pt )) 8t 1:

In un equilibrio uniperiodale le successioni di prezzi e aspettative devono equili-


brarsi, ossia devono far s che domanda e oerta coincidano in ogni t. In particolare,
in equilibrio si ha
a b
pt = Et 1 (pt ) 8t 1: (10.4)

Poich i prezzi sono positivi, devessere


a
0 Et 1 (pt ) 8t 1:
b
Tali disuguaglianze rappresentano una condizione necessaria a nch le aspettative
siano di equilibrio. Ma, a parte queste semplici disuguaglianze, la nozione di equilibrio
alla quale ci siamo riferiti non pone alcuna restrizione sulle aspettative di equilibrio.
Si richiede loro soltanto di equilibrarsi coi prezzi, nullaltro.

10.3 Formazione delle aspettative


Proviamo a fare alcune ipotesi su come si possano formare le aspettative. Uninfor-
mazione importante per i nostri produttori la successione dei prezzi di equilibrio
fp1 ; p2 ; :::; pt 1 g vericatasi sino in t 1. Supponiamo che essi, un popigramente, si
aspettino che lultimo prezzo osservato, pt 1 , sia anche il futuro prezzo di equilibrio,
cio
Et 1 (pt ) = pt 1 8t 2; (10.5)
con aspettativa iniziale E0 (p1 ) arbitraria2 . Con questo processo di formazione delle
aspettative, detto classico, il mercato M Rt diventa

D (pt ) = pt
S (pt 1 ) = a + bpt 1

e, in equilibrio uniperiodale, i prezzi evolvono secondo lequazione


a b
pt = pt 1 8t 2 (10.6)

2
Infatti, le aspettative sul prezzo iniziale p1 non possono basarsi su alcun prezzo precedentemente
osservato.
10.4. PIGRE, MA CORRETTE 281

con valore iniziale


a b
p1 = E0 (p1 ) (10.7)

determinato dallarbitraria aspettativa iniziale E0 (p1 ).

Laspettativa E0 (p1 ) funge da innesco: una volta ssato un valore per E0 (p1 ),
dallequazione (10.7) scende il prezzo di equilibrio p1 , che a sua volta determina sia
laspettativa E1 (p2 ) tramite lequazione (10.5) sia il prezzo di equilibrio p2 tramite
lequazione (10.6), e cos via per i periodi successivi. Quindi, a partire da una data
aspettativa iniziale E0 (p1 ), le equazioni (10.5) e (10.6) permettono di determinare
per ricorrenza le successioni di equilibrio fpt g e fEt 1 (pt )g di prezzi e aspettative.
In particolare, in ogni t 2 si determinano i prezzi pt e si formano le aspettative
Et (pt+1 ).

Supponiamo che, un pomeno pigramente, i produttori si aspettino che il prezzo


futuro sia una media dei due ultimi prezzi osservati, pt 1 e pt 2 , cio
1 1
Et 1 (pt ) = pt 1 + pt 2 8t 3 (10.8)
2 2
con aspettative iniziali E0 (p1 ) e E1 (p2 ) arbitrarie. In equilibrio uniperiodale, tale
processo di formazione delle aspettative, detto estrapolativo, determina lequazione di
prezzo
a 1 1
pt = pt 1 pt 2 8t 3
2 4
con arbitrari valori iniziali p2 e p1 . In ogni caso, la presenza di ritardi nella produzione
e di aspettative pi o meno pigre, fa quindi s che la successione dei prezzi di equilibrio
uniperiodale sia denita per ricorrenza. Per semplicit, nel seguito considereremo
aspettative classiche.

10.4 Pigre, ma corrette


Una propriet fondamentale delle aspettative la loro correttezza. In equilibrio le
aspettative classiche risultano corrette, cio

Et 1 (pt ) = pt 8t 1

se e solo se i prezzi di equilibrio sono costanti:

Et 1 (pt ) = pt () pt = pt 1 8t 1 (10.9)

La condizione di costanza

pt+1 = pt = p 8t 1 (10.10)
282 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

richiede lesistenza di uno stesso prezzo p , detto stazionario, in ogni data.


Nella successione (10.6) ci vale se e solo se

a b
p = p

ossia
a
p =
+b
Si ritrova quindi il prezzo di equilibrio (10.3) del mercato con produzione istantanea.
Esiste un valore di innescoE0 (p1 ) da cui, per ricorrenza, si ottiene la successione
costante pt = p di equilibrio uniperiodale per il mercato delle patate? Se cos non
fosse, tale successione costante sarebbe un mero fantasma teorico. Losservazione
cruciale per rispondere a questa domanda che la successione costante di prezzi si
realizza quando
E0 (p1 ) = p1 (10.11)
cio quando laspettativa iniziale E0 (p1 ) corretta, ossia uguale alleettivo prezzo
p1 di equilibrio uniperiodale. Infatti, dalla relazione (10.4) e dallipotesi di aspettative
classiche (10.5), segue che

a b a b
E0 (p1 ) = p1 () p1 = E0 (p1 ) = p1 () p1 = p (10.12)

Daltra parte, con aspettative classiche, da p1 = p segue che E1 (p2 ) = p , sicch

a b a b a b a
p2 = E1 (p2 ) = p =
+b
1( a) ( + b) b ( a) a
= = =p
+b +b
Iterando si ha

E2 (p3 ) = p ;
a b a b
p3 = E2 (p3 ) = p =p ;

Et 1 (pt ) = p ;
a b a b
pt = Et 1 (pt ) = p =p

Grazie allipotesi (10.11) di aspettativa iniziale correttasi ha quindi una successione


costante fpt g di prezzi di equilibrio uniperiodale con pt = p , nonch una successione
costante fEt 1 (pt )g di aspettative di equilibrio con Et 1 (pt ) = p .
10.5. ASPETTATIVE RAZIONALI 283

Tirando le la, si ha dunque

Et 1 (pt ) = pt = p 8t 1

sicch in ogni t i produttori hanno aspettative corrette sul prezzo futuro. Sebbene pi-
gre, le aspettative classiche si rivelano corrette quando laspettativa iniziale azzeccata.
In questo fortunato caso iniziale, sia esso dovuto alla bravura nellelaborazione delle
proprie informazioni oppure a una pi banale fortuna del principiante, la successiva
pigrizia ben meritata.

Possiamo riassumere quanto appena visto nella seguente

Proposizione 132 Per un equilibrio uniperiodale con aspettative classiche le seguenti


propriet sono equivalenti:

(i) la successione fpt g dei prezzi di equilibrio costante;

(ii) la successione fEt 1 (pt )g delle aspettative di equilibrio corretta;

(iii) laspettativa iniziale corretta, cio E0 (p1 ) = p1 .

In tal caso, si ha
a
Et 1 (pt ) = pt = 8t 1
+b

10.5 Aspettative razionali


Date una successione di prezzi di equilibrio fpt g e una di aspettative fEt 1 (pt )g,
lerrore di previsione et in ogni t dato da

et = pt Et 1 (pt )

Laspettativa ha sottostimato il prezzo pt se et > 0 e lo ha sovrastimato se et < 0.


Invece, se et = 0 laspettativa risultata corretta.
presumibile che produttori razionali non siano sistematicamente in errore: er-
rare humanun est, perseverare diabolicum. Una forma estrema del principio consiste
nellassumere che le aspettative siano sistematicamente corrette, cio

Et 1 (pt ) = pt 8t 1

la cosiddetta ipotesi di aspettative razionali. Bench la correttezza delle aspettative


sia una propriet molto forte, quasi estrema, essa utilissima per ssare le idee. Per
esempio, la Proposizione 132 aerma che le aspettative classiche sono razionali in
equilibrio se e solo se i prezzi di equilibrio sono costanti. In particolare, la condizione
iniziale E0 (p1 ) = p1 necessaria e su ciente a nch le aspettative di equilibrio siano
razionali.
284 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

Grazie alla relazione (10.4), nel mercato delle patate lerrore di previsione et commes-
so in t dai produttori

a b
et = pt Et 1 (pt ) = + 1 Et 1 (pt )

In particolare, per ogni t 1 si ha


et = 0
se e solo se
a b
+ 1 Et 1 (pt ) = 0

cio, se e solo se
a
Et 1 (pt ) =
+b
Quindi, le aspettative sono razionali se e solo se
a
Et 1 (pt ) = pt = p = 8t 1
+b
Abbiamo quindi mostrato la seguente

Proposizione 133 Un equilibrio uniperiodale dei mercati M Rt ha aspettative di equi-


librio razionali, cio
Et 1 (pt ) = pt 8t 1
se e solo se la successione di prezzi di equilibrio costante con pt = p per ogni t 1.
In tal caso, si ha
a
Et 1 (pt ) = pt = 8t 1
+b

La costanza della successione dei prezzi di equilibrio uniperiodale quindi equiva-


lente alla correttezza delle aspettative. Si tratta di un risultato molto importante per
comprendere la funzione delle aspettative nellinterazione di mercato, e che prescinde
da come si formano le aspettative, in modo classico o non. In eetti, lequivalenza
tra (i) e (ii) della precedente Proposizione 132 un caso molto particolare di questo
risultato, proprio per il caso di aspettative classiche. Rispetto alla Proposizione 133,
la Proposizione 132 conserva limportante equivalenza con la propriet (iii), ossia con
la correttezza dellaspettativa iniziale.
Il confronto tra le Proposizioni 132 e 133 dovrebbe anche aver ulteriormente chiarito
come la razionalit sia una propriet delle aspettative e non unipotesi sul loro mec-
canismo di formazione. Una volta specicato tale meccanismo, per esempio classico o
estrapolativo, si pone il problema teorico di capire in quali condizioni esso determini
aspettative che siano razionali, cio corrette. La Proposizione 132 risolve il problema
nel caso classico, mostrando le condizioni che fanno s che le aspettative classiche siano
razionali.
10.6. CONVERGENZA DEI PREZZI 285

Un altro aspetto notevole della Proposizione 133 che il prezzo di equilibrio uniperi-
odale che si determina con aspettative razionali nel mercato M Rt con ritardi nella
produzione lo stesso del mercato con produzione istantanea, ovvero fornito dalla
(10.3). Le aspettative razionali hanno quindi annullato, in equilibrio, le dierenze nella
tecnologia di produzione: avere una tecnologia tradizionale, con semina in t 1 e pro-
duzione in t, piuttosto che una fantascientica tecnologia che consenta la produzione
istantanea, non fa alcuna dierenza sui prezzi, e quindi sulle quantit, di equilibrio
uniperiodale del mercato delle patate.
Bench molto forte, lipotesi di aspettative razionali quindi molto importante per
comprendere come lanalisi della produzione e del consumo possa essere ingannevole
senza unadeguata analisi dellinterazione di mercato e delle sue dinamiche.

Chiudiamo con unultima considerazione metodologica. Nella nozione di equilibrio


uniperiodale le aspettative possono contenere errori, anche sistematici. Se riteniamo
che tali errori non siano sostenibili e siano un elemento di disequilibrio del mercato,
occorre dare anche alle aspettative una funzione equilibratrice e considerarle, al
pari di prezzi e quantit, come variabili endogene (e quindi di equilibrio). Ci porta
alla seguente nozione di equilibrio, in cui domanda e oerta devono bilanciarsi e le
aspettative devono essere corrette.

Denizione 78 Una terna di successioni fpt g 2 R1 1


+ di prezzi, fqt g 2 R+ di quantit
e fEt 1 (pt )g 2 R1
+ di aspettative si dice equilibrio di aspettative razionali dei mercati
M Rt se
qt = D (pt ) = S (Et 1 (pt )) 8t 1
e
Et 1 (pt ) = pt 8t 1

In altre parole, un equilibrio di aspettative razionali un equilibrio uniperiodale


per il quale si richiede la correttezza delle aspettative. Naturalmente, in generale
gli equilibri uniperiodali non sono di aspettative razionali: per esempio, un equilibrio
uniperiodale con aspettative classiche e con E0 (p1 ) 6= p1 non di aspettative razionali.
Grazie alla Proposizione 133, lequilibrio uniperiodale con produzione istantanea
uguale, in termini di prezzi e quantit, allequilibrio di aspettative razionali con
produzione ritardata. Come gi osservato, la correttezza delle aspettative compensa
limpatto di dierenze tecnologiche su prezzi e quantit di equilibrio.

10.6 Convergenza dei prezzi


Torniamo alla successione denita per ricorrenza

a b
pt = pt 1 8t 2
286 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

con condizione iniziale p1 , dei prezzi di equilibrio uniperiodale di un mercato di un


bene con ritardi di produzione e con aspettative classiche della Sezione 10.2. Lo studio
del limite
lim pt
permette di comprendere il comportamento asintotico della successione di prezzi di
equilibrio. Da p = ( a) = ( + b) segue che

a b a 1 1 b
pt p = pt 1 =( a) pt 1
+b +b
ab b b
= pt 1 = (pt 1 p );
+b

cio
b
pt p = (pt 1 p) 8t 2 (10.13)

Grazie alla struttura ricorrente della relazione, si ottiene iterando:

b
p2 p = (p1 p)
2
b b b b
p3 p = (p2 p )= (p1 p) = (p1 p)
3
b b
p4 p = (p3 p )= (p1 p)

t 1
t 1 b
pt p = ( 1) (p1 p)

Si noti che (
1 se t dispari
( 1)t 1
=
1 se t pari
Prendendo il valore assoluto si ha quindi
t 1
b
jpt p j= jp1 pj 8t 2 (10.14)

Il valore di lim pt dipende dal rapporto b= , cio dal rapporto tra le pendenze delle
curve di domanda e oerta. Dobbiamo quindi distinguere tre casi a seconda che tale
rapporto sia maggiore, uguale o minore di 1, cio a seconda che

b< ; b= ; b> :
10.6. CONVERGENZA DEI PREZZI 287

Caso 1: b < La curva di oerta meno inclinata della curva di domanda. Si ha


t 1
b
lim jpt p j = jp1 p j lim =0

e quindi
lim pt = p ; (10.15)
nonch
lim Et 1 (pt ) = p : (10.16)
Quando b < , i prezzi di equilibrio del mercato con ritardi di produzione e le aspetta-
tive classiche tendono al prezzo p di equilibrio del mercato con produzione istantanea.
Ci vale per qualsiasi valore iniziale p1 , e quindi per ogni valore dellaspettativa iniziale
E0 (p1 ).
I limiti (10.15) e (10.16) mostrano che, per ogni possibile aspettativa iniziale, in
modo asintotico si ha ci che la Proposizione 132 aveva mostrato valere in ogni t
quando laspettativa iniziale corretta, ossia quando E0 (p1 ) = p1 . In particolare,
lerrore di previsione asintoticamente nullo:

et = pt Et 1 (pt ) ! 0

Le aspettative classiche, pur pigre, grazie alla condizione b < sono asintoticamente
razionali, lerrore di previsione via via meno rilevante.

Caso 2: b = Le curve di domanda e di oerta hanno la stessa pendenza. Liter-


azione vista sopra implica

pt p = ( 1)t 1
(p1 p) 8t 2:

Daltra parte, nella (10.12) si era visto che

E0 (p1 ) = p1 () p1 = p :

Quindi, se p1 = p , ossia se laspettativa iniziale corretta, si ottiene pt = p per


ogni t, secondo quanto gi visto nella Proposizione 132. Invece, un errore iniziale
nelle aspettative, cio E0 (p1 ) 6= p1 , determina una successione oscillante di prezzi di
equilibrio:
2p p1 se t pari
pt = p + ( 1)t 1 (p1 p ) =
p1 se t dispari
per ogni t 2. Lerrore di aspettativa

et = pt Et 1 (pt ) = pt pt 1 = ( 1)t 1
( 1)t 2
(p1 p ) = 2 ( 1)t 1
(p1 p)

anchesso oscillante tra i due valori p1 e 2p p1 .


288 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

Caso 3: b > La curva di domanda meno ripida della curva di oerta. Da b >
segue che
t 1
b
lim = +1:

Quando p1 6= p , le oscillazioni

t 1
t 1 b
pt p = ( 1) (p1 p)

sono dunque di ampiezza via via pi grande. Infatti

t 1
b
lim jpt p j = jp1 p j lim = +1:

In questo caso lerrore nellaspettativa iniziale si propaga in modo sempre pi grave, de-
terminando una spirale esplosiva di prezzi. Quando b > , la pigrizia delle aspettative
classiche porta molto lontano dalle aspettative razionali.

10.7 Aspettative adattive


Il pi importante tra i meccanismi di formazione delle aspettative ladattivo. La
successione di aspettative fEt 1 (pt )g si dice adattiva se esiste un coe ciente 2 (0; 1]
tale che

Et 1 (pt ) Et 2 (pt 1 ) = [pt 1 Et 2 (pt 1 )] 8t 2; (10.17)

con aspettativa iniziale E0 (p1 ) arbitraria. In altre parole, laggiustamento

Et 1 (pt ) Et 2 (pt 1 )

nelle aspettative una proporzione dellultimo errore di previsione

pt 1 Et 2 (pt 1 ) :

Periodo dopo periodo, le aspettative sono aggiornate in base agli errori di previsione
commessi. Se = 1 si torna al caso classico Et 1 (pt ) = pt 1 . In generale, per
10.7. ASPETTATIVE ADATTIVE 289

2 (0; 1), iterando si ottiene:

E1 (p2 ) = E0 (p1 ) + (p1 E0 (p1 )) = (1 ) p1 + E0 (p1 )


E2 (p3 ) = E1 (p2 ) + (p2 E1 (p2 ))
= (1 ) p1 + p2 + (1 )2 E0 (p1 )
E3 (p4 ) = E2 (p3 ) + (p3 E2 (p3 ))
= p3 + (1 ) p2 + (1 )2 p1 + (1 )3 E0 (p1 )

Et 1 (pt ) = Et 2 (pt 1 ) + (pt 1 Et 2 (pt 1 ))


Xt 1
= (1 )i 1 pt i + (1 )t 1
E0 (p1 )
i=1

Si ha dunque
X
t 1
Et 1 (pt ) = (1 )i 1
pt i + (1 )t 1
E0 (p1 ) : (10.18)
i=1

Le aspettative adattive dipendono sia dallaspettativa iniziale E0 (p1 ) sia dalla media
pesata
X
t 1
(1 )i 1 pt i
i=1

dei prezzi passati, nella quale i prezzi pi recenti ricevono un peso maggiore rispetto
ai pi remoti.
Poich 2 (0; 1), si ha limt!1 (1 )t 1 = 0 e, al crescere di t, il termine (1 )t 1
diventa via via pi piccolo. Ne segue che laspettativa iniziale E0 (p1 ) diventa, al
crescere di t, sempre meno rilevante per la formazione dellaspettativa Et 1 (pt ), mentre
diventano prevalenti i prezzi passati.

Si noti che nella (10.18) intervengono tutti i prezzi passati, pur se maggiore il
peso dei pi recenti. Ci implica che le aspettative estrapolative del tipo (10.8) non
siano adattive perch esse considerano solo gli ultimi prezzi (per esempio, in (10.8)
solo quelli degli ultimi due periodi).

Dalla (10.17) segue che le aspettative adattive sono razionali, cio

Et 1 (pt ) = pt 8t 1

se e solo se
pt+1 pt = [pt pt ] = 0 8t 1
ossia, se e solo se
pt+1 = pt 8t 1:
290 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

Si ritrova quindi la condizione (10.10) vista nella Sezione 10.4 per il caso speciale
delle aspettative classiche. Come il lettore pu agevolmente vericare, si pu quindi
ripetere verbatim lanalisi allora svolta e mostrare che la Proposizione 132 vale, molto
pi in generale, per le aspettative adattive. Esse sono quindi razionali se e solo se
laspettativa iniziale corretta, cio E0 (p1 ) = p1 . La correttezza dellaspettativa
iniziale caratterizza la razionalit delle aspettative adattive, delle quali le aspettative
classiche sono un caso speciale.

Da quanto appena visto segue che le aspettative adattive sono razionali se e solo
se
pt = p 8t 1;
dove, al solito, p = ( a) = ( + b) il prezzo stazionario. Nella Sezione 10.6 si era
visto in quali condizioni il prezzo di equilibrio con aspettative classiche convergesse al
prezzo stazionario. Generalizziamo lanalisi al caso di aspettative adattive: al tal ne,
si noti che la relazione di equilibrio (10.4) si pu riscrivere come

a
Et 1 (pt ) = pt :
b b
Sostituendo questultima relazione nella (10.17) si ottiene

a
pt 1 pt = pt 1 + pt 1 ;
b b b b

ossia
b a
pt 1 pt = pt 1 1+
b b
il che implica
+b a
pt = 1 pt 1 + :

Con semplici manipolazione algebriche si ottiene

+b a a
pt p = 1 pt 1 + =
+b
+b 1
= 1 pt 1 +( a) =
+b
(1 ) b a
= pt 1 + (b (1 )) =
( + b)
(1 ) b a
= pt 1 =
+b
(1 ) b
= (pt 1 p ):
10.7. ASPETTATIVE ADATTIVE 291

Si ha quindi la notevole relazione


(1 ) b
pt p = (pt 1 p) 8t 2

e la (10.13) ne il caso speciale con = 1. Iterando si ha


t 1
t 1 b (1 )
pt p = ( 1) (p1 p) 8t 2;

dalla quale, prendendo il valore assoluto, si ottiene


t 1
b (1 )
jpt p j= jp1 pj 8t 2

che si riduce alla (10.14) nel caso classico = 1.


Il valore del limite lim pt dipende dal rapporto
b (1 )

e si devono quindi distinguere tre casi a seconda che esso sia maggiore, uguale o minore
di 1, cio a seconda che

j b (1 ) j< ; j b (1 ) j= ; j b (1 ) j>

Ricordando quanto visto nella Sezione 10.6, facile vedere che nel primo caso si ha

lim pt = p ;

cio i prezzi convergono al prezzo stazionario, che il prezzo di equilibrio con aspet-
tative razionali. Nel secondo caso i prezzi sono oscillanti, mentre nel terzo caso essi
divergono (in valor assoluto).
Consideriamo pi da vicino il caso di convergenza, il pi interessante dal punto di
vista teorico perch in esso le aspettative sono asintoticamente razionali, indipenden-
temente dal valore dellaspettativa iniziale. Si ha
b 2
j b (1 ) j< () < b (1 ) < () 1< < :

Poich b; > 0, risulta


b 2
j b (1 ) j< () < :

Nel caso classico = 1 ritroviamo la condizione


b
<1 (10.19)
292 CAPITOLO 10. APPLICAZIONE: PREZZI E ASPETTATIVE

considerata nel primo caso studiato nella Sezione 10.6. Per aspettative adattive non
classiche, cio con 2 (0; 1), vale la disuguaglianza

2
> 1:

Quindi, per tali aspettative, la condizione


b 2
<

meno stringente della (10.19) del caso classico, sicch la convergenza

lim pt = p

pi facile da ottenere. In altre parole, tra le aspettative adattive, le classiche sono


le meno stabili rispetto alla convergenza al prezzo stazionario p . Con aspettative
adattive non classiche si ha la convergenza ad aspettative razionali per un pi ampio
insieme di valori dei parametri e b che per le aspettative classiche.
Capitolo 11

Serie numeriche

11.1 Il concetto
Lidea che qui vogliamo sviluppare riguarda, grossolanamente, la possibilit di som-
mare inniti addendi. Per fare un esempio rudimentale, immaginiamo un bastone
lungo 1 metro e di tagliarlo a met, ottenendo cos due pezzi lunghi 1=2; di tagliare
poi il secondo pezzo a met, ottenendo due pezzi lunghi 1=4; di tagliare ancora il secon-
do pezzo, ottenendone due lunghi 1=8, e di proseguire idealmente, senza fermarsi mai.
Prescindendo da volgari contingenze concrete (la segatura che si forma, dopo un po
diventa quasi impossibile continuare a tagliare un moncherino lungo pochi millimetri,
ecc.), avremmo inniti pezzi di lunghezze 1=2, 1=4, 1=8, ... nei quali stato suddiviso
loriginario bastone di 1 metro. piuttosto naturale immaginare che
1 1 1 1
+ + + + + = 1; (11.1)
2 4 8 2n
cio che, ricomponendo i singoli pezzi, si ritrovi il metro di partenza.
Ci apprestiamo a dare un contenuto preciso a uguaglianze come la (11.1). Immag-
iniamo dunque una successione fxn g e di volerne sommare tutti i termini, cio di
voler eettuare loperazione

X
1
x1 + x2 + + xn + = xn :
n=1

Talvolta opportuno far iniziare la sommatoria dallindice n = 0 piuttosto che dal


termine n = 1. Quando la scelta possibile (si vedr che questo non il caso per
alcuni tipi di serie, come la serie armonica, che non pu essere denita per n = 0), la
scelta di far partire una serie da n = 0 oppure da n = 1 di pura comodit. In generale,
si capir dal contesto quale sar la scelta pi opportuna. Sottolineiamo comunque che
tale scelta non cambia il carattere della serie (che deniremo rigorosamente pi avanti),
e quindi non cambia la sostanza del problema di determinare se la somma innita dia
un valore reale, o un valore innito o nessun valore. Per dare un signicato preciso alla

293
294 CAPITOLO 11. SERIE NUMERICHE

nuova operazione di somma di inniti addendi, che diversa dalla somma ordinaria1
(e ce ne accorgeremo), sommeremo un numero nito di addendi, diciamo n, faremo
tendere n allinnito e assumeremo il limite, se esiste, come valore da assegnare alla
serie. Stiamo dunque pensando di costruire una nuova successione fsn g cos denita:

s1 = x 1 (11.2)
s2 = x 1 + x 2
s3 = x 1 + x 2 + x 3

sn = x 1 + + xn

e di assumere il suo eventuale limite come somma della serie.


P
1
Denizione 79 La serie di una successione fxn g di scalari, in simboli xn , la
n=1
successione fsn g denita in (11.2). I termini sn della successione sono detti somme
parziali della serie.
P
1
La serie xn quindi denita come la successione fsn g delle somme parziali, il
n=1
P
1
cui comportamento limite ne determina il valore. In particolare, la serie xn :
n=1

(i) convergente e ha somma S, in simboli


X
1
xn = S;
n=1

se lim sn = S 2 R,
P
1
(ii) positivamente divergente, in simboli xn = +1, se lim sn = +1,
n=1

P
1
(iii) negativamente divergente, in simboli xn = 1, se lim sn = 1,
n=1

(iv) irregolare (o oscillante) se la successione fsn g irregolare.

In breve, si attribuisce alla serie lo stesso carattere (convergenza, divergenza o


irregolarit) della sua successione delle somme parziali2 .
1
Non possiamo certo metterci a sommare per davvero inniti addendi: non basterebbe tutta la
carta del mondo, non ci sarebbe su ciente la vita intera, non sapremmo dove mettere la riga che
tradizionalmente si scrive sotto gli addendi prima di sommarli, ecc..
2
Usando la terminologia gi usata per le successioni, la serie talvolta detta regolare quando non
irregolare, ossia quando vale uno dei casi (i)-(iii).
11.1. IL CONCETTO 295

11.1.1 Tre classiche serie


Illustriamo le precedenti nozioni con tre importanti serie.
Esempio 163 (Serie di Mengoli) La seguente detta serie di Mengoli:
1 1 1 X
1
1
+ + + + =
1 2 2 3 n (n + 1) n=1
n (n + 1)
Poich
1 1 1
=
n (n + 1) n n+1
risulta
1 1 1
sn = + + +
1 2 2 3 n (n + 1)
1 1 1 1 1 1 1 1
= 1 + + + + =1 !1
2 2 3 3 4 n n+1 n+1
Dunque
X
1
1
=1
n=1
n (n + 1)
e quindi la serie di Mengoli converge e ha somma 1. N
Esempio 164 (Serie armonica) La serie armonica :
1 1 1 X1
1
1+ + + + + =
2 3 n n=1
n
Consideriamone le somme parziali interrotte in un indice n che sia una potenza di 2
(n = 2k ):
1
s1 = 1 ; s2 = 1 +
2
1 1 1 1 1 1 1 1
s4 = 1 + + + > 1 + + + = s2 + = 1 + 2
2 3 4 2 4 4 2 2
1 1 1 1 1 1 1 1 1 1
s8 = s4 + + + + > s 4 + + + + = s4 + > 1 + 3
5 6 7 8 8 8 8 8 2 2
Cos continuando si vede che
1
s2k > 1 + k (11.3)
2
La successione delle somme parziali strettamente crescente (dato che gli adden-
di sono tutti positivi) e quindi ammette limite; la (11.3) garantisce che essa non
superiormente limitata e perci lim sn = +1. Dunque
X1
1
= +1
n=1
n
e la serie armonica diverge positivamente. N
296 CAPITOLO 11. SERIE NUMERICHE

Esempio 165 (Serie geometrica) La serie geometrica di ragione q denita come


segue:
X1
1 + q + q2 + q3 + + qn + = qn
n=0

Il suo carattere dipende dal valore di q. In particolare,


8
>
> +1 se q 1
X1 >
< 1
qn = se jqj < 1
>
> 1 q
n=0 >
:
irregolare se q 1

Per vederlo, si cominci con losservare che quando q = 1 si ha

sn = 1| + 1 +{z + 1} = n + 1 ! +1
n+1 volte

Sia ora q 6= 1. Poich

sn qsn = 1 + q + q 2 + q 3 + + qn q 1 + q + q2 + q3 + + qn
= 1 + q + q2 + q3 + + qn q + q2 + q3 + + q n+1 = 1 q n+1

si ha
(1 q) sn = 1 q n+1
e quindi, essendo q 6= 1,
1 q n+1
sn =
1 q
Ne segue che
X
1
1 q n+1
q n = lim
n=0
n!+1 1 q
Lo studio di tale limite devessere separato in vari casi:

(i) se 1 < q < 1, si ha q n+1 ! 0 e perci


1
sn !
1 q

(ii) se q > 1, si ha q n+1 ! +1 e perci sn ! +1;

(iii) se q = 1 le somme parziali di ordine pari sono nulle mentre quelle di ordine
dispari sono uguali a 1. La successione da esse formate quindi irregolare.

(iv) se q < 1, la successione fq n+1 g irregolare e quindi lo anche fsn g. N


11.2. PROPRIET ELEMENTARI 297

11.1.2 Utilit intertemporale con orizzonte innito


Le serie si applicano fruttuosamente in Economia. Per esempio, torniamo alle scelte
intertemporali con orizzonte nito introdotte nella Sezione 9.3.
Avevamo visto come un prolo intertemporale di consumo sia rappresentabile con
una successione del tipo
x = fx1 ; x2 ; : : : ; xt ; : : :g
e possa essere quanticato da una funzione intertemporale U : A R1 ! R di utilit.
In particolare, avevamo menzionato la possibile forma di U data da
t 1
U (x) = u1 (x1 ) + u2 (x2 ) + + ut (xt ) + (11.4)

dove 2 (0; 1) il fattore soggettivo di sconto. Alla luce di quanto appena visto, la
(11.4) la serie
X1
t 1
ut (xt ) (11.5)
t=1

Le serie permettono quindi di dare un senso corretto alla fondamentale speci-


cazione (11.4) della funzione intertemporale di utilit. Naturalmente, siamo interessati
al caso in cui la serie (11.5) sia convergente perch vogliamo che lutilit complessiva
che il consumatore trae dal consumo intertemporale fx1 ; x2 ; : : : ; xt ; : : :g sia nita. Al-
trimenti, come potremmo confrontare, e quindi scegliere, tra tali proli se se ne trae
utilit innita3 ?
Come vedremo tra breve nellEsempio 171, grazie alle propriet della serie geomet-
rica, si ha che la serie (11.5) converge, supponendo che le funzioni ut di utilit siano
positive e limitate da una stessa costante, se e solo se < 1. In tal caso, avendo
assunto 2 (0; 1), la funzione di utilit intertemporale

X
1
t 1
U (x) = ut (xt ) (11.6)
t=1

ha come dominio tutto R1 , ossia U (x) 2 R per ogni x 2 R1 . Essa permette di


confrontare tutti i possibili proli di consumo intertemporale.

11.2 Propriet elementari


Visto che il carattere di una serie stato ricondotto al carattere di una successione,
evidente che togliendo, aggiungendo, o modicando un numero nito di termini
di una serie, essa
P non cambia carattere. Cambia invece, in generale, la suaP somma.
In particolare 1 x
n=1 n ha lo stesso carattere (ma non la stessa somma) di 1
n=k xn
3
La mente corre alla celebre scommessa di Blaise Pascal. Se Dio non esistesse, crederci o no
procurebbe utilit nita; ma se Dio esiste, crederci d utilit innita (leterna beatitudine) e non
crederci utilit pari a meno innito (leterna dannazione): dunque ragionevole credere in Dio.
298 CAPITOLO 11. SERIE NUMERICHE

per ogni intero k > 1: la dierenza tra le due somme non altro che il totale delle
modicazioni che si sono apportate.
Rispetto alle operazioni fondamentali si ha:
X
1 X
1
cxn = c xn 8c 2 R
n=1 n=1

e, quando non si cada in una forma di indeterminazione del tipo 1 1,


X
1 X
1 X
1
(xn + yn ) = xn + yn :
n=1 n=1 n=1
P1
Il prossimo risultato piuttosto ovvio, ma importante. Se n=1 xn converge,
allora xn tende necessariamente a 0: i singoli addendi devono denitivamente diventare
irrilevanti per consentire che la somma non esploda.
P
Teorema 134 Se la serie 1 n=1 xn converge, allora xn ! 0.

Dim. Risulta banalmente xn = sn sn 1 e, visto che la serie converge, sn ! S e


sn 1 ! S; perci
x n = sn sn 1 !S S = 0:

La nullit della successione fxn g quindi condizione necessaria per la convergenza


della sua serie. Che la condizionePsia solo necessaria mostrato dalla serie armonica:
pur risultando 1=n ! 0, la serie 1 n=1 1=n diverge.

Esempio 166 La serie di termine generale


2n2 3n + 4
xn =
17n2 + 4n + 5
non convergente perch il generico termine asintotico a 2n2 =17n2 = 2=17 e quindi
non tende a 0. N

11.3 Serie con termini positivi


11.3.1 Criterio di convergenza del confronto
P
Esaminiamo ora il caso speciale di serie 1 n=1 xn con tutti i termini xn 0.4
Essendo tutti i termini xn 0, la successione fsn g delle somme parziali crescente
e vale perci banalmente la seguente
4
Se i termini fossero positivi soltanto denitivamente, non cambierebbe nulla visto che si pu sop-
primere un numero nito di addendi senza alterare il carattere della serie. Tutti i risultati sul carat-
tere di serie a termini positivi valgono quindi pi generalmente per serie con termini denitivamente
positivi.
11.3. SERIE CON TERMINI POSITIVI 299

Proposizione 135 Ogni serie con termini positivi convergente o divergente positi-
vamente. In particolare, essa convergente se e solo se superiormente limitata5 .

Le serie con termini positivi ereditano quindi le notevoli propriet di regolarit


delle successioni monotone. Ci conferisce loro uno status particolarmente importante
tra le serie. Per esse, vediamo ora quale forma assumono in criteri di convergenza visti
nella Sezione 9.9 per le successioni.
P1 P1
Proposizione 136 (Criterio del confronto) Siano n=1 xn e n=1 yn due serie
con i termini positivi e sia denitivamente xn yn .
P1 P1
(i) Se xn diverge positivamente, allora diverge positivamente anche
n=1 n=1 yn .
P P1
(ii) Se 1
n=1 yn converge, allora converge anche n=1 xn .

Dim. Dette sn e n le somme parziali delle due successioni, risulta denitivamente


0 sn n e lasserto segue dalla Proposizione 102 per le successioni.

Si noti che la (i) la contronominale della (ii), e viceversa: infatti, grazie alla
Proposizione 135, per una serie a termini positivi la negazione della convergenza la
divergenza positiva6 . Per la loro utilit le abbiamo enunciate entrambe, ma si tratta
della stessa propriet vista in modi equivalenti.

Esempio 167 La serie dei reciproci dei fattoriali7

X1
1
n=0
n!

converge perch, per ogni n 1,

1 1
< :
n! (n 1) n

che il generico termine della serie di Mengoli che sappiamo convergere. Vedremo
successivamente che la sua somma il numero e di Nepero. N
5
Per denizione, la serie superiormente limitata quando lo la successione delle somme parziali,
esiste cio k > 0 tale che jsn j k per ogni n 1.
6
Si ricordi che, date due propriet p e q, limplicazione :q =) :p la contronominale
dellimplicazione originaria p =) q.
7
Si ricordi che 0! = 1. Per questa ragione facciamo partire la serie da n = 0. Quando la scelta
possibile (per esempio, non questo il caso per la serie armonica, che non denita per n = 0),
la scelta di far partire una serie da n = 0 oppure P da n = 1 di pura comodit. In questo caso
1
partiamo
P1 da n = 0 perch, come vederemo, si ha n=0 1=n! = e, unespressione pi elegante di
n=1 1=n! = e 1.
300 CAPITOLO 11. SERIE NUMERICHE

Esempio 168 Si chiama serie armonica generalizzata la serie


X1 1
n=1 n
con 2 R. Se = 1 essa si riduce alla serie armonica che sappiamo divergente a
+1. Se < 1, facile vedere che, per ogni n > 1,
1 1
> (ovvero che n < n)
n n
e perci
X1 1
= +1:
n=1 n

Se = 2, la serie armonica generalizzata converge: infatti


1 1
2
<
n (n 1) n

che il generico termine della serie di Mengoli che sappiamo convergere8 . Se > 2,
1 1
< 2
n n
e perci si ha ancora convergenza. Inne, si pu vedere, ma la cosa pi delicata,
che la serie armonica generalizzata converge anche per tutti i valori di 2 (1; 2). N

Esempio 169 La serie


X1 10n
n=1 n52n+3
converge. Infatti, poich
n
10n 10n 10n 1 2
= n 2 =
n52n+3 52n+2 25 5 25 5

la convergenza della serie geometrica di ragione 2=5 garantisce, per il Criterio del
confronto, la convergenza della serie. N
P
Dunque la serie 1 n=1 n diverge per ogni 1 e converge per ogni > 1.
Il caso = 1 cos lultimo caso di divergenza: basta aumentare di un nonnulla
lesponente, da 1 a 1 + " con " > 0, e la serie converge. Ci lascia intuire come la
divergenza sia estremamente lenta, come il lettore pu controllare calcolando alcune
delle somme parziali9 . Questa intuizione resa precisa dal prossimo bel risultato.
8
P1 2 2
Risulta precisamente n=1 1=n = =6, ma non abbiamo qui gli strumenti per dimostrare
questo notevole risultato.
9
Un illustre professore parlava di innito cadaverico.
11.3. SERIE CON TERMINI POSITIVI 301

Proposizione 137 Si ha
1 1 1
1+ + + + log n: (11.7)
2 3 n

In altre parole la successione delle somme parziali della serie armonica asintotica
con il logaritmo.
Dim. La dimostrazione del risultato usa nozioni di integrazione che saranno esposte
nel Capitolo 24. Sia : [0; +1) ! R la funzione denita come
1
(x) = 8x 2 [i 1; i)
i
per i 1. Quindi (x) = 1 se x 2 [0; 1), (x) = 1=2 se x 2 [1; 2), e cos via. Inoltre,
facile vedere che
1 1
(x) 8x > 0. (11.8)
x+1 x
La funzione a scala e quindi, grazie alla Proposizione 377, si ha
X
n Z n
1
= (x) dx 8k = 1; :::; n
i=k
i k 1

per ogni n 1. Dalla (11.8) segue che


Z n X
n X
n Z n
1 1 1 1
log (1 + n) = dx =1+ 1+ dx = 1 + log n;
0 x+1 i=1
i i=2
i 1 x

per ogni n 1. Quindi,


Pn 1
log (1 + n) i=1 i 1 + log n
8n 1
log n log n log n
e per il Criterio del confronto per successioni concludiamo che
Pn 1
i=1 i
! 1;
log n
il che completa la dimostrazione.

Il Criterio del confronto ha una bella e utile versione asintotica, basata sul confronto
asintotico dei termini delle successioni.
P1 P1
Proposizione 138 (Criterio del confronto asintotico) Siano n=1 xn e n=1 yn
due serie con i termini positivi.
302 CAPITOLO 11. SERIE NUMERICHE
P1 P
(i) Se xn yn , le serie xn e 1n=1 yn hanno lo stesso carattere.
n=1
P P1
(ii) Qualora yn = o (xn ), la serie 1n=1 yn converge se n=1 xn converge.

La (i) la propriet decisamente pi interessante e mostra che il carattere di una


serie sia invariante per equivalenza asintotica. La (ii) un caso particolare del Criterio
del confronto (come risulter chiaro dalla dimostrazione) e non aggiunge quindi molto
aPci che gi sappiamo. Al riguardo, P1 si noti la contronominale10della (ii): la serie
1
x
n=1 n diverge positivamente se n=1 yn diverge positivamente.

Dim. (i) Poich xn yn , per ogni " > 0 esiste n" 1 tale che11
xn
1 " 1+" 8n n" .
yn
Per ogni n n" si ha quindi

X
n nX
" 1 Xn
xk
nX
" 1 X
n X
n
xk = xk + yk xk + (1 + ") yk c + (1 + ") yk (11.9)
k=1 k=1 k=n
yk k=1 k=n" k=n"
"

e
X
n nX
" 1 Xn
xk X
n
xk = xk + yk c + (1 ") yk (11.10)
k=1 k=1 k=n
yk k=n"
"
Pn" 1 P
dovePsi posto c = xk . Il carattere della serie 1
n=1 n=1 yn lo stesso della se-
1
rie k=n" yPk perch i primi termini di una serie sono irrelevanti
P1 per il suo carattere.
1
Quindi,Pse n=1 yn converge, dalla (11.9) segue che anche n=1 xnP converge, men-
tre se 1 y
n=1 n diverge positivamente, dalla (11.10) segue che anche 1
n=1 xn diverge
positivamente.

(ii) Sia yn = o (xn ). Poich yn = o (xn ), per ogni " > 0 esiste n" 1 tale che

yn "xn 8n n"

Lasserto segue dal Criterio del confronto.

Esempio 170 Sia


2n3 3n + 8
xn = :
5n5 n4 4n3 + 2n2 12
Dato che
2n3 2
xn 5
= 2,
5n 5n
10
Si ricordi che, grazie alla Proposizione 135, per una serie a termini positivi la negazione della
convergenza la divergenza positiva.
11
Si noti che da xn yn segue che i termini xn e yn sono denitivamente diversi da zero. I rapporti
che compaiono nella dimostrazione sono perci ben deniti.
11.3. SERIE CON TERMINI POSITIVI 303
P1
la serie n=1 xn converge. Sia, invece,
n+1
xn = :
n2 3n + 4
P1
Dato che xn 1=n, la serie n=1 xn diverge a +1. N

Il Criterio del confronto asintotico ci permette di dimostrare un celebre risultato


legato alla serie armonica, dimostrato nel 1737 da Eulero, che aerma che la serie dei
reciproci dei numeri primi diverge positivamente.

Teorema 139 (Eulero) Si ha

1 1 1 1 1 X1
1
+ + + + + = = +1
2 3 5 7 11 p
n=1 n

Dim. Grazie al Teorema 126 si ha pn n log n, e quindi


1 1
pn n log n
P
(si ricordi la (9.25)). Grazie al Criterio
P del confronto asintotico, la serie 1
n=1 1=pn
12 1
ha lo stesso carattere della serie n=2 1=n log n. Come vedremo nellEsempio 182
(nonch nellEsempio 481), si ha
X
1
1
= +1
n=2
n log n
P1
Ne segue che n=1 1=pn = +1, come desiderato.

Il Teorema di Eulero implica la divergenza della serie armonica per il Criterio del
confronto poich 1=pn 1=n per ogni n (si ha 1=p1 = 1=2 1, 1=p2 = 1=3 1=2,
1=p3 = 1=5 1=3, 1=p4 = 1=7 1=4, e cos via). Un momento di riessione dovrebbe
essere su ciente per rendersi conto di quanto il Teorema di Eulero sia pi potente: in
esso si sommano solo i reciproci dei numeri primi, rispetto al risultato di divergenza
della serie armonica in cui si sommano i reciproci di tutti i numeri naturali, sia primi
sia composti.
Il Teorema di Eulero conferma linnit dei numeri primi e mostra che sono densi
in N, scappandoa
P1 +1 meno rapidamente delle potenze n , con > 1, per le quali
si ha i=1 1=n < +1. P Si noti che per il Criterio del confronto da questultima
convergenza segue che nn=1 1=pn < +1 per ogni > 1.

Chiudiamo lo studio del Criterio del confronto con un importante esempio eco-
nomico.
12
Si noti che la serie inizia con n = 2 perch per n = 1 il termine non denito. Naturalmente, ci
irrilevante per il carattere della serie.
304 CAPITOLO 11. SERIE NUMERICHE

Esempio 171 Consideriamo la serie (11.5) data da


X
1
t 1
ut (xt )
t=1

e supponiamo che le funzioni ut : R ! R siano positive e limitate da una medesima


costante, ossia esista M > 0 tale che, per ogni t, 0 ut (x) M per ogni x 2 R.
Quindi
X
1 X1
t 1 t 1
0 ut (xt ) M
t=1 t=1
P
e, per il Criterio del confronto, basta vericare quando la serie geometrica 1 t=1
t 1

converge. Tornando a quanto visto nellEsempio 165 possiamo concludere che la serie
(11.5) converge se e solo se < 1. Il lettore curioso di sapere che cosa accade quando
! 1, cio quando la pazienza diventa innita, trova risposta nel profondo Teorema
di Frobenius-Littlewood della Sezione 23.2.4. N

11.3.2 Criteri di convergenza del rapporto: preludio


Nella prossima sottosezione studieremo in profondit limportante criterio di conver-
genza del rapporto. Per il lettore impaziente, prima di far ci vediamone la versione
pi elementare.

Proposizione
P1 140 (Criterio del rapporto nella forma limite elementare) Sia
n=1 xn una serie con i termini positivi e non nulli, e supponiamo che il limite
lim xn+1 =xn esista.

(i) Se
xn+1
lim <1
xn
la serie converge.

(ii) Se
xn+1
lim >1
xn
la serie diverge positivamente.

Il criterio si basa sullo studio del limite del rapporto


xn+1
xn
dei termini della successione. Dal punto di vista teorico lipotesi di esistenza del
limite lim xn+1 =xn troppo stringente, come vedremo nella prossima sottosezione.
Ma, quando sodisfatta, la forma limite elementare del Criterio del rapporto di facile
applicazione e si rivela piuttosto utile in parecchie circostanze.
11.3. SERIE CON TERMINI POSITIVI 305

Esempio 172 (i) La serie


X
1
n2 + 5n + 1
n=1
n2n + 1
converge. Infatti,
(n+1)2 +5(n+1)+1
xn+1 (n+1)2n+1 +1 (n + 1)2 + 5 (n + 1) + 1 n2n + 1
= n2 +5n+1
=
xn n2n +1
n2 + 5n + 1 (n + 1) 2n+1 + 1
2
n + 7n + 7 n2n + 1 n2 n2n n2n 1 n 1
= = = !
n2 + 5n + 1 (n + 1) 2n+1 + 1 2
n (n + 1) 2n+1 (n + 1) 2n+1 2n+1 2
il che implica la convergenza della serie.

(ii) La serie
X
1
2n!
n=1
3n
diverge positivamente. Infatti,
2(n+1)!
xn+1 3n+1 2 (n + 1)! 3n 1 (n + 1)! 1
= 2n!
= n+1
= = (n + 1) ! +1
xn 3n
3 2n! 3 n! 3

il che implica la divergenza della serie. N

Nel caso di limite unitario


xn+1
lim=1
xn
nulla si pu dire: il carattere della serie indeterminato,
P1essa puP
convergere oppure
divergere positivamente. Ci ben illustrato dalle serie n=1 1=n e 1 2
n=1 1=n : bench
per entrambe si abbia lim xn+1 =xn = 1, la prima diverge e la seconda converge.

11.3.3 Criteri di convergenza del rapporto


Studiamo ora pi in profondit il Criterio del rapporto, del quale diamo subito la
versione pi generale.
P
Proposizione 141 (Criterio del rapporto) Sia 1 n=1 xn una serie con i termini,
13
denitivamente, positivi e non nulli .

(i) Se esiste un numero q < 1 tale che denitivamente


xn+1
q (11.11)
xn
allora la serie converge.
13
Lipotesi che i termini xn siano non nulli serve a rendere ben denito il rapporto xn+1 =xn .
306 CAPITOLO 11. SERIE NUMERICHE

(ii) Se invece il rapporto denitivamente 1, la serie diverge positivamente.

Si badi che il teorema richiede che i rapporti siano minori di un numero a sua volta
minore di 1 e non semplicemente che siano minori di 1. Al riguardo si osservi che per
la serie armonica i rapporti sono
1
n+1 n
1 = ;
n
n+1

tutti minori di 1, ma essa diverge14 . P


Poich, per il Teorema 134, la convergenza di 1 n=1 xn implica xn ! 0, il Cri-
terio del rapporto per serie pu vedersi come estensione dellomonimo criterio per
successioni. Analoga osservazione vale per il Criterio della radice che vedremo tra
breve.

Dim. Da xn+1 qxn si deduce, come nellanalogo criterio per le successioni che 0 <
xn q n 1 x1 e il primo asserto segue dalla Proposizione 102. Se invece xn+1 =xn 1,
cio se xn+1 xn > 0, fxn g crescente e perci non pu tendere a 0.

molto utile riscrivere il Criterio del rapporto usando i limiti superiori e inferiori
introdotti nella Sezione 9.14.

Lemma 142 Esiste q < 1 tale che denitivamente valga la (11.11) se e solo se
xn+1
lim sup <1 (11.12)
xn
Dim. Solo se. Supponiamo che esista q < 1 tale che denitivamente valga la (11.11).
Esiste n tale che xn+1 =xn q per ogni n n. Quindi, per ogni tale n si ha
xk+1
sup q
k n xk

il che implica
xn+1 xk+1
lim sup = lim sup q<1
xn n!1 k n xk

Se. Supponiamo valga la (11.12). Poich


xk+1
lim sup =L<1
n!1 k n xk

per ogni " > 0 esiste n tale che


xn+1
sup L <" 8n n
k n xn
14
I rapporti tendono a 1 e perci non vi spazio per inlare un numero che sia simultaneamente
maggiore di tutti e minore di 1.
11.3. SERIE CON TERMINI POSITIVI 307

cio
xk+1
L " < sup <L+" 8n n
k n xk
Se prendiamo " su cientemente piccolo di modo che L + " < 1, ponendo q = L + " si
ottiene la condizione cercata.

In modo analogo si dimostra che si ha denitivamente xn+1 =xn 1 se


xn+1
lim inf >1 (11.13)
xn
e solo se
xn+1
lim inf 1 (11.14)
xn
Quindi, la condizione che denitivamente xn+1 =xn 1 implica la (11.14) ed implicata
dalla (11.13). Ma, nulla di pi si pu dire: la successione costante con termine xn = 1
mostra che la suddetta condizione pu valere anche se la (11.13) non vale, mentre
la successione f1=ng mostra che la (11.14) pu valere anche quando la condizione
violata.

Tutto ci porta al seguente corollario, molto comodo nel far di conto, in cui il
Criterio del rapporto espresso in termini di limiti.
P1
Corollario 143 (Criterio del rapporto nella forma limite) Sia n=1 xn una se-
rie con i termini positivi e non nulli.

(i) Se
xn+1
lim sup <1
xn
la serie converge.

(ii) Se
xn+1
lim inf >1
xn
la serie diverge positivamente.

Si noti che, grazie al Lemma 142, il punto (i) equivalente al punto (i) della
Proposizione 141. Invece, per quanto visto appena sopra, il punto (ii) pi debole
del punto (ii) della Proposizione 141 perch la condizione (11.13) solo su ciente, ma
non necessaria, per avere denitivamente xn+1 =xn 1.

Come mostrano i prossimi esempi, questa forma del Criterio del rapporto parti-
colarmente utile quando esiste il limite
xn+1
lim
xn
308 CAPITOLO 11. SERIE NUMERICHE

cio quando
xn+1 xn+1 xn+1
lim = lim sup = lim inf
xn xn xn
In tal caso notevole, il Criterio del rapporto assume lutile forma tripartita della
Proposizione 140:

(i) se
xn+1
lim <1
xn
la serie converge;

(ii) se
xn+1
lim >1
xn
la serie diverge positivamente;

(iii) se
xn+1
lim =1
xn
il criterio fallisce e non d alcuna indicazione circa il carattere della serie.

A livello operativo, la tripartita la forma usuale con la quale si applica il Criterio


del rapporto. A livello meccanico, su ciente ricordare la tripartizione della Propo-
sizione 140 e i relativi esempi illustrativi, ossia quanto si visto nel Preludio. Ma, per
evitare di fare idraulica e non matematica, importante tenerne a mente i fondamenti
teorici dati dalla Proposizione 141 e dal Corollario 143.
LEsempio 172 ha gi illustrato i casi (i) e (ii) della tripartizione,
P1 mentre il caso
P
fallimentare (iii) gi stato ben illustrato dalla serie n=1 1=n e 1 2
n=1 1=n . In
chiusura, vediamo altri esempi per i casi (i) e (ii).
P
Esempio 173 (i) La serie 1 k n
n=1 n q converge per ogni k 2 R e ogni 0 < q < 1.
Infatti
k
(n + 1)k q n+1 n+1
= q ! q < 1:
nk q n n
Ci mostra anche che questa serie diverge positivamente quando q > 1.

(ii) La serie
X
1
xn
n=0
n!
converge per ogni x > 0. Infatti per n 1 si ha
xn+1 n! x
n
= !0 8x > 0:
(n + 1)! x n+1
11.3. SERIE CON TERMINI POSITIVI 309

(iii) La serie
X
1
xn
n=1
n
converge per ogni 0 < x < 1. Infatti
xn+1 n n
n
= x!x
n+1 x n+1
che ovviamente < 1 quando 0 < x < 1. N

11.3.4 Criteri di convergenza della radice


Il prossimo criterio di convergenza , dal punto di vista teorico, il pi potente, come
vedremo nella prossima sezione.
P1
Proposizione 144 (Criterio della radice) Sia n=1 xn una serie con i termini
positivi.
(i) Se esiste un numero q < 1 tale che, denitivamente,
pn
xn q
allora la serie converge.
p
(ii) Se invece n xn 1 per inniti valori di n, allora la serie diverge.
p
Dim. Da n xn q si ha subito che 0 xn q n e, applicando il Criterio del confronto,
p
si ha la tesi. Se invece n xn 1 per inniti valori di n, per essi xn 1 e non pu
tendere a 0.
Vediamone la forma limite. Grazie al Lemma 142, il punto (i) si pu formulare in
p p
modo equivalente come lim sup n xn < 1. Circa il punto (ii), esso richiede che n xn 1
p
per inniti valori di n, ossia che esista un sottosuccessione fnk g tale che nk xnk 1
per ogni k. La condizione vale se
p
lim sup n xn > 1 (11.15)
e solo se
p
lim sup n
xn 1: (11.16)
La successione costante xn = 1 mostra che la condizione (11.16) pu valere anche
se la (11.15) non vale. La successione f(1 1=n)n g mostra invece che (persino) la
condizione (ii) della Proposizione 144 pu non valere bench valga la (11.16). quindi
chiaro che la (11.15) implica la (ii) della Proposizione 144, che a sua volta implica la
(11.16), ma le implicazioni inverse non valgono.
Tutto ci porta alla seguente forma limite, nella quale il punto (i) equivalente a
quello della Proposizione 144, mentre il (ii) pi debole in quanto, come appena visto,
p
la (11.15) solo condizione su ciente a nch si abbia n xn 1 per inniti valori di
n.
310 CAPITOLO 11. SERIE NUMERICHE
P1
Corollario 145 (Criterio della radice nella forma limite) Sia n=1 xn una se-
rie con i termini positivi.
p
(i) Se lim sup n xn < 1, la serie converge.
p
(ii) Se lim sup n xn > 1, la serie diverge positivamente.
p p
Dim. Se lim sup n xn < 1, si ha che n xn q denitivamente per qualche q < 1 La
p p
tesi segue dalla Proposizione 144. Se lim sup n xn > 1, allora n xn 1 per inniti
valori di n, e la tesi segue dalla Proposizione 144.

Come per la forma limite del Criterio del rapporto, anche quella del Criterio della
p
radice particolarmente utile quando esiste lim n xn . Esso assume allora la seguente
forma tripartita:

(i) se
p
lim n
xn < 1
la serie converge;

(ii) se
p
lim n
xn > 1
la serie diverge positivamente;

(iii) se
p
lim n
xn = 1
il criterio fallisce e non d alcuna indicazione circa il carattere della serie.

Al pari dellanaloga forma tripartita del Criterio del rapporto, anche per il Criterio
della radice la versione tripartita ne la forma pi utile a livello operativo. Ma,
ricordando che fatti non foste a viver come bruti ma per seguir virtute e canoscenza,
ci auguriamo che il lettore voglia sempre tenere a mente i fondamenti teorici del criterio.

Esempio 174 (i) Sia q > 0. La serie


X1
qn
n=1
nn

converge perch r
n qn q
n
= ! 0:
n n
P p
(ii) Sia 0 q < 1: La serie 1 k n
n=1 n q converge per ogni k: infatti
n
nk q n = qnk=n !
q visto che nk=n ! 1 (dato che log nk=n = (k=n) log n ! 0). N
11.3. SERIE CON TERMINI POSITIVI 311

11.3.5 Potenza del criterio della radice


I criteri del rapporto e della radice si basano sul comportamento delle successioni
p
fxn+1 =xn g e n xn . Al riguardo il prossimo risultato, la cui dimostrazione sar data
nella Sezione 23.2.2, illuminante.

Proposizione 146 Per ogni successione fxn g con termini positivi, si ha


xn+1 p p xn+1
lim inf lim inf n
xn lim sup n
xn lim sup : (11.17)
xn xn

Se esiste lim xn+1 =xn , si ha


xn+1 p
lim = lim n xn ; (11.18)
xn
e i due criteri sono equivalenti nella loro forma limite. Tuttavia, se lim xn+1 =xn non
esiste, si ha comunque, dalla (11.17),
xn+1 p
lim sup < 1 ) lim sup n xn < 1;
xn
e
xn+1 p
> 1 ) lim sup n xn > 1;
lim inf
xn
il che indica che il Criterio della radice pi potente di quello del rapporto per la
convergenza: ogni volta che il Criterio del rapporto indica convergenza o divergenza, la
stessa conclusione si sarebbe raggiunta applicando il Criterio della radice. Il viceversa
non vale, come mostra il prossimo esempio nel quale il Criterio della radice indica
convergenza mentre quello del rapporto fallisce.

Esempio 175 Consideriamo la serie15


1
2n
se n dispari
xn = 1
2n 2 se n pari

cio:
1 1 1 1 1 1 1
+1+ + + + + + +
2 8 4 32 16 128 64
Si ha 8 1
>
< 2(n+1) 2
xn+1 1 = 2 se n dispari
= 2n
1
xn >
: 2n+1
1 = 18 se n pari
2n 2

e
1
p 2p
se n dispari
n
xn = n
4
2
se n pari
15
Si veda Rudin (1976) p. 67.
312 CAPITOLO 11. SERIE NUMERICHE

sicch
xn+1 xn+1 1
lim sup =2 , lim inf =
xn xn 8
e
p 1
lim sup n
xn =
2
Il Criterio del rapporto fallisce, mentre il Criterio della radice garantisce la convergenza
della serie. N

Nonostante la maggior potenza del Criterio della radice, il Criterio del rapporto
rimane comunque un utile strumento perch in generale molto pi semplice calcolare
il limite di rapporti che di radici. Il Criterio della radice s pi potente dal punto di
vista teorico, ma risulta di pi di cile applicabilit dal punto di vista operativo.

Alla luce di tutto ci, in concreto nellapplicare i criteri la prima cosa da fare
vericare se lim xn+1 =xn esiste e, nel caso, calcolarlo. In tale evenienza, grazie alla
p
(11.18) sappiamo anche il valore di lim n xn e possiamo quindi giovarci della potenza
del Criterio della radice.
Se, purtroppo, lim xn+1 =xn non esiste e siamo al pi in grado di determinare
lim sup xn+1 =xn e lim inf xn+1 =xn , o ci rassegniamo alla minor potenza del Criterio
del rapporto (rischiando il fallimento come nel precedente esempio), oppure cerchiamo
p
di calcolare direttamente lim sup n xn , con la speranza che esso esista (come nel prece-
dente esempio), cos che il Criterio della radice si possa applicare nella pi comoda
forma tripartita.

Da ultimo si osservi che, per quanto potente, il Criterio della radice (e, a fortiori,
il meno potente Criterio del rapporto) fornisce solo una condizione su ciente, ma non
necessaria per la convergenza, come mostra il prossimo esempio.

Esempio 176 La serie


X1
1
n=1
n2
converge. Tuttavia, ricordandosi lEsempio 148, si ha
r r r
n 1 n 1 n 1
lim 2
= lim lim =1
n n n
N

Il Criterio della radice


P1 non2 quindi di alcun aiuto nel determinare la convergenza
della semplice serie n=1 n . La ragione della carenza emerge con chiarezza dal
prossimo semplice risultato, che mostra come questo criterio implichi la convergenza
a zero dei termini della serie con velocit almeno geometrica.
11.3. SERIE CON TERMINI POSITIVI 313
P p
Proposizione 147 Sia 1 n=1 xn una serie con i termini positivi, con lim sup
n x
n <
1. Per ogni q > 0 tale che
p
lim sup n xn q < 1
si ha, denitivamente,
xn qn (11.19)
p
Dim. Sia q > 0 tale che lim sup n xn q < 1. Esiste nq 1 tale che
p
n
xn q

per ogni n nq . Per ogni tale n si ha:


p
n
xn q () xn qn

e quindi vale la (11.19).

Grazie alla (11.19), possiamo concludere che serie convergenti i cui termini conver-
gono a zero con velocit inferiori alla geometrica, cio tali che q n = o (xn ), sono al di
fuori della portata del Criterio della radice. Per esempio, per ogni numero naturale
k 2 si ha
qn
1 ! 0
nk
P1
e quindi q n = o n k . Per determinare la convergenza della serie n=1 n k , il Criterio
della radice quindi inutile. Ci confermato dal fatto che
r
n 1
lim =1
nk
ma grazie alla Proposizione 147 possiamo capire la ragione del fallimento del Criterio
della radice.

11.3.6 Un primo sviluppo in serie


Limportantissimo numero e di Nepero stato introdotto nel capitolo precedente come
limite della successione (1 + 1=n)n . Sorprendentemente esso emerge anche come som-
X1
ma della serie 1=n! dei reciproci dei fattoriali. Si ricordi, per, che un primo
n=0
collegamento tra e e n! si era visto con la formula di De Moivre-Sterling.

Proposizione 148 Si ha
X1
1
=e (11.20)
n=0
n!
314 CAPITOLO 11. SERIE NUMERICHE

Dim. NellEsempio 167 abbiamo mostrato che la serie converge. Calcoliamone la


somma. Grazie alla formula di Newton (6.2) si ha

1
n Xn
n 1 Xn
1 n! 1
1+ = k
=
n k=0
k n k=0
k! (n k)! nk

Daltra parte
n! k
= n (n 1) (n k + 1) n
| {z n} = n
(n k)! | {z }
k volte k volte

Quindi,
n! 1
1
(n k)! nk
il che implica
1
n Xn
1 n! 1 Xn
1
1+ =
n k=0
k! (n k)! nk k=0
k!
Ne segue che
X1
1
e . (11.21)
n=0
n!
Per ogni k 1 si ha
n! 1
lim =1 (11.22)
n!1 (n k)! nk
Infatti
n!1 n (n k) (n k + 1) nk
k
= k
=1
(n k)! n n nk
Fissiamo m 1. Per ogni n > m si ha:

1
n Xn
1 n! 1 Xm
1 n! 1 Xn
1 n! 1
1+ = = +
n k=0
k! (n k)! nk k=0
k! (n k)! nk k=m+1 k! (n k)! nk
Xm
1 n! 1
k=0
k! (n k)! nk

e quindi, grazie alla (11.22),

1
n Xm
1 n! 1 Xm
1 n! 1 Xm
1
e = lim 1+ lim k
= lim =
n!1 n n!1
k=0
k! (n k)! n k=0
k! n!1 (n k)! nk k=0
k!

Poich ci vale per ogni m, si ha


Xm
1 X
1
1
e lim = ,
m!1
k=0
k! n=0 n!
11.4. SERIE CON TERMINI DI SEGNO QUALSIASI 315

che, con la (11.21), implica la (11.20).

La somma (11.20) si pu generalizzare in modo sostanziale (omettiamo la di-


mostrazione).

Teorema 149 Per ogni x 2 R, si ha

x n X
1
xn
x
e = lim 1+ = (11.23)
n!1 n n=0
n!

Luguaglianza (11.23) vale per ogni scalare x e si riduce alla (11.20) nel caso speciale
x = 1. Si noti la notevolissima espressione

X
1
xn x2 x3 xn
x
e = =1+x+ + + + + (11.24)
n=0
n! 2 3! n!

X
1
della funzione esponenziale tramite una serie. Tra breve vedremo che xn =n! una
n=0
serie di potenze. Per questa ragione, luguaglianza (11.24) detta sviluppo in serie di
potenze della funzione esponenziale. un risultato tanto elegante quanto importante,
che permette di scomporrela funzione esponenziale in una somma (seppur innita)
di funzioni elementari quali le potenze xn .
Studieremo con maggiore generalit gli sviluppi in serie con gli strumenti del
Calcolo dierenziale, di cui gli sviluppi in serie sono una delle applicazioni pi notevoli.

11.4 Serie con termini di segno qualsiasi


11.4.1 Convergenza assoluta
P
Consideriamo ora il caso generale di serie 1 n=1 xn con termini xn di segno qualsiasi,
non necessariamente sempre positivi, neanche denitivamente. Per studiarle conside-
riamo una serie ausiliaria a termini positivi, facendo cos rientrare dalla porta ci che
era appena uscito dalla nestra.
P1
Denizione
P1 80 La serie n=1 xn si dice assolutamente convergente se convergente
la serie n=1 jxn j dei suoi valori assoluti.

Il prossimo risultato mostra che la convergenza della serie dei valori assoluti, veri-
cabile con i criteri test visti, garantisce quella della ben pi selvatica serie originale,
con segni qualsiasi.
P1 P1
Teorema 150 Se n=1 xn converge assolutamente, allora n=1 xn converge.
316 CAPITOLO 11. SERIE NUMERICHE

Si noti che la condizione solo su ciente: la serie


X1
( 1)n 1 1 1 1 1
= 1+ + + +
n=1
n 2 3 4 5 6

converge (si veda la Proposizione 155), ma non assolutamente poich


X1
( 1)n X1
1
= = +1
n=1
n n=1
n

La classe delle serie assolutamente convergenti quindi contenuta in quella delle se-
rie convergenti. Come si vedr nella Sezione 11.6, tale sottoclasse ha fondamentali
propriet di regolarit rispetto alle serie convergenti di segno qualsiasi che non sono
assolutamente convergenti. In altre parole, le serie assolutamente convergenti sono, tra
le convergenti, quelle che si comportano decisamente meglio. La convergenza assoluta
unimportante condizione di regolarit.

Per provare il Teorema 150 ci servono un concetto e un piccoloPrisultato prelimi-


nari, nello spirito della condizione (9.21) di Cauchy. Per una serie 1
n=1 xn arbitraria
indichiamo con Cn;k , dove n; k 1, la somma troncata

Cn;k = sn+k sn = xn+1 + xn+2 + + xn+k ;


cio la somma di k addendi a partire dall(n + 1)-esimo.
P
Lemma 151 Condizione necessaria e su ciente a nch una serie 1 n=1 xn converga
che ad ogni " > 0 si possa associare un indice n" tale che jCn;k j < " per ogni n n"
e ogni k 1.

Dim. unapplicazione della condizione di Cauchy. La successione fsn g converge se


e solo se, per ogni " > 0 arbitrario, si ha denitivamente jsm sn j < ". Basta poi
porre m = n + k.

Laermazione del Lemma piuttosto intuitiva: una serie converge se e solo se,
almeno a partire da un certo posto in poi, la somma di un numero arbitrariamente
grande di addendi arbitrariamente piccola, cio, da un certo posto in poi, gli addendi
devono essere irrilevanti.
0
Dim. del Teorema
P1 P1Indicando con Cn;k e con Cn;k rispettivamente le somme
150.
troncate di n=1 xn e di n=1 jxn j, risulta

0
jCn;k j = jxn+1 + xn+2 + + xn+k j jxn+1 j + jxn+2 j + + jxn+k j = Cn;k :
0
Da Cn:k < " segue a fortiori che jCn;k j < " che, per il precedente Lemma, garantisce
lasserto.
11.4. SERIE CON TERMINI DI SEGNO QUALSIASI 317

Esempio 177 Riprendiamo, per completarlo lEsempio 173.


P1
(i) Grazie al Teorema 150, la serie n=1 nk q n converge per ogni k 2 R e ogni
1 < q < 1. Infatti, da
k
(n + 1)k q n+1 n+1
= jqj ! jqj < 1
nk q n n

segue che essa converge assolutamente.


P
(ii) La serie 1 n
n=1 x =n! converge per ogni x 2 R. Infatti, da

xn+1 n! x
n
= !0 8x 2 R;
(n + 1)! x n+1

segue che essa converge assolutamente.


P
(iii) La serie 1 n
n=1 x =n converge per ogni 1 < x < 1. Infatti

xn+1 n n
= jxj ! jxj;
n + 1 xn n+1

che ovviamente < 1 quando 1 < x < 1. Anche questa serie quindi converge
assolutamente.
Aggiungiamo due ulteriori esempi.

(iv) La serie
x3 x5 x7 X
1
x2n+1
n
x + + = ( 1)
3! 5! 7! n=0
(2n + 1)!
converge per ogni x 2 R. Infatti

x2n+3 (2n + 1)! x2


= !0 8x 2 R
(2n + 3)! x2n+1 (2n + 3) (2n + 2)

e quindi essa converge assolutamente.

(v) La serie
x2 x4 x6 X
1
x2n
1 + + = ( 1)n+1
2! 4! 6! n=0
(2n)!
converge per ogni x 2 R. Infatti

x2n+2 (2n)! x2
= !0 8x 2 R
(2n + 2)! x2n (2n + 2) (2n + 1)

e quindi anche questultima serie converge assolutamente. N


318 CAPITOLO 11. SERIE NUMERICHE

11.4.2 Rivisitazione dei criteri di convergenza


Grazie al Teorema 150, possiamo dare versioni dei criteri di convergenze per serie di
segno qualsiasi. Cominciamo col Criterio del confronto visto nella Proposizione 136,
di cui estendiamo il punto (ii).
P1 P1 P1
Proposizione 152 SianoP1 n=1 x n e n=1 yn due serie con jxn j yn . Se n=1 yn
converge, allora anche n=1 xn converge.
P P1
Dim. Se 1 n=1 yn converge, allora
P1 n=1 jxn j converge per il Criterio del confronto.
Grazie al Teorema 150, anche n=1 xn converge.

Esempio 178 Consideriamo la serie

X1
( 1)n
2
.
n=1
n

Si ha j( 1)n =n2 j 2
1=nP , e quindi per il Criterio del confronto la convergenza della
serie segue da quello di 1 2
n=1 1=n . N

Passiamo alla versione per serie di segno qualsiasi del Criterio del rapporto. Per
brevit, consideriamo solo la sua forma limite, vista nel Corollario 143.
P
Corollario 153 Sia 1 n=1 xn una serie con i termini di segno qualsiasi e non (den-
itivamente) nulli, e si ponga

xn+1 xn+1
lim sup = 2 [0; +1] e lim inf = 2 [0; +1]
xn xn

Allora,

(i) se < 1, la serie converge,

(ii) se > 1, la serie non converge.

Dim. Grazie al Teorema 150, il caso < 1 segue dallanalogo caso del Corollario
143. Se > 1, si ha denitivamente jxn+1 =xn j > 1, ossia jxn+1 j jxn j > 0, dove si
ha > 0 perch, per ipotesi, i termini xn non sono nulli. Non vale quindi la condizione
necessaria di convergenza xn = o (1).

Si noti che, mentre per serie con termini positivi la condizione > 1 implica
la divergenza; per serie con termini di segno qualsiasi da > 1 segue solo la non
convergenza. Ci dovuto alle migliori propriet di regolarit delle serie con termini
positive viste nella Proposizione 135 (se non convergono divergono positivamente).
11.4. SERIE CON TERMINI DI SEGNO QUALSIASI 319

Esempio 179 La serie


X
1
xn
( 1)n
n=1
n!
converge per ogni x 6= 0. Infatti

xn+1 n! jxj
n
= !0 8x 6= 0:
(n + 1)! x n+1
N

Chiudiamo con la versione del Criterio della radice, sempre nella forma limite, per
serie di segno qualsiasi: lasciamo al lettore la dimostrazione del risultato.
P1
Corollario 154 Sia n=1 xn una serie con i termini di segno qualsiasi e non nulli,
e si ponga p
n
lim sup jxn j = 2 [0; +1] .
Allora,

(i) se < 1, la serie converge,

(ii) se > 1, la serie non converge,

(iii) se = 1, il criterio fallisce e non autorizza alcuna conclusione.

Esempio 180 Sia q 2 R. La serie


X1
qn
n=1
nn
converge perch s
qn n jqj
= ! 0:
nn n
P
In modo simile si pu vedere che la serie 1 k n
n=1 n q converge per jqj < 1 (si vedano
gli Esempi 174 e 177). N

11.4.3 Serie con i segni alternati


Chiudiamo considerando le serie che hanno i termini di segno alternato:

n+1
X
1
x1 x2 + x3 x4 + + ( 1) xn + = ( 1)n+1 xn ;
n=1

con ogni xn 0. Per esse si pu dire qualcosa dinteressante:


320 CAPITOLO 11. SERIE NUMERICHE

P
1
Proposizione 155 La serie ( 1)n+1 xn con i segni alternati convergente se la
n=1
successione fxn g decrescente e innitesima.
Come ben sappiamo, la condizione di nullit xn ! 0 necessaria, ma non su ciente
per la convergenza di una serie generica; per le serie a segni alternati, con laggiunta
della decrescenza dei valori assoluti16 , diventa anche su ciente.

Dim. Per lalternanza dei segni e per la decrescenza dei valori assoluti, le due
successioni
s1 ; s3 ; s5 ; : : : e s2 ; s4 ; s6 ; : : :
sono rispettivamente decrescente e crescente. Infatti
s3 = x 1 x2 + x3 x1 = s1 perch x2 + x3 0
s5 = s3 x4 + x5 s3 perch x4 + x5 0, ecc.
e
s4 = s2 + x 3 x4 s2 perch x3 x4 0
s6 = s4 + x 5 x6 s4 perch x5 x6 0, ecc..
Le due successioni, essendo monotone, ammettono limite; per di pi, visto che s2n+1
s2n = x2n+1 ! 0, il limite lo stesso per entrambe. Quindi lintiera successione fsn g
delle somme parziali ammette limite e perci la serie converge.

OfB. La successione fsn g oscilla attorno al suo limite S con oscillazioni sempre pi
piccole.

1.5

s(n)

0.5

0
O s s s ... n
1 2 3

-0.5
0 2 4 6 8 10

Esempio di successione oscillante.

16 n+1
Si noti che xn il valore assoluto del termine ( 1) xn della successione.
11.4. SERIE CON TERMINI DI SEGNO QUALSIASI 321

Il primo valore s1 il pi grande di tutti, il secondo valore s2 il pi piccolo di tutti;


gli altri sono maggiori di S quando n dispari e minori di S quando n pari e
progressivamente si avvicinano a S. H
Esempio 181 La serie
X
1
1
( 1)n+1 ;
n=1
n
detta serie armonica con segni alternati, convergente17 . N

11.4.4 Il criterio di condensazione di Cauchy


Tra i moltissimi criteri che sono stati sviluppati nellOttocento per la convergenza di
una serie, ne segnaliamo uno che ci permetter di dimostrare una cosetta lasciata in
sospeso.
Teorema 156 (Criterio di condensazione, Cauchy) Sia fxn g una successione con
i termini positivi e decrescenti (xn xn+1 0) e sia k un arbitrario numero intero
X
1
maggiore di 1. Allora la serie originaria xn ha lo stesso carattere della serie
n=1

X
1
2 m
x1 + kxk + k xk2 + +k x km + = k n 1 xk n 1 :
n=1

In altre parole, le due serie hanno lo stesso carattere: se luna converge (diverge),
anche laltra converge (diverge).

Dim. Indichiamo con sn e con m le somme parziali delle due serie:


sn = x 1 + x 2 + + xn e m = x1 + kxk + k 2 xk2 + + k m xk m :
Risulta
skm+1 skm = xkm +1 + xkm +2 + + xkm+1
e tale somma conta k m+1 k m = k m (k 1) addendi che, per ipotesi, sono decrescenti.
Perci
k m (k 1) xkm+1 skm+1 skm k m (k 1) xkm +1 ;
ovvero
1
1 k m+1 xkm+1 skm+1 sk m k m (k 1) xkm +1 :
k
Prendendo m = 0; 1; 2; ;h 1 e sommando tali disuguaglianze (ovviamente, per
m = 0, k 0 xk0 = x1 ), si ottiene
1
1 ( h x1 ) sk h x1 (k 1) h 1;
k
17
Precisamente la sua somma log 2.
322 CAPITOLO 11. SERIE NUMERICHE

dove la seconda diseguaglianza dovuta al fatto che, poich fxn g decrescente, si ha:

x1 + kxk+1 + k 2 xk2 +1 + :: + k h 1 xkh 1 +1 x1 + kxk + k 2 xk2 + :: + k h 1 xkh 1 = h 1:

Visto che x1 e k 1 non dipendono da h, questultima disuguaglianza mostra che,


se h ! +1, anche skh ! +1 e, per la monotonia di di sn , segue che sn ! +1.
Se invece h ! L, risulta skh x1 (k 1) L cosicch fsn g monotona e
superiormente limitata e quindi converge. Il Teorema cos dimostrato.

Il criterio di condensazione consente di discutere il comportamento della serie


armonica generalizzata. Consideriamo dunque
X1 1
n=1 n
e applichiamole il criterio di condensazione con k = 2: ci conduce a considerare la
serie
1 1 1 1 1 1
1+2 + 22 2 + 23 3 + =1+ 1
+ + +
2 2 2 2 22( 1) 23( 1)

che geometrica di ragione 1=2 1 e quindi converge se e solo se 2 1 > 1, cio se e


solo se > 1. Resta cos provato che la serie armonica generalizzata converge per ogni
> 1 e diverge per ogni 1.

Esempio 182 (i) La serie


X1 1
n log n
n=2

divergente. Infatti, prendendo per comodit un primo addendo nullo e applicando il


Criterio di condensazione con k = 2, si ha
2 22 23 1 1 1
+ 2 + + = + + +
2 log 2 2 log 22 23 log 23 log 2 2 log 2 3 log 2
che diverge trattandosi della serie armonica moltiplicata per 1= log 2.

(ii) La serie
X1 1
n=2 n log1+" n

invece convergente per ogni " > 0. Infatti, preso k = 2, il suo carattere lo
stesso della serie
X
1
2n X 1
1 X 1
1
= =
n=2
2 log (2 ) n=2 log (2 ) n=2 n log1+" 2
n 1+" n 1+" n 1+"

che converge essendo


1 1
1+" < 1+" .
n1+" log 2 n
11.5. SERIE DI POTENZE 323

(iii) Si pu concludere allora che la serie


X
1
1
n=2
n log n

converge per > 1; qualsiasi e per = 1; > 1, mentre diverge per < 1;
qualsiasi e per = 1; 1. Usando lordinamento lessicograco <L 18 si pu
dire che si ha convergenza se e solo se [ ; ] <L [1; 1].
(iv) Simile conclusione vale per
X
1
1
n=2
n log n (log log n)

che converge se e solo se > 1 oppure = 1 e > 1 oppure = = 1 e


> 1. N

11.5 Serie di potenze


Le serie di potenze sono unimportante classe di serie della forma
X
1
an x n (11.25)
n=0

con an 2 R per ogni n 0. Per evitare banalit supporremo sempre che gli scalari an ,
0
detti coe ciente della serie, non siano denitivamente nulli; inoltre,
X1 si pone 0 = 1.
La serie (11.25) converge (diverge od oscilla) in x0 se la serie an xn0 converge
n=0
(diverge od oscilla).

Cominciamo con losservare che ogni serie di potenze converge almeno in 0: infatti
X1
an 0n = a0 .
n=0
X1
Proposizione 157 Se una serie di potenze an xn converge in x0 , allora con-
n=0
verge in ogni x tale che jxj < x0 . Se non converge in un punto x0 , allora non converge
in ogni x tale che jxj > x0 .

Dim. Basta applicare il Criterio del confronto e ricordare lassoluta convergenza.


X1
Ne segue che, per ogni serie di potenze an xn , esiste un numero reale esteso
n=0
r 0, detto raggio di convergenza tale che essa converge in ogni jxj < r e diverge in
18
Il cosiddetto ordine lessicograco <L tra vettori aerma che y <L x se il primo elemento di y
> del primo elemento di x oppure, quando y1 = x1 se y2 > x2 , oppure, quando y1 = x1 e y2 = x2 ; se
y3 > x3 , e cos via. Tale ordine lessicograco perch lo stesso che si usa per mettere le parole in
ordine alfabetico: si tratta di un ordine completo.
324 CAPITOLO 11. SERIE NUMERICHE

ogni jxj > r (quando r = 0 la serie converge solo per x = 0; quando invece r = +1 la
serie converge per ogni x 2 R); in x = r la serie pu essere convergente oppure non
convergente.

I criteri di convergenza per serie di segno qualsiasi danno semplici risultati sul
raggio di convergenza. Il pi potente segue dal Criterio della radice in forma limite.
X1
Teorema 158 (Cauchy-Hadamard) Per la serie di potenze an xn il raggio
n=0
di convergenza r = 1= (ponendo r = +1 se = 0 e r = 0 se = +1) ove
p
= lim sup n jan j 2 [0; +1] :

Dim. Poich la serie ovviamente converge senzaltro per x = 0, supponiamo x 6= 0.


Si ha
p p jxj
lim sup n jan xn j = jxj lim sup n jan j = jxj = :
r
Per il Criterio della radice, si ha convergenza se jxj =r < 1, ossia se jxj < r, e non si
ha convergenza se jxj =r > 1, ossia se jxj > r.

Esempio 183 La serie di potenze


X
1
xn
(11.26)
n=0
n!
ha raggio di convergenza r = +1. Infatti
1
(n+1)! 1
1 = ! 0;
n!
n+1
p
usando la notevole disuguaglianza (11.17), implica = lim sup n 1=n! = 0, ossia
r = +1. Del resto, abbiamo gi incontrato questa serie di potenze nel Teorema 149,
in cui si era visto che essa ha somma ex per ogni x 2 R. N

Esempio 184 La serie di potenze


X
1
xn
(11.27)
n=1
n
ha raggio di convergenza r = 1. Infatti,
1
(n+1) n
1 = ! 1;
n
n+1
p
usando la notevole disuguaglianza (11.17), implica = lim sup n 1=n = 1, ossia r = 1.
Per x = 1, la serie diventa larmonica e quindi diverge, mentre per x = 1 essa diventa
larmonica a segni alternati che converge. Dunque la serie (11.27) converge per ogni
x 2 [ 1; 1). N
11.6. PROPRIET ASSOCIATIVA E COMMUTATIVA 325

Rivisitiamo le nozioni ora presentate da un punto di vista funzionale che torner


utile in seguito. Data una successione fan g di scalari, si denisca la funzione f : A
R ! R come
X1
f (x) = an x n :
n=0
X1
Il suo dominio costituito dai punti ( r; r) nei quali la serie di potenze an x n
n=0
converge. Grazie alla Proposizione 157, esiste un intorno dellorigine ( r; r), dove
r 2 (0; +1]; tale che
( r; r) dom f [ r; r]:
A seconda del carattere della serie in x = r, le inclusioni diventano o meno uguaglianze.
Per esempio, se la serie converge in entrambi i punti r, si ha dom f = [ r; r], mentre
se non converge in alcuno dei due si ha dom f = ( r; r).

Esempio 185 La funzione


X
1
xn
f (x) = ;
n=0
n!

denita tramite la serie di potenze (11.26) ha dominio R. In particolare, grazie al


Teorema 149 sappiamo che f (x) = ex . Invece la funzione

X
1
xn
f (x) = ;
n=1
n

denita tramite la serie di potenze (11.27) ha dominio [ 1; 1). N

11.6 Propriet associativa e commutativa


Ci siamo occupati in questo capitolo di somme di inniti addendie ci che abbiamo
esposto costituisce senza dubbio un buon, ma non perfetto, surrogato della somma
ordinaria.
La somma, come sappiamo, gode, tra le altre, delle propriet associativa (facen-
do somme parziali degli addendi, la somma complessiva non cambia) e commutativa
(cambiando lordine degli addendi la somma non risulta alterata). naturale chiedersi
se tali propriet si conservino anche per le serie. In generale la risposta negativa.
piuttosto ovvio che non valga la propriet associativa: se nella serie irregolare

1 1+1 1+1 1+

associamo gli addendi a due a due, otteniamo

(1 1) + (1 1) + (1 1) + =0+0+0+
326 CAPITOLO 11. SERIE NUMERICHE

che regolarissima e ha somma 0. Se associamo gli addendi a due a due, lasciando


per fuori il primo, otteniamo

1 + ( 1 + 1) + ( 1 + 1) + =1+0+0+

che ancora regolare ma ha la diversa somma 1.


anche semplice vedere che non vale la propriet commutativa. Se nella stessa serie
rimescoliamo gli addendi in modo da averne due positivi e uno negativo, otteniamo

1+1 1+1+1 1+1+1 1+ :

Calcoliamone le somme parziali. Se prendiamo un indice n multiplo di 3, n = 3k,


dobbiamo sommare 2k addendi pari a 1 e k addendi pari a 1: perci s3k = k e quindi
s3k+1 = k + 1 e s3k+2 = k + 2. Dunque, in generale sn n=3 e perci la serie, cos
riscritta, divergente a +1. C anche di pi: poniamo di voler ottenere, utilizzando
le propriet commutativa e associativa, una serie che converga a 5, o a qualsiasi altro
intero. Basterebbe anticipare cinque addendi 1 e poi proseguire alternando i segni

1 + 1 + 1 + 1 + 1 + (1 1) + (1 1) + =5+0+0+ = 5:

Fin troppo facile. Se valessero le propriet associativa e commutativa, potremmo


dunque pasticciare gli addendi della serie, originariamente irregolare, rendendola di-
vergente oppure convergente a qualsiasi intero.

11.6.1 Incidenti storici


Anche se non fu il suo principale contributo scientico, il nome di Luigi Guido Grandi
legato alla serie
X1
1 1+1 1+ = ( 1)n+1
n=1

spesso detta serie di Grandi. curioso che, no alla seconda met dellOttocento,
anche i pi grandi matematici condividessero lopinione che tale serie sommasse 1=2.
La Matematica si sviluppata, sino alla met dellOttocento, in maniera alquanto
disordinata: da un lato erano gi noti teoremi di grande complessit, ma, dallaltro,
mancava lattenzione alle denizioni ben poste e al rigore al quale oggi siamo abituati.
Il monaco Grandi, sbagliando due volte, si disse che 1 1 + 1 1 + 1 1 +
1 1 1
una serie geometrica di ragione q = 1 (giusto) e quindi ha somma 1 q = 1 ( 1) = 2
(sbagliato, perch la serie geometrica converge soltanto per jqj < 1); accorpando poi
gli addendi a due a due (sbagliato perch la propriet associativa in generale non vale
per le serie) prosegu aermando che (1 1)+(1 1)+ = 0+0+ per concludere
che
1
0+0+0+ = ;
2
11.6. PROPRIET ASSOCIATIVA E COMMUTATIVA 327

ovvero che la somma di inniti zeri vale 12 . Ci lo port non a negare lesistenza di
Dio, ma a ritenere irrilevante il suo intervento nella creazione; anche senza interventi
divini, dal nulla si crea qualcosa (basta aspettare un po): creatio ex nihilo.
Altre eleganti dimostrazionisono:

(i) Posto S = 1 1+1 1+ si ha

1 S=1 (1 1+1 1+ )=1 1+1 1+ =S

e quindi, essendo 1 S = S, risulta S = 1=2.

(ii) Da
1 1
=1
1+1 1+1
si deduce che
1 1
=1 1
1+1 1+1
e, cos continuando, che

1
=1 1+1 1+ :
1+1

(iii) Pi in generale, si sostenne che, partendo da x = a x (che implica x = a=2), si


ottiene x = a (a x) e, cos continuando, che x = a a + a a + . Dunque
tale somma innita vale a=2.

(iv) Leibnitz osserv che sommando un numero pari di addendi si ottiene zero e che
sommandone un numero dispari si ottiene 1. La serie di Grandi contiene per
inniti addendi: non essendo innito n pari n dispari, la sua somma devessere
qualcosa tra 0 e 1. Per una legge di giustizia devesserne la media. Lo stesso
Leibnitz argoment anche sul fatto che innito pari con probabilit 1=2 e
dispari con probabilit1=2.

(v) Jacob Bernoulli prov il seguente elegante paradosso. Da

k k kn kn2
= + 3
m+n m m2 m
si deduce in particolare, per m = n, che

k k k k
= + ;
2m m m m
che generalizza la serie di Grandi.
328 CAPITOLO 11. SERIE NUMERICHE

(vi) Callet osserv che 1 1+1 1+ si ottiene anche come caso particolare di
1+x
=1 x2 + x3 x5 + x6 x8 +
1 + x + x2
che per, per x = 1, fornisce 2=3 = 1 1 + 1 1 + . Lagrange puntualizz
per che la serie di Callet si sarebbe dovuta correttamente scrivere

1+0 x2 + x3 + 0 x5 + x6 + 0 x8 +

che avrebbe condotto a 1 + 0 1 + 1 + 0 1 + 1 + 0 1 + = 2=3 (sconcertante:


inlando inniti zeri nella serie di Grandi il suo valore cambia passando da 1=2
a 2=3).

In realt, no alla seconda met dellOttocento mancava una denizione rigorosa


di serie cosicch ci si appoggiava a unidea intuitiva di somma di inniti addendi e
ci consentiva di attribuirle signicati (sottilmente e anche inconsapevolmente) diversi.
Vedremo che la somma della serie di Grandi proprio 1=2 dando alla somma di inniti
addendiil signicato datale da Cesro.

11.6.2 La retta via


Per non fare la ne del monaco Grandi cerchiamo di fare chiarezza sulle due propriet.
Cominciamo con la propriet associativa. Possiamo dare il seguente

Teorema 159 Se in una serie regolare (convergente o divergente) si associano, con


una regola arbitraria, un numero nito di addendi consecutivi, si ottiene ancora una
serie regolare e con la stessa somma.

Dim. piuttosto banale: associando un numero nito di addendi consecutivi, nelle-


lenco delle somme parziali, alcune spariscono (quelle relative agli addendi associati) e
le altre rimangono intatte. Per esempio, immaginiamo di associare tra loro x3 ; x4 ; x5 ,
cio
x1 + x2 + (x3 + x4 + x5 ) + x6 + :
Le nuove somme parziali coincidono con le vecchie s1 ; s2 ; s5 ; s6; : : :. In generale dunque,
dopo lassociazione, la successione delle somme parziali diventa una sottosuccessione
delloriginaria. Se la successione delle somme parziali era regolare, lo anche qualunque
sua sottosuccessione.

La dissociazione (cio la sostituzione di un addendo con un numero nito di


addendi aventi la stessa somma delladdendo rimosso), se perpetrata innite volte,
cambia invece il carattere della serie. Ne abbiamo gi un esempio. La serie 0+0+0+
converge e ha per somma 0, ma

(1 1) + (1 1) + (1 1) + =1 1+1 1+
11.6. PROPRIET ASSOCIATIVA E COMMUTATIVA 329

irregolare.
Possiamo per aermare che, se si dissocia ciascun termine di una serie in un
numero nito di addendi tutti dello stesso segno, allora la serie non n cambia carattere
n somma.

Pi delicata, ma anche di maggior soddisfazione, la propriet commutativa.


Cominciamo con la

Denizione 81 Una serie detta incondizionatamente convergente ( divergente) se,


permutando in qualunque modo i suoi termini, si ottiene ancora una serie convergente
(divergente) e con la stessa somma.
P
Possiamo adottare la seguente simbologia. Sia 1 n=1 xn una serie. Fissiamo una
corrispondenza biunivoca m : N ! N tra i posti:
P1 a ogni n corrisponde un solo m =
m (n) e viceversa.
P1 Costruiamo la nuova serie m=1 ym con ym = P ym(n) = xn . Possiamo
1
dire che y
m=1 m stata ottenuta permutando i termini di n=1 xn . Ci stiamo
chiedendo se
X1 X
1
xn = ym
n=1 m=1

qualunque sia la corrispondenza biunivoca m (n).


Non lo dimostreremo, ma si pu vedere che la serie armonica a segni alternati
1 1 1 1
1 + + + ( 1)n+1 +
2 3 4 n
che, come sappiamo, convergente e ha somma log 2, non incondizionatamente
convergente. Cambiando lordine dei termini prendendo due addendi positivi e uno
negativo si ottiene la serie
1 1 1 1 1
1+ + + +
3 2 5 7 4
p
che ancora convergente ma ha somma log 2 2. Prendendo p tre addendi positivi seguiti
da uno negativo si ottiene una serie che converge a log 2 3 e, in generale,
p prendendo
k addendi positivi e uno negativo, si ha una serie che converge a log 2 k.

Un altro grazioso esempio dello stesso tipo il seguente. Come vedremo:

x x2 x3 x4 x5
log (1 + x) = 1 + + +
2 3 4 5 6
per ogni 1<x 1. In particolare, per x = 1,
1 1 1 1 1 1 1 1 1
log2 = 1 + + + + +
2 3 4 5 6 7 8 9 10
330 CAPITOLO 11. SERIE NUMERICHE

e quindi
2 1 2 1 2 1 2 1
2log2 = 2 1++ + +
3 2 5 3 7 4 9 5
e, sommando gli addendi con lo stesso denominatore e riordinando,

1 1 1 1 1
2log2 = 1 + + +
2 3 4 5 6
si ottiene luguaglianza2log2 = log2.

Vale il seguente profondo (e quasi commovente)

Teorema 160 (Dirichlet) Una serie incondizionatamente convergente se e solo se


assolutamente convergente. Una serie incondizionatamente divergente a +1 se e
solo se la serie dei suoi termini positivi diverge e la serie dei suoi termini negativi
converge (viceversa per 1)19 .

Il teorema sorprendente perch mostra come due concetti (le convergenze incon-
dizionata e assoluta), completamente diversi da un punto di vista logico (luno riguarda
la propriet commutativa, laltro i valori assoluti), sono in realt equivalenti.

Dim. Quando la serie contiene elementi tutti dello stesso segno, o anche denitiva-
mente dello stesso segno, lasserto una conseguenza del precedente Teorema sulla
propriet associativa.
Lunico caso da prendere in considerazione quindi che vi siano inniti addendi
positivi e inniti negativi. Consideriamo
P separatamente le due serie dei termini positivi
P
e negativi e indichiamole con 1 p
k=1 k e 1
h=1 qh ; siano inoltre Pk e Qh le loro somme
parziali.
P
Cominciamo con il caso della convergenza. P Se. Sia 1 n=1 xn assolutamente con-
vergente. Si ha allora20 Pk ! P , Qh ! Q e 1 x
n=1 n = P Q. Indichiamo
P1 con Xn la
0
sua somma parziale n-esima e con Xn la somma parziale n-esima di n=1 jxn j. Si ha
allora che Xn ! P Q e Xn0 P ! P + Q. P1
Prendiamo ora una serie 1 m=1 ym ottenuta permutando i termini di n=1 xn e
siano Ym le sue somme parziali. Scomponiamo anch P1essa nelle due
P1serie0 formate dai
0
suoi termini positivi e negativi che indicheremo con r=1 pr e con s=1 qs ; siano inne
Pr0 e Q0s le loro somme parziali. Dobbiamo provare che Ym ! P Q. Ora

Ym = Pr0 Q0s (con r + s = n)


19
A futura memoria, il lettore rietta sulla circostanza che lintegrale di una funzione di segno
qualunque denito proprio cos, cio come la dierenza tra gli integrali delle parti positiva e negativa.
Ci proprio per evitare le inestricabili conseguenze derivanti dal frammischiare i segni.
20
Si badi che, senza lassoluta convergenza (si ricordi la serie armonica con segni alternati), non si
potrebbe garantire che Pn e Qn convergono.
11.6. PROPRIET ASSOCIATIVA E COMMUTATIVA 331

e visibilmente, quando n ! 1, anche r ! 1 e s ! 1. Sempre per il precedente


teorema sulla propriet associativa, Pr0 ! P e Q0s ! Q e perci anche Ym ! P Q.
P1
Solo se. Sia n=1 xn incondizionatamente convergente. DobbiamoP mostrare
che anche assolutamente convergente. Se non lo fosse, entrambe
P P le serie 1k=1 pk e
1 1
q
h=1 h divergerebbero perch, se ne divergesse una soltanto, x
n=1 n non potrebbe
convergere.
Ci baster mostrare
P1 che, in tal caso, si possono permutare i termini in modo che
la risultante serie m=1 ym diverga a +1 oppure diverga a 1. Dunque Pk ! +1
e Qh ! +1; indichiamo con ki il minimo valore di k per il quale Pk > Qi + i.
Disponiamo ora i termini nellordine

p1 + + p k1 q1 + pk1 +1 + + p k2 q2 + :

In tal modo le somme parziali con lultimo termine negativo sono

Pk 1 Q1 ; Pk2 Q2 ; ; Pk i Qi ;

e divergono a +1 perch Pki Qi > i. Scambiando le Pk con le Qh si costruisce una


diversa permutazione che diverge a 1.

P1Vediamo il caso di divergenza. Se. Sia Pk ! +1 e Qh ! Q 2 R col che


n=1 xn = +1. Ogni serie da essa ottenuta permutandone i termini anchessa
divergente dato che, con i simboli gi introdotti Ym = Pr0 Q0s e, ancora per il teorema
precedente, Pr0 ! +1 e Q0s ! Q.

P1Solo seP.1 identica a quella relativa alla convergenza perch, se delle due serie
k=1 pk e h=1 qh una divergesse e laltra convergesse, lasserto sarebbe banale dato
che, riordinando i termini di una serie divergente con termini tutti positivi, si ottiene
sempre una serie divergente.

Da ultimo citiamo, ma non dimostriamo, un teorema veramente devastante.


P1
Teorema 161 (Riemann) P1Sia n=1 xn una serie convergente, ma non assoluta-
mente convergente (cio, n=1 jxnP j = +1). Fissato arbitrariamente
P1 un valore L 2 R,
si possono permutare i termini di 1 x
n=1 n in modo che la serie m=1 ym cos ottenuta
abbia somma L.

Non c che dire: una serie di questo tipo, per esempio la serie armonica con
segni alternati, non gode della propriet associativa nella maniera pi profonda: possi-
amo riorganizzarla in maniera da farle avere qualunque comportamento, convergente
o divergente.

In conclusione, possiamo aermare che soltanto le serie assolutamente convergenti si


comportano come lordinaria somma: per esse vale infatti, senza eccezioni, la propriet
commutativa e, entro certi limiti, anche la propriet associativa.
332 CAPITOLO 11. SERIE NUMERICHE

11.7 Applicazioni
Chiudiamo il capitolo sulle serie con due applicazioni importanti. La prima lim-
potante risultato che ogni numero reale pu essere rappresentato in una qualsiasi base
intera positiva. La seconda utilizza questo risultato per dimostrare il Teorema 90,
ossia che linsieme delle parti di N ha la stessa cardinalit di R, la cui dimostrazione
era stata lasciata in sospeso nella Sezione 7.7.

11.7.1 Rappresentazione dei numeri


Nella Sezione 1.6 si era osservato che i numeri naturali possono essere scritti in una base
intera positiva qualsiasi. Il prossimo teorema generalizza il risultato a ogni numero
reale.

Teorema 162 Sia r 2 N con r 2: Ogni numero reale x pu essere rappresentato


in modo univoco rispetto alla base r come una successione fa; d1 ; d2 ; :::dn ; :::g in modo
tale che:

(i) a il pi grande intero uguale o minore di x;

(ii) dn intero, con 0 dn < r, per ogni n;

(iii) non esiste N intero tale che dn = r 1 per ogni n > N ;

(iv) la successione fcn g denita ricorsivamente da


dn+1
c0 = a ; cn+1 = cn +
rn+1
converge a x.

Viceversa, sia fa; d1 ; d2 ; :::dn ; :::g una successione tale che:

(i) a intero;

(ii) esiste un intero r 2 tale che dn intero e 0 dn < r per ogni n.

Allora esiste un unico reale x tale che la successione fcn g denita ricorsivamente
da
dn+1
c0 = a ; cn+1 = cn +
rn+1
converge a x.

Dim. Sia x un numero reale e sia a il pi grande intero minore o uguale a x. Allora
esiste un numero 0 "1 < r tale che
"1
x=a+ :
r
11.7. APPLICAZIONI 333

Considerando ora il reale "1 , esistono un numero intero d1 2 f0; 1; :::r 1g e un numero
0 "2 < r tali che
"2
"1 = d1 + :
r
Iterando il procedimento n volte, facile vedere che esistono n interi d1 ; d2 ; :::dn 2
f0; 1; :::r 1g e n + 1 reali 0 "1 ; "2 ; :::"n ; "n+1 < r tali che
"2 "3 "n+1
"1 = d1 + ; "2 = d2 + ; :::; "n = dn + :
r r r
Per costruzione si ha quindi:

d1 d2 d3 dn "n+1
x=a+ + 2 + 3 + ::: + n + n+1 : (11.28)
r r r r r
Pi in generale, iterando il procedimento allinnito, esiste una successione di interi
fdi g1
i=1 , con di 2 f0; 1; :::r 1g, che permette di esprimere il reale x nel seguente modo:

X
1
di
x=a+ (11.29)
i=1
ri

La (11.29) mostra che la successione fcn g converge a x se e solo se la serie

X
1
di
(11.30)
i=1
ri

converge a x a: Consideriamo la somma parziale sn della serie (11.30):

X
n
di
sn = :
i=1
ri

Da (11.28) si ha
"n+1 1
0 (x a) sn = n+1
< n:
r r
Siccome
1
lim
= 0;
n!1 r n

applicando il Teorema del confronto si ha che fsn g converge a x a, come desiderato.

Viceversa, sia fa; d1 ; d2 ; :::dn ; :::g una successione che soddisfa le ipotesi (i) e (ii).
Per lunicit del limite, su ciente dimostrare che la serie

X
1
dh
h=1
rh
334 CAPITOLO 11. SERIE NUMERICHE

converge. A tal ne basta osservare che si tratta di una serie a termini positivi tale
che
X 1 n
di X 1 X
n n n 1
1 1 r r
i
< i 1
= k
= 1
< :
i=1
r i=1
r k=0
r 1 r
r 1
cio con successione delle somme parziali superiormente limitatata.

Il teorema rende rigorosa unidea intuitiva circa i numero reali. Quando si pensa
a un numero reale, si immagina un numero intero associato a una parte decimale con
innite cifre, che nel caso di numeri irrazionali si susseguono senza regolarit. Per la
classica base r = 10, a rappresenta il numero intero e la successione fd1 ; d2 ; :::dn ; :::g
la parte decimale del numero reale x21 .
Tuttavia, il teorema molto pi profondo e generale: la parte decimale di un
numero reale pu essere sostituita in modo univoco con qualsiasi base intera r 2
diversa da 10. In altre parole, come gi si osservato nella Sezione 1.6, lusuale rapp-
resentazione decimale dei numeri reali solo uno degli inniti modi di rappresentarlo.
Il lettore curioso pu (ri)leggere la Sezione 1.6 per avere informazioni dettagliate sul-
luso di diverse basi di rappresentazione dei numeri dalle diverse civilt nella storia.
La rappresentazione decimale risulta particolarmente comoda per il nostro modo di
numerazione, ma, per esempio, per dimostrare il Teorema 90 occorre considerare la
base binaria con r = 2 (peraltro ampiamente usata in informatica ed elettronica).

11.7.2 Applicazione alla teoria degli insiemi


Possiamo ora dimostrare il Teorema 90, completando in tal modo la Sezione 7.7.2. Al
riguardo, si ricordi che tale teorema aerma che 2N = jRj, ossia che linsieme delle
parti dei numeri naturali ha la potenza del continuo.
Il Teorema 162 sar il perno della dimostrazione. Occorre tuttavia prima fare
alcune premesse sul legame che intercorre tra insieme delle parti di un insieme A e
linsieme delle funzioni f : A ! f0; 1g da A in f0; 1g, denito come 2A . Osserviamo che
(non a caso!) la notazione usata per i due insiemi la stessa. Per evitare confusione, in
questa sottosezione 2A indica linsieme di tali funzioni, mentre P(A) indica linsieme
delle parti di A.
I due insiemi hanno la stessa cardinalit. Nel caso di A nito semplice vederlo.
Abbiamo gi visto che jP(A)j = 2n se se jAj = n. Daltra parte, non di cile
dimostrare che, dati due insiemi A e X di rispettiva cardinalit n e k, allora il numero
di funzioni f : A ! X pari a22 k n . Da ci segue j2A j = 2n se jAj = n.
21
Si noti che la richiesta che non esista N intero tale che dn = r 1 per ogni n > N serve per
avere lunivocit della rappresentazione. A titolo di esempio, il numero 1000 in base 10 pu essere
rappresentato solo dalla successione f1000; 0; 0; 0; ::::g e non anche dalla successione f999; 9; 9; 9; :::g.
22
Infatti, sia A = fa1 ; a2 ; :::; an g e X = fx1 ; x2 ; :::; xk g : Poich la funzione non necessariamente
iniettiva, vi sono k modi diversi di denire f (a1 ); k 2 modi diversi di denire (f (a1 ); f (a2 )),... k n modi
diversi di denire (f (a1 ); f (a2 ):::f (an )). inne evidente che vi una corrispondenza binunivoca tra
una funzione f e le n-uple del tipo (f (a1 ); f (a2 ):::f (an )):
11.7. APPLICAZIONI 335

Per un insieme nito A linsieme delle parti di A e linsieme delle funzioni f : A !


f0; 1g hanno la stessa cardinalit, da cui il precedente abuso di notazione. Il prossimo
risultato mostra che questa corrispondenza biunivoca vale anche per insiemi inniti.

Proposizione 163 Per ogni insieme A si ha jP(A)j = j2A j.

Dim. Per dimostrare che due insiemi hanno la stessa cardinalit bisogna stabilire una
corrispondenza biunivoca tra i loro elementi. Sia B 2 P(A). Allinsieme B associamo
la funzione fB 2 2A denita da
(
1 se x 2 B
fB (x) = :
0 se x 2 A B

Viceversa, sia f 2 2A : Alla funzione f associamo linsieme B 2 P(A) denito da

B = fx 2 A : f (x) = 1g :

Si noti che gli insiemi ; e da A sono in corrispondenza, rispettivamente con la funzione


costante f (x) = 0 per ogni x 2 A e con la funzione costante f (x) = 1 per ogni
x 2 A. Si quindi stabilita una corrispondenza biunivoca tra gli elementi di P(A) e
gli elementi di 2A .

Alla luce di questo risultato, per dimostrare il Teorema 90 baster trovare una
corrispondenza biunivoca tra i numeri reali e le funzioni f : N ! f0; 1g.

Dim. del Teorema 90 Grazie alla Proposizione 163, su ciente dimostrare che
linsieme 2N delle funzioni f : N ! f0; 1g ha la potenza del continuo. In altre parole,
dobbiamo dimostrare che esiste una corrispondenza biunivoca tra 2N e R, oppure (per
la propriet transitiva dellequipotenza) tra 2N e un insieme che ha la potenza del
continuo. A tale scopo, osserviamo che lintervallo [0; 1) ha la potenza del continuo,
com facile vericare. Intendiamo quindi stabilire una biiezione tra 2N e [0; 1). Si noti,
a tal ne, che linsieme 2N altro non che linsieme delle successioni a valori in f0; 1g.
Applicando il Teorema 162 con la base r = 2, esiste una corrispondenza biunivoca
tra i numeri reali x 2 [0; 1) e le successioni fd1 ; d2 ; :::dn ; :::g, con di 2 f0; 1g per ogni
i 1.23 Si ha quindi j2N j = j[0; 1)j, il che implica 2N = jRj.

23
A essere rigorosi no in fondo (cio pedanti), osserviamo che, per avere lunivocit della rappre-
sentazione di un numero reale, da 2N abbiamo tolto linsieme delle successioni denitivamente costanti
e pari a 1, insieme che chiameremo K1 . Sarebbe quindi pi corretto dire che vi una biiezione tra
[0; 1) e il sottoinsieme di 2N denito da 2N K1 (insieme formato da tutte le successioni a valori in
f0; 1g e non denitivamenta pari a 1). Tuttavia, possibile dimostrare che linsieme K1 numerabile.
Pertanto, poich 2N K1 ha la potenza del continuo, anche 2N ha la potenza del continuo.
336 CAPITOLO 11. SERIE NUMERICHE
Capitolo 12

Limiti di funzioni

12.1 Esempi introduttivi


Il concetto di limite nasce per formalizzare rigorosamente il concetto di come si com-
porta una funzione quando la variabile indipendente si avvicina, tende, a un punto x0 .
Per ssare le idee, cominciamo con alcuni esempi introduttivi nei quali consideriamo
funzioni scalari, per poi arrivare a una formalizzazione rigorosa sia nel caso scalare sia
nel pi generale caso di funzioni di vettore.

Consideriamo la funzione f : R f0g ! R data f (x) = (sin x) =x e vediamone il


comportamento per punti via via pi vicini a x0 = 0, ossia allorigine. Nella prossima
tabella troviamo i valori che la funzione assume per alcuni punti sempre pi vicini
allorigine:

x 0; 2 0; 1 0; 01 0; 001 0; 001 0; 01 0; 1 0; 2
sin x
0; 993 0; 998 0; 99998 0; 9999999 0; 9999999 0; 99998 0; 998 0; 993
x

Inserendo altri valori via via pi vicini allorigine, si pu vericare che si hanno valori
di (sin x) =x sempre pi prossimi al limite L = 1. In questo caso si dice che il limite
di (sin x) =x per x che tende a x0 = 0 L = 1; in simboli:

sin x
lim =1
x!0 x

Si osservi che in questo esempio il punto x0 = 0 relativamente al quale si prende il


limite non appartiene al dominio della funzione f .

Sia f : R ! R la funzione cos denita:

x per x 1
f (x) =
1 per x > 1

337
338 CAPITOLO 12. LIMITI DI FUNZIONI

il cui graco

3
y

1 1

0
O 1 x

-1

-2

-3
-3 -2 -1 0 1 2 3 4 5

Come si comporta f avvicinandosi al punto x0 = 1? Prendendo punti sempre pi


vicini a x0 = 1 si ha:

x 0; 95 0; 98 0; 99 0; 999 0; 9999 1; 0001 1; 001 1; 01 1; 02 1; 05


f (x) 0; 95 0; 98 0; 99 0; 999 0; 9999 1 1 1 1 1

Aggiungendo altri valori, via via pi vicini a x0 = 1, si pu vericare che per valori di
x sempre pi prossimi a x0 = 1 si hanno valori di f (x) sempre pi vicini a L = 1. In
questo caso si dice che il limite di f (x) per x che tende a x0 = 1 L = 1, e si scrive

lim f (x) = 1
x!1

Si osservi che il valore che la funzione assume nel punto x0 = 1 f (1) = 1, e quindi il
limite L = 1 uguale al valore f (1) della funzione in x0 = 1.

Sia f : R ! R la funzione cos denita:


8
< x se x < 1
f (x) = 2 se x = 1
:
1 se x > 1
Rispetto allesempio precedente abbiamo introdotto un saltonel punto x = 1, sicch
la funzione salta al valore 2 (si ha infatti f (1) = 2).
12.1. ESEMPI INTRODUTTIVI 339

3
y

2 2

1 1

0
O 1 x

-1

-2

-3
-3 -2 -1 0 1 2 3 4 5

Se studiamo il comportamento di f per valori di x sempre pi vicini a x0 = 1, si


costruisce la stessa tabella di prima (perch la funzione, eccetto nel punto 1, identica
allesempio precedente), e quindi anche in questo caso si ha

lim f (x) = 1
x!1

Questa volta il valore che la funzione assume nel punto 1 f (1) = 2, diverso dal valore
L = 1 del limite.

Finora ci si avvicinati ad un punto x0 sia da destra sia da sinistra, ossia in modo


bilaterale. Talvolta ci non possibile, ma ha senso solo avvicinarsi da destra o da
sinistra, ossia in modo unilaterale. Consideriamo, per esempio la funzione denita da
f : R f2g ! R data da f (x) = 1= (x 2) e sia x0 = 2.

10
y
8

0
O x x
0
-2

-4

-6

-8

-10
-2 -1 0 1 2 3 4
340 CAPITOLO 12. LIMITI DI FUNZIONI

Avvicinarsi al punto x0 = 2 da destravuol dire avvicinarsi considerando soltanto


valori x > 2.

x 2; 0001 2; 001 2; 01 2; 05 2; 1 2; 2 2; 5
f (x) 10:000 1:000 100 20 10 5 2

Per valori via via pi vicini a 2 da destra la funzione assume valori via via maggiori e
non superiormente limitati. In questo caso si dice che la funzione f tende a +1 per
x che tende a 2 da destrae si scrive

lim f (x) = +1
x!2+

Vediamo ora che cosa accade avvicinandoci a x0 = 2 da sinistra, ossia considerando


valori x < 2.

x 1; 5 1; 8 1; 9 1; 95 1; 99 1; 999 1; 9999
f (x) 2 5 10 20 100 1:000 10:000

Per valori via via pi vicini a 2 da sinistra la funzione assume valori negativi sempre
maggiori (in valore assoluto). In questo caso si dice che la funzione f tende a 1
per x che tende a 2 da sinistrae si scrive

lim f (x) = 1
x!2

Si osservi che
lim f (x) 6= lim f (x)
x!2+ x!2

ossia esistono i limiti destro e sinistro ma sono diversi. Come vedremo nella
Proposizione 164, la diversit dei limiti unilaterali riette il fatto che il limite bilaterale
di f (x) per x che tende a 2 non esiste. Infatti, luguaglianza dei limiti unilaterali
equivale allesistenza del limite bilaterale. Per esempio, se modichiamo la funzione
considerando f (x) = 1= jx 2j, si ha

lim f (x) = lim+ f (x) = lim f (x) = +1 (12.1)


x!2 x!2 x!2

I due limiti unilaterali sono tra loro uguali, e coincidono con il bilaterale, che in questo
caso esiste (pur se innito).

Sempre considerando la funzione f (x) = 1= (x 2), che cosa accade se come x0


consideriamo +1? In altri termini, che cosa accade se consideriamo valori via via
maggiori di x? Vediamo la seguente tabella:

x 100 1:000 10:000 100:000 1:000:000


f (x) 0; 0102 0; 001002 0; 0001 0; 00001 0; 000001
12.1. ESEMPI INTRODUTTIVI 341

Per valori via via maggiori di x la funzione assume valori via via sempre pi vicini a
0. In questo caso si dice che la funzione tende a 0 per x che tende a +1e si scrive

lim f (x) = 0:
x!+1

Si osservi come la funzione assuma valori prossimi a 0, ma sempre strettamente positivi:


f si avvicina a 0 da sopra. Se vogliamo enfatizzare questo aspetto scriviamo

lim f (x) = 0+
x!+1

dove 0+ ricorda che i valori di f (x) nel tendere a 0 rimangono strettamente positivi.
Che cosa succede se, invece, come x0 consideriamo 1? Si ha la seguente tabella
di valori:

x 100 1:000 10:000 100:000 1:000:000


f (x) 0; 0098 0; 000998 0; 0001 0; 00001 0; 000001

Per valori negativi di x e sempre maggiori (in valore assoluto), la funzione assume
valori sempre pi prossimi a 0. Si dice che la funzione tende a 0 per x che tende a
1e si scrive

lim f (x) = 0:
x! 1

Se vogliamo enfatizzare che la funzione, nel tendere a 0, rimane negativa, scriviamo

lim f (x) = 0 :
x! 1

Da ultimo, dopo aver visto vari tipi di limiti, consideriamo una funzione che ne sia
priva, ossia che non manifesti alcun comportamento tendenziale. Sia f : R f0g ! R
data da
1
f (x) = sin
x

Nel punto x0 = 0 la funzione non ammetta limite: per x via via pi vicino a x0 = 0 la
funzione continua a oscillare con andamento sinusoidale sempre pi serrato:
342 CAPITOLO 12. LIMITI DI FUNZIONI

1 y
0.8

0.6

0.4

0.2

0
x
-0.2

-0.4

-0.6

-0.8

-1

-0.4 -0.2 0 0.2 0.4 0.6

Graco di f (x) = sin x1 :

Il punto x0 = 0 per lunico punto dove la funzione non ha limite: in tutti i


punti del dominio esso esiste. Comportamento ben pi drammatico ha la funzione
f : R ! R data da
1 per x 2 Q
f (x) = (12.2)
0 per x 2=Q
Questa notevole funzione, detta di Dirichlet, oscilla in modo ossessivo tra i valori 0
e 1 perch, grazie alla densit dei razionali nei reali, per una qualsiasi coppia x < y
di reali esiste un razionale q tale x < q < y. Come vedremo, questa funzione non ha
limite in alcun punto x0 2 R.

12.2 Funzioni scalari


12.2.1 Limiti bilaterali
Dallesame degli esempi introduttivi emergono quattro casi possibili quando il limite
esiste, a seconda della nitezza o meno del punto x0 e del valore del limite:

(i) limx!x0 f (x) = L 2 R, ossia sia il punto x0 sia il limite L sono reali (niti);

(ii) limx!x0 f (x) = 1, ossia il punto x0 reale, ma il limite innito;

(iii) limx!+1 f (x) = L 2 R o limx! 1 f (x) = L 2 R, ossia il punto x0 innito,


ma il limite nito;

(iv) limx!+1 f (x) = 1 oppure limx! 1 f (x) = 1, ossia sia il punto x0 sia il
limite sono inniti.
12.2. FUNZIONI SCALARI 343

Formalizziamo ora la nozione di limite in questi casi. Cominciamo con il caso (i).
Come prima cosa osserviamo che si pu pensare di calcolare il limite di una funzione
con dominio A R per x0 2 R soltanto quando x0 un punto di accumulazione di A.
Ci permette di dar senso alla frase per x 2 A che tende a x0 .

Denizione 82 Dati una funzione f : A R ! R e un punto di accumulazione x0


di A, si scrive
lim f (x) = L 2 R
x!x0

se ad ogni " > 0 si pu associare " > 0 tale che, per ogni x 2 A,

0 < jx x0 j < " =) jf (x) Lj < " (12.3)

Il valore L si dice limite della funzione in x0 .

Si noti come la (12.3) si possa scrivere

0 < d (x; x0 ) < " =) d (f (x) ; L) < " (12.4)

La denizione richiede che, ssata qualsiasi quantit " > 0, arbitrariamente piccola,
esista un valore " tale che tutti i punti x 2 A che distano da x0 meno di " abbiano
immagini f (x) a distanza minore di " dal valore L del limite. Si noti che la condizione
d (x; x0 ) > 0 equivale a richiedere x 6= x0 .

Esempio 186 Mostriamo che limx!2 (3x 5) = 1. Dobbiamo far vedere che, per
ogni " > 0, esiste " > 0 tale che

jx 2j < =) j(3x 5) 1j < " (12.5)

Si ha j(3x 5) 1j < " se e solo se jx 2j < "=3 e quindi, ponendo " = "=3, si
ottiene la (12.5). N

Si noti come la quantit " dipenda dal valore ssato per ": pi piccolo il valore
di ", pi piccola anche " . Naturalmente, la scelta di " non univoca, tant che,
trovato un valore di " , anche tutti i valori pi piccoli andrebbero bene: nellEsempio
186, potevamo in realt scegliere come " qualsiasi valore (positivo) minore di "=3.

NB. Il valore di ", oltre che da ", dipende chiaramente anche da x0 . O

Vediamo ora un esempio in cui il limite non esiste.

Esempio 187 Riprendiamo la funzione di Dirichlet (12.2): limx!x0 f (x) non esiste
per alcun x0 2 R. Infatti, dato x0 2 R, supponiamo, per contra, che limx!x0 f (x)
esista e sia uguale a L 2 R. Sia 0 < " < 1=2. Esiste = " tale che
1
x 2 (x0 ; x0 + ) e x 6= x0 =) jf (x) Lj < " <
2
344 CAPITOLO 12. LIMITI DI FUNZIONI

In ogni intorno (x0 ; x0 + ) esistono sia punti razionali sia punti non razionali
distinti da x0 (si veda la Proposizione 18), ovvero sia punti x 2 (x0 ; x0 + ) per
cui f (x) = 1 sia punti x 2 (x0 ; x0 + ) per cui f (x) = 0. Ma ci contraddice
jf (x) Lj < 1=2 per ogni x 2 (x0 ; x0 + ) con x 6= x0 . Dunque il limx!x0 f (x)
non esiste in alcun x0 2 R. N

Una denizione come la 82, nella quale sono esplicitate le distanze, si dice "- .
Alla luce della (12.4), immediata la riscrittura della Denizione 82 nel linguaggio
degli intorni. Per rendere pi immediatamente espressiva la simbologia, indicheremo,
anzich con la lettera B, rispettivamente con U (x0 ) un intorno di x0 di raggio (della
variabile indipendente, cio un intorno in ascissa) e con V (L) = V" (L) un intorno di
L di raggio " (della variabile dipendente, cio un intorno in ordinata).

Denizione 83 Siano f : A R ! R una funzione e x0 2 R un punto di accumu-


lazione di A. Si scrive
lim f (x) = L 2 R
x!x0

se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che

x 2 U " (x0 ) \ A e x 6= x0 =) f (x) 2 V" (L) (12.6)

Come nel caso della convergenza di successioni, la riscrittura nel linguaggio degli
intorni molto evocativa1 . In particolare, grazie alla topologia della retta reale estesa,
possiamo subito generalizzare la denizione in modo da includere anche i casi (ii), (iii)
e (iv), in analogia con quanto fatto con la Denizione 67 per i limiti di successioni.

Denizione 84 Siano f : A R ! R una funzione e x0 2 R un punto di accumu-


lazione di A. Si scrive
lim f (x) = L 2 R
x!x0

se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che

x 2 U " (x0 ) \ A e x 6= x0 =) f (x) 2 V" (L) (12.7)

La dierenza tra le Denizioni 83 e 84 in apparenza minima: dove nella prima


denizione avevamo R, nella seconda abbiamo R. La semplice modicazione permette
per di considerare anche i casi (ii), (iii) e (iv). In particolare:

il caso (ii) si ritrova ponendo x0 2 R e L = 1;

il caso (iii) si ritrova ponendo x0 = 1 e L 2 R;

il caso (iv) si ritrova ponendo x0 = 1eL= 1.


1
In breve, si pu dire che esiste un intornoprende il posto di denitivamenteper le successioni.
12.2. FUNZIONI SCALARI 345

A titolo di esempio, consideriamo esplicitamente alcuni sottocasi, lasciando al let-


tore gli altri. Cominciamo dal sottocaso x0 2 R e L = +1 di (i). In esso la Denizione
84 equivale alla seguente, in forma "- , cio con lesplicitazione delle distanze.

Denizione 85 Siano f : A R ! R una funzione e x0 2 R un punto di accumu-


lazione di A. Si scrive
lim f (x) = +1
x!x0

se, per ogni M > 0, esiste M > 0 tale che, per ogni x 2 A, si abbia

0 < jx x0 j < M =) f (x) > M (12.8)

In altre parole, per ogni costante M , per quanto grande sia, esiste M > 0 tale che
tutti i punti x 2 A che distano da x0 meno di M (escluso al pi x0 ) hanno immagini
f (x) maggiori di M .

Esempio 188 Sia f : R f2g ! R data da f (x) = 1= jx 2j. Il punto x0 = 2 di


accumulazione per R f2g e quindi possiamo considerare limx!2 f (x). Sia M > 0.
Posto M = 1=M , si ha

1 1
0 < jx x0 j < M () 0 < jx 2j < =) >M
M jx 2j

e quindi
0 < jx 2j < M =) f (x) > M
ossia limx!2 f (x) = +1. N

Consideriamo ora il caso (iii) con x0 = +1 e L 2 R. Qui la Denizione 84 equivale


alla seguente, ancora in forma "- perch sono esplicitate le distanze.

Denizione 86 Sia f : A R ! R, con A non superiormente limitato2 . Si scrive

lim f (x) = L 2 R
x!+1

se, per ogni " > 0, esiste M" > 0 tale che, per ogni x 2 A, si abbia

x > M" =) jf (x) Lj < " (12.9)

In questo caso, per ogni scelta di " > 0 arbitrariamente piccola, esiste un valore
M" tale che le immagini di punti x maggiori di M" distano meno di " da L.
2
Grazie al Lemma 98, il fatto che A non sia superiormente limitato garantisce che +1 ne sia
punto di accumulazione. Per esempio, ci il caso se (a; +1) A.
346 CAPITOLO 12. LIMITI DI FUNZIONI

Esempio 189 Sia f : R ! R data da f (x) = 1 + e x . Grazie al Lemma 98, +1


punto di accumulazione di R. Possiamo quindi considerare il limite limx!+1 f (x).
Verichiamo che limx!+1 f (x) = 1. Sia " > 0. Si ha
x x
jf (x) Lj = 1 + e 1 =e < " () x < log " () x > log "

e quindi, posto M" = log ", si ha

x > M" =) jf (x) Lj < ";

ossia limx!+1 f (x) = 1. N

Consideriamo inne il caso (iv) con x0 = L = +1. In esso la Denizione 84


equivale alla seguente:

Denizione 87 Sia f : A R ! R; con A non superiormente limitato. Si scrive

lim f (x) = +1
x!+1

se, per ogni M > 0, esiste N tale che, per ogni x 2 A, si abbia

x > N =) f (x) > M: (12.10)


p
Esempio 190 Sia f : R+ ! R data da f (x) = x. Grazie al Lemma 98, +1
punto di accumulazione di R+ e possiamo quindi considerare il limite limx!+1 f (x).
Verichiamo che limx!+1 f (x) = +1. Per ogni M > 0 si ha
p
f (x) > M () x > M () x > M 2

Posto N = M 2 , risulta quindi

x > N =) f (x) > M

ossia limx!+1 f (x) = +1. N

Se A = N+ , cio f : N+ ! R una successione, con le due ultime denizioni


ritroviamo le nozioni di convergenza e divergenza (positiva) per successioni. La teoria
dei limiti di funzioni estende perci la teoria dei limiti di successioni del Capitolo 9.

OfB. utile vedere che il concetto di limite a tre stadi(come un missile):

(i) per ogni intorno V di L (in ordinata)

(ii) esiste un intorno U di x0 (in ascissa) tale che


12.2. FUNZIONI SCALARI 347

(iii) tutti i valori di f con x 2 U , x 6= x0 , appartengono a V , cio tutte le immagini


esclusa al pi f (x0 ) di f in U \ A appartengono a V : f (U \ A fx0 g) V .

10 y

V(l)
6

O U(x ) x
0
0

-2
-2 -1 0 1 2 3 4

Spesso si tentati di semplicare liter logico riducendolo a due stadi: i valori di


x prossimi a x0 hanno immagini f (x) prossime a L, cio

per ogni U esiste V tale che f (U \ A fx0 g) V

Purtroppo per in tal modo non si dice proprio nulla perch ci che che precede
sempre vero, come mostra la gura:

5
y

3 V(l)

0
O x
U(x )
-1 0

-2

-3

-4
-4 -2 0 2 4 6

Nella gura, per ogni intorno U , anche piccolissimo, di x0 esiste sempre un intorno
(di solito grandino) V di L entro il quale cadono tutti i valori di f (x) con x 2 U fx0 g.
Tale V pu sempre essere preso come un intervallo aperto che contiene f (U fx0 g).
H
348 CAPITOLO 12. LIMITI DI FUNZIONI

OfB. Come pi volte s detto, una successione una funzione denita su N+ che ha
un solo punto di accumulazione: +1. Per una successione lunico limite del quale si
pu parlare allora limn!1 che abbiamo talvolta indicato semplicemente con lim non
essendovi possibilit di equivoco. H

Da ultimo, ci limitiamo ad avvertire che, come per le successioni, si pu ancora


parlare, e negli stessi termini, di valori limite, classe limite e di limite superiore e
inferiore. Per brevit omettiamo i dettagli.

12.2.2 Limiti unilaterali


Non sempre si pu parlare di limiti bilaterali. Per esempio, nei punti di frontiera del
dominio di una funzionepi limiti bilaterali, per evidenti
p motivi, non sono deniti: il
limite bilaterale limx!0 x non pu esistere perch x denita soltanto per x 0.
Ma, anche nei punti interni del dominio, il limite bilaterale pu non esistere. Si
consideri per esempio la semplice funzione f : R ! R data da

2 se x 1
f (x) =
x se x < 1

facile vedere che il limite limx!1 f (x) non esiste. In questi casi soccorre la pi debole
nozione di limite unilaterale, gi incontrata in modo intuitivo negli esempi introduttivi
del presente capitolo. Essi suggeriscono le diverse possibilit:

(i) limx!x+0 f (x) 2 R e limx!x0 f (x) 2 R;

(ii) limx!x+0 f (x) = 1 e limx!x0 f (x) = 1.

Si noti come, nei limiti unilaterali, il punto x0 sia necessariamente in R, mentre il


valore del limite in R.
La prossima denizione ricomprende i due possibili casi generali (i) e (ii), modi-
cando in modo opportuno la Denizione 84.

Denizione 88 Siano f : A R ! R una funzione e x0 2 R un punto di accumu-


lazione di A. Si scrive
lim f (x) = L 2 R
x!x+
0

se, per ogni intorno V" (L) di L, esiste un intorno destro U +" (x0 ) = [x0 ; x0 + " ) di x0
tale che
x 2 U +" (x0 ) \ A e x 6= x0 =) f (x) 2 V" (L) (12.11)
Il valore L si dice limite destro della funzione in x0 .
12.2. FUNZIONI SCALARI 349

Poich, escludendo x0 , lintorno U +" (x0 ) si riduce a (x0 ; x0 + " ), la (12.11) si pu


scrivere pi semplicemente come

x 2 (x0 ; x0 + ") \ A =) f (x) 2 V" (L)

In particolare:

il caso (i) si ritrova ponendo L 2 R;

il caso (ii) si ritrova ponendo L = 1.

Nel caso (i) la Denizione 88 equivalente alla seguente denizione "- .

Denizione 89 Siano f : A R ! R una funzione e x0 2 R un punto di accumu-


lazione di A. Si scrive
lim f (x) = L 2 R
x!x+
0

se, per ogni " > 0, esiste = " > 0 tale che, per ogni x 2 A,

x0 < x < x0 + =) jf (x) Lj < " (12.12)

Vediamo un esempio.
p
Esempiop 191 Consideriamo f : R+ ! R data da f (x) = x. Mostriamo che
limx!0+ x = 0. Sia " > 0. Risulta
p
jf (x) Lj = x < " () x < "2

Posto " = "2 , si ha


0<x< " =) jf (x) Lj < "
p
ossia limx!0+ x = 0. N

Consideriamo il sottocaso L = +1 di (ii), lasciando al lettore il sottocaso L = 1.


Per esso la Denizione 88 equivalente alla seguente denizione "- :

Denizione 90 Siano f : A R ! R una funzione e x0 2 R un punto di accumu-


lazione di A. Si scrive
lim f (x) = +1
x!x+
0

se, per ogni M > 0, esiste M > 0 tale che, per ogni x 2 A,

x0 < x < x0 + M =) f (x) > M (12.13)


350 CAPITOLO 12. LIMITI DI FUNZIONI

Esempio 192 Sia f : R f2g ! R data da f (x) = 1= (x 2). Il punto x0 = 2


di accumulazione di R f2g e possiamo considerare entrambi i limiti unilaterali
limx!0+ f (x) e limx!0 f (x). Sia M > 0. Posto M = 1=M , per ogni x > 2 si ha

1 1
x x0 < M () x 2< =) >M
M x 2
e quindi
0<x 2< M =) f (x) > M
ossia limx!2+ f (x) = +1. Daltra parte, per ogni x < 2 si ha

1 1
x0 x< M () 2 x< =) < M
M x 2
e quindi
0<2 x< M =) f (x) < M
ossia limx!2 f (x) = 1. N

Negli stessi termini si deniscono i limiti sinistri che si indicano con limx!x0 f (x).

12.2.3 Relazioni tra limiti unilaterali e bilaterali


La prima propriet dei limiti che studiamo mostra che i limiti bilaterali (per punti al
nito) esistono se e solo se i corrispondenti limiti unilaterali esistono e sono uguali.
In altre parole, il limite bilaterale si pu vedere come il caso nel quale i due limiti
unilaterali coincidono, mentre, quando vi discrepanza tra essi, il limite bilaterale non
esiste.

Proposizione 164 Siano f : A R ! R una funzione e x0 uno scalare per il quale


esiste un intorno B" (x0 ) tale che B" (x0 ) fx0 g A. Risulta limx!x0 f (x) = L 2 R
se e solo se limx!x+0 f (x) = limx!x0 f (x) = L 2 R.

Si noti che B" (x0 ) fx0 g un intorno di x0 bucato, cio privo del punto x0
stesso. La condizione B" (x0 ) fx0 g A richiede che esista almeno un tale intorno
bucato incluso in A. In altre parole, si richiede linclusione dellintorno con leventuale
eccezione del punto x0 stesso, al quale non si richiede di appartenere ad A. Natu-
ralmente, un caso ovvio e importante dove esiste un intorno B" (x0 ) che soddisfa la
condizione B" (x0 ) fx0 g A quando x0 un punto interno di A.

Tornando agli esempi appena visti, per f (x) = 1= jx 2j si ha limx!2 f (x) = +1


e quindi, per la Proposizione 164, si ha

lim f (x) = lim+ f (x) = lim f (x) = +1


x!2 x!2 x!2
12.2. FUNZIONI SCALARI 351

che conferma la (12.1). Per f (x) = 1= (x 2) si ha invece


+1 = lim+ f (x) 6= lim f (x) = 1
x!2 x!2

e quindi, per la Proposizione 164, il limite bilaterale limx!2 f (x) non esiste.

Dim. Dimostriamo la proposizione per L 2 R, lasciando al lettore il caso L = 1.


Inoltre, per semplicit supponiamo che x0 sia punto interno di A.
Se. Mostriamo che se limx!x0 f (x) = limx!x+0 f (x) = L, allora limx!x0 f (x) = L.
Sia " > 0. Poich limx!x+0 f (x) = L, esiste 0" > 0 tale che per ogni x 2 (x0 ; x0 + 0" )\A
si abbia jf (x) Lj < ". Daltra parte, poich limx!x0 f (x) = L, esiste 00" > 0 tale che
00
per ogni x 2 (x0 " ; x0 ) \ A si abbia jf (x) Lj < ". Sia " = min f 0" ; 00" g. Allora
x 2 (x0 ; x0 + ") \ A =) jf (x) Lj < " (12.14)
e
x 2 (x0 " ; x0 ) \ A =) jf (x) Lj < " (12.15)
ossia
x 2 (x0 " ; x0 + ") \ A e x 6= x0 =) jf (x) Lj < "
Quindi limx!x0 f (x) = L.
Solo se. Mostriamo che se limx!x0 f (x) = L, allora limx!x0 f (x) = limx!x+0 f (x) =
L. Sia " > 0. Poich limx!x0 f (x) = L, esiste " > 0 tale che
x 2 (x0 " ; x0 + ") \ A e x 6= x0 ) jf (x) Lj < " (12.16)
Poich x0 non di frontiera, sia (x0 " ; x0 ) \ A sia (x0 ; x0 + " ) \ A non sono
vuoti. Quindi la (12.16) implica sia la (12.14) sia la (12.15), ossia limx!x+0 f (x) =
limx!x0 f (x) = L.

Il lettore avr osservato come la Proposizione 164 vieti che x0 sia di frontiera per A.
Infatti, se A un intervallo della retta reale, quando x0 = inf A non ha senso parlare
del limite unilaterale limx!x0 f (x), mentre quando x0 = sup A non ha senso parlare
del limite unilaterale limx!x+0 f (x). Discorso analogo se A una semiretta limitata
inferiormente (superiormente): in tal caso non esiste il limite sinistro (destro)
p per x
che tende allestremo inferiore (superiore) di A: Per esempio,
p per f (x) = x e x0 = 0,
si ha x0 = inf A (anzi, x0 = min A) e il limite limx!0 x non denito. Quando x0
un generico punto di frontiera, per esempio il punto 3 per linsieme A = (0; 3) [ [5; 19],
il problema si presenta esattamente negli stessi termini.

Notazione. Analizziamo il caso molto frequente nel quale A sia un intervallo della
retta reale3 . Quando x0 di frontiera, almeno uno dei due unilaterali non esiste e per-
ci la condizione limx!x+0 f (x) = limx!x0 f (x) perde signicato. In tali casi porremo
3
In altre parole, vale uno dei seguenti quattro casi: (i) A = (a; b); (ii) A = [a; b); (iii) A = (a; b];
(iv) A = [a; b].
352 CAPITOLO 12. LIMITI DI FUNZIONI

semplicemente limx!x0 f (x) = limx!x+0 f (x) oppure limx!x0 f (x) = limx!x0 f (x) a
seconda di quale limite unilaterale esista. La denizione di limite bilaterale infatti
perfettamente rispettata: per ogni intorno (bilaterale) V di L esiste un intorno, for-
zosamente unilaterale perch x0 di frontiera, tale che le immagini di f (esclusa al pi
f (x0 )) cadono in V .
p
Esempio 193 Sia f : R+ ! R data da f (x) = x. NellEsempio 191 avevamo visto
come limx!0+ f (x) = 0. Per quanto detto possiamo scrivere anche limx!0 f (x) = 0.
istruttivo calcolare questo limite bilaterale anche direttamente, tramite la Denizione
82. Sia " > 0. Come s visto nellEsempio 191, si ha
p
jf (x) Lj = x < " () x < "2

Posto " = "2 , per ogni x 2 A, ossia per ogni x 0, si ha

0 < jx x0 j < " () 0 < x < " =) jf (x) Lj < "


p
e quindi limx!0 x = 0, cio esso pu anche essere visto come limite bilaterale. N

12.2.4 Gran nale


Concludiamo con la denizione generalissima di limite bilaterale, che compendia tutti
i casi: punto nito o innito e limite nito o innito.

Denizione 91 Siano f : A R ! R una funzione e x0 2 R un punto di accumu-


lazione di A. Si dice che, per x che tende a x0 , la funzione tende a L 2 R se ad ogni
intorno V di L si pu associare un intorno U di x0 tale che f ((U \ A) fx0 g) V .
In tal caso, si scrive
lim f (x) = L
x!x0

Lanaloga versione generalissima per i limiti unilaterali limx!x+0 f (x) e limx!x0 f (x)
si ottiene in modo ovvio sostituendo, nel primo caso, x+ 0 in luogo di x0 e intorno destro
in luogo di intorno, e nel secondo caso x0 in luogo di x0 e intorno sinistro in luogo di
intorno.

12.3 Funzioni di vettore


Lestensione al caso di funzioni f : A Rn ! R della denizione di limite limx!x0 f (x) =
L molto naturale. In questo caso si ha d (x; x0 ) = kx x0 k e avvicinarsia x0 sig-
nica che tale distanza diventa via via pi piccola. Diamo direttamente la versione
vettoriale della Denizione 84 di limite4 .
4
Consideriamo solo il caso x0 2 Rn , poich lo studio dellanalogo vettoriale di x ! 1
particolarmente tedioso.
12.3. FUNZIONI DI VETTORE 353

Denizione 92 Siano f : A Rn ! R una funzione e x0 2 Rn un punto di


accumulazione di A. Si scrive
lim f (x) = L 2 R (12.17)
x!x0

se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che
x 2 U " (x0 ) \ A e x 6= x0 =) f (x) 2 V" (L) (12.18)
Il valore L si dice limite della funzione in x0 .
La Denizione 84 ne il caso particolare con n = 1. Nella versione "- si ha
(12.17) se, per ogni " > 0, esiste " > 0 tale che, per ogni x 2 A,
0 < d (x; x0 ) < " =) d (f (x) ; L) < " (12.19)
Si noti come la (12.19) sia assolutamente identica alla (12.4): la distanza d (x; x0 ),
che jx x0 j nel caso n = 1, nel caso generale diventa kx x0 k.
P
Esempio 194 Sia f : Rn ! R data da f (x) = 1 + ni=1 xi . Verichiamo che
limx!0 f (x) = 1. Sia " > 0. Si ha
X
n X
n
d (f (x) ; 1) = 1 + xi 1 < " () xi < "
i=1 i=1
P Pn
Poniamo = "=n. Poich j ni=1 xi j
" i=1 jxi j, si ha
v
u n
uX " Xn
"2
d (x; x0 ) < " () t x 2
< () x 2
< =)
i i 2
i=1
n i=1
n
q r
2
" "2 "
x2i < 2
8i = 1; 2; : : : ; n =) jx i j = x 2
i < 2
= 8i = 1; 2; : : : ; n
n n n
Xn Xn Xn
=) jxi j < " =) d (f (x) ; 1) = xi jxi j < "
i=1 i=1 i=1

ossia limx!0 f (x) = 1. N


Per estendere la denizione di limite unilaterale al caso vettoriale occorrerebbe
considerare le diverse direzioni lungo le quali ci si pu avvicinare a un punto x 2 Rn .
Lasciando a corsi successivi lo studio dellargomento, ci limiteremo a considerare solo
i limiti bilateralisu Rn . Non presenta invece alcuna di colt lestensione al caso di
funzioni di vettore dei limiti per eccesso e per difetto (e ci perch in ogni caso L in
R e non in Rn ).
Da ultimo si osservi che la Denizione 95 del Capitolo 13 estender la nozione di
limite ad applicazioni. Poich tale ultima estensione non presenta alcuna sostanziale
novit, preferiamo studiarla direttamente insieme con la nozione di continuit di
applicazioni (che ne motiva lo studio).
354 CAPITOLO 12. LIMITI DI FUNZIONI

12.4 Propriet dei limiti


In questa sezione presentiamo alcune propriet fondamentali dei limiti. Per poter
enunciare le propriet direttamente per funzioni vettoriali, considereremo punti limite
x0 niti, ossia x0 2 Rn ; lasciamo al lettore le versioni delle propriet per il caso
x ! 1 di funzioni scalari.

Cominciamo con unimportante caratterizzazione dei limiti di funzioni tramite


limiti di successioni.

Proposizione 165 Data una funzione f : A Rn ! R e un punto di accumulazione


x0 2 Rn di A, si ha limx!x0 f (x) = L 2 R se e solo se si ha

xn ! x0 =) f (xn ) ! L

per ogni successione fxn g in A, con xn 6= x0 per ogni n 1.

Dim Consideriamo L 2 R, lasciando al lettore il caso L = 1. Se: supponiamo


f (xn ) ! L per ogni successione fxn g di punti di A, con xn 6= x0 per ogni n, tale che
xn ! x0 . Supponiamo che limx!x0 f (x) = L sia falsa. Esiste quindi " > 0 tale che,
per ogni > 0, esiste x 2 A con 0 < d (x ; x0 ) < e d (f (x ) ; L) ". Per ogni n, si
ponga = 1=n e sia xn il corrispondente punto di A appena indicato con x . Per la
successione fxn g di punti di A cos costruita si ha d (x0 ; xn ) < 1=n per ogni n, e quindi
limn!1 d (x0 ; xn ) = 0. Per la Proposizione 96, xn ! x. Ma, per costruzione, si ha
d (f (xn ) ; L) " per ogni n, e quindi la successione f (xn ) non converge a L. Avendo
contraddetto lipotesi, concludiamo perci che limx!x0 f (x) = L.

Solo se: supponiamo limx!x0 f (x) = L 2 R. Sia fxn g una successione di punti
di A, con xn 6= x0 per ogni n, tale che xn ! x0 . Sia " > 0. Esiste " > 0 tale che per
ogni x 2 A con 0 < d (x; x0 ) < " si abbia d (f (x) ; L) < ". Poich xn ! x0 e xn 6= x0 ,
esiste n" 1 tale che 0 < d (xn ; x0 ) < " per ogni n n" . Per ogni n n" si ha quindi
d (f (xn ) ; L) < ", il che implica f (xn ) ! L.

Esempio 195 Torniamo al limite limx!2 (3x 5) dellEsempio 186. Poich A = R,


sia fxn g una qualsiasi successione di numeri reali, con xn 6= 2 per ogni n, tale che
xn ! 2. Per esempio, xn = 2 + 1=n oppure xn = 2 1=n2 . Grazie allalgebra dei limiti
di successioni, si ha

lim (3xn 5) = 3 lim xn 5=3 2 5=1


n!+1 n!+1

Per esempio, nel caso speciale xn = 2 + 1=n si ha


1 1
lim 3 2+ 5 = 3 lim 2+ 5=3 2 5=1
n!+1 n n!+1 n
N
12.4. PROPRIET DEI LIMITI 355

Esempio 196 Consideriamo la funzione f : R+ ! R data da


p
x
f (x) =
x
e il limite limx!0 f (x). Poich A = R+ e x0 = 0, sia fxn g una qualsiasi successione di
numeri reali positivi e diversi da zero, cio xn > 0 per ogni n, tale che xn ! 0. Per
esempio, xn = 1=n oppure xn = 1=n2 . Grazie allalgebra dei limiti di successioni, si ha
p
xn 1
lim = lim p = +1
n!+1 xn n!+1 xn

e quindi la Proposizione 165 permette di concludere che limx!0 f (x) = +1. N

La caratterizzazione dei limiti tramite successioni importante sia dal punto di


vista computazionale, perch il calcolo dei limiti di funzioni si riduce al pi semplice
calcolo di limiti di successioni, sia dal punto di vista teorico, perch cos molte delle
propriet viste per limiti di successioni si estendono immediatamente a limiti di fun-
zioni. In questa sezione useremo tale secondo aspetto, pi teorico, per ottenere le
propriet fondamentali dei limiti di funzioni usando le analoghe propriet gi viste per
limiti di successioni. Cominciamo col Teorema di unicit del limite.

Teorema 166 (di unicit del limite) Siano f : A Rn ! R una funzione e


x0 2 R un punto di accumulazione di A. Esiste al pi un unico L 2 R tale che
limx!x0 f (x) = L.

Nel caso n = 1 possiamo assumere anche x0 2 R:

Dim 1. Supponiamo, per contra, che esistano due limiti diversi tra loro L0 6= L00 . Sia
fxn g una successione in A, con denitivamente xn 6= x0 , tale che xn ! x0 . Per la
Proposizione 165, F (xn ) ! L0 e F (xn ) ! L00 , il che contraddice lunicit del limite
per successioni. Ne segue che L0 = L00 .

Una dimostrazione alternativa, che non utilizza i limiti di successioni, la seguente.

Dim 2. Per assurdo supponiamo che esistano due limiti diversi tra loro L1 6= L2 . Si
assume cio che
lim f (x) = L1
x!x0
e
lim f (x) = L2
x!x0

con L1 6= L2 . Senza perdita di generalit, supponiamo che L1 > L2 . Esiste uno scalare
K tale che L1 > K > L2 . Posto 0 < "1 < L1 K e 0 < "2 < K L2 , gli intorni
B"1 (L1 ) = (L1 "1 ; L1 + "1 ) e B"2 (L2 ) = (L2 "2 ; L2 + "2 ) sono disgiunti.
356 CAPITOLO 12. LIMITI DI FUNZIONI

Poich per ipotesi limx!x0 f (x) = L1 , dato il raggio "1 > 0 si pu trovare un raggio
1 > 0 tale che per

x 2 (x0 1 ; x0 + 1) \ A; x 6= x0 ) f (x) 2 (L1 "1 ; L1 + "1 ) (12.20)

Analogamente, poich per ipotesi limx!x0 f (x) = L2 , dato il raggio "2 > 0 si puo
trovare un raggio 2 > 0 tale che per

x 2 (x0 2 ; x0 + 2) \ A; x 6= x0 ) f (x) 2 (L2 "2 ; L2 + "2 ): (12.21)

Preso il pi piccolo dei due raggi = min f 1 ; 2 g si ha che lintorno di x0 con raggio
contenuto nei due intorni precedenti, cio in (x0 ; x0 + ) valgono entrambe le
propriet (12.20) e (12.21):

8x 2 (x0 ; x0 + ); x 6= x0 ) f (x) 2 (L1 "1 ; L1 + "1 ) e f (x) 2 (L2 "2 ; L2 + "2 )

cio:

8x 2 (x0 ; x0 + ); x 6= x0 ) f (x) 2 (L1 "1 ; L1 + "1 ) \ (L2 "2 ; L2 + "2 )

che assurda in quanto per ipotesi si ha che

(L1 "1 ; L1 + "1 ) \ (L2 "2 ; L2 + "2 ) = ;:

Il limite quindi unico.

Passiamo ora al Teorema del confronto per funzioni, lasciando al lettore la di-
mostrazione (basata sul Teorema 114 e sulla Proposizione 165).

Teorema 167 (del confronto) Siano f; g; h : A Rn ! R tre funzioni e x0 2 Rn


(o x0 2 R quando n = 1) un punto di accumulazione di A. Se

g (x) f (x) h (x) 8x 2 A (12.22)

e
lim g (x) = lim h (x) = L 2 R (12.23)
x!x0 x!x0

allora
lim f (x) = L
x!x0

Una dimostrazione alternativa, che non utilizza i limiti di successioni, la seguente:

Dim. alternativa Preso " > 0 arbitrario, si deve dimostrare che esiste > 0 tale
che g(x) 2 (L "; L + ") per ogni x 2 (x0 ; x0 + ) \ A con x 6= x0 . Siccome
limx!x0 f (x) = L, dato " > 0, esiste 1 > 0 tale che

8x 2 (x0 1 ; x0 + 1) \ A; x 6= x0 ) L " < f (x) < L + " ( ) (12.24)


12.4. PROPRIET DEI LIMITI 357

Siccome limx!x0 h(x) = L, dato " > 0, esiste 2 > 0 tale che

8x 2 (x0 2 ; x0 + 2) \ A; x 6= x0 ) L " < h(x) < L + " ( ) (12.25)

Allora, preso = min f 1 ; 2 g, si ha che in (x0 ; x0 + ) \ A valgono sia (12.24)


sia (12.25). Inoltre si ha f (x) g(x) h(x) in (x0 ; x0 + ) \ A. Quindi 8x 2
(x0 ; x0 + ) \ A si ha

L " < f (x) g(x) h(x) < L + "

cio
g(x) 2 (L "; L + ") 8x 2 (x0 ; x0 + )
e quindi, essendo " arbitrario, si ha limx!x0 g(x) = L, come desiderato.

Linterpretazione del risultato del tutto analoga alla versione per successioni.
Vediamone una semplice applicazione, simile, mutatis mutandis, a quella vista nellE-
sempio 145.
2 1
Esempio 197 Sia f : R ! R data da f (x) = ex cos x e sia x0 = 0. Poich

1
0 cos2 1 8x 2 R;
x
considerando la monotonia della funzione esponenziale, per x 0 si ha
2 1
1 = e0 x ex cos x e1 x = ex 8x 0:

Ponendo g (x) = 1 e h (x) = ex , le condizioni (12.22) e (12.23) sono soddisfatte con


L = 1. Quindi limx!0 f (x) = 1. La dimostrazione per x < 0 analoga. N

Concludiamo con la versione per funzioni del Teorema della permanenza del segno
(ancora lasciamo al lettore la dimostrazione, basata sul Teorema 101 e sulla Propo-
sizione 165).

Teorema 168 (della permanenza del segno) Siano f : A Rn ! R una fun-


n
zione e x0 2 R (o x0 2 R quando n = 1) un punto di accumulazione di A. Se
limx!x0 f (x) = L 6= 0, allora esiste un intorno U" (x0 ) di x0 tale che

f (x) L > 0 8x 2 (U" (x0 ) \ A) fx0 g

ovvero tale che f (x) e L hanno lo stesso segno.

Questultimo importante risultato molto intuitivo: se L 6= 0, sempre possibile


scegliere un intorno di x0 (su cientemente piccolo) tale che tutti i suoi punti hanno
immagine dello stesso segno di L.
358 CAPITOLO 12. LIMITI DI FUNZIONI

Anche qui diamo una dimostrazione alternativa che non utilizza i limiti di succes-
sioni.

Dim. alternativa Supponiamo che sia L > 0. Poich limx!x0 f (x) = L, scelto
" = L=2 > 0, esiste un intorno U" (x0 ) di x0 tale che

L L L 3L
x 2 U" (x0 ) \ A fx0 g =) f (x) 2 L ;L + = ; :
2 2 2 2

Poich L=2 > 0, si ha la tesi. Con L < 0 la dimostrazione analoga.

Come gi osservato, anche per funzioni, i Teoremi del confronto e della permanenza
del segno sono propriet dei limiti rispetto alla struttura dordine. La prossima propo-
sizione, lanaloga per funzioni della Proposizione 102, rappresenta un ultimo semplice
risultato dello stesso tipo.

Proposizione 169 Siano f; g : A Rn ! R due funzioni, x0 2 Rn (o x0 2 R


quando n = 1) un punto di accumulazione di A e risulti limx!x0 f (x) = L 2 R e
limx!x0 g (x) = H 2 R.

(i) Se f (x) g (x) in un intorno B" (x0 ) di x0 , allora L H.

(ii) se L > H, allora esiste un intorno di x0 nel quale f (x) > g (x) :

Dim. (i) Per contra, sia L < H. Si ponga " = H L, sicch " > 0. Gli intorni
(L "=4; L + "=4) e (H "=4; H + "=4) sono disgiunti siccome L + "=4 < H "=4.
Poich limx!x0 f (x) = L, esiste 1 > 0 tale che per x 2 (x0 1 ; x0 + 1 ) =) f (x) 2
" "
L 4 ; L + 4 : Analogamente, poich limx!x0 g (x) = H esiste 2 > 0 tale che
" "
x 2 (x0 2 ; x0 + 2) =) g(x) 2 H ;H +
4 4
Posto = minf 1 ; 2 g, si ha
" " " "
x 2 (x0 ; x0 + ) =) L < f (x) < L + < H < g(x) < H +
4 4 4 4
cio, f (x) < g(x) per ogni x 2 B (x0 ). Ci contraddice lipotesi che sia f (x) g (x)
in un intorno Br (x0 ) di x0 .
(ii) Se valesse f (x) g(x) per ogni intorno di x0 , allora per il punto (i) si avrebbe
L H.

Si osservi che nella (i) continua a valere L H anche quando si ha la disuguaglianza


stretta f (x) > g (x). Per esempio, se f (x) = 1=x e g (x) = 0, si ha L = H = 0 sebbene
f (x) > g (x) per ogni x > 0.
12.5. ALGEBRA DEI LIMITI 359

12.5 Algebra dei limiti


Il prossimo risultato riguarda il comportamento dei limiti rispetto alle operazioni fon-
damentali. la versione per le funzioni delle analoghe propriet delle successioni
viste nella Proposizione 112. Un risultato analogo, omesso per brevit, vale per la
Proposizione 113.

Proposizione 170 Date due funzioni f; g : A Rn ! R e un punto di accumulazione


x0 2 Rn di A, supponiamo che limx!x0 f (x) = L 2 R e limx!x0 g (x) = M 2 R.
Allora:

(i) limx!x0 (f + g) (x) = L + M , purch L + M non sia una forma di indetermi-


nazione (1.22);
(ii) limx!x0 (f g) (x) = LM , purch LM non sia una forma di indeterminazione
(1.23);
(iii) limx!x0 (f =g) (x) = L=M purch M 6= 0 e g (x) 6= 0 in ogni x 6= x0 , e L=M non
sia una forma di indeterminazione (1.24).

Dim Mostriamo solo la (i), lasciando al lettore lanaloga dimostrazione degli altri
punti. Sia fxn g una successione in A, con xn 6= x0 per ogni n 1, tale che xn ! x0 .
Per la Proposizione 165, f (xn ) ! L e g (xn ) ! M . Supponiamo che L + M non sia
una forma di indeterminazione. Per la Proposizione 112, (f + g) (xn ) ! L + M , e
quindi, dalla Proposizione 165 segue che limx!x0 (f + g) (x) = L + M .

Esempio 198 Siano f; g : R f0g ! R date da f (x) = sin x=x e g (x) = 1= jxj. Si
ha limx!0 sin x=x = 1 e limx!0 1= jxj = +1 e quindi
sin x 1
lim + = 1 + 1 = +1
x!0 x jxj
Se, invece, g (x) = ex , si ha limx!0 (sin x=x + ex ) = 1 + 1 = 2. N

12.5.1 Forme di indeterminazione


Lalgebra dei limiti presenta forme di indeterminazione analoghe a quelle viste per le
successioni. Vediamole in breve.

Forma di indeterminazione 1 1
Cominciamo con la forma di indeterminazione 1 1. Per esempio, il limite limx!0 (f + g) (x)
della somma delle funzioni f; g : R f0g ! R date da f (x) = 1=x2 e g (x) = 1=x4
ricade sotto questa forma di indeterminazione. Svolgendo i conti si ha
1 1 1 1
(f + g) (x) = = 1
x2 x4 x2 x2
360 CAPITOLO 12. LIMITI DI FUNZIONI

e quindi
1 1
lim (f + g) (x) = lim lim 1 = 1;
x!0 x!0 x2 x!0 x2
poich (+1) ( 1) non una forma di indeterminazione. Scambiando i segni
tra queste due funzioni, ossia ponendo f (x) = 1=x2 e g (x) = 1=x4 , si ha di
nuovo una forma di indeterminazione 1 1 in x0 = 0, ma questa volta risul-
ta limx!0 (f + g) (x) = +1. Com del tutto ovvio, anche per il caso di funzioni
le forme di indeterminazione possono quindi dare risultati completamente diversi e
devono essere risolte caso per caso.
Da ultimo si noti che tali f e g danno luogo a una forma di indeterminazione
in x0 = 0, ma non in x0 6= 0. Quindi, cruciale specicare il punto x0 che si sta
considerando.

Forma di indeterminazione 0 1
Per esempio, siano f; g : R ! R date da f (x) = (x 3)2 e g (x) = 1= (x 3)4 . Il
limite limx!3 (f g) (x) ricade sotto questa forma di indeterminazione. Si ha per
1 1
lim (f g) (x) = lim (x 3)2 4 = lim = +1
x!3 x!3 (x 3) x!3 (x 3)2

Daltra parte, considerando f (x) = 1= (x 3)2 e g (x) = (x 3)4 , si ha


1
lim (f g) (x) = lim (x 3)4 2 = lim (x 3)2 = 0
x!3 x!3 (x 3) x!3

Anche ora, solo il calcolo diretto del limite pu stabilirne il valore del limite.

Forme di indeterminazione 1=1 e 0=0


Per esempio, siano f; g : R ! R date da f (x) = 5 x e g (x) = x2 25. Il limite del
loro quoziente per x ! 5 ha la forma 0=0, ma

f 5 x 5 x 1 1
lim (x) = lim = lim = lim =
x!5 g x!5 x2 25 x!5 (x 5)(x + 5) x!5 x + 5 10

Daltra parte, prendendo f; g : R ! R date da f (x) = x2 e g (x) = x, per x ! +1 si


ha una forma del tipo 1=1 e

f x2
(x) = lim = lim x = +1
g x!+1 x x!+1

mentre per x ! 1 si ha ancora una forma del tipo 1=1 e

f x2
lim (x) = lim = lim x = 1
x! 1 g x! 1 x x! 1
12.6. LIMITI ELEMENTARI E LIMITI NOTEVOLI 361

con risultato di segno opposto nei due casi: di nuovo, non resta che il calcolo diretto
del limite.

Per le funzioni f e g appena viste, nel punto x0 = 0 si ha la forma di indetermi-


nazione 0=0, ma
f x2
lim (x) = lim = lim x = 0
x!0 g x!0 x x!0

mentre, ponendo g (x) = x4 , si ha ancora una forma del tipo 0=0 e


f x2 1
lim (x) = lim
= lim 2 = +1
x!0 g x!0 x4 x!0 x

p
Daltra parte, prendendo f : R+ ! R data da f (x) = x + x 2 e g : R f1g ! R
data da g (x) = x 1, si ha
p p p
f x+ x 2 x 1+ x 1 x 1
lim (x) = lim = lim = lim 1 +
x!1 g x!1 x 1 x!1 x 1 x!1 x 1
p
x 1 1 1 3
= 1 + lim p p = 1 + lim p =1+ =
x!1 ( x 1) ( x + 1) x!1 x+1 2 2
Chiudiamo con due osservazioni.

Come per le successioni, anche per le funzioni le varie forme di indeterminazione


si possono ricondurre luna allaltra.
Anche nel caso di funzioni si pu riassumere quanto nora visto con tabelle del
tutto identiche a quelle viste nella Sezione 9.8.4 e alle quali rinviamo.

12.6 Limiti elementari e limiti notevoli


12.6.1 Limiti elementari
Usando le denizioni viste nella sezione precedente, calcoliamo alcuni limiti elemen-
tari. Altri limiti signicativi, che richiedono la dimostrazione preliminare di alcune
propriet, saranno considerati nella Sezione 12.6.
Il prossimo esempio, che sfrutta propriet elementari dei limiti, si propone di fornire
i limiti di potenze, funzioni iperboliche, esponenziali, logaritmiche e trigonometriche.

Esempio 199 (i) Sia f : R ! R data da f (x) = xn con n 1. Per ogni x0 2 R, per
le propriet elementari dei limiti, si ha

lim xn = xn0
x!x0

Inoltre, limx! 1 xn = +1 se n pari, mentre limx!+1 xn = +1 e limx! 1 xn = 1


se n dispari.
362 CAPITOLO 12. LIMITI DI FUNZIONI

(ii) Sia f : R f0g ! R data da f (x) = 1=xn per n 1. Per ogni 0 6= x0 2 R, si ha


1
lim f (x) =
x!x0 xn0
Inoltre, limx! 1 1=xn = 0+ se n pari, mentre limx!+1 1=xn = 0+ e limx! 1 xn =
0 se n dispari. Inne, limx!0+ 1=xn = +1 e limx!0 1=xn = 1 se n dispari,
mentre limx!0+ 1=xn = limx!0 1=xn = +1 se n pari.
x
(iii) Sia f : R ! R data da f (x) = , con > 0. Per ogni x0 2 R, si ha
limx!x0 x = x0 . Inoltre,
8 8
< 0 se > 1 < +1 se >1
x x
lim = 1 se = 1 e lim = 1 se =1
x! 1 : x!+1 :
+1 se < 1 0 se <1

(iv) Sia f : R++ ! R data da f (x) = loga x, con a > 0; a 6= 1. Per ogni x0 > 0, si
ha limx!x0 loga x = loga x0 . Inoltre,

1 se a > 1 +1 se a > 1
lim+ loga x = e lim loga x =
x!0 +1 se a < 1 x!+1 1 se a < 1

(v) Siano f; g : R ! R date da f (x) = sin x e g (x) = cos x. Per ogni x0 2 R,


si ha limx!x0 sin x = sin x0 e limx!x0 cos x = cos x0 . I limiti limx! 1 sin x e
limx! 1 cos x non esistono. N

12.6.2 Limiti notevoli


Grazie alle denizioni e ai limiti elementari, possiamo ora calcolare alcuni limiti par-
ticolarmente signicativi e non banali.
Avevamo gi incontrato il primo limite notevole (12.26) nellintroduzione al pre-
sente capitolo.

Proposizione 171 Siano f; g : R+ ! R date da f (x) = sin x=x e g (x) = (cos x 1) =x.
Allora,
sin x
lim =1 (12.26)
x!0 x
e
1 cos x 1 cos x 1
lim = 0 ; lim = (12.27)
x!0 x x!0 x2 2
Dim. facile vedere gracamente che 0 < sin x < x < tan x per x 2 (0; =2) e che
tan x < x < sin x < 0 per x 2 ( =2; 0). Quindi, dividendo tutti i termini per sin x; e
osservando che sin x > 0 quando x 2 (0; =2) e sin x < 0 quando x 2 ( =2; 0), si ha
in tutti i casi:
x 1
1< <
sin x cos x
12.6. LIMITI ELEMENTARI E LIMITI NOTEVOLI 363

Il primo limite discende allora dal Teorema del confronto.


Per il terzo, basta osservare che
1 cos x 1 cos x 1 + cos x 1 cos2 x sin2 x 1
2
= 2
= 2
= 2
x x 1 + cos x x (1 + cos x) x 1 + cos x
e che, per x ! 0, il primo fattore tende a 1 mentre il secondo tende a 1=2.
Il secondo consegue immediatamente dal terzo:
1 cos x 1 cos x 1
=x 2
!0 =0
x x 2

Dalle analoghe proposizioni viste a proposito delle successioni si deducono facil-


mente (le dimostrazioni sono sostanzialmente le stesse) le seguenti:
(i) Se f (x) ! 1 per x ! x0 , allora
f (x)
k
lim 1+ = ek
x!x0 f (x)
In particolare
f (x) x
1 1
lim 1+ =e ; lim 1+ =e
x!x0 f (x) x! 1 x

(ii) Siano a > 0 e f (x) ! 0 per x ! x0 . Risulta allora


af (x) 1
lim = log a
x!x0 f (x)
In particolare
ax 1
lim = log a (12.28)
x!0 x
che, quando a = e, diventa
ex 1
lim =1
x!0 x
(iii) Siano 0 < a 6= 1 e f (x) ! 0 per x ! x0 . Risulta allora
loga (1 + f (x)) 1
lim =
x!x0 f (x) log a
In particolare
loga (1 + x) 1
lim =
x!0 x log a
che, quando a = e, diventa
ln(1 + x)
lim =1
x!0 x
364 CAPITOLO 12. LIMITI DI FUNZIONI

(iv) Se f (x) ! 0 per x ! x0 , si ha


(1 + f (x)) 1
lim =
x!x0 f (x)
In particolare
(1 + x) 1
lim =
x!0 x

12.7 Ordini di convergenza e di divergenza


Come le successioni, anche per le funzioni accade che alcune tendano al proprio limite
pi velocementedi altre.
Per semplicit ci limitiamo a funzioni scalari per le quali valgono tutte le conclusioni
alle quali siamo giunti per le successioni. Diamo comunque lanaloga della Denizione
68. Si noti limportanza della clausola per x ! x0 , che lunica vera novit rispetto
al caso di successioni, in cui ci non era necessario perch si considerava lunico limite
per n ! +1. In altre parole, la clausola x ! x0 sostituisce la clausola n ! +1
usata nel confronto asintotico delle successioni.

Denizione 93 Date due funzioni f; g : A R ! R, sia x0 2 R un punto di


accumulazione di A per il quale esista un intorno B" (x0 ) tale che g (x) 6= 0 per ogni
x 2 A \ B" (x0 ).

(i) Se
f (x)
lim =0
x!x0 g (x)
si dice che f trascurabile rispetto a g per x ! x0 ; in simboli

f = o (g) per x ! x0

(ii) Se
f (x)
lim = k 6= 0 (12.29)
x!x0 g (x)
si dice che f confrontabile con g per x ! x0 ; in simboli

f g per x ! x0

(iii) In particolare, se
f (x)
lim =1
x!x0 g (x)
si dice che f e g sono asintotiche per x ! x0 e si scrive

f (x) g (x) per x ! x0


12.7. ORDINI DI CONVERGENZA E DI DIVERGENZA 365

facile vedere come anche per le funzioni valgano per e per le stesse propriet
viste nella Sezione 9.12 per le successioni:

(i) le relazioni di confrontabilit e di asintotico sono simmetriche e transitive;

(ii) la relazione di trascurabilit transitiva;

(iii) se i limiti limx!x0 f (x) e limx!x0 g (x) sono entrambi niti e non nulli, allora
f g per x ! x0 ;

(iv) se limx!x0 f (x) = 0 e 0 6= limx!x0 g (x) 2 R, allora f = o (g) per x ! x0 .

Consideriamo ora i casi, i pi interessanti anche per le funzioni, nei quali entrambe
le funzioni convergono a zero oppure divergono a 1. Cominciamo con la convergenza
a zero, e assumiamo che limx!x0 f (x) = limx!x0 g (x) = 0. In questo caso, intuiti-
vamente, f trascurabile rispetto a g per x ! x0 se tende a zero pi velocemente.
Siano, per esempio, x0 = 1, e f (x) = (x 1)2 e g (x) = x 1. Si ha

(x 1)2
lim = lim (x 1) ! 0
x!1 x 1 x!1

ossia f = o (g) per x0 ! 1. Daltra parte, per x ! +1, si ha


p v
x u 1
lim p = lim u t !1
x!+1 x + 1 x!+1 1 + 1
x
p p
e quindi le funzioni f (x) = x e g (x) = x + 1 sono confrontabili (anzi asintotiche)
per x ! +1.

Consideriamo due funzioni tendenti entrambe a 1 per x che tende a x0 . In


questo caso, intuitivamente, f trascurabile rispetto a g quando tende a innito pi
lentamente, ossia assume meno rapidamente valori via via pi grandi in valore assoluto.
Per esempio, se f (x) = x e g (x) = x2 , per x0 = +1, si ha
x 1
lim 2
= lim =0
x!+1 x x!+1 x

e quindi f = o (g) per x ! +1. Pure per x ! 1, si ha


x 1
lim 2
= lim =0
x! 1x x! 1 x

e quindi f = o (g) anche per x ! 1: in entrambi i casi x tende a innito pi


lentamente di x2 . Si noti che, per x ! 0, si ha invece limx!0 x2 = limx!0 x = 0 e
x2
lim = lim x = 0
x!0 x x!0
366 CAPITOLO 12. LIMITI DI FUNZIONI

e quindi g = o (f ) per x ! 0.

Anche per funzioni il signicato di trascurabilit deve essere precisato a seconda che
si consideri la convergenza a zero oppure la divergenza allinnito. Inoltre, cruciale
il punto x0 che si considera, e ci rappresenta lunica novit signicativa rispetto a
quanto si era visto per le successioni.

Vediamo alcuni classici esempi di funzioni con diversa velocit di divergenza.

Proposizione 172 Se k; h > 0, > 1 e a > 1, si ha

(i) xk = o ( x
) per x ! +1, ossia

xk
lim x
=0
x!+1

(ii) xh = o xk per x ! +1 se h < k;

(iii) loga x = o xk per x ! +1, ossia

loga x
lim =0
x!+1 xk

Si noti che per la propriet transitiva della relazione di trascurabilit, da (i) e (ii)
segue che
loga x = o ( x ) per x ! +1
Dim. Per tutte e tre le funzioni, denite da x , xk , loga x, risulta f (n 1) f (x)
f (n) dove n = [x] la parte intera di x: tali successioni sono dunque crescenti. Basta
poi utilizzare la denizione successionale di limite di una funzione e utilizzare il criterio
del confronto.

NB. Aermare che una funzione un o (1) per x ! x0 signica semplicemente che
essa tende a 0: infatti, dire che f (x) = o (1) signica che f (x) =1 = f (x) ! 0. O

12.7.1 Equivalenza asintotica


Lequivalenza asintotica per funzioni analoga a quella vista per le successioni. In
particolare, vedremo che nel calcolo dei limiti si possono sostituire funzioni tra loro
asintotiche, il che spesso permette di semplicare in modo sostanziale tale calcolo.
Lo svolgimento di questo argomento parallelo a quello visto per successioni nella
Sezione 9.12.1. Tale parallelismo, e linevitabile ripetitivit che comporta, non deve far
perdere di vista limportanza di quanto ora vedremo. In ogni caso, per limitare le ripe-
tizioni, ometteremo alcuni dettagli e commenti, nonch le dimostrazioni (rimandando
il lettore alla Sezione 9.12.1).
12.7. ORDINI DI CONVERGENZA E DI DIVERGENZA 367

Si cominci con losservare che f (x) g (x) per x ! x0 implica, per dato L 2 R,

lim f (x) = L() lim g (x) = L


x!x0 x!x0

cio due funzioni asintotiche per x ! x0 condividono lo stesso limite per x ! x0 . In


particolare, vale la seguente versione per funzioni del Lemma 121.

Lemma 173 Siano f (x) g (x) e h (x) l (x) per x ! x0 . Allora:

(i) f (x) + h (x) g (x) + l (x) per x ! x0 , purch esista k > 0 e un intorno B" (x0 )
di x0 tale che
g (x)
k (12.30)
g (x) + l (x)
per ogni x 2 B" (x0 );

(ii) f (x) h (x) g (x) l (x) per x ! x0 ;

(iii) f (x) =h (x) g (x) =l (x) per x ! x0 , purch h (x) 6= 0 e l(x) 6= 0 in ogni punto
x 6= x0 di un intorno B" (x0 ).

Diamo ora lanalogo dellimportante Lemma 122,

Lemma 174 Si ha

f (x) f (x) + o (f (x)) per x ! x0 (12.31)

Dunque,
lim f (x) = L() lim (f (x) + o (f (x))) = L
x!x0 x!x0

Ci che trascurabile rispetto a f per x ! x0 , ossia ci che o (f (x)) per x ! x0 ,


asintoticamente irrilevante e pu essere trascurato. Grazie al Lemma 173, si ha quindi:

f (x) + o (f (x)) + g (x) + o (g (x)) f (x) + g (x) per x ! x0 (12.32)

purch valga la condizione (12.30), e

(f (x) + o (f (x))) (g (x) + o (g (x))) f (x) g (x) per x ! x0 (12.33)

nonch
f (x) + o (f (x)) f (x)
per x ! x0 (12.34)
g (x) + o (g (x)) g (x)
Vediamo alcuni esempi.
368 CAPITOLO 12. LIMITI DI FUNZIONI

Esempio 200 Consideriamo il limite


p p3 1 2
2 x + 5 x2 + x 2x 2 + 5x 3 + x
lim p = lim 3
x!+1 3 + x3 + 3x x!+1 3 + x 2 + 3x

3
e poniamo f (x) = x e g (x) = x 2 . Per x ! +1 si ha
1 2
2x 2 + 5x 3 = o (f ) e 3 + 3x = o (g)

La (12.34) implica quindi


1 2
2x 2 + 5x 3 + x x 1
3 = p ! 0 per x ! +1
3
3 + x + 3x2 x 2 x
N

Esempio 201 Consideriamo il limite


1
x2
+ x24 + e1x x 2 + 2x 4 + e x
lim = lim
x!+1 14 + 18 + 310 x!+1 x 4 + x 8 + 3x 10
x x x

Per x ! +1, si ha x 8 + 3x 10 = o (x 4 ) e, per la Proposizione 172-(i), e x


+ 2x 4
=
o (x 2 ). La (12.34) implica quindi

x 2 + 2x 4 + e x
x 2
= x2 ! +1 per x ! +1
x 4 + x 8 + 3x 10 x 4

Esempio 202 Consideriamo il limite


1 cos x
lim .
x!0 sin2 x + x3

Applicando prima la (12.34) e poi il lemma 173 punto (iii), si ottiene:


1 cos x 1 cos x 1 cos x 1
! per x ! 0
sin2 x + x3 sin2 x x 2 2
N

12.7.2 Terminologia
Anche per le funzioni, per il confronto sia di funzioni entrambe convergenti a zero sia
di funzioni entrambi tendenti a 1, vi una terminologia specica. In particolare,

(i) una funzione f tale che limx!x0 f (x) = 0 si dice innitesima (o innitesimo)
per x ! x0 ;
12.7. ORDINI DI CONVERGENZA E DI DIVERGENZA 369

(ii) una funzione f tale che limx!x0 f (x) = 1 si dice innita (o innito) per
x ! x0 ;
(iii) se due funzioni f e g sono entrambe innitesime in x0 e tali che f = o (g) per
x ! x0 , la funzione f detta innitesima di ordine superiore in x0 rispetto a g;
(iv) se due funzioni f e g sono entrambe innite in x0 e tali che f = o (g) per x ! x0 ,
la funzione f detta innita di ordine inferiore rispetto a g.
Una funzione quindi innitesima di ordine superiore a unaltra se tende a zero
pi velocemente, mentre innita di grado inferiore se tende a innito pi lentamente.
Esempio 203 (i) Le funzioni denite da (x x0 )a sono innitesime per x ! x+ 0
quando a > 0 e innite quando a < 0.
(ii) Le funzioni denite da x sono innite per x ! +1 e innitesime per x ! 1
quando > 1 e viceversa quando 0 < < 1. H

12.7.3 Il solito bestiario


Riproponiamo i risultati, gi segnalati per le successioni, relativi al confronto tra
funzioni esponenziali, x , potenza, xk , e logaritmiche, logh x. Per
x ! +1
esse sono innite quando > 1, k > 0 e h > 0 e innitesime quando 0 < < 1, k < 0
e h < 0.
(i) Se > > 0, si ha x
= o( x
): infatti x
= x
= ( = )x ! 0.
(ii) xk = o ( x ) per ogni > 1 e k > 0, come gi provato col Criterio del rapporto.
Se invece 0 < < 1 e k > 0, si ha x = o xk .
(iii) Se k1 > k2 > 0, si ha xk2 = o xk1 : infatti xk2 =xk1 = xk2 k1
! 0.

(iv) logh x = o xk .

(v) Se h1 > h2 , si ha logh2 x = o logh1 x : infatti


logh2 x 1
h1
= h1 h2
!0
log x log x
Possiamo ancora aggiungere che:
(vi) x
= o (xx ) per ogni > 0: infatti x
=xx = ( =x)x ! 0.
I precedenti risultati si adattano facilmente al caso nel quale in luogo di x si abbia
una funzione f (x) ! +1 per x ! x0 . Inoltre, tali risultati si possono organizzare
in scale di inniti e innitesimi, in analogia con quanto visto per le successioni. Per
brevit omettiamo i dettagli.
370 CAPITOLO 12. LIMITI DI FUNZIONI
Capitolo 13

Funzioni continue

Intuitivamente, una funzione scalare continua quando la relazione tra la variabile


indipendente x e la variabile dipendente y regolare, senza strappi, cos che il
graco di una funzione continua si possa tracciare senza mai dover staccare la penna
dal foglio.
Ci signica che una funzione continua in un punto x0 del dominio se vi coerenza
tra il comportamento verso x0 della funzione e il valore f (x0 ) che essa assume in x0 ,
ossia tra il limite limx!x0 f (x) e limmagine f (x0 ) del punto.
Denizione 94 Una funzione f : A Rn ! R si dice continua in un punto x0 2
0
A \ A se
lim f (x) = f (x0 ) (13.1)
x!x0
Si conviene che f sia continua in ogni punto isolato di A.
Si noti come si sia richiesto che x0 appartenga al dominio A. Infatti, la continuit
una propriet di regolarit della funzione nei vari punti del suo dominio, e non ha
quindi alcun senso considerare punti dove la funzione non denita. Si ricordi inoltre
che A \ A0 linsieme dei punti di accumulazione di A e che
A (A \ A0 )
linsieme dei punti isolati di A. La denizione distingue tra i punti di A che sono
di accumulazione, per i quali ha senso parlare di limiti, e gli isolati. Per questi ul-
timi la nozione di continuit vacua, non essendoci alcun comportamento limite di
cui richiedere la coerenza. In quanto tale, non ha senso parlare di comportamento
tendenziale della funzione verso x0 , tant che la nozione di limite non stata data
per i punti isolati. La nozione di continuit quindi svuotata di contenuto nei punti
isolati, ma, quando si enunciano risultati sulla continuit, molto comodo assumere
che una funzione sia continua nei punti isolati del proprio dominio. Per convenzione,
si assume quindi che ogni funzione sia continua nei punti isolati. A titolo di esempio,
consideriamo la funzione f : R+ [ f 1g ! R data da
p
x per x 0
f (x) =
1 per x = 1

371
372 CAPITOLO 13. FUNZIONI CONTINUE

Qui x0 = 1 punto isolato nel dominio. S ha quindi che f continua sul suo dominio.

Decisamente pi importante il caso x0 2 A \ A0 , cio x0 punto daccumulazione.


In tal caso, la condizione (13.1) richiede la coerenza tra il comportamento tendenziale
della funzione verso x0 e il valore f (x0 ) che essa assume in x0 . Come avevamo visto
nel capitolo precedente, in generale tale coerenza non sussiste. Per esempio, avevamo
considerato la funzione f : R ! R data da
8
< x per x < 1
f (x) = 2 per x = 1 (13.2)
:
1 per x > 1
Per essa limx!1 f (x) = 1 6= f (1) perch in x0 = 1 c un salto. La funzione non
quindi continua nel punto x0 = 1 perch in esso non v coerenza tra comportamento
tendenziale e immagine. Daltra parte, la funzione continua in tutti gli altri punti
del suo dominio: immediato vericare infatti che limx!x0 f (x0 ) = f (x0 ) per ogni
x0 6= 1, e quindi la funzione non presenta altri salti oltre a quello in x0 = 1.

Una funzione continua in tutti i punti di un sottoinsieme C del dominio A si dice


continua su C. Per esempio, la funzione denita dalla (13.2) non continua su R ma
continua su R f1g. Quando la funzione continua in tutti i punti del proprio
dominio, si dice continua, senza ulteriori specicazioni. Per esempio, la funzione sin x
continua.

Vediamo ora unimportante caratterizzazione della continuit tramite successioni,


basata sulla Proposizione1 165. Si noti come essa non distingua tra punti x0 isolati e
di accumulazione.

Proposizione 175 Una funzione f : A Rn ! R continua in un punto x0 di A se


e solo se f (xn ) ! f (x0 ) per ogni successione fxn g di punti di A tale che xn ! x0 .

Dim. Il risultato segue immediatamente dalla Proposizione 165, una volta che si sia
osservato che, quando x0 un punto isolato di A, lunica successione contenuta in A
che tende a x0 costante: fx0 ; x0 ; g.

Vediamo alcuni esempi. Cominciamo con losservare che le funzioni elementari sono
continue.

Esempio 204 (i) Sia f : R++ ! R data da f (x) = log x. Poich limx!x0 log x =
log x0 per ogni x0 > 0, la funzione continua.
x x x0
(ii) Sia f : R ! R data da f (x) = , con > 0. Poich limx!x0 = per ogni
x0 2 R, la funzione continua.
1
Osserviamo che la richiesta xn 6= x0 della Proposizione 165 qui non compare poich x0 2 A:
373

(iii) Siano f; g : R ! R date da f (x) = sin x e g (x) = cos x. Poich limx!x0 sin x =
sin x0 e limx!x0 cos x = cos x0 , entrambe le funzioni sono continue. N

Vediamo ora alcuni esempi di discontinuit.

Esempio 205 La funzione f : R ! R data da


8
< 1 se x 6= 0
f (x) = x (13.3)
:
0 se x = 0

non continua in x0 = 0, e quindi su R, ma lo su R f0g. N

Esempio 206 La funzione f : R ! R data da


8
< 1 se x 6= 0
f (x) = x2 (13.4)
:
0 se x = 0

non continua in x0 = 0, e quindi su R, ma lo su R f0g. N

Esempio 207 La funzione f : R ! R data da


(
2 se x > 1
f (x) = (13.5)
x se x 1

non continua in x0 = 1, e quindi su R, ma lo sia su ( 1; 1] sia su (1; +1). N

Esempio 208 La funzione di Dirichlet 12.2 non continua in alcun punto del proprio
dominio: come abbiamo visto nellEsempio 187, limx!x0 f (x) non esiste per alcun
x0 2 R. N

Vediamo ora alcune funzioni di pi variabili.


P
Esempio 209 (i) Sia f : Rn ! R data da f (x) = 1 + ni=1 xi . Procedendo come
nellEsempio 194, si pu vericare che limx!x0 f (x) = f (x0 ) per ogni x0 2 Rn . La
funzione quindi continua.
(ii) La funzione f (x1 ; x2 ) = x21 + 1=x2 continua: essa infatti continua in ogni
punto del proprio dominio A = R2 fx = (x1 ; x2 ) 2 R2 : x2 = 0g. N

Esempio 210 Consideriamo la funzione f : R ! R data da


(
2x + b se x 2
f (x) = (13.6)
x2 + 4 se x > 2
374 CAPITOLO 13. FUNZIONI CONTINUE

e chiediamoci per quali valori di b essa continua in x0 = 2 (e quindi in tutto il suo


dominio, com immediato vericare). Per rispondere occorre trovare il valore di b (se
esiste) per il quale
lim f (x) = lim+ f (x) = f (2)
x!2 x!2

Si ha limx!2 f (x) = 4 + b = f (2) e limx!2+ f (x) = 0, per cui f continua in x0 = 2


se e solo se 4 + b = 0, ossia quando b = 4. Quindi, per b = 4 la funzione (13.6)
continua su R, mentre per b 6= 4 essa continua su R f2g. N

Si noti che quando f continua in x0 , possiamo scrivere e cacemente

lim f (x) = f (x0 ) = f lim x


x!x0 x!x0

sicch f e lim risultano scambiabili. Tale scambiabilit lessenza del concetto di


continuit.

OfB. In modo ingenuo di potrebbe ritenere che una funzione come f (x) = 1=x abbia
una (vistosissima) discontinuit in x = 0. Dopotutto fa un saltonepassando da 1
a +1.

10
y
8

0
O x
-2

-4

-6

-8

-10
-2 -1 0 1 2 3 4

Funzione x1 :

In modo analogo si potrebbe ritenere per continua una funzione come g (x) = log x
perch non presenta alcun salto.
13.1. DISCONTINUIT 375

5
y
4

0
O x
-1

-2
-3 -2 -1 0 1 2 3 4

Funzione lg x:

Se esaminiamo le due funzioni con un minimo di attenzione ci accorgiamo che 1=x si


macchia del peccatuccio di non essere denita per x = 0 mentre log x del peccato ben
pi grave di non essere denita n per x = 0 n per x < 0 e quindi dovrebbe essere
ritenuta ancor pi discontinuadi 1=x.
La verit che, nei punti nei quali una funzione non denita, del tutto pretes-
tuoso porsi il problema della continuit2 ; essa deve riferirsi ai soli punti nei quali le
funzioni sono denite e, in essi, entrambe le funzioni 1=x e log x sono continue. H

OfB. La denizione di continuit si pu riformulare, ripescando il concetto di limite,


come segue. Una funzione f : A Rn ! R si dice continua in un punto x0 2 A se,
per ogni intorno V di f (x0 ), esiste un intorno U di x0 tale che f (U \ A) V .
Si vede subito che essa identica a quella di limite avendo semplicemente soppresso
la precisazione x 6= x0 . Si badi che, con tale soppressione, il limite L non pu che
coincidere con f (x0 ). Se cos non fosse, la denizione sarebbe certamente violata:
detta " = jL f (x0 ) j > 0 la distanza tra limite e valore della funzione, per ogni
intorno V di L di raggio inferiore ad " non vi potrebbe essere un intorno U di x0 tale
che f (U \ A) V perch almeno f (x0 ) ne cadrebbe fuori. H

13.1 Discontinuit
Come emerge dagli esempi appena visti, vi sono diversi tipi di discontinuit:

(i) f non continua in x0 perch limx!x0 f (x) esiste, ma diverso da f (x0 );


2
Sarebbe come chiedersi se i maiali verdi a pallini gialli sono capaci di volare. I maiali verdi a
pallini gialli non esistono e perci la domanda priva di senso.
376 CAPITOLO 13. FUNZIONI CONTINUE

(ii) f non continua in x0 perch i limiti unilaterali limx!x0 f (x) e limx!x+0 f (x)
esistono niti, ma sono diversi, cio limx!x0 f (x) 6= limx!x+0 f (x) (e quindi
limx!x0 f (x) non esiste);
(iii) f non continua in x0 perch i limiti unilaterali limx!x0 f (x) e limx!x+0 f (x)
sono 1 oppure non esistono.

Per esempio, la discontinuit in x0 = 1 della funzione (13.2) ricade nel caso (i)
poich limx!1 f (x) esiste ma diverso da f (1). La discontinuit in x0 = 1 della
funzione (13.5) ricade nel caso (ii) poich
lim f (x) = 1 6= lim+ f (x) = 2
x!1 x!1

Invece, la discontinuit in x0 = 0 della funzione (13.3) ricade nel caso (iii) poich
lim f (x) = 1=
6 lim+ f (x) = +1
x!0 x!0

Allo stesso modo, la discontinuit in x0 = 0 della funzione (13.4) ricade nel caso (iii)
poich
lim f (x) = lim+ f (x) = lim f (x) = +1
x!0 x!0 x!0

(il limite bilaterale qui esiste, ma innito). Anche la funzione di Dirichlet ricade, in
ogni punto x0 2 R, nel caso (iii) poich facile vedere che non esistono neanche i suoi
limiti unilaterali.

Quando la discontinuit in un punto x0 del tipo (i) si parla di discontinuit


eliminabile, mentre quando del tipo (ii) o (iii) si parla di discontinuit non eliminabile.
In particolare, la discontinuit non eliminabile (ii) detta a salto, mentre la (iii)
detta discontinuit non eliminabile essenziale. Si noti che quando una funzione f ,
in un punto x0 , ha una discontinuit non eliminabile a salto: il salto dato dalla
dierenza limx!x+0 f (x) limx!x0 f (x). Per esempio, la funzione (13.5) ha in x0 = 1
un salto pari a
lim+ f (x) lim f (x) = 2 1 = 1
x!x0 x!x0

La discontinuit non eliminabile una forma di discontinuit decisamente pi grave


di quella eliminabile. Infatti, questultima si pu eliminaremodicando la funzione
f in x0 nel seguente modo:
f (x) se x 6= x0
f~ (x) = (13.7)
limx!x0 f (x) se x = x0

La funzione f~ la versione aggiustatadella funzione f , che ne ripristina la continuit


in x0 . Per esempio, la versione aggiustata della funzione (13.2)
( (
f (x) se x 6= 1 x se x 1
f~ (x) = =
limx!x0 f (x) se x = 1 1 se x > 1
13.1. DISCONTINUIT 377

Come il lettore pu vericare facilmente, tutto ci non invece possibile in presen-


za di discontinuit non eliminabili che rappresentano discontinuit sostanziali di una
funzione.

Terminiamo con unosservazione interessante. Una funzione monotona (crescente


o decrescente) non pu avere discontinuit di tipo (i) o (iii). Infatti, supponiamo che
f sia crescente (considerazioni analoghe valgono nel caso decrescente). La crescenza
garantisce che i limiti destro e sinistro esistono, con

lim f (x) lim f (x) lim f (x) lim f (x)


x!x0 x!x+
0 x!~
x0 x+
x!~ 0

per ogni coppia di punti x0 < x~0 . Quindi, questi limiti non possono essere inniti
salvo, al pi, negli estremi inf A e sup A del dominio.
Inoltre f non pu avere nemmeno discontinuit eliminabili, perch violerebbero la
monotonia. Dunque una funzione monotona pu soltanto presentare discontinuit a
salto. Ebbene, il prossimo risultato mostra che le discontinuit a salto di una funzione
monotona possono essere al pi uninnit numerabile. La dimostrazione di questo
utile risultato si basa sul seguente lemma, di interesse indipendente.

Lemma 176 Una collezione di intervalli disgiunti di R al pi numerabile.

Dim. Siano fIj gj2J un insieme di intervalli disgiunti di R. Per la densit dei razionali,
ogni intervallo Ij contiene un razionale qj Poich gli intervalli sono disgiunti, si ha
qi 6= qj per i 6= j. Allora linsieme di razionali fqj gj2J un sottoinsieme proprio di Q
ed dunque un insieme al pi numerabile.

Osserviamo che lipotesi di non sovrapponibilit degli intervalli ineliminabile. In-


fatti, linsieme di intervalli sovrapponibili del tipo fIr = ( r; r); r 2 Rg chiaramente
non numerabile.

Proposizione 177 Una funzione monotona f pu avere al pi uninnit numerabile


di discontinuit a salto.

Dim. Una discontinuit a salto di f nel punto x0 determina un intervallo nellinsieme


Im f delimitato da limx!x0 f (x) e limx!x+0 f (x). Per la monotonia di f; gli intervalli
determinati dai salti sono disgiunti luno dallaltro. Per il lemma 176, gli intervalli, e
quindi i salti di f , sono al pi uninnit numerabile.

Osserviamo inne come lipotesi di monotonia della funzione sia indispensabile per
la numerabilit delle sue discontinuit: essa garantisce infatti la non sovrapponibilit
degli intervali in Im f determinati dai salti della funzione.
378 CAPITOLO 13. FUNZIONI CONTINUE

13.2 Operazioni e composizione


Il prossimo risultato illustra il comportamento della continuit rispetto allalgebra delle
funzioni.

Proposizione 178 Siano f; g : A R ! R continue in x0 2 A. Allora:

(i) la funzione f + g continua in x0 ;

(ii) la funzione f g continua in x0 ;

(iii) la funzione f =g continua in x0 , purch g (x0 ) 6= 0.

Dim. Mostriamo la (i), lasciando al lettore gli altri punti. Poich limx!x0 f (x) =
f (x0 ) 2 R e limx!x0 g (x) = g (x0 ) 2 R, grazie alla Proposizione 170-(i) si ha

lim (f + g) (x) = lim f (x) + lim g (x) = f (x0 ) + g (x0 ) = (f + g) (x0 )


x!x0 x!x0 x!x0

e quindi f + g continua in x0 .
2 n
Per esempio, ogni polinomio f (x) = 0 + 1x + 2x + + nx continuo.
Infatti, per ogni x0 2 R si ha
2 n
lim f (x) = lim 0 + 1x + 2x + + nx
x!x0 x!x0
2 n
= lim 0 + lim 1x + lim 2x + + lim nx
x!x0 x!x0 x!x0 x!x0
2 n
= 0 + 1 x0 + 2 x0 + + n x0 = f (x0 ) :

Vediamo ora che la continuit si preserva per composizione di funzioni.

Proposizione 179 Siano f : A Rn ! R e g : B R ! R tali che Im f B. Se


f continua in x0 2 A e g continua in f (x0 ), allora g f continua in x0 .

Dim. Sia fxn g A tale che xn ! x0 . Per la Proposizione 175, si ha f (xn ) !


f (x0 ). Poich g continua in f (x0 ), unaltra applicazione di tale proposizione porta
a g (f (xn )) ! g (f (x0 )), e quindi, sempre grazie a essa, possiamo concludere che g f
continua in x0 .

Come mostra il prossimo esempio, il risultato pu essere utile anche nel calcolo dei
limiti poich, quando valgono le sue ipotesi, possiamo scrivere

lim (g f ) (x) = g (f (x0 )) = g lim f (x) = g (f (x0 )) (13.8)


x!x0 x!x0

Se un limite riguarda la composizione di funzioni continue, la (13.8) ne rende imme-


diato il calcolo.
13.3. ZERI ED EQUILIBRI 379

Esempio 211 Sia f : R f g ! R data da f (x) = x2 = (x + ) e g : R ! R data


da g (x) = sin x. Poich g continua, per la Proposizione 179 si ha che g f continua
in ogni x 2 R f g. Losservazione utile, per esempio, per calcolare il limite

x2
lim sin
x! x+

Infatti, una volta osservato che esso si pu scrivere usando la composizione di f e g,


grazie alla (13.8) si ha

x2 2
lim sin = lim (g f ) (x) = (g f ) ( ) = sin = sin =1
x! x+ x! 2 2

Quindi, la continuit consente di calcolare i limite per sostituzione. N

13.3 Zeri ed equilibri


Le funzioni continue godono di notevoli propriet e ci le fa preferire nelle applicazioni.
In questa sezione ne studiamo alcune, con leccezione del Teorema di Weierstrass, una
notevolissima propriet delle funzioni continue, il cui studio rimandato al Capitolo
17.

13.3.1 Zeri
Il primo risultato, il Teorema degli zeri3 , molto intuitivo, ma la sua dimostrazione,
pur semplice, non banale, a riprova di come enunciati allapparenza molto intuitivi
possono anche essere di dimostrazione complessa. In eetti, lintuizione una gui-
da fondamentale nella ricerca di nuovi risultati, ma talvolta ingannevole. Non di
rado, propriet allapparenza intuitivamente ovvie si sono rivelate addirittura false.
Per questa ragione, la dimostrazione lunico criterio di validit di un risultato; lin-
tuizione, anche la pi ra nata, a un certo punto deve cedere il passo al rigore della
dimostrazione.

Teorema 180 (degli zeri) Sia f : [a; b] ! R una funzione continua. Se f (a)
f (b) 0, allora esiste c 2 [a; b] tale che f (c) = 0. Inoltre, se f strettamente
monotona, tale c unica.

Si noti che la condizione f (a) f (b) 0 equivale a richiedere che i due valori non
abbiano lo stesso segno. Il chiaro signicato intuitivo di questo teorema rivelato dalla
prossima gura
3
Il risultato anche noto sotto il nome di Teorema di Bolzano, che per primo ne diede una
dimostrazione nel 1817.
380 CAPITOLO 13. FUNZIONI CONTINUE

0.8 y

0.6

0.4

0.2

-0.2

-0.4
O a c b x
-0.6

-0.8

-1
0 0.5 1 1.5 2 2.5 3 3.5 4

Dim. Se f (a) f (b) = 0, si ha f (a) = 0, e in tal caso il risultato vero ponendo


c = a, oppure f (b) = 0, e in tal caso c = a.
Sia allora f (a) f (b) < 0: la funzione assume perci almeno un valore negativo e
almeno un valore positivo. Indichiamo con C linsieme dei valori di x 2 [a; b] tali che
f (x) < 0 e con c lestremo superiore di C. Mostriamo che f (c) = 0.
Se fosse f (c) < 0, la continuit di f implicherebbe, grazie al Teorema della perma-
nenza del segno, lesistenza di un intorno (c ; c + ) nel quale f si conserva negativa:
ma allora c + 2 C e c non potrebbe esserne lestremo superiore.
In modo analogo, se fosse f (c) > 0, sempre per la continuit di f esisterebbe un
intorno (c ; c + ) nel quale f si conserva positiva: ma allora (c ;c + ) 2= C e
ancora c non potrebbe essere lestremo superiore di C (perch in ogni intorno sinistro
dellestremo superiore devono cadere punti dellinsieme).
Inne, se f strettamente monotona, allora per ogni h > 0

f (c h) < f (c) = 0 < f (c + h)

o viceversa, e perci il punto c unico.

Una semplice applicazione del risultato riguarda le soluzioni reali di unequazione


polinomiale. Sia f : R ! R il polinomio
2 n
f (x) = 0 + 1x + 2x + + nx (13.9)

e studiamo lequazione f (x) = 0. Lequazione pu non avere soluzioni reali: per esem-
pio, lequazione f (x) = 0 con f (x) = x2 + 1. Grazie al Teorema degli zeri, abbiamo il
seguente risultato, che garantisce che ogni polinomio di grado dispari possieda sempre
almeno una soluzione reale.

Corollario 181 Se il grado del polinomio f in (13.9) dispari, esiste (almeno un


valore di) x^ 2 R tale che f (^
x) = 0.
13.3. ZERI ED EQUILIBRI 381

Dim. Supponiamo n > 0 (altrimenti, si considera f ) e sia g : R ! R data da


g (x) = 0 + 1 x + 2 x2 + + n 1 xn 1 . Si ha g (x) = o (xn ) sia per x ! +1 sia
per x ! 1. Quindi possiamo scrivere f (x) = n xn + o (xn ) sia per x ! +1 sia
per x ! 1, il che implica limx!+1 f (x) = +1 e limx! 1 f (x) = 1. Poich f
continua, esistono x1 < x2 tali che f (x1 ) < 0 < f (x2 ). La funzione f continua
sullintervallo [x1 ; x2 ], e quindi, grazie al Teorema degli zeri, esiste x^ 2 (x1 ; x2 ) tale che
f (^
x) = 0.

13.3.2 Equilibri
Il prossimo risultato unulteriore conseguenza del Teorema degli zeri, con una notev-
ole applicazione economica: lesistenza e lunicit del prezzo di equilibrio di mercato.

Proposizione 182 Siano f; g : [a; b] ! R continue. Se f (a) g (a) e f (b) g (b),


esiste c 2 [a; b] tale che
f (c) = g (c)
Se f strettamente decrescente e g strettamente crescente, tale c unica.

Dim. Sia h : [a; b] ! R denita come h (x) = f (x) g (x). Si ha

h (a) = f (a) g (a) 0 e h (b) = f (b) g (b) 0

Siccome h continua, per il Teorema degli zeri esiste c 2 [a; b] tale che h (c) = 0, ossia
f (c) = g (c).
Se f strettamente decrescente e g strettamente crescente, allora h strettamente
decrescente, e quindi, sempre per il Teorema degli zeri, c unica.

Applichiamo ora il risultato allesistenza e allunicit del prezzo di equilibrio di


mercato. Siano D : [a; b] ! R e S : [a; b] ! R le funzioni di domanda e oerta di un
bene, dove [a; b] R+ linsieme dei prezzi ai quali pu esser scambiato il bene4 . Una
coppia (p; q) 2 R2+ di prezzi e quantit si dice equilibrio del mercato se

q = D (p) = S (p) :

Un problema fondamentale lesistenza, e leventuale unicit, di tale equilibrio.


Grazie alla Proposizione 182, e quindi in ultima analisi grazie al Teorema degli zeri,
possiamo risolvere il problema in modo molto generale. Assumiamo che S (a) D (a)
e S (b) D (b), ossia quando il prezzo zero la domanda del bene maggiore della
sua oerta e il contrario vale per il prezzo massimo b. Si tratta di ipotesi del tutto
naturali che, grazie alla Proposizione 182, garantiscono che esista un prezzo p 2 [a; b]
di equilibrio, ossia tale che D (p) = S (p). La quantit di equilibrio q = D (p) = S (p),
e quindi la coppia di prezzi e quantit (p; q) 2 R2+ un equilibrio del mercato.
4
Si veda il Capitolo 10, dove lintervallo [a; b] si era indicato con [k1 ; k2 ] e dove, inter alia, avevamo
un esempio di mercato con funzioni di domanda e oerta lineari.
382 CAPITOLO 13. FUNZIONI CONTINUE

Inoltre, sempre grazie alla Proposizione 182, il mercato ha un unico equilibrio


(p; q) 2 R2+ se assumiamo, com naturale, che la funzione di domanda D sia stret-
tamente decrescente, ossia che a prezzi maggiori corrispondono minori quantit do-
mandate, e che la funzione di oerta S sia strettamente crescente, ossia che a prezzi
maggiori corrispondono maggiori quantit domandate.

Data la sua importanza, enunciamo formalmente questo fondamentale risultato di


esistenza e unicit dellequilibrio.
Proposizione 183 Siano D : [a; b] ! R e S : [a; b] ! R continue e tali che D (a)
S (a) e D (b) S (b). Allora esiste un equilibrio (p; q) 2 R2+ di mercato. Se, inoltre,
D strettamente decrescente e S strettamente crescente, tale equilibrio unico.
La prossima gura illustra gracamente il risultato, che corrisponde al classico
incrociodi domanda e oerta:

6
y
D
5

S
3

0
O b x
-1
-0.5 0 0.5 1 1.5 2

Nellanalisi di equilibrio il Teorema degli zeri spesso applicato tramite la funzione


di eccesso di domanda, ossia la funzione E : [a; b] ! R denita come
E (p) = D (p) S (p)
Se E (p) 0, al prezzo p la domanda eccede loerta, mentre si ha E (p) 0 quando
loerta eccede la domanda. Quindi, un prezzo p 2 [a; b] di equilibrio se e solo se
E (p) = 0, cio se e solo se p rende uguali domanda e oerta. Il prezzo di equilibrio p
uno zero della funzione di eccesso di domanda e le condizioni sulle funzioni D e S
enunciate nella Proposizione 183 garantiscono lesistenza e unicit di tale zero.

Unultima osservazione: il lettore pu vericare facilmente che la Proposizione


182 vale purch (i) le monotonie di f e g siano opposte: luna crescente e laltra
decrescente, (ii) almeno una di esse sia stretta. Nellenunciato abbiamo posto f stret-
tamente decrescente e g strettamente decrescente crescente sia per semplicit sia in
vista dellapplicazione allequilibrio di mercato.
13.4. TEOREMA DEI VALORI INTERMEDI 383

13.4 Teorema dei valori intermedi


Unimportante estensione del Teorema degli zeri il Teorema dei valori intermedi,
al quale dedichiamo questa sezione. Lesistenza dei minimi e massimi nellenunciato
segue dal Teorema di Weierstrass5 .

Teorema 184 (Teorema dei valori intermedi, Darboux) Sia f : [a; b] ! R con-
tinua. Posto
m = min f (x) e M = max f (x)
x2[a;b] x2[a;b]

Per qualunque valore z con


m z M
esiste c 2 [a; b] tale che f (c) = z. Se f strettamente monotona, tale c unica.

Poich minx2[a;b] f (x) = min ff (x) : x 2 [a; b]g e maxx2[a;b] f (x) = max ff (x) : x 2 [a; b]g
sono rispettivamente il valore minimo e il valore massimo tra tutti i valori che f (x) as-
sume sullintervallo [a; b], anche il Teorema dei valori intermedi ha un chiaro signicato
intuitivo, evidenziato dalla prossima gura

5
y
4
M

3
z = f(c)

1
m
0 O a x c x b x
M m

-1

-1 0 1 2 3 4 5 6

Dim. Per il Teorema di Weierstrass, la funzione f ammette massimo e minimo su


[a; b]. Siano x1; x2 2 [a; b] tali che

M = f (x1 ) e m = f (x2 )

Sia g : [a; b] ! R denita come g (x) = f (x) z. Si ha

g (x1 ) = f (x1 ) z 0 e g (x2 ) = f (x2 ) z 0


5
Studieremo il Teorema di Weierstrass nel Capitolo 17; bene leggere questa sezione dopo aver
studiato tale importante risultato.
384 CAPITOLO 13. FUNZIONI CONTINUE

Siccome f continua, anche g lo , e per il Teorema degli zeri esiste

c 2 [minfx1 ; x2 g; maxfx1 ; x2 g] [a; b]

tale che g (c) = 0, ossia esiste c 2 [a; b] tale che f (c) = z.


La funzione g strettamente monotona se e solo se f lo . Quindi, per il Teorema
degli zeri tale c unica qualora f sia strettamente monotona.

Il Teorema degli zeri un caso particolare del Teorema dei valori intermedi. Infatti,
se f (a) f (b) 0 e f continua, si ha

min f (x) 0 max f (x)


x2[a;b] x2[a;b]

e il Teorema dei valori intermedi implica lesistenza di uno zero di f in [a; b].

La continuit di f su [a; b] cruciale per il Teorema dei valori intermedi. Infatti,


si consideri per esempio la funzione sgn : [ 1; 1] ! R data da
8
< 1 se x < 0
sgn x = 0 se x = 0
:
1 se x < 0

detta funzione segno. Essa continua in tutti i punti di [ 1; 1] eccetto lorigine 0, in cui
ha una discontinuit non eliminabile a salto. Lipotesi di continuit del Teorema dei
valori intermedi non vale e in eetti la funzione presenta un notevole strappo: la sua
immagine consta dei soli tre punti f 1; 0; 1g e per ogni z 2 [ 1; 1], con z 6= 1; 0; 1,
non esiste alcun x 2 [ 1; 1] tale che sgn x = z.

13.5 Monotonia e continuit


Per funzioni continue abbiamo la seguente caratterizzazione della forte crescenza.

Proposizione 185 Una funzione continua f : A Rn ! R denita su un aperto A


fortemente crescente se e solo se

x y ) f (x) > f (y) 8x; y 2 A (13.10)

Quindi, per funzioni continue, la richiesta che f sia crescente superua nella
denizione di forte crescenza.

Dim. Il Solo sesegue dalla denizione di funzione fortemente crescente. Per il Se,
sia x y. Poich x punto interno, esiste un naturale n su cientemente grande tale
che
B 1 (x) A 8n n
n
13.6. LIMITI E CONTINUIT DELLE APPLICAZIONI 385

In particolare, per ogni n n esiste zn 2 B1=n (x) tale che zn x y, dunque anche
zn y:. Per la forte crescenza si ha f (zn ) > f (y). Poich zn ! x, la continuit
implica f (zn ) ! f (x) e quindi, per la Proposizione 102 si ha
f (x) = lim f (zn ) f (y)
n

Ci prova che f crescente.


Il prossimo esempio6 mostra che senza la continuit il risultato falso.
Esempio 212 Sia f : R2+ ! R data da
x1 x2 se x1 > 0
f (x) =
x2 se x1 = 0
Essa soddisfa la (13.10). Infatti, sia x = (x1 ; x2 ) y = (y1 ; y2 ). Se y1 > 0, si ha
f (x) = x1 x2 > y1 y2 = f (y)
poich x1 > y1 > 0 e x2 > y2 0. Se y1 = 0, si ha
f (x) = x1 x2 > 0 y2 = f (y)
poich x1 > y1 = 0 e x2 > y2 0. In entrambi i casi si ha f (x) > f (y) e quindi
vale la (13.10). Ma la funzione non crescente. Infatti, prendiamo due punti sullasse
delle ordinate, per esempio x = (0; 1) e y = (0; 0). Si ha x > y (e quindi x y) ma
f (x) = 1 < f (y) = 0. N
Senza continuit, la propriet di crescenza e la (13.10) sono quindi indipendenti:
esistono funzioni crescenti che non soddisfanno la (13.10) (basta che abbiano tratti
di costanza) e, viceversa, funzioni che soddisfanno la (13.10) che non sono crescenti
(ultimo esempio).

13.6 Limiti e continuit delle applicazioni


La nozione di continuit si estende in modo naturale alle applicazioni f : A Rn !
Rm . Per prima cosa, si osservi che esse si possono vedere come una m-pla (f1 ; :::; fm )
di funzioni di pi variabili
fi : A Rn ! R 8i = 1; :::; m
denite da:
y1 = f1 (x1 ; :::; xn )
y2 = f2 (x1 ; :::; xn )

ym = fm (x1 ; :::; xn )
Per esempio, torniamo alle applicazioni dellEsempio 76.
6
Suggerito da Simone Cerreia-Vioglio.
386 CAPITOLO 13. FUNZIONI CONTINUE

Esempio 213 (i) Se f : R2 ! R2 denita da f (x1 ; x2 ) = (x1 ; x1 x2 ) per ogni vettore


(x1 ; x2 ) 2 R2 , si ha

f1 (x1 ; x2 ) = x1
f2 (x1 ; x2 ) = x1 x2

(ii) Se f : R3 ! R2 denita da

f (x1 ; x2 ; x3 ) = 2x21 + x2 + x3 ; x1 x42 8 (x1 ; x2 ; x3 ) 2 R3

si ha

f1 (x1 ; x2 ; x3 ) = 2x21 + x2 + x3
f2 (x1 ; x2 ; x3 ) = x1 x42

La nozione di limite si estende in modo naturale alle applicazioni.

Denizione 95 Siano f : A Rn ! Rm unapplicazione e x0 2 Rn un punto di


accumulazione di A. Si scrive

lim f (x) = L 2 Rm (13.11)


x!x0

se, per ogni intorno V" (L) di L, esiste un intorno U " (x0 ) di x0 tale che

x 2 U " (x0 ) \ A e x 6= x0 =) f (x) 2 V" (L) (13.12)

Il valore L si dice limite della funzione in x0 .

Per m = 1 si ritrova la Denizione 92 di limite di funzioni di pi variabili. Si


noti che qui L un vettore di Rm e, per semplicit, non consideriamo possibili valori
estesi, cio L con una o pi coordinate che siano 1.
Anche qui unapplicazione continua in tutti i punti di un sottoinsieme C del dominio
A si dice continua su C, mentre unapplicazione continua in tutti i punti del proprio
dominio si dice continua. facile vedere che le applicazioni dellultimo esempio sono
entrambe continue.

La scrittura f = (f1 ; :::; fm ) porta alla seguente caratterizzazione della continuit,


la cui dimostrazione lasciata al lettore.

Proposizione 186 Unapplicazione f = (f1 ; :::; fm ) Rn ! Rm continua in un


punto x0 di A se le funzioni di pi variabili fi Rn ! R sono ivi continue.
13.7. CONTINUIT UNIFORME 387

La continuit di unapplicazione f si riconduce quindi a quella delle funzioni di pi


variabili fi di cui si compone.

Nella Sezione 9.13 si era visto che la convergenza di vettori equivale a quella delle
loro componenti. Ci permette (al lettore) di dimostrare il prossimo risultato che es-
tende la Proposizione 175 alle applicazioni e che conferma come la continuit, sebbene
appena caratterizzata in termini delle funzioni componenti, sia una propriet delle
applicazione nella loro interezza.

Proposizione 187 Unapplicazione f : A Rn ! Rm continua in un punto x0


di A se e solo se f (xn ) ! f (x0 ) per ogni successione fxn g di punti di A tale che
xn ! x0 .

Lenunciato identico a quello della Proposizione 175; lunica dierenza che qui
f (xn ) ! f (x0 ) indica una convergenza di vettori in Rm .

La Proposizione 187 permette di estendere alle applicazioni i risultati di continuit


stabiliti per funzioni di pi variabili, eccetto quelli che usano in modo essenziale la
struttura dordine di R (per esempio, il Teorema degli zeri). Per brevit lasciamo al
lettore tali estensioni.

13.7 Continuit uniforme


Come si visto allinizio del capitolo, la denizione di continuit la stessa di limite,
avendo soppresso in questultima la precisazione x 6= x0 , cio si ha continuit se e solo
se, per ogni " > 0, esiste " > 0 tale che

kx x0 k < " =) jf (x) f (x0 )j < "

Il valore di " , oltre che da ", dipende ovviamente anche dal punto x0 . Se dovesse
accadere che, dato " > 0, si possa scegliere lo stesso " per ogni x0 2 A (cio, ssato
"; lo stesso " potesse essere comune a tutti i punti del dominio di f ) avremmo un
concetto pi forte della continuit e che si dice continuit uniforme. Si tratta di
una notevole propriet di uniformit che permette di controllare la distanza delle
immagini jf (x) f (y)j tramite la sola distanza dei punti jx yj per ogni coppia di
punti x e y del dominio di f .

Denizione 96 Una funzione f : A Rn ! R detta uniformemente continua su


A se per ogni " > 0 esiste " > 0 tale che

kx yk < =) jf (x) f (y)j < " 8x; y 2 A


388 CAPITOLO 13. FUNZIONI CONTINUE

Il valore di " dipende quindi solo da ", e non da alcun punto.

La continuit uniforme implica la continuit, ma non vale il converso. Per esempio,


tra poco vedremo che la funzione x2 continua su R, ma non uniformemente. Limpli-
cazione inversa vale per per la fondamentale classe degli insiemi compatti (introdotti
nella Sezione 5.6).

Teorema 188 Una funzione f : A Rn ! R continua su un insieme K A


compatto se e solo se uniformemente continua su K.

Dim. Il Se ovvio perch luniforme continuit implica la continuit. Dimostriamo


il Solo se. Per semplicit, consideriamo il caso scalare n = 1 con K = [a; b]. Sia
quindi f : [a; b] ! R continua. Mostriamo che anche uniformemente continua.
Supponiamo, per contra, che esista " > 0 tale che esistano due successioni fxn g e fyn g
in [a; b] tali che xn yn ! 0 e

f (xn ) f (yn ) " 8n 1 (13.13)

Poich le successioni fxn g e fyn g sono limitate, per il Teorema di Bolzano-Weierstrass


esistono due sottosuccessioni convergenti fxnk g e fynk g, ossia esistono x; y 2 [a; b] tali
che xnk ! x e ynk ! y. Siccome xn yn ! 0, si ha xnk ynk ! 0, e quindi, per
lunicit del limite, x y = 0.
Siccome f continua, f (xnk ) ! f (x) e f (ynk ) ! f (y), ossia f (xnk ) f (ynk ) !
f (x) f (y) = 0 e ci contraddice la (13.13). Quindi, f uniformemente continua.

Il Teorema 188 non vale senza la compattezza di K. Diamo a tal proposito due
controesempi: nel primo consideriamo un insieme chiuso ma non limitato (la retta
reale), mentre nel secondo consideriamo un insieme limitato ma non chiuso (lintervallo
aperto (0; 1)).

Esempio 214 La funzione f : R ! R data da f (x) = x2 non uniformemente


continua su R. Supponiamo per contra che f sia uniformemente continua su R. Posto
" = 1 esiste " > 0 tale che

jx yj < " =) x2 y2 < 1 8x; y 2 R (13.14)

Se prendiamo xn = n e yn = n + " =2, si ha jxn yn j < " per ogni n 1, ma


limn jx2n yn2 j = +1, il che contraddice la (13.14). N

Bench f (x) = x2 non sia uniformemente continua su R, se ne consideriamo la


restrizione su qualsiasi intervallo [a; b] essa uniformemente continua grazie al Teorema
188.
13.7. CONTINUIT UNIFORME 389

Esempio 215 La funzione f : (0; 1) ! R data da f (x) = 1=x continua, ma non


uniformemente, su (0; 1). Infatti, supponiamo per contra che f sia uniformemente
continua. Posto " = 1 esiste " > 0 tale che

1 1
jx yj < " =) <1 8x; y 2 (0; 1) (13.15)
x y

Siano x < y tali che jx yj < ", cio x < y < x + ". Si ha

" " "


1> > = (13.16)
xy x(x + ") x2 + "x

Poich
"
lim = +1
x!0 x2 + "x

esiste x 2 (0; 1) tale che


"
1
x2 + "x

il che contraddice la (13.16). Quindi, la funzione 1=x non uniformemente continua


su (0; 1). N
390 CAPITOLO 13. FUNZIONI CONTINUE
Parte III

Analisi lineare e non lineare

391
Capitolo 14

Funzioni e applicazioni lineari

Nel Capitolo 3 abbiamo studiato in dettaglio la struttura lineare di Rn . In questo


capitolo consideriamo le funzioni lineari, unimportante famiglia di funzioni denite su
Rn e che ne preserva la struttura lineare.

14.1 Funzioni lineari


14.1.1 Denizione e prime propriet
Denizione 97 Una funzione f : Rn ! R di n variabili detta lineare1 se
f ( x + y) = f (x) + f (y) (14.1)
per ogni x; y 2 Rn ed ogni ; 2 R.
Nel seguito indicheremo spesso con la lettera L una funzione lineare.
Esempio 216 Le funzioni scalari f : R ! R con f (x) = mx con m 2 R sono lineari.
Geometricamente esse sono le rette passanti per lorigine. N
Esempio 217 Dati duePvettori x; y 2 Rn , il loro prodotto scalare (o interno) x y
denito come x y = ni=1 xi yi . Usando i prodotti scalari facile denire funzioni
lineari. Infatti, dato un vettore 2 Rn , sia L : Rn ! R denita come
L (x) = x 8x 2 Rn :
Tale L lineare. Verichiamolo:
X
n
L ( x + y) = ( x + y) = i ( xi + yi )
i=1
X
n X
n
= i xi + i yi = ( x) + ( y)
i=1 i=1
= L (x) + L (y)
1
Esse sono talvolta dette funzionali lineari.

393
394 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

per ogni x; y 2 Rn ed ogni ; 2 R. N

Diamo ora unutile caratterizzazione: essa mostra come una funzione di pi variabili
sia lineare se e solo se rispetta le operazioni di somma e moltiplicazione scalare, cio
se preserva la struttura lineare di Rn .

Proposizione 189 Una funzione f : Rn ! R lineare se e solo se, per ogni x; y 2 Rn


e ogni 2 R,

(i) f (x + y) = f (x) + f (y)

(ii) f ( x) = f (x).

Dim. Se. Supponiamo che valgano la (i) e (ii). Allora

f ( x + y) = f ( x) + f ( y) = f (x) + f (y)

e quindi f una funzione lineare.


Solo se. Sia f una funzione lineare. Se in (14.1) poniamo = = 1 otteniamo
la (i); ponendo invece = 0 in (14.1), si ottiene la (ii).

Prima di proseguire con altri esempi, vediamo unimportante propriet delle fun-
zioni lineari.

Proposizione 190 Sia f : Rn ! R una funzione lineare. Si ha f (0) = 0 e


!
Xn X
n
i i
f ix = if x (14.2)
i=1 i=1

n
per ogni insieme di vettori fxi gi=1 in Rn ed ogni insieme di numeri reali f i gni=1 .

Dim. Mostriamo che f (0) = 0. Poich f lineare si ha f ( 0) = f (0) per ogni


2 R e quindi f (0) = f (0) per ogni 2 R, il che pu accadere se e solo se f (0) = 0.
La dimostrazione della (14.2) lasciata al lettore.

La propriet (14.2) ha una semplice, ma importante, conseguenza: una volta noti i


valori di una funzione lineare sugli elementi di una base, si possono determinare i suoi
valori per tutti i vettori di Rn . Infatti, sia S una base di Rn . Ogni vettore x 2 Rn si
pu scrivere come combinazione lineare di elementi di S, ossia esiste un insieme
Pn nito
i n n
di vettori fx gi=1 in S e un insieme di coe cienti reali f i gi=1 tali che x = i=1 i xi .
Grazie alla (14.2), si ha
X n
i
f (x) = if x
i=1
i i
Noti i valori di ff (x ) : x 2 Sg, si possono determinare tutti i valori f (x) dei vettori
x 2 Rn sfruttando la linearit di f .
14.1. FUNZIONI LINEARI 395

La linearit una propriet puramente algebrica che richiede il buon comporta-


mento delle funzioni rispetto alle operazioni di somma e moltiplicazione scalare, senza
alcun risvolto topologico. Ci nondimeno, tutte le funzioni lineari sono continue: si
tratta di unelegante propriet tanto notevole quanto sorprendente.

Teorema 191 Le funzioni lineari f : Rn ! R sono continue.

Dim. un caso speciale del Teorema 255, al quale rinviamo.

14.1.2 Rappresentazione
Denizione 98 Linsieme di tutti le funzioni lineari f : Rn ! R detto spazio duale
di Rn ed indicato con (Rn )0 .

Lo spazio (Rn )0 quindi linsieme di tutti le funzioni lineari denite su Rn . In (Rn )0


si possono denire in modo naturale somma e moltiplicazione scalare:

1. Se f; g 2 (Rn )0 , la somma f + g lelemento di (Rn )0 denito come

(f + g) (x) = f (x) + g (x) (14.3)

per ogni x 2 Rn .

2. Se f 2 (Rn )0 e 2 R, la moltiplicazione scalare f lelemento di (Rn )0 denito


come
( f ) (x) = f (x) (14.4)
per ogni x 2 Rn ed ogni 2 R.

Le due operazioni soddisfanno le propriet (v1)-(v8) del Capitolo 3 e quindi (Rn )0


uno spazio vettoriale. In particolare, lelemento neutro per la somma la funzione
identicamente nulla, ossia f (x) = 0 per ogni x 2 Rn , mentre lelemento opposto di
f 2 (Rn )0 la funzione g = ( 1) f = f , ossia g(x) = f (x) per ogni x 2 Rn .

Il prossimo importante risultato, una versione elementare del classico Teorema


di Riesz, descrive lo spazio duale (Rn )0 . Abbiamo visto come ogni vettore 2 Rn
induca una funzione lineare f : Rn ! R denita da f (x) = x per ogni x 2 Rn .
Il prossimo risultato mostra come in eetti tutte le funzioni lineari denite su Rn
abbiano tale forma, ossia lo spazio duale (Rn )0 contiene soltanto le funzioni lineari del
tipo f (x) = x per qualche 2 Rn . In particolare, nel caso scalare ci signica che
le rette passanti per lorigine sono le uniche funzioni lineari.

Teorema 192 (Riesz) Una funzione f : Rn ! R lineare se e solo se esiste un


unico vettore 2 Rn tale che

f (x) = x 8x 2 Rn :
396 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Dim. Abbiamo visto il Se nellEsempio 217. Resta da dimostrare il Solo se. Sia
perci f : Rn ! R una funzione lineare e consideriamo la base canonica fe1 ; :::; en g di
Rn . Poniamo
= f e1 ; :::; f (en ) :
P
Per ogni vettore x 2 Rn si ha x = ni=1 xi ei , e quindi
!
Xn Xn Xn
i i
f (x) = f xi e = xi f e = i xi = x
i=1 i=1 i=1

per ogni x 2 Rn .
Per quanto riguarda lunicit, sia 0 2 Rn un vettore tale che f (x) = 0
x per ogni
x 2 Rn . Allora, per ogni i = 1; :::; n, si ha
0 0
i = ei = f ei = ei = i

0
e quindi = .

Una funzione lineare f : Rn ! R dunque identicata da un unico vettore 2 Rn :


per brevit, possiamo dire che un vettore in Rn . Ci consente di concludere che lo
spazio duale di Rn Rn , ossia (Rn )0 = Rn .

14.1.3 Monotonia
Una funzione di pi variabili f : Rn ! R detta positiva se f (x) 0 per ogni
x 0 e strettamente positiva se f (x) > 0 per ogni x > 0. In altre parole, una
funzione (strettamente) positiva assegna valori f (x) (strettamente) positivi a vettori
x (strettamente) positivi.
In generale, la positivit una propriet molto pi debole della crescenza: per
esempio, la funzione denita da f (x) = kxk positiva ma non crescente. Una
prima notevole propriet delle funzioni lineari che per esse le due propriet diventano
equivalenti.

Proposizione 193 Una funzione lineare f : Rn ! R (strettamente) crescente se e


solo se (strettamente) positiva.

Dim. Dimostriamo il Se perch il converso banale. Sia f positiva. Mostriamone


la crescenza. Siano x; y 2 Rn tali che x y. Poniamo z = x y 2 Rn . Poich z 0,
la positivit e la linearit implicano

f (x) f (y) = f (x y) = f (z) 0

sicch f (x) f (y), come desiderato. La dimostrazione analoga per f strettamente


positiva.
14.2. MATRICI 397

Per vericare se una funzione lineare f : Rn ! R crescente basta quindi mostrare


che f (x) 0 per ogni x 0, mentre per la stretta crescenza occorre mostrare che
f (x) > 0 per ogni x > 0.
La positivit emerge anche nella versione monotona del Teorema di Riesz, di grande
importanza nelle applicazioni come vedremo nellultima sezione del capitolo.
Proposizione 194 Una funzione lineare f : Rn ! R (strettamente) crescente se
e solo se il vettore 2 Rn tale che f (x) = x per ogni x 2 Rn (strettamente)
positivo.
La crescenza delle funzioni lineari caratterizzata dalla positivit del vettore . In
particolare, visto che tutte le funzioni lineari f : Rn ! R hanno la forma f (x) = x,
esse sono crescenti se 0 e mentre sono strettamente crescenti se > 0.
Esempio 218 La funzione lineare f : R3 ! R data da f (x) = x1 + 2x2 + 5x3
strettamente crescente perch = (1; 2; 5) > 0, mentre la funzione lineare f : R3 ! R
data da f (x) = x1 + 3x2 crescente perch = (1; 2; 0) 0. N
La dimostrazione della Proposizione 194 conseguenza immediata del Teorema 192,
della Proposizione 193 e del seguente lemma, come il lettore invitato a vericare.
Lemma 195 Siano a; b 2 Rn . Si ha:
(i) a b 0 per ogni b 0 se e solo se a 0;
(ii) a b > 0 per ogni b > 0 se e solo se a 0.
Dim. I Se sono ovvi. Per i Solo se, si prenda b = ei : risulta allora ab = ai che
devessere rispettivamente 0 oppure > 0 per ogni i.
I risultati visti per crescenza e stretta crescenza hanno versioni per la forte crescen-
za. Inoltre, tutti i risultati visti in questa sezione si possono riscrivere, invertendo le
disuguaglianze, in termini di funzioni lineari decrescenti e negative come il lettore pu
vericare facilmente.

14.2 Matrici
Prima di passare allo studio delle applicazioni lineari, introduciamo le matrici, che
saranno centrali in tale studio.
Una matrice m n semplicemente una tavola, con m righe e n colonne, di numeri
reali 2 3
a11 a12 a1j a1n
6 a21 a22 a2j a2n 7
6 7
6 7
6 7
4 5
am1 am2 amj amn
398 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Per esempio, 2 3
1 5 7 9
4 3 2 1 4 5
12 15 11 9
una matrice 3 4, ove
a11 = 1 a12 = 5 a13 = 7 a14 = 9
a21 = 3 a22 = 2 a23 = 1 a24 = 4
a31 = 12 a32 = 15 a33 = 11 a34 = 9
Notazione. La matrice di componenti aij si indica con (aij ). Una matrice con m
righe e n colonne sar spesso indicata con A .
m n

In una matrice (aij ) si distinguono n colonne (detti vettori colonna):


2 3 2 3 2 3
a11 a12 a1n
6 7 6 7 6 7
6 7;6 7 ; :::; 6 7
4 5 4 5 4 5
am1 am2 amn
e m righe (detti vettori riga):
(a11 ; :::; a1n )
(a21 ; :::; a2n )

(am1 ; :::; amn )


La matrice si dice quadrata (di ordine n) quando m = n e si dice rettangolare
quando m 6= n.

Esempio 219 La matrice 3 4:


2 3
1 5 7 9
4 3 2 1 4 5
12 15 11 9
rettangolare, con i tre vettori riga
1 5 7 9 ; 3 2 1 4 ; 12 15 11 9
e i quattro vettori colonna
2 3 2 3 2 3 2 3
1 5 7 9
4 3 5; 4 2 5; 4 1 5; 4 4 5:
12 15 11 9
14.2. MATRICI 399

La matrice 3 3: 2 3
1 5 1
4 3 4 2 5
1 7 9
quadrata, con i tre vettori riga
1 5 1 ; 3 4 2 ; 1 7 9
e i tre vettori colonna 2 3 2 3 2 3
1 5 1
4 3 5; 4 4 5; 4 2 5:
1 7 9
N
Esempio 220 (i) La matrice quadrata di ordine n che si ottiene accostando i vettori
fondamentali di Rn detta matrice identit (o unit) e indicata con In o, se non vi
possibilit di equivoco, semplicemente con I:
2 3
1 0 0
6 0 1 0 7
6 7
I = 6 .. .. .. .. 7
4 . . . . 5
0 0 1
(ii) La matrice m n con elementi tutti nulli detta nulla e indicata con Omn o, se
non vi possibilit di equivoco, semplicemente con O:
2 3
0 0 0
6 0 0 0 7
6 7
O = 6 .. .. .. .. 7 :
4 . . . . 5
0 0 0
N

14.2.1 Operazioni tra matrici


Sia M (m; n) lo spazio di tutte le matrici m n. In M (m; n) possiamo denire in
modo naturale le operazioni di somma e moltiplicazione scalare:
(i) date due matrici (aij ) e (bij ) in M (m; n), la matrice somma (aij )+(bij ) si denisce
come:
2 3 2 3 2 3
a11 a1n b11 b1n a11 + b11 a1n + b1n
6 7 6 7 6 7
6 7+6 7=6 7;
4 5 4 5 4 5
am1 amn bm1 bmn am1 + bm1 amn + bmn
ossia (aij ) + (bij ) = (aij + bij );
400 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

(ii) dato 2 R e (aij ) 2 M (m; n), la moltiplicazione scalare (aij ) si denisce come:
2 3 2 3
a11 a1n a11 a1n
6 7 6 7
6 7=6 7;
4 5 4 5
am1 amn am1 amn

ossia (aij ) = ( aij ).

Esempio 221 Si ha
2 3 2 3 2 3
1 5 7 9 0 2 1 4 1 7 8 13
4 3 2 1 4 5+4 1 3 1 4 5=4 2 1 0 0 5
12 15 11 9 5 8 1 2 17 23 12 11
e 2 3 2 3
1 5 7 9 4 20 28 36
4
4 3 2 1 5 4
4 = 12 8 4 16 5 :
12 15 11 9 48 60 44 36
N

Esempio 222 Data una matrice quadrata A = (aij ) di ordine n e due scalari e ,
si ha 2 3
a11 + a12 a1n
6 a a + a2n 7
A+ I =6 4
21 22 7:
5
am1 am1 amn +
N

facile vericare che le operazioni di somma e moltiplicazione scalare test in-


trodotte su M (m; n) godono delle propriet (v1)-(v8) delle analoghe operazioni su Rn
viste nella Sezione 3.1, cio

(v1) A + B = B + A (propriet commutativa)

(v2) (A + B) + C = A + (B + C) (propriet associativa)

(v3) A + O = A (esistenza dellelemento neutro per la somma)

(v4) A + ( A) = O (esistenza dellopposto di ogni A)

(v5) (A + B) = A + B (propriet distributiva)

(v6) ( + ) A = A + A (propriet distributiva)

(v7) 1A = A (esistenza dellelemento neutro per la moltiplicazione scalare)


14.2. MATRICI 401

(v8) ( A) = ( )A (propriet associativa)

In altre parole, ricordando quanto detto nella Sezione 3.1, M (m; n) un altro
esempio di spazio vettoriale. Si noti che lelemento neutro per la somma la matrice
nulla.

Le matrici quadrate sono particolarmente importanti. In esse si chiama diagonale


principale linsieme degli elementi aii che occupano la diagonale discendente. Inoltre,
una matrice quadrata detta:

(i) simmetrica quando aij = aji per ogni i; j = 1; 2; ; n, cio quando i due trian-
goli separati dalla diagonale principale sono limmagine speculare uno dellaltro;
(ii) triangolare inferiore se ha nulli tutti gli elementi sopra la diagonale principale,
ossia aij = 0 per i < j;
(iii) triangolare superiore se ha nulli tutti gli elementi sotto la diagonale principale,
ossia aij = 0 per i > j;
(iv) diagonale se simultaneamente triangolare inferiore e superiore, cio se ha nulli
tutti gli elementi fuori dalla diagonale principale: aij = 0 per i 6= j.

Esempio 223 Le matrici


2 3 2 3 2 3
1 0 0 1 5 1 1 0 0
4 3 4 0 5 , 4 0 4 2 5 , 4 0 4 0 5
1 7 9 0 0 0 0 0 9
sono rispettivamente triangolare inferiore, triangolare superiore e diagonale. N

Da ultimo, si dice trasposta della matrice A 2 M (m; n) la matrice B 2 M (n; m)


che si ottiene scambiando le righe e le colonne di A:

bij = aji

per ogni i = 1; 2; ; m e ogni j = 1; 2; ; n. La trasposta di A si indica con AT .

Esempio 224 Si ha
2 3 2 3
1 5 7 1 3 12
A=4 3 2 1 5 T 4
e A = 5 2 7 5
12 15 11 7 1 11
nonch 2 3
1 3
1 0 7 4
A= T
e A = 0 5 5:
3 5 1
7 1
N
402 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

T
Risulta AT = A, cio la trasposta della trasposta la matrice iniziale. Si vede
molto facilmente che una matrice A quadrata simmetrica se e solo se AT = A.
Inoltre:
( A)T = AT e (A + B)T = AT + B T
per ogni 2 R e ogni A; B 2 M (m; n).

Inne, si noti che un vettore riga x = (x1 ; :::; xn ) 2 Rn si pu considerare come una
matrice 1 n, cio si pu identicare Rn con M (1; n). Secondo tale identicazione, la
trasposta xT di x il vettore colonna
2 3
x1
6 7
6 7;
4 5
xn

ossia xT 2 M (n; 1). Tale trasposta permette di identicare Rn anche come M (n; 1).
Nel seguito considereremo spesso i vettori di Rn come particolari matrici e, in tale
prospettiva, li considereremo talvolta come vettori riga, cio elementi di M (1; n), e
talvolta come vettori colonna, cio elementi di M (n; 1). Sia come sia, essi rimangono
in primis elementi di Rn .

14.2.2 Prodotto tra matrici


In opportune condizioni sulle loro dimensioni possibile eettuare il prodotto tra due
matrici A e B. Per denirlo iniziamo da un caso particolare: il prodotto matrice per
vettore. Sia dunque A = (aij ) 2 M (m; n) e x 2 Rn . La scelta delle dimensioni di A e
di x non casuale: il prodotto del tipo AxT tra la matrice A e il vettore colonna xT
richiede che il numero di righe di x sia uguale al numero di colonne di A. Se tale il
caso, il prodotto AxT si denisce come segue:
2 n 3
X
6 a1i xi 7
2 32 3 6 i=1 7 2 1 3
a11 a12 a1n x1 6 X n 7 a x
6 7
6 a21 a22 a2n 7 6 x2 7 6 a2i xi 7 6 2 7
T
Ax = 4 6 7 6 7 = 6 7=6 a x 7
54 5 6 i=1 7 4 5
6 7
am1 am2 amn xn 6 7 m
a x
6 Xn 7
4 5
ami xi
i=1

dove a1 , a2 , ..., am sono le righe di A e

a1 x; a2 x; :::; am x

sono i prodotti interni tra le righe di A e il vettore x. In particolare, AxT 2 M (m; 1).
14.2. MATRICI 403

quindi evidente perch il vettore x debba avere dimensione pari al numero di


colonne di A: nel prodotto riga per colonna le componenti di AxT sono prodotti
scalari tra le righe di A e il vettore x, e il prodotto scalare si pu eettuare solo tra
vettori della stessa dimensione.

Notazione. Per semplicit, nel seguito scriveremo Ax in luogo di AxT .

Esempio 225 Siano A 2 M (3; 4) e x 2 R4 deniti come x = (1; 2; 3; 4) e


2 3
3 2 0 1
A = 4 0 10 2 2 5:
4 0 2 3

possibile eettuare il prodotto Ax e si ha:


2 3
2 3 1
3 2 0 1 6
2 7
Ax = 4 0 10 2 2 56 4 3 5
7
4 0 2 3
4
2 3 2 3
3 1 + ( 2) 2 + 0 3 + ( 1) ( 4) 3
= 4 0 1 + 10 2 + 2 3 + ( 2) ( 4) 5 = 4 34 5 :
4 1 + 0 2 + ( 2) 3 + 3 ( 4) 14

Mentre possibile fare il prodotto Ax; non possibile eettuare il prodotto xA. Infatti
il numero di righe di A (che 3) non uguale al numero di colonne di x (che 1). N

In modo analogo si denisce il prodotto tra due matrici A e B. Anche in questo


caso il prodotto si svolge righe per colonne, e il prerequisito sulle dimensioni delle
matrici che il numero delle colonne di A sia pari al numero delle righe di B. In altre
parole, il prodotto AB possibile quando A 2 M (m; n) e B 2 M (n; q). In tal caso,
indicando con a1 , a2 ,..., am le righe di A e con b1 , b2 ,..., bq le colonne di B si ha
2 1 3 2 1 1 3
a a b a1 b 2 a1 b q
6 a2 7 1 2 6 2 1 a2 b 2 a2 b q 7
AB = 6 7 b ; b ; :::; bq = 6 a b 7:
4 5 4 5
m m 1 m 2 m q
a a b a b a b

Le componenti abij della matrice prodotto AB sono quindi


X
m
i j
abij = a b = aik bkj
k=1

per i = 1; :::; q e j = 1; :::; n.

La matrice prodotto AB di tipo m q: ha cio lo stesso numero di righe di A e lo


stesso numero di colonne di B. Il lettore pu inoltre osservare che possibile svolgere
404 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

il prodotto AB tra le matrici A e B se e solo se possibile svolgere il prodotto B T AT


tra le matrici trasposte B T e AT .

La nozione di prodotto di matrici trova giusticazione nella Proposizione 202, che


vedremo tra breve. Per il momento importante comprendere la meccanica della
nozione. A tal ne diamo alcuni esempi.

Esempio 226 Siano A 2 M (2; 4) e B 2 M (4; 3) denite come segue:


2 3
0 2 3
3 2 8 6 6 5 6 1 7
A= e B=6 4 12 7 0 5 :
7
13 0 4 9
1 9 11

possibile eettuare il prodotto AB e si ha:


3 0 + ( 2) 5 + 8 12 + ( 6) ( 1) 3 2 + ( 2) ( 6) + 8 7 + ( 6) 9
AB =
13 0 + 0 5 + ( 4) 12 + 9 ( 1) 13 2 + 0 ( 6) + ( 4) 7 + 9 9
3 3 + ( 2) 1 + 8 0 + ( 6) (11) 152 20 59
= :
13 3 + 0 1 + ( 4) 0 + 9 (11) 57 79 138
Mentre possibile il prodotto AB; non possibile il prodotto BA. Infatti il numero di
righe di A (che 2) non uguale al numero di colonne di B (che 3). Come osservato
prima, tuttavia possibile eettuare il prodotto B T AT poich il numero di colonne di
B T (che 4) pari al numero di righe di AT . N

Esempio 227 Siano A e B denite come


2 3
1 2 1 0
1 3 1
A = e B = 4 2 5 2 2 5:
2 3 0 1 4 3 4
0 1 3 2
La matrice prodotto AB 2 4. A tale proposito, si osservi lutile regola mnemonica
(2 4) = (2 3)(3 4). Si ha:

2 3
1 2 1 0
1 3 1 4 2 5 2 2 5
AB =
0 1 4
0 1 3 2
1 1+3 2+1 0 1 2+3 5+1 1 1 1+3 2+1 3
=
0 1+1 2+4 0 0 2+1 5+4 1 0 1+1 2+4 3
1 0+3 2+1 2 7 18 10 8
= :
0 0+1 2+4 2 2 9 14 10
N
Il prodotto di matrici gode delle seguenti propriet, come il lettore pu vericare.
14.2. MATRICI 405

Proposizione 196 Date tre matrici A; B e C per le quali si possano eettuare i


prodotti sotto indicati, si ha
(i) (AB)C = A(BC)
(ii) A(B + C) = AB + AC
(iii) (A + B)C = AC + BC
(iv) AB = ( A)B = A( B) per ogni 2R
(v) (AB)T = B T AT
Tra le propriet del prodotto test elencate vi unillustre assenza: la commuta-
tivit. Infatti, il prodotto di matrici non gode in generale di tale propriet: qualora
siano ben deniti entrambi i prodotti AB e BA, in generale si ha AB 6= BA, come
mostrer il prossimo esempio.
Quando AB = BA, si dice che le due matrici commutano. Siccome (AB)T =
B T AT , le matrici A e B commutano se e solo se commutano anche le loro trasposte.
Esempio 228 Siano A e B denite come
2 3 2 3
1 0 3 2 1 4
A = 4 2 1 0 5 e B = 4 0 3 1 5:
1 4 6 4 2 4
Siccome A e B sono quadrate, esistono sia BA sia AB, ed entrambe sono matrici 3 3.
Si ha:
2 32 3
2 1 4 1 0 3
BA = 4 0 3 1 5 4 2 1 0 5
4 2 4 1 4 6
2 3
2 1+1 2+4 1 2 0+1 1+4 4 2 3+1 0+4 6
= 4 0 1+3 2+1 1 0 0+3 1+1 4 0 3+3 0+1 6 5
4 1+2 2+4 1 4 0+2 1+4 4 4 3+2 0+4 6
2 3
8 17 30
= 4 7 7 6 5
12 18 36
mentre
2 32 3
1 0 3 2 1 4
AB = 4 2 1 0 5 4 0 3 1 5
1 4 6 4 2 4
2 3
1 2+0 0+3 4 1 1+0 3+3 2 1 4+0 1+3 4
= 4 2 2+1 0+0 4 2 1+1 3+0 2 2 4+1 1+0 4 5
1 2+4 0+6 4 1 1+4 3+6 2 1 4+4 1+6 4
2 3
14 7 16
= 4 4 5 9 5:
26 25 32
406 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Si noti che AB 6= BA: il prodotto non commutativo. N

14.2.3 Applicazione: matrice di Leontie


Chiudiamo la sezione con unimportante applicazione delle matrici che presenta i tratti
essenziali del classico modello di Leontie.
Lintero sistema economico idealmente suddiviso in n diversi settori ognuno dei
quali produce una sola merce: gli indici 1; 2; :::; n individuano cos sia i vari settori sia
le diverse merci. Ogni settore, per produrre la merce che gli propria, utilizza alcune
delle merci prodotte nel sistema (eventualmente anche la propria: per esempio, per
produrre grano serve grano).
Indichiamo con aij il numero delle unit delli-esima merce necessarie per produrre
ununit dellj-esima merce. Chiaramente devessere aij 0 per ogni i; j = 1; 2; ;n
e 0 aii < 1 per ogni i = 1; 2; ; n. La matrice quadrata A = (aij ) detta matrice
di Leontie (o input-otput o delle transazioni intersettoriali).
Raccogliamo nel vettore x 2 Rn le quantit prodotte delle varie merci e con c 2 Rn
il vettore delle quantit destinate al consumo nale. La quantit xi di merce prodotta
nel generico settore i in parte destinata alla produzione negli altri settori (aij xj
quanto assorbito nellj-esimo settore ) e, per il resto, destinata al consumo nale ci ,
cosicch
Xn
xi = ci + aij xj 8i = 1; 2; ;n
j=1

ovvero, in notazione matriciale,


x = c + Ax
che si pu riscrivere come
(I A) x = c:
Come vedremo tra breve, (I A) x = c un esempio di sistema lineare. Si noti che
gli elementi della diagonale principale di I A sono tutti non negativi.

Per fare un esempio molto rudimentale, sia


2 3
0; 1 0; 5 0
A = 4 0; 3 0 1; 5 5
0 0; 4 0; 2
col che 2 3
0; 9 0; 5 0
I A= 4 0; 3 1 1; 5 5
0 0; 4 0; 8
e quindi il sistema (I A) x = c diventa
8
< 0; 9x1 0; 5x2 = c1
0; 3x1 + x2 1; 5x3 = c2
:
0; 4x2 + 0; 8x3 = c3
14.3. APPLICAZIONI LINEARI 407

Se x = (500; 800; 300), risulta

c1 = 50 ; c2 = 200 ; c3 = 80:

Per esempio, delle 500 unit della merce 1 prodotte dal settore 1, 50 sono riutilizzate
dalle stesso settore 1 e 0; 5 800 = 400 sono impiegate dal settore 2.
Viceversa, se si vuol garantire il vettore c = (100; 100; 100) di consumi nali, si
devono produrre
x1 = 2:250 ; x2 = 3:850 ; c3 = 2:050:
Per esempio, delle 3:850 unit della merce 2, 0; 3 2:250 = 675 sono utilizzate dal settore
1 e 1; 5 2:050 = 3:075 dal settore 3 e dunque ne restano disponibili 3:850 675 3:075 =
100.

14.3 Applicazioni lineari


14.3.1 Denizione e prime propriet
Le funzioni (vettoriali di vettore) T : Rn ! Rm denite su Rn e a valori in Rm sono
dette applicazioni, come accennato nel Capitolo 7. In questo libro ci limitiamo a
studiare le pi semplici tra esse, ossia le lineari:

Denizione 99 Unapplicazione T : Rn ! Rm lineare se

T ( v + w) = T (x) + T (y) (14.5)

per ogni x; y 2 Rn ed ogni ; 2 R.

La nozione di applicazione lineare generalizza quella di funzione lineare (Denizione


97), che ne il caso speciale m = 1, cio Rm = R.
Prima di vedere qualche esempio, osserviamo come unapplicazione sia lineare
se e solo se preserva le operazioni di somma e di moltiplicazione. Omettiamo la
dimostrazione, analoga a quella della Proposizione 189.

Proposizione 197 Unapplicazione T : Rn ! Rm lineare se e solo se

T (x + y) = T (x) + T (y) (14.6)


T ( v) = T (x) (14.7)

per ogni x; y 2 Rn ed ogni 2 R.

Esempio 229 Data una matrice A 2 M (m; n), deniamo lapplicazione T : Rn ! Rm


come
T (x) = Ax (14.8)
408 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

per ogni x 2 Rn . facile vedere come T sia lineare. Fra poco, nel Teorema 200 vedremo
come in realt tutte le applicazioni lineari T : Rn ! Rm abbiano tale forma. Al
riguardo, si noti che lapplicazione (14.8) si pu scrivere nella forma T = (T1 ; :::; Tm ) :
Rn ! Rm introdotta nella Sezione 13.6 ponendo Ti (x) = ai x per ogni i = 1; :::; m,
dove ai li-esimo vettore riga della matrice A. N

Esempio 230 (i) Lapplicazione 0 : Rn ! Rm denita come

0 (x) = 0

per ogni x 2 Rn , lineare ed detta applicazione nulla.

(ii) Tra le applicazioni lineari T : Rn ! Rn , importante lapplicazione identit


I : Rn ! Rn denita come

I (x) = x 8x 2 Rn :

Si verica immediatamente che I lineare. N

Un importante caso speciale si ha quando n = m e perci T : Rn ! Rn .

Esempio 231 Sia A = (aij ) una matrice quadrata n n e, similmente allEsempio


229, deniamo lapplicazione T : Rn ! Rn come

T (x) = Ax

per ogni x 2 Rn . Quindi, se nellEsempio 229 si usano matrici quadrate n n, si ha


Rn = Rm . N

Concludiamo questa prima sezione con altre semplici propriet delle applicazioni
lineari, analoghe a quelle enunciate nella Proposizione 190 per le funzioni lineari. La
semplice dimostrazione lasciata al lettore.

Proposizione 198 Sia T : Rn ! Rm unapplicazione lineare. Si ha T (0) = 0 e


!
Xn X
n
i i
T ix = iT x (14.9)
i=1 i=1

n
per ogni insieme di vettori fxi gi=1 in Rn ed ogni insieme di numeri reali f i gni=1 .

Come avevamo gi visto per le funzioni lineari, la propriet (14.9) ha limportante


conseguenza che, una volta noti i valori di unapplicazione lineare T sugli elementi di
una base di Rn , si possono determinare i valori di T su tutti i vettori di Rn .

Possiamo denire in modo naturale la somma e la moltiplicazione scalare di appli-


cazioni.
14.3. APPLICAZIONI LINEARI 409

Denizione 100 Date due applicazioni S; T : Rn ! Rm ed un numero reale 2 R,


si pone:

(S + T ) (x) = S (x) + T (x) 8x 2 Rn ;


( T ) (x) = T (x) 8x 2 Rn :

Sia L (Rn ; Rm ) lo spazio di tutte le applicazioni lineari T : Rn ! Rm . Nel caso


di funzioni lineari, ossia Rm = R, L (Rn ; R) non altro che lo spazio duale (Rn )0 che
abbiamo brevemente esaminato nel capitolo precedente. facile vericare che anche
le operazioni test introdotte soddisfanno le ormai solitepropriet (v1)-(v8), ragion
per cui (Rn )0 un ulteriore esempio di spazio vettoriale (che il lettore approfondir in
corsi successivi).

Introduciamo ora la nozione di prodotto di applicazioni.

Denizione 101 Date due applicazioni lineari T : Rn ! Rm e S : Rm ! Rq , il loro


prodotto la trasformazione ST : Rn ! Rq denita da

(ST ) (x) = S (T (x))

per ogni x 2 Rn .

In altre parole, lapplicazione prodotto ST la funzione composta S T . Se le


applicazioni S e T sono lineari, lo anche il prodotto ST . Infatti:

(ST ) ( x + y) = S (T ( x + y)) = S ( T (x) + T (y))


= S (T (x)) + S (T (y)) = (ST ) (x) + (ST ) (y)

per ogni x; y 2 Rn ed ogni ; 2 R. Il prodotto di due applicazioni lineari quindi


ancora una applicazione lineare.

Come risulter chiaro dopo la Proposizione 202, il prodotto non in generale


commutativo: quando entrambi i prodotti ST e T S sono ben deniti, in generale si ha
ST 6= T S. Di conseguenza, nelle scritture ST e T S importante lordine con il quale
appaiono le due applicazioni.
Nel caso di applicazioni lineari della forma T : Rn ! Rn per brevit indichiamo
con L (Rn ), invece di L (Rn ; Rn ), lo spazio di tali applicazioni.

Da ultimo, enunciamo la versione per applicazioni del notevole Teorema 191 di


continuit (la semplice dimostrazione lasciata al lettore).

Proposizione 199 Le applicazioni lineari T : Rn ! Rm sono continue.


410 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

14.3.2 Rappresentazione
In questa sezione studiamo pi in dettaglio le applicazioni lineari T : Rn ! Rm .
Cominciamo col darne una rappresentazione. Nel Teorema di Riesz abbiamo visto
come un funzione L : Rn ! R sia lineare se e solo se esiste un vettore 2 Rn tale
che L (x) = x per ogni x 2 Rn . Il prossimo risultato generalizza tale risultato alle
applicazioni lineari.
Teorema 200 Unapplicazione T : Rn ! Rm lineare se e solo se esiste ununica
matrice A tale che
m n
T (x) = Ax (14.10)
n
per ogni x 2 R .
A detta matrice associata allapplicazione T .
Dim. Se. Tale direzione contenuta essenzialmente nellEsempio 229. Solo se.
Sia T unapplicazione lineare. Si ponga
A = T e1 ; T e2 ; :::; T (en ) ; (14.11)
ossia A la matrice m n le cui n colonne sono i vettori colonnaPT (ei ) per i = 1; :::; n.
n
Linsieme fei gi=1 una base di Rn e per ogni x 2 Rn si ha x = ni=1 xi ei . Quindi, per
ogni x 2 Rn ,
!
Xn Xn
i
T (x) = T xi e = xi T ei
2 i=1 3 i=1
2 3 2 3
a11 a12 a1n
6 a21 7 6 a22 7 6 a2n 7
6 7 6 7 6 7
= x1 6 .. 7 + x2 6 .. 7 + + xn 6 .. 7
4 . 5 4 . 5 4 . 5
am1 am2 amn
2 3 2 3
a11 x1 + a12 x2 + + a1n xn a1 x
6 a21 x1 + a22 x2 + 7 6
+ a2n xn 7 6 a2 x 7
6 7
= 6 .. 7=6 .. 7 = Ax
4 . 5 4 . 5
am1 x1 + am2 x2 + + amn xn am x
dove a1 , a2 , ..., am sono le righe di A.
Per quanto riguarda lunicit, sia B una matrice m n per cui valga la (14.10).
Considerando i vettori ei si ha
(a11 ; a21 ; :::; am1 ) = T e1 = Be1 = (b11 ; b21 ; :::; bm1 )
(a12 ; a22 ; :::; am2 ) = T e2 = Be2 = (b12 ; b22 ; :::; bm2 )

(a1n ; a2n ; :::; amn ) = T (en ) = Ben = (b1n ; b2n ; :::; bmn )
14.3. APPLICAZIONI LINEARI 411

e quindi A = B.

Esempio 232 Sia T : R3 ! R3 denita come

T (x) = (0; x2 ; x3 )

per ogni x 2 R3 . In altre parole, T la proiezione di ogni vettore in R3 nel piano


fx 2 R3 : x1 = 0g. Per esempio, T (2; 3; 5) = (0; 3; 5). Si ha

T e1 = (0; 0; 0)
T e2 = (0; 1; 0)
T e3 = (0; 0; 1)

e perci 2 3
0 0 0
A = T e1 ; T e2 ; T e3 = 4 0 1 0 5:
0 0 1
In conclusione, T (x) = Ax per ogni x 2 R3 . N

Esempio 233 Sia T : R3 ! R2 denita come

T (x) = (x1 x 3 ; x1 + x 2 + x 3 )

per ogni x 2 R3 . Per esempio, T (2; 3; 5) = ( 3; 10). Si ha

T e1 = (1; 1)
T e2 = (0; 1)
T e3 = ( 1; 1)

e perci
1 0 1
A = T e1 ; T e2 ; T e3 = :
1 1 1
Si pu quindi scrivere T (x) = Ax per ogni x 2 R3 . N

14.3.3 Matrici e operazioni


A questo punto naturale domandarsi quali siano le rappresentazioni in termini di
matrici delle operazioni introdotte nelle Denizioni 100 e 101, quando si intendano
denite tra applicazioni in L (Rn ; Rm ).
Per somma e moltiplicazioni scalari vale il seguente semplice risultato, la cui ovvia
dimostrazione lasciata al lettore.

Proposizione 201 Siano S; T : Rn ! Rm due applicazioni lineari e sia 2 R. Siano


A e B le due matrici m n rispettivamente associate a S e T . Allora, A+B la matrice
associata allapplicazione S +T , mentre A la matrice associata allapplicazione S.
412 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Esempio 234 Siano S; T : R3 ! R3 due applicazioni lineari denite da

S (x) = (0; x2 ; x3 ) e T (x) = (2x1 x3 ; x1 + x2 + 3x3 ; 2x1 x2 )

per ogni x 2 R3 . NellEsempio 232 abbiamo visto che


2 3
0 0 0
A=4 0 1 0 5
0 0 1

la matrice associata allapplicazione S. Procedendo nello stesso modo, si pu vedere


come 2 3
2 0 1
B=4 1 1 3 5
2 1 0
sia la matrice associata allapplicazione T . Per la Proposizione 201 si ha che
2 3
2 0 1
A+B =4 1 2 3 5
2 1 1

la matrice associata allapplicazione S + T . Inoltre, se poniamo per esempio = 10,


per la Proposizione 201 si ha che
2 3
0 0 0
A = 4 0 10 0 5
0 0 10

la matrice associata allapplicazione S. N

Passiamo al caso pi interessante di prodotto di applicazioni.

Proposizione 202 Si considerino due applicazioni lineari S : Rm ! Rq e T : Rn !


Rm , le cui matrici associate sono rispettivamente

A = (aij ) e B = (bij ) :
q m m n

Allora, la matrice associata allapplicazione prodotto ST : Rn ! Rq la matrice


prodotto AB.

La matrice prodotto AB quindi la rappresentazione matriciale dellapplicazione


prodotto ST . Ci motiva la nozione di prodotto di matrici (che, quando stata
introdotta nella Sezione 14.2.2, poteva apparire un poarticiosa).
14.4. RANGO 413

n q m
Dim. Siano fei gi=1 , f~
ei gi=1 e fei gi=1 rispettivamente le basi canoniche di Rn , Rq e
m
R . Si ha

T ej = Bej = (b1j ; b2j ; :::; bmj )


X
m
= b1j (1; 0; :::; 0) + b2j (0; 1; 0; :::; 0) +bmj (0; 0; :::; 1) = bkj ek :
k=1

Allo stesso modo,


q
X
S ek = Aek = (a1k ; :::; aqk ) = aiik e~i :
i=1

Possiamo quindi scrivere


!
X
m X
m
(ST ) ej = S T ej =S bkj ek = bkj S ek
k=1 k=1
q
! q
!
X
m X X X
m
= bkj aik e~i = aik bkj e~i :
k=1 i=1 i=1 k=1

Daltra parte, se C la matrice associata allapplicazione ST ,


q
X
j j
(ST ) e = Ce = (c1j ; :::; cqj ) = cij e~i :
i=1
Pm
Quindi cij = k=1 aik bkj e possiamo concludere che C = AB.

Come abbiamo visto nella Sezione 14.2.2, il prodotto di matrici non in generale
commutativo, il che riette la mancanza di commutativit del prodotto di applicazioni
lineari.

14.4 Rango
14.4.1 Applicazioni lineari
Data unapplicazione T : Rn ! Rm , il suo nucleo ker T linsieme

ker T = fx 2 Rn : T (x) = 0g ; (14.12)

ossia ker T = T 1 (0). In altre parole, il nucleo linsieme dei punti in cui lapplicazione
si annulla e quindi assume come valore il vettore nullo 0 di Rm .
Un altro insieme importante limmagine di T , che si denisce nel modo usuale
come
Im T = fx 2 Rm : x = T (y) per qualche y 2 Rn g (14.13)
414 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Limmagine quindi linsieme dei vettori di Rm che sono raggiuntida Rn attraverso


lapplicazione T .

Il prossimo risultato mostra che tali insiemi sono entrambi sottospazi vettoriali, il
primo di Rn e il secondo di Rm .

Lemma 203 Se T 2 L (Rn ; Rm ), allora ker T e Im T sono sottospazi vettoriali rispet-


tivamente di Rn e Rm .

Dim. Mostriamo il risultato per ker T lasciando al lettore Im T . Siano x; x0 2 ker T ,


cio due vettori tali che T (x) = 0 e T (x0 ) = 0. Dobbiamo provare che x+ x0 2 ker T
per ogni ; 2 R. Risulta infatti

T ( x + x0 ) = T (x) + T (x0 ) = 0 + 0 = 0

come desiderato.

I sottospazi sono importanti per studiare le propriet di iniettivit e suriettivit


delle applicazioni. In particolare, per denizione T suriettiva quando Im T = Rm ,
mentre, sfruttando la linearit di T , si ha la seguente semplice caratterizzazione
delliniettivit.

Lemma 204 Unapplicazione T 2 L (Rn ; Rm ) iniettiva se e solo se ker T = f0g.

Dim. Se. Sia T : Rn ! Rm unapplicazione lineare tale che ker T = f0g. Siano
x; y 2 Rn con x 6= y. Essendo x y 6= 0, lipotesi ker T = f0g implica T (x y) 6= 0,
e quindi T (x) 6= T (y). Solo se. Sia T : Rn ! Rm unapplicazione lineare iniettiva
e sia x 2 ker T . Se x 6= 0, per liniettivit si ha la contraddizione T (x) 6= T (0) = 0.
Si ha quindi x = 0, il che implica ker T = f0g.

Possiamo ora enunciare limportante Teorema di rango e nullit, che aerma che
la dimensione di Rn , cio n, sia sempre la somma delle dimensioni dei due sottospazi
ker T e Im T . A tal ne, diamo un nome alle due dimensioni.

Denizione 102 Il rango (T ) di unapplicazione lineare T : Rn ! Rm la dimen-


sione di Im T , mentre la nullit (T ) la dimensione di ker T .

Usando questa terminologia, possiamo ora enunciare e dimostrare il risultato.

Teorema 205 (di rango e nullit) Data unapplicazione lineare T : Rn ! Rm , si


ha
(T ) + (T ) = n: (14.14)
14.4. RANGO 415

Dim. Posto (T ) = k e (T ) = l, sia fxi gki=1 una base del sottospazio vettoriale Im T
di Rm e fxi gli=1 una base del sottospazio vettoriale ker T di Rn . Essendo fxi gki=1
Im T , per denizione esistono k vettori fyi gki=1 in Rn tali che T (yi ) = xi per ogni
i = 1; :::; k. Si ponga
S = fy1 ; :::; yk ; x1 ; :::; xl g :
Per dimostrare il teorema su ciente mostrare che S una base di Rn . Infatti in tal
caso S consta di n vettori e quindi r + l = n. Per prima cosa, mostriamo che S un
insieme linearmente indipendente. Sia f 1 ; :::; k ; 1 ; :::; l g R tale che

X
k X
l

i yi + i xi = 0: (14.15)
i=1 i=1

Pl Pl
Siccome fxi gli=1 una base di ker T , si ha i=1 iT (xi ) = T i=1 i xi = 0. Poich
T (0) = 0, la (14.15) implica

X
k X
l X
k X
k

iT (yi ) + iT (xi ) = iT (yi ) = i xi = 0: (14.16)


i=1 i=1 i=1 i=1

Essendo una base, fxi gki=1 un insieme linearmente indipendente e quindi (14.16)
P
implica i = 0 per ogni i = 1; :::; k. Pertanto, (14.15) si riduce a li=1 i xi = 0, il che
implica i = 0 per ogni i = 1; :::; l poich anche fxi gli=1 , essendo una base, un insieme
linearmente indipendente. In conclusione, linsieme S linearmente indipendente.
Resta da mostrare che Rn = span S. Sia x 2 Rn e si consideri la sua immagine
T (x). Per denizione, T (x) 2 Im T e quindi, siccome fxi gki=1 una base di Im T ,
P
esiste un insieme f i gki=1 R tale che T (x) = ki=1 i xi . Avendo posto xi = T (yi )
per ogni i = 1; :::; k, si ha
!
X
k X
k
T (x) = iT (yi ) = T i yi :
i=1 i=1

Pk Pk
Pertanto, T x i=1 i yi = 0 e quindi x i=1 i yi 2 ker T . Daltra parte,
fx gl una base di ker T , e dunque esiste un insieme f i gli=1 R tale che x
Pki i=1 Pl Pk Pl
i=1 i yi= i=1 i xi . In conclusione, x = i=1 i yi + i=1 i xi , il che mostra che
x 2 span S, come desiderato.

Per apprezzare la portata del risultato, vediamone alcune interessanti conseguenze.

Corollario 206 Unapplicazione lineare T : Rn ! Rm iniettiva solo se n m,


mentre suriettiva solo se n m.
416 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Dim. Sia T iniettiva, cosicch ker T = f0g. Siccome Im T un sottospazio vettoriale


di Rm , si ha (T ) = dim (Im T ) dim Rm = m. Quindi, la (14.14) si riduce a

n = dim Rn = (T ) + dim (0) = (T ) dim Rm = m:

Si assuma ora che T sia suriettiva, ossia Im T = Rm . Siccome (T ) 0, la (14.14)


implica:

n = dim Rn = (T ) + (T ) = dim Rm + (T ) dim Rm = m

come desiderato.

Per una generica funzione, liniettivit e suriettivit sono propriet ben diverse e
indipendenti. molto facile costruire esempi di funzioni iniettive ma non suriettive,
e viceversa. Il prossimo importante risultato, che rappresenta unaltra notevole con-
seguenza del Teorema 205, mostra come per le applicazioni lineari da Rn a Rn le due
propriet risultino invece equivalenti.

Corollario 207 Unapplicazione lineare T : Rn ! Rn iniettiva se e solo se


suriettiva. In particolare, le seguenti condizioni sono equivalenti:

(i) T biiettiva,

(ii) ker T = f0g ;

(iii) Im T = Rn .

Dim. (i) implica banalmente (ii). Per il converso, assumiamo (ii), ossia ker T = f0g.
Siccome (T ) = 0, la (14.14) implica (T ) = n. Essendo Im T un sottospazio di Rn ,
ci implica Im T = Rn e pertanto, (ii) implica (iii).
Resta da dimostrare che (iii) implica (i). Si assuma quindi (iii), ossia Im T = Rn .
Per mostrare che T biiettiva ci basta mostrare che iniettiva. Usando la (14.14), da
(T ) = n scende che (T ) = 0, il che implica ker T = f0g. Per la Proposizione 204,
si ha quindi che T iniettiva, come desiderato.

Un modo equivalente per enunciare la seconda parte del Corollario 207 dire che
le seguenti condizioni sono equivalenti:

(i) T biiettiva,

(ii) (T ) = 0,

(iii) (T ) = n.
14.4. RANGO 417

14.4.2 Rango di matrici


Il rango di una matrice una delle nozioni centrali dellalgebra lineare.
Denizione 103 Il rango di una matrice A, indicato con (A), il massimo numero
delle sue colonne linearmente indipendenti.
Esempio 235 Sia 2 3
3 6 18 2
6 1 2 6 47
A=6
40
7:
1 3 65
2 1 3 8
Poich la terza colonna si ottiene moltiplicando per 3 la seconda colonna, linsieme
di tutte e quattro le colonne linearmente dipendente. Quindi, (A) < 4. Invece,
facile vericare che le colonne (3; 1; 0; 2) ; (6; 2; 1; 1) e (2; 4; 6; 8) sono linearmente
indipendenti, cos come lo sono (3; 1; 0; 2) ; (18; 6; 3; 3) e (2; 4; 6; 8) : Si ha dunque
(A) = 3. Si noti che vi sono due diversi insiemi di colonne linearmente indipendenti,
che per hanno la stessa cardinalit. N
Sia A la matrice associata a unapplicazione lineare T . Poich il sottospazio vettori-
ale Im T generato dai vettori colonna di A,2 si ha (T ) (A) (perch?). Il prossimo
risultato mostra che, in realt, vale luguaglianza: le nozioni di rango per applicazioni
e matrici sono dunque coerenti tra loro. In altre parole, la dimensione dellimmagine di
unapplicazione lineare pari al massimo numero di colonne linearmente indipendenti
della matrice ad essa associata.
Proposizione 208 Sia A 2 M (m; n) la matrice associata a unapplicazione lineare
T : Rn ! Rm . Si ha (A) = (T ).
Dim. Poniamo (A) = k n. Dalla dimostrazione del Teorema 200 si ha A =
(T (e1 ) ; T (e2 ) ; :::; T (en )). Senza perdita di generalit, supponiamo che le k colonne
linearmente indipendenti siano T (e1 ), ..., T ek . Le (eventuali) rimanenti colonne
T ek+1 , ..., T (en ) si possono quindi esprimere come loro combinazione lineare, sicch
span fT (e1 ) ; T (e2 ) ; :::; T (en )g = span T (e1 ) ; T (e2 ) ; :::; T ek .
Sia y 2P Im T . Per denizione,
Pn esiste x 2 Rn tale che T (x) = y. Quindi, y =
n i i
T (x) = T ( i=1 xi e ) = i=1 xi T (e ). Ne segue che
Im T = span T e1 ; T e2 ; :::; T (en ) = span T e1 ; T e2 ; :::; T ek
il che prova che linsieme T (e1 ) ; T (e2 ) ; :::; T ek base di Im T . Dunque (T ) =
dim (Im T ) = k.

Grazie al Teorema di rango e nullit, la proposizione implica il seguente corollario


che mostra come lindipendenza lineare delle colonne sia la controparte matriciale
delliniettivit.
2
Pn
Infatti, si ricordi che la colonna i-esima di A T ei e quindi T (x) = T i=1 xi e
i
=
Pn i
i=1 xi T e , il che mostra che limmagine T (x) combinazione lineare delle colonne di A.
418 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Corollario 209 Unapplicazione lineare T : Rn ! Rm , con matrice associata A 2


M (m; n), iniettiva se e solo se le colonne di A sono linearmente indipendenti.

Dim. Per il Lemma 204, T iniettiva se e solo se (T ) = 0. Per il Teorema di rango e


nullit, ci accade se e solo se (T ) = n, cio se e solo se (A) = n per la Proposizione
208.

Sinora abbiamo considerato lindipendenza lineare delle colonne di A. Il legame con


lindipendenza lineare delle righe di A per molto stretto, come mostra il prossimo
importante risultato. Al riguardo si osservi che il rango della matrice trasposta AT
il massimo numero di righe linearmente indipendenti di A.

Teorema 210 Per ogni matrice A, i numeri massimi di righe e di colonne linearmente
indipendenti coincidono:
(A) = AT :

Dim. Sia A = (aij ) 2 M (m; n). Nella dimostrazione indichiamo la riga i-esima con Ri
e la colonna j-esima con Cj . Dobbiamo dimostrare che il sottospazio di Rn generato
dalle righe di A, detto spazio delle righe di A, ha la stessa dimensione del sottospazio
di Rm generato dalle colonne di A, detto spazio delle colonne di A. Sia r la dimensione
dello spazio delle righe di A e sia fx1 ; x2 ; :::; xr g Rn una base di tale spazio, dove

xi = xi1 ; xi2 ; :::; xin 8i = 1; 2; :::; r

Ogni riga Ri di A pu essere scritta in modo unico come combinazione lineare di


fx1 ; x2 ; :::; xr g, cio esiste un vettore di r coe cienti (w1i ; w2i ; :::; wri ) tale che

Ri = w1i x1 + w2i x2 + + wri xr 8i = 1; 2; :::; m: (14.17)

Concentriamoci ora sulla prima colonna di A, C1 = (a11 ; a21 ; :::am1 ). La prima com-
ponente a11 di C1 uguale alla prima componente di R1 , la seconda componente a21
di C1 uguale alla prima componente di R2 , e cos via sino alla m-esima componente
am1 di C1 che uguale alla prima componente di Rm . Grazie alla (14.17), si ha

a11 = w11 x11 + w21 x21 + + wr1 xr1


a21 = w12 x11 + w22 x21 + + wr2 xr1

am1 = w1m x11 + w2m x21 + + wrm xr1

ossia 2 3 2 1 3 2 1 3 2 3
a11 w1 w2 wr1
6 a21 7 6 2 7 6 2 7 6 wr2 7
C1 = 6 7 = x11 6 w1 7 + x21 6 w2 7 + + xr1 6 7:
4 5 4 5 4 5 4 5
m m m
am1 w1 w2 wr
14.4. RANGO 419

La colonna C1 di A si pu quindi scrivere come combinazione lineare dei vettori


w1 ; w2 ; :::; wr dove
2 1 3 2 1 3 2 1 3
w1 w2 wr
6 2 7
w1 7 6 2 7 6 2 7
w1 = 6 ; w 2
= 6 w2 7 ; ; w r
= 6 wr 7 :
4 5 4 5 4 5
m m m
w1 w2 wr

In modo analogo si verica che tutte le n colonne di A si possono scrivere come


combinazione lineare di w1 ; w2 ; :::; wr . Pertanto lo spazio delle colonne di A generato
dagli r vettori w1 ; w2 ; :::; wr di Rm , il che implica che la sua dimensione minore o
uguale a r, cio
AT r = (A):
Scambiando le righe con le colonne e ripetendo gli stessi ragionamenti, si ottiene

r = (A) AT

il che conclude la dimostrazione.

Esempio 236 Torniamo alla matrice


2 3
3 6 18
A=4 1 2 6 5
0 1 3

dellultimo esempio, ma ora consideriamone le righe. Poich la prima riga si ottiene


moltiplicando per 3 la seconda, linsieme di tutte e tre le righe linearmente dipen-
dente. Quindi, AT < 3. Invece, le due righe (3; 6; 18) e (0; 1; 3) sono linearmente
indipendenti, cos come lo sono le righe (1; 2; 6) e (0; 1; 3). Si ha dunque AT = 2.N

Gli insiemi massimi di righe o di colonne linearmente indipendenti possono essere


diversi (nella matrice dellultimo esempio si hanno due diversi insiemi sia per le righe sia
per le colonne), ma la loro cardinalit necessariamente uguale poich (A) = AT .
Alla luce del Corollario 207 ci mostra che le seguenti condizioni sono equivalenti per
unapplicazione lineare T : Rn ! Rn :

(i) T iniettiva;

(ii) T suriettiva;

(iii) le colonne di A sono linearmente indipendenti, cio (A) = n;

(iv) le righe di A sono linearmente indipendenti, cio AT = n.


420 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Lequivalenza di queste condizioni uno dei risultati pi notevoli dellAlgebra


Lineare.

OfB. Talvolta si denisce come rango per righe il massimo numero di righe linearmente
indipendenti, e come rango per colonne ci che noi abbiamo denito come rango, ossia
il massimo numero di colonne linearmente indipendenti. Secondo queste denizioni, il
Teorema 210 aerma che il rango per colonne coincide sempre col rango per righe. Il
rango il loro comune valore.

14.4.3 Propriet
Dal Teorema 210 segue che, se A 2 M (m; n), si ha

(A) min fm; ng : (14.18)

Se accade che (A) = min fm; ng, la matrice A detta di rango pieno (o di rango
massimo): pi di tanto non pu essere.

Si noti che il rango di una matrice non cambia scambiando di posto due colonne.
Ci consente di assumere senza perdere di generalit che, per una matrice A di rango
r, siano le prime r colonne a essere linearmente indipendenti. Tale utile convenzione
verr usata pi volte nelle dimostrazioni della sezione.

Il prossimo risultato raccoglie alcune utili propriet del rango.

Proposizione 211 Siano A; B 2 M (m; n).

(i) (A + B) (A) + (B) e ( A) = (A) per ogni 6= 0.

(ii) (A) = (CA) = (AD) = (CAD) se C e D sono matrici quadrate di rango


pieno3 .

(iii) (A) = AT A .

Il punto (i) mostra il comportamento del rango rispetto alle operazioni vettoriali
di somma e moltiplicazione scalare. I punti (ii) e (iii) sono interessanti propriet di
invarianza del rango rispetto alla moltiplicazione di matrici. Al riguardo, la matrice
quadrata AT A, detta matrice di Gram, importante in Statistica (la incontreremo a
proposito del Metodo dei minimi quadrati).

Dim. (i) Siano r e r0 i ranghi di A e di B: in A vi sono r colonne linearmente


indipendenti e in B ve ne sono r0 . Se r + r0 n laermazione banale perch le
colonne di A + B sono n e non ve ne possono essere pi di n linearmente indipendenti.
3
Di ordine m e n, rispettivamente, per consentire i prodotti CA e AD.
14.4. RANGO 421

Sia allora r + r0 < n. Indichiamo con as e con bs , s = 1; : : : ; n le generiche colonne


delle due matrici, cosicch ls-esima colonna di A + B as + bs . Possiamo sempre
supporre che le r colonne linearmente indipendenti di A siano le prime (cio a1 ; : : : ; ar )
0
e che le r0 colonne linearmente indipendenti di B siano le ultime (cio bn r +1 ; : : : ; bn ).
In tal modo le colonne centrali di A+B (ovvero le as +bs con s = r +1; : : : ; n r0 , sono
0
certamente combinazioni lineari di a1 ; ; ar ; bn r +1 ; : : : ; bn perch le as si possono
0
scrivere come combinazioni lineari di fa1 ; ; ar g e le bs di bn r +1 ; : : : ; bn . Ne segue
che il numero di colonne linearmente indipendenti di A + B non pu superare r + r0 .

(ii) Dimostriamo (A) = (AD), lasciando al lettore la dimostrazione di (A) =


(CA) (luguaglianza (A) = (CAD) si ottiene immediatamente applicando le altre
due).
Se A = O laermazione banalmente vera. Sia dunque A 6= O e sia r il rango
di A; vi sono allora r colonne linearmente indipendenti: diciamole a1 ; a2 ; :::; ar visto
che possiamo sempre supporre che si tratti delle prime r; le altre, ar+1 ; ar+2 ; ; an
sono combinazioni lineari delle prime. Dimostriamo ora che le colonne di AD sono
combinazioni lineari delle colonne di A. A tale scopo, siano A = (aij ) e D = (dij ).
Inoltre siano aRi per i = 1; 2; :::; m e aj per j = 1; 2; :::; n le righe e le colonne di A, e
dj per j = 1; 2; :::; n le colonne di D.

2 3 2 3
aR
1 aR R
1 d1 a1 d2 aR
1 dn
6 aR 7 6 a2 d1 a2 d2
R R
aR 7
2 dn 7
AD = 6
4
2 7 [d1 jd2 j
5 jdn ] = 6
4 5
aR
m aR R
m d1 am d2 aR
m dn

La prima colonna di AD, indicata con (ad)1 ,


2 R 3 2 3
a1 d1 a11 d11 + a12 d21 + ::: + a1n dn1
6 aR
2 d1 7
7 6 7
(ad)1 = 6 6 a21 d11 + a22 d21 + ::: + a2n dn1 7 = d11 a1 +d21 a2 +:::+dn1 an :
4 5=4 5
aR
m d1 am1 d11 + am2 d21 + ::: + amn dn1
La prima colonna di AD dunque combinazione lineare delle colonne di A. Analoga-
mente, si dimostra che la seconda colonna di AD
(ad)2 = d12 a1 + d22 a2 + + dn2 an
e in generale la j-esima colonna di AD
(ad)j = d1j a1 + d2j a2 + + dnj an 8j = 1; 2; :::; n: (14.19)
Quindi, poich ogni colonna di AD combinazione lineare delle colonne di A, lo
spazio generato dalle colonne di AD un sottospazio di Rm che ha dimensione minore
o uguale di quella dello spazio generato dalle colonne di A. In altre parole,
(AD) (A) = r: (14.20)
422 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Supponiamo per assurdo che sia (AD) < (A) = r. Allora, nelle combinazioni lineari
(14.19) una delle prime r colonne di A ha coe ciente sempre nullo (se cos non fosse, lo
spazio delle colonne di AD avrebbe dimensione almeno r, essendo a1 ; a2 ; :::; ar vettori
linearmente indipendenti di Rm ). Senza perdita di generalit supponiamo che sia la
colonna a1 ad avere coe ciente nullo in tutte le combinazioni lineari (14.19). Allora
si ha
d11 = d12 = = d1n = 0
il che assurdo poich D ha rango pieno e non pu avere una riga di soli zeri. Quindi
lo spazio generato dalle colonne di AD ha dimensione almeno r, cio (AD) r.
Insieme alla (14.20), ci prova la tesi.

(iii) Se A, e quindi AT , sono di rango pieno, laermazione segue dal punto prece-
dente. Sia A non di rango pieno e sia (A) = r, con r < minfm; ng. Come visto nel
punto (ii), le colonne di AT A sono combinazioni lineari delle colonne di AT , quindi

(AT A) (AT ) = (A) = r: (14.21)

Ipotizzando che le prime r colonne di A siano linearmente indipendenti, possiamo


scrivere A come
A = B C
m n m r m (n r)

con B di rango pieno pari a r. Quindi

BT BTB BTC
AT A = [B C] = :
CT C TB C TC
Per la propriet (ii), la submatrice B T B, che quadrata di ordine r, ha rango pieno
r. Allora, le r colonne di B T B sono vettori di Rr linearmente indipendenti. Di
conseguenza le prime r colonne di AT A sono vettori di Rn linearmente indipendenti
(se cos non fosse, le r colonne di B T B non sarebbero linearmente indipendenti). Lo
spazio delle colonne di AT A ha dimensione almeno r, cio (AT A) r. Insieme alla
(14.21), ci prova la tesi.

14.4.4 Procedimento gaussiano di eliminazione


Il Procedimento gaussiano di eliminazione un importante algoritmo per il calcolo
del rango di matrici. Un altro algoritmo, detto Procedimento di Kronecker, sar
presentato nella Sezione 14.6.5, dopo aver introdotto i determinanti.
Cominciamo con una banale osservazione. Vi sono matrici che rivelano immedi-
atamente le loro propriet, tra le quali il rango. Per esempio,
2 3
2 3 1 0 0
1 0 0 0 0 6 7
4 0 1 0 0 0 5 e 6 0 1 0 7 (14.22)
4 0 0 1 5
0 0 1 0 0
0 0 0
14.4. RANGO 423

hanno entrambe rango 3: la prima ha le prime tre colonne linearmente indipendenti (si
tratta dei tre vettori fondamentali di R3 ); la seconda ha le prime tre righe linearmente
indipendenti. Le matrici (14.22) sono un caso particolare di matrici a scala, che sono
caratterizzate dalle seguenti propriet:

(i) le righe con componenti non tutte nulle hanno 1 come prima componente non
nulla, detta componente pilota;

(ii) le altre componenti della colonna della componente pilota sono tutte nulle;

(iii) le componenti pilota formano una scaletta da sinistra a destra: una compo-
nente pilota di una riga inferiore alla destra della componente pilota di una
riga superiore;

(iv) le eventuali righe con tutte componenti nulle sono sotto le altre righe, ossia nella
parte bassa della matrice.

Le matrici (14.22) sono a scala, cos come lo anche la matrice:


2 3
1 0 0 0 0
6 0 1 0 0 7 7
6 7
4 0 0 1 3 0 5
0 0 0 0 0

nella quale le componenti pilota sono evidenziate in grassetto. Si noti che una matrice
quadrata a scala quando diagonale, eventualmente seguita da righe di soli zeri: per
esempio 2 3
1 0 0
4 0 1 0 5:
0 0 0
immediato vericare che le righe non nulle (cio le righe con almeno una com-
ponente non nulla) sono linearmente indipendenti. Il rango di una matrice a scala
perci manifesto:

Lemma 212 Il rango di una matrice a scala pari al numero di righe non nulle.

Esistono alcune semplici operazioni che consentono di trasformare qualsiasi matrice


A in una matrice a scala. Tali operazioni, dette operazioni elementari (per riga 4 ), sono:

(1) moltiplicazione di una riga per uno scalare non nullo;

(2) somma a una riga di un multiplo di unaltra riga;


4
Si potrebbero denire anche le analoghe operazioni elementari per colonna, ma preferiamo non
farlo e riferirci sempre alle righe per evitare facili confusioni e errori di calcolo.
424 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

(3) scambio di posto di due righe.

Le tre operazioni equivalgono a premoltiplicare la matrice A per opportune matrici,


dette elementari, quadrate e non singolari. Precisamente, essendo A 2 M (m; n):

(i) la moltiplicazione dells-esima riga di A per equivale a premoltiplicare A per


la matrice Ps ( ) che coincide con la matrice identit di ordine m salvo che nel
posto (s; s) compare anzich 1;

(ii) la somma allr-esima riga di A di volte ls-esima riga equivale a premoltiplicare


A per la matrice Srs ( ) che coincide con la matrice identit di ordine m nella
quale per nel posto (r; s) compare anzich 0;

(iii) lo scambio tra le righe r-esima e s-esima di A equivale a premoltiplicare A per


la matrice Trs che coincide con la matrice identit nella quale si sono scambiate
le stesse due righe.

Esempio 237 Sia 2 3


3 2 4 1
A = 4 1 0 6 9 5:
5 3 7 4

(i) Premoltiplicando A per 2 3


1 0 0
P2 ( ) = 4 0 0 5
0 0 1
si ottiene
2 3 2 3 2 3
1 0 0 3 2 4 1 3 2 4 1
P2 ( ) A = 4 0 0 5 4 1 0 6 9 5=4 0 6 9 5
0 0 1 5 3 7 4 5 3 7 4

nella quale la seconda riga stata moltiplicata per .

(ii) Premoltiplicando A per 2 3


1 0
S12 ( ) = 4 0 1 0 5
0 0 1
si ottiene
2 3 2 3 2 3
1 0 3 2 4 1 3 2 4+6 1+9
4
S12 ( ) A = 0 1 0 5 4 5
1 0 6 9 = 4 1 0 6 9 5
0 0 1 5 3 7 4 5 3 7 4

nella quale alla prima riga stata sommata la seconda moltiplicata per .
14.4. RANGO 425

(iii) Premoltiplicando A per 2 3


0 1 0
T12 =4 1 0 0 5
0 0 1
si ottiene
2 3 2 3 2 3
0 1 0 3 2 4 1 1 0 6 9
T12 A=4 1 0 0 5 4 1 0 6 9 5=4 3 2 4 1 5
0 0 1 5 3 7 4 5 3 7 4

nella quale sono state scambiate le prime due righe. N

Il prossimo risultato, del quale omettiamo la dimostrazione, mostra lunicit della


matrice a scala alla quale si arriva grazie alle operazioni elementari:

Lemma 213 Ogni matrice A 2 M (m; n) si trasforma, secondo le operazioni elemen-


tari, in ununica matrice a scala, indicata con A 2 M (m; n).

Naturalmente, matrici diverse si possono trasformare nella stessa matrice a scala. Si


chiama Procedimento gaussiano di eliminazione la successione di operazioni elementari
che trasformano una matrice A nella matrice a scala A.

Esempio 238 Sia 2 3


3 2 4 1
A = 4 1 0 6 9 5:
5 3 7 4
Si procede come segue (il segno signica che si passa da una matrice allaltra con
unoperazione elementare):
2 3 2 3 2 3
3 2 4 1 1 23 43 13 1 32 4
3
1
3
A = 4 1 0 6 9 5 4 1 0 6 9 5 4 0 32 6 + 43 9 + 13 5
(1) (2)
5 3 7 4 5 3 7 4 5 3 7 4
2 2 4 1
3 2 18 27
3
1 3 3 3
1 0 3 3
4 0 2 22 28 5 4 0 2 22 28 5
(3) 3 3 3 (4) 3 3 3
10 20 5 1 1 7
0 3 3
7 3
4 3
0 3 3 3
2 3 2 3 2 3
1 0 6 9 1 0 0 9 + 21 2
1 0 0 3
2
4 0 2 22 28 5 4 0 2 22 28 5 4 0 2 0 28 154 5
(5) 3 3 3 (6) 3 3 3 (7) 3 3 12
0 0 4 7 0 0 4 7 0 0 4 7
2 3
1 0 0 32
4 0 1 0 21 5
(8) 4
0 0 1 74
426 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

ove: (1) moltiplicazione della prima riga per 1=3; (2) somma della prima riga alla
seconda; (3) somma di 5 volte la prima riga alla terza; (4) sottrazione della seconda
riga dalla prima; (5) somma della met della seconda riga alla terza; (6) somma di 3=2
della terza riga alla prima; (7) sottrazione di 22=12 della terza riga dalla seconda; (8)
moltiplicazione della seconda riga per 3=2 e della terza per 1=4. In conclusione
2 3
1 0 0 23
A=4 0 1 0 21 5
4
7
0 0 1 4
N

Esempio 239 Se A quadrata di ordine n, la matrice a scala A che si ottiene con il


Procedimento gaussiano di eliminazione quadrata di ordine n e triangolare superiore,
con diagonale composta da soli 1 e 0. N

Tornando al calcolo del rango, che era la motivazione iniziale della sezione, la
Proposizione 211 mostra che le operazioni elementari per riga non modicano il rango
di A poich le matrici elementari sono quadrate e non singolari. Si ha quindi:

Proposizione 214 Per ogni matrice A risulta (A) = A .

Per calcolare il rango di una matrice dunque opportuno applicare il Procedimento


gaussiano di eliminazione, cos da ottenere una matrice a scala di ugual rango, il cui
rango manifesto.

Esempio 240 Nellultimo esempio A = 3 perch tutte e tre le righe non sono
nulle. Grazie alla Proposizione 214, (A) = 3. La matrice A di rango massimo. N

14.5 Applicazioni invertibili


14.5.1 Invertibilit
Unapplicazione T 2 L (Rn ) iniettiva usualmente detta invertibile. Grazie al Corol-
lario 207, unapplicazione T 2 L (Rn ) invertibile se sia iniettiva sia suriettiva.
Data unapplicazione invertibile T 2 L (Rn ), consideriamo la sua inversa T 1 :
R ! Rn , sicch T (x) = y se e solo se x = T 1 (y). Siccome T iniettiva, T 1 ben
n

denita; inoltre, essendo T suriettiva, il dominio di T 1 proprio lintero spazio Rn .

Lemma 215 Si ha T 2 L (Rn ) se e solo se T 1


2 L (Rn ).

Il lemma, la cui dimostrazione lasciata al lettore, mostra che linversa T 1


anchessa unapplicazione lineare, ossia T 1 2 L (Rn ). inoltre facile vericare che
1 1
T T = TT =I (14.23)
14.5. APPLICAZIONI INVERTIBILI 427

Esempio 241 (i) Lidentit I : Rn ! Rn invertibile e si ha I 1


= I. (ii) Sia
T : R2 ! R2 denita come T (x) = Ax per ogni x 2 R2 , dove

1 0
A= :
1 2
1
Lapplicazione T invertibile, con T (x) = Bx per ogni x 2 R2 , dove

1 0
B= 1 1 :
2 2

Grazie al Corollario 207, nellultima sezione abbiamo visto una prima caratteriz-
zazione dellinvertibilit tramite la nozione di rango. Si pu dare unaltra caratteriz-
zazione dellinvertibilit.

Proposizione 216 Unapplicazione T 2 L (Rn ) invertibile se e solo se esistono


S; R 2 L (Rn ) tali che
T S = RT = I: (14.24)
1
In tal caso, S ed R sono uniche e si ha S = R = T .

Dim. Solo se. Sia T invertibile; la (14.23) implica che la (14.24) vale con S =
R = T 1 . Se. Assumiamo che esistano S; R 2 L (Rn ) tali che valga la (14.24).
Siano x; y 2 Rn , x 6= y. Si ha T (x) 6= T (y) e quindi T iniettiva. Infatti, se fosse
T (x) = T (y), per la (14.24) si avrebbe

x = R (T (x)) = R (T (y)) = y;

il che contraddice x 6= y. Resta da mostrare che T suriettiva. Sia x 2 Rn e si ponga


y = S (x). Per la (14.24), si ha

T (y) = T (S (x)) = x

e quindi x 2 Im T . Ci implica che Rn = Im T , come desiderato. In conclusione, T


invertibile.
Usando la (14.23) e la (14.24), si ha

S (x) = T 1 T (S (x)) = T 1 ((T S) (x)) = T 1 (x) ;


R (x) = R T T 1 (x) = (R T ) T 1 (x) = T 1 (x)

per ogni x 2 Rn , e quindi S = R = T 1


.

Nella (14.24) abbiamo avuto bisogno sia di T S = I sia di RT = I. Altrimenti, T


potrebbe non essere invertibile.
428 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

14.5.2 Matrici inverse


Sia T 2 L (Rn ) unapplicazione lineare su Rn alla quale associata la matrice quadrata
A. Se T invertibile, la matrice A si dice invertibile; la matrice associata allappli-
cazione inversa T 1 detta matrice inversa di A ed indicata con A 1 . Tornando
allEsempio 241, si ha

1 0 1 1 0
A= e A = 1 1 :
1 2 2 2

Dalla (14.23) si ha
A 1 A = AA 1
= I:
Pi in generale, alla luce del Corollario 209 e della Proposizione 216, si ha la seguente
caratterizzazione:

Corollario 217 Per una matrice quadrata A di ordine n le seguenti propriet sono
equivalenti:

(i) A invertibile;

(ii) le colonne di A sono linearmente indipendenti;

(iii) le righe di A sono linearmente indipendenti;

(iv) (A) = n;

(v) esistono due matrici quadrate B e C di ordine n tali che AB = CA = I. Tali


matrici sono uniche e, di pi, si ha B = C = A 1 .

Dal corollario segue unultima interessante propriet delle matrici inverse:

Proposizione 218 Se le matrici quadrate A e B di ordine n sono invertibili, allora


il loro prodotto invertibile e
AB 1 = B 1 A 1 :

Dim. Siano A e B di ordine n e invertibili. Si ha (A) = (B) = n, sicch (AB) = n


per la Proposizione 211. Per il Corollario 217, la matrice prodotto invertibile. Si
ricordi dalla (7.8) della Sezione 7.4 che, per la composizione di funzioni invertibili f e
g, risulta (g f ) 1 = f 1 g 1 . In particolare ci vale per le applicazioni lineari, ossia
ST 1 = T 1 S 1 , e quindi la Proposizione 202 implica AB 1 = B 1 A 1 .

Fin qui tutto bene. Il problema per calcolare materialmente linversa di una
matrice (invertibile), ossia, data una matrice invertibile A, trovare le componenti della
sua inversa A 1 . Per far ci, dobbiamo fermarci e introdurre i determinanti.
14.6. DETERMINANTI 429

14.6 Determinanti
14.6.1 Denizione
Una matrice contenuta in una matrice A 2 M (m; n) si dice sottomatrice di A. Essa si
pu pensare come ottenuta da A cancellando alcune righe e/o colonne. In particolare,
si indica con Aij la sottomatrice (m 1) (n 1) che si ottiene da A cancellando la
riga i e la colonna j.

Esempio 242 Sia


2 3 2 3
a11 a12 a13 2 1 4
A = 4 a21 a22 a23 5 = 4 3 1 0 5 :
a31 a32 a33 1 6 3
Si ha, per esempio,
a21 a23 3 0 a11 a13 2 4
A12 = = ; A32 = = ;
a31 a33 1 3 a21 a23 3 0
a11 a13 2 4 a12 a13 1 4
A22 = = ; A31 = = :
a31 a33 1 3 a22 a23 1 0
N

Usando le sottomatrici possiamo denire in modo ricorsivo i determinanti di matrici


quadrate (solo per esse si denisce tale nozione). Indichiamo con M (n), invece di
M (n; n), lo spazio delle matrici quadrate di ordine n.

Denizione 104 Il determinante la funzione det : M (n) ! R tale che, per ogni
A 2 M (n):

(i) se n = 1, A = [a11 ], det A = a11 ,


P
(ii) se n > 1, A = (aij ), det A = nj=1 ( 1)1+j a1j det A1j .

Vediamo alcuni esempi di calcolo.

Esempio 243 Se n = 2, il determinante della matrice


a11 a12
A=
a21 a22

det A = ( 1)1+1 a11 det ([a22 ]) + ( 1)1+2 a12 det ([a21 ]) = a11 a22 a12 a21 :
Per esempio, se
2 4
A= ;
1 3
si ha det A = 2 3 4 1 = 2. N
430 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Esempio 244 Se n = 3, il determinante della matrice


2 3
a11 a12 a13
A = 4 a21 a22 a23 5
a31 a32 a33
dato da

det A = ( 1)1+1 a11 det A11 + ( 1)1+2 a12 det A12 + ( 1)1+3 a13 det A13
= a11 det A11 a12 det A12 + a13 det A13
= a11 (a22 a33 a23 a32 ) a12 (a21 a33 a23 a31 ) + a13 (a21 a32 a22 a31 )
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 a11 a23 a32 a12 a21 a33 a13 a22 a31 :

Per esempio, supponiamo di voler calcolare il determinante della matrice


2 3
2 1 4
A=4 3 1 0 5:
1 6 3
Calcoliamo prima i determinanti delle tre sottomatrici A11 , A12 e A13 . Si ha

det A11 = 1 3 0 6=3


det A12 = 3 3 0 1=9
det A13 = 3 6 1 1 = 17

e quindi

det A = 2 det A11 1 det A12 + 4 det A13 = 2 3 1 9 + 4 17 = 65:

Esempio 245 Per una matrice triangolare superiore A si ha

det A = a11 a22 ann ;

cio il suo determinante semplicemente il prodotto degli elementi della diagonale


principale. Infatti tutti gli altri prodotti sono nulli perch vi compare necessariamente
uno degli elementi nulli del triangolo inferiore.
Analogo risultato vale per le matrici triangolari inferiori e quindi per le diagonali. N

Esempio 246 Se A ha tutti gli elementi della prima riga tutti nulli tranne il primo
che vale 1, risulta
2 3
1 0 0 2 3
6 a21 a22 7 a22 a2n
6 a2n 7 6 .. .. .. 7
det 6 .. .. .. .. 7 = det 4 . . . 5
4 . . . . 5
an2 ann
an1 an2 ann
14.6. DETERMINANTI 431

ovvero il suo determinante coincide con quello della sottomatrice A11 . Infatti, in
X
n
det A = ( 1)1+j a1j det A1j ;
j=1

sono nulli tutti gli addendi salvo il primo. Pi in generale, per ogni scalare k si ha
2 3
k 0 0 2 3
6 a21 a22 a a
6 a2n 77 6 .
22
..
2n
.. 7 :
det 6 .. .. .. .. 7 = k det 4 .. . . 5
4 . . . . 5
an2 ann
an1 an2 ann

Simili propriet valgono anche per le colonne. N

Il determinante di una matrice quadrata quindi calcolabile attraverso una proce-


dura ben precisa (un algoritmo) basata sulle sue sottomatrici. Esistono varie tecniche
per semplicare il calcolo dei determinanti (ne vedremo qualcuna tra breve), ma, per i
nostri ni, importante sapere che si tratta di quantit calcolabili attraverso algoritmi.

Chiudiamo con una caratterizzazione della nozione di determinante che risulter


utile nelle dimostrazioni della prossima sezione. Nella Sezione 6.2 si erano introdotte
le permutazioni di un insieme: applichiamo tale nozione allinsieme di numeri N =
f1; 2; :::; ng. Vi sono n! possibili permutazioni e ognuna di esse si pu identicare con
una funzione : N ! N . Per esempio la permutazione

f2; 1; 3; 4; :::; ng;

ottenuta scambiando i primi due elementi di N e lasciando invariati gli altri, identi-
cata dalla funzione : N ! N tale che

(1) = 2 ; (2) = 1 e (s) = s per ogni s 3:

Sia linsieme di tutte le permutazioni di N . Ricordando dalla Sezione 6.2 le nozioni


di permutazioni di classe pari o dispari, deniamo la funzione sgn : ! f 1; 1g come
8
< +1 se di classe pari
sgn = :
: 1 se di classe dispari

Vale la seguente caratterizzazione del determinante, della quale omettiamo la di-


mostrazione:

Teorema 219 Si ha
X Y
n
det A = sgn ai (i) (14.25)
2 i=1

per ogni matrice quadrata A = (aij ) di ordine n.


432 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

In altre parole, si considerano tutte le n! permutazioni dei numeri f1; 2; :::; ng e


si considerano le loro parit. Poi si considerano gli n! prodotti del tipo a1 (1) a2 (2)
an (n) , dove si ha il segno + se la permutazione di classe pari e il segno se essa
di classe dispari. Il determinante di A risulta essere la somma (con segno) di tali n!
prodotti.
Si osservi che tutti i termini della sommatoria (14.25) contengono un solo elemento
di ogni riga e un solo elemento di ogni colonna. Ci sar cruciale nelle dimostrazioni
della prossima sezione.

14.6.2 Propriet
La prossima proposizione raccoglie le principali propriet dei determinanti, utili anche
per il loro calcolo. In essa linea sta indierentemente per riga o per colonna: le
propriet valgono infatti simmetricamente sia per le righe sia per le colonne della
matrice. Linee parallelesignica due righe oppure due colonne.

Proposizione 220 Siano A e B due matrici quadrate dello stesso ordine. Allora:

(i) Se una linea di A nulla, det A = 0.

(ii) Se si moltiplica una linea di A per uno scalare k, il determinante risulta molti-
plicato per k.

(iii) Se si scambiano tra loro due linee parallele, il determinante cambia (solo) di
segno.

(iv) Se due linee parallele sono uguali, il determinante nullo.

(v) Se una linea di A somma di due vettori b e c, il determinante di A la somma


dei determinanti delle due matrici che si ottengono prendendo tale linea pari una
volta a b e laltra a c.

(vi) Se si somma a una linea un multiplo di una linea parallela, il determinante non
cambia.

(vii) det A = det AT .

Dim. Nella dimostrazione cruciale la caratterizzazione del determinante riportata


nella Proposizione 219, e in particolare losservazione che ogni termine che compare
nel determinante contiene esattamente un elemento di ogni riga e un elemento di ogni
colonna. Ci limiteremo a considerare le righe.
(i) In tutti i prodotti che costituiscono il determinante compare un elemento di
ciascuna riga (e di ciascuna colonna): se una riga nulla, tutti i prodotti sono nulli.
(ii) Per lo stesso motivo, tutti i prodotti risultano moltiplicati per k.
(iii) Scambiando due righe (o due colonne) tutte le permutazioni pari diventano
dispari e viceversa, quindi il determinante cambia di segno.
14.6. DETERMINANTI 433

(iv) Sia A la matrice che ha la riga i uguale alla riga j e sia Aij la matrice A con
le righe i e j scambiate. Allora, per il punto (iii) det Aij = det A. Tuttavia, poich
le due righe scambiate sono uguali, si ha A = Aij , quindi det Aij = det A. Questo
possibile se e solo se det Aij = det A = 0:
(v) Sia
2 1 3 2 1 3
a a
6 a2 7 6 a2 7
6 . 7 6 . 7
6 . 7 6 . 7
6 . 7 6 . 7
A=6 r 7=6 7:
6 a 7 6 b+c 7
6 . 7 6 . 7
4 .. 5 4 .. 5
am am
Indichiamo con 2 3 2 3
a1 a1
6 a2 7 6 a2 7
6 .. 7 6 .. 7
6 7 6 7
6 . 7 6 . 7
Ab = 6 7 e Ac = 6 7
6 b 7 6 c 7
6 .. 7 6 .. 7
4 . 5 4 . 5
am am
le due matrici che si ottengono considerando come r-esima riga una volta b e una volta
c. Risulta allora
!
X Yn X Y
det A = sgn ai (i) = sgn ai (i) (b + c)r (r)
2 i=1 2 i6=r
! !
X Y X Y
= sgn ai (i) br (r) + sgn ai (i) cr (r) = det Ab + det Ac
2 i6=r 2 i6=r

il che completa la dimostrazione del punto.


(vi) Sia
2 3
a1
6 a2 7
6 7
A=6 .. 7:
4 . 5
am

La matrice ottenuta da A sommando per esempio k volte la prima riga alla seconda,
B 2 3
a1
6 a2 + ka1 7
6 7
B=6 .. 7:
4 . 5
m
a
434 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Siano inoltre 2 3 2 3
a1 a1
6 ka1 7 6 a1 7
6 7 6 7
C=6 .. 7 e D=6 .. 7
4 . 5 4 . 5
am am
Per il punto (v) si ha det B = det A + det C. Daltra parte, per il punto (ii) si ha
det C = k det D. Ma poich D ha due righe uguali, per il punto (i) si ha det D = 0:
Quindi det B = det A.
(vii) La trasposizione non altera nessuno degli n! prodotti che formano il determi-
nante, nonch la loro parit.

Osserviamo che una importante conseguenza operativa della Proposizione 220


che le operazioni elementari modicano il determinante di A nel seguente modo:

(1) moltiplicando una riga della matrice A per una costante 6= 0 il determinante
della matrice trasformata pari a det A (punto (ii) della Proposizione 220);
(2) sommando a una riga di A il multiplo di unaltra riga, il determinante della
matrice trasformata non cambia (punto (vi) della Proposizione 220);
(3) scambiando due righe di A il determinante della matrice trasformata pari a
det A (punto (iii) della Proposizione 220).

Losservazione appena fatta permette di dimostrare la seguente importante carat-


terizzazione delle matrici quadrate di rango pieno.

Proposizione 221 Sia A quadrata di ordine n. Risulta det A 6= 0 se e solo se le linee


(parallele) di A sono linearmente indipendenti.

Dim. Dimostriamo la proposizione per le righe, omettendo lanaloga dimostrazione


per le colonne. Se. Se A ha le righe linearmente indipendenti, essa ha rango pieno.
Allora, con una serie di operazioni elementari, possibile trasformarla nella matrice
identit di ordine n. Se per contra det A = 0, con le operazioni elementari il deter-
minante della matrice trasformata sarebbe nullo, il che assurdo perch la matrice
identit ha determinante pari a 1. Quindi det A 6= 0.
Solo se. Se le righe non sono linearmente indipendenti, almeno una combi-
nazione lineare di altre: essa pu allora essere ridotta a diventare nulla sommandole
ripetutamente opportuni multipli delle altre. Per il punto (i) della Proposizione 220,
il determinante della matrice trasformata nullo, e tale deve essere il determinante di
A, il che assurdo poich det A 6= 0 per ipotesi. Quindi, se det A 6= 0 le righe di A
sono linearmente indipendenti.

I determinanti si comportano bene rispetto al prodotto, come mostra il prossi-


mo risultato (talvolta detto Teorema di Binet). la propriet pi importante dei
determinanti.
14.6. DETERMINANTI 435

Teorema 222 Se A e B sono due matrici quadrate dello stesso ordine n, si ha

det AB = det A det B:

Dim. Se (almeno) una delle due matrici, diciamo A, ha le righe linearmente dipendenti
lasserto banalmente vero perch le righe di AB, essendo combinazioni lineari di quelle
di A, sono anchesse linearmente dipendenti e quindi

det AB = 0 = det A det B:

Supponiamo quindi che A e B siano di rango pieno. Se A una matrice diagonale, la


tesi immediata. Infatti, osserviamo che in tal caso det A = a11 a22 ann . Inoltre si
ha
0 10 1
a11 0 0 b11 b12 b1n
B 0 a22 0 C B b2n C
AB = B C B b21 b22 C
@ A@ A
0 0 ann bn1 bn2 bnn
0 1
a11 b11 a11 b12 a11 b1n
B a22 b21 a22 b22 a22 b2n C
= B @
C:
A
ann bn1 ann bn2 ann bnn
Applicando la propriet (ii) della Proposizione 220 si ha

det AB = a11 a22 ann det B = det A det B

che la tesi.
Se A non diagonale, possibile trasformarla in matrice diagonale applicando
opportunamente la seconda e la terza delle operazioni per righe elencate nellalgorit-
mo di Gauss. Come si visto, tali operazioni equivalgono a premoltiplicare A per
una opportuna matrice. In particolare, per sommare volte la riga r alla riga s si
premoltiplica A per la matrice Srs ( ) che la matrice identit con 6= 0 nel posto
(r; s) anzich lo 0. Per scambiare le righe r ed s si premoltiplica A per la matrice Trs
ottenuta dallidentit scambiando le righe r ed s.
Nel rendere diagonale A (cio nel diagonalizzarla), supponiamo di eettuare prima
le trasformazioni T di scambio righe e poi le trasformazioni S ( ) di somma di un
multiplo di una riga ad unaltra riga. Supponiamo inoltre che occorra eettuare h
volte la trasformazione S ( ) e k volte la trasformazione T per avere una matrice
diagonale. Sia D la matrice diagonale cos ottenuta, cio

D = S ( )S ( ) S ( )T T T A:
| {z }| {z }
h k

Allora, poich D diagonale, sappiamo che

det DB = det D det B:


436 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Daltra parte, poich la matrice D la matrice A trasformata da h trasformazioni


elementari che non ne modicano il determinante e k trasformazioni che cambiano il
segno del determinante, si ha che

det D = ( 1)k det A

e quindi
det DB = ( 1)k det A det B: (14.26)
Analogamente, poich il prodotto tra matrici gode della propriet associativa, si ha

DB = (S ( ) S ( )T T A) B = (S ( ) S ( )T T ) (AB)

e quindi DB la matrice AB trasformata da h trasformazioni elementari che non ne


modicano il determinante e k trasformazioni che cambiano il segno del determinante.
Quindi, analogamente a prima si ha

det DB = ( 1)k det AB: (14.27)

Mettendo insieme le (14.26) e (14.27) si ottiene

det AB = det A det B

che ci che si voleva dimostrare.

Poich I = A 1 A, uninteressante conseguenza del risultato che, quando A


invertibile,
1
det A 1 = :
det A

14.6.3 Teorema di Laplace


Sia A una matrice quadrata di ordine n. Si dice complemento algebrico di aij , e si
indica con aij , il numero
aij = ( 1)i+j det Aij :
Si chiama matrice aggiunta, e si indica con A , la matrice che ha come elementi i
complementi algebrici degli elementi di A:

A = aij

con i; j = 1; 2; ; n.

Esempio 247 Sia 2 3


1 3 0
A= 4 5 1 2 5
3 6 4
14.6. DETERMINANTI 437

Per a11 = 1, risulta

1 2
A11 = e det A11 = 16:
6 4

Perci a11 = ( 1)1+1 ( 16) = 16.

Per a12 = 3, risulta

5 2
A12 = e det A12 = 26
3 4

Perci a12 = ( 1)1+2 26 = 26.

Per a13 = 0, risulta

5 1
A13 = e det A13 = 34:
3 6

Perci a13 = ( 1)1+3 34 = 34.

Analogamente

a21 = ( 1)2+1 12 = 12 ; a22 = ( 1)2+2 4 = 4 ; a23 = ( 1)2+3 ( 15) = 15


a31 = ( 1)3+1 6 = 6 ; a32 = ( 1)3+2 2 = 2 ; a33 = ( 1)3+3 ( 16) = 16:

Quindi 2 3
16 26 34
A =4 12 4 15 5 :
6 2 16
N

Usando la nozione di complementi algebrico, si pu vedere il determinante di una


matrice quadrata come somma dei prodotti degli elementi della prima riga per i propri
complementi algebrici, cio
X n
det A = a1j a1j
j=1

Il prossimo risultato, detto Secondo Teorema di Laplace, mostra che, in realt, il


determinante si pu calcolare usando qualsiasi riga o colonna della matrice: non vi
nulla di speciale nella prima riga.

Proposizione 223 Il determinante di una matrice quadrata A uguale alla som-


ma dei prodotti degli elementi di una linea qualsiasi (riga o colonna) per i propri
complementi algebrici.
438 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

In simboli, scegliendo la riga i,


X
n
det A = aij aij
j=1

ovvero, scegliendo la colonna j,


X
n
det A = aij aij :
i=1

Dim. Per la prima riga lasserto una semplice parafrasi della denizione di deter-
minante. Verichiamolo per la riga i-esima. Per il punto (vi) della Proposizione 220
possiamo riscrivere det A nel seguente modo:
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
det A = det 6 ai1 aij ain 7 (14.28)
6 . . 7
4 .. .. 5
an1 anj ann
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
= ai1 det 6 1 0 0 7+
6 . .. 7
4 .. . 5
an1 anj ann
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
+ aij det 6 0 1 0 7+
6 . .. 7
4 .. . 5
an1 anj ann
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
+ ain det 6 0 0 1 7
6 . .. 7
4 .. . 5
an1 anj ann
Calcoliamo il determinante della sottomatrice relativa al termine (i; j):
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7
det 6 0 1 0 7 (14.29)
6 . .. 7
4 .. . 5
an1 anj ann
14.6. DETERMINANTI 439

Osserviamo che per poter applicare la denizione di determinante e usare la nozione di


complemento algebrico, necessario eettuare opportune operazioni per riga e trasfor-
mare la matrice (14.29) in una matrice che ha come prima riga (1; 0; 0; :::0), come prima
colonna (1; a1j ; a2j ; :::; ai 1;j ; ai+1;j ; :::anj ) e Aij come sottomatrice di Sud-Est.
2 3
1 0 0 0 0
6 a1j a11 a1;j 1 a1;j+1 a1n 7
6 7
6 7
6 7
Ae = 6 ai 1;j ai 1;1 ai 1;j 1 ai 1;j+1 ai 1;n 7
6 7:
6 ai+1;j ai+1;1 ai+1;j 1 ai+1;j+1 ai 1;n 7
6 7
4 5
anj an1 an;j 1 an;j+1 an;n

La trasformazione richiede i 1 scambi di righe adiacenti per portare la i-esima riga


in cima, e j 1 scambi di colonne adiacenti per portare la j-esima colonna a sinistra
(lasciando invariati gli ordinamenti tra le altre righe e colonne). Evidentemente si ha

e = 1 det Aij
det A

e quindi
2 3
a11 a1j a1n
6 .. .. 7
6 . . 7
6 7 e = ( 1)i+j det Aij = a : (14.30)
det 6 0 1 0 7 = ( 1)i+j 2
det A ij
6 . .. 7
4 .. . 5
an1 anj ann

Applicando la formula (14.28) e utilizzando (14.30) si ottiene la tesi.

Esempio 248 Sia 2 3


1 3 4
A=4 2 0 2 5:
1 3 1
Utilizzando il precedente risultato, osserviamo che pi semplice calcolare il determi-
nante usando la seconda riga poich essa contiene un termine nullo, il che agevola i
conti. Allora

det A = a21 a21 + a22 a22 + a23 a23


3 4 1 3
= ( 2)( 1)2+1 det + 0 + (2)( 1)2+3 det
3 1 1 3
= ( 2)( 1)( 15) + 0 + (2)( 1)(0) = 30:

N
440 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Il prossimo risultato, detto Primo Teorema di Laplace, completa il precedente


mostrando ci che accade se usiamo i complementi algebrici di una diversa riga (o
colonna).

Proposizione 224 La somma dei prodotti degli elementi di una riga (colonna) qual-
siasi per i complementi algebrici di una diversa riga (colonna) nullo.

In simboli, scegliendo la riga i,


X
n
aij aqj = 0 per ogni q 6= i
j=1

ovvero, scegliendo la colonna j,


X
n
aij aiq = 0 per ogni q 6= j
i=1

Dim. Immaginiamo di sostuire la i-esima riga alla q-esima. Risulta allora det A =
P n
j=1 aij aqj . Ma, daltra parte, il determinante nullo perch la matrice ha due righe
uguali.

Esempio 249 Sia 2 3


1 0 2
A= 4 2 1 3 5:
2 4 1
Allora

a11 = ( 1)1+1 ( 13) = 13 ; a12 = ( 1)1+2 4 = 4 ; a13 = ( 1)1+3 10 = 10


a21 = ( 1)2+1 8 = 8 ; a22 = ( 1)2+2 ( 3) = 3 ; a23 = ( 1)2+3 ( 4) = 4
a31 = ( 1)3+1 2 = 2 ; a32 = ( 1)3+2 1 = 1 ; a33 = ( 1)3+3 ( 1) = 1:

Sommiamo i prodotti degli elementi della seconda riga per i complementi algebrici
della prima riga:

(2)a11 + (1)a12 + (3)a13 = 26 4 + 30 = 0:

Sommiamo i prodotti degli elementi della seconda riga per i complementi algebrici
della prima riga:
(2)a31 + (1)a32 + (3)a33 = 4 1 3 = 0:
Il lettore pu vericare che si ottiene 0 in tutti i casi in cui si sommino i prodotti degli
elementi di una riga per i complementi algebrici di una riga diversa. N

I due ultimi risultati si compendiano nel celebre Teorema di Laplace:


14.6. DETERMINANTI 441

Teorema 225 (Laplace) Sia A una matrice quadrata di ordine n. Risulta:

(i) scegliendo la riga i, (


X
n
det A se q = i
aij aqj =
j=1 0 se q 6= i

(ii) scegliendo la colonna j,


(
X
n
det A se q = j
aij aiq =
i=1 0 se q 6= j

Il Teorema di Laplace loccasione per introdurre il classico simbolo di Kronecker:

1 se i = j
ij =
0 se i 6= j

dove i e j sono due qualsiasi numeri naturali (per esempio, 11 = 33 = 1 e 13 = 31 =


0). Grazie a tale simbolo, la (i) e (ii) del Teorema di Laplace assumono la seguente
elegante veste:
Xn Xn
aij aqj = iq det A e aij aiq = jq det A
j=1 i=1

come il lettore invitato a vericare.

14.6.4 Inverse e determinanti


Torniamo alle matrici inverse. Il prossimo risultato mostra limportanza dei determi-
nanti nel loro calcolo.

Teorema 226 Una matrice quadrata A invertibile se e solo se det A 6= 0. In tal


caso, si ha
1
A 1= (A )T ;
det A
1
cio le componenti aij della matrice inversa A 1 sono

aji det Aji


aij1 = = ( 1)i+j : (14.31)
det A det A
Una matrice (quadrata) A per cui det A = 0 detta singolare. Con questa ter-
minologia, il Teorema 226 aerma che una matrice invertibile se e solo se non
singolare. Grazie al Corollario 217, le seguenti propriet sono quindi equivalenti:

(i) A invertibile;
442 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

(ii) det A 6= 0, ovvero A non singolare;

(iii) le colonne di A sono linearmente indipendenti;

(iv) le righe di A sono linearmente indipendenti;

(v) (A) = n;

Dim. Se
2 3 2 3
aR
1 a1 R
6 aR 7 6 a2 R 7
A = (aij ) = 6
4
2 7
5 e A = (aij ) = 6
4
7
5
aR
n anR

si ha 2 3
aR
1
6 aR 7 R
A(A )T = 6
4
2 7 a1 j a2 R j
5 j anR :
aR
n

Applicando il Teorema di Laplace si ha che il posto (i; q) nella matrice prodotto di A


e (A )T , A(A )T ,
X
n
det A se i = q
aR
i aq R = aij aqj = :
0 se i 6= q
j=1

Analogamente, il posto (i; q) nella matrice prodotto di (A )T e A, (A )T A,

X
n
det A se i = q
C
ai aC
q = aji ajq = ;
0 se i 6= q
j=1

dove ai C la i-esima colonna di A e aC q la q-esima colonna di A. Quindi la matrice


T T
prodotto A (A ) uguale a (A ) A e entrambe sono uguali alla matrice (di ordine
n) che ha elementi tutti nulli fuori dalla diagonale principale ed elementi tutti pari a
det A sulla diagonale principale:
2 3
det A 0 0
6 0 det A 0 7
6 7
A (A )T = (A )T A = 6 .. .. .. .. 7 = det A In ;
4 . . . . 5
0 0 det A
ovvero
1 1
A (A )T = (A )T A = In ;
det A det A
14.6. DETERMINANTI 443

il che permette di concludere che


1
A 1
= (A )T ;
det A
cio che linversa della matrice A coincide con la trasposta della sua matrice aggiunta
moltiplicata per il reciproco del determinante di A.

Lultimo teorema importante perch, attraverso i determinanti, fornisce un algo-


ritmo che permette sia di vericare linvertibilit di A sia di calcolare le componenti
dellinversa A 1 . Si noti che nella formula (14.31) il pedice di Aji proprio ji e non
ij.

Esempio 250 Usiamo la formula (14.31) per calcolare linversa della matrice

1 2
A= :
3 5

Si ha
det A11 a22 5
a111 = ( 1)1+1 = == 5
det A a11 a22 a12 a21 1
det A21 a12 2
a121 = ( 1)1+2 = = =2
det A a11 a22 a12 a21 1
det A12 a21 3
a211 = ( 1)2+1 = = =3
det A a11 a22 a12 a21 1
det A22 a11 1
a221 = ( 1)2+2 = = = 1
det A a11 a22 a12 a21 1
e quindi
a22 a12
1 det A det A
5 2
A = a21 a11 = :
det A det A
3 1
N

Esempio 251 Una matrice diagonale A invertibile se nessun elemento della di-
agonale nullo. In tal caso linversa A 1 diagonale e la formula (14.31) implica
che
1
1 aij
se i = j
aij = :
0 se i 6= j
N

Esempio 252 Per la matrice


2 3
1 3 0
A= 4 5 1 2 5
3 6 4
444 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

avevamo visto che 2 3


16 26 34
A =4 12 4 15 5 :
6 2 16
Perci 2 3
16 12 6
T
(A ) = 4 26 4 2 5:
34 15 16
Risulta anche det A = 94 e quindi
2 3 2 8 6 3
3
16 12 6
1 1 4 47 47 47
A 1
= (A )T = 26 4 2 5=4 13
47
2
47
1
47
5:
det A 94 17 15 8
34 15 16 47 94 47

N
Da ultimo si osservi che, per stabilire se k assegnati vettori x1 ; x2 ; :::; xk 2 Rn sono
linearmente indipendenti (con k n altrimenti la risposta certamente negativa)
si pu costruire la matrice n k che ha come colonne i suddetti vettori: essi sono
linearmente indipendenti se e solo se il rango di tale matrice k. In particolare quando
k = n il determinante della matrice a dare una risposta al problema: esso diverso
da zero se e solo se i vettori sono linearmente indipendenti.

14.6.5 Procedimento di Kronecker


Il Procedimento di Kronecker un algoritmo per laccertamento del rango di una
matrice basato sui determinanti. Per introdurlo presentiamo prima un podi termi-
nologia.
Sia A una matrice quadrata di ordine n. Si dicono:
(i) minori principali i determinanti delle sottomatrici quadrate che si ottengono
eliminando alcune righe e le colonne di ugual posto;
(ii) minori principali di Nord Ovest (NW) i minori principali che si ottengono elim-
inando le ultime k righe e le ultime k colonne, con 0 k n 1.
Esempio 253 Sia 2 3
1 3 2
A = 4 10 1 2 5 :
3 5 7
I determinanti
1 3 1 2
det A = 101 ; det = 29 ; det = 3 ; det [1] = 1
10 1 5 7
1 2
det = 1 ; det [7] = 7
3 7
14.6. DETERMINANTI 445

sono suoi minori principali.


La precedente matrice A possiede tre soli minori principali di NW:
1 3
det A = 101 ; det = 29 ; det [1] = 1
10 1

Una matrice quadrata di ordine n possiede


n n
k k
minori di ordine k (cio determinanti di sottomatrici quadrate di ordine k): infatti si
n
possono eliminare n k righe in modi diversi e in altrettanti modi si possono
k
n
eliminare n k colonne (s da lasciarne k e k). Di essi sono minori principali.
k
Vi un solo minore principale di NW di ordine k: quello che si ottiene eliminando le
ultime n k righe e colonne.

Prima di presentare il cosiddetto Procedimento di Kronecker, ricordiamo alcuni


risultati dimostrati in precedenza.
Ricordiamo che se il rango di una matrice r, essa contiene al pi r, e non pi di
r, colonne (e quindi anche r righe) linearmente indipendenti.
Ricordiamo che r vettori x1 ; x2 ; :::; xr di Rr sono linearmente indipendenti se e solo
se diverso da 0 il determinante della matrice quadrata di ordine r che li ha come
vettori riga (o colonna).
Osserviamo inne che se r vettori x1 ; x2 ; :::; xr di Rr sono linearmente indipendenti
in Rr , allora sono linearmente indipendenti in Rn anche gli r vettori y 1 ; y 2 ; :::; y r di Rn ,
n > r che hanno esattamente x1 ; x2 ; :::; xr come loro prime r componenti (la propriet
facile da vericare ed stata gi usata nella dimostrazione della Proposizione 211).
La seguente proposizione, della quale omettiamo la semplice dimostrazione, si rivela
molto utile per la ricerca del rango di una matrice.

Proposizione 227 (Kronecker) Le seguenti propriet sono equivalenti per una ma-
trice A:

(i) A ha rango r;
(ii) A ha un minore di ordine r non nullo e tutti i minori di ordine r + 1 sono nulli;
(iii) A ha un minore di ordine r non nullo e tutti i minori di ordine r + 1 che lo
contengono nulli;
(iv) A ha un minore di ordine r non nullo e tutti i minori di ordine > r nulli.

Il Procedimento di Kronecker per laccertamento del rango di una matrice si basa


sul Teorema di Kronecker e si pu illustrare come segue:
446 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

(i) Si sceglie come pilota una sottomatrice quadrata di ordine di A che sia
visibilmente non singolare (con determinante non nullo); siccome locchio ha i
suoi limiti, concretamente si prende spesso una sottomatrice di ordine 2.
(ii) Si orla in tutti i modi possibili la sottomatrice pilota con una delle righe e
una delle colonne superstiti. Se tutti tali minori orlati (di ordine + 1) sono
nulli, il rango di A e il procedimento nisce qui. Se ci si imbatte in un minore
non nullo di ordine + 1, si riparte prendendolo come nuovo pilota.
Esempio 254 Sia 2 3
6 3 9 0
A=4 4 1 7 2 5:
8 10 6 12
Scegliamo come pilotail minore di ordine 2
6 3
det = 6 6= 0
4 1
e quindi il rango di A almeno 2. Con le ultime due colonne e lultima riga non
utilizzate si ottengono i seguenti minori orlati:
2 3 2 3
6 3 9 6 3 0
det 4 4 1 7 5 = 0 ; det 4 4 1 2 5=0
8 10 6 8 10 12
e perci il rango di A 2. N
Da ultimo, facciamo esplicitamente notare che il rango di una matrice simultane-
amente tante cose (e ognuna ne una plausibile denizione):
1. il rango di una matrice il massimo numero di colonne linearmente indipendenti;
2. il rango di una matrice il massimo numero di righe linearmente indipendenti;
3. il rango di una matrice il massimo ordine dei suoi minori non tutti nulli;
4. il rango di una matrice la dimensione dello spazio vettoriale delle immagini
della funzione lineare da essa determinata.

14.7 Sistemi lineari quadrati


Usando le matrici inverse si pu dare una procedura per risolvere i sistemi lineari
quadrati, cio di n equazioni in n incognite:
8
> a11 x1 + a12 x2 +
>
<
+ a1n xn = b1 ;
a21 x1 + a22 x2 + + a2n xn = b2 ;
>
>
:
an1 x1 + an2 x2 + + ann xn = bn ;
14.7. SISTEMI LINEARI QUADRATI 447

che si possono scrivere in forma matriciale

A x = b (14.32)
n nn 1 n 1

dove A una matrice quadrata n n, mentre x e b sono vettori in Rn . Ci poniamo


due problemi riguardo al sistema (14.32):

Esistenza: quali condizioni assicurano che il sistema abbia soluzione per ogni
vettore b 2 Rn , ossia quando, per ogni dato b 2 Rn , esiste x 2 Rn tale che
Ax = b?

Unicit: quali condizioni assicurano che tale soluzione sia unica, ossia quando,
per ogni dato b 2 Rn , esiste un unico x 2 Rn tale che Ax = b?

Per inquadrare il problema in quanto abbiamo studiato nora, si consideri lap-


plicazione lineare T : Rn ! Rn associata ad A, denita come T (x) = Ax per ogni
x 2 Rn . immediato vedere che:

il sistema ammette soluzione per un dato b 2 Rn se e solo se b 2 Im T ; in parti-


colare, il sistema ammette soluzione per ogni b 2 Rn se e solo se T suriettiva,
ossia Im T = Rn ;

il sistema ammette ununica soluzione per un dato b 2 Rn se e solo se la con-


troimmagine T 1 (b) un singoletto; in particolare, il sistema ammette ununica
soluzione per ogni b 2 Rn se e solo se T iniettiva5 .

Poich iniettivit e suriettivit, per il Corollario 207, sono propriet equivalenti, i


due problemi di esistenza ed unicit sono tra loro equivalenti: esiste una soluzione per
il sistema (14.32) per ogni b 2 Rn se e solo se tale soluzione unica.
In particolare, condizione necessaria e su ciente a nch tale unica soluzione esista
per ogni b 2 Rn che lapplicazione T sia invertibile, cio che valga una delle seguenti
condizioni equivalenti:

(i) la matrice A invertibile;

(ii) la matrice A non singolare, cio det A 6= 0;

(iii) la matrice A di rango pieno, cio (A) = n.

La condizione cercata perci linvertibilit della matrice A, o una delle sue equiv-
alenti propriet (ii) e (iii). Formalmente, si ha il seguente risultato, spesso chiamato
Teorema di Cramer, che discende facilmente da quanto abbiamo visto nora.
5
Si ricordi che una funzione iniettiva se e solo se tutte le sue controimmagini sono singoletti.
448 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Teorema 228 (Cramer) Sia A 2 M (n). Il sistema (14.32) ha una sola soluzione
per ogni b 2 Rn se e solo se la matrice A invertibile. La soluzione data da

x = A 1 b:

Dim. Se. Sia A invertibile. Lapplicazione lineare associata T : Rn ! Rn


invertibile, e quindi sia suriettiva sia iniettiva. Poich T suriettiva, il sistema ha
soluzione. Poich T iniettiva, tale soluzione unica. In particolare, la soluzione
corrispondente a un assegnato b 2 Rn T 1 (b). Poich T 1 (y) = A 1 y per ogni
y 2 Rn , ne segue che la soluzione 6 T 1 (b) = A 1 b.
Solo se. Si assuma che il sistema (14.32) ammetta una ed una sola soluzione per
ogni b 2 Rn . Ci signica che per ogni vettore b 2 Rn esiste un solo vettore x 2 Rn
tale che T (x) = b. Pertanto, lapplicazione T biiettiva, ed quindi invertibile. Ne
segue anche che A invertibile.

Il sistema (14.32) ammette quindi soluzione per ogni b se e solo se la matrice A


invertibile e, cosa ancor pi importante, lunica soluzione si esprime in termini di A 1 .
Siccome, grazie al Teorema 226, sappiamo calcolare A 1 attraverso i determinanti,
abbiamo ottenuto una procedura di risoluzione di sistemi lineari di n equazioni in n
incognite. In particolare, grazie Teorema 226 la formula x = A 1 b si pu scrivere come
1
x= (A )T b
det A
e in questa forma detta regola di Cramer.

Esempio 255 Un caso particolare del sistema (14.32) si ha quando b = 0. In tal caso
il sistema detto omogeneo e, per la Proposizione 228, lunica soluzione x = 0. N

Esempio 256 Per il sistema di 2 equazioni in 2 incognite:

x1 + 2x2 = b1
3x1 + 5x2 = b2

si ha
1 2
A=
3 5
6
Alternativamente, si pu dimostrare il Seanche nel seguente modo, molto meccanico. Si ponga
x = A 1 b; si ha
Ax = A A 1 b = AA 1 b = Ib = b;
1
e quindi x = A e 2 Rn unaltra soluzione,
b risolve il sistema. anche lunica soluzione. Infatti, se x
si avrebbe
1 1 1
e = Ix
x e= A e=A
A x (Ae
x) = A b;
come desiderato.
14.7. SISTEMI LINEARI QUADRATI 449

DallEsempio 250 sappiamo che A invertibile. Per la Proposizione 228, lunica


soluzione del sistema quindi
5 2 b1 5b1 + 2b2
x = A 1b = =
3 1 b2 3b1 b2
N
Esempio 257 Per il sistema di 3 equazioni in 3 incognite:
8
< x1 2x2 + 2x3 = b1
2x2 x3 = b2
:
x 2 x 3 = b3
si ha 2 3
1 2 2
A=4 0 2 1 5
0 1 1
Usando le sottomatrici, facile (ma tedioso) vericare che det A = 1 6= 0. Quindi,
A invertibile e, usando la formula (14.31), si pu vericare che
2 3
1 0 2
A 1=4 0 1 1 5
0 1 2
Per la Proposizione 228, lunica soluzione del sistema quindi
2 32 3 2 3
1 0 2 b1 b1 + 2b3
x = A 1b = 4 0 1 1 5 4 b2 5 = 4 b2 b3 5
0 1 2 b3 b2 2b3
Per esempio, se b = (1; 1; 2), si ha
x = (1 + 2 2; 1 2; 1 2 2) = (5; 3; 5)
N
Esempio 258 Per il sistema lineare
8
< 2x1 3x2 + 4x3 = 5
6x1 + 4x2 + 5x3 = 4
:
10x1 + 5x2 x3 = 0
si ha 2 3
2 3 4
A= 4 6 4 5 5
10 5 1
e b = (5; 4; 0). Il lettore pu vericare che det A = 266 e che la soluzione del sistema

77 112 210
x= ; ;
266 266 266
N
450 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

14.8 Sistemi lineari generali


Consideriamo il sistema lineare di m equazioni in n incognite
8
>
> a11 x1 + a12 x2 + + a1n xn = b1
>
<
a21 x1 + a22 x2 + + a2n xn = b2
;
>
>
>
:
am1 x1 + am2 x2 + + amn xn = bm

detto rettangolare perch non si richiede che n = m. Il sistema si scrive in forma


matriciale come
A x = b
m nn 1 m 1
n m
dove A 2 M (m; n), x 2 R e b 2 R . Il sistema quadrato il caso speciale n = m.

Sia T (x) = Ax lapplicazione T : Rn ! Rm associata al sistema. Si usa dire che il


sistema :

(i) impossibile quando non ammette nessuna soluzione, cio b 2


= Im T ;

(ii) possibile quando ammette almeno una soluzione, cio b 2 Im T .

A sua volta, un sistema lineare possibile si dice:

1
(ii.a) determinato quando ammette una sola soluzione, cio T (b) un singoletto;
1
(ii.b) indeterminato quando ammette innite soluzioni, cio T (b) ha cardinalit
innita.

Le due indicate esauriscono tutte le possibilit: se un sistema ammette due soluzioni,


ne ha certamente innite. Infatti se x e x0 ne sono due diverse soluzioni, cio se
Ax = Ax0 = b, allora anche tutte le combinazioni lineari x + (1 ) x0 ne sono
soluzione per ogni 2 R dato che

A ( x + (1 ) x0 ) = Ax + (1 ) Ax0 = b + (1 ) b = b:

Usando questa terminologia, nel caso n = m il Teorema di Cramer aerma che


un sistema lineare quadrato possibile per ogni vettore b se e solo determinato. In
questa sezione modichiamo lanalisi dellultima sezione in due diverse direzioni:

(i) consideriamo sistemi generali, senza pi richiedere m = n;

(ii) studiamo lesistenza ed eventuale unicit di soluzioni per un dato vettore b, e


non pi per ogni vettore.
14.8. SISTEMI LINEARI GENERALI 451

A tal ne, consideriamo la cosiddetta matrice completa del sistema

Ajb
m (n+1)

ottenuta accostando ad A il vettore b dei termini noti. Il prossimo celebre risulta-


to fornisce una condizione necessaria e su ciente a nch un sistema lineare abbia
soluzione.

Teorema 229 (Rouch-Capelli) Sia A 2 M (m; n) e b 2 Rm . Il sistema lineare


Ax = b possibile se e solo se la matrice A ha lo stesso rango della matrice completa
Ajb, cio
(A) = (Ajb) : (14.33)

Dim. Sia T : Rn ! Rm lapplicazione lineare associata al sistema, che si pu quindi


scrivere come T (x) = b. Il sistema possibile se e solo se b 2 Im T . Dato che Im T il
sottospazio vettoriale di Rm generato dalle colonne di A, il sistema possibile se e solo
se b combinazione lineare di tali colonne. Ne consegue che necessario e su ciente
che il rango di A non sia modicato dallaggiunta della colonna b.

Esempio 259 Sia: 8


>
< x1 + 2x2 + 3x3 = 3
6x1 + 4x2 + 2x3 = 7 :
>
:
5x1 + 2x2 x3 = 4
Dato che, per entrambe le matrici
2 3 2 3
1 2 3 1 2 3 3
A= 64 4 2 5 e 4
Ajb = 6 4 2 7 5;
5 2 1 5 2 1 4

la 3a riga = 2a riga 1a riga, le tre righe non sono linearmente indipendenti: (A) =
(Ajb) = 2 e il sistema possibile. N

Esempio 260 Un sistema omogeneo sempre possibile perch il vettore nullo sem-
pre una sua soluzione. Ci si conferma applicando il Teorema di Rouch-Capelli perch
per un sistema omogeneo si confrontano i ranghi di A e di Aj0: essi sono sempre uguali
e quindi il sistema sempre possibile. N

Si osservi come il Teorema di Rouch-Capelli consideri una data coppia (A; b),
mentre il Teorema di Cramer considera come data solo una matrice quadrata A. Ci
riette la nuova direzione (ii) prima menzionata e, per tale ragione, i due teoremi sono
solo parzialmente confrontabili nel caso di matrici A quadrate. Infatti, il Teorema di
Cramer considera solo il caso (A) = n, in cui la condizione (14.33) automaticamente
soddisfatta per ogni b 2 Rn (perch?); per tale caso esso pi potente del Teorema
di Rouch-Capelli: lesistenza vale per ogni vettore b e, inoltre, si ha anche lunicit.
452 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Ma, a dierenza del Teorema di Cramer, il Teorema di Rouch-Capelli in grado


di considerare anche il caso (A) < n dando, per un dato vettore b, una condizione
necessaria e su ciente a nch il sistema sia possibile.

Volgiamo ora lattenzione alleventuale unicit delle soluzioni la cui esistenza


garantita dal Teorema di Rouch-Capelli. Il prossimo risultato mostra che anche
per lunicit occorre considerare il rango della matrice A (si ricordi che, grazie alla
condizione (14.18), si ha (A) n).

Proposizione 230 Sia Ax = b un sistema lineare possibile, con A 2 M (m; n) e


b 2 Rm . Allora:

(i) se (A) = n, il sistema determinato;

(ii) se (A) < n, il sistema indeterminato.

La dimostrazione si basa sulla seguente generalizzazione del Lemma 204, che aveva
stabilito lequivalenza tra iniettivit di unapplicazione T e la banalit del suo nucleo
(cio, ker T = f0g).

Lemma 231 Sia T : Rn ! Rm unapplicazione lineare e risulti T (x) = b. I vettori


x 2 Rn per i quali T (x) = b sono tutti e soli del tipo x + z con z 2 ker T . In altri
termini:
T 1 (b) = fx + z : z 2 ker T g :

Dim. Tutti. Essendo T (z) = 0, risulta T (x + z) = T (x) + T (z) = b + 0 = b.


Soli. Sia x un altro punto per il quale T (x ) = b. Sottraendo membro a
membro le due uguaglianze T (x ) = b e T (x) = b si trova T (x ) T (x) = 0, cio
T (x x) = 0 e perci x x 2 ker T . Si conclude che x = x + z con z 2 ker T .

Il risultato acquista la seguente veste per i sistemi:

Corollario 232 Se x una soluzione del sistema Ax = b, tutte le altre sono del tipo

x+z

con z tale che Az = 0 (cio z risolve il sistema omogeneo Ax = 0).

Quindi, una volta trovata una soluzione del sistema Ax = b, tutte le altre soluzioni
si trovano sommandovi le soluzioni del sistema omogeneo Ax = 0. Ci permette di
dimostrare la Proposizione 230.

Dim. della Proposizione 230 Per ipotesi, il sistema ha almeno una soluzione x.
Inoltre, poich (A) = (T ), dal Teorema di rango e nullit segue che (A)+ (T ) = n.
Se (A) = n, si ha (T ) = 0, cio ker T = f0g. Dal Corollario 232 segue che x
lunica soluzione. Se, invece, (A) < n si ha (T ) > 0 e quindi ker T un sottospazio
14.9. RISOLUZIONE DI SISTEMI 453

vettoriale non banale di Rm , con inniti elementi. Grazie al Corollario 232, sommando
tali elementi alla soluzione x si trovano le innite soluzioni del sistema.

Oltre al suo interesse teorico, da un punto di vista operativo il Corollario 232 mostra
che un possibile modo per risolvere il sistema Ax = b di trovarne una soluzione e di
sommarvi tutte le soluzioni del sistema omogeneo Ax = 0.7 La via tanto pi utile
quanto pi semplice risolvere il sistema omogeneo rispetto a quello originario.

Tirando le la dei risultati della sezione, siamo ora in grado di enunciare un risultato
generale sulla risoluzione dei sistemi lineari che combina il Teorema di Rouch-Capelli
e la Proposizione 230.

Teorema 233 Sia A 2 M (m; n) e b 2 Rm . Il sistema lineare Ax = b

(i) impossibile se e solo se (A) < (Ajb).

(ii) possibile se e solo se (A) = (Ajb). In tal caso, esso

(ii.a) determinato se e solo se (A) = (Ajb) = n;


(ii.b) indeterminato se e solo se (A) = (Ajb) < n.

Il confronto dei ranghi (A) e (Ajb) col numero n delle incognite permette quindi
di stabilire lesistenza ed eventuale unicit delle soluzioni del sistema. Se il sistema
quadrato, si ha8 (A) = n se e solo se (A) = (Ajb) = n per ogni b 2 Rm . Il Teorema
di Cramer, che era solo parzialmente confrontabile col Teorema di Rouch-Capelli,
quindi un caso speciale del pi generale Teorema 233.

Esempio 261 Consideriamo un sistema lineare omogeneo Ax = 0. Poich, come gi


osservato, la condizione (A) = (Ajb) sempre soddisfatta, il sistema ha ununica
soluzione (cio il vettore nullo) se e solo se (A) = n, ed indeterminato se e solo se
(A) < n. N

14.9 Risoluzione di sistemi


Chiudiamo lo studio dei sistemi con due procedure di risoluzione, basate su quanto
visto nel capitolo.
7
Segnaliamo che, come si imparer in corsi successivi, un risultato analogo vale per le equazioni
dierenziali lineari. Infatti la soluzione generale di una equazione dierenziale lineare non omogenea
di ordine n data da una soluzione particolare sommata alla soluzione della corrispondente equazione
dierenziale omogenea.
8
Perch? (si era gi fatta una simile osservazione).
454 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

14.9.1 Cramer
piuttosto diusa lidea, sbagliata ma aggiustabile, che un sistema lineare Ax = b,
con A 2 M (m; n),

(i) ha ununica soluzione se m = n (vi sono tante equazioni quante incognite)


(ii) indeterminato se m < n (vi sono meno equazioni che incognite9 );
(iii) impossibile se m > n (vi sono pi equazioni che incognite).

Lidea sbagliata perch pu benissimo accadere che alcune equazioni siano ridon-
danti: qualcuna multipla di unaltra oppure combinazione lineare di altre (in tali
casi esse sarebbero automaticamente vericate non appena lo fossero le altre). Alla
luce Teorema 233, le aermazioni diventano giuste a patto di intendere m come il
numero delle equazioni non ridondanti, cio come il rango di A: infatti esso conta le
equazioni che non si possono esprimere come combinazioni lineari di altre.

Losservazione conduce a una procedura che si rivela utilissima per il calcolo mate-
riale. Consideriamo un generico sistema lineare Ax = b con A 2 M (m; n) e poniamo
che (A) = k.

1. Se k < m, vi sono m k righe che risultano combinazione lineare delle altre


k. Visto che ogni riga di A identica unequazione del sistema, vi sono m k
equazioni che, essendo combinazioni lineari delle altre, sono completamente in-
utili: sono certamente soddisfatte quando lo siano le altre k. Possiamo semplice-
mente cancellarle, riducendo cos il sistema ad avere k equazioni linearmente
indipendenti.
2. Se k < n, vi sono n k colonne che risultano combinazione lineare delle altre k
(cio inutili). Le corrispondenti n k incognite non sono aatto incognite
(sono inutili incognite), ma possono assumere valori del tutto arbitrari: per
ogni scelta di tali valori, il sistema si riduce ad avere k incognite (e k equazioni)
e perci vi una sola soluzione relativa alle k vere incognite. Possiamo sem-
plicemente assegnare valori arbitrari alle n k false incognite, riducendo cos
il sistema ad avere k incognite.

Al solito, possiamo sempre pensare che le k righe e le k colonne che determinano il


rango di A siano le prime. Se diciamo A0 una sottomatrice10 k k non singolare di A,
2 3
A0 B
6 k k k (n k) 7
A =4 5;
m n C D
(m k) k (m k) (n k)

9
Si dice anche che vi sono pi gradi di libert che vincoli. Lopposto vale in (iii).
10
Spesso ce ne pi duna, cio c una certa libert nello scegliere quali equazioni cancellare e quali
incognite sono false.
14.9. RISOLUZIONE DI SISTEMI 455

possiamo sopprimere le ultime m k righe e attribuire valori arbitrari, diciamoli


z 2 Rn k alle ultime n k incognite giungendo cos al sistema A0 x0 + Bz = b0 ovvero
a:
A0 x0 = b0 Bz (14.34)
nel quale x0 2 Rk il vettore che contiene le sole k vere incognite e b0 2 Rk il
vettore dei primi k termini noti. Il sistema (14.34) soddisfa le ipotesi del Teorema di
Cramer per ogni z 2 Rn k , ed quindi risolvibile con lomonima regola. Se diciamo
x^0 (z) lunica soluzione per ogni dato z 2 Rn k , le soluzioni delloriginario sistema
Ax = b sono
x0 (z) ; z)
(^ 8z 2 Rn k

Esempio 262 Riprendiamo il sistema:


8
>
< x1 + 2x2 + 3x3 = 3
6x1 + 4x2 + 2x3 = 7
>
: 5x + 2x
1 2 x3 = 4

dellEsempio 259. Dato che, come sera gi visto, per entrambe le matrici incompleta e
completa, la 3a riga = 2a riga 1a riga, le tre righe non sono linearmente indipendenti:
(A) = (Ajb) = 2 e il sistema possibile.
Lultima equazione ridondante: cancelliamola. Lultima incognita pu assumere
valore arbitrario: poniamo x3 = z. In tal modo, il sistema si riduce a:
(
x1 + 2x2 = 3 3z
6x1 + 4x2 = 7 2z

cio, posto b0z = b0 Bz,


A0 x = b0z
con matrice
1 2
A0 =
6 4
e vettori x = (x1 ; x2 ) e b0z = (3 3z; 7 2z). Poich det A0 6= 0, grazie alla Regola di
Cramer le innite soluzioni sono:
2 8z 1 11 + 16z 11
x1 = = +z ; x2 = = 2z ; x3 = z
8 4 8 8
per ogni z 2 R. Possiamo vericarlo:

1 11 1 + 11
1a : 1 +z +2 2z +3 z = +0 z =3
4 8 4
1 11 6 + 22
2a : 6 +z +4 2z +2 z = + 0 z = 7:
4 8 4
456 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Avremmo potuto aermare che, per entrambe le matrici incompleta e completa, la 2a


riga = 3a riga + 1a riga e cancellare la seconda riga anzich la terza. In tal caso il
sistema si sarebbe ridotto a
x1 + 2x2 + 3x3 = 3
5x1 + 2x2 x3 = 4

e avremmo potuto assegnare valore arbitrario alla prima incognita, diciamo x1 = z~,
anzich alla terza11 . Il sistema sarebbe diventato:
2x2 + 3 = 3 z~
;
2x2 x3 = 7 5~z

cio A00 x = b00z~ con matrice:


1 2
A00 =
6 4
z ). Poich det A00 6= 0, grazie alla Regola di
e vettori x = (x1 ; x2 ) e b00z~ = (3 z~; 7 5~
Cramer avremmo perci scritto le innite soluzioni come:
15 16~
z 1
x1 = z~ ; x2 = ; x3 = + z~ z 2 Rn :
8~
8 4
Nel primo modo avevamo trovato x1 = 1=4 + z, nel secondo x1 = z~: quindi z~ = 1=4 + z.
Con tale valore le soluzioni appena trovate
1
x1 = z~ = +z
4
1
15 16~z 15 16 4
+z 15 4 16z 11
x2 = = = = 2z
8 8 8 8
e
1 1 1
x3 =
+ z~ = + +z =z
4 4 4
diventano le vecchie. I due pacchetti di soluzioni sono in realt lo stesso, semplicemente
scritto con due diversi parametri. Invitiamo il lettore a cancellare la prima equazione
e a rifare i calcoli. N

14.9.2 Gauss
La procedura di risoluzione di sistemi basata sulla regola di Cramer elegante dal punto
di vista teorico, ma dal punto di vista computazionale vi una procedura migliore,
basata sul Procedimento gaussiano di eliminazione. Vale infatti il:

Lemma 234 Due sistemi lineari hanno lo stesso insieme di soluzioni se le loro matrici
complete si trasformano nella stessa matrice a scala.
11
La tilda su z aiuta a distinguere questo caso dal precedente.
14.9. RISOLUZIONE DI SISTEMI 457

Dim. Il lettore pu vericare che, applicando successivamente le operazioni elementari


alla matrice completa Ajb, cio simultaneamente ad A e b, linsieme delle soluzioni non
cambia.

Se indichiamo con Ajb la matrice a scala nella quale il Procedimento gaussiano di


eliminazione trasforma la matrice completa Ajb, per il Lemma 234 il sistema
Ax = b (14.35)
ha lo stesso insieme di soluzioni del sistema di partenza Ax = b. La forma particolare
della matrice a scala rende il sistema (14.35) di immediata soluzione. Si ha quindi una
procedura per risolvere il sistema Ax = b: si calcola la matrice a scala Ajb tramite il
Procedimento gaussiano di eliminazione e poi si risolve il sistema (14.35) cos ottenuto.
Tale procedura di soluzione una seconda notevole applicazione del Procedimento
gaussiano di eliminazione, dopo laccertamento del rango visto nella Sezione 14.4.4. I
prossimi esempi illustrano la procedura.

Esempio 263 NellEsempio 246 avevamo visto che il Procedimento gaussiano di elim-
inazione trasforma la matrice 2 3
3 2 4 1
4 1 0 6 9 5
5 3 7 4
nella matrice a scala 2 3
3
1 0 0 2
4 0 1 0 21 5:
4
7
0 0 1 4
La prima matrice corrisponde al sistema:
8
< 3x1 + 2x2 + 4x3 = 1
x1 + 6x3 = 9
:
5x1 + 3x2 + 7x3 = 4
e la seconda al sistema: 8 3
< x1 = 2
21
x2 = 4
: 7
x3 = 4
che ne rappresenta la soluzione. Possiamo vericarlo:
3 21 7 9 7
1a : 3 +2 +4 = +7=1
2 4 4 2 2
3 7 3 21
2a : 1 +6 = + =9
2 4 2 2
3 21 7 15 63 49
3a : 5 +3 +7 = + = 4:
2 4 4 2 4 4
N
458 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Esempio 264 Si voglia risolvere il sistema:


8
>
> 2x1 3x2 + 5x3 x4 = 6
<
x1 + 2x2 3x3 + 6x4 = 12
:
>
> x1 + 12x2 19x3 + 20x4 = 24
:
3x1 + 8x2 13x3 + 8x4 = 0
Utilizziamo il Procedimento gaussiano di eliminazione:
2 3 2 3 5 1
3
2 3 5 1 6 1 2 2 2
3
6 1 2 3 6 12 7 6 1 2 3 6 12 7
6 7 6 7
4 1 12 19 20 24 5 (1) 4 1 12 19 20 24 5
3 8 13 6 0 3 8 13 6 0
2 3 5 1
3 2 3 5 1
3
1 2 2 2
3 1 2 2 2
3
6 0 7 11 13
9 7 6 7 11 13
9 7
6 2 2 2 7 6 0 2 2 2 7
(2) 4 19 20 24 5 (3) 4 0 5
21 33 39
1 12 2 2 2
27
3 8 13 6 0 3 8 13 6 0
2 3 5 1
3 2 3 5 1
3
1 2 2 2
3 1 2 2 2
3
6 0 7 11 13
9 7 6 7 11 13
9 7
6 2 2 2 7 6 0 21 2 2 2 7
(4) 4 0 2 21 33 39
27 5 (5) 4 0 33 39
27 5
2 2 2 2 2
0 72 11
2
13
2
9 0 7
2
11
2
13
2
9
2 3 5 1
3 2 3 5 1
3
1 2 2 2
3 1 2 2 2
3
4 0 7 11 13
9 5 4 0 2 7 11 13
9 5
(5) 2 2 2 (6) 2 2
21 33 39
0 2 2 2
27 0 212
33
2
39
2
27
3 5 1 3 5 1
1 2 2 2
3 1 2 2 2
3
7 11 13 7 11 13
(6) 0 2 2 2
9 (7) 0 2 2 2
9
1 16 48 1 16 48
1 0 7 7 7
1 0 7 7 7
(7) 0 27 11
2
13
2
9 (8) 0 1 11
7
13
7
18
7
ove: (1) moltiplicazione per 1=2 della prima riga; (2) sottrazione della prima riga dalla
seconda; (3) somma della prima riga alla terza; (4) somma del triplo della prima
riga alla quarta; (5) sottrazione della seconda riga dalla quarta ed eliminazione della
quarta riga che risulta nulla; (6) sottrazione del triplo della seconda riga dalla terza
ed eliminazione della terza che risulta nulla; (7) somma di 3=7 della seconda riga alla
prima; (8) moltiplicazione per 2=7 della seconda riga.
Leliminazione di due righe segnala che esse sono combinazione lineare delle prime
due e perci che le corrispondenti equazioni sono superue. Due delle quattro incognite
possono perci ricevere valori arbitrari.

Siamo quindi arrivati alla matrice a scala


1 16 48
1 0 7 7 7
11 13 18
0 1 7 7 7
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 459

alla quale corrisponde il sistema:


8 1
> x1 + 11
> 7 3
x + 16 7 4
x = 487
< 13 18
x2 7
x 3 + 7
x 4 = 7
>
> x 3 =
:
x4 =

dove z1 e z2 sono valori arbitrari. Le innite soluzioni del sistema sono perci:
48 1 16 18 11 13
x1 = ; x2 = + ; x3 = ; x4 =
7 7 7 7 7 7
con ; 2 R arbitrari. In altre parole, linsieme delle soluzioni

48 1 16 18 11 13
; + ; ; : ; 2R
7 7 7 7 7 7

Le costanti e svolgono un ruolo analogo a quello del vettore z dellultima sezione.


N

14.10 Il Teorema fondamentale della Finanza


14.10.1 Portafogli
Riprendiamo lo studio dei mercati nanziari intrapreso nella Sezione 3.7. La matrice
che si ottiene a ancando, in colonna, i vettori dei pagamenti nali degli n titoli quotati
2 3
y11 y12 y1n
6 y21 y22 y2n 7
Y = (yij ) = 6
4
7
5
ym1 ym2 ymn

detta matrice dei pagamenti (nali). Essa descrive tutti i pagamenti nei vari stati
del mondo dei titoli del listino L = fy 1 ; :::; y n g: la prima colonna descrive i pagamenti
del titolo y 1 , la seconda colonna descrive i pagamenti del titolo y 2 , e cos via. Per
esempio, la matrice di pagamenti dei titoli elementari la matrice identit.

Come si visto nella Sezione 3.7 il sottospazio vettoriale

M = span L

generato dai titoli del listino linsieme dei vettori w di pagamenti replicabili con
portafogli di tali titoli. Data una matrice di pagamenti Y , lapplicazione lineare R :
Rn ! Rm denita da
R (x) = Y x
460 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

descrive il vettore di pagamenti ottenuto col portafogli x. In particolare, si ha

M = Im R; (14.36)

sicch il sottospazio vettoriale M ha dimensione (R), ossia dim M = (Y ) grazie


alla Proposizione 208.12 Il mercato quindi completo (e tutti i vettori w 2 Rm sono
replicabili) quando (Y ) = m, mentre incompleto quando (Y ) < m. Alla luce della
(14.36) nel seguito useremo indierentemente M e Im R.

Esempio 265 La matrice dei pagamenti di due titoli sia


2 3
10 10
4
Y = 12 10 5 :
15 10

Si ha (Y ) = 2, sicch dim M = (Y ) = 2, cio M un sottospazio vettoriale


di dimensione 2 di R3 . Il mercato incompleto e quindi non tutti i vettori w =
(w1 ; w2 ; w3 ) 2 R3 sono replicabili: per vedere quali lo sono occorre determinare il
sottospazio vettoriale M . Poich M coincide con Im R, esso costituito da tutti
i vettori w 2 Rm per i quali il sistema lineare R (x) = w ammette (almeno una)
soluzione. Il sistema in discorso
8
< 10x1 + 10x2 = w1
12x1 + 10x2 = w2 :
:
15x1 + 10x2 = w3

Esso ha soluzione, come vuole il Teorema di Rouch-Capelli, se e solo se le matrici Y


e Y jw hanno lo stesso rango. Poich (Y ) = 2, anche la matrice completa
2 3
10 10 w1
Y jw = 4 12 10 w2 5
15 10 w3

deve allora avere rango 2, cio devessere singolare: det Y jw = 0. Si ha


3 5
det Y jw = 0 () 30w1 + 50w2 20w3 = 0 () w3 = w1 + w2 :
2 2
In conclusione
3 5
M= w1 ; w2 ; w1 + w2 : w1 ; w2 2 R :
2 2

Sono quindi replicabili (ricostruibili con i due titoli quotati) tutti i vettori di paga-
menti che appartengono a M e non replicabili tutti gli altri. Per esempio, (4; 8; 14) e
( 10; 10; 40) sono replicabili, mentre (4; 8; 36) e ( 10; 10; 18) non lo sono. N
12
Usando la terminologia della Sezione 3.7 si ha h = jIj = (Y ).
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 461

14.10.2 Intermezzo: Il Teorema di Hahn-Banach


Le versioni per mercati incompleti delle fondamentali relazioni di prezzo (14.42) e
(14.47) che stabiliremo nelle prossime sottosezioni si basano sul celebre Teorema di
Hahn-Banach. Cogliamo quindi loccasione per presentare questo fondamentale risul-
tato, nella sua forma elementare13 per Rn .
Nel capitolo abbiamo considerato funzioni lineari denite sullintero spazio Rn . In
realt, pi in generale esse si possono denire su qualsiasi sottospazio vettoriali V di
Rn : una funzione f : V ! R detta lineare se

f ( x + y) = f (x) + f (y)

per ogni x; y 2 V ed ogni ; 2 R. Poich V chiuso rispetto a somme e moltipli-


cazioni scalari, x + y 2 V e quindi la denizione ben posta14 .

Esempio 266 Il piano di quota 0 in R3 il sottospazio vettoriale

V = f(x1 ; x2 ; 0) : x1 ; x2 2 Rg

generato dai versori e1 e e2 . La funzione f : V ! R denita sul piano da f (x) = x1 +x2


per ogni x 2 V lineare. N

Data una funzione lineare f : V ! R denita su un sottospazio vettoriale di Rn ,


naturale chiedersi se essa sia estendibile in modo lineare sullintero spazio Rn o se,
invece, rimanga intrappolatanel sottospazio V senza avere alcuna estensione su Rn .
In altre parole, ci si chiede se esiste una funzione lineare f : Rn ! R tale che fjV = f ,
cio f (x) = f (x) per ogni x 2 V .
Si tratta di un problema di grande importanza, non solo teorica, ma anche per le
applicazioni come vedremo tra breve. Per fortuna, vale il seguente

Teorema 235 (Hahn-Banach) Sia V un sottospazio vettoriale di Rn . Ogni fun-


zione lineare f : V ! R pu essere estesa in modo lineare su Rn .

Dim. Sia dim V = k n e sia x1 ; :::; xk una base di V . Per il Teorema 37 esistono
n k vettori xk+1 ; :::; xn tali che linsieme complessivo fx1 ; :::; xn g una base di
Rn . Sia rk+1 ; :::; rn un insieme arbitrario di n k numeri reali e sia f : Rn ! R la
funzione lineare tale che
f (xi ) per i = 1; :::; k
f xi = :
ri per i = k + 1; :::; n
13
La versione per spazi vettoriali generali uno dei risultati centrali dellAnalisi matematica. Il
lettore che vuole limitarsi alle dimostrazioni delle relazioni (14.42) e (14.47) per mercati completi pu
saltare la sezione.
14
Sebbene qui ci concentriamo su funzioni lineari, in modo simile anche le applicazioni lineari si
possono denire su qualsiasi sottospazio vettoriale di Rn .
462 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Inoltre, essendo x1 ; :::; xk una base di V , per ogni x 2 V esistono k coe cienti reali
P
f i gki=1 tali che x = ki=1 i xi , sicch:
! !
Xk X
k X
k Xk
i i i i
f (x) = f ix = if x = if x =f ix = f (x) :
i=1 i=1 i=1 i=1
n n
Quindi f : R ! R estende su R il funzionale lineare f : V ! R.
Come risulta chiaro dalla dimostrazione, lestensione lungi dallessere unica: ad
ogni insieme fri gni=k+1 di scalari associata una diversa estensione.
Esempio 267 Consideriamo lesempio precedente, con V = f(x1 ; x2 ; 0) : x1 ; x2 2 Rg
e f : V ! R denita da f (x) = x1 + x2 . Grazie al Teorema di Hahn-Banach, esiste
una funzione lineare f : R3 ! R tale che f (x) = f (x) per ogni x 2 V . Per esempio,
f (x) = x1 + x2 + x3 per ogni x 2 R3 , ma anche f (x) = x1 + x2 + x3 per ogni 2 R.
Ci conferma la non unicit dellestensione. N
Bench dallapparenza piuttosto innocua, il Teorema di Hahn-Banach un risultato
molto potente. Vediamone una prima notevole conseguenza estendendo i teoremi di
rappresentazione visti nel capitolo (Teorema 192 e Proposizione 194) a funzioni lineari
denite su sottospazi.
Teorema 236 Sia V un sottospazio vettoriale di Rn . Una funzione f : V ! R
lineare se e solo se esiste un vettore 2 Rn tale che
f (x) = x 8x 2 V (14.37)
Dim. Mostriamo il Solo seperch il converso ovvio. Sia f : V ! R una funzione
lineare. Grazie al Teorema di Hahn-Banach, esiste una funzione lineare f : Rn ! R
tale che f (x) = f (x) per ogni x 2 V . Per il Teorema 192, esiste 2 Rn tale che
f (x) = x per ogni x 2 Rn . Quindi
f (x) = f (x) = x 8x 2 V
come desiderato.
La novit sostanziale rispetto al Teorema 192 (e alla Proposizione 194) la perdita
di unicit del vettore . Infatti, la dimostrazione mostra che tale vettore sia uni-
vocamente determinato dallestensione f la cui esistenza garantita dal Teorema di
Hahn-Banach. Ma, tali estensioni sono lungi dallessere uniche e ci implica la non
unicit del vettore .
Esempio 268 Tornando agli esempi precedenti, si gi osservato che tutte le funzioni
lineari f : R3 ! R denite da f (x) = x1 + x2 + x3 , per 2 R, estendono f su Rn .
Posto = (1; 1; ), si ha f (x) = x per ogni 2 R, sicch
f (x) = x 8x 2 V
per ogni 2 R. In questo esempio esistono quindi inniti vettori per cui vale la
rappresentazione (14.37). N
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 463

La versione monotona del Teorema di Hahn-Banach particolarmente importante.

Teorema 237 (Krein-Rutman) Sia V un sottospazio vettoriale di Rn . Ogni fun-


zione lineare e (strettamente) crescente f : V ! R pu essere estesa in modo lineare
e (strettamente) crescente su Rn .

NellEsempio 267, la funzione f (x) = x1 + x2 lineare e strettamente crescente su


V = f(x1 ; x2 ; 0) : x1 ; x2 2 Rg e qualsiasi f (x) = x1 + x2 + x3 con > 0 una sua
estensione lineare e strettamente crescente su R3 . Si noti che esistono anche estensioni
lineari e non monotone: basta considerare f (x) con < 0.
Grazie al Teorema di Krein-Rutman e alla Proposizione 194, si ha la seguente
versione monotona del Teorema 192.

Proposizione 238 Sia V un sottospazio vettoriale di Rn . Una funzione f : V ! R


lineare (strettamente) crescente se e solo se esiste un vettore (strettamente) positivo
2 Rn tale che
f (x) = x 8x 2 V

Analogo risultato vale per la forte crescenza, e questa sar in realt la versione
rilevante per il resto del capitolo. Al riguardo, si osservi che la funzione f (x) = x1 +x2
fortemente positiva, al pari di f (x) = x1 + x2 + x3 con > 0.

14.10.3 Valore di mercato


Riprendiamo lo studio dei mercati nanziari. Indichiamo con

p = (p1 ; p2 ; : : : ; pn ) 2 Rn

il vettore che contiene i prezzi degli n titoli espressi dal mercato al tempo 0. Vista la
perfezione del mercato, il valore di mercato di un generico portafogli x semplicemente
Xn
p x= pk xk :
k=1

Dato il vettore di prezzi p, la funzione v : Rn ! R di pi variabili che assegna a ogni


portafogli x il suo valore di mercato v (x) ha quindi la forma

v (x) = p x

ed lineare. In altre parole, solo una funzione lineare pu modellare il valore dei
portafogli su un mercato perfetto. Al riguardo, si noti che il titolo y 1 identicato
dal portafogli e1 = (1; 0; :::; 0) 2 Rn , sicch v (e1 ) = p1 ; il titolo y 2 identicato dal
portafogli e2 = (0; 1; 0; :::; 0) 2 Rn , sicch v (e2 ) = p2 ; e cos via. Il valore di mercato
dei titoli quotati il loro prezzo, cio

pk = v ek 8k = 1; 2; :::; n: (14.38)
464 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Siano Y 2 M (m; n) la matrice dei pagamenti di n titoli quotati su un mercato


nanziario e p 2 Rn il vettore dei loro prezzi. La coppia (Y; p) identica un mercato
nanziario perfetto (secondo la terminologia della Sezione 3.7) in cui si scambiano i
titoli del listino secondo il vettore p di prezzi. Per i Teoremi di rappresentazione 192 e
200, vi una corrispondenza biunivoca tra lapplicazioni lineare R : Rn ! Rm (denita
da R (x) = Y x) e la matrice Y 2 M (m; n) dei pagamenti e tra la funzione lineare
v : Rn ! R e il vettore p 2 Rn di prezzo. quindi equivalente considerare le coppie
(Y; p) e (R; v); nel seguito useremo indierentemente luna o laltra15 .

14.10.4 Legge del prezzo unico


Una prima propriet di buon funzionamento di un mercato (Y; p) la Legge del prezzo
unico:
Y x = Y x0 =) p x = p x0 8x; x0 2 Rn ; (14.39)
cio portafogli che orono gli stessi pagamenti hanno lo stesso valore. Il signicato
della propriet chiaro: i portafogli sono solo mezzi, non ni, ci che conta sono i
pagamenti che essi garantiscono nei vari stati del mondo. Ne segue che due portafogli
che orono gli stessi pagamenti debbano avere lo stesso valore di mercato.

Per le coppie (R; v) la Legge del prezzo unico si scrive come

R (x) = R (x0 ) =) v (x) = v (x0 ) 8x; x0 2 Rn : (14.40)

Il valore di mercato di un portafogli quindi funzione solo dei suoi pagamenti nei
vari stati. Ci permette di dare la seguente fondamentale denizione di prezzo di un
pagamento replicabile. Al riguardo si ricordi la (14.38): il prezzo dei titoli quotati
uguale al loro valore di mercato.

Denizione 105 Il prezzo pw di un pagamento replicabile16 w 2 M il valore di


mercato di ogni portafogli x 2 Rn che lo replica, cio

pw = v (x)

dove w = R (x).

Il pagamento w aleatorio, dipende da quale stato del mondo si verica. Il suo


prezzo pw il costo v (x) che si deve sostenere al tempo 0 per formare un portafogli
x che al tempo 1 garantisca tale pagamento aleatorio, ossia w = R (x). Nel caso dei
titoli quotati si ritrova la (14.38).
Grazie alla Legge del prezzo unico la denizione ben posta: siano infatti x e
x0 due portafogli che replicano w, ossia tali che R (x) = R (x0 ). Per la (14.40) si ha
15
La funzione R associa a ogni portafogli il vettore di pagamenti da essofornito; la funzione v
fornisce il prezzo di mercato di ogni portafogli.
16
Si ricordi dalla (14.36) che M = Im R.
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 465

v (x) = v (x0 ) e quindi il prezzo pw risulta univocamente denito come pw = v (x) =


v (x0 ).

La Legge del prezzo unico permette quindi di estendere la nozione di prezzo dai
titoli quotati a tutti i pagamenti replicabili. Si tratta di una prima fondamentale
conseguenza di tale legge. Ma c molto di pi. Torniamo infatti alla (14.40). Da essa
si deduce facilmente lesistenza di una funzione f : M ! R tale che v = f R, cio

v (x) = f (R (x)) 8x 2 M: (14.41)

Fissato w 2 M , sia x 2 Rn tale che R (x) = w. Si ha

pw = v (x) = f (R (x)) = f (w) :

Poich w era un arbitrario vettore di M , si ha dunque

pw = f (w) 8w 2 M:

La funzione f associa quindi a ogni pagamento replicabile w 2 M il suo prezzo pw .


Per questa ragione f detta funzione di prezzo. Vale il fondamentale:

Teorema 239 La coppia (Y; p) soddisfa la Legge del prezzo unico se e solo se la
funzione di prezzo lineare, ossia esiste un vettore 2 Rm tale che

pw = w 8w 2 M (14.42)

La Legge del prezzo unico garantisce lesistenza della funzione di prezzo ed equivale
alla sua linearit (la funzione f data da f (z) = z per ogni z 2 Rn ). Il prezzo di
qualsiasi pagamento replicabile w la media pesata
X
m
pw = w= i wi (14.43)
i=1

dei suoi pagamenti nei vari stati. In particolare, per i titoli quotati si ha
X
m
pk = yk = i yik :
i=1

Che la linearit della funzione di prezzo caratterizzi i mercati per i quali vale la
Legge del prezzo unico (la funzione f data da f (z) = z per ogni z 2 Rn ) un
notevolissimo risultato, alla base della teoria dei prezzi delle attivit nanziarie (asset
pricing theory).

Dim. Mostriamo il Solo se poich il converso ovvio. Supponiamo che la coppia


(R; v) soddis la Legge del prezzo unico. Mostriamo che ci implica la linearit di f .
Per ssare le idee, consideriamo prima un mercato completo e poi un mercato qualsiasi.
466 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

(i) Supponiamo che il mercato sia completo, cio M = Im R = Rm . Siano x; y 2 Rm


e ; 2 R. Dobbiamo mostrare che f ( x + y) = f (x) + f (y). Al tal ne, per
prima cosa si osservi che, essendo Im R = Rm , esistono vettori x; y 2 Rn tali che
R (x) = x e R (y) = y. Grazie alla linearit di R e v si ha quindi:

f ( x + y) = f ( R (x) + R (y)) = f (R ( x + y)) = v ( x + y) = v (x) + v (y)


= f (R (x)) + f (R (y)) = f (x) + f (y)

come desiderato.
La funzione f : Rm ! R quindi lineare. Grazie al Teorema 192, esiste un vettore
2 Rm tale che f (z) = z per ogni z 2 Rm . Sostituendo tale f nella (14.41) si
ottiene la (14.42). Ci completa la dimostrazione per mercati completi.

(ii) Consideriamo ora un mercato qualsiasi, cosicch M = Im R Rm . Siano


x; y 2 M e ; 2 R. Dobbiamo mostrare che f ( x + y) = f (x) + f (y). Essendo
M = Im R, esistono vettori x; y 2 Rn tali che R (x) = x e R (y) = y. Grazie alla
linearit di R e v si pu quindi ripetere largomento visto sopra, cio

f ( x + y) = f ( R (x) + R (y)) = f (R ( x + y)) = v ( x + y) = v (x) + v (y)


= f (R (x)) + f (R (y)) = f (x) + f (y) :

La funzione f : Im R ! R quindi lineare sul sottospazio vettoriale Im R. Grazie


al Teorema 236, esiste un vettore 2 Rm tale che f (z) = z per ogni z 2 Rm .
Sostituendo tale f nella (14.41) si ottiene la (14.42). Ci completa la dimostrazione
anche per mercati non necessariamente completi.

Esempio 269 (i) Supponiamo che il pagamento certo 1 = (1; 1; :::; 1) sia replicabile,
cio 1 2 M . Secondo la Legge del prezzo unico il suo prezzo

X
m
p1 = 1= i:
i=1
P
Pi in generale, per il pagamento certo k = k1 = (k; k; :::; k) si ha pk = k m i=1 i .
Secondo la Legge del prezzo unico il prezzo di un pagamento certo pari allammontare
di tale pagamento, moltiplicato per la somma delle componenti del vettore .
(ii) Supponiamo che il titolo elementare ek sia replicabile, cio ek 2 M . Secondo
la Legge del prezzo unico il suo prezzo

pek = ek = k:

La componente k-esima del vettore pu essere quindi vista come il prezzo (negativo
o positivo) del titolo elementare che paga 1 euro se e solo se si verica lo stato k-esimo.
N
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 467

In un caso molto speciale la condizione (14.42) si desume in modo quasi banale:


supponiamo che il mercato sia completo e che i titoli elementari e1 , e2 , ..., em in Rm
siano quotati con prezzi p = (p1 ; :::; pm ). Poich tali titoli formano una base di Rm ,
essi possono replicare qualsiasi pagamento w 2 Rn :

w = w1 e1 + w2 e2 + + wm em :

Il portafogli che replica w quindi w stesso, cio w = R (w). Poich il valore di


mercato di tale portafogli p w, grazie alla (14.41) si ha

p w = v (w) = f (R (w)) = f (w) :

Quindi
pw = f (w) = p w
che la condizione (14.42) ponendo = p. Si noti che tale eguaglianza una partico-
larit del caso in esame, nel quale i titoli elementari sono quotati. Di norma i vettori
e p sono distinti.

Da ultimo, si osservi come la dimostrazione mostri uninteressante dierenza tra


mercati completi e incompleti: per i primi il vettore unico (in (i) si usato il
Teorema 192), mentre per i secondi ci non pi vero (in (ii) si usato il pi debole
Teorema 236).

14.10.5 Arbitraggio
Una seconda propriet fondamentale di buon funzionamento di un mercato nanziario
lassenza di arbitraggi. In particolare, un portafogli x 2 Rn detto di arbitraggio se
vale luna o laltra delle due seguenti condizioni
Yx 0 Yx>0
I ; II
p x<0 p x 0
di ovvio signicato: se valesse la prima, il portafogli x avrebbe un vettore Y x 0
di pagamenti nali (non farebbe perdere in nessuno degli stati del mondo) e avrebbe
prezzo p x < 0 (si acquisterebbe a un prezzo negativo, cio incassando soldi); se valesse
la seconda, x avrebbe un vettore Y x > 0 di pagamenti nali (non farebbe perdere in
nessuno degli stati del mondo e guadagnare almeno in uno) e avrebbe prezzo p x 0
(si acquisterebbe o gratis o a un prezzo negativo).

Le precedenti condizioni di arbitraggio implicano che, in assenza di arbitraggi,

I R (x) 0 =) v (x) 0 8x 2 Rn (14.44)

e
II R (x) > 0 =) v (x) > 0 8x 2 Rn : (14.45)
La prima di tali condizioni garantisce la Legge del prezzo unico.
468 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

Lemma 240 Per una coppia (R; v) che soddisfa la condizione di non arbitraggio
(14.44) vale la Legge del prezzo unico.
Dim. Applicando la (14.44) al portafogli x, si ha
R (x) 0 =) v (x) 0 8x 2 Rn ;
ossia
R (x) 0 =) v (x) 0 8x 2 Rn :
Insieme alla (14.44), ci implica
R (x) = 0 =) v (x) = 0 8x 2 Rn :
Siano ora x e x0 due portafogli tali che R (x) = R (x0 ). La linearit di R implica
R (x x0 ) = 0, e quindi v (x0 x) = 0, ossia v (x0 ) = v (x).

Grazie al lemma, la condizione di non arbitraggio (14.44) fa s che i prezzi dei


pagamenti siano determinati dalla (14.42). Ma, il prossimo risultato evidenzia una
signicativa nuova propriet: il vettore ora positivo, sicch la funzione di prezzo
diventa lineare e crescente.
Proposizione 241 La coppia (Y; p), con p 6= 0, soddisfa la condizione di non arbi-
traggio (14.44) se e solo se la funzione di prezzo lineare e crescente, ossia esiste un
vettore 2 Rm + tale che
pw = w 8w 2 M (14.46)
Dim. Mostriamo il Solo se poich il converso ovvio. Consideriamo un mercato
completo, cio M = Im R = Rm . Grazie al Lemma 240, la coppia (R; v) soddisfa
la Legge del prezzo unico, e quindi f lineare per la Proposizione 239. Dobbiamo
mostrare che crescente. Poich f lineare, grazie alla Proposizione 193 basta mostrare
che f positiva.
Sia x 2 Rm con x 0. Essendo Im R = Rm , esiste x 2 Rn tale che R (x) = x.
Si ha quindi R (x) = x 0, sicch la (14.44) implica v (x) 0 per la linearit di v.
Quindi,
f (x) = f (R (x)) = v (x) 0
In conclusione, la funzione lineare f positiva, e quindi crescente. Grazie alla Propo-
sizione 194, esiste un vettore 2 Rm + positivo tale che f (z) = z per ogni z 2 Rm .
Ci completa la dimostrazione per mercati completi; lasciamo al lettore lestensione a
mercati incompleti (basata su un opportuno uso della Proposizione 238).

Un ulteriore importante miglioramento si ha quando il mercato soddisfa anche la


seconda condizione di non arbitraggio (14.45): il vettore diventa fortemente positivo,
il che rende la funzione di prezzo lineare e fortemente crescente. Poich le condizioni di
non arbitraggio (14.44) e (14.45) sono cogenti, ed quindi naturale che un mercato ben
funzionante soddis entrambe, siamo giunti al risultato pi importante della sezione
(come testimonia il nome).
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 469

Teorema 242 (Teorema fondamentale della Finanza) La coppia (Y; p), con p 6=
0, soddisfa le condizioni di non arbitraggio (14.44) e (14.45) se e solo se la funzione
di prezzo lineare e fortemente crescente, ossia esiste un vettore 2 Rm ++ tale che

pw = w 8w 2 M (14.47)

Secondo il Teorema fondamentale della Finanza il prezzo di qualsiasi pagamento


replicabile w la media pesata

X
m
pw = w= i wi
i=1

dei suoi pagamenti nei vari stati, con pesi positivi. Se i prezzi che si osservano sul
mercato non si possono scrivere nella forma (14.47) per qualche vettore fortemente
positivo, ci indica la presenza di arbitraggi sul mercato, che non quindi ben funzio-
nante (intuitivamente17 un mercato in cui sono possibili arbitraggi non pu essere in
equilibrio).

La forte positivit della funzione di prezzo fa s che pagamenti w 0 abbiano


prezzo positivo, che diventa fortemente positivo se tale il pagamento. In altre parole,
acquisire in data 0 il diritto a un pagamento sempre positivo in data 1 deve costare
qualcosa.
Che la positivit della funzione di prezzo segua dallassenza di arbitraggi piuttosto
intuitivo e verr provato rigorosamente tra poche righe. Ma, lo possiamo vedere in
modo molto semplice nel caso speciale del mercato completo dei titoli elementari. In
assenza di arbitraggi assolutamente manifesto che il vettore p dei loro prezzi debba
essere fortemente positivo: i titoli elementari pagano 1 oppure 0 e perci debbono pur
costare qualcosa. Detto in altri termini, se uno di tali prezzi, pi , non fosse positivo,
il corrispondente titolo elementare sarebbe un arbitraggio (si acquisterebbe ei > 0 al
prezzo pi 0). Si conclude che, per vietare arbitraggi, si deve avere p 0.

Dim. Anche qui mostriamo il Solo se, poich il converso ovvio, e consideriamo un
mercato completo (cio, M = Im R = Rm ). Grazie alla Proposizione 241, f lineare
e crescente. Dobbiamo mostrare che fortemente crescente. Grazie alla versione
fortemente crescente della Proposizione 193 basta mostrare che f fortemente positiva.
Sia x 2 Rm con x 0. Essendo Im R = Rm , esiste x 2 Rn tale che R (x) = x.
Si ha quindi R (x) = x 0, sicch la (14.44) implica v (x) 0 per la linearit di v.
Quindi,
f (x) = f (R (x)) = v (x) > 0
In conclusione, la funzione lineare f fortemente positiva, e quindi fortemente cres-
cente. Grazie alla versione fortemente positiva della Proposizione 194, esiste un vettore
17
Il lettore render pi precisa tale intuizione in corsi successivi.
470 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

2 Rm
++ fortemente positivo tale che f (z) = z per ogni z 2 Rm . Ci completa la di-
mostrazione per mercati completi; anche in questo caso lasciamo al lettore lestensione
a mercati incompleti, che analoga a quella del risultato precedente.

Si osservi inne che il vettore in (14.47) in generale non unico, a meno che il
mercato sia completo (perch in tal caso unico il vettore , come s gi osservato
discutendo la Proposizione 239).

14.10.6 Teorema di rappresentazione dellarbitraggio


Supporremo qui che il titolo certo che paga 1 in ogni stato del mondo sia replicabile
sul mercato: ci accade senzaltro quando il mercato completo. In tal caso la forte
positivit di permette
P unimportante riscrittura P della relazione di prezzo (14.47).
Poich 0, si ha ni=1 i > 0. Si ponga B = ni=1 i . NellEsempio 269 si visto
che il prezzo di non arbitraggio del pagamento certo 1 = (1; 1; ::; 1)
X
n
p1 = i = B: (14.48)
i=1

La costante B rappresenta il costo delloperazione di compravendita che in data 0


garantisce 1 euro nella data 1 indipendentemente da quale stato si verichi. Tale
costante pu quindi essere intesa come il fattore di sconto18 per operazioni prive di
rischio.
Ponendo
i
Qi = 8i = 1; 2; :::; m
B
si ottiene un vettore Q = (Q1 ; :::; Qm ) di probabilit poich Qi > 0 per ogni i =
1; 2; :::; m e Pn
Xn Xn
i
X n
i i
Qi = = Pn = Pi=1
n = 1:
i=1 i=1
B i=1 i=1 i i=1 i

La relazione di prezzo (14.47) si pu allora riscrivere come


X
m
pw = Bq w = B Qi wi (14.49)
i=1

Il prezzo di non arbitraggio di un pagamento aleatorio w la media dei suoi pagamenti


wi nei vari stati del mondo pesati per le probabilit Qi di vericarsi che la probabilit
Q assegna loro. P
Dal capitolo 8 sappiamo che il valor medio m i=1 Qi wi si indica con EQ (w). La
(14.49) si pu quindi riscrivere come
pw = BEQ (w) : (14.50)
Illustriamo questa relazione di prezzo con un esempio.
18
Si veda la Sezione 15.7.2.
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 471

Esempio 270 Supponiamo che ogni titolo elementare ek sia replicabile, cio ek 2 M .
Secondo la (14.50) il suo prezzo di non arbitraggio

pek = BEQ ek = BQk

sicch
pek
Qk = :
p1
La probabilit Qk pu essere quindi vista come un prezzo relativo determinato dal
rapporto tra il prezzo del titolo elementare ek e il prezzo del titolo certo 1. N

Supponiamo che P gli stati del mondo si verichino secondo una probabilit P =
(P1 ; :::; Pm ), dove m
i=1 Pi = 1 e Pi > 0 per ogni i = 1; :::; m. Quindi, Pi la prob-
abilit che lo stato ! i si verichi. La probabilit Q una nozione del tutto diversa
dalleettiva probabilit P secondo la quale gli stati si vericano; come ha mostrato
lultimo esempio, Q un prezzo relativo determinato dal mercato nanziario, cio dalla
coppia (Y; p), senza alcuna relazione con la probabilit eettiva degli stati.
Detto ci, consideriamo il rapporto tra i vettori e P ponendo
i
i = 8i = 1; :::; m:
Pi

Il vettore = ( 1 ; :::; m) 2 Rm
++ permette la seguente di scrivere la (14.47) come

pw = EP ( w) (14.51)

Infatti, si ha
X
m X
m
i
X
m
pw = w= i wi = Pi wi = Pi i wi = EP ( w) :
i=1 i=1
Pi i=1

La relazione (14.51) equivalente alla (14.50), ma questa volta il valore medio


valutato rispetto alleettiva probabilit P degli stati.

Esempio 271 Per il titolo certo 1 = (1; :::; 1) la (14.51) implica

p1 = EP ( 1) = EP ( )

Grazie alla (14.48), si ha


B = EP ( )
e ci mostra lo stretto legame tra fattore di sconto e il vettore (nel caso determin-
istico dove un singoletto, lultima uguaglianza diventa B = ). Come nellultimo
esempio, supponiamo che ek 2 M per ogni k = 1; :::; m. Secondo la (14.51) si ha

pek = EP ek = k Pk
472 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

sicch
pek
k = :
Pk
La componente k il rapporto tra il prezzo del titolo elementare ek e la probabilit
dello stato ! k ; se interpretiamo Pk come rischio dello stato ! k , tale rapporto pu
vedersi come prezzo per unit di rischiodello stato ! k . N

Tirando le la, abbiamo stabilito la seguente importante versione del Teorema


fondamentale della Finanza.

Teorema 243 (di rappresentazione dellarbitraggio) Per una coppia (Y; p) con
p 6= 0 le seguenti condizioni sono equivalenti:

(i) soddisfa le condizioni di non arbitraggio (14.44) e (14.45);

(ii) esiste una probabilit Q 2 Rm


++ tale che

pw = BEQ (w) 8w 2 M ; (14.52)

(iii) esiste un vettore 2 Rm


++ tale che

pw = EP ( w) 8w 2 M: (14.53)

I prezzi pw sono di non arbitraggio se e solo se esiste una probabilit Q (detta


probabilit neutra rispetto al rischio) per la quale valga la (14.52), nonch se e solo
se esiste un vettore 2 Rm ++ (detto fattore stocastico di sconto) per il quale valga la
(14.53).
Le relazioni di prezzo (14.52) e (14.53) sono entrambe centrali in Finanza e uniscono
eleganza matematica e profondit economica.

14.10.7 Calcolo dei prezzi di non arbitraggio


Per il calcolo materiale di , e quindi dei prezzi di non arbitraggio, si osservi che le
relazioni di prezzo (14.47) aermano che soluzione del sistema lineare
8
>
> 1 y11 + 2 y21 + + m ym1 = p1
<
y
1 12 + y
2 22 + + m ym2 = p2
>
>
:
1 y1n + 2 y2n + + m ymn = pn
cio
YT = pT
n mm 1 n 1

o, equivalentemente e pi elegantemente,

Y =p
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 473

Il sistema ha ununica soluzione quando Y ha rango pieno (cio quando il mercato


completo). Per esempio, se quadrata la soluzione
1
= pY

sicch la funzione di prezzo


1
f (w) = pY w:
In generale, per risolvere il sistema possiamo usare i risultati delle ultime due sezioni,
come mostrano i prossimi esempi.

Esempio 272 Siano


5 8
Y = ; p = (7; 6) :
10 4
Il mercato completo. Il sistema Y T = p ha lunica soluzione = (16=30; 13=30) e
quindi i prezzi di non arbitraggio sono
16 13
pw = w1 + w2 8w 2 R2 :
30 30
In particolare, per i due titoli quotati y 1 e y 2 si conferma che
16 13
py 1 = 5+ 10 = 7
30 30
e
16 13
py 2 = 8+ 4=6
30 30
N

Esempio 273 Siano 2 3


5 8
Y = 4 10 4 5 ; p = (7; 6) :
12 6
Il mercato incompleto. Il sistema Y = p ha le innite soluzioni
16 6 13 33
= ; ; 8 2 R:
30 30

Tale strettamente positivo per 0 < < 13=33. Posto, per esempio, = 1=3, si ha

7 1 1
= ; ;
15 15 3
sicch i prezzi di non arbitraggio dei pagamenti replicabili sono
7 1 1
pw = w1 + w2 + w3 8w 2 M R3 :
15 15 3
474 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

In particolare, per i due titoli quotati y 1 e y 2 si conferma che


7 1 1
py 1 = 5+ 10 + 12 = 7
15 15 3
e
7 1 1
py 2 = 8+ 4+ 6 = 6:
15 15 3
N

Esempio 274 Sia 2 3


10 8 12
Y = 4 12 6 4 5 :
15 14 10

(i) Prendiamo p = (13; 1; 10; 4; 8; 6). Il sistema Y = p ammette lunica soluzione


= (1=5; 3=10; 1=2) e dunque tale coppia (Y; p) non consente arbitraggi.

(ii) Prendiamo p = (12; 3; 11; 2; 11; 8). Il sistema Y = p ammette lunica soluzione
= (6=10; 1=10; 1=2), sicch la coppia (Y; p) ammette possibilit di arbitraggi
(del I tipo). Per esempio, ogni vettore di pagamenti del tipo (0; k; 0) con k > 0
lo , avendo costo (1=10) k < 0. Il sistema Y x = (0; k; 0)T ha lunica soluzione

22 20 5
x=k ; ;
124 124 124
e ciascuno di essi permette di realizzare un arbitraggio. Per maldenza, control-
liamo:
2 3 2 3 2 3 2 3 2 3
10 8 12 220 160 60 0
22k 4 20k 4 5k 4 k 4
12 5 6 5 4 5= 264 120 20 5 = 4 k 5 :
124 124 124 124
15 14 10 330 280 50 0

Tali portafogli valgono


22k 20k 5k k k
12; 3 11; 2 11; 8 = (270; 6 224 59) = 12; 4 = 0; 1k:
124 124 124 124 124
Per esempio, con k = 1:000 il portafogli
22 000 20 000 5 000
x= ; ; ' (177; 4194; 161; 2903; 40; 3226) :
124 124 124

Esso pagher (0; 1:000; 0)T e oggi costa 100, cio fa incassare 100. Gli indicati
non sono aatto gli unici arbitraggi possibili. Per esempio, possiamo costruire
il precedente portafogli e usare lincasso 100 per acquistare pagamenti positivi
anche in ! 1 e ! 3 . Per esempio, il portafogli di pagamenti (20; 1:000; 50) ha valore
63.
14.10. IL TEOREMA FONDAMENTALE DELLA FINANZA 475

(iii) Prendiamo p = (12; 10; 4; 11; 2). Il sistema Y = p ha ora lunica soluzione
= (6=10; 0; 4=10): sono possibili arbitraggi (del II tipo). Gli stessi portafogli
indicati al punto (2), cio

22 20 5
x=k ; ;
124 124 124

con vettore (0; k; 0) di pagamenti (k > 0), hanno ora costo nullo:

22k 20k 5k k
12 10; 4 11; 2 = (264 208 56) = 0
124 124 124 124
N

14.10.8 Rendimenti
Il Teorema di rappresentazione dellarbitraggio talvolta enunciato in termini di rendi-
menti. Il rendimento lordo di un titolo quotato y che ha prezzo p il vettore R 2 Rm
tale che
yi
Ri = 8i = 1; :::; m
p
Lo scalare Ri ci che rende ogni euro investito nel titolo qualora si verichi lo stato
del mondo i-esimo ! i . Pi in generale, ogni pagamento aleatorio w ha rendimento
lordo R dato da
wi
Ri =
p
Qui R il rendimento di ogni euro investito nel portafogli che replica w qualora si
verichi lo stato del mondo i-esimo ! i .
Poich
pw Riw = wi 8i = 1; :::; m
in assenza di arbitraggi la (14.53) implica
X
m X
m X
m
pw = EP ( w) = Pi i wi = Pi i pw Riw = pw Pi i Riw = pw EP ( Rw )
i=1 i=1 i=1

cio
p w = p w EP ( R w )
Ma
pw = pw EP ( Rw ) () 1 = EP ( Rw )
e in conclusione, si ha:

Proposizione 244 In assenza di arbitraggi si ha

EP ( R w ) = 1 8w 2 M (14.54)
476 CAPITOLO 14. FUNZIONI E APPLICAZIONI LINEARI

La variabile aleatoria Rw = ( 1 R1w ; :::; m Rm


w
) 2 Rm pesa, in ogni stato, il rendi-
mento col fattore stocastico di sconto. In un mercato senza arbitraggi tali rendimenti
pesati hanno tutti valore atteso unitario. Si noti che il fattore stocastico il medes-
imo per tutti i w ed quindi una notevole conseguenza dellassenza di arbitraggi che
esso possa aggiustare i rendimenti di tutti i titoli in modo da renderne uguale il
valore atteso.

In termini di probabilit neutra rispetto al rischio Q facile vedere (perch?) che


la condizione (14.54) diventa

EQ (Rw ) = 1 8w 2 M: (14.55)

La probabilit neutra fa s che 1 euro investito in qualsiasi portafogli renda in valore


atteso (secondo Q) proprio 1 euro. In altri termini, secondo tale probabilit (che, si
ricordi, determinata dal mercato e nulla ha a che vedere con la probabilit P degli
stati) tutti gli investimenti nanziari orono lo stesso rendimento atteso, che pari
alla somma investita: in media si va in pari, senza guadagni e perdite.

Spesso invece del rendimento lordo si considera quello netto r 2 Rm ottenuto


sottraendo al rendimento lordo sottraiamo leuro investito:
yi p
ri = Ri 1= 8i = 1; :::; m:
p

In termini di rendimento netto le condizioni (14.54) e (14.55) diventano

EP ( rw ) = EQ (rw ) = 0 8w 2 M:

A rendimenti lordi attesi unitari corrispondono rendimenti netti nulli. Entrambi i


tipi di rendimenti vengono spesso usati ed sempre importante capire di quale si stia
parlando.
Capitolo 15

Funzioni concave

15.1 Insiemi convessi


In Economia importante poter combinare tra loro le diverse alternative tra cui i
decisori devono scegliere. Per esempio, se x e y sono panieri di beni o vettori di input,
vogliamo poter considerare anche le loro misture x + (1 ) y con 2 [0; 1]. Siano
x = (10; 0) e y = (0; 10) vettori di input, il primo con dieci unit di ferro e zero di
rame, il secondo con zero unit di ferro e dieci di rame, vogliamo poter considerare
anche la loro combinazione
1 1
(0; 10) + (10; 0) = (5; 5)
2 2
che consta di cinque unit di entrambi i materiali.
La propriet degli insiemi che permette tali combinazioni la convessit, e per
questa ragione sono tra gli insiemi pi importanti per le applicazioni economiche. Ne
trattiamo qui ponendoci direttamente in Rn .

Denizione 106 Un insieme C Rn detto convesso se, per ogni coppia di punti
x; y 2 C,
x + (1 )y 2 C 8 2 [0; 1] :

Il signicato di convessit basato sulla nozione di combinazione (lineare) convessa:

x + (1 )y

che, al variare di in [0; 1], rappresenta geometricamente ogni punto appartenente al


segmento
f x + (1 )y : 2 [0; 1]g (15.1)
che congiunge x con y. Un insieme convesso se contiene il segmento (15.1) che

477
478 CAPITOLO 15. FUNZIONI CONCAVE

congiunge due suoi punti qualsiasi x e y.

2 1

1 .5 B 0 .8

0 .6
1
0 .4

0 .5
0 .2

0 0
A
-0 .2
-0 .5
C
-0 .4
-1
-0 .6

-1 .5
-0 .8

-2 -1
-3 .5 -3 -2 .5 -2 -1 .5 -1 -0 .5 0 0 .5 1 6 6 .5 7 7 .5 8

Insiemi convessi in R2 Insieme convesso in R3

Insieme non convesso di


2
Insiemi non convessi di R R3

Antichi insiemi convessi Buon insieme non convesso

Esempio 275 Nella retta reale gli unici insiemi convessi sono gli intervalli, limitati o
illimitati. Gli insiemi convessi possono perci vedersi come la generalizzazione a Rn
della nozione di intervallo. N
15.1. INSIEMI CONVESSI 479

Esempio 276 Gli intorni B" (x) = fy 2 Rn : kx yk < "g di Rn sono convessi. In-
fatti, siano y 0 ; y 00 2 B" (x) e 2 [0; 1]. Grazie alle propriet della norma viste nella
Proposizione 44 si ha

kx ( y 0 + (1 ) y 00 )k = k x + (1 )x ( y 0 + (1 ) y 00 )k
0
= k (x y ) + (1 ) (x y 00 )k
kx y 0 k + (1 ) kx y 00 k < "

e quindi y 0 + (1 ) y 00 2 B" (x), il che prova che lintorno B" (x) convesso. N

Vediamo una prima propriet degli insiemi convessi.

Proposizione 245 La chiusura e linterno di un insieme convesso sono convessi.

Dim. Sia C convesso. Lasciamo al lettore la dimostrazione che linterno int C


convesso. Consideriamo, invece, la sua chiusura C. Ovviamente, C C. Quindi,
se prendiamo due punti x; y in C che appartengono anche a C, risulta banalmente
x + (1 )y 2 C C. Prendiamo allora x 2 C e y 2 C ma non appartenente a
C, cio y 2 C C. Grazie alla Proposizione 58, si ha C = C [ C 0 . Quindi y 2 C 0 ,
cio y punto di accumulazione di C, il che implica lesistenza di una successione
fyn g C che converge a y. Risulta x + (1 ) yn 2 C per ogni n e, dato che
x + (1 ) yn ! x + (1 ) y, sempre per la chiusura di C, x + (1 ) y 2 C.
Si ragiona nello stesso modo quando anche x 2 C ma non appartenente a C.

Non vale il converso: anche un insieme non convesso pu avere interno o chiusura
convessi. Per esempio linsieme [2; 5] [ f7g R non convesso (non un intervallo)
ma il suo interno (2; 5) lo ; linsieme (0; 1) [ (1; 5) R non convesso ma la sua
chiusura [0; 5] lo . Ancor pi interessante considerare un quadrato in R2 e privarlo
di un punto su un lato, non di vertice. Il lettore pu vericare che il quadrato privato
del punto non un insieme convesso, ma sia la chiusura sia linterno sono convessi.

Proposizione 246 Lintersezione tra due insiemi convessi convessa.

Lasciamo al lettore la facile dimostrazione. Si noti che, invece, lunione di convessi


non in generale convessa. Per esempio, lunione (0; 1) [ (1; 5) non convesso bench
lo siano entrambi gli insiemi (0; 1) e (1; 5).

15.1.1 Politopi e poligoni


In generale, data una collezione qualsiasi fxi gki=1 di vettori di Rn , la somma

X
k

i xi
i=1
480 CAPITOLO 15. FUNZIONI CONCAVE
P
con i 0 per ogni i e con ki=1 i = 1, si dice combinazione (lineare) convessa
dei vettori fxi gki=1 . Nel caso k = 2, 1 + 2 = 1 implica 2 = 1 1 , e quindi
le combinazioni convesse di due vettori hanno in eetti la forma x + (1 ) y con
2 [0; 1] vista a inizio capitolo.
Le combinazioni convesse permettono di denire una classe importante di insiemi
convessi.
Denizione 107 Data una collezione nita fxi gki=1 di vettori di Rn , il politopo da
essi generato linsieme
( k )
X X
k

i xi : i 0 per ogni i = 1; :::; k e i = 1


i=1 i=1

di tutte le loro combinazioni convesse.


I politopi sono ovviamente insiemi convessi. In particolare, il politopo generato da
due vettori qualsiasi x e y di Rn il segmento che li congiunge.
I segmenti sono lesempio pi elementare di politipo. In generale, i politopi han-
no naturali interpretazioni geometriche, particolarmente evidenti se consideriamo R2 .
Dati tre vettori x, y e z non allineati di R2 il politopo1
f 1x + 2y + (1 1 2) z : 1; 2 0e 1 + 2 1g
forma il triangolo che li ha come vertici:

2
x

1 y

-1
z

-2
-3 -2 -1 0 1 2 3 4 5

Politopo generato dai vettori x; y e z.

1
Si noti che
f( 1; 2; 3) : 1; 2; 3 0e 1 + 2 + 3 = 1g = f( 1; 2; 1 1 2) : 1; 2 2 [0; 1]g
15.1. INSIEMI CONVESSI 481

In generale, dati k vettori x1 , ..., xk di R2 il politopo

( k )
X X
k

i xi : i 0 8i = 1; :::; k e i =1 (15.2)
i=1 i=1

forma il poligono che li ha come vertici.2


Grazie ai politopi ritroviamo i poligoni studiati nelle scuole superiori: essi si possono
quindi vedere come luogo di tutte le combinazioni convesse dei loro vertici. da lungo
tempo che, in realt, abbiamo a che fare con insiemi convessi.

Esempio 277 Se consideriamo i quattro vettori f(0; 1) ; (1; 0) ; ( 1; 0) ; (0; 1)g, allo-
ra il politopo da loro generato il rombo

che ha come vertici questi quattro vettori. N

Esempio 278 Si noti che i cinque vettori f(0; 1) ; (1; 0) ; ( 1; 0) ; (0; 1) ; (1=2; 1=2)g
generano il medesimo rombo perch il vettore aggiunto (1=2; 1=2) gi apparteneva al

2
Un caveat: se, per esempio, x giace sul segmento che congiunge y e z (cio, i tre vettori sono
linearmente dipendenti), il triangolo generato da x, y e z si riduce a tale segmento. In questo caso,
i vertici sono solo y e z. Simili considerazioni valgono nel caso generale, come il rombo del prossimo
esempio mostra.
482 CAPITOLO 15. FUNZIONI CONCAVE

rombo

perch il vettore aggiunto (1=2; 1=2) gi apparteneva al rombo. Come gi il caveat


dellultima nota indicava, non infatti detto che tutti i vettori che generano il poligono
ne siano vertici. N

Il prossimo risultato caratterizza la convessit tramite le combinazioni convesse.

Proposizione 247 Un insieme C di Rn convesso se e solo se chiuso rispetto a


tutte le combinazioni convesse di propri elementi.
P
Quindi, C convesso se e solo se ki=1 i xi 2 C per ogni collezione fxi gki=1 di vettori
P
di C ed ogni collezione f i gki=1 di scalari tali che i 0 per ogni i e ki=1 i = 1.
In altri termini, un insieme convesso se e solo se contiene tutti i politopi generati
dai suoi punti: in R2 un insieme convesso se e solo se contiene tutti i poligoni ivi
iscritti, cio tutti i poligoni che hanno suoi punti come vertici.

Dim. Il Se ovvio poich considerando le combinazione convesse con k = 2 otte-


niamo la Denizione 106. Proviamo il Solo se. Sia C convesso e sia fxi gki=1 una
collezione di vettori di C e f i gki=1 una collezione di scalari tali che i 2 [0; 1] per ogni
P P
i = 1; :::; k e ki=1 i = 1. Vogliamo mostrare che ki=1 i xi 2 C. Per la Denizione
106, ci vero per n = 2. Procediamo per induzione su k, assumendo che sia vero per
k 1, e mostrando come ci implichi che la propriet valga anche per k. Si ha:

X
k X
k 1 X
k 1
i
i xi = i xi + k xk = (1 k) xi + k xk :
i=1 i=1 i=1
1 k

Poich abbiamo assunto che C sia chiuso rispetto alle combinazioni convesse di k 1
elementi, si ha
X
k 1
i
xi 2 C:
i=1
1 k
15.1. INSIEMI CONVESSI 483

Quindi, la convessit di C implica che


X
k 1
i
(1 k) xi + k xk 2 C;
i=1
1 k

e ne segue che C chiuso rispetto alle combinazioni convesse di k elementi, come


desiderato.

Chiudiamo con unimportante classe di politopi.

Esempio 279 Dati i versori fondamentali e1 , e2 , ..., en di Rn , linsieme


( n )
X Xn
i
n 1 = ie : i 0 8i = 1; :::; n e i = 1

( i=1 i=1
)
X
n
= ( 1 ; :::; n) : i 0 8i = 1; :::; n e i =1
i=1

formato da tutte le loro combinazioni convesse si dice simplesso.


Per esempio, il simplesso
1 2
1 = 1e + 2e : 1; 0 e 1+ 2=1
2
= f (1; 0) + (1 ) (0; 1) : 2 [0; 1]g = f( ; 1 ): 2 [0; 1]g

di R2 il segmento che congiunge i versori e1 e e2 . Il simplesso di R3 si ha:


1
2 = 1e + 2 e2 + 3 e3 : 1 ; 2 ; 3 0e 1 + 2+ 3 =1
= f 1 (1; 0; 0) + 2 (0; 1; 0) + (1 1 2 ) (0; 0; 1) : 1; 2 0e 1 + 2 1g

ossia
2 = f( 1; 2; 1 1 2) : 1; 2 0e 1 + 2 1g .
N

Nel Capitolo 8 si era visto come ogni misura di probabilit denita su uno spazio
nito di stati = f! 1 ; ! 2 ; :::; ! n g si pu identicare con un vettore P 2 Rn+ dato da

P = (P1 ; P2 ; : : : ; Pn )

ponendo Pi = P (! i ). Linsieme di tali vettori proprio il simplesso n 1 , che ha


quindi unimportante interpretazione probabilistica come insieme di tutte le misure di
probabilit su = f! 1 ; ! 2 ; :::; ! n g. In particolare, si scrive
( )
X
n

n 1 = (P1 ; P2 ; : : : ; Pn ) : Pi 0 8i = 1; :::; n e Pi = 1
i=1

quando si interessati a tale interpretazione del simplesso.


484 CAPITOLO 15. FUNZIONI CONCAVE

15.1.2 Coni
Denizione 108 Un insieme C Rn detto cono se, per ogni x 2 C, accade che
x2C 8 0:
Geometricamente, C un cono se, ogni volta che x 2 C, linsieme C contiene anche
tutta la semiretta uscente dallorigine (origine inclusa) e passante per x.

5
y 7

6 y
4

3
4

2 3

2
1 O x
O x
1

0
0

-1 -1
-3 -2 -1 0 1 2 3 4 5 6 7 -6 -4 -2 0 2 4 6 8 10

Cono convesso Cono non convesso

Si dimostra facilmente che la chiusura di un cono un cono (non vero il contrario)


e che lintersezione tra due coni un cono.
Proposizione 248 Un insieme convesso C Rn un cono se e solo se
x; y 2 C ) x + y 2 C; 8 ; 0
Dim. (i) Sia C un cono. Siano x; y 2 C. Vogliamo mostrare che x + y 2 C per
ogni ; 0. Fissiamo ; 0. Siccome C convesso, si ha

x+ y2C
+ +
Siccome C un cono, si ha

x+ y =( + ) x+ y 2C
+ +
come desiderato.
(ii) Supponiamo che x; y 2 C implichi x + y 2 C per ogni ; 0. Vogliamo
mostrare che C un cono. Prendendo = = 0 si conclude che 0 2 C e, prendendo
y = 0, che x 2 C per ogni 0, cio che C un cono.
Un insieme convesso dunque chiuso rispetto alle combinazioni convesse, mentre
un cono convesso chiuso rispetto alle combinazioni lineari con pesi non negativi.
15.2. FUNZIONI CONCAVE 485

Esempio 280 (i) Un singoletto fxg Rn sempre convesso; un cono soltanto


quando x = 0.

(ii) In R gli unici coni sono le due semirette ( 1; 0] e [0; +1).

(iii) Linsieme Rn+ = fx 2 Rn : x 0g dei vettori non negativi un cono convesso. N

I coni possono essere chiusi, per esempio Rn+ , oppure aperti, per esempio Rn++ . I
sottospazi vettoriali formano unimportante classe di coni chiusi e convessi (omettiano
la semplice dimostrazione).

Proposizione 249 I sottospazi vettoriali sono insiemi chiusi di Rn .

15.2 Funzioni concave


Un insieme convesso pu rappresentare, per esempio, un insieme di panieri su cui
denita una funzione di utilit in Teoria del consumatore, oppure un insieme di
input su cui denita una funzione di produzione in Teoria della produzione. La
convessit degli insiemi permette di combinare tra loro panieri, oppure input. Diventa
quindi importante studiare come le funzioni denite su tali insiemi, siano di utilit o
di produzione, si comportano rispetto a queste combinazioni.
Per questa ragione le funzioni concave e convesse sono straordinariamente impor-
tanti per numerose applicazioni allEconomia .

Denizione 109 Una funzione f : C Rn ! R denita su un insieme convesso C


di Rn si dice concava se

f ( x + (1 ) y) f (x) + (1 ) f (y) (15.3)

per ogni x; y 2 C ed ogni 2 [0; 1], mentre si dice convessa se

f ( x + (1 ) y) f (x) + (1 ) f (y) (15.4)

per ogni x; y 2 C ed ogni 2 [0; 1].

Gracamente, una funzione concava se il segmento (detta corda) che congiunge


due qualsiasi punti (x; f (x)) e (y; f (y)) del suo graco giace al di sotto (meglio, non
al di sopra) del graco della funzione stessa, mentre convessa se accadde il contrario,
ossia se tale corda giace al di sopra del graco della funzione.
486 CAPITOLO 15. FUNZIONI CONCAVE

14 14

12 12

10 10

8 8

6 6

4 4

2 2

0 0

-2 x O y -2 x O y
-1 0 1 2 3 4 5 -1 0 1 2 3 4

Funzione concava. Funzione convessa.

Infatti, tale corda costituita dai punti

f (x; f (x)) + (1 ) (y; f (y)) : 2 [0; 1]g


= f( x + (1 ) y; f (x) + (1 ) f (y)) : 2 [0; 1]g

Esempio 281 La funzione valore assoluto j j : R ! R convessa. Infatti:

j x + (1 ) yj j xj + j(1 ) yj = jxj + (1 ) jyj ;

per ogni x; y 2 R e ogni 2 [0; 1]. Pi in generale, la norma k k : Rn ! R una


funzione convessa. Infatti:

k x + (1 ) yk k xk + k(1 ) yk = kxk + (1 ) kyk ; (15.5)

per ogni x; y 2 Rn e ogni 2 [0; 1]. N

Si noti che una funzione f convessa se e solo se f concava: tale semplice


dualit tra le nozioni di convessit e concavit di funzionali fa si che le propriet delle
funzioni convesse siano ricavabili in modo immediato da quelle delle funzioni concave.
Ci limiteremo perci a considerare le propriet delle funzioni concave, lasciando al
lettore la semplice deduzione delle corrispondenti propriet delle funzioni convesse.

NB. Il dominio di una funzione concava (convessa) devessere un insieme conves-


so. Se cos non fosse, la denizione non starebbe in piedi perch il suo secondo
membro f (x) + (1 ) f (y) sarebbe denito per ogni 2 [0; 1] mentre il primo
f ( x + (1 ) y) non esisterebbe almeno per qualche 2 [0; 1]. Per questa ragione
15.2. FUNZIONI CONCAVE 487

dora in poi assumeremo, spesso senza menzionarlo, che le funzioni concave (e convesse)
considerate siano sempre denite su insiemi convessi. O

Unimportante sottoclasse di funzioni concave data dalle strettamente concave,


che sono le funzioni f : C Rn ! R per cui si ha

f ( x + (1 ) y) > f (x) + (1 ) f (y) ;

per ogni x; y 2 C ed ogni 2 (0; 1). In altre parole, la disuguaglianza (15.3)


qui richiesta essere stretta, il che implica che il graco di una funzione strettamente
concava non abbia tratti lineari.
In modo analogo, una funzione f : C Rn ! R si dice strettamente convessa se

f ( x + (1 ) y) < f (x) + (1 ) f (y) ;

per ogni x; y 2 C ed ogni 2 (0; 1). In particolare, una funzione strettamente


convessa se e solo se f strettamente concava.

Diamo ora alcuni esempi di funzioni concave e convesse. Vericare se una funzione
gode di tali propriet usando la denizione spesso non facile. Per questo invitiamo
al lettore a cercare unintuizione graca per questi esempi, in attesa di vedere pi in l
alcune condizioni su cienti basate sul Calcolo dierenziale che semplicano la verica.
p
Esempio 282 (i) Le funzioni f; g : R+ ! R denite da f (x) = x e g (x) = log x
sono strettamente concave.

(ii) La funzione f : R ! R denita da f (x) = x2 strettamente convessa.

(iii) La funzione f : R ! R denita da f (x) = x3 non n concava n conves-


sa; sullintervallo ( 1; 0] per strettamente concava, mentre su [0; +1)
strettamente convessa.

(iv) La funzione f : R ! R denita da

x se x 1
f (x) =
1 se x > 1

concava (ma non strettamente).

Esempio 283 (i) La funzione f : R2 ! R denita da f (x) = x21 + x22 strettamente


convessa. (ii) La funzione Cobb-Douglas vista nellEsempio 75 concava, come sar
mostrato nella Sezione 16.1. N

Esempio 284 La funzione f : Rn ! R denita da

f (x) = min xi
i=1;:::;n
488 CAPITOLO 15. FUNZIONI CONCAVE

concava. Infatti, si osservi che, dati due vettori x; y 2 Rn , si ha

min (xi + yi ) min xi + min yi :


i=1;:::;n i=1;:::;n i=1;:::;n

Del resto, nel rendere separatamente minime x e y si hanno pi gradi di libert che nel
renderle minime congiuntamente come somma. Ne segue che, se x; y 2 Rn e 2 [0; 1],
si ha

f ( x + (1 ) y) = min ( xi + (1 ) yi )
i=1;:::;n
min xi + (1 ) min yi = f (x) + (1 ) f (y)
i=1;:::;n i=1;:::;n

Nella Teoria del consumatore la funzione di utilit u (x) = mini=1;:::;n xi prende il nome
di funzione di utilit di Leontief, gi incontrata nella Sezione 7.4.4. N

Poich le disuguaglianze (15.3) e (15.4) sono deboli, possibile che una funzione
sia contemporaneamente concava e convessa. In tal caso, la funzione detta a ne. In
altre parole, una funzione f : C Rn ! R a ne se

f ( x + (1 ) y) = f (x) + (1 ) f (y) ;

per ogni x; y 2 C ed ogni 2 [0; 1].


La nozione di funzione a ne strettamente legata a quella di funzione lineare:

Proposizione 250 Una funzione f : Rn ! R a ne se e solo se esistono una


funzione lineare l : Rn ! R e uno scalare q 2 R tali che

f (x) = l (x) + q 8 x 2 Rn (15.6)

In particolare, f lineare se e solo se f (0) = 0, ossia se e solo se q = 0.

Quando il dominio C lintero spazio Rn , le funzioni a ni sono le lineari traslate,


essendo la traslazione data da f (0) = q. Quando f (0) = 0 la funzione lineare. In
ogni caso, le funzioni a ni, a meno di una traslazione, sono lineari.
La linearit in eetti un concetto pi forte della nit: tutte le funzioni lineari
sono a ni, ma il converso falso. Per esempio, la retta f : R ! R data da f (x) = x+1
a ne ma non lineare.

Dim. SeSiano x; y 2 Rn e 2 [0; 1]. Si ha

f ( x + (1 ) y) = l ( x + (1 ) y) + q = l (x) + (1 ) l (y) + q + (1 )q
= (l (x) + q) + (1 ) (l (y) + q)

e quindi f (x) = l (x) + q a ne.


15.2. FUNZIONI CONCAVE 489

Solo se Sia f : Rn ! R a ne e si ponga l (x) = f (x) f (0) per ogni x 2 Rn .


Posto q = f (0), dobbiamo mostrare che l lineare. Cominciamo a fare vedere che

l ( x) = l (x) 8x 2 Rn , 8 2 R: (15.7)

Per ogni 2 [0; 1] si ha

l ( x) = f ( x) f (0) = f ( x + (1 ) 0) (1 ) f (0) f (0)


= f (x) + (1 ) f (0) (1 ) f (0) f (0) = f (x) f (0) = l (x) :

Sia ora > 1. Posto y = x, per quanto appena dimostrato si ha


y 1
l (x) = l = l (y) ;

e quindi l ( x) = l (x). Daltra parte,

1 1 1 1
0 = l (0) = l x x =f x x f (0)
2 2 2 2
1 1 1 1 1 1
= f (x) + f ( x) f (0) f (0) = l (x) + l ( x) ;
2 2 2 2 2 2
sicch l (x) = l ( x). Se < 0, si ha quindi:

l ( x) = l (( ) ( x)) = ( ) l ( x) = ( ) ( l (x)) = l (x) :

Tutto ci prova che vale la (15.7). Alla luce del Lemma 189, per completare la
dimostrazione della linearit di l occorre mostrare che

l (x + y) = l (x) + l (y) 8x; y 2 Rn : (15.8)

Si ha:
x+y x y x y
l (x + y) = 2l = 2l + =2 f + f (0)
2 2 2 2 2
1 1 1 1
= 2 f (x) + f (y) f (0) f (0) = l (x) + l (y) ;
2 2 2 2
come desiderato.

La (15.6) si pu scrivere come


X
n
f (x) = x+q = i xi +q
i=1

dove 2 Rn e q 2 R. Nel caso scalare, si ha

f (x) = mx + q 8x 2 R (15.9)
490 CAPITOLO 15. FUNZIONI CONCAVE

con m 2 R.3 Le funzioni a ni scalari hanno quindi un aspetto ben noto: esse non
sono altro che le rette con pendenza e intercetta q; in particolare, ci conferma che le
funzioni scalari lineari sono le rette passanti per lorigine poich per esse f (0) = q = 0.
In generale, il valore f (x) di una funzionale a ne una somma pesata, con pesi
i , delle componenti xi dellargomento x, pi un termine noto q 2 R. la forma pi
semplice che pu assumere una funzione di pi variabili. Per esempio, se = (3; 4) e
q = 2, si ha la funzione a ne f : R2 ! R data da f (x) = 3x1 + 4x2 + 2.

Esempio 285 Nella Teoria della produzione le funzioni di produzioni sono spesso
ipotizzate lineari. In tal caso il vettore = ( 1 ; 2 ; :::; n ) interpretato come il vettore
dei coe cienti costanti di produzione. Infatti, considerando i versori fondamentali e1 ,
e2 , ..., en si ha

f e1 = e1 = 1
f e2 = e2 = 2

f (en ) = en = n

Quindi 1 la quantit di output determinata da ununit del primo input, 2


la quantit di output determinata da ununit del secondo input, e cos via. Tali
coe cienti si dicono costanti perch non dipendono dalla quantit di input. Ci fa si
che i rendimenti di scala di queste funzioni di produzione siano costanti (si veda la
Sezione 16.1). N

15.3 Propriet
15.3.1 Funzioni concave e insiemi convessi
Esiste una semplice caratterizzazione delle funzioni concave f : C Rn ! R che usa
gli insiemi convessi. Si consideri infatti linsieme

ipof = f(x; y) 2 C R : f (x) yg Rn+1 ; (15.10)

detto ipograco di f , costituito dai punti (x; y) 2 Rn+1 che giacciono al di sotto del
graco della funzione, graco che ricordiamo essere dato da:

Gr f = f(x; y) 2 C R : f (x) = yg :

3
Usiamo nel caso scalare la pi comune lettera m invece di .
15.3. PROPRIET 491

6
y

1
O x

0
0 1 2 3 4 5 6

Ipograco di funzione.

Il prossimo risultato mostra che la concavit di f equivalente alla convessit del


suo ipograco.

Proposizione 251 Una funzione f : C Rn ! R denita su un insieme convesso


C concava se e solo se il suo ipograco ipof un insieme convesso in Rn+1 .

Dim. Sia f concava, e siano (x; y) ; (y; z) 2 ipof . Per denizione, y f (x) e
z f (y). Ne segue che

t + (1 )z f (x) + (1 ) f (y) f ( x + (1 ) y) ;

per ogni 2 [0; 1]. Quindi, ( x + (1 ) y; t + (1 ) z) 2 ipof , il che prova che


ipof convesso.
Per il converso, supponiamo che ipof sia convesso: per ogni x; y 2 C e 2 [0; 1],

( x + (1 ) y; f (x) + (1 ) f (y)) 2 ipo f

cio,
f (x) + (1 ) f (y) f ( x + (1 ) y) ;
come desiderato.

Nella Sezione 7.3.1 avevamo denito le curve di livello di una funzione f : C


n
R ! R come le controimmagini
1
f (k) = fx 2 C : f (x) = kg

per k 2 R. In modo simile, gli insiemi

fx 2 C : f (x) kg
492 CAPITOLO 15. FUNZIONI CONCAVE

sono detti insiemi di soprallivello, indicati con (f k), mentre gli insiemi

fx 2 C : f (x) kg

sono detti insiemi di sottolivello, indicati con (f k). Naturalmente,

1
f (k) = (f k) \ (f k)

1
tant che talvolta si usa la notazione (f = k) in luogo di f (k).

In Economia gli insieme di soprallivello si incontrano n dalle prime lezioni di


Microeconomia. Infatti, per una funzione u : C Rn ! R di utilit, linsieme di
soprallivello (u k) linsieme di tutti panieri che hanno utilit almeno pari a k.
Quando n = 2, gracamente (u k) la porzione di piano delimitata inferiormente
dalla curva di indienza u 1 (k). I prossimi due graci evidenziano gli insiemi di
sopralivello di due funzioni u : C R ! R Si noti che, mentre nel primo caso si
ha una funzione non monotona con insiemi di soprallivello non (tutti) convessi, nel
secondo caso la funzione monotona produce insiemi di sopralivello convessi.

5
y
4

2 y=k

0
O x
-1

-2
-3 -2 -1 0 1 2 3 4

Insieme di soprallivello (u k) per una funzione


u non monotona.
15.3. PROPRIET 493

8
y
6

4
y=k
2

O x
-2

-4
-4 -3 -2 -1 0 1 2 3 4

Insieme di soprallivello (u k) per una funzione


u monotona.

Di solito in Microeconomia tali porzioni di piano si assumono convesse, e a tale


convessit di (u k) ci si riferisce quando si parla, impropriamente, di curve di indif-
ferenza convesse. Come mostra il prossimo risultato, questa convessit vale quando la
funzione u di utilit concava

Proposizione 252 Se f : C Rn ! R concava, allora tutti i suoi insiemi di


soprallivello (f k) sono convessi.

Per le funzioni convesse vale il risultato speculare dove sono convessi gli insiemi di
sottolivello (f k).

Dim. Dato k 2 R, sia (f k) non vuoto (diversamente, il risultato ovvio perch gli
insieme vuoti sono banalmente convessi). Siano x1 ; x2 2 (f k) e 2 [0; 1]. Per la
concavit di f si ha risulta

f x1 + (1 ) x2 f x1 + (1 ) f x2 k + (1 )k = k

e perci x1 + (1 ) x2 2 (f k).

Abbiamo quindi visto che la forma usuale delle curve di indierenza implicata
dalla concavit delle funzioni di utilit, ossia, pi rigorosamente, che le funzioni concave
hanno insiemi di soprallivello convessi. Il converso non vero! Si pensi per esempio a
qualsiasi funzione f : R ! R strettamente crescente: si ha
1
(f k) = f (k) ; +1
494 CAPITOLO 15. FUNZIONI CONCAVE

per ogni k 2 R. Tutti gli insiemi di soprallivello sono convessi, bench in generale esse
non siano concave4 .
La concavit delle funzioni di utilit quindi condizione su ciente, ma non nec-
essaria, per la convessit delle curve di indierenza: vi sono funzioni di utilit non
concave che hanno curve di indierenza di questa forma. A questo punto natu-
rale chiedersi quale sia la classe di funzioni, pi ampia delle concave, caratterizzata
dallavere curve di indierenza convesse. La Sezione 15.4 risponder alla domanda
introducendo la quasi concavit.

15.3.2 Disuguaglianza di Jensen e continuit


Bench la concavit si denisca usando combinazioni convesse di due soli elementi, il
prossimo risultato mostra come essa valga in realt per tutte le combinazioni convesse.

Proposizione 253 (Disuguaglianza di Jensen) Una funzione f : C Rn ! R


denita su un insieme convesso C concava se e solo se, per ogni collezione nita
fx1 ; x2 ; :::; xn g di elementi di C, si ha
!
X n X
n
f i xi i f (xi ) (15.11)
i=1 i=1
Pn
per ogni i 0e i=1 i = 1.

La (15.11) nota come disuguaglianza di Jensen ed importantissima nelle appli-


cazioni.

Dim. Il Se ovvio. Per quanto riguarda il Solo sesi procede, come per il Lemma
247, per induzione su n. Sia quindi f concava. La (15.11)
Pn 1vale ovviamente
Pn 1 per n = 2.
Si supponga che valga per n 1, ossia che si abbia f i=1 i xi i=1 i f (xi ) per
ogni combinazione convessa di n 1 elementi di C. Se n = 1, la (15.11) vale in modo
banale. Sia quindi n < 1. Si ha:
! ! !
Xn X
n 1 X
n 1
i
f i xi = f i xi + n xn = f (1 n) xi + n xn
i=1 i=1 i=1
1 n
!
X
n 1
i
(1 n) f xi + n f (xn )
i=1
1 n

X
n 1
i
X
n
(1 n) f (xi ) + nf (xn ) = if (xi ) ;
i=1
1 n i=1

come desiderato.
h 1
4
Per ssare le idee, si pensi alla cubica f (x) = x3 , per cui si ha (f = c) = c 3 ; +1 per ogni
c 2 R.
15.3. PROPRIET 495

Vediamo unaltra importante propriet delle funzioni concave, la cui dimostrazione


lasciata al lettore.

Proposizione 254 Siano f; g : C Rn ! R due funzioni concave. La funzione f + g


concava, mentre f concava se 0.

Si noti che la propriet fa s che linsieme delle funzioni concave sia un cono.

Le funzioni concave sono molto regolari, in particolare godono di notevoli propriet


di continuit.

Teorema 255 Una funzione concava continua in ogni punto interno del suo do-
minio.

In particolare, una funzione concava ovunque continua quando il suo dominio


aperto. In questo importante caso, la sola concavit garantisce la continuit.

Dim. Dimostriamo il risultato nel caso scalare. Sia f una funzione concava denita
su un insieme convesso C R. Dimostreremo che continua in ogni intervallo chiuso
[a; b] incluso nellinterno di C: ne seguir la continuit di f sullinterno di C.
Sia m il pi piccolo tra i due valori f (a) e f (b); per ogni x = a + (1 ) b,
0 1, cio per ogni x 2 [a; b], risulta

f (x) f (a) + (1 ) f (b) m + (1 )m = m

e quindi f inferiormente limitata da m su [a; b]. Per ogni

a b b a
t
2 2
risulta, per la concavit di f ,

a+b 1 a+b 1 a+b


f f +t + f t ;
2 2 2 2 2
ovvero
a+b a+b a+b
f +t 2f f t :
2 2 2
Peraltro, essendo
a+b
t
2
un punto dellintervallo [a; b],

a+b
f t m
2
496 CAPITOLO 15. FUNZIONI CONCAVE

e perci
a+b a+b
f +t 2f m:
2 2
Posto
a+b
M = 2f m
2
si ha dunque che f anche superiormente limitata da M su [a; b].
Consideriamo ora un intervallo [a "; b + "], con " > 0 tale che anchesso sia
contenuto in C e diciamo m" e M" gli estremi inferiore e superiore di f su di esso. Se
m" = M" , la funzione costante e, a maggior ragione, continua. Sia allora m" < M" .
Consideriamo due punti x 6= y in [a; b] e poniamo

" (x y) jx yj
z=y ; = :
jx yj " + jx yj

Si vede immediatamente che z 2 [a "; b + "] e che y = z + (1 ) x e pertanto

f (y) f (z) + (1 ) f (x) = f (x) + [f (z) f (x)] ;

cio
jx yj M" m"
f (x) f (y) [f (x) f (z)] (M" m" ) = (M" m" ) < jx yj :
" + jy xj "

In conclusione
jf (x) f (y)j k jx yj ;
dove k = (M" m" ) =". Ora, se y ! x, jx yj ! 0 e quindi f (y) ! f (x) che prova
la continuit di f in x. Per la genericit di x segue lasserto.

facile vedere che la presenza di una discontinuit in un punto interno al dominio


fa s che, necessariamente, qualche corda tagli il graco della funzione, impedendole
cos di essere concava (o convessa).
Se la discontinuit di frontiera, invece ci non necessariamente accade.

Esempio 286 Sia f : [ 1; 1] ! R denita come:

2 x2 se x 2 (0; 1)
f (x) =
0 se x 2 f0; 1g

Essa concava sullintero dominio [ 1; 1], ed discontinua in 0 e 1, ossia nei punti


di frontiera del dominio. In accordo col Teorema 255, f invece continua su (0; 1),
linterno del suo dominio [0; 1]. N
15.4. FUNZIONI QUASI CONCAVE 497

15.4 Funzioni quasi concave


Nella precedente sezione avevamo posto un problema, motivato da semplici consider-
azioni di Teoria dellutilit, che possiamo cos riformulare: visto che la concavit
solo condizione su ciente per la convessit degli insiemi di soprallivello, quale inde-
bolimento della nozione di concavit permette di individuare le funzioni che abbiano
insiemi di soprallivello convessi? Nel linguaggio della Teoria dellutilit, qual la
caratterizzazione delle funzioni di utilit che hanno curve di indierenza convesse?
A queste domande risponde la seguente classe di funzioni, introdotta nel 1949 da
Bruno de Finetti.5

Denizione 110 Una funzione f : C Rn ! R denita su un insieme convesso C


si dice quasi concava se

f ( x + (1 ) y) min ff (x) ; f (y)g (15.12)

per ogni x; y 2 C ed ogni 2 [0; 1], mentre si dice quasi convessa se

f ( x + (1 ) y) max ff (x) ; f (y)g : (15.13)

Quando la disuglianza in (15.12) stretta per 2 (0; 1), la funzione f si dice


strettamente quasi concava. In modo analogo, quando la disuglianza in (15.13)
stretta per 2 (0; 1), la funzione f si dice strettamente quasi convessa.

Inne, una funzione f che sia quasi concava sia quasi convessa, ossia tale che

min ff (x) ; f (y)g f ( x + (1 ) y) max ff (x) ; f (y)g ; 8x; y 2 C; 8 2 [0; 1]


(15.14)
si dice quasi a ne.

Le funzioni concave sono quasi concave, poich

f ( x + (1 ) y) f (x) + (1 ) f (y) min ff (x) ; f (y)g

mentre le funzioni convesse sono quasi convesse. In particolare, le funzioni a ni sono


quasi a ni. Il converso di queste implicazioni falso, come mostra il seguente esempio.

Esempio 287 Le funzioni scalari monotone (strettamente o meno) sono quasi a ni.
Infatti, sia f : C R ! R crescente denita sul convesso C e siano x; y 2 C e
2 [0; 1]. Senza perdita di generalit, supponiamo che x y. Quindi x x+
(1 )y y, e la crescenza implica f (x) f ( x + (1 ) y) f (y), ossia la
(15.14). Un argomento analogo vale quando f decrescente. N
5
Bruno de Finetti (1906-1985) stato un matematico applicato italiano autore di fondamentali
contributi in Calcolo delle probabilit, Statistica ed Economia teorica.
498 CAPITOLO 15. FUNZIONI CONCAVE

Le funzioni strettamente concave sono strettamente quasi concave:

f ( x + (1 ) y) > f (x) + (1 ) f (y) min ff (x) ; f (y)g

mentre le funzioni strettamente convesse sono strettamente quasi convesse. Il converso


di queste implicazioni falso. In particolare, si osservi come una funzione quasi con-
cava possa essere strettamente convessa (per esempio, f (x) = ex ). La terminologia
devessere quindi presa cum grano salis.

Il prossimo importante risultato motiva lo studio delle funzioni quasi concave.

Proposizione 256 Una funzione f : C Rn ! R denita su un insieme convesso C


quasi concava se e solo se tutti i suoi insiemi di soprallivello (f k) sono convessi.

Dim. Sia f quasi concava. Dato un insieme di soprallivello (f k) non vuoto


(diversamente il risultato banale), siano x; y 2 (f k) e 2 [0; 1]. Si ha

f ( x + (1 ) y) min ff (x) ; f (y)g k

e quindi x + (1 ) y 2 (f k). Linsieme (f k) dunque convesso.


Viceversa, supponiamo che tutti gli insiemi di soprallivello (f k) siano convessi.
Siano x; y 2 C e 2 [0; 1]. Senza perdita di generalit supponiamo f (x) f (y).
Posto k = f (y), si ha x + (1 ) y 2 (f k), e quindi

f ( x + (1 ) y) k = min ff (x) ; f (y)g .

Ci prova la quasi concavit di f .

Le funzioni quasi concave sono dunque caratterizzate dalla convessit dei loro in-
siemi di soprallivello. La quasi concavit quindi lindebolimento della nozione di
concavit che risponde al quesito di apertura.
Nella Teoria dellutilit le funzioni di utilit quasi concave sono tutte e sole quelle
che che hanno curve di indierenza convesse, la forma usuale delle curve di indif-
ferenza. Ci rende le funzioni di utilit quasi concave la classe di gran lunga pi
importante di funzioni utilit.

Curve di indierenza Per le funzioni quasi convesse la Proposizione 256 vale con
gli insiemi di sottolivello in luogo di quelli soprallivello. Di conseguenza, una funzione f
quasi a ne ha curve di di livello (f = k) convesse perch (f = k) = (f k) \ (f k).
Il converso per falso: si prenda la funzione f : R ! R data da
( 1
x
se x 6= 0
f (x) =
0 altrimenti
15.4. FUNZIONI QUASI CONCAVE 499

1
Poich f inettiva, le sue curve di livello sono singoletti. In particolare, f (0) = f0g
e, per ogni y 6= 0,
1
f 1 (y) = :
y
Quindi, le curve di livello sono banalmente convesse. Ma f non n quasi concava n
quasi convessa, e quindi non quasi a ne.
Nella Teoria dellutilit quanto appena osservato mostra che condizione su ciente,
ma non necessaria, a nch una funzione di utilit u abbia curve di indierenza con-
vesse (in senso proprio!) che u sia quasi a ne. Si ricordi che in precedenza avevamo
parlato di convessit in senso improprio (di solito virgolettata) delle curve di indieren-
za, intendendo con ci in realt la convessit degli insiemi di soprallivello (u k). Per
quanto impropria una terminologia diusa. In senso proprio, la convessit delle curve
di indierenza la convessit delle curve di livello (u = k). Grazie alla Proposizione
256, la convessit impropria delle curve di indierenza caratterizza le funzioni di utilit
quasi concave, mentre la loro convessit propria goduta dalle funzioni di utilit quasi
a ni, senza per esserne una propriet caratterizzante.

Cardinalit e ordinalit Un importante aspetto della quasi concavit di essere


preservata da trasformazioni monotone. Al riguardo utile studiare assieme, per
meglio confrontarlo, il comportamento della concavit e della quasi concavit rispetto
alla composizione.

Proposizione 257 Siano g : C Rn ! R e f : D R ! R due funzioni tali che


Im g D.

(i) Se g concava e f concava e crescente, allora la funzione composta f g : C


Rn ! R concava.

(ii) Se g quasi concava e f crescente, allora la funzione composta f g :C


Rn ! R quasi concava.

Dim. Mostriamo solo la (i), lasciando la (ii) al lettore. Siano x; y 2 C e 2 [0; 1].
Grazie alle propriet delle funzioni f e g si ha

(g f ) ( x + (1 ) y) = g (f ( x + (1 ) y)) g ( f (x) + (1 ) f (y))


g (f (x)) + (1 ) (g (f (y)))
= (g f ) (x) + (1 ) (g f ) (y)

come desiderato.

Tra (i) e (ii) vi unimportante dierenza: la concavit preservata dalla trasfor-


mazione monotona f g se f sia crescente sia concava, mentre per preservare la
quasi concavit su ciente la crescenza. In altri termini, la quasi concavit si preser-
va per trasformazioni monotone (crescenti) mentre ci non vero per la concavit.
500 CAPITOLO 15. FUNZIONI CONCAVE
p
Per esempio, se f; g : R+ ! R sono g (x) = x e f (x) = x4 , la funzione composta
f g : R+ ! R la funzione strettamente convessa6 x2 . Con f solo crescente, la
concavit di g implica solo la quasi concavit di f g, nulla pi.
La dierenza tra (i) e (ii) importante nella Teoria dellutilit. Una propriet delle
funzioni di utilit che si preserva per trasformazioni monotone strettamente crescenti
detta ordinale, mentre una propriet che si preserva solo per trasformazioni a ni
strettamente crescenti, ossia per f (x) = x + con > 0 e 2 R, si dice cardinale.
Naturalmente, una propriet ordinale anche cardinale, mentre il converso falso.
Per esempio, grazie alla Proposizione 257 la quasi concavit una propriet ordinale,
mentre la concavit solo cardinale.
La distinzione tra propriet cardinali e ordinali concettualmente importantissima.
Infatti, data una funzione di utilit u : C Rn ! R e una funzione f : D R!
R, con Im u D, nella Sezione 7.4.4 avevamo visto che, quando f strettamente
crescente, la trasformazione f u : C Rn ! R della funzione di utilit u : C
n
R ! R , a sua volta, una funzione di utilit equivalente a u. Infatti, si era osservato
che interessa il modo nel quale una funzione di utilit ordina le coppie di panieri x
e y, se x preferito a y, cio, u (x) u (y), o se, viceversa, y preferito a x, cio,
u (y) u (x). Quando f strettamente crescente, lordinamento preservato da f u
poich u (x) u (y) se e solo se (f u) (x) (f u) (y).
Per questa ragione, sono le propriet ordinali a essere proprie delle funzioni di
utilit perch esse valgono per u e per tutte le sue equivalenti trasformazioni f u,
mentre ci non vero per le propriet solo cardinali.

Alla luce di tutto ci, la quasi concavit, e non la concavit, sembra essere la
propriet rilevante per le funzioni di utilit u : C Rn ! R. Infatti, grazie alla
Proposizione 257, la prima una propriet ordinale, mentre la seconda cardinale
ma non ordinale. Ma, prima di incoronare denitivamente la quasi concavit come
propriet rilevante dal punto di vista ordinalista, in luogo della concavit, occorre fare
unultima sottile osservazione. La trasformazione monotona f u quasi concava se u
concava; vale anche il viceversa? cio, tutte le funzioni quasi concave sono esprimibili
in questo modo, come trasformazioni monotone di funzioni concave?
Se questo fosse il caso, la concavit tornerebbe in gioco anche in un approccio ordi-
nalista: data una funzione quasi concava, basterebbe considerare la sua equivalente ver-
sione concava, ottenuta tramite unopportuna trasformazione strettamente crescente.
La risposta negativa: esistono funzioni quasi concave che non sono trasformazioni
monotone di funzioni concave.

Esempio 288 Sia g : R ! R data da7


8
< x x 0
g (x) = 0 x 2 (0; 1)
:
x 1 x 1
6
Si noti che x4 qui strettamente crescente perch labbiamo denita su R+ .
7
Esempio suggerito da Simone Cerreia-Vioglio.
15.5. PRINCIPIO DI DIVERSIFICAZIONE 501

Essa crescente, e quindi quasi concava. Non esiste alcuna f : R ! R strettamente


crescente ed alcuna h : R ! R concava tale che

g=f h (15.15)

Poich f strettamente crescente, ha inversa f 1 strettamente crescente. Dunque, la


(15.15) equivale a
h=f 1 g
Dobbiamo perci mostrare che f 1 g non concava per qualunque f : R ! R
strettamente crescente. Supponiamo per contra che f 1 g sia concava. Posto x = 3=2
e y = 0, si ha

1 1 3 1 1 1
f (0) = f g = f g x+ y
4 2 2
1 1 1 1 1 1 1 1 1
f g (x) + f g (y) = f + f (0)
2 2 2 2 2

cio
1 1 1
f (0) f
2
il che contraddice la stretta crescenza di f 1
. N

Lesempio mostra che esistono funzioni genuinamente quasi concave, non rappre-
sentabili come trasformazioni monotone di funzioni concave. la prova denitiva che
la quasi concavit, e non la concavit, la propriet rilevante in un approccio ordi-
nalista. Questa importante conclusione fu raggiunta nel 1949 da Bruno de Finetti
nellarticolo in cui introdusse le funzioni quasi concave, la cui teoria fu poi estesa nel
1954 da Werner Fenchel8 .

15.5 Principio di diversicazione


tempo di motivare economicamente le nozioni studiate nel capitolo. Ci concentrere-
mo sulla Teoria del consumatore, ma simili considerazioni valgono per la Teoria della
produzione.
Abbiamo pi volte osservato che nella Teoria del consumatore si soliti consid-
erare funzioni di utilit con curve di indierenza convesse, cio funzioni di utilit
con insiemi convessi di soprallivello9 . Come osservato, questa la ragione per cui la
quasi concavit una propriet fondamentale delle funzioni di utilit. Ma, qual la
8
Bruno de Finetti, Sulle straticazioni convesse, Annali di Matematica Pura e Applicata, 1949;
Werner Fenchel, Convex cones, sets, and functions, Princeton University Press, 1953.
9
In tutta questa sezione la convessit delle curve di indierenza sempre in senso improprio. Per
semplicit, nel seguito della sezione omettiamo le virgolette.
502 CAPITOLO 15. FUNZIONI CONCAVE

motivazione economica dellassumere curve di indierenza convesse, cio funzioni di


utilit quasi concave?
La risposta nel Principio di diversicazione: se due panieri di beni garantiscono
un certo livello di utilit, una loro combinazione lineare, detta anche mistura, x +
(1 ) y far almeno altrettanto. In altre parole, la diversicazione che propria del
paniere composto x + (1 ) y rispetto ai panieri originari x e y garantisce unutilit
non inferiore a quella originaria. Se x = (0; 1) il paniere composto da zero unit di
acqua e una di pane, mentre y = (1; 0) composto da una unit di acqua e una di
pane, la loro mistura
1 1 1 1
(0; 1) + (1; 0) = ;
2 2 2 2
risulta in un paniere diversicato, con quantit positive sia di acqua sia di pane, ed
naturale pensare dia unutilit non inferiore ai due panieri originari.

Formalmente, il Principio di diversicazione la condizione:

u (x) k e u (y) k =) u ( x + (1 ) y) k 8k 2 R (PD)

per ogni 2 [0; 1] . proprio la classica propriet di convessit delle curve di indif-
ferenza. Matematicamente, la convessit dellinsieme di soprallivello (u k). Poich
vale per ogni k 2 R, corrisponde alla quasi concavit delle funzioni di utilit.

Tutto bene? Quasi, perch in realt quanto appena detto si pu a nare. Si osservi
che il Principio di diversicazione implica che, per ogni x; y 2 C,

u (x) = u (y) =) u ( x + (1 ) y) u (x) 8 2 [0; 1] (PPD)

Infatti, posto k = u (x) = u (y), si ha ovviamente u (x) k e u (y) k, il che implica


u ( x + (1 ) y) k per il Principio di diversicazione. Chiamiamo Principio puro
di diversicazione la condizione PPD.
La condizione PPD molto interessante: essa aerma che ogni paniere che sia
mistura di panieri indierenti preferito agli originari. Se disegniamo una curva di
indierenza, vediamo che la pi debole propriet PPD spesso usata come propriet
che caratterizza la convessit delle curve di indierenza. Infatti, la PPD la forma pi
pura e intuitiva del Principio di diversicazione: combinando due possibilit indier-
enti se ne ottiene una migliore. Tornando allesempio di pane e acqua, verosimilmente
si ha
1 1
u (0; 1) = u (1; 0) u ; :
2 2
Il prossimo risultato mostra che, nei casi di interesse per la Teoria del consumatore, i
due principi sono in realt equivalenti. Nel risultato faremo uso della nozione di insieme
direzionato vista nel Capitolo 7. Si ricordi che, secondo la Denizione 47, un insieme
C in Rn direzionato se per ogni x; y 2 C esiste z 2 C tale che sia z x sia z y:
un insieme direzionato quando ogni coppia di suoi elementi ha un minorante comune
15.5. PRINCIPIO DI DIVERSIFICAZIONE 503

che appartiene allinsieme. Nella Teoria del consumatore molti insiemi di interesse
sono direzionati. Per esempio, tutti gli insiemi C Rn+ che contengono lorigine sono
direzionati. Infatti, in tal caso 0 x per ogni x 2 Rn e quindi lorigine stessa il
minorante comune a tutte le coppie di elementi di C.
Possiamo ora enuciare il risultato di equivalenza. Esso vale per funzioni di utilit
continue e crescenti, ipotesi standard nella Teoria del consumatore.

Proposizione 258 Sia u : C Rn ! R una funzione continua e crescente denita


su un insieme convesso e direzionato C. La funzione u quasi concava se e solo se
soddisfa la condizione PPD.

Dim. Siccome il Solo se ovvio, dimostriamo il Se. Mostriamo che la condizione


PPD implica la quasi concavit di u. Siano x; y 2 C e 2 [0; 1], con u (x) u (y).
Poich C direzionato esiste z 2 C tale che z xez y. Per la crescenza di u si
ha u (z) u (x) e u (z) u (y). Deniamo la funzione ausiliaria : [0; 1] ! R come
(t) = u (tx + (1 t) z) per ogni t 2 [0; 1]. Siccome C convesso, la funzione ben
denita. La continuit di u implica quella di . Infatti:

tn ! t ) tn x + (1 tn ) z ! tx + (1 t) z
) u (tn x + (1 tn ) z) ! u (tx + (1 t) z)
) (tn ) ! (t) :

Siccome (0) = u (z) u (y) u (x) = (1), per il Teorema di Darboux la continuit
della implica lesistenza di t 2 [0; 1] tale che (t) = u (y). Posto w = tx + (1 t) z,
si ha quindi u (w) = u (y). Inoltre, z x implica w x.
Dalla PPD segue u ( w + (1 ) y) u (w) = u (y), mentre w x implica w +
(1 )y x + (1 ) y. Grazie alla crescenza di u si ha quindi

u ( x + (1 ) y) u ( w + (1 ) y) u (y) = min fu (x) ; u (y)g

il che prova che u quasi concava.

Il risultato appena dimostrato garantisce che, nei casi di maggior interesse della
Teoria del consumatore, le due possibili interpretazioni della convessit delle curve di
indierenza sono equivalenti. Possiamo quindi considerare il Principio puro di diversi-
cazione, ossia la forma pi nitida del Principo di diversicazione, quale motivazione
delluso di funzioni quasi concave di utilit.

E le funzioni concave? Esse soddisfano il Principio di diversicazione e quindi


il loro uso conforme a tale principio. Tuttavia, lEsempio 288 ha mostrato come
esistano esempi di funzioni quasi concave che non sono trasformazioni monotone di
funzioni concave, cio che non hanno la forma f g con f strettamente crescente e g
concava. In altre parole, la quasi concavit, e quindi il Principio di diversicazione,
una propriet pi debole della concavit anche dal punto di vista ordinale.
504 CAPITOLO 15. FUNZIONI CONCAVE

In conclusione, luso di funzioni concave coerente col Principio di diversicazione,


ma non da esso giusticato. Solo la quasi concavit giusticata da tale principio,
del quale la controparte matematica.

Vediamo unultima osservazione sul Principio puro di diversicazione, che non


aggiunge molto sul piano concettuale ma molto utile nelle applicazioni. Se nella
condizione PPD consideriamo la disuglianza stretta, cio

u (x) = u (y) ) u ( x + (1 ) y) > u (x) 8 2 (0; 1) (PSD)

abbiamo una forma forte del Principio, in cui la diversicazione sempre strettamente
preferita dal consumatore. La condizione PSD implicata dalla stretta quasi concavit
di u poich

u (x) = u (y) ) u ( x + (1 ) y) > min fu (x) ; u (y)g 8 2 (0; 1) :

Ne equivalente nelle ipotesi della Proposizione 258, di cui si ha la seguente versione


(la cui dimostrazione lasciata al lettore).

Proposizione 259 Sia u : C Rn ! R una funzione continua e crescente denita


su un insieme convesso e direzionato C. La funzione u strettamente quasi concava
se e solo se soddisfa la condizione PSD.

La PSD quindi la versione del Principio di diversicazione che caratterizza la


stretta quasi concavit, una propriet spesso usata nelle applicazioni.

Chiudiamo osservando che, per quanto importante, il Principio di diversicazione


non ha certo validit universale: vi sono casi in cui ha poco senso. Per esempio, se il
paniere (1; 0) composto da una unit di lievito di birra e zero di lievito per dolci,
mentre il paniere (0; 1) composto da una unit di lievito per dolci e zero di lievito
di birra, e li giudichiamo indierenti, la loro combinazione (1=2; 1=2) potrebbe essere
inutile sia per fare una pizza sia per fare una torta. In questo caso la combinazione
nefasta.

15.6 Rischio e concavit


Il Principio di diversicazione caratterizza dunque la quasi concavit, ma non la con-
cavit. La concavit, tuttavia, trova un suo notevole fondamento economico in prob-
lemi di decisioni in condizioni di rischio, come mostrer la sezione. Per prima cosa
mostriamo che le funzioni di utilit Bernoulliane sono cardinali.
15.6. RISCHIO E CONCAVIT 505

15.6.1 Unicit e cardinalit


Sia ( (C) ; %) un problema di decisione in condizioni di rischio. Le funzioni di utilit
Bernoulliane hanno notevoli propriet di unicit. In particolare, due tali utilit u :
C ! R e u0 : C ! R sono equivalenti quando
Ep u (c) Eq u (c) () Ep u0 (c) Eq u0 (c) 8p; q 2 (C) : (15.16)
Lequivalenza richiede che le utilit preservino sia lordine sia il valor medio: questo
duplice compito ha conseguenze drammatiche sullunicit.
Proposizione 260 Due funzioni di utilit Bernoulliane u : C ! R e u0 : C ! R sono
equivalenti se e solo se esistono > 0 e 2 R tale che
u0 (c) = u (c) + 8c 2 C
Le funzioni : R ! R data da (x) = x + , con > 0 e 2 R, sono a ni e
positive e, come ormai ben sappiamo, non sono altro che le rette strettamente crescenti.
La Proposizione 260 aerma quindi che due utilit sono equivalenti se e solo se esiste
una retta strettamente crescente : R ! R tale che u0 = u.
Tali rette sono una classe molto speciale di funzioni strettamente crescente: le fun-
zione di utilit Bernoulliane non sono quindi uniche a meno di arbitrarie trasformazioni
strettamente crescenti. Ricordando la classicazione della Sezione 15.4, le funzioni di
utilit sono cardinali, laddove le funzioni di utilit u : A Rn ! R studiate nel caso
deterministico sono ordinali.
Dim. Ci limitiamo a Mostrare il Se, omettendo il pi di cile converso. Sia u0 :
C ! R tale che u0 (c) = u(c) + , dove > 0 e 2 R. Vogliamo mostrare che vale la
(15.16). Siano p e q due lotterie tali che
Ep u (c) Eq u (c) : (15.17)
Si ha
X X
Ep u0 (f ) = u0 (c) p (c) = ( u (c) + ) p (c)
c2supp p c2supp p
X X X
= p (c) + u (c) p (c) = + u (c) p (c) :
c2supp p c2supp p c2supp p

Grazie alla (15.17), si ha


X X
+ u (c) p (c) + u (c) q (c)
c2supp p c2supp q

sicch
X X X
u0 (c) p (c) = + u (c) p (c) + u (c) q (c)
c2supp p c2supp p c2supp q
X X
= ( u (c) + ) q (c) = u0 (c) q (c)
c2supp p c2supp q
506 CAPITOLO 15. FUNZIONI CONCAVE

il che implica X X
u0 (c) p (c) u0 (c) q (c)
c2supp p c2supp q

come desiderato.

Il prossimo esempio mostra che cosa pi andar storto considerando trasformazioni


strettamente crescenti ma non a ni.

Esempio 289 Sia C = R e siano p e q tali che


1 3 1
p (1) = p (3) = p (5) = ; q (1) = e q (8) =
3 4 4
Se u (x) = x si ha
1 1 1 3 1 11
Ep u (c) = 1 + 3 + 5 = 3 e Eq u (c) = 1 + 8 =
3 3 3 4 4 4
sicch
Ep u (c) > Eq u (c) : (15.18)
Consideriamo la trasformazione strettamente crescente, ma non a ne,

x2 se x 0
(x) =
0 se x < 0

sicch u0 = u data da

(u(x))2 se u (x) 0
u0 (c) = ( u) (c) = :
0 se u (x) < 0

Si ha
1 1 1 35
Ep u0 (c) = (1)2 + (3)2 + (5)2 = ' 11:67
3 3 3 3
3 1 67
Eq u0 (c) = (1)2 + (8)2 = = 16:75
4 4 4
e dunque
Ep u0 (c) < Eq u0 (c)
ribaltando in tal modo la disuglianza (15.18). Le utilit u e u0 non sono quindi
equivalenti. N

In conclusione, le utilit Bernoulliane sono cardinali, ossia uniche a meno di trasfor-


mazioni a ni positive. Le trasformazione strettamente crescenti u di funzioni di
utilit Bernoulliane sono sempre funzioni di utilit sulle conseguenze certe C, cio

c % c0 () ( u) (c) ( u) (c0 ) 8c; c0 2 C


15.6. RISCHIO E CONCAVIT 507

ma conservano la Bernoullianit, ossia la propriet di ordinare le lotterie secondo le


utilit attese, solo se a ne.

NB. In problemi di decisione in condizioni di incertezza la condizione di invarianza


(15.16) diventa

EP u (f ) EP u (g) () EP u0 (f ) EP u0 (g) 8f; g 2 F

dove gli atti sostituiscono le lotterie. La dimostrazione della Proposizione 260 si pu


facilmente ripetere con questa condizione di invarianza, come il lettore pu vericare.
O

15.6.2 Avversione al rischio


Caratterizziamo ora la concavit delle utilit Bernoulliane grazie alla fondamentale
nozione di avversione al rischio.
Sia ( (C) ; %) un problema di decisione in condizioni di rischio, con conseguenze
monetarie: C un intervallo di R. Per ssare le idee, si pensi a lotterie che descrivono
attivit nanziarie. I decisori possono reagire in modo diverso rispetto al rischio che
caratterizza tali lotterie: molti decisori non lo amano, alcuni lo tollerano, altri ancora
lamano (come evidenzia il successo delle case da gioco). Dal nostro punto di vista tali
atteggiamenti verso il rischio sono importanti perch sono una componente essenziale
nelle scelte tra alternative incerte. Consideriamo due titoli nanziari: un titolo privo
di rischio che paga 5 euro e un titolo che paga con egual probabilit 9 euro o 1 euro.
Il primo titolo modellato dalla lotteria degenere p con p (5) = 1, il secondo titolo
dalla lotteria q tale che q (1) = q (9) = 1=2.
Nel confrontare i due titoli, intuitivamente, un decisore che non ama il rischio
preferir il titolo p che paga di sicuro 5 euro piuttosto che il titolo incerto q, sebbene
entrambi i titoli abbiano lo stesso valor medio di 5 euro:
1 9
p (5) 5 = q (1) 1 + q (9) 9 = + = 5:
2 2
Ma, essendo un valor medio pu benissimo accadere (con probabilit 1=2) che il de-
cisore che scelga q si ritrovi con solo 1 euro. questo peggior scenario che preoccupa
il decisore avverso al rischio, che si concentra quindi su di esso. Un tale decisore
preferisce p a q, cio
p % q: (15.19)
Al contrario, per un decisore amante del rischio si ha

p - q; (15.20)

mentre per un decisore che non bada al rischio i due titoli sono indierenti

p q: (15.21)
508 CAPITOLO 15. FUNZIONI CONCAVE

Ci che conta per tale decisore solo il valor medio, che uguale per entrambi i titoli.

Per formalizzare queste idee, indichiamo con mp il valor medio di una lotteria
p2 (C). Possiamo riscrivere (15.19), (15.20), and (15.21) come:

mp % p; p % mp ; p mp

Ci suggerisce la seguente classicazione.

Denizione 111 Un decisore avverso al rischio se, per ogni lotteria p 2 (C), si
ha
mp % p
amante del rischio se
p % mp
ed neutro rispetto al rischio se
p mp

In altre parole, un decisore avverso al rischio preferisce una possibilit certa a una
incerta con lo stesso valore atteso, mentre lopposto vale per un decisore amante del
rischio. Inne, un decisiore neutrale al rischio indierente tra le due.
Si noti che non una classicazione esaustiva: vi possono essere decisori che non
rientrano in alcuna delle tre categorie della denizione. Per essi vi almeno una
coppia di lotterie p e q con p % mp e mq q. Ci evidenzia anche un importante
limite operativo della Denizione 111: per poter classicare un decisore come avver-
so/amante/neutro occorre che egli confronti tutte le lotterie con i loro valori attesi.
Quindi, bench cogente dal punto di vista concettuale, la classicazione introdotta
dalla Denizione 111 alquanto problematica dal punto di vista operativo.
Per fortuna, il prossimo importante risultato ci soccorre, rendendo operativa la
classicazione:

Teorema 261 Un decisore avverso al rischio se e solo se la sua funzione di utilit


Bernoulliana concava. Egli amante del rischio se e solo se essa convessa, ed
neutrale se e solo se essa lineare.

Dim. Dimostriamo il risultato per lavversione al rischio, lasciando al lettore gli altri
casi. Supponiamo che la funzione u sia concava. Grazie alla disuguaglianza di Jensen,
per ogni lotteria p 2 (C) si ha
!
X X
u (mp ) = cp(c) u (c) p(c);
c2supp p c2supp p

sicch mp % p. Ci prova che il decisore avverso al rischio.


15.6. RISCHIO E CONCAVIT 509

Per mostrare il converso, supponiamo che il decisore sia avverso al rischio. Sia
0 1, e siano c e c0 due importi monetari. Consideriamo la lotteria p tale che
p (c) = e p (c0 ) = 1 . Grazie allavversione al rischio:

c + (1 )c0 = mp % p (15.22)

e quindi
u ( c + (1 )c0 ) = u (mp ) u(c) + (1 )u(c0 )
il che prova la concavit di u.

La prossima gura illustra il risultato per le lotterie p e q di inizio sezione:

5
y
u(9)

u(5)
(u(1)+u(9))/2
-5

-10
u(1)

O 1 5 9 x
-15
0 1 2 3 4 5 6

Grazie al Teorema 261, non pi necessario vericare per tutte le lotterie se il


decisore le preferisca o meno al loro valore atteso, ma basta consoscere la forma della
funzione di utilit. Se essa concava, per esempio u (c) = log c, ci su ciente per
concludere che il decisore avverso al rischio; se convessa, egli amante del rischio,
mentre se lineare a ne, cio u (c) = c + con > 0 e 2 R, allora egli neutro
rispetto al rischio.
Si ricordi, inoltre, dalla Sezione 8.5 che le funzioni di utilit Bernoulliane sono
uniche a meno di trasformazioni positive a ni (x) = x + , con > 0 e 2 R.
Tali trasformazioni preservano la concavit: se u concava, facile vedere che anche
u0 = u lo . Quindi, la concavit si preserva per funzioni di utilit Bernoulliane
equivalenti.

In conclusione, nella Teoria del rischio la concavit della funzione di utilit Bernoul-
liana caratterizza lavversione al rischio. Date le notevoli propriet della concavit
(specialmente nei problemi di ottimo, che sono centrali in Economia), molto impor-
tante che tale propriet abbia un cos naturale e cogente fondamento comportamentale.
510 CAPITOLO 15. FUNZIONI CONCAVE

Da ultimo, il lettore curioso si chieder qual la controparte dellavversione al ris-


chio in un problema di decisione in condizioni di incertezza. Un semplice adattamento
del Teorema 261 mostra che, in tale contesto, la funzione di utilit u : C ! R concava
se e solo se
f % Ep f
per ogni atto f : ! C. Ci suggersice di considerare avverso allincertezza un
decisiore che preferisce gli atti ai loro valori attesi. Lasciamo al lettore i dettagli.

15.6.3 Premio al rischio


Continuamo lo studio delle lotterie monetarie p 2 (C). Il certo equivalente cp di ogni
tale lotteria p lammontare certo che le indierente, ossia

cp Ep u (c)

Se u strettamente crescente, il certo equivalente si pu scrivere esplicitamente come


1
cp = u (Ep u (c))

Esempio 290 Se u (c) = log c e p la lotteria che assegna probabilit 1=2 a due premi
c1 e c2 , si ha
1 1 p p p p
cp = e 2 log c1 + 2 log c2 = elog c1 +log c2
= elog c 1 c2
= c1 c2

Il decisore logaritmico quindi indierente tra la lotteria p e lammontare certo


p
c1 c2 . N

I certi equivalenti consentono di denire il premio al rischio p di una lotteria p


come la dierenza
p = mp cp
tra il valor medio della lotteria e il suo certo equivalente. Poich

u (mp p) = Ep u (c)

il premio al rischio lammontare che rende il decisore indierente tra la lotteria e


lammontare certo mp p . Da

mp % p () u (mp ) Ep u (c) () mp cp

segue il prossimo risultato:

Proposizione 262 Un decisore avverso al (amante del) rischio se e solo ogni lot-
teria ha premio al rischio positivo (negativo), cio p 0 ( 0)per ogni p 2 (C).
15.6. RISCHIO E CONCAVIT 511

La nozione di premio al rischio fornisce una semplice caratterizzazione dellavver-


sione al rischio. In particolare, il premio al rischio , intuitivamente, una misura di
quanto il decisore sia avverso al rischio: tanto maggiore il premio al rischio che un
decisore richiede per ogni lotteria, tanto pi egli avverso al rischio.
Formalmente, siano u0 e u due utilit Bernoulliane di due diversi decisori, con
rispetti premi al rischio 0p e p per ogni lotteria p 2 (C). Diciamo che il decisore u0
pi avverso al rischio del decisore u se10
0
p p 8p (C)
Si noti che la disuguaglianza deve valere per ogni lotteria: la maggior avversione al
rischio un atteggiamento generale verso il rischio che deve valere rispetto ad ogni
situazione di rischio, ossia rispetto ad ogni lotteria.
Dal punto di vista formale vi un elegante e intuitiva caratterizzazione della
maggior avversione al rischio in termini di maggior concavit delle funzioni di util-
it Bernoulliane. In particolare, la funzione di utilit u0 si dice (strettamente) pi
concava della funzione di utilit u se esiste una trasformazione f : Im u ! R concava
e strettamente crescente tale che
u0 = f u
Intuitivamente, la concavit di f accentua la concavit di u, rendendendo la funzione
composta f u, ossia la funzione u, pi concava di u. Il prossimo celebre risultato,
dimostrato dal John Pratt nel 1964, mostra che decisore pi avversi al rischio hanno
funzioni di utilit Bernoulliani pi concave.
Teorema 263 (Pratt) Il decisore u0 pi avverso al rischio del decisore u se e solo
se u0 pi concava di u.
Il risultato di Pratt centrale in molte applicazioni economiche perch permette
risultati di statica comparata in avversione al rischio, che in problemi di ottimo dove
la funzione obiettivo unutilit attesa (per esempio, il problema di assicurazione
della Sezione 17.7) permettono di confrontare le soluzioni del problema al variare
dellavversione al rischio del decisore.
Esempio 291 (i) Ogni decisore avverso al rischio pi avverso al rischio di un de-
cisore neutrale al rischio. Questa naturale intuizione unimmediata conseguenza del
Teorema di Pratt: una funzione di utilit Bernoulliana u concava e strettamente cres-
cente infatti pi concava della funzione di utilit Bernoulliana u0 (c) = c (basta porre
f = u).
(ii) Posto C = (0; +1), il decisore
1
u0 (x) =
log c
2
p
pi avverso al rischio del decisore u (x) = c. Infatti, la funzione u0 pi
concava della funzione u: basta porre f (x) = log x. N
10
Per brevita scriviamo decisore u invece di decisore con funzioni di utilit Bernoulliana u.
512 CAPITOLO 15. FUNZIONI CONCAVE

15.7 Gran nale: lequazione di Cauchy


Chiudiamo il capitolo con un notevolissimo ra namento del Lemma 189 che mostra
come per funzioni che soddisfanno una minima condizione di regolarit (la continuit
in almeno un punto) ladditivit f (x + y) = f (x) + f (y) basti a caratterizzare le
funzioni lineari scalari.
Questo ra namento di solito si enuncia tramite lequazione funzionale di Cauchy,
con la quale ci si chiede se esistono funzioni f : R ! R per le quali

f (x + y) = f (x) + f (y) 8x; y 2 R:

Si parli di equazione funzionale perch qui lincognita una funzione f e non un


mero scalare, come nelle equazioni di vario grado studiate nelle scuole superiori.
Una funzione soddisfa lequazione di Cauchy se e solo se additiva. Vale in
proposito il

Teorema 264 (Cauchy) Se f : R ! R continua almeno in un punto, allora sod-


disfa lequazione di Cauchy se e solo se lineare, ossia del tipo f (x) = mx con
m 2 R.

Nel linguaggio del Lemma 189 il teorema diventa: una funzione f : R ! R con-
tinua in almeno un punto lineare se e solo se additiva. Con una minima propri-
et di regolarit, la propriet di omogeneit (i) del Lemma 189 automaticamente
soddisfatta11 .

Dim. Il Se banale; mostriamo il Solo se in tre passi. (1) Presi x = y = 0,


lequazione porge f (0) = f (0) + f (0) = 2f (0), cio f (0) = 0: tutte le funzioni che
soddisfanno lequazione passano per lorigine.
(2) Mostriamo che f continua in ogni punto. Sia infatti x0 il punto nel quale, per
ipotesi, f continua:
f (x) ! f (x0 ) per x ! x0
Consideriamo un altro (generico) punto z0 . Grazie allequazione di Cauchy e alla
continuit di f in x0 , si pu scrivere

f (x) = f (x z0 + z0 ) = f (x z0 ) + f (z0 ) ! f (x0 ) per x ! x0

Perci
f (x z0 ) ! f (x0 ) f (z0 ) = f (x0 z0 ) per x ! x0
che prova la continuit di f in x0 z0 e, per la genericit di x0 z0 , f ovunque
continua.
11
Tra le altre cose, il teorema consente di aermare che le funzioni additive non lineari devono
essere discontinue in ogni punto, e quindi sono estremamente irregolari. Ci le rende complicate da
descrivere (e non particolarmente belle da vedere) e per brevit non ne riportiamo esempi.
15.7. GRAN FINALE: LEQUAZIONE DI CAUCHY 513

(3) Utilizzando n volte lequazione di Cauchy, possiamo scrivere che, per ogni x 2 R
e per ogni n intero,
0 1

f (nx) = f @x
| + x{z
+ x}A = f (x) + f (x) + f (x) = nf (x)
| {z }
n volte n volte

Ora, essendo f (kx) = kf (x) per ogni x 2 R e ogni k intero e ponendo y = kx, si
deduce che
1 1 1
f (y) = kf y cio f y = f (y) 8y 2 R, 8k 2 N
k k k

In conclusione, combinando le due uguaglianze,


n n
f x = f (x) 8x 2 R, 8k; n 2 N
k k
ovvero
f (rx) = rf (x) 8x 2 R, 8r 2 Q
e, fatto x = 1 e ponendo f (1) = a,

f (r) = ar 8r 2 Q

La funzione f cos lineare sui razionali. Prendiamo ora una successione frk g di
razionali che tende a x irrazionale. Sappiamo che

f (rk ) = ark 8k = 1; 2; :

Dato che ark ! ax per k ! +1, per la continuit di f in ogni x 2 R,

ax = a lim rk = lim ark = lim f (rk ) = f lim rk = f (x)


k!+1 k!+1 k!+1 k!+1

che prova lasserto.

NB. La conclusione del Teorema 264 vale anche quando f denita solo su R+ : la
dimostrazione la stessa. Useremo questa versione del teorema nella Sezione 15.7.2.O

15.7.1 Varianti notevoli


Semplici varianti dellequazione di Cauchy sono:

(i) pi-per: consideriamo lequazione funzionale

f (x + y) = f (x) f (y) 8x; y 2 R: (15.23)


514 CAPITOLO 15. FUNZIONI CONCAVE

Essa ammette la soluzione banale f (x) = 0 per ogni x 2 R. Ogni altra sua
soluzione strettamente positiva. Infatti, se f una tale soluzione, per ogni
x 2 R si ha:
x x x x h x i2
f (x) = f + =f f = f 0
2 2 2 2 2
Inoltre, se esistesse y 6= 0 con f (y) = 0, per ogni x 2 R si avrebbe
f (x) = f ((x y) + y) = f (x y) f (y) = 0,
il che contraddice la non banalit di f .
In conclusione, ogni soluzione non banale di (15.23) strettamente positiva.
Grazie a ci, possiamo prendere i logaritmi di entrambi i membri di (15.23),
cosicch
log f (x + y) = log f (x) + log f (y) 8x; y 2 R;
che lequazione di Cauchy nella funzione incognita log f . La soluzione perci
log f (x) = mx con m 2 R, e quindi la funzione esponenziale
f (x) = emx
la soluzione non banale dellequazione funzionale (15.23).
(ii) per-pi: consideriamo lequazione funzionale
f (x y) = f (x) + f (y) 8x; y 2 R: (15.24)
Usando lidentit xy = elog x+log y essa diventa
f elog x+log y = f elog x + f elog y 8x; y 2 R:
Posto g (x) = f (ex ) per ogni x 2 R, si ha lequazione di Cauchy
g (log x + log y) = g (log x) + g (log y)
nella funzione incognita g, la cui soluzione g (x) = mx con m 2 R. Ci implica
f (ex ) = mx, ossia la funzione logaritmo
f (x) = log xm
la soluzione dellequazione funzionale (15.24).
(iii) per-per: consideriamo lequazione funzionale
f (x y) = f (x) f (y) 8x; y 2 R: (15.25)
Prendendo il logaritmo dei due membri, essa si riduce alla (ii) con log f al posto
di f , e perci la sua soluzione log f (x) = m log x ovvero la funzione potenza
f (x) = em log x = xm :
15.7. GRAN FINALE: LEQUAZIONE DI CAUCHY 515

I risultati test visti sono notevoli perch danno una fondazione funzionale alle
funzioni elementari. Per esempio, la funzione esponenziale si pu caratterizzare col
limite
x n
ex = lim 1 +
n!1 n
secondo quanto visto col Teorema 149, oppure, con un completo cambiamento di
prospettiva, come la funzione che risolve lequazione funzionale (15.23). Entrambi
i punti di vista su tale fondamentale funzione elementare sono di estrema importanza.
In ragione dellimportanza di questa nuova prospettiva sulle funzioni elementari,
diamo veste di teorema a quanto stabilito.

Teorema 265 (i) La funzione esponenziale f (x) = emx , con m 2 R, lunica


soluzione non banale dellequazione funzionale (15.23).

(i) La funzione logaritmica f (x) = log xm , con m 2 R, lunica soluzione delle-


quazione funzionale (15.24).

(ii) La funzione potenza f (x) = xm , con m 2 R, lunica soluzione dellequazione


funzionale (15.25).

15.7.2 Capitalizzazione
Un problema estremamente comune, per esempio nella pratica bancaria o sui mercati
nanziari, consiste nel calcolare il valore di un capitale ad una data futura. Indichiamo
con C limporto del capitale disponibile oggi, data 0, e con M il suo montante, cio il
suo valore alla data t 0. Lipotesi pi comune, e pi semplice, che M dipenda solo
da C e da t:
M = M (C; t) : R R+ ! R
con lovvia convenzione che C > 0 signica incasso e C < 0 esborso (C = 0 signica
assenza di movimento di denaro).
ragionevole supporre che tale funzione sia additiva rispetto alla prima variabile,
crescente (almeno debolmente) rispetto alla seconda e che valga C quando t = 0.
Formalmente:

(i) M (C1 + C2 ; t) = M (C1 ; t) + M (C2 ; t) per ogni t 0;

(ii) t1 < t2 implica M (C; t1 ) M (C; t2 ) per ogni C;

(iii) M (C; 0) = C.

Lipotesi (i), ossia che il montante di un capitale somma la somma dei due
montanti, pur di estrema semplicit, rispecchia ci che pi frequentemente accade
nella pratica. Si osservi che sarebbe insensato supporre che

M (C1 + C2 ; t) < M (C1 ; t) + M (C2 ; t)


516 CAPITOLO 15. FUNZIONI CONCAVE

per qualche valore di C1 ; C2 0 perch, in tal caso, non converrebbe impiegare il


capitale C1 +C2 ma piuttosto frazionarlo ottenendo cos un maggior montante. Sarebbe
invece del tutto legittimo immaginare che

M (C1 + C2 ; t) M (C1 ; t) + M (C2 ; t) ;

ma ci ci porterebbe un potroppo lontano.


Lipotesi (ii), ossia che il montante cresca al crescere della durata dellimpiego,
poco men che ovvia: si badi che ci implica di attribuire alla parola montante il
signicato di valore nominale (monetario) e non di valore reale (potere dacquisto),
che, al contrario del primo, potrebbe anche deteriorarsi nel tempo.
Inne, lipotesi (iii) sostanzialmente obbligatoria.

Possiamo subito dare il seguente

Teorema 266 Qualora la funzione M sia continua almeno per un valore di C, valgono
le ipotesi (i)-(iii) se e solo se

M (C; t) = Cf (t) ;

dove f : R+ ! R+ una funzione crescente e tale che f (0) = 1.

Dim. La prima ipotesi non altro che lequazione funzionale di Cauchy relativamente
alla prima variabile che compare in M . Come sappiamo dallomonimo teorema, essa
caratterizza le funzioni lineari e quindi M (C; t) del tipo Cf (t) con f (t) (indipendente
da C e quindi) funzione per ora arbitraria di t. Per rispettare la seconda ipotesi, f (t)
devessere crescente e, per la terza, devessere f (0) = 1.

Nelle ipotesi (i)-(iii) il montante dunque proporzionale allimporto C del capitale.


Si pu scrivere allora f (t) = M (1; t), cio f (t) il montante in t di un capitale
unitario; il montante di ogni altro capitale si ottiene semplicemente moltiplicandolo
per f (t). Per tal motivo f (t) detto fattore di montante.

Il pi comune fattore di montante, detto esponenziale, utilizzato nella pratica


bancaria e non, denito da

f (t) = e t = (1 + i)t = t
con ; i 0e 1

ove chiaramente 1 + i = = e , cio = log (1 + i) = log . Il valore di i detto tasso


o saggio (annuo) dinteresse. Per esempio, con i = 0; 04 (4% annuo) il montante di
5:000 euro dopo 3 anni risulta 5:000 1; 043 = 5:624; 32 euro.

Immaginiamo di impiegare un capitale C da oggi, 0, sino alla data t1 + t2 ; possiamo


pensare di eettuare limpiego:

(a) direttamente dallinizio alla ne ottenendo cos il montante Cf (t1 + t2 ), oppure


15.7. GRAN FINALE: LEQUAZIONE DI CAUCHY 517

(b) prima da 0 a t1 ottenendo il montante Cf (t1 ) e di reimpiegare tale importo per


la residua durata t2 giungendo cos al montante nale (Cf (t1 )) f (t2 ).

I due montanti, senza e con linterruzione in t1 , sono in generale diversi. Dallo


studio della variante (15.23) dellequazione di Cauchy, sappiamo che, se f continua
almeno in un punto, risulta
f (t1 + t2 ) = f (t1 ) f (t2 ) 8t1 ; t2 0
se e solo se f (t) = e t .

Osserviamo che, se luguaglianza f (t1 + t2 ) = f (t1 ) f (t2 ) fosse violata in un mer-


cato perfetto (nel quale si pu indierentemente investire o nanziarsi alle condizioni
sancite da f ), sarebbe possibile un arbitraggio: se fosse f (t1 + t2 ) > f (t1 ) f (t2 )
converrebbe investire senza interruzioni da 0 a t1 + t2 e indebitarsi con interruzione
in t1 intascando cos la dierenza f (t1 + t2 ) f (t1 ) f (t2 ) > 0; viceversa, se fosse
f (t1 + t2 ) < f (t1 ) f (t2 ), converrebbe indebitarsi senza interruzioni investendo con
uninterruzione in t1 . In un mercato perfetto di capitali luguaglianza f (t1 + t2 ) =
f (t1 ) f (t2 ) deve allora essere rigidamente rispettata per ogni scelta di t1 ; t2 . In
conclusione, lunica legge di capitalizzazione che garantisce lassenza di arbitraggio
lesponenziale.

Accenniamo brevemente anche al problema inverso, ovvero calcolare il valore oggi,


in 0, di un capitale C disponibile ad una data futura t > 0. Il valore in 0, detto valor
attuale denito come limporto A = A (C; t) tale che il suo montante in t sia proprio
C, ovvero
M (A (C; t) ; t) = C
che porge immediatamente
A (C; t) f (t) = C
cio
C
= C' (t) ;
A (C; t) =
f (t)
avendo chiamato ' il reciproco di f . Ovviamente
' (t) = A (1; t)
il valor attuale di un capitale unitario ed detto fattore di sconto. Un fattore di
sconto, essendo nullaltro che il reciproco di un fattore di montante, una funzione
' : R+ ! R+ positiva, decrescente e tale che ' (0) = 1.
In particolare, il fattore di sconto reciproco del fattore esponenziale di montante
denito da
1 1
' (t) = e t = t = t
(1 + i)
con ; i 0 e 1.
518 CAPITOLO 15. FUNZIONI CONCAVE
Capitolo 16

Funzioni omogenee

16.1 Omogeneit e rendimenti di scala


Le propriet dei rendimenti di scala sono di grande interesse per le funzioni di pro-
duzione. In matematica queste propriet vanno sotto il nome di omogeneit. Comin-
ciamo con la pi classica di esse, la positiva omogeneit; per funzioni di produzione
corrisponde allipotesi di rendimenti costanti di scala.
Denizione 112 Una funzione f : C Rn ! R denita su un insieme convesso con
0 2 C si dice positivamente omogenea se
f ( x) = f (x) (16.1)
per ogni x 2 C e ogni 2 [0; 1].
Quindi, un taglio proporzionale x di tutte le componenti del vettore x determina
un analogo taglio f (x) del valore f ( x) della funzione.
Esempio 292 (i) Le funzioni omogenee f : Rn ! R (e quindi le lineari) sono positiva-
p
mente omogenee. (ii) La funzione f : R2+ ! R data da f (x) = x1 x2 positivamente
omogenea. Infatti
p p p
f ( x) = ( x1 ) ( x2 ) = 2x x = x1 x2 = f (x)
1 2

per ogni 0. N
Si noti che per funzioni positivamente omogenee si ha
f (0) = 0 (16.2)
Infatti, per ogni 2 [0; 1] si ha f (0) = f ( 0) = f (0), il che implica f (0) = 0. In
altre parole, le funzioni positivamente omogenee sono nulle nellorigine.

La condizione 0 2 C fa si che x 2 C per ogni 2 [0; 1], sicch la (16.1) risulta


ben denita. Quando C un cono (come nelle funzioni dellesempio precedente) la
propriet (16.1) vale per ogni scalare positivo.

519
520 CAPITOLO 16. FUNZIONI OMOGENEE

Proposizione 267 Una funzione f : C Rn ! R denita su un cono C positiva-


mente omogenea se e solo se
f ( x) = f (x) (16.3)
per ogni x 2 C e ogni 0.

Dim. Poich il Se ovvio, consideriamo il Solo se. Sia f positivamente omogenea


e x 2 C. Dobbiamo mostrare che f ( x) = f (x) per ogni > 1. Sia quindi > 1
e si ponga y = x, cosicch x = y= . Da > 1 segue 1= < 1. Grazie alla positiva
omogeneit di f si ha
1 1 1
f (x) = f y = f (y) = f ( x)

ossia f ( x) = f (x), come desiderato

Una funzione positivamente omogenea su un cono preserva dunque la moltipli-


cazione scalare positiva: moltiplicando un vettore x per un qualsiasi scalare positivo
, limmagine f ( x) uguale allimmagine f (x) di x moltiplicata per lo scalare .
Quindi, sia tagli sia aumenti proporzionali in x determinano analoghi tagli o aumen-
ti in f (x). Quando f una funzione di produzione ritroviamo la classica ipotesi di
rendimenti costanti di scala: raddoppiando gli input, si raddoppia loutput ( = 2),
triplicando gli inpunt si triplica gli output ( = 3), e cos via.

Le funzioni di produzioni lineari sono positivamente omogenee e quindi, come gi


osservato nellEsempio 285, hanno rendimenti costanti di scala. Vediamo un altro
classico esempio.

Esempio 293 Sia f : R2+ ! R la funzione di produzione CES (constant elasticity of


substitution) data da
1
f (x) = ( x1 + (1 ) x2 )
con 2 [0; 1] e > 0. Essa positivamente omogenea:
1 1
f ( x) = ( ( x1 ) + (1 ) ( x2 ) ) = ( ( x1 + (1 ) x2 ))
1
= ( x1 + (1 ) x2 ) = f (x)

per ogni 0. N

Oltre a essere costanti, i rendimenti di scala possono essere crescenti oppure de-
crescenti. Ci motiva le due seguenti propriet.

Denizione 113 Una funzione f : C Rn ! R denita su su un insieme convesso


con 0 2 C si dice ( positivamente) superomogenea se

f ( x) f (x)
16.1. OMOGENEIT E RENDIMENTI DI SCALA 521

per ogni x 2 C e ogni 2 [0; 1], mentre si dice ( positivamente) subomogenea se

f ( x) f (x)

per ogni x 2 C e ogni 2 [0; 1].

Naturalmente, una funzione positivamente omogenea se e solo se sia subomo-


genea sia superomogenea.
Quando f una funzione di produzione, la subomogenit cattura i rendimenti
decrescenti di scala e la superomogeneit i crescenti. Ci si vede con chiarezza nel-
la versione della Proposizione 267 per funzioni subomogenee e superomogenee. Per
brevit consideriamo il caso subomogeneo, lasciando al lettore il caso superomogeneo.

Proposizione 268 Una funzione f : C Rn ! R denita su un cono convesso


subomogenea se e solo se per ogni x 2 C si ha

f ( x) f (x) 8 2 [0; 1]

e
f ( x) f (x) 8 1:

Dim. Consideriamo il Solo se, il converso essendo banale. Sia f subomogenea e


x 2 C. Dobbiamo mostrare che f ( x) f (x) per ogni > 1. Sia quindi > 1 e
si ponga y = x, cosicch x = y= . Da > 1 segue 1= < 1. Grazie alla positiva
subomogeneit di f si ha
1 1 1
f (x) = f y f (y) = f ( x)

ossia f ( x) f (x), come desiderato

Quindi, raddoppiando gli input ( = 2) loutput si incrementa meno del doppio,


triplicando gli input ( = 3) loutput si incrementa meno del triplo, e cos via per
ogni 1. Incrementi proporzionali negli input determinano aumenti meno che
proporzionali negli output, il che modella lipotesi di rendimenti decrescenti nella pro-
duzione. Considerazioni speculari valgono per i rendimenti crescenti, in cui aumenti
proporzionali degli input determinano aumenti pi che proporzionali nelloutput.

Esempio 294 Consideriamo la seguente versione generale di una funzione f : R2++ !


R di produzione di Cobb-Douglas

f (x) = xa1 xb2

con a; b 0 ma senza richiedere a + b = 1. Per ogni 2 [0; 1] si ha

f ( x) = ( x1 )a ( x2 )b = a+b a b
x1 x2 = a+b
f (x)

Quindi, la funzione di produzione positivamente:


522 CAPITOLO 16. FUNZIONI OMOGENEE

(i) omogenea se a + b = 1 (rendimenti di scala costanti);

(ii) subomogenea se a + b 1 (rendimenti di scala decrescenti);

(iii) superomogenea se a + b 1 (rendimenti di scala crescenti).

Tutto ci si estende facilmente al caso generale


Y
n
f (x) = xai i
i=1

con ai 0 per ogni i. Infatti:


Y
n
ai
Y
n Y
n Y
n
ai ai
f ( x) = ( xi ) = xi = ai
xai i
i=1 i=1 i=1 i=1
Pn Y
n
Pn
= i=1 ai
xai i = i=1 ai
f (x)
i=1
Pn
per
Pn ogni 2 [0; 1]. Ne segue che
Pnf omogenea se i=1 ai = 1, subomogenea se
i=1 ai 1 e superomogenea se i=1 ai 1. N

Tirando le somme, le nozioni di omogeneit test viste si deniscono per 2 [0; 1],
cio per tagli proporzionali, su insiemi convessi contenenti lorigine, ma trovano il
loro ambiente naturale su coni dove modellano le classiche ipotesi di rendimenti sui
scala. Bench, dal punto di vista matematico, sia unosservazione molto semplice (le
dimostrazioni delle Proposizioni 267 e 267 sono elementari), il caso 1 molto
importante nelle applicazioni.

Le funzioni concave sono subomogenee, purch positive allorigine.

Proposizione 269 Sia f : C Rn ! R denita su un insieme convesso, con 0 2 C


e f (0) 0. Se f concava, allora subomogenea.

Per le funzioni di produzione la condizione di positivit f (0) 0 banalmente


soddisfatta (di solito con uguaglianza). Quindi, funzioni di produzione concave hanno
rendimenti di scala decrescenti. Lasciamo al lettore lanalogo risultato per funzioni
convesse.

Dim. Sia f concava e sia x 2 C. Per ogni 2 [0; 1] si ha

f ( x) = f ( x + (1 ) 0) f (x) + (1 ) f (0) f (x)

e quindi f (x) f ( x).

Le funzioni concave con f (0) 0 sono quindi subomogenee. Tra esse sono di
particolare interesse quelle positivamente omogenee.
16.1. OMOGENEIT E RENDIMENTI DI SCALA 523

Denizione 114 Una funzione f : C Rn ! R denita su un cono convesso si dice:

(i) superlineare se sia concava sia positivamente omogenea;

(ii) sublineare se sia convessa sia positivamente omogenea;

(iii) ultra ne se sia superlineare sia sublineare.

Gli Esempi 298 e 299 mostreranno che alcune classiche funzioni usate in Economia
sono superlineari. Vediamo un primo esempio.

Esempio 295 Abbiamo visto come la funzione f : Rn ! R denita da

f (x) = min xi
i=1;:::;n

sia concava. Essa positivamente omogenea:

f ( x) = min xi = min xi = f (x) 8 0


i=1;:::;n i=1;:::;n

ed quindi superlineare. Quindi, la funzione di utilit di Leontief superlineare. N

Le norme sono un importante esempio di funzioni sublineari.

Esempio 296 La funzione norma k k : Rn ! R sublineare. Infatti, essa positiva-


mente omogenea e convessa (Esempio 281). N

Il prossimo risultato mostra che, rispetto alla concavit, la superlinearit richiede


la disuguaglianza per tutti i coe cienti positivi, non solo per quelli con somma 1.

Proposizione 270 Sia f : C Rn ! R una funzione superlineare denita su un


cono convesso. Allora, f (0) = 0 e per ogni x; y 2 C si ha

f ( x + y) f (x) + f (y) 8 ; 0. (16.4)

Dim. Sia f superlineare. Poich positivamente omogenea, vale la (16.2), cio


f (0) = 0. Inoltre, per ogni ; 0,

f ( x + y) = f ( + ) x+ y = ( + )f x+ y
( + ) ( + ) ( + ) ( + )

( + ) f (x) + f (y) = f (x) + f (y)


( + ) ( + )
come desiderato.

In modo simile si mostra che f : C Rn ! R sublineare se e solo se la (16.4) vale


con la disuguaglianza opposta, mentre luguaglianza caratterizza le funzioni ultra ni.
524 CAPITOLO 16. FUNZIONI OMOGENEE

In ogni caso, si passa da coe cienti positivi e1 a coe cienti positivi qualunque
e .

Da ultimo, consideriamo funzioni superlineari f : V Rn ! R denite su un


sottospazio vettoriale V di Rn , cosicch x + y 2 V per ogni x; y 2 V . Tali funzioni
sono superadditive, cio f (x + y) f (x) + f (y). Infatti:

1 1 1 1 1
f (x + y) = 2f (x + y) = 2f x+ y 2 f (x) + 2 f (y) = f (x) + f (y)
2 2 2 2 2

dove la prima uguaglianza segue dalla positiva omogeneit e la disuguaglianza dalla


concavit. In modo analogo si mostra che le funzioni sublineari f : V Rn ! R sono
subadditive, f (x + y) f (x) + f (y),1 sicch le funzioni ultra ni f : V Rn ! R
sono additive, f (x + y) = f (x) + f (y). Grazie alla positiva omogeneit di f , ci
implica la linearit di tali funzioni ultra ni:

Proposizione 271 Una funzione f : V Rn ! R denita su un sottospazio vettori-


n
ale V di R ultra ne se e solo se lineare.

Il risultato motiva la terminologia superlineare e sublineare per questa importante


classe di funzioni concave e convesse.

16.2 Omotetia
Nella Teoria del consumatore si usa la seguente versione ordinale della positiva omo-
geneit.

Denizione 115 Una funzione f : C Rn ! R denita su un cono si dice omotetica


se
f (x) = f (y) =) f ( x) = f ( y)

per ogni x; y 2 C e ogni 0.

In particolare, una funzione di utilit u omotetica quando lordinamento tra


panieri x e y preservato moltiplicando entrambi per una stessa costante positiva. In
altre parole lordinamento invariante rispetto alla scala: se si raddoppiano (triplicano,
ecc. ecc.) i vettori non si altera il loro ordinamento relativo.2
1
Il lettore ardimentoso pu cimentarsi nel dimostrare che, in realt, una funzione f : V Rn ! R
superlineare (sublineare) se e solo se sia superadditive (subadditiva) sia positivamente omogenea.
2
Si noti che qui si pone 0, e non solo 2 [0; 1], perch in questa denizione C un cono.
16.2. OMOTETIA 525

8
y
7

6 k=3

5
k=2
4

2 k=1

0
O x
-1
0 0.5 1 1.5 2 2.5 3 3.5

p
Curve di livello della funzione omotetica x2 x2

Lomotetia ha una semplice caratterizzazione, che lasciamo dimostrare al lettore.


Proposizione 272 Una funzione h : C Rn ! R denita su un cono omotetica
se e solo se esprimibile come
h=f g
con g : C Rn ! R positivamente omogenea e f : Im g ! R strettamente crescente.
In altre parole, una funzione omotetica se e solo se trasformazione stretta-
mente crescente di una funzione positivamente omogenea3 . In particolare, le funzioni
omogenee sono omotetiche poich f (x) = x strettamente crescente.
Esempio 297 Sia u : Rn++ ! R la funzione di utilit Cobb-Douglas
Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1
Pn
con i P0 e i=1 i = 1. DallEsempio 294 segue che essa positivamente omogenea
poich ni=1 i = 1.
Se f strettamente crescente, le trasformazioni f u della funzione di utilit di
Cobb-Douglas sono omotetiche. Per esempio, se f (x) = log x, si ottiene la funzione
di utilit log-lineare v = log u data da
X
n
v (x) = i log xi
i=1

che omotetica. Essa la forma pi usata, perch pi comoda, della Cobb-Douglas.


N
3
Si ricordi al riguardo che ci non vero per la quasi concavit: come si osservato nellultima
nota, esistono funzioni quasi concave che non sono trasformazioni di funzioni concave.
526 CAPITOLO 16. FUNZIONI OMOGENEE

16.3 Omogeneit e quasi concavit


Chiudiamo con un bel risultato, di cui omettiamo la non semplice dimostrazione, che
mostra come la quasi concavit sia equivalente alla concavit per funzioni positive
che siano anche positivamente omogenee. Per apprezzarne la portata, ricordiamoci di
come la quasi concavit sia, in generale, molto pi debole della concavit.

Teorema 273 Sia f : C Rn ! R una funzione positivamente omogenea denita su


un cono. Se f 0, allora f concava se e solo se quasi concava.

Il risultato equivale ad aermare che una funzione f 0 superlineare se e solo


se quasi concava e positivamente omogenea. La condizione f 0 necessaria: la
funzione f : R ! R data da
(
2x se x 0
f (x) =
x se x < 0

strettamente crescente (e quindi quasi concava) e positivamente omogenea. Tuttavia


non concava (anzi convessa).

Vediamo un paio di notevoli applicazioni del risultato. In entrambe lo useremo per


provare la concavit di alcune classiche funzioni mostrando che sono positive, quasi
concave e positivamente omogenee. Questa via, aperta dal Teorema 273, risulta molto
pi semplice che vericare direttamente la loro concavit.

Esempio 298 La funzione di produzione CES


1
f (x) = ( x1 + (1 ) x2 )

con 2 [0; 1] e 2 (0; 1], concava. Per = 1 laermazione ovvia. Se < 1,


si osservi che su R+ la funzione potenza x concava se 2 (0; 1), e quindi lo
1
g (x) = x1 + (1 ) x2 . Siccome h (x) = x strettamente crescente su R+ per
ogni > 0; ne segue che f = h g quasi concava. Ma f 0, e grazie al Teorema
273 possiamo concludere che f concava poich avevamo gi mostrato la sua positiva
omegenit. In particolare, f superlineare perch sia concava sia positivamente
omogenea. N

Il prossimo esempio ci d loccasione per presentare un utile risultato.

Lemma 274 Il prodotto f g : C Rn ! R di due funzioni f; g : C Rn ! R


concave e strettamente positive una funzione quasi concava.

Dim. Siccome f e g sono strettamente positive, possiamo scrivere

log (f g) = log f + log g


16.3. OMOGENEIT E QUASI CONCAVIT 527

Le funzioni log f e log g sono concave grazie alla Proposizione 257. Quindi, log (f g)
concava perch somma di funzioni concave (Proposizione 254). Ne segue che f g quasi
concava perch f g = elog f g trasformazione strettamente crescente di una funzione
concava.

Esempio 299 La funzione di utilit Cobb-Douglas


Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1
Pn
con i > 0 e i=1 i = 1, concava. Per poter applicare il Teorema 273, consideriamo
la funzione u sullintero quadrante Rn+ e non solo su Rn++ (infatti Rn+ un cono, a
dierenza di Rn++ ). Ogni funzione potenza xi i concava e strettamente positiva.
Siccome la funzione u il loro prodotto, dal lemma precedente segue che essa quasi
concava. Poich u 0, il Teorema 273 implica che u sia concava su Rn+ (e quindi, a
fortiori, su Rn++ ) dato che abbiamo gi visto come u sia positivamente omogenea. In
particolare, la funzione di utilit Cobb-Douglas, come la funzione di produzione CES,
superlineare. N
528 CAPITOLO 16. FUNZIONI OMOGENEE
Capitolo 17

Problemi di ottimo

17.1 Generalit
I problemi di ottimo sono fondamentali in Economia, il cui studio si basa sullanalisi
dei problemi di ottimo degli agenti economici, quali individui (consumatori, produttori
e investitori), famiglie e governi. Per tale ragione questo il capitolo centrale del libro,
che motiva lo studio sia delle nozioni viste sinora sia di quelle che si aronteranno nei
capitoli successivi.

Consideriamo la funzione f : R ! R data da f (x) = 1 x2 , il cui graco

4 y
3

0
O x
-1

-2

-3

-4

-5
-4 -3 -2 -1 0 1 2 3 4 5

Graco di f (x) = 1 x2 :

529
530 CAPITOLO 17. PROBLEMI DI OTTIMO

immediato vedere come la funzione assuma il proprio valore massimo1 , pari a 1,


in corrispondenza del punto 0, ossia dellorigine. La funzione non ha invece minimo.
Supponiamo invece, per qualche ragione, di essere interessati al suo comportamento
solo sullintervallo [1; 2], e non sullintero dominio R. In tal caso, la funzione ha 0 come
valore massimo, realizzato in corrispondenza del punto 1, mentre ha 3 come valore
minimo in corrispondenza del punto 2.
Da questo esempio scendono due osservazioni cruciali:

(i) la distinzione tra valore di massimo e punto di massimo: un punto di massimo


un elemento del dominio in cui la funzione raggiunge il proprio valore massimo,
che lelemento del codominio che corrisponde allimmagine di un punto di
massimo;

(ii) limportanza del sottoinsieme del dominio in cui si interessati a stabilire le-
sistenza di punti di massimo o di minimo.

Le due osservazioni portano alla prossima denizione, in cui consideriamo un


sottoinsieme C del dominio A di una funzione f , detto insieme di scelta (o delle
possibilit).

Denizione 116 Sia f : A Rn ! R una funzione a valori reali e sia C un sot-


toinsieme di A. Un elemento x^ 2 C si dice punto di massimo ( globale) di f su C
se
f (^
x) f (x) 8x 2 C: (17.1)
x) della funzione in x^ si dice massimo (o valore massimo) globale2 , di f
Il valore f (^
su C.

Nel caso particolare C = A, ossia quando si considera come insieme di scelta lintero
dominio, lelemento x^ si dice punto di massimo, senza ulteriori specicazioni.
Nellesempio iniziale avevamo considerato due casi:

(i) nel primo caso C era lintero dominio, ossia C = R, e risultava x^ = 0 e


max f (R) = 1;

(ii) nel secondo caso C era lintervallo [1; 2] e si aveva x^ = 1 e max f ([1; 2]) = 0.

Il valore massimo di f sullinsieme di scelta C non altro che il massimo dellinsieme


f (C), cio3
f (^
x) = max f (C) :
1
Per la loro maggiore importanza in economia, nel seguito ci concentreremo sui massimi, dato che
considerazioni del tutto analoghe valgono per i minimi.
2
Talvolta invece di globale si usa laggettivo assoluto.
3
Si ricordi che f (C) = ff (x) : x 2 Cg linsieme (7.1) di tutte le immagini di punti che
appartengono a C.
17.1. GENERALIT 531

Grazie alla Proposizione 15, il valore massimo unico. Indichiamo tale unico valore
come
max f (x) :
x2C

I punti di massimo possono invece non essere unici e il loro insieme si indica con
arg maxC f , cio

arg max f (x) = x 2 C : f (x) = max f (x) :


x2C x2C

Per esempio, per la funzione f : R ! R denita da


8
>
> x+1 se x 1
<
f (x) = 0 se 1<x<1
>
>
: x+1 se x 1

si ha maxx2R f (x) = 0 e arg maxx2R f (x) = [ 1; 1]: linsieme dei punti di mas-
simo tutto lintervallo [ 1; 1]. Daltra parte, se ci restringiamo a [1; +1), si ha
maxx2[1;+1) f (x) = 0 e arg maxx2[1;+1) f (x) = f1g, ossia 1 lunico punto di massimo
di f su [1; +1).

Denizione 117 Sia f : A Rn ! R una funzione a valori reali e sia C un


sottoinsieme di A. Un punto x^ 2 C si dice di massimo forte (o stretto) se

f (^
x) > f (x)

per ogni x 2 C distinto da x^.

I massimi forti sono una classe molto importante di massimi, con la seguente
notevole propriet di unicit.

Proposizione 275 Un punto di massimo forte se e solo se unico, ossia se e solo


se arg maxC f un singoletto.

Dim. Solo se. Supponiamo per contra che esistano due distinti punti di massimo
globale forte x^1 e x^2 . Per denizione, si ha f (^ x2 ) e f (^
x1 ) > f (^ x1 ), il che
x2 ) > f (^
impossibile.
Se. Sia arg maxx2C f un singoletto f^ xg. Per ipotesi, f (^ x) f (x) per ogni
x 2 C. Supponiamo per contra che esista y 2 C tale che f (^ x) = f (y). Si ha
x) f (x) per ogni x 2 C, il che contraddice il fatto che x^ sia lunico punto
f (y) = f (^
di massimo.

In altri termini la forza di un massimo equivale alla sua unicit. Quando vale,
la forza, e quindi lunicit, dei massimi una notevolissima propriet che semplica
532 CAPITOLO 17. PROBLEMI DI OTTIMO

grandemente lo studio di come variano i punti e valori di massimo al variare dellinsieme


di scelta C in esame. Per esempio, di come variano i panieri ottimi, e loro utilit, al
variare dellinsieme di bilancio in seguito a variazioni nel reddito del consumatore o
nei prezzi (si veda la Sezione 17.1.3). Tale analisi nelle applicazioni economiche
nota come Statica comparata, e rappresenta uno strumento fondamentale della Teoria
economica. Essa particolarmente e cace quando i massimi sono unici, ossia forti.

Sinora abbiamo parlato di punti di massimo, ma analoghe considerazioni valgono


per i punti di minimo. Per esempio, nella Denizione 116 un elemento x^ 2 C
punto di minimo (globale) di f su C se f (^ x) f (x) per ogni x 2 C, con valore di
minimo f (^ x) = min f (C), indicato come minx2C f (x). Rendere massimo e rendere
minimo sono in realt due facce della stessa medaglia: ci formalizzato dal prossimo
risultato, la cui ovvia dimostrazione si basa sullosservazione che f (x) f (y) se e
solo se f (x) f (y) per ogni x; y 2 A.

Proposizione 276 Sia f : A ! R una funzione a valori reali denita su un insieme


A Rn e sia C un sottoinsieme di A. Un punto x^ 2 C di minimo di f su C se e
solo se di massimo di f su C, ed punto di massimo di f su C se e solo se di
minimo di f su C. In particolare,

min f (x) = max ( f ) (x) e max f (x) = min ( f ) (x) :


x2C x2C x2C x2C

Per esempio, immediato vedere come i punti di minimo della funzione f : R ! R


data da f (x) = x2 1 siano di massimo per la funzione f (x) = 1 x2 vista allinizio
della sezione.
Grazie alla Proposizione 276, tra massimi e minimi esiste una naturale dualit che
rende i risultati nellun caso semplici versioni speculari dellaltro caso. Perci, dal
punto di vista matematico, la scelta di quale studiare tra tali due problemi equivalenti
solo questione di comodit, senza alcuna rilevanza concettuale. Vista la loro mag-
gior importanza nelle applicazioni economiche, nel seguito tenderemo a considerare
le propriet dei massimi, lasciando al lettore le analoghe propriet per i minimi. In
ogni caso, si tenga presente che la voce estremo sta indierentemente per massimo o
minimo.

Il problema di rendere massima o minima una funzione f : A ! R su un assegnato


insieme di scelta C A Rn , ossia di trovarne il massimo e i punti di massimo
(o il minimo e i punti di minimo), detto problema di ottimo con funzione obiettivo
f . In un problema di ottimo i punti di massimo (o di minimo) sono detti soluzioni.
Le soluzioni sono dette forti se tali sono i punti di massimo (o di minimo). Per la
Proposizione 275, una soluzione forte se e solo se unica.
Scriveremo un problema di massimo come

max f (x) sub x 2 C (17.2)


x
17.1. GENERALIT 533

e un problema di minimo con min al posto di max. Quando C = A, nella scrittura


talvolta si omette la clausola sub x 2 C poich x deve ovviamente appartenere al
dominio di f . Nel caso particolare in cui A = C e A aperto, si parla di problemi di
ottimo libero; diversamente, si parla di problemi di ottimo vincolato.

17.1.1 La fortuna del principiante


Normalmente la risoluzione di problemi di ottimo piuttosto complicata e le dedicher-
emo il Capitolo 27. Tuttavia i punti di massimo (o di minimo) si possano talvolta
trovare a occhio nudo, come mostrano i prossimi fortunati esempi.

Esempio 300 Sia f : R ! R data da f (x) = 2x x2 . Consideriamo il problema di


ottimo
max f (x) sub x 2 R;
x

ossia cerchiamo il punto di massimo di f su tutto il suo dominio. Visto che si pu


scrivere f (x) = 2x x2 1 + 1 = 1 (x 1)2 , risulta

f (x) 1 8x 2 R

e, dato che f vale 1 in x^ = 1, anzi f vale 1 solo in x^ = 1, possiamo aermare che x^ = 1


punto di massimo forte di f su R. Si vede inoltre che f non inferiormente limitata
in R e perci essa non possiede punti di minimo globale. Il massimo di f su R 1. N

Esempio 301 Sia f : R2 ! R denita da f (x1 ; x2 ) = x21 6x1 x2 +12x22 . Consideriamo


il problema di ottimo
min f (x) sub x 2 R2 :
x

Dato che f (x1 ; x2 ) = x21 6x1 x2 + 9x22 + 3x22 = (x1 3x2 )2 + 3x22 , cio f la somma
di due quadrati, si ha che

f (x1 ; x2 ) 0 8 (x1 ; x2 ) 2 R2 :

Visto che f (0; 0) = 0, anzi vale 0 solo in esso, possiamo concludere che (0; 0) punto
di minimo forte di f su R2 . Si vede inoltre che f non superiormente limitata in R2
e perci essa non possiede punti di massimo. Il minimo di f su R2 0. N
x21 x22 x23
Esempio 302 Sia f : R3 ! R data da f (x1 ; x2 ; x3 ) = e . Consideriamo il
problema di ottimo
max f (x) sub x 2 R3 :
x

Visto che 0 < f (x1 ; x2 ; x3 ) 1 per ogni (x1 ; x2 ; x3 ) 2 R3 e che f (0; 0; 0) = 1, si ha che
(0; 0; 0) punto di massimo forte di f su R3 . La funzione non possiede invece punti di
minimo perch essa non raggiunge mai lestremo inferiore 0 dei suoi valori. Il massimo
di f su R3 1. N
534 CAPITOLO 17. PROBLEMI DI OTTIMO

Esempio 303 Sia f : R ! R denita fa f (x) = cos x. Consideriamo il problema di


ottimo
min f (x) sub x 2 R
x

Dato che 1 cos x 1, tutti i punti nei quali f (x) = 1 sono di massimo e tutti i
punti nei quali f (x) = 1 sono di minimo. I punti di massimo sono perci x^ = 2k per
k 2 Z e i punti di minimo sono x~ = (2k + 1) per k 2 Z. I valori massimo e minimo
sono rispettivamente 1 e 1.
Questi punti di massimo e minimo su R non sono forti. Tuttavia, se consideriamo
un insieme di scelta meno ambizioso, quale per esempio C = [0; 2 ), si trova lunico
punto di massimo forte x^ = 0 e lunico punto di minimo forte x~ = . N

Esempio 304 Per una funzione costante tutti punti del dominio sono simultanea-
mente di massimo e di minimo. N

Si noti che la Denizione 116 non richiede alcuna propriet alla funzione, in par-
ticolare la continuit (o la derivabilit). Per esempio, la funzione f : R ! R data da
f (x) = jxj minima per x^ = 0. La funzione f : R ! R data da
(
x + 1 se x 1
f (x) =
x se x > 1
massima per x^ = 1 ove vale 2, pur essendo discontinua in tale punto.
Pu anche accadere che un punto isolato sia di massimo (o di minimo). Per esempio,
la funzione cos denita 8
>
> x + 1 se x 1
<
f (x) = 5 se x = 2
>
>
: x se x > 4
massima per x^ = 2.

OfB. Come abbiamo gi osservato, il valore massimo di f : A Rn ! R su C A non


altro che maxf (C). Il particolare fondamentale che esso un valore eettivamente
raggiunto da f , cio esiste almeno un punto x^ 2 C per il quale f (^
x) = maxf (C). Si
pu dunque scegliere un punto in C di f per intascarneeettivamente il massimo.
Anche quando il massimo non esiste, linsieme immagine f (C) pu ammettere
estremo superiore supf (C) nito. Il particolare sgradevole che non vi alcun punto
in C nel quale esso raggiunto, cio non possiamo metterlo in tasca. Da un punto
di vista pragmatico, la cosa meno preoccupante di quanto potrebbe apparire a prima
vista.
Infatti, come indica la Proposizione 52, possiamo scegliere un punto nel quale f
arbitrariamente vicina al sup. Se supf (C) = 48, non potremo mai arrivare esatta-
mente a 48, ma possiamo sempre scegliere un punto nel quale la funzione vale 47; 9 e,
se non ci basta, un punto nel quale f vale 47; 999999999999 e, se non ci basta.... Ci
possiamo contentare. Analoghe considerazioni valgono per minimi. H
17.1. GENERALIT 535

17.1.2 Propriet
I problemi di ottimo (17.2) godono di una semplice, ma importante, propriet di
invarianza.

Proposizione 277 Sia g : B R ! R una funzione strettamente crescente con


Im f B. I due problemi di ottimo
max f (x) sub x 2 C
x

e
max (g f ) (x) sub x 2 C
x
sono equivalenti, ossia hanno le stesse soluzioni.

Dim. Basta osservare che, grazie alla Proposizione 78, dalla stretta crescenza segue
che
f (x) f (y) () (g f ) (x) (g f ) (y) 8x; y 2 A:
Quindi f (^
x) f (x) per ogni x 2 C se e solo se (g f ) (^
x) (g f ) (x) per ogni
x 2 C.

Consideriamo il caso, importante nelle applicazioni economiche (come vedremo tra


breve), nel quale la funzione obiettivo fortemente crescente.

Proposizione 278 Dato il problema di ottimo (17.2), sia f : A Rn ! R fortemente


crescente. Le eventuali soluzioni sono di frontiera, cio
arg max f (x) @C
x2C

Dim. Sia x^ 2 arg maxx2C f (x). Vogliamo mostrare che x^ 2 @C. Supponiamo, per
contra, che x^ 2
= @C, cio x^ punto interno di C. Esiste quindi un intorno B" (^ x) di
x^ incluso in C. facile vedere che esiste y 2 B" (^ x) tale che x^ y. Per la forte
crescenza di f si ha quindi f (y) > f (^
x), il che contraddice lottimalit di x^.

Nellarontare il problema di ottimo (17.2) con f fortemente crescente ci si pu


limitare a cercare le eventuali soluzioni tra i punti x di frontiera dellinsieme di scelta
C. Ci permette di semplicare il problema di ottimo (17.2), che diventa equivalente
al pi semplice problema
max f (x) sub x 2 @C
x
Vedremo tra breve una notevole applicazione di questa osservazione nella Legge di
Walras.
Si noti che la Proposizione 278 implica che quando @C \ C = ;, il che accade
per esempio quando C aperto, il problema di ottimo (17.2) non ha soluzioni se f
fortemente crescente. Un banale esempio f (x) = x su C = (0; 1).

Da ultimo, consideriamo una ovvia ma importante propriet di monotonia in C.


536 CAPITOLO 17. PROBLEMI DI OTTIMO

Proposizione 279 Data f : A Rn ! R, siano C e C 0 due insiemi qualsiasi tali


0
che C C A. Si ha
max f (x) max0 f (x)
x2C x2C

Dim. Sia x^0 2 arg maxx2C 0 f (x). Poich C C 0 , si ha

arg max f (x) C0


x2C

x0 )
e quindi f (^ x) per ogni x^ 2 arg maxx2C f (x).
f (^

Insiemi C pi grandi portano sempre a pi grandi valori massimi della funzione


obiettivo. In altri termini, avere pi opportunit tra cui scegliere non mai dan-
noso, qualunque sia la forma della funzione obiettivo. Questo semplice principio di
monotonia spesso importante.

Esempio 305 Si ricordi lesempio iniziale in cui avevamo considerato due diversi in-
siemi di scelta, R e [1; 2], per la funzione f (x) = 1 x2 . Si aveva maxx2[1;2] f (x) =
0 < 1 = maxx2R f (x). N

17.1.3 Consumo e produzione


I due prossimi classici esempi illustrano la centralit dei problemi di ottimo in Econo-
mia.

Il Problema del consumatore Consideriamo un consumatore con reddito I 2 R e


le cui preferenze sono rappresentate da una funzione di utilit u : A Rn+ ! R, dove
A un insieme di panieri x = (x1 ; x2; :::; xn ) di n beni; per semplicit, assumeremo che
Rn++ A, cio tutti i panieri x 0 appartengono al dominio A.
Indichiamo con p = (p1 ; p2 ; :::; pn ) 2 Rn+ il vettore dei prezzi dei beni. Linsieme
di bilancio (individuale) del consumatore, ossia linsieme dei panieri che egli pu
acquistare dati il vettore di prezzi p e il suo reddito I,

Bi (p; I) = fx 2 A : p x Ig ;

dove abbiamo scritto Bi (p; I) per evidenziare la dipendenza dellinsieme da p e da I.


Per esempio,
I I 0 ) Bi (p; I) Bi (p; I 0 ) ; (17.3)
ossia a maggiore reddito corrisponde un pi grande insieme di bilancio. Analogamente,

p p0 ) Bi (p; I) Bi (p0 ; I) ; (17.4)

ossia a minori prezzi corrisponde un pi grande insieme di bilancio.


17.1. GENERALIT 537

Si noti che, per denizione, Bi (p; I) un sottoinsieme del dominio A; in eetti,


il pedice i ci ricorda che questo linsieme dei panieri del consumatore con funzione
di utilit u : A Rn+ ! R, che quindi valuta solo beni in A. Se astraiamo da un
singolo consumatore e consideriamo i beni che, al prezzo p e col reddito I, un generico
consumatore pu acquistare, otteniamo linsieme di bilancio di mercato

B (p; I) = x 2 Rn+ : p x I ;

Non vi pi il pedice i perch questo linsieme di beni determinato di per s da


prezzi e reddito, senza considerare alcun particolare consumatore. Naturalmente, si
ha
Bi (p; w) = B (p; w) \ A (17.5)
e, in particolare, Bi (p; w) = B (p; w) quando A = Rn+ , come spesso il caso.

Esempio 306 (i) Sia u : R2+ ! R la funzione di utilit CES


1
u (x) = ( x1 + (1 ) x2 )

con 2 [0; 1] e 2 (0; 1]. In questo caso A = R2+ e quindi Bi (p; w) = B (p; w).
(ii) Sia u : R2++ ! R la funzione di utilit Cobb-Douglas

u (x) = xa1 x21 a

con a 2 [0; 1]. Qui si ha A = R2++ sicch Bi (p; w) = B (p; w) \ R2++ . Consumatori
CES e Cobb-Douglass hanno quindi diversi insiemi di bilancio individuali.
(iii) Supponiamo che il consumatore abbia un paniere di sussistenza x 0, per
cui egli pu considerare solo panieri x x, pena la sopravvivenza. In questo caso
naturale assumere come dominio A della sua funzione di utilit linsieme chiuso e
convesso
A = x 2 Rn+ : x x ; (17.6)
che incluso in Rn++ . Quindi, domini A chiusi e convessi inclusi in Rn++ si possono
giusticare in termini di panieri di sussistenza x 0. Per esempio, dato un tale
paniere di sussistenza possiamo considerare le restrizioni di funzioni di utilit CES e
Cobb-Douglass sullinsieme (17.6). N

Il prossimo importante risultato mostra le notevoli propriet dellinsieme di bilancio


di mercato.

Proposizione 280 Linsieme di bilancio di mercato B (p; I) convesso e, se p 0,


anche compatto.

La condizione p 0 ovvia: se qualcuno dei beni fosse gratis e disponibile in quan-


tit illimitata, il consumatore ne potrebbe ottenere una qualsiasi quantit e linsieme
di bilancio non quindi limitato.
538 CAPITOLO 17. PROBLEMI DI OTTIMO

Dalla (17.5) segue che linsieme di bilancio individuale Bi (p; I) convesso se il


dominio A convesso, ed compatto se A chiuso4 . Quindi, domini A chiusi e
convessi rendono anche gli insiemi di bilancio individuale compatti e convessi. Per
questa ragione spesso si assume che A sia chiuso e convesso (ma la Cobb-Douglas su
Rn++ un importante esempio in cui ci non il caso).

Dim. Sia I 0 e p 0. Mostriamo che B (p; I) chiuso. Consideriamo una


successione di panieri xk B (p; I) tale che xk ! x. Poich p xk I per ogni k,
si ha
p x = lim p xk I
e quindi x 2 B (p; I). Per il Teorema 66, B (p; I) chiuso.
Ci resta da mostrare che B (p; I) un insieme limitato. Per contra, supponiamo
che esista una successione xk B (p; I) tale che xki ! +1 per un qualche bene i.
Poich p 0 e x 2 Rn+ , si ha p xk pi xki per ogni k. Si ha quindi la contraddizione

I lim p xk pxki ! +1

Concludiamo che B (p; I) sia chiuso sia limitato, cio compatto.

Per quanto riguarda la convessit, sia I 0 e p 0. Siano x; y 2 B (p; I) e


2 [0; 1]. Si ha

p ( x + (1 ) y) = (p x) + (1 ) (p y) I + (1 )I = I

e quindi x + (1 ) y 2 B (p; I). Linsieme di bilancio perci convesso.

Il Problema (di ottimo) del consumatore consiste nel rendere massima la propria
funzione di utilit u : A Rn+ ! R sullinsieme di bilancio Bi (p; I), ossia nel risolvere

max u (x) sub x 2 Bi (p; I) : (17.7)


x

Dati prezzi e reddito, linsieme di bilancio Bi (p; I) linsieme di scelta del Problema
del consumatore. In particolare, un paniere x^ 2 Bi (p; I) di massimo, ossia soluzione
del problema di ottimo (17.7), se

u (^
x) u (x) 8x 2 Bi (p; I) ;

mentre maxx2Bi (p;I) u (x) la massima utilit ottenibile dal consumatore. Si noti che,
grazie alla Proposizione 277, ogni trasformazione strettamente crescente g u di u
denisce un problema di ottimo

max (g u) (x) sub x 2 Bi (p; I)


x

4
Si ricordi che lintersezione di due convessi convesso, e quella di due chiusi chiusa. Inoltre,
un sottoinsieme chiuso di un insieme compatto a sua volta compatto.
17.1. GENERALIT 539

equivalente alloriginale (17.7). La scelta di quale risolvere, tra tali problemi equiv-
alenti, una pura questione di comodit analitica. Al riguardo, si ricordi come nellE-
sempio 7.4.4 avessimo visto che le funzioni di utilit g u sono del tutto equivalenti
a u e quindi lequivalenza tra i problemi di ottimo non solo matematica ma anche
economica.

Esempio 307 La funzione di utilit log-lineare

X
n
u (x) = i log xi
i=1

la trasformazione della funzione di utilit Cobb-Douglas di maggior comodit ana-


litica. N

La massima utilit maxx2Bi (p;I) u (x) dipende dal reddito I e dal vettore di prezzi
p: la funzione v : Rn++ R+ ! R denita come

v (p; I) = max u (x) 8 (p; I) 2 Rn++ R+


x2Bi (p;I)

detta funzione indiretta di utilit e, al variare di prezzi e reddito, indica come varia
la massima utilit ottenibile dal consumatore nella scelta del proprio paniere di beni.
Come vedremo tra breve col Teorema 294, la funzione di utilit indiretta esiste per
ogni coppia (p; I) 2 Rn++ R+ purch u sia continua5 .

Esempio 308 Nel Capitolo 27 vedremo che la funzione di utilit indiretta associata
alla funzione di utilit log-lineare u (x) = log x1 + (1 ) log x2

v (p; I) = log I + log + (1 ) log (1 ) ( log p1 + (1 ) log p2 )

Grazie alle (17.3) e (17.4), la propriet di monotonia vista nella Proposizione 279
acquista la seguente veste per le funzioni di utilit indirette.

Proposizione 281 Sia u : A Rn+ ! R continua. Allora,

I I 0 ) v (p; I) v (p; I 0 )

e
p p0 ) v (p; I) v (p0 ; I)
5
La funzione indiretta di utilit un esempio di funzione valore di un problema di ottimo, come
il lettore vedr in corsi successivi.
540 CAPITOLO 17. PROBLEMI DI OTTIMO

In altre parole, il consumatore trae sempre benecio sia da un pi alto reddito


sia da minori prezzi, indipendemente da quale sia la sua funzione di utilit (purch
continua).

Come si osservato nella Sezione 7.4.4, naturale ipotizzare che la funzione di util-
it u : A Rn+ ! R sia almeno crescente. Grazie alla Proposizione 278, se assumiamo
la forte crescenza di u, la soluzione del Problema del consumatore apparterr alla fron-
tiera @Bi (p; I) dellinsieme di bilancio. Ma, grazie alla forma particolare dellinsieme
di bilancio, possiamo dare un risultato pi ne.

Proposizione 282 (Legge di Walras) Sia u : A Rn+ ! R fortemente crescente.


Se x^ soluzione del Problema del consumatore (17.7), allora p x^ = I.

Dim. Sia x 2 Bi (p; I) tale che p x < I. facile vedere che esiste y x tale che
p y I. Per la forte crescenza, si ha u (y) > u (x) e quindi x non pu essere soluzione
del Problema del consumatore.

Il consumatore destina quindi tutto il proprio reddito allacquisto della soluzione x^,
cio p x^ = I.6 Questa propriet detta Legge di Walras e, grazie a essa, nel Problema
del consumatore con funzioni fortementi crescenti di utilit, si pu sostituire linsieme
di bilancio Bi (p; I) con il suo sottoinsieme

(p; I) = fx 2 A : p x = Ig @Bi (p; I)

denito dal vincolo di uguaglianza.

Il Problema del produttore Consideriamo un produttore che deve decidere la


quantit y da produrre di un dato output y. Nel prendere tale decisione il produttore
deve considerare sia il ricavo r (y) che avr dal vendere la quantit y sia il costo c (y)
che sosterr per produrla.
Siano r : R+ ! R la funzione di ricavo e c : R+ ! R la funzione di costo del
produttore. Il suo protto quindi rappresentato dalla funzione : R+ ! R data da

(y) = r (y) c (y) 8y 2 A:

Per semplicit, si ponga A = R+ . Il Problema (di ottimo) del produttore di rendere


massima la propria funzione di protto : R+ ! R, ossia7

max (y) sub y 2 R+ (17.8)


y

6
La Proposizione 282 pi ne della Proposizione 278 perch esistono punti della frontiera
@Bi (p; I) tale che p x < I. Per esempio, lorigine 0 2 @Bi (p; I).
7
Linsieme A di produzione pu per esempio essere determinato da condizioni tecnologiche. Si
noti che, nella terminologia della Denizione 116, si ha A = C, ossia linsieme C coincide col dominio:
omettiamo quindi la clausola sub x 2 C in (17.8).
17.1. GENERALIT 541

In particolare, una quantit yb 0 di massimo se

(b
y) (y) 8y 2 R+

mentre maxy2R+ (y) il massimo protto ottenibile dal produttore. Linsieme degli
output di massimo arg maxy (y).

La forma della funzione di ricavo dipende dal tipo di mercato nel quale il produttore
vende il bene, mentre quella della funzione di costo dipende dal tipo di mercato ove
il produttore acquista gli input necessari a produrre il bene. Consideriamo alcune
classiche forme di mercato:

(i) Il mercato delloutput perfettamente concorrenziale, cosicch il suo prezzo


di vendita p 2 R+ indipendente dalla quantit che il produttore decide di
produrre. In tal caso la funzione r : R+ ! R di ricavo data da

r (y) = py 8y 2 R+ :

(ii) Il produttore un monopolista sul mercato delloutput. Supponiamo che la


funzione di domanda su tale mercato sia D : R+ ! R, dove D (y) indica il
prezzo unitario al quale il mercato assorbe la quantit y delloutput. Di solito,
per evidenti ragioni, si assume che la funzione di domanda sia decrescente: il
mercato assorbe quantit via via maggiori di output quanto pi basso il suo
prezzo unitario. La funzione di ricavo r : R+ ! R allora data da

r (y) = yD (y) 8y 2 R+ :

(iii) Il mercato degli input perfettamente concorrenziale, ossia i vettori

x = (x1 ; x2 ; :::; xn )

necessari alla produzione di y hanno prezzi di acquisto raccolti in

w = (w1 ; w2 ; :::; wn ) 2 Rn+

indipendente dalla quantit che il produttore decide di acquistare (wi indica


il prezzoPdelli-esimo input). Il costo di un vettore x di input perci pari a
w x = ni=1 wi xi .
Sia f : Rn+ ! R la funzione di produzione che il produttore ha a disposizione per
trasformare un vettore x 2 Rn+ di input nella quantit f (x) di output. Il costo
c (y) per produrre la quantit y di output si ottiene rendendo minimo il costo
w x tra tutti i vettori x 2 Rn+ che appartengono allisoquanto
1
f (y) = x 2 Rn+ : f (x) = y ;
542 CAPITOLO 17. PROBLEMI DI OTTIMO

ossia tra tutti i vettori che permettono di produrre la quantit y di output.


Dal punto di vista della produzione gli input in f 1 (y) sono equivalenti e il
produttore opter per quello di minor costo. In altri termini, la funzione di
costo c : R+ ! R data da

c (y) = min
1
w x 8y 2 R+ ;
x2f (y)

ossia pari al valore di minimo del problema di minimo per il costo w x


sullisoquanto f 1 (y).

Per esempio, un produttore monopolista nel mercato delloutput e in concorrenza


perfetta nel mercato degli input avr la funzione di protto

(y) = r (y) c (y) = yD (y) min


1
w x 8y 2 R+
x2f (y)

mentre un produttore in concorrenza perfetta sia nel mercato delloutput sia nel
mercato degli input avr funzione di protto

(y) = r (y) c (y) = py min


1
w x 8y 2 R+
x2f (y)

Postilla Chiudiamo con unosservazione metodologica. I problemi di ottimo sono


fondamentali anche nelle scienze naturali, come ben spiega Leonida Tonelli in uno
scritto del 1940 Le questioni di massimo e minimo hanno sempre avuto un grande
valore anche nellinterpretazione dei fenomeni naturali, perch su questi fenomeni dom-
ina un principio generale di economia. La natura, nelle sue manifestazioni, tende a
risparmiare il pi possibile ci che essa deve impegare; e quindi le soluzioni che essa
trova sono sempre soluzioni di problemi di minimo o di massimo. Il principio gen-
erale di economia al quale allude Tonelli, talvolta detto principio di minima azione,
un principio metasico (nellaccezione pi propria del termine). Non a caso Tonelli
prosegue scrivendo Euler diceva che, essendo la costruzione del mondo la pi perfetta
possibile, come quella dovuta ad un Creatore innitamente saggio, in natura nulla
avviene che non presenti propriet di massimo o di minimo. In Economia, invece, la
centralit dei problemi di ottimo si basa su unassunzione di razionalit degli agenti
economici. Le conseguenti scelte ottime degli agenti (per esempio, panieri ottimi x^
per i consumatori e output ottimi yb per i produttori) sono il canone rispetto al quale
considerare eventuali comportamenti non ottimali.

17.2 Esistenza: Teorema di Weierstrass


La prima fondamentale, di rilevanza sia teorica sia applicativa, questione da arontare
per i problemi di ottimo lesistenza di soluzioni. Per fortuna, esistono notevoli risul-
tati di esistenza che garantiscono, in condizioni molto generali, lesistenza di soluzioni.
17.2. ESISTENZA: TEOREMA DI WEIERSTRASS 543

Il pi celebre e fondamentale tra essi il Teorema di Weierstrass, che garantisce le-


sistenza sia di punti di massimo sia di punti di minimo per funzioni continue denite
su insiemi compatti. Data la centralit nelle applicazioni economiche dei problemi di
ottimo, il Teorema di Weierstrass uno dei pi importanti del libro.

Teorema 283 (Weierstrass) Una funzione f : A Rn ! R continua su un sot-


toinsieme compatto K di A ammette (almeno un) punto di minimo e (almeno un)
punto di massimo in K, ossia esistono x1 ; x2 2 K tali che

f (x1 ) = max f (x) e f (x2 ) = min f (x) :


x2K x2K

Grazie a questo risultato il problema di ottimo (17.2), ossia

max f (x) sub x 2 C


x

ammette soluzione tutte le volte che f continua e C compatto. Ci vale anche per
lo speculare problema di ottimo con min in luogo di max.

Una classica applicazione del Teorema di Weierstrass il Problema del consumatore


(17.7):
max u (x) sub x 2 Bi (p; I)
x

con u : A Rn+ ! R continua e dominio A chiuso. Grazie alla Proposizione 280,


linsieme di bilancio Bi (p; I) compatto, purch p 0 (cio purch nessun bene sia
gratis). Per il Teorema di Weierstrass il Problema del consumatore ha soluzione.

Esempio 309 La funzione di utilit CES u : Rn+ ! R data da


1
u (x) = ( x1 + (1 ) x2 )

con 2 [0; 1] e 2 (0; 1], continua e ha dominio Rn+ chiuso. Per il Teorema di
Weierstrass, il Problema del consumatore con tale funzione di utilit ha soluzione
(purch p 0). N

La dimostrazione del Teorema di Weierstrass si basa sul prossimo lemma, che


mostra che limmagine f (K) di un insieme compatto compatta in R (si ricordi la
Denizione 9).

Lemma 284 Sia f : A Rn ! R continua su un sottoinsieme compatto K di A.


Allora, limmagine f (K) un insieme compatto in R.

Dim. Con le nozioni di topologia a nostra disposizione siamo in grado di dimostrare


il risultato solo nel caso n = 1 (il caso generale non presenta comunque sostanziali
dierenze)
544 CAPITOLO 17. PROBLEMI DI OTTIMO

Alla luce della Denizione 9, per mostrare che f (K) limitato in R occorre
mostrare che sia superiormente sia inferiormente limitato in R. Supponiamo, per
contra, che f (K) non sia superiormente limitato. In tal caso esiste una successione
fyn g f (K) con limn!1 yn = +1. Sia fxn g K la corrispondente successione tale
che f (xn ) = yn per ogni n. La successione fxn g limitata poich fxn g K, ossia
contenuta nellinsieme limitato K. Per il Teorema di Bolzano-Weierstrass, esiste
una sottosuccessione fxnk g e un punto x~ 2 R tale che limk!1 xnk = x~. Poich K
chiuso, si ha x~ 2 K. Inoltre, la continuit di f implica limk!1 ynk = limk!1 f (xnk ) =
x) 2 R. Ci contraddice limk!1 ynk = limn!1 yn = +1. Ne segue che f (K)
f (~
superiormente limitato. In modo analogo si mostra che f (K) inferiormente limitato.
Possiamo quindi concludere che f (K) limitato.
Per completare la dimostrazione che f (K) compatto, ci resta da mostrare che
f (K) anche chiuso. Consideriamo una successione fyn g f (K) che converge a y 2
R. Alla luce del Teorema 66, dobbiamo mostrare che y 2 f (K). Poich fyn g f (K),
per denizione esiste una successione fxn g K tale che f (xn ) = yn . Come visto
sopra, la successione fxn g limitata. Quindi, per il Teorema di Bolzano-Weierstrass
esiste una sottosuccessione fxnk g e un punto x~ 2 R tale che limk!1 xnk = x~. Poich
K chiuso, si ha x~ 2 K. Inoltre, la continuit di f implica
y = lim ynk = lim f (xnk ) = f (~
x) :
k!1 k!1

Quindi, y 2 f (K), come desiderato.

Prima di dimostrare il Teorema di Weierstrass si osservi che il preservarsi per


continuit una notevole propriet della compattezza ed unulteriore caratteristica
che distingue i compatti tra gli insiemi chiusi, per i quali in generale la propriet non
vale.

Esempio 310 La funzione f (x) = e x continua, ma limmagine dellinsieme chiuso


[0; 1) linsieme (0; 1] che non chiuso. Naturalmente, linsieme chiuso [0; 1) non
compatto. H

Dim. del Teorema di Weierstrass. Come per il precedente lemma, con le nozioni
di topologia a nostra disposizione siamo in grado di dimostrare il risultato solo nel
caso n = 1. Ci limitiamo a dimostrare lesistenza di un punto di massimo perch in
modo analogo si dimostra lesistenza di un punto di minimo.
Grazie al Lemma 284, f (K) compatto, e quindi limitato. Per il Teorema di
completezza dei reali esiste sup f (K). Sia = sup f (K): per ogni n esiste yn 2
f (K) tale che yn > 1=n. Quindi, esiste una successione fyn g f (K) tale che
limn!1 yn = . Poich f (K) chiuso, 2 f (K) grazie al Teorema 66. Da ci segue
che = max f (K) e quindi esiste x1 2 K tale che f (x1 ) = maxx2K f (x).
Lesistenza del minimo si prova in maniera analoga.

Le ipotesi di continuit e compattezza del Teorema di Weierstrass non si possono


indebolire, come mostrano i prossimi esempi.
17.3. ESISTENZA: TEOREMA DI TONELLI 545

Esempio 311 (i) Sia f : [0; 1] ! R data da


8
< x se x 2 (0; 1)
f (x) =
: 1 se x 2 f0; 1g
2
Essa denita sul compatto K = [0; 1], ma non continua. facile vedere che non
ha n punti di massimo n punti di minimo su K.
(ii) Sia f : R ! R data da f (x) = x. Consideriamo K = (0; 1). La funzione
continua, ma non denita su un compatto K perch (0; 1) limitato ma non chiuso.
Anche in questo caso la funzione non ha n punti di massimo n punti di minimo su
K.
(iii) Sia f : R ! R data da f (x) = x. Consideriamo K = [0; +1). La funzione
continua, ma non denita su un insieme compatto K perch [0; +1) chiuso ma
non limitato. La funzione non ha punti di massimo su K (ha solo il punto di minimo
0). N

17.3 Esistenza: Teorema di Tonelli


17.3.1 Coercivit
Il Teorema di Weierstrass garantisce lesistenza sia di punti di massimo sia di punti di
minimo. Nei problemi di ottimo dellEconomia si per quasi sempre interessati solo
allesistenza di punti di massimo oppure di minimo, ma raramente a entrambi. Per
esempio, in molte applicazioni economiche cruciale lesistenza di punti di massimo,
mentre leventuale esistenza anche di punti di minimo di poco o nullo interesse.
Per tal ragione introduciamo ora una classe di funzioni che, basandosi su un uso
ingegnoso del Teorema di Weierstrass, garantiscono con ipotesi pi deboli almeno
lesistenza di punti di massimo, senza curarsi degli eventuali punti di minimo8 . Si
ricordi che per una funzione f : A Rn ! R si indica con (f t) linsieme di
soprallivello fx 2 A : f (x) tg.
Denizione 118 Una funzione f : A Rn ! R detta coerciva su un sottoinsieme
C di A se esiste t 2 R tale che linsieme
(f t) \ C = fx 2 C : f (x) tg
non vuoto e compatto.
Quando A = C, la funzione si dice coerciva, senza ulteriori specicazioni. Una
funzione coerciva su C quando esiste almeno un insieme di soprallivello che abbia
intersezione non vuota e compatta con C. Si noti come sia una propriet congiunta
della funzione f e dellinsieme C, cio della coppia (f; C). una propriet ordinale:
8
In ogni caso chiaro che i prossimi teoremi possono essere rivoltati (basta prendere f ) per
garantire lesistenza di punti di minimo, senza curarsi dei punti di massimo.
546 CAPITOLO 17. PROBLEMI DI OTTIMO

Proposizione 285 Data una funzione f : A Rn ! R, sia g : B R ! R


strettamente crescente con Im f B. La funzione f coerciva su C A se e solo se
la funzione composta g f coerciva su C.

Dim. Nella dimostrazione della Proposizione 277, si era osservato che

f (x) f (y) () (g f ) (x) (g f ) (y) 8x; y 2 A:

Da ci segue che
(f t) = (g f t) 8t 2 R
il che implica il risultato (come il lettore pu facilmente vericare).

Tutte le funzioni continue sono coercive su insiemi compatti. Ci sar una sem-
plice conseguenza della seguente importante propriet degli insiemi di soprallivello e
sottolivello di funzioni continue.

Lemma 286 Sia f : A Rn ! R continua su un sottoinsieme chiuso C di A. Gli


insiemi (f t) \ C sono chiusi per ogni t 2 R.

Dim. Se (f t) vuoto, si ha (f t)\C = ;, che banalmente chiuso. Consideriamo


qualsiasi insieme di soprallivello (f t) non vuoto. Sia fxn g (f t) \ C una
successione che converge a x 2 R. Per il Teorema 66, per provare che (f t) \ C
chiuso occorre mostrare che x 2 (f t) \ C. La chiusura di C implica x 2 C.
La continuit di f in x implica f (xn ) ! f (x). Poich f (xn ) t per ogni n, una
semplice applicazione della Proposizione 102 mostra che f (x) t, ossia x 2 (f t).
In conclusione, x 2 (f t) \ C, come desiderato.

Esempio 312 Lipotesi che C sia chiuso cruciale. Sia per esempio f : R ! R data
da f (x) = x. Se C = (0; 1), si ha (f t) \ C = [t; 1) per ogni t 2 (0; 1) e tali insiemi
non sono chiusi. N

Grazie al Lemma 286 ora banale dimostrare il prossimo risultato.

Proposizione 287 Una funzione continua f : A Rn ! R coerciva su ogni


sottoinsieme compatto e non vuoto C A.

Dim. Sia C A compatto. Se f : A Rn ! R continua su C, il Lemma 286


implica che ogni insieme (f t) \ C chiuso. Poich un sottoinsieme chiuso di un
compatto , a sua volta, compatto, ne segue che ogni (f t) \ C compatto. Ci
mostra che f coerciva su C.

Le funzioni continue su compatti sono un primo importante esempio di coppie


(f; C) per cui si ha la coercivit. Vediamo altri esempi.
17.3. ESISTENZA: TEOREMA DI TONELLI 547

Esempio 313 Sia f : R ! R denita come f (x) = 1 x2 : essa coerciva; infatti


( p p
1 t; 1 t se t 1
fx 2 R : f (x) tg =
; se t > 1

e quindi linsieme fx 2 R : f (x) tg compatto e non vuoto per ogni t 1. Per


esempio, per t = 0, si ha
fx 2 R : f (x) 0g = [ 1; 1]
che gi basta per concludere che f coerciva (nella Denizione 118 si richiede infatti
che esista almeno un t 2 R per cui linsieme fx 2 R : f (x) tg sia compatto e non
vuoto). N

Esempio 314 Sia f : R ! R denita come f (x) = e jxj : essa coerciva; infatti
8
>
> R se t 0
<
fx 2 R : f (x) tg = [log t; log t] se t 2 (0; 1]
>
>
: ; se t > 1

e quindi fx 2 R : f (x) tg compatto e non vuoto per ogni t 2 (0; 1]. N

Esempio 315 Sia f : R ! R denita come


(
log (jxj) se x 6= 0
f (x) = :
0 se x = 0

Si ponga C = [ 1; 1]. Si ha
(
( 1; et ] [ [et ; +1) [ f0g se t 0
fx 2 R : f (x) tg = ;
( 1; et ] [ [et ; +1) se t > 0
e quindi
(
; t>0
fx 2 R : f (x) tg \ C = :
[ 1; et ] [ [et ; 1] [ f0g t 0
La funzione quindi coerciva su C. N

abbastanza intuibile che la coercivit e la continuit di una funzione garantiscano


che essa presenti massimo. Linsieme di soprallivello (f t) taglia via la parte bassa
(ovvero sotto il valore di t) di Imf senza toccarne la parte alta (ove giace il massimo).
La denizione di coercivit richiede che almeno uno di tali insiemi sia non vuoto e
compatto.
Il prossimo risultato, caso speciale di uno pi generale di Leonida Tonelli, formalizza
lintuizione e dimostra lesistenza di punti di massimo per funzioni coercive.
548 CAPITOLO 17. PROBLEMI DI OTTIMO

Teorema 288 (Tonelli) Una funzione f : A Rn ! R coerciva e continua su un


sottoinsieme C di A ammette punto di massimo in C, ossia esiste x^ 2 C tale che
f (^
x) = max f (x) :
x2C

Dim. Poich f coerciva, esiste t 2 R tale che linsieme di soprallivello = (f t)\C


non vuoto e compatto. Per il Teorema di Weierstrass, esiste x^ 2 tale che f (^ x)
f (x) per ogni x 2 . Daltra parte, se x 2 C , si ha f (x) < t e quindi f (^
x) t >
f (x). Ne segue che f (^
x) f (x) per ogni x 2 C, ossia f (^ x) = maxx2C f (x).
Si noti che, alla luce della Proposizione 287, le ipotesi del Teorema di Tonelli sono
pi deboli di quelle del Teorema di Weierstrass. Infatti, una funzione f : A Rn ! R
continua su un compatto C A coerciva su C.
Daltra parte, a ipotesi pi deboli consegue un risultato pi debole, che garantisce
solo lesistenza di un punto di massimo, senza dire alcunch su eventuali punti di
minimo. Poich, come gi s accennato, nella gran parte dei problemi di ottimo si
interessati allesistenza di punti di massimo, il Teorema 288 importante perch
snellisce il Teorema di Weierstrass da ipotesi sovrabbondanti (rispetto a ci che
interessa).
In questo modo possiamo applicare il Teorema 288 anche a problemi di ottimo nei
quali le ipotesi del Teorema di Weierstrass (in primis la compattezza dellinsieme di
scelta C) non sono soddisfatte. In particolare, il problema di ottimo (17.2), ossia
max f (x) sub x 2 C
x

ammette soluzione se f coerciva e continua su C. In queste ipotesi, non si pu invece


dire alcunch per lo speculare problema di minimo (con min in luogo di max).
Esempio 316 NellEsempio 313 abbiamo visto come la funzione f (x) = 1 x2 sia
coerciva. Poich anche continua, grazie al Teorema di Tonelli possiamo conclude che
arg maxx2R f (x) 6= ;. Si noti che invece arg minx2R f (x) = ;. Del resto, linsieme R
non compatto e quindi il Teorema di Weierstrass non applicabile. N

17.3.2 Supercoercivit
Alla luce del Teorema di Tonelli, diventa importante individuare classi di funzioni
coercive. Le funzioni supercoercive ne sono un primo importante esempio.
Denizione 119 Una funzione f : A Rn ! R si dice supercoerciva su un sot-
toinsieme C di A se f (xn ) ! 1 per ogni successione fxn g C tale che kxn k !
+1.
Quando A = C, la funzione si dice supercoerciva, senza ulteriori specicazioni. La
supercoercivit richiede che f diverga a 1 lungo ogni possibile successione illimitata
che appartiene al suo dominio. In altre parole, la funzione non pu assumere valori
che crescano indenitamente su una successione che scappaallinnito. Ci fa si che
gli insiemi di soprallivello siano tutti limitati.
17.3. ESISTENZA: TEOREMA DI TONELLI 549

Proposizione 289 Sia f : A Rn ! R supercoerciva su un sottoinsieme C di A.


Gli insiemi (f t) \ C sono limitati per ogni t 2 R.

Dim. Data f : A Rn ! R, si supponga che f (xn ) ! 1 per ogni successione


fxn g A tale che kxn k ! +1. Vogliamo mostrare che gli insiemi (f t) sono
limitati per ogni t 2 R. Supponiamo, per contra, che linsieme (f t) non sia limitato.
Esiste quindi una successione illimitata fxn g (f t), cio tale che kxn k ! +1.
Poich (f t) A, si ha quindi una successione fxn g A tale che kxn k ! +1 e
f (xn ) t per ogni n, il che contraddice lipotesi f (xn ) ! 1. Linsieme (f t)
perci limitato.

Esempio 317 (i) La funzione f : R ! R data da f (x) = x2 supercoerciva.


Infatti, jxn j ! +1 se e solo se xn ! +1 oppure xn ! 1. Poich

xn ! +1 ) f (xn ) = 1

e
xn ! 1 ) f (xn ) = 1
la funzione supercoerciva su R.
(ii) La funzione f : R2 ! R data da f (x) = x21 x22 supercoerciva su R2 .
Infatti,
q 2
f (x) = x21 + x22 = x21 + x22 = kxk2

e quindi
kxk ! +1 ) f (x) = 1
Pn
(iii) Pi in generale, la funzione f : Rn ! R data da f (x) = i=1 x2i
supercoerciva su R2 . N

Esempio 318 La funzione f : R2 ! R data da f (x) = (x1 x2 )2 non supercoerci-


va. Infatti, si consideri la successione f(n; n)g. Si ha f (n; n) = 0 per ogni n, bench
k(n; n)k ! +1. N

Il prossimo risultato mostra che la supercoercivit implica la coercivit per le coppie


(f; C) dove f continua su C e linsieme C chiuso (e permette quindi di applicare il
Teorema 288). Ma, la supercoercivit una condizione pi semplice sia da leggere sia
da vericare. Di qui il suo interesse.

Proposizione 290 Una funzione f : A Rn ! R continua e supercoerciva su un


sottoinsieme chiuso C di A ivi coerciva. In particolare, gli insiemi (f t) \ C sono
compatti per ogni t 2 R.
550 CAPITOLO 17. PROBLEMI DI OTTIMO

Dim. Il risultato precedente implica che, per ogni t 2 R, gli insiemi (f t) \ C sono
limitati. Poich f continua e C chiuso, questi insiemi sono anche chiusi. Infatti,
sia fxn g (f t) \ C tale che xn ! x 2 Rn . Per il Teorema 66, per mostrare che
(f t) \ C chiuso, basta mostrare che x 2 (f t) \ C. Poich C chiuso, si ha
x 2 C. Poich f continua, si ha lim f (xn ) = f (x). Siccome f (xn ) t per ogni n, ne
segue che f (x) t, cio x 2 (f t). Quindi, x 2 (f t) \ C e linsieme (f t) \ C
chiuso. Essendo limitato, compatto.

Si noti che, per una funzione supercoerciva e continua tutti gli insiemi (f t) \ C
sono compatti, mentre la coercivit richiede solo che almeno uno sia non vuoto e
compatto. Ci prova ulteriormente quanto la supercoercivit sia una propriet pi
forte della coercivit (sebbene si limiti agli insiemi chiusi C, che comunque formano
una fondamentale classe di insiemi nei problemi di ottimo).

Corollario 291 Una funzione continua f : A Rn ! R supercoerciva su un


sottoinsieme C di A se esistono < 0 e 2 R tale che, denitivamente,

f (xn ) kxn k + (17.9)

per ogni successione fxn g C tale che kxn k ! +1.

Dim. immediato vedere che, se esistono < 0 e 2 R tali che, denitivamente,


f (xn ) kxn k + , allora f (xn ) ! 1 quando kxn k ! +1.

Esempio 319 (i) Sia f : Rn ! R la funzione continua denita come f (x) = 1 kxk
per ogni x 2 Rn . Se 1, il Corollario 291 implica che f sia supercoerciva. Infatti,
per ogni successione fxn g tale che kxn k ! +1, si ha denitivamente

kxk kxk (17.10)

e quindi
f (x) = 1 kxk 1 kxk
Ponendo = 1 e = 1, vale la (17.9). Per il Corollario 291, f coerciva. Si noti
che per n = = 1 si ritrova la funzione f (x) = 1 x2 dellultimo esempio.
Per il Teorema di Tonelli, f almeno un punto di massimo in Rn . Daltra parte,
facile vedere come la funzione non abbia punti di minimo in Rn (il Teorema di
Weierstrass non vale poich Rn non compatto).
2 2
(ii) Sia f : R2 ! R data da f (x) = ex1 x42 . Si ha x21 ex1 per ogni x1 2 R e
x22 x42 per ogni jx2 j 1. Insieme alla (17.10) ci implica che, denitivamente,
2
f (x) = ex1 x4 x21 x22 = kxk2 kxk

Per il Corollario 291, f coerciva. Grazie al Teorema di Tonelli, f almeno un punto


di massimo in R2 (anche qui il Teorema di Weierstrass non vale poich R2 non
compatto). N
17.4. ESTREMI LOCALI 551

Il corollario evidenzia come la supercoercivit si erediti per maggiorazione: data


una funzione g, se troviamo una funzione supercoerciva f su C tale che g f su C,
allora anche la funzione g supercoerciva su C. Infatti, per ogni successione fxn g C
tale che kxn k ! +1, da g (xn ) f (xn ) segue che g (xn ) ! 1.
In particolare, se < 0 la funzione f (x) = kxk + supercoerciva su ogni
insieme C di Rn e la sua semplice forma la rende un naturale prototipo. Tutte le
funzioni che, su un dato insieme C, sono maggiorate da f sono quindi supercoercive su
C. Il Corollario ha ulteriormente indebolito la condizione richiedendo la maggiorazione
solo sulle successioni illimitate di C, ma lo spirito del risultato nellaver individuato
un prototipo rispetto al quale vericare la supercoercivit tramite maggiorazione.

17.4 Estremi locali


Consideriamo ora una versione pi debole, locale, delle nozioni di massimo. Di per
s si tratta di un indebolimento di ben poco interesse, soprattutto nelle applicazioni
economiche dove gli oggetti di interesse sono gli estremi globali. Per esempio, nel
problema del consumatore, non di grande interesse che un paniere sia di massimo
locale: ci che interessa se esso sia di massimo globale o no.
Tuttavia, grazie al Calcolo dierenziale, i punti di massimo locale hanno grandis-
sima importanza strumentale, in primis (ma non solo) nella risoluzione dei problemi
di ottimo, come vedremo nel Capitolo 27. Per questa ragione dedicheremo loro questa
sezione.

Consideriamo una funzione f : R ! R che ricordi il prolo di una catena montuosa:

6
y
5

0 O x

-1

-2
1880 1900 1920 1940 1960 1980 2000

La cima pi alta il valore massimo (globale), ma intuitivamente anche le altre


cime corrispondono a punti che, localmente, sono di massimo. La prossima denizione
formalizza la semplice idea.
552 CAPITOLO 17. PROBLEMI DI OTTIMO

Denizione 120 Sia f : A Rn ! R una funzione a valori reali denita su un


n
insieme A in R e sia C un sottoinsieme di A. Un vettore x^ 2 C si dice punto di
massimo locale (debole) di f su C se esiste un intorno B" (^
x) di x^ tale che

f (^
x) f (x) ; 8x 2 B" (^
x) \ C: (17.11)

Il valore f (^
x) della funzione in x^ si dice massimo (o valore massimo) locale di f su
C.

Il massimo locale forte (o stretto) se nella (17.11) si ha f (^


x) > f (x) per ogni
x 2 B" (^x) \ C distinto da x^. Nella terminologia del problema di ottimo (17.2), un
punto di massimo locale di f su C si dice soluzione locale del problema (locale forte
se il massimo forte). Analoghe denizioni si hanno per i minimi locali, con e < in
luogo di e >.9

Un punto di massimo globale su C ovviamente anche di massimo locale. La


nozione di massimo locale in eetti molto pi debole di quella di massimo globale.
Come mostra il prossimo esempio pu anche accadere che vi siano (anche molti) punti
di massimo locale senza che esista un punto di massimo globale.

Esempio 320 Sia f : R ! R data da f (x) = x6 3x2 +1. NellEsempio 437 vedremo
che il suo graco :

In particolare, il punto x = 0 di massimo locale, ma non globale. Infatti,


limx!+1 f (x) = limx! 1 f (x) = +1 e quindi la funzione non ha punti di massimo
globale. N
9
Talvolta invece di locale si usa laggettivo relativo, parlando in tal caso di massimi relativi,
minimi relativi, ecc..
17.5. CONCAVIT E QUASI CONCAVIT 553

OfB. La locuzione pi importante della denizione di punto di massimo locale se


esiste un intorno. Un errore piuttosto comune di sostituire alla corretta se es-
iste un intorno la scorretta se, preso un intorno U" (^ x) di x^. In tal modo non
si denisce un punto di massimo locale ma un punto di massimo globale. Infatti,
prendere (ssare a priori) lintorno U" (^
x) equivale a considerare un dominio ristretto
C = U" (^x) per la funzione e quindi a riproporre la denizione di punto di massimo
globale (semplicemente avendo cambiato il nome di C).
In conclusione la vera dierenza tra le denizioni globale e locale di punto di mas-
simo che, con la prima, linsieme C di riferimento ssato a priori, mentre con la
seconda no: ci si chiede semplicemente se (tra i tanti) ne esiste almeno uno. In maniera
e cace, possiamo dire che, con la denizione globale, linsieme di riferimento ssato
da noi, mentre, con la denizione locale, lasciato alla funzione (ci si chiede se,
per essa, vi almeno un insieme, che si pu sempre prendere come un intorno, tale
che f (^
x) f (x) per ogni x dellinsieme). H

OfB. Un punto x0 isolato del dominio di una funzione sempre punto sia di massimo
sia di minimo locale. Vi infatti almeno un suo intorno per il quale B" (x0 ) \ C
contiene soltanto x0 e perci le disuguaglianze f (x0 ) f (x) e f (x0 ) f (x) per ogni
x 2 B" (x0 ) \ C si riducono a f (x0 ) f (x0 ) e f (x0 ) f (x0 ), che sono banalmente
vere.
Il considerare punti di massimo e di minimo locale tutti i punti isolati del do-
minio pu essere giudicato sgradevole. Per evitarlo si potrebbe pensare di riformulare
la denizione di punto di massimo e di minimo imponendo in essa che x^ sia punto
di accumulazione di C. In tal modo i punti isolati, non essendo di accumulazione,
cesserebbero di essere di massimo o di minimo locale. Vi sarebbe per una conseguen-
za ancor pi sgradevole. Se un punto isolato fosse di massimo o di minimo globale,
dovremmo dire che per non lo in senso locale. Dovremmo cio fare uneccezione al
fatto che ogni punto di massimo o di minimo globale anche locale e ci, francamente,
ancora pi sgradevole10 . Insomma, il rimedio sarebbe peggiore del male. Alla ne,
meglio dunque tenersi la piccola sgradevolezza che tutti i punti isolati del dominio
sono di massimo e di minimo locali. H

17.5 Concavit e quasi concavit


Le funzioni concave trovano la loro applicazioni pi classica nello studio dei problemi
di ottimo, nei quali godono di notevolissime propriet.
La prima di tali propriet che per le funzioni concave tutti i massimi sono globali.

Teorema 292 Sia f : C Rn ! R una funzione concava denita su un sottoinsieme


convesso C. Se il punto x^ 2 C di massimo locale, allora anche di massimo globale.
10
Sarebbe come dire che luomo pi alto del mondo non il pi alto a casa sua.
554 CAPITOLO 17. PROBLEMI DI OTTIMO

Dim. Sia x^ 2 C punto di massimo locale. Per denizione, esiste un suo intorno B" (^
x)
tale che
f (^
x) f (x) 8x 2 B" (^x) : (17.12)
Supponiamo che x^ non sia di massimo globale. Esiste quindi y 2 C tale che f (y) >
x). Poich f concava, per ogni t 2 (0; 1) si ha
f (^

f (t^
x + (1 t) y) tf (^
x) + (1 t) f (y) > tf (^
x) + (1 t) f (^
x) = f (^
x) : (17.13)

Poich C convesso, si ha t^
x + (1 t) y 2 C per ogni t 2 (0; 1). Daltra parte,

lim kt^
x + (1 t) y x^k = ky x^k lim (1 t) = 0;
t!1 t!1

e quindi esiste t 2 (0; 1) tale che t^


x + (1 t) y 2 B" (^
x) per ogni t 2 (t; 1). La (17.13)
implica che per tali t si abbia f (t^ x), il che contraddice la (17.12).
x + (1 t) y) > f (^
Ci prova che x^ punto di massimo globale.

Questo importante risultato non vale per le funzioni quasi concave.

Esempio 321 Sia f : R ! R data da


8
>
> 2 se x 0
<
f (x) = 2 x se x 2 (0; 1)
>
>
: 1 se x 1

Essa quasi concava perch monotona. Tutti i punti x > 1 sono massimi locali ma
non globali. N

Grazie al Teorema 292, i punti di massimo di funzioni concave sono necessariamente


globali. Si noti che, quando f quasi concava11 , linsieme dei punti di massimo, cio
arg maxC f , convesso. Infatti, siano x; y 2 arg maxC f e sia t 2 [0; 1]. Per la quasi
concavit si ha

f (tx + (1 t) y) min ff (x) ; f (y)g = f (x) = f (y) = max f (x) ;


x2C

e quindi
f (tx + (1 t) y) = max f (x) ;
x2C

ossia tx + (1 t) y 2 arg maxC f .


Essendo convesso, si hanno tre possibilit per tale insieme:

(i) arg maxC f vuoto, ossia non esistono punti di massimo;


11
In particolare, quando f concava. Si ricordi che le propriet stabilite per funzioni quasi concave
valgono, a fortiori, per le funzioni concave (che sono una classe di funzioni quasi concave). Il converso
ovviamente non vale: il Teorema 292 ne un importante esempio.
17.5. CONCAVIT E QUASI CONCAVIT 555

(ii) arg maxC f un singoletto, ossia esiste un unico punto di massimo;


(iii) arg maxC f consta di inniti punti, ossia esistono inniti punti di massimo.
Illustriamo con esempi le diverse possibilit.
Esempio 322 (i) Sia f : R++ ! R denita come f (x) = log x per ogni x > 0. Essa
strettamente concava; daltra parte, facile vedere che non possiede punti di massimo,
ossia che arg maxR++ f = ;.
(ii) Sia f : R ! R denita come f (x) = 1 x2 per ogni x 2 R. Essa strettamente
concava e lunico punto di massimo x^ = 0, sicch arg maxR++ f = f0g.
(iii) Sia f : R ! R denita come
8
>
> x se x 1
<
f (x) = 1 se x 2 (1; 2) :
>
>
: 3 x se x > 2

Essa concava e arg maxR f = [1; 2]. N


Nellultimo esempio, con inniti punti di massimo, la funzione era concava ma non
strettamente. Il prossimo risultato mostra che, in eetti, la stretta quasi concavit
implica che il massimo, se esiste, unico. In altre parole, per funzioni strettamente
quasi concave, arg maxC f al pi un singoletto, e lunico massimo in senso forte.
Teorema 293 Una funzione f : C Rn ! R strettamente quasi concava denita su
un sottoinsieme convesso C ha al pi un unico punto di massimo.
Dim. Supponiamo che x^1 ; x^2 2 C siano due punti di massimo globale per f . Vogliamo
mostrare che x^1 = x^2 . Supponiamo che ci non sia, ossia che x^1 6= x^2 . Poich x^1
e x^2 sono massimi globali, si ha f (^ x2 ) = maxx2C f (x). Poniamo xt =
x1 ) = f (^
x1 + (1 t) x^2 per t 2 (0; 1). Poich C convesso, si ha xt 2 C. Inoltre, per la stretta
t^
quasi concavit si ha
f (xt ) = f (t^
x1 + (1 t) x^2 ) > min ff (^
x1 ) ; f (^
x2 )g = max f (x)
x2C

che una contraddizione. Ne segue che x^1 = x^2 , come desiderato.

Tra gli ultimi visti, f (x) = 1 x2 un esempio di funzione strettamente concava


con un unico punto di massimo x^ = 0. Daltra parte, f (x) = log x un esempio
di funzione strettamente concava priva di massimi. La clausola al pi quindi
indespensabile perch, purtroppo, i massimi possono non esistere.
Lavere (al pi) un unico massimo, che quindi forte, la caratteristica fondamen-
tale delle funzioni strettamente quasi concave ed la ragione del loro largo uso nelle
applicazioni economiche. Infatti la stretta quasi concavit la condizione pi semplice
che garantisce lunicit del punto di massimo.
556 CAPITOLO 17. PROBLEMI DI OTTIMO

17.6 Consumo e produzione


Applichiamo i risultati visti nelle ultime sezioni ai problemi classici di consumo e di
produzione introdotti allinizio del capitolo.

17.6.1 Consumo
Torniamo al Problema del consumatore (17.7):

max u (x) sub x 2 Bi (p; I)


x

Supponiamo che u : A Rn+ ! R sia continua. Se il dominio A chiuso, abbiamo gi


visto che, grazie al Teorema di Weierstrass, il Problema del consumatore ha soluzione.
Del resto, in questo caso u coerciva su Bi (p; I) per la Proposizione 287, sicch
lapplicazione del Teorema di Weierstrass pu vedersi come applicazione del Teorema
di Tonelli.
Se, invece, il dominio A non chiuso il Teorema di Weierstrass non pi applicabile
(linsieme Bi (p; I) non compatto) ed occorre assumere che u sia coerciva su Bi (p; I)
per poter applicare il Teorema di Tonelli, il cui uso cruciale in questo caso.
Inne, se A convesso e u strettamente quasi concava, grazie al Teorema 293 la
soluzione unica. In sintesi:

Teorema 294 Se la funzione di utilit u : A Rn+ ! R continua e coerciva su


Bi (p; I), il Problema del consumatore ha soluzione. Tale soluzione unica se A
convesso e u strettamente quasi concava.

La funzione di utilit Cobb-Douglas u : Rn++ ! R data da

Y
n
u (x) = xi i
i=1
P
con i > 0 e ni=1 i = 1, ha dominio Rn++ aperto. Essa continua e strettamente
concava. Il prossimo lemma mostra che coerciva su Bi (p; w); per il Teorema 294 il
Problema del consumatore ha una e una sola soluzione. Naturalmente, lesistenza di
un eventuale paniere di sussistenza x 0 restringe il dominio della funzione Cobb-
n
Douglas al dominio chiuso A = x 2 R+ : x x Rn++ ; in questo caso la coercitivit
su Bi (p; w) conseguenza immediata della Proposizione 287.

Lemma 295 La funzione di utilit Cobb-Douglas u : Rn++ ! R coerciva su Bi (p; w),


purch p 0.

Dim. Per prima cosa mostriamo che gli insiemi di soprallivello (u t) sono chiusi per
ogni t 2 R. Se t 0 ci banalmente vero perch (u t) = ;. Sia t > 0, cosicch
(u t) 6= ;. Si consideri una successione xk (u t) che converge a un paniere
17.6. CONSUMO E PRODUZIONE 557

x~ 2 Rn . Per mostrare che (u t) chiuso occorre mostrare che x~ 2 (u t). Poich


xk Rn++ , si ha x~ 0. Mostriamo che x~ 0. Supponiamo, per contra, che x ha
Yn
k
almeno una coordinata nulla. Ci implica u x ! x~i i = 0, il che contraddice
i=1

u xk t>0 8k
In conclusione, x~ 0. Quindi, x~ appartiene al dominio di u, dalla cui continuit segue
u xk ! u (~ x). Poich u xk t per ogni k, possiamo concludere che u (~ x) t, cio
x~ 2 (u t), come desiderato.
facile vedere che, per t > 0 su cientemente piccolo, lintersezione (u t) \
Bi (p; w) non vuota. Si ha
(u t) \ Bi (p; w) = x 2 Rn++ : u (x) t \ x 2 Rn++ : p x w
= x 2 Rn++ : u (x) t \ x 2 Rn+ : p x w
= (u t) \ B (p; w)
Siccome (u t) chiuso e B (p; w) compatto, ne segue che lintersezione (u t) \
Bi (p; w) un insieme compatto. La funzione u quindi coerciva su Bi (p; w).
Linsieme delle soluzioni del Problema del consumatore, cio dei panieri ottimi di
consumo, arg maxx2B(p;I) u (x). Se la funzione di utilit strettamente quasi concava,
tale insieme al pi un singoletto; indichiamolo con f^ x (p; I)g, cos da evidenziare la
dipendenza della soluzione dal reddito I e dal vettore p di prezzi. In particolare, tale
dipendenza si pu formalizzare con la funzione D : Rn++ R+ ! Rn denita come
D (p; I) = x^ (p; I) ; 8 (p; I) 2 Rn++ R+
La funzione D detta funzione di domanda del consumatore: ad ogni vettore (p; I)
essa associa il suo paniere ottimo. La funzione di domanda, fondamentale in Economia,
descrive perci il variare della soluzione del problema del consumatore al variare di
prezzi e reddito12 .

17.6.2 Produzione
Consideriamo il Problema del produttore (17.8):
max (y) sub y 2 R+
y

In questo caso la variabile di scelta y appartiene allinsieme di scelta non compatto R+ .


Non possiamo quindi applicare il Teorema di Weierstrass, ma anche qui il Teorema di
Tonelli ci viene in aiuto13 .
12
un primo fondamentale esempio che illustra limportanza nelle applicazioni economiche del-
lunicit della soluzione di un problema di ottimo, di cui si era detto subito dopo la Proposizione
275.
13
Da questi importanti esempi si vede come, in un certo senso, il Teorema di Tonelli la versione
operativa di quello di Weierstass.
558 CAPITOLO 17. PROBLEMI DI OTTIMO

Teorema 296 Se le funzioni di ricavo r e di costo c sono continue, il Problema del


produttore ha soluzione purch limy!+1 c (y) = +1 e

r (y)
<1
c (y)

per ogni y su cientemente grande. In particolare, tale soluzione unica se


strettamente quasi concava.

Dim. Sia y > 0 tale che r (y) =c (y) < 1 per ogni y y. Per ogni tale y si ha

r (y)
(y) = r (y) c (y) = c (y) 1 ! 1
c (y)

e quindi supercoerciva su R+ . Poich continua, la funzione quindi coerciva.


Dal Teorema di Tonelli segue lesistenza di una soluzione.

Inne, se strettamente quasi concava, grazie al Teorema 293 la soluzione


unica.

Per esempio, consideriamo un produttore in concorrenza perfetta nel mercato del-


loutput e con costi quadratici dellinput, cio r (y) = p y e c (y) = y 2 . Il suo problema

max (y) = max p y y 2 sub y 0 (17.14)


y y

Le funzioni r e c sono continue. Inoltre,

r (y) p y p
= 2 = !0
c (y) y y

e quindi le ipotesi del Teorema 296 sono soddisfatte. Ne segue che il problema (17.14)
ha soluzione. Inoltre, tale soluzione unica perch strettamente concava.

17.7 Assicurazione
Le grandinate sono da sempre una grave minaccia per i raccolti e, per tale ragione,
la stipula di una polizza di assicurazione contro la grandine un problema di scelta
importante per molti contadini. Il Criterio dellutilit attesa permette di formalizzare
tale problema. Vi sono due stati del mondo rilevanti:

! 1 =non grandina ; ! 2 =grandina

Supponiamo che, sulla base delle sue informazioni metereologiche, il contadino ritenga
che le probabilit P (! 1 ) e P (! 2 ) con le quali gli stati si vericheranno sono P (! 1 ) =
1 p e P (! 2 ) = p, con p 2 [0; 1]. Nel gergo assicurativo, p la probabilit del sinistro.
17.7. ASSICURAZIONE 559

In assenza di grandinate il raccolto avrebbe fruttato w1 euro al contadino, ridotti


a w2 euro in caso di grandinate. La dierenza

= w1 w2

il danno causato dalla grandine. Per fronteggiare tale danno, il contadino pu ac-
quistare diverse quantit di una polizza assicurativa unitaria contro la grandine che
paga 1 euro di risarcimento in caso di grandine a fronte del pagamento da parte del
contadino di un premio di euro. Se il contadino acquista una quantit 0 di tale
polizza unitaria, ricever un risarcimento di euro in caso di grandine e pagher un
premio di euro.
Indichiamo con f latto che corrisponde allacquisto di unit della polizza
unitaria. Le consequenze di tale atto sono

f (! 1 ) = w1

e
f (! 2 ) = w2 +
Si noti che il premio viene pagato in ogni stato del mondo, mentre il risarcimento
pagato solo in caso di grandine. Secondo il Criterio dellutilit attesa, il contadino
valuta latto f come

EP u (f ) = u (f (! 1 )) P (! 1 ) + u (f (! 2 )) P (! 2 )
= u (w1 ) (1 p) + u (w2 + )p
= u (w1 ) (1 p) + u (w1 + )p

dove lultima espressione pone in evidenza il danno . La scelta della quantit si


basa sul confronto tra le utilit attese degli atti f , ossia sulla risoluzione del seguente
problema di ottimo
max EP u (f ) sub 0 (17.15)
La quantit ^ ottima se

EP u (f ^ ) EP u (f ) 8 0

cio se essa garantisce unutilit attesa maggiore o uguale di quella garantita da qualsi-
asi altra quantit . Chiamiamo (17.15) il Problema di assicurazione e lo risolveremo
nel Capitolo 27 (Sezione 27.5.3).

In ultimo, consideriamo il problema dal punto di vista dellassicuratore. La vendita


di quantit della polizza unitaria determina un protto atteso

= (1 p) + ( )p

che, dopo alcuni semplici calcoli, si pu riscrivere come

= ( p)
560 CAPITOLO 17. PROBLEMI DI OTTIMO

Fissato > 0, si ha quindi


= 0 () =p
Il protto dellassicuratore nullo per ogni possibile quantit quando il premio che
lassicurato paga per ogni euro di copertura uguale alla probabilit p con la quale
si verica il sinistro. Tale premio si dice (attuarialmente) equo 14 . In analogia, diremo
che il premio iniquo quando > p ed superequo quando < p. Il protto
dellassicuratore positivo per ogni > 0 se il premio iniquo ed negativo se esso
superequo.
Il premio il prezzo che lassicuratore richiede per la vendita della polizza unitaria,
che la sua merce (come i prodotti del raccolto lo sono per il contadino). Un
premio equo pu essere il risultato di condizioni di mercato di concorrenza perfetta tra
assicuratori15 , mentre un premio iniquo pu riettere un qualche potere di mercato
dellassicuratore16 . In ogni caso, ci di importanza secondaria per noi: quel che
rilevante il ruolo centrale che tali caratteristiche dei premi svolgono nello studio del
Problema di assicurazione, come vedremo nel Capitolo 27.

17.8 Minimi quadrati


Il Metodo dei minimi quadrati uno dei metodi fondamenati della Matematica ap-
plicata, centrale in moltissime applicazioni. Come tutte le grandi idee, esso si pu
considerare da diversi angoli e cos faremo in questa sezione.

17.8.1 Sistemi lineari


Cominciamo da una prospettiva di Algebra lineare. Un sistema lineare di equazioni

A x = b ; (17.16)
(m n)(n 1) m 1

pu non avere soluzione. Per esempio, questo spesso il caso per sistemi con pi
equazioni che incognite: m > n.
Quando il sistema non ha soluzione non esiste alcun vettore x^ 2 Rn tale che A^x = b.
Ci detto, ci si pu chiedere se esista un surrogato della soluzione, un vettore x 2 Rn
che renda minimo lerrore di approssimazione

kAx bk (17.17)

ossia la distanza tra limmagine Ax dellapplicazione lineare F (x) = Ax e il vettore


di termini noti b.
14
Laggettivo non ha qui alcuna connotazione morale.
15
Immaginiamo il contadino che vada in una piazza con tanti piccolo chioschi, in ciascuno dei quali
un assicuratore ore le sue polizze contro la grandine.
16
Nella piazza dellultima nota vi un unico chiosco al quale il contadino pu rivolgersi per stipulare
una polizza.
17.8. MINIMI QUADRATI 561

Lerrore nullo nel caso fortunato ove x soluzione del sistema perch Ax b = 0.
In generale, lerrore (17.17) positivo perch la norma sempre 0.
Per la Proposizione 277 equivalente rendere minima la norma kAx bk oppure
la sua pi comoda trasformazione quadratica kAx bk2 . Ci motiva la prossima
denizione.

Denizione 121 Un vettore x 2 Rn si dice soluzione ai minimi quadrati del sistema


(17.16) se soluzione del Problema di ottimo

min kAx bk2 sub x 2 Rn (17.18)


x

Si tratta di una soluzione approssimata del sistema lineare, quanto di meglio si


pu fare per rendere minima la distanza tra i vettori Ax e b di Rm . Poich k k2 una
somma di quadrati, il renderli minimi col Problema di ottimo (17.18) si dice Metodo dei
minimi quadrati. I padri del Metodo sono Gauss e Legendre, che lo proposero allinizio
dellOttocento per analizzare dati astronomici sulle orbite di alcuni corpi celesti.

Quando esiste, la soluzione del sistema ne anche soluzione ai minimi quadrati. Per
essere un buon surrogato, occorre per che la soluzione ai minimi quadrati esista anche
quando il sistema non ha soluzione. In altre parole, il Metodo dei minimi quadrati
tanto pi utile quanto pi generali sono le condizioni che garantiscono lesistenza di
soluzioni del Problema di ottimo (17.18).
Il prossimo importante risultato mostra che, in eetti, tali soluzioni esistono e sono
uniche con la sola ipotesi (A) = n, che nel caso pi rilevante m > n equivale a
richiedere che la matrice A abbia rango massimo. Il risultato si basa sul Teorema di
Tonelli per lesistenza e sul Teorema 293 per lunicit.

Teorema 297 Il Problema di ottimo (17.18) ha una e una sola soluzione purch
(A) = n.

Per dimostrare il teorema consideriamo la funzione g : Rn ! R denita da

g (x) = kAx bk2

sicch il Problema (17.18) equivalente al Problema di ottimo:

max g (x) sub x 2 Rn (17.19)


x

Il prossimo lemma mostra le notevoli propriet della funzione obiettivo g che perme-
ttono di applicare il Teorema di Tonelli e Teorema 293. Si ricordi che la condizione
(A) = n equivale alliniettivit dellapplicazione lineare F (x) = Ax.

Lemma 298 Se (A) = n, allora g coerciva e strettamente concava.


562 CAPITOLO 17. PROBLEMI DI OTTIMO

Dim. Cominciamo col dimostrare che g strettamente concava. Siano x1 ; x2 2 Rn e


2 (0; 1). La condizione (A) = n implica che F iniettiva, sicch F (x1 ) 6= F (x2 ).
Quindi,

kF ( x1 + (1 ) x2 ) bk2 = k F (x1 ) + (1 ) F (x2 ) ( b + (1 ) b)k2


= k (F (x1 ) b) + (1 ) (F (x2 ) b)k2
< kF (x1 ) bk2 + (1 ) kF (x2 ) bk2

dove la disuglianza stretta segue dalla stretta concavit della norma k k. Dunque:

g ( x1 + (1 ) x2 ) = kF ( x1 + (1 ) x2 ) bk2
2
> kF (x1 ) bk (1 ) kF (x2 ) bk2
= g (x1 ) + (1 ) g (x2 )

il che implica la stretta concavit di g.


Mostriamo ora che g coerciva. Poich F iniettiva, linversa F 1 : Im F ! Rn
esiste ed continua17 . Inoltre, la funzione f : Rm ! R denita da f (y) = ky bk2
supercoerciva. Infatti:

kyk = ky b + bk ky bk + kbk

e quindi

kyk ! +1 =) ky bk ! +1 =) f (y) = ky bk2 ! 1

Si ponga Bt = fy 2 Im F : f (y) tg = (f t) \ Im F per t 2 R. Siccome f


supercoerciva e continua, per la Proposizione 290 f coerciva sullinsieme chiuso
Im F e gli insiemi Bt = (f t) \ Im F sono compatti per ogni t. Inoltre

(g t) = fx 2 Rn : f (F (x)) tg = fx 2 Rn : F (x) 2 Bt g = F 1
(Bt )

Siccome F 1 continua e Bt compatto, per il Lemma 284 F 1 (Bt ) compatto. Ne


segue che (g t) compatto per ogni t, il che implica che g coerciva.

Dim. del Teorema 297 Alla luce dellultimo lemma, il Problema (17.19), e quindi
il Problema (17.18), ha soluzione grazie al Teorema di Tonelli perch g coerciva ed
unica grazie al Teorema 293 perch g strettamente concava.

17.8.2 Statistica descrittiva


Riprendiamo il Metodo dei minimi quadrati secondo una prospettiva pi statistica.
Consideriamo un contadino che debba decidere quanto concime x (input) usare per il
17
Infatti, anche per applicazioni lineari vale una versione del Teorema 191.
17.8. MINIMI QUADRATI 563

prossimo raccolto di patate y (output). Egli non conosce la funzione di produzione


f : R+ ! R che a ogni quantit di input x associa la relativa quantit di output y,
e quindi, dato un obiettivo di output y egli non pu semplicemente calcolare linversa
f 1 (y).
Tuttavia, il contadino ha a sua disposizione i dati sulle coppie (xi ; yi ) di input e
output negli ultimi m anni, cio per i = 1; :::; m. Il contadino vuol determinare la
funzione di produzione lineare f (x) = x, con 2 R, che meglio d conto dei suoi
dati. La scelta della linearit di semplicit, una volta capito come procedere in
questo caso si pu pensare a forme di f pi complicate.
Resta da capire cosa si intenda di preciso per che meglio d conto dei suoi dati.
questa la chiave di volta del problema. Secondo il Metodo dei minimi quadrati, con
questa espressione si intende la funzione f (x) = x, ossia il coe ciente , che rende
minima
X m
(yi xi )2
i=1

cio la somma dei quadrati degli errori yi xi che si commettono usando la funzione
di produzione f (x) = x per valutare loutput. Si ha quindi il seguente problema di
ottimo
X m
min (yi xi )2 sub 2 R
i=1

Se indichiamo con X = (x1 ; :::; xm ) e Y = (y1 ; :::; ym ) i vettori dei dati su input e
output, possiamo riscriverlo in forma matriciale come

min k X Y k2 sub 2R (17.20)

che il caso particolare n = 1 del Problema di ottimo (17.18) con la notazione18


A = X, x = e b = Y .
Grazie al Teorema 297, il Problema (17.20) ha ununica soluzione 2 R perch
la condizione di rango banalmente soddisfatta quando n = 1. Il contadino pu usare
la funzione di produzione
f (x) = x

per decidere quanto concime usare per il prossimo raccolto per un dato livello di
produzione di patate che si pregga. Con i dati a sua disposizione e la scelta di
semplicit di limitarsi a funzioni di produzione lineari, il Metodo dei minimi quadrati
gli suggerisce che questa la funzione di produzione che meglio si accorda con i dati.

18
Purtroppo la notazione qui usata, comune in statistica, non coerente con quella del Problema
(17.18). In particolare, qui svolge il ruolo di x nella (17.18).
564 CAPITOLO 17. PROBLEMI DI OTTIMO

8
y
7

1
0 O 1 2 3 4 5 6 7x

Quanto fatto dal contadino si pu ripetere per lanalisi di dati di qualsiasi coppia di
variabili. La variabile esplicativa x, detta regressore, spesso non unica. Per esempio,
tornando al nostro contadino, supponiamo che siano necessari n tipi di input x1 , x2 ,
..., x2 (cio n regressori) per produrre la quantit y di output. I dati raccolti dal
contadino sugli input sono

X1 = (x11 ; x12 ; :::; x1m )


X2 = (x21 ; x22 ; :::; x2m )

Xn = (xn1 ; xn2 ; :::; xnm )

dove xij la quantit dellinput i dellanno j. Il vettore Y = (y1 ; :::; ym ) continua a


indicare loutput prodotto. La funzione di produzione lineare ora di pi variabile,
cio f (x) = x con x 2 Rn . La matrice dei dati
2 3
x11 x12 x1n
6 x21 x22 x2n 7
6 7
T
X = X1 X2 T
Xn = 6
T
6
7
7 (17.21)
m n
4 5
xm1 xm2 xmn

ha come colonne i vettori X1 , X2 , ..., Xn , sicch ogni colonna raccoglie i dati sui
regressori nei vari anni.
Il Metodo dei minimi quadrati conduce a

min kX Y k2 sub 2 Rn
17.9. PROIEZIONI E APPROSSIMAZIONI 565

che il Problema di ottimo (17.18) con la notazione19 A = X, x = e b = Y .


Se r (X) = n, il Teorema 297 garantisce che il Problema (17.20) ha ununica
soluzione 2 Rn . La funzione di produzione lineare che i dati suggeriscono al con-
tadino f (x) = X , dove il vettore di coe cienti = ( 1 ; :::; n ) assegna a ogni
regressore xi il peso esplicativo i secondo il Metodo dei minimi quadrati.

17.9 Proiezioni e approssimazioni


17.9.1 Teorema della proiezione
Ricordiamo dal Capitolo 4 che due vettori x; y 2 Rn sono ortogonali quando il loro
prodotto interno nullo; in tal caso si scrive x?y. In particolare, quando x ortogonale
a tutti i vettori di un insieme S di Rn si scrive x?S.
Fatta questa premessa, veniamo a un problema molto semplice e generale. Dati un
punto x 2 Rn e un sottospazio vettoriale V di Rn , si tratta di individuare, se esiste, il
punto m 2 V pi vicino a x (nel senso che rende minima kx yk al variare di y in
V ).

1.5

1
x
0.5

0 ||x-m||
O
-0.5
m
-1

-1.5

-2
-1 0 1 2 3 4

Ovviamente, se x appartenesse a V , il problema sarebbe banale risultando m = x.


Possiamo parafrasare il problema dicendo che si tratta di trovare in V la migliore
approssimazione a un dato x 2 Rn : V appare allora come lo spazio delle approssi-
mazioni ammissibili: x m detto erroreperch rappresenta giustappunto lerrore
commesso approssimando x con m.
Il problema descritto di ottimo: si tratta di rendere minima kx yk con il vincolo
y 2 V . Le domande da porsi sono, nellordine:

(i) Tale m esiste?


19
Purtroppo la notazione qui usata, comune in Statistica, non coerente con quella del Problema
(17.18). In particolare, qui svolge il ruolo di x nella (17.18).
566 CAPITOLO 17. PROBLEMI DI OTTIMO

(ii) Se esiste, unico?

(iii) Come caratterizzarlo?

A tali domande risponde il:

Teorema 299 (della proiezione) Sia V un sottospazio vettoriale di Rn . Per ogni


x 2 Rn , il problema di ottimo

min kx yk sub y 2 V (17.22)


y

ha una e una sola soluzione, data dal vettore m 2 V il cui errore x m ortogonale
a V , cio (x m) ?V .

Si noti che lunicit di m fa s che kx mk < kx yk per ogni y 2 V distinto da


m.

Questo importante risultato garantisce lesistenza e lunicit della soluzione, rispon-


dendo in tal modo alle prime due domande, e caratterizza la soluzione come il vettore
di V che rende ortogonale a V lerrore di approssimazione. Lortogonalit rispetto
allerrore una profonda propriet della soluzione, che ha innumerevoli conseguenze
nelle applicazioni. Inoltre, il Teorema 303 mostrer come essa permetta di determinare
la soluzione in forma chiusa in termini di una base di V , fornendo cos una risposta
completa anche allultima domanda.

Dato x 2 Rn , consideriamo la funzione f : Rn ! R denita da

f (y) = kx yk

Il Problema (17.22) si pu riscrivere come

max f (y) sub y 2 V (17.23)


y

Grazie al prossimo lemma, a questo problema di ottimo si possono applicare il


Teorema di Tonelli e il Teorema 293.

Lemma 300 La funzione f strettamente concava ed coerciva su V .

Dim. La dimostrazione analoga a quella del Lemma 298 ed lasciata al lettore (si
ricordi dalla Proposizione 249 che V un insieme chiuso e convesso di Rn ).

Dim. del Teorema della proiezione Alla luce dellultimo lemma, il Problema
(17.23), e quindi il Problema (17.22), ha soluzione grazie al Teorema di Tonelli perch
f coerciva su V ed unica grazie al Teorema 293 perch f strettamente concava.
17.9. PROIEZIONI E APPROSSIMAZIONI 567

Resta da dimostrare che, se m rende minima kx yk, allora (x m) ?V . Supponi-


amo per assurdo che vi sia qualche y~ 2 V non ortogonale a x m. Possiamo sempre
supporre, senza perdere in generalit, che k~
y k = 1 (se cos non fosse, basterebbe pren-
y k che ha sempre norma 1) e che (x m) y~ = 6= 0. Indichiamo con y 0
dere y~= k~
lelemento di V tale che y 0 = m + y~. Risulta
2
kx y 0 k = kx m y~k2 = kx mk2 2 (x m) y~+ 2
= kx mk2 2
< kx mk2

il che contraddice lipotesi che m renda minima kx yk perch lelemento y 0 renderebbe


kx yk ancora pi piccola. La contraddizione dimostra il risultato.

Indichiamo con V ? linsieme dei vettori ortogonali a V , cio V ? = fx 2 Rn : x?V g.


Come il lettore pu vericare, tale insieme forma un sottospazio vettoriale di Rn , detto
sottospazio ortogonale di V .

Esempio 323 Sia V generato dai vettori fyi gki=1 , e sia Y 2 M (k; n) la matrice che
ha tali vettori come colonne. Dato x 2 Rn , si ha x?V se e solo se

Yx=0

Quindi, V ? formato da tutte le soluzioni di questo sistema lineare omogeneo. N

Il Teorema della proiezione ha il seguente importante corollario.

Corollario 301 Sia V un sottospazio vettoriale di Rn . Ogni vettore x 2 Rn si pu


scomporre in modo unico come
x=y+z
con y 2 V e z 2 V ? .

Dim. Basta porre y = m e z = x m.

In altre parole, ogni vettore si pu rappresentare in modo univoco come somma di


vettori di V e del suo ortogonale V ? , e ci si pu ripetere per qualsiasi sottospazio
vettoriale V di Rn . notevole lunicit della scomposizione, ossia che i vettori y e z
siano unici. Per tale ragione si dice che Rn somma diretta dei sottospazi V e V ? ,
in simboli Rn = V V ? . In molte applicazioni molto importante vedere Rn come
somma diretta di un suo sottospazio e del suo ortogonale.

17.9.2 Proiezioni
Dato un sottospazio vettoriale V di Rn , la soluzione del problema di minimo (17.22)
si dice proiezione di x su V . In tal modo si denisce unapplicazione PV : Rn ! Rn
che a ogni x 2 Rn associa la sua proiezione PV (x).

Proposizione 302 La proiezione unapplicazione lineare.


568 CAPITOLO 17. PROBLEMI DI OTTIMO

Dim. Siano x; y 2 Rn e ; 2 R. Dobbiamo mostrare che PV ( x + y) = PV (x) +


PV (y). Per ogni z 2 V si ha

( PV (x) + PV (y) ( x + y)) z = ( (PV (x) x) + (PV (y) y)) z


= (PV (x) x) z + (PV (y) y) z = 0

Quindi
( PV (x) + PV (y) ( x + y)) ?V
e, per il Teorema della proiezione, PV (x) + PV (y) la proiezione di x + y su V ,
cio PV ( x + y) = PV (x) + PV (y).

Le proiezioni, in quanto applicazione lineari, hanno una rappresentazione matri-


ciale. Per trovarla, si consideri un insieme fyi gki=1 di vettori che genera il sottospazio
V , cio V = span fy1 ; :::; yn g. Dato x 2 Rn , per il Teorema della proiezione si ha
(x PV (x)) ?V , e quindi

(x PV (x)) yi = 0 8i = 1; :::; k

Sono le cosiddette equazioni normali per la proiezione. PPoich PV (x) 2 V , possiamo


scrivere tale vettore come combinazione lineare PV (x) = ki=1 k yk , sicch le equazioni
normali diventano:
!
X
k
x k yk yi = 0 8i = 1; :::; k
i=1

ossia
X
k

k (yk yi ) = x yi 8i = 1; :::; k
i=1

Si ha quindi il sistema
8
>
> 1 (y1 y1 ) + 2 (y2 y1 ) + + k (yk y1 ) = x y1
<
1 (y1 y2 ) + 2 (y2 y2 ) + + k (yk y2 ) = x y2
>
>
:
1 (y1 yk ) + 2 (y2 yk ) + + k (yk yk ) = x yk

Sia Y 2 M (n; k) la matrice che ha i vettori generatori fyi gki=1 come colonne. Possiamo
riscrivere il sistema in forma matriciale come

YT Y = YT x (17.24)
k nn kk 1 k nn 1

Ritroviamo la matrice quadrata di Gram Y T Y , che, per la Proposizione 211, ha rango


uguale a Y , cio Y T Y = (Y ). Se i vettori fyi gki=1 sono linearmente indipendenti,
17.9. PROIEZIONI E APPROSSIMAZIONI 569

la matrice Y ha rango pieno k e quindi la matrice di Gram invertibile. Moltiplicando


1
entrambi i membri del sistema (17.24) per la matrice inversa Y T Y di Gram si ha:
1
= Y TY Y Tx

sicch la proiezione data da

X
k
1
PV (x) = k yk =Y = Y Y TY Y Tx 8x 2 Rn
i=1

Abbiamo quindi provato il fondamentale:

Teorema 303 Sia V un sottospazio vettoriale di Rn generato dai vettori linearmente


indipendenti20 fyi gki=1 . La proiezione PV : Rn ! Rn su V data da
1
PV (x) = Y Y T Y Y Tx 8x 2 Rn (17.25)

dove Y 2 M (n; k) la matrice che ha tali vettori come colonne.


1
In conclusione, la matrice Y Y T Y Y T rappresenta lapplicazione lineare PV .

17.9.3 Minimi quadrati e proiezioni


Lidea di approssimazione che sottende sia i minimi quadrati sia le proiezioni suggerisce
uno stretto legame tra le due nozioni. Renderemo qui precisa tale naturale intuizione.

La soluzione x 2 Rn ai minimi quadrati risolve il problema di minimo

min kAx bk2 sub x 2 Rn (17.26)


x

Daltra parte, poich limmagine Im F dellapplicazione lineare F (x) = Ax un sot-


tospazio vettoriale di Rm , la proiezione PIm F (b) del vettore b 2 Rm risolve il problema
di ottimo

min ky bk2 sub y 2 Im F


y

cio
kPIm F (b) bk ky bk y 2 Im F
Quindi, un vettore x 2 Rn soluzione ai minimi quadrati se e solo se

Ax = PIm F (b) (17.27)


20 k
Lipotesi che V sia generato dai vettori linearmente indipendenti fyi gi=1 equivale a richiedere che
tali vettori siano una base di V . Lincipit del teorema si pu enunciare in modo equivalente come:
k
Sia fyi gi=1 una base di un sottospazio vettoriale di Rn .
570 CAPITOLO 17. PROBLEMI DI OTTIMO

cio se e solo se la sua immagine Ax la proiezione di b sullo sottospazio vettoriale


Im F generato dalle colonne di A. Limmagine Ax spesso si indica con y ; con tale
notazione, la (17.27) si scrive come y = PIm F (b).

Luguaglianza (17.27) mostra lo strettissimo legame tra proiezioni e minimi quadrati.


In particolare, grazie al Teorema della proiezione lerrore Ax b ortogonale al
sottospazio vettoriale Im F :
(Ax b) ? Im F
o, equivalentemente, (y b) ? Im F .
Il sottospazio vettoriale Im F generato dalle colonne di A, che sono quindi a
loro volta ortogonali con lerrore di approssimazione. Per esempio, nellinterpretazione
statistica dei minimi quadrati della Sezione 17.8.2, la matrice A si indica con X e
ha la forma (17.21); ogni colonna XiT di X riporta i dati sulli-esimo regressore nei
vari periodi. Se identichiamo ogni tale colonna col regressore di cui riporta i dati,
possiamo vedere Im F come il sottospazio vettoriale di Rm generato dai regressori.
Il Metodo dei minimi quadrati equivale a considerare la proiezione del vettore Y di
output sul sottospazio generato dai regressori X1 , ..., Xn . In particolare, i regressori
sono ortogonali allerrore di approssimazione:

(X Y ) ?Xi 8i = 1; ::; n

Equivalentemente, ponendo Y = X si ha (Y Y ) ?Xi per ogni i = 1; ::; n.


Ritroviamo cos una classica propriet dei minimi quadrati.

Forma della soluzione Quando A invertibile si ha


1
x =F (PIm F (b)) (17.28)

cosicch la soluzione ai minimi quadrati si pu determinare dalla proiezione. La (17.28)


diventa particolarmente signicativa se possiamo esprimerla in forma matriciale. A tal
ne, si osservi che le colonne di A generano il sottospazio Im F e quindi svolgono il ruolo
della matrice Y della Sezione 17.9.2. Quindi, se esse sono linearmente indipendenti,
grazie al Teorema 303 si ha
1
Ax = PIm F (b) = A AT A AT b

Moltiplicando per la matrice AT si ottiene:


1
AT A x = AT A AT A AT b = A T b
1
Inne, moltiplicando per linversa della matrice di Gram AT A si ha:
1
x = AT A AT b
17.10. APPROFONDIMENTO SEMICONTINUO 571

Questa la rappresentazione matriciale della (17.28), che stata resa possibile dalla
rappresentazione matriciale delle proiezioni stabilita nel Teorema 303. Si dunque
trovata la soluzione ai minimi quadrati quando la matrice A ha rango pieno. In
notazione statistica si ritrova la classica formula
1
= X TX X TY
dei minimi quadrati.

17.10 Approfondimento semicontinuo


I teoremi di esistenza visti nel capitolo hanno assunto la continuit della funzione
obiettivo f , una condizione semplice e spesso soddisfatta nelle applicazioni. Vi
per un classico indebolimento della continuit, la semicontinuit, che risulta essere la
condizione al contempo pi generale e pi naturale per cui vale il Teorema di Tonelli,
come il lettore pi curioso trova esposto in questultima sezione.

Si ricordi che una funzione f : A Rn ! R continua in un punto x0 2 A \ A0 se


limx!x0 f (x) = f (x0 ), cio se per ogni " > 0 esiste " > 0 tale che
kx x0 k < " =) jf (x0 ) f (x)j < " 8x 2 A \ A0
ossia
kx x0 k < " =) f (x0 ) " < f (x) < f (x0 ) + " 8x 2 A \ A0
Se conserviamo la sola seconda disuguaglianza, abbiamo il seguente indebolimento
della continuit.

Denizione 122 Una funzione f : A Rn ! R si dice superiormente semicontinua


nel punto x0 2 A \ A0 se, per ogni " > 0, esiste " > 0 tale che
kx x0 k < " =) f (x) < f (x0 ) + " 8x 2 A \ A0
Si conviene che f sia superiormente semicontinua in ogni punto isolato di A.

Una funzione superiormente semicontinua in ogni punto di un insieme A si dice


superiormente semicontinua su A. La funzione si dice superiormente semicontinua
quando lo in tutti i punti del proprio dominio.

NB. Accanto alla semicontinuit superiore vi quella inferiore, con f (x) > f (x0 ) "
in luogo di f (x) < f (x0 ) + ". Lo studio di queste due forme di semicontinuit
analogo, tant che facile vedere che f superiormente semicontinua se e solo se f
inferiormente semicontinua. Per questa ragione, consideremo solo la semicontinuit
superiore perch pi rilevante per i punti di massimo. O

Il prossimo risultato la versione della Proposizione 175 per funzioni semicontinue,


e aiuta a capire la portata di questo indebolimento della nozione di continuit.
572 CAPITOLO 17. PROBLEMI DI OTTIMO

Proposizione 304 Una funzione f : A Rn ! R superiormente semicontinua nel


punto x0 2 A se e solo se
lim sup f (xn ) f (x0 )
n

per ogni successione fxn g di punti di A tale che xn ! x0 .

Dim. Sia f superiormente semicontinua in x0 2 A e sia fxn g tale che xn ! x0 . Per


denizione, ssato " > 0 si ha f (xn ) < f (x0 ) + " per ogni n. Quindi, lim supn f (xn )
f (x0 )+". Siccome ci vero per ogni " > 0, concludiamo che lim supn f (xn ) f (x0 ).
Supponiamo ora che lim supn f (xn ) f (x0 ) per ogni successione fxn g A tale
che xn ! x0 2 A. Sia " > 0 e si supponga, per contraddizione, che f non sia
superiormente semicontinua in x0 . Per ogni > 0 esiste x tale che kx x0 k < e
f (x ) f (x0 ) + ". Posto = 1=n, ne segue che per ogni n esiste xn tale che

kxn x0 k < 1=n e f (xn ) f (x0 ) + ":

In questo modo possiamo costruire una successione fxn g tale che xn ! x0 e f (xn )
f (x0 )+" per ogni n. Dunque, lim inf n f (xn ) f (x0 )+", il che contraddice lim supn f (xn )
f (x0 ) e mostra come f debba quindi essere superiormente semicontinua in x0 .

Esempio 324 La funzione f : [0; 1] ! R denita come


(
1 se x = 0
f (x) =
x se x 2 (0; 1]

superiormente semicontinua. Infatti, essa continua in ogni x 2 (0; 1], e per quanto
riguarda x = 0 si consideri fxn g [0; 1] con xn ! 0. Per ogni tale xn si ha f (xn ) 1
e quindi lim supn f (xn ) 1 = f (0). Per la Proposizione 304, f superiormente
semicontinua anche in 0. N

Esempio 325 Nel Capitolo 13 si era visto che la funzione f : R ! R data da


8
>
> x per x < 1
<
f (x) = 2 per x = 1
>
>
: 1 per x > 1

ha una discontinuit eliminabile in x = 1. Essa ivi superiormente semicontinua.


Infatti, sia fxn g R con xn ! 1. Per ogni tale xn si ha f (xn ) 1 e quindi
lim supn f (xn ) 1 < 2 = f (1). Per la Proposizione 304, f superiormente semicon-
tinua anche in 1 (ed quindi superiormente semicontinua perch continua in ogni
x 6= 1).
In generale, una funzione f che ha una discontinuit eliminabile in un punto
x0 , cio il cui limite limx!x0 f (x) esiste ma diverso da f (x0 ), ivi superiormente
semicontinua quando f (x0 ) > limx!x0 f (x) ed inferiormente semicontinua quando
f (x0 ) < limx!x0 f (x). N
17.10. APPROFONDIMENTO SEMICONTINUO 573

Esempio 326 La funzione f : R ! R data da


(
2 se x 1
f (x) = (17.29)
x se x < 1

ha una discontinuit non eliminabile a salto in x0 = 1. Essa ivi superiormente


semicontinua. Infatti, sia fxn g R con xn ! 1. Per ogni tale xn si ha f (xn ) 2
e quindi lim supn f (xn ) 2 = f (1). Per la Proposizione 304, f superiormente
semicontinua anche in 1 (ed quindi superiormente semicontinua perch continua in
ogni x 6= 1).
In generale, il lettore pu vericare che una funzione crescente f : R ! R superi-
ormente semicontinua in x0 se e solo se ivi continua da destra, cio limx!x+0 f (x) =
f (x0 ), mentre ivi inferiormente semicontinua se e solo se ivi continua da sinistra,
cio limx!x0 f (x) = f (x0 ).
Per esempio, modichiamo la funzione 17.29 in x0 = 1 cos da avere
(
2 se x > 1
f (x) =
x se x 1

Essa inferiormente semicontinua in x0 = 1. N

Il Lemma 286 sulla chiusura degli insiemi di soprallivello continua a valere per fun-
zioni superiormente semicontinue, ed anzi una propriet caratterizzante per questa
nozione indebolita di continuit.

Proposizione 305 Una funzione f : A Rn ! R superiormente semicontinua su


un sottoinsieme chiuso C di A se e solo se gli insiemi (f t) \ C sono chiusi per ogni
t 2 R.

Dim. Sia f superiormente semicontinua su C. Fissato t 2 R, vogliamo mostrare che


(f t) \ C chiuso per ogni t 2 R. Sia fxn g (f t) \ C con xn ! x 2 Rn . Occorre
mostrare che x 2 (f t) \ C.
Poich C chiuso, si ha x 2 C. Inoltre, per ogni n si ha f (xn ) t. Siccome f
superiormente semicontinua su C, per la Proposizione 304 si ha lim supn f (xn ) f (x).
Quindi t f (x), ossia x 2 (f t), come desiderato.
Viceversa, supponiamo che gli insiemi (f t) \ C siano chiusi per ogni t 2 R.
Fissato x 2 C, sia fxn g A tale che xn ! x. Vogliamo mostrare che lim supn f (xn )
f (x). Per contraddizione, assumiamo che lim supn f (xn ) > f (x). Sia 2 R tale che
lim supn f (xn ) > > f (x). Esiste una sottosuccessione fxnk g tale che f (xnk )
per ogni k. Daltra parte xn ! x implica xnk ! x, e quindi x 2 (f ) \ C poich
(f ) \ C chiuso. Ma ci porta alla contraddizione f (x) > f (x), il che ci
permette di concludere che lim supn f (xn ) f (x).
574 CAPITOLO 17. PROBLEMI DI OTTIMO

Esempio 327 Dato un sottoinsieme chiuso F di Rn , la funzione 1F : Rn ! R denita


come (
1 se x 2 F
1F (x) = :
0 se x 2=F
superiormente semicontinua. Infatti,
8
>
> X se t 0
<
(1F t) = F se t 2 (0; 1]
>
>
: ; se t > 1

e quindi gli insieme (1F t) sono chiusi per ogni t 2 R. Per esempio, le funzioni
1[0;+1) : R ! R e 1[0;1] : R ! R hanno la forma
( (
1 se x 0 1 se x 2 [0; 1]
1[0;+1) (x) = e 1[0;1] (x) =
0 se x < 0 0 se x 2
= [0; 1]
N

Possiamo ora enunciare la seguente versione pi generale del Teorema di Tonelli in


cui si assume che la funzione obiettivo solo semicontinua.

Teorema 306 Una funzione f : A Rn ! R coerciva e superiormente semicontinua


su un sottoinsieme C di A ammette punto di massimo in C, ossia esiste x^ 2 C tale
che
f (^
x) = max f (x) :
x2C

Dim. Cominciamo col dimostrare che f superiormente limitata su C, cio supx2C f (x) <
+1. Supponiamo, per contra, che supx2C f (x) = +1. Grazie alla Proposizione 52,
esiste una successione crescente f n g f (C) tale che n " +1. Quindi, esiste una
successione fxn g C tale che f (xn ) = n per ogni n. Poich f coerciva, esiste t 2 R
tale che (f t) \ C compatto e non vuoto. Poich n " +1, si ha denitivamente
n t e quindi denitivamente xn 2 (f t) \ C. La compattezza di questo insieme
implica che la successione fxn g limitata; per il Teorema di Bolzano-Weierstrass,
esiste una sottosuccessione fxnk g che converge a un elemento x 2 (f t) \ C. La
semicontinuit di f porta alla contraddizione

+1 = lim n = lim sup f (xn ) f (x) 2 R


n n

Ne segue che supx2C f (x) < +1. Si ponga = supx2C f (x). Applicando di nuovo la
Proposizione 52, si costruisce una successione crescente f n g f (C) tale che n " ,
sicch esiste una successione fxn g C tale che f (xn ) = n per ogni n.
Se = t, lasserto vale perch ogni elemento di (f t)\C punto di massimo di f
in C. Sia > t. Siccome n " , si ha denitivamente n t, e quindi denitivamente
17.10. APPROFONDIMENTO SEMICONTINUO 575

xn 2 (f t) \ C. La compattezza di questo insieme implica che la successione fxn g


limitata; per il Teorema di Bolzano-Weierstrass, esiste una sottosuccessione fxnk g che
converge a un elemento x 2 (f t)\C. Poich f semicontinua si ha lim supn f (xn )
f (x). Insieme a f (xn ) = n " ci implica

= lim f (xn ) f (x) sup f (x) =


n x2C

ossia = f (x). Il punto x quindi di massimo di f in C, il che completa la


dimostrazione.

Esempio 328 La funzione f : R ! R dellEsempio 324 data da


(
2 se x = 0
f (x) =
e kxk se x 6= 0

coerciva e superiormente semicontinua. Grazie al Teorema 306, ha almeno un punto


di massimo in R. Si noti come, invece, la funzione non abbia punti di minimo; del
resto, il Teorema di Weierstrass qui non vale poich il dominio R non compatto. N

Il prossimo corollario una semplice conseguenza del Teorema 306 e mostra che la
coercitivit implicata dalla semicontinuit superiore quando linsieme in cui si cerca
il punto di massimo un compatto. Questa versione del Teorema 306 si presta bene
ad un confronto col Teorema di Weierstrass, in quanto esso vale sotto le medesime
ipotesi, eccetto la semicontinuit superiore al posto della continuit.

Corollario 307 Una funzione f : A Rn ! R superiormente semicontinua su un


sottoinsieme compatto C di A ammette punto di massimo in C.

Dim. Per la Proposizione 305, (f t)\C chiuso per ogni t 2 R, e quindi compatto.
Quindi, f coerciva su C. Essendo anche superiormente semicontinua su C, lasserto
segue dal Teorema 306.

Esempio 329 Consideriamo la funzione superiormente semicontinua f : [0; 1] ! R


vista nellEsempio 324 e data da
(
1 se x = 0
f (x) = :
x se x 2 (0; 1]

Per il Corollario 307, la funzione ha almeno un punto di massimo nel suo dominio [0; 1].
Si pu vericare che essa non ha punti di minimo nel suo dominio (qui il Teorema di
Weierstrass non si pu applicare poich la funzione non continua). N
576 CAPITOLO 17. PROBLEMI DI OTTIMO
Parte IV

Calcolo dierenziale

577
Capitolo 18

Derivate

18.1 Denizione
La funzione c : R+ ! R indichi il costo c (x) necessario per produrre la quantit x di
output. Supponiamo il produttore voglia valutare limpatto sui costi di una variazione
x nelloutput prodotto. Per esempio, se x = 100 e x = 3, si deve valutare la
ricaduta sui costi di una variazione positiva, ossia di un incremento, di 3 unit di
output rispetto allattuale produzione di 100 unit.
La variazione x determina una variazione

c = c (x + x) c (x)

del costo. Se x una variazione discreta non nulla, ossia

x 2 (Z f0g) = f ; 3; 2; 1; 1; 2; 3; g;

il costo medio di ogni unit aggiuntiva di output in x dato da


c c (x + x) c (x)
= : (18.1)
x x
Il rapporto c= x, detto rapporto incrementale, fondamentale per valutare limpatto
della variazione x sul costo della quantit prodotta. Illustriamolo con la seguente
tabella, in cui c (x) =x indica il costo medio (in euro) di ogni unit prodotta:
c(x) c
x c (x) x x

100 4:494 44; 94


4:500 4:500 4:494
102 4:500 102
' 44; 11767 2
=3
4:510 4:510 4:500
105 4:510 105
' 42; 95238 3
' 3; 33333
4:515 4:515 4:510
106 4:515 106
' 42; 59434 1
= 5:

Come si vede, al crescere della produzione, mentre il costo medio scende, il rapporto

579
580 CAPITOLO 18. DERIVATE

incrementale sale. Ci signica che il costo medio di ogni unit aggiuntiva cresce e
quindi aumentare la produzione , al margine, via via pi costoso per il produttore.
In particolare, lultima unit aggiuntiva ha determinato un aumento dei costi di 5
euro e quindi per il produttore tale aumento nella produzione conveniente se (e solo
se) vi un aumento almeno uguale anche nel rapporto incrementale dei ricavi che
indicheremo con R (x), ossia nel ricavo di ogni unit aggiuntiva:

R R (x + x) R (x)
= : (18.2)
x x
Aggiungiamo alla tabella due colonne con i possibili ricavi e con i loro rapporti
incrementali:
c(x) c R
x c (x) x x
R (x) x

100 4:494 44; 94 5:000


5:100 5:000
102 4:500 44; 11767 3 5:100 2
' 33; 33333
5:200 5:100
105 4:510 42; 95238 3; 33333 5:200 2
= 50
5:204 5:200
106 4:515 42; 59434 5 5:204 1
=4

Come si vede, i primi due aumenti di produzione sono molto convenienti per il pro-
duttore: il secondo aumento produce un rapporto incrementale dei ricavi pari a 50
euro contro un rapporto incrementale dei costi pari a 3; 33333. Dopo lultimo aumento
di produzione, tale rapporto scende invece a soli 4 euro, inferiore al corrispondente
valore di 5 euro del rapporto incrementale dei costi. Il produttore trover quindi con-
veniente aumentare al produzione no a 105 unit, ma non no a 106. La bont della
scelta confermata dallandamento del protto (x) = R (x) c (x), che per comodit
aggiungiamo alla tabella:
c(x) c R
x c (x) x x
R (x) x
(x)
100 4:494 44; 94 5:000 506
102 4:500 44; 11767 3 5:100 33; 33333 600
105 4:510 42; 95238 3; 33333 5:200 50 690
106 4:515 42; 59434 5 5:204 4 689

Il protto del produttore continua a salire no al livello 105 delloutput prodotto,


ma decresce in caso di ulteriore aumento a 106. Le informazioni incrementali,
quanticate da rapporti incrementali quali (18.1) e (18.2), sono quindi decisive per
il produttore nel valutare le proprie decisioni di produzione, mentre, per esempio,
linformazione su costi o ricavi medi del tutto irrilevante (anzi, in questo caso,
fuorviante: il diminuire nei costi medi pu trarre in inganno).
18.1. DEFINIZIONE 581

Finora abbiamo considerato il rapporto (18.1) per variazioni x discrete. Idealiz-


zando, consideriamo variazioni x 2 R qualsiasi e, in particolare, variazioni sempre
pi piccole, ossia con x ! 0. Il loro limite c0 (x) dato da

c (x + x) c (x)
c0 (x) = lim : (18.3)
x!0 x

Quando esiste nito, c0 (x) chiamato costo marginale in x: esso indica la variazione
nel costo causata da variazioni innitesime di output rispetto alla quantit iniziale
x.

Per una funzione f : (a; b) R ! R il rapporto incrementale (18.1) prende la


forma
f f (x + h) f (x) f (x + h) f (x)
= = ; (18.4)
x (x + h) x h

dove x = h indica una generica variazione, positiva se h > 0 o negativa1 se h < 0.

Denizione 123 Una funzione f : (a; b) R ! R si dice derivabile nel punto


x0 2 (a; b) se il limite
f (x0 + h) f (x0 )
lim (18.5)
h!0 h
esiste nito. Tale limite si dice derivata di f in x0 , e si indica f 0 (x0 ).

Quindi, la derivata non altro che il limite del rapporto incrementale quando esso
esiste ed nito. Altre notazioni usate per la derivata in x0 sono

df
Df (x0 ) e (x0 )
dx

La notazione f 0 (x0 ), che useremo in prevalenza, probabilmente la pi comoda;


useremo talvolta anche le altre due notazioni quando esse risultino particolarmente
e caci2 .
Si noti il duplice requisito che il limite esista e sia nito: se in un punto il limite
del rapporto incrementale (18.5) esiste ma innito, la funzione non ivi derivabile
(si veda lEsempio 333).

1
Si noti che, poich il dominio (a; b) un intervallo aperto, almeno per h su cientemente piccolo,
si ha x + h 2 (a; b).
2
Luso di una determinata notazione per un ente matematico questione di comodit e di e cacia,
requisiti che non sempre ununica notazione soddisfa al meglio in ogni contesto in cui usato lente
matematico. Per questa ragione, a volte comodo avere a disposizione pi notazioni.
582 CAPITOLO 18. DERIVATE

18.1.1 Osservazioni
(i) Nelle applicazioni le due variabili y e x che compaiono in una funzione y = f (x)
hanno un signicato concreto e sono entrambe misurate rispetto a una loro unit di
misura (e, kg, litri, anni, miglia, parsec, ecc.): se indichiamo con T lunit di misura
della variabile dipendente y e S lunit di misura della variabile indipendente x, i
loro rapporti incrementali y= x, e quindi la derivata (se esiste), sono allora espressi
nellunit di misura T =S.
Per esempio, consideriamo la funzione che esprime il protto y al variare della
quantit prodotta x di una merce: poniamo che si esprima il protto in e e la quantit
prodotta in quintali. La derivata della funzione di domanda allora espressa in e/q
cio in euro al quintale.
Ne discende che la diusa pratica di rappresentare su uno stesso graco una fun-
zione e la sua derivata scorretta quando le due funzioni hanno diverse unit di
misura.

(ii) Il pi classico esempio di derivata proviene dalla sica: sia t il tempo e s lo spazio
percorso da un oggetto mobile. La funzione s (t) indichi lo spazio complessivamente
percorso no al tempo t. Il suo rapporto incrementale s= t immediatamente
interpretabile come velocit media in un intervallo di lunghezza t di tempo e quindi
la sua derivata in un punto t0 come velocit istantanea in t0 .
Si osservi che, se lo spazio misurato in km e il tempo in ore, la velocit in km/h,
cio in chilometri allora3 .

(iii) La notazione df =dx (o lequivalente dy=dx) vuol ricordare che la derivata un


limite di rapporti. Si badi per che df =dx semplicemente un simbolo e non un
eettivo rapporto (infatti il limite di rapporti); purtuttavia a livello euristico spesso
si tratta come un eettivo rapporto (si veda, per esempio, lOfB sulla Regola della
catena nella Sezione 18.8). Naturalmente, lintuizione euristica devessere poi vericata
in modo formale.

18.2 Interpretazione geometrica


La derivata ha unimportante interpretazione geometrica. Dati una funzione f :
(a; b) R ! R e un punto x0 2 (a; b), consideriamo la retta passante per i punti
(x0 ; f (x0 )) e (x0 + h; f (x0 + h)), dove h 6= 0 una variazione qualsiasi. Assumiamo,
per esempio, h > 0, ma analoghe considerazioni valgono per h < 0. Lequazione di
tale retta (il cui graco riportato in gura)

3
Il tachimetro di unautomobile mostra al guidatore proprio la derivata (in ogni istante) dello
spazio percorso al variare del tempo.
18.2. INTERPRETAZIONE GEOMETRICA 583

y
5

f(x +h)
4 0

3
f(x )
0
2

0
O a x x +h b x
0 0
-1
-1 0 1 2 3 4 5 6

si determina risolvendo il sistema


(
f (x0 ) = mx0 + q
:
f (x0 + h) = m (x0 + h) + q
Facendo qualche calcolo si ottiene
f (x0 + h) f (x0 )
y = f (x0 ) + (x x0 ) ; (18.6)
h
che quindi lequazione della retta passante per i punti (x0 ; f (x0 )) e (x0 + h; f (x0 + h)).
Prendendone il limite per h ! 0, si ha
y = f (x0 ) + f 0 (x0 ) (x x0 ) ;
che lequazione della retta tangente al graco di f nel punto (x0 ; f (x0 )) 2 Gr f : per
h che tende a 0, la retta (18.6) tende alla retta tangente, e la derivata f 0 (x0 ) ne la
pendenza.
Geometricamente, la derivata pu quindi vedersi come la pendenza della retta
tangente nel punto (x0 ; f (x0 )). Si noti che la retta tangente (18.6) pu vedersi come
unapprossimazione locale della funzione f in x0 . Losservazione sar sviluppata, con
la fondamentale nozione di dierenziale, nella Sezione 18.11.

Vediamo alcuni esempi.

Esempio 330 Consideriamo la funzione f : R ! R data da f (x) = x2 1. In un


generico punto x 2 R si ha

0 f (x + h) f (x) (x + h)2 + 1 (x2 + 1)


f (x) = lim = lim =
h!0 h h!0 h
2
h + 2xh
= lim = lim (h + 2x) = 2x:
h!0 h h!0
584 CAPITOLO 18. DERIVATE

La derivata esiste in ogni x 2 R ed data da 2x. Per esempio, la derivata in x = 1


f 0 (1) = 2, con retta tangente
y = f (1) + f 0 (1) (x 1) = 2x 2
nel punto (1; 0) 2 Gr f .

La derivata nellorigine f 0 (0) = 0, con retta tangente


y = f (0) + f 0 (0) x = 1
nel punto (0; 1) 2 Gr f .

In questo caso la retta tangente orizzontale (costante) e vale sempre 1. N


Esempio 331 Consideriamo una funzione f : R ! R costante, ossia f (x) = k per
ogni x 2 R. Per ogni h 6= 0 si ha
f (x + h) f (x) k k
= =0
h h
18.2. INTERPRETAZIONE GEOMETRICA 585

e quindi f 0 (x) = 0 per ogni x 2 R. La derivata di una costante zero. N


Esempio 332 Consideriamo la funzione f : R f0g ! R data da f (x) = 1=x. In un
generico punto x 2 R f0g si ha
1 1
f (x + h) f (x) x (x + h)
0
f (x) = lim = lim x+h x = lim =
h!0 h h!0 h h!0 hx (x + h)

h 1 1
= lim = lim = :
h!0 hx (x + h) h!0 x (x + h) x2
La derivata esiste in ogni x 6= 0 ed data da x 2 . Per esempio, la derivata in x = 1
f 0 (1) = 1, e in 2 f 0 ( 2) = 1=4. N
Esempio 333 Consideriamo la funzione f : R ! R data da
( p
x se x 0
f (x) = p :
x se x < 0
Gracamente,

Consideriamo lorigine, ossia x = 0. Per h > 0 si ha


p
f (x + h) f (x) h 1
= = p ! +1
h h h
e, per h < 0, si ha
p p
f (x + h) f (x) h h 1
= = =p ! +1:
h h h h
Quindi
f (x + h) f (x)
lim = +1
h!0 h
e, non essendo il limite nito, la funzione non derivabile in x = 0. N
586 CAPITOLO 18. DERIVATE

18.3 Funzione derivata


Data una funzione f : (a; b) R ! R, linsieme D (a; b) dei punti del dominio ove
f derivabile detto dominio di derivabilit di f . Negli Esempi 330-332 il dominio
della funzione coincide con quello di derivabilit. Invece, nellEsempio 333 il dominio
della funzione R, mentre il dominio di derivabilit R f0g.
Possiamo allora introdurre la

Denizione 124 Sia f : (a; b) R ! R una funzione con dominio di derivabilit


D (a; b). La funzione f : D ! R che a ogni x 2 D associa la derivata f 0 (x) detta
0

funzione derivata.

La funzione derivata descrive quindi la derivata nei dierenti punti del dominio
di derivabilit, dando cos conto del comportamento complessivo della derivata di f .
Tornando agli esempi appena visti,

(i) se f (x) = x2 1, la funzione derivata f 0 : R ! R data da f 0 (x) = 2x;

(ii) se f (x) = k, la funzione derivata f 0 : R ! R data da f 0 (x) = 0;

(iii) se f (x) = 1=x = x 1 , la funzione derivata f 0 : R f0g ! R data da f 0 (x) =


x 2.

La nozione di funzione derivata permette di inquadrare meglio i calcoli che abbiamo


fatto negli esempi dellultima sezione: calcolare la derivata di una funzione f in un
generico punto x del dominio equivale a calcolare la sua funzione derivata f 0 . Quando
abbiamo stabilito che la derivata di f (x) = x2 in un punto qualsiasi x 2 R data da
2x, ne abbiamo in realt determinato la funzione derivata data da f 0 (x) = 2x, con
f 0 : R ! R.

Esempio 334 Siano r : R+ ! R la funzione di ricavo e c : R+ ! R la funzione di


costo di un produttore (si veda la Sezione 17.1.3). La funzione derivata r0 : D R+ !
R detta funzione di ricavo marginale, mentre la funzione derivata c0 : D R+ ! R
detta funzione di costo marginale. N

Se la funzione derivata f 0 continua su un sottoinsieme E del dominio di derivabil-


it D si dice che f derivabile con continuit su E. In particolare, quando D = E, la
funzione si dice derivabile con continuit, senza ulteriori specicazioni. Linsieme di
tutte le funzioni derivabili con continuit su un insieme E in R si indica con C 1 (E).

18.4 Derivate unilaterali


Finora abbiamo considerato il limite bilaterale (18.5) del rapporto incrementale.
talvolta utile considerare separatamente variazioni positive e negative di h. A tal ne,
introduciamo le nozioni di derivata destra e sinistra.
18.4. DERIVATE UNILATERALI 587

Denizione 125 Una funzione f : (a; b) R ! R si dice derivabile da destra nel


punto x0 2 (a; b) se esiste nito il limite unilaterale

f (x0 + h) f (x0 )
lim+ (18.7)
h!0 h

e derivabile da sinistra in x0 2 (a; b) se esiste nito il limite unilaterale

f (x0 + h) f (x0 )
lim : (18.8)
h!0 h

Quando esiste nito, il limite (18.7) e si dice derivata destra di f in x0 , e si indica


f+0 (x0 ). Analogamente, quando esiste nito, il limite (18.8) si dice derivata sinistra di
f in x0 , e si indica f 0 (x0 ). Grazie alla Proposizione 164, si ha:

Proposizione 308 Una funzione f : (a; b) R ! R derivabile in x0 2 (a; b) se e


solo se derivabile sia da destra sia da sinistra, con f+0 (x0 ) = f 0 (x0 ). In tal caso,

f 0 (x0 ) = f+0 (x0 ) = f 0 (x0 ) :

Vediamo un semplice esempio nel quale le derivate unilaterali sono cruciali.

Esempio 335 Sia f : R ! R data da f (x) = jxj. Nel punto x0 = 0 si ha

f (x0 + h) f (x0 ) jhj 1 se h > 0


= =
h h 1 se h < 0

Il limite bilaterale del rapporto incrementale non esiste e quindi la funzione non
derivabile in 0. Tuttavia, esistono le derivate unilaterali; in particolare

f (x0 + h) f (x)
f+0 (0) = lim+ = 1;
h!0 h
f (x0 + h) f (x)
f 0 (0) = lim = 1:
h!0 h

Il lettore pu inne vericare che la funzione derivabile in ogni punto x 6= 0, con


(
1 se x > 0
f 0 (x) = :
1 se x < 0

H
588 CAPITOLO 18. DERIVATE

18.5 Derivabilit e continuit


Una prima importante propriet delle funzioni derivabili la loro continuit.

Proposizione 309 Una funzione f : (a; b) R ! R derivabile in un punto x 2 (a; b)


ivi continua.

Dim. Bisogna dimostrare che

lim f (x) = f (x0 )


x!x0

Siccome f derivabile in R, il limite del rapporto incrementale esiste nito ed pari


a f 0 (x0 ):
f (x0 + h) f (x0 )
lim = f 0 (x0 ):
h!0 h
Riscriviamo il limite ponendo x = x0 + h, sicch h = x x0 , e osservando che per h
che tende a 0 si ha che x tende a x0 :

f (x) f (x0 )
lim = f 0 (x0 ):
x!x0 x x0
Si ha quindi:

f (x) f (x0 ) f (x) f (x0 )


lim (f (x) f (x0 )) = lim (x x0 ) = lim lim (x x0 )
x!x0 x!x0 x x0 x!x0 x x0 x!x0
0 0
= f (x0 ) lim (x x0 ) = f (x0 ) 0 = 0
x!x0

dove lultima eguaglianza vale poich f 0 (x0 ) esiste nito. Si perci dimostrato che
limx!x0 (f (x) f (x0 )) = 0. Daltra parte:

0 = lim (f (x) f (x0 )) = lim f (x) lim f (x0 ) = lim f (x) f (x0 );
x!x0 x!x0 x!x0 x!x0

e quindi limx!x0 f (x) = f (x0 ), come desiderato.

La derivabilit in un punto implica quindi la continuit (nello stesso punto). Il


converso falso: la funzione valore assoluto f (x) = jxj continua in x = 0, ma non
ivi derivabile, come gi s visto nellEsempio 335. In altre parole, la continuit
condizione necessaria, ma non su ciente, per la derivabilit.

Tra le altre cose, la Proposizione 309 e lEsempio 335 permettono di individuare


tre possibili cause (che non sono le uniche) di non derivabilit in un punto x:

(i) f non continua in x;


18.6. DERIVATE DELLE FUNZIONI ELEMENTARI 589

(ii) f ha un punto angoloso in x, ossia esistono le derivate unilaterali f+0 (x) e


f 0 (x), ma f+0 (x) 6= f 0 (x);

(iii) f ha la tangente verticale in x; per esempio, la funzione


( p
x se x 0
f (x) = p
x se x < 0

vista nellEsempio 333 in x = 0 ha la tangente verticale poich limh!0 f (h) =h =


+1.

Come s detto, le tre indicate non sono le uniche cause di non derivabilit. Per
esempio la funzione
8
< x sin 1 se x 6= 0
f (x) = x
:
0 se x = 0
ovunque continua: infatti limx!0 x sin 1=x = 0 perch jsin 1=xj 1 e quindi x
x sin 1=x x. In x0 = 0 non derivabile perch

f (x0 + h) f (x0 ) h sin h1 0 1


lim = lim = lim sin
h!0 h h!0 h h!0 h

non esiste. Si osservi che il punto non angoloso e che in esso non vi tangente
verticale. Il motivo della non derivabilit risiede nella circostanza che f , in qualsiasi
intorno di x0 = 0, compie innite oscillazioni (che fanno s che il rapporto incrementale
sin 1=h oscilli innite volte tra 1 e 1). Si noti che in questo esempio non esistono
neanche le derivate unilaterali f+0 (x) e f 0 (x).

18.6 Derivate delle funzioni elementari


Calcoliamo le derivate di alcune classiche funzioni elementari. Cominciamo dalle
potenze.

Proposizione 310 La funzione potenza f : R ! R data da f (x) = xn per n 2 N


derivabile in ogni x 2 R, con funzione derivata f 0 : R ! R data da

f 0 (x) = nxn 1 :

Per esempio, la funzione f (x) = x5 ha funzione derivata f 0 (x) = 5x4 .


590 CAPITOLO 18. DERIVATE

Dim. Per la formula del binomio di Newton, si ha

f (x + h) f (x) (x + h)n xn
f 0 (x) = lim = lim
h!0
P h h!0 h
n n! n k k n
k=0 k!(n k)!
x h x
= lim
h!0 h
n n 1 n(n 1) n 2 2
x + nx h+ 2
x h + + nxhn 1
+ hn xn
= lim
h!0 h
n (n 1) n 2
= lim nxn 1
+ x h+ + nxhn 2
+ hn 1
= nxn 1 ;
h!0 2

come desiderato.

Consideriamo ora le funzioni esponenziali.

x
Proposizione 311 La funzione esponenziale f : R ! R data da f (x) = , con
> 0, derivabile in ogni x 2 R, con funzione derivata f 0 : R ! R data da

f 0 (x) = x
log :

Dim. Si ha
x+h x x h
f (x + h) f (x) 1
f 0 (x) = lim = lim = lim
h!0 h h!0 h h!0 h
h
1
= x lim = x log ;
h!0 h
dove lultima uguaglianza segue dal limite notevole (12.28).

In particolare, dex =dx = ex , ossia la funzione derivata della funzione esponenziale


la stessa funzione esponenziale. questa una notevolissima propriet di invarianza
della funzione esponenziale.

Chiudiamo con le funzioni trigonometriche.

Proposizione 312 La funzione f : R ! R data da f (x) = sin x derivabile in ogni


x 2 R, con funzione derivata f 0 : R ! R data da

f 0 (x) = cos x:

La dimostrazione si basa sul classico risultato di trigonometria secondo il quale

sin (a + b) = sin a cos b + cos a sin b: (18.9)


18.7. ALGEBRA DELLE DERIVATE 591

Dim. Grazie alla formula (18.9), si ha

f (x + h) f (x) sin (x + h) sin x


f 0 (x) = lim = lim
h!0 h h!0 h
sin x cos h + cos x sin h sin x
= lim
h!0 h
sin x (cos h 1) + cos x sin h
= lim
h!0 h
cos h 1 sin h
= sin x lim + cos x lim = cos x;
h!0 h h!0 h

dove lultima uguaglianza segue dai limiti notevoli (12.27) per cos x e (12.26) per sin x.

In modo analogo si dimostra che la funzione f : R ! R data da f (x) = cos x


derivabile in ogni x 2 R, con funzione derivata f 0 : R ! R data da

f 0 (x) = sin x: (18.10)

18.7 Algebra delle derivate


Nella Sezione 7.3.2 avevamo studiato lalgebra delle funzioni, ossia le somme, i prodotti
e i rapporti tra esse. Vediamo ora come la derivazione si comporta rispetto a queste
operazioni. Cominciamo con la somma.

Proposizione 313 Siano f; g : (a; b) ! R due funzioni derivabili in x 2 (a; b). La


funzione somma f + g : (a; b) ! R, con ; 2 R, derivabile in x, con

( f + g)0 (x) = f 0 (x) + g 0 (x) . (18.11)

Per = = 1 abbiamo la somma in senso stretto, ma il risultato vale per generici


scalari e . In particolare, la derivata di f (x) f 0 (x).

Dim. Si ha
( f + g) (x + h) ( f + g) (x)
( f + g)0 (x) = lim =
h!0 h
f (x + h) f (x) g (x + h) g (x)
= lim + =
h!0 h h
f (x + h) f (x) g (x + h) g (x)
= lim + lim =
h!0 h h!0 h
= f 0 (x) + g 0 (x) ;
592 CAPITOLO 18. DERIVATE

come desiderato.

La somma si comporta quindi in modo molto semplice rispetto alla derivazione:


con uno slogan, possiamo dire che la derivata di una somma la somma delle derivate4 .
Pi sottile il caso del prodotto di funzioni.

Proposizione 314 Siano f; g : (a; b) ! R due funzioni derivabili in x 2 (a; b). La


funzione prodotto f g : (a; b) ! R derivabile in x, con

(f g)0 (x) = f 0 (x) g (x) + f (x) g 0 (x) : (18.12)

Dim. Si ha

(f g) (x + h) (f g) (x) f (x + h) g (x + h) f (x) g (x)


(f g)0 (x) = lim = lim
h!0 h h!0 h
f (x + h) g (x + h) f (x) g (x + h) + f (x) g (x + h) f (x) g (x)
= lim
h!0 h
g (x + h) (f (x + h) f (x)) + f (x) (g (x + h) g (x))
= lim
h!0 h
g (x + h) (f (x + h) f (x)) f (x) (g (x + h) g (x))
= lim +
h!0 h h
g (x + h) (f (x + h) f (x)) f (x) (g (x + h) g (x))
= lim + lim
h!0 h h!0 h
f (x + h) f (x) g (x + h) g (x)
= lim g (x + h) lim + f (x) lim
h!0 h!0 h h!0 h
= g (x) f 0 (x) + f (x) g 0 (x) ,

come desiderato. Nellultimo passaggio limh!0 g (x + h) = g (x) grazie alla continuit


di g garantita dalla sua derivabilit.

La derivata del prodotto non quindi il prodotto delle derivate, ma data dalla
pi sottile regola (18.12). Unanaloga regola, mutatis mutandis, vale per il rapporto.

Proposizione 315 Siano f; g : (a; b) ! R due funzioni derivabili in x 2 (a; b), con
g (x) 6= 0. La funzione rapporto f =g : (a; b) ! R derivabile in x, con
0
f f 0 (x) g (x) f (x) g 0 (x)
(x) = : (18.13)
g g (x)2
4
Ovviamente non vale il converso: se la somma di due funzioni derivabile, non detto che le
singole funzioni lo siano (per esempio, f (x) = jxj e g (x) = jxj). La stessa osservazione vale anche
per le operazioni di moltiplicazione e di divisione.
18.7. ALGEBRA DELLE DERIVATE 593

Dim. Cominciamo col caso in cui f sia costante e pari a 1. Si ha


1 1
0
1 g (x + h) g (x) g (x) g (x + h)
(x) = lim = lim
g h!0 h h!0 g (x) g (x + h) h

1 g (x) g (x + h)
= lim
g (x) h!0 g (x + h) h
1 g (x + h) g (x) 1 g 0 (x)
= lim lim = :
g (x) h!0 h h!0 g (x + h) g (x)2

Consideriamo ora f : (a; b) ! R qualunque. Grazie alla (18.12) si ha


0 0 0
f 1 1 1
(x) = f (x) = f 0 (x) (x) + f (x) (x)
g g g g
f 0 (x) g 0 (x) f 0 (x) g 0 (x)
= + f (x) = f (x)
g (x) g (x)2 g (x) g (x)2
f 0 (x) g (x) f (x) g 0 (x)
= ;
g (x)2

come desiderato.

Esempio 336 Siano f; g : R ! R date da f (x) = x3 e g (x) = sin x. Si ha

(f + g)0 (x) = 3x2 + cos x 8x 2 R;

e
(f g)0 (x) = 3x2 sin x + x3 cos x 8x 2 R;
nonch
0
f 3x2 sin x x3 cos x
(x) = 8x 2 R fn : n 2 Zg :
g sin2 x
Nella formula del rapporto, fn : n 2 Zg linsieme dei punti f ; 2 ; ; 0; ; 2 ; g
dove la funzione g (x) = sin x si annulla. N

Esempio 337 Sia f : R ! R data da f (x) = tan x. Poich tan x = sin x= cos x, si ha

f 0 (x) = 1 + tan2 x

come il lettore pu vericare N

Esempio 338 La derivata della funzione data da f (x) = x2 = x x si pu calcolare


utilizzando la derivata di un prodotto: f 0 (x) = 1 x + x 1 = 2x.
594 CAPITOLO 18. DERIVATE

Nello stesso modo si pu mostrare per induzione nita che la derivata di xn nxn 1 .
Infatti, il caso n = 1 ovvio. Supponiamo che la regola valga per n 1, cio che la
derivata di xn 1 sia (n 1) xn 2 . Grazie alla regola del prodotto si ha
dxn d (xn 1 x)
= = (n 1) xn 2
x + xn 1
1 = (n 1) xn 1
+ xn 1
= nxn 1
dx dx
come desiderato. N
Esempio 339 Sia c : R+ ! R una funzione di costo, con funzione di costo marginale
c0 : D R+ ! R. Consideriamo la funzione di costo medio cm : (0; +1) ! R data da
c (x)
cm (x) =
x
Grazie alla regola del rapporto, si ha
c(x)
xc0 (x) c (x) x c0 (x) x c0 (x) cm (x)
c0m(x) = = =
x2 x2 x
Poich x > 0, si ha
c0m (x) 0 () c0 (x) cm (x) 0 () c0 (x) cm (x) (18.14)
Dunque, la variazione nei costi medi positiva in un punto x se e solo se ivi i costi
marginali sono maggiori di quelli medi. In altre parole, i costi medi continuano a salire
ntanto che sono inferiori ai costi marginali.
Lo stesso ragionamento vale pi in generale per ogni funzione f : R+ ! R che
esperime, al variare di x 0, una grandezza economica: ricavo, protto, ecc.. La
funzione fm : (0; +1) ! R denita da
f (x)
fm (x) =
x
la corrispondente grandezza media(ricavo medio, protto medio, ecc.), mentre la
funzione derivata f 0 (x) esprime la grandezza marginale (ricavo marginale, protto
marginale, ecc.). In ogni x > 0 la funzione f 0 (x) geometricamente interpretabile
come la pendenza della retta tangente al graco di f in x, mentre fm (x) la pendenza
della retta (secante) passante per lorigine e per il punto di ascissa x.
18.8. LA REGOLA DELLA CATENA 595

Dal punto di vista geometrico, la (18.14) aerma che la variazione della media fm
0
positiva, cio fm 0, ntanto che la pendenza della retta tangente maggiore di
quella secante. N

18.8 La regola della catena


Consideriamo ora la derivazione di funzioni composte g f . In altre parole, come
si pu determinare la derivata della funzione composta g f a partire dalle derivate
delle funzioni f e g? La risposta alla domanda la formula (18.15), detta regola della
catena, molto importante nelle applicazioni.
Proposizione 316 Siano f : (a; b) ! R e g : (c; d) ! R due funzioni con Im f
(c; d). Se f derivabile in x 2 (a; b) e g derivabile in f (x), la funzione composta
g f : (a; b) ! R derivabile in x, e risulta
(g f )0 (x) = g 0 (f (x)) f 0 (x) : (18.15)
Dim. Si ha
g (f (x + h)) g (f (x)) f (x + h) f (x)
(g f )0 (x) = lim
h!0 f (x + h) f (x) h
g (f (x + h)) g (f (x)) f (x + h) f (x)
= lim lim
h!0 f (x + h) f (x) h!0 h
g (f (x) + k) g (f (x)) f (x + h) f (x)
= lim lim = g 0 (f (x)) f 0 (x) ,
k!0 k h!0 h
dove k = f (x + h) f (x), tale che k ! 0 se e solo se h ! 0 poich f , essendo
derivabile, continua in x.
La regola della catena conduce quindi al prodotto delle derivate g 0 e f 0 , dove g 0 ha
per come argomento limmagine f (x).
Esempio 340 Siano f; g : R ! R date da f (x) = x3 e g (x) = sin x. Si ha, in ogni
x 2 R, (g f ) (x) = sin x3 e (f g) (x) = sin3 x e quindi
(g f )0 (x) = g 0 (f (x)) f 0 (x) = cos x3 3x2 = 3x2 cos x3
e
(f g)0 (x) = f 0 (g (x)) g 0 (x) = 3 sin2 x cos x
N
Esempio 341 Siano f : (a; b) ! R una funzione qualsiasi, derivabile in ogni x 2 (a; b)
e g (x) = ex . Si ha
(g f )0 (x) = g 0 (f (x)) f 0 (x) = ef (x) f 0 (x) : (18.16)
x4
e la (18.16) diventa (g f )0 (x) = 4x3 ex .
4
Per esempio, se f (x) = x4 , (g f ) (x) = e
N
596 CAPITOLO 18. DERIVATE

La regola della catena5 molto utile nel calcolare la derivata di funzioni che possono
scriversi come composizione di opportune funzioni.

Esempio 342 Sia ' : R ! R data da ' (x) = sin3 (9x + 1). Per calcolare '0 (x)
opportuno vedere ' come
' = f g h; (18.17)
dove f : R ! R data da f (x) = x3 , g : R ! R data da g (x) = sin x, e h : R ! R
data da h (x) = 9x + 1. Grazie alla regola della catena si ha

'0 (x) = f 0 ((g h) (x)) (g h)0 (x) = f 0 ((g h) (x)) g 0 (h (x)) h0 (x)
= 3 sin2 (9x + 1) cos (9x + 1) 9 = 27 sin2 (9x + 1) cos (9x + 1) :

Vedere la funzione ' nella forma (18.17) ne quindi semplica il calcolo della derivata.
N

OfB. Se scriviamo z = f (x) e y = g (z) risulta evidentemente y = g (f (x)). Ci che


abbiamo dimostrato si pu sintetizzare aermando che

dy dy dz
= ;
dx dz dx

che si ricorda piuttosto bene (immaginando di aver semplicato dz che compare a


numeratore e a denominatore): in questo caso, il simbolo

d
d
si comporta come un eettivo rapporto. H

18.9 Derivata di funzioni inverse


Teorema 317 Sia f : (a; b) ! R una funzione iniettiva derivabile in x0 2 (a; b) con
f 0 (x0 ) 6= 0. La funzione inversa f 1 esiste ed derivabile in y0 = f (x0 ) e risulta

1 0 1
f (y0 ) = : (18.18)
f0 (x0 )
5
Qualcuno la chiama regola della cipollaperch la derivata di una funzione composta si ottiene
sbucciando progressivamente la funzione dallesterno:
0 0
(f g h ) = (f (g (h ( )))) = f 0 (g (h ( ))) g 0 (h ( )) h0 ( ) :
18.9. DERIVATA DI FUNZIONI INVERSE 597

In breve, la derivata della funzione inversa di f (in y0 ) il reciproco della derivata


di f (in x0 ).

Sarebbe bello invocare la regola della catena e scrivere che da y0 = (f f 1 ) (y0 )


0 0 0
segue 1 = f 0 (f 1 (y0 )) (f 1 ) (y0 ) e quindi 1 = f 0 (x0 ) (f 1 ) (y0 ), cio che (f 1 ) (y0 ) =
1=f (x0 ). Purtroppo non possiamo utilizzare tale regola perch non siamo (ancora) cer-
ti che f 1 sia derivabile: infatti la prima conclusione (da dimostrare) che la funzione
inversa derivabile.

Dim. Poniamo f (x0 + h) = y0 +k: si osservi che, per la continuit di f , quando h ! 0


anche k ! 0. Per la denizione di inversa, x0 = f 1 (y0 ) e x0 +h = f 1 (y0 + k): perci
h = f 1 (y0 + k) f 1 (y0 ). Per ipotesi esiste il

f (x0 + h) f (x0 )
lim = f 0 (x0 ) ;
h!0 h
ma
f (x0 + h) f (x0 ) y0 + k y0 1
= 1
= 1 1
h f (y0 + k) f 1 (y0 ) f (y0 + k) f (y0 )
k
e quindi, purch f 0 (x0 ) 6= 0, esiste anche il limite del rapporto
1 1
f (y0 + k) f (y0 )
k
per k ! 0 ed il reciproco del precedente:

1 0 1
f (y0 ) = :
f0 (x0 )

La derivata della funzione inversa si ottiene quindi dalla frazione unitaria in cui al
denominatore la derivata f 0 ha come argomento la controimmagine f 1 (y).

Esempio 343 Sia f : R ! R data da f (x) = ex , cosicch f 1 : R++ ! R data


dalla funzione logaritmica f 1 (y) = log y. In altre parole, ex = y se e solo se x = log y.
Dato che dex =dx = ex = y, risulta

d log y 1 1 1 1
= 0 = x = log y =
dy f (x) e e y

per ogni y 2 R++ . N


598 CAPITOLO 18. DERIVATE

Questo esempio e la Regola della catena implicano limportante formula


d log f (x) f 0 (x)
=
dx f (x)
per funzioni f derivabili e strettamente positive. la versione logaritmica della (18.16).
Grazie alla regola della catena e a quanto visto nellEsempio 343, si pu dare
unimportante generalizzazione della Proposizione 310.
Proposizione 318 La funzione potenza f : R ! R data da f (x) = xa con a 2 R
derivabile in ogni x 2 R, con funzione derivata f 0 : R ! R data da
f 0 (x) = axa 1 :
Dim. Si ha
a
xa = elog x = ea log x : (18.19)
Ponendo f (x) = ex e g (x) = a log x, da (18.19) segue che
d (xa ) a a
= f 0 (g (x)) g 0 (x) = ea log x = xa = axa 1 ;
dx x x
come desiderato.
Vediamo un altro paio di esempi.
1
Esempio 344 Sia f : R ! R data da f (x) = sin x, cosicch f : [ 1; 1] ! R data
da f 1 (y) = arcsin y. Dalla (18.18) si ha
d sin x p p
= cos x = 1 sin2 x = 1 y 2
dx
e quindi
d arcsin y 1
=p
dy 1 y2
per ogni y 2 [ 1; 1]. Nello stesso modo si prova che
d arccos y 1
= p
dy 1 y2
per ogni y 2 [ 1; 1] . N
1
Esempio 345 Sia f : R ! R data da f (x) = tan x, cosicch f : R ! R data da
f 1 (y) = arctan y. Dalla (18.18) si ha
d tan x
= 1 + tan2 x = 1 + y 2
dx
e quindi
d arctan y 1
=
dy 1 + y2
per ogni y 2 R. N
18.10. FORMULARIO 599

Releghiamo in un esempio la derivata di una funzione con base ed esponente


variabili.

Esempio 346 Sia F : R ! R la funzione data da F (x) = [f (x)]g(x) con f : R ! R+


e g : R ! R. Visto che si pu scrivere
g(x)
F (x) = elog[f (x)] = eg(x) log f (x) ;

risulta, applicando la regola della catena,

f 0 (x)
F 0 (x) = eg(x) log f (x) D [g (x) log f (x)] = F (x) g 0 (x) log f (x) + g (x) :
f (x)

Per esempio, la derivata di F (x) = xx

dxx 1
= xx log x + x = xx (1 + log x) ;
dx x
2
mentre la derivata di F (x) = xx
2
dxx 2 1 2 +1
= xx 2x log x + x2 = xx (1 + 2 log x) :
dx x

N
x
Il lettore provi a calcolare la derivata di F (x) = xx .

1
OfB. Indicando con y = f (x) una funzione e con x = f (x) la sua inversa, possiamo
riassumere ci che abbiamo visto scrivendo
dx 1
= :
dy dy
dx

Ancora il simbolo d =d si comporta come un eettivo rapporto. H

18.10 Formulario
La regola della catena permette di ampliare notevolmente la portata dei risultati sulle
derivate di funzioni elementari visti nella Sezione 18.6. Gi nellEsempio 341 avevamo
visto come calcolare la derivata di una generica funzione ef (x) , molto pi generale
dellesponenziale ex della Proposizione 311.
In modo analogo si possono generalizzare tutti i risultati sulla derivazione di fun-
zioni elementari visti sinora. Riassumiamo il tutto con due tabelle: la prima riporta le
600 CAPITOLO 18. DERIVATE

derivate di funzioni elementari, mentre la seconda ne contiene la generalizzazione che


si ottiene grazie alla regola della catena.

f f0 Riferimento
k 0 Esempio 331
xa axa 1 Prop. 318
ex ex Prop. 311
x x
log Prop. 311
1
log x Esempio 343
x
1
loga x Esercizio per lettore
x log a
sin x cos x Prop. 312
cos x sin x Osservazione 18.10
1
tan x = 1 + tan2 x Esercizio per il lettore
cos2 x
1
cotanx = (cotan2 x) Esercizio per il lettore
sin2 x
1
arcsin x p Esercizio 344
1 x2
1
arccos x p Esercizio per il lettore
1 x2
1
arctan x Esercizio 345
1 + x2
1
arccotanx Esercizio per il lettore
1 + x2 (18.20)

bene mandare a memoria la tabella che precede. Purtroppo, in questo caso


il minore dei mali: rifarsi i calcoli volta per volta sarebbe ancora pi dispendioso.
la stessa economia di tempo e di pensiero che, a suo tempo, ha costretto tutti noi a
mandare a memoria le tabelline.

Vediamone anche la versione generale, ottenuta grazie alla regola della catena.
Nella tabella f sono le funzioni elementari della tabella precedente, mentre g una
18.11. DIFFERENZIABILIT E LINEARIT 601

funzione (derivabile) qualsiasi.

f g (f g)0 Immagine di g
a a 1
g (x) ag (x) g 0 (x) A R
g(x) 0 g(x)
e g (x) e A R
g(x)
g 0 (x) g(x) log A R
g 0 (x)
log g (x) A R++
g (x)
g 0 (x) 1
loga g (x) A R++
g (x) log a
sin g (x) g 0 (x) cos g (x) A R
cos g (x) g 0 (x) sin g (x) A R
g 0 (x)
tan g (x) = g 0 (x) (1 + tan2 g (x)) A R
cos2 g (x)
g 0 (x)
arcsin g (x) p A [0; 1]
1 g 2 (x)
g 0 (x)
arccos g (x) p A [0; 1]
1 g 2 (x)
g 0 (x)
arctan g (x) A R
1 + g 2 (x)
(18.21)

Quasi tutte le derivate sono calcolabili usando in modo appropriato questultima


tabella.

Terminologia. Una funzione denita su un intervallo chiuso pu al pi possedere


derivate unilaterali negli estremi. Qualora una funzione risultasse derivabile in tutti i
punti interni di tale intervallo e unilateralmente derivabile nei suoi estremi, diremo che
essa derivabile sullintervallo chiuso. Seguiremo la stessa convenzione, gi utilizzata
per i limiti, anche per gli intervalli semiaperti e per le unioni di intervalli.

18.11 Dierenziabilit e linearit


Allinizio del capitolo, nellintrodurre la nozione di derivata, abbiamo enfatizzato il
suo signicato come rappresentazione del comportamento incrementale, marginale,
di una funzione scalare f : (a; b) ! R in un punto x0 2 (a; b). La derivata pu essere
vista anche da una diversa prospettiva, come approssimazione lineare dellincremento
della funzione.
602 CAPITOLO 18. DERIVATE

18.11.1 Dierenziale
Un problema fondamentale se sia possibile approssimare una funzione f : (a; b) ! R
localmente, cio in un intorno di un assegnato punto del suo dominio, tramite una
funzione a ne, ossia con una retta. Se ci fosse possibile, potremmo approssimare
localmente funzioni anche molto complicate con la pi semplice delle funzioni, ossia
con la retta.
Per rendere precisa questa idea, dati una funzione f : (a; b) ! R e un punto
x0 2 (a; b), supponiamo che esista una funzione a ne r : R ! R che approssimi f in
x0 secondo la condizione

f (x0 + h) = r (x0 + h) + o (h) per h ! 0 (18.22)

per ogni h tale che x0 + h 2 (a; b), cio per ogni h 2 (x0 a; b x0 ). Quando h = 0,
la condizione di approssimazione locale (18.22) diventa f (x0 ) = r (x0 ): essa richiede
quindi due propriet a una retta r : R ! R a nch si possa considerarla unadeguata
approssimazione di f in x0 . La prima che la retta coincida con f in x0 , ossia
f (x0 ) = r (x0 ): nel punto x0 in esame lapprossimazione deve essere perfetta, priva di
errore. La seconda, e pi importante, che lerrore di approssimazione f (x0 + h)
r (x0 + h) in x0 + h sia o (h), ossia che, allavvicinarsi di x0 + h a x0 , lerrore vada a
zero pi velocemente di h. Il termine o (h) permette di aermare che lapprossimazione
(localmente) molto buona: f (x0 + h) r (x0 + h) tende a zero allavvicinarsi di
x0 + h a x0 con rapidit superiore a h, cio al passo compiuto.

Si noti che f (x0 ) = r (x0 ) implica, grazie alla (15.9) del Capitolo 15,

r (x0 + h) = m (x0 + h) + q = mh + mx0 + q = mh + f (x0 ) :

Se chiamiamo l : R ! R la funzione lineare data da l (h) = mh, la condizione di


approssimazione (18.22) si pu equivalentemente scrivere come

f (x0 + h) f (x0 ) = l (h) + o (h) per h ! 0; (18.23)

dove l (h) = mh lapprossimazione lineare della dierenza f (x0 + h) f (x0 ), con


termine di errore di magnitudo o (h). Con tale scrittura si enfatizza sia la condizione
r (x0 ) = f (x0 ), ossia che la funzione a ne r approssimante abbia valore f (x0 ) in x0 ,
sia la linearit dellapprossimazione della dierenza f (x0 + h) f (x0 ), sia inne la
bont dellapprossimazione: la dierenza f (x0 + h) f (x0 ) l (h) o (h). Lenfasi
molto importante e motiva la seguente denizione.

Denizione 126 Una funzione f : (a; b) ! R si dice dierenziabile in x0 2 (a; b) se


esiste una funzione lineare l : R ! R tale che

f (x0 + h) = f (x0 ) + l (h) + o (h) per h ! 0 (18.24)

per ogni h 2 (x0 a; b x0 ).


18.11. DIFFERENZIABILIT E LINEARIT 603

In altri termini, la denizione richiede che esista un numero m 2 R, indipendente


da h (ma in generale dipendente da x0 ), tale che

f (x0 + h) = f (x0 ) + mh + o (h) per h ! 0:

Quindi, f dierenziabile in x0 se la funzione lineare l : R ! R approssima la


dierenza f (x0 + h) f (x0 ) con un errore che o (h) (ossia che, per h ! 0, va a zero
pi velocemente di h). Equivalentemente, f dierenziabile in x0 se la funzione a ne
r : R ! R data da r (h) = f (x0 ) + l (h) approssima f in x0 secondo la condizione
(18.22).
La funzione lineare l : R ! R in (18.24) si dice dierenziale di f in x0 ed indicato
come df (x0 ) : R ! R. Con tale notazione, la (18.24) diventa

f (x0 + h) = f (x0 ) + df (x0 ) (h) + o (h) per h ! 0: (18.25)

Uninteressante riscrittura della (18.25) si ottiene ponendo h = x x0 , che permette


di esprimere la (18.25) nella forma

f (x) = f (x0 ) + df (x0 ) (x x0 ) + o (x x0 ) per x ! x0 ; (18.26)

che useremo spesso6 .

Denizione 127 Una funzione f : (a; b) ! R dierenziabile in ogni punto di (a; b)


si dice dierenziabile.

OfB. Il concetto di dierenziabilit sancisce che una funzione ben approssimabile


con una funzione a ne (una retta), cio con la pi semplice tra le funzioni, almeno in
prossimit del punto in questione. Lapprossimazione buona soltanto nelle immediate
vicinanze del punto, ma, se ci si allontana un po da esso, in generale essa decade
rapidamente. Tale approssimazione, pur se rozza, d almeno due informazioni preziose:

(i) il solo fatto che esista garantisce che la funzione non presenti strappi (sia con-
tinua);

(ii) svela se la funzione va in su o in gi e, con la sua pendenza, ci dice approssima-


tivamente qual il tasso di variazione della funzione nel punto in esame.

Si tratta di due informazioni preziose nelle applicazioni. Il Capitolo 21 approfondir


questi aspetti e presenter approssimazioni locali pi ni. H
6
Si noti che x x0 in df (x0 ) (x x0 ) largomento del dierenziale df (x0 ) : R ! R in x0 .
604 CAPITOLO 18. DERIVATE

18.11.2 Dierenziabilit e derivabilit


Il prossimo risultato mostra che le due prospettive sulla derivazione, marginale e di
approssimazione lineare, sono tra loro coerenti. Ricordando quanto visto nella Sezione
18.2 sullinterpretazione geometrica della derivata, non sorprendentemente, tutto ci
signica che la retta tangente proprio la funzione a ne che soddisfa la condizione
(18.22).

Teorema 319 Una funzione f : (a; b) ! R dierenziabile in x0 2 (a; b) se e solo se


ivi derivabile. In tal caso, il dierenziale df (x0 ) : R ! R dato da df (x0 ) (h) =
f 0 (x0 ) h.

Si noti che, tra le altre cose, il risultato mostra anche lunicit del dierenziale
df (x0 ).

Dim. Se. Sia f derivabile in x0 2 (a; b). Si ha


f (x0 + h) f (x0 ) f 0 (x0 ) h f (x0 + h) f (x0 )
lim = lim f 0 (x0 )
h!0 h h!0 h
f (x0 + h) f (x0 )
= lim f 0 (x0 ) = 0;
h!0 h
ossia f (x0 + h) f (x0 ) f 0 (x0 ) h = o (h). Posto m = f 0 (x0 ), ci implica la (18.24)
e quindi f dierenziabile in x0 .

Solo se. Sia f dierenziabile in x0 2 (a; b). Per la (18.24), si ha


f (x0 + h) f (x0 ) = l (h) + o (h) per h ! 0:
La funzione lineare l : R ! R una retta passante per lorigine, ed esiste quindi m 2 R
tale che l (h) = mh. Quindi
f (x0 + h) f (x0 ) l (h) + o (h)
lim = lim =m2R:
h!0 h h!0 h
in x0 il limite del rapporto incrementale esiste nito e quindi f derivabile in x0 .

Dierenziabilit e derivabilit7 sono quindi nozioni equivalenti e, quando valgono,


si ha
f (x0 + h) = f (x0 ) + df (x0 ) (h) + o (h) = f (x0 ) + f 0 (x0 ) h + o (h) per h ! 0
(18.27)
o, equivalentemente,
f (x) = f (x0 ) + df (x0 ) (x x0 ) + o (h) (18.28)
= f (x0 ) + f 0 (x0 ) (x x0 ) + o (x x0 ) per x ! x0 :
7
Tale equivalenza si ha solo per funzioni di una variabile; per funzioni di pi variabili i due concetti
si scollano.
18.11. DIFFERENZIABILIT E LINEARIT 605

Il lettore ricorder, dalla (18.6), che

r (x) = f (x0 ) + f 0 (x0 ) (x x0 )

proprio lequazione della retta tangente in x0 , confermando la naturale intuizione


che essa lapprossimazione a ne che rende una funzione dierenziabile in x0 .

OfB La dierenza f (x0 + h) f (x0 ) detta incremento di f in x0 ed spesso indicata


con f (x0 ) (h). Quando f dierenziabile in x0 risulta allora

f (x0 ) (h) = df (x0 ) (h) + o (h)

e quindi risulta
f (x0 ) df (x0 ) per h ! 0

quando f 0 (x0 ) 6= 0. Infatti:

f (x0 ) (h) df (x0 ) (h) o (h) f 0 (x0 ) h o (h) o (h)


= + = + = f 0 (x0 ) + ! f 0 (x0 )
h h h h h h

I due innitesimi f (x0 ) e df (x0 ) sono quindi dello stesso ordine. H

18.11.3 Dierenziabilit e continuit


Una fondamentale propriet delle funzioni dierenziabili, e quindi delle derivabili, la
continuit. Grazie al Teorema 319, la Proposizione 309 si pu vedere come corollario
del seguente risultato.

Proposizione 320 Una funzione f : (a; b) ! R dierenziabile in x0 2 (a; b) ivi


continua.

Dim. Per la (18.28) si ha

lim f (x) = lim (f (x0 ) + f 0 (x0 ) (x x0 ) + o (x x0 ))


x!x0 x!x0
= f (x0 ) + f 0 (x0 ) lim (x x0 ) = f (x0 )
x!x0

e quindi f continua in x0 .

Naturalmente, il converso falso, come mostra la funzione valore assoluto f (x) =


jxj in x0 = 0.
606 CAPITOLO 18. DERIVATE

18.12 Derivate di ordine superiore


Nella Sezione 18.3 avevamo introdotto la funzione derivata f 0 : D ! R, denita sul
dominio D di derivabilit della funzione f : (a; b) ! R. A sua volta, la funzione
derivata f 0 pu ammettere derivata in un punto interno x 2 D, indicata on f 00 (x) e
data da
f 0 (x + h) f 0 (x)
f 00 (x) = lim ;
h!0 h
quando il limite esiste nito. La derivata f 00 (x) detta derivata seconda di f in x e
una funzione per cui f 00 (x) esiste si dice due volte derivabile in x.
Esempio 347 La funzione quadratica f : R ! R data da f (x) = x2 ha funzione
derivata f 0 : R ! R data da f 0 (x) = 2x. A sua volta f 0 derivabile in ogni x 2 R,
con f 00 (x) = 2 per ogni x 2 R. N
Sia D0 il dominio di derivabilit di f 0 , cosicch la sua funzione derivata f 00 : D0 ! R
a ogni x 2 D0 associa la derivata seconda f 00 (x). La funzione f 00 : D0 ! R pu a sua
volta avere derivata in un punto x 2 D0 , indicata con f 000 (x) e data da
f 00 (x + h) f 00 (x)
f 000 (x) = lim
h!0 h
quando tale limite esiste nito. La derivata f 000 (x) detta derivata terza di f in x e
una funzione per cui f 000 (x) esiste si dice tre volte derivabile in x.
Esempio 348 Nellesempio precedente, la funzione f 00 : R ! R derivabile in ogni
x 2 R, con f 000 (x) = 0 per ogni x 2 R. N
Quanto appena visto si pu iterare ad libitum, con derivata quarta, quinta, e
cos via. Indicando con f (n) la derivata n-esima, possiamo denire per ricorrenza la
derivabilit di ordine superiore di una funzione.
Denizione 128 Una funzione f : (a; b) R ! R che risulti n 1 volte derivabile
in un punto x 2 (a; b), si dice n volte derivabile in x se il limite
f (n 1)
(x + h) f (n 1)
(x)
lim (18.29)
h!0 h
esiste nito.
Per n = 0 si intende che f (0) = f . Quando n = 1, lipotesi di 1 volta derivabilit
non altro che la derivabilit ordinaria. In questo caso (18.29) denisce la derivata
(prima). Quando n = 2, (18.29) denisce la derivata seconda, e cos via.
Esempio 349 Sia f : R ! R data da f (x) = x4 . In ogni x 2 R si ha
f 0 (x) = 4x3 ; f 00 (x) = 12x2 ; f 000 (x) = 24x; f iv (x) = 24; f v (x) = 0
e f (n) (x) = 0 per ogni n 5. N
18.12. DERIVATE DI ORDINE SUPERIORE 607

OfB. La derivata seconda di una funzione denita da y = f (x) pu essere denita


direttamente come il limite per x ! 0 del rapporto
2
( y) y
=
( x)2 x2

cio
2
y f (x + 2h) 2f (x + h) + f (x)
f 00 (x) = lim 2
= lim
x!0 x h!0 h2
se tale limite esiste nito. H
608 CAPITOLO 18. DERIVATE
Capitolo 19

Derivazione parziale

Il capitolo introduce alcune nozioni di base di Calcolo dierenziale per funzioni di pi


variabili, rinviando a corsi successivi unanalisi pi approfondita dellargomento. Per
tale ragione, gran parte dei risultati del capitolo sono presentati senza dimostrazione.

19.1 Generalit
Finora abbiamo considerato derivate di funzioni di una variabile reale. La derivazione
per funzioni di pi variabili un argomento fondamentale, ma pi sottile, che sar
arontato in piena generalit in corsi successivi. Possiamo per indicare una prima
nozione molto semplice di derivazione in Rn , la derivazione parziale. Cominciamo dal
caso bidimensionale. Consideriamo lorigine x = (0; 0). Vi sono, intuitivamente, due
direzioni fondamentali lungo le quali avvicinarsi allorigine: la direzione orizzontale,
cio percorrendo lasse delle ascisse, e la direzione verticale, ossia percorrendo lasse
delle ordinate.

1
y
0.8

0.6

0.4

0.2

0
O x
-0.2

-0.4

-0.6

-0.8

-1
-1 -0.5 0 0.5 1

609
610 CAPITOLO 19. DERIVAZIONE PARZIALE

Ma, come verso lorigine ci si pu muovere lungo le due direzioni fondamentali,


verticale e orizzontale, lo stesso si pu fare verso un qualsiasi punto x 2 R2 .

y1
0.8

0.6

0.4

0.2

x0
2
-0.2

-0.4

-0.6

O x x
-0.8 1

-1
-1 -0.5 0 0.5 1

Per formalizzare lidea, consideriamo i due vettori (versori) fondamentali e1 = (1; 0)


e e2 = (0; 1) in R2 . Per ogni x = (x1 ; x2 ) 2 R2 e ogni scalare h 2 R, si ha

x + he1 = (x1 ; x2 ) + (h; 0) = (x1 + h; x2 )

Gracamente

0.8

0.6

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1
-1 -0.5 0 0.5 1

Linsieme
x + he1 : h 2 R
formato perci dai vettori di R2 con la medesima seconda coordinata, ma con una
diversa prima coordinata.
19.1. GENERALIT 611

0.8

0.6

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1
-1 -0.5 0 0.5 1

Gracamente si tratta della retta orizzontale che passa per il punto x. Per esempio,
se x lorigine (0; 0), linsieme

x + he1 : h 2 R = f(h; 0) : h 2 Rg

diventa lasse delle ascisse.


Analogamente, per ogni scalare h 2 R, si ha

x + he2 = (x1 ; x2 ) + (0; h) = (x1 ; x2 + h)

Gracamente:

0.8

0.6

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1
-1 -0.5 0 0.5 1

In questo caso linsieme fx + he2 : h 2 Rg formato dai vettori di R2 con la


medesima prima coordinata, ma con una diversa seconda coordinata.
612 CAPITOLO 19. DERIVAZIONE PARZIALE

0.8

0.6

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1
-1 -0.5 0 0.5 1

Gracamente si tratta della retta verticale che passa per il punto x. Quando x
lorigine (0; 0), linsieme fx + he2 : h 2 Rg lasse delle ordinate.
La derivata parziale @f =@x1 (x) di una funzione f : R2 ! R in un punto x 2 R2
considera leetto sulla funzione f nel punto x di variazioni innitesime lungo la retta
orizzontale fx + he1 : h 2 Rg, mentre la derivata parziale @f =@x2 (x) considera leetto
sulla funzione f di variazioni innitesime lungo la retta verticale fx + he2 : h 2 Rg. In
altre parole, si studia la funzione f in x muovendosi lungo le due direzioni fondamentali
parallele agli assi cartesiani. Precisamente, deniamo derivate parziali, che si indicano
con @f =@xi o con fx0 i , nel punto x 2 R2 i limiti1

@f f (x + he1 ) f (x)
(x) = lim (19.1)
@x1 h!0 h
@f f (x + he2 ) f (x)
(x) = lim (19.2)
@x2 h!0 h

quando esistono niti.


La derivata parziale @f =@x1 (x) di una funzione f : R2 ! R in un punto x 2 R2
considera leetto sulla funzione f nel punto x di variazioni innitesime lungo la retta
orizzontale fx + he1 : h 2 Rg, mentre la derivata parziale @f =@x2 (x) considera leetto
sulla funzione f di variazioni innitesime lungo la retta verticale fx + he2 : h 2 Rg. In
altre parole, si studia la funzione f in x muovendosi lungo le due direzioni fondamentali
parallele agli assi cartesiani.

Le denizioni (19.1) e (19.2) sono cruciali per capire il signicato della derivazione
parziale, ma sono meno utili per il loro calcolo. A tal ne, ssato x 2 R2 , introduciamo
le due funzioni scalari ausiliarie, dette proiezioni, '1 ; '2 : R ! R denite come
1
Il simbolo @ si legge d rondo. Esso prende il posto di d e sottolinea che non ci si riferisce a
funzioni di una variabile.
19.1. GENERALIT 613

'1 (t) = f (t; x2 ) ; '2 (t) = f (x1 ; t)


Si noti che 'i funzione della sola i-esima variabile, indicata con t, mentre laltra
variabile mantenuta costante. immediato vedere che per le derivate parziali @f =@xi
nel punto x 2 R2 si ha
@f ' (x1 + h) '1 (x1 )
(x) = lim 1 = '01 (x1 ) (19.3)
@x1 h!0 h
@f ' (x2 + h) '2 (x2 )
(x) = lim 2 = '02 (x2 ) (19.4)
@x2 h!0 h
La derivata parziale @f =@xi non altro che lordinaria derivata '0i della funzione scalare
'i calcolata in t = xi , con i = 1; 2. Grazie alle funzioni ausiliarie 'i ci riportiamo quindi
alla derivazione ordinaria di funzioni scalari, studiata nellultimo capitolo. Le formule
(19.3) e (19.4) risultano utilissime per il calcolo delle derivate parziali, che in tal modo
riportato allinterno dellordinaria derivazione di funzioni scalari.

Esempio 350 Sia f : R2 ! R denita come f (x1 ; x2 ) = x1 x2 . Calcoliamo le derivate


parziali di f in x = (1; 1). Si ha

'1 (t) = f (t; 1) = t


'2 (h) = f (1; t) = t

e quindi '01 (x1 ) = 1 e '02 (x2 ) = 1, il che implica


@f @f
(1; 1) = '01 (1) = 1 ; (1; 1) = '02 ( 1) = 1
@x1 @x2
Pi in generale, in un punto x 2 R2 qualsiasi, si ha

'1 (t) = tx2 ; '2 (t) = x1 t

e quindi '01 (x1 ) = x2 e '02 (x2 ) = x1 . Dunque


@f @f
(x) = '01 (x1 ) = x2 ; (x) = '02 (x2 ) = x1
@x1 @x2
H

In altre parole, per calcolare @f =@x1 (x) abbiamo considerato f come funzione
scalare di x1 , tenendo costante laltra variabile x2 , e ne abbiamo calcolato la derivata
ordinaria in x1 . Ci quanto, implicitamente, ha fatto la proiezione '1 .
In modo simile, calcolare @f =@x2 (x) tramite la proiezione '2 equivale a considerare
f come funzione scalare di x2 , tenendo costante laltra variabile x1 , e a calcolarne
la derivata ordinaria in x2 . Una volta compreso ci, possiamo saltare un passaggio
omettendo di menzionare esplicitamente le proiezioni. Il calcolo delle derivate parziali
diventa immediato.
614 CAPITOLO 19. DERIVAZIONE PARZIALE

Esempio 351 Sia f : R R++ ! R denita come f (x1 ; x2 ) = x1 log x2 . Calcoliamo


le derivate parziali in x 2 R R++ . Cominciamo con @f =@x1 (x). Se consideriamo f
come funzione scalare in x1 , la sua derivata ordinaria log x2 . Quindi,

@f
(x) = log x2
@x1

Del resto '1 (t) = t log x2 , e quindi nel punto t = x1 si ha '01 (x1 ) = log x2 . Passiamo a
@f =@x2 (x). Se consideriamo f come funzione scalare in x2 , la sua derivata ordinaria
x1 =x2 . Quindi,
@f x1
(x) =
@x2 x2
H

OfB. Il signicato geometrico delle due proiezione del tutto simile alle curve di
livello. Fissato il punto (x1 ; x2 ), la proiezione '1 (t) = f (t; x2 ) si ottiene tagliando
la supercie che rappresenta f con il piano verticale di equazione x2 = x2 , mentre
la proiezione '2 (t) = f (x1 ; t) si ottiene tagliando la supercie che rappresenta f con
il piano verticale (e perpendicolare al precedente) di equazione x1 = x1 . Dunque,
come con un panettone, si taglia la supercie con due piani tra loro perpendicolari: le
proiezioni non sono altro che le forme delle due fette, e, in quanto tali, funzioni scalari
(il cui graco giace sul piano con cui si seziona la supercie).

Le derivate parziali in (x1 ; x2 ) sono allora semplicemente le pendenze in tale punto


delle due proiezioni. H

La nozione di derivata parziale si estende in modo naturale per funzioni a n vari-


abili. Nelle sezioni precedenti abbiamo studiato la derivabilit di funzioni scalari de-
nite su intervalli aperti (a; b) che, come visto nel Capitolo 5, sono la forma che gli intorni
19.1. GENERALIT 615

assumono nella retta reale. quindi naturale denire la derivabilit parziale per fun-
zioni di pi variabili denite su intorni di Rn , ossia su insiemi U = fy 2 Rn : kx yk < "g
per qualche x 2 Rn e " > 0.2
Siano dunque e1 = (1; 0; :::; 0), e2 = (0; 1; :::; 0), ..., en = (0; 0; :::; 1) i versori
fondamentali in Rn .
Denizione 129 Una funzione f : U ! R denita (almeno) su un intorno in Rn
ammette derivate parziali in un punto x 2 U se, per ogni i = 1; 2; ; n, i limiti
f (x + hei ) f (x)
lim (19.5)
h!0 h
esistono niti. Tali limiti sono detti derivate parziali di f in x.
Precisamente il limite (19.5) si dice derivata parziale i-esima di f in x, e si indica
con
@f (x)
fx0 i (x) oppure con
@xi
In particolare, il vettore
@f @f @f
(x) ; (x) ; :::; (x) 2 Rn
@x1 @x2 @xn
delle derivate parziali in x detto gradiente di f in x e si indica con3 rf (x) o anche
semplicemente con f 0 .
Denizione 130 Una funzione f : U ! R denita (almeno) su un intorno U in Rn
si dice derivabile in un punto x 2 U se ivi ammette tutte le derivate parziali.
Quando f derivabile in tutti i punti di un sottoinsieme B di U per brevit si
dice che f derivabile su B. Secondo la denizione una funzione derivabile in un
punto quando ivi esistono tutte le sue derivate parziali. Come il lettore vedr in corsi
successivi, si tratta una nozione debole di derivabilit ma su ciente per i nostri ni.

Anche nel caso generale di n variabili indipendenti, per calcolare le derivate parziali
in un punto x utile introdurre le proiezioni 'i denite come
'i (t) = f (x1 ; : : : ; xi 1 ; t; xi+1 ; : : : ; xn ) 8i = 1; 2; : : : ; n
Usando la funzione 'i , si ha
@f (x) ' (xi + h) 'i (xi )
= lim i = '0i (xi ) 8i = 1; 2; : : : ; n
@xi h!0 h
che generalizza a Rn le formule (19.3) e (19.4), riportando anche in questo caso il
calcolo delle derivate parziali alla derivazione ordinaria di funzioni scalari.
2
Come visto nel Capitolo 5, geometricamente in R2 gli intorni sono i cerchi (privati della
circonferenza), in R3 sono le sfere (privati della circonferenza), e Rn sono le palle (aperte).
3
Il simbolo r si legge nabla.
616 CAPITOLO 19. DERIVAZIONE PARZIALE

Esempio 352 Sia f : R4 ! R denita come f (x1 ; x2 ; x3 ; x4 ) = x1 + ex2 x3 + 2x24 . In


ogni punto x 2 Rn si ha
'1 (t) = t + ex2 x3 + 2x24 ; '2 (t) = x1 + etx3 + 2x24
'3 (t) = x1 + ex2 t + 2x24 ; '4 (t) = x1 + ex2 x3 + 2t2
e quindi
'01 (t) = 1 ; '02 (t) = x3 etx3
'03 (t) = x2 ex2 t ; '04 (t) = 4t
Dunque
@f @f
(x) = '01 (x1 ) = 1 ; (x) = '02 (x2 ) = x3 ex2 x3
@x1 @x2
@f @f
(x) = '03 (x3 ) = x2 ex2 x3 ; (x) = '04 (x4 ) = 4x4
@x3 @x4
In conclusione
rf (x) = (1; x3 ex2 x3 ; x2 ex2 x3 ; 4x4 )
N
Come nel caso speciale n = 2 , anche nel caso generale calcolare la derivata parziale
@f (x) =@xi tramite la proiezione 'i equivale a considerare f come funzione scalare in
xi , tenendo costanti le altre n 1 variabili. Si calcola poi la derivata ordinaria in xi
di questa funzione scalare. In altre parole, si studia il comportamento incrementale
di f rispetto a variazioni della sola xi , ceteris paribus, ossia tenendo costanti le altre
variabili.

19.1.1 Ceteris paribus: utilit e produttivit marginali


Le derivate parziali si rivelano fondamentali in Economia. In questa sottosezione
consideriamo due classiche applicazioni alle teorie del consumo e della produzione.

Produzione Sia f : A Rn+ ! R+ una funzione di produzione che, come gi visto,


indica che il produttore in grado di trasformare un vettore x 2 Rn+ di input nella
quantit f (x) di output. La derivata parziale
@f (x)
(19.6)
@xi
quantica la variazione nelloutput prodotto che il produttore ottiene per variazioni
innitesime delli-esimo input, a parit delle quantit degli altri. In altre parole, la
derivata parziale (19.6) isola leetto sulloutput prodotto causato da variazioni nelli-
esimo input, ceteris paribus, ossia tenendo sse le quantit degli altri. La derivata
parziale (19.6) detta produttivit marginale dellinput i, con i = 1; 2; : : : ; n, e ha
unimportanza centrale nelle scelte di produzione compiute dal produttore.
19.2. DIFFERENZIALE TOTALE 617

Utilit Sia u : A Rn ! R una funzione di utilit. Se assumiamo che u abbia unin-


terpretazione cardinale, ossia che u (x) quantichi il piacere ottenuto dal consumare il
paniere x, la dierenza
u x + hei u (x) (19.7)
indica la variazione di piacere che il consumatore percepisce al variare la quantit con-
sumata del bene i nel paniere x, ceteris paribus, ossia a parit delle quantit consumate
degli altri beni. Ne segue che la derivata parziale
@u (x)
(19.8)
@xi
quantica la variazione nel piacere che il consumatore prova per variazioni innitesime
del bene i, a parit delle quantit consumate degli altri beni.
La derivata parziale (19.8) detta utilit marginale del bene i nel paniere x ed
centrale nella visione cardinalista alla teoria del consumatore. Nellapproccio ordi-
nalista, invece, le utilit marginali non hanno pi ragion dessere perch le dierenze
(19.7) non hanno alcun signicato. Tant che facile costruire esempi nei quali si ha

u x + hei > u (x) e (g u) x + hei < (g u) (x)

con g : R ! R strettamente crescente. Poich u e g u sono due funzioni di utilit


equivalenti dal punto di vista ordinale, chiaro che le dierenze (19.7) non hanno di
per s alcun signicato. Per questa ragione nella teoria ordinalista del consumatore si
usano i saggi marginali di sostituzione e non pi le utilit marginali (come si vedr nella
Sezione 19.5.2). Cionondimeno, il concetto di utilit marginale rimane una nozione
molto usata in Economia per la sua semplicit intuitiva.

19.2 Dierenziale totale


La Denizione 126 di dierenziale si estende a funzioni denite su un intorno U in Rn .

Denizione 131 Una funzione f : U Rn ! R si dice dierenziabile in un punto


x 2 U se esiste una funzione lineare l : Rn ! R tale che

f (x + h) = f (x) + l (h) + o (khk) per khk ! 0 (19.9)

per ogni h 2 Rn tale che x + h 2 U .4

La funzione lineare l si dice dierenziale di f in x, indicato con df (x) : Rn ! R.


Il dierenziale lapprossimazione lineare nel punto x della funzione f con errore di
magnitudo o (khk), cio

f (x + h) f (x) = df (x) (h) + o (khk)


4
Nel caso scalare la clausola per ogni h 2 Rn tale che x0 + h 2 U si riduce alla per ogni
h 2 (x0 a; b x0 ) della Denizione 126.
618 CAPITOLO 19. DERIVAZIONE PARZIALE

ossia,
jf (x + h) f (x) df (x) (h)j o (khk)
lim = lim =0
h!0 khk h!0 khk

Grazie al Teorema di Riesz (Sezione 14.1.2) il funzionale lineare df (x) ha la rappre-


sentazione
df (x) (h) = h
per un opportuno vettore 2 Rn . Il prossimo notevole risultato, la cui dimostrazione
lasciata a corsi successivi, estende il Teorema 319 al caso vettoriale mostrando che,
con semplici ipotesi di regolarit (la continuit delle derivate parziali), il dierenziale
esiste, unico e il vettore che lo rappresenta il gradiente di f .

Teorema 321 Supponiamo f : U Rn ! R abbia derivate parziali continue su U .


Allora, f dierenziabile in ogni punto x 2 U e risulta

Xn
@f
df (x) (h) = rf (x) h = (x) hi 8h 2 Rn (19.10)
i=1
@xi

Quando f scalare si ritrova la classica espressione

df (x) (h) = f 0 (x) h 8h 2 R

del dierenziale nel caso scalare.

Esempio 353 Consideriamo la funzione f : Rn ! R data da f (x) = kxk2 , il cui


gradiente

@f @f
rf (x) = (x) = 2x1 ; :::; (x) = 2xn = 2x 8x 2 Rn
@x1 @xn

Le derivate parziali sono continue su Rn e quindi la funzione dierenziabile su Rn .


Grazie al Teorema 321, in ogni x 2 Rn si ha

df (x) (h) = rf (x) h 8h 2 Rn

e
kx + hk2 kxk2 = 2x h + o (khk)
per khk ! 0. N
Pn
Esempio 354 Consideriamo la funzione f : Rn++ ! R data da f (x) = i=1 log xi , il
cui gradiente

@f 1 @f 1
rf (x) = (x) = ; :::; (x) = 8x 2 Rn++
@x1 x1 @xn xn
19.2. DIFFERENZIALE TOTALE 619

Le derivate parziali sono continue su Rn++ e quindi la funzione dierenziabile su Rn++ .


Grazie al Teorema 321, in ogni x 2 Rn++ si ha
df (x) (h) = rf (x) h 8h 2 Rn
sicch
X
n X
n X
n
hi
log (xi + hi ) log xi = + o (khk)
i=1 i=1 i=1
xi
per khk ! 0. N
In modo impreciso, ma espressivo, la (19.10) si indica spesso come:
@f @f
df = dx1 + + dxn (19.11)
@x1 @xn
detta formula del dierenziale totale. Tale formula mostra come leetto complessivo df
sulla f si scomponga nella somma degli eetti che hanno su f le variazioni innitesime
dxi delle singole variabili: i vari addendi @f =@xi sono talora detti dierenziali parziali.
Per esempio, se f : Rn ! R una funzione di produzione con n input, la (19.11) ci
dice che la variazione complessiva df delloutput il risultato della somma degli eetti
@f
dxi
@xi
che hanno sulla funzione di produzione le variazioni innitesime dxi dei singoli in-
put. In un linguaggio pi economico, la variazione complessiva delloutput df data
dalla somma delle variazioni innitesime dxi dei fattori, moltiplicati per le loro rispet-
tive produttivit marginali @f =@xi . Maggiore (in valore assoluto) la produttivit
marginale @f =@xi dellinput i, maggiore limpatto sulloutput di una sua variazione.
Similmente, se u : Rn+ ! R una funzione di utilit, la (19.11) assume la veste
@u @u
du = dx1 + + dxn
@x1 @xn
La variazione complessiva du di utilit si scompone nella somma degli eetti
@u
dxi
@xi
sulla funzione di utilit di variazioni innitesime dxi dei singoli beni che costituis-
cono il paniere x: la variazione complessiva di utilit du la somma delle variazioni
innitesime dei beni dxi , moltiplicati per le loro rispettive utilit marginali @u=@xi .
Esempio 355 Sia u : Rn++ P
P ! R la funzione di utilit log-lineare u (x1 ; :::; xn ) =
n n
i=1 i log xi con i > 0 e i=1 i = 1. Essa equivalente alla funzione di utilit
Cobb-Douglas su Rn++ , di cui la trasformazione logaritmica. Il suo dierenziale totale

1 n
du = dx1 + + dxn
x1 xn
Linuenza di ogni variazione innitesima dxi sulla variazione complessiva di utilit
du determinato dal coe ciente i =xi . N
620 CAPITOLO 19. DERIVAZIONE PARZIALE

Per quanto evocativo, il dierenziale totale (19.10) solo una versione euristica del
dierenziale df (x), che la nozione rigorosa5 .

19.3 Regola della catena


Una delle formule pi utili nel Calcolo dierenziale per funzioni scalari la regola
della catena (f g)0 (x) = f 0 (g (x)) g 0 (x) per funzioni composte f g. Essa si pu
generalizzare al caso di funzioni di pi variabili.

Teorema 322 (Regola della catena) Siano g : U Rn ! R e f : B R!R


con Im g B. Se g dierenziabile in x 2 U e se f dierenziabile in g (x), allora
la composizione f g : U Rn ! R dierenziabile in x e si ha
@g (x) @g (x)
r (f g) (x) = f 0 (g (x)) rg (x) = f 0 (g (x)) ; :::; f 0 (g (x)) ;
@x1 @xn
cui corrisponde il dierenziale
X
n
@g (x)
0
d (f g) (x) (h) = f (g (x)) hi (19.12)
i=1
@xi

Nel caso scalare n = m = 1, la (19.12) si riduce alla classica regola

(f g)0 (x) = f 0 (g (x)) g 0 (x) .

La veste come dierenziale totale della (19.11) :


df @g df @g
d (f g) = dx1 + + dxm (19.13)
dg @x1 dg @xm
La variazione in f g si pu vedere come scomposta a catena secondo le diverse
variazioni innitesime dxi , ognuna delle quali induce la variazione (@g=@xi ) dxi su g,
che a sua volta causa una variazione df =dg su f . Sommando queste catene di eetti
si ottiene la variazione complessiva d (f g).

Esempio 356 Sia f : R ! R denita come f (x) = e2x per ogni x 2 R e sia g : R2 !
R denita come g (x) = x1 x22 per ogni x 2 R2 . Calcoliamo con la regola della catena
2
il dierenziale della funzione composta f g : R2 ! R data da (f g) (x) = e2x1 x2 . Si
ha
2 2
r (f g) (x) = 2x22 e2x1 x2 ; 4x1 x2 e2x1 x2
5
Il procedere in modo euristico essenziale in matematica nella ricerca di nuovi risultati (di
avanguardia degli sforzi euristici verso il nuovo scriveva Carlo Emilio Gadda, frase quanto mai ap-
propriata per la Matematica) e nel loro uso spedito. La verica rigorosa di ci che si ottenuto per
essenziale; solo pochissimi sommi matematici, cari agli dei, possono a darsi unicamente allintuito
senza curarsi granch del rigore.
19.4. DERIVATE PARZIALI DI ORDINE SUPERIORE 621

e quindi
2
d (f g) (x) h = 2e2x1 x2 x22 h1 + 2x1 x2 h2
per ogni h 2 R2 . Il dierenziale totale (19.13) si scrive come:
2
d (f g) = 2e2x1 x2 x22 dx1 + 2x1 x2 dx2 :

Esempio 357 Sia f : (0; +1) ! R denita come f (x) = log x e sia g : R2++ ! R
p
denita come g (x1 ; x2 ) = x1 x2 . Qui la funzione g devessere ristretta su R2++ per
soddisfare la condizione Im g (0; +1). Calcoliamo con la regola della catena il
p
dierenziale della funzione composta f g : R2++ ! R data da (f g) (x) = log x1 x2 .
Si ha r r
@g (x) 1 x2 @g (x) 1 x1
= e =
@x1 2 x1 @x2 2 x2
sicch
@g (x) 0 @g (x)
r (f g) (x) = f 0 (g (x)) ; f (g (x))
@x1 @x2
r r
1 1 x2 1 1 x1 1 1
= p ;p = ;
x1 x2 2 x1 x1 x2 2 x2 2x1 2x2
e
1 1
d (f g) (x) h = h1 + h2
2x1 2x2
per ogni h 2 R2 . Il dierenziale totale (19.13) si scrive come:
1 1
d (f g) = dx1 + dx2
2x1 2x2
N

19.4 Derivate parziali di ordine superiore


Consideriamo una funzione f : U Rn ! R denita (almeno) su un intorno U in Rn
e ivi derivabile. Le sue derivate parziali @f =@xi possano a loro volta essere viste come
funzioni di pi variabili
@f
: U Rn ! R
@xi
Esempio 358 Le derivate parziali
@f @f @f
(x) = x2 x3 ; (x) = x1 x3 ; (x) = x1 x2
@x1 @x2 @x3
della funzione f (x1 ; x2 ; x3 ) = x1 x2 x3 sono funzioni su tutto R3 . N
622 CAPITOLO 19. DERIVAZIONE PARZIALE

Essendo funzioni, ha senso parlare di derivabilit delle funzioni derivate parziali


@f =@xi : U Rn ! R in un punto x 2 U . In tal caso, per ogni i; j = 1; :::; n si ha la
derivata parziale
@f
@ @x i
(x)
@xj
rispetto a xj della derivata parziale @f =@xi . Tali derivata parziale si dicono derivate
parziali del secondo ordine e si indicano con
@2f
(x)
@xi @xj
Quando i = j si scrive
@2f
(x)
@x2i
invece di @ 2 f =@xi @xi .6 Secondo tale notazione, si ha la matrice
2 3
@2f @2f @2f
2 (x) @x1 @x2
(x) @x1 @xn
(x)
6 @x1 7
6 7
6 @2f 2
@ f 2
@ f 7
6 @x2 @x1 (x) 2 (x) (x) 7
6 @x 2 @x 2 @xn 7
6 7
6 7
6 7
6 7
4 5
2
@ f 2
@ f 2
@ f
@xn @x1
(x) @xn @x2
(x) @x2
(x)
n

delle derivate parziali del secondo ordine, detta matrice Hessiana di f e indicata con
r2 f (x).

Esempio 359 Sia f : R2 ! R denita come f (x) = ex1 x2 + 3x2 x3 per ogni x 2 R2 .
Calcoliamo la matrice Hessiana. Si ha:
@f @f @f
(x) = x2 ex1 x2 ; (x) = x1 ex1 x2 + 3x3 ; (x) = 3x2 ,
@x1 @x2 @x3
e quindi
@f @f @f
2
(x) = x22 ex1 x2 ; (x) = (1 + x1 x2 ) ex1 x2 ; (x) = 0;
@x1 @x1 @x2 @x1 @x3
@f @f @f
(x) = (1 + x1 x2 ) ex1 x2 ; 2
(x) = x21 ex1 x2 ; (x) = 3;
@x2 @x1 @x2 @x2 @x3
@f @f @f
(x) = 0; (x) = 3; (x) = 0:
@x3 @x1 @x3 @x2 @x23
6
Si noti che con questa notazione lordine di i e j invertito. Per tale ragione, a volte si usa la
notazione @ 2 f =@xj @xi . Daltra parte, grazie al Teorema 323 la scelta irrilevante nella maggior parte
dei casi.
19.4. DERIVATE PARZIALI DI ORDINE SUPERIORE 623

Possiamo concludere che la matrice Hessiana di f :


2 3
x22 ex1 x2 (1 + x1 x2 ) ex1 x2 0
6 7
6 7
r2 f (x) = 6 (1 + x1 x2 ) ex1 x2 x21 ex1 x2 3 7
4 5
0 3 0

Le derivate parziali del secondo ordine possono a loro volta essere viste come fun-
zioni di pi variabili e possiamo quindi cercarne le derivate parziali, che (se esistono)
diventano le derivate parziali di ordine terzo. Daltra parte, anche le derivate parziali
di ordine terzo possono essere viste come funzioni delle singole variabili, le cui derivate
parziali (se esistono) diventano le derivate di ordine quarto, e cos via.
Per esempio, tornando allEsempio 359 consideriamo la derivata parziale

@2f
(x) = (1 + x1 x2 ) ex1 x2
@x1 @x2

Si hanno le seguenti derivate di ordine terzo:

@2f
3
@ f @ @x1 @x2
(x) = (x) = 2x2 + x1 x22 ex1 x2 ;
@x1 @x2 @x1 @x1
@2f
@ f 3 @ @x1 @x2
(x) = = 2x1 + x21 x2 ex1 x2 ;
@x1 @x22 @x2

e cos via per le derivate parziali di ordine quarto, ecc.

Esempio 360 Sia f : R2 ! R denita come f (x1 ; x2 ) = x1 x2 . immediato vedere


che f ha derivate parziali continue di qualsiasi ordine. Pi in generale, ci vale per i
polinomi di pi variabili. N

Per le derivate parziali di ordine secondo vale il seguente fondamentale teorema,


del quale omettiamo la dimostrazione.

Teorema 323 Sia f : U Rn ! R una funzione che abbia derivate parziali del
secondo ordine su U . Se tali derivate sono continue in x 2 U , allora

@2f @2f
(x) = (x) (19.14)
@xi @xj @xj @xi

per ogni i; j = 1; :::; n.


624 CAPITOLO 19. DERIVAZIONE PARZIALE

Quando sono continue, non conta lordine nel quale si considerano le derivate
parziali: possiamo indierentemente calcolare prima la derivata parziale rispetto a
xi e poi quella rispetto a xj , o fare il contrario. Il risultato non cambia, e possiamo
perci scegliere la via che pi sembra facile da calcolare, ottenendo gratis anche
laltra derivata parziale seconda. Ci semplica notevolmente il calcolo delle derivate
ed , inoltre, unelegante propriet di simmetria della matrice Hessiana.

Esempio 361 Sia f : R3 ! R denita come f (x1 ; x2 ; x3 ) = x21 x2 x3 . Semplici conti


mostrano che:
@2f @2f
(x) = (x) = 2x1 x3
@x1 @x2 @x2 @x1
come garantito dal Teorema 323 perch le derivate parziali seconde sono continue. N

Esempio 362 Sia f : R3 ! R denita come f (x1 ; x2 ; x3 ) = cos (sin (x1 x2 )) + e x3 .


La matrice Hessiana
2 3
x22 cos (x1 x2 ) sin (x1 x2 ) x1 x2 cos (x1 x2 ) 0
6 7
6 7
r2 f (x) = 6 sin (x1 x2 ) x1 x2 cos (x1 x2 ) x21 cos (x1 x2 ) 0 7
4 5
x3
0 0 e
Come garantisce il Teorema 323, la matrice simmetrica. N

Per concludere, mostriamo un caso non coperto dal Teorema 323.

Esempio 363 Sia f : R2 ! R denita come:


8 2 2
< x1 x2 xx21 +xx22 se (x1 ; x2 ) 6= (0; 0)
1 2
f (x1 ; x2 ) =
:
0 se (x1 ; x2 ) = (0; 0)
Il lettore pu vericare che: (i) f ha derivate parziali @f =@x1 e @f =@x2 continue su
R2 ; (ii) f ha derivate parziali del secondo ordine @ 2 f =@x1 @x2 e @f =@x2 @x1 denite
su tutto R2 , ma discontinue in (0; 0). Pertanto, lipotesi di continuit delle derivate
parziali del secondo ordine, richiesta nel Teorema 323, non vale nel punto (0; 0). Tale
teorema non pu perci dire alcunch sul comportamento di tali derivate in (0; 0).
Proviamo a calcolarle. Facendo i conti si scopre che:
@2f @2f
(0; 0) = 1 e (0; 0) = 1
@x1 @x2 @x2 @x1
e quindi
@2f @2f
(0; 0) 6= (0; 0)
@x1 @x2 @x2 @x1
Lipotesi di continuit delle derivate parziali del secondo ordine perci importante
per la validit delluguaglianza (19.14). N
19.5. FUNZIONI IMPLICITE 625

19.5 Funzioni implicite


19.5.1 Teorema di Dini
In tutto ci che precede abbiamo discusso di funzioni scalari f utilizzandone la scrittura
in forma esplicita:
y = f (x)
ovvero nella consueta forma che tiene separate la variabile indipendente x dal-
la dipendente y: essa consente di determinare i valori di questultima attraverso
lassegnazione di valori a x. La stessa funzione si pu riscrivere in forma implicita,
ovvero attraverso unequazione che tiene le variabili tutte dallo stesso lato del segno
di uguaglianza:
y f (x) = 0
cio come
g (x; f (x)) = 0
dove g la funzione di due variabili denita da

g (x; y) = f (x) y.

Esempio 364 (i) La funzione f (x) = x2 + x 3 si pu scrivere in forma implicita


come g (x; y) = 0 con g (x; y) = x2 + x 3 y. (ii) La funzione f (x) = 1 + lg x si pu
scrivere in forma implicita come g (x; y) = 0 con g (x; y) = 1 + lg x y. N

Si noti come
1
g (0) = Gr f
1
in altre parole, il graco della funzione f coincide con la curva di livello g (0) =
f(x; y) 2 A : g (x; y) = 0g della funzione g di due variabili.

La riscrittura implicita di una funzione scalare f di cui nota la forma esplicita


poco pi che una curiosit poich la forma esplicita contiene tutte le informazioni
rilevanti su f , in particolare sul legame di dipendenza tra variabile independente x
e variabile dipendente y. Purtroppo, spesso nelle applicazioni funzioni scalari impor-
tanti non sono denite pronte alluso in forma esplicita, ma solo in forma implicita
tramite equazioni g (x; y) = 0. Per questa ragione interessante e molto utile porsi
il problema inverso: unequazione del tipo g (x; y) = 0 denisce implicitamente una
funzione scalare f ? in altre parole, esiste f tale che g (x; f (x)) = 0?

Lasciando trattazioni pi dettagliate a corsi successivi, qui ci limitiamo ad af-


frontare tali domande da un punto di vista locale, incentrato su un punto (x0 ; y0 ) che
sia soluzione dellequazione g (x; y) = 0, ossia tale che g (x0 ; y0 ) = 0.
626 CAPITOLO 19. DERIVAZIONE PARZIALE

Denizione 132 Lequazione g (x;y) = 0, con g : A R2 ! R, denisce implicita-


mente nel punto (x0 ; y0 ) 2 g 1 (0) una funzione scalare se esistono intorni U (x0 ) e
V (y0 ) per i quali vi ununica funzione scalare f : U (x0 ) ! V (y0 ) tale che

g (x; f (x)) = 0 8x 2 U (x0 ) (19.15)

La funzione implicita f : U (x0 ) ! V (y0 ) denita localmentenel punto (x0 ; y0 ).


Il punto di vista locale particolarmente adatto alluso del Calcolo dierenziale, come
mostra il prossimo celeberrimo risultato di Ulisse Dini, spesso detto Teorema della
funzione implicita. il risultato pi importante nello studio delle funzioni implicite e
ha innumerevoli applicazioni.

Teorema 324 (Dini) Sia g : A R2 ! R denita su un insieme aperto e sia


g (x0 ; y0 ) = 0. Se g derivabile con continuit in un intorno di (x0 ; y0 ), con

@g
(x0 ; y0 ) 6= 0 (19.16)
@y

allora esistono intorni U (x0 ) e V (y0 ) e ununica funzione f : U (x0 ) ! V (y0 ) tale che

g (x; f (x)) = 0 8x 2 U (x0 ) (19.17)

La funzione f suriettiva e derivabile con continuit in U (x0 ), con

@g
(x; y)
f 0 (x) = @x (19.18)
@g
(x; y)
@y
1
per ogni (x; y) 2 g (0) \ U (x0 ) V (y0 ).

La funzione f : U (x0 ) ! V (y0 ) quindi denita implicitamente dallequazione


g (x;y) = 0. Poich f unica e suriettiva, la (19.17) equivale a

g (x; y) = 0 () y = f (x) 8 (x; y) 2 U (x0 ) V (y0 ) (19.19)

ossia a
1
g (0) \ (U (x0 ) V (y0 )) = Gr f
1
La curva di livello g (0) quindi localmente rappresentabile dal graco della funzione
implicita.

Limportanza del Teorema di Dini nel consentire, grazie alla formula (19.18), il
calcolo della derivata prima della funzione implicita senza che sia necessario conoscerne
la forma chiusa. Poich la derivata prima spesso ci che realmente interessa della
funzione f (perch, per esempio, si interessati a risolvere condizioni del primo ordine)
19.5. FUNZIONI IMPLICITE 627

di cile sottovalutare limportanza per le applicazioni di tale notevolissima propriet


del Teorema di Dini.

Il caso pi importante della (19.18)


@g
(x0 ; y0 )
f 0 (x0 ) = @x
@g
(x0 ; y0 )
@y
ossia il calcolo della derivata della funzione implicita nel punto in esame (x0 ; y0 ). Si noti
che luso della formula (19.18) si basa sulla clausola (x; y) 2 g 1 (0) \ U (x0 ) V (y0 )
che richiede di ssare entrambe le variabili x e y. questo il prezzo da pagare nella
derivabilit implicita, laddove a quella esplicita bastava ssare la variabile x.

Da ultimo si osservi che possiamo riscrivere la (19.18) come


@g
(x; f (x))
f 0 (x) = @x 8x 2 U (x0 )
@g
(x; f (x))
@y
enfatizzando il ruolo svolto dalla funzione implicita. Entrambe le formulazioni sono
utili, per motivi diversi, ed bene tenere entrambe a mente.

Si noti che la formula (19.18) si pu ricavare in modo euristico usando il dierenziale


totale di g. Infatti si ha
@g @g
dg = dx + dy
@x @y
Si ha dg = 0 per spostamenti (dx; dy) che ci facciano rimanere lungo la curva di livello
g 1 (0). Quindi
@g @g
dx = dy
@x @y
il che implica(potenza delleuristica!)
@g
dy @x
= @g
dx @y

Si tratta di un argomento quanto mai rozzo (e scorretto), ma certamente utile, per


ricordare la (19.18).

Esempio 365 Nel caso semplicissimo, nel quale tutto ovvio, di funzione lineare
g (x; y) = ax + by k, lequazione g (x; y) = 0 diventa

ax + by k=0
628 CAPITOLO 19. DERIVAZIONE PARZIALE

Da essa si trae immediatamente,


a k
y= x+
b b
purch b 6= 0: anche nel caso pi semplice, lesistenza di una funzione implicita richiede
la condizione b = @g (x) =@y 6= 0. N

Esempio 366 Sia g : R2 ! R data da g (x; y) = x2 xy 3 + y 5 17. Verichiamo


se lequazione g (x; y) = 0 denisce implicitamente una funzione implicita nel punto
(x0 ; y0 ) = (5; 2) 2 g 1 (0). La funzione g derivabile con continuit su tutto R2 , risulta
@g (x; y) =@y = 3xy 2 + 5y 4 e perci
@g
(x0 ; y0 ) = 20 6= 0:
@y
Grazie al Teorema di Dini esiste ununica f : U (x0 ) ! V (y0 ) derivabile con continuit
e tale che
x2 xf 3 (x) + f 5 (x) = 17 8x 2 U (x0 )
Inoltre
@g
(5; 2) 2 5 23 1
0
f (5) = @x = =
@g 3 5 22 + 5 24 10
(5; 2)
@y
Per il punto (x0 ; y0 ) = (1=2; 1) si ha @g (x0 ; y0 ) =@y 6= 0 e
0
f 0 (x0 ) = 3 =0
2
+5

Si tratta di un punto stazionario per la funzione implicita f . LEsempio 372 mostrer


che un minimo locale.
In generale, in ogni punto (x0 ; y0 ) dove @g (x; y) =@y 6= 0 si ha
@g
(x; y) 2x y 3 y 3 2x
f 0 (x) = @x = =
@g 3xy 2 + 5y 4 3xy 2 + 5y 4
(x; y)
@y
per ogni (x; y) 2 U (x0 ) V (y0 ). In particolare, lapprossimazione locale del primo
ordine

f (x) = f (x0 ) + f 0 (x0 ) (x x0 ) + o (x x0 )


y 3 2x
= y0 + (x x0 ) + o (x x0 )
3xy 2 + 5y 4
in (x 0 ; y0 ). N
19.5. FUNZIONI IMPLICITE 629

Esempio 367 Consideriamo la funzione g : R2 ! R data da g (x; y) = 7x2 2y ey .


Le ipotesi del Teorema di Dini sono soddisfatte in ogni punto (x0 ; y0 ) 2 R2 , sicch
lequazione g (x; y) = 0 denisce implicitamente in un punto (x0 ; y0 ) 2 g 1 (0) una
funzione scalare f : U (x0 ) ! V (y0 ) derivabile con continuit e tale che
@g(x;y)
0 @x 14x
f (x) = @g(x;y)
= (19.20)
2 ey
@y

per ogni (x; y) 2 U (x0 ) V (y0 ). Pur non conoscendo la forma di f , abbiamo de-
terminato la sua funzione derivata f 0 . Lapprossimazione locale del primo ordine

f (x) = f (x0 ) + f 0 (x0 ) (x x0 ) + o (x x0 )


14x0
= y0 (x x0 ) + o (x x0 )
2 ey0
1
in (x 0 ; y0 ). Per esempio, nel punto (1=7; 0) 2 g (0) si ha

1
f = 2x + o (x)
7
per x ! 0. N

Esempio 368 Sia g : R2 ! R data da g (x; y) = x3 +4yex +y 2 +xey . Se g (x0 ; y0 ) = 0


e @g (x0 ; y0 ) =@y 6= 0, grazie al Teorema di Dini lequazione g (x; y) = 0 denisce in
(x0 ; y0 ) ununica funzione scalare f : U (x0 ) ! V (y0 ) derivabile con continuit e tale
che
@g(x;y)
3x2 + 4yex + ey
f 0 (x) = @g(x;y)
@x
=
4ex + 2y + xey
@y

per ogni (x; y) 2 U (x0 ) V (y0 ). Lapprossimazione locale del primo ordine

f (x) = f (x0 ) + f 0 (x0 ) (x x0 ) + o (x x0 )


3x20 + 4y0 ex0 + ey0
= y0 (x x0 ) + o (x x0 )
4ex0 + 2y0 + x0 ey0

in (x 0 ; y0 ). Per esempio, se (x0 ; y0 ) = (0; 0) si ha @g (0; 0) =@y = 4 > 0, e quindi


@g(0;0)
1
f 0 (0) = @x
@g(0;0)
=
4
@y

e
1
f (x) = y0 + f 0 (0) x + o (x) = x + o (x)
4
per x ! 0. N
630 CAPITOLO 19. DERIVAZIONE PARZIALE

Scambiando le variabili nel Teorema di Dini, possiamo aermare che la continuit


di g in un intorno di (x0 ; y0 ) e la circostanza che @g (x0 ; y0 ) =@x 6= 0 garantiscono
lesistenza di una (unica) funzione implicita x = ' (y) tale che localmente risulti
g (' (y) ; y) = 0. Ne consegue che, qualora almeno una delle due derivate parziali
@g (x0 ; y0 ) =@x e @g (x0 ; y0 ) =@y non sia nulla, vi localmente un legame univoco tra
le due variabili; quindi il Teorema di Dini, in uno dei due sensi, non fornisce alcuna
certezza soltanto quando entrambe le derivate indicate sono nulle.
Per esempio se g (x; y) = x2 +y 2 1, per ogni punto (x0 ; y0 ) che soddisfa lequazione
g (x; y) = 0 si ha @g (x0 ; y0 ) =@y = 2y0 che nulla soltanto per y0 = 0 (e quindi x0 =
1). Nei due punti (1; 0) e ( 1; 0) lequazione non denisce infatti alcuna funzione
implicita del tipo y = f (x). In essi per risulta @g ( 1; 0) =@x = 2 6= 0 e perci
lequazione denisce una funzione implicita del tipo x = ' (y). Simmetricamente, nei
due punti (0; 1) e (0; 1) lequazione denisce una funzione implicita del tipo y = f (x)
ma non una del tipo x = ' (y).

19.5.2 Saggi marginali


Data una funzione g : A R2 ! R e uno scalare k, la semplice trasformazione
gk = g k consente di riportare lo studio della curva di livello

1
g (k) = fx 2 A : g (x) = kg

di livello k alla curva


gk 1 (0) = fx 2 A : gk (x) = 0g

di livello 0 poich g 1 (k) = gk 1 (0). Il Teorema di Dini permette di studiare local-


mente gk 1 (0), e quindi g 1 (k). In particolare, la funzione implicita f : U (x0 ) !
V (y0 ) permette di dare, in un intorno U (x0 ) V (y0 ) di un punto (x0 ; y0 ) 2 g 1 (k),
una rappresentazione funzionale della curva di livello g 1 (k) tramite la fondamentale
relazione
g 1 (k) \ (U (x0 ) V (y0 )) = Gr f (19.21)

Per tale ragione le funzioni implicite descrivono il legame tra le variabili x e y che
convivono in tali curve e, in tal modo, consentono di formulare in modo naturale
alcune propriet fondamentali delle curve di livello. Ci spiega la loro importanza.
Per esempio, consideriamo un isoquanto g 1 (k). Si tratta di una curva di livello
della funzione di produzione g : R2+ ! R: vi sono due input, x e y, e un output. I
punti (x; y) che appartengono allisoquanto sono tutte le combinazioni produttive che
mantengono costante la quantit prodotta. La funzione implicita y = f (x) informa,
localmente, su come deve variare la quantit y al variare di x per mantenere costante
la produzione complessiva. Perci, le propriet della funzione f : U (x0 ) ! V (y0 )
caratterizzano, localmente, le relazioni tra gli input che garantiscono il livello k di
output. Di solito, si assume che f sia:
19.5. FUNZIONI IMPLICITE 631

(i) decrescente, cio f 0 (x) 0 per ogni x 2 U (x0 ): i due input sono parzialmente
sostituibili e, per mantenere inalterata la quantit prodotta al livello k, a mi-
nori quantit dellinput x devono corrispondere maggiori quantit dellinput y
(e viceversa);

(ii) convessa, cio f 00 (x0 ) 0 per ogni x 2 U (x0 ): a maggiori livelli di x, sono
necessarie quantit di y via via maggiori per compensare variazioni di x a nch
la produzione rimanga al livello k.

Il valore assoluto jf 0 j della derivata della funzione implicita si dice saggio (o tasso)
marginale di trasformazione perch, per variazioni innitesime degli input, ne descrive
il grado di sostituibilit, cio la variazione da apportare a y che bilancia marginalmente
un aumento di x. Grazie alla rappresentazione funzionale (19.21) dellisoquanto, geo-
metricamente il saggio marginale di trasformazione si pu interpretare come la pen-
denza dellisoquanto in (x; y). questa la classica interpretazione del saggio, che segue
dalla (19.21).
Dal Teorema di Dini segue la classica formula
@g
(x; y)
SM Tx;y = jf 0 (x)j = @x
@g
(19.22)
@y
(x; y)

che la forma usuale nella quale si presenta la nozione di saggio marginale di trasfor-
mazione SM Tx;y . Si noti che nella (19.22) compaiono direttamente le derivate parziali
di g, che sono uguali a quelle della sua trasformazioni gk .

Esempio 369 Sia f : R2++ ! R la funzione di produzione Cobb-Douglas f (x; y) =


x y 1 , con 0 < < 1. Il saggio marginale di trasformazione risulta
@g 1 1
@x
(x; y) x y y
SM Tx;y = @g
= =
@y
(x; y) (1 )x y 1 x

Per esempio, in un punto nel quale si impiegano uguali quantit dei due input, cio x =
y, se si aumenta di ununit il primo input, il secondo deve diminuire di = (1 ) per
lasciare inalterata la quantit prodotta: in particolare, quando = 1=2, la diminuzione
del secondo devessere di ununit. In un punto nel quale si impiega una quantit del
secondo input quintupla di quella del primo, cio y = 5x, un aumento di ununit del
primo input compensata dalla diminuzione di 5 = (1 ) del secondo. N

Considerazioni analoghe valgono per le curve di livello di una funzione di utilit


u : R2+ ! R, ovvero per le sue curve di indierenza u 1 (k). Le funzioni implicite
informano, localmente, su come deve variare la quantit y al variare di x per mantenere
costante lutilit complessiva. Per esse si assumono propriet di monotonia e convessit
analoghe a quelle assunte per le funzioni implicite denite da isoquanti. La monotonia
della funzione implicita riette la parziale sostituibilit dei due beni: si pu consumare
632 CAPITOLO 19. DERIVAZIONE PARZIALE

un meno delluno e un popi dellaltro e mantenere intatto il livello complessivo di


utilit. La convessit della funzione implicita modella la classica ipotesi di saggi di
sostituzione decrescenti, secondo la quale allaumentare di una quantit di un bene,
per esempio x, occorrono variazioni compensative sempre maggiori dellaltro bene,
y, a nch si rimanga sulla medesima curva di indierenza, cio a nch u (x; y) =
u (x + x; y + y).
Il valore assoluto jf 0 j della derivata della funzione implicita detto saggio (o tas-
so) marginale di sostituzione: misura la variazione (negativa) da apportare a y che
bilancia marginalmente un aumento di x. Geometricamente la pendenza della curva
di indierenza in (x; y) e, grazie al Teorema di Dini, si ha
@u
(x; y)
SM Sx;y = f 0 (x) = @x
@u
@y
(x; y)

che la classica forma del saggio marginale di sostituzione.

Sia h una funzione scalare strettamente crescente e derivabile. Per la Regola della
catena si ha
@h u
@x
(x; y) h0 (u (x; y)) @u
@x
(x; y) @u
@x
(x; y)
@h u
= =
@y
(x; y) h0 (u (x; y)) @u
@y
(x; y) @u
@y
(x; y)
La derivata h0 (u (x; y)) si elide e quindi il saggio marginale di sostituzione lo stesso
per u e per tutte le trasformazioni crescenti h u. Il saggio marginale di sostituzione
una nozione ordinale, invariante per trasformazioni strettamente crescenti, che non
dipende dalla scelta di una tra le equivalenti funzioni di utilit u e h u. Ci spiega la
centralit di tale nozione nella Teoria del consumatore, dove ha sostituito la nozione
di utilit marginale, che invece, come gi osservato, non una nozione ordinale.

Esempio 370 Consideriamo le equivalenti funzioni di utilit Cobb-Douglas u (x; y) =


x y 1 e log-lineare log (u (x; y)) = log x + (1 ) log y. Si ha
@u @ log(u(x;y))
@x
(x; y) x 1y1 y @x
(x; y)
SM Sx;y = @u
= = = @ log(u(x;y))
@y
(x; y) (1 )x y 1 x (x; y)
@y

Le due funzioni di utilit hanno quindi lo stesso saggio marginale di sostituzione. N

Da ultimo, consideriamo un consumatore che consumi in due periodi, oggi e domani,


con funzione di utilit intertemporale U : R2+ ! R data da

U (c1 ; c2 ) = u (c1 ) + u (c2 )

dove si assume la stessa funzione di utilit istantanea u nei due periodi. Fissato un
livello di utilit k, sia
1
U (k) = (c1 ; c2 ) 2 R2+ : U (c1 ; c2 ) = k
19.5. FUNZIONI IMPLICITE 633

la relativa curva di indierenza e sia (c1 ; c2 ) un suo punto. Quando le ipotesi del
Teorema di Dini sono soddisfatte in tale punto, esiste una funzione implicita f :
B (c2 ) ! B (c1 ) tale che7

U (f (c2 ) ; c2 ) = 0 8c2 2 B (c2 )

La funzione scalare c1 = f (c2 ) informa su come deve variare la quantit c1 di consumo


oggi al variare della quantit c2 di consumo domani per mantenere costante lutilit
complessiva U . Si ha:

@U
(c1 ; c2 )
@c2 u0 (c2 )
SM SIc1 ;c2 = f 0 (c2 ) = =
@U u0 (c1 )
(c1 ; c2 )
@c1

Quando esiste
u0 (c2 )
jf 0 (c2 )j = (19.23)
u0 (c1 )
detto saggio (o tasso) marginale di sostituzione intertemporale: misura la variazione
(negativa) da apportare a c1 che bilancia marginalmente un aumento di c2 .

Esempio 371 Consideriamo la funzione di utilit potenza u (c) = c = per > 0. Si


ha
c c
U (c1 ; c2 ) = 1 + 2

sicch il saggio marginale di sostituzione intertemporale :


1
c2
c1

19.5.3 Estensioni
Chiudiamo la sezione con un paio di estensioni del Teorema di Dini.

Approssimazione quadratica
Il Teorema di Dini aerma, inter alia, che se la funzione g dierenziabile con
continuit, anche la funzione implicita f lo . Il prossimo teorema estende tale
propriet.
7
Per evitare confusione col simbolo di utilit, qui usiamo la lettera B per gli intorni.
634 CAPITOLO 19. DERIVAZIONE PARZIALE

Teorema 325 Se nel Teorema di Dini la funzione g derivabile due volte con con-
tinuit8 , allora anche la funzione implicita f ha derivata seconda continua. In tal
caso
2 2
@g(x;y) @g(x;y)
@2x @y
2 @g(x;y)
@x@y
@g(x;y) @g(x;y)
@x @y
+ @g(x;y)
@2y
@g(x;y)
@x
f 00 (x) = 3 (19.24)
@g(x;y)
@y

per ogni x 2 U (x0 ).

Lespressione appena indicata, riscritta per brevit come


00 02 00 0 0 00 02
00
gxx gy 2gxy gx gy + gyy gx
f (x) = 03
gy

ha il numeratore che ricorda lo sviluppo di un quadrato, il che aiuta a rammentarla.

Ci che s visto negli ultimi due teoremi consente di fornire approssimazioni locali
di una funzione denita implicitamente. Come sappiamo, molto raro poter scri-
vere lespressione esplicita di una funzione implicitamente denita da unequazione: la
possibilit di fornirne approssimazioni risulta perci oltremodo importante.
Se g dierenziabile con continuit su un aperto A, in un punto (x0 ; y0 ) 2 A tale
che g (x0 ; y0 ) = 0 lapprossimazione del primo ordine della funzione implicitamente
denita
@g
(x0 ; f (x0 ))
f (x) = y0 @x (x x0 ) + o (x x0 )
@g
(x0 ; f (x0 ))
@y
per x ! x0 .
Se g ha derivate parziali derivabili con continuit su un aperto A, in un punto
(x0 ; y0 ) 2 A tale che g (x0 ; y0 ) = 0 lapprossimazione del secondo ordine (spesso detta
quadratica) della funzione implicita , per x ! x0 ,
00 0 2 00 0 0 00 02
gx0 gxx gy 2gxy gx gy + gyy gx
f (x) = y0 (x x0 ) + (x x0 )2 + o (x x0 )2
gy0 03
gy

dove per brevit abbiamo omesso lindicazione della dipendenza delle varie derivate
dal punto (x0 ; f (x0 )).

Esempio 372 Per la funzione dellEsempio 366 si ha

00 2 (3x0 + 2y0 )2 6 (2x0 + 3y0 ) (3x0 + 2y0 ) + 2 (2x0 + 3y0 )2


f (x0 ) =
(3x0 + 2y0 )3
8
Ossia, ha derivate parziali derivabili con continuit.
19.5. FUNZIONI IMPLICITE 635

e quindi lapprossimazione quadratica di f , per x ! x0 ,


2x + 3y0
f (x) = y0 (x x0 )
3x + 2y0
2 (3x0 + 2y0 )2 6 (2x0 + 3y0 ) (3x0 + 2y0 ) + 2 (2x0 + 3y0 )2
(x x0 )2
(3x0 + 2y0 )3
+o (x x0 )2

in un generico punto (x 0 ; y0 ) 2 g 1 (0). Per esempio, in (x 0 ; y0 ) = (0; 1) 2 g 1 (0) si


ha
3 10 2
f (0) = 1 x x + o (jxj)
2 8
per x ! 0:
Inoltre, la conoscenza della derivata seconda permette di completare lo studio del
punto stazionario (x0 ; y0 ) = (1=2; 1). Si ha

316
f 00 (x0 ) = >0
1331
e quindi il punto di minimo locale. N

Il caso vettoriale
Il Teorema di Dini si adatta in modo naturale al caso dove x un vettore. Siccome ora
la funzione implicita f di pi variabili, le derivate parziali @f (x) =@xk sostituiscono
la derivata f 0 (x) del caso scalare.

Teorema 326 Data g : A Rn R ! R, sia (x0 ; y0 ) 2 g 1


(0). Se g derivabile con
continuit in un intorno B (x0 ; y0 ) A, con

@g
(x0 ; y0 ) 6= 0
@y

allora esistono intorni U (x0 ) e V (y0 ) e ununica funzione di n variabili f : U (x0 ) !


V (y0 ) tale che
g (x; f (x)) = 0 8x 2 U (x0 ) (19.25)
La funzione f suriettiva e derivabile con continuit in U (x0 ), con

@g
(x; y)
@f @xk 1
(x) = 8 (x; y) 2 g (0) \ U (x0 ) V (y0 ) : (19.26)
@xk @g
(x; y)
@y

per ogni k = 1; :::; n.


636 CAPITOLO 19. DERIVAZIONE PARZIALE

Anche qui lunicit e suriettivit della f rende la (19.25) equivalente a:

g (x; y) = 0 () y = f (x) 8 (x; y) 2 U (x0 ) V (y0 )


1
sicch la curva di livello g (0) localmente rappresentabile come graco di f :
1
g (0) \ (U (x0 ) V (y0 )) = Gr f

Usando il gradiente, la (19.26) si scrive come


1
rf (x) = rx g (x; y)
@g
(x; y)
@y
avendo indicato con rx g il gradiente parziale (rispetto alle sole x1 , x2 , ..., xn ) di g.

Il Teorema 326 consente di estendere a Rn lo studio dei saggi marginali visto nella
sezione precedente per n = 2. Per brevit omettiamo i dettagli e ci limitiamo qui a
illustrare il teorema con un esempio analitico.

Esempio 373 Siano

g (x1 ; x2 ; y) = x21 x22 + y 3 ; (x1 ; x2 ; y0 ) = (6; 3; 3)

Si ha g 2 C 1 (R3 ) e risulta (@g=@y) (x; y) = 3y 2 , sicch


@g
(6; 3; 3) = 27 6= 0
@y
Per il Teorema di Dini esiste ununica y = f (x1 ; x2 ) denita in un intorno U (6; 3), ivi
derivabile e con valori in un intorno V ( 3). Poich
@g @g
(x; y) = 2x1 e (x; y) = 2x2
@x1 @x2

risulta
@f 2x1 @f 2x2
(x) = e (x) = 2
@x1 3y 2 @x2 3y

In particolare
4 2
rf (6; 3) = ;
27 27

Il lettore pu vericare lesistenza di una funzione implicita in senso globale f : R2 ! R


e, dopo averne trovato lespressione esplicita (che qui esiste data la semplicit di g),
vericare la correttezza della formula di Dini per il calcolo di rf (x) : N
Capitolo 20

Propriet dierenziali

20.1 Estremi e punti critici


20.1.1 Preambolo
Sinora abbiamo considerato la nozione di derivabilit per funzioni denite su intorni,
ossia su intervalli aperti (a; b) per funzioni scalari e, pi in generale, su palle aperte U
per funzioni di pi variabili. Per studiare i problemi di ottimo dobbiamo considerare
funzioni f : A Rn ! R denite su un sottoinsieme A qualsiasi di Rn . Per fortuna,
tutto quanto visto nora per un punto qualsiasi di un intorno U si estende immedi-
atamente ai punti interni di A. Infatti, se x0 un punto interno di A, esiste un suo
intorno U tale che U A. La restrizione fjU di f su U derivabile in x0 se il limite

fjU (x0 + h) fjU (x0 )


lim
h!0 h
esiste nito. Ma, per ogni h tale che x0 + h 2 U si ha

fjU (x0 + h) fjU (x0 ) f (x0 + h) f (x0 )


=
h h
e quindi
0 f (x0 + h) f (x0 )
fjU (x0 ) = lim
h!0 h
Possiamo dunque considerare direttamente il limite

f (x0 + h) f (x0 )
lim
h!0 h
e dire che f derivabile nel punto interno x0 se tale limite esiste nito. Indichiamo la
derivata con f 0 (x0 ).
La derivabilit dunque una nozione locale che usa solo le propriet della funzione
in un intorno, piccolo a piacere, del punto in esame.

637
638 CAPITOLO 20. PROPRIET DIFFERENZIALI

20.1.2 Teorema di Fermat


Nella Sezione 17.4 abbiamo visto in dettaglio le nozioni di massimo e di minimo lo-
cali. Come avevamo osservato, dal punto di vista delle applicazioni esse sono di poco
interesse, ma avevamo anche menzionato la loro importanza strumentale. Il prossimo
importantissimo Teorema di Fermat, uno dei pi classici dellAnalisi matematica, ne
la ragione.

Teorema 327 (Fermat) Sia f : A R ! R denita su un insieme A in R e sia C


un sottoinsieme di A. Sia f derivabile in un punto interno x^ di C. Se x^ punto di
estremo (massimo o minimo) locale di f su C, allora

f 0 (^
x) = 0: (20.1)

Condizione necessaria a nch un punto interno x^ sia di massimo o di minimo locale


dunque che la derivata (se esiste) in tale punto sia nulla. La fondamentale condizione
necessaria (20.1) si riveler decisiva nella risoluzione dei problemi di ottimo, donde il
ruolo strumentale degli estremi locali.

Dim. Sia x^ 2 C punto interno di massimo locale su C (un argomento simile vale se
di minimo locale). Esiste quindi B" (^
x) tale che valga la (17.11), ossia f (^
x) f (x)
per ogni x 2 B" (^x) \ C. Per ogni h > 0 su cientemente piccolo, ossia h 2 (0; "), si
ha x^ + h 2 B" (^
x). Quindi

f (^
x + h) f (^
x)
0 8h 2 (0; ") ;
h
il che implica
f (^
x + h) f (^
x)
lim+ 0: (20.2)
h!0 h
Daltra parte, per ogni h < 0 su cientemente piccolo, ossia h 2 ( "; 0), si ha x^ + h 2
B" (^x). Quindi
f (^
x + h) f (^ x)
0; 8h 2 ( "; 0) ;
h
il che implica
f (^
x + h) f (^
x)
lim 0: (20.3)
h!0 h
Insieme, le (20.2) e (20.3) implicano che

f (^
x + h) f (^
x) f (^
x + h) f (^
x) f (^
x + h) f (^
x)
0 lim = lim = lim+ 0;
h!0 h h!0 h h!0 h
e quindi, dato che per ipotesi esiste f 0 (^
x),

f (^
x + h) f (^
x)
f 0 (^
x) = lim = 0;
h!0 h
20.1. ESTREMI E PUNTI CRITICI 639

come desiderato.

OfB. La condizione (20.1) ha una semplice lettura euristica. Come vedremo tra breve,
se f 0 (x0 ) > 0 la funzione strettamente crescente in x0 , se f 0 (x0 ) > 0 la funzione
ivi strettamente decrescente. Se f massima in x0 non n strettamente crescente n
decrescente e perci la derivata, se esiste, non pu che essere nulla. H

importante mettere a fuoco i seguenti aspetti:

(i) lipotesi che x^ sia punto interno di C;

(ii) lipotesi di derivabilit in x^;

(iii) la condizione f 0 (^
x) = 0 solo necessaria.

Discutiamoli uno per uno.

(i) Lipotesi che x sia punto interno di C essenziale per il Teorema 327. Infatti,
consideriamo per esempio f : R ! R data da f (x) = x, e sia C = [0; 1]. Il punto di
frontiera x = 0 di minimo globale della funzione f su [0; 1], ma f 0 (0) = 1 6= 0. Allo
stesso modo, il punto di frontiera x = 1 di massimo, ma f 0 (1) = 1 6= 0. Quindi, se x
punto di massimo o di minimo locale di frontiera, non detto che si abbia f 0 (x) = 0.

(ii) Il Teorema 327 non applicabile a funzioni che, pur avendo punti interni di
massimo o di minimo, non sono derivabili in tali punti. Un esempio classico la
funzione f : R ! R data da f (x) = jxj: x = 0 punto di minimo globale, ma f non
ivi derivabile, e perci la condizione f 0 (x) = 0 non rilevante in questo caso. Un altro
esempio in proposito il seguente.
q
Esempio 374 Sia f : R ! R data da f (x) = 3 (x2 5x + 6)2 . Dato che x2 5x+6 =
(x 2) (x 3) si annulla (soltanto) per x = 2 e per x = 3, possiamo concludere che

f (x) 0 8x 2 R e f (2) = 0 ; f (3) = 0:

Pertanto x = 2 e x = 3 sono punti di minimo globale (debole e locale forte). Non


essendo superiormente limitata, la funzione non ammette alcun massimo globale1 . Si
osservi che la derivata di f
2 2 1 2 (2x 5)
f 0 (x) = x 5x + 6 3
(2x 5) = p
3 3
3 x2 5x + 6
e quindi essa non esiste ove x2 5x + 6 nulla, cio in entrambi i punti di minimo.N

(iii) Da ultimo, la condizione f 0 (x) = 0 solo necessaria. Il seguente semplicissimo


esempio non dovrebbe lasciare dubbi in proposito.
1
Il punto x = 5=2 di massimo locale: in esso f 0 (x) = 0.
640 CAPITOLO 20. PROPRIET DIFFERENZIALI

Esempio 375 Sia f : R ! R data da f (x) = x3 . Si ha f 0 (0) = 0 sebbene x0 = 0 non


sia n di massimo n di minimo locale2 . Il semplice esempio mostra che la condizione
(20.1) necessaria, ma non su ciente a nch un punto sia un estremo locale. N

Passiamo ora alla versione vettoriale del Teorema di Fermat. In tal caso la con-
dizione (20.1) si generalizza nella prossima condizione (20.4), ove il gradiente prende
il posto della derivata prima.

Teorema 328 Sia f : A Rn ! R una funzione a valori reali denita su un insieme


A in Rn e sia C un sottoinsieme di A. Sia f derivabile in un punto interno x^ di C. Se
x^ punto di massimo locale o di minimo locale di f su C, allora

rf (^
x) = 0: (20.4)

Lasciamo al lettore la dimostrazione che, mutatis mutandis, la stessa del Teorema


327.

OfB. Il Teorema 328 codica la seguente semplice intuizione: se f : A Rn ! R


massima (minima) in x^, allora anche tutte le sue sezioni 'i sono massime (minime) (in
x^i ), i = 1:2; : : : ; n (ubi maior ...). Il converso falso: pu accadere che tutte le sezioni
di f siano massime (minime) senza che lo sia f . Lesempio pi semplice il lenzuolo
bagnato. Si immagini di adagiare un lenzuolo bagnato su unintelaiatura di due li
per stendere tra loro perpendicolari e non perfettamente tesi (un pomolli): il punto
nel quale i due li si interscano il pi basso del telaio e perci esso simultaneamente
di minimo per le due proiezioni (cio percorrendo il lenzuolo seguendo luno o laltro
lo). Esso non per punto di minimo per lintera supercie del lenzuolo perch,
essendo bagnato, nei quattro spicchi tra i due li, scende ancor pi in basso. H

20.1.3 Punti stazionari


I punti x^ di Rn tali che rf (^
x) = 0, in particolare per n = 1 i punti tali che f 0 (^
x) = 0,
si dicono punti stazionari o critici di f . Usando tale terminologia, il Teorema 328 si
pu parafrasare dicendo che condizione necessaria a nch un punto interno x sia di
minimo o di massimo locale che esso sia stazionario.

Esempio 376 Sia f : R ! R data da f (x) = 10x3 (x 1)2 . La condizione necessaria


(20.1) diventa
10x2 (x 1) (5x 3) = 0
e quindi i punti che soddisfano la condizione sono x = 0, x = 1 e x = 3=5. N
2
Infatti f (x) < 0 per ogni x < 0 e f (x) > 0 per ogni x > 0.
20.1. ESTREMI E PUNTI CRITICI 641

Esempio 377 Sia f : R2 ! R denita come f (x1 ; x2 ) = 2x21 + x22 3 (x1 + x2 ) +


x1 x2 3. Si ha
rf (x) = (4x1 3 + x2 ; 2x2 3 + x1 ) :
La condizione (20.4) qui assume la forma

4x1 3 + x2 = 0
:
2x2 3 + x1 = 0

facile vedere che x = (3=7; 9=7) lunica soluzione del sistema ed quindi lunico
punto stazionario di f su R2 . N

Esempio 378 Sia f : R2 ! R denita come f (x1 ; x2 ) = x21 x22 . Si ha

rf (x) = (2x1 ; 2x2 )

e la condizione (20.4) ha la forma


(
2x1 = 0
:
2x2 = 0

Lunica soluzione del sistema (0; 0), che quindi lunico punto critico di f su R2 .
facile vedere che questo punto non n di massimo n di minimo. Infatti, se con-
sideriamo qualsiasi punto (0; x2 ) diverso dallorigine sullasse delle ordinate e qualsiasi
punto (x1 ; 0) diverso dallorigine sullasse delle ascisse, abbiamo

f (0; x2 ) = x22 < 0 e f (x1 ; 0) = x21 > 0;

e quindi in ogni intorno del punto (0; 0) vi sono sia punti in cui la funzione stret-
tamente positiva sia punti in cui strettamente negativa. Siccome f (0; 0) = 0, ci
implica che (0; 0) non pu essere n punto di massimo n di minimo. Pertanto, al pari
del caso scalare, anche per funzioni di pi variabili vi possono essere punti stazionari
che non sono n di massimo n di minimo. N

20.1.4 Problemi di ottimo libero


Nel Capitolo 27 vedremo in dettaglio luso del Teorema di Fermat nella risoluzione di
problemi di ottimo. Possiamo per gi vederne un primo semplice uso in un problema
di ottimo libero
max f (x) sub x 2 C (20.5)
x

dove linsieme C un insieme aperto di Rn (si ricordi che nella Sezione 17.1 i problemi
di ottimo si erano detti liberi quando C aperto).
Assumiamo, com usuale nelle applicazioni, che f sia derivabile su C. In tal modo,
ogni eventuale estremo locale interno (essendo C aperto) e f ivi derivabile. Grazie
642 CAPITOLO 20. PROPRIET DIFFERENZIALI

al Teorema di Fermat, possiamo aermare che gli eventuali estremi locali di f su C


sono punti stazionari. A fortiori, ci vale per le eventuali soluzioni del problema (20.5)
poich tali soluzioni sono, ovviamente, anche massimi locali.
Quindi, per trovare le eventuali soluzioni del problema (20.5) occorre risolvere la
cosidetta condizione del primo ordine

rf (x) = 0

Le soluzioni del Problema di ottimo, se esistono, sono tra le soluzioni di questa


condizione, che necessaria (ma non su ciente!) a nch un punto sia un estremo
locale.

Esempio 379 Sia f : R3 ! R data da

f (x) = x41 + x42 4x1 x2

Si ha rf (x) = (4x31 4x2 ; 4x32 4x1 ) e quindi la condizione del primo ordine
(
4x31 4x2 = 0
4x32 4x1 = 0

cio (
x31 = x2
x32 = x1
I punti stazionari sono (0; 0), (1; 1) e ( 1; 1). Tra cui si debbono ricercare le eventuali
soluzioni del problema di ottimo libero

max f (x) sub x 2 R2


x

20.2 Teorema del valor medio


In questa sezione studiamo il Teorema del valor medio, di grande importanza teorica.
Cominciamo con un suo caso particolare, noto come Teorema di Rolle.

Teorema 329 (Rolle) Sia f : [a; b] ! R continua su [a; b] e derivabile su (a; b),
con f (a) = f (b). Allora, esiste (almeno) un punto critico x^ 2 (a; b), ossia un punto
x^ 2 (a; b) tale che f 0 (^
x) = 0.

Il teorema fornisce una semplice condizione su ciente a nch una funzione abbia
un punto critico. Il risultato ha unimmediata intuizione graca:
20.2. TEOREMA DEL VALOR MEDIO 643

6
y

1
O a c b x

0
0 1 2 3 4 5

Dim. Per il Teorema di Weierstrass, esistono x1 ; x2 2 [a; b] tali che f (x1 ) = minx2[a;b] f (x)
e f (x2 ) = maxx2[a;b] f (x). Poniamo m = minx2[a;b] f (x) e M = maxx2[a;b] f (x). Se
m = M , allora f costante, ossia f (x) = m = M , e quindi f 0 (x) = 0 per ogni
x 2 (a; b). Se m < M , allora almeno uno tra x1 e x2 interno ad [a; b]. Infatti, non
possono essere entrambi di frontiera perch f (a) = f (b). Se x1 punto interno di
[a; b], ossia x1 2 (a; b), allora per il Teorema 327 si ha f 0 (x1 ) = 0, e quindi x^ = x1 .
Analogamente, se x2 2 (a; b), si ha f 0 (x2 ) = 0, e quindi x^ = x2 .
p
Esempio 380 Sia f : [ 1; 1] ! R data da f (x) = 1 x2 . La funzione continua
su [ 1; 1] e derivabile su ( 1; 1). Poich f ( 1) = f (1) = 0, per il Teorema di
Rolle esiste un punto critico x^ 2 ( 1; 1), ossia tale che f 0 (^
x) = 0. In particolare, da
0 2
f (x) = x (1 x ) segue che il punto critico in ( 1; 1) x^ = 0. N
Data f : [a; b] ! R, consideriamo i punti (a; f (a)) e (b; f (b)) del suo graco. La
retta passante per tali punti ha equazione
f (b) f (a)
y = f (a) + (x a) (20.6)
b a
come il lettore pu vericare risolvendo il sistema
(
f (a) = ma + q
f (b) = mb + q
Questa retta svolge un ruolo chiave nel Teorema del valor medio (o dellincremento
nito o di Lagrange), che ora enunciamo e dimostriamo.
Teorema 330 (del valor medio, Lagrange) Sia f : [a; b] ! R continua su [a; b] e
derivabile su (a; b). Allora, esiste x^ 2 (a; b) tale che
f (b) f (a)
f 0 (^
x) = : (20.7)
b a
644 CAPITOLO 20. PROPRIET DIFFERENZIALI

Il Teorema di Rolle ne il caso particolare nel quale f (a) = f (b) e perci la


condizione (20.7) diventa f 0 (^
x) = 0.
Si noti che
f (b) f (a)
b a
il coe ciente angolare della retta (20.6) passante per i punti (a; f (a)) e (b; f (b)) del
graco di f , mentre f 0 (x) il coe ciente angolare della retta tangente al graco di
f nel punto (x; f (x)). Il Teorema del valor medio d quindi una semplice condizione
su ciente a nch esista un punto x^ 2 (a; b) tale che la retta tangente in (^ x)) sia
x; f (^
parallela alla retta passante per i punti (a; f (a)) e (b; f (b)). Gracamente:

6
y

1
O a c b x

0
0 1 2 3 4 5

Il nome di Teorema dellincremento nito deriva dal fatto che lincremento nito
(cio non innitesimo) f (b) f (a) della funzione sullintero intervallo [a; b] si pu
scrivere, grazie al Teorema, come

f (b) f (a) = f 0 (^
x) (b a) ;

ovvero, in modo equivalente,

f (b) f (a) = f 0 a + t^(b a) (b a)

per un opportuno 0 t^ 1. Infatti, si ha

[a; b] = f(1 t) a + tb : t 2 [0; 1]g = fa + t (b a) : t 2 [0; 1]g ;

ossia ogni punto x^ 2 [a; b] si pu scrivere nella forma a + t^(b a) con un opportuno
t^ 2 [0; 1].

Dim. Sia g : [a; b] ! R la funzione ausiliaria data da


f (b) f (a)
g (x) = f (x) f (a) + (x a) :
b a
20.2. TEOREMA DEL VALOR MEDIO 645

Essa la dierenza tra f e la retta passante per i punti (a; f (a)) e (b; f (b)). La
funzione g continua su [a; b] e derivabile su (a; b). Inoltre, si ha g (a) = g (b) = 0.
Per il Teorema di Rolle, esiste x^ 2 (a; b) tale che g 0 (^
x) = 0. Ma,
f (b) f (a)
g 0 (x) = f 0 (x)
b a
e quindi
f (b) f (a)
f 0 (^
x) = 0;
b a
ossia x^ soddisfa la condizione (20.7).

Vediamo una prima applicazione del Teorema del valor medio (nella prossima
sezione ne vedremo unaltra ancor pi importante), che mostra che la nullit della
derivata caratterizza le funzioni costanti.
Corollario 331 Sia f : [a; b] ! R continua su [a; b] e derivabile su (a; b). Si ha
f 0 (x) = 0 per ogni x 2 (a; b) se e solo se f costante, ossia se e solo se esiste k 2 R
tale che
f (x) = k 8x 2 [a; b] :
Dim. Mostriamo il Solo se, poich il Se la semplice propriet delle derivate vista
nellEsempio 331. Sia x 2 (a; b) e applichiamo il Teorema del valor medio sullintervallo
[a; x]. Esiste quindi x^ 2 (a; x) tale che
f (x) f (a)
0 = f 0 (^
x) = ;
x a
ossia f (x) = f (a). Poich x un punto qualsiasi in (a; b), ne segue che f (x) = f (a)
per ogni x 2 [a; b). Per la continuit in b, si ha anche f (a) = f (b).

Questa caratterizzazione delle funzioni costanti si riveler importante nella Teoria


dellintegrazione. In particolare, sar importante la seguente semplice generalizzazione
del Corollario 331.
Corollario 332 Siano f; g : [a; b] ! R continue su [a; b] e derivabili su (a; b). Si ha
f 0 (x) = g 0 (x) per ogni x 2 (a; b) se e solo se esiste k 2 R tale che
f (x) = g (x) + k 8x 2 [a; b] :
Dim. Anche qui ci limitiamo al Solo se essendo ovvio il Se. Sia h : [a; b] ! R
la funzione ausiliaria h (x) = f (x) g (x). Si ha h0 (x) = f 0 (x) g 0 (x) = 0 per ogni
x 2 (a; b), e quindi, per il Corollario 331, h costante su [a; b], ossia esiste k 2 R tale
che h (x) = k per ogni x 2 [a; b] e quindi f (x) = g (x) + k per ogni x 2 [a; b].

Due funzioni con uguale derivata prima sono dunque a loro volta uguali a meno
di una costante (additiva) k: luguaglianza delle derivate caratterizza le funzioni
(derivabili) uguali a meno di costanti.
646 CAPITOLO 20. PROPRIET DIFFERENZIALI

20.3 Monotonia e derivabilit


Vi uno stretto legame tra la monotonia di una funzione derivabile e il segno della
sua derivata. Ci permette di studiare la monotonia attraverso condizioni dieren-
ziali, ossia basate sulle propriet delle derivate. Si tratta di condizioni importanti sia
concettualmente sia operativamente per vericare le propriet di monotonia di una
funzione.

20.3.1 Monotonia scalare


Cominciamo con lintrodurre il concetto di monotonia di una funzione in un punto del
suo dominio. Per semplicit consideriamo solo le funzioni scalari.

Denizione 133 Siano f : A R ! R e x0 2 A \ A0 . La funzione f si dice


( localmente) crescente in x0 se esiste un suo intorno3 (a; b) tale che

f (x) f (x0 ) f (y) (20.8)

per ogni x; y 2 (a; b) \ A con x < x0 < y. Inoltre, la funzione si dice ( localmente)
strettamente crescente se le disuguaglianze in (20.8) sono strette.

Analoghe denizioni valgono per la (stretta) decrescenza in un punto.

A scanso di equivoci, ricordiamo che nella Sezione 7.4.4 avevamo denito la monoto-
nia in senso globale, dicendo (nella Denizione 46) che una funzione f : A R ! R
crescente se x > y =) f (x) f (y) e strettamente crescente se x > y =) f (x) >
f (y) per ogni x; y 2 A, valendo analoghe denizioni per la decrescenza.
Ovviamente, una funzione crescente su A crescente in ogni punto di A. Tra breve
vedremo che, in generale, il converso non vale, cio la monotonia locale in ogni punto
di A non garantisce la monotonia globale su A.

subito evidente la seguente

Proposizione 333 Sia f : A R ! R derivabile in x0 2 A. Se f crescente in x0 ,


allora4 f 0 (x0 ) 0. Se f 0 (x0 ) > 0, allora f strettamente crescente in x0 .

Dim. Se f crescente, i rapporti incrementali di f in x0 sono tutti positivi (almeno


per h su cientemente piccolo) e perci il loro limite 0. Se invece f 0 (x0 ) > 0, i
rapporti incrementali, almeno per h prossimo a 0, sono positivi per il Teorema della
permanenza del segno: ne segue che f (x0 + h) > f (x0 ) per h > 0 e f (x0 + h) < f (x0 )
per h < 0, con h su cientemente piccolo, e perci f strettamente crescente in x0 .

Si badi allasimmetria della precedente proposizione:


3
Eventualmente solo destro o solo sinistro quando x0 sia di frontiera.
4
La derivata intesa in senso unilaterale quando x0 di frontiera.
20.3. MONOTONIA E DERIVABILIT 647

f crescente in x0 =) f 0 (x0 ) 0
ma
f 0 (x0 ) > 0 =) f strettamente crescente in x0 :
La non negativit della derivata necessaria per la crescenza; la sua positivit
su ciente per la stretta crescenza. Analoga caratterizzazione vale per la (stretta)
decrescenza.

Esempio 381 (i) La funzione f : R ! R denita da f (x) = 2x2 3x strettamente


crescente in x0 = 5 essendo f 0 (5) = 17 > 0 e strettamente decrescente in x0 = 0
essendo f 0 (0) = 3 < 0.

(ii) La funzione f : R ! R denita da f (x) = x3 strettamente crescente in x0 = 0


(infatti x3 > 0 per ogni x > 0 e x3 < 0 per ogni x < 0) ma f 0 (0) = 0. N

Si potrebbe pensare che, se una funzione monotona in ogni punto di un insieme


A, palesi lo stesso tipo di monotonia anche su tutto A. Non aatto cos: per esempio,
la funzione
1
f (x) =
x
denita su R f0g ed strettamente crescente in ogni punto del suo dominio: infatti
f 0 (x) = 1=x2 > 0 per ogni x 6= 0. Ma, essa non aatto crescente perch, per esempio
1 < 1 ma f ( 1) = 1 > 1 = f (1).

8 y

0
O x
-2

-4

-6

-8
-4 -3 -2 -1 0 1 2 3 4 5

1
Graco di x
:
648 CAPITOLO 20. PROPRIET DIFFERENZIALI

Il punto sostanziale che f 0 (x) > 0 garantisce la crescenza di f nel punto x e


pu benissimo accadere che una funzione sia crescente in tutti i punti di un insieme
senza che lo sia su tutto linsieme: a naso, perch, se linsieme lunione di intervalli
disgiunti, ogni volta la funzione ricomincia da capo.
Dunque la monotonia puntuale in ogni punto di un insieme non implica la monoto-
nia globale. Ma, come mostra il prossimo importante risultato, tale garanzia c
quando linsieme un intervallo.

Proposizione 334 Una funzione f : (a; b) ! R derivabile su (a; b), con a; b 2 R,


(globalmente) crescente su (a; b) se e solo se f 0 (x) 0 per ogni x 2 (a; b).

Si noti che a; b 2 R, cio lintervallo (a; b) pu essere illimitato (per esempio,


(a; b) = R). Un risultato analogo, negativit della derivata su (a; b), vale per la
decrescenza. Si noti che il Corollario 331 un caso particolare di questo risultato
poich f 0 (x) = 0 per ogni x 2 (a; b) equivale ad avere sia f 0 (x) 0 sia f 0 (x) 0 per
ogni x 2 (a; b) e quindi, essendo f simultaneamente crescente e decrescente, costante.
La Proposizione vale, intendendo in senso unilaterale le derivate nei punti di
frontiera, anche per intervalli chiusi o semiaperti.

Dim. Solo se. Supponiamo che f sia crescente. Sia x 2 (a; b). Per ogni h > 0 si ha
f (x + h) f (x), e quindi
f (x + h) f (x)
0:
h
Ne segue che

f (x + h) f (x) f (x + h) f (x)
f 0 (x) = lim = lim+ 0:
h!0 h h!0 h

Se. Sia f 0 (x) 0 per ogni x 2 (a; b). Siano x1 ; x2 2 (a; b) con x1 > x2 . Per il
Teorema 330 del valor medio, esiste x^ 2 (a; b) tale che

f (x1 ) f (x2 )
f 0 (^
x) = : (20.9)
x1 x2

Poich f 0 (^
x) 0 e x1 x2 > 0, da (20.9) segue che f (x1 ) f (x2 ).

Esempio 382 Sia f : R ! R data da f (x) = 3x5 +2x3 . Poich f 0 (x) = 15x4 + 6x2
0 per ogni x 2 R, per la Proposizione 334 la funzione crescente. Daltra parte, per
la parabola denita da f (x) = x2 , si ha f 0 (x) = 2x, e quindi la Proposizione 334 (e
il suo analogo per la decrescenza) permette di concludere che f non n crescente n
decrescente su R, ma che crescente su (0; 1) e decrescente su ( 1; 0). N

Mostriamo ora che la stretta crescenza implicata dalla stretta positivit della
derivata.
20.3. MONOTONIA E DERIVABILIT 649

Proposizione 335 Sia f : (a; b) ! R derivabile su (a; b), con a; b 2 R. Se f 0 (x) > 0
per ogni x 2 (a; b), allora f strettamente crescente su (a; b).

Analogo risultato vale per la stretta decrescenza e per intervalli non aperti.

Dim. La dimostrazione simile a quella appena vista della Proposizione 334 ed una
semplice applicazione Teorema 330 del valor medio. Sia f 0 (x) > 0 per ogni x 2 (a; b)
e siano x1 ; x2 2 (a; b) con x1 > x2 . Per il Teorema 330 del valor medio, esiste c 2 (a; b)
tale che
f (x1 ) f (x2 )
f 0 (c) = : (20.10)
x1 x2
Poich f 0 (c) > 0 per ogni c e x1 x2 > 0, da (20.10) segue che f (x1 ) > f (x2 ).

Il converso del precedente risultato non vale, come mostra il prossimo esempio.

Esempio 383 Sia f : R ! R data da f (x) = x3 . La funzione strettamente


crescente in ogni punto, ma f 0 (0) = 0 e quindi non si ha f 0 (x) > 0 per ogni x 2 R. N

Analoghe proposizioni valgono per la decrescenza (f 0 (x) 0) e per la stretta


decrescenza (f 0 (x) < 0).
Illustriamo la Proposizione 335 con un esempio.

Esempio 384 Per la Proposizione 335, f (x) = x2 strettamente crescente su (0; +1)
e strettamente decrescente su ( 1; 0). Per tale proposizione, la funzione f (x) =
3x5 +2x3 strettamente crescente sia su ( 1; 0) sia su (0; 1). Tuttavia la proposizione
non pu garantire alcunch circa la stretta crescenza di f su tutto R perch f 0 (0) = 0.
Per determinare se f strettamente crescente su tutto R non resta che la verica
diretta usando la denizione di stretta crescenza. A tal ne, basta osservare che
f (y) < f (0) = 0 < f (x) per ogni y < 0 < x e ci prova che eettivamente f
strettamente crescente su tutto R. N

OfB. Una funzione derivabile e strettamente crescente su un intervallo ha dunque


derivata 0 (e non > 0 come molti credono). I punti nei quali la derivata nulla
sono per necessariamente isolati: se la derivata fosse nulla in un intero interval-
lo, la funzione sarebbe costante in esso (per il Corollario 331) e perci la funzione
non potrebbe essere strettamente crescente. Essendo isolati, tali punti sono al pi
uninnit numerabile (si ricordi il Lemma 176). H

OfB. Sera detto che f (x) (h) = f (x + h) f (x) = df (x) (h)+o (h). Consideriamo
ora i soli valori h > 0, cio immaginiamo di percorrere nel verso naturale lintervallo
(a; b) sul quale denita f . Se (e solo se) f 0 (x) > 0 per ogni x 2 (a; b) risulta
df (x) (h) = f 0 (x) h > 0 e quindi f (x) (h) > 0 perch lultimo addendo o (h) non
pu cambiare il segno del secondo membro.
Il segno della derivata (su (a; b)) si trascina dietro il segno del dierenziale che, a
sua volta, determina il segno dellincremento: dunque, se f 0 (x) > 0 per ogni x 2 (a; b),
650 CAPITOLO 20. PROPRIET DIFFERENZIALI

allora f (x) (h) = f (x + h) f (x) > 0 per ogni h > 0. Si pensi, per esempio, che f
sia un protto. Se f 0 > 0 (informazione di per s poco rilevante da un punto di vista
economico), allora f > 0 che uninformazione economicamente molto rilevante
perch mostra che, allaumentare di x, il protto cresce. H

OfB. Sera detto che lapprossimazione lineare del dierenziale fa capire se una fun-
zione va in su o in gi. ci che abbiamo visto ora. In un punto di massimo o di
minimo, la funzione non va n su n gi: perci necessariamente la derivata non n
positiva n negativa: se esiste, pu essere solo zero. H

20.3.2 Monotonia vettoriale


La Proposizione 334 si pu in parte estendere a funzioni di pi variabili, come mostra
il prossimo risultato.

Proposizione 336 Se una funzione derivabile f : U ! R denita su un intorno U


di Rn crescente, allora rf (x) 0 per ogni x 2 U .

Lasciamo al lettore la dimostrazione, che analoga a quella della Proposizione 334.


Con opportune condizioni aggiuntive, che il lettore incontrer in corsi successivi, vale
anche il converso. Altrimenti il converso falso: pu accadere che rf 0 senza che
f sia crescente, come il prossimo esempio mostra.

Esempio 385 Sia A il primo quadrate (assi esclusi) di R2 dal quale sia stato soppresso
il quadrato [1; 2] (0; 1] (si veda la gura).

La funzione f : A ! R denita da
( 1
x + x2
25 1
se (x1 ; x2 ) 2 A (2; 1) (0; 1)
f (x1 ; x2 ) = 1
x + x2 (1 x2 )2
25 1
se (x1 ; x2 ) 2 (2; 1) (0; 1)
20.4. UNA CONDIZIONE SUFFICIENTE PER ESTREMI LOCALI 651

ha gradiente

( 1
25
;1 se (x1 ; x2 ) 2 A (2; 1) (0; 1)
rf (x1 ; x2 ) = 1
25
;1 + 2 (1 x2 ) se (x1 ; x2 ) 2 (2; 1) (0; 1)

> 0 ma non crescente: infatti per esempio

1
f (0; 5; 0; 5) = 0; 5 + 0; 5 = 0; 52;
25

ma
1
f (2; 5; 0; 55) = 2; 5 + 0; 55 (1 0; 55)2 = 0; 4475:
25

Il trucco dellesempio che precede sta nella circostanza che, pur essendo A tutto
dun pezzo (connesso), le proiezioni '1 (x1 ), quando x2 2 (0; 1), hanno un dominio
che non lo , essendo formato da due intervalli disgiunti: in tal caso, come abbiamo
visto (si ricordi f (x) = 1=x), la positivit della derivata non garantisce la crescenza
globale.

20.4 Una condizione su ciente per estremi locali

Nella Sezione 20.1 avevamo studiato la fondamentale condizione necessaria di annul-


lamento della derivata prima per lesistenza di punti di massimo e di minimo locale.
Il semplice esempio f (x) = x3 aveva mostrato come la condizione fosse necessaria, ma
non su ciente. Grazie ai risultati appena visti su monotonia e derivabilit, possiamo
ora integrare quanto visto nella Sezione 20.1 con una condizione su ciente per le-
sistenza di punti di estremo locale. Per semplicit considereremo solo funzioni scalari,
lasciando a corsi successivi le versioni vettoriali di queste condizioni.
La condizione su ciente che cinteressa si basa su una semplice intuizione: perch
x0 sia punto di massimo locale, vi deve essere un intorno di x0 nel quale la funzione
dapprima cresce e poi, una volta scollinatoin x0 , decresce.
652 CAPITOLO 20. PROPRIET DIFFERENZIALI

6
y

O x x
0
1

0
-1 0 1 2 3 4 5

Proposizione 337 Sia f : A R ! R una funzione a valori reali denita su un


insieme A in R e sia C un sottoinsieme di A. Un punto interno x0 di C di massimo
locale se esiste un suo intorno U tale che f sia continua in x0 e derivabile in ogni
x 2 U fx0 g, con

x < x0 < y =) f 0 (x) 0 f 0 (y) 8x; y 2 U \ C: (20.11)

Se le disuguaglianze in (20.11) sono strette, il massimo locale forte.

In modo analogo si mostra che si ha un punto di minimo locale se in (20.11) si


ha f 0 (x) 0 f 0 (y), minimo che forte se f 0 (x) < 0 < f 0 (y). Si noti che non
richiesta la derivabilit di f in x0 , ma solo la sua continuit.

OfB. La precedente Proposizione non esclude che si abbia f 0 (x) = 0 = f 0 (y), cio che
f 0 (x) = 0, 8x 2 U \ C: in tal caso f costante e quindi simultaneamente massima
e minima su U \ C. H

Dim. Senza perdita di generalit, assumiamo che U = (x0 "; x0 + ") C. Sia
x 2 (x0 "; x0 ). Per il Teorema 330 esiste 2 (x0 "; x0 ) tale che
f (x0 ) f (x)
= f 0 ( ):
x0 x
Per la (20.11) si ha che f 0 ( ) 0, da cui si deduce che f (x0 ) f (x). In modo analogo
si dimostra che f (x0 ) f (y) per ogni y 2 (x0 ; x0 + "). In conclusione, f (x0 ) f (x)
per ogni x 2 U e dunque x0 punto di massimo locale.

Esempio 386 Sia f : R ! R data da f (x) = 1 x2 e consideriamo x0 = 0. Si ha


f 0 (x) = 2x e quindi la (20.11) soddisfatta in senso stretto. Grazie alla Proposizione
337 si pu concludere che x0 punto di massimo locale forte. N
20.4. UNA CONDIZIONE SUFFICIENTE PER ESTREMI LOCALI 653

Esempio 387 Sia f : R ! R dato da f (x) = jxj e consideriamo x0 = 0. La


funzione continua in x0 ed derivabile in ogni x 6= 0. Si ha
(
1 se x < 0
f 0 (x) =
1 se x > 0

e quindi la (20.11) soddisfatta in modo stretto. Grazie alla Proposizione 337, x0


punto di massimo locale forte. N

La precedente condizione su ciente si pu semplicare in modo sostanziale as-


sumendo che la funzione sia due volte derivabile in x0 . In questo caso, basta infatti
valutare il segno della derivata seconda nel punto.

Corollario 338 Sia f : A R ! R una funzione a valori reali denita su un insieme


A in R e sia C un sottoinsieme di A. Un punto interno x0 di C di massimo
locale forte se esiste un suo intorno U ove f due volte derivabile, con f 0 (x0 ) = 0 e
f 00 (x0 ) < 0.

Dim. Lo sviluppo di Taylor (21.5) che vedremo tra breve consente una facile di-
mostrazione che lasciamo al lettore. Se assumiamo che f sia due volte derivabile con
continuit5 , possiamo dare qui una dimostrazione diretta senza luso di Taylor. Gra-
zie alla continuit di f 00 in x0 , si ha limx!x0 f 00 (x) = f 00 (x0 ) < 0. Il Teorema della
permanenza del segno implica lesistenza di un intorno U = U" (x0 ) tale che f 00 (x) < 0
per ogni x 2 U . Quindi, per la Proposizione 335 la derivata prima f 0 strettamente
decrescente in U , ossia

x < x0 < y =) f 0 (x) > f 0 (x0 ) = 0 > f 0 (y) :

Grazie alla Proposizione 337, possiamo concludere che x0 di massimo locale stretto.

Tornando allEsempio 386, grazie al Corollario 338, basta osservare che f 00 (0) =
2 < 0 per concludere che x0 = 0 punto di massimo locale forte. Si noti che,
invece, il Corollario 338 non si pu applicare allEsempio 386 perch f (x) = jxj non
derivabile in x0 = 0.

Il prossimo esempio mostra che la condizione f 00 (x0 ) < 0 su ciente, ma non


necessaria: esistono punti di massimo locale x0 per i quali non si ha f 00 (x0 ) < 0.

Esempio 388 Sia f : R ! R data da f (x) = x4 . Il punto x0 = 0 di massimo


locale, bench f 00 (x0 ) = 0. N

Il Corollario 338 consente di aermare che, per un punto stazionario, ossia tale che
f 0 (x0 ) = 0:
5
Ossia, f 0 e f 00 sono continue su U .
654 CAPITOLO 20. PROPRIET DIFFERENZIALI

(i) f 00 (x0 ) < 0 permette di concludere che x0 di massimo locale;

(ii) f 00 (x0 ) > 0 permette di concludere che x0 di minimo locale;

(iii) f 00 (x0 ) 0 non esclude che x0 sia di massimo locale;

(iv) f 00 (x0 ) 0 non esclude che x0 sia di minimo locale.

Possiamo allora riformulare il precedente corollario cos:

Corollario 339 Sia f : A R ! R denita su un insieme A in R e sia C un


sottoinsieme di A.

(i) Condizione necessaria a nch un punto interno x0 di C sia di massimo locale


che esista un suo intorno U ove f due volte derivabile con continuit, con
f 0 (x0 ) = 0 e f 00 (x0 ) 0.

(ii) Condizione su ciente a nch un punto interno x0 di C sia di massimo locale


(forte) che esista un suo intorno U ove f due volte derivabile con continuit,
con f 0 (x0 ) = 0 e f 00 (x0 ) < 0.

Intuitivamente, se f 0 (x0 ) = 0 e f 00 (x0 ) < 0, la derivata in x0 nulla e strettamente


decrescente (perch la sua derivata f 00 negativa): perci essa, essendo nulla in x0 ,
passa da valori positivi a valori negativi. Dunque la funzione crescente prima di x0 ,
stazionaria in x0 e decrescente dopo x0 : si conclude facilmente che essa massima in
x0 .
Alternativamente, in x0 , f stazionaria e concava (si veda oltre) e perci massima.

Analogo commento vale negli altri casi: per esempio, se f 0 (x0 ) = 0 e f 00 (x0 ) 0,
la derivata in x0 nulla e non strettamente crescente (perch la sua derivata f 00 non
positiva): non si pu escludere che x0 sia di massimo.

20.4.1 Ricerca di estremi locali


Alla luce dei risultati visti sinora, e in particolare del Corollario 339, possiamo sta-
bilire una procedura per la ricerca dei punti di massimo e di minimo locali su C di
unassegnata funzione scalare f : A R ! R due volte dierenziabile. Essa sar
notevolmente a nata nella Sezione 21.3.
Indichiamo con int C linsieme dei punti interni di C e supponiamo che f sia
derivabile due volte con continuit su int C.
La procedura prevede due fasi:

1. Grazie al Teorema di Fermat, si determina linsieme S int C dei punti interni


stazionari di f . In altre parole, si calcola f 0 (x) e si risolve lequazione f 0 (x) = 0,
raccogliendone le soluzioni x1 ; x2 ; x3 ; ::: nellinsieme S.
20.4. UNA CONDIZIONE SUFFICIENTE PER ESTREMI LOCALI 655

2. Si calcola f 00 in ciascuno dei punti stazionari x 2 S: il punto x di massimo


locale forte se f 00 (x) < 0; di minimo locale forte se f 00 (x) > 0. Se f 00 (x) = 0
la regola fallisce.
Riettiamo sul percorso. Dopo il primo passo, che cosa possiamo dire relativa-
mente ai punti x1 ; x2 ; x3 ; :::? Essi potrebbero essere di massimo, potrebbero essere di
minimo, ma potrebbero anche non essere n di massimo n di minimo (soddisfanno
soltanto una condizione necessaria). C allora da chiedersi: ma perch labbiamo
fatto? Anche senza risolvere lequazione f 0 (x) = 0, sapevamo gi che un punto pu
essere di massimo, di minimo, o n luno n laltro!
Il motivo che di tali x1 ; x2 ; x3 ; : : : non sappiamo proprio nulla, ma sappiamo che
ogni altro punto interno (non compreso nellelenco) non pu essere n di massimo n
di minimo perch viola una condizione necessaria. Dunque, la conoscenza acquisita
dopo il primo passo in negativo: possiamo escludere che tutti i punti interni diversi
da x1 ; x2 ; x3 ; : : : siano di massimo o di minimo. In altri termini la fase 1 seleziona i
punti interni, ossia i punti x 2 int C, che sono possibili candidati a essere estremi
locali.
La fase 2, invece, prende in esame uno ad uno i possibili candidati e cerca di
determinare, attraverso la condizione su ciente sulla derivata seconda, se essi sono
eettivamente estremi locali.
Esempio 389 Sia f : R ! R data da f (x) = 10x3 (x 1)2 e C = R. Proviamo a
determinare con la procedura gli estremi locali di f su R. Si ha
C = int C = R
e f due volte derivabile con continuit su R. Per la prima fase ricordando quanto
visto nellEsempio 376:
S = f0; 1; 3=5g :
I punti stazionari in S sono gli unici candidati a essere estremi locali. Per la fase 2, si
ha
f 00 (x) = 60x (x 1)2 + 120x2 (x 1) + 20x3
e quindi f 00 (0) = 0, f 00 (1) > 0 e f 00 (3=5) < 0. Quindi, il punto 1 di minimo locale
forte, il punto 3=5 di massimo locale forte, mentre resta indeterminata la natura del
punto 0. N
La procedura, pur molto utile, ha importanti limitazioni. Prima di tutto, essa
pu solo considerare i punti interni di C dove f due volte derivabile con continuit,
mentre del tutto silente sugli altri punti di C, cio sui suoi punti di frontiera nonch
sui suoi punti interni dove f non due volte derivabile con continuit.
Esempio 390 Sia f : [0; 1] ! R denita come
(
x se x 2 (0; 1)
f (x) = :
2 se x 2 f0; 1g
656 CAPITOLO 20. PROPRIET DIFFERENZIALI

I punti di frontiera f0; 1g sono massimi locali, ma la procedura non in grado di


riconoscerli come tali. N
Si osservi che la fase 1, la pi importante, si applica pi generalmente a tutti i
punti interni dove f derivabile, perch nulla di pi serve per applicare il Teorema di
Fermat.

Unulteriore limitazione della procedura lindeterminazione del caso f 00 (0) = 0.


La semplice funzione f (x) = x4 ben illustra questa limitazione: la natura di minimo
locale del punto stazionario x = 0 non determinabile tramite la procedura perch
f 00 (0) = 0. Vediamo un altro esempio, pi banale ma pi grave.
Esempio 391 Consideriamo una funzione costante f (x) = k per ogni x 2 R. Essa
banalmente derivabile due volte con continuit su R. Dato un insieme aperto qualsiasi
C di R, si ha f 0 (x) = f 00 (x) = 0 per ogni x 2 C. Quindi, tutti i punti di C sono
stazionari e la procedura non in grado di dire alcunch circa la loro natura. Ma essi
sono ovviamente tutti punti sia di massimo sia di minimo. N
Il punto x = 0 per la funzione f (x) = x4 di minimo forte. Nella Sezione 21.2
vedremo una forma pi potente della procedura che permette di arontare il caso
dubbio f 00 (x) = 0 se la funzione derivabile con continuit un numero su ciente di
volte.
La procedura, e ogni suo a namento, sono invece impotenti di fronte a massimi
locali non forti, quali per esempio tutti i punti C dellultimo esempio. Le condizioni
su cienti del tipo f 00 (x) ? 0 individuano solo gli estremi locali forti. Quindi, quando
f 00 (x) = 0 corrisponde a un estremo locale non forte, la procedura non in grado di
dare alcuna indicazione circa la natura di tale punto stazionario.

20.4.2 Ottimi liberi


Possiamo applicare quanto visto al problema (20.5) di ottimo libero. Supponiamo che
f sia due volte derivabile con continuit su C. Grazie a quanto appena visto, dopo
aver determinato linsieme S \ C dei punti stazionari di f su C, se ne considera la
derivata seconda. Condizione necessaria a nch un punto x 2 S \ C sia soluzione del
problema che f 00 (x) 0. Infatti, se f 00 (x) > 0, il punto x di minimo locale e non
pu quindi essere soluzione.
Si noti come la globalit della soluzione determini una diversa prospettiva sulla
condizione del secondo ordine, non su ciente ma necessaria. Infatti, la circostanza
che f 00 (x) < 0 implichi che x sia massimo locale forte uninformazione secondaria
perch non conclusiva: il punto potrebbe essere solo di massimo locale, e del resto
potremmo avere soluzioni anche ove f 00 (x) = 0. Invece, linformazione f 00 (x) > 0
conclusiva in quanto esclude, ipso facto, che x possa essere soluzione.
un altro esempio di come il punto di vista globale, al quale siamo realmente
interessati, possa portare a vedere le cose in modo diverso rispetto ad un punto di
vista locale.
20.5. TEOREMA E REGOLA DI DE LHOSPITAL 657

20.5 Teorema e regola di de lHospital


20.5.1 Forme di indeterminazione 0=0 e 1=1
In questa sezione consideriamo la cosiddetta regola di de lHospital6 , unaltra classica
applicazione del Teorema del valor medio, che si rivela di grande utilit nel calcolo di
limiti che si presentano nelle forme di indeterminazione 0=0 e 1=1.
Come vedremo, la regola aerma che, in opportune condizioni, si pu ricondurre
il calcolo del limite limx!x0 f (x) =g (x) di un rapporto a quello del rapporto tra le
derivate, cio limx!x0 f 0 (x) =g 0 (x). Siccome questultimo limite pu risultare pi sem-
plice delloriginario, la regola ore uno strumento in pi nel calcolo dei limiti. Come
appena anticipato, essa si rivela particolarmente preziosa per le forme di indetermi-
nazione del tipo 0=0 e 1=1 (alle quali, come sappiamo, si possono ricondurre tutte
le altre).

Teorema 340 (de lHospital) Siano f; g : (a; b) ! R derivabili su (a; b), con g 0 (x) 6=
0 per ogni x 2 (a; b), e sia x0 2 [a; b], con

f 0 (x)
lim = L 2 R: (20.12)
x!x0 g 0 (x)

Se limx!x0 f (x) = limx!x0 g (x) = 0 oppure limx!x0 g (x) = 1, allora

f (x)
lim = L:
x!x0 g (x)

La regola di de lHospital aerma dunque che, nelle ipotesi appena indicate, si ha

f 0 (x) f (x)
lim = L =) lim = L;
x!x0 g 0 (x) x!x0 g (x)

ossia che il calcolo del limite limx!x0 f (x) =g (x) pu ricondursi al calcolo del limite
del rapporto tra le derivate: limx!x0 f 0 (x) =g 0 (x). Tanto pi semplice il secondo
rispetto alloriginario, tanto maggiore lutilit della regola. Essa si applica anche ai
limiti unilaterali, sebbene per brevit omettiamo tale parte nellenunciato.

Dimostreremo il Teorema di de lHospital nella Sezione 20.5.3. Vi tuttavia un caso


speciale di dimostrazione elementare. Siano f; g : (a; b) ! R derivabili con continuit7
su (a; b), con g 0 (x) 6= 0 per ogni x 2 (a; b), e sia x0 2 (a; b), con limx!x0 f (x) =
limx!x0 g (x) = 0. Allora,

f 0 (x) f (x)
lim 0
= L 2 R =) lim = L: (20.13)
x!x0 g (x) g (x)
6
In realt il risultato dovuto a Jean Bernoulli.
7
Ossia f; g 2 C 1 (a; b).
658 CAPITOLO 20. PROPRIET DIFFERENZIALI

Infatti, risultando f (x0 ) = limx!x0 f (x) = g (x0 ) = limx!x0 g (x) = 0 per la


continuit di f e g,

f (x0 + h) f (x0 )
f (x0 + h) f (x0 + h) f (x0 ) h
= =
g (x0 + h) g (x0 + h) g (x0 ) g (x0 + h) g (x0 )
h
e quindi, poich per ipotesi limx!x0 f 0 (x) =g 0 (x) esiste (nito o innito), si ha

f (x0 + h) f (x0 )
f 0 (x) f 0 (x0 ) limh!0
lim = 0 = h =
x!x0 g 0 (x) g (x0 ) g (x0 + h) g (x0 )
limh!0
h
f (x0 + h) f (x0 )
h f (x0 + h) f (x)
= lim = lim = lim
h!0 g (x0 + h) g (x0 ) h!0 g (x0 + h) x!x0 g (x)

h
che prova la (20.13).

Illustriamo subito la regola di de lHospital con alcuni esempi.

Esempio 392 Sia f : ( 1; +1) ! R data da f (x) = log (1 + x) e sia g : R ! R


data da g (x) = x. Per x0 = 0 il limite limx!x0 f (x) =g (x) si presenta nella forma di
indeterminazione 0=0. Vediamo se la regola di de lHospital pu applicarsi ed essere
di aiuto. Sia B" (0) = ( "; ") un intorno di x0 tale che ( "; ") ( 1; +1). In tale
intorno di x0 sono soddisfatte le ipotesi della regola di de lHospital. Quindi,
1
f 0 (x) 1 f (x) log (1 + x)
lim 0 = lim 1+x = lim = 1 =) lim = lim =1:
x!x0 g (x) x!0 1 x!0 1 + x x!x0 g (x) x!0 x

la regola di de lHospital si rivelata di grande utilit nel risolvere una forma di


indeterminazione. N

Esempio 393 Siano f; g : R ! R date da f (x) = sin x e g (x) = x. Poniamo x0 = 0


e consideriamo il limite notevole limx!x0 f (x) =g (x). In ogni intervallo ( "; ") sono
soddisfatte le ipotesi della regola di de lHospital e quindi

f 0 (x) cos x f (x) sin x


lim = lim = lim cos x = 1 =) lim = lim = 1:
x!x0 g 0 (x) x!0 1 x!0 x!x 0 g (x) x!0 x

molto interessante osservare come la regola di de lHospital risolva in modo molto


semplice questo classico limite notevole. N
20.5. TEOREMA E REGOLA DI DE LHOSPITAL 659

Esempio 394 Sia f : R++ ! R data da f (x) = log x e sia g : R ! R data da


g (x) = x. Posto x0 = +1, il limite limx!x0 f (x) =g (x) si presenta nella forma di
indeterminazione 1=1. In ogni intervallo (a; +1), con a > 0, sono soddisfatte le
ipotesi della regola di de lHospital. Quindi,
1
f 0 (x) x f (x) log x
lim 0
= lim = 0 =) lim = lim = 0:
x!x0 g (x) x!+1 1 x!x0 g (x) x!+1 x

Il prossimo esempio mostra che per la risoluzione di alcuni limiti occorre applicare
pi volte la regola di de lHospital.

Esempio 395 Siano f; g : R ! R date da f (x) = ex e g (x) = x2 . Posto x0 = +1, il


limite limx!x0 f (x) =g (x) nella forma di indeterminazione 1=1. In ogni intervallo
(a; +1), con a > 0, sono soddisfatte le ipotesi della regola di de lHospital. Si ha

f 0 (x) ex 1 ex f (x) ex 1 ex
lim = lim = lim =) lim = lim = lim ; (20.14)
x!x0 g 0 (x) x!+1 2x 2 x!0 x x!x0 g (x) x!+1 x2 2 x!0 x
ottenendo un limite pi semplice, ma ancora irrisolto. Applichiamo di nuovo la regola
di de lHospital alle funzioni derivate f 0 ; g 0 : R ! R date da f 0 (x) = ex e g 0 (x) = x.
Ancora in ogni intervallo (a; +1), con a > 0, sono soddisfatte le ipotesi della regola
di de lHospital, e quindi
f 00 (x) ex f 0 (x) ex
lim = lim = +1 =) lim = lim = +1:
x!x0 g 00 (x) x!+1 1 x!x0 g 0 (x) x!+1 x

Grazie alla (20.14), possiamo concludere che

f (x) ex
lim = lim 2 = +1:
x!x0 g (x) x!+1 x

Per risolvere questo limite abbiamo dovuto applicare due volte la regola di de lHos-
pital. N

Esempio 396 In modo simile si pu calcolare il limite del rapporto tra f (x) = 1
cos x e g (x) = x2 per x ! 0:

f 0 (x) sin x cos x 1 f (x) 1 cos x 1


lim = lim = lim = =) lim = lim = :
x!x0 g 0 (x) x!0 2x x!0 2 2 x!x0 g (x) x!0 x2 2
N

In alcuni casi la regola di de lHospital inutile o addirittura controproducente. Ci


accade quando il comportamento del rapporto f 0 (x) =g 0 (x) pi irregolare di quello
del rapporto originario f (x) =g (x). I prossimi esempi illustrano questa situazione.
660 CAPITOLO 20. PROPRIET DIFFERENZIALI

2
Esempio 397 Siano f; g : R ! R date da f (x) = ex e g (x) = ex . Posto x0 = +1, il
limite limx!x0 f (x) =g (x) nella forma di indeterminazione 1=1. In ogni intervallo
(a; +1), con a > 0, sono soddisfatte le ipotesi della regola di de lHospital. Si ha
2 2 2 2
f 0 (x) 2xex xex f (x) ex xex
lim 0 = lim = 2 lim =) lim = lim = 2 lim
x!x0 g (x) x!+1 ex x!+1 ex x!x0 g (x) x!+1 ex x!+1 ex

e quindi lapplicazione della regola di de lHospital ha portato a un limite pi compli-


cato delloriginario. In questo caso, la regola inutile, mentre il limite si risolve molto
facilmente in modo diretto:
2
ex 2
lim x = lim ex x
= lim ex(x 1)
= +1:
x!+1 e x!+1 x!+1

Esempio 398 Siano f; g : R ! R date da f (x) = sin x e g (x) = x. Posto x0 = +1,


si verica facilmente che limx!x0 f (x) =g (x) = 0. Daltra parte, in ogni intervallo
(a; +1), con a > 0, sono soddisfatte le ipotesi della regola di de lHospital poich
limx!+1 g (x) = +1. Ma il limite

f 0 (x) cos x
lim 0
= lim
x!x0 g (x) x!+1 1

non esiste. Se avessimo cercato di calcolare il semplice limite limx!x0 f (x) =g (x) = 0
attraverso la regola di de lHospital avremmo usato uno strumento sia inutile, data la
semplicit del limite, sia ine cace. Un uso meccanico della regola pu quindi essere
molto fuorviante. N

La regola di de lHospital quindi un utile strumento nel calcolo dei limiti, ma la


sua utilit devessere valutata caso per caso.

20.5.2 Altre forme di indeterminazione


La regola di de lHospital si pu applicare, mediante opportune manipolazioni, anche
alle forme di indeterminazione 1 1 e 0 1.
Cominciamo con la forma 0 1. Siano f; g : (a; b) ! R derivabili su (a; b) e
sia x0 2 [a; b] tale che limx!x0 f (x) = 0 e limx!x0 g (x) = 1, cosicch il limite
limx!x0 f (x) g (x) si presenta nella forma di indeterminazione 0 1. Sia, per esempio,
limx!x0 g (x) = +1 (il caso limx!x0 g (x) = 1 analogo). Esiste a > 0 tale che
g (x) > 0 per ogni x 2 (a; +1); si ha quindi

f (x)
lim f (x) g (x) = lim 1
x!x0 x!x0
g(x)
20.5. TEOREMA E REGOLA DI DE LHOSPITAL 661

con limx!x0 1=g (x) = 0 e si pu applicare la regola de lHospital alle funzioni f e 1=g.
Se f diversa da zero in un intorno di x0 , si pu anche scrivere
g (x)
lim f (x) g (x) = lim 1
x!x0 x!x0
f (x)

con limx!x0 1=f (x) = 1. In questo caso, la regola de lHospital si pu applicare alle
funzioni g e 1=f . Quale delle due possibili applicazioni della regola sia pi comoda
devessere valutato caso per caso.

Esempio 399 Sia f : R ! R data da f (x) = x e sia g : R++ ! R data da


f (x) = log x. Posto x0 = 0, il limite unilaterale limx!x+0 f (x) g (x) si presenta nella
forma di indeterminazione 0 1. La funzione 1=x denita e strettamente positiva su
R++ . Su ogni intervallo (a; +1), con a > 0, sono soddisfatte le ipotesi della regola di de
lHospital per le funzioni log x e 1=x poich limx!0+ log x = 1 e limx!0+ 1=x = +1.
Quindi
1
g 0 (x) x g (x)
lim 0 = lim+ 1 = lim+ ( x) = 0 =) lim+ 1 = lim+ f (x) g (x) = 0:
x!x0 1 x!0 x!0 x!x0 x!x0
x2 f (x)
f (x)

Passiamo ora alla forma di indeterminazione 1 1. Siano f; g : (a; b) ! R


derivabili su (a; b) e sia x0 2 [a; b] tale che limx!x0 f (x) = +1 e limx!x0 g (x) = 1.
Supponiamo, per semplicit, che in un intorno di x0 sia g sia f siano diverse da zero.
Vi sono almeno due possibili manipolazioni. Si pu considerare
g (x)
lim (f (x) + g (x)) = lim f (x) 1 + (20.15)
x!x0 x!x0 f (x)
e applicare la regola di de lHospital al limite limx!x0 g (x) =f (x), che ha la forma
1=1, oppure si pu considerare
1 1
+
f (x) g (x)
lim (f (x) + g (x)) = lim (20.16)
x!x0 x!x0 1
f (x) g (x)
e applicare la regola di de lHospital al limite
1 1
+
f (x) g (x)
lim
x!x0 1
f (x) g (x)
che nella forma 0=0.
662 CAPITOLO 20. PROPRIET DIFFERENZIALI

Esempio 400 Sia f : R ! R data da f (x) = x e sia g : R++ ! R data da


g (x) = log x. Posto x0 = +1, il limite limx!x0 (f (x) + g (x)) nella forma di
indeterminazione 1 1. NellEsempio 394 avevamo visto, grazie alla regola di de
lHospital, che limx!+1 (log x) =x = 0. Ne segue che

log x
lim (x log x) = lim x 1 = +1
x!+1 x!+1 x

e quindi la manipolazione (20.15) ci ha permesso di calcolare il limite. N

20.5.3 Dimostrazione del Teorema di de lHospital


Per dimostrare il Teorema (regola) di de lHospital ci occorrer la seguente sem-
plice generalizzazione del Teorema del valor medio che considera due funzioni f e
g. Ritroviamo il Teorema del valor medio quando g (x) = x.

Proposizione 341 Siano f; g : [a; b] ! R due funzioni continue su [a; b] e derivabili


su (a; b), con g 0 (x) 6= 0 per ogni x 2 (a; b). Allora, esiste x^ 2 (a; b) tale che

f 0 (^
x) f (b) f (a)
0
= : (20.17)
g (^ x) g (b) g (a)

Dim. Si considera la funzione ausiliaria h : [a; b] ! R data da

f (b) f (a)
h (x) = f (x) f (a) (g (x) g (a))
g (b) g (a)
e si procede come nella dimostrazione del Teorema del valor medio.

Dim. del Teorema di de lHospital. Consideriamo x0 2 [a; b), lasciando al lettore


il caso x0 = b. Supponiamo che L 2 [ 1; +1). Sia M > L e si prenda " > 0 tale che
L + " < M . Per la (20.12), esiste = " > 0 tale che x0 + 2 (a; b) e

f 0 (x)
x0 < x < x0 + =) < L + ": (20.18)
g 0 (x)

Siano x; y 2 (x0 ; x0 + ), con x < y. Per la Proposizione 341, applicata sullinter-


vallo [x; y], esiste x^ 2 (x; y) tale che

f 0 (^
x) f (y) f (x)
0
=
g (^ x) g (y) g (x)

e, per la (20.18), si ha
f (y) f (x)
< L + ": (20.19)
g (y) g (x)
Consideriamo due casi.
20.5. TEOREMA E REGOLA DI DE LHOSPITAL 663

Caso 1 : limx!x0 f (x) = limx!x0 g (x) = 0. La (20.19) implica


f (y) f (y) f (x)
= lim L+"<M
g (y) x!x 0 g (y) g (x)
e quindi
f (y)
y 2 (x0 ; x0 + ") =) < M: (20.20)
g (y)
Caso 2 : limx!x0 g (x) = +1 (il caso limx!x0 g (x) = 1 analogo). Esiste c1 2
(x0 ; y) tale che g (x) > g (y) e g (x) > 0 per ogni x 2 (x0 ; c1 ). Se, nella (20.19),
moltiplichiamo entrambi i termini per (g (x) g (y)) =g (x) otteniamo
f (y) f (x) g (x) g (y) f (x) f (y) g (x) g (y)
= < (L + ") ;
g (y) g (x) g (x) g (x) g (x)
ossia
f (x) g (y) f (y)
< (L + ") (L + ") + :
g (x) g (x) g (x)
Poich limx!x0 g (x) = +1, esiste c2 2 (x0 ; c1 ) tale che per ogni x 2 (x0 ; c2 ) si ha
g (y) f (y)
(L + ") (L + ") + <M
g (x) g (x)
e quindi
f (x)
x 2 (x0 ; c2 ) =) < M: (20.21)
g (x)
Grazie alle (20.20) e (20.21), possiamo concludere che, sia nel Caso 1 sia nel Caso
2, per ogni M > L esiste d = dM 2 (a; b) tale che
f (x)
x 2 (x0 ; d) =) < M: (20.22)
g (x)
In modo analogo, si pu mostrare che se L 2 ( 1; +1], allora per ogni m < L esiste
d 2 (a; b) tale che
f (x)
x 2 (x0 ; d) =) > m: (20.23)
g (x)
Se L = 1, la (20.22) implica limx!x0 f (x) =g (x) = 1. Se L = +1, la (20.23)
implica limx!x0 f (x) =g (x) = +1. Se L 2 R, per ogni " > 0 si ha L " < L < L + "
ed esistono quindi dL " ; dL+" 2 (a; b) tali che, posto " = min fdL " ; dL+" g, si ha
f (x)
x 2 (x0 ; x0 + ") =) L "< < L + ";
g (x)
ossia limx!x+0 f (x) =g (x) = L. Se x0 = a, ci implica che limx!x0 f (x) =g (x) =
L (si ricordi losservazione dopo la dimostrazione della Proposizione 164). Se, in-
vece, x0 2 (a; b), procedendo in modo analogo a quanto fatto nora, si mostra che
664 CAPITOLO 20. PROPRIET DIFFERENZIALI

limx!x0 f (x) =g (x) = L. Anche in questo caso si ha quindi limx!x0 f (x) =g (x) = L.

Si badi che il Teorema di de lHospital aerma che, se esiste il lim f 0 =g 0 , allora esiste
anche il lim f =g e che i due limiti sono uguali. Non vale il converso: pu benissimo
accadere che esista lim f =g senza che esita lim f 0 =g 0 . Gi ne abbiamo visto un esempio,
ma ne mostriamo altri due un popi complicati.

Esempio 401 Dette f (x) = x sin x e g (x) = x + sin x, risulta


sin x
f (x) x sin x 1
lim = lim = lim x = 1;
x!1 g (x) x!1 x + sin x x!1 sin x
1+
x
ma
f 0 (x) 1 cos x
lim 0
= lim
x!1 g (x) x!1 1 + cos x

non esiste perch sia il numeratore sia il denominatore oscillano tra 0 e 2 e quindi il
rapporto oscilla tra 0 e +1. N

1
Esempio 402 Dette f (x) = x2 sin e g (x) = log (1 + x), risulta
x
f (x) x2 sin x1 x sin x1 0
lim = lim = lim = = 0;
x!0 g (x) x!0 log (1 + x) x!0 log (1 + x) 1
x
ma
f 0 (x) 2x sin x1 cos x1
lim = lim
x!0 g 0 (x) x!0 1
1+x
non esiste perch il denominatore tende a 1 e al numeratore il primo addendo tende a
0 e il secondo non ammette limite. N
Capitolo 21

Approssimazione

21.1 Approssimazione polinomiale di Taylor


Grazie al Teorema 319, una funzione f : (a; b) ! R derivabile in x0 2 (a; b) ha
localmente, in tale punto, lapprossimazione lineare
f (x0 + h) = f (x0 ) + f 0 (x0 ) h + o (h) per h ! 0:
Le propriet fondamentali di tale approssimazione sono due:
(i) la semplicit della funzione approssimante: in questo caso la funzione lineare
df (x0 ) (h) = f 0 (x0 ) h;
(ii) la qualit dellapprossimazione, data dal termine di errore o (h).
Intuitivamente, vi una tensione tra le due propriet: pi semplice la funzione ap-
prossimante, peggiore la qualit dellapprossimazione. In altri termini, pi vogliamo
che la forma della funzione approssimante sia semplice, pi alto il costo in termine
di errore che verosimilmente si ha. In questa sezione vogliamo studiare pi in det-
taglio la relazione tra le due propriet. In particolare, supponiamo di indebolire la
propriet (i), accontendandoci di una funzione approssimante che sia un polinomio
di grado n, non necessariamente con n = 1 come nel caso di una retta. Il desideratum
che poniamo che vi sia un corrispondente miglioramento nel termine di errore che
lo porti a essere di magnitudo o (hn ). In altre parole, allaumentare del grado n del
polinomio approssimante, e quindi allaumentare della complessit dellapprossimante,
vogliamo che corrisponda un termine di errore che migliori in modo parallelo, cosicch
laumentare della complessit dellapprossimante sia controbilanciato dalla crescente
bont dellapprossimazione.
Per formalizzare tali idee, introduciamo la nozione di sviluppi polinomiali o di
Taylor1 . Si ricordi che un polinomio pn : R ! R al pi di grado n ha la forma
p (h) = 0 + 1 h + 2 h2 + + n hn .
1
Brook Taylor tenne fede al suo cognome tagliando su misura unapprossimazione polinomiale
per le funzioni.

665
666 CAPITOLO 21. APPROSSIMAZIONE

Denizione 134 Una funzione f : (a; b) ! R ammette sviluppo polinomiale (o di


Taylor) di grado n in x0 2 (a; b) se esiste un polinomio pn : R ! R al pi di grado n
tale che
f (x0 + h) = pn (h) + o (hn ) per h ! 0 (21.1)
per ogni h tale che x0 + h 2 (a; b), cio per ogni h 2 (x0 a; b x0 ).

Per n = 1, il polinomio pn si riduce alla funzione a ne r (h) = 0 + 1 h della


Sezione 18.11.1 e lapprossimazione (21.1) si riduce alla (18.22). Quindi, per n = 1 lo
sviluppo di f in x0 uguale, a meno del termine noto 0 , al dierenziale di f in x0 .
Per n 2 la nozione di sviluppo polinomiale va oltre il dierenziale. In particolare,
f ha uno sviluppo di Taylor di grado n in x0 2 (a; b) se esiste un polinomio pn : R ! R
che approssima f (x0 + h) con un errore che o (hn ), ossia che, per h ! 0, va a zero pi
velocemente di hn . A unapprossimazione polinomiale di Taylor di grado n corrisponde
quindi un termine di errore di magnitudo o (hn ), formalizzando in tal modo laccennata
tensione tra complessit della funzione approssimante e bont dellapprossimazione.
Per esempio, se n = 2, abbiamo la cosiddetta approssimazione quadratica:
2
f (x0 + h) = 0 + 1h + 2h + o h2 per h ! 0:

Rispetto allapprossimazione lineare

f (x0 + h) = 0 + h + o (h) per h ! 0

la funzione approssimante pi complicata: al posto di una retta abbiamo un poli-


nomio di secondo grado, ma daltra parte il termine di errore migliore: al posto di
o (h) abbiamo o (h2 ).
Vediamo unimportante propriet degli sviluppi di Taylor: quando esistono, sono
unici.

Lemma 342 Una funzione f : (a; b) ! R ha al pi un unico sviluppo polinomiale di


grado n in ogni punto x0 2 (a; b).

Dim. Supponiamo che, per ogni h 2 (x0 a; b x0 ), vi siano due diversi sviluppi
2 n n 2 n n
0+ 1h + 2h + + n h + o (h ) = 0+ 1h + 2h + + n h + o (h ) : (21.2)

Risulta allora
2 n
0 = lim 0 + 1h + 2h + + nh + o (hn )
h!0
2 n
= lim 0 + 1h + 2h + + nh + o (hn ) = 0
h!0

e la (21.2) diventa
2 n
1h + 2h + + nh + o (hn ) = 1h + 2h
2
+ + nh
n
+ o (hn ) ; (21.3)
21.1. APPROSSIMAZIONE POLINOMIALE DI TAYLOR 667

ossia, dividendo entrambi i membri per h,


n 1
1 + 2h + + nh + o hn 1
= 1 + 2h + + nh
n 1
+ o hn 1
:

Quindi,
n 1
1 = lim 1 + 2h + + nh + o hn 1
h!0
n 1
= lim 1 + 2h + + nh + o hn 1
= 1
h!0

e la (21.3) diventa
2 n
2h + + nh + o (hn ) = 2h
2
+ + nh
n
+ o (hn ) :

Iterando quanto fatto sopra, si mostra che 2 = 2 , e cos via no a mostrare che n =
n . Ci prova che vi al pi un polinomio p (h) che possa soddisfare lapprossimazione
(21.1).

Denizione 135 Sia f : (a; b) ! R una funzione derivabile n volte in un punto


x0 2 (a; b). Il polinomio Tn : R ! R di grado al pi n dato da

1 1 X f (k) (x0 )
n
Tn (h) = f (x0 ) + f (x0 ) h + f 00 (x0 ) h2 +
0
+ f (n) (x0 ) hn = hk
2 n! k=0
k!

si dice polinomio di Taylor di grado n di f in x0 .

Per comodit di notazione si posto f (0) = f . Tale polinomio ha come coe cienti
le derivate di f nel punto x0 sino allordine n. In particolare, se x0 = 0 il polinomio
di Taylor talvolta chiamato polinomio di MacLaurin.
Il prossimo risultato, fondamentale e di grande eleganza, mostra che se f oppor-
tunamente derivabile in x0 , lunico sviluppo polinomiale dato proprio dal polinomio
di Taylor.

Teorema 343 (Taylor) Sia f : (a; b) ! R derivabile n 1 volte su (a; b). Se f


derivabile n volte in x0 2 (a; b), allora f ha in x0 uno e un solo sviluppo polinomiale
pn di grado n, dato da
pn (h) = Tn (h) : (21.4)

Grazie a questo teorema, con semplici ipotesi di derivabilit in x0 , si ha dunque la


fondamentale approssimazione polinomiale
X
n
f (k) (x0 )
f (x0 + h) = Tn (h) + o (hn ) = hk + o (hn ) : (21.5)
k=0
k!

Tn quindi lunico polinomio, al pi di grado n, che soddisfa la Denizione 134, ossia


in grado di approssimare f (x0 + h) con errore o (hn ).
668 CAPITOLO 21. APPROSSIMAZIONE

Lapprossimazione (21.5) detta sviluppo di Taylor di ordine n di f in x0 . Lim-


portante caso particolare x0 = 0 prende il nome di sviluppo di MacLaurin di ordine n
di f .
Si noti che per n = 1 il Teorema 343 coincide con la direzione Se del Teorema
319. Infatti, poich si posto f (0) = f , dire che f derivabile 0 volte su (a; b) equivale
semplicemente a dire che f denita su (a; b). Quindi, per n = 1, il Teorema 343
aerma che, se f : (a; b) ! R derivabile in x0 2 (a; b), allora

f (x0 + h) = T1 (h) + o (h) = f (x0 ) + f 0 (x0 ) h + o (h) per h ! 0;

ossia f dierenziabile in x0 .

Per n = 1 lapprossimazione polinomiale (21.5) si riduce dunque allapprossi-


mazione lineare (18.27), ossia a

f (x0 + h) = f (x0 ) + f 0 (x0 ) h + o (h) per h ! 0:

Se n = 2 la (21.5) diventa lapprossimazione quadratica


1
f (x0 + h) = f (x0 ) + f 0 (x0 ) h + f 00 (x0 ) h2 + o h2 per h ! 0; (21.6)
2
e cos via per gli ordini superiori.
Lapprossimazione (21.5) importantissima nelle applicazioni ed la forma eettiva
che acquista la tensione tra complessit del polinomio approssimante e bont dellap-
prossimazione di cui abbiamo prima parlato. Il trade-o devessere risolto caso per
caso, a seconda della relativa importanza che hanno le due propriet nella particolare
applicazione che interessa. In molti casi, tuttavia, lapprossimazione quadratica (21.6)
un buon compromesso: tra tutti i possibili gradi di approssimazione, il quadratico
ha unimportanza particolare.

OfB. Gracamente lapprossimazione quadratica (detta anche del secondordine)


una parabola. Lapprossimazione lineare, come sappiamo, la retta tangente al graco
della funzione; lapprossimante quadratica la cosiddetta parabola osculatrice 2 , cio
la parabola che condivide in x0 lo stesso valore della funzione, la stessa pendenza
(derivata prima) e la stessa curvatura (derivata seconda). H

Dim. Alla luce del Lemma 342, su ciente mostrare che il polinomio di Taylor
soddisfa la (21.1). Cominciamo con losservare preliminarmente che, poich f deriv-
abile n 1 volte su (a; b), si ha f (k) : (a; b) ! R per ogni 1 k n 1. In-
(k)
oltre, grazie alla Proposizione 320, f continua in x0 per 1 k n 1. Siano
' : (x0 a; b x0 ) ! R e : R ! R le funzioni ausiliarie date da
X
n
f (k) (x0 )
' (h) = f (x0 + h) hk e (h) = hn :
k=0
k!
2
Da os, bocca, cio la parabola baciante.
21.1. APPROSSIMAZIONE POLINOMIALE DI TAYLOR 669

Dobbiamo dimostrare che


' (h)
lim = 0: (21.7)
h!0 (h)
Si ha
(k) (k)
lim (h) = (0) (21.8)
h!0

per ogni 1 k n 1. Inoltre, poich f (k) continua in x0 per 1 k n 1, si ha

lim '(k) (h) = '(k) (0) = 0: (21.9)


h!0

Grazie alle (21.8) e (21.9), possiamo applicare la regola di de lHospital n 1 volte, in


modo da avere

'(n 1)
(h) '(n 2)
(h) '(0) (h)
lim (n 1) (h)
= L =) lim (n 2) (h)
= L =) =) lim (0) =L (21.10)
h!0 h!0 h!0 (h)
(n 1)
con L 2 R. Semplici calcoli mostrano che (h) = n!h e '(n) (h) = f (x0 + h)
f (x0 ). Quindi,

'(n 1)
(h) 1 '(n 1) (h) 1
lim (n 1) (h)
= lim = '(n) (0) = 0;
h!0 n! h!0 h n!

e, grazie alla (21.10), possiamo concludere che vale la (21.7), come desiderato.

Ponendo x = x0 + h, lapprossimazione polinomiale (21.5) si pu riscrivere come

X
n
f (k) (x0 )
f (x) = (x x0 )k + o ((x x0 )n ) ; (21.11)
k=0
k!

che molto usata.

Illustriamo ora gli sviluppi di Taylor (o di MacLaurin) con alcuni esempi.

Esempio 403 Cominciamo con i polinomi, la cui approssimazione polinomiale ba-


nale: essa restituisce infatti, com ovvio,
P il polinomio stesso. In particolare, se
f : R ! R gi un polinomio, f (x) = nk=0 k xk , si ha lidentit

X
n
f (k) (0)
f (x) = xk 8x 2 R
k=0
k!

poich, come il lettore pu vericare, si ha

f (k) (0)
k = 81 k n:
k!
670 CAPITOLO 21. APPROSSIMAZIONE

Ogni polinomio pu dunque equivalentemente riscriversi nella forma di sviluppo di


MacLaurin. Per esempio, se f (x) = x4 3x3 , si ha f 0 (x) = 4x3 9x2 , f 00 (x) =
12x2 18x; f 000 (x) = 24x 18 e f (iv) (x) = 24, e quindi

f 00 (0)
0 = f (0) = 0 ; 1 = f 0 (0) = 0 ; 2 = =0 ;
2!
f 000 (0) 18 f (iv) (0) 24
3 = = = 3 ; 4 = = = 1:
3! 6 4! 24
N

Esempio 404 Sia f : R++ ! R data da f (x) = log (1 + x). Essa derivabile n volte
in ogni punto del proprio dominio, con

(n 1)!
f (n) (x) = ( 1)n+1 8n 1
(1 + x)n

e perci lo sviluppo di Taylor di ordine n di f in x0 2 R++

h h2
log (1 + x0 + h) = log (1 + x0 ) +
1 + x0 2 (1 + x0 )2
h3 n+1 hn n
+ 3 + + ( 1) n + o (h )
3 (1 + x0 ) n (1 + x 0 )
Xn
h k
= log (1 + x0 ) + ( 1)k+1 k
+ o (hn )
k=0
k (1 + x0 )

o equivalentemente, usando la (21.11),

X
n
k+1 (x x0 )k
log (1 + x) = log (1 + x0 ) + ( 1) k
+ o ((x x0 )n )
k=1
k (1 + x0 )

Si noti come un semplice polinomio approssimi (e bene quanto si vuole perch o ((x x0 )n )
pu essere reso arbitrariamente piccolo) la funzione logaritmica. In particolare, lo
sviluppo di MacLaurin di ordine n di f

x2 x3 n+1 xn X n
xk
log (1 + x) = x + + +( 1) +o (xn ) = ( 1)k+1 +o (xn ) (21.12)
2 3 n k=1
k

Esempio 405 In modo analogo il lettore pu vericare gli sviluppi di MacLaurin di


21.1. APPROSSIMAZIONE POLINOMIALE DI TAYLOR 671

ordine n delle seguenti funzioni elementari:

x2 x3 xn X xk
n
x
e = 1+x+ + + + + o (xn ) = + o (xn )
2 3! n! k=0
k!
1 3 1 5 ( 1)n 2n+1
sin x = x x + x + + x + o x2n+1
3! 5! (2n + 1)!
Xn
( 1)k 2k+1
= x + o x2n+1
k=0
(2k + 1)!
1 2 1 4 ( 1)n 2n X ( 1)k n
cos x = 1 x + x + + x + o x2n = x2k + o x2n :
2 4! (2n)! k=0
(2k)!

Anche qui importante osservare come tali funzioni si possano (ben) approssimare
con semplici polinomi. N

Esempio 406 Sia f : ( 1; +1) ! R data da f (x) = log (1 + x3 ) 3 sin2 x. La fun-


zione derivabile quante volte si vuole in ogni punto del proprio dominio. Calcoliamone
lo sviluppo di MacLaurin di secondo ordine. Si ha

3x2 3x4 + 6x
f 0 (x) = 6 cos x sin x ; f 00 (x) = 6(cos2 x sin2 x)
1 + x3 (1 + x3 )2

e quindi
1
f (x) = f (0) + f 0 (0) x + f 00 (0) x2 + o x2 = 3x2 + o x2 : (21.13)
2
N

Esempio 407 Sia f : ( 1; +1) ! R data da f (x) = e x (log (1 + x) 1) + 1. La


funzione indenitamente derivabile in ogni punto del proprio dominio. Lasciamo al
lettore vericare che lo sviluppo di Taylor di terzo ordine in x0 = 3 dato da

log 4 1 5 4 log 4 16 log 4 25


f (x) = 3
+1+ 3
(x 3) + (x 3)2
e 4e 32e3
63 32 log 4
+ (x 3)3 + o (x 3)3 :
192e3
N

OfB. Con n ssato, lapprossimazione fornita dal polinomio di Taylor buona soltanto
in un intorno (che pu essere piccolissimo) del punto x0 . Daltra parte, aumentando n
lapprossimazione migliora. Se ne conclude che, ssato n, lapprossimazione buona
(migliore di una pressata soglia di errore) soltanto in un intorno di x0 , mentre, ssato
un intervallo, esiste un valore di n che fa s che lapprossimazione in tale intervallo
672 CAPITOLO 21. APPROSSIMAZIONE

sia buona (migliore di una pressata soglia di errore): ovviamente purch la funzione
ammetta derivate no a tale ordine.
Se si ssano simultaneamente il grado n e un intervallo, in generale dunque lap-
prossimazione non controllabile: pu essere pessima. H
OfB. Si dimostra che, qualora f : (a; b) ! R sia derivabile n + 1 volte in (a; b), si pu
anche scrivere, per x0 ; x0 2 (a; b),
X n
f (k) (x0 ) k
f (x0 + h) = h + f (n+1) (x0 + #h) ;
k=0
k!
con 0 # 1. In altre parole, laddendo o (hn ) si pu sempre prendere pari alla
derivata (n + 1)-esima calcolata in un punto intermedio tra x0 e x0 + h. Lespressione
indicata permette di controllare lerrore di approssimazione: se f (n+1) (x) k per
ogni x 2 [x0 ; x0 + h] si pu concludere che lerrore di approssimazione non supera k e
quindi che
Xn
f (k) (x0 ) k Xn
f (k) (x0 ) k
h k f (x0 + h) h + k:
k=0
k! k=0
k!
H
Gli sviluppi di Taylor si rivelano molto utili anche nel calcolo dei limiti. Infatti,
sviluppando in modo appropriato f in x0 , ci si riduce ad un semplice limite di polinomi.
Illustriamo con un paio di esempi luso degli sviluppi di Taylor per il calcolo dei
limiti.
Esempio 408 Consideriamo il limite
log (1 + x3 ) 3 sin2 x
lim :
x!0 log (1 + x)
Siccome il limite per x ! 0, possiamo usare lo sviluppo di MacLaurin del secondo
ordine (21.13) e (21.12) per approssimare il numeratore e il denominatore. Grazie al
Lemma 173 e usando lalgebra degli o piccoli, si ha
log (1 + x3 ) 3 sin2 x 3x2 + o (x2 ) 3x2
lim = lim = lim = 0:
x!0 log (1 + x) x!0 x + o (x) x!0 x
Il calcolo del limite stato quindi notevolmente semplicato grazie alluso combinato
di sviluppi di MacLaurin e del confronto di innitesimi visto nel Lemma 173. N
Esempio 409 Consideriamo il limite
x sin x
lim :
x!0 log2 (1 + x)

Anchesso si pu risolvere combinando in modo opportuno sviluppi e confronti tra


innitesimi:
x sin x x (x + o (x)) x2 + o (x2 ) x2
lim = lim = lim 2 = lim 2 = 1:
x!0 log2 (1 + x) x!0 (x + o (x))2 x!0 x + o (x2 ) x!0 x

N
21.2. PROPOSIZIONE OMNIBUS PER ESTREMI LOCALI 673

21.2 Proposizione omnibus per estremi locali


Grazie allapprossimazione di Taylor possiamo enunciare una proposizione omnibus
per gli estremi locali che ricomprende ed estende sia la condizioni necessaria f 0 (x0 ) = 0
del Teorema 327 sia la condizione su ciente f 0 (x0 ) = 0 e f 00 (x0 ) < 0 del Corollario
338.
Proposizione 344 Siano f : A R ! R una funzione a valori reali denita su un
insieme A in R e C un sottoinsieme di A. Sia x0 un punto interno di C per il quale
esiste un intorno U = U" (x0 ) tale che f sia derivabile n 1 volte su U e derivabile n
volte in x0 .
Se f (k) (x0 ) = 0 per ogni 1 k n 1 e f (n) (x0 ) 6= 0, allora:
(i) Se n pari e f (n) (x0 ) < 0, il punto x0 di massimo locale forte;
(ii) Se n pari e f (n) (x0 ) > 0, il punto x0 di minimo locale forte;
(iii) Se n dispari, il punto x0 non di estremo locale e, di pi, f crescente o
decrescente in x0 secondo che f (n) (x0 ) > 0 o f (n) (x0 ) < 0.
Per n = 1, il punto (iii) non altro che la fondamentale condizione necessaria
(20.1). Infatti, per n = 1, il punto (iii) aerma che se f 0 (x0 ) 6= 0 allora x0 non punto
di estremo locale (cio, non n punto di massimo locale n di minimo locale). Per
contrapposizione, ci equivale a dire che se x0 di estremo locale, allora f 0 (x0 ) = 0.
Il punto (iii) estende a derivate successive la condizione necessaria (20.1).
Il punto (i) invece, insieme con lipotesi f (k) (x0 ) = 0 per ogni 1 k n 1,
00
estende alle derivate successive la condizione su ciente f (x0 ) < 0 per i punti di
massimo locale forte. Infatti, per n = 2 il punto (i) proprio la condizione f 00 (x0 ) < 0.
Analogamente, il punto (ii) estende la condizione f 00 (x0 ) > 0 per i punti di minimo3 .

Dim. Dimostriamo il punto (i). Sia n pari e sia f (n) (x0 ) < 0. Grazie al Teorema 343,
dallipotesi f (k) (x0 ) = 0 per ogni 1 k n 1 e f (n) (x0 ) 6= 0 segue che
f (n) (x0 ) n f (n) (x0 ) n o (hn )
f (x0 + h) f (x0 ) = h + o (hn ) = h 1+ :
n! n! hn
Poich limh!0 o (hn ) =hn = 0, esiste > 0 tale che jhj < implica jo (hn ) =hn j < 1.
Quindi
o (hn )
h2( ; ) =) 1 + > 0:
hn
Siccome f (n) (x0 ) < 0, si ha dunque, essendo hn > 0 perch n pari,
f (n) (x0 ) n o (hn )
h2( ; ) =) h 1+ < 0 =) f (x0 + h) f (x0 ) < 0;
n! hn
3
Si osservi che, grazie a quanto dimostrato circa lapprossimazione di Taylor, il caso n = 2 presenta
in realt un interessante miglioramento rispetto al Corollario 338: si richiede che la funzione f sia
due volte derivabile su U , ma non necessariamente con continuit.
674 CAPITOLO 21. APPROSSIMAZIONE

ossia, ponendo x = x0 + h,

x 2 (x0 ; x0 + ) =) f (x) < f (x0 )

e quindi x0 un punto di massimo locale.


In modo analogo si dimostra il punto (ii). Inne, il punto (iii) si dimostra adattando
in modo opportuno la dimostrazione del Teorema 327.

Esempio 410 Consideriamo la funzione f : R ! R data da f (x) = x4 . Avevamo


visto nellEsempio 388 che, per il suo punto di massimo x0 = 0, non si poteva applicare
la condizione su ciente f 0 (x0 ) = 0 e f 00 (x0 ) < 0. Si ha per

f 0 (0) = f 00 (0) = f 000 (0) = 0 e f (iv) (0) < 0:

Siccome n = 4 pari, per il punto (i) della Proposizione 344, possiamo concludere che
x0 = 0 punto di massimo locale (in realt, di massimo globale, ma la Proposizione
344 non in grado di dirlo). N

Esempio 411 Consideriamo la funzione f : R ! R data da f (x) = x3 . In x0 = 0


si ha
f 0 (0) = f 00 (0) = 0 e f 000 (0) < 0:
Siccome n = 3 dispari, per il punto (iii) della della Proposizione 344 si ha che x0 = 0
non di estremo locale (anzi, in esso, la funzione strettamente decrescente). N

OfB. La Proposizione 344 aerma in sostanza che, se le prime k 1 derivate di f sono


tutte nulle in x0 e f (k) (x0 ) 6= 0, essa, se k pari, d la stessa informazione di f 00 (punto
di massimo o di minimo (locale)), mentre, se k dispari, d la stessa informazione di
f 0 (crescere o decrescere). In breve, come se tutte le k 1 derivate nulle non ci
fossero per nulla. H

Esempio 412 La funzione denita da f (x) = x6 chiaramente minima in x0 = 0.


Risulta f 0 (0) = f 00 (0) = = f v (0) = 0 e f vi (0) = 6! > 0. La funzione denita
da f (x) = x5 chiaramente crescente in x0 = 0. Risulta f 0 (0) = f 00 (0) = f 000 (0) =
f iv (0) = 0 e f v (0) = 5! = 120 > 0. N

Esempio 413 Consideriamo le funzioni f; g : R ! R cos denite:


8 8
< x sin 1 se x 6= 0 < x2 sin 1 se x 6= 0
f (x) = x ; g (x) = x
: :
0 se x = 0 0 se x = 0

sono entrambe continue in x = 0. Infatti


1
lim f (0 + h) = lim h sin =0
h!0 h!0 h
21.3. PROCEDURA OMNIBUS DI RICERCA DI ESTREMI LOCALI 675

perch jsin (1=h)j 1, e

1
lim g (0 + h) = lim h2 sin = 0:
h!0 h!0 h
La prima non derivabile in x = 0; la seconda lo . Infatti

f (0 + h) f (0) h sin h1 0 1
lim = lim = lim sin non esiste;
h!0 h h!0 h h!0 h
e
g (0 + h) g (0) h2 sin h1 0 1
lim = lim = lim h sin = 0:
h!0 h h!0 h h!0 h
Nessuna delle due funzioni massima o minima per x = 0 perch esse compiono innite
oscillazioni in qualunque intorno dello zero.
Per g il punto x = 0 stazionario ma in esso la funzione non ammette derivata
seconda. Infatti risulta
8
< 2x sin 1 cos 1 se x 6= 0
0 x x
g (x) =
:
0 se x = 0

e perci

g 0 (0 + h) g 0 (0) 2h sin h1 cos h1 0 1 1 1


lim = lim = lim 2 sin cos
h!0 h h!0 h h!0 h h h

non esiste. H

21.3 Procedura omnibus di ricerca di estremi locali


Grazie alla Proposizione 344, possiamo a nare la procedura vista nella Sezione 20.4.1
per la ricerca degli estremi locali di una funzione f : A R ! R su un insieme C.
Per ssare le idee studiamo prima due importanti casi particolari.

21.3.1 Caso di funzioni due volte derivabili


Supponiamo che f sia due volte derivabile nei punti interni di C, cio su int C. La
procedura omnibus si articola nelle seguenti fasi:

1. Si determina linsieme S dei punti stazionari, risolvendo lequazione f 0 (x) = 0.


Se S = ; la procedura termina (e si pu concludere che, non esistendo punti
stazionari, a maggior ragione non vi sono estremi); altrimenti si passa alla fase
successiva.
676 CAPITOLO 21. APPROSSIMAZIONE

2. Si calcola f 00 in ciascuno dei punti stazionari x 2 S: il punto x di massimo


locale forte se f 00 (x) < 0; di minimo locale forte se f 00 (x) > 0; se f 00 (x) = 0 la
procedura non grado di determinarne la natura.

La condizione f 0 (x) = 0 detta condizione del primo ordine 4 , mentre f 00 (x) < 0
o f 00 (x) > 0 detta condizione del secondo ordine.

la classica procedura per trovare estremi locali basata sulle condizioni di primo
e secondo ordine. La versione appena presentata migliora quanto visto nella Sezione
20.4.1 perch, riprendendo quanto osservato in una nota precedente, essa richiede solo
che la funzione sia due volte derivabile su int C, non necessariamente con continuit.
Rimangono tuttavia le altre limitazioni osservate nella Sezione 20.4.1.

21.3.2 Caso di funzioni derivabili innite volte


Supponiamo che f sia derivabile innite volte su int C. La procedura omnibus si
articola nelle seguenti fasi:

1. Si determina linsieme S dei punti stazionari, risolvendo lequazione f 0 (x) = 0.


Se S = ; la procedura termina; altrimenti si passa alla prossima fase.
2. Si calcola f 00 in ciascuno dei punti stazionari x 2 S: il punto x di massimo
locale forte se f 00 (x) < 0; di minimo locale forte se f 00 (x) > 0. Diciamo S (2) il
sottoinsieme di S dei punti tali che f 00 (x) = 0. Se S (2) = ; la procedura termina;
altrimenti si passa alla fase successiva.
3. Si calcola f 000 nellinsieme S (2) : se f 000 (x) 6= 0, il punto x non di estremo locale.
Detto S (3) il sottoinsieme di S (2) nel quale f 000 (x) = 0, se S (3) = ; la procedura
termina; altrimenti si passa alla fase successiva.
4. Si calcola f (iv) in ciascuno dei punti x 2 S (3) : il punto x di massimo locale forte
se f (iv) (x) < 0; di minimo locale forte se f (iv) (x) > 0. Detto S (4) il sottoinsieme
di S (3) nel quale f (iv) (x) = 0, se S (4) = ; la procedura termina; altrimenti si
passa alla fase successiva.
5. Si itera la procedura nch S (n) = ;.

La procedura quindi termina se esiste n tale che S (n) = ;. In il caso contrario la


procedura si itera ad libitum (o ad nauseam).

Esempio 414 Riprendiamo la funzione f (x) = x4 , con C = R. Avevamo visto


nellEsempio 388 che, per il suo punto di massimo x0 = 0, non si poteva applicare la
condizione su ciente f 0 (x0 ) = 0 e f 00 (x0 ) < 0. Si ha per

f 0 (0) = f 00 (0) = f 000 (0) = 0 e f (iv) (0) < 0;


4
Si ricordi quanto detto nella Sezione 20.1.4.
21.3. PROCEDURA OMNIBUS DI RICERCA DI ESTREMI LOCALI 677

sicch
S = S (2) = S (3) = f0g e S (4) = ;;
La fase 1 individua linsieme S = f0g, su cui la fase 2 non ha per nulla da dire poich
f 00 (0) = 0. Anche la fase 3 non ha alcun esito perch f 000 (0) = 0. La fase 4 invece
risolutiva: poich f (iv) (0) < 0, possiamo concludere che x = 0 di massimo locale
forte (in realt, di massimo globale, ma la procedura non in grado di dirlo). N

Naturalmente, la procedura di interesse pratico quando essa termina con un valore


di n su cientemente piccolo.

21.3.3 Caso generale


Consideriamo ora il caso generale. A tal ne, sia C (k) linsieme dei punti interni di C
in cui f derivabile almeno k volte. Ovviamente

int C C (1) C (2) C (k)

In particolare, \
C (1) = C (k)
k

il sottoinsieme di int C ove f derivabile innite volte. I casi studiati nelle Sezioni
21.3.1 e 21.3.2 corrispondono, rispettivamente, a int C = C (2) e int C = C (1) .

Esempio 415 (i) La funzione f (x) = x4 derivabile innite volte su R. Per qualsiasi
sottoinsieme C in R si ha quindi C (1) = C. (ii) Per la funzione
(
x2 se x 0
f (x) = (21.14)
x2 se x > 0

si ha f 0 (x) = 2 jxj ed quindi derivabile una sola volta in 0 e innite volte negli
altri punti di R. Quindi, per qualsiasi sottoinsieme C in R si ha C = C (1) , nonch
C (1) = C f0g se 0 2 C. N

Si ponga per ogni n,

S (n) = x 2 C (n) : f 0 (x) = = f (n) (x) = 0 :

Per n = 1, si tratta dellinsieme dei punti stazionari che, per semplicit di notazione,
continuiamo a indicare con S in luogo di S (1) . Si noti che

S (n) S

Nel caso generale, la procedura omnibus si articola nel seguente modo:


678 CAPITOLO 21. APPROSSIMAZIONE

1. Si determina linsieme S dei punti stazionari, risolvendo lequazione f 0 (x) = 0.


Se S \ C (2) = ; la procedura termina; altrimenti si passa alla fase successiva.

2. Si calcola f 00 in ciascuno dei punti stazionari x 2 S \C (2) : il punto x di massimo


locale forte se f 00 (x) < 0; di minimo locale forte se f 00 (x) > 0; appartiene a
S (2) se f 00 (x) = 0. Se S (2) \ C (3) = ; la procedura termina; altrimenti si passa
alla fase successiva.

3. Si calcola f 000 nellinsieme S (2) \ C (3) : se f 000 (x) 6= 0, il punto x non un estremo
locale, appartiene a S (3) se f 000 (x) = 0. Se S (3) \ C (4) = ; la procedura termina;
altrimenti si passa alla fase successiva.

4. Si calcola f (iv) in ciascuno dei punti x 2 S (3) \ C (4) : il punto x di massimo


locale forte se f (iv) (x) < 0; di minimo locale forte se f (iv) (x) > 0; appartiene a
S (iv) se f (iv) (x) = 0. Se S (4) \ C (5) = ; la procedura termina; altrimenti si passa
alla fase successiva.

5. Si itera la procedura no a n < k tale che S (n) \ C (n+1) = ;.

La procedura termina quando S (n) \C (n+1) = ;, ossia quando nei punti S (n) rimasti
da considerare alla fase successiva la funzione non n + 1 volte derivabile. Linsieme
terminale S (n) detto residuo. Se la funzione derivabile innite volte su int C, la
procedura termina se e solo se S (n) = ;, come osservato sopra. In particolare, lasciamo
vericare al lettore che nei casi int C = C (2) e int C = C (1) la procedura si riduce a
quelle viste, rispettivamente, nelle Sezioni 21.3.1 e 21.3.2.

La procedura esaustiva se essa termina quando S (n) = ;, cio quando linsieme


residuo vuoto. In questo caso stata in grado di determinare tutti gli estremi locali
di f appartenenti a C (n) , ossia gli estremi locali nei quali f derivabile n volte. Invece,
quando essa termina bench S (n) 6= ;, la procedura non stata esaustiva perch per i
punti in S (n) non stata in grado di dire alcunch. Tanto pi piccolo linsieme S (n) ,
tanto migliore stata le cacia della procedura.

21.3.4 Commenti
La procedura illustrata potente. La sua benzina data dal numero di volte che
f derivabile nei punti interni di C perch ci determina il numero di fasi di cui la
procedura pu avvalersi, prima di doversi eventualmente arrestare per mancanza di
derivabilit, cio perch C (n) = ;. Da questo punto di vista, le funzioni ideali per
lapplicazione della procedura sono le innitamente derivabili (per esempio, le funzioni
elementari) ed per tal motivo che prima abbiamo considerato proprio loro.
Per quanto potente, anchessa condivide tuttavia alcuni dei limiti della sua versione
pi debole indicata nella Sezione 20.4.1. Per prima cosa, come appena osservato, la
sua benzina la derivabilit di ordine superiore, propriet della quale molte funzioni
non godono.
21.4. FORMULA DI TAYLOR: CASO VETTORIALE 679

Secondo, la procedura pu solo valutare i punti interni di C ove f derivabile,


senza poter dire niente su quelli di frontiera, il che pu essere un serio limite com
illustrato dal semplice Esempio 390.
Terzo, la procedura in grado di determinare la natura dei punti di estremo locale
che non solo siano interni a C ma anche di estremo locale forte. Gli estremi locali
non forti eludono le condizioni f (k) (x) 7 0 delle fasi pari e li ritroveremo perci
nellinsieme S (n) dei punti stazionari per i quali la procedura stata ine cace. Il
banalissimo esempio della funzione costante f (x) = k ci ricorda che, anche quando
f innitamente derivabile, i punti di estremo locale non forte possono sfuggire alla
procedura.
In conclusione, la procedura di grande aiuto, ma ha limiti sostanziali che pos-
sono renderne grottesca unapplicazione puramente meccanica (per esempio, a tale
applicazione sfuggirebbero gli estremi locali di una funzione costante).

21.4 Formula di Taylor: caso vettoriale


In questa sezione studiamo una versione della fondamentale Formula di Taylor per
funzioni di pi variabili. Per far ci, occorre introdurre le forme quadratiche.

21.4.1 Forme quadratiche


Una funzione f : Rn ! R della forma

f (x1 ; :::; xn ) = k (x1 1 x2 2 xn n )


P
con k 2 R e i 2 N, detta monomio di grado m 2 N quando ni=1 i = m. Per
esempio, f (x1 ; x2 ) = 2x1 x2 un monomio di secondo grado, mentre f (x1 ; x2 ; x3 ) =
5x1 x32 x43 un monomio di ottavo grado.

Denizione 136 Una funzione f : Rn ! R una forma quadratica se somma di


monomi di secondo grado.

Per esempio, f (x1 ; x2 ; x3 ) = 3x1 x3 x2 x3 una forma quadratica perch la


somma dei monomi di secondo grado 3x1 x3 e x2 x3 . facile vedere che le seguenti
funzioni sono forme quadratiche:

f (x) = x2 ;
f (x1 ; x2 ) = x21 + x22 4x1 x2 ;
f (x1 ; x2 ; x3 ) = x1 x3 + 5x2 x3 + x23 ;
f (x1 ; x2 ; x3 ; x4 ) = x1 x4 2x21 + 3x2 x3 :

Vi una corrispondenza biunivoca tra forme quadratiche e matrici simmetriche, come


mostra il prossimo risultato, del quale omettiamo la dimostrazione.
680 CAPITOLO 21. APPROSSIMAZIONE

Proposizione 345 Esiste una corrispondenza biunivoca tra forme quadratiche f :


Rn ! R e matrici simmetriche A di ordine n determinata da:
X
n X
n
f (x) = x Ax = aij xi xj per ogni x 2 Rn . (21.15)
i=1 j=1

Data una matrice simmetrica A esiste quindi ununica forma quadratica f : Rn ! R


n n
per cui vale la (21.15); viceversa, data una forma quadratica f : Rn ! R esiste
ununica matrice simmetrica A per cui vale la (21.15).
n n

La matrice A si dice matrice associata alla forma quadratica f . Vediamo qualche


esempio.

Esempio 416 La matrice associata alla forma quadratica f (x1 ; x2 ; x3 ) = 3x1 x3 x2 x3


data da: 2 3
3
0 0 2
A=4 0 0 1 5
2
:
3 1
2 2
0
Infatti, per ogni x 2 R3 si ha:
2 3
32 3
0 0 2
x1
x Ax = (x1 ; x2 ; x3 ) 4 0 0 1 54
x2 5
2
3 1
2 2
0 x3
3 1 3 1
= (x1 ; x2 ; x3 ) x3 ; x3 ; x1 x2
2 2 2 2
3 1 3 1
= x1 x3 x2 x3 + x1 x3 x2 x3 = 3x1 x3 x2 x3 :
2 2 2 2
Si noti che anche le matrici
2 3 2 3
0 0 3 0 0 0
4
A= 0 0 1 5 4
e A= 0 0 0 5 (21.16)
0 0 0 3 1 0

sono tali che f (x) = x Ax, bench non siano simmetriche. Quel che si perde senza
simmetria la corrispondenza biunivoca tra forme quadratiche e matrici. Infatti,
mentre data la forma qudratica f (x1 ; x2 ; x3 ) = 3x1 x3 x2 x3 esiste ununica matrice
simmetrica per cui la (21.15) vale, ci non pi vero se non si richiede la simmetria
della matrice, come mostrano le due matrici in (21.16), per entrambe le quali vale la
(21.15). N

Esempio 417 Riguardo la forma quadratica f (x1 ; x2 ) = x21 + x22 4x1 x2 , si ha:

1 2
A= :
2 1
21.4. FORMULA DI TAYLOR: CASO VETTORIALE 681

Infatti, per ogni x 2 R2 si ha:

1 2 x1
x Ax = (x1 ; x2 ) = (x1 ; x2 ) (x1 2x2 ; 2x1 + x2 )
2 1 x2
= x21 2x1 x2 2x1 x2 + x22 = x21 + x22 4x1 x2

N
P
Esempio 418 Sia f : Rn ! R denita come f (x) = kxk2 = ni=1 x2i per ogni x 2 Rn .
La matrice simmetrica associata a questa forma quadratica la matrice identit I.
Infatti,
X
n
x Ix = x x = x2i :
i=1
Pn 2
Pi in generale, sia f (x) = i=1 con i 2 R per ogni i = 1; :::; n. Efacile vedere
i xi
che la matrice associata a f la matrice diagonale
2 3
1 0 0 0
6 0 0 0 7
6 2 7
6 0 0 0 7:
6 3 7
4 0 0 0 0 5
0 0 0 n

Ai nostri ni importante classicare le forme quadratiche secondo il loro segno.

Denizione 137 Una forma quadratica f : Rn ! R si dice:

(i) semidenita positiva se f (x) 0 per ogni x 2 Rn ,

(ii) denita positiva se f (x) > 0 per ogni x 2 Rn con x 6= 0,

(iii) indenita se esistono x; x0 2 Rn tali che f (x) < 0 e f (x0 ) > 0.

In modo analogo si deniscono le forme quadratiche semidenite e denite nega-


tive. Alla luce della Proposizione 345, si ha una classicazione parallela per le matrici
simmetriche, dove la matrice si dice semidenita positiva se lo la corrispondente
forma quadratica, e cos via.

In alcuni casi facile vericare il segno di una forma


P quadratica. Per esempio,
immediato vedere che la forma quadratica f (x) = ni=1 i x2i semidenita positiva
se e solo se i 0 per ogni i, mentre denita positiva se e solo se i > 0 per ogni
i. In generale, tuttavia, non semplice stabilire direttamente il segno di una forma
quadratica e si sono perci elaborati alcuni metodi che aiutano in tale compito. Tra
essi, vediamo a titolo desempio il criterio di Sylvester-Jacobi.
682 CAPITOLO 21. APPROSSIMAZIONE

Data una matrice simmetrica A, costruiamo le seguenti sottomatrici quadrate A1 ,


A2 , ..., An :
2 3
a11 a12 a13
a11 a12
A1 = [a11 ] ; A2 = ; A3 = 4 a21 a22 a23 5 ; :::; An = A
a21 a22
a31 a32 a33

Proposizione 346 (Criterio di Sylvester-Jacobi) Una matrice simmetrica A :

(i) denita positiva se e solo se det Ai > 0 per ogni i = 1; :::; n;


(ii) denita negativa se e solo se det Ai cambia di segno cominciando con segno
negativo (cio, det A1 < 0, det A2 > 0, det A3 < 0 e cos via);
(iii) indenita se e solo se i determinanti det Ai non sono nulli e la successione dei
loro segni non rispetta la (i) e la (ii).

Esempio 419 Sia f (x1 ; x2 ; x3 ) = x21 + 2x22 + x23 + (x1 + x3 ) x2 . La matrice associata
a f : 2 3
1 12 0
A = 4 21 2 12 5 :
0 21 1
Infatti,
2 1
332
1 2
0
x1
x Ax = (x1 ; x2 ; x3 ) 4 12 2 12 5 4 x2 5
0 12 1 x3
1 1 1 1
= (x1 ; x2 ; x3 ) x1 + x2 ; x1 + 2x2 + x3 ; x2 + x3
2 2 2 2
2 2 2
= x1 + 2x2 + x3 + (x1 + x3 ) x2 :

Proviamo a studiare il segno della forma quadratica con il criterio di Sylvester-Jacobi.


Si ha:

det A1 = 1;
1 7
1 2
det A2 = det 1 = > 0;
2 2 4
3
det A3 = det A = > 0:
2
Grazie al criterio di Sylvester-Jacobi possiamo quindi concludere che la forma quadrat-
ica denita positiva. N

Esistono versioni del criterio di Sylvester-Jacobi per determinare se una matrice


simmetrica semidenite positiva, negativa o se invece indenita. Omettiamo
tuttavia i dettagli e passiamo, invece, alla Formula di Taylor.
21.4. FORMULA DI TAYLOR: CASO VETTORIALE 683

21.4.2 Formula di Taylor


Grazie al Teorema 321, una funzione f : U Rn ! R con derivate parziali continue
dierenziabili in ogni x 2 U , cio approssimabile in modo lineare:

f (x + h) = f (x) + df (x) (h) + o (khk) = f (x) + rf (x) h + o (khk) (21.17)

per ogni h 2 Rn . Con un piccolo cambio di notazione, indichiamo con x0 il punto in


cui f dierenziabile e poniamo h = x x0 . Con tale notazione, la (21.17) assume la
seguente equivalente, ma pi espressiva, forma:

f (x) = f (x0 ) + df (x0 ) (x x0 ) + o (kx x0 k) (21.18)


= f (x) + rf (x) (x x0 ) + o (kx x0 k)

per ogni x 2 Rn .
Possiamo ora presentare la formula di Taylor per funzioni a pi variabili; come
nel caso scalare, anche nel nostro caso pi generale la formula di Taylor ra na lap-
prossimazione (21.18). Nellenunciarla ci limitiamo ad unapprossimazione arrestata
al secondo ordine che basta ai nostri ni, rimandando a corsi successivi lo studio di
approssimazioni di ordine superiore.

Teorema 347 Sia f : U Rn ! R una funzione con derivate parziali di secondo


ordine continue su U . Allora, in ogni x0 2 U si ha:
1
f (x) = f (x0 ) + df (x0 ) (x x0 ) + (x x0 ) d2 f (x0 ) (x x0 ) + o kx x0 k2
2
1
= f (x0 ) + rf (x0 ) (x x0 ) + (x x0 ) r2 f (x0 ) (x x0 ) + o kx x0 k2
2
per ogni x 2 Rn .

Lespressione
1
f (x0 ) + rf (x0 ) (x x0 ) + (x x0 ) r2 f (x0 ) (x x0 )
2
detta polinomio di Taylor di secondo grado in x0 . Il termine di secondo grado una
forma quadratica, la cui matrice associata, lHessiana r2 f (x), simmetrica grazie al
Teorema 323. Naturalmente, se arrestata al primo ordine la formula di Taylor si riduce
alla (21.18). Inoltre, si osservi che nel caso scalare il polinomio di Taylor assume la
ben nota forma:
1
f (x0 ) + f 0 (x0 ) (x x0 ) + f 00 (x0 ) (x x0 )2
2
Infatti, in tale caso si ha r2 f (x0 ) = f 00 (x0 ) e quindi

(x x0 ) r2 f (x0 ) (x x0 ) = f 00 (x0 ) (x x0 )2 (21.19)


684 CAPITOLO 21. APPROSSIMAZIONE

Al pari del caso scalare, anche qui abbiamo un trade-o tra semplicit dellap-
prossimazione e sua accuratezza. Infatti, lapprossimazione arrestata al primo ordine
(21.18) ha il pregio della semplicit rispetto a quella arrestata al secondo ordine: si
approssima con una funzione lineare invece che con un polinomio di secondo grado, a
scapito per del grado di accuratezza dellapprossimazione, dato da o (kx x0 k) invece
del migliore o kx x0 k2 .
La scelta dellordine cui arrestare la formula di Taylor dipende quindi dal partico-
lare uso al quale siamo interessati, a seconda di quale aspetto dellapprossimazione sia
in esso pi importante, se la semplicit oppure laccuratezza.
2
Esempio 420 Sia f : R2 ! R denita come f (x1 ; x2 ) = 3x21 ex2 . Si ha:
2 2
rf (x) = 6x1 ex2 ; 6x21 x2 ex2

e 2 2
2 6ex2 12x1 x2 ex2
r f (x) = 2 2
12x1 x2 ex2 6x21 ex2 (1 + 2x22 )
Per il Teorema 347, la formula di Taylor in x0 = (1; 1)

f (x) = f (1; 1) + rf (1; 1) (x1 1; x2 1)


1
+ (x1 1; x2 1) r2 f (1; 1) (x1 1; x2 1) + o k(x1 1; x2 1)k2
2
= 3e + (6e; 6e) (x1 1; x2 1) +
1 6e 12e x1 1
(x1 1; x2 1) + o (x1 1)2 + (x2 1)2
2 12e 18e x2 1
= 3e x21 x1 + 5 8x2 + 4x1 x2 + 3x22 + o (x1 1)2 + (x2 1)2 :
2
La funzione f (x1 ; x2 ) = 3x21 ex2 quindi approssimata nel punto (1; 1) dal polinomio
di Taylor di secondo grado

3e x21 4x1 + 5 8x2 + 4x1 x2 + 3x22

con livello di accuratezza dato da o (x1 1)2 + (x2 1)2 . N

21.4.3 Condizioni del secondo ordine


Grazie alla formula di Taylor (21.18) possiamo enunciare una condizione su ciente
del secondo ordine per estremi locali. Infatti, tale formula permette di approssimare
localmente una funzione f : U Rn ! R in un punto x0 2 U con un polinomio di
secondo grado nel modo seguente:
1
f (x) = f (x0 ) + rf (x0 ) (x x0 ) + (x x0 ) r2 f (x0 ) (x x0 ) + o kx x 0 k2
2
21.4. FORMULA DI TAYLOR: CASO VETTORIALE 685

Se x0 un estremo (massimo o minimo) locale, per il Teorema di Fermat si ha


rf (x0 ) = 0 e quindi lapprossimazione diventa:

1
f (x) = f (x0 ) + (x x0 ) r2 f (x0 ) (x x0 ) + o kx x 0 k2 : (21.20)
2
Lavorando su questa semplice osservazione si ottengono le condizioni del secondo
ordine, che si basano sul segno della forma quadratica x r2 f (x0 ) x.

Teorema 348 Sia f : U Rn ! R una funzione con derivate parziali di secondo


ordine continue. Sia x^ 2 U un punto stazionario.5

(i) Se x^ punto di massimo (minimo) locale su U , la forma quadratica x r2 f (^


x) x
semidenita negativa (positiva).

(ii) Se la forma quadratica x r2 f (^


x) x denita negativa (positiva), allora x^
punto di massimo (minimo) locale forte.

Nel caso scalare ritroviamo le usuali condizioni del secondo ordine, basate sul segno
della derivata seconda f 00 (^
x). Infatti, avevamo gi osservato nella (21.19) che nel caso
scalare vale
x r2 f (^x) x = f 00 (^
x) x2
sicch in questo caso il segno della forma quadratica dipende solo dal segno di f 00 (^ x);
00
ossia, essa denita negativa (positiva) se e solo se f (^ x) < 0 (> 0) ed semidenita
negativa (positiva) se e solo se f 00 (^
x) 0 ( 0).
Naturalmente, come nel caso scalare, anche nel nostro ambito pi generale la con-
dizione (i) solo necessaria a nch x^ sia un massimo locale. Infatti, consideriamo la
funzione scalare f (x) = x3 . Si ha r2 f (x) = f 00 (x) e quindi in x^ = 0 si ha r2 f (^
x) = 0.
2
La corrispondente forma quadratica x r f (^ x) x identicamente nulla ed quindi sia
semidenita negativa che positiva. Cionondimeno, x^ = 0 non n punto di massimo
n di minimo locale.
Similmente, la condizione (ii) solo su ciente a nch x^ sia un punto di massimo
locale. Si consideri la funzione scalare f (x) = x4 . Il punto x^ = 0 chiaramente un
punto di massimo (addirittura assoluto) per la funzione f . Ma, r2 f (^ x) = 0 e quindi
la corrispondente forma quadratica x r2 f (^ x) x non denita negativa.

LHessiana r2 f (^x) la matrice simmetrica associata alla forma quadratica x


2
r f (^
x) x; possiamo quindi equivalentemente enunciare il Teorema 348 nel modo seguente:

condizione necessaria a nch x^ sia punto di massimo (minimo) che la matrice


Hessiana r2 f (^
x) sia semidenita negativa (positiva),
5
Per semplicit continuiamo a considerare una funzione denita su un intorno. Lasciamo al lettore
ladattamento a funzioni f : A Rn ! R e a punti interni x ^ appartenenti a un insieme di scelta
C A.
686 CAPITOLO 21. APPROSSIMAZIONE

condizione su ciente a nch x^ sia punto di massimo (minimo) forte che tale
matrice sia denita negativa (positiva).

questa unosservazione importante dal punto di vista pratico perch esistono dei
criteri, quale quello di Sylvester-Jacobi, per determinare se una matrice simmetrica
positiva/negativa denita o semidenita.

Esempio 421 Sia f : R2 ! R denita come f (x1 ; x2 ) = 2x21 + x22 3 (x1 + x2 ) +


x1 x2 3. Si ha:
rf (x) = (4x1 3 + x2 ; 2x2 3 + x1 )
e quindi
4 1
r2 f (x) =
2 1
Lunico punto stazionario x = (3=7; 9=7). Per il criterio di Sylvester-Jacobi, la ma-
trice Hessiana r2 f (x) denita positiva. Grazie al Teorema 348, possiamo concludere
che (3=7; 9=7) punto di minimo locale forte. N

Esempio 422 Sia f : R3 ! R denita come f (x1 ; x2 ; x3 ) = x31 +x32 +3x23 2x3 +x21 x22 .
Si ha:
rf (x) = 3x21 + 2x1 x22 ; 3x22 + 2x21 x2 ; 6x3 2
e quindi 2 3
6x1 + 2x22 4x1 x2 0
r2 f (x) = 4 4x1 x2 6x2 + 2x21 0 5
0 0 6
I punti stazionari sono x = ( 3=2; 3=2; 1=3) e x = (0; 0; 1=3). In x = ( 3=2; 3=2; 1=3)
si ha 2 9 3
2
9 0
r2 f (x) = 4 9 9
2
0 5
0 0 6
e quindi
9 9
9
det < 0; det 2
9 < 0; det r2 f (x) < 0
2 9 2
Per il criterio di Sylvester-Jacobi la matrice Hessiana indenita. Grazie al Teorema
348, il punto x = ( 3=2; 3=2; 1=3) non n un minimo n un massimo locale. Per il
punto x = (0; 0; 1=3) si ha 2 3
0 0 0
r2 f (x) = 4 0 0 0 5
0 0 6
e quindi tutti i determinanti delle matrici considerate dal criterio di Sylvester-Jacobi
sono nulli. Per la Proposizione 346, la matrice Hessiana indenita. In conclusione,
la condizione del secondo ordine non dice alcunch in questo esempio. N
Capitolo 22

Concavit e dierenziabilit

22.1 Caso scalare


Le funzioni concave hanno notevoli propriet dierenziali che confermano la natura
regolare di queste funzioni gi evidenziata dalle loro belle propriet di continuit viste
nel Capitolo 15.
In particolare, le propriet dierenziali di una funzione concava scalare f scendono
da una semplice osservazione geometrica. Dati due punti x e y nel dominio di una
funzione f la corda che congiunge i punti (x; f (x)) e (y; f (y)) del graco ha pendenza
f (y) f (x)
y x
come si pu vericare con una semplice modicazione di quanto visto per la (18.6).

y
5

f(y)
4
f(y)-f(x)
3
f(x)
2
y-x

0
O x y x
-1
-1 0 1 2 3 4 5 6

Se una funzione concava la pendenza della corda decresce quando si sposta la


corda verso destra, come dimostra il seguente lemma. Nel capitolo C indica un insieme
convesso, e quindi un intervallo nel caso scalare.

687
688 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT

Lemma 349 Sia f : C R ! R concava. Siano x; w; y; z quattro punti del dominio


di f con x w y z. Si ha

f (y) f (x) f (z) f (w)


(22.1)
y x z w

Per una funzione convessa la disuguaglianza invertita.

In altre parole, spostandoci a destra, da [x; y] a [w; z], la pendenza delle corde
diminuisce. Questa propriet risulta intuitivamente chiara dal graco:

y
5 D
C
4

3
B
2

1 A

0
O x w y z x
-1
-1 0 1 2 3 4 5 6

Dim. La dimostrazione si articola in due fasi: prima si mostra che la corda AC ha


maggiore pendenza della corda BC:

y
5
C
4

3
B
2

1 A

0
O x w y x
-1
-1 0 1 2 3 4 5 6

Fatto ci, si mostra che la corda BC ha maggiore pendenza della corda BD:
22.1. CASO SCALARE 689

y
5 D
C
4

3
B
2

0
O w y z x
-1
-1 0 1 2 3 4 5 6

La prima fase equivale a dimostrare la (22.1) per z = y. Poich x w y, esiste


2 [0; 1] tale che
w = x + (1 )y
Poich f concava si ha f (w) f (x) + (1 )f (y), sicch
f (y) f (w) f (y) f (x) (1 )f (y) f (y) f (x)
= (22.2)
y w y (1 )y y x
Ci completa la prima fase. Passiamo ora alla seconda fase: essa equivale a dimostrare
la (22.1) per x = w. Poich w y z, esiste 2 [0; 1] tale che

y = w + (1 )z

Poich f concava si ha f (y) f (w) + (1 )f (z), sicch

f (y) f (w) f (w) + (1 )f (z) f (w) f (z) f (w)


= (22.3)
y w w + (1 )z w z w
Da (22.2) e (22.3) segue che
f (z) f (w) f (y) f (w) f (y) f (x)
z w y w y x
il che prova la disuguaglianza (22.1).

La semplice propriet geometrica (22.1) alla base del prossimo importante risul-
tato che mostra come le funzioni concave ammettano sempre almeno le derivate uni-
laterali nei punti interni del proprio dominio.

Proposizione 350 Una funzione concava f : C R ! R ammette derivata destra


f+0 (x) e sinistra f 0 (x) in ogni punto interno x 2 C, con f+0 (x) f 0 (x). Inoltre,
entrambe le derivate sono decrescenti.
690 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT

Senza alcuna propriet aggiuntiva, la concavit di per s garantisce la derivabilit


unilaterale nei punti interni. Naturalmente, la funzione derivabile in x quando le
derivate unilaterali coincidono; in tal caso f 0 (x) = f+0 (x) = f 0 (x).
Una funzione concava ha dunque notevoli propriet di regolarit: in ogni punto
interno al suo dominio continua e ammette almeno le derivate unilaterali.

Dim. Poich x0 un punto interno, esiste un suo intorno (x0 "; x0 + ") incluso in
C, cio (x0 "; x0 + ") C. Sia 0 < a < ", cos da avere [x0 a; x0 + a] C. Sia
: [ a; a] ! R denita come
f (x0 + h) f (x0 )
(h) = 8h 2 [ a; a]
h
La propriet (22.1) implica che descrescente, cio
f (x0 + h0 ) f (x0 ) f (x0 + h00 ) f (x0 )
h0 h00 =) (h0 ) = (h00 ) = (22.4)
x0 + h0 x0 x0 + h00 x0
Infatti, se h0 < 0 < h00 basta applicare la (22.1)con w = y = x0 , x = x0 + h0 e
z = x0 + h00 . Se h0 h00 < 0, basta applicare la (22.2) con y = x0 , x = x0 + h0 e
w = x0 + h . Se 0 < h0
00
h00 basta applicare la (22.3) con w = x0 , y = x0 + h0 e
z = x0 + h00 .
Siccome decrescente su [ a; a] si ha (a) (h) ( a) per ogni h 2
[ a; a], ossia limitata. Quindi sia descrescente sia limitata, il che implica che
i limiti destro e sinistro di esistono e sono niti. Ci prova lesistenza delle derivate
unilaterali. Inoltre, la decrescenza di implica (h0 ) (h00 ) per ogni h0 < 0 < h00 ,
sicch
f+0 (x0 ) = lim+ (h) lim (h) = f 0 (x0 ) :
h!0 h!0
Per mostrare la monotonia, consideriamo x; y 2 int C tali che x < y. Grazie alla
(22.1) si ha
f (x + h) f (x) f (y + h) f (y)
8h 2 [ a; a]
x+h x y+h y
Quindi
f (x + h) f (x) f (y + h) f (y)
f+0 (x) = lim+ lim+ = f+0 (y) ;
h!0 h h!0 h
il che implica che la derivata destra decrescente. Un argomento simile vale per la
derivata sinistra.

Esempio 423 La funzione concava f (x) = jxj non derivabile in x = 0. Tuttavia,


le derivate unilaterali esistono in ogni punto del dominio, con
(
1 se x < 0
f+0 (x) =
1 se x 0
22.1. CASO SCALARE 691

e (
1 se x 0
f 0 (x) =
1 se x > 0
Quindi f+0 (x) f 0 (x) per ogni x 2 R ed entrambe le derivate unilaterali sono
decrescenti. N

Esempio 424 La funzione concava


8
< x+1 se x 1
f (x) = 0 se 1<x<1
:
1 x se x 1
non derivabile in x = 1 e x = 1. Tuttavia, le derivate unilaterali esistono in ogni
punto del dominio, con
8
< 1 se x < 1
f+0 (x) = 0 se 1 x<1
:
1 se x 1
e 8
< 1 se x 1
f 0 (x) = 0 se 1<x 1
:
1 se x > 1
Quindi f+0 (x) f 0 (x) per ogni x 2 R ed entrambe le derivate unilaterali sono
decrescenti. N

Esempio 425 La funzione concava f (x) = 1 x2 derivabile su R con f 0 (x) = 2x.


La derivata decrescente. N

La Proposizione 350 aerma, inter alia, che nei punti interni si ha

f+0 (x) f 0 (x)

Il prossimo risultato, di cui omettiamo la dimostrazione, aerma che in realt si ha


f+0 (x) = f 0 (x), e quindi f derivabile in x, in tutti i punti di C eccetto un insieme al
pi numerabile (nellultimo esempio era il singoletto costituito dallorigine). Il risultato
conferma le notevoli propriet dierenziali delle funzioni concave.

Teorema 351 Una funzione concava f : C R ! R derivabile in tutti i punti di


C , eccetto un insieme al pi numerabile di tali punti.

Una propriet importante stabilita nella Proposizione 350 la decrescenza delle


derivate unilaterali delle funzioni concave. Il prossimo importante risultato mostra che
per funzioni continue questa propriet caratterizza la concavit. Si ricordi che linterno
int C di un intervallo C un intervallo aperto: infatti, se C = [a; b] o C = [a; b) o
C = (a; b] si ha sempre int C = (a; b).
692 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT

Teorema 352 Sia f : C R ! R continua. Allora:

(i) f concava se e solo se la derivata destra f+0 esiste ed decrescente su int C;

(ii) f strettamente concava se e solo se la derivata destra f+0 esiste ed strettamente


decrescente su int C.

Analogo risultato, lasciato al lettore, vale per laltra derivata unilateriale f 0 .

Dim. Sia f : C R ! R continua. (i) Solo se: segue dalla Proposizione 350.
Se. Supponiamo che la derivata sinistra f+0 sia decrescente su int C.1 Siano
x; y 2 int C con y < x. Consideriamo la funzione ' : [0; 1] ! R data da

' ( ) = f ( x + (1 ) y) f (x) (1 ) f (y) 8 2 [0; 1] .

Vogliamo mostrare che ' 0. La continuit di f implica che ' continua su [0; 1].
Per il Teorema di Weierstrass, ' ha un punto di minimo b 2 [0; 1]. Poich ' (0) =
' (1) = 0, se b 2 f0; 1g si ha ' ( ) ' (b ) = 0, come desiderato. Supponiamo quindi
che b 2 (0; 1). Condizione necessaria a nch b 2 (0; 1) sia minimo che '0+ (b ) 0.
Ma,
'0+ ( ) = (x y) f+0 ( x + (1 ) y) f (x) + f (y) 8 2 (0; 1)
e quindi '0+ decrescente su (0; 1) perch 1 2 se e solo se 1 x + (1 1) y
0 0
2 x + (1 2 ) y. Da ci segue che la condizione ' + (b ) 0 implica ' + ( ) 0 per
ogni 2 [b ; 1). La funzione ' dunque decrescente su [b ; 1), e quindi su [b ; 1] perch
' continua. Ne segue che ' (b ) ' (1) = 0. Ma b minimo e dunque

'( ) ' (b ) = 0 8 2 [0; 1] .

Ci prova che ' 0, come desiderato. La funzione f quindi concava su int C. Grazie
alla sua continuit su C, ci implica la concavita di f sullintero C (perch?).

(ii) Solo se. Sia f strettamente concava. Per quanto appena dimostrato la
derivata unilaterale f+0 decrescente su int C. Supponiamo, per contra, che non sia
strettamente tale: esistono x; y 2 int C, con x < y, tali che f+0 (x) = f+0 (y). Quindi,
f+0 (z) = f+0 (x) per ogni z 2 [x; y]. Posto k = f+0 (x), per la versione unilaterale del
Corollario 332 si ha f (z) = kz + b, con b 2 R, per ogni z 2 [x; y], il che contraddice la
stretta concavit di f .
Se. Sia f+0 strettamente decrescente su int C. Ci implica che '0+ strettamente
decrescente su (0; 1), e quindi b 2 f0; 1g. Infatti, supponiamo per contra che b 2 (0; 1).
La condizione '0+ (b ) 0 implica '0+ ( ) < 0 per ogni 2 [b ; 1). La funzione '
dunque strettamente decrescente su [b ; 1), e quindi su [b ; 1] perch ' continua. Ne
segue che ' (b ) > ' (1) = 0, il che contraddice la minimalit di b .
1
Per comprendere la struttura di questa dimostrazione, in prima lettura il lettore pu sostituire
la derivata f 0 a quella sinistra f+0
. Una volta capita la dimostrazione in questo caso speciale, la sua
0
validit nel caso generale con f+ non dovrebbe presentare problemi.
22.1. CASO SCALARE 693

Il Teorema 352 stabilisce una caratterizzazione dierenziale della concavit: es-


sa equivale alla decrescenza delle derivate unilaterali. Nel teorema sono centrali le
derivate unilaterali perch la concavit, di per s, garantisce solo la loro esistenza, non
quella della derivata bilaterale.

Esempio 426 Consideriamo la funzione continua f : R ! R data da f (x) = jx + x3 j,


cio (
x + x3 se x < 0
f (x) =
x x3 se x 0

La funzione ha derivate unilaterali in ogni punto del dominio, con


(
0 1 + 3x2 se x < 0
f+ (x) =
1 3x2 se x 0

e (
1 + 3x2 se x 0
f 0 (x) =
1 3x2 se x > 0

Per vedere che ci il caso, consideriamo lorigine, che il punto pi delicato. Si ha

f (h) f (0) (h + h3 ) h3
f+0 (0) = lim+ = lim+ = lim+ 1 + = 1
h!0 h h!0 h h!0 h
e
f (h) f (0) h + h3 h3
f 0 (0) = lim = lim = lim 1+ =1
h!0 h h!0 h h!0 h
Quindi f+0 (x) f 0 (x) per ogni x 2 R ed entrambe le derivate sono decrescenti. Per
il Teorema 352 la funzione concava. N

Le derivate unilaterali sono per un pomeno agevoli da manipolare della derivata


bilaterale. Come una breve riessione sul precedente semplice esempio dovrebbe render
chiaro, per poter caratterizzare la concavit tramite propriet della derivata bilaterale
occorre assumere, oltre alla continuit, anche la derivabilit di f . Ci porta a una
semplice conseguenza della caratterizzazione dierenziale del Teorema 352 che, grazie
alla comparsa della derivata bilaterale, per cruciale dal punto di vista operativo.

Corollario 353 Sia f : C R ! R derivabile su int C e continua su C. Allora

(i) f concava se e solo se la sua derivata f 0 decrescente su int C;

(ii) f strettamente concava se e solo se la sua derivata f 0 strettamente decrescente


su int C.
694 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT

Quando C aperto la condizione di continuit diventa superua (analoga osser-


vazione vale per il Corollario 354).

Dim. (i) Sia f : C R ! R derivabile su int C e continua su C. Se f concava, il


Teorema 352 implica che f 0 = f+0 sia decrescente. Viceversa, se f 0 = f+0 decrescente,
il Teorema 352 implica che f sia concava. La (ii) analoga.

Esempio 427 Le funzioni f; g : R ! R data da f (x) = jx3 j e g (x) = e x


sono
derivabili sul loro dominio, con
(
0 3x2 se x 0
f (x) = 2
e g 0 (x) = e x
3x se x > 0

Le derivate sono strettamente decrescenti e quindi f e g sono strettamente concave


grazie al Corollario 353. N

Se assumiamo la derivabilit, si ha dunque che condizione necessaria e su ciente


a nch una funzione sia (strettamente) concava che la sua derivata prima sia (stret-
tamente) decrescente. Si ha quindi un semplice criterio dierenziale di concavit: una
funzione derivabile concava se la sua derivata prima decrescente. Dal punto di vista
operativo si riduce la verica della concavit a quella, spesso operativamente semplice,
di una propriet delle derivate prime.
Ma si pu far ancor meglio, ricordandosi la caratterizzazione dierenziale della
monotonia vista nella Sezione 20.3.

Corollario 354 Sia f : C R ! R due volte derivabile su int C e continua su C.


Allora

(i) f concava se e solo se f 00 0 su int C;

(ii) f strettamente concava se f 00 < 0 su int C.

Si noti lasimmetria tra i punti (i) e (ii): mentre in (i) la decrescenza condizione
necessaria e su ciente per la concavit, in (ii) la stretta decrescenza solo condizione
su ciente per la stretta concavit. Ci segue dallanaloga asimmetria per la monotonia
tra le Proposizioni 334 e 335.

Dim. (i) Basta osservare che, grazie alla versione decrescentedella Proposizione 334,
la derivata prima f 0 decrescente su int C se e solo se f 00 (x) 0 per ogni x 2 int C.
(ii) Segue dalla versione decrescentedella Proposizione 335.

Con lulteriori ipotesi che f sia due volte derivabile su int C, la concavit equivale
alla negativit della derivata seconda, una condizione spesso di pi facile verica della
decrescenza della derivata prima. In ogni caso, grazie ai due ultimi corollari disponiamo
ora di potenti criteri dierenziali di concavit.
22.1. CASO SCALARE 695

Prima di illustrare la potenza di questi criteri con alcuni esempi, osserviamo che
per le funzioni convesse valgono risultati speculari, con la crescenza in luogo della
decrescenza (e f 00 0 in luogo di f 00 0). Lasciamo al lettore vericare questa
osservazione, che nel seguito daremo per acquisita.
p
Esempio 428 (i) Le funzioni f; g : R+ ! R denite da f (x) = x e g (x) = log x
hanno rispettivamente derivate
1 1
f 0 (x) = p e g 0 (x) =
2 x x

strettamente decrescenti e quindi sono strettamente concave. Le derivate seconde


1 1
f 00 (x) = < 0 e g 00 (x) = <0
4x3=2 x2
ovviamente confermano la conclusione.

(ii) La funzione f : R ! R denita da f (x) = x2 ha derivata f 0 (x) = 2x stret-


tamente crescente e perci strettamente convessa. A conferma f 00 (x) = 2 >
0.

(iii) La funzione f : R ! R denita da f (x) = x3 ha derivata f 0 (x) = 3x2 che


strettamente decrescente su ( 1; 0] e strettamente crescente su [0; +1). A
conferma la derivata seconda f 00 (x) = 6x 0 su ( 1; 0] e 0 su [0; +1). N

In conclusione, le funzioni concave hanno notevoli propriet di regolarit: in ogni


punto interno al loro dominio sono continue e ammettono almeno le derivate unilaterali.

22.1.1 Corde e tangenti


Teorema 355 Sia f : (a; b) R ! R derivabile in x 2 (a; b). Se f concava, allora

f (y) f (x) + f 0 (x) (y x) 8y 2 (a; b) : (22.5)

Per f convessa la disuguaglianza si inverte.

Dim. Sia f concava e siano x e y due punti distinti di (a; b). Se 2 (0; 1) si ha:

f (x + (1 ) (y x)) = f ( x + (1 ) y) f (x) + (1 ) f (y)


= f (x) + (1 ) [f (y) f (x)]

e dunque
f (x + (1 ) (y x)) f (x)
f (y) f (x) :
(1 )
696 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT

Dividendo e moltiplicando il primo membro per y x si ottiene


f (x + (1 ) (y x)) f (x)
(y x) f (y) f (x) :
(1 ) (y x)
Questa disuguaglianza vale per ogni 2 (0; 1). Quindi, grazie alla derivabilit di f in
x, si ha
f (x + (1 ) (y x)) f (x)
lim (y x) = f 0 (x) (y x)
!1 (1 ) (y x)
Perci
f 0 (x) (y x) f (y) f (x)
come desiderato.

Il secondo membro della disuguaglianza (22.5) lapprossimazione a ne, costruita


nel punto x e valutata in y, di f : si tratta cio della retta tangente a f in x. Il Teorema
355 aerma allora che per una funzione f concava e derivabile in x, lapprossimazione
a ne di f in x per eccesso, cio la retta tangente le sta sempre sopra.
La cosa geometricamente evidente: la denizione di concavit richiede che la
retta passante per i due punti (x; f (x)) e (y; f (y)) stia sotto la curva nellintervallo
tra x e y e quindi che le stia sopra fuori da tale intervallo2 . Facendo tendere y a x, la
retta in discorso diventa tangente e sta tutta sopra la curva. Analoga conclusione vale
per le funzioni convesse.

5 f(y)+f'(x)(y-x)
y
4.5
f(x)
4
f(y)
3.5

f(y )
3 2

2.5

2 f(y )
1
1.5

0.5
O y y y x x
1 2
0
0 1 2 3 4 5

2
Pur essendo la cosa geometricamente ovvia, sentiamo il dovere di dimostrarla. Sia z esterno
allintervallo [x; y]: poniamo che z > y. Si pu allora scrivere y = x + (1 ) z con 2 (0; 1) e, per
la concavit di f , si ha f (y) f (x) + (1 ) f (z), ovvero
1
f (z) f (y) f (x) :
1 1
Ma, essendo 1= (1 ) = > 1 e 1 = 1 1= (1 ) = = (1 ) < 0, si ha f (z) =
f ( y + (1 ) x) f (y) + (1 ) f (x) per ogni > 1. Se z < x si ragiona in modo speculare.
22.2. CASO VETTORIALE 697

Il teorema precedente si basava sulla derivabilit in un dato punto x della funzione


f . Se assumiamo che f sia derivabile su tutto lintervallo (a; b), la disuguaglianza
(22.5) caratterizza la concavit.

Teorema 356 Sia f : (a; b) R ! R derivabile su (a; b). Allora, f concava se e


solo se risulta
f (y) f (x) + f 0 (x) (y x) 8x; y 2 (a; b) : (22.6)

Per una funzione derivabile su (a; b), si pu quindi aermare che condizione neces-
saria e su ciente di concavit che le rette tangenti nei vari punti del dominio stiano
tutte sopra il suo graco. Analoghe considerazioni valgono per la convessit: sotto il
graco invece che sopra.

Dim. Il Solo sesegue dal teorema precedente. Mostriamo il Se. Supponiamo che
valga la disuguaglianza (22.6) e consideriamo il punto z = x + (1 ) y. Scriviamo
la precedente disuguaglianza una volta relativamente ai punti z e x e unaltra ai punti
z e y:

f 0 (z) (1 ) (x y) f (x) f ( x + (1 ) y) ;
0
f (z) (y x) f (y) f ( x + (1 ) y) :

Moltiplichiamo la prima disuguaglianza per , la seconda per (1 ) e sommiamo:

0 f (x) + (1 ) f (y) f ( x + (1 ) y) ;

che, vista la genericit di x e y, assicura la concavit di f .

22.2 Caso vettoriale


Le nostre conoscenze di calcolo dierenziale per funzioni di pi variabili sono piuttosto
limitate e perci ci limitiamo a poche elementari considerazioni, senza dimostrazioni.
Il Teorema 359 sar per molto importante nel capitolo sulla Programmazione matem-
atica.

Il primo problema che si incontra nel caso vettoriale quale sia la controparte vet-
toriale della decrescenza della derivata prima nel caso scalare, che grazie al Corollario
353 caratterizza la concavit scalare. La derivata prima f 0 diventa nel caso vettoriale
il gradiente rf . In particolare, supponiamo che f : U Rn ! R sia derivabile sul-
n
lintorno U , cosicch si possa scrivere rf : U ! R . Il gradiente si pu quindi vedere
come una funzione da un sottoinsieme convesso di Rn a valori in Rn . In generale,
queste funzioni hanno la forma g : C Rn ! Rn , dove C un sottoinsieme convesso
di Rn . Una tale funzione si dice decrescente se

(g (x) g (y)) (x y) 0 8x; y 2 C (22.7)


698 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT

e crescente se vale la disuguaglianza opposta. Il lettore pu vericare che per n = 1


essa si riduce alla solita nozione di crescenza/decrescenza. Non si tratta peraltro di
unestensione ovvia della nozione scalare di monotonia e lasciamo il suo studio a corsi
successivi. Ci limitiamo qui a osservare che, grazie alla nozione di monotonia (22.7),
si pu enunciare una versione vettoriale del Corollario 353.
Teorema 357 Sia f : U Rn ! R derivabile su U . Se la funzione f concava,
allora
(rf (y) rf (x)) (y x) 0 8x; y 2 U (22.8)
Il converso vale se le derivate parziali sono continue.
Nellipotesi di continuit delle derivate parziali (di solito soddisfatta nelle appli-
cazioni), f concava se e solo se il gradiente rf decrescente, nel senso della (22.7).
La funzione f convessa se e solo se vale la disuguaglianza opposta, cio se rf
crescente. Dal punto di vista operativo il risultato porta alla seguente condizioni di
negativit sulla matrice Hessiana di f , cio la matrice delle derivate parziali seconde
di f , che generalizza la condizione f 00 (x) 0 del Corollario 354. In altre parole, il
ruolo della derivata seconda svolto nel caso generale dalla matrice Hessiana.
Proposizione 358 Sia f : U Rn ! R una funzione con derivate parziali di ordine
secondo continue su U . Allora:
(i) f concava se e solo se la matrice Hessiana r2 f (x) semidenita negativa per
ogni x 2 U ;
(ii) f strettamente concava se r2 f (x) denita negativa per ogni x 2 C.
il criterio pi utile per determinare se una funzione concava. Naturalmente,
risultati speculari valgono per le funzioni convesse, che sono caratterizzate dallavere
matrice Hessiane semidenite positive.
Esempio 429 NellEsempio 419 avevamo considerato la funzione f : R3 ! R denita
come
f (x) = x21 + 2x22 + x23 + (x1 + x3 ) x2 8x 2 R3
ed avevamo visto come la sua matrice Hessiana fosse denita positiva. Per il Teorema
358, la funzione strettamente convessa. N
Il prossimo risultato la versione vettoriale dei Teoremi 355 e 356. Come gi
osservato, sar importante nello studio della Programmazione matematica del Capitolo
27.
Teorema 359 Sia f : U Rn ! R derivabile in x 2 U . Se f concava, allora
f (y) f (x) + rf (x) (y x) 8y 2 U (22.9)
Se f derivabile su U con derivate parziali continue, allora f concava se e solo se
la (22.9) vale per ogni x; y 2 U .
22.2. CASO VETTORIALE 699

Per funzione convessa vale la disuguaglianza opposta. Il secondo membro della


(22.9) lapprossimazione a ne, costruita in x e valutata in y, di f : geometricamente
si tratta delliperpiano tangente a f in x, la versione vettoriale della retta tangente.
Il Teorema aerma allora che una funzione f derivabile concava se e solo se, in ogni
punto, tale approssimazione per eccesso, cio se liperpiano tangente le sta sempre
sopra (con la richiesta di continuit delle derivate parziali per la validit del Se).
700 CAPITOLO 22. CONCAVIT E DIFFERENZIABILIT
Capitolo 23

Complementi

23.1 Studio di funzioni


23.1.1 Flessi
Denizione 138 Siano f : A R ! R e x0 2 A \ A0 . La funzione f si dice

(i) concava nel punto x0 se esiste un suo intorno (eventualmente solo destro o solo
sinistro quando x0 sia di frontiera) nel quale essa concava;

(ii) strettamente concava nel punto x0 se esiste un suo intorno (eventualmente solo
destro o solo sinistro) nel quale essa strettamente concava.

Analoghe denizioni valgono per la (stretta) convessit in un punto.

Il Corollario 354 permette subito di dare la seguente

Proposizione 360 Sia f : A R ! R due volte derivabile in x0 2 A. Se f concava


in x0 , allora f 00 (x0 ) 0 (eventualmente la derivata intesa in senso unilaterale). Se
f 00 (x0 ) < 0, allora f strettamente concava in x0 .

Brevemente:

f concava in x0 =) f 00 (x0 ) 0
e
f 00 (x0 ) < 0 =) f strettamente concava in x0
Analoga caratterizzazione vale per la (stretta) convessit.

Esempio 430 (i) La funzione f : R ! R denita da f (x) = 2x2 3 strettamente


convessa in ogni punto perch f 00 (x) = 4 > 0 in ogni x.

701
702 CAPITOLO 23. COMPLEMENTI

(ii) La funzione f : R ! R denita da f (x) = x3 strettamente convessa in x0 = 5


essendo f 00 (5) = 30 > 0 e strettamente concava in x0 = 1 essendo f 00 ( 1) =
6 < 0. N

Geometricamente, come sappiamo, per le funzioni derivabili la concavit (conves-


sit) signica che la retta tangente sta sempre sopra (sotto) il graco della funzione.
La concavit (convessit) in un punto signica allora che la retta tangente in tal punto
sta localmente, ovvero almeno in un intorno del punto, sopra (sotto) il graco della
funzione.

5 10
y y

0 f(x )
0
6

-5 4 f(x )
0

-10

O x x O x x
0 0
-15 -2
0 1 2 3 4 5 6 -1 0 1 2 3 4 5 6 7

OfB. Cos come la derivata prima di una funzione in un punto d informazioni sul suo
crescere o decrescere, la derivata seconda d informazioni sulla concavit o convessit
in un punto. Quanto pi jf 00 (x0 )j grande, tanto pi pronunciata la curvatura (la
pancia) di f in x0 (e la pancia allins se f 00 (x0 ) < 0, prima gura, e allingi
se f 00 (x0 ) > 0, seconda gura).
Per evitare linuenza dellunit di misura di f (x), specialmente in Economia, si
considera
f 00 (x0 )
f 0 (x0 )
(o il suo valor assoluto) che non ne dipende1 . Si osservi incidentalmente che f 00 (x0 ) =f 0 (x0 )
la derivata di log f 0 (x0 ). N

Denizione 139 Siano f : A R ! R e x0 un punto di accumulazione per A. Il


punto x0 detto di esso per f se esiste un suo intorno relativamente al quale f
concava a destra e convessa a sinistra di x0 o viceversa.

In breve, in punto di esso cambia il verso della concavit della funzione. La


precedente Proposizione 360 consente di concludere subito che:
1
Infatti, se T e S sono rispettivamente le unit di misura delle variabili dipendente e indipendente,
00
le unit di misura di f 0 e di f 00 sono TS e ST2 , cosicch lunit di misura di ff 0 ST2 = TS = S1 .
23.1. STUDIO DI FUNZIONI 703

Proposizione 361 Sia f : A R ! R due volte derivabile in x0 . Se x0 punto di


esso per f , allora2 f 00 (x0 ) = 0.
2
Esempio 431 Sia f : A R ! R denita da f (x) = e x . Risultando f 0 (x) =
x2 00 2 2
2xe si ha f (x) = (4x 2) e x ; la funzione concava per
1 1
p <x< p
2 2
p p
e convessa
p per jxj > 1= 2. I due punti 1= 2 sono perci di esso e infatti
f 00 1= 2 = 0. Si noti che il punto x = 0 di massimo locale (in realt, globale,
come il lettore pu facilmente vericare). N

Geometricamente, per le funzioni derivabili, in un punto di esso la retta tangente


taglia il graco: non pu infatti stargli localmente n sopra n sotto.
Se in punto di esso accade che f 0 (x0 ) = f 00 (x0 ) = 0, la retta tangente orizzontale
e taglia il graco della funzione: si parla di punto di esso con tangente orizzontale.

Esempio 432 Per la funzione f : R ! R denita da f (x) = x3 il punto x0 = 0


di esso con tangente orizzontale. Pi in generale, ci vale per la funzione f (x) = xn
con n dispari. N

23.1.2 Asintoti
Intuitivamente, si chiama asintoto una retta alla quale il graco di una funzione si
avvicina indenitamente. Tali rette possono essere verticali, orizzontali od oblique.

(i) Quando limx!x0 f (x) = 1, la retta di equazione x = x0 un asintoto verticale


per f .
(ii) Quando limx!+1 f (x) = L o limx! 1 f (x) = L, la retta di equazione y = L
un asintoto orizzontale per f .
(iii) La retta di equazione y = ax + b (a 6= 0) un asintoto obliquo per f quando
limx! 1 (f (x) ax b) = 0, cio se la distanza tra la funzione e la retta tende
a 0 per x ! 1. Gli asintoti orizzontali sono in realt il caso particolare di
asintoti obliqui con a = 0.

evidente che vi pu essere al pi un solo asintoto orizzontale od obliquo per


x ! 1 e al pi uno solo per x ! +1. invece possibile che f possieda pi asintoti
verticali.
Non vi alcuna di colt per individuare gli asintoti verticali e orizzontali. Dedichi-
amo qualche considerazione agli obliqui. A tal ne diamo due semplici risultati.
2
Di pi, com facile vedere, se f 000 (x0 ) < 0 la derivata seconda decrescente e quindi passa
da valori positivi a valori negativi e quindi f passa dalla convessit alla concavit. Viceversa se
f 000 (x0 ) > 0.
704 CAPITOLO 23. COMPLEMENTI

Proposizione 362 La retta di equazione y = ax + b asintoto obliquo di f per


x ! 1 se e solo se
f (x)
lim =a e lim [f (x) ax] = b:
x! 1 x x! 1

Dim. Se. Se f (x) =x ! a, consideriamo la dierenza f (x) ax. Se essa tende a un


limite nito b, allora (e solo allora) f (x) ax b ! 0. Solo se. Da f (x) ax b ! 0
segue che f (x) ax ! b e, dividendo per x, che f (x) =x a ! 0.

Proposizione 363 Sia f derivabile e f (x) ! 1 per x ! 1. Allora y = ax + b


asintoto obliquo di f per x ! 1 se limx! 1 f 0 (x) = a e limx! 1 [f (x) ax] = b.

Dim. Basta applicare la regola di de lHospital.

Esempio 433 Per la funzione f : R ! R data da f (x) = 5x + 2e x , per x ! +1, si


ha che
f (x) 2
=5+ x !5
x xe
e che
f (x) 5x = 2e x ! 0:
Perci y = 5x asintoto obliquo di f per x ! +1. Per x ! 1 la funzione non
possiede asintoti orizzontali e obliqui. N
p
Esempio 434 Per la funzione f : [1; +1) ! R data da f (x) = x2 x, per x !
+1, si ha p r
f (x) x2 x 1
= = 1 !1
x x x
e per x ! +1
r 1
!
p 1 1 2
f (x) x = x2 x x = x 1 x=x 1 1
x x
1
1
1 x
2
1 1
= 1 ! :
x
2

Pertanto
1
y=x
2
asintoto obliquo per x ! +1 per f . N

piuttosto semplice rendersi conto che:

(i) Se f (x) = g (x) + h (x) e h (x) ! 0 per x ! 1, allora f e g hanno in comune


gli eventuali asintoti obliqui.
23.1. STUDIO DI FUNZIONI 705

(ii) Se pn (x) = a0 xn + a1 xn 1 + + an un polinomio


p di grado n in x con a0 > 0
n
e n dispari, allora la funzione denita da f (x) = pn (x) ha asintoto obliquo

p 1 a1
y= n
a0 x +
n a0

Se pn (x) = a0 xn + a1 xn 1 + + an un polinomio
p di grado n in x con a0 > 0 e
n
n pari, allora la funzione denita da f (x) = pn (x) per x ! +1 ha asintoto
obliquo
p 1 a1
y = n a0 x +
n a0
e per x ! 1 asintoto obliquo

p 1 a1
y= n
a0 x +
n a0

Verichiamo solo la (ii) per n dispari (per n pari i conti sono analoghi). Se n
dispari per x ! 1 si ha
p q
n
a x n n 1 + a1 + ::: + an
f (x) 0 a0 x a0 x p
= ! n a0
x x
p
quindi il coe ciente angolare dellasintoto obliquo n a0 . Inoltre
1
" 1 # 1+ a1 xn 1 +:::an n
1
p p a1 x n 1
+ :::an n p a1 x n 1
+ :::an a 0 xn
f (x) n
a0 x = n
a0 x 1+ 1 = n
a0 x a1 xn 1 +:::an
a0 x n a0 x n a 0 xn

Poich per x ! 1
1
a1 xn 1 +:::an n
1+ a 0 xn
1
1 p a1 x n 1
+ :::an p a1
a1 xn 1 +:::an
! e n
a0 x ! n
a0
a 0 xn
n a0 x n a0

si ha, per x ! 1,
p p a1 1
f (x) n
a0 x ! n
a0
a0 n
Nellesempio precedente si aveva n = 2, a0 = 1e a1 = 1; infatti, per x ! +1,
lasintoto aveva equazione
p
2 1 1 1
y= 1 x+ =x
2 1 2
706 CAPITOLO 23. COMPLEMENTI

23.1.3 Studio di funzioni


I risultati ottenuti in questi capitoli sul Calcolo dierenziale permettono lo studio
qualitativo di una funzione, che consiste nellindividuarne eventuali massimi e minimi
locali, essi e comportamento asintotico.
Consideriamo una funzione f : A R ! R denita su un insieme A. Per applicare
i risultati del capitolo, supponiamo inoltre che f sia derivabile almeno due volte in
ogni punto interno di A.

(i) In primo luogo opportuno calcolare i limiti di f nei punti di frontiera del
dominio oltre che eventualmente per x ! 1 quando A illimitato.
(ii) Pu essere interessante stabile gli insiemi nei quali la funzione positiva, f (x)
0, crescente, f 0 (x) 0, e convessa, f 00 (x) 0. Con le intersezioni con gli assi
(f (0) con lasse delle ordinate, f (x) = 0 con lasse delle ascisse) gi si ha unidea
sommaria del suo graco.
(iii) Per individuare eventuali estremi locali, si pu usare la procedura omnibus vista
nella Sezione 21.3.
(iv) I punti nei quali f 00 (x) = 0 sono candidati ad essere di esso; lo sono senzaltro
se in essi f 000 6= 0.
(v) Inne opportuno cercare eventuali asintoti di f .

Esempio 435 Sia f : R ! R data da f (x) = x3 7x2 + 12x. Si ha

lim f (x) = 1 ; lim f (x) = +1:


x! 1 x!+1

Risulta poi:

(i) f (0) p= 0 e f (x) = 0, cio x (x2 7x + 12) = 0, per x = 0 e per x =


7 49 48 =2 = 3 e 4. Visto che si pu scrivere f (x) = x (x 3) (x 4), la
funzione 0 quando x 2 [0; 3] [ [4; 1).
(ii) Essendo f 0 (x) = 3x2 14x + 12, la derivata nulla per
p p p
14 196 144 14 52 7 13
x= = = :
6 6 3
p i h p
La derivata 0 quando x 2 1; 7 3 13 [ 7+3 13 ; 1 .

(iii) Essendo f 00 (x) = 6x 14, essa nulla per x = 7=3. La derivata seconda 0
quando x 7=3.
p p
(iv) Dato che f 00 7 3 13 < 0, il punto di massimo locale; risultando invece f 00 7+ 13
3
>
0, il punto di minimo locale. Inne il punto 7=3 di esso.
23.1. STUDIO DI FUNZIONI 707

Il graco della funzione dunque:

10

y
8

0
O x

-2
-3 -2 -1 0 1 2 3 4 5 6 7

N
2
Esempio 436 Sia f : R ! R data da f (x) = e x . Entrambi i limiti, per x ! 1,
sono 0+ . La funzione sempre strettamente positiva e f (0) = 1. Cerchiamo eventuali
punti di estremo locale. La condizione del primo ordine f 0 (x) = 0 ha la forma
x2
2xe =0
e quindi x = 0 lunico punto critico. La derivata seconda
x2 x2 x2
f 00 (x) = 2e + ( 2x) e ( 2x) = 2e 2x2 1
e quindi f 00 (0) = 2: x = 0 punto di massimo locale.
Il graco della funzione

N
708 CAPITOLO 23. COMPLEMENTI

Esempio 437 Sia f : R ! R data da f (x) = x6 3x2 + 1. Cerchiamo eventuali


punti di estremo locale. La condizione del primo ordine f 0 (x) = 0 ha la forma

6x5 6x = 0;

e quindi x = 0 e x = 1 sono gli unici punti critici. Si ha f 00 (0) = 6, f 00 ( 1) = 24


e f 00 (1) = 24. Quindi, x = 0 punto di massimo locale, mentre x = 1 e x = 1 sono
punti di minimo locale. Da limx!+1 f (x) = limx! 1 f (x) = +1 segue che il graco
di questa funzione

Esempio 438 Sia f : R ! R data da f (x) = xex . I suoi limiti risultano

lim xex = 0 ; lim xex = +1:


x! 1 x!+1

Si ha poi che:

(i) f (x) 0 () x 0.

(ii) f 0 (x) = (x + 1) ex 0 () x 1.

(iii) f 00 (x) = (x + 2) ex 0 () x 2.

(iv) f (0) = 0: lorigine lunico punto di intersezione con gli assi.

Risultando f 0 (x) = 0 per x = 1 e f 00 ( 1) = e 1 > 0, x = 1 lunico punto di


minimo. Visto che f 00 (x) = 0 per x = 2, esso punto di esso.
23.1. STUDIO DI FUNZIONI 709

Esempio 439 Sia f : R ! R data da f (x) = x2 ex . I suoi limiti risultano


lim x2 ex = 0+ ; lim x2 ex = +1:
x! 1 x!+1

Si ha poi che:
(i) f (x) sempre 0 e f (0) = 0: x = 0 perci punto di minimo globale.
(ii) f 0 (x) = x (x + 2) ex 0 () x 2 ( 1; 2] [ [0; +1).
p p
(iii) f 00 (x) = (x2 + 4x + 2) ex 0 () x 2 1; 2 2 [ 2+ 2; +1
(iv) x = 2 e x = 0 sono gli unici punti stazionari. Essendo f 00 ( 2) = 2e 2 < 0,
x = 2 punto di massimo locale. Dato che f 00 (0) = 2e0 > 0 si conferma che
x = 0 di minimo.
p
(v) I due punti di ascisse 2 2 sono di esso.
710 CAPITOLO 23. COMPLEMENTI

Esempio 440 Sia f : R ! R data da f (x) = x3 ex . I suoi limiti risultano

lim x3 ex = 0 ; lim x3 ex = +1:


x! 1 x!+1

Si ha poi che:

(i) f (x) 0 () x 0; f (0) = 0.


(ii) f 0 (x) = x2 (x + 3) ex 0 () x 3; si noti che f 0 (0) = 0 ma che f 0 > 0 in
prossimit di x = 0: la funzione perci crescente nellorigine.
p p
(iii) f 00 (x) = (x3 + 6x2 + 6x) ex 0 () x 2 3 3; 3 + 3 [ [0; +1).
(iv) x = 3 e x = 0 sono gli unici punti stazionari. Essendo f 00 ( 3) = 9e 3 > 0,
x = 3 punto di minimo locale. Risulta f 00 (0) = 0 e gi sappiamo che la
funzione crescente in x = 0.
p
(v) I tre punti di ascisse 3 3 e 0 sono di esso.

N
1
Esempio 441 Sia f : R ! R data da f (x) = 2x + 3 + x 2
. Essa non denita per
x = 2. Risulta

lim f (x) = 1 ; lim f (x) = 1 ; lim f (x) = +1 ; lim f (x) = +1:


x! 1 x!2 x!2+ x!+1

1
(i) f (0) = 3 2
= 25 ; si ha f (x) = 0 allorquando (2x + 3) (x 2) = 1 ovvero
quando 2x2 x 5 = 0, cio per
p
1 41
x= ' 1; 35 e 1; 85.
4
23.1. STUDIO DI FUNZIONI 711

(ii) Risulta
1
f 0 (x) = 2
(x 2)2
che nulla se (x 2)2 = 1=2 cio se
p
2
x=2 .
2
(iii) Dato che
2
f 00 (x) =
(x 2)3
positiva per ogni x > 2 e negativa per ogni x < 2, i due punti stazionari
p
2
2
2
sono rispettivamente di massimo e di minimo locale.
(iv) Dato che f 0 (x) ! 2 per x ! 1, la funzione presenta un asintoto obliquo.
Visto che
1
lim [f (x) 2x] = lim 3+ = 3.
x! 1 x! 1 x 2
lasintoto obliquo ha equazione y = 2x + 3. Vi poi ovviamente un asintoto
verticale di equazione x = 2.

Si osservi, a conferma di ci che s detto, che


1
f (x)
x 2
1
per x ! 2 (in prossimit di 2 si comporta come , cio diverge) e che f (x) 2x+3
x 2
per x ! 1 (per x su cientemente grande si comporta come y = 2x + 3).
712 CAPITOLO 23. COMPLEMENTI

23.1.4 Versiera di Agnesi

La versiera di Agnesi una curva che si costruisce come segue. Si prende una circon-
ferenza di raggio a > 0 con centro nel punto (0; a) e si considera la retta di equazione
y = 2a. A questo punto si prendono tutte le rette che passano per lorigine 0. Ognuna
di esse intereseca la retta y = 2a in un unico punto A. Il segmento OA interseca a
sua volta la circonferenza nellorigine e in un unico punto B. La versiera il luogo dei
punti che hanno come ascissa lascissa di A e come ordinata lordinata di B.

y
1.5

A A A
3 1 2
1

0.5

-0.5

-1
O x
-1.5

-2
-2 -1 0 1 2

Costruzione dela versiera di Agnesi come luogo di


punti.

Con facili calcoli che lasciamo al lettore si vede che lequazione della versiera

8a3
f (x) = 8x 2 R
x2 + 4a2
23.2. CALCOLO DISCRETO 713

5
y
4

0
O x

-1
-5 0 5

Graco della versiera di Agnesi.

La curva straordinariamente simile alla celebre campana di Gauss. Risulta

8a3
f 0 (x) = 2x
(x2 + 4a2 )2

che nulla soltanto per x = 0. Dato che f 0 (x) > 0 per ogni x < 0 e f 0 (x) < 0 per
ogni x > 0, lorigine punto di massimo (globale). Risulta ancora

8a3 2 8a3 8a3 2x2


f 00 (x) = 2 + (2x) = 2 1+
(x2 + 4a2 )2 (x2 + 4a2 )3 (x2 + 4a2 )2 x2 + 4a2

che nulla quando


2x2
= 1 cio quando x2 = 4a2
x2 + 4a2
ovvero per x = 2a: essi sono perci punti di esso.

23.2 Calcolo Discreto


Il calcolo discreto considera per le successioni, cio per funzioni f : N f0g ! R con
dominio discreto, problemi analoghi a quelli che il Calcolo dierenziale studia per le
funzioni su R. Come vedremo, i risultati del Calcolo discreto sono spesso pi grezzi,
meno puliti, degli analoghi risultati del Calcolo dierenziale. Cionondimeno, in alcune
applicazioni il Calcolo discreto si rivela importante.
714 CAPITOLO 23. COMPLEMENTI

23.2.1 Dierenze nite


Le dierenze (dette talvolta dierenze nite)
xn = xn+1 xn
sono lanalogo, nel discreto, delle derivate: il pi piccolo passo di incremento per n
infatti 1 e perci
xn+1 xn xn+1 xn xn
xn = = = :
1 (n + 1) n n
Denizione 140 Data una successione fxn g,
f xn g = fxn+1 xn g
si dice successione delle dierenze (nite) di fxn g.

Il prossimo risultato contiene lalgebra delle dierenze, ossia il comportamento delle


dierenze rispetto alle operazioni fondamentali. lanalogo discreto dei risultati della
Sezione 18.7.

Proposizione 364 Date due successioni fxn g e fyn g, si ha

(i) (xn + yn ) = xn + yn ;
(ii) (xn yn ) = xn+1 yn + yn xn ;
xn yn xn xn yn
(iii) = .
yn yn yn+1
Mentre la (i) garantisce che la somma si scambia senza problemi con la dierenza
, i punti (ii) e (iii) aermano che le cose sono pi sottili per prodotti e rapporti. La
(ii) si dice regola del prodotto, mentre la (iii) la regola del rapporto.

Dim. La (i) ovvia. La (ii) segue da


(xn yn ) = xn+1 yn+1 xn yn = xn+1 yn+1 xn+1 yn + xn+1 yn xn yn
= xn+1 (yn+1 yn ) + yn (xn+1 xn ) = xn+1 yn + yn xn :
La (iii) segue da
xn xn+1 xn xn+1 yn xn yn+1 xn+1 yn xn yn + xn yn xn yn+1
= = =
yn yn+1 yn yn yn+1 yn yn+1
yn (xn+1 xn ) xn (yn+1 yn ) yn xn xn yn
= = :
yn yn+1 yn yn+1

La monotonia delle successioni si caratterizza in modo semplice, ma interessante,


tramite le dierenze.
23.2. CALCOLO DISCRETO 715

Lemma 365 Una successione crescente (decrescente) se e solo se xn 0( 0)


per ogni n 1.

La monotonia della successione originale quindi svelata dal segno delle dierenze.

Esempio 442 Sia fxn g = fan g con a > 0. Si ha

xn = an+1 an = (a 1) an = (a 1) xn :

Quindi, la successione fan g monotona crescente se e solo se a 1. N

Se a = 2, per la successione fan g si ha xn = xn . Daltro canto, se fxn g una


successione tale che
xn = xn ; (23.1)
ossia xn+1 xn = xn , si ottiene xn = 2n 1 x1 per ricorrenza. In particolare, partendo
da x1 = 2 si ottiene xn = 2n . La propriet di invarianza (23.1) per dierenze nite
caratterizza la successione f2n g, che quindi lanalogo nel discreto della funzione
esponenziale nel Calcolo dierenziale.

La successione delle dierenze di f xn g si indica con f 2 xn g ed detta delle


dierenze seconde. Si pu cos continuare indicando con k xn le dierenze di k 1 xn ,
cio k xn = k 1
xn .

Esempio 443 Sia fxn g = fn2 g. Risulta

xn = n2 = (n + 1)2 n2 = 2n + 1

e
2 2 2
xn = n = 2 (n + 1) + 1 (2n + 1) = 2.
N

Esempio 444 Sia fxn g = nk con k 2 N. Generalizzando quanto appena visto per
k = 2, mostriamo che
k k
n = k!
Procediamo per induzione. Per k = 2 sappiamo che 2 xn = 2 = 2! Supponiamo che
per ogni 2 r k 1 si abbia r nr = r! Usando il binomio di Newton, si ha

k k k k
nk = (n + 1)k nk = nk + n 1
+ n 2
+ +1 nk
1 2
k k
= knk 1
+ n 2
+ +1
2
716 CAPITOLO 23. COMPLEMENTI

r r
e quindi, usando lipotesi di induzione n = r! per 2 r k 1 e lalgebra delle
dierenze, si ha
k 1 k k 2
nk = k 1
nknk + 1
+1+
2
k
= k k 1 nk 1 + k 1
nk 2 + + k 1
(1)
2
= k (k 1)! + 0 + + 0 = k!
Si noti che gli zeri dellultima riga seguono dallipotesi induttiva, che garantisce, per
2 r k,
k 1 k r
n = r 1 k r nk r = r 1 (k r)! = 0
In conclusione, k k
n = k 1
nk = k!, come desiderato. N
Lesempio evidenzia lanalogia tra del calcolo discreto e la derivata del calcolo
continuo. Infatti, nel continuo necessario derivare k volte xk per arrivare a una
costante e derivarlo k + 1 volte per arrivare alla costante 0. Nel discreto, bisogna
applicare k volte alla successione nk per arrivare ad una costante e k + 1 volte per
arrivare alla costante 0.
Citiamo inne la formula di sommazione per parti (che lanalogo discreto della
formula di integrazione per parti). Consideriamo la somma
X
n
as b s :
s=1

Indichiamo con 1; 2; ; n i cumulati:


1 = b1
2 = b1 + b2

n = b1 + b2 + + bn
Proposizione 366 Convenendo di porre an+1 = 0, vale lidentit
Xn Xn
as b s = s as : (23.2)
s=1 s=1

Dim. Infatti
X
n X
n X
n
(as as+1 ) s = as s as+1 s
s=1 s=1 s=1
X
n X
n+1 X
n
= as s as s 1 = a1 1+ as s s 1
s=1 s=2 s=2
X
n X
n
= a1 b 1 + as b s = as b s ;
s=2 s=1
23.2. CALCOLO DISCRETO 717

come desiderato.

In altre parole, ponendo s = (as as+1 ), si ha

X
n X
n
as b s = s s
s=1 s=1

Decumularei valori as e cumularei bs lascia le cose intatte.

23.2.2 Un teorema di Cesro


Il limite del rapporto
xn
yn
ha unimportanza fondamentale, come visto nello studio degli ordini di convergenza.
Consideriamo il seguente esempio.

Esempio 445 Sia xn = n ( 1)n e yn = n2 . Si ha

xn ( 1)n
= !0
yn n
Se consideriamo le loro dierenze si ha
xn xn+1 xn ( 1)n+1 (1 + 2n)
= = = ( 1)n+1
yn yn+1 yn 1 + 2n

e quindi il rapporto xn = yn non converge. N

Quindi, mentre landamento asintotico del rapporto xn =yn regolare, quello del
rapporto xn = yn delle dierenze nite irregolare. Il prossimo risultato di Ernesto
Cesro mostra che, al contrario, la regolarit del comportamento asintotico del rap-
porto xn = yn implica quella del rapporto originario xn =yn .

Teorema 367 (Cesro) Siano fyn g una successione strettamente crescente e positi-
vamente divergente e fxn g unaltra successione. Se esiste il limite (nito o innito)
del rapporto
xn
(23.3)
yn
allora esiste anche il limite di xn =yn e i due limiti sono uguali.

Dim. La successione f xn = yn g sia convergente: ne segue che limitata e perci


esiste n tale che xn = yn < k per ogni n n. Dato che, per ipotesi, yn+1 yn > 0,
risulta
xn+1 xn < k (yn+1 yn ) 8n n:
718 CAPITOLO 23. COMPLEMENTI

Sommando tali disuguaglianze per n = n; n + 1; ;m 1 si ottiene

xm xn < k (ym yn ) ;
cio
xm xn kyn
<k+ :
ym ym
Visto che n sso e che ym ! +1 per m ! 1, risulta

xn kyn
! 0:
ym

Si ha allora che xm =ym < k + " per ogni " > 0 e ne segue lasserto.
Nello stesso modo, se xn = yn diverge a +1, xn = yn > K > 0 per ogni n n
e ne segue che xm =ym > K + ". In caso di divergenza a 1, xn = yn < K < 0 per
ogni n n e ne segue che xm =ym < K + ". In ogni caso vale lasserto.

Il teorema aerma che, se esiste il limite di xn = yn , esiste anche quello di xn =yn : il


precedente esempio ha mostrato come possa accadere che il secondo limite esista anche
senza che esista il primo. Perci eventuali irregolarit nel comportamento asintotico
del rapporto xn =yn si possono solo amplicare per il rapporto delle loro dierenze. Ne
segue che la regolarit di questultimo implica quella del rapporto originario xn =yn .
Il lettore attento avr gi notato che tutto ci non altro che lanalogo discreto
del Teorema di de lHospital. Cos come il Teorema di de lHospital si rivela di grande
utilit nel calcolo di limiti di funzioni, soprattutto quando presentano forme di inde-
terminazione, lanalogo discreto di Cesro pu rivelarsi molto utile nel calcolo di limiti
di successioni caratterizzati da forme di indeterminazione.

Esempio 446 Consideriamo la successione

log (1 + n)
(23.4)
n

il cui limite ricade nella forma di indeterminazione 1=1. Consideriamo le successioni


con termine xn = log (1 + n) e yn = n, cosicch la successione (23.4) si pu scrivere
nella forma xn =yn . Si ha

xn log (1 + n + 1) log (1 + n) 1
= = log 1 + !0
yn 1 1+n

e quindi
log (1 + n)
lim =0
n
grazie al Teorema di Cesro. N
23.2. CALCOLO DISCRETO 719

Anche se non lo dimostriamo, il Teorema di Cesro si pu estendere anche al caso


nel quale il limite (23.3) non esiste, risultando in generale

xn xn xn xn
lim inf lim inf lim sup lim sup (23.5)
yn yn yn yn

Per vedere che il Teorema di Cesro segue da questa disuguaglianza basta osservare
che se xn = yn converge, cio se lim inf xn = yn = lim sup xn = yn , allora la (23.5)
diventa
xn xn xn xn
lim inf = lim inf = lim sup = lim sup
yn yn yn yn
cio xn =yn converge allo stesso limite.

Questa versione pi generale del Teorema di Cesro implica la notevole disug-


uaglianza (11.17) che si rivelata importante nello studio della convergenza delle
serie. Infatti, sia fxn g una successione positiva. Si ha

xn+1 p 1
log = log xn+1 log xn e log n
xn = log xn :
xn n

Considerando log xn e yn = n , la (23.5) diventa

log xn log xn log xn log xn


lim inf lim inf lim sup lim sup
yn yn yn yn
cio
log xxn+1
n
p p log xxn+1
n
lim inf lim inf log n
xn lim sup log n
xn lim sup ;
1 1
da cui scende la (11.17).

Unaltra bella conseguenza del Teorema di Cesro contenuta nel seguente

Proposizione 368 Per ogni k > 1 risulta

X
n
nk+1 1
sk = + nk + o nk
s=1
k+1 2

Dim. Ci limitiamo a far vedere che, per n ! +1,

nk+1
1k + 2k + + nk :
k+1
Poniamo
xn = 1k + 2k + + nk ; yn = nk+1
720 CAPITOLO 23. COMPLEMENTI

e osserviamo subito che xn ; yn ! +1 per n ! 1 (e k < 1). Ora, utilizzando il


fatto che
(1 + zn ) 1
lim =
zn
con zn = 1= (n + 1),

xn+1 xn (n + 1)k 1 1
= = h i!
yn+1 yn (n + 1)k+1 nk+1 (n + 1) 1 1 1 k+1 k+1
n+1

Ne segue che lim xn =yn = 1= (k + 1).

23.2.3 Convergenza in media


Il prossimo risultato, oltre a essere di grande eleganza, anche una versione determin-
istica della legge forte dei grandi numeri, uno dei risultati centrali del Calcolo delle
probabilit.

Teorema 369 (Cesro) Sia fxn g una successione che converge a L 2 R. Si ha

x1 + x2 + + xn
! L:
n

Dim. Consideriamo le due successioni per le quali zn = x1 + x2 + + xn e yn = n.


Per esse
zn+1 zn xn+1
= = xn+1 :
yn+1 yn 1
Risulta allora, per ci che s visto poco sopra,
zn zn
lim inf xn+1 lim inf lim sup lim sup xn+1
n n
e, visto che lim inf xn+1 = lim sup xn+1 = lim xn = L per ipotesi, segue che
x1 + x2 + + xn
lim zn = lim = L;
n
come desiderato.

La successione Pn
i=1 xi
n
delle medie aritmetiche converge dunque sempre allo stesso limite della successione
fxn g, ma ovviamente non vale il converso: la successione delle medie pu convergere
anche quando la successione originaria non converge.
23.2. CALCOLO DISCRETO 721

Esempio 447 La successione f( 1)n g irregolare, ma


Pn
i=1 xi
!0
n
Infatti (
x1 + x2 + + xn 0 per n pari
=
n 1
per n dispari
n

La successione delle medie dunque pi regolare, pi stabile, della successione


originaria: ci molto importante ed alla base della legge forte dei grandi numeri,
nonch di molti altri risultati del Calcolo delle probabilit3 . In particolare, ci motiva
la prossima denizione pi generale di limite di successioni, detta nel senso di Cesro
o in media, di grande importanza nel Calcolo delle probabilit.

Denizione 141 Si dice che una successione fxn g tende a L secondo Cesro (o in
C
media), in simboli xn ! L, quando

x1 + x2 + + xn
! L:
n

Da ci che s detto chiaro che, se una successione converge in senso ordinario,


converge anche secondo Cesro allo stesso limite. Il converso non vale: vi pu essere
convergenza secondo Cesro senza che vi sia lordinaria.

C
Esempio 448 La successione f( 1)n g irregolare, ma ( 1)n ! 0. N

di un certo interesse stabilire in quali casi vale anche il converso, cio quando
accade che dalla convergenza della successione delle medie si possa dedurre la conver-
genza della successione originaria. Si parla in proposito di Teoremi tauberiani. Ne
indichiamo uno:

Proposizione 370 (Hardy-Landau) Sia fxn g una successione per la quale esiste
k < 0 tale che
xn
>k 8n 1: (23.6)
n
C
Allora xn ! L 2 R se e solo se xn ! L.
3
Una consimile propriet stabilizzante si ha non solo per la media aritmetica semplice, ma per
ogni tipo di media: media aritmetica ponderata, geometrica, quadratica, ecc..
722 CAPITOLO 23. COMPLEMENTI

Per esempio, la condizione (23.6) senzaltro vericata quando la successione fxn g


crescente: una successione crescente converge a L se e solo se vi converge in media.

OfB. Qualora una successione non converga nemmeno in media, potremmo consid-
erare la successione delle medie delle medie che, per i motivi esposti, converge pi
facilmentedella successione delle medie: si parla di convergenza nel senso C2. Lidea
si pu chiaramente estendere alle medie delle medie fatte k volte. H

Quanto abbiamo appena visto acquista un particolare interesse quando applicato


alla successione delle somme parziali. Infatti, intendendo il limite della successione
fsn g delle somme parziali nel senso di Cesro, possiamo dare un concetto pi generale
C P C
dellordinario alla somma di una serie: se sn ! S scriveremo 1 n=1 xn = S.
Serie del tutto irregolari diventano convergenti secondo questo pi generale con-
cetto. Vediamo un notevole esempio.
P1
Esempio 449 La serie n=1 ( 1)n irregolare. Le sue somme parziali

s1 = 1 ; s 2 = 0 ; s 3 = 1 ; s 4 = 0 ; s 5 = 1 ;

conducono alla successione delle medie (delle somme parziali)

1+0 1 2 2 1 3
y1 = 1 ; y2 = = ; y3 = ; y4 = = ; y5 = ;
2 2 3 4 2 5

abbastanza evidente che tutte le yn con n pari valgono 1=2 e che tutte le yn con n
dispari valgono
1=2 + n=2 n+1 1 1
= = +
n 2n 2 2n
e perci tendono anchesse a 1=2. Dunque

X
1
C 1
( 1)n = .
n=1
2

Il monaco Grandi pu essere soddisfatto: aveva sbagliato ma, precorrendo i tempi,


aveva fornito la risposta a un quesito pi generale. N

23.2.4 Innita pazienza


Nella Sezione 11.1.2 si era introdotta, per ogni 2 (0; 1), la funzione di utilit
intertemporale U : R1 ! R data da

X
1
t 1
U (x) = ut (xt ) 8x 2 R1 (23.7)
t=1
23.2. CALCOLO DISCRETO 723

Tale funzione ordina tutti i possibili proli di consumo intertemporale x 2 R1 . In


particolare, maggiore il fattore soggettivo di sconto maggiore limportanza che il
decisore assegna ai periodi futuri, ossia maggiore la sua pazienza.
naturale chiedersi cosa accada nel caso limite " 1,4 ossia quando il fattore
soggettivo di sconto tende a 1. Intuitivamente, ci corrisponde al caso di innita
pazienzadove tutti i periodi, presenti e futuri, hanno ugual peso per il decisiore. Nel
caso di orizzonte nito T la risposta banale:
X
T X
T
t 1
lim ut (xt ) = ut (xt ) (23.8)
"1
t=1 t=1

e quindi il caso limite corrisponde alla somma delle utilit dei vari periodi, tut-
ti con egual peso unitario. Con orizzonte innito il problema si complica in modo
X
1
sostanziale poich, per il Teorema 134, la convergenza della serie ut (xt ) richiede
t=1
limt!1 ut (xt ) = 0, il che poco plausibile dal punto di vista economico.
Consideriamo invece il limite
X1
t 1
lim (1 ) ut (xt )
"1
t=1

dove il fattore 1 di normalizzazione poich


X
1
t 1
(1 ) =1 (23.9)
t=1

Tale limite pu non esistere:


Esempio 450 Consideriamo la successione fxt g data da
0; 0 ; 1; 1 ; 0; 0; 0; 0; 1; 1; 1; 1; 1; 1; 1; 1; :::
|{z} |{z} | {z } | {z }
2 elementi 2 elementi 4 elementi 8 elementi

dove ogni blocco di 0 e 1 ha lunghezza pari alla somma delle lunghezze dei blocchi
X1
precedenti. Si pu mostrare che lim "1 (1 ) t 1
xt non esiste. N
t=1

Il prossimo profondo risultato, del quale omettiamo la non semplice dimostrazione,


mostra che lesistenza del limite equivale alla convergenza delle medie.
Teorema 371 (Frobenius-Littlewood) Sia x = fxt g una successione limitata, cio
X
1
1 t 1
x 2 R . Il limite lim "1 (1 ) xt esiste se e solo se fxt g converge nel senso
t=1
di Cesro. In tal caso
X
1
1X
1
t 1
lim (1 ) xt = lim xt
"1 T !+1 T
t=1 t=1
4
Per il signicato di " 1 si rinvia alla Sezione 9.6.3.
724 CAPITOLO 23. COMPLEMENTI

Il teorema suggerisce di denire la funzione V : R1 ! R come

V (x) = (1 ) U (x) 8x 2 R1

Per ogni 2 (0; 1) la funzione V equivalente a U :

V (x) V (y) () U (x) U (y) 8x 2 R1

Alla luce della (23.9), V una normalizzazione di U che assegna valore 1 alla
successione costante xt = 1 per ogni t.
Grazie al Teorema di Frobenius-Littlewood, si ha

1X
1
lim V (x) = lim ut (xt )
"1 T !+1 T
t=1

purch i limiti esistano. Il caso di innita pazienza perci catturato dal limite delle
utilit medie
1X
1
lim ut (xt ) (23.10)
T !+1 T
t=1

cio dal limite secondo Cesro della succesione fut (xt )g. Tale criterio pu quindi
vedersi come il caso limite per " 1 della funzione di utilit intertemporale V .
XT
Il ruolo che la somma ut (xt ) svolge nel caso (23.8) con orizzonte nito viene
t=1
dunque svolto con orizzonte innito dal limite delle utilit medie (23.10). Ques-
ta importante applicazione economica del Teorema di Frobenius-Littlewood chiude
degnamente il capitolo.
Parte V

Calcolo integrale

725
Capitolo 24

Integrale secondo Riemann

Consideriamo una funzione f positiva (cio con valori 0) denita su un intervallo


chiuso [a; b]. Intuitivamente, lintegrale di f su [a; b] la misura, detta area, della
porzione di piano

A f[a;b] = f(x; y) 2 [a; b] R+ : 0 y f (x)g ; (24.1)

sotteso dal graco della funzione f sullintervallo.

6
y

1
O a b x

0
0 1 2 3 4 5 6

Il problema come rendere rigorosa tale naturale intuizione. Per ssare le idee, nel
resto di questa sezione introduttiva considereremo una funzione f : [a; b] ! R positi-
va, cosicch il problema sia interpretabile proprio come larea della porzione di piano
A f[a;b] sottesa da f su [a; b]. Il classico procedimento che seguiremo, detto di esaus-
tione, consiste nellapprossimare la misura di A f[a;b] tramite aree di poligoni molto
semplici, i cosiddetti plurirettangoli, la cui misura si calcola in modo elementare.
Qualora lapprossimazione che si ottiene grazie a questi semplici poligoni si possa ren-
dere sempre pi precisa no a riuscire a catturare, al limite, la misura di A f[a;b] , tale

727
728 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

valore sar assunto come lintegrale di f su [a; b]. Lidea del procedimento di esaus-
tione nasce nella matematica greca, dove ha trovato brillanti applicazioni nei lavori di
Ippocrate di Chio, Eudosso di Cnido e Archimede di Siracusa.

24.0.5 Plurirettangoli
Sappiamo calcolare le aree di gure geometriche elementari e, tra esse, le pi semplici
sono i rettangoli, la cui area data dal prodotto di base per altezza. Una semplice, ma
cruciale, generalizzazione dei rettangoli rappresentata dai cosiddetti plurirettangoli,

-1
-1 0 1 2 3 4 5 6 7 8 9

ossia da poligoni formati da rettangoli contigui. Larea di un plurirettangolo non


altro che la somma delle aree dei singoli rettangoli che lo compongono.
Torniamo ora allinsieme A f[a;b] sotteso da una funzione f su [a; b]. facile
vedere come essa si possa racchiudere tra plurirettangoli inscritti e plurirettangoli che
la circoscrivono. Per esempio il seguente plurirettangolo inscritto

4 y

3.5

2.5

1.5

0.5

0
O a b x
-0.5

-1
0 1 2 3 4 5 6
729

mentre questaltro plurirettangolo circoscritto

4 y

3.5

2.5

1.5

0.5

0
O a b x
-0.5

-1
0 1 2 3 4 5 6

Naturalmente, larea di A f[a;b] maggiore di quella di ogni plurirettangolo in-


scritto e minore di quella di ogni plurirettangolo circoscritto. In altre parole, larea di
A f[a;b] compresa tra le misure delle aree dei plurirettangoli inscritti e circoscritti.
Che larea di A f[a;b] possa prendersi in mezzo, a sandwich, tra misure di aree
di plurirettangoli la prima osservazione importante: ci fornisce semplici approssi-
mazioni inferiori (le aree dei plurirettangoli inscritti) e superiori (le aree dei pluriret-
tangoli circoscritti) della misura di A f[a;b] .
La seconda osservazione cruciale che tale sandwich, e quindi le relative approssi-
mazioni, si possa rendere sempre migliore considerando plurirettangoli via via pi ni,
suddividendo sempre pi le loro basi,

4 y 4 y

3.5 3.5

3 3

2.5 2.5

2 2

1.5 1.5

1 1

0.5 0.5

0 0
O a b x O a b x
-0.5 -0.5

-1 -1
0 1 2 3 4 5 6 0 1 2 3 4 5 6

Suddividendo sempre pi le loro basi, larea dei plurirettangoli inscritti diventa


via via maggiore pur rimanendo sempre minore dellarea di A f[a;b] , mentre larea dei
plurirettangoli circoscritti diventa via via minore, pur rimanendo sempre maggiore del-
larea di A f[a;b] . In altre parole, le due fette del sandwich che racchiudono linsieme
730 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

A f[a;b] (le approssimazioni inferiori e superiori) hanno misure progressivamente pi


vicine tra loro.
Considerando plurirettangoli sempre pi ni, corrispondenti a basi via via pi
suddivise, se, al limite, lapprossimazione inferiore coincide con la superiore, ossia se,
al limite, le due fette del sandwich si saldano, tale valore (limite) pu a buon diritto
essere considerato come area di A f[a;b] . Partendo da oggetti molto semplici da
misurare, le aree di plurirettangoli, saremo cos riusciti a misurare, procedendo per
approssimazioni sempre pi precise, un oggetto in generale molto pi complesso qual
larea della porzione di piano A f[a;b] sottesa da una funzione f .

24.1 Denizione
Rendiamo ora rigorosa la procedura di esaustione, cominciando con il considerare
funzioni positive f : [a; b] ! R+ . In una prossima sezione ci occuperemo di funzioni
di segno qualunque.

24.1.1 Funzioni positive


Denizione 142 Un insieme = fxi gni=0 di punti una suddivisione di un intervallo
[a; b] se
a = x0 < x 1 < < xn = b
Linsieme di tutte le possibili suddivisioni di un intervallo [a; b] sar indicata con .

Data una funzione f : [a; b] ! R+ limitata, consideriamo le basi contigue determi-


nate dai punti della suddivisione

[x0 ; x1 ] ; [x2 ; x3 ] ; ::: ; [xn 1 ; xn ] (24.2)

Su di esse costruiamo il pi grande plurirettangolo inscritto nellinsieme sotteso da f .


In particolare, per li-esima base, la massima altezza mi del rettangolo di base [xi 1 ; xi ]
inscrivibile nellinsieme sotteso da f

mi = inf f (x)
x2[xi 1 ;xi ]

Siccome abbiamo supposto che f sia limitata, per il Teorema di completezza dei reali
tale estremo inferiore esiste nito, ossia mi 2 R. Poich la lunghezza xi di ogni base
[xi 1 ; xi ]
xi = xi xi 1
larea I (f; ) di tale massimo plurirettangolo inscritto data da

X
n
I (f; ) = mi xi (24.3)
i=1
24.1. DEFINIZIONE 731

In modo analogo, costruiamo sulle basi contigue (24.2) determinate dalla suddivisione
il pi piccolo plurirettangolo che circoscrive linsieme sotteso da f . Per li-esima base
la minima altezza Mi del rettangolo di base [xi 1 ; xi ] che circoscrive linsieme sotteso
da f data da
Mi = sup f (x)
x2[xi 1 ;xi ]

Anche in questo caso, essendo f limitata, per il Teorema di completezza dei reali,
lestremo superiore esiste nito, ossia Mi 2 R. Quindi, larea S (f; ) del minimo
plurirettangolo circoscritto

X
n
S (f; ) = mi xi (24.4)
i=1

Poich mi Mi per ogni i, si ha

I (f; ) S (f; ) 8 2 (24.5)

In particolare, linsieme sotteso da f compreso tra questi due valori. Quindi, I (f; )
d unapprossimazione inferiore di tale area, mentre S (f; ) ne d unapprossimazione
superiore.

Denizione 143 Date due suddivisioni e 0 di [a; b], diciamo che 0


ra na se
0
, ossia se tutti i punti di sono anche punti di 0 .

In altre parole, la suddivisione pi ne 0 ottenuta da aggiungendole ulteriori


punti, che determinano una suddivisione pi ne. Per esempio, se consideriamo [a; b] =
[0; 1], la suddivisione
0 1 1 3
= 0; ; ; ; 1
1 2 4
ra na la suddivisione = f0; 1=2; 1g.
facile vedere che se 0 ra na , allora

I (f; ) I (f; 0 ) S (f; 0 ) S (f; ) (24.6)

ossia una suddivisione pi ne 0 determina migliori approssimazioni, sia inferiore sia


superiore, dellarea sottesa1 da f . Partendo da qualsiasi suddivisione, possiamo quindi
sempre ra narla migliorando (o almeno non peggiorando) le approssimazioni date dai
rispettivi plurirettangoli.
Lo stesso si pu fare partendo da due qualsiasi suddivisioni e 0 non necessaria-
mente una pi ne dellaltra. Infatti, la suddivisione 00 = [ 0 formata dai tutti i
punti appartenenti a entrambe le suddivisioni e 0 ra na sia sia 0 : in altre parole,
00
un ra namento comune a e 0 .
1
Per brevit scriviamo area sottesa da f in luogo di area della porzione di piano sottesa da f .
732 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Esempio 451 Consideriamo le suddivisioni


1 1 2 0 1 1 3
= 0; ; ; ; 1 e = 0; ; ; ; 1
3 2 3 4 2 4
0 0
Si tratta di due diverse suddivisioni: n ra na n ra na . La suddivisione
00 1 1 1 2 3
= [ = 0; ; ; ; ; ; 1
4 3 2 3 4
un ra namento comune a e 0
. N

Grazie alla disuguaglianza (24.6) si ha


00 00
I (f; ) I (f; ) S (f; ) S (f; ) (24.7)

e
I (f; 0 ) I (f; 00
) S (f; 00
) S (f; 0 ) (24.8)
Un ra namento comune 00 determina perci, rispetto a e 0
, migliori approssi-
mazioni, sia inferiore sia superiore, dellarea sottesa da f .
Tutto ci suggerisce la prossima denizione.

Denizione 144 Sia f : [a; b] ! R+ una funzione limitata. Si dice integrale inferiore
di f su [a; b] il valore
Z b
f (x) dx = sup I (f; ) (24.9)
a 2

mentre si dice integrale superiore di f su [a; b] il valore


Z b
f (x) dx = inf S (f; ) (24.10)
a 2

Rb
Quindi, f (x) dx lestremo superiore delle aree I (f; ) dei plurirettangoli in-
a
scritti rispetto a tutte le possibili suddivisioni di [a; b], ed quindi la migliore ap-
prossimazione inferiore che si pu costruire per larea sottesa da f su [a; b] a partire
dai plurirettangoli inscritti.
Rb
In modo analogo, a f (x) dx lestremo inferiore delle aree I (f; ) dei plurirettan-
goli circoscritti rispetto a tutte le possibili suddivisioni di [a; b], ed quindi la migliore
approssimazione superiore che si pu costruire per larea sottesa da f su [a; b] a partire
dai plurirettangoli circoscritti.

Una prima questione da arontare se eettivamente esistano gli integrali inferiori


e superiori di una funzione limitata.

Lemma 372 Per una funzione limitata f : [a; b] ! R+ esistono niti sia lintegrale
Rb Rb
inferiore sia lintegrale superiore, ossia f (x) dx 2 R+ e a f (x) dx 2 R+ .
a
24.1. DEFINIZIONE 733

Dim. Poich f positiva e limitata, esistono 0 m M tali che m f (x) M


per ogni x 2 [a; b]. Quindi, per ogni suddivisione = fxi gni=0 si ha

m inf f (x) sup f (x) M 8i = 1; 2; : : : ; n


x2[xi 1 ;xi ] x2[xi 1 ;xi ]

e quindi
m (b a) I (f; ) S (f; ) M (b a) 8 2 ;
il che, grazie al Teorema di completezza dei reali, implica che lestremo
Rb superiore in
(24.9) e lestremo inferiore in (24.10) esistano niti e positivi, ossia f (x) dx 2 R+ e
a
Rb
a
f (x) dx 2 R+ .

Grazie al precedente lemma, ogni funzione limitata f : [a; b] ! R+ possiede sia


lintegrale inferiore sia lintegrale superiore. Naturalmente si ha
Z b Z b
f (x) dx f (x) dx
a a

e larea sottesa2 da f compresa tra tali due valori. La disuguaglianza la versione ul-
tima della disuguaglianza (24.6): gli integrali inferiore e superiore sono rispettivamente
le migliori approssimazioni inferiore e superiore dellarea sottesa da f ottenibile a par-
Rb Rb
tire dai plurirettangoli. In particolare, quando f (x) dx = a f (x) dx, larea sottesa
a
sar assunta uguale a tale valore. Ci motiva la prossima fondamentale denizione.

Denizione 145 Una funzione limitata f : [a; b] ! R+ si dice integrabile secondo


Riemann se Z b Z b
f (x) dx = f (x) dx
a a
Rb R
Il valore comune si indica con a
f (x) dx o con [a;b]
f (x) dx e si dice integrale di
Riemann di f su [a; b].
Rb R
La notazione a f (x) dx, o lequivalente [a;b] f (x) dx, vuol ricordare che lintegrale
Pn P
ottenuto
R come limite di somme del tipo i=1 i x i : la sostituita da una esse
lunga , xi da dx e i , che sono valori della funzione, da f (x).
Nel resto del capitolo per brevit spesso parleremo di integrali e funzioni integrabili,
omettendo la qualicazione di (o secondo) Riemann. Essendovi altre nozioni di
integrale, importante comunque tenere sempre in mente tale qualicazione. Si noti,
inoltre, che la denizione si applica solo a funzioni limitate: quando nel seguito si
considereranno funzioni integrabili, esse saranno, a fortiori, limitate.
Illustriamo la denizione di integrale con due esempi, il primo di una funzione
integrabile e il secondo di una funzione non integrabile.
2
Se esiste, cio se esiste la misura dellinsieme sotteso da f .
734 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Esempio 452 Sia f : [0; 1] ! R data da f (x) = x. Per qualunque suddivisione


fxi gni=0 si ha

X
n
I (f; ) = x0 x1 + x1 x2 + + xn 1 xn = xi 1 xi
i=1
X
n
S (f; ) = x1 x1 + x2 x2 + + xn xn = xi xi
i=1

e quindi
X
n
S (f; ) I (f; ) = (x1 x0 ) x1 +(x2 x1 ) x2 + +(xn xn 1 ) xn = ( xi )2
i=1

Per suddivisioni via via pi ni si ha xi ! 0, e dunque


Z b
X
n Z b X
n
2
0 f (x) dx = ( xi ) x f (x) dx ( xi )2 ! 0
a i=1 a i=1

Rb Rb
ossia a
f (x) dx = f (x) dx. Ne segue che f (x) = x integrabile. N
a

Esempio 453 Sia f : [0; 1] ! R la funzione di Dirichlet

1 se x 2 Q\ [0; 1]
f (x) = (24.11)
0 se x 2
= Q\ [0; 1]

ristretta su [0; 1]. Per la Proposizione 18 sulla densit dei razionali, per ogni 0 x <
y 1 esiste un razionale q tale che x < q < y. Data qualsiasi suddivisione fxi gni=0 di
[0; 1], si ha allora

I (f; ) = 0 x1 + 0 x2 + + 0 xn = 0;
X n
S (f; ) = 1 x1 + 1 x2 + + 1n xn = xi = 1;
i=1

Rb Rb
il che implica a
f (x) dx = 0 < 1 = f (x) dx. La funzione di Dirichlet non quindi
a
integrabile3 . N

24.1.2 Funzioni di segno qualsiasi


Estendiamo ora la nozione di integrale a funzioni f : [a; b] ! R limitate qualsiasi, non
necessariamente positive. Per una funzione f : [a; b] ! R che possa assumere valori sia
3
Non ha quindi signicato (almeno nel senso di Riemann) parlare di area dellinsieme sotteso
da tale funzione.
24.1. DEFINIZIONE 735

negativi sia positivi, linsieme sotteso da f su [a; b] ha in generale una parte positiva
e una parte negativa

5 y

2
+

1
O - x
0

-1

-2
-3 -2 -1 0 1 2 3 4

e lintegrale la dierenza tra le misure della parte positiva e della parte negativa.
Se esse hanno uguale valore, lintegrale nullo: il caso, per esempio, della funzione
f (x) = sin x sullintervallo [0; 2 ].
Per rendere rigorosa lidea, utile scomporre una funzione nelle sue parti positiva
e negativa.

Denizione 146 Sia f : A R ! R. La funzione f + : A R ! R+ denita come

f + (x) = max ff (x) ; 0g 8x 2 A;

mentre la funzione f : A R ! R+ denita come

f (x) = min ff (x) ; 0g 8x 2 A:

La funzione f + detta parte positiva di f , mentre f detta parte negativa.

Entrambe le funzioni f + e f sono positive.

Esempio 454 Sia f : R ! R data da f (x) = x. Si ha

x x 0 0 x 0
f + (x) = e f (x) = :
0 x<0 x x<0

Gracamente:
736 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Graco di f + : Graco di f :
N

Esempio 455 Sia f : R ! R data da f (x) = sin x. Si ha


8 [
< sin x x 2 [2n ; (2n + 1) ]
f + (x) = n2Z
:
0 altrimenti

e 8 [
< 0 x2 [2n ; (2n + 1) ]
f (x) = n2Z
:
sin x altrimenti
Gracamente:

Graco di f + : Graco di f :
N
24.1. DEFINIZIONE 737

Poich per ogni numero reale a 2 R si ha banalmente che

a = max fa; 0g + min fa; 0g ;

ne segue che, per ogni x 2 A, si ha

f (x) = max ff (x) ; 0g + min ff (x) ; 0g =


= max ff (x) ; 0g ( min ff (x) ; 0g) = f + (x) f (x) :

Ogni funzione f : A R ! R si pu quindi scomporre nella somma della sua parte


positiva e della sua parte negativa, ossia

f = f+ f : (24.12)

Il lettore pu vericare la scomposizione nei due esempi appena visti.


La scomposizione (24.12) permette di estendere in modo naturale la nozione di
integrale a funzioni non necessariamente positive. Essendo entrambe le funzioni pos-
itive, alle aree sottese da f + e f si applica la nozione di integrale di Riemann. La
dierenza tra i loro Rintegrali, ossia tra le aree da esse sottese, proprio lintegrale
Rb che
b +
cercavamo. Infatti, a f (x) dx larea sottesa dalla parte positiva di f e a f (x) dx
Rb Rb
larea sottesa dalla parte negativa di f . La loro dierenza a f + (x) dx a f (x) dx
equivale a considerare la dierenza tra le aree sottese della parte positiva e della parte
negativa.
Tutto ci motiva la seguente denizione di integrale di Riemann per funzioni
limitate di segno qualsiasi.

Denizione 147 Una funzione limitata f : [a; b] ! R si dice integrabile secondo


Riemann se sono integrabili le funzioni f + e f . In tal caso, lintegrale di Riemann
di f su [a; b] denito come
Z b Z b Z b
+
f (x) dx = f (x) dx f (x) dx:
a a a

Tale denizione rende rigorosa e trasparente lidea di considerare con segno di-
verso le aree che si trovano, rispettivamente, al di sotto della parte positiva f + e al
di sopra della parte negativa f di f . Tuttavia, mostreremo subito che si pu es-
primere in modo equivalente utilizzando, anche per funzioni di segno qualunque, le
approssimazioni I (f; ) e S (f; ) della denizione di integrale di funzioni positive.

24.1.3 Tutto si tiene


Per prima cosa osserviamo che, data una suddivisione = fxi gni=0 , possiamo denire,
anche per qualsiasi funzione f : [a; b] ! R limitata, le somme S (f; ) e I (f; ) come in
738 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

(24.3) e (24.4). Il lettore pu facilmente vericare che, per queste somme, continuano
a valere le propriet (24.5), (24.6), (24.7) e (24.8). In particolare, si ha

sup I (f; ) inf S (f; ) :


2 2

Anche per qualsiasi funzione f : [a; b] ! R limitata (non necessariamente positiva)


possiamo denire gli integrali inferiori e superiori
Z b Z b
f (x) dx = sup I (f; ) e f (x) dx = inf S (f; ) ; (24.13)
2 a 2
a

in perfetta analogia con quanto fatto per le funzioni positive. Il prossimo risultato
mostra che tutto si tiene, ossia la nozione di integrale di Riemann ottenuta tramite
la scomposizione (24.12) in parte positiva e negativa coincide con luguaglianza tra
integrali superiori e inferiori della (24.13).

Proposizione 373 Una funzione limitata f : [a; b] ! R integrabile se e solo se


Rb Rb
f (x) dx = a f (x) dx. In tal caso,
a

Z b Z b Z b
f (x) dx = f (x) dx = f (x) dx:
a a a

Dim. Sia f : [a; b] ! R una funzione limitata. Sia = fxi gni=0 una suddivisione di
[a; b]. Per prima cosa mostriamo che

sup I (f; ) sup I f + ; inf S f ; (24.14)


2 2 2

inf S f + ; sup I f ; inf S (f; ) :


2 2 2

Consideriamo un generico intervallo [xi 1 ; xi ]. Si ha

sup f (x) 0 () sup f (x) = sup f + (x) e inf f (x) = 0


x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ]
x2[xi 1 ;xi ]

sup f (x) < 0 () sup f + (x) = 0 e sup f (x) = inf f (x) :


x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ]
x2[xi 1 ;xi ]

Quindi
sup f (x) = sup f + (x) inf f (x) ;
x2[xi 1 ;xi ] x2[xi 1 ;xi ]
x2[xi 1 ;xi ]

il che implica
I (f; ) = I f + ; S f ;
24.1. DEFINIZIONE 739

sup I (f; ) = sup I f + ; S f ; sup I f + ; + sup S f ; =


2 2 2 2
= sup I f + ; inf S f ; :
2 2

Si ha inoltre

inf f (x) 0 () inf f (x) = inf f + (x) e sup f (x) = 0


x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ]

inf f (x) < 0 () inf f + (x) = 0 e inf f (x) = sup f (x) :


x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ]

Quindi
inf f (x) = inf f + (x) sup f (x) ;
x2[xi 1 ;xi ] x2[xi 1 ;xi ] x2[xi 1 ;xi ]

il che implica
S (f; ) = S f + ; I f ;
e

inf S (f; ) = inf S f + ; I f ; inf S f + ; + inf I f ; =


2 2 2 2
= inf S f + ; sup I f ; :
2 2

Tutto ci prova che vale la disuguaglianza (24.14).


Usando la disuguaglianza (24.14) possiamo ora dimostrare lenunciato. Cominci-
Rb Rb
amo con il Se: supponiamo f (x) dx = a f (x) dx. Mostriamo che allora f + e f
a
sono integrabili. Dalla (24.14) segue

sup I (f; ) = sup I f + ; inf S f ; = (24.15)


2 2 2

= inf S f + ; sup I f ; = inf S (f; ) :


2 2 2

Quindi

0 sup I f + ; inf S f ; = inf S f + ; sup I f ; 0;


2 2 2 2

da cui

sup I f + ; inf S f ; = inf S f + ; sup I f ; = 0;


2 2 2 2
740 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

ossia
inf S f + ; sup I f + ; = inf S f ; sup I f ; = 0:
2 2 2 2

Si conclude che inf 2 S (f + ; ) = sup 2 I (f + ; ) e inf 2 S (f ; ) = sup 2 I (f ; ),


e perci le funzioni f + e f sono integrabili. Inoltre, dalla (24.15) segue che
Z b Z b Z b
+
inf S (f; ) = sup I (f; ) = f (x) dx f (x) dx = f (x) dx:
2 2 a a a

Rimane da mostrare il Solo se. Supponiamo ora che f sia integrabile, ossia che
f + e f siano integrabili. Mostriamo allora che

sup I (f; ) = inf S (f; ) : (24.16)


2 2

Grazie alla (24.14) si ha


Z b Z b Z b
sup I (f; ) f + (x) dx f (x) dx = f (x) dx inf S (f; ) : (24.17)
2 a a a 2

0
Per ogni " > 0, esistono suddivisioni e tali che

S f +; I f +; <" e S f ; 0
I f ; 0
< ".
00 0
Se un ra namento comune di e , a maggior ragione, si ha

S f +; 00
I f +; 00
<" e S f ; 00
I f ; 00
<"

e perci
00 00
0 inf S (f; ) sup I (f; ) S (f; ) I (f; )
2 2
= S f +; 00
I f +; 00
+S f ; 00
I f ; 00
< 2";

il che implica la (24.16). Insieme alla (24.17), ci mostra che


Z b
sup I (f; ) = f (x) dx = inf S (f; ) ;
2 a 2

il che completa la dimostrazione.

24.2 Criteri di integrabilit


Nella prossima sezione studieremo alcune importanti classi di funzioni integrabili. A
tal ne, stabiliamo qui alcuni importanti criteri di integrabilit.
Vediamo un primo semplice, ma utile, criterio:
24.2. CRITERI DI INTEGRABILIT 741

Proposizione 374 Una funzione limitata f : [a; b] ! R integrabile secondo Rie-


mann se e solo se per ogni " > 0 esiste una suddivisione tale che S (f; ) I (f; ) <
".

Dim. Se. Supponiamo che, per ogni " > 0, esiste una suddivisione tale che
S (f; ) I (f; ) < ". Allora
Z b Z b
0 f (x) dx f (x) dx S (f; ) I (f; ) < "
a a

Rb Rb
e quindi, essendo " > 0 qualsiasi, si ha a
f (x) dx = f (x) dx.
a

Rb Rb
Solo se. Supponiamo a
f (x) dx. Grazie alla Proposizione 52, per
f (x) dx =
a
Rb
ogni " > 0 esistono una suddivisione tale che a f (x) dx I (f; ) < " e una suddi-
Rb
visione 0 tale che S (f; 0 ) f (x) dx < ". Sia 00 una suddivisione che ra na sia
a
sia 0 . Grazie alla (24.6) si ha I (f; ) I (f; 00 ) S (f; 00 ) S (f; 0 ), e quindi
Z b Z b
00 00 0
S (f; ) I (f; ) < S (f; ) I (f; ) < " + f (x) dx + " f (x) dx = 2";
a a

come desiderato.

Il prossimo risultato mostra che, se due funzioni sono uguali tranne che in un
numero nito di punti, allora i loro integrali, se esistono, sono uguali. Si tratta di
unimportante propriet di stabilit dellintegrale, il cui valore non cambia qualora si
modichi una funzione f : [a; b] ! R in un numero nito di punti.

Proposizione 375 Sia f : [a; b] ! R una funzione integrabile. Se g : [a; b] ! R


Ruguale
b
a f tranne
R b al pi in un numero nito di punti, allora anche g integrabile e
a
f (x) dx = a
g (x) dx.

Dim. Sia = fxi gni=0 la suddivisione tale che x1 < x2 < < xn 1 sono i punti in cui
f e g dieriscono, ossia f (xi ) 6= g (xi ) per ogni i = 1; 2; ; n 1, mentre f (x) = g (x)
per ogni x 2= fx1 ; x2 ; ; xn 1 g. Poich f e g sono entrambe limitate, esistono m < M
tali che
m f (x) M e m g (x) M; 8x 2 [a; b] :
Siano ' : [a; b] ! R e : [a; b] ! R funzioni ausiliarie tali che ' (x) = (x) se
x2= fx1 ; x2 ; : : : ; xn 1 g e ' (xi ) = m e (xi ) = M per ogni i = 1; 2; : : : ; n 1. Si ha
' f e' g . Fissato " > 0, consideriamo la suddivisione " data da

x0 < x 1 " < x1 + " < x2 " < x2 + " < < xn 1 " < xn 1 + " < xn :
742 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Si ha

I ('; ") = inf f (x) (x1 " x0 ) + 2" inf ' (x) + inf f (x) (x2 " x
x2[x0 ;x1 "] x2[x1 ";x1 +"] x2[x1 +";x2 "]

+2" inf ' (x) + + inf ' (x) + inf f (x) (xn xn 1
x2[x2 ";x2 +"] x2[xn 1 ";xn 1 +"] [xn 1 +";xn ]

= inf f (x) ( x1 ") + 2" (n 1) m +


x2[x0 ;x1 "]

X
n 1
+ inf f (x) ( xi 2") + inf f (x) ( xn ")
x2[xi 1 +";xi "] [xn 1 +";xn ]
i=2

S( ; ") = sup f (x) ( x1 ") + 2" (n 1) M +


x2[x0 ;x1 "]

X
n 1
+ inf f (x) ( xi 2") + inf f (x) ( xn ") :
x2[xi 1 +";xi "] [xn 1 +";xn ]
i=2

Perci

S (g; ") I (g; ") S( ; ") I ('; ") = 2" (n 1) (M m) : (24.18)

Poich n, m e M sono ssati (date f e g), mentre " > 0 arbitrario, grazie alla
Proposizione 374 dalla (24.18) segue che la funzione g : [a; b] ! R integrabile.
Rb Rb
Inoltre, a f (x) dx = a g (x) dx. Infatti, per ogni " > 0, si ha
Z b Z b
f (x) dx g (x) dx S ( ; " ) I ('; " ) ;
a a

e quindi la (24.18) implica


Z b Z b
f (x) dx g (x) dx lim 2" (n 1) (M m) = 0;
a a "#0

Rb Rb
ossia a
f (x) dx = a
g (x) dx.

OfB. Anche se una funzione f non denita in un numero nito di punti dellintervallo
[a; b], si pu parlare del suo integrale: esso coincide con quello di qualunque funzione
denita anche nei punti mancanti e che uguale a f nei punti nei quali questultima
denita. In particolare gli integrali di f su [a; b], (a; b], [a; b) e (a; b) coincidono sempre:
Z b
ci rende non ambigua la notazione f (x) dx. H
a

Da ultimo, mostriamo che lintegrabilit si preserva per trasformazioni continue.

Proposizione 376 Sia f : [a; b] ! R una funzione integrabile. Se g : A R ! R


continua, con Im f A, allora la funzione composta g f : [a; b] ! R integrabile.
24.3. CLASSI DI FUNZIONI INTEGRABILI 743

Dim. Sia " > 0. Siccome integrabile, f limitata. Esistono quindi m < M tali
che m f (x) M per ogni x 2 [a; b]. Grazie al Teorema 188, g uniformemente
continua su [m; M ], ossia esiste " > 0 tale che

jx yj < " =) jg (x) g (y)j < "; 8x; y 2 [m; M ] : (24.19)

Senza perdita di generalit, possiamo assumere che " < ".


Poich f integrabile, per la Proposizione 374 esiste una suddivisione = fxi gni=0
di [a; b] tale che S (f; ) I (f; ) < 2" . Sia I f0; 1; 2; : : : ; ng linsieme degli indici
dei punti di tali che

sup f (x) inf f (x) < ":


x2[xi 1 ;xi ]
x2[xi 1 ;xi ]

Dalla (24.19) segue

sup (g f ) (x) inf (g f ) (x) < " 8i 2 I:


x2[xi 1 ;xi ]
x2[xi 1 ;xi ]

Daltra parte
" #
X X
2
" xi sup f (x) inf f (x) xi < ";
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i2I
= i2I
=
P
e quindi i2I
= < ". Dunque
xi < "
" #
Xn
S (g f; ) I (g f; ) = sup (g f ) (x) inf (g f ) (x) xi
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i=0
" #
X
= sup (g f ) (x) inf (g f ) (x) xi
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i2I
" #
X
+ sup (g f ) (x) inf (g f ) (x) xi
x2[xi 1 ;xi ]
x2[xi 1 ;xi ]
i2I
=
X X
" xi + 2 sup g (x) xi < " (b a) + 2 sup g (x) "
i2I x2[m;M ] x2[m;M ]
i2I
=
" #
= b a + 2 sup g (x) ":
x2[m;M ]

Grazie alla Proposizione 374, g f integrabile.

24.3 Classi di funzioni integrabili


Forti dei criteri di integrabilit visti nella sezione precedente, studiamo ora alcune
importanti classi di funzioni integrabili.
744 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

24.3.1 Funzioni a scala


I plurirettangoli non sono, a loro volta, insiemi sottesi da funzioni. Infatti, con-
sideriamo per esempio un semplice plurirettangolo determinato dalla suddivisione
x0 < x 1 < x 2 < x 3 < x 4 < x 5 :

0
x x x x x
1 2 3 4 5
-1
-1 0 1 2 3 4 5 6 7 8 9

In corrispondenza dei punti x2 , x3 e x4 di suddivisione si hanno due valori in


ordinata e perci non esiste una funzione il cui graco determini un plurirettangolo. Vi
una per una classe di funzioni che, a meno di un numero nito di punti, sottendono
un plurirettangolo.

Denizione 148 Una funzione f : [a; b] ! R si dice a scala se esistono una suddivi-
sione = fxi gni=0 e un insieme fci gni=1 di costanti tali che

f (x) = ci 8x 2 (xi 1 ; xi ) : (24.20)

Per esempio, sono a scala le funzioni f; g : [a; b] ! R date da

X
n 1
f (x) = ci 1[xi 1 ;xi )
(x) + cn 1[xn 1 ;xn ] (x) (24.21)
i=1

e
X
n
g (x) = c1 1[x0 ;x1 ] + ci 1(xi 1 ;xi ]
(x) (24.22)
i=2

dove, per ogni insieme A R, con 1A : R ! R si denotata la funzione indicatrice

1 se x 2 A
1A (x) = :
0 se x 2
=A

Gracamente
24.3. CLASSI DI FUNZIONI INTEGRABILI 745

7 7

6 6

5 5

4 4
4 4
3
3 3
3
2 2 2 2

1 1 1 1

0 0
x x x x x x x x
1 2 3 4 1 2 3 4
-1 -1
-1 0 1 2 3 4 5 6 7 8 9 -1 0 1 2 3 4 5 6 7 8 9

Sugli intervalli
[x0 ; x1 ) [ (x1 ; x2 ) [ [ (xn 2 ; xn 1 ) [ (xn 1 ; xn ]
larea sottesa dalla funzione a scala corrisponde eettivamente a un plurirettangolo,
privato dei punti x1 < x2 < < xn 1 . In tali punti la funzione a scala dierisce
dal plurirettangolo determinato dalla suddivisione fxi gni=0 e dalle costanti fci gni=1 ,
ma, grazie alla Proposizione 375, tale discrepanza irrilevante per lintegrale: larea
sottesa dalla funzione a scala determinata dalla suddivisione fxi gni=0 e dalle costanti
fci gni=1 secondo la (24.20) pari a quella del corrispondente plurirettangolo in gura,
indipendentemente dai valori della funzione nei punti x1 < x2 < < xn 1 .

4
4
3
3
2 2

1 1

0
x x x x
1 2 3 4
-1
-1 0 1 2 3 4 5 6 7 8 9

Proposizione 377 Una funzione f : [a; b] ! R a scala, determinata dalla suddivi-


sione fxi gni=0 e dalle costanti fci gni=1 secondo la (24.20), integrabile e risulta
Z b Xn
f (x) dx = ci xi : (24.23)
a i=1
746 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Tutte le funzioni a scala sono determinate da una suddivisione fxi gni=0 e da un


insieme di costanti fci gni=1 secondo la (24.20) hanno perci il medesimo integrale, dato
dalla (24.23). In particolare, ci vale per le funzioni a scala (24.21) e (24.22).
Rb Rb
Dim. Siccome f limitata, grazie al Lemma 372 si ha che f (x) dx; a f (x) dx 2
a
R. Sia m = inf x2[a;b] f (x) e M = supx2[a;b] f (x). Fissato " > 0, consideriamo la
suddivisione " data da

x0 < x 1 " < x1 + " < x2 " < x2 + " < < xn 1 " < xn 1 + " < xn :

Si ha
Z b
f (x) dx I (f; ") = c1 (x1 " x0 ) + 2" inf f (x) + c2 (x2 " x1 ")
x2[x1 ";x1 +"]
a
+2" inf f (x) + + inf f (x) + cn (xn xn 1 ")
x2[x2 ";x2 +"] x2[xn 1 ";xn 1 +"]

X
n 1
= c1 ( x1 ") + 2" inf f (x)
x2[xi ";xi +"]
i=1
X
n 1
+ ci ( xi 2") + cn ( xn ")
i=2
X
n X
n 1
= ci xi " (c1 + cn ) + 2" inf f (x)
x2[xi ";xi +"]
i=1 i=1
X
n X
n
ci xi 2"M + 2" (n 1) m = ci xi + 2" ((n 1) m M) :
i=1 i=1

Poich la disuguaglianza vale per ogni " > 0, si ha


Z !
b X
n X
n
f (x) dx lim ci xi + 2" (m (n 1) M) = ci xi : (24.24)
"!0+
a i=1 i=1

In modo analogo si mostra che


Z b
X
n
f (x) dx S (f; ") ci xi + 2" (M (n 1) m)
a i=1

e quindi
Z b
!
X
n X
n
f (x) dx lim ci xi + 2" (M (n 1) m) = ci xi : (24.25)
a "!0+
i=1 i=1

Rb Pn
Le (24.24) e (24.25) implicano lintegrabilit di f , con a
f (x) dx = i=1 ci xi .
24.3. CLASSI DI FUNZIONI INTEGRABILI 747

24.3.2 Approccio analitico e approccio geometrico


Le funzioni a scala possono vedersi come la versione funzionale dei plurirettangoli. Esse
sono perci le funzioni pi semplici alle quali applicare lintegrazione. In particolare,
grazie alla (24.23), cio
Z b Xn
f (x) dx = ci xi
a i=1

gli integrali inferiori e superiori possono esprimersi in termini di integrali di funzioni


a scala. Sia S ([a; b]) linsieme di tutte le funzioni a scala denite su [a; b].

Proposizione 378 Data una funzione limitata f : [a; b] ! R si ha


Z b Z b
f (x) dx = sup h (x) dx : h f e h 2 S ([a; b]) (24.26)
a a

e Z Z
b b
f (x) dx = inf h (x) dx : h f e h 2 S ([a; b]) : (24.27)
a a

Dim. Consideriamo la (24.26) (la (24.27) si mostra in modo analogo). Sia f : [a; b] !
R una funzione a scala tale che f (xi ) = f (xi ) per ogni i = 0; 1; 2; : : : ; n e

f (x) = inf f (y) 8x 2 (xi 1 ; xi ) (24.28)


y2(xi 1 ;xi )

Poich
mi = inf f (y) inf f (y)
y2[xi 1 ;xi ] y2(xi 1 ;xi )

dalla (24.23) segue che

X
n Z
I (f; ) inf f (y) xi = f (x) dx
y2(xi 1 ;xi )
i=1

Perci Z Z
b
f (x) dx = sup I (f; ) sup f (x) dx
a 2 2

Mostriamo ora che Z Z


b
f (x) dx = sup f (x) dx (24.29)
a 2
Rb R
Supponiamo, per contra, che a f (x) dx < sup 2 f (x) dx. Esistono k > 0 e una
n
suddivisione e = f~
xi gi=0 tale che per ogni altra 2 si ha
Z
I (f; ) + k fe (x) dx (24.30)
748 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Fissato " > 0, consideriamo la suddivisione e" data da

x~0 < x~1 " < x~1 + " < x~2 " < x~2 + " < < x~n 1 " < x~n 1 + " < x~n

Procedendo come nella dimostrazione della Proposizione 377, si ha


X
n
I (f; e" ) ci x~i + 2" (m (n 1) M) : (24.31)
i=1

Poich la disuguaglianza vale per ogni " > 0, le (24.30) e (24.31) implicano che
Z !
Xn
fe (x) dx I (f; e" ) + k lim ci x~i + 2" (m (n 1) M ) + k
"#0
i=1
X
n Z
= ci x~i + k = fe (x) dx + k;
i=1

il che porta alla contraddizione 0 k > 0. Ne segue che vale la (24.29), come
desiderato.

Sia ora h 2 S ([a; b]) tale che h f . Supponiamo che h sia determinata, secondo
la (24.20), dalla suddivisione = fxi gni=0 e dalle costanti fci gni=1 . Poich h f , si ha
ci inf x2(xi 1 ;xi ) f (x) per ogni i = 1; 2; : : : ; n. Per la (24.23),
Z X
n X
n Z
h (x) dx = ci xi inf f (y) xi = f (x) dx
y2(xi 1 ;xi )
i=1 i=1

e quindi
Z b Z
sup h (x) dx : h f e h 2 S ([a; b]) sup f (x) d (x) :
a

Daltra parte, poich per costruzione f S ([a; b]) ed tale che f f , si ha


Z Z b
sup f (x) d (x) sup h (x) dx : h f e h 2 S ([a; b]) :
a

Grazie alla (24.29), possiamo concludere che vale la (24.26).

Grazie alle (24.26) e (24.27), una funzione limitata f : [a; b] ! R integrabile


secondo Riemann se e solo se
Z b Z b
sup h (x) dx : h f e h 2 S ([a; b]) = inf h (x) dx : f h e h 2 S ([a; b]) ;
a a

ossia se e solo se lapprossimazione inferiore data dagli integrali di funzioni a scala


minori di f coincide, al limite, con lapprossimazione superiore data dagli integrali
24.3. CLASSI DI FUNZIONI INTEGRABILI 749

di funzioni a scala maggiori di f . In questo caso lesaustione assume un aspetto


pi analitico e meno geometrico4 avendo sostituito lapprossimazione tramite poligoni
elementari (i plurirettangoli) con una fornita da funzioni elementari (le funzioni a
scala).
Ci suggerisce un diverso approccio allintegrale di Riemann, pi analitico e meno
geometrico. In esso dapprima si deniscono gli integrali di funzioni a scala (ossia
larea da essi sottesa), che si possono determinare in base a elementari considerazioni
geometriche basate sui plurirettangoli.
Si usano poi tali integrali elementari per approssimare in modo opportuno le
aree sottese da funzioni pi complesse. In particolare, una volta denito lintegrale
delle funzioni elementari, deniamo lintegrale inferiore di una funzione limitata f :
[a; b] ! R come lapprossimazione da sotto ottenuta grazie a funzioni scala h f ,
e, analogamente, lintegrale superiore di una funzione limitata f : [a; b] ! R come
lapprossimazione da sopraottenuta con funzioni a scala h f .
Grazie alle (24.26) e (24.27), tale interpretazione pi analitica del metodo di esaus-
tione equivalente alla geometrica adottata in precedenza. Lapproccio analitico
molto procuo per alcuni sviluppi successivi

OfB. Deniamo integrale I 1( ; ] di una funzione indicatrice larea da essa


sottesa, cio visibilmente (si tratta di un rettangolo di base e di altezza 1). Sia
ora f : R ! R+ una funzione limitata denita su (a; b]. Possiamo approssimarla, per
difetto e per eccesso, utilizzando combinazioni lineari di funzioni indicatrici. Detto I
linsieme delle funzioni indicatrici, se accade che
X
n X
n
f (x) ci 'i (x) e f (x) di 'i (x)
i=1 i=1
Xn
con 'i 2 I e ci ; di 2 R, allora ci 'i (x) unapprossimazione per difetto e
Xn i=1
di 'i (x) unapprossimazione per eccesso di f . Possiamo chiamare integrale di
i=1
una combinazione lineare di funzioni indicatrici (cio di una funzione a scala) la stessa
combinazione lineare dei loro integrali:
!
X
n Xn
I ki 'i (x) = ki I ('i (x))
i=1 i=1

e integrale superiore e inferiore di f rispettivamente il sup e linf degli integrali delle


loro approssimazioni per difetto e per eccesso:
Z b ( n )
X X
n
f (x) dx = sup ci I (ci (x)) : f (x) ci 'i (x)
a 'i 2I
i=1 i=1

4
Ossia basato anche sulluso di nozioni di analisi, quali le funzioni, e non solo su quello di gure
geometriche, quali i plurirettangoli.
750 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

e Z ( n )
b X X
n
f (x) dx = inf di I (ci (x)) : f (x) di 'i (x) :
a 'i 2I
i=1 i=1
H

24.3.3 Integrabilit delle funzioni continue e delle funzioni


monotone
Introduciamo due importanti classi di funzioni integrabili, le continue e le monotone.

Proposizione 379 Ogni funzione f : [a; b] ! R continua integrabile.

Dim. Poich f continua su [a; b], grazie al Teorema di Weierstrass, f limitata. Sia
" > 0. Grazie al Teorema 188, f uniformemente continua, ossia esiste " > 0 tale
che
jx yj < " =) jf (x) f (y)j < " 8x; y 2 [a; b] : (24.32)
Sia = fxi gni=0 una suddivisione di [a; b] su cientemente ne da far s che ogni
xi < " . Grazie alla (24.32), per ogni i = 1; 2; : : : ; n si ha allora

max f (x) min f (x) < ";


x2[xi 1 ;xi ] x2[xi 1 ;xi ]

dove max e min esistono grazie al Teorema di Weierstrass. Ne segue che


X
n X
n
S (f; ) I (f; ) = max f (x) xi min f (x) xi =
x2[xi 1 ;xi ] x2[xi 1 ;xi ]
i=1 i=1
Xn X
n
= max f (x) min f (x) xi < " xi = " (b a) :
x2[xi 1 ;xi ] x2[xi 1 ;xi ]
i=1 i=1

Grazie alla Proposizione 374, f integrabile.

Per la stabilit dellintegrale vista nella Proposizione 375, si ha la seguente imme-


diata generalizzazione della Proposizione 379: Ogni funzione limitata f : [a; b] ! R
che abbia al pi un numero nito di discontinuit eliminabili integrabile. Infatti,
ricordandosi la (13.7) del Capitolo 13, se S = fxi gni=1 linsieme dei punti dove f ha
discontinuit eliminabili, la funzione

f (x) se x 2
=S
f~ (x) =
limy!x f (y) se x 2 S

continua (e quindi integrabile) ed uguale a f eccetto che nei punto di S.


Lipotesi che le discontinuit siano eliminabili, in realt superua, purch la
funzione sia limitata:
24.4. PROPRIET DELLINTEGRALE 751

Teorema 380 Ogni funzione limitata f : [a; b] ! R che abbia al pi un numero nito
di discontinuit integrabile.
Omettiamo la dimostrazione (che meno immediata del caso speciale test visto
con sole discontinuit eliminabili). importante osservare che questo importante
risultato di integrabilit generalizza sia la Proposizione 379 sia la Proposizione 377
sullintegrabilit delle funzioni a scala (che, ovviamente, sono continue eccetto nei
punti delle suddivisioni che le deniscono).

Consideriamo ora le funzioni monotone.


Proposizione 381 Ogni funzione f : [a; b] ! R monotona integrabile.
Dim. Sia " > 0. Sia = fxi gni=0 una suddivisione di [a; b] tale che
b a
xi = < ":
n
Supponiamo che f sia crescente (largomento per f decrescente analogo). Si ha
inf f (x) = f (xi 1 ) f (a) e sup f (x) = f (xi ) f (b)
x2[xi 1 ;xi ] x2[xi 1 ;xi ]

e quindi
X
n X
n
S (f; ) I (f; ) = sup f (x) xi inf f (x) xi
x2[xi 1 ;xi ]
i=1 x2[xi 1 ;xi ] i=1
Xn X
n X
n
= f (xi ) xi f (xi 1 ) xi = (f (xi ) f (xi 1 )) xi
i=1 i=1 i=1

aX
n
b b a
(f (xi ) f (xi 1 )) = (f (b) f (a)) < " (f (b) f (a)) :
n i=1
n

Grazie alla Proposizione 374 f integrabile.

Si noti che la Proposizione 381 non un caso particolare del Teorema 380 perch
le funzioni monotone f : [a; b] ! R possono avere inniti punti di discontinuit.

24.4 Propriet dellintegrale


La prima importante propriet dellintegrale la sua linearit: lintegrale di una
somma (algebrica) uguale alla somma degli integrali.
Teorema 382 Siano f; g : [a; b] ! R due funzioni limitate e integrabili. Allora, per
ogni ; 2 R, la funzione f + g : [a; b] ! R integrabile, con
Z b Z b Z b
( f + g) (x) dx = f (x) dx + g (x) dx: (24.33)
a a a
752 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Dim. Sia = fxi gni=0 una suddivisione di [a; b]. Si ha


X
n X
n
I ( f; ) = inf ( f ) (x) xi = sup f (x) xi =
x2[xi 1 ;xi ] x2[xi 1 ;xi ]
i=0 i=0
X
n
= sup f (x) xi = S (f; )
i=0 x2[xi 1 ;xi ]

e, in modo analogo, si ha S ( f; ) = I (f; ). Sia " > 0. Poich f integrabile,


per la Proposizione 374, esiste tale che S (f; ) I (f; ) < ". Quindi, S ( f; )
I ( f; ) = S (f; ) I (f; ) < ", il che implica, grazie alla Proposizione 374, che f
integrabile. Inoltre,

Z b Z b
( f ) (x) dx = sup I ( f; ) = sup S (f; ) = inf S (f; ) = f (x) dx:
a 2 2 2 a

Se 0 si ha I ( f; ) = I (f; ) e S ( f; ) = S (f; ). Quindi, f integrabile,


Rb Rb
con a f (x) dx = a
f (x) dx. Se < 0, si ha
sup I ( f; ) = sup I (( ) ( f ) ; ) = sup I (( f ) ; )
2 2 2
Z b Z b
= ( f ) (x) dx = f (x) dx:
a a
Rb
In modo analogo, si ha inf 2 S ( f; ) = f (x) dx e quindi f integrabile con
Rb Rb a

a
f (x) dx = a
f (x) dx. In conclusione,
Z b Z b
f (x) dx = f (x) dx 8 2 R: (24.34)
a a

Sia " > 0. Poich f e g sono integrabili, per la Proposizione 374, esiste una
suddivisione di [a; b] tale che S (f; ) I (f; ) < " ed esiste 0 tale che S (g; 0 )
I (g; 0 ) < ". Sia 00 una suddivisione di [a; b] che ra na sia sia 0 . Grazie alla (24.6),
si ha S (f; 00 ) I (f; 00 ) < " e S (g; 00 ) I (g; 00 ) < ". Inoltre,
00 00 00 00 00 00
I (f; ) + I (g; ) I (f + g; ) S (f + g; ) S (f; ) + S (g; )
e quindi
00 00 00 00 00 00
S (f + g; ) I (f + g; ) S (f; ) I (f; ) + S (g; ) I (g; ) < 2":
Per la Proposizione 374, f + g integrabile. Inoltre,
sup I (f + g; ) sup (S (f; ) + S (g; ))
2 2
Z b Z b
sup S (f; ) + sup S (g; ) = f (x) dx + g (x) dx
2 2 a a
24.4. PROPRIET DELLINTEGRALE 753

inf S (f + g; ) inf (I (f; ) + I (g; ))


2 2
Z b Z b
inf I (f; ) + inf I (g; ) = f (x) dx + g (x) dx:
2 2 a a

Possiamo quindi concludere che


Z b Z b Z b
(f (x) + g (x)) dx = f (x) dx + g (x) dx: (24.35)
a a a

Insieme, le (24.34) e (24.35) equivalgono alla (24.33).

Tra le altre cose, la linearit implica che si possa liberamente suddividere il dominio
di integrazione [a; b] in sottointervalli:

Corollario 383 Sia f : [a; b] ! R una funzione limitata e integrabile. Se a < c < b,
si ha Z b Z c Z b
f (x) dx = f (x) dx + f (x) dx: (24.36)
a a c

Dim. Si ha f = 1[a;c] f + 1(c;b] f ; la linearit dellintegrale implica


Z b Z b
f (x) dx = 1[a;c] f + 1(c;b] f (x) dx =
a a
Z b Z b Z c Z b
= 1[a;c] f (x) dx + 1(c;b] f (x) dx = f (x) dx + f (x) dx
a a a c

come desiderato.

La prossima propriet di monotonia dellintegrale mostra che a funzioni pi grandi


corrispondono integrali maggiori. La scrittura f g signica f (x) g (x) per ogni
x 2 [a; b].

Teorema 384 Siano f; g : [a; b] ! R due funzioni limitate e integrabili. Se f g,


Rb Rb
allora a f (x) dx a
g (x) dx.

Dim. Da f g segue

I (f; ) I (g; ) e S (f; ) S (g; ) ; 8 2 :


Rb Rb
che sua volta implica a
f (x) dx a
g (x) dx.

Dalla monotonia dellintegrale segue unimportante disuguaglianza tra valori asso-


luti di integrali e integrali di valori assoluti.
754 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Corollario 385 Sia f : [a; b] ! R una funzione limitata e integrabile. Allora, jf j :


[a; b] ! R integrabile e
Z b Z b
f (x) dx jf (x)j dx sup jf (x)j (b a) : (24.37)
a a x2[a;b]

Dim. Poich g (t) = jtj continua, lintegrabilit di jf j : [a; b] ! R segue dal-


la Proposizione 376. Poich f jf j e f jf j, dalla Proposizione 384 segue
Rb Rb Rb Rb Rb
che a f (x) dx a
jf (x)j dx e a f (x) dx a
jf (x)j dx, ossia a f (x) dx
Rb
a
jf (x)j dx. Poich jf (x)j supx2[a;b] jf (x)j, sempre dalla Proposizione 384, segue
Rb Rb
che a jf (x)j dx a
supx2[a;b] jf (x)j dx = supx2[a;b] jf (x)j (b a).

Osserviamo che, se f; g : [a; b] ! R sono due funzioni limitate integrabili, allora


anche il loro prodotto f g : [a; b] ! R integrabile. Infatti, se f = g, allora lintegra-
bilit di f 2 segue dalla Proposizione 376 considerando la funzione continua g (x) = x2 .
Se f 6= g, su ciente considerare lidentit

1
fg = (f + g)2 (f g)2 :
4
Terminiamo con il classico Teorema del valor medio del calcolo integrale.

Teorema 386 (del valor medio) Sia f : [a; b] ! R una funzione limitata e integra-
bile. Esiste uno scalare " #
2 inf f; sup f
x2[a;b] x2[a;b]

tale che Z b
f (x) dx = (b a) :
a

In particolare, se f continua, esiste c 2 [a; b] tale chef (c) = , cio


Z b
f (x) dx = f (c) (b a) :
a

Dim. Detti rispettivamente m e M gli estremi inferiore e superiore di f su [a; b], si ha

m f (x) M 8x 2 [a; b]

e perci, grazie alla monotonia dellintegrale,


Z b Z b Z b
mdx f (x) dx M dx:
a a a
24.5. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE 755
Rb
Risulta evidentemente a mdx = m (b a) (si tratta dellarea di un rettangolo di
Rb
base b a e di altezza m) e a M dx = M (b a). Perci
Z b
m (b a) f (x) dx M (b a)
a

e ne segue banalmente la prima parte dellasserto.


Per la seconda basta osservare che se f costante su [a; b] allora m = M e
Rb
a
f (x) dx = m (b a) = M (b a). Se invece f non costante, su ciente
ricordare che una funzione continua assume tutti i valori strettamente compresi tra il
suo estremo inferiore e il suo estremo superiore per concludere che esiste c 2 [a; b] nel
quale f (c) = .

OfB. Il contenuto del precedente Teorema estremamente intuitivo: esiste certamente


un rettangolo di base [a; b] di area pari a quella sottesa da f su [a; b].

25

y
20

15

10

0
O a b x

-2 0 2 4 6 8

Se poi la funzione f continua, laltezza di tale rettangolo necessariamente coincide


con una delle ordinate di f .
Il valore di del precedente teorema detto valor medio (delle ordinate) di f : il
valore dellintegrale non cambia se si sostituisce il valore costante a tutte le ordinate
della funzione. H

24.5 Teorema fondamentale del Calcolo integrale


In questa sezione studiamo il risultato centrale della Teoria dellintegrazione, il cui
nome, Teorema fondamentale, ne evidenzia limportanza. Tra le altre cose, mostrer
come lintegrazione possa vedersi come loperazione inversa della derivazione, rendendo
in tal modo molto semplice il calcolo degli integrali.
756 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Nello studio della derivabilit, abbiamo considerato funzioni derivabili su un in-


tervallo aperto (a; b), o comunque derivabili nei punti interni del proprio dominio. In
questa sezione considereremo funzioni f : [a; b] ! R derivabili su [a; b], intendendo la
derivata negli estremi a e b in senso unilaterale. In modo analogo abbiamo convenuto
di intendere la derivabilit sugli intervalli semiaperti (a; b] e [a; b).

24.5.1 Funzioni primitive


Anche se saremo principalmente interessati a funzioni denite su intervalli [a; b] chiusi
e limitati, in questa sezione considereremo, pi in generale, un intervallo I qualsiasi,
sia esso aperto, chiuso, o semiaperto, limitato o non limitato (per esempio, I pu essere
lintera retta reale R).

Denizione 149 Sia f : I ! R. Una funzione P : I ! R si dice funzione primitiva


di f su I se P derivabile su I e

P 0 (x) = f (x) 8x 2 I:

In altre parole, il passare dalla funzione f alla sua primitiva P pu vedersi come
il procedimento inverso rispetto al passare da P a f tramite la derivazione. In questo
senso, la funzione primitiva linversa della funzione derivata5 .
Vediamo ora un paio di esempi. Al riguardo importante osservare che, come
mostrer lEsempio 459, esistono funzioni che non hanno primitive: la ricerca della
primitiva di una data funzione pu essere vana.

Esempio 456 Sia f : [0; 1] ! R data da f (x) = x. La funzione P : [0; 1] ! R data


da P (x) = x2 =2 primitiva di f . Infatti, P 0 (x) = 2x=2 = x. N

Esempio 457 Sia f : R ! R data da f (x) = x= (1 + x2 ). La funzione P : R ! R


data da
1
P (x) = log 1 + x2
2
primitiva di f . Infatti,
1 1
P 0 (x) = 2x = f (x)
2 1 + x2
per ogni x 2 R . N

Facciamo una semplice, ma utile, osservazione: se I1 e I2 sono due intervalli tali


che I1 I2 , allora, se P primitiva di f su I2 , lo anche su I1 . Per esempio, se
consideriamo la restrizione di f (x) = x= (1 + x2 ) su [0; 1], ossia la funzione fe : [0; 1] !
R data da fe(x) = x= (1 + x2 ), allora la primitiva su [0; 1] rimane P (x) = 21 log (1 + x2 ).
5
Tant che talvolta chiamata antiderivata.
24.5. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE 757

Si noti che, se P una primitiva di f , allora la funzione P + k ottenuta sommando


una costante a P anchessa una primitiva di f . Infatti, (P + k)0 (x) = P 0 (x) = f (x)
per ogni x 2 [a; b]. Il prossimo risultato mostra che, a meno di tali traslazioni, la
funzione primitiva unica.

Proposizione 387 Sia f : I ! R. Due funzioni P1 : I ! R e P2 : I ! R sono


entrambe primitive di f su I se e solo se esiste una costante k 2 R tale che

P1 = P2 + k:

Dim. Il Se ovvio. Dimostriamo il Solo se. Sia I = [a; b] e siano P1 : [a; b] ! R


e P2 : [a; b] ! R due funzioni primitive di f su [a; b]. Poich P10 (x) = f (x) e P20 (x) =
f (x) per ogni x 2 [a; b], si ha

(P1 P2 )0 (x) = P10 (x) P20 (x) = 0 8x 2 [a; b]

e quindi la funzione P1 P2 ha derivata nulla su [a; b]. Per il Corollario 331, la funzione
P1 P2 costante, ossia esiste k 2 R tale che P1 = P2 + k.
Sia ora I un intervallo aperto e limitato (a; b). Sia " > 0 su cientemente piccolo
da far s che a + " < b ". Si ha
1 h
[ " "i
(a; b) = a+ ;b :
n=1
n n

Per quanto appena dimostrato, per ogni n 1 esiste una costante kn 2 R tale che
h " "i
P1 (x) = P2 (x) + kn 8x 2 a + ; b : (24.38)
n n
Sia x0 2 (a; b) tale che a + " < x0 < b ", cosicch x0 2 [a + "=n; b "=n] per
ogni n 1. Dalla (24.38) segue che P1 (x0 ) = P2 (x0 ) + kn per ogni n 1. Quindi,
kn = P1 (x0 ) P2 (x0 ) per ogni n 1, ossia k1 = k2 = = kn . Esiste dunque k 2 R
tale che P1 (x) = P2 (x) + k per ogni x 2 (a; b).
In modo simile si pu dimostrare il risultato quando I un intervallo semiaperto
e limitato (a; b] o [a; b). Se I = R, si procede come nel caso (a; b) osservando che
[
1
R = [ n; n]. Un simile argomento, che lasciamo al lettore, vale anche per gli
n=1
intervalli illimitati.

La Proposizione 387 unaltra importante applicazione del Teorema del valor medio
(del Calcolo dierenziale). Grazie ad essa, una volta individuata una primitiva P di
una funzione f , possiamo scrivere la famiglia di tutte le primitive come fP + kgk2R .
Tale importante famiglia ha un nome.

Denizione 150 Data una funzione f : I !R R, la famiglia di tutte le sue primitive


si chiama integrale indenito e si indica con f (x) dx.
758 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Torniamo agli Esempi (456) e (457).

Esempio 458 Per la funzione f : [0; 1] ! R data da f (x) = x, si ha

Z
x2
f (x) dx = + k:
2

Per la funzione f : R ! R data da f (x) = x= (1 + x2 ) si ha

Z
1
f (x) dx = log 1 + x2 + k:
2

Chiudiamo la sezione mostrando che non tutte le funzioni ammettono una primi-
tiva, e quindi un integrale indenito.

Esempio 459 Sia f : R ! R la funzione segno, indicata con sgn x, data da

8
< 1 se x > 0
sgn (x) = 0 se x = 0
:
1 se x < 0

Essa non ammette primitiva. Supponiamo, per contra, che esista una primitiva P :
R ! R, ossia una funzione derivabile tale che P 0 = sgn x. Per la Proposizione 387
esiste k 2 R tale che
x+k se x > 0
P (x) =
x+k se x < 0

Siccome P derivabile, per continuit si ha inoltre P (0) = k. Quindi, P (x) = jxj + k


per ogni x 2 R, ma tale funzione non derivabile, il che contraddice quanto assunto su
P . Si noti che la funzione segno a scala e quindi integrabile grazie alla Proposizione
377.
24.5. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE 759

24.5.2 Formulario
La prossima tabella, ottenuta ribaltando lanaloga tabella delle derivate notevoli,
riporta alcuni integrali indeniti notevoli.
R
f f (x) dx
xa+1
xa +k 1 6= a 2 R e x > 0
a+1
xn+1
xn +k x2R
n+1
1
log x + k x>0
x
1
log jxj + k x 6= 0
x
cos x sin x + k x2R
sin x cos x x2R
ex ex x2R
x
x
>0ex2R
log
1
p arcsin x x2R
1 x2
1
tan x x2R
1 + x2
Facciamo tre osservazioni:
(i) Per le potenze si ha
Z
xa+1
xa dx = +k 8a 6= 1
a+1
su tutto R quando a tale che la funzione potenza xa ha come dominio R: per
esempio, se a = n naturale. Se invece a 2 R, per esempio a = 1=2, devessere
x > 0.
(ii) Il caso a = 1 per le potenze coperto da f (x) = 1=x.
(iii) Come sappiamo, se f (x) = log x, risulta f 0 (x) = 1=x, ma anche per f (x) =
log ( x) risulta
1 1
f 0 (x) = ( 1) = :
x x
Perci
d log jxj 1
=
dx x
e nella tabella abbiamo scritto che lintegrale di 1=x log jxj.
760 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

24.5.3 Il Primo Teorema fondamentale del calcolo integrale


Il prossimo teorema, detto Primo Teorema fondamentale del calcolo integrale, il
risultato centrale della teoria dellintegrazione. Dal punto di vista concettuale mostra
come lintegrazione si possa vedere come loperazione inversa della derivazione. Ci, a
sua volta, ore un potente metodo di calcolo dellintegrale basato sulluso delle funzioni
primitive.

Teorema 388 (Primo Teorema fondamentale del calcolo integrale) Siano f :


[a; b] ! R una funzione limitata e P : [a; b] ! R una sua funzione primitiva qualunque.
Se f integrabile, allora
Z b
f (x) dx = P (b) P (a) : (24.39)
a
Rb
Grazie alla (24.39), il calcolo dellintegrale di Riemann a f (x) dx si riduce al
calcolo della primitiva P di f , ossia al calcolo dellintegrale indenito. Come abbiamo
visto nella sezione precedente, esso si pu svolgere utilizzando in modo opportuno le
regole di derivazione studiate nel Capitolo 18. In un certo senso, la (24.39) riduce il
calcolo integrale al dierenziale.

Dim. Sia = fxi gni=0 una suddivisione di [a; b]. Se aggiungiamo e sottraiamo P (xi )
per ogni i = 1; 2; : : : ; n 1, si ha

P (b) P (a) = P (xn ) P (xn 1 ) + P (xn 1 ) P (x1 ) + P (x1 ) P (x0 )


Xn
= (P (xi ) P (xi 1 )) :
i=1

Consideriamo P su [xi 1 ; xi ]. Poich P derivabile su (a; b) e continua su [a; b], per il


Teorema del valor medio (del Calcolo dierenziale) esiste x^i 2 (xi ; xi 1 ) tale che
P (xi ) P (xi 1 )
P 0 (^
xi ) = :
xi xi 1
Essendo P una primitiva, si ha dunque
P (xi ) P (xi 1 )
xi ) = P 0 (^
f (^ xi ) =
xi xi 1
e quindi
X
n X
n X
n
P (b) P (a) = (P (xi ) P (xi 1 )) = f (^
xi ) (xi xi 1 ) = f (^
xi ) xi ;
i=1 i=1 i=1

il che implica
I (f; ) P (b) P (a) S (f; ) : (24.40)
24.5. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE 761

Poich una suddivisione qualsiasi, la (24.40) vale per ogni 2 e quindi

sup I (f; ) P (b) P (a) inf S (f; )


2 2

da cui, essendo f integrabile, segue la (24.39).

Illustriamo il teorema con alcuni esempi, che riprendono le primitive calcolate negli
Esempi (456) e (457).

Esempio 460 Sia f : R ! R data da f (x) = x. Si ha P (x) = x2 =2 e quindi, grazie


alla (24.39),
Z b
b 2 a2
xdx = :
a 2 2
R1
Per esempio, 0 xdx = 1=2. N

Esempio 461 Sia f : R ! R data da f (x) = x= (1 + x2 ). Come s visto nellEsem-


pio 457, la funzione primitiva P : R ! R data da P (x) = (1=2) log (1 + x2 ). Quindi,
grazie alla (24.39),
Z b
x 1 1
2
dx = log 1 + b2 log 1 + a2 :
a 1+x 2 2

Per esempio,
Z 1
x 1 log 2
dx = log 2 0= :
0 1 + x2 2 2
N

Per le funzioni integrabili prive di primitive, quali la funzione segno sgn x, il Teo-
rema 388 inapplicabile e il calcolo degli integrali non pu quindi farsi tramite la
formula (24.39). In alcuni semplici casi si riesce comunque a calcolare lintegrale us-
ando direttamente la denizione. Per esempio, la funzione segno a scala e quindi
possiamo applicare la Proposizione 377, nella quale, usando la denizione di integrale,
si era determinato il valore dellintegrale per questa classe di funzioni. In particolare,
grazie alla (24.23) si ha
8
Z b >
< b a se b 0
sgn x dx = a + b se a < 0 < b :
a >
: a b se b 0

Tuttavia, quando il Teorema 388 non applicabile, il calcolo degli integrali diventa in
generale molto pi arduo.
762 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

24.5.4 Il Secondo Teorema fondamentale del calcolo integrale


Alla luce del Primo Teorema fondamentale 388, diventa cruciale individuare condizioni
che garantiscano che una funzione f : [a; b] ! R integrabile abbia una primitiva.
Infatti, come abbiamo visto nellEsempio 459, vi sono funzioni integrabili che non
hanno primitive, e per le quali quindi il Teorema 388 non si pu applicare.
A questo ne, introduciamo unimportante nozione.

Denizione 151 Sia f : [a; b] ! R una funzione integrabile. La funzione F : [a; b] !


R data da Z x
F (x) = f (x) dx
a
si dice funzione integrale di f .

In altre parole, il valore F (x) della funzione integrale larea sottesa da f sullin-
tervallo [a; x], al variare di x. Vediamo una prima propriet delle funzioni integrali.

Proposizione 389 La funzione integrale F : [a; b] ! R di una funzione integrabile


f : [a; b] ! R (uniformemente) continua.

Dim. Poich f limitata, esiste M > 0 tale che jf (x)j M per ogni x 2 [a; b].
Siano x; y 2 [a; b]. Supponiamo y < x, cosicch
Rx jx yj = x y. Per la denizione di
funzione integrale, si ha F (x) F (y) = y f (t) dt. Grazie alla (24.37), si ha
Z x
jF (x) F (y)j = f (t) dt sup jf (t)j jx yj M jx yj :
y t2[y;x]

e quindi, per ogni " < 0, posto " = "=M ,

jx yj < " =) jF (x) F (y)j < " 8x; y 2 [a; b] :

Per il Teorema 188, F (uniformemente) continua su [a; b].

Forti della nozione di funzione integrale, possiamo ora tornare al problema che
aveva aperto la sezione, ossia lindividuazione di criteri che garantiscano lesistenza di
primitive per funzioni integrabili. Il prossimo importante risultato, il Secondo Teorema
fondamentale del calcolo integrale, mostra che se f continua, allora F 0 (x) = f (x) per
ogni x 2 [a; b], ossia la funzione integrale proprio una primitiva di f . La continuit di
una funzione perci una semplice e fondamentale condizione che garantisce lesistenza
di sue primitive.

Teorema 390 (Secondo Teorema fondamentale del calcolo integrale) Sia f :


[a; b] ! R una funzione continua (e quindi integrabile). La sua funzione integrale
F : [a; b] ! R una primitiva di f , ossia derivabile in ogni x 2 [a; b], e risulta

F 0 (x) = f (x) 8x 2 [a; b] :


24.5. TEOREMA FONDAMENTALE DEL CALCOLO INTEGRALE 763

Dim. Sia x0 2 (a; b). Per prima cosa vediamo quale forma assume il rapporto
incrementale di F in x0 . Consideriamo h > 0. Grazie al Corollario 383 si ha
Z x0 +h Z x0
F (x0 + h) F (x0 ) = f (t) dt f (t) dt =
a a
Z x0 Z x0 +h Z x0 Z x0 +h
= f (t) dt + f (t) dt f (t) dt = f (t) dt
a x0 a x0

e quindi, grazie al Teorema del valor medio (del calcolo integrale), avendo indicato con
x0 + #h, 0 # 1, un punto dellintervallo [x0 ; x0 + h]:
R x0 +h
F (x0 + h) F (x0 ) x0
f (t) dt hf (x0 + #h) hf (x0 )
f (x0 ) = f (x0 ) = =
h h h
= jf (x0 + #h) f (x0 )j ! 0
per la continuit di f .
Un argomento analogo vale anche se h < 0 e quindi
F (x0 + h) F (x0 )
F 0 (x0 ) = lim = f (x0 ) ;
h!0 h
completando in tal modo la dimostrazione quando x0 2 (a; b). I casi x0 = a e x0 = b
si dimostrano in modo simile, come il lettore pu agevolmente vericare.
Si conclude che esiste F 0 (x0 ) e che uguale a f (x0 ).

Il Secondo Teorema fondamentale fornisce una condizione su ciente (la continuit)


a nch una funzione integrabile abbia primitiva. Inoltre, grazie alla (24.39) del Primo
Teorema, si ha Z b
f (x) dx = F (b) F (a) ; (24.41)
a
Rb
ossia lintegrale a f (x) dx di Riemann di una funzione continua f uguale alla
dierenza F (b) F (a) calcolata relativamente alla funzione integrale.
Il prossimo esempio mostra che la continuit condizione solo su ciente, ma non
necessaria, a nch una funzione integrabile ammetta primitiva. Esso mostra infatti
che esistono funzioni integrabili non continue che possiedono primitive (e per le quali
si applica quindi il Primo Teorema fondamentale).
Esempio 462 Sia f : R ! R data da
( 1 1
2x sin cos se x 6= 0
f (x) = x x :
0 se x = 0
Essa discontinua in 0. Tuttavia, una sua primitiva P : R ! R
( 1
x2 sin se x 6= 0
P (x) = x
0 se x = 0
764 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Infatti, per x 6= 0, ci si pu vericare derivando x2 sin 1=x, mentre per x = 0 si osserva


che
P 0 (h) h2 sin h1 1
P 0 (0) = lim = lim = lim h sin = 0 = f (0) :
h!0 h h!0 h h!0 h
N

Chiudiamo osservando che vi sono funzioni continue la cui primitiva non esprim-
2
ibile tramite funzioni elementari.
R x2 Un classico esempio la funzione (continua) e x , il
cui integrale indenito e dx non si pu esprimere tramite funzioni elementari. In
tali casi il calcolo dei corrispondenti integrali di Riemann richiede tecniche pi ra nate
di quelle presentate in queste note. Sapere che una funzione ammette primitiva, per
esempio perch continua e quindi vale il Secondo Teorema fondamentale, cosa ben
diversa dal poterla poi calcolare.

OfB. Loperazione di integrazione rende pi regolare una funzione: la funzione inte-


grale F di f sempre continua e, se f continua, F derivabile. Loperazione di
derivata invece rende pi irregolare la funzione.
Anzi, di pi, lintegrazione migliora di una tacca la regolarit: F sempre con-
tinua; se f continua, F derivabile e, cos continuando, se f derivabile, F lo
due volte, ecc. ecc. La derivazione peggiora invece di una taccala regolarit di una
funzione. H
x2
OfB. Lintegrale di e si pu, per esempio, calcolare utilizzandone lo sviluppo in
serie. Risultando
x2 x4 x6
e =1 x2 + +
2! 3!
si ha Z
x2 x3 x5 x7
e dx = x + + +k
3 10 42
Per esempio, Z 1
x2 1 1 1
e dx = 1 + +
0 3 10 42
H

OfB. Interessa talora considerare un integrale su un intervallo [a (t) ; b (t)] dipendente


da un parametro t che, a sua volta, varia in un intervallo [t0 ; t1 ]:
Z b(t)
f (x) dx;
a(t)

Se F una primitiva di f , risulta


Z b(t)
f (x) dx = F (b (t)) F (a (t))
a(t)
24.6. PROPRIET DELLINTEGRALE INDEFINITO 765

e perci risulta, se a e b sono entrambe funzioni derivabili di t,


Z b(t)
D f (x) dx = F 0 (b (t)) b0 (t) F 0 (a (t)) a0 (t) = f (b (t)) b0 (t) f (a (t)) a0 (t) :
a(t)

24.6 Propriet dellintegrale indenito


Il Primo Teorema fondamentale del calcolo integrale fornisce, tramite la formula (24.39),
un metodo molto potente per il calcolo degli integrali di Riemann. In esso essenziale
il calcolo delle
R bprimitive, ossia dellintegrale indenito. Infatti, per calcolare lintegrale
di Riemann a f (x) dx di una funzione f : [a; b] ! R che ha primitiva si procede in
due passi:
R
(i) si calcola la primitiva P : [a; b] ! R di f , ossia lintegrale indenito f (x) dx;

(ii) si calcola la dierenza P (a) P (b): tale dierenza spesso indicata con le
notazioni P (x)jba o [P (x)]ba .

Presentiamo alcune propriet dellintegrale indenito che ne semplicano il calcolo.


Come prima cosa, osserviamo che la linearit delle derivate, stabilita nella (18.11), im-
plica la linearit dellintegrale indenito. Come nella Sezione 24.5.1, con I indichiamo
un generico intervallo.

Proposizione 391 Siano f; g : I ! R due funzioni che ammettono primitive. Per


ogni ; 2 R, la funzione f + g : I ! R ammette primitiva e risulta
Z Z Z
( f + g) (x) dx = f (x) dx + g (x) dx: (24.42)

Dim. Siano Pf : I ! R e Pg : I ! R le primitive di f e g. Grazie alla (18.11) si ha

( Pf + Pg )0 (x) = Pf0 (x) + Pg0 (x) = f + g

e quindi Pf + Pg la primitiva di f + g, il che implica la (24.42).

Una semplice applicazione del risultato il calcolo dellintegrale indenito di un


polinomio. Infatti, dato un polinomio f (x) = 0 + 1 x + + n xn , dalla (24.42)
segue che
Z Z X ! Z
n Xn Xn
xi+1
i i
f (x) dx = i x dx = i x dx = i + k:
i=0 i=0 i=0
i + 1

La regola (18.12) di derivazione del prodotto di funzioni conduce a unimportante


regola di calcolo dellintegrale indenito, detta di integrazione per parti.
766 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Proposizione 392 (Integrazione per parti) Siano f; g : I ! R due funzioni deriv-


abili. Allora
Z Z
f (x) g (x) dx + f (x) g 0 (x) dx = f (x) g (x) + k:
0
(24.43)

Dim. La (18.12) implica che (f g)0 = f 0 g + f g 0 . Quindi, f g = Pf 0 g+f g0 , e grazie alla


(24.42) si ha
Z Z Z
f (x) g (x) + k = [f (x) g (x) + f (x) g (x)] dx = f (x) g (x) dx + f (x) g 0 (x) dx;
0 0 0

come desiderato.

La regola (24.43) utile


R perch talvolta viR una forte asimmetria nella calcolabilit
degli integrali indeniti f 0 (x) g (x) dx e f (x) g 0 (x) dx: uno dei due pu essere
molto pi semplice da calcolare dellaltro. Sfruttando tale asimmetria, grazie alla
(24.43), possiamo calcolare lintegrale pi complicato come dierenza tra f (x) g (x) e
lintegrale pi semplice.
R
Esempio 463 Calcoliamo lintegrale indenito logR x dx. Siano f; g : (0; +1) ! R
denite
R come f (x) = log x e g (x) = x, cosicch log x dx si pu riscrivere come
log x g 0 (x) dx. Grazie alla (24.43) si ha
Z Z
0
xf (x) dx + log x dx = x log x + k;

ossia Z Z
1
x dx + log x dx = x log x + k
x
che implica Z
log x dx = x (log x 1) + k:

N
R
Esempio 464 Calcoliamo lintegrale indenito xR sin x dx. Siano f; g : (0; +1) !
RR date da f (x) = x e g (x) = cos x, cosicch x sin x dx si pu riscrivere come
f (x) g 0 (x) dx. Grazie alla (24.43) si ha
Z Z
0
f (x) g (x) dx + x sin x dx = x cos x + k

ossia Z Z
x sin x dx = cos xdx x cos x + k = sin x x cos x + k:

N
24.7. CAMBIAMENTO DI VARIABILE 767

Si osservi che nellultimo esempio, se invece avessimo posto f (x) = sin x e g (x) =
2
x =2, la regola
R (24.43) si sarebbe
R rivelata inutile. Anche con tale scelta di f e g si pu
riscrivere x sin x dx come f (x) g 0 (x) dx, ma qui la (24.43) implica
Z Z
0 x2
f (x) g (x) dx + x sin x dx = sin x + k
2
ossia Z Z
x2 1
x sin x dx = sin x x2 cos xdx + k
2 2
R 2
che ha in realt complicato le cose perch R lintegrale x cos xdx pi di cile da
calcolare rispetto allintegrale originario x sin x dx. Ci mostra che lintegrazione
per parti non pu svolgersi in modo meccanico, ma richiede un podi accortezza.

OfB. La formula dintegrazione per parti usualmente scritta come


Z Z
0
f (x) g (x) dx = f (x) g (x) f 0 (x) g (x) dx + k

I due fattori del prodotto f (x) g 0 (x) dx sono detti rispettivamente fattor nito (f (x))
e fattor dierenziale (g 0 (x) dx), cosicch la formula si ricorda come: lintegrale del
prodotto tra un fattor nito e un fattor dierenziale uguale al prodotto tra il fattor
nito e lintegrale del fattor dierenziale meno lintegrale del prodotto tra la derivata
del fattor nito e lintegrale appena trovato. Ribadiamo che decisivo scegliere
oculatamente quale dei due fattori prendere come fattor nito e quale come fattor
dierenziale.
Considerando integrali deniti, la formula diventa ovviamente
Z b Z b
0 b
f (x) g (x) dx = f (x) g (x)ja f 0 (x) g (x) dx
a a
Z b
= f (b) g (b) f (a) g (a) f 0 (x) g (x) dx
a

24.7 Cambiamento di variabile


Il prossimo risultato mostra come cambia lintegrale di una funzione f quando la
componiamo con unaltra funzione '.
Teorema 393 Sia ' : [c; d] ! [a; b] una funzione derivabile e strettamente crescente
tale che '0 : [c; d] ! R sia integrabile. Se f : [a; b] ! R continua, con Im ' [a; b],
allora la funzione (f ') '0 : [c; d] ! R integrabile e
Z d Z '(d)
0
f (' (t)) ' (t) dt = f (x) dx (24.44)
c '(c)
768 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Se ' suriettiva, si ha c = ' 1 (a) e d = ' 1 (b). La (24.44) si pu perci riscrivere


come
Z b Z ' 1 (b) Z ' 1 (b)
0
f (x) dx = f (' (t)) ' (t) dt = f (' (t)) d' (t) (24.45)
a ' 1 (a) ' 1 (a)

Euristicamente, la (24.44) si pu vedere come il risultato del cambiamento di variabile


x = ' (t) e del relativo cambiamento

dx = '0 (t) dt = d' (t) (24.46)

in dx. A livello mnemonico e di calcolo, losservazione pu essere utile, pur se la


scrittura (24.46) di per s priva di signicato.

Dim. Poich ' strettamente crescente, si ha ' (c) < ' (d). Dato che f continua,
grazie alla (24.41) si ha
Z '(d)
f (x) dx = F (' (d)) F (' (c)) (24.47)
'(c)

Inoltre, la regola della catena implica

(F ')0 (t) = (F 0 ') (t) '0 (t) = (f ') (t) '0 (t)

ossia F ' una primitiva di (f ') '0 : [c; d] ! R. Grazie alla Proposizione 376, la
funzione composta f ' : [c; d] ! R integrabile. Siccome, per ipotesi, '0 : [c; d] ! R
integrabile, anche la funzione prodotto (f ') '0 : [c; d] ! R integrabile (si ricordi
quanto visto al termine della Sezione 24.4). Per il Primo Teorema fondamentale si ha
Z d
(f ') (t) '0 (t) dt = (F ') (d) (F ') (c) : (24.48)
c

Poich ' biiettiva si ha ' (c) = a e ' (d) = b. Quindi, la (24.48) e la (24.47) implicano
Z d Z b
0
(f ') (t) ' (t) dt = F (' (d)) F (' (c)) = f (x) dx;
c a

come desiderato.

Il Teorema 393, oltre ad avere un interesse teorico, pu essere molto utile nel
calcolo degli integrali. La formula (24.44), e la sua riscrittura (24.45), si possono
usare sia da destra verso sinistra sia da sinistraRverso destra. Nel primo caso, da
b
destra a sinistra, lobiettivo calcolare lintegrale a f (x) dx trovando un opportuno
R ' 1 (b)
cambiamento di variabile x = ' (t) che porti a un integrale ' 1 (a) f (' (t)) '0 (t) dt
di calcolo pi semplice. La di colt sta nel trovare un opportuno cambiamento di
24.7. CAMBIAMENTO DI VARIABILE 769

variabile x = ' (t): nulla garantisce infatti che esista un cambiamento semplicatorio
e, quandanche esista, pu non essere ovvio trovarlo.

Luso in direzione sinistra verso destra della formula (24.44) serve per calcolare un
Rd
integrale che si possa scrivere come c f (' (t)) '0 (t) dt e il cui corrispondente integrale
R '(d)
'(c)
f (x) dx, ottenuto ponendo x = ' (t), sia di pi facile risoluzione. In tal caso la
Rd
di colt sta nel riconoscere la forma composta c f (' (t)) '0 (t) dt in un dato integrale
che si intende calcolare. Anche qui, nulla garantisce che esso si possa riscrivere in
questa forma, n che, quandanche possibile, essa sia facile da riconoscere.

Presentiamo ora tre esempi che illustrano le due possibili applicazioni della formula
(24.44). I primi due esempi considerano il caso destra verso sinistra, mentre lultimo
esempio considera il caso opposto. Per semplicit usiamo le variabili x e t come
appaiono nella (24.44), sebbene si tratti ovviamente di una pura comodit, priva di
valore sostanziale.

Esempio 465 Consideriamo lintegrale


Z b
p
sin xdx
a
p
con [a; b] [0; +1). Poniamo t = x, cosicch x = t2 . Si ha quindi ' (t) = t2 e,
grazie alla (24.45), si ha
Z Z p Z p
b p b b
sin xdx = p
2t sin tdt = 2 p
t sin tdt:
a a a
R
NellEsempio 464 avevamo risolto per parti lintegrale indenito t sin tdt. Alla luce
di tale esempio, si ha
Z pb p p p p
p p p
t sin tdt = sin x x cos xjpb = sin b sin a + a cos a b cos b
p a
a

e quindi
Z b p p p
p p p p
sin xdx = 2 sin b sin a+ a cos a b cos b :
a
p
Si noti come il punto dippartenza sia stato porre t = x, ossia specicare la funzione
inversa t = ' 1 (x) = x. Questo spesso il caso perch pi semplice pensare a
quale trasformazione di x possa semplicare lintegrazione. N

Esempio 466 Consideriamo lintegrale


Z
2 cos x
dx:
0 (1 + sin x)3
770 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

1
Poniamo t = sin x, cosicch ' (t) = sin t su [0; =2]. Dalla (18.18) segue che

1
'0 (t) = 1
:
cos sin t

Grazie alla (24.45), si ha


Z Z 1 1
2 cos x cos sin t 1
dx = dt =
0 (1 + sin x)3 0 (1 + t) 3
cos sin 1
t
Z 1 1
1 1 3
= dt = = :
0 (1 + t)3 2 (1 + t)2 0
8

Esempio 467 Consideriamo lintegrale


Z d
log t
dt (24.49)
c t

con [c; d] (0; +1). Posto g (x) = x e ' (t) = log t, si pu riscrivere lintegrale come
Z d Z d
log t
dt = g (' (t)) '0 (t) dt:
c t c

Grazie alla (24.44) si ha quindi


Z d Z d Z log d Z log d
log t 1
dt = 0
g (' (t)) ' (t) dt = g (x) dx = xdx = log2 d log2 c :
c t c log c log c 2

24.8 Integrali impropri


Si parla di integrali impropri in due casi: quando lintervallo dintegrazione illimitato
oppure quando lintervallo dintegrazione limitato ma illimitata la funzione in
prossimit di qualche suo punto.

24.8.1 Intervalli illimitati dintegrazione


Sinora abbiamo considerato integrali su intervalli chiusi e limitati [a; b]. Nelle ap-
plicazioni sono per molto importanti anche gli integrali su intervalli illimitati. Un
celeberrimo esempio la campana gaussiana
24.8. INTEGRALI IMPROPRI 771

y
2.5

1.5

0.5

0
O x
-0.5

-1
-4 -3 -2 -1 0 1 2 3 4

centrata nellorigine, la cui area data da un integrale della forma


Z +1
1 x2
p e 2 dx: (24.50)
2 1

In questo caso il dominio di integrazione lintera retta reale ( 1; +1).

Cominciamo con domini di integrazione della forma [a; +1). Data una funzione
f : [a; +1) ! R, si consideri la funzione integrale F : [a; +1) ! R data da
Z x
F (x) = f (t) dt:
a
R +1
La denizione di integrale improprio a f (x) dx si basa sul limite limx!+1 F (x),
ossia sul comportamento asintotico della funzione integrale. Per esso si possono avere
tre casi:
(i) limx!+1 F (x) = L 2 R,
(ii) limx!+1 F (x) = 1,
(iii) limx!+1 F (x) non esiste.
I casi (i) e (ii) sono considerati dalla prossima denizione.
Denizione 152 Sia f : [a; +1) ! R una funzione integrabile su ogni intervallo
[a; b] [a; +1) con primitiva F . Se limx!+1 F (x) 2 R, si pone
Z +1
f (x) dx = lim F (x)
a x!+1
R +1
e la funzione f si dice integrabile in senso improprio su [a; +1). Il valore a
f (x) dx
detto integrale improprio (o generalizzato) di Riemann.
772 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Per brevit, nel seguito diremo che una funzione f integrabile su [a; +1), omet-
tendo in senso improprio. Si ha la seguente terminologia:

(i) convergente se limx!+1 F (x) 2 R;

(ii) divergente positivamente se limx!+1 F (x) = +1; divergente negativamente se


limx!+1 F (x) = 1.
R +1
(iii) inne, se limx!+1 F (x) non esiste, si dice che lintegrale a f (x) dx non esiste
o che oscillante.

Esempio 468 Fissato > 0, sia f : [1; +1) ! R data da f (x) = x . La funzione
integrale F : [1; +1) ! R
( 1
(x1 1) se 6= 1
F (x) = 1
log x se =1

sicch 8
< +1 se 1
lim F (x) = 1
x!+1 : se >1
1
Ne segue che lintegrale improprio
Z +1
1
dx
1 x

esiste per ogni 2 R: converge se > 1 e diverge positivamente se 1. N


Ra
Lintegrale 1 f (x) dx sul dominio di integrazione ( 1; a] si denisce in modo
R1 Ra
analogo a a f (x) dx, considerando il limite limx! 1 x f (t) dt.

x2
Esempio 469 Sia f : ( 1; 0] ! R data da f (x) = xe . Si ha
Z 0 Z 0
t2 1 x2 1
f (x) dx = lim te dt = lim 1+e =
1 x! 1 x x! 12 2

e quindi lintegrale improprio


Z 0
x2
xe dx
1

esiste e converge. N

Consideriamo ora lintegrale improprio sul dominio di integrazione ( 1; 1).


24.8. INTEGRALI IMPROPRI 773

Denizione 153 SiaR f : R ! R una R afunzione integrabile su ogni intervallo [a; b]. Se
+1
esistono gli integrali a f (x) dx e 1 f (x) dx, la funzione f si dice integrabile (in
senso improprio) su R e si pone
Z +1 Z +1 Z a
f (x) dx = f (x) dx + f (x) dx; (24.51)
1 a 1

R +1
purch non si abbia una forma di indeterminazione 1 1. Il valore 1 f (x) dx
detto integrale improprio (o generalizzato) secondo Riemann di f su R.

facile vedere che questa denizione non dipende dalla scelta del punto a 2 R.
Spesso, per comodit, si prendeR a = 0.
+1
Anche lintegrale improprio 1 f (x) dx si dice convergente o divergente a seconda
che il suo valore sia nito oppure sia 1.

Illustriamo ora la nozioneR con un paio diR esempi. Si noti come occorra calcolare
+1 a
separatamente i due integrali a f (x) dx e 1 f (x) dx, i cui valori devono poi essere
sommati (quando non diano luogo a una forma di indeterminazione).

Esempio 470 Sia f : R ! R la funzione costante f (x) = k. Si ha


Z +1 Z +1 Z 0
f (x) dx = f (x) dx + f (x) dx
1 0 1
8
< +1 se k > 0
= lim kx + lim kx = 0 se k = 0
x!+1 x! 1 :
1 se k < 0
R +1
In altre parole, 1
kdx = k 1 a meno che k sia nulla. N

x2
Esempio 471 Sia f : R ! R data da f (x) = xe . Si ha
Z +1 Z +1 Z 0
f (x) dx = f (x) dx + f (x) dx
1 0 1
Z x Z 0
t2 t2
= lim te dt + lim te dt
x!+1 0 x! 1 x
1 x2 1 x2 1 1
= lim 1 e + lim 1+e = + =0
x!+1 2 x! 12 2 2
e quindi lintegrale improprio
Z +1
x2
xe dx
1

esiste e vale 0. N
774 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Esempio 472 Sia f : R ! R data da f (x) = x. Si ha


Z +1 Z +1 Z 0 Z x Z 0
f (x) dx = f (x) dx + f (x) dx = lim tdt + lim tdt
1 0 1 x!+1 0 x! 1 x
x2 x2
= lim + lim =1 1
x!+1 2 x! 1 2
e quindi lintegrale improprio Z +1
xdx
1
non esiste perch si ha la forma di indeterminazione 1 1. N
Una strada alternativa per denire una nozione di integrale su ( 1; +1) di
considerare lunico limite Z k
lim f (x) dx
k!+1 k
invece dei due limiti separati in (24.51). Ci motiva la prossima denizione.
Denizione 154 Sia f : R ! R una funzione integrabile
R1 su ogni intervallo
R 1[a; b]. Il
valore principale di Cauchy, che si indica con VP 1 f (x) dx, dellintegrale 1 f (x) dx
dato da Z Z
+1 k
VP f (x) dx = lim f (x) dx
1 k!+1 k

quando il limite esiste in R.


Al posto dei due limiti su cui si basa
R k la denizione di integrale improprio, il valore
principale considera il solo limite di k f (x) dx. Si tratta di una nozione pi debole
rispetto allintegrale improprio; infatti:
R +1 R +1
(i) quando esiste 1 f (x) dx, allora esiste anche il valore principale e VP 1 f (x) dx =
R +1
1
f (x) dx poich, per la Proposizione 170-(i), si ha
Z +1 Z k Z k Z 0
VP f (x) dx = lim f (x) dx = lim f (x) dx + f (x) dx
1 k!+1 k k!+1 0 k
Z k Z 0 Z 1
= lim f (x) dx + lim f (x) dx = f (x) dx
k!+1 0 k!+1 k 1

(ii) tuttavia, il valore principale pu esistere anche quando lintegrale improprio


R +1 non
esiste: nellultimo esempio abbiamo visto come lintegrale improprio 1 xdx
non esista; peraltro
Z +1 Z k
VP xdx = lim xdx = 0
1 k!+1 k
R +1
e quindi VP 1
xdx esiste nito.
24.8. INTEGRALI IMPROPRI 775

Il valore principale pu quindi esistere anche quando lintegrale improprio non


esiste. Per illustrare meglio la relazione tra le due nozioni di integrale su ( 1; 1),
consideriamo una versione pi generale dellEsempio 472.

Esempio 473 Sia f : R ! R data da f (x) = x + , con 2 R. Si ha


Z +1 Z +1 Z 0 Z x Z 0
f (x) dx = f (x) dx + f (x) dx = lim (t + ) dt + lim (t + ) dt
1 0 1 x!+1 0 x! 1 x
x2 x2
= lim + x + lim x =1 1
x!+1 2 x! 1 2

e quindi lintegrale improprio Z 1


(x + ) dx
1

non esiste perch si ha la forma di indeterminazione 1 1. Per quanto riguarda il


valore principale si ha
Z +1 Z k
VP f (x) dx = lim (x + ) dx =
1 k!+1 k
8
Z k < +1 se >0
= lim xdx + 2 k = 2 lim k = 0 se =0
k!+1 k k!+1 :
1 se <0
R +1
e quindi il valore principale esiste: VP 1
(x + ) dx = 1, a meno che sia nullo.
N

Esempio 474 Sia f : R ! R data da f (x) = x= (1 + x2 ) Si ha


Z +1 Z +1 Z 0 Z x Z 0
t t
f (x) dx = f (x) dx + f (x) dx = lim dt + lim dt =
1 0 1 x!+1 0 1 + t2 x! 1 x 1 + t2
1 1
= lim log 1 + t2 + lim log 1 + t2 =1 1
x!+1 2 x! 1 2

e quindi lintegrale improprio non esiste perch si ha la forma di indeterminazione


1 1. Per quanto riguarda il valore principale si ha invece
Z +1 Z k
x
VP f (x) dx = lim dx =
1 k!+1 k 1 + x2
1 1
= lim log 1 + k 2 log 1 + k 2 =0
k!+1 2 2
R +1 x
e quindi il valore principale VP 1
dx = 0. N
1 + x2
776 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Propriet e criteri di integrabilit


Diamo ora alcune propriet degli integrali impropri, nonch alcuni criteri di integra-
bilit impropria, ossia condizioni su cienti a nch una funzione f denita su un
dominio illimitato possieda integrale improprio. Per semplicit, ci limitiamo al do-
minio [a; +1), lasciando al lettore le analoghe versioni di questi criteri per i domini
( 1; a] e ( 1; +1).

Propriet Essendo deniti come limiti, le propriet degli integrali impropri seguono
dalle propriet dei limiti di funzioni viste nella Sezione 12.4. In particolare, lintegrale
improprio conserva le propriet di linearit e monotonia dellintegrale di Riemann.
Cominciamo con la linearit, che segue dallalgebra dei limiti vista nella Propo-
sizione 170.

Proposizione 394 Siano f; g : [a; +1) ! R due funzioni integrabili su [a; +1).
Allora, per ogni ; 2 R, la funzione f + g : [a; +1) ! R integrabile su [a; +1)
e risulta
Z +1 Z +1 Z +1
( f + g) (x) dx = f (x) dx + g (x) dx (24.52)
a a a

purch il secondo membro non sia una forma di indeterminazione 1 1.

Dim. Grazie alla linearit dellintegrale di Riemann, e ai punti (i) e (ii) della Propo-
sizione 170, si ha
Z x
lim ( f + g) (x) dx = lim ( F (x) + G (x)) = lim F (x) + lim G (x) =
x!+1 a x!+1 x!+1 x!+1
Z +1 Z +1
= f (x) dx + g (x) dx
a a

che implica lintegrabilit impropria della funzione f + g e la (24.52).

La propriet di monotonia dei limiti di funzioni (si veda la Proposizione 169 e le


sue varianti scalari) implica la propriet di monotonia dellintegrale improprio.

ProposizioneR 395 Siano f; gR : [a; +1) ! R due funzioni integrabili su [a; +1). Se
+1 +1
f g, allora a f (x) dx a
g (x).

Dim. Grazie alla monotonia dellintegrale di Riemann, si ha F (x) G (x) per ogni
x 2 [a; +1). Per la monotonia dei limiti di funzioni, si ha quindi limx!+1 F (x)
limx!+1 G (x).
R +1
Come s visto nellEsempio 470, si ha a 0dx = 0. Una semplice conseguenza
R +1
della Proposizione 395 allora che a f (x) dx 0 quando f positiva e integrabile
su [a; +1).
24.8. INTEGRALI IMPROPRI 777

La Proposizione 395 fornisce anche un semplice criterio del confronto per la diver-
genza: date due funzioni f; g : [a; +1) ! R integrabili su [a; +1), con g f , si
ha Z +1 Z +1
f (x) dx = +1 =) g (x) dx = +1 (24.53)
a a
e Z +1 Z +1
g (x) dx = 1 =) f (x) dx = 1: (24.54)
a a

Criteri di integrabilit Diamo ora alcuni criteri di integrabilit, limitandoci per


semplicit alle funzioni f : [a; +1) ! R positive. In tal caso, la funzione integrale
F : [a; +1) ! R crescente. Infatti, per ogni x2 x1 a,
Z x2 Z x1 Z x2 Z x1
F (x2 ) = f (t) dt = f (t) dt + f (t) dt f (t) dt = F (x1 )
a a x1 a
R x2
poich x1 f (t) dt 0. Grazie alla monotonia della funzione integrale, si ha la seguente
caratterizzazione degli integrali impropri di funzioni positive.

Proposizione 396 Sia f : [a; +1) ! R una funzione positiva e integrabile su ogni
[a; b] [a; +1). Allora essa integrabile su [a; +1) e
Z +1
f (t) dt = sup F (x) : (24.55)
a x2[a;+1)
R1
In particolare, a
f (t) dt converge solo se limx!+1 f (x) = 0 (purch tale limite
esista).

Le funzioni
R +1 f : [a; +1) ! R positive sono quindi integrabili
R 1 in senso impro-
prio, ossia a f (t) dt 2 R+ . In particolare, il loro integrale a f (t) dt converge
oppure diverge positivamente: tertium non datur. Si ha convergenza se e solo se
supx2[a;+1) F (x) < +1, e solo se f innitesima per x ! +1 (purch il limite
R +1
limx!+1 f (x) esista). Altrimenti, a f (t) dt diverge positivamente.

La condizione limx!+1 f (x) = 0 solo necessaria per la convergenza, come mostra


lEsempio 468 con 0 < 1. Per esempio, nel caso = 1 si ha limx!+1 1=x = 0, ma
per ogni a > 0 si ha
Z +1 Z x
1 1 x
dt = lim dt = lim log = +1
a t x!+1 a t x!+1 a
R +1
e quindi a (1=t) dt diverge positivamente.

Nellenunciare la condizione necessaria limx!+1 f (x) = 0 si posta la clausola


purch tale limite esista. Il prossimo semplice esempio mostra
R 1 che la clausola
importante perch il limite pu non esistere bench lintegrale a f (t) dt converga.
778 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Esempio 475 Sia f : [0; +1) ! R data da


(
1 se x 2 N
f (x) = :
0 altrimenti
Rx
Grazie alla Proposizione 375, facile vedere che 0 f (t) dt = 0 per ogni x > 0 e quindi,
R1
0
f (x) dx = 0. Tuttavia, il limite limx!+1 f (x) non esiste. N

La Proposizione 396 riposa sulla seguente semplice propriet dei limiti di funzioni
monotone.

Lemma 397 Sia ' : [a; +1) ! R una funzione crescente. Allora, limx!+1 ' (x) =
supx2[a;+1) ' (x).

Dim. Consideriamo dapprima il caso supx2[a;+1) ' (x) 2 R. Sia " > 0. Poich
supx2[a;+1) ' (x) = sup ' ([a; +1)), grazie alla Proposizione 52 esiste x" 2 [a; +1)
tale che ' (x" ) > supx2[a;+1) ' (x) ". Poich ' crescente, si ha

sup ' (x) " < ' (x" ) ' (x) sup ' (x) , 8x x"
x2[a;+1) x2[a;+1)

e quindi limx!+1 ' (x) = supx2[a;+1) ' (x).


Supponiamo ora che supx2[a;+1) ' (x) = +1. Per ogni M > 0 esiste xM 2 [a; +1)
tale che ' (xM ) M . La crescenza implica ' (x) ' (xM ) M per ogni x xM , e
quindi limx!+1 ' (x) = +1.

Dim. della Proposizione 396. Poich f denitivamente positiva, la sua funzione


integrale F : [a; +1) ! R crescente e quindi, grazie al Lemma 397

lim F (x) = sup F (x) :


x!+1 x2[a;+1)

Supponiamo che esista limx!+1 f (x). Mostriamo che lintegrale converge solo se
limx!+1 f (x) = 0. Supponiamo, per contra, che limx!+1 f (x) = L 2 (0; +1].
Dato 0 < " < L, esiste x" > 0 tale che f (x) L " > 0 per ogni x x" . Quindi
Z +1 Z +1 Z x Z x
f (t) dt f (t) dt = lim f (t) dt lim (L ") dt =
a x" x!+1 x" x!+1 x"
= (L ") lim (x x" ) = +1;
x!+1
R +1
il che mostra che a
f (t) dt diverge positivamente.

La Proposizione 396 rappresenta un semplice criterio di confronto per determinare


se lintegrale improprio di una funzione positiva convergente.
24.8. INTEGRALI IMPROPRI 779

Corollario 398 Siano f; g : [a; +1) ! R due funzioni positive e integrabili su ogni
[a; b] [a; +1), con f g. Allora
Z +1 Z +1
g (x) dx 2 [0; +1) =) f (x) dx 2 [0; +1) ; (24.56)
a a
e Z +1 Z +1
f (x) dx = +1 =) g (x) dx = +1 (24.57)
a a
R +1 R +1
Dim. Grazie alla Proposizione 395, si ha a f (x) dx g (x) dx, mentre, gra-
R +1 aR
+1
zie alla Proposizione 396, si ha a f (x) dx 2 [0; +1] e a g (x) dx 2 [0; +1].
R +1 R +1 R +1
Quindi, a f (x) dx converge se a g (x) dx converge, mentre a g (x) dx diverge
R +1
positivamente se a f (x) dx diverge positivamente.
Esempio 476 Tornando alla campana gaussiana (24.50), sia f : R ! R data da
Z +1
1 x2
f (x) = p e 2 dx:
2 1

La funzione f positiva. Per


R +1qualsiasi a 2 R qualsiasi, la Proposizione 396 garantisce
che lintegrale improprio a f (x) dx esiste. Mostriamo che esso converge. Sia g :
R ! R data da
1
g (x) = p e x .
2
Se x > 0, si ha

x x2 x2
g (x) f (x) () e e () x () x 2. 2
2
R +1 R +1
Grazie alla (24.56), se 2 g (x) dx converge, allora anche 2 f (x) dx converge. A
R +1
sua volta, ci implica che a f (x) dx converga per ogni a 2 R. Ci ovvio se a 2.
Se a < 2, si ha Z Z Z
+1 2 +1
f (x) dx = f (x) dx + f (x) dx
a a 2
R2
e,
R1 siccome a
f (x) dx esiste Rgrazie alla continuit di f su [a; 2], la convergenza di
1
f (x) dx implica quella di a f (x) dx.
2 R +1
Resta quindi da mostrare che 2 g (x) dx converge. Si ha
Z x
G (x) = g (x) dx = e x + e a
2

e quindi la (24.55) implica


Z 1
a
g (x) dx = sup G (x) = e < +1:
2 x2[2;1)
R +1
Ne segue che 2
g (x) dx converge, come desiderato. N
780 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Segnaliamo da ultimo un importante criterio asintotico di integrabilit, basato sulla


natura asintotica dellintegrale improprio.
Proposizione 399 Siano f; g : [a; +1) ! R funzioni positive e integrabile su ogni
[a; b] [a; +1).
R +1 R +1
(i) Se f g per x ! +1, allora a g (x) dx converge se e solo se a f (x) dx
converge.
R +1 R +1
(ii) Se f = o (g) per x ! +1 e a g (x) dx converge, allora anche a f (x) dx
converge.
R +1 R +1
(iii) Se f = o (g) per x ! +1 e a f (x) dx diverge positivamente, allora a g (x) dx
diverge positivamente.
Dim. (i) Poich f g per x ! +1, esiste k > 0 tale che
f (x)
lim = k:
x!+1 g (x)

Sia 0 < " < k. Esiste x" > a tale che 0 R(k ") g (x) f (x) (k + ") g (x)
+1
per ogni x x" . Grazie alla (24.56), si ha a f (x) dx 2 [0; +1) se e solo se
R +1
a
g (x) dx 2 [0; +1).
(ii) e (iii) Sia f = o (g) per x ! +1, ossia
f (x)
lim = 0:
x!+1 g (x)

Dato " > 0 esiste x" > a tale che 0 f (x)R "g (x) per ogni x x" . Anche qui, la
R +1 +1
(24.56) implica a f (x) dx 2 [0; +1) se a g (x) dx 2 [0; +1), mentre la (24.57)
R +1 R +1
implica a g (x) dx = +1 se a f (x) dx = +1.
R +1
Alla luce dellEsempio 468, la Proposizione 399 implica che a f (x) dx converge
se esiste > 1 tale che
1 1
f oppure f = o per x ! +1:
x x
Il confronto con le potenze x un importante criterio di convergenza per gli integrali
impropri, come mostrano i prossimi due esempi.
Esempio 477 Sia f : [0; +1) ! R una funzione positiva data da
p
x+ x
f (x) = :
sin2 x + x
Poich
1
f;
x
R +1
la Proposizione 399 implica 0 f (x) dx = +1. N
24.8. INTEGRALI IMPROPRI 781

Esempio 478 Sia f : [0; +1) ! R una funzione positiva data da


sin x
f (x) =
x
con 3. Poich
1
f ;
x 1
R +1
la Proposizione 399 implica 0 f (x) dx 2 [0; +1), ossia lintegrale converge. N

Chiudiamo osservando che, come il lettore pu vericare, quanto dimostrato per


le funzioni positive, si estende facilmente a tutte le funzioni f : [a; +1) ! R de-
nitivamente positive, ossia tali che esiste c > a per cui f (x) 0 per ogni x
c.

24.8.2 Funzioni illimitate


Un altro caso di integrale improprio sia ha quando la funzione sia continua in un
intervallo limitato [a; b] salvo che in qualche punto in un intorno del quale essa non
limitata (ovvero il limite della funzione in tali punti 1). Ci baster considerare
il caso di un solo punto dato che, se fossero pi duno, basterebbe esaminarli uno per
volta.
Cominciamo con il considerare il caso nel quale il punto in prossimit del quale la
funzione illimitata sia lestremo superiore b dellintervallo.

Denizione 155 Sia f : [a; b) ! R una funzione continua tale che limx!b f (x) =
1. Se Z z
lim f (x) dx = lim [F (z) F (a)]
z!b a x!+1

esiste (nito o innito) la funzione f si dice integrabile in senso improprio su [a; b] e


Rb Rb
tale limite si assume come a f (x) dx. Il valore a f (x) dx detto integrale improprio
(o generalizzato) di Riemann.

Se lillimitatezza della funzione riguardasse il punto a, o entrambi, si darebbe


una denizione del tutto analoga. Se lillimitatezza riguardasse un punto c 2 (a; b),
basterebbe disgiuntamente considerare i due intervalli [a; c] e [c; b].

Esempio 479 Sia f : [a; b] ! R data da


f (x) = (b x) con 0:
Dato che la sua funzione integrale
8 +1
< (b x)
>
per 0 6= 1
F (x) = +1 ;
>
:
log jb xj per =1
782 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

risulta
0 se 0 <1
lim F (x) = :
x!b +1 se 1
Ne segue che lintegrale improprio
Z b
1
dx
a (b x)
esiste per ogni 2 R: converge se 0 < 1 e diverge positivamente se 1. N

Anche per Rquesti integrali impropri vale la Proposizione 399 che permette ora di
b
aermare che a f (x) dx converge se esiste 0 < 1 tale che

1 1
f oppure f = o per x ! b :
(b x) (b x)

Il confronto con (b x) un importante criterio di convergenza per questi integrali


impropri.

OfB. Quando lintervallo illimitato, a nch lintegrale improprio converga, la fun-


zione deve tendere a zero piuttosto rapidamente (come x con > 1). Quando
invece illimitata la funzione, a nch lintegrale improprio converga, la funzione deve
tendere allinnito piuttosto lentamente (come (b x) con 0 < 1). Entrambe
le cose sono piuttosto intuibili: in ogni caso, a nch larea di una supercie illimitata
esista nita, la sua porzione che scappa allinnitodevessere molto stretta.
Per esempio, la funzione f : R+ ! R+ denita da f (x) = 1=x non integrabile n
su intervalli del tipo [a; +1), a > 0 n su intervalli del tipo [0; a]: infatti la funzione
integrale di f F (x) = log x che diverge sia per x ! +1 sia per x ! 0+ . Le
funzioni (asintotiche a) 1= (x b)1+" , con " > 0, sono integrabili sugli intervalli del
tipo [b; +1), b > 0, mentre funzioni (asintotiche a) 1= (x b)1 " , con 0 < " < 1, sono
integrabili sugli intervalli del tipo [0; b]. H

24.9 Criterio integrale di convergenza per le serie


Mostriamo qui unapplicazione del calcolo integrale allo studio della convergenza delle
serie. Cominciamo con unosservazione piuttosto banale. Data una successione fan g
di termini positivi, consideriamo una funzione f : [1; 1) ! R cos denita

f (x) = an 8x 2 [n; n + 1)

(cio a scala, ma con uninnit numerabile di scalini) risulta


Z k X
k 1
f (x) dx = an
1 n=1
24.9. CRITERIO INTEGRALE DI CONVERGENZA PER LE SERIE 783

per ogni k intero: infatti f sottende (prescindendo dai punti di ascissa intera che
peraltro non inuiscono sullintegrale) un plurirettangolo di basi tutte unitarie e di
altezze a1 ; a2 ; ; ak 1 . Facendo tendere k allinnito si conclude perci che
Z 1 X
1
f (x) dx = an ;
1 n=1
sia in caso di convergenza sia in caso di divergenza.
Nellintento di trarre indicazioni sul carattere di una serie dal comportamento di
un integrale, cerchiamo di rovesciarela precedente semplice osservazione.
Sia f : R++ ! R+ una funzione positiva e decrescente. Poniamo an = f (n),
n = 0; 1; 2; : : :. La positivit e la decrescenza di f consentono di aermare che
Z 1 X 1
f (x) dx an (la serie rappresenta il plurirettangolo inscritto)
0 n=1

e che
Z 1 X
1
f (x) dx an (la serie rappresenta il plurirettangolo circoscritto)
0 n=0

1.5 1.5

y y

a a
1 0 1 0

0.5 a 0.5 a
1 1
a a
2 2
. .
. .
. .
0 0
O 1 2 . . . x O 1 2 . . . x

-0.5 -0.5
-1 0 1 2 3 4 5 6 -1 0 1 2 3 4 5 6

e perci che
X
1 Z 1 X
1
an f (x) dx an :
n=1 0 n=0
Vale allora il

Teorema 400 (Criterio integrale di convergenza per le serie) P1 Siano f : R++ !


R+ una funzione positivaR1 e decrescente e a n = f (n). La serie n=1 an ha lo stesso
carattere dellintegrale 0 f (x) dx.

Esso piuttosto e cace perch spesso pi semplice appurare la convergenza o la


divergenza dellintegrale che la convergenza o la divergenza della serie.
784 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Esempio 480 Consideriamo la funzione f : R+ ! R denita da f (x) = 1=x . Dato


che 8
Z > x +1
1 < per 6= 1
dx = +1 ;
x >
:
logx per = 1
il suo integrale tra 0 e 1 converge se e solo se > 1. Ci consente di aermare che la
serie armonica generalizzata
X1 1
n=1 n

converge per > 1 e diverge per 1. N

Esempio 481 Consideriamo la funzione f : (1; 1) ! R denita da

1
f (x) = :
xlogx

Dato che Z
1
dx = logx
xlogx
che diverge per x ! 1, si pu concludere che la serie
X1 1
n=2 nlogn

divergente. N

24.10 Gran nale: Riemann e i numeri primi


Nella Sezione 9.12 avevamo studiato la distribuzione dei numeri primi. In particolare
avevamo visto il celebre Teorema dei numeri primi per il quale la loro distribuzione
asintotica a n= log n. Presentiamo qui alcuni ulteriori risultati sulla distribuzione
dei primi, tra i pi profondi dellintera Matematica e in cui Bernhard Riemann diede
contribuiti fondamentali.
Come prima cosa, deniamo p su [1; 1): (x) il numero di numeri primi inferiori
ax 1. Per esempio, se x = 2 2, si ha (x) = 2. La distribuzione ora una
funzione e non pi una successione.
Grazie alle sue incredibili capacit di calcolo, alla ne del Settecento Gauss ave-
va osservato che sembrava essere ben approssimato dalla funzione integrale Li :
[2; 1) ! R denita da Z x
1
Li (x) = dt
2 log t

Lintegrale non esprimibile in forma chiusa, ma integrando per parti si scopre che:
24.10. GRAN FINALE: RIEMANN E I NUMERI PRIMI 785

Lemma 401 Pe ogni n si ha:

x x x x x
Li (x) = + 1! 2 + 2! 3 + + (n 1)! +O (24.58)
log x log x log x logn x log n+1
x

La congettura di Gauss su Li (x) che un altro possibile stimatore6 di rispetto a


x= log x. Vediamo un podi dati:
x
x (x) log x
Li (x)
10 4 4; 3 6; 2
102 25 21; 7 30; 1
103 168 145 178
104 1:229 1:086 1:246
105 9:592 8:686 9:630
1010 455:052:511 434:294:482 455:055:615
1015 29:844:570:422:669 28:952:965:460:217 29:844:571:475:288
1020 2:220:819:602:560:918:840 2:171:472:409:516:250:000 2:220:819:602:783:663:484

con termini di errore

n
x (n) log n
j (x) Li (x)j

10 0; 3 2; 2
102 3; 3 5; 1
103 23 10
104 143 17
105 906 38
1010 20:758:029 3:104
1015 891:604:962:452 1:052:619
1020 49:347:193:044:659:701 222:744:644
In eetti, da queste tabelle Li (x) sembra essere uno stimatore di ancor pi interes-
sante di x= log x. Come nello sviluppo (24.58), Li (x) e x= log x sono funzioni diverse
ma collegate, tanto da essere asintotiche per x ! +1.

Proposizione 402 Si ha
x
Li (x) per x ! +1
log x
6
Le nozioni e terminologia sviluppata nella Sezione 9.12 per successioni si adattano in modo
naturale a funzioni. Per brevit, lasciamo al lettore i dettagli.
786 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Dim. Grazie al Secondo Teorema fondamentale del calcolo integrale, si ha d Li (x) =dx =
1= log x. Quindi
d Li(x) 1
dx log x log x
d(x= log x)
= log x 1 = !1
log2 x
log x 1
dx

e grazie alla regola di de lHospital si ha Li (x) x= log x.

Grazie al Teorema dei numeri primi si ha quindi


x
(x) Li (x) per x ! +1 (24.59)
log x
e abbiamo due possibili stimatori corretti di , cio Li (x) e x= log x. Nelle tabelle
appena viste lo stimatore Li (x) si comporta meglio di x= log x, ma per aermare che
Li (x) sia migliore di x= log x occorre un risultato analitico (i numeri delle tabelle, per
quanto suggestivi, non hanno alcun valore teorico).
Il prossimo risultato, dimostrato nel 1899 da de la Valle Poussin, d una fonda-
mentale valutazione dellerrore relativo7 di Li (x).

Teorema 403 Esiste una costante > 0 tale che, denitivamente, si ha


(x) Li (x) p
log x
e (24.60)
Li (x)
Grazie a questo fondamentale risultato, di cui omettiamo la non semplice di-
mostrazione, possiamo provare il seguente importante corollario.

Corollario 404 Risulta


x
j (x) Li (x)j = o (x) per x ! +1 (24.61)
log x
In particolare,
x
j (x) Li (x)j = o per x ! +1
log2 x
Dim. Nella dimostrazione si assume x 2. Si ha
j (x) Li (x)j j (x) Li (x)j jLi (x)j
x = x (24.62)
log2 x
jLi (x)j log2 x
x
1 jLi (x)j log x 1
p
log x x x
p
log x
log x ! 0
e log x log2 x e

(il lettore verichi il limite). Grazie alla (24.60), si ha:


x
j (x) Li (x)j = o per x ! +1 (24.63)
log2 x
7
Laggettivo relativo dovuto allavere jLi (x)j al denominatore.
24.10. GRAN FINALE: RIEMANN E I NUMERI PRIMI 787

Daltra parte, la (24.58) implica che

x x x
(x) Li (x) = (x) +O
log x log2 x log3 x
ossia
x x x
(x) = (x) Li (x) + +O
log x log2 x log3 x
e quindi
x x x
(x) j (x) Li (x)j + +O
log x log2 x log3 x
Ci implica
x x
(x) log x j (x) Li (x)j O log3 x
x x +1+ x
log2 x log2 x log2 x

Esiste k > 0 tale che


x
O log3 x k logx3 x 1
x x =k !0
log2 x log2 x
log x
Dunque, grazie alla (24.63) per ogni " > 0 esiste x" tale che

x
(x) log x
1 " x 1+" 8x x"
log2 x

Quindi
x x
(x)
log x log2 x
il che, insieme alla (24.63), implica
x
j (x) Li (x)j j (x) Li (x)j log2 x
= x !0
x x
(x) log x log2 x (x) log x

Ci prova la (24.61).

Il corollario mostra che lo stimatore Li (x) ha un migliore termine di errore dello


stimatore x= log x, e quindi il migliore tra i due. Ci conferma quanto le tabelle
avevano lasciate presagire, ma il lettore noti labissale dierenza concettuale tra il
risultato teorico stabilito nel corollario e il mero trovare regolarit in alcuni dati.

Alla luce di quanto appena visto, dora in poi ci concentriamo sullo stimatore Li (x),
indicando con e (x) il suo termine di errore, cio

e (x) = j (x) Li (x)j : (24.64)


788 CAPITOLO 24. INTEGRALE SECONDO RIEMANN

Dalla (24.59) si ha una prima valutazione di questo errore, data da


x
e (x) = o
log x
Ma, grazie alla notevole disuglianza (24.60), la valutazione si pu migliorare.
Corollario 405 Per ogni n si ha
x
e (x) = o : (24.65)
logn x
Dim. Abbiamo gi mostrato il caso n = 1. Il caso n = 2 contenuto nella (24.62)
della precedente dimostrazione. In modo analogo per n 3 si ha
j (x) Li (x)j j (x) Li (x)j jLi (x)j
x = x
logn x
jLi (x)j logn x
x
1 jLi (x)j log x 1
p
log x x x
p
log x
logn 1
x!0
e log x logn x e
dove anche qui lasciamo al lettore la verica del limite.
Se cerchiamo di migliorare signicativamente la valutazione (24.65) dellerrore en-
triamo in uno dei campi pi profondi della Matematica. Vi un intimo legame tra ler-
rore 24.64 e la celeberrima Ipotesi di Riemann, la congettura pi famosa della Matem-
atica. Enunciare lIpotesi di Riemann e, soprattutto, discuterne lenorme profondit
va oltre queste note. Lo studio del termine di errore e (x) ci d comunque loccasione
per vederne un aspetto. Si ha infatti il seguente importante risultato dimostrato da
Helge von Koch nel 1901.
Teorema 406 (Koch) Lipotesi di Riemann equivalente ad avere
p
e (x) = O x log x (24.66)
ossia p
(x) = Li (x) + O x log x
p
Si noti che x log x = o (x= logn x) per ogni n poich:
p
x log x 1
x = p logn+1 x ! 0
logn x
x
La valutazione (24.66) quindi un sostanziale miglioramento rispetto alla (24.65), e,
alla luce di altri risultati che qui non possiamo riportare, non appare possibile un
ulteriore signicativo miglioramento. La (24.66) quanto di meglio possiamo dire
sul termine di errore dello stimatore Li (x) della distribuzione dei numeri primi.
La validit della valutazione dipende dallIpotesi di Riemann, il problema aperto pi
celebre della Matematica, su cui negli ultimi 150 anni hanno lavorato alcuni dei pi
brillanti matematici, senza che sinora nessuno sia stato in grado n di dimostrarne n
di confutarne la validit8 .
8
Il lettore curioso di saperne di pi pu consultare, a livello divulgativo, i libri: John Derbyshire,
24.10. GRAN FINALE: RIEMANN E I NUMERI PRIMI 789

Prime obsession, Joseph Henry Press, Washington, 2003 e, in traduzione italiana, Marcus du Sautoy,
Lenigma dei numeri primi, Rizzoli, Milano, 2003. A livello decisamente pi avanzato si veda Harold
M. Edwards, Riemanns zeta function, Dover, Mineola, 2001.
790 CAPITOLO 24. INTEGRALE SECONDO RIEMANN
Parte VI

Ottimizzazione

791
Capitolo 25

Anteprima

Consideriamo il problema di ottimo

max f (x) sub x 2 C (25.1)


x

Se il sottoinsieme C di A aperto e la funzione f : A Rn ! R derivabile su C,


tale problema detto di ottimo dierenziale libero. Il Calcolo dierenziale riesce a
fornire notevoli strumenti per lo studio delle soluzioni locali di tali problemi di ottimo.
Nel capitolo utilizzeremo tali strumenti per lo studio delle soluzioni globali alle quali,
come sottolineato pi volte, siamo realmente interessati nei problemi di ottimo. A tal
ne, combineremo il Teorema di Fermat, di natura locale, e il Teorema di Tonelli, di
natura globale.
Tale combinazione d luogo al cosiddetto Metodo di eliminazione per la risoluzione
dei problemi di ottimo, che in questo capitolo applicheremo ai problemi di ottimo
dierenziale libero. Nel Capitolo 27 riprenderemo e approfondiremo i temi del capitolo,
che unanteprima rispetto a tale analisi pi approfondita.

Il Metodo di eliminazione si articola nelle seguenti fasi:.

1. Si stabilisce se il Teorema di Tonelli sia applicabile, ossia se f coerciva su C (la


continuit di f su C gi garantita dalla dierenziabilit). In caso aermativo,
si passa alla fase successiva.

2. Si trova linsieme S dei punti interni stazionari di f su C, ossia

S = fx 2 C : rf (x) = 0g

Se S 6= ;, si passa alla fase successiva.


Quando la funzione f scalare e derivabile pi volte su C, in luogo di S si
pu considerare il suo sottoinsieme Se S costituito dai punti stazionari che la
procedura omnibus della Sezione 21.3 individua come punti di massimo locale e
da quelli di cui essa non in grado di determinare la natura.

793
794 CAPITOLO 25. ANTEPRIMA

3. Si costruisce linsieme f (S) = ff (x) : x 2 Sg. Se x^ 2 S tale che

f (^
x) f (x) 8x 2 S (25.2)

allora tale x^ soluzione del problema di ottimo (27.1). In altre parole, si costru-
isce linsieme formato dai punti stazionari; il punto (o i punti) dellinsieme dove
f ha valore massimo la soluzione del problema di ottimo.

Per capire il funzionamento del Metodo di eliminazione, si osservi che grazie al


Teorema di Fermat linsieme S consta di tutti i punti di int C candidati ad essere
soluzioni locali del problema di ottimo (25.1). Daltra parte, se f continua e coerciva
su C, per il Teorema di Tonelli esiste almeno una soluzione del problema di ottimo.
Tale soluzione deve appartenere allinsieme S poich una soluzione del problema di
ottimo ne , a fortiori, soluzione locale. Quindi, le soluzioni del problema ristretto
di ottimo
max f (x) sub x 2 S (25.3)
x

sono anche le soluzioni del problema (25.1) di ottimo. Ma le soluzioni del problema
(25.3) sono i punti x^ 2 S per cui vale la (25.2). Esse sono quindi le soluzioni del
problema (25.1) di ottimo, come aerma la fase 3 del Metodo di eliminazione.

Come illustreranno i prossimi esempi, il Metodo di eliminazione combina in modo


elegante ed e cace il risultato globale di Tonelli e quello di natura locale di Fermat.
Si noti come il Teorema di Tonelli sia essenziale poich linsieme C aperto e non
quindi applicabile il Teorema di Weierstrass (che richiede la compattezza di C).
Se S = ; il Metodo si arresta alla prima fase ed in grado solo di determinare
lesistenza di soluzioni. Se S 6= ;, la sua e cacia tanto maggiore quanto pi piccolo
linsiemi S perch la fase 3 richiede il confronto di f in tutti i punti di S. Per tale
ragione il Metodo particolarmente e cace quando nel caso scalare in luogo di S si
pu considerare il suo sottoinsieme Se fornito dalla procedura omnibus.

Esempio 482 Sia f : Rn ! R data da f (x) = 1 kxk2 e sia C = Rn . Risolviamo il


problema di ottimo dierenziale libero

max 1 kxk2 sub x 2 Rn (25.4)


x

Applichiamo il Metodo di eliminazione.

Fase 1: La funzione coerciva su C e perci soddisfa le ipotesi del Teorema di Tonelli.

Fase 2: facile vedere che


rf (x) = 0 () x = 0;
sicch S = f0g e x = 0 lunico punto stazionario. Ci completa la fase 2.

Fase 3: Poich S un singoletto, la fase 3 banalmente vericata e quindi x^ = 0


soluzione del problema (25.4) di ottimo. N
795

Esempio 483 Sia f : R ! R data da f (x) = x6 + 3x2 1 e sia C = R. Risolviamo


il problema di ottimo dierenziale libero

max x6 + 3x2 1 sub x 2 R (25.5)


x

Applichiamo il Metodo di eliminazione.

Fase 1: Si ha limx!+1 f (x) = limx!+1 f (x) = 1 e quindi, per la Proposizione 290,


f coerciva su R. Ci completa la fase 1.

Fase 2: La condizione del primo ordine f 0 (x) = 0 ha la forma

6x5 6x = 0

e quindi x = 0 e x = 1 sono gli unici punti stazionari, cio

S = f 1; 0; 1g

Si ha f 00 (0) = 6, f 00 ( 1) = 24 e f 00 (1) = 24 e dunque x = 0 punto di massimo


locale, mentre x = 1 e x = 1 sono punti di minimo locale. Quindi,

Se = f0g

Fase 3: Poich Se un singoletto la fase 3 banalmente vericata e quindi x^ = 0


soluzione del problema (25.5) di ottimo. N
796 CAPITOLO 25. ANTEPRIMA
Capitolo 26

Ottimizzazione locale vincolata

26.1 Introduzione
La classica condizione necessaria per estremi locali del Teorema di Fermat considera
punti interni dellinsieme di scelta C, il che ne limita grandemenente lapplicabilit in
molti problemi di ottimo dellEconomia. Infatti, in molti di essi valgono le ipotesi di
monotonia della Proposizione 278 e quindi le eventuali soluzioni sono di frontiera (e
non interne). Un classico esempio il Problema del consumatore
max u (x) sub x 2 B (p; I) (26.1)
x

presentato nel Capitolo 17. Nella consueta ipotesi di monotonia, grazie alla Legge di
Walras il problema si pu riscrivere come
max u (x) sub x 2 (p; I)
x

dove (p; I) = fx 2 A : p x = Ig @B (p; I) determinato da un vincolo di uguaglian-


za (il consumatore destina tutto il proprio reddito allacquisto del paniere ottimo).
Linsieme (p; I) privo di punti interni, cio
int (p; I) = ;
Il Teorema di Fermat considera punti interni ed perci inutile per le soluzioni locali del
Problema del consumatore. Il vincolo di uguaglianza, con le sue drastiche conseguenze
topologiche, ci priva di questo fondamentale risultato nello studio del Problema del
consumatore. Per fortuna, vi un altrettanto importante risultato di Lagrange che ci
soccorre, come questo capitolo mostrer.

26.2 Il problema
La forma generale di un problema di ottimo con vincoli di uguaglianza dato da
max f (x) (26.2)
x2A
sub g1 (x) = b1 ; g2 (x) = b2 ; :::; gm (x) = bm :

797
798 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

dove f : A Rn ! R la funzione obiettivo, mentre le funzioni gi : A Rn ! R e


gli scalari bi 2 R rappresentano m vincoli di uguaglianza. Supponiamo che le funzioni
f e gi siano tutte derivabili con continuita in un sottoinsieme non vuoto e aperto D
del suo dominio; cio, ; =6 D int A.
Linsieme
C = fx 2 A : gi (x) = bi per ogni i = 1; :::; mg , (26.3)
il sottoinsieme di A identicato dai vincoli, e quindi il problema di ottimo (26.2) si
pu formulare in modo equivalente come:

max f (x) sub x 2 C


x

secondo la scrittura usata nel Capitolo 17. Tuttavia, per questa speciale classe di
problemi di ottimo, useremo spesso la pi evocativa scrittura (26.2).

Studieremo il problema di ottimo (26.2) prima nellimportante caso speciale con


un unico vincolo, per poi generalizzare lanalisi al caso di pi vincoli.

26.3 Un vincolo
Nel caso di un unico vincolo di uguaglianza il problema di ottimo (26.2) diventa:

max f (x) sub g (x) = b (26.4)


x2A

dove f : A Rn ! R la funzione obiettivo, mentre la funzione g : A Rn ! R e lo


scalare b 2 R deniscono il vincolo di uguaglianza.

Il prossimo fondamentale lemma d la chiave per trovare le soluzioni del problema


(26.4). Lipotesi x^ 2 C \ D richiede che x^ sia un punto dellinsieme di scelta in cui f
e g sono derivabili con continuit. Inoltre, si richiede che rg (^x) 6= 0; al riguardo, si
osservi che un punto x 2 A si dice singolare (o regolare) se rg (x) = 0. Secondo tale
terminologia la condizione rg (^x) 6= 0 richiede che x^ non sia un punto singolare.

Lemma 407 Sia x^ 2 C \ D soluzione locale del problema di ottimo (26.4). Se


x) 6= 0, allora esiste uno scalare ^ 2 R tale che
rg (^

x) = ^ rg (^
rf (^ x) : (26.5)

Dim. Si rinvia alla dimostrazione del pi generale Lemma 409.

La (26.5) ci dice che condizione necessaria a nch x^ sia soluzione locale del prob-
lema di ottimo (26.4) che i gradienti delle funzioni f e g siano tra loro proporzionali.
Il cappellosopra ricorda che tale scalare dipende dal punto x^ considerato.
Il prossimo esempio mostra come la condizione (26.5) sia necessaria, ma non
su ciente.
26.3. UN VINCOLO 799

Esempio 484 Consideriamo il problema di ottimo:

x31 + x32
max sub x1 x2 = 0 (26.6)
x2R 2
Esso della forma (26.4), dove f : R2 ! R e g : R2 ! R sono date da f (x) =
2 1 (x31 + x32 ) e g (x) = x1 x2 , mentre b = 0. Si ha:

rf (0; 0) = (0; 0) e rg (0; 0) = (1; 1)

e quindi ^ = 0 tale che rf (0; 0) = ^ rg (0; 0). Il punto (0; 0) soddisfa quindi con
^ = 0 la condizione (26.5), ma tale punto non soluzione del problema di ottimo
(26.6). Infatti,
f (t; t) = t3 > 0 = f (0; 0) , 8t > 0. (26.7)
Si osservi che (0; 0) non neanche un punto di minimo (globale) vincolato poich
f (t; t) = t3 < 0 per ogni t < 0. N

Per capire a livello intuitivo la condizione (26.5), assumiamo che f e g siano denite
su R2 , cosicch la (26.5) ha la forma:

@f @f @g @g
(^
x) ; (^
x) =^ (^
x) ; (^
x)
@x1 @x2 @x1 @x2

ossia
@f @g @f @g
x) = ^
(^ (^
x) e x) = ^
(^ (^
x) (26.8)
@x1 @x1 @x2 @x2
La condizione rg (^ x) 6= 0 richiede che almeno una delle due derivate parziali (@g=@xi ) (^
x)
sia diversa da zero. Se, per comodit, supponiamo che lo siano entrambe e che ^ 6= 0,
allora la (26.8) equivale a
@f @f
@x1
(^
x) @x2
(^
x)
@g
= @g (26.9)
@x1
(^
x) @x2
(^
x)
Vediamo ora di capire intuitivamente perch la (26.9) necessaria a nch x^ sia
soluzione del problema di ottimo (26.4). I dierenziali di f e g nel punto x^ sono dati
da
@f @f
x) (h) = rf (^
df (^ x) h = (^
x) h1 + (^
x) h2 8h 2 R2
@x1 @x2
@g @g
x) (h) = rg (^
dg (^ x) h = (^
x) h1 + (^
x) h2 8h 2 R2
@x1 @x2
e danno unapprossimazione lineare delle dierenze f (^ x + h) f (^x) e g (^
x + h) g (^
x),
ossia delleetto su f e g determinato dal passare da x^ a x^ + h. Come ben sappiamo,
tale approssimazione tanto migliore quanto pi piccolo h. Supponiamo, idealmente,
che h sia innitesimo e che lapprossimazione sia esatta, di modo che f (^
x + h) f (^
x) =
800 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

x) (h) e g (^
df (^ x + h) g (^ x) (h). Dal punti di vista formale ci ovviamente
x) = dg (^
scorretto, ma qui stiamo procedendo in modo euristico, cercando di capire a livello
intuitivo la (26.9).
Proseguendo nel nostro ragionamento euristico, partiamo ora dal punto x^ e con-
sideriamo variazioni x^ + h con h innitesime. Il primo problema da porsi che essi
siano legittimi, ossia che rispettino il vincolo di uguagliaza g (^
x + h) = b. Ci signica
che g (^
x + h) = g (^ x), e quindi h deve essere tale che dg (^
x) (h) = 0. Ne segue che:

@g @g
(^
x) h1 + (^
x) h2 = 0
@x1 @x2
e quindi
@g
@x2
(^
x)
h1 = @g
h2 (26.10)
@x1
(^
x)
Leetto sulla funzione obiettivo f del passare da x^ a x^ +h dato da df (^
x) (h). Quando
h legittimo, per la (26.10) tale eetto dato da:
@g
!
@f @x2
(^
x ) @f
df (^
x) (h) = (^
x) @g
h 2 + (^
x) h2 (26.11)
@x1 @x
(^
x ) @x 2
1

Se x^ soluzione del problema di ottimo, si deve necessariamente avere df (^ x) (h) = 0


per ogni variazione h legittima. Altrimenti, se fosse df (^ x) (h) > 0 essa darebbe un
punto x^ +h che rispetta il vincolo di uguaglianza ma tale che f (^x + h) > f (^x). Daltra
parte, se fosse df (^
x) (h) < 0 la stessa considerazione si pu fare questa volta per h,
che ovviamente anchessa una variazione legittime e che porterebbe al punto x^ h
con f (^x h) > f (^ x).
La condizione necessaria di ottimo df (^ x) (h) = 0 insieme alla (26.11) fornisce:
@g
!
@f @x2
(^
x) @f
(^
x) @g
h2 + (^
x) h2 = 0
@x1 @x
(^
x) @x2
1

Se, come naturale, assumiamo h2 > 0, si ha


@g
!
@f @x2
(^
x ) @f
(^
x) @g
+ (^
x) = 0
@x1 @x1
(^
x) @x2

che proprio la (26.9). A livello intuitivo, tutto ci spiega perch la (26.5) sia necessaria
a nch x^ sia soluzione del problema.

Il Lemma 407 fornisce una condizione necessaria di ottimo, di signicato piuttosto


intuitivo. Tale condizione si pu equivalentemente scrivere come

rf (^
x) ^ rg (^
x) = 0
26.3. UN VINCOLO 801

Ricordando lalgebra dei gradienti, lespressione rf (x) rg (x) porta in modo


n
naturale a pensare alla funzione L : A R R R ! R denita come

L (x; ) = f (x) + (b g (x)) ; 8 (x; ) 2 A R (26.12)

Essa si chiama funzione lagrangiana (o lagrangiano) ed fondamentale nei problemi


di ottimo. Il suo gradiente
@L @L @L
rL (x; ) = (x; ) ; :::; (x; ) ; (x; ) 2 Rn+1
@x1 @xn @
ed in esso molto utile distinguere le due parti rx L e r L date da:
@L @L
rx L (x; ) = (x; ) ; :::; (x; ) 2 Rn ;
@x1 @xn
@L
r L (x; ) = (x; ) 2 R
@
Usando tale notazione, si ha

rx L (x; ) = rf (x) rg (x) (26.13)

e
r L (x; ) = b g (x) (26.14)
il che porta alla seguente fondamentale formulazione in termini della funzione la-
grangiana della condizione necessaria di ottimalit del Lemma 407.

Teorema 408 Sia x^ 2 C \ D soluzione locale del problema di ottimo (26.4). Se


rg (^x) 6= 0, allora esiste uno scalare ^ 2 R, detto moltiplicatore di Lagrange, tale che
la coppia x^; ^ 2 Rn+1 punto stazionario della funzione lagrangiana.

Dim. Sia x^ soluzione del problema di ottimo (26.4). Per il Lemma 407 esiste ^ 2 R
tale che
x) ^ rg (^
rf (^ x) = 0
Per la (26.13), la condizione equivale a

rx L x^; ^ = 0

Daltra parte, per la (26.13) si ha r L (x; ) = b g (x), e quindi si avr anche


r L x^; ^ = 0 poich b g (^ x) = 0. Ne segue che x^; ^ un punto stazionario di
L.

Grazie al Teorema 408, la ricerca delle soluzioni locali del problema di ottimo
vincolato (26.4) si basa sulla ricerca dei punti stazionari di unopportuna funzione di
802 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

pi variabili, la funzione lagrangiana. Si tratta di una funzione pi complicata della


funzione f originaria poich abbiamo la nuova variabile , ma con essa la ricerca delle
soluzioni del problema di ottimo pu essere svolta risolvendo una normale condizione
del primo ordine, del tipo di quelle viste per i problemi senza vincoli.
Naturalmente si sta parlando di condizione solo necessaria: non quindi detto che i
punti stazionari siano eettivamente soluzioni del problema. Ma gi un notevolissimo
passo in avanti avere a disposizione la semplice condizione (del primo ordine)

rL (x; ) = 0 (26.15)

per la ricerca dei possibili candidati ad essere soluzione del problema vincolato. Nel-
la prossima sezione vedremo come la condizione sia fondamentale nella ricerca delle
soluzioni locali del problema di ottimo (26.4) col Metodo di Lagrange.

Prima di proseguire, occorre fare due importanti osservazioni. Per prima cosa,
si osservi che in generale la coppia x^; ^ non punto di massimo del lagrangiano,
neanche quando x^ eettivamente soluzione del problema di ottimo. La coppia x^; ^
un punto stazionario per il lagrangiano, ma nulla pi. Perci, dire che la ricerca delle
soluzione del problema di ottimo vincolato si riduce alla ricerca dei punti di massimo
del lagrangiano un grave errore, come vedremo meglio nel Capitolo 9.
La seconda osservazione che il problema (26.4) ha una versione simmetrica

min f (x) sub g (x) = b


x2A

in cui invece di punti di massimo vincolato si cercano punti di minimo vincolato. La


condizione (26.5) necessaria anche per questa versione del problema (26.4) e quindi i
punti stazionari del lagrangiano potrebbero essere punti di minimo vincolato invece che
di massimo, ma potrebbero anche non essere n di massimo n di minimo. lusuale
ambiguit delle condizioni del primo ordine, g incontrata nel caso di ottimizzazione
libera, che riette la sola necessit della condizione del primo ordine.

26.4 Metodo di Lagrange


Il Teorema 408 suggerisce la seguente procedura, che chiamiamo Metodo (locale del
primo ordine) di Lagrange, per la ricerca delle soluzioni locali del problema di ottimo
(26.4):

1. si determina linsieme D dove le funzioni f e gi sono derivabili con continuit;

2. si determina linsieme C D dei punti del vincolo ove le funzioni f e gi non sono
derivabili con continuit;
26.4. METODO DI LAGRANGE 803

3. posto
D0 = fx 2 D : rg (x) = 0g

si determina linsieme C \ D0 dei punti singolari che soddisfano il vincolo;

4. si determina linsieme S dei punti non singolari x 2 D D0 per i quali esista


un moltiplicatore di Lagrange 2 R tale che la coppia (x; ) 2 Rn+1 un punto
stazionario del Lagrangiano, cio soddisfa la condizione del primo ordine (26.15);

Le eventuali soluzioni locali del problema di ottimo (26.4) si devono cercare tra i
punti del sottoinsieme
S [ (C \ D0 ) [ (C D)
di C. Infatti, una soluzione locale che sia un punto regolare apparterr allinsieme S
grazie al Teorema 408. Invece, tale teorema non dice alcunch sia circa le eventuali
soluzioni locali che sono punti singolari, e che quindi appartengono allinsieme C \ D0 ,
sia circa le eventuali soluzioni locali ove le funzioni non sono derivabili con continuit,
e che cio appartengono allinsieme C D.
In conclusione, condizione necessaria a nch un punto x 2 C sia soluzione locale
del problema di ottimo (26.4) che esso appartenga al sottoinsieme S [ (C \ D0 ) [
(C D) C. Ci quanto consente di stabilire il Teorema 408. Naturalmente,
lapplicazione del teorema tanto pi e care quanto pi piccolo tale insieme, sicch
la ricerca delle soluzioni locali si possa restringere a un insieme signicativamente pi
piccolo delloriginario insieme C.

Nel Capitolo 27 la procedura sar integrata nel Metodo di eliminazione per la ricer-
ca delle soluzioni (globali) del problema di ottimo (26.4). In eetti, sono le soluzioni
globali ci che interessa maggiormente, come detto pi volte; la ricerca delle soluzioni
locali ha un mero interesse strumentale per la ricerca delle soluzioni globali. Per tale
ragione non considereremo condizioni del secondo ordine per le soluzioni locali.

Nel resto della sezione illustriamo la procedura con alcuni esempi analitici. La
prossima sezione considerer il classico Problema del consumatore.

Esempio 485 Consideriamo il problema di ottimo:

max2 2x21 5x22 sub x21 + x22 = 1 (26.16)


x2R

Esso della forma (26.4), dove f : R2 ! R e g : R2 ! R sono date da f (x1 ; x2 ) =


2x21 5x22 e g (x1 ; x2 ) = x21 + x22 , mentre b = 1. Le funzioni sono tutte derivabili con
continuit su R2 , ossia D = R2 . Quindi, C \ D = C, sicch C D = ;: in tutti i
punti del vincolo le funzioni f e g sono derivabili con continuit. Questottimo incipit
completa le fasi 1 e 2 del Metodo di Lagrange.
Si ha
rg (x) = (2x1 ; 2x2 )
804 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

e quindi (0; 0) lunico punto singolare, cio D0 = f(0; 0)g. Lunico punto singolare
non soddisfa il vincolo, sicch C \ D0 = ;. Abbiamo cos completato la fase 3 del
Metodo di Lagrange.
Il Lagrangiano L : R3 ! R dato da

L (x1 ; x2 ; ) = 2x21 5x22 + 1 x21 x22 ; 8 (x1 ; x2 ; ) 2 R3 ;

e per trovare linsieme dei suoi punti stazionari occorre risolvere la condizione del primo
ordine (26.15): 8 @L
>
> =0
< @x1
@L
@x2
=0
>
>
: @L
@
=0
Occorre quindi risolvere il seguente sistema (non lineare) di tre equazioni
8
>
> 4x1 2 x1 = 0
<
10x2 2 x2 = 0
>
>
: 1 x2 x2 = 0
1 2

nelle tre incognite x1 , x2 e . Si verica immediatamente che x1 = x2 = 0 non


soddisfanno la terza equazione. Mentre x1 = 0 e = 5 implicano x2 = 1: Inoltre,
x2 = 0 e = 2 implicano x1 = 1. In conclusione, le terne (x1 ; x2 ; ) che soddisfanno
la condizione del primo ordine (26.15) sono

f(0; 1; 5) ; (0; 1; 5) ; (1; 0; 2) ; ( 1; 0; 2)g

sicch
S = f(0; 1) ; (0; 1) ; (1; 0) ; ( 1; 0)g
il che completa la fase 4 del Metodo di Lagrange. In conclusione

S [ (C \ D0 ) [ (C D) = S = f(0; 1) ; (0; 1) ; (1; 0) ; ( 1; 0)g (26.17)

e in questo (fortunato) caso la condizione del primo ordine necessaria per qualsiasi
soluzione locale del problema di ottimo (26.16). NellEsempio 500 del Capitolo 27
continueremo lo studio del problema di ottimo (26.16), mostrando quali tra i quattro
punti (26.17) individuati dal Metodo di Lagrange siano soluzioni (globali) del problema
di ottimo (26.16). N

Esempio 486 Consideriamo il problema di ottimo:

X
n
kxk2
maxn e sub xi = 1 (26.18)
x2R
i=1
26.4. METODO DI LAGRANGE 805
2
n n kxk
Esso della
Pn forma (26.4), dove f : R ! R e g : R ! R sono date da f (x) = e e
2
g (x) = i=1 xi , mentre b = 1. Le funzioni sono tutte derivabili con continuit su R ,
ossia D = R2 . Come nel precedente esempio, C \ D = C e C D = ;: in tutti i punti
del vincolo le funzioni f e g sono derivabili con continuit. Abbiamo cos completato
le fasi 1 e 2 del Metodo di Lagrange.
Si ha
rg (x) = (1; 1; :::; 1)
e quindi non esistono punti singolari, cio D0 = ;. Ci completa la fase 3 del Metodo
di Lagrange.
Il Lagrangiano L : Rn ! R dato da
!
2 Xn
L (x1 ; x2 ; ) = e kxk + 1 xi ; 8 (x; ) 2 Rn+1 ;
i=1

e per trovare linsieme dei suoi punti stazionari occorre risolvere la condizione del primo
ordine (26.15) data dal seguente sistema (non lineare) di n + 1 equazioni
( @L 2

@xi
= 2xi e kxk = 0 8i = 1; :::; n
@L
Pn
@
=1 i=1 xi = 0

Osserviamo che in nessuna soluzione si pu avere = 0. Infatti, se cos fosse, le prime


n equazioni implicherebbero xi = 0, il che per contraddice lultima equazione. Ne
segue che in ogni soluzione si ha 6= 0. Le prime n equazioni implicano

2
xi = ekxk
2
e sostituendo questi valori nellultima equazione troviamo

2
1 n ekxk = 0
2
ossia
2 kxk2
= e
n
Sostituendo tale valore di in ciascuna delle prime n equazioni troviamo xi = 1=n, e
quindi lunico punto (x; ) 2 Rn+1 che soddisfa la condizione del primo ordine (26.15)

1 1 1 2 n
; ; :::; ; e
n n n n
sicch S il singoletto
1 1 1
S= ; ; :::;
n n n
806 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

Ci completa la fase 4 del Metodo di Lagrange. Poich


1 1 1
S [ (C \ D0 ) [ (C D) = S = ; ; :::;
n n n
anche in questo esempio la condizione del primo ordine (26.15) necessaria per qual-
siasi soluzione locale del problema di ottimo (26.18). Tale vettore perci lunico
candidato a essere soluzione locale del problema. LEsempio 501 del Capitolo 27 com-
pleter lanalisi mostrando che, eettivamente, si tratta della soluzione del problema.
N
Il prossimo esempio intende mostrare limportanza dei punti singolari.
Esempio 487 Consideriamo il problema di ottimo:
x1
max2 e sub x31 x22 = 0 (26.19)
x2R

Esso della forma (26.4), dove f : R2 ! R e g : R2 ! R sono date da f (x) = e x1


e g (x) = x31 x22 , mentre b = 0. Si ha D = R2 , e quindi C \ D = C e C D = ;. I
passi 1 e 2 del Metodo di Lagrange sono completati.
Si ha
rg (x) = 3x21 ; 2x2
e quindi (0; 0) lunico punto singolare ed esso soddisfa il vincolo: D0 = C \ D0 =
f(0; 0)g. Anche la fase 3 del Metodo di Lagrange sono completati.
Il Lagrangiano L : R2 ! R dato da
x1
L (x1 ; x2 ; ) = e + x22 x31 ; 8 (x; ) 2 R3 ;
e per trovare linsieme dei suoi punti stazionari occorre risolvere la condizione del primo
ordine (26.15) data dal seguente sistema (non lineare) di tre equazioni
8 @L x1
>
> @x1 = e 3 x21 = 0
<
@L
@x2
= 2 x2 = 0
>
>
: @L
@
= x22 x31 = 0
Osserviamo che per nessuna soluzione si pu avere = 0. Infatti, se fosse = 0
la prima equazione diventerebbe e x1 = 0, che non ha soluzione. Supponiamo quindi
6= 0. La seconda equazione implica x2 = 0, e quindi dalla terza scende x1 = 0.
La prima equazione diventa 1 = 0, e la contraddizione mostra che il sistema non
ha soluzioni. Quindi non vi sono punti che soddifano la condizione del primo oridine
(26.15), sicch S = ;. Il passo 4 del Metodo di Lagrange mostra che
S [ (C \ D0 ) [ (C D) = C \ D0 = f(0; 0)g
Lunica possibile soluzione locale del problema di ottimo (26.19) il punto (0; 0).
Vedremo nellEsempio 502 del Capitolo 27 che essa lunica soluzione del problema di
ottimo (26.19). N
26.5. PROBLEMA DEL CONSUMATORE 807

26.5 Problema del consumatore


Consideriamo un Problema del consumatore per il quale valga la Legge di Walras, cio

max u (x) sub x 2 (p; I)


x

dove (p; I) = fx 2 A : p x = Ig, con p 0 (prezzi strettamente positivi), e la


funzione u : A Rn+ ! R di utilit strettamente crescente su A e derivabile con
continuit sullinterno di A, cio su int A.1 Per esempio, la funzione u : Rn++ ! R di
utilit Cobb-Douglas denita da
Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1
Pn n
con ogni i > 0 e i=1 i = 1 soddisfa queste ipotesi,
Pn con A = int A = R++ , mentre la
n
funzione u : R+ ! R di utilit separabile u (x) = i=1 xi le soddisfa con A = int A =
Rn+ .

La funzione g (x) = p x esprime il vincolo, e quindi D = Rn+ \ int A e

C D = (A int A) \ C

Linsieme C D quindi costituito dai punti di frontiera di A che soddisfano il


vincolo e che appartengono ad A. Si noti che quando A = int A, come nel caso della
Cobb-Douglas, si ha C D = ;.
Da
rg (x) = p 8x 2 Rn
segue che non ci sono punti singolari, cio D0 = ; e D1 = Rn++ . Tutto ci completa le
fasi 1-4 del Metodo di Lagrange.
Il Lagrangiano L : A R ! R data da

L (x; ) = u (x) + (I p x)

e, per trovare linsieme dei suoi punti stazionari, occorre risolvere la condizione del
primo ordine: 8 @L
>
> @x1
(x; ) = 0
>
>
>
>
>
<
>
>
>
> @L
(x; ) = 0
>
> @xn
>
: @L
@
(x; ) = 0
1
Si noti che A Rn+ implica int A Rn++ , cio i punti interni di A hanno sempre coordinate
strettamente positive.
808 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

cio
8 @u(x)
>
> @x1
p1 = 0
>
>
>
>
>
<
>
>
>
> @u(x)
pn = 0
>
> @xn
>
:
I p x=0

In modo pi compatto, scriviamo

@u (x)
= pi 8i = 1; :::; n (26.20)
@xi
p x = I (26.21)

La fondamentale condizione (26.20) si legge in modo diverso secondo linterpretazione,


cardinalista oppure ordinalista, della funzione di utilit. Supponiamo, per semplicit,
che 6= 0. Secondo la lettura cardinalista, la condizione si legge nella forma equivalente

@u(x) @u(x)
@x1 @xn
= =
p1 pn

che evidenzia come nel paniere x soluzione (locale) del Problema del consumatore le
utilit marginali del reddito speso per i vari beni, misurate dai rapporti

@u(x)
@xi
pi

siano tutte uguali. Si noti che 1=pi la quantit del bene i acquisibile con ununit di
reddito.
In chiave ordinalista, dove la nozione di utilit marginale non ha pi cittadinanza,
la condizione (26.20) si riscrive come

@u(x)
@xi pi
@u(x)
=
pj
@xj

per ogni coppia di beni i e j del paniere soluzione x. In tale paniere, quindi, il saggio
marginale di sostituzione tra ogni coppia di beni devessere pari al rapporto tra i loro
prezzi, cio SM Sxi ;xj = pi =pj . Per n = 2 si ha la classica interpretazione geometrica
della condizione di ottimalit in un paniere (x1 ; x2 ) come uguaglianza tra la pendenza
della curva di indierenza (nel senso della Sezione 19.5.2) e quella della retta del vincolo
di bilancio.
26.5. PROBLEMA DEL CONSUMATORE 809

2
x
2

1.5

0.5

-0.5

O x
1
-1
-1 0 1 2 3 4 5 6 7

La lettura ordinalista non richiede la nozione cardinalista di utilit marginale,


nozione che, applicando il rasoio di Occam, risulta quindi superua per lo studio del
Problema del consumatore. Losservazione risale a Vilfredo Pareto2 e rappresent uno
dei punti svolta nella storia della Teoria dellutilit, tanto che si parl di rivoluzione
ordinalista.

Sia come sia, le (26.20) e (26.21) sono condizioni del primo ordine del Problema
del consumatore e la loro risoluzione determina linsieme S dei punti stazionari. In
conclusione, il Metodo di Lagrange implica che le soluzioni locali del Problema del
consumatore debbano essere cercate tra i punti di

S [ ((A int A) \ C)

Oltre che punti che soddisfano le condizioni (26.20) e (26.21) del primo ordine, le
soluzioni locali possono essere punti di frontiera A int A dellinsieme A che soddisfano
il vincolo (tali soluzioni sono dette di frontiera 3 ).

Esempio 488 Consideriamo la funzione di utilit Cobb-Douglas. Per semplicit,


consideriamo il caso n = 2, ossia

u (x1 ; x2 ) = x1 x21

con 2 (0; 1). La sua trasformazione logaritmica v = log u la log-lineare

v (x1 ; x2 ) = log x1 + (1 ) log x2


2
Si veda per esempio il suo Sunto di alcuni capitoli di un nuovo trattato di economia pura del
prof. Pareto apparso sul Giornale degli Economisti nel 1900.
3
Nel caso n = 2 e A = R2+ tali soluzioni possono essere (0; I=p2 ) e (I=p1 ; 0).
810 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

che molto comoda per far di conto. Con essa la condizione del primo ordine in ogni
(x1 ; x2 ) 2 R2++ assume la forma
1
= p1 ; = p2 (26.22)
x1 x2
p1 x1 + p2 x2 = I (26.23)
La (26.22) implica
1
=
p1 x1 p2 x2
Sostituendo nella (26.23), si ha
1
p1 x1 + p1 x1 = I
e quindi
I (1 )I
x1 = ; x2 =
p1 p2
In conclusione,
I (1 )I
S= ;
p1 p2
Lunica possibile soluzione locale del Problema del consumatore il paniere
I (1 )I
x= ;
p1 p2
La Sezione 27.3.1 del prossimo capitolo mostrer, grazie al Metodo di eliminazione,
che questo paniere eettivamente lunica soluzione del Problema del consumatore
nel caso Cobb-Douglass. N
Esempio 489 Consideriamo la funzione di utilit separabile u : R2+ ! R data da
u (x) = x1 + x2 . Per prima cosa si osservi che
I I
C D= 0; ; ;0
p2 p1
La condizione del primo ordine in ogni (x1 ; x2 ) 2 R2++ diventa
1 = p1 ; 1 = p2 (26.24)
p1 x1 + p2 x2 = I (26.25)
che non ha soluzioni quando p1 6= p2 (come di solito il caso). Quindi, S = ;, sicch
I I
S [ (C D) = C D= 0; ; ;0
p2 p1
Le uniche possibili soluzioni locali del Problema del consumatore sono quindi i panieri
di frontiera
I I
0; ; ;0
p2 p1
N
26.6. PI VINCOLI 811

26.6 Pi vincoli
Consideriamo ora il problema generale di ottimo (26.2), in cui vi possono essere pi
vincoli di uguaglianza. Il Lemma 407 e il Teorema 408 si generalizzano in modo
naturale al caso di pi vincoli. Scriviamo il problema (26.2) come

max f (x) sub g (x) = b (26.26)


x2A

dove g = (g1 ; :::; gm ) : A Rn ! Rm e b = (b1 ; :::; bm ) 2 Rm . La matrice Jacobiana


Dg (x) data da 2 3
rg1 (x)
6 rg2 (x) 7
Dg (x) = 6
4
7
5
rgm (x)
e i punti x dove Dg (^ x) ha rango massimo sono detti regolari, mentre i punti dove ci
non accade sono detti singolari.
La Jacobiana Dg (^ x) ha rango massimo quando i gradienti rg1 (^ x), rg2 (^
x), ...,
rgm (^ x) sono vettori linearmente indipendenti di Rn . Per tale ragione, la condizione
di rango massimo richiede che m n, ossia la condizione di regolarit pu valere solo
se il numero m di vincoli non eccede la dimensione n dello spazio.
Due osservazioni sulla condizione di regolarit: (i) quando m = n la Jacobiana ha
rango massimo se e solo se non singolare, cio det Dg (x) 6= 0; (ii) quando m = 1, si
ha Dg (x) = rg (x) e la condizione di rango massimo equivale a richiedere rg (x) 6= 0,
il che ci riporta alle nozioni di punti regolari e singolari visti precedentemente.

Il prossimo risultato estende il Lemma 407 al caso di pi vincoli e mostra che la


condizione di regolarit rg (^
x) 6= 0 di tale lemma si generalizza richiedendo che la
Jacobiana Dg (^x) abbia rango massimo. In altre parole, x^ anche qui non deve essere
un punto singolare.

Lemma 409 Sia x^ 2 C \ D soluzione locale del problema di ottimo (26.26). Se le


funzioni f; g1 ; :::; gm sono di classe C 1 e se Dg (^x) ha rango pieno, allora esiste un
^ m
vettore 2 R tale che
X n
rf (^x) = ^ i rgi (^
x) (26.27)
i=1

Sebbene la dimostrazione del Lemma 407 si possa estendere a questo caso pi


generale, preferiamo dare una dimostrazione alternativa che non si basa sul Teorema
della funzione implicita.

Dim. Sia k k la norma Euclidea. Siccome A aperto, esiste ^" > 0 su cientemente
x) = fx 2 A : kx x^k ^"g
piccolo da far si che B ^" (^ A. Dato " 2 (0; ^"], si ponga
x) = fx 2 A : kx x^k = "g. Linsieme U" (^
U" (^ x) compatto.
Per prima cosa dimostriamo una propriet che useremo in seguito.
812 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

Propriet 1. Per ogni " 2 (0; ^"], esiste N > 0 tale che

2
X
m
f (x) f (^
x) kx x^k N (gi (x) x))2 < 0
gi (^ (26.28)
i=1

per ogni x 2 U" (^


x).

Dim. della Propriet 1. Procediamo per contraddizione, supponendo che esista


" 2 (0; ^"] per cui non si ha alcun N > 0 tale che valga la (26.28). Si prenda una
successione crescente fNn gn con Nn " +1, e per ognuno di questi Nn si prenda
xn 2 U" (^x) per cui la (26.28) non vale, ossia xn tale che:

2
X
m
f (xn ) f (^
x) kxn x^k Nn (gi (xn ) x))2
gi (^ 0
i=1

Quindi, per ogni n 1, si ha:

f (xn ) x) kxn
f (^ x^k2 X
m
(gi (xn ) x))2
gi (^ (26.29)
Nn i=1

Poich la successione fxn gn appena costruita contenuta nellinsieme compatto U" (^


x),
per il Teorema di Bolzano-Weierstrass esiste una sua sottosuccessione fxnk gk conver-
gente in U" (^
x), ossia esiste x 2 U" (^
x) tale che xnk ! x . La (26.29) implica che, per
ogni k 1, si abbia:

f (xnk ) x) kxnk
f (^ x^k2 X
m
(gi (xnk ) x))2
gi (^ (26.30)
Nnk i=1

Siccome f continua, si ha limk f (xnk ) = f (x ). Inoltre, limk kxnk x^k = kx x^k.


Poich limk Nnk = +1, abbiamo

f (xnk ) x) kxnk
f (^ x^k2
lim =0
k Nnk

e quindi la (26.30) implica, grazie alla continuit delle funzioni gi ,

X
m
2
X
m
(gi (x ) gi (^
x)) = lim (gi (xnk ) x))2 = 0
gi (^
k
i=1 i=1

Ne segue che (gi (x ) gi (^ x))2 = 0 per ogni i = 1; :::; m, da cui gi (x ) = gi (^


x) = bi
per ogni i = 1; :::; m. Il punto x soddisfa allora i vincoli di uguaglianza, e si ha perci
x) f (x ) visto che x^ soluzione del problema di ottimo (26.26).
f (^
26.6. PI VINCOLI 813

Daltra parte, siccome xnk 2 U" (^


x) per ogni k 1, la (26.30) implica che

2
X
m
f (xnk ) f (^
x) kxnk x^k + Nnk (gi (xnk ) x))2
gi (^ "2 8k 1
i=1

e quindi f (xnk ) x) + "2 per ogni k


f (^ 1. Grazie alla continuit della f , questo
porta a
f (x ) = lim f (xnk ) x) + "2 > f (^
f (^ x)
k

il che contraddice f (^
x) f (x ). Questa contraddizione dimostra la Propriet 1. 4

Usando la Propriet 1, dimostriamo ora una seconda propriet di cui avremo


bisogno. Qui si pone U1m+1 (0) = fx 2 Rm+1 : kxk = 1g.

x) ed un vettore ( "0 ;
Propriet 2. Per ogni " 2 (0; ^"], esiste x" 2 B" (^ "
1 ; :::;
"
m) 2
U1m+1 (0) tale che

@f " X
m
@gi "
" "
0 (x ) 2 x"j x^j i (x ) = 0; 8j = 1; :::; n (26.31)
@xj i=1
@xj

Dim della Propriet 2. Dato " 2 (0; ^"], sia N" > 0 la costante positiva la cui
esistenza garantita dal Propriet 1. Si denisca la funzione h" : A Rn ! R come:

2
X
m
h" (x) = f (x) f (^
x) kx x^k N" (gi (x) x))2 ;
gi (^ 8x 2 A
i=1

Si ha h" (^
x) = 0 e, per come si scelto N" ,
h" (x) > 0; 8x 2 U" (^
x) : (26.32)
La funzione h" continua sul compatto B " (^ x) = fx 2 A : kx x^k "g e, per il Teo-
x) tale che h" (x" ) h" (x) per ogni x 2 B " (^
rema di Weierstrass, esiste x" 2 B " (^ x).
" "
In particolare, h" (x ) x) = 0, e quindi la (26.32) implica che kx k < ", ossia
h" (^
" "
x 2 B" (^ x). Il punto x dunque un punto di massimo sullaperto B" (^ x) e per il
Teorema di Fermat si ha rh" (x" ) = 0. Quindi,

@f " X
m
@gi "
(x ) 2 x"j x^j 2N" gi (x" ) (x ) = 0; 8j = 1; :::; n (26.33)
@xj i=1
@xj

Si ponga:
X
m
c" = 1 + (2N" gi (x" ))2
i=1
" 1
0 =
c"
" 2N" gi (x" )
i = ; 8i = 1; :::; m
c"
814 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA
qP
m
cosicch la (26.31) si ottiene dividendo la (26.33) per c" . Si osservi che i=0 ( "i )2 =
1, ossia ( "0 ; "1 ; :::; "m ) appartiene a U1m+1 (0). 4
Usando la Propriet 2, possiamo ora completare la dimostrazione. Si prenda una
successione decrescente f"n gn (0; ^"] con "n # 0,4 e si consideri la relativa successione
f( n0 ; n1 ; :::; nm )gn Rm+1 la cui esistenza garantita dalla Propriet 2.
Poich la successione f( n0 ; n1 ; :::; nm )gn contenuta nel compatto U1m+1 (0), per il
Teorema di Bolzano-Weierstrass esiste una sua sottosuccessione f( n0 k ; n1 k ; :::; nmk )gk
convergente in U1m+1 (0), ossia esiste ( 0 ; 1 ; :::; m ) 2 U1m+1 (0) tale che
nk nk nk
( 0 ; 1 ; :::; m) ! ( 0; 1 ; :::; m) :

Grazie alla Propriet 2, per ogni "nk esiste xnk 2 B"nk (^ x) per cui vale la (26.31),
ossia
nk @f nk X m
nk @gi
nk
0 (x ) 2 (x x^j ) i (xnk ) = 0; 8j = 1; :::; n
@xj i=1
@x j

Si consideri la successione fxnk gk cos costruita. Da xnk 2 B"nk (^


x) segue che
kxnk x^k < "nk ! 0
e quindi, per ogni j = 1; :::; n,
@f X
m
@gi
0 (^
x) i (^
x) (26.34)
@xj i=1
@xj
!
nk @f X
m
nk @gi nk
= lim 0 xk 2 (xnk x^j ) i (x ) = 0
k @xj i=1
@xj
Daltra parte, 0 6= 0. Infatti, se fosse 0 = 0, allora dalla (26.34) seguirebbe che
X
m
@gi
i (^
x) = 0; 8j = 1; :::; n
i=1
@xj
Poich i gradienti rg1 (^x), rg2 (^ x), ..., rgm (^
x) sono linearmente indipendenti, risulta
m+1
i = 0 per ogni i = 1; :::; m, il che contraddice ( 0 ; 1 ; :::; m ) 2 U1 (0).
In conclusione, se poniamo ^ i = i = 0 per ogni i = 1; :::; m, la (26.34) implica la
(26.27).
Il Lagrangiano ora la funzione L : A R Rn Rm ! R denita come:
X
m
L (x; ) = f (x) + i (bi gi (x)) = f (x) + (b g (x)) (26.35)
i=1
m
per ogni (x; ) 2 A R , e il Teorema 408 si generalizza nel seguente modo (omettiamo
la dimostrazione, del tutto analoga).
4
Naturalmente, questo uso dellindice n non va confuso con luso di n come indice di dimensionalit
dello spazio Rn su cui le funzioni f e gi sono denite.
26.6. PI VINCOLI 815

Teorema 410 Sia x^ soluzione del problema di ottimo (26.26). Se le funzioni f; g1 ; :::; gm
x) ha rango m, allora esiste un vettore ^ 2 Rm tale che la
sono di classe C 1 e se Dg (^
coppia x^; ^ 2 Rn+m punto stazionario della funzione Lagrangiana.

Le componenti ^ i del vettore ^ 2 Rm sono dette moltiplicatori di Lagrange. Si


osservi che tale vettore ^ unico: poich i vettori frgi (^
x)gm sono linearmente
Pm ^ i=1
x) = i=1 i rgi (^
indipendenti si ha ununica rappresentazione rf (^ x).
Valgono anche per questo caso pi generale le medesime considerazioni fatte per
il Teorema 408. In particolare, la ricerca dei candidati ad essere soluzione locale del
problema vincolato si svolge sempre secondo il Metodo (del primo ordine) di Lagrange,
che dal punto di vista concettuale non presenta alcuna novit nel caso di pi vincoli.
Dal punto di vista operativo si osservi tuttavia che la condizione del primo ordine
(26.15)
rL (x; ) = 0
si basa sul Lagrangiano L che ha per ora la pi complicata veste (26.35). Anche
la veste dellinsiemi dei punti singolari D0 ora pi complicata. In particolare, lo
studio del determinante della Jacobiana pu risultare complicato, rendendo disagevole
la ricerca dei punti singolari. Spesso la cosa migliore cercare direttamente i punti
singolari che soddisfano i vincoli, cio linsieme C \D0 , invece di determinare dapprima
linsieme D0 e successivamente lintersezione C \ D0 (come si era fatto con un unico
vincolo). I punti x 2 C \ D0 sono tali che gi (x) = bi e i gradienti rgi (x) sono
linearmente dipendenti. Occorre perci vericare se il sistema
8 Pm
>
> i=1 i rgi (x) = 0
>
>
>
> g1 (x) = b1
<
>
>
>
>
>
>
:
gm (x) = bm
ammette soluzioni (x; ) 2 Rn Rm con = ( 1 ; :::; m ) 6= 0, cio con i non tutte
nulle. Tali eventuali soluzioni identicano i punti singolari che soddisfano i vincoli. Si
noti che il sistema si pu scrivere come
8 P
m @gi (x)
>
> i=1 i @x1 = 0
>
>
>
>
>
>
>
>
>
>
>
>
>
< Pm @gi (x)
i=1 i @xn = 0 (26.36)
>
> g (x) = b 1
>
>
1
>
>
>
>
>
>
>
>
>
>
>
: gm (x) = bm
816 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

che la forma pi comoda per i calcoli.

Esempio 490 Consideriamo il problema di ottimo:

max3 (7x1 3x3 ) sub x21 + x22 = 1 e x1 + x2 x3 = 1 (26.37)


x2R

Esso della forma (26.26), dove f : R3 ! R e g = (g1 ; g2 ) : R3 ! R2 sono date da


f (x1 ; x2 ) = 3x1 4x3 ; g1 (x1 ; x2 ; x3 ) = x21 + x22 e g2 (x1 ; x2 ; x3 ) = x1 + x2 x3 , mentre
b = (1; 1) 2 R2 .
Tali funzioni sono tutte derivabili con continuit su R3 , ossia D = R3 . Quindi,
C \ D = C, sicch C D = ;: in tutti i punti del vincolo sia la funzioni f sia le
funzioni gi , con i = 1; 2, sono derivabili con continuit. Ci completa le fasi 1 e 2 del
Metodo di Lagrange.
Troviamo gli eventuali punti singolari che soddisfanno il vincolo, cio linsieme
C \ D0 . Il sistema (26.36) diventa
8
>
> 2 1 x1 + 2 = 0
>
>
< 2 1 x2 + 2 = 0
2 = 0 :
>
> 2 2
>
> x1 + x2 = 1
:
x1 + x2 x3 = 1

Poich 2 = 0, 1 diverso da 0. Ci implica x1 = x2 = 0, il che contraddice la


quarta equazione. Quindi, non esistono punti singolari che soddisfanno il vincolo, cio
C \ D0 = ;. Si completa cos il passo 3 del Metodo di Lagrange.
Il Lagrangiano L : R3 ! R

L (x1 ; x2 ; ) = 7x1 3x3 + 1 1 x21 x22 + 2 (1 x1 x2 + x3 )

per ogni (x1 ; x2 ; x3 ; 1 ; 2 ) 2 R5 . Per trovare linsieme dei suoi punti stazionari occorre
risolvere la condizione del primo ordine (26.15) data dal seguente sistema non lineare
di cinque equazioni 8
@L
>
> @x1 = 7 2 1 x1 2 = 0
>
>
> @L
< @x2 = 2 1 x2 2 = 0
@L
@x3
= 3 + 2 = 0
>
> @L 2
>
> = 1 x 1 x22 = 0
> @ 1
: @L = 1 x
@ 2 1 x2 + x3 = 0
nelle cinque incognite x1 , x2 , x3 , 1 e 2. La terza equazione implica 2 = 3 e quindi
il sistema si riduce a: 8
>
> 2 1 x1 + 4 = 0
<
1 x2 3=0
>
> 1 x1 x22 = 0
2
:
1 x1 x2 + x3 = 0
26.6. PI VINCOLI 817

La prima equazione implica 1 6= 0. Quindi, dalle prime due equazioni segue che:
2 3
= x1 e = x2
1 2 1
Sostituendo nella terza equazione si ottiene:
5
1 =
2
Se 1 = 5=2, si ha x1 = 4=5, x2 = 3=5, x3 = 4=5: Se 1 = 5=2, si ha x1 = 4=5,
x2 = 3=5, e x3 = 7=5. Abbiamo quindi trovato i due punti stazionari del Lagrangiano
4 3 4 5 4 3 7 5
; ; ; ;3 ; ; ; ; ;3
5 5 5 2 5 5 5 2
sicch
4 3 4 4 3 7
S= ; ; ; ; ;
5 5 5 5 5 5
il che completa tutti le fasi del Metodo di Lagrange. In conclusione, si ha
4 3 4 4 3 7
S [ (C \ D0 ) [ (C D) = S = ; ; ; ; ;
5 5 5 5 5 5
il che prova che nellesempio la condizione del primo ordine (26.15) necessaria per
qualsiasi soluzione locale del problema di ottimo (26.37). NellEsempio 505 del Capito-
lo 27 mostreremo quali, tra i punti di S, sono soluzioni del problema di ottimo (26.37).
N
Esempio 491 Consideriamo il problema di ottimo:
max3 x1 sub x21 + x32 = 0 e x23 + x22 2x2 = 0 (26.38)
x2R

Anchesso della forma (26.26), dove f : R3 ! R e g = (g1 ; g2 ) : R3 ! R2 sono


date da f (x1 ; x2 ) = x1 , g1 (x1 ; x2 ; x3 ) = x21 + x32 , g2 (x1 ; x2 ; x3 ) = x23 + x22 2x2 ,
mentre b = (0; 1) 2 R2 .
Anche qui le funzioni sono tutte derivabili con continuit su R3 , ossia D = R3 .
Quindi, C \ D = C, sicch C D = ;: in tutti i punti del vincolo sia la funzioni f sia
le funzioni gi sono derivabili con continuit. Ci completa le fasi 1 e 2 del Metodo di
Lagrange.
Troviamo gli eventuali punti singolari che soddisfanno il vincolo, cio linsieme
C \ D0 . Il sistema (26.36) diventa
8
>
> 2a1 x1 = 0
>
> 2
< 3 1 x2 + 2 (2x2 2) = 0
2 2 x3 = 0
>
>
>
> x21 + x32 = 0
:
x3 + x22 2x2 = 0
2

Alla luce della prima e della terza equazione, dobbiamo considerare tre casi:
818 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

(i) 1 = 0, x3 = 0 e 2 6= 0: in questo caso la seconda equazione implica x2 = 1, il


che contraddice lultima equazione.
(ii) 2 = 0, x1 = 0 e 1 6= 0: in questo caso si ha la soluzione x1 = x2 = x3 = 0.
(iii) x1 = x3 = 0: anche qui si ottiene la soluzione x1 = x2 = x3 = 0.
In conclusione f(0; 0; 0)g lunico punto singolare che soddisfa i vincoli, cio C \
D0 = f(0; 0; 0)g. Ci completa la fase 3 del Metodo di Lagrange.
Il Lagrangiano L : R5 ! R dato da
L (x1 ; x2 ; ) = x1 + 1 x21 x32 + 2 x23 x22 + 2x2
La condizione del primo ordine (26.15) data dal seguente sistema (non lineare) di
cinque equazioni 8
@L
>
> = 1 + 2 1 x1 = 0
>
>
@x1
> @L 2
< @x2 = 3 1 x2 2 2 (x2 1) = 0
@L
@x3
= 2 2 x3 = 0
>
> @L
>
> = x21 x32 = 0
> @ 1
: @L = x2 + x2 2x = 0
@ 2 3 2 2

nelle cinque incognite x1 , x2 , x3 , 1 e 2 . La prima equazione implica 1 6= 0 e x1 6= 0.


Dalla quarta equazione segue che x2 6= 0 e quindi dalla seconda equazione si ottiene
2 6= 0.
Poich 2 6= 0, dalla terza equazione si ha x3 = 0, sicch la quinta equazione
implica x2 = 0 oppure x2 = 2. Poich x2 = 0 contraddice ci che p si appena stabilito,
consideriamo x2 = 2. La quarta equazione implica x1 = 8, e quindi la prima
equazione implica
1
1 = p ;
4 2
cosicch dalla seconda equazione si ottiene
3
2 = p :
2 2
In conclusione, i punti stazionari del Lagrangiano sono
p 1 3 p 1 3
8; 2; 0; p ; p ; 8; 2; 0; p ; p
4 2 2 2 4 2 2 2
e quindi n p o
S= 8; 2; 0
il che completa tutti le fasi del Metodo di Lagrange. In conclusione, si ha
n p o
S [ (C \ D0 ) [ (C D) = S [ (C \ D0 ) = 8; 2; 0 ; (0; 0; 0)

e tra tali tre punti si deve svolgere la ricerca delle evenuali soluzioni locali del problema
di ottimo (26.38). N
26.6. PI VINCOLI 819

Esempio 492 Consideriamo il problema di ottimo:

max3 x21 + x22 + x23 sub x21 x2 = 1 e x1 + x3 = 0 (26.39)


x2R

Questo problema della forma (26.26), dove f : R3 ! R e g = (g1 ; g2 ) : R3 ! R2 sono


date da f (x1 ; x2 ; x3 ) = (x21 + x22 + x23 ), g1 (x1 ; x2 ; x3 ) = x21 x2 e g2 (x1 ; x2 ; x3 ) =
x1 + x3 , mentre b = (1; 1) 2 R2 . Come negli esempi precedenti, le funzioni sono tutte
derivabili con continuit su R3 , ossia D = R3 . Quindi, C \ D = C, sicch C D = ;,
il che completa le fasi 1 e 2 del Metodo di Lagrange.
In questo caso studiamo direttamente il rango della Jacobiana:

2x1 1 0
Dg (x) =
1 0 1

facile vedere come per nessun valore di x1 i due vettori riga, ossia i due gradienti
rg1 (x) e rg2 (x), siano lineramente dipendenti (a livello meccanicosi verica facil-
mente che non esista alcun valore di x1 per cui la matrice Dg (x) non ha rango pieno).
Quindi, non esistono punti singolari, ossia si ha D0 = ;. Ne segue che C \ D0 = ;, e
abbiamo cos completato la fase 3 del Metodo di Lagrange.
Passiamo ora alla ricerca dellinsieme dei punti stazionari del Lagrangiano, che
qui dato da

L (x1 ; x2 ; ) = x21 + x22 + x23 + 1 1 x21 + x2 + 2 (1 x1 x3 )

per ogni (x1 ; x2 ; x3 ; 1 ; 2 ) 2 R5 . Per trovare tali punti occorre risolvere il seguente
sistema (non lineare) di 5 equazioni
8
@L
>
> = 2x1 2 1 x1 2 = 0
>
>
@x1
> @L
< @x2 = 2x2 + 1 = 0
@L
@x3
= 2x3 2 = 0
>
> @L 2
>
> = 1 x1 + x2 = 0
> @
: @L1 = 1 x
@ 2 1 x3 = 0

Si ha 1 = 2x2 e 2 = 2x3 , che sostituiti nella prima equazione portano al seguente


sistema non lineare di 3 equazioni:
8
< x1 + 2x1 x2 x3 = 0
1 x21 + x2 = 0
:
1 x1 x3 = 0

Dalle ultime due equazioni abbiamo x2 = x21 1 e x3 = 1 x1 , che, sostituiti nella


prima, portano a 2x31 1 = 0, da cui
1
x1 = p
3
:
2
820 CAPITOLO 26. OTTIMIZZAZIONE LOCALE VINCOLATA

e quindi
1 1
x2 = p
3
1 e x3 = 1 p
3
:
4 2
Vi allora lunico punto stazionario

1 1 1 2 2
p
3
;p 1; 1 p ;p 2; 2 + p
2 34 3
2 34 3
2
sicch
1 1 1
S= p3
;p
3
1; 1 p3
2 4 2
il che completa tutti le fasi del Metodo di Lagrange. In conclusione, si ha

1 1 1
S [ (C \ D0 ) [ (C D) = S = p
3
;p 1; 1 p
2 34 3
2
lunico candidato a essere soluzione locale del problema di ottimo (26.39). N
Capitolo 27

Programmazione matematica

La Programmazione matematica costituisce un capitolo fondamentale della Matemat-


ica applicata e comprende i metodi e i concetti volti alla risoluzione dei problemi di
ottimo presentati nel Capitolo 17.
La centralit sia analitica sia concettuale dei problemi di ottimo in Economia
conferisce alla Programmazione matematica unimportantissima funzione nelle appli-
cazioni economiche. Nel capitolo vedremo alcuni tra gli elementi iniziali della teoria,
secondo le linee anticipate nellanteprima presentata nel Capitolo 25, e che il lettore
svilupper in corsi successivi. Prima di entrare nel dettaglio, ci piace per ricordare
che sono state proprio le applicazioni economiche a fornire il maggior stimolo, soprat-
tutto nel secondo dopoguerra, allo sviluppo della Programmazione matematica. Si
in tal modo ripresa lantica funzione dellEconomia quale ispiratrice di importante
ricerca matematica, che per lungo tempo era stato fondamentale per lo sviluppo della
Matematica: si pensi alla mercatura nello sviluppo dellAlgebra nel Medioevo e nel
Rinascimento, a partire dai celebri lavori di Fibonacci nel tredicesimo secolo, sino a
quando Galileo e Newton consegnarono tale funzione alla Fisica.

27.1 Programmazione dierenziale


Un problema di ottimo
max f (x) sub x 2 C (27.1)
x

si dice dierenziale se la funzione f : A Rn ! R derivabile in un sottoinsieme


(non vuoto) aperto D del suo dominio, cio ; = 6 D int A.1
Lo studio dei problemi di ottimo dierenziale si pu giovare dei risultati sinora visti
di Calcolo dierenziale. In particolare, in questa sezione presentiamo una procedura di
risoluzione dei problemi dierenziali di ottimo, detta Metodo di eliminazione, che sia
1
Nelle applicazione spesso si assume la derivabilit con continuit in D, ossia che f sia di classe
1
C su D. La Sezione 27.2.3 richieder esplicitamente la derivabilit con continuit perch basata
sui risultati del capitolo precedente, mentre non necessaria per la Sezione 27.2.1 che basata sul
Teorema di Fermat.

821
822 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

molto e cace sia di grande eleganza perch basata su una combinazione di risultati
globali, quali i Teoremi di Weierstrass e di Tonelli, di natura topologica, e di risultati
locali di Calcolo dierenziale, quali il Teorema di Fermat e alcune sue varianti.

27.1.1 Anatomia di C
Per presentare il Metodo di eliminazione dobbiamo prima studiare pi da vicino
linsieme C. Indichiamo con G lintersezione
G = D \ int C
ossia linsieme dei punti interni di C ove f derivabile. Poich int C e D sono aperti,
anche G lo .
Poniamo, inoltre
F = C G;
cio F linsieme dei punti di C in cui f non derivabile. Se C chiuso, linsieme F
anchesso chiuso e contiene tutti i punti di frontiera di C ; cio @C F .
Per denizione, F \ G = ; e F [ G = C. Ogni punto di C appartiene quindi a G
oppure a F . In altre parole, fF; Gg una partizione di C. Quando f derivabile in
tutti i punti interni di C si ha G = int C e F @C. In questo caso (fortunato) la par-
tizione fF; Gg di C si riduce a quella tra punti interni e di frontiera (che appartengono
a C).
Illustriamo queste nozioni con alcuni esempi. Il primo tra essi particolarmente
importante.
Esempio 493 Data g : A R2 ! R e b 2 R, sia
C = fx 2 A : g (x) = bg (27.2)
linsieme di scelta identicato da un classico vincolo di uguaglianza. Linsieme C non
ha punti interni, e quindi int C = G = ;. Ne segue che F = C. N
P
Esempio 494 Sia f : Rn ! R data da f (x) = xi . La funzione derivabile su Rn ,
n n
ossia D = R . Se C = R P , si ha G = int C = C e F = @C = ;. Se, invece, C
n
linsieme chiuso x 2 R+ : xi 1 , si ha
n X o n X o
G = int C = x 2 Rn+ : xi < 1 e F = @C = x 2 Rn+ : xi = 1

In entrambi i casi f derivabile su C e quindi G = int C e F = @C. N


Esempio 495 Sia f : R ! R data da f (x) = jxj. La funzione derivabile su R,
eccetto che nellorigine 0, sicch D = R f0g. Se C = R, si ha G = D \ R = R f0g
e F = f0g. Se, invece, C = [ 1; 1] = fx 2 R : jxj 1g, si ha
G = int C \ D = ( 1; 0) [ (0; 1) e F =C G = f 1; 0; 1g
In entrambi i casi f non derivabile su tutto C, ma solo su un suo sottoinsieme:
G int C e @C F . N
27.2. METODO DI ELIMINAZIONE 823

Esempio 496 Nel caso vettoriale la funzione dellesempio precedente diventa f :


Rn ! R data da f (x) = kxk : Essa derivabile su Rn , eccetto che in 0, sicch
D = Rn f0g.PSe C = Rn , si ha G = D \ Rn = Rn f0g e F = f0g. Se, invece,
C = fx 2 Rn : ni=1 jxi j 1g, da
( )
X
n
int C = x 2 Rn : jxi j < 1
i=1

segue che
( ) ( )
X
n X
n
n n
G= x2R :0< jxi j < 1 e F = f0g [ x2R : jxi j = 1
i=1 i=1

Anche qui f non derivabile su tutto C, ma solo su un suo sottoinsieme, per cui
G int C e @C F . N

27.2 Metodo di eliminazione


I risultati dei capitoli precedenti consentono di studiare due classi di insiemi di scelta
C:

(i) insiemi C con interno non vuoto; per i quali si pu applicare il Teorema di
Fermat;

(ii) insiemi C determinati da vincoli di uguaglianza; per i quali si pu usare il Metodo


di Lagrange.

A seconda del tipo di insieme di scelta, il Metodo di eliminazione assume una forma
diversa, bench lidea di base sia la stessa, ovvero combinare risultati di esistenza
globali alla Weiertrass/Tonelli e risultati dierenziali locali alla Fermat/Lagrange.

27.2.1 Primo caso: interno non vuoto


Consideriamo il problema
max f (x) sub x 2 C
x

tale che linsieme C di scelta abbia interno non vuoto. Si pu applicare il Teorema di
Fermat e il Metodo di eliminazione si articola nelle seguenti fasi:

1. Si determinano gli insiemi G e F . Se G 6= ;, si passa alla fase successiva.

2. Si stabilisce se sia applicabile il Teorema di Tonelli, ossia se f continua e


coerciva su C. Se s, si passa alla fase successiva.
824 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

3. Si trova linsieme S dei punti interni stazionari di f su C, ossia

S = fx 2 G : rf (x) = 0g :

Se S 6= ;, si passa alla fase successiva.


Quando n = 1 e G = int C (la funzione scalare e derivabile in tutti i punti
interni di C), in luogo di S si pu considerare il suo sottoinsieme Se S costituito
dai punti stazionari che la procedura omnibus della Sezione 21.3 individua come
punti di massimo locale e da quelli di cui essa non in grado di determinare la
natura.

4. Si costruisce linsieme ff (x) : x 2 S [ F g. Se x^ 2 S [ F tale che

f (^
x) f (x) 8x 2 S [ F;

allora tale x^ soluzione del problema di ottimo (27.1).


In altre parole, si costruisce linsieme formato dai punti stazionari e dai punti
di F , ove la funzione non derivabile. I punti dellinsieme in cui f ha valore
massimo sono le soluzioni del problema di ottimo.

Per capire il funzionamento del Metodo di eliminazione, si osservi che, grazie al


Teorema di Fermat, linsieme S formato da tutti i punti di int C candidati ad essere
soluzioni locali del problema di ottimo (27.1).
Daltra parte, se f continua e coerciva su C, per il Teorema di Tonelli, esiste
almeno una soluzione del problema di ottimo. Poich

C =G[F e G \ F = ;;

tale soluzione deve appartenere a G oppure a F . Ma, se appartiene a G, per quanto


abbiamo appena osservato, essa deve essere in S. Ne segue che le soluzioni apparten-
gono a S [ F , e quindi i punti x^ 2 S [ F tali che f (^
x) f (x) per ogni x 2 S [ F
sono le soluzioni del problema di ottimo (27.1).

Come anticipato, il Metodo di eliminazione unelegante combinazione di un risul-


tato globale di esistenza qual il Teorema di Tonelli e di un risultato locale qual
invece il Teorema di Fermat.

Se S = ; il Metodo si arresta alla prima fase ed in grado solo di determinare


lesistenza di soluzioni. Se S 6= ;, la sua e cacia tanto maggiore quanto pi piccoli
sono gli insiemi S e F perch la fase 4 richiede il confronto di f in tutti i punti di
S [ F . Per questa ragione il Metodo particolarmente e cace sia nel caso scalare,
quando in luogo di S si pu considerare il suo sottoinsieme Se della procedura omnibus,
sia quando C un insieme aperto su cui f derivabile (in tal caso G = C e quindi
F = ;).
Quando, invece, int C = ; oppure D = ; si ha G = ; e quindi C = F , sicch
questa versione del Metodo di eliminazione si rivela vacua. Nellimportante caso in cui
27.2. METODO DI ELIMINAZIONE 825

linsieme di scelta C denito da un vincolo di uguaglianza si pu dare una diversa


versione del Metodo basata sui moltiplicatori di Lagrange, come il lettore vedr tra
poco nella Sezione 27.2.3.

Esempio 497 Sia f : Rn ! R data da f (x) = 1 kxk2 e sia C = Rn . Risolviamo il


problema di ottimo
max 1 kxk2 sub x 2 Rn (27.3)
x
2
Da kxk 0 scende che 1 kxk2 1 per ogni x 2 Rn , sicch il punto x^ = 0 risolve il
problema poich f (^
x) = 1. Ci detto, proviamo a ritrovare questo semplice risultato
col Metodo di eliminazione.

Fase 1: La funzione derivabile sullinsieme aperto C; quindi G = C e F = ;.

Fase 2: La funzione coerciva e derivabile (e quindi continua) su C e perci soddisfa


le ipotesi del Teorema di Tonelli.

Fase 3: facile vedere che


rf (x) = 0 () x = 0;
sicch S = f0g e x = 0 lunico punto stazionario. Ci completa la fase 3.

Fase 4: F = ; e quindi S [ F = f0g. La fase 4 banalmente vericata e quindi x = 0


soluzione del problema (27.3) di ottimo. N

Esempio 498 Sia f : R ! R data da f (x) = x6 + 3x2 1 e sia C = R. Risolviamo


il problema di ottimo scalare

max x6 + 3x2 1 sub x 2 R (27.4)


x

Applichiamo il Metodo di eliminazione.

Fase 1: Anche qui siamo fortunati: G = C e F = ;.

Fase 2: Si ha limx!+1 f (x) = limx!+1 f (x) = 1 e quindi, per la Proposizione 290,


f coerciva su R. Ci completa la fase 2 perch f ovviamente continua.

Fase 3: La condizione del primo ordine f 0 (x) = 0 ha la forma

6x5 6x = 0;

e quindi x = 0 e x = 1 sono gli unici punti stazionari, cio S = f 1; 0; 1g. Si ha


f 00 (0) = 6, f 00 ( 1) = 24 e f 00 (1) = 24 e quindi x = 0 punto di massimo locale,
mentre x = 1 e x = 1 sono punti di minimo locale. Quindi, Se = f0g.

Fase 4: Poich F = ;, si ha Se [ F = Se = f0g. La fase 4 banalmente vericata e


quindi x = 0 soluzione del problema di ottimo (27.4). N
826 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

27.2.2 Ubi maior


Quando, nella fase 2 del Metodo di eliminazione, si pu usare il Teorema di Weierstrass
invece del pi debole Teorema di Tonelli, si ottengono come sottoprodotto anche i
punti di minimo globale, ossia i punti x 2 C che risolvono il problema minx f (x) sub
x 2 C. Infatti, facile vedere che tali sono i punti x 2 S [F tali che f (x ) f (x) per
ogni x 2 S [ F . Naturalmente, ci non pi vero se si usa il Teorema di Tonelli perch
esso garantisce solo lesistenza di punti di massimo e non dice alcunch sullesistenza
di eventuali punti di minimo.

Esempio 499 Sia f : Rn ! R sempre data da f (x) = 1 kxk2 , ma sia C =


fx 2 Rn : kxk 1g. Anche qui immediato vedere che x^ = 0 soluzione. Ma,
applichiamo il Metodo di eliminazione.

Fase 1: Si ha

G = int C = fx 2 Rn : kxk < 1g e F = @C

Fase 2: Linsieme C compatto e la funzione f continua su C: quindi soddisfa le


ipotesi del Teorema di Weierstrass. La fase 1 quindi vericata con questo teorema
in luogo del pi debole di Tonelli.

Fase 3: S = f0g perch x = 0 lunico punto stazionario. Ci completa la fase 3.

Fase 4: @C = fx 2 Rn : kxk = 1g e quindi

S [ @C = f0g [ fx 2 Rn : kxk = 1g

Si ha
f (0) > f (x) = 1 8x 2 @C
e la fase 4 conferma che x^ = 0 lunica soluzione del problema di ottimo

max f (x) sub x 2 C


x

mentre tutti i punti di frontiera @C sono soluzioni del problema di ottimo

min f (x) sub x 2 C


x

27.2.3 Secondo caso: vincoli di uguaglianza


Quando linsieme di scelta C ha interno vuoto la versione appena vista del Metodo di
eliminazione diventa inutile. Grazie ai risultati del capitolo precedente possiamo per
darne una diversa versione per problemi vincolati

max f (x) sub x 2 C = fx 2 A : gi (x) = bi per ogni i = 1; :::; mg (27.5)


x
27.2. METODO DI ELIMINAZIONE 827

con f e g entrambe dierenziabili con continuit sullinsieme D. Ricordiamo dal


Capitolo 26 che D0 = fx 2 D : rg (x) = 0g linsieme dei punti singolari di g.
In questo caso si ha C = F e il Metodo di eliminazione si articola nelle seguenti
fasi:

1. Si determina se sia applicabile il Teorema di Tonelli, ossia se f continua e


coerciva su C. Se s, si passa alla fase successiva.

2. Si determina col Metodo di Lagrange del Capitolo 26 linsieme

S [ (C \ D0 ) [ (C D) (27.6)

costituito dallinsieme S dei punti x 2 D D0 non singolari per i quali esiste


tale che la coppia (x; ) un punto stazionario del Lagrangiano2 , dallinsieme
D0 \ C dei punti singolari che soddisfanno i vincoli, e, inne, dallinsieme C D
dei punti che soddisfanno i vincoli nei quali non vi derivabilit.

3. Si costruisce linsieme

ff (x) : S [ (D0 \ C) [ (Dc \ C)g

Se un punto x^ 2 S [ (D0 \ C) [ (Dc \ C) tale che

f (^
x) f (x) 8x 2 S [ (D0 \ C) [ (Dc \ C) (27.7)

allora x^ soluzione del problema di ottimo (27.5). In altre parole, i punti del-
linsieme (27.6) nei quali f ha valore massimo sono le soluzioni del problema di
ottimo.

Per capire il Metodo di eliminazione, si osservi che, come si visto nel Capitolo
26, grazie al Teorema 408 linsieme (27.6) consta dei punti di C che sono candidati
ad essere soluzioni locali del problema di ottimo (27.5). Daltra parte, per il Teorema
di Tonelli esiste almeno una soluzione del problema di ottimo. Tale soluzione deve
appartenere allinsieme (27.6) poich una soluzione del problema di ottimo ne , a
fortiori, soluzione locale. Quindi, le soluzioni del problema ristrettodi ottimo

max f (x) sub x 2 S [ (D0 \ C) [ (Dc \ C) (27.8)


x

sono anche le soluzioni del problema (27.5) di ottimo. Ma le soluzioni del problema
(27.8) sono i punti x^ 2 S [ (D0 \ C) [ (Dc \ C) per cui vale la (27.7). Esse sono
quindi soluzioni del problema (27.5) di ottimo, come aerma la fase 3 del Metodo di
eliminazione.
2
Si osservi che questi punti x soddisfanno sicuramente il vincolo e quindi si ha sempre S C D0 ;
non occorre quindi vericare se per un punto x 2 S si abbia anche x 2 C.
828 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

Anche in questo caso il Metodo di eliminazione unelegante combinazione del


risultato globale di Tonelli e di quello di natura locale del Teorema 408.

Vale ancora quanto osservato nella Sezione 27.2.2: quando nella prima fase del
Metodo di eliminazione si usa il Teorema di Weiertrass, come sottoprodotto si ot-
tengono anche i punti di minimo globale, ossia i punti x 2 C che risolvono il problema
speculare minx f (x) sub x 2 C = (gi (x) = bi 8i = 1; :::; m).

Illustriamo il Metodo con alcuni esempi.

Esempio 500 Riprendiamo lEsempio 485, col problema di ottimo:

max2 2x21 5x22 sub x21 + x22 = 1 (27.9)


x2R

che ha la forma (27.5). Linsieme

C = x = (x1 ; x2 ) 2 R2 : x21 + x22 = 1

compatto, e ci completa la prima fase del Metodo di eliminazione (qui vale il


Teorema di Weierstrass).
NellEsempio 485, si mostrato con il Metodo di Lagrange che

S [ (C \ D0 ) [ (C D) = S = f(0; 1) ; (0; 1) ; (1; 0) ; ( 1; 0)g

il che completa la seconda fase. Si ha

f (0; 1) = f (0; 1) = 5 e f (1; 0) = f ( 1; 0) = 2;

sicch i punti (0; 1) e (0; 1) sono soluzioni del problema di ottimo (27.9). N

Esempio 501 Riprendiamo lEsempio 486, col problema di ottimo:


X
n
kxk2
maxn e sub xi = 1 (27.10)
x2R
i=1

che ha la forma (27.5). Linsieme


( )
X
n
C= x = (x1 ; :::; xn ) 2 Rn : xi = 1
i=1

non compatto, e quindi non si pu applicare il Teorema di Weierstrass. Tuttavia, f


coerciva. Infatti,
8
< Rn p se t 0
n
(f t) = x 2 R : kxk lg t se t 2 (0; 1]
:
; se t > 1
27.2. METODO DI ELIMINAZIONE 829

e quindi linsieme (f t) compatto e non vuoto per t 2 (0; 1]. Per il Teorema di
Tonelli, f possiede almeno un punto di massimo su C, e ci completa la prima fase
del Metodo di eliminazione.
NellEsempio 486 il Metodo di Lagrange aveva mostrato che

1 1 1
S [ (C \ D0 ) [ (C D) = ; ; :::;
n n n

Siccome linsieme un singoletto, il Metodo di eliminazione permette di concludere


che il vettore x = (1=n; :::; 1=n) lunica soluzione del problema (27.10) di ottimo: N

Il prossimo esempio mostra limportanza dellinsieme D0 \ C.

Esempio 502 Riprendiamo lEsempio 487, col problema di ottimo:


x1
max2 e sub x31 x22 = 0 (27.11)
x2R

che ha la forma (27.5). Linsieme

C = x = (x1 ; x2 ) 2 R2 : x31 = x22

chiuso ma non compatto, e quindi il Teorema di Weierstrass non si pu applicare.


La funzione f continua su R2 e si ha:
8
< R2 se t 0
(f t) = ( 1; lg t] R se t 2 (0; 1]
:
; se t > 1

La funzione f non quindi coerciva sullintero spazio R2 . Lo per su C, ed ci


che interessa. Per vericarlo, si cominci con losservare che x1 pu rispettare il vincolo
x31 = x22 solo se x1 0, sicch C R+ R e

(f t) \ C (( 1; lg t] R) \ (R+ R) = [0; lg t] R, 8t 2 (0; 1]

Se x1 2 [0; lg t], il vincolo fa s che x22 2 0; lg3 t , ossia


q q
3
x22 2 lg t; lg3 t

Ne segue che
q q
3
(f t) \ C [0; lg t] lg t; lg3 t 8t 2 (0; 1]

e quindi (f t) \ C compatto poich un sottoinsieme chiuso di un compatto.


La funzione f perci coerciva e continua su C, e, per il Teorema di Tonelli, essa
830 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

ha almeno un punto di massimo su C. La prima fase del Metodo di eliminazione


completata.
Per quanto riguarda la seconda fase, nellEsempio 487 il Metodo di Lagrange ha
mostrato che
S [ (C \ D0 ) [ (C D) = f(0; 0)g
Il Metodo di eliminazione permette di concludere che (0; 0) lunica soluzione del
problema di ottimo (27.11). N

Bench il Metodo di eliminazione rappresenti una procedura molto generale di


risoluzione dei problemi di ottimo vincolato, pu succedere che alcune soluzioni del
problema di ottimo che siano catturate dalla procedura. Infatti, la prima fase del
Metodo di eliminazione si basa su risultati di esistenza alla Weierstrass/Tonelli che
forniscono condizioni su cienti, ma non necessarie, per lesistenza di punti di ottimo.
Pu quindi accadere che, bench soluzioni del problema di ottimo esistano, la prima
fase del Metodo di eliminazione fallisca. Lunica cosa che si pu dire quando la prima
fase non dia esiti che le soluzioni, se esistono, appartengono allinsieme S [ D0 . Ma
pu benissimo accadere che nessuno di tali punti sia soluzione del sistema.
I prossimi esempi illustrano questi aspetti del Metodo di eliminazione.

Esempio 503 Consideriamo il problema di ottimo:

maxn x31 x32 sub x1 x2 = 0 (27.12)


x2R

Linsieme
C = x = (x1 ; x2 ) 2 R2 : x1 = x2
non compatto e la funzione f non coerciva su C. Infatti

; se t > 0
(f t) \ C =
C se t 0

Ne segue che non valgono le ipotesi del Teorema di Tonelli, e quindi la prima fase del
Metodo di eliminazione fallisca e il Metodo non si pu perci applicare al problema
(27.12) di ottimo.
Daltra parte, immediato vericare che f (x) = 0 per ogni x 2 C, e quindi ogni
punto di C soluzione del problema (27.12). Il Metodo di eliminazione non qui stato
in grado di risolvere un problema piuttosto banale di ottimo. N

Esempio 504 Cambiamo leggermente lesempio precedente, e consideriamo il prob-


lema di ottimo:
x31 x32 sub x1 + x2 = 0 (27.13)
Anche qui linsiemeC = fx = (x1 ; x2 ) 2 R2 : x1 = x2 g
27.2. METODO DI ELIMINAZIONE 831

non compatto e la funzione f non coerciva su C. Infatti


"r !
3 t
(f t) \ C = ; +1 8t 2 R
2
Non valgono le ipotesi del Teorema di Tonelli e quindi il Metodo di eliminazione non
si pu applicare neanche a questo problema di ottimo. A dierenza dellesempio prece-
dente, il problema non ha soluzione. Infatti, da x1 = x2 segue f (x1 ; x2 ) = 2x31 e
quindi f (x1 ; x2 ) ! 1 quando x1 ! 1, il che mostra che il problema (27.13) non
ha soluzioni.
Se studiamo il Lagrangiano, otteniamo S [ (D0 \ C) [ (C D) = f(0; 0)g, e quindi
il punto (0; 0) lunico candidato ad essere soluzione del problema. Ma, f (n; n) >
f (0; 0) e quindi anche per questa via si conclude che il problema (27.13) non ha
soluzioni3 . N
Passiamo ora a esempi con pi vincoli, riprendendo i problemi di ottimo studiati
col Metodo di Lagrange nel Capitolo 26.
Esempio 505 Riprendiamo lEsempio 490, col problema di ottimo:
max3 (7x1 3x3 ) sub x21 + x22 = 1 e x1 + x2 x3 = 1 (27.14)
x2R

Linsieme
C = x = (x1 ; x2 ; x3 ) 2 R3 : x21 + x22 = 1 e x1 + x2 x3 = 1
ovviamente chiuso. Mostriamo che esso anche limitato, e quindi compatto. Per
gli x1 e x2 tali che x21 + x22 = 1 si ha x1 ; x2 2 [ 1; 1], mentre per gli x3 tali che
x3 = x1 + x2 1 e x1 ; x2 2 [ 1; 1] si ha x3 2 [ 3; 1]. Ne segue che
C [0; 1] [0; 1] [ 3; 1]
e perci linsieme C limitato. In conclusione C compatto, il che completa la prima
fase del Metodo di eliminazione poich la funzione obiettivo f continua (si noti che
qui vale il Teorema di Weierstrass).
NellEsempio ?? il Metodo di Lagrange aveva mostrato che
4 3 4 4 3 7
S [ (C \ D0 ) [ (C D) = ; ; ; ; ;
5 5 5 5 5 5
il che completa la fase 2 del Metodo di eliminazione. Si ha:
4 3 4
f ; ; = 8,
5 5 5
4 3 7 49
f ; ; =
5 5 5 5
3
Questa seconda via che usa il Lagrangiano involuta rispetto allo studio diretto della successione
xn = (n; n), ma vi sono casi in cui utile prima ridursi a S [ (D0 \ C) [ (C D), per poi stabilire
che nessuno di questi candidati eettivamente soluzione del problema.
832 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

e ci implica che
4 3 4
; ;
5 5 5
la soluzione del problema di ottimo (27.14), mentre

4 3 7
; ;
5 5 5

punto di minimo (globale) vincolato. N

Esempio 506 Riprendiamo lEsempio 491, col problema di ottimo:

max3 x1 sub x21 + x32 = 0 e x23 + x22 2x2 = 0 (27.15)


x2R

Anche qui linsieme

C = x = (x1 ; x2 ; x3 ) 2 R3 : x32 = x21 e x23 + x22 = 2x2

chiuso. Esso anche limitato, e quindi compatto. Infatti, il secondo vincolo si pu


scrivere come x23 + (x2 1)2 = 1, e quindi gli x2 e x3 che lo soddisfano sono tali che
x3 2p[ 1; 1]. A questo punto il vincolo x21 = x32 implica che x21 2 [0; 8], da
x2 2 [0; 2] ep
cui x1 2 8; 8 . In conclusione,
h p p i
C 8; 8 [0; 2] [ 1; 1]

il che mostra che C limitato. Come nellesempio precedente, anche qui le ipotesi del
Teorema di Weierstrass sono soddisfatte e questo completa la prima fase del Metodo
di eliminazione.
NellEsempio ?? il Metodo di Lagrange aveva mostrato che
n p o
S [ (C \ D0 ) [ (C D) = 8; 2; 0 ; (0; 0; 0)

il che completa la fase 2. Si ha:


p p
f 8; 2; 0 = 8,
f (0; 0; 0) = 0

ilpche implica che (0; 0; 0) la soluzione del problema di ottimo (27.15), mentre
8; 2; 0 punto di minimo (globale) vincolato. N

Esempio 507 Riprendiamo lEsempio 492, col problema di ottimo:

max3 x21 + x22 + x23 sub x21 x2 = 1 e x1 + x3 = 0 (27.16)


x2R
27.3. APPLICAZIONI 833

Linsieme
C = x = (x1 ; x2 ; x3 ) 2 R3 : x21 x2 = 1 e x1 = x3
chiuso, ma non limitato p (e quindi non compatto). Infatti, si consideri la succes-
sione fxn g data da xn = 1 + n; n; 1 n . Essa appartiene a C, ma kxn k ! +1 e
quindi non esiste alcun intorno in R3 che possa contenerla.
Daltra parte, grazie alla Proposizione 290 la f coercitiva e continua, e quindi vale
il Teorema di Tonelli. La prima fase del Metodo di eliminazione quindi soddisfatta.
NellEsempio ?? il Metodi Lagrange aveva mostrato che
1 1 1
S [ (C \ D0 ) [ (C D) = p
3
;p 1; 1 p
2 34 3
2
Linsieme (27.6) un singoletto e ci permette subito di concludere che il punto
1 1 1
p
3
;p 1; 1 p
2 34 3
2
la soluzione del problema di ottimo (27.16). Si noti come in questo caso il metodo
di eliminazione non dica alcunch sullesistenza di eventuali punti di minimo globale
vincolato in quanto la prima fase si basa sul Teorema di Tonelli e non sul Teorema di
Weierstrass. N

Si osservi da ultimo che non abbiamo parlato di condizioni del secondo ordine da
usare nella risoluzione di problemi di ottimo vincolato, mentre nella Sezione 20.4 del
Capitolo 18 avevamo parlato in dettaglio di tali condizioni nei problemi senza vincoli.
Lomissione non casuale ed dovuta al cambiamento di prospettiva, da locale a
globale, fatta in questo capitolo rispetto al Capitolo 18. Le condizioni del secondo
ordine sono infatti di poco interesse per la ricerca di punti di massimo globale, ed il
loro contributo marginale a tale ricerca di solito pi che compensato dalla pesantezza
dei calcoli che esse comportano. Per tale ragione non ne parliamo.

27.3 Applicazioni
27.3.1 Problema del consumatore
Consideriamo il classico Problema del consumatore (17.7), ossia il problema di ottimo

max u (x) sub x 2 B (p; I) :


x

con prezzi strettamente positivi, cio p 0, e funzione di utilit u : A Rn+ ! R


continua e strettamente crescente.
Per la Legge di Walras la soluzione, ossia il paniere ottimo, appartiene allinsieme
(p; I) = fx 2 A : p x = Ig, sicch il Problema del consumatore assume la forma

max u (x) sub x 2 (p; I) ; (27.17)


x
834 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

col vincolo di bilancio soddisfatto come uguaglianza. Si tratta di un classico problema


di ottimo con vincolo di uguaglianza, dove la funzione g : Rn ! R data da g (x) =
p x. Per risolverlo col Metodo di eliminazione della Sezione 27.2.3, supponiamo che
u : A Rn+ ! R sia derivabile con continuit sul suo interno int A; cio D = int A.
Per esempio, la funzione di utilit Cobb-Douglas u : Rn++ ! R denita da

Y
n
u (x1 ; x2 ; ; xn ) = xi i
i=1
Pn
con ogni i >0e i=1 i = 1 soddisfa lipotesi, con A = D = int A = Rn++ .

La prima fase del Metodo segue dal Teorema 294, unapplicazione del Teorema di
Weierstrass che aveva mostrato che il Problema del consumatore ha soluzione. Per la
seconda fase, nella Sezione 26.5 del Capitolo 26 il Metodo di Lagrange aveva mostrato
che linsieme (27.6) per il Problema del consumatore

S [ ((A int A) \ C)

Le soluzioni del Problema del consumatore sono quindi i panieri x^ 2 S[((A int A) \ C)
tali che
u (^
x) u (x) 8x 2 S [ ((A int A) \ C)
In altre parole, occorre confrontare tra loro le utilit che si ottengono con i punti
stazionari in S e con i punti di frontiera che soddisfano il vincolo in (A int A) \ C. Il
loro confronto richiede il calcolo dei loro valori e perci il Metodo tanto pi e cace
quanto pi piccolo linsieme S [ ((A int A) \ C).
Come s visto nel Capitolo 17, quando la soluzione del Problema del consumatore
unica, la indichiamo con x^ (p; I) per evidenziarne la dipendenza da prezzi e reddito
ed essa determina la funzione di domanda D : Rn++ R+ ! Rn denita come

D (p; I) = x^ (p; I) ; 8 (p; I) 2 Rn++ R+

Esempio 508 Consideriamo la funzione di utilit Cobb-Douglas. Come nellEsempio


488, anche qui per semplicit consideriamo il caso n = 2, ossia u (x1 ; x2 ) = x1 x12 con
2 [0; 1]. Grazie al Lemma 295, la funzione u coerciva (purch p 0). Essendo
anche continua, la prima fase del Metodo di eliminazione completata.
Si ricordi dallEsempio 488 che (A int A) \ C = ; e

I (1 )I
S= ;
p1 p2

Grazie al Metodo di eliminazione il paniere

I (1 )I
x= ;
p1 p2
27.3. APPLICAZIONI 835

lunica soluzione del Problema del consumatore. La funzione di domanda D : R2++


R+ ! R2
I (1 )I
D (p; I) = ; (27.18)
p1 p2
Intuitivamente, i valori di e 1 indicano limportanza relativa dei due beni per
lutilit del consumatore: tanto pi alto , tanto maggiore limportanza del bene x1
rispetto al bene x2 , e viceversa. La funziona di domanda (27.18) mostra che la quantit
domandata dei beni dipende dal reddito, dai loro prezzi e dalla loro importanza e
1 nella funzione di utilit.
Inne, sostituendo lunica soluzione nella funzione di utilit si ottiene la funzione
di utilit indiretta
I (1 )I
v (p; I) = max u (x) = u (^
x (p; I)) = log + (1 ) log
x2B(p;I) p1 p2
= (log + log I log p1 ) + (1 ) (log (1 ) + log I log p2 )
= log I + log + (1 ) log (1 ) ( log p1 + (1 ) log p2 )
per (p; I) 2 Rn+1
++ . N

Il confronto tra gli Esempi 488 e 508 evidenzia la potenza del Metodo di elim-
inazione: luso dei moltiplicatori di Lagrange ci aveva consentito di individuare un
unico candidato in Rn++ a rappresentare la soluzione del Problema del consumatore,
senza per poter concludere alcunch di denitivo circa la sua natura (se massimo,
minimo o altro) n tantomeno sulla sua unicit, che una propriet importantissima
delle soluzioni. Tutto ci stato svelato dal Metodo di eliminazione, che ha mostrato
come il candidato eettivamente lunica soluzione del Problema del consumatore.

27.3.2 Problema del produttore


Consideriamo il Problema del produttore (17.8), cio
max (y) sub y 2 R+ (27.19)
y

Nel Teorema 296 della Sezione 17.6 avevamo visto condizioni nelle quali il problema
ha soluzione. Inquadriamo ora tale risultato nel Metodo di eliminazione della Sezione
27.2.1.
Assumiamo che:

(E.1) le funzioni di ricavo e di costo siano continue su R+ e derivabili su (0; +1), con
c (0) > r (0).
(E.2) c (y) ! +1 e
r (y)
<1 (27.20)
c (y)
per ogni y su cientemente grande.
836 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

La funzione di protto derivabile su (0; +1). Quindi G = (0; +1) e F = f0g.

Vediamo ora le fasi del Metodo.

Fase 1: La funzione di protto derivabile su (0; +1) e quindi G = (0; +1) e


F = f0g.

Fase 2: La (27.20) implica (y) ! 1 (come si era visto nella dimostrazione del
Teorema 296). La funzione continua quindi coerciva su R+ .

Fase 3: Si ha
0
S = fx 2 (0; +1) : (y) = 0g = fx 2 (0; +1) : r0 (y) = c0 (y)g

Poich (0) < 0 e (y) ! 1, per il Teorema di Darboux, esiste y > 0 tale che
(y) = (0). Per il Teorema di Rolle, S =
6 ;.

Fase 4: Si ha
f (y) : y 2 S [ F g = f (y) : y 2 S [ f0gg
Le soluzioni del Problema sono le yb 2 S [ F tali che

(b
y) (y) 8y 2 S [ f0g

In conclusione, con le condizioni (E.1)-(E.2) il Problema del produttore risolvibile


col Metodo di eliminazione.

Esempio 509 Consideriamo un produttore in un mercato di concorrenza perfetta,


sicch r (y) = p y. Supponiamo, inoltre, che la funzione di costo sia continua su R+ ,
derivabile su (0; +1), con c (0) > 0, e asintoticamente quadratica, cio

c (y) y2 per y ! +1

Per esempio, c (y) = + y 2 , con > 0, soddisfa queste condizioni, come anche
p
c (y) = + y 2 y.
Grazie a queste ipotesi, lassunzione (E.1) ovviamente soddisfatta. Verichiamo
la (E.2):
r (y) py p
2
= !0
c (y) y y
Quindi, entrambe le condizioni (E.1) e (E.2) sono soddisfatte. Il Problema del pro-
duttore dunque risolvibile col Metodo di eliminazione. In particolare, si ha
npo
S=
2
Poich
(p=2) = p2 =2 > (0) = 0,
possiamo concludere che yb = p=2 lunica soluzione. N
27.4. PROGRAMMAZIONE DIFFERENZIALE CONCAVA 837

27.4 Programmazione dierenziale concava


Le funzioni concave hanno notevolissime propriet di ottimalit, gi evidenziate nel
Capitolo 17. Per questa ragione i problemi dierenziali di ottimo con funzioni obiettivo
concave formano un capitolo fondamentale della Programmazione. In particolare, un
problema di ottimo dierenziale

max f (x) sub x 2 C (27.21)


x

si dice concavo se linsieme C A convesso e se la funzione f : A Rn ! R


concava su C. Per brevit, ci concentreremo sul caso di insiemi di scelta con interno
non vuoto.

Il prossimo, magico, risultato che la ragione per cui la concavit cos importante
nella Programmazione. una conseguenza della disuglianza

f (y) f (x) + rf (x) (y x) ; 8y 2 U . (27.22)

stabilita nel Teorema 359.

Teorema 411 Un punto interno x^ di C soluzione del problema di ottimo dieren-


ziale concavo (27.21) se e solo se rf (^
x) = 0. Inoltre, tale soluzione unica se f
strettamente quasi concava.

Dim. Sia x^ 2 int C tale che rf (^x) = 0. Sia U un intorno qualsiasi incluso in int C.
Poich f concava su U , grazie alla (27.22) si pu scrivere

f (y) x) + rf (^
f (^ x) (y x^) ; 8y 2 U .

Da rf (^x) = 0 segue che f (y) f (^ x) per ogni y 2 U , ossia x^ un massimo locale.


Grazie al Teorema 292, x^ quindi soluzione del problema (27.21). Il converso segue
dal Teorema di Fermat, mentre lunicit segue dal Teorema 293.

La condizione del primo ordine rf (^ x) = 0 quindi necessaria e su ciente a nch


un punto interno x^ di C sia soluzione. Questa notevolissima propriet dei punti
stazionari delle funzioni concave ne semplica grandemente lo studio4 . In partico-
lare, per i problemi di ottimo concavi abbiamo il Metodo (di eliminazione) concavo,
che si articola nelle seguenti tre fasi:

1. Si determinano gli insiemi G e F . Se G 6= ;, si passa alla fase successiva.

2. Si trova linsieme S dei punti stazionari di f su C, ossia S = fx 2 G : rf (x) = 0g.


Se S 6= ;, si passa alla fase successiva.
4
Naturalmente, considerazioni speculari valgono per funzioni convesse, per le quali lo studio dei
punti di minimo a risultare parimenti facilitato.
838 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

3. Si costruisce linsieme ff (x) : x 2 F g:

(a) ogni punto x^ 2 S soluzione del problema di ottimo;


(b) se x^ 2 F tale che f (^
x) = f (y) per qualche y 2 S, allora x^ soluzione del
problema di ottimo.

Vediamo ora la ratio del Metodo concavo. Per il Teorema 411, tutti i punti
stazionari in S sono soluzioni, il che giustica la costruzione di S nella fase 2 nonch
quanto aermato nella parte (a) della fase 3.
Daltra parte, il Teorema 411 implica che, se un punto di G soluzione del problema
di ottimo, esso stazionario. Quindi, solo tra i punti di frontiera vi possono essere altre
soluzioni del problema. Ecco perch la parte (b) della fase 3 si concentra sullinsieme
di non derivabilit F per cercare tali altre eventuali soluzioni. Per vericare se un
punto x^ 2 F soluzione basta confrontarne il valore con un y 2 S qualsiasi, che gi
sappiamo essere soluzione. Ci quanto prescrive la parte (b) della fase 3.
Naturalmente, se f strettamente concava e S 6= ;, lunica soluzione appartiene a S
ed quindi superuo considerare linsieme di non derivabilit F , con ci semplicando
non poco il Metodo concavo. Al riguardo, si osservi che nelle applicazioni economiche
la funzione obiettivo f spesso strettamente concava perch, come gi osservato,
lunicit della soluzione molto importante.

Il Metodo concavo si giova delle propriet di ottimalit delle funzioni concave, che
gi stabiliscono un legame tra propriet locali e globali. Si pensi al Teorema 292 che
assicura che, per le funzioni concave, i massimi locali sono sempre globali . Il Metodo
concavo si basa questi aspetti glocali propri della concavit per usare il Calcolo
dierenziale nella ricerca delle soluzioni di problemi di ottimo dierenziali concavi.
Gli aspetti glocali della concavit rendono superuo luso dei risultati globali di
esistenza delle funzioni coercive, sui quali si era basato il Metodo di eliminazione.

Esempio 510 Sia f : R ! R la funzione strettamente concava denita come f (x) =


1 x2 e sia C = R. Applichiamo il Metodo concavo:

Fase 1: Quindi, G = C e F = ;.

Fase 2: Si ha S = f0g poich f 0 (x) = 2x = 0 se e solo se x = 0:

Fase 3: il punto stazionario x^ = 0 soluzione del problema di ottimo dierenziale


concavo
min 1 x2 sub x 2 R: (27.23)
x
Poich f strettamente concava, essa lunica soluzione e ci completa la fase 3.

Sia, invece, C = [1; 2]. In questo caso S = ; e quindi il Metodo concavo non
applicabile. Tuttavia, si vede subito che x^ = 1 lunica soluzione del problema
( 27.23). Il Metodo non sostituisce quindi il buon senso. N
27.5. ESEMPI 839

Esempio 511 Torniamo alla funzione f (x) = 1 kxk2 dellEsempio 497, con C = Rn .
La funzione strettamente concava e possiamo quindi risolvere col Metodo concavo il
problema di ottimo
max 1 kxk2 sub x 2 Rn (27.24)
x
prima risolto col Metodo di eliminazione (nonch a occhio).
Fase 1: Si ha G = C e F = ;, come gi visto.
Fase 2: Si ha S = f0g :
Fase 3: Il punto stazionario x^ = 0 soluzione del problema (27.24) ed, essendo f
strettamente concava, essa lunica soluzione. Ci completa la fase 3.
Quando applicabile, il Metodo concavo quindi pi potente di quello di elimi-
nazione. N

27.5 Esempi
27.5.1 Problema del produttore
Se assumiamo che r sia concava e c convessa, il Problema del produttore
max (y) sub y 2 R+
y

diventa di Programmazione dierenziale concava. In particolare, assumiamo che:


(C.1) Le funzioni di ricavo e costo siano continue su R+ e due volte derivabili su
(0; +1).
(C.2) Esistono y1 ; y2 0 tali che r0 (y1 ) c0 (y1 ) e r0 (y2 ) < c0 (y2 ).
(C.3) La funzione di ricavo concava e la funzione di costo convessa.
Si noti che la condizione (C.2) richiede solo che esistano punti in cui il protto
marginale abbia segno diverso. Applichiamo il Metodo convesso.
Fase 1. Si ha G = (0; +1) e F = f0g.
Fase 2: Si ha
0
S = fx 2 (0; +1) : (y) = 0g = fx 2 (0; +1) : r0 (y) = c0 (y)g
Poich 0 (y) < 0 0
(0) e 0 continua (poich due volte derivabile), per il
Teorema di Darboux si ha S 6= ;.
Fase 3: ogni yb 2 S soluzione del Problema del produttore. Se (0) = y ) per
(b
qualche yb 2 S, allora anche yb = 0 soluzione.
Quindi, nelle condizioni (C.1)-(C.3) il Problema del produttore risolvibile col
Metodo convesso.
840 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

Esempio 512 Consideriamo un produttore in un mercato di concorrenza perfetta e


con costi quadratici, sicch r (y) = p y e c (y) = + y 2 , con 0. facile vedere
che le condizioni (C.1)-(C.3) sono soddisfatte. Grazie al Metodo convesso possiamo
concludere che yb = p=2 lunica soluzione. Se > 0, il problema risolvibile sia col
Metodo di eliminazione che col Metodo convesso: quando ci possibile, la scelta di
quale procedura usare di pura comodit analitica. N

Come abbiamo appena visto, il Problema del produttore dellesempio risolvibile


con entrambi i Metodi. In generale, ci non possibile perch si basano su ipotesi
diverse. Quali assumere di esse dipende dalla loro plausibilit economica. Da questo
punto di vista, le condizioni (C.1)-(C.3) sono di pi facile lettura rispetto alle (E.1) e
(E.2), e in particolare rispetto a questultima condizione asintotica.

27.5.2 Minimi quadrati


Il Teorema 297 della Sezione 17.8 aveva mostrato come il Problema di ottimo
2
min A x b sub x 2 Rn (27.25)
x m nn 1 m 1

che caratterizza il Metodo dei minimi quadrati abbia ununica soluzione x purch
(A) = n. Per illustrare la portata del Metodo di eliminazione, mostriamo come il
risultato sia ottenibile anche con tale Metodo, che in aggiunta permette di determinare
la forma della soluzione x .
A tal ne studiamo lequivalente Problema di ottimo (17.19), cio

max g (x) sub x 2 Rn


x

dove g : Rn ! R denita da g (x) = kAx bk2 , con (A) = n.


Si tratta di un problema concavo poich g strettamente concava e derivabile su
Rn . Procediamo col Metodo concavo, considerando le sue tre fasi.

Fase 1: Si ha G = R e F = ;.

Fase 2: La condizione del primo ordine 5

rg (x) = 2A? (Ax b) = 0 (27.26)


5
Il calcolo di rg semplice ma richiede una versione della Regola della catenaPpi generale di
m 2
quella presentata nel Capitolo 19. Tuttavia, nel caso speciale n = 1 si ha g (x) = i=1 (bi ai xi )
e si ottiene facilmente la seguente versione
m
X
rg (x) = 2 (bi ai xi ) = 2 (b a x) = 0
i=1

della (27.26).
27.5. ESEMPI 841

Dalla condizione del primo ordine segue che lunico punto stazionario
1
x = A? A A? b

cio Pn
ai b i
x = Pi=1
n 2
i=1 ai

quando n = 1. Quindi, S = fx g.

Fase 3: Linsieme F vuoto (g derivabile su Rn ). Ne segue che x lunica soluzione


del problema.

Il Metodo concavo ha rapidamente risolto il problema (senza bisogno, per esempio,


di usare la coercivit) trovando anche la forma dellunica soluzione. Ci conferma la
potenza del Metodo.

Esempio 513 Nel caso n = 1 la funzione di produzione lineare cercata dal contadino
della Sezione 17.8.2 Pn
^ xi yi
f (x) = x = Pi=1 n 2
x (27.27)
i=1 xi
con termine di errore Pn
xi yi
yi Pi=1
n 2
xi 8i = 1; :::; n
i=1 xi
In generale tale funzione f : Rn ! R
1
f (x) = X ? X X ?Y x

27.5.3 Assicurazione
Torniamo al Problema di assicurazione (17.15)

max EP u (f ) sub 0

della Sezione 17.7, che possiamo riscrivere come

max u (w1 ) (1 p) + u (w1 + ) p sub 0 (27.28)

Supponiamo la funzione di utilit Bernoulliana u : [0; +1) ! R dellassicurato (il


contadino della Sezione 27.5.3) sia due volte dierenziabile su (0; +1), con u0 > 0 e
u00 < 0.
La funzione quindi strettamente concava, il che rende il Problema (27.28) dif-
ferenziale concavo. Procediamo col Metodo concavo, considerando le sue tre fasi.
842 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA

Fase 1: Si ha G = (0; +1) e F = f0g.

Fase 2: La condizione del primo ordine

u0 (w1 ) (1 p) ( ) + u0 (w1 + ) p (1 )=0

che si pu riscrivere come

(1 p)
u0 (w1 + )= u0 (w1 )
p (1 )

Poich
(1 p)
R 1 () Rp (27.29)
p (1 )
occorre distinguere tre sottocasi:

1. = p: il premio equo. In tal caso, grazie alla (27.29) la condizione del primo
ordine diventa
u0 (w1 + ) = u0 (w1 ) (27.30)
Essendo u00 < 0, la deriva prima u0 strettamente decrescente, e quindi

u0 (w1 + ) = u0 (w1 ) () w1 + = w1 () =

Posto = , si ha quindi S = f g. Nellunico punto stazionario lassicurato


sceglie una copertura completa, con risarcimento pari al danno.

2. > p: il premio iniquo. Supponiamo che la funzione u sia tale che esista
un unico punto stazionario che risolva tale condizione6 , ossia S = f g. La
(27.29) implica
(1 p)
>1
p (1 )
cosicch dalla condizione del primo ordine segue che

u0 (w2 + ) > u0 (w1 ) () w1 + < w1 () <

poich u0 strettamente decrescente. Ne segue che lunico punto stazionario


prevede una copertura parziale, con risarcimento inferiore al danno.

3. < p: il premio superequo. Procedendo come nel caso precedente, si mostra che
lunico punto stazionario prevede una sovracopertura, con risarcimento superiore
al danno.
6
Nel caso equo questa richiesta superua perch = lunico punto stazionario per ogni u.
27.5. ESEMPI 843

Fase 3: lultima fase richiede il confronto tra le utilit attese EP u (f ) e EP u (f0 ),


cio tra lutilit attesa garantita dallacquisto della quantit della polizza unitaria
e lutilit attesa che si ha senza stipulare alcuna polizza di assicurazione.
Per semplicit, consideriamo solo il caso equo. Si ha

EP u (f ) = u (w1 ) (1 p) + u (w1 ) p = u (w1 )

e
EP u (f0 ) = u (w1 ) (1 p) + u (w1 )p
Poich u strettamente concava, si ha

EP u (f0 ) = u (w1 ) (1 p) + u (w1 ) p < u (w1 (1 p) + (w1 ) p)


= u (w1 p) = EP u (f )

sicch = lunica soluzione del Problema dellassicuratore.

Tirando le la, lassicurato sceglier una copertura piena quando il premio equo,
eliminando in tal modo il rischio perch latto f pari a w1 in ogni stato del
mondo. Per il nostro contadino, che grandini o meno il suo raccolto gli garantir il
reddito certo w1 .
Quando, invece, il premio iniquo (ossia il premio per ogni euro di copertura
maggiore della probabilit del sinistro) e la polizza ha quindi un prezzo pi alto, leven-
tuale soluzione comporta una copertura solo parziale: in caso di sinistro lassicurato
incorrer in un danno. Il rischio permane, sebbene attenuato dalla parziale copertura
assicurativa. Il contrario vale quando il premio superequo.
844 CAPITOLO 27. PROGRAMMAZIONE MATEMATICA
Capitolo 28

Applicazione: investimento

28.1 Scelta intertemporale aleatoria


Consideriamo un consumatore, Lorenzo, che debba decidere il consumo, sia di oggi sia
di domani, di un bene c 2 R+ . Oggi il reddito di Lorenzo I0 , ma del doman non v
certezzae quindi il suo reddito di domani una variabile aleatoria I1 : ! R, dove
= f! 1 ; :::; ! m g un insieme nito di stati del mondo che descrivono i vari possibili
domaniche potranno realizzarsi. Per tale ragione, il consumo di domani anchesso
una variabile aleatoria c1 : ! R, che descrive la quantit consumata del bene nei
vari stati del mondo. La variabile aleatoria c1 detta bene contingente (allo stato del
mondo) e modella il consumo del bene nei vari stati.
Ricordando ci che si visto nel Capitolo 8, possiamo identicare il bene contin-
gente c1 con il vettore
c1 = (c11 ; c12 ; :::; c1n ) 2 Rm
+

dove c1i = c (i) per ogni stato ! i . Grazie a tale identicazione, la decisione di Lorenzo
tra coppie
(c0 ; c1 ) 2 R+ Rm
+

di consumo oggi e domani. Supponiamo che egli ordini le coppie secondo la funzione
obiettivo V : R+ Rm + ! R data da

V (c0 ; c1 ) = u (c0 ) + EP u (c1 ) (28.1)

dove
P = (P1 ; P2 ; :::; Pm ) 2 Rm
+

il vettore che rappresenta la probabilit degli stati, 2 [0; 1] il fattore di sconto


soggettivo della Sezione 9.3 e

X
m
EP u (c1 ) = u (c1i ) Pi
i=1

845
846 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO

lutilit attesa del bene contingente c1 secondo la funzione di utilit istantanea


Bernoulliana u : R+ ! R che per comodit assumiamo denita su tutta la semiretta
positiva.

La funzione obiettivo (28.1) separabile rispetto al tempo: il primo addendo u (c0 )


valuta il consumo odierno, mentre il secondo EP u (c1 ) valuta quello futuro scontato
con fattore . Entrambi gli addendi condividono la stessa utilit istantanea u che
valuta il consumo in ogni periodo e stato. Ricordando quanto visto nella Sezione
19.5.2, il rapporto
u0 (c1i )
(28.2)
u0 (c0 )
il saggio marginale di sostituzione intertemporale nelli-esimo stato: esso misura la
variazione (negativa) da apportare a c0 per bilanciare (marginalmente) un aumento di
c1i , trascurando gli altri possibili stati.
Se consideriamo c1 : ! R nella sua veste di variabile aleatoria, anche il rapporto

u0 (c1 )
u0 (c0 )

una la variabile aleatoria, detta saggio marginale di sostituzione intertemporale. Nei


vari stati essa assume il valore (28.2). Per esempio, per lutilit potenza u (c) = c =
si scrive
1
c1
c0

28.2 Carpe diem


Dopo aver determinato la funzione obiettivo, consideriamo il vincolo di bilancio di
Lorenzo. Supponiamo che il bene sia deperibile e quindi debba essere consumato
subito, senza poter essere conservato da oggi a domani. Siano p0 > 0 il prezzo odierno
del bene e
p1 = (p11 ; p12 ; :::; p1m ) 0
il prezzo (aleatorio) del bene contingente c1 , dove p1i indica il prezzo di c1i . Il vettore

p = (p0 ; p1 ) 2 R++ Rm
++

il sistema dei prezzi per la coppia (c0 ; c1 ). Posto1 I = (I0 ; I1 ) 2 R+ Rm


+ , linsieme

B (p; I) = (c0 ; c1 ) 2 R+ Rm
+ : p0 c0 I0 e p1i c1i I1i per ogni i

consta di tutte le coppie (c0 ; c1 ) che Lorenzo pu acquistare dati i prezzi del bene e i
suoi redditi presenti e futuri.
1
Grazie allormai solita identicazione tra variabili aleatorie e vettori.
28.2. CARPE DIEM 847

Avendo determinato obiettivo e vincoli, possiamo concludere che il problema di


ottimo di Lorenzo di rendere massima la propria funzione obiettivo V : R+ Rm
+ ! R
sullinsieme di bilancio B (p; I), ossia nel risolvere il problema
max V (c) sub c = (c0 ; c1 ) 2 B (p; I) (28.3)
c

Una coppia c^ = (^
c0 ; c^1 ) 2 B (p; I) ne soluzione quando
V (^
c) V (c) 8c = (c0 ; c1 ) 2 B (p; I)
Proposizione 412 (Carpe diem) Sia u : R+ ! R strettamente crescente e contin-
ua. Il Problema (28.3) ha ununica soluzione c^ = (^
c0 ; c^1 ) data da
I0 I1i
c^0 = e c^1i = 8i = 1; :::; m
p0 p1i
In altre parole, sia oggi sia domani Lorenzo esaurisce tutto il suo reddito in con-
sumo: carpe diem! La struttura del problema fa s che per Lorenzo sia ottimo consid-
erare in modo del tutto separato loggi e il domani, e spendere in ognuno di essi tutto
il suo reddito. In un certo senso, la proposizione ricorda la Legge di Walras.

Dim. Linsieme di bilancio B (p; I) compatto (il lettore pu vericarlo procedendo


come nella dimostrazione della Proposizione 280). Grazie al Teorema di Weierstrass,
esiste una soluzione c^ = (^ c0 ; c^1 ).
Mostriamo che p0 c^0 = I. Suppponiamo, per contra, che p0 c^0 < I. facile vedere
che esiste c00 c^0 tale che p0 c00 I0 . Per la stretta crescenza, si ha u (c00 ) > u (^c0 ) e
quindi
V (c00 ; c^1 ) = u (c00 ) + EP u (^
c1 ) > u (^
c0 ) + EP u (^
c1 ) = V (^
c0 ; c^1 )
Ne segue che (^ c0 ; c^1 ) non pu essere soluzione del Problema di Lorenzo. Ci dimostra
che p0 c^0 = I.
Mostriamo ora che p1i c1i = Ii per ogni i. Supponiamo, per contra, che p1{ c^1{ < I{
per qualche {. facile vedere che esiste c01{ c^1{ tale che p0 c01{ I1{ . Sia c1 il bene
0
contingente con c1{ in luogo di c^1{ , cio
c^1i se i 6= {
c1i =
c0i se i = {
Per la stretta crescenza di u, si ha u (c01i ) > u (^
c1i ) e quindi
X
V (^
c0 ; c1 ) = u (^
c0 ) + EP u (c1 ) = u (^
c0 ) + u (c1i ) Pi + u (c0{ ) P{
i6={
X X
= u (^
c0 ) + c1i ) Pi + u (c0{ ) P{ = u (^
u (^ c0 ) + c1i ) Pi + u (c0{ ) P{
u (^
i6={ i6={
X
> u (^
c0 ) + u (^
c1i ) Pi + u (^
c{ ) P{ = u (^
c0 ) + EP u (^
c1 ) = V (^
c0 ; c^1 )
i6={

il che contraddice lottimalit di (^


c0 ; c^1 ). Ci completa la dimostrazione.
848 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO

28.3 Il Problema dellinvestitore


Il Lorenzo poeta (e tantaltro) era per, in primis, un banchiere. Diamogli modo di
poter mostrare tutti i suoi talenti.
A tal ne, si osservi che nel Problema di Lorenzo non vi la possibilit di risparmi-
are: (i) la deperibilit del bene non d facolt a Lorenzo, qualora lo desideri, di ac-
quistare oggi quantit di bene da destinare al consumo di domani; (ii) lassenza di
mercati nanziari rende impossibile trasportare reddito dalloggi al domani, cosic-
ch egli possa, qualora lo desideri, acquistare minori quantit del bene oggi e maggiori
domani. In altre parole non vi modo per Lorenzo di scambiare consumo di oggi con
consumo di domani.
Conserviamo lipotesi di deperibilit e arricchiamo, invece, la struttura del Proble-
ma di Lorenzo supponendo che possa accedere a un mercato nanziario perfetto (nel
senso della Sezione 3.7) dove al prezzo py pu comprare o vendere un titolo nanziario

y = (y1 ; :::; ym ) 2 Rm

che domani pagher limporto yi se si vericher lo stato ! i . Il consumatore ora


(anche) un investitore.

Lesistenza dei titolo consente allinvestitore di trasferire reddito dalloggi al do-


mani. Infatti, egli pu trasformare il risparmio di oggi

I0 p0 c0 0 (28.4)

in reddito di domani
I0 p0 c0
yi 8i = 1; :::; m (28.5)
py
se si vericher li-esimo stato. Infatti
I0 p0 c0
(28.6)
py
la quantit di titolo y che linvestitore pu acquistare al prezzo py avendo risparmiato
I0 p0 c0 . Tale quantit pagher la somma (28.5) se si vericher lo stato ! i .
Per linvestitore il risparmio equivale a minor consumo oggi per nanziare, col
pagamento del titolo, maggior consumo domani. Anche loperazione opposta per
legittima: egli pu decidere di consumare oggi pi di quanto lattuale reddito gli
consentirebbe, sicch
I0 p0 c0 < 0
nanziando tale maggior consumo con la vendita di quantit (28.6) del titolo y, il che
lobbligher domani a pagare la somma (28.5) se si vericher lo stato ! i . Le cambiali
sono un esempio di tale titolo nanziario.

In conclusione, a seconda del segno di (28.4), linvestitore acquista o vende il titolo


y (nel linguaggio nanziario, corto o lungo sul titolo). Se b indica la quantit
28.4. RISOLUZIONE DEL PROBLEMA 849

del titolo y che egli detiene dopo aver operato sul mercato (in acquisto o in vendita),
linsieme di bilancio diventa

B (p; py ; I) = (c0 ; c1 ) 2 R+ Rm
+ : p0 c0 + py b = I0 e p1i c1i I1i + byi per ogni i

Linsieme B (p; py ; I) composto da tutte le coppie (c0 ; c1 ) di consumo che, dati i prezzi
p e i redditi I, linvestitore pu nanziare grazie allesistenza di un mercato perfetto
del titolo y di prezzo py .

Il Problema (di ottimo) dellinvestitore consiste nel rendere massima la funzione


obiettivo V : R+ Rm + ! R sullinsieme di bilancio B (p; py ; I), ossia nel risolvere

max V (c) sub c = (c0 ; c1 ) 2 B (p; py ; I) (28.7)


c

Una coppia c^ = (^
c0 ; c^1 ) 2 B (p; py ; I) soluzione del problema di ottimo se

V (^
c) V (c) 8c = (c0 ; c1 ) 2 B (p; py ; I)

Il Problema dellinvestitore quindi unestensione del Problema del consumatore


che tiene conto della possibilit di accedere a mercati nanziari. Per tale ragione esso
alla base della Teoria della nanza.

28.4 Risoluzione del problema


Il prossimo semplice risultato permette di semplicare il Problema dellinvestitore.

Proposizione 413 Sia u : R+ ! R strettamente crescente. Se c^ = (^


c0 ; c^1 ) soluzione
del Problema dellinvestitore (28.7), allora

p1i c^1i = I1i + ^byi 8i = 1; :::; m

dove ^b = I0 p0 c^0 .

Il risultato (che lasciamo dimostrare al lettore) permette di sostituire nel Problema


dellinvestitore linsieme di bilancio col suo sottoinsieme

(p; py ; I) = (c0 ; c1 ) 2 R+ Rm
+ : p0 c0 + py b = I0 e p1i c1i = I1i + byi per ogni i

purch u sia strettamente crescente. In tal caso il Problema dellinvestitore si pu


riscrivere come
max V (c) sub c = (c0 ; c1 ) 2 (p; py ; I) (28.8)
c

Il problema (28.8) ammette unequivalente formulazione scalare. A tal ne, si


osservi che dalle uguaglianze
I0 py b I1i + byi
c0 = e c1i = 8i = 1; :::; m (28.9)
p0 p1i
850 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO

segue che
I0 I1i
c0 0 () b e ci1 0 () b :
py py
Ponendo
I0 I11 I1m
a= e a = max ; :::;
p0 py py
si ha a 0 a e possiamo quindi denire la funzione scalare f : [a; a] ! R come

I0 py b X
m
I1i + byi
f (b) = u + u Pi 8b 2 [a; a]
p0 i=1
p1i

La restrizione b 2 [a; a] garantisce che il consumo di oggi e di domani sia 0


(implicitamente si assume che il livello di sussistenza di consumo sia zero).

Il problema di ottimo
max f (b) sub b 2 [a; a] (28.10)
b

equivalente al problema (28.8):

Lemma 414 Lo scalare ^b 2 [a; a] soluzione del problema (28.10) se e solo se la


coppia c^ = (^
c0 ; c^1 ) data da

I0 py^b I1i + ^byi


c^0 = e c^1i = 8i = 1; :::; m
p0 p1i
soluzione del problema (28.8).

Dim. Si ha

f ^b f (b)
! !
I0 py^b X
m
I1i + ^byi
() u + u Pi
p0 i=1
p1i
I0 py b Xm
I1i + byi
u + u Pi
p0 i=1
p1i
X
m X
m
() u (^
c0 ) + u (^
c1i ) Pi u (c0 ) + u (c1i ) Pi
i=1 i=1

come desiderato.

Grazie al lemma, possiamo studiare il problema di ottimo (28.10) che ha una fun-
zione obiettivo scalare. Tale funzione eredita le propriet di dierenziabilit e concavit
della funzione di utilit u. In particolare, facile vericare che f dierenziabile su
(a; a) se u dierenziabile su (0; +1). Inoltre:
28.4. RISOLUZIONE DEL PROBLEMA 851

Lemma 415 La funzione f : [a; a] ! R strettamente concava se la funzione di


utilit u : R+ ! R strettamente concava.

Dim. Sia 2 (0; 1) e b; b0 2 [a; a]. Si ha:

I0 py ( b + (1 ) b0 ) X
m
I1i + ( b + (1 ) b0 ) y i
f ( b + (1 ) b0 ) = u + u Pi
p0 i=1
p1i
I0 py b (1 ) py b 0 X
m
I1i + byi + (1 ) b0 y i
= u + u Pi
p0 i=1
p1i
I0 + (1 ) I0 py b (1 ) p y b0
= u
p0
X
m
I1i + (1 ) I1i + byi + (1 ) b0 y i
+ u Pi
i=1
p1i
I0 py b I0 p y b0
= u + (1 )
p0 p0
X
m
I1i + byi I1i + b0 yi
+ u + (1 ) Pi
i=1
p1i p1i
I0 py b I0 p y b0
> u + (1 )u
p0 p0
!
X
m
I1i + byi X
m
I1i + b0 yi
+ u + (1 ) u Pi
i=1
p1i i=1
p1i
= f (b) + (1 ) f (b0 )

come desiderato.

Il problema di ottimo (28.10) quindi dierenziale concavo quando u strettamente


concava su R+ e dierenziabile su (0; +1). Supponiamo che tale sia il caso (come
accade di norma nelle applicazioni) e arontiamo il problema col Metodo concavo.
Consideriamo le sue due fasi:

Fase 1: Si ha G = (a; a) e F = fa; ag.

Fase 2: La condizione del primo ordine

I0 py b py Xm
I1i + byi yi
f 0 (b) = u0 + u0 Pi = 0
p0 p0 i=1
p1i p1i

cio
I0 py b py X
m
I1i + byi yi
0
u = u0 Pi (28.11)
p0 p0 i=1
p1i p1i
852 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO
n o
Se esiste ^b 2 (a; a) per il quale vale la (28.11) si ha S = ^b . Diversamente, S = ; e
il Metodo si arresta.
n o
Fase 3: Sia S non vuoto, cioe S = ^b . Il punto ^b soluzione del problema. I punti
a e a sono anchessi soluzioni se, rispettivamente, f (a) = f ^b e f (a) = f ^b .

quindi decisivo vericare se esiste ^b 2 (a; a) che soddisfa la condizione del primo
ordine (28.11).

Esempio 514 Sia u : R+ ! R lutilit quadratica

c2
u (c) =
2
e si ponga p0 = p1i per ogni i. La condizione (28.11) diventa

X
m
(I0 py b) py = (I1i + byi ) yi Pi
i=1

cio
EP (y 2 ) + p2y
b=
I0 py EP (I1 y)
Ne segue che b 2 (a; a) se e solo se

EP (y 2 ) + p2y
a< <a
I0 py EP (I1 y)

il che si verica o meno a seconda dei valori di , y, py , I0 e I1 . N

28.5 Prezzi dei titoli


Lunica possibile soluzione ^b soddisfa quindi la condizione (28.11). Grazie alla (28.9),
si pu riscrivere la condizione in termini di consumo ottimo come
m u0 (^ c1i ) u0 (^
c1 )
!
X p1i p1
py = y P = EP u0 (^c0 ) y
c0 ) i i
u0 (^
i=1 p0 p0

Quando il prezzo del bene lo stesso oggi e domani, ossia p0 = p1i per ogni i,
luguaglianza diventa
X
m
u0 (^
c1i ) u0 (^
c1 )
py = y i Pi = EP y
i=1
u0 (^
c0 ) 0
u (^c0 )
28.5. PREZZI DEI TITOLI 853

Leventuale unica soluzione c^ = (^


c0 ; c^1 ) del Problema dellinvestitore quindi fa s che
il prezzo py del titolo sia uguale al valor medio dei saggi marginale di sostituzione
intertemporale
u0 (^
c1i )
0
u (^c0 )
moltiplicati per il pagamento yi oerto dal titolo nello stato i-esimo.

Supponiamo che, invece di un unico titolo, esista un listino L di n titoli che generano
un mercato nanziario M . Per il Teorema di rappresentazione della nanza della
Sezione 14.10, esiste un fattore stocastico di sconto 2 Rm ++ tale che

py = EP ( y) 8y 2 L

Vale il fondamentale:

Teorema 416 Sia p0 = p1i per ogni i. Se il mercato M completo,

u0 (^
c1i )
i = 0
8i = 1; :::; m (28.12)
u (^c0 )

Dim. Mostriamo il risultato quando L consti di m titoli (tanti quanti gli stati del
mondo) linearmente indipendenti. Per ogni y 2 L si ha

X
m
u0 (^
c1i ) X
m X
m
u0 (^
c1i )
y i Pi = i yi Pi () i Pi y i = 0
i=1
u0 (^
c0 ) i=1 i=1
u0 (^
c0 )

La lineare indipendenza di L implica

u0 (^
c1i )
0 i Pi = 0 8i = 1; :::; m
u (^c0 )

cio
u0 (^
c1i )
= i 8i = 1; :::; m
u0 (^
c0 )
come desiderato.

La completezza del mercato fa s che il fattore stocastico di sconto eguagli il saggio


marginale di sostituzione intertemporale

u0 (^
c1 )
=
u0 (^
c0 )

nel consumo ottimo c^. Ci vale per ogni investitore che abbia la funzione obiettivo
V (c0 ; c1 ) = u (c0 )+ EP u (c1 ), indipendentemente da quale sia la sua specica funzione
di utilit istantanea u. In altre parole:
854 CAPITOLO 28. APPLICAZIONE: INVESTIMENTO

(i) tutti gli investitori con funzioni obiettivo di tale forma hanno lo stesso saggio
marginale di sostituzione intertemporale;

(ii) tale saggio, che soggettivo, uguale al fattore stocastico di sconto del mercato
nanziario.

La connessione tra saggi marginali di sostituzione intertemporale e fattori stocastici


di sconto una notevolissima conseguenza della completezza del mercato, alla base
della valutazione dei prezzi dei titoli nanziari (come il lettore vedr in corsi successivi).

Chiudiamo osservando che vale lipotesi di costanza dei prezzi p0 = p1i quando il
bene deperibile lunico esistente nelleconomia. Consideriamo per esempio unisola
tropicale popolata da agenti che hanno a disposizione un albero che la mattina produce
una data quantit di un frutto, perfettamente omogeneo. Tale frutto deperisce nellarco
della giornata ed lunico bene presente nellisola.
In tale economia con un unico bene si ha p0 = p1i = 1 perch sia oggi sia domani
le quantit del frutto, che perfettamente omogeneo, si scambiano uno a uno. Le
quantit I0 e I1 sono le dotazioni del bene che lagente ha oggi e domani, ossia le
quantit del frutto che il loro albero produce. Il titolo nanziario unattivit reale
che paga in quantit di bene: py la quantit di frutto che occorre pagare oggi per
avere diritto a ricevere domani le quantit y = (y1 ; :::; ym ) di frutto a seconda dello
stato del mondo che si verica.
Le economie mono-bene sono spesso usate per la loro semplicit, che consente
di isolare fenomeni economici di interesse nella loro essenzialit; per esempio, per esse
vale il Teorema 416 senza altra ipotesi che la completezza del mercato.
Parte VII

Appendici

855
Appendice A

Richiami di trigonometria

A.1 Generalit
Si chiama abitualmente circonferenza trigonometrica una circonferenza con il centro
nellorigine degli assi cartesiani e di raggio 1, orientata in senso antiorario e percorsa
a partire dal punto sul semiasse positivo delle ascisse (cio dal punto di coordinate
(1; 0)).

y
1.5

0.5

(1,0)
0
O x
-0.5

-1

-1.5

-2
-2 -1 0 1 2

Circonferenza trigonometrica.

manifesto che ogni punto sulla circonferenza determina un angolo delimitato dal
semiasse positivo delle ascisse e dalla retta congiungente il punto con lorigine degli assi
e, viceversa, che ogni angolo determina un punto sulla circonferenza; equivalentemente
anzich intendere la corrispondenza tra punti e angoli si pu intenderla tra punti e archi
di circonferenza.

857
858 APPENDICE A. RICHIAMI DI TRIGONOMETRIA

y
1.5

P
0.5
'

0
O A x
-0.5

-1

-1.5

-2
-2 -1 0 1 2

0
Il punto P genera langolo e larco :

Gli angoli si misurano solitamente in gradi o in radianti. Un grado la 360a parte


di un angolo giro (corrispondente a un giro completo della circonferenza); un radiante
una (apparentemente stravagante) unit di misura che assegna misura 2 a un angolo
giro: ne cio la 2 -esima parte. Useremo il radiante come unit di misura degli
angoli perch presenta qualche comodit in pi rispetto al grado. Riportiamo qui
sotto alcune equivalenze tra gradi e radianti.

gradi 0 30 45 60 90 180 270 360


3
radianti 0 2
6 4 3 2 2
Angoli che dieriscono per uno o pi giri completi della circonferenza sono identici:
scrivere o + 2k , con k 2 Z, lo stesso. Prenderemo perci sempre 0 <2 .
Fissato un punto P = (P1 ; P2 ) sulla circonferenza trigonometrica, si dice seno
dellangolo (o dellarco) da esso determinato lordinata P2 del punto P ; si dice invece
coseno lascissa P1 del punto P .

Il seno e il coseno dellangolo (o dellarco) si indicano rispettivamente con sin


e cos . evidente che il seno positivo nel I e nel II quadrante e negativo nel III e
nel IV e che il coseno positivo nel I e nel IV quadrante e negativo nel II e nel III.
Per esempio,
3
0 p4 2 2
2
2
sin 0 p2 1 0 1 0
2
cos 1 2 0 1 0 1

Grazie a ci che s detto sopra, per ogni k 2 Z si ha


A.2. CONCERTO DARCHI 859

sin ( + 2k ) = sin e cos ( + 2k ) = cos :

Fissato ancora un punto sulla circonferenza, si chiamano invece tangente dellangolo


(o dellarco) da esso determinato il rapporto tra la sua ordinata e la sua ascissa e
cotangente il rapporto inverso.
Nella gura precedente la tangente dellangolo individuato da P il rapporto
! ! ! !
P B=OB e la cotangente il rapporto OB=P B.
La tangente e la cotangente dellangolo si indicano rispettivamente con tan e
cotan . Non merita di parlare della cotangente visto che semplicemente il reciproco
della tangente1 . evidente che la tangente positiva nel I e nel III quadrante e
negativa nel II e nel IV. Per esempio,
3
0 4 2 2
2
tan 0 1 !1 0 !1 0

Ancora, per ogni k 2 Z,


tan ( + k ) = tan : (A.1)
Risulta banalmente
sin
tan = :
cos
Il Teorema di Pitagora garantisce che sin2 + cos2 = 1 per ogni 2 R:Se ne deduce
che
tan2
sin2 = :
1 + tan2

A.2 Concerto darchi


Diamo qui, limitandoci a seni e coseni, alcune relazioni per angoli (archi) tra loro
collegati.

(i) Angoli e :

sin ( )= sin ; cos ( ) = cos :

(ii) Angoli e 2
:

sin = cos ; cos = sin :


2 2

(iii) Angoli e 2
+ :

sin + = cos ; cos + = sin :


2 2
1
Qualche pedante chiama anche secante e cosecante rispettivamente i reciproci di seno e coseno.
860 APPENDICE A. RICHIAMI DI TRIGONOMETRIA

(iv) Angoli e :
sin ( ) = sin ; cos ( )= cos :

(v) Angoli e + :
sin ( + ) = sin ; cos ( + ) = cos :

Valgono poi numerose formule che non dimostriamo (basterebbe dimostrare le


prime due perch le altre ne sono conseguenze piuttosto semplici).
Formule di addizione e di sottrazione
sin ( + ) = sin cos + sin cos ; cos ( + ) = cos cos sin sin
e
sin ( ) = sin cos sin cos ; cos ( ) = cos cos + sin sin :
(A.2)
Formule di duplicazione e di bisezione
sin 2 = 2 sin cos ; cos 2 = cos2 sin2
e r r
1 cos 2 1 + cos 2
sin = ; cos = :
2 2
Formule di prostaferesi
sin ( + )+sin ( ) = 2 sin cos ; sin ( + ) sin ( ) = 2 cos cos ;
e
cos ( + )+cos ( ) = 2 cos cos ; cos ( + ) cos ( )= 2 sin sin :

La Trigonometria intimamente legata allo studio dei triangoli. Ci limitiamo a


ricordare i due teoremi pi noti. In essi a; b; c indicano le lunghezze dei tre lati e ; ;
gli angoli ad essi opposti.
Teorema 417 (dei seni) I lati sono proporzionali ai seni dei loro angoli opposti:
a b c
= = :
sin sin sin
Teorema 418 (Carnot) Il quadrato di un lato uguale alla somma dei quadrati degli
altri due diminuita del doppio del loro prodotto moltiplicato per il coseno dellangolo
opposto al primo:
a2 = b2 + c2 2ab cos :
In particolare, se il triangolo rettangolo, prendendo come primo lato lipotenusa,
si ha cos = cos =2 = 0 e perci vale il celeberrimo
Teorema 419 (Pitagora) In un triangolo rettangolo il quadrato dellipotenusa
uguale alla somma dei quadrati dei cateti: a2 = b2 + c2 .
A.3. PERPENDICOLARIT 861

A.3 Perpendicolarit
La circonferenza trigonometrica formata dai punti x 2 R2 di norma unitaria, cio
kxk = 1. Quindi, qualsiasi punto x 2 R2 si riporta su tale circonferenza dividendolo
per la sua norma kxk poich kx= kxkk = 1. Ne segue che
x2 x1
sin = e cos =
kxk kxk
ovvero
x = (kxk cos ; kxk sin )
Tale rappresentazione trigonometrica del vettore x detta polare, e le componenti
kxk cos e kxk sin sono dette coordinate polari.
Siano x e y due vettori del piano R2 che determinano gli angoli e . Grazie alla
(A.2) si ha:

x y = (kxk cos ; kxk sin ) (kyk cos ; kyk sin )


= kxk kyk (cos cos + sin sin ) = kxk kyk cos ( )

cio
x y
= cos ( )
kxk kyk
dove langolo che dierenza degli angoli determinati dai due punti. Tale
angolo retto, cio i vettori x e y sono perpendicolari, quando
x y
= cos = 0
kxk kyk 2

ossia se e solo se x y = 0. In altre parole, due vettori del piano R2 sono perpendicolari
quando il loro prodotto interno nullo.
862 APPENDICE A. RICHIAMI DI TRIGONOMETRIA
Appendice B

Elementi di logica

Ci limiteremo ai tratti veramente essenziali della logica, tanto pi che le sue operazioni
di base sono straordinariamente simili alle operazioni tra insiemi e ne condividono le
propriet.

Chiameremo proposizione ogni aermazione che possa essere o vera o falsa1 . In-
dicheremo una proposizione con lettere quali p; q; : : :.
Sono dunque escluse tutte le aermazioni ancora incerte, come per esempio do-
mani piover. Indicheremo per brevit con 1 e 0 rispettivamente la verit o la falsit
di una proposizione: essi sono detti valori di verit.
Le pi semplici operazioni tra proposizioni sono:

(i) Negazione. Sia p una proposizione; si indica con :p, e si legge non p, la
proposizione che vera quando p falsa e che falsa quando p vera.

(ii) Intersezione. Siano p e q due proposizioni; si dice intersezione di p e q, e si indica


con p ^ q, la proposizione che vera quando p e q sono entrambe vere e falsa
quando almeno una delle due falsa.

(iii) Unione. Siano p e q due proposizioni; si dice unione di p e q, e si indica con p _ q,


la proposizione che vera quando almeno una tra p e q vera e falsa quando
entrambe sono false.

Possiamo sintetizzare le tre denizioni in tabelle che indicano i vari valori di verit2 :
1
Tertium non datur.
La dicotomia vero-falsorisale al mondo greco, ma negata da molte losoe orientali: il monaco
Mumon, nel suo celebre Mumonkhan, nel quale sosteneva che la non conoscenza insensata; la
conoscenza un inganno, aermava che la via (per lilluminazione) non pu essere descritta con
parole e nemmeno con non parole.
2
I valori di verit di p ^ q e di p _ q sono rispettivamente il minimo e il massimo dei valori di verit
di p e di q.

863
864 APPENDICE B. ELEMENTI DI LOGICA

p q p^q p_q
1 1 1 1
p :p 1 0 0 1
1 0 0 1 0 1
0 1 ; 0 0 0 0

Le seguenti propriet sono estremamente evidenti:

1. p ^ p = p e p _ p = p per ogni p (idempotenza);


2. p ^ :p sempre falsa (contraddizione);
3. p _ :p sempre vera (tautologia);
4. : (:p) = p per ogni p (doppia negazione);
5. p ^ q = q ^ p e p _ q = q _ p per ogni p; q (commutativit);
6. (p ^ q) ^ r = p ^ (q ^ r) e (p _ q) _ r = p _ (q _ r) p per ogni p; q; r (associativit).

Valgono le leggi di de Morgan:


: (p ^ q) = :p _ :q ; : (p _ q) = :p ^ :q
che possiamo dimostrare ricorrendo alla tabella dei valori di verit; ci limitiamo alla
prima legge:
p q p ^ q : (p ^ q) :p :q :p _ :q
1 1 1 0 0 0 0
1 0 0 1 0 1 1
0 1 0 1 1 0 1
0 0 0 1 1 1 1

per la quale la tabella mostra che i valori di verit di : (p ^ q) e di :p _ :q sono


identici.
Siano p e q due proposizione. Se accade che, quando p vera, anche q vera, si
dice che p implica q e si scrive p =) q. Si potrebbe dire che il valore di verit di p
del valore di verit di q: se p vera anche q vera (valori entrambi pari a 1); se p
falsa (valore 0), q pu essere vera o falsa (valore o 0 o 1).
Laermazione p =) q a sua volta una proposizione con tabella di verit:

p q p =) q
1 1 1
1 0 0
0 1 1
0 0 1
865

Se accade simultaneamente che p =) q e q =) p si scrive p () q e si dice


che p e q sono equivalenti.
Si vede facilmente che p =) q equivalente a3 :q =) :p:

p q p =) q :p :q :p =) :q
1 1 1 0 0 1
1 0 0 0 1 0
0 1 1 1 0 1
0 0 1 1 1 1

Un teorema una proposizione del tipo p =) q (p detta ipotesie q tesi).


Per dimostrare il teorema p =) q si possono seguire tre diverse strade:

(a) eettuare la cosiddetta dimostrazione diretta: se p vera anche q lo ;

(b) dimostrare la cosiddetta contronominaleo contropositiva: :q =) :p;

(c) per assurdo, provando che p ^ :q sempre falsa, cio che p ^ :q =) p ^ :p


oppure che p ^ :q =) q ^ :q.

Se p =) q si dice che p (condizione) su ciente per q e che q (condizione)


necessaria per p; se p () q, si dice che p (condizione) necessaria e su ciente per
q.

I simboli 8 e 9 signicano rispettivamente per ognie esiste (almeno un). Il loro


uso assolutamente fondamentale: senza di essi la matematica non direbbe proprio
nulla. Per esempio, laermazione x2 = 1 in s priva di signicato. Completandola
scrivendo x2 = 1 8x 2 R si commetterebbe un enorme strafalcione; scrivendo invece
9x 2 R tale che x2 = 1 si aermerebbe una (banale) verit: vi qualche numero reale
(precisamente ce ne sono due: x = 1) il cui quadrato 1.

Terminiamo con il classico principio di induzione. Si voglia dimostrare che una


propriet P (n) che dipende da un intero n (n = 1; 2; ) vera per ogni n. Per
3
Citiamo un dei tanti apparenti paradossi: losservare un paio di calze rosso costituisce una (picco-
la) conferma del fatto che tutti i corvi sono neri. Infatti la proposizione corvo =) nero equivalente
a non nero =) non corvo e perci aver osservato un non nero (rosso) che un non corvo (paio di
calze) eettivamente una piccola conferma che corvo =) nero. La cosa pu apparire sconcertante,
ma, per vericare che tutti i corvi sono neri, si possono seguire due strade: o controllare che tutti i
corvi sono neri oppure controllare che tutti i non neri sono non corvi. Sul pianeta Terra, ove i corvi
sono relativamente pochi, conviene certamente la prima strada, ma sul pianeta Corvinus del sistema
-123 nella Galassia G-18, ove, com noto, ci sono molti pi corvi che altro, pi semplice la seconda
possibilit.
866 APPENDICE B. ELEMENTI DI LOGICA

provarlo basta mostrare che P (1) vera e che P (k) =) P (k + 1), cio che la
propriet vera per n = 1 e che, se vera per n = k, allora vera anche per n = k + 1.
In tal modo P (1) =) P (2), P (2) =) P (3), P (3) =) P (4) e cos via e
dunque la propriet sempre vera4 (essendolo P (1)).
Come esempi vediamo il calcolo di alcune somme che ricorrono abbastanza spesso.

(i) Sia
Xn n (n + 1)
1+2+ +n= s= :
s=1 2
Per n = 1 la propriet banalmente vera poich

1 (1 + 1)
1=
2
Sia ora vera per n = k, cio
Xk k (k + 1)
s=
s=1 2
Dobbiamo provare che vera anche per n = k + 1, cio che
Xk+1 (k + 1) (k + 2)
s= :
s=1 2
Infatti5
Xk+1 Xk k (k + 1) (k + 1) (k + 2)
s= s + (k + 1) = +k+1= :
s=1 s=1 2 2
In particolare, la somma dei primi n numeri dispari vale n2 :
Xn Xn Xn n (n + 1)
(2s 1) = 2 s 1=2 n = n2 :
s=1 s=1 s=1 2

(ii) Sia
Xn
n (n + 1) (2n + 1)
12 + 22 + + n2 = s2 = :
s=1 6
Per n = 1 la propriet banalmente vera poich

1 (1 + 1) (2 + 1)
12 =
6
4
Ci sono tanti soldati tutti in la. Il primo ha la scarlattina destra, una rara forma di scarlattina
che contagia istantaneamente chi a destra del malato: tutti la prendono perch il primo lattacca
al secondo, il secondo al terzo, ecc..
5
Unaltra dimostrazione si limita a osservare che la somma del primo e dellultimo addendo n+1,
la somma del secondo e del penultimo ancora n + 1, ecc.. Ci sono n=2 coppie e quindi la somma
(n + 1) n=2.
867

Procedendo come sopra si ha poi


Xk+1 Xk k (k + 1) (2k + 1)
s2 = s2 + (k + 1)2 = + (k + 1)2 =
s=1 s=1 6
(k + 1) [k (2k + 1) + 6 (k + 1)] (k + 1) [2k 2 + 7k + 6]
= = =
6 6
(k + 1) (k + 2) (2k + 3)
=
6
come si voleva.

(iii) Sia
!2
Xn X
n
n2 (n + 1)2
3 3 3 3
1 +2 + +n = s = s = :
s=1
s=1
4
Per n = 1 la propriet banalmente vera poich

12 (1 + 1)2
3
1 = :
4
Procedendo come sopra si ha
Xk+1 Xk k 2 (k + 1)2 3
s 3
= 3
s + (k + 1) = + (k + 1)3 =
s=1 s=1 4
2 2
(k + 1) [k + 4 (k + 1)] (k + 1)2 (k + 2)2
= = :
4 4

(iv) Si consideri la somma


Xn 1 qn
a + aq + aq 2 + + aq n 1
= aq s 1
=a :
s=1 1 q
di n addendi in progressione geometrica di primo termine a e ragione q 6= 1.
Per n = 1 la propriet banalmente vera poich
1 q
a=a
1 q
Procedendo come sopra si ha
Xk+1 Xk qk 1
aq s 1
= aq s + aq k =
1
+ aq k = a
s=1 s=1 q 1
1 q k + (1 q) q k 1 q k+1
= a =a
1 q 1 q
come si voleva.
868 APPENDICE B. ELEMENTI DI LOGICA

(v) Si consideri la somma


Xn
q + 2q 2 + 3q 3 + + nq n = sq s
s=1

di n addendi in progressione aritmetico-geometrica. Risulta


X
n X
n X
s X
n X
n X
n
1 qn r+1
s s s
sq = q 1= 1 q = 1 qr =
s=1 s=1 r=1 r=1 s=r r=1
1 q
!
1 Xn X
n
1 1 qn
= qr q n+1 = q nq n+1 =
1 q r=1 r=1
1 q 1 q
n+1
q q n (1 q) q n+1 1 (n + 1) q n + q n+1
= 2 =q :
(1 q) (1 q)2
Appendice C

Cenni sulle coniche

Presentiamo qui i tratti essenziali delle coniche, ovvero delle curve esprimibili con
unequazione di secondo grado in due variabili. Si tratta delle curve pi celebri: ellisse
(in particolare circonferenza), iperbole e parabola. Esse sono dette coniche o sezioni
coniche perch si possono ottenere sezionando un doppio cono (illimitato).

Costruzione della parabola come Costruzione dellellisse e della Costruzione delliperbole com
sezione conica. circonferenza come sezioni coniche. conica.

869
870 APPENDICE C. CENNI SULLE CONICHE

C.1 I classici
Denizione 156 Si dice circonferenza il luogo dei punti equidistanti da un punto
sso, detto centro.

y
1.5

0.5

0
O x
-0.5

-1

-1.5

-2
-2 -1 0 1 2

Graco della circonferenza.

Prendendo il riferimento cartesiano in guisa che lorigine coincida con il centro


della circonferenza e indicandone con r il raggio, lequazione, detta canonica, della
circonferenza , per il Teorema di Pitagora,

x2 + y 2 = r 2 :

Quando invece il centro ha coordinate (x0 ; y0 ), lequazione, detta generale, della


circonferenza
(x x0 )2 + (y y0 )2 = r2 ;
ovvero
x2 + y 2 2x0 x 2y0 y + x20 + y02 r2 = 0:

Denizione 157 Si dice ellisse (o ellissi) il luogo dei punti per i quali costante la
somma delle distanze da due punti ssi detti fuochi.

Prendendo il riferimento cartesiano in modo che i due fuochi siano sullasse delle
ascisse e che lasse delle ordinate passi per il loro punto medio, i fuochi hanno coordi-
nate ( b; 0) e (b; 0). Detta 2c > 2b = 0 la somma costante delle distanze di un punto
dellellisse dai due fuochi, lequazione
q q
(x + b) + y + (x b)2 + y 2 = 2c
2 2
C.1. I CLASSICI 871

che si pu riscrivere
c2 b2 x 2 + c 2 y 2 = c 2 c 2 b2
e inne, ponendo c2 b2 = a2 e dividendo per a2 c2 ,

x2 y 2
+ 2 =1
c2 a
che detta equazione canonica dellellisse.

4 y
3

2
a
1
b
0
O c x
-1

-2

-3

-4

-6 -4 -2 0 2 4 6

Graco dellellisse.

Il rapporto p
b c 2 a2
= ;
c c
certamente compreso tra 0 e 1, detto eccentricit dellellisse. Quando a = c, col
che b = 0 e i due fuochi diventano un sol punto, si ritrova una circonferenza (la cui
eccentricit 0).

Denizione 158 Si dice iperbole il luogo dei punti per i quali costante la dierenza
delle distanze da due punti ssi detti fuochi.

Prendendo il riferimento cartesiano in modo che i due fuochi siano sullasse delle
ascisse e che lasse delle ordinate passi nel loro punto medio, i fuochi hanno coordinate
( b; 0) e (b; 0). Detta 2c, 0 < 2c < 2b, la dierenza costante delle distanze di un punto
delliperbole dai due fuochi, lequazione
q q
(x + b)2 + y 2 (x b)2 + y 2 = 2c
872 APPENDICE C. CENNI SULLE CONICHE

che si pu riscrivere
c2 b2 x 2 + c 2 y 2 = c 2 c 2 b2
e inne, ponendo c2 b2 = a2 e dividendo per a2 c 2 ,
x2 y2
=1
c2 a2
che detta equazione canonica delliperbole.

6
y

b
0
c x
O
-2

-4

-6
-8 -6 -4 -2 0 2 4 6 8

Graco delliperbole.

Il rapporto p
b c 2 + a2
= ;
c c
certamente maggiore di 1, detto eccentricit delliperbole.
Le due rette di equazione
a ap 2 a ap 2
y= x c2 ; y= + x c2
c c c c
sono dette asintoti delliperbole. Si pu vedere infatti che la dierenza tra iperbole e
asintoto tende a zero per x ! 1: liperbole si avvicina indenitamente a ciascuno
dei due asintoti.
Quando i due asintoti sono tra loro perpendicolari, cio quando a = c, liperbole
detta equilatera: la sua equazione semplicemente

x2 y 2 = a2 :

Denizione 159 Si dice parabola il luogo dei punti equidistanti da un punto sso
detto fuoco e da una retta ssa detta direttrice.
C.2. LE CONICHE IN GENERALE 873

1.5 y

0.5

F
0
V x
-0.5

-1

-1.5
d

-2
-1 0 1 2 3 4

Graco della parabola y 2 = 2ax:

Prendendo il riferimento cartesiano in modo che il fuoco sia sullasse delle ascisse,
che la direttrice sia parallela allasse delle ordinate e che lorigine sia il punto medio tra
a a
fuoco e direttrice, il fuoco ha coordinate ; 0 e la direttrice ha equazione x = .
2 2
Lequazione (canonica) della parabola allora
r
a 2 a
x + y2 = x + ;
2 2
ovvero
y 2 = 2ax:

C.2 Le coniche in generale


Possiamo dare la seguente denizione generale, che contiene tutti e quattro i casi
indicati, di conica.

Denizione 160 Si dice conica il luogo dei punti del piano di equazione

a11 x2 + a22 y 2 + 2a12 xy + 2a13 x + 2a23 y + a33 = 0

con i coe cienti aij 2 R con i; j = 1; 2; 3.

La conica detta degenere quando il polinomio a primo membro scomponibile


nel prodotto di due polinomi di primo grado in x e in y.
874 APPENDICE C. CENNI SULLE CONICHE

Il determinante della matrice simmetrica


2 3
a11 a12 a13
A = 4 a12 a22 a23 5
a13 a23 a33

detto invariante della conica. Vale il seguente

Proposizione 420 Una conica degenere se e solo se la matrice A singolare, cio


det A = 0. Se il rango di A 2 la conica degenera in due rette distinte, mentre se il
rango di A 1 degenera in due rette coincidenti.

Indicando con
a11 a12
A33 =
a12 a22
la sottomatrice ottenuta da A eliminando la terza riga e colonna, si possono riconoscere
i vari tipi di coniche.

Proposizione 421 Una conica non degenere :

(i) unellisse se e solo se det A33 > 0;

(ii) uniperbole se e solo se det A33 < 0;

(iii) una parabola se e solo se det A33 = 0.

Il lettore invitato a controllare il valore di A33 per le coniche indicate in prece-


denza.
Appendice D

DizionErio biograco

Maria Gaetana Agnesi (Milano 1718 1799) Erudita e matematica italiana. Si


avvicin alla Matematica seguendo il padre che ne fu studioso; dopo la di lui morte si
diede ad opere di carit, abbandonando i suoi interessi. Nel 1748 pubblic le Istituzioni
analitiche ad uso della giovent, inteso a dare una sistemazione al calcolo dierenziale,
con particolare riferimento alle curve piane: rimasta celebre la sua versiera.

Jean-Baptiste Le Rond dAlembert (Parigi 1717 - Parigi 1783) Filosofo, lettera-


to e matematico francese, importante gura dellIlluminismo e curatore dellEncyclopdie.
Laureato in giurisprudenza, non esercit mai la professione. Nel 1743 pubblic il Trait
de dinamyque nel quale enunciato il celebre principio di dAlembert. In seguito si
occup di astronomia, sica e matematica e i suoi scritti gli diedero fama europea.
Scopr il calcolo delle dierenze parziali e lo applic al problema delle corde vibranti.
Amico di Voltaire e di Diderot, dal 1750 si dedic con questultimo alla redazione
dellEncyclopdie della quale fu direttore, per essa redasse tutta la parte matemat-
ica e il celebre Discours prliminaire che rappresenta il manifesto della sua losoa
epistemologica.
Nel 1754 divenne membro dellAcadmie franaise e nel 1755 dellAccademia delle
Scienze di Bologna. Riut invece lincarico di direttore dellAccademia delle Scienze
di Federico II e la carica di precettore del granduca Paolo oertagli da Caterina II di
Russia.
Abbandon il lavoro allEncyclopdie prima che lopera fosse sospesa per decreto
reale nel 1759.

Apollonio di Perge (III Secolo a.C.) Fu compagno di studi di Archimede e di


Euclide ad Alessandria. Fu lautore di un celebre trattato di geometria sulle coniche.

Archimede (Siracusa 287 a.C. circa 212 a.C.) considerato il maggior matematico
dellantichit e tra i pi grandi di tutti i tempi. Fu anche un grande ingegnere
del mondo classico, avendo applicato la matematica a numerosi problemi pratici e
inventato numerosi strumenti, quali lo specchio ustore, la pompa a spirale, e altri.

875
876 APPENDICE D. DIZIONERIO BIOGRAFICO

Poco si sa della sua vita; secondo la leggenda fu ucciso da un soldato romano,


insultato per aver cancellato gure geometriche da lui tracciate sulla sabbia.
Sono giunte a noi le sue opere sui conoidi e sferoidi, sulle spirali, sullequilibrio dei
piani, sulla quadratura della parabola e la fondamentale opera sui corpi galleggianti,
che rappresenta un vero e proprio rivoluzionario trattato di tecnica navale.
Archimede fu capace di calcolare larea di una supercie sferica che dimostr es-
sere pari al quadrato del suo circolo massimo: in ci us mirabilmente il metodo
di esaustione. Con lo stesso metodo prov anche che larea di un cerchio uguale
allarea di un triangolo rettangolo che ha uno dei cateti pari alla circonferenza del
cerchio e laltro al suo raggio e ottenne la formula per la quadratura di una parabo-
la e di unellisse. Dimostr anche la notevole limitazione per secondo la quale
3 + 10=71 < < 3 + 10=70.
Il celebre postulato di Euclide secondo il quale, dati due arbitrari numeri positivi,
esiste un multiplo di ciascuno di essi che supera laltro (in linguaggio moderno, per
ogni a; b 2 R+ esiste n 2 N tale che na > b) fu reso pi incisivo da Archimede (che
stabil che, per ogni a; b; c 2 R+ con a > b, esiste n 2 N tale che n (a b) > c) nella
forma oggi detta propriet archimedea.
Gli attribuito il celeberrimo postulato di Archimede sulla spinta ricevuta da un
corpo immerso in un uido.

Jeremy Bentham (Londra 1748 1832) Economista, giurista e losofo inglese.


considerato il fondatore dellutilitarismo, cio del calcolo del piacere e del dolore come
guida delle azioni umane. Ritenne che lutilitarismo fosse la base per una miglior
felicit individuale e collettiva.
La sua opera pi importante, Introduction to the Principles of Moral and Legisla-
tion del 1789, segn profondamente il pensiero economico .

Daniel Bernoulli (Groninga 1700 Basilea 1782) Figlio di Johann, fu, oltre che
matematico, economista e naturalista. Avviato alla medicina, si occup invece di
varie altre discipline: importante il suo contributo, con lHydrodynamica del 1738,
alla dinamica dei uidi e suo il Teorema fondamentale dellidrodinamica.
Il suo Specimen theoriae novae de mensura sortis del 1738 una pietra miliare
nella storia della Teoria economica. In poche pagine, Bernoulli espone con straordi-
nario acume alcune delle idee fondamentali della Teoria dellutilit, tra cui il criterio
dellutilit attesa e il principio dellutilit marginale decrescente.

Jakob Bernoulli (Basilea 1654 1705) Matematico, della famiglia svizzera Bernoul-
li, originaria di Anversa, che cont non meno di sette studiosi di alto o altissimo livello.
Jakob Bernoulli svilupp il calcolo dierenziale, si occup di equazioni dierenziali e
fu il precursore del calcolo delle variazioni. Nel 1713 usc il volume postumo Ars con-
jectandi con una prima versione della legge dei grandi numeri, uno dei risultati centrali
del Calcolo delle probabilit.
877

Johann (o Jean) Bernoulli (Basilea 1667 1748) Fratello di Jakob, si occup di


calcolo dierenziale, di serie e di equazioni. Studi le geodetiche (linee di lunghezza
minima) e la curva brachistocrona.

Bernhard Bolzano (Praga 1781 1848) Sacerdote boemo di origini italiane, fu


losofo, teologo e matematico. Diede importanti contributi alla teoria degli insiemi e
al concetto di innito.

Cesare Burali-Forti (Arezzo 1861 Torino 1931) Matematico italiano. Fu profes-


sore allAccademia Militare di Torino. Ebbe numerosi rapporti scientici con Peano e
il suo Logica matematica, nella seconda edizione del 1919, fu per qualche decennio il
testo di riferimento sullargomento. rimasto celebre un suo paradosso sugli insiemi.

Georg Cantor (Pietroburgo 1845 Halle 1918) Matematico tedesco e professore a


Halle, fu il fondatore della teoria degli insiemi alla quale diede straordinari contributi
rivoluzionando la Matematica e inuenzando grandemente il pensiero moderno.

Gerolamo Cardano (Pavia 1501 Roma 1576) Medico, losofo e matematico


italiano, che si dedic principalmente a procedimenti risolutivi di equazioni.
Nel 1539 vide la luce la sua Practica arithmeticae, et mensurandi singularis e nel
1545 lArs magna, seu regularis algebraicis. Questultima fu oggetto di disputa con
Tartaglia sulla priorit nella soluzione di equazioni di terzo grado.
Fu autore di numerosissime opere nei campi pi diversi che gli diedero fama europea
e ne fecero uno dei protagonisti culturali di maggior prestigio.

Augustin-Louis Cauchy (Parigi 1789 Sceaux 1857) Matematico francese che,


come pochi altri, contribu allimpostazione moderna dellAnalisi matematica, intro-
ducendovi il rigore che, no a lui, era spesso approssimativo. Ci lo port a fornire
molti teoremi e propriet intesi a dare organicit al tessuto dellAnalisi.

Bonaventura Cavalieri (Milano 1598 - Bologna 1647) Matematico italiano, allievo


di Galilei, svilupp la teoria degli indivisibili che lo colloca tra i precursori del calcolo
innitesimale.

Ernesto Cesro (Napoli 1859 - Torre Annunziata 1906) Matematico italiano, in-
segn a Napoli e Palermo. Svolse importanti ricerche in Analisi e in particolare nella
Teoria delle serie divergenti, nella quale introdusse il celebre criterio di convergenza
che porta il suo nome.
878 APPENDICE D. DIZIONERIO BIOGRAFICO

Jean Gaston Darboux (Nmes, 1842 Parigi 1917) Matematico francese, insegn
a Parigi. Diede importanti contributi alle equazioni dierenziali alle derivate parziali,
alla teoria delle supercie e a parecchie applicazioni meccaniche. Il suo nome legato
alla cosiddetta propriet di Darboux, secondo la quale una funzione continua denita su
un intervallo chiuso, assume tutti i valori compresi tra il suo minimo e il suo massimo.

Julius Wilhelm Richard Dedekind (Braunschweig 1831 1916) Matematico


tedesco, fu allievo di Gauss a Gottinga e insegn, oltre che a Gottinga, a Zurigo e
nella natia Braunschweig. Diede fondamentali contributi alla teoria dei numeri, in
particolare precisando rigorosamente il concetto di numero reale. Diede anche una
nozione di numero intero in termini puramente insiemistici. Sue sono parecchie delle
idee alla base dellAlgebra moderna.

Democrito (Abdera 460 a.C. circa 380 o 360 a.C. circa) Filosofo greco, allievo di
Leucippo. Ebbe interessi molto vasti: cosmologia, matematica, geograa e medicina.
Diogene Laerzio, nelle Vite dei loso, riporta pi di settanta sue opere, ma noi ne
possediamo solo frammenti.
La dottrina atomistica di Democrito, intesa a dare una spiegazione delluniverso
sico, aermava lesistenza del non-essere accanto allessere (il non-pieno, cio il vuoto,
e il pieno): nello spazio vuoto si possono muovere inniti corpuscoli invisibili chiamati
atomi.
In un certo senso fu il lontano precursore della teoria dellutilit, avendo egli con-
cluso che la ragione, capace di eettuare un calcolo tra i piaceri, la guida morale
della vita delluomo saggio.

Ren Descartes (Cartesio) (La Haye 1596 Stoccolma 1650) Filosofo e matem-
atico francese. Dopo aver studiato nel collegio dei Gesuiti di La Flche, si arruol
nellesercito di Maurizio di Nassau in Olanda, ove conobbe lo scienziato Beckman e
cominci a occuparsi di problemi di Fisica matematica. Trasferitosi in Germania, agli
ordini di Massimiliano, tra il 10 e l11 ottobre 1619 fece un sogno che determin un
nuovo corso di vita e di studi. Nel sogno intravide la possibilit di unimpostazione
unitaria dei problemi della Fisica matematica utilizzando rigorosamente il linguaggio
matematico. Dedic il resto della sua vita a tale progetto.
Nel 1637 pubblic il celebre Discorso sul metodo, fondamento della moderna im-
postazione scientica, e nel 1641 le Meditazioni.

Diofanto (Alessandria, II - III Secolo a.C.) il precursore della teoria dei numeri
e dellalgebra. Nella sua opera si riscontrano i primi esempi di simboli algebrici e di
simboli specici per le incognite e la trattazione della sottrazione, delle potenze e la
nozione di uguaglianza. Studi successioni numeriche che descrivono poligoni.
879

Ulisse Dini (Pisa 1845 1918) Matematico italiano, insegn alluniversit di Pisa.
Port a conclusione una radicale revisione dei fondamenti dellAnalisi matematica,
nello spirito di Cauchy e di Weierstrass. Diede molti contributi alla geometria dif-
ferenziale, alle equazioni dierenziali e alle funzioni analitiche. Il suo nome legato
al Teorema sullesistenza e unicit di una funzione implicita. Il teorema apparve per
la prima volta nelle dispense redatte dal Dini per il corso di Analisi reale dellanno
accademico 1877-1888.

Peter Gustav Lejeune Dirichlet (Dren 1805 Gottinga 1859) Matematico tedesco
formatosi a Parigi con Fourier, Poisson e altri. Insegn a Breslavia, Berlino e Gottinga:
qui succedette a Gauss e spos la sorella del compositore Felix Mendelssohn-Bartholdy.
Diede importanti contributi alla teoria dei numeri, al calcolo integrale, ai criteri di
convergenza per le serie e alla Fisica matematica.

Francis Ysidro Edgeworth (Edgeworthstown 1845 Oxford 1926) Economista


inglese, professore di Economia a Londra e successivamente a Oxford.
Diede importanti contributi alla Teoria economica. Nella sua Mathematical Physics
del 1881 applic la matematica alla misurazione del piacere e, per esso, introdusse le
curve dindierenza.

Erone di Alessandria (I Secolo a.C.) Famoso matematico dellantichit. Nella


sua opere Misure forn il modo di calcolare la radice quadrata e si occup di gure
geometriche piane e solide. Diede la formula per calcolareplarea di un triangolo di lati
a; b; c. Detto p = (a + b + c) =2 il semiperimetro, larea p (p a) (p b) (p:c). Tale
formula non richiede laltezza del triangolo, spesso di cile da valutare esattamente ai
tempi di Erone, e risultava perci di pi agevole applicazione della tradizionale.
Fu anche eccellente ingegnere: invent le porte automatiche, il distributore a get-
tone, loracolo automatico, la caldaia a vapore, alcune macchine da guerra e molte
macchine e automi teatrali.

Euclide (IV - III Secolo a.C.) Della sua vita non ci noto quasi nulla. Il suo lavoro
fondamentale, gli Elementi, in tredici libri (i primi quattro sulla geometria nel piano, i
successivi sei sui numeri, lundicesimo sulla geometria solida, il penultimo sui problemi
dellinnito e lultimo sui cinque poliedri regolari: tetraedro, esaedro, ottaedro, dode-
caedro e icosaedro), fu a lungo il pi diuso testo di matematica, usato nelle scuole
no a un paio di secoli addietro. Gli Elementi sono certamente successivi a Platone
(che mor nel 347 a.C.) e anteriori ad Archimede che, in molti punti, prosegu lopera
di Euclide. Gli Elementi rappresentano una mirabile sintesi della matematica greca
dei tre secoli precedenti (Talete, Pitagora, Ippocrate, Democrito, Eudosso e altri); del
tutto nuova, e molto moderna, tuttavia limpostazione rigorosamente assiomatica
che li rende il modello di impostazione ipotetico-deduttiva di stampo aristotelico.
880 APPENDICE D. DIZIONERIO BIOGRAFICO

Eudosso di Cnido (prima met del IV Secolo a.C.) Fu lideatore del metodo di
esaustione per il calcolo delle aeree; esso, precorrendo il concetto di limite, considera
una successione di gure geometriche inscritte e circoscritte nella gura della quale
si vuol valutare larea che pu cos essere approssimata, con la precisione voluta, per
difetto e per eccesso. Studi la teoria delle proporzioni, successivamente utilizzata da
Euclide.
Propose anche un nuovo modello planetario che, seguito da Aristotele, port al
sistema geocentrico di Claudio Tolomeo.

Leonhard Euler (Eulero) (Basilea 1707 Pietroburgo 1783) Matematico svizzero,


allievo di Johan e amico di Daniel e Nicolas Bernoulli, che segu in Russia. Fu poi a
Berlino, ove divenne direttore della sezione matematica dellAccademia delle Scienze
nel 1744 per poi ritornare a Pietroburgo nel 1766.
Nel 1735 fu colpito da progressiva cecit che non ne compromise leccezionale attiv-
it scientica che ne fa uno dei pi produttivi matematici di tutti i tempi. Si interess
anche di sica, astronomia, balistica, idraulica, navigazione e di parecchi altri settori
applicativi.
Diede contributi fondamentali alla teoria dei numeri, allalgebra, allanalisi com-
plessa e pose le basi della teoria delle funzioni speciali, del calcolo delle variazioni e
dellidrodinamica. Forn anche tecniche di interpolazione e di soluzione di equazioni
algebriche1 .

Pierre de Fermat (Beaumont-de-Lomagne 1601 Castres 1665) Matematico e uo-


mo di legge francese. Pubblic raramente le sue scoperte, omettendo quasi sempre
le dimostrazioni, limitandosi a comunicarle per lettera agli amici o annotandole sui
margini dei libri di giurisprudenza dei quali faceva uso per professione. Con Leibnitz e
Newton, fu uno dei precursori del calcolo innitesimale, con Cartesio, delle applicazioni
dellalgebra alla geometria e, con Pascal, del calcolo delle probabilit.
Il suo nome legato alla teoria dei numeri: celeberrimo lultimo Teorema di
Fermat, secondo il quale non esistono soluzioni intere dellequazione xn + y n = z n
per n intero > 2. La proposizione (... della qual cosa scopersi in vero una mirabile
dimostrazione. La ristrettezza del margine non la pu contenere scrisse Fermat),
dopo oltre tre secoli, fu nalmente dimostrata da A. Wiles nel 1995.
A Fermat si deve anche il principio ottico secondo il quale un raggio luminoso segue
sempre il percorso di minima durata e che sta alla base delle leggi di rifrazione.

Leonardo Fibonacci (detto Leonardo Pisano) (Pisa circa 1170 - circa1240) Fu


il pi importante matematico del Medio Evo. I suoi viaggi in Oriente gli fecero scoprire
la scienza araba. Raccolse nelle sue opere i saperi matematici greco e arabo e, con il
1
Le notazioni e per il numero di Nepero, per le dierenze, i simboli trigonometrici e altri ancora
sono a lui dovuti.
881

Liber abaci, contribu in modo essenziale allintroduzione in Europa della cosiddetta


numerazione araba (peraltro di origine indiana).
Matematico di grande talento, diede importanti contribuiti. Celebri sono i numeri
di Fibonacci: essi si riscontrano spesso in fenomeni naturali e hanno la notevole pro-
priet (per esempio il rapporto tende alla sezione aurea, o divina proportione, canone
della perfezione classica).

Bruno de Finetti (Innsbruck 1906 Roma 1985) Matematico applicato italiano,


insegn a Trieste e a Roma. Fondamentali sono i suoi contributi alla teoria delle prob-
abilit (scambiabilit, processi stocastici) e alla sua metodologia (concezione sogget-
tiva della probabilit). Si occup di parecchie questioni economiche (preferibilit,
avversione al rischio) che lo portarono a studiare per primo la quasi concavit.

Nicol Fontana (detto Tartaglia) (Brescia 1499 Venezia 1557) Nato poveris-
simo, detto Tartaglia per la sua balbuzie, fu autodidatta ed considerato uno dei
maggiori algebristi del Cinquecento. Diede contributi alla soluzione delle equazioni di
terzo grado.
Nel 1534 Anton Maria Fiore lanci una pubblica sda sulla soluzione dellequazione
x3 + px + q = 0, alla quale Tartaglia diede soluzione. Ne segu una lunga polemica,
di vasta risonanza, con Cardano, che nel 1545 pubblic la sua teoria generale delle
equazioni di terzo grado.

Friedrich Gottlob Frege (Wismar 1848 Gottinga 1925) Logico e matematico


tedesco, che insegn alluniversit di Jena. Diede decisivi contributi ai fondamenti della
Matematica; formul anche una denizione di numero naturale utilizzando soltanto
nozioni logiche.
Nel suo sistema logico centrale la distinzione tra oggetto e concetto (o funzione
proposizionale). Frege utilizz un linguaggio articiale, lideograa, e di un sistema
di calcolo basato su assiomi e sulla regola del modus ponens. I suoi studi furono
ignorati no a che Bertand Russell non mise in luce la contraddittoriet della sua
teoria. Nonostante ci, Frege il riferimento per la maggior parte degli studi di logica,
linguistica e losoa del Novecento.

Galileo Galilei (Pisa 1564 Arcetri 1642) Celebre scienziato italiano, autore di
una vera e propria rivoluzione scientica. Sin dalla giovinezza si dedic alla Fisica: la
sua scoperta dellisocronismo delle oscillazioni del pendolo del 1583. Studi Platone,
Euclide e Archimede, che molto lo inuenz come si pu evincere dal suo prima lavoro
La bilancetta del 1586 e dal successivo sul centro di gravit dei corpi.
Diventato lettore di Matematica alluniversit di Pisa, si occup di meccanica (la
sua opera De Motu uscir soltanto postuma) aprendo la via alla moderna dinamica.
Nel 1592 Galilei ottenne la cattedra di Matematica alluniversit di Padova, che gli
garant ampia libert di pensiero e ove trascorse diciotto anni. In questo periodo scopr
882 APPENDICE D. DIZIONERIO BIOGRAFICO

la legge della caduta dei gravi nel 1604 e nel 1610, basandosi su una scoperta olandese,
mise a punto il telescopio con il quale, tra la ne del 1609 e i primi mesi del 1610,
scopr le macchie lunari, le fasi di Venere, i quattro satelliti (oggi detti galileiani) di
Giove e, pi tardi, le macchie solari. Nel 1619 pubblic a Venezia il Sidereus Nuncius,
che suscit ampie polemiche.
Le opere fondamentali di Galilei sono Il Saggiatore del 1630 e il Dialogo sopra i
due massimi sistemi del mondo del 1632. In essi, avendo accettato la nuova teoria
copernicana che metteva in dubbio la vecchia concezione dellastronomia, si fece pal-
adino della nuova teoria. Avversato dalla Chiesa, fu condannato nel 1633 al carcere,
che evit abiurando.
Negli ultimi anni, che trascorse ad Arcetri, si dedic ai Discorsi e dimostrazioni
matematiche intorno a due nuove scienze attinenti alla meccanica ed i movimenti
locali, che pu essere considerata il vero inizio del pensiero scientico moderno.

Carl Friederich Gauss (Brunswick 1777 Gottinga 1855) Insigne matematico


tedesco che si occup di numerosi problemi della Matematica.
Nel suo celebre Disquisitiones arithmeticae, del 1801, pose le basi della moderna
teoria dei numeri. Gi nel 1799 diede una dimostrazione rigorosa del Teorema fonda-
mentale dellalgebra di dAlembert. Studi la distribuzione degli errori di misurazione,
che oggi, in suo onore, detta gaussiana. Si occup di elettrostatica e di magnetismo
terrestre e propose un sistema di misurazione detto sistema elettromagnetico di Gauss.
Con un ventennio di anticipo scopr, ma non pubblic, i fondamenti delle geometrie
non euclidee.

Luigi Guido Grandi (Cremona 1671 Pisa 1742) Frate camaldolese, fu professore
a Firenze, prima di losoa e successivamente di matematica. Il suo nome legato
alla serie detta di Grandi.

Jacques Salomon Hadamard (Versailles 1865 Parigi 1963) Matematico francese,


insegn a Bordeaux e a Parigi. Diede importanti contributi sulle funzioni analitiche,
sulle funzioni di variabile complessa e sulle equazioni dierenziali. Fu uno degli inizia-
tori dellAnalisi funzionali e si occup anche di geometria dierenziale e di teoria dei
numeri.

Heinrich Eduard Heine (Berlino 1821 Halle 1881) Matematico tedesco che in-
segn nelle universit di Bonn e di Halle. Si occup di funzioni speciali e forn il
concetto di continuit uniforme.

John Richard Hicks (Warwick 1904 Blockley 1989) Economista inglese, riprese
e sistematizz limpostazione ordinalista di Pareto contribuendo alla sua aermazione
quale base della Teoria del consumatore. Diede importanti contributi in macroecono-
mia (fu tra gli autori del modello IS-LM) e in economia dinamica.
883

Guillaume Franois Antoine de lHpital (Parigi 1661 1704) Matematico


francese. Dopo lincontro con Johann Bernoulli nel 1691, abbandon la carriera mil-
itare, alla quale era destinato per le sue nobili origini, per una scientica. Nel 1696
pubblic il famoso Analyse des innitement petits pour lintellegence des lignes courbes,
primo testo di Calcolo dierenziale: nel Capitolo 9 compare la sua celebre regola.
Trovato tra le sue carte dopo la morte, nel 1707 fu pubblicato il Trait analytique des
section coniques.

Ippocrate di Chio (Chio V Secolo a.C.) Matematico e astronomo greco, si occup


di due problemi della geometria antica: la quadratura di supercie limitate da archi di
cerchio e la duplicazione del cubo. Fu il primo a redigere un trattato (gli Elementi) di
geometria elementare.
A lui si fanno risalire tentativi di applicazione del metodo di esaustione.

Johan Jensen (Nakskov 1859 Copenhagen 1925) Matematico danese. Pur avendo
una spiccata inclinazione per gli studi matematici, nel 1861 accett un impiego presso
una socit telefonica Bell a Copenaghen, che mantenne sino al 1924.
Parallelamente si dedic anche alla Matematica. Si occup della congettura di
Riemann, di serie e di funzioni speciali, ma il suo nome legato alla funzione convesse,
che introdusse in un lavoro del 1905 (la celebre disuguaglianza per le funzioni convesse
che porta il suo nome ne ricorda il ruolo pioneristico).

William Stanley Jevons (Liverpool 1835 Bexill 1882) Economista e losofo in-
glese, legato allutilitarismo di Bentham. Con Walras e Menger uno dei fondatori
della scuola marginalista. Nei suoi scritti Elementary Lessons in Logic del 1870 e Prin-
ciples of Science del 1874 sostenne lapplicazione della logica matematica alle scienze
naturali e sociali. La sua opera principale, The Theory of Polical Economy del 1871,
analizza il comportamento del consumatore in base alla razionalit della sua condotta
economica.

Muh.ammad ibn Musa al-Khuwarizm (750 circa Bagdad 850 circa) Matemati-
co, astronomo e geografo arabo. Scrisse un libro di aritmetica per illustrare il sistema
posizionale indiano; ne rimane solo una traduzione latina che si inizia con Algorithmi
dicit: algoritmo, corruzione del nome dellautore, ora entrato nelluso per indicare
un procedimento di calcolo.
Un volume di algebra, nel quale si occup di equazioni, Al-jabr wmuqabala
(Rispristinare e contrapporre) dell830: dal nome arabo al-jabr derivato algebra.
Fu autore di opere di astronomia e di geograa: nelle prime utilizz i metodi
dellastronomia indiana e nelle seconde della Geograa di Tolomeo.
Anche il nome logaritmo si deve ricollegare a una deformazione del suo nome.
884 APPENDICE D. DIZIONERIO BIOGRAFICO

Giuseppe Luigi Lagrange (Torino 1736 Parigi 1813) Matematico italiano, con
Eulero il pi importante matematico del Settecento, trascorse i primi trentanni della
sua vita a Torino, i successivi ventuno a Berlino e gli ultimi ventisei a Parigi.
Nel 1757 fond, con alcuni colleghi, una societ scientica che sarebbe poi diventata
lAccademia delle Scienze di Torino. Si occup di calcolo delle variazioni, di calcolo
delle probabilit, di serie, di equazioni algebriche e di equazioni dierenziali, per le
quali forn il metodo di variazioni delle costanti. Il suo nome legato alla funzione
lagrangiana e ai moltiplicatori di Lagrange per problemi di ottimo vincolato.
Fu anche un eccellente sico matematico. Si occup di meccanica celeste, risolse
molti problemi sulla librazione lunare e introdusse la funzione di Lagrange denita
come dierenza tra energia cinetica e potenziale.

Gabriel Lam (Tours 1795 Parigi 1870) Matematico francese, insegn a Parigi.
Si occup di teoria dei numeri, e in particolare dellultimo teorema di Fermat, di
meccanica, di termodinamica e di teoria dellelasticit. Il suo contributo pi rilevante
fu lintroduzione delle coordinate curvilinee.

Pierre-Simon de Laplace (Beaumont-en-Auge 1749 Parigi 1827) Ottenuta una


cattedra di matematica allcole militaire di Parigi nel 1777, si occup inizialmente
della Teoria della gravitazione universale. Successivamente, con Lavoisier, si occup
di chimica.
Nel suo volume Thorie du mouvement et de gure elliptique des planetes utilizz
sistemi di equazioni dierenziali per descrivere i movimenti dei pianeti e le loro pertur-
bazioni. Nel Trait de mcanique celeste, in cinque tomi, diede una visione complessiva
del moto dei pianeti del Sistema solare.
Nel 1812 pubblic la Thorie analytique des probabilits che rappresenta il primo
trattato sistematico di Calcolo delle probabilit.
Sono ben noti i suoi contributi allAnalisi matematica relativi a funzioni continue,
serie, equazioni dierenziali, calcolo integrale e determinanti.

Adrien-Marie Legendre (Parigi 1752 1833) Matematico francese, attivo membro


dellAccademia delle Scienze. Fu il fondatore della teoria delle funzioni ellittiche e si oc-
cup anche meccanica celeste, di teoria dei numeri e di geometria. Indipendentemente
da Gauss svilupp il Metodo dei minimi quadrati.

Gottfried Wilhelm Leibnitz (Lipsia 1646 Hannover 1716) Diplomatico, losofo e


matematico tedesco. Pubblic di logica e matematica nel 1666: Disputatio arithmetica
de complexionibus e Dissertatio de arte combinatoria. Del 1670 il trattato di Fisica
Nova Methodus pro maximis et minimis, nel quale, per primo, espose le regole del
calcolo innitesimale.
Nel 1698 usc il Codex iuris gentium diplomaticum sulla storia del diritto pubblico
tedesco dal 1000 al 1600. Nel 1703 inizi a lavorare al Nuveaux essais sur lentendement
885

humain (uscito postumo nel 1753); nel 1712 pubblic lEssai de Theodice, sur la bont
de Dieu, la libert de lhomme e lorigin du mal. I Principes de la nature et de la grce
fonds en raison e i Principes de philosophie furono pubblicati nel 1718 e nel 1720.
Ben nota la disputa che scoppi con Newton circa la priorit della scoperta del
calcolo innitesimale; essa lo amareggi profondamente e contribu a isolarlo dal mondo
no alla morte, avvenuta per una crisi di gotta, nel 1716.
Leibnitz insegu un progetto di sapere universale, attraverso una teoria dellin-
venzione, gi elaborata da Ramon Lull (Raimondo Lullo) nel Medioevo e ripresa nel
Rinascimento, che avrebbe dovuto condurre a un linguaggio universale in grado di
esprimere qualsiasi nozione e da metterne in luce i collegamenti. Da Aristotele, Leib-
nitz prese lidea che ogni sostanza ha una forma immutabile e distinta dalle altre: la
monade che rispecchia lordine delluniverso.

Wassily Leontief (Vasilij Leontev) (Pietroburgo 1905 New York 1999) Econo-
mista russo, che studi a Pietroburgo e a Berlino. Trasferitosi negli Stati Uniti, in-
segn nelle universit di Harvard e di New York. Il suo nome legato allanalisi delle
interdipendenze settoriali.

Colin MacLaurin (Kilmodan 1698 Edimburgo 1746) Matematico scozzese, fu


professore ad Aberdeen e a Edimburgo. Il suo nome legato alle serie di funzioni, ma
si occup anche di geometria e di Fisica matematica.

Lorenzo deMedici (Firenze 1449 1492) Conosciuto come Lorenzo il Magnico,


fu banchiere, poeta e politico. I suoi molti e notevoli talenti lo rendono uno dei pi
celebri protagonisti del Rinascimento.

Carl Menger (Nowy Sacz 1840 Vienna 1921) Economista austriaco, professore
a Vienna dal 1873, fu uno dei fondatori del marginalismo. La sua Untersuchungen
ber die Methode der Sozialwissenschaften und der politischen konomie insbesondere
del 1883 sostenne che soltanto il metodo deduttivo consentiva di giungere a leggi
economiche generali e che su ciente analizzare il comportamento razionale dei singoli
individui per descrivere lintero processo economico. Su tali punti ebbe una lunga
disputa con G. von Schmoller.
La sua opera principale, Grundstze der Volkswirtschaftslehere del 1871, partendo
dai bisogni di beni, fornisce una chiara formulazione dellequilibrio del consumatore.

Pietro Mengoli (Bologna 1626 1686) La sua opera precorre lAnalisi innitesi-
male, a lui di poco successiva. Stabil che condizione necessaria di convergenza di una
serie che il suo termine generale tenda a zero e che una serie con i termini positivi
convergente se le sue somme parziali sono limitate.
886 APPENDICE D. DIZIONERIO BIOGRAFICO

Marin Mersenne (Oiz 1588 Parigi 1648) Filosofo e scienziato francese. Entrato
nellorine dei Minimi nel 1611, si diede alla losoa, prima attaccando il pensiero
rinascimentale e poi redigendo opere di erudizione scientica, tra le quali Cogita-
ta phusica-mathematica del 1644. Intrattenne una ricchissima corrispondenza con
Cartesio, Galileo, Gassendi, Hobbes, Huygens e Torricelli.
I suoi studi musicali rappresentano la base teorica del Clavicembalo ben temperato
di Bach.

Abraham de Moivre (Vitry-le-Franois 1667 Londra 1754) Matematico francese


che lavor principalmente a Londra. Scrisse la Doctrine of Chance (1718), di fonda-
mentale importanza per il Calcolo delle probabilit.
Il suo nome legato alla formula per la potenza di un numero complesso.

John Neper (o Napier o Nepero) (Merchiston 1550 - Merchiston 1631) Matem-


atico scozzese. Dopo un periodo nel quale sostenne con vigore la chiesa anglicana, si
dedic completamente alla Matematica e, in particolare, al calcolo dei logaritmi natu-
rali (o neperiani) e alla trigonometria sferica. celebre il suo Logarithmorum Canonis
Descriptio del 1614.

Isaac Newton (Woolsthorpe 1642 Londra 1727) Studi a Cambridge, ove fu in-
uenzato dal losofo Henry Moore e dal matematico Isaac Barrow, ma la sua for-
mazione fu in gran parte frutto di studi autonomi.
Nel 1714 cos sintetizz la fase iniziale della sua attivit: Allinizio del 1665 scop-
ersi il metodo di approssimazione delle serie e la regola per ridurre qualsiasi esponente
di ogni binomio a tali serie. Il medesimo anno, in maggio, scopersi il metodo delle
tangenti di Gregory e di Sluse, e in novembre ero in possesso del metodo diretto delle
ussioni2 , e lanno successivo, in gennaio, avevo la teoria dei colori, nel maggio seguente
ero in possesso del metodo inverso delle ussioni. Nello stesso tempo iniziai a pensare
alla gravitazione che si estende no allorbita della luna e (avendo trovato come cal-
colare la forza per eetto della quale un globo che ruota dentro una sfera preme la
supercie della sfera), dalle legge di Keplero sei tempi periodici dei pianeti che sono
nella ragione di 3 a 2 delle loro distanze dai centri delle loro orbite, ho dedotto che la
forza che trattiene i pianeti nelle loro orbite deve essere mutuamente come il quadrato
delle loro distanze dai centri intorno ai quali essi ruotano; e per mezzo di ci confrontai
la forza richiesta per trattenere la Luna nella sua orbita con la forza di gravit sulla
supercie della Terra, e trovai la risposta quasi soddisfacente.
A solo venticinque anni aveva gi ottenuto risultati di enorme rilevanza.
Alla ne del 1669 fu nominato professore di matematica e insegn ottica, algebra e
aritmetica e i moti dei corpi celesti. Nel 1672 divenne membro della Royal Society. Nel
1689 fu eletto in Parlamento come rappresentante universitario. Nonostante le varie
2
Le derivate.
887

cariche, condusse sempre una vita molto ritirata. Storica la disputa con Leibnitz
sulla priorit della scoperta del calcolo innitesimale.
I suoi lavori fondamentali sono De Systemate Mundi del 1687 e i Philosophiae
Naturalis Principia Mathematica.

Vilfredo Pareto (Parigi 1848 Cligny 1923) Economista e sociologo italiano,


studi al Politecnico di Torino e successivamente si trasfer a Firenze dove lavor
per alcuni anni nel settore ferroviario. Vivacemente contrario al protezionismo, tent
senza fortuna la carriera politica. Abbandonate tali ambizioni, scopr il pensiero di
Walras e comprese che la sua vocazione era negli studi.
Nel 1893 ottenne la cattedra di Economia politica allUniversit di Losanna, succe-
dendo proprio a Walras. Qui scrisse il Cours deconomie politique (1896-97), basato
sullastrazione dellhomo oeconomicus e sullofelimit, cio una rappresentazione di
convenienza che fa s che una cosa soddis un bisogno o un desiderio. Diede contributi
fondamentali alla Teoria economica, tra cui la nozione di e cienza che porta il suo
nome e, soprattutto, lapproccio ordinalista che rivoluzion la Teoria del consumatore.
Dedic gli ultimi anni della sua vita alla Sociologia, della quale uno dei padri
fondatori con Durkheim e Weber.

Blaise Pascal (Clermont Ferrand, 1623 Parigi 1662) Filosofo e scienziato francese.
Dibattuto tra fede e ragione, ritenne inizialmente (tra il 1646 e il 1654) che, nelle
discipline dei sensi e del ragionamento (come la sica e la matematica), il solo giudice
la ragione, mentre per la storia (e la rivelazione) deve valere un principio dautorit.
Nel 1654 strinse stretti rapporti con Port-Royal che lo portarono a una sorta di
conversione alla fede, alla base della quale non stanno n lesprit de gometrie (la
ragione) n lesprit de nesse (lintuizione), ma soprattutto il cuore che ha ragioni
che la ragione non conosce; luomo non capace di nessuna certezza eppure ne ha
assoluto bisogno. Di questo periodo sono le sue opere pi celebri: le Provinciales del
1654 e i Pense, pubblicato nel 1670, ove compare la celebre scommessa.
Sul piano scientico, Pascal si occup inizialmente di geometria (Essai pour le
coniques del 1640) e successivamente di problemi del vuoto (Trait de lquilibre des
liqueurs del 1653, ma pubblicato postumo). Nel 1654 si occup di un problema postogli
dal cavaliere di Mr sul giuoco dei dadi; le sei lettere che si scambiarono Pascal e
Fermat sullargomento sono il primo accenno al calcolo delle probabilit.
Si occup anche della cicloide e del calcolo dei volumi. Il suo ultimo lavoro, il
Trait de sinus du quart du cercle fu probabilmente lelemento decisivo che condusse
Leibnitz al calcolo dierenziale.

Pitagora (Samo 570 a.C. circa Metaponto primo terzo del V Secolo a.C.) Pare
che abbia trascorso la giovinezza in viaggi, spinto dal desiderio di sapere (losoa);
in essi ebbe modo di conoscere i saperi egizio e orientale. Verso i quarantanni emigr
nella Magna Grecia e, a Crotone, fond una cerchia religiosa di tipo esoterico. Mor,
probabilmente suicida, a Metaponto.
888 APPENDICE D. DIZIONERIO BIOGRAFICO

Il pitagorismo, che ebbe stretti legami con lorsmo e i misteri dionisiaci, rappresen-
t unastrazione intellettuale di tipo religioso, dotata di un vero e proprio catechismo
fondato sul rispetto della volont divina, sulla felicit della propria condizione, sul-
la difesa della legalit, sulla fedelt agli amici e sulla comunione dei beni materiali.
Verso la met del V Secolo a.C. ai pitagorici spiritualisti si contrapposero i pitagorici
matematici, dediti alla scienza e allattivit intellettuale.
Nel pensiero di Pitagora, luniverso armonia e numeroe, in base al numero, si
pu spiegare lesistenza e il futuro di tutte le cose. Il dieci il numero perfetto perch
somma dei primi quattro interi (10 = 1 + 2 + 3 + 4): il suo simbolo la tetrakts,
formata da un triangolo equilatero di dieci punti, e su di essa i pitagorici facevano i
giuramenti pi solenni.
Il nome di Pitagora indissolubilmente legato al teorema che ne porta il nome,
anche se in realt egli si limit a sistemare conoscenze antiche, gi note
p agli Egizi. Sua
anche lelegante dimostrazione della non razionalit del numero 2.

Jules-Henri Poincar (Nancy 1854 Parigi 1912) Filosofo della scienza e matem-
atico francese. Diede contributi alle equazioni dierenziali, alle funzioni fuchsiane,
allelettrodinamica, alla propagazione delle onde elettromagnetiche e a teorie cosmogo-
niche.
Il pensiero di Poincar si collega al movimento di revisione del razionalismo e
dellempirismo positivista. Fu assertore del principio di non contraddittoriet, cio
della soggezione del pensiero matematico alla sola coerenza interna, senza che vi sia
la necessit che esista qualche oggetto reale che vi si conformi.
Le sue principali opere losoche sono La science et lhypothse del 1901 e La valeur
de la science del 1905.
considerato uno degli ultimi grandi uomini di scienza con interessi poliedrici.

Georg Friedrich Bernhard Riemann (Breselenz 1826 Selasca 1866) Matemati-


co tedesco, senza dubbio uno dei pi grandi dellOttocento, che si diede alla matematica
dopo studi in teologia a Gottinga.
Si laure a Gottinga con una tesi sulle funzioni di variabili complessa e, nel 1857,
pubblic un lavoro sulla rappresentazione di una funzione mediante una serie trigono-
metrica. Prese il posto di Dedekind come professore di matematica alluniversit di
Gottinga. Tra i suoi lavori fondamentali ve n uno sulla cosiddetta funzione di Rie-
mann e uno sulla propagazione del suono che contiene un metodo per lintegrazione
di equazioni dierenziali alle derivate parziali del secondo ordine.
Con Weierstrass, gett le basi della teoria delle funzioni di variabile complessa e
introdusse le supercie di Riemann. Si occup anche di geometria e dei suoi fonda-
menti.
Celebre la congettura di Riemann sui numeri primi.

Michel Rolle (Ambert 1652 Parigi 1719) Di umili origini, fu essenzialmente au-
todidatta. Acquist notoriet, e anche una certa sicurezza economica, risolvendo un
889

problema che era stato pubblicamente proposto (trovare quattro numeri tali che le
dierenze di ogni coppia sia un quadrato perfetto e che inoltre la somma dei primi tre
sia un quadrato perfetto). Successivamente lavor al Ministero della guerra e fu eletto
membro dellAcadmie Royal des Sciences.
Il suo nome inscindibilmente legato al celebre Teorema che aerma che, se una
funzione derivabile denita su un intervallo e assume lo stesso valore negli estremi,
esiste almeno un punto nel quale la sua derivata nulla.

Bertrand Russell (Trellech 1872 Penrhyndeudraeth 1970) Matematico e losofo


inglese, fu iniziatore, con Moore, della losoa analitica e, con Frege, della logica
matematica moderna. Sono celebri le sue antinomie che lo condussero alla teoria dei
tipi.

Giovanni Gerolamo Saccheri (Sanremo 1667 Milano 1733) Matematico italiano


che insegn a Pavia. I suoi Quaesita geometrica gli valsero buona fama n dalla
giovinezza; nella Logica demonstrativa del 1697 elabor lo schema di ragionamento
che utilizz nella sua opera maggiore, Euclides ab omni naevo vindicatus, per la quale
considerato il principale precursore delle geometrie non euclidee.

Eugen Slutsky (Yaroslav 1880 Mosca 1948) Economista e statistico russo che
diede importanti contributi allanalisi del comportamento del consumatore (con la
celebre analisi degli eetti di reddito e di sostituzione che porta il suo nome) e al
Calcolo delle probabilit.

James Stirling (Garden 1692 Edimburgo1770) Matematico scozzese. Ebbe rap-


porti scientici con Newton. Trasferitosi a Londra nel 1724, divenne membro della
Royal Society. Si occup di serie, di curve cubiche, di prodotti inniti, di interpo-
lazione e di calcolo delle dierenze. Il suo maggior contributo fu unapprossimazione
p
1
al fattoriale attraverso la cosiddetta formula di Stirling: n! ' nn+ 2 e n 2 .

Talete (Mileto 624 a.C. circa met del VI Secolo a.C.) Di origine fenicia, fu uno
dei Sette Sapienti della Grecia. Aristotele lo considera il padre della losoa sica.
Non si conosce nessuno dei suoi scritti, ma gli attribuisce di aver fondato la geome-
tria su basi diverse dalle egizie. Il pi noto dei teoremi a lui attribuiti aerma la
proporzionalit dei segmenti determinati da un fascio di rette su due trasversali.
Ebbe grandissima fama per aver predetto leclissi di Sole del 28 maggio 585 a.C..

Brook Taylor (Edmonton 1685 Londra 1731) Allievo di Newton, svilupp le idee
del maestro nellAnalisi matematica: di particolare rilievo la formula dello sviluppo
in serie di una funzione.
890 APPENDICE D. DIZIONERIO BIOGRAFICO

Leonida Tonelli (Gallipoli 1885 Pisa 1946) Matematico italiano, diede contribu-
ti fondamentali al Calcolo delle variazioni sviluppando il cosiddetto Metodo diretto
basato sulle propriet di ottimalit delle funzioni semicontinue. Forn risultati anche
per la teoria dellintegrazione e per le serie trigonometriche.

Charles Jean de la Valle Poussin (Lovanio 1866 1962) Matematico belga, pro-
fessore a Lovanio, dimostr, in contemporanea con Hadamard, il Teorema dei numeri
primi. Si occup anche di teoria dellintegrazione, di equazioni dierenziali, di fun-
zioni di variabile complessa e di rappresentazione conforme. Scrisse un celebre Cours
danalyse, pi volte aggiornato dal 1899 al 1922.

Marie-Esprit-Lon Walras (vreux 1834 Clarens-Montreux 1910) Economista


francese, insegn a Losanna no al 1892. uno dei fondatori del marginalismo: il suo
lements dconomie politique pure (due volumi del 1874 e del 1889) diede uno schema
di equilibrio economico generale e rappresenta una tappa fondamentale del pensiero
economico. Lutilit marginale il concetto unicante di tutta limpostazione teorica
del problema della distribuzione di mezzi scarsi in impieghi alternativi. Lequilibrio
economico che ne consegue risente di tutte le variabili del sistema e consente di denire
la posizione di equilibrio alla quale tende uneconomia perfettamente concorrenziale.

Karl Theodor Weierstrass (Ostenfelde 1815 Berlino 1897) Insegn alluniversit


di Berlino. Raro esempio di matematico che forn rilevanti contributi scientici soltanto
in et matura. Fu il precursore della cosiddetta corrente aritmeticista, che intese
ridurre lAnalisi allAritmetica. Diede fondamentali contributi allo studio delle funzioni
analitiche, alle funzioni di variabile complessa e alle funzioni ellittiche.

You might also like