You are on page 1of 166

September 30, 2014

INSIEMI

In modo piuttosto informale si introducono nozioni e notazioni insiemistiche che vengono correntemente usate per sviluppare le teorie matematiche tra cui quella che `e argomento del corso.
1. Nozioni di base
La notazione fondamentale `e
aA
che si legge a `e un elemento dellinsieme A oppure, equivalentemente, a appartiene ad A. Il
simbolo indica quindi una relazione (di appartenenza) che pu`
o correlare (o no) un elemento ed
un insieme. La notazione a
/ A significa che a non `e un elemento di A cio`e che a non appartiene ad
A. I concetti di elemento e di insieme sono concetti primitivi, cio`e non vengono definiti in termini
di altri concetti pi`
u elemetari. Per dare sostanza al discorso postuleremo che certi enti sono insiemi.
Per esempio gli insiemi di numeri N, Z, Q, R (naturali, interi, razionali, reali) che assumiamo pi`
uo
meno familiari al lettore sono, appunto, insiemi. Inoltre fisseremo in modo preciso certe procedure
per manipolare gli insiemi, per esempio per costruire nuovi insiemi a partire da insiemi dati.
La notazione
AB
si legge dicendo che linsieme A `e un sottoinsieme dellinsieme B oppure, equivalentemente, che A
`e contenuto in B; significa che ogni elemento di A `e anche un elemento di B (cio`e se a A allora
a B). Quindi indica una relazione (di inclusione) che pu`
o correlare (o no) un insieme con
un altro insieme. Per ogni insieme A, si ha che A A. Postuliamo che esiste linsieme vuoto, cio`e
linsieme privo di elementi che `e indicato con il simbolo . Per ogni insieme A, A. A non `e
contenuto in B se esiste un elemento a A tale che a
/ B. A `e strettamente contenuto in B se A B
ed esiste b B che non appartiene a A.
Poniamo
A=B
se valgono entrambe le inclusioni
AB eBA.
Quindi A 6= B se esiste a A che non appartiene a B o esiste b B che non appartiene ad A, dove
questo o non `e esclusivo, ma significa che almeno una delle due circostanze si verifica.
Attenzione alle notazioni senza senso: se A e B sono insiemi, allora la notazione A B non ha
senso. Se a A, allora la notazione a A non ha senso. Invece ha senso scrivere {a} A, dove {a}
`e linsieme costituito dal solo elemento a; in particolare ha senso scrivere a {a}.
1.1. Unione, intersezione, complementare. Dati due insiemi A e B, linsieme unione
AB
`e caratterizzato dalla propriet`
a che x A B se e solo se x A o x B. Come sopra, questo o
non `e esclusivo: richiediamo che x appartenga ad almeno uno dei due insiemi A, B. E chiaro che
A, B A B, cio`e entrambi gli insiemi A e B sono sottoinsiemi dellinsieme unione A B.
Linsieme intersezione
AB
`e tale che x A B se e solo se x A e x B, cio`e x `e un elemento di entrambi gli insiemi A e B.
E chiaro che A B A, B, cio`e lintersezione `e un sottoinsieme di entrambi gli insiemi A e B.
Se A B, allora
CB (A) = {x B|x
/ A}
`e linsieme complementare di A in B. Si verifica che (farlo per esercizio):

INSIEMI

(1) CB (CB (A)) = A;


(2) Se A, D B, allora
CB (A D) = CB (A) CB (D)
CB (A D) = CB (A) CB (D) .
Dati due insiemi A, B
A \ B := CA (A B)
`e per definizione linsieme differenza. Si osserva che A B \ A B consiste proprio degli elementi
dellinsieme unione che appartengono in modo esclusivo ad A oppure a B.
1.2. Prodotto. Dati insiemi non vuoti A1 , . . . , An , linsieme prodotto A1 An ha per elementi le
n-uple ordinate (a1 , . . . , an ) tali che, per ogni j = 1, . . . , n, aj Aj . Attenzione, lordine `e essenziale:
ad esempio (1, 2) e (2, 1) sono elementi diversi dellinsieme prodotto N N.
1.3. Linsieme delle parti. Dato un insieme A, P(A) `e linsieme che ha per elementi i sottoinsiemi
di A. Linsieme delle parti P(A) `e sempre non vuoto perche P(A). In particolare P() `e non
vuoto e `e il suo unico elemento. Se A `e non vuoto e a A, allora a {a} P(A), ma a
/ P(A);
daltra parte se a A e A B, allora a B. Questo mette in evidenza il fatto (sottile e importante)
che lo stato di un ente in quanto elemento o insieme non `e dato una volta per tutte ma dipende
dalla relazione con altri enti. Si pu`
o iterare la costruzione in modo induttivo (si veda la dispensa
[INDUZIONE]) ponendo
P (n) (A) = P(P n1 (A)) .
Per esempio P(P()) = {, {}} `e costituto di due elementi. La possibilit`a di creare insiemi i cui
elementi sono insiemi `e un punto molto delicato del discorso, su cui torneremo in seguito per i lettori
particolarmente interessati.
1.4. Funzioni. Una funzione
f :AB
(chiamata anche con il sinonimo applicazione) definita sullinsieme A a valori nellinsieme B, associa
ad ogni a A un unico elemento b = f (a) B. A volte A `e detto il dominio di definizione di f , B il
codominio.
Data una funzione f : A B, il sottoinsieme di B:
Im(f ) = {b B| a A, f (a) = b}
`e detto limmagine di f . A volte si scrive anche f (A) invece di Im(f ).
Per ogni C B, il sottoinsieme di A:
f 1 (C) = {a A| f (a) C}
`e detto limmagine inversa o anche la controimmagine di C.
Il sottoinsieme di A B:
G(f ) = {(a, b) A B| b = f (a)}
`e detto il grafico di f . Si osserva che G(f ) A f (A).
Attenzione: Una funzione e il suo grafico sono strettamente legati tra loro ma non sono la stessa
cosa. Trattando le funzioni bisogna imparare a tenere concettualmente distinti i vari oggetti associati
(dominio di definizione, immagine, grafico, ...); per esempio, data una funzione f : A B, la notazione
a f non ha senso; bisogna avere chiaro se si intende un elemento a A, un elemento f (a) f (A),
oppure un elemento (a, f (a)) G(f ), . . . e cos` via.
Una funzione f : A B `e surgettiva se B = f (A), cio`e per ogni elemento b B esiste a A tale che
f (a) = b. E iniettiva se per ogni b f (A), esiste un unico a A tale che f (a) = b. Attenzione a non
confondere (come agli studenti capita spesso) la definizione di funzione iniettiva con la definizione
stessa di funzione. La propriet`
a di essere iniettiva si pu`
o esprimere in modo equivalente dicendo

INSIEMI

che per ogni b f (A), f 1 ({b}) = {a}, oppure dicendo che per ogni coppia di elementi a1 , a2 A, se
a1 6= a2 allora f (a1 ) 6= f (a2 ).
Una funzione f : A B `e bigettiva se `e contemporaneamente iniettiva e surgettiva.
Per ogni A 6= ,
idA : A A, x A, idA (x) = x
`e la funzione identit`
a di A che `e evidentemente bigettiva. Se C A,
i : C A, x C, i(x) = x
`e la funzione di inclusione di C in A che `e evidentemente iniettiva.
Dati due insiemi non vuoti A e B indicheremo con
B A = {f : A B}
cio`e linsieme di tutte le applicazioni definite su A a valori in B.
1.5. Composizione di funzioni. Date due funzioni f : A B e g : B C, definiamo la funzione
composta
g f : A C, x A, (g f )(x) = g(f (x)) .
Se f `e bigettiva, possiamo definire la funzione inversa
f 1 : B A
dove per ogni b B, a = f 1 (b) `e lunico a A tale che f (a) = b; si ha che (f 1 f ) = idA ,
(f f 1 ) = idB .
Attenzione. Per ogni funzione f : A B e per ogni C B, abbiamo gi`a incontrato linsieme
immagine inversa f 1 (C). In questo caso non facciamo alcuna ipotesi particolare sulla funzione f .
Invece la funzione inversa f 1 `e definita solo se f `e bigettiva. Quindi il simbolo f 1 ha un significato
diverso nei due contesti. Attenti a non fare confusione.
2. Logichetta: proposizioni e teoremi
Allinterno di una teoria matematica (per esempio quella di Analisi I) si trattano proposizioni
sensate (in particolare formulate rispettando le regole di una certa sintassi - includendo nel nostro
caso le regole dellitaliano), che sono in modo esclusivo vere oppure false, cio`e non possono essere
contemporaneamente vere e false: capita una e una sola delle due possibilit`a. Il corpo della teoria in
un dato momento del suo sviluppo `e dato dallinsieme delle proposizioni che sono state riconosciute
come vere (e magari anche interessanti). La dimostrazione di un nuovo teorema della teoria accresce
il numero di proposizioni riconosciute come vere. Di solito la teoria non `e compiuta nel senso che
restano sul campo proposizioni sensate (e anche interessanti) che per`o sono ancora indeterminate,
cio`e non `e ancora noto se siano vere oppure false.
Si incontrano diversi tipi di proposizioni sensate. Per il tipo pi`
u semplice si fissa un insieme A, un
elemento a A e di predica una propriet`
a p che a pu`
o verificare (o no). La proposione `e vera se e
solo se a verifica la propriet`
a. Ad esempio
a = 5 N = A, p := 2|5 (cio`e 5 `e pari).
`e una proposizione (falsa) di questo tipo. A volte possiamo considerare famiglie di proposizioni di
questo tipo che dipendono da un parametro a che varia in A. Ogni volta che fissiamo il valore del
parametro, otteniamo una proposizione del tipo in questione. Una cosa di questo genere capita quando
definiamo un sottoinsieme si A per mezzo di una propriet`
a verificata dai suoi elementi. Per esempio
{n N| 2|n} N
definisce il sottoinsieme dei numeri pari.
Proposizioni pi`
u complicate si ottengono ammettendo che intervengano diversi elementi che variano
effettivamente e non necessariamente in un unico insieme. In questo caso `e essenziale luso corretto
dei due quantificatori esiste () e per ogni (). Esempi minimali di proposizioni di questo tipo
sono della forma:

INSIEMI

a A che verifica la propriet`


a p
oppure
a A, a verifica la propriet`
a p.
Lespressione senza quantificatori a A, a verifica la propriet`
a p, non `e sensata.
Di solito si ha per`
o a che fare con proposizioni sensate pi`
u complicate dove frammenti elementari si
combinano variamente. Per esempio incontreremo in seguito la seguente proposizione sensata (e vera
- il significato dei termini e i simboli usati saranno definiti in seguito):
f : [a, b] R continua, R, > 0, R, > 0, tale che x [a, b], y [a, b], se |y x| < ,
allora |f (y) f (x)| < .
Attenzione. In una proposizione in cui appaiono pi`
u di un quantificatore, lordine dei quantificatori
`e cruciale. Cambiando lordine il senso della proposizione pu`
o cambiare radicalmente. Si consideri ad
esempio:
n N, m N, m > n
m N, n N, m > n
nel primo caso si afferma che per ogni n esiste m pi`
u grande di n (vera: basta per esempio prendere
m = n + 1). Nel secondo caso si afferma che esiste m che `e pi`
u grande di qualsiasi n (falsa: infatti
per ogni m esiste n (per esempio n = m + 1) tale che m < n).
Le proposizioni si possono manipolare e combinare in modi che ricordano quanto abbiamo fatto con
gli insiemi. Se P e Q sono due proposizioni, abbiamo la proposizione
P o Q
che `e vera se e solo se P `e vera o Q `e vera. Qui o non `e esclusivo, come nella definizione dellunione
A B: richiediamo che almeno una delle due proposizioni sia vera.
La proposizione
P e Q
`e vera se e solo se P e Q sono entrambe vere, analogamente a quanto accadeva nella definizione
dellintersezione A B.
La negazione
non(P )
`e vera se e solo se P `e falsa. Chiaramente non(non (P ))=P (propriet`a che ricorda quelle del complementare CB (A)).
E importante sapere negare una proposizione. Per le proposizioni minimali, basta scambiare i quantificatori e negare la propriet`
a. Ad esempio la negazione di:
a N, a `e pari
(che `e falsa) `e
a N che non `e pari
(che `e vera). Per le proposizioni pi`
u complesse occorre applicare ripetutamente questa regola di base,
insieme allaltra per cui o e si scambiano, facendo un po di pratica. Per esempio:
non(P o Q) `e vera se e solo se `e vera non(P ) e non(Q). Si osserva lanalogia con:
CB (A D) = CB (A) CB (D)
non(P e Q) `e vera se e solo se `e vera non(P ) o non(Q). Si osserva lanalogia con:
CB (A D) = CB (A) CB (D) .

INSIEMI

Una proposizione della forma


P e non(P )
`e sempre falsa e viene detta una contraddizione. La sua negazione
non (P ) o P
`e sempre vera.
Tipicamente la dimostrazione di un teorema consiste nel verificare che una certa implicazione `e vera.
Un implicazione ha la forma
P = Q
e si legge se P allora Q. Infatti vale la seguente regola di deduzione:
Se P `e vera ed `e vera limplicazione P = Q, allora anche Q `e vera.
Dunque se P faceva gi`
a parte del corpo della teoria che stiamo sviluppando, dimostrando che limplicazione
`e vera, aggiungiamo Q al corpo della teoria. Il lettore esigente potrebbe pensare che in effetti non
abbiamo ancora detto precisamente cosa intendiamo per P = Q. Lo accontentiamo dicendo che `e
un altro modo di denotare la proposizione
non(P ) o Q
Si noti infatti che se questultima `e vera e P `e vera, allora non(P ) `e falsa e quindi necessariamente Q
`e vera, in accordo con la regola di deduzione che abbiamo enunciato sopra.
Un fatto spesso utile `e che limplicazione
P = Q
`e equivalente alla sua contronominale
non(Q) = non(P )
cio`e la prima implicazione `e vera se e solo se `e vera la seconda. Per esempio supponiamo di volere
dimostrare limplicazione:
h = f g iniettiva = g iniettiva
la contronominale `e
g non iniettiva = h = f g non iniettiva
e questa implicazione `e facile da dimostrare: infatti se x 6= y sono tali che g(x) = g(y), allora
h(x) = f (g(x)) = f (g(y)) = h(y).
Una versione pi`
u elaborata ma sostanzialmente equivalente alluso della contronominale `e la cosiddetta
dimostrazione per assurdo. Si procede cos`: volendo dimostrare limplicazione
P = Q
si dimostra invece unimplicazione della forma
P e non(Q) = S
dove sappiamo che S `e falsa. Allora, se P `e vera, necessariamente non(Q) `e falsa, perche altrimenti,
grazie alla solita regola di deduzione, S sarebbe vera ed invece sappiamo che `e falsa. Dunque Q `e
vera. Nella pratica molto spesso la S che funziona `e della forma
S = N e non(N )
cio`e `e una contraddizione.
Avvertenza: Nella parte che segue faremo riferimento al principio di induzione. Pertanto, prima
di procedere con la presente dispensa, conviene leggere (e capire) la dispensa [INDUZIONE].

INSIEMI

3. Insiemi finiti, numero di elementi


Per ogni n 1, il sottoinsieme di N
In = {0, 1, 2, . . . , n 1} N
`e linsieme finito campione con n 1 elementi.
Un insieme A `e finito se `e vuoto, oppure esistono n 1 e unapplicazione bigettiva f : In A. I
seguenti fatti sono del tutto intuitivi, non sono difficili da dimostrare e comunque saranno assunti
come veri.
Esiste unapplicazione bigettiva f : In Im se e solo se m = n.
Se A `e finito e non vuoto, allora esiste un unico n 1 per il quale esiste f : In A bigettiva.
Allora |A| = n `e per definizione il numero di elementi di A. Naturalmente poniamo || = 0.
Se A `e finito, C A, allora: C `e finito; |C| |A|; |C| = |A| se e solo se C = A.
A e B finiti non vuoti, allora:
(i) |A| |B| se e solo se esiste f : B A iniettiva.
(ii) |A| = |B| se e solo se esiste f : B A bigettiva.
(iii) |A| = |B| se e solo se |A| |B| e |A| |B|.
3.1. Un po di calcolo combinatorio. In una certa misura il calcolo combinatorio consiste nel
determinare il numero di elementi di un certo insieme finito A in funzione del numero di elementi di
altri insiemi finiti che intervengono nella definizione di A. Vedremo alcuni esempi.
(1) Siano |A| = m, |B| = n, n, m 1. Allora |B A | = nm . Dimostriamolo per induzione su m 1.
Se m = 1, A = {a}, e ci sono n modi di definire f (a). Se |A| = s + 1, fissiamo a A e sia
A = A \ {a}. Quindi |A | = s. Ci sono n modi di definire b = f (a). Per ogni scelta di b = f (a)
questa si completa ad una f : A B, per mezzo di una qualsiasi funzione g : A B. Per
induzione ci sono ns possibilit`a per definire g e quindi in totale n ns = ns+1 possibilit`a per
definire f .
(2) Se |A| = n, allora |P(A)| = 2n . Diamo una prima dimostrazione costruendo unapplicazione
bigettiva
f : P(A) {0, 1}A .
In tal caso si avr`
a che |P(A)| = |{0, 1}A| = 2n . Per ogni C P(A), sia 1C : A {0, 1}
tale che 1C (x) = 1 se e solo se x C. Questa `e detta la funzione indicatrice del sottoinsieme
C. Poniamo allora f (C) = 1C . Dimostriamo che f `e iniettiva: infatti se C 6= C (a meno
di invertire lordine dei due insiemi) esiste x C tale che x
/ C . Ma allora 1 = 1C (x) 6=

1C (x) = 0, cio`e f (C) 6= f (C ). Dimostriamo che f `e surgettiva. Infatti data g : A {0, 1},
sia C = g 1 (1). Allora f (C) = 1C = g.
Diamo ora un altra dimostrazione per induzione su n 0. Se n = 0, A = , P(A) = {},
1 = 20 . Supponiamo ora che |A| = n+1. Fissiamo a A. Definiamo X = {C P(A)| a C},
Y = {C P(A)| a
/ C}. Allora P(A) = X Y e X Y = . Ne segue che |P(A)| = |X| + |Y |.
Sia A = A \ {a}. |A | = n. Definiamo
: P(A ) X, (C) = C {a}
: P(A ) Y, (C) = C .
Si verifica facilmente che sono entrambe bigettive. Allora, per induzione |X| = |Y | = |P(A )| =
2n , |P(A)| = 2n + 2n = 2n+1 .
(3) Se |A| = n, |B| = m, m n 1, poniamo i(A, B) linsieme delle applicazioni iniettive definite
m!
su A a valori in B. Allora |i(A, B)| = m(m 1) . . . (m n + 1) =
. Operiamo per
(m n)!
induzione su n 1. Per n = 1, A = {a}, e ci sono m modi di definire b = f (a) B. Se
|A| = s + 1, s + 1 m, fissiamo a A, poniamo A = A \ {a}, |A | = s. Ci sono m modi di
assegnare b = f (a) B. Fissato uno di questi modi ci sono |i(A , B \ {b})| modi di completare
il dato b = f (a) ad unapplicazione iniettiva definita su tutto A. Dunque, per induzione,

INSIEMI

|i(A, B)| = m[(m 1) . . . (m 1 (n 1) + 1)] come voluto. Se n = m, i(A, B) `e linsieme


delle applicazioni bigettive definite su A a valori in B e risulta |i(A, B)| = n! .
(4) Sia |A| = n, 0 m n. Poniamo
Pm (A) := {C P(A)| |C| = m}
 
n
:= |Pm (A)| .
m
Ricaviamo un metodo induttivo per calcolare questi numeri, noto anche come triangolo di
Tartaglia detto anche di Pascal.
Il triangolo in questione `e dato
di N2 , T = {(n, m) N2 | n m}.
 dal
 sottoinsieme
 
n
n
Lungo il bordo di T abbiamo
=
= 1. Infatti A `e lunico sottoinsieme di A
n
0
con n elementi, `e lunico con 0 elementi.
Consideriamo ora 0 < m < n. Fissiamo a A. A = A \ {a}. |A | = n 1. Con lo stesso
argomento della dimostrazione induttiva vista sopra di |P(A)| = 2n , osserviamo che:
|Pm (A)| = |Pm1 (A )| + |Pm (A )|
da cui equivalentemente:
  
 

n
n1
n1
=
+
.
m
m1
m
 
n
Questo schema induttivo determina completamente
per ogni (n, m) T . Per ricondursi
m
ad una induzione formalmente pi`
u ordinaria, definiamo per ogni (n, m) T la distanza d(n, m)
di (n, m) dal bordo di T come il numero minimo di segmenti orizzontali o verticali nel piano R2
con estremi in N2 che `e necessario percorrere per andare da (n, m) ad un punto di coordinate
(p, p) o (p, 0). Chiaramente d(p, p) = d(p, 0)= 0.
 Allora lo schema induttivo stabilito sopra
n
pu`
o essere riconvertito in una definizione di
per induzione su d = d(n, m) 0.
m
Nelle stesse ipotesi, poniamo adesso
n!
.
F (n, m) =
m!(n m)!
Affermiamo che

 
n
F (n, m) =
.
m
Ci sono almeno due modi per dimostrarlo; il primo consiste
nel verificare algebricamente che
 
n
F (n, m) verifica lo stesso schema induttivo che definisce
, cio`e che:
m
F (n, 0) = F (n, n) = 0
F (n, m) = F (n 1, m 1) + F (n 1, m) .
Il secondo metodo considera lapplicazione surgettiva
g : i(Im , A) Pm (A), g(h) = h(Im )
cio`e g associa ad ogni applicazione iniettiva h : Im A la sua immagine che ha appunto m
elementi. Si osserva poi che per ogni C Pm (A) ci sono m! funzioni h tali che g(h) = h(Im ) =
C. Si conclude che
 
|i(Im , A)|
n
= F (n, m) .
=
m!
m
Segue inoltre dalle considerazioni precedenti che:
n
n  
X
X
n
|Pj (A)| = |P(A)| = 2n .
=
j
j=0
j=0

INSIEMI

 
n
si chiamano anche coefficienti binomiali perche intervengono nello sviluppo
m
delle potenze di un binomio secondo la formula di Newton:
n  
X
n j nj
n
a b
(a + b) =
j
j=0

(5) I numeri

che si pu`
o dimostrare sia per induzione
su n 0, sia identificando esplicitamente il coefficiente
 
n
del monomio aj bnj con il numero
, usando la prima definizione che ne abbiamo dato.
j
`
4. Insiemi infiniti, cardinalita
Un insieme A `e infinito se non `e finito. Vogliamo estendere la nozione di numero degli elementi al
caso di insiemi arbitrari (finiti o infiniti). Prendiamo alcune delle propriet`
a del numero di elementi di
un insieme finito come modello della definizione generale.
Definizione 4.1. Dati due insiemi A e B diciamo che A ha cardinalit`
a (a volte si dice anche potenza)
maggiore o uguale a quella di B (e scriveremo |A| |B|) se esiste f : B A iniettiva. Diremo che A
e B hanno la stessa cardinalit`
a e scriveremo |A| = |B|, se esiste g : B A bigettiva. Diremo che A
ha cardinalit`
a strettamente maggiore a quella di B e scriveremo |A| > |B|, se |A| |B| ma |A| 6= |B|,
cio`e esiste f : B A iniettiva ma non esiste g : B A bigettiva.
Nel caso degli insiemi finiti ritroviamo lusuale numero di elementi |A| N. In generale la cardinalit`
a
non `e un numero ma una specie di qualit`a condivisa da due insiemi correlati da una applicazione
bigettiva. Se |A| = |N|, allora diciamo che A `e numerabile. Bisogna stare attenti perche diverse
propriet`
a che sono intuitivamente evidenti nel caso degli insiemi finiti, invece non sono pi`
u vere
per gli insiemi infiniti, come mostra il punto (2) nel seguente teorema. Questo sar`a conseguenza di
un ulteriore propriet`
a che postuliamo verificata dagli insiemi. Ancora una volta, questa propriet`
a `e
intuitivamente del tutto accettabile nel caso degli insiemi finiti, lo `e molto meno per quelli infiniti. Si
stratta dellesistenza di funzioni di scelta:
Per ogni insieme non vuoto A e per ogni X P(A) non vuoto tale che ogni C X, C 6= , postuliamo
lesistenza di una funzione (di scelta)
s:XA
tale che per ogni C X, s(C) C. In altre parole la funzione s sceglie un elemento s(C) in ogni
insieme C appartenente alla famiglia X di sottoinsiemi non vuoti di A.
Teorema 4.1. (1) Sia A un insieme infinito. Allora |A| |N|.
(2) Linsieme A `e infinito se e solo se esiste B A, B 6= A, tale che |A| = |B|.
Dim. (1) Sia X il sottoinsieme di P(A) formato dai sottoinsiemi non vuoti di A. Definiamo per
induzione f : N A iniettiva, partendo da una funzione di scelta s : X A (di cui abbiamo
postulato lesistenza). Poniamo allora f (0) = s(A), f (n + 1) = s(A \ {f (0), . . . , f (n)}). Si osservi che
f `e ben definita perche, essendo A infinito, per ogni n, A \ {f (0), . . . , f (n)} `e non vuoto. E immediato
che f cos` definita `e iniettiva.
(2) Se A `e finito sappiamo gi`
a che un tale B non esiste. Resta da dimostrare che invece esiste se A
`e infinito. Dimostriamo intanto la tesi quando A = N. Poniamo B = 2N, cio`e linsieme dei numeri
pari. g : N 2N, g(n) = 2n `e bigettiva, quindi |N| = |2N|. In generale sia f : N A iniettiva come
in (1). A = f (N) CA (f (N)) e poniamo: B = f (2N) CA (f (N)); G : A B, G(x) = f (g(f 1 (x)))
se x f (N), G(x) = x altrimenti. G `e bigettiva.
2
Altre propriet`
a del numero degli elementi invece si generalizzano alla cardinalit`
a degli insiemi (anche
infiniti). Indichiamone alcune.
Vale in generale il seguente Teorema di Bernstein la cui dimostrazione, abbastanza complicata,
viene omessa.
Teorema 4.2. Dati due insiemi A e B, se |A| |B| e |B| |A|, allora |A| = |B|.

INSIEMI

Si ricordi che le cardinalit`


a non sono numeri ordinari. Si tratterebbe di dimostrare che se
esistono f : B A e h : A B entrambe iniettive (e a priori del tutto indipendenti tra loro),
allora esiste g : A B bigettiva. Se ci si pensa un pochino si capisce che la cosa non `e affatto
evidente.
Abbiamo visto prima che se A `e finito, |A| = n, allora |P(A)| = 2n e quindi |P(A)| > |A|.
Anche questa propriet`
a si generalizza.
Teorema 4.3. Per ogni insieme A, |P(A)| > |A|.
Dim. Dimostriamo intanto che |P(A)| |A| cio`e che esiste f : A P(A) iniettiva. Infatti
basta porre per ogni a A, f (a) = {a}. Per concludere basta dimostrare che qualsiasi
g : A P(A) non pu`
o essere surgettiva. Infatti, data g, poniamo C = {x A| x
/ g(x)}.
Affermiamo che C non appartiene allimmagine g(A). Infatti se fosse C = g(y), y C se e
solo se y
/ g(y) = C e questo `e assurdo.
2
Se A e B sono finiti ed esiste g : A B surgettiva, allora `e facile vedere che |A| |B|. Anche
questa propriet`
a si generalizza:
Teorema 4.4. Sia g : A B unapplicazione surgettiva. Allora |A| |B|.
Dim. Vogliamo mostrare che esiste f : B A iniettiva. Per ogni b B, Xb = g 1 (b)
P(A) `e non vuoto perche g `e surgettiva. Poniamo X = {Xb | b B}. Sia s : X A una
funzione di scelta. Definiamo f (b) = s(Xb ). Resta da verificare che f `e iniettiva. Infatti se
b 6= b , Xb Xb = , da cui f (b) 6= f (b ) perch`e appartengono a sottoinsiemi disgiunti di A.
2
Osservazioni 4.2. (Per un lettore particolarmente interessato.) Abbiamo detto allinizio che la
possibilit`a di formare insiemi i cui elementi sono insiemi `e un punto delicato che pu`
o portare a serie
difficolt`
a. Ispirati anche dalla penultima dimostrazione, consideriamo l insieme U formato da tutti
gli insiemi che non sono un elemento di se stessi. Allora U U se e solo se U
/ U . Questo `e
assurdo, quindi nella nostra teoria c`e un paradosso. Potremmo cercare di aggirarlo aggiungendo agli
assiomi della nostra teoria degli insiemi la propriet`
a che ogni insieme non pu`
o essere un elemento
di se stesso. Ma il paradosso riappare considerando ora come U l insieme di tutti gli insiemi. Un
modo pi`
u sostificato di aggirare il paradosso `e allora quello di decretare che U non `e un insieme,
accettando cos` di pagare il prezzo che la nostra teoria degli insiemi non `e chiusa in se stessa e si
immege in una qualche sovra-teoria (in cui magari si annidano altri paradossi meno immediati....).
Ma anche pagando questo prezzo, nella pratica lavoriamo tranquillamente con molti insiemi di
insiemi che, appunto, abbiamo decretato essere insiemi. E se ci fosse annidato da qualche parte un
paradosso meno evidente ma altrettanto fatale .... ?
4.1. Alcuni confronti di cardinalit`
a. Dimostriamo per esempio che |N| = |N2 |. Costruiamo cio`e
2
2
f : N N bigettiva. Consideriamo N come un sottoinsieme del piano R2 . Consideriamo la famiglia
di rette parallele rn , n 0, di equazione x + y = n. Sia Un = rn N2 . Allora: per ogni n N,
|Un | = n + 1; Un Um = se n 6= m; N2 = nN Un . Ordiniamo totalmente gli elementi di N2 nel
modo seguente:
Se (a, b) rm , (c, d) rn , n > m, allora (c, d) > (a, d).
Se (a, b), (c, d) rm , a > c, allora (a, b) > (c, d).
Si verifica che `e un buon ordinamento (linsieme degli Un `e bene ordinato come lo `e N, ogni Un `e finito
e quindi ben ordinato). Si pu`
o allora definire f per induzione, ponendo f (0) = (0, 0) cio`e uguale al
minimo elemento di N2 , f (n + 1) uguale al minimo elemento di N2 \ {f (0), . . . , f (n)}.
Dimostriamo che |N| = |Q+ |. Usando la rappresentazione di ogni numero razionale per mezzo di
ununica frazione ridotta ai minimi termini abbiamo che
n
Q+ = { | (n, d) N2 , d > 0, MCD(n, d) = 1} .
d
Lapplicazione
n
j : Q+ N2 , j( ) = (n, d)
d

10

INSIEMI

`e evidentemente iniettiva. Consideriamo j 1 : j(Q+ ) Q+ che `e bigettiva. Consideriamo su N2 il


buon ordinamento totale gi`
a usato prima. Il sottoinsieme j(Q+ ) N2 eredita un buon ordinamento
totale. Possiamo allora definire per induzione g : N j(Q+ ) bigettiva usando la stessa procedura
usata prima per definire f : N N2 . Infine j 1 g : N Q+ `e lapplicazione bigettiva cercata. Questo
risultato pu`
o apparire anti-intuitivo se consideriamo N e Q+ come sottoinsiemi di R+ e ricordiamo che
N `e discreto mentre Q+ `e denso in R (vedi [REALI]). Il punto `e che quando trattiamo la cardinalit`
a,
gli insiemi sono nudi cio`e privi di qualsiasi altra struttura ulteriore (quale quella, per esempio, che
`e necessaria per potere definire cosa vuol dire che Q `e denso in R).
Poiche linclusione i : N R `e iniettiva, ne segue che |R| |N|. In effetti si pu`
o mostrare che |R| > |N|
(vedi [AD]).
Osservazioni 4.3. (Per un lettore particolarmente interessato.) Consideriamo la seguente proposizione sensata
Esiste un insieme infinito X tale che |N| < |X| < |R|.
La sua negazione `e anche nota come ipotesi del continuo. Per lungo tempo `e stata una proposizione
indeterminata della teoria degli insiemi(nel senso di quanto detto nel capitolo 2). Alla fine `e stato
appurato che `e in effetti indecidibile. Questultimo aggettivo ha un significato preciso e molto riposto
che non siamo in grado qui di spiegare. Vogliamo solo segnalare che lo studio di questa proposizione
ha portato ad alcune delle riflessioni pi`
u profonde sui fondamenti della logica e della matematica.

12 Ottobre 2014
I Reali: un approccio quasi assiomatico.

Indice
1 Primi passi.

2 Alcune propriet`
a (importanti) di R.

Estremo superiore ed estremo inferiore.

4 Un teorema di unicit`
a.

10

5 Rappresentazione decimale.

11

6 Approssimazione.

13

7 Radici e potenze.

14

8 Rappresentazione decimale e numeri razionali: algoritmo della frazione generatrice.


16

Primi passi.

Dovendo introdurre i reali `e dobbligo un riferimento al mondo greco, al loro gusto


per la riflessione teorica, ed al fatto che la scoperta della non commensurabilit`a del
lato e della diagonale del quadrato abbia messo in crisi i fondameni di una concezione
del mondo, che vedeva tutto come proveniente da un armonico assembramento di
particelle elementari.
Ci`o si applicava in particolare anche alle grandezze geometriche, intuitivamente recepite come omogenee: questa scoperta metteva in crisi il fatto che due grandezze
avessero sempre un comune sottomultiplo e quindi che tutti i rapporti fra grandezze
potessero esser valutati in termini di rapporti di numeri interi, arrivando in un certo
senso a valutare quanti elementi corpuscolari simili le costituissero.
Ad esempio si pensi al processo pitagorico che poteva portare alla determinazione
di una possibile grandezza in comune tra due grandezze pensate come lunghezze di
due segmenti. Si prende il segmento pi`
u corto e si ricopre quello pi`
u lungo con tante
copie di quello pi`
u corto: se si arriva a ricoprirlo si finisce altrimenti si prende il

segmento rimanente e si cerca di ricoprire il pi`


u corto con tante copie di questultimo.
Anche qui se ci si riesce si termina altrimenti si ricomincia. Per i pitagorici questo
procedimento avrebbe dovuto sempre terminare e questo `e praticamente equivalente
alla commensurabilit`a: una sorta di algoritmo di Euclide geometrico. La scoperta
di grandezze incommensurabili dava una scossa proprio a questa concezione.
A tutto ci`o si aggiunse lazione critica di altri pensatori come Zenone che non riuscivano a conciliare questa visione con il fatto che una grandezza finita potesse risultare
dalla somma di un numero infinito di grandezze finite (Achille e la tartaruga).
Anche se queste idee saranno presenti in sottofondo lungo tutto il testo, ripercorrerle
in dettaglio `e per`o fuori dagli scopi di queste brevi note e preferiamo rimandare per
una trattazione pi`
u sistematica a testi di storia della matematica o della scienza.
Vogliamo qui solo introdurre in modo rapido linsieme dei numeri reali seguendo
un approccio astratto che si rif`a a Dedekind, ancorche anche egli, almeno a suo
dire, probabilmente altro non fece che evidenziare le idee gi`a espresse nel mondo
greco, rifacendosi al metodo per confrontare due grandezze detto di esaustione e
al principio di Eratostene, che per comodit`a del lettore riportiamo qui di seguito
utilizzando terminologie pi`
u moderne.
Pricipio di Eratostene. Diremo che due grandezze a e b sono nella stessa proporzione
di altre due grandezze A e B se comunque fissati due numeri interi positivi m e n si
ha
ma < nb se e solo se mA < nB
ma > nb se e solo se mA > nB
Fissiamo il contesto. Il nostro punto di partenza saranno gli insiemi numerici, nel
senso che daremo per noti gli insiemi dei numeri naturali (N), dei numeri interi (Z) e
dei numeri razionali (Q) con le loro principali propriet`a e la usuale rappresentazione
decimale dei numeri razionali.
Cerchiamo un insieme X che estenda gli insiemi N, Z e Q e in cui si possano fare delle
operazioni e delle considerazioni che ad esempio in Q non si possono fare, come ad
esempio la misurazione della diagonale del quadrato o provare che Achille raggiunge
la tartaruga.
Abbiamo pertanto bisogno di un insieme X e del fatto che su questo insieme si
possano fare (siano cio`e definite) due operazioni che chiameremo somma e prodotto
e che indicheremo rispettivamente con + e con . Una operazione (binaria) su X
altro non `e che una legge che associa ad una coppia di elementi di X un altro
elemento di X: si pensi allusuale somma in Z. Vorremo inoltre poter operare con
un certo numero di regole di calcolo: chiederemo quindi che le operazioni soddisfino
un numero minimo di regole da cui poter ricavare le altre, cio`e che le operazioni
verifichino un elenco, se pur minimo, di assiomi.
Abbiamo quindi bisogno di un insieme X, la natura dei cui elementi per ora lasciamo nel vago, e su X pensiamo definite due operazioni, cio`e due applicazioni che
chiameremo rispettivamente somma e prodotto
2

X X X, (x, y) x + y
X X X, (x, y) x y
che verificano i seguenti assiomi:
1. assiomi per loperazione somma
S1 (associativit`a) x, y, z X

S2 (commutativit`a) x, y X

(x + y) + z = x + (y + z)
x+y =y+x

S3 (esitenza elemento neutro) u X : x X

x+u=x

S4 (esitenza inverso) x Xx : x + x = u
2. assiomi per loperazione prodotto
P1 (associativit`a) x, y, z X

P2 (commutativit`a) x, y X

(x y) z = x (y z)
xy =yx

P3 (esitenza elemento neutro) e X : x X

P4 (esitenza inverso) x 6= u x : x x = e

xe=x

3. e di un assioma che leghi il comportamento delle due operazioni, cio`e che le


operazioni definite non siano del tutto indipendenti tra di loro:
Dis (distributivit`a) x, y, z X

x (y + z) = x y + x z

Per comodit`a di notazione indicheremo con 0 lelemento neutro per loperazione +


e con 1 quello per loperazione e indicheremo con x linverso dellelemento x per
loperazione + e con x1 quello per loperazione ed abbrevieremo con x x la
scrittura x + (x).
Dagli assiomi discende immediatamente che lelemento neutro per la somma `e unico;
supponiamo infatti che ve ne siano due u e v: risulta immediatamente dagli assiomi
S3 ed S2 che u = u+v = v. Allo stesso modo si ha che linverso per la somma `e unico;
siano infatti x ed x due inversi per x si ha x = 0+x = (x +x)+x = x +(x+x ) =
x + 0 = x . Notare che lassioma S2 permette di non fare distinzioni tra inverso
destro e sinistro. Avremo anche bisogno di richiedere che 1 6= 0. Propriet`a analoghe
si dimostrano per il prodotto.
Da questi assiomi discendono immediatamente, con dimostrazioni analoghe a quelle
viste, quelle che potremmo chiamare regole di calcolo in X e che sono le usuali regole
aritmetiche. Vediamone qualcuna.

1. x X

x0=0x=0

Prova: x 0 = x (0 + 0) = x 0 + x 0 da cui x 0 = 0

2. (x)y = (xy) = x(y)

Prova: 0 = 0 y = (x + (x))y = xy + (x)y da cui (x)y = (xy) ed


analogamente a destra.
2

3. (x)(y) = xy
Prova: Da (2) si ha (x) y = (x y). Sempre per (2) (x) (y) =
(x) (y) = x y per unicit`a dellopposto.
2

Analogamente a queste si ricavano tutte le altre usuali regole di calcolo: osserviamo


in particolare che la regola di calcolo (1) fornisce una giustificazione del fatto che
nellassioma P4 viene posta la condizione di non essere lelemento neutro per la
somma.
Un insieme dotato di due operazioni verificanti questi 9 assiomi viene detto brevemente corpo commutativo o campo.
Avremo bisogno inoltre che sull insieme X sia definita anche una relazione di ordine
che indicheremo con .

Gli assiomi (le richieste) per la relazione dordine sono i seguenti

O1 (dicotomia) x, y X `e vera una delle seguenti due relazioni x y o y x


O2 (riflessivit`a) x Xx x
O3 (antisimmetria) x y e y x x = y
O4 (transitivit`a)x y e y z x z
Con i seguenti due assiomi esprimiamo infine che tale relazione sia compatibile con
le operazioni esistenti
14 x y x + z y + zx, y, z X
15 x 0 e y 0 x y 0
Un insieme verificante tutti questi 15 assiomi viene detto brevemente un campo
ordinato. Un esempio di insieme siffatto, cio`e di campo ordinato `e linsieme dei
numeri razionali Q.
4

Anche qui si pu`o verificare rapidamente che da questi assiomi si possono dedurre le
usuali regole di calcolo.
Un insieme X dotato di queste propiet`a `e una estensione di Q, nel senso che esiste
una applicazione iniettiva : Q X che rispetta la struttura, cio`e
a, b Q

(a + b) = (a) + (b)
(a b) = (a) (b)
a b (a) (b)
Una tale si ottiene in questo modo: facciamo corrispondere allelemento 0 Q
lelemento neutro per la somma ed al numero razionale 1 lelemento neutro per il
prodotto; definiamo (n) la somma di n volte lelemento neutro per il prodotto
) = (m) ((n))1 si ha una estensione a tutto Q. L
ed infine ponendo ( m
n
applicazione cos` definita `e iniettiva (perche?).
Quindi in un insieme dotato di queste propriet`a sappiamo ritrovare i numeri naturali, gli interi ed i razionali. Continueremo ad indicare con la simbologia usuale
gli interi e i razionali anche pensati dentro X se la cosa non d`a adito a confusione.
Fatte queste premesse, dentro un campo ordinato completo possiamo rifare tutti gli
abituali calcoli dellaritmetica elementare, per esempio risolvere equazioni e disequazioni lineari. Per il momento con la parola risolvere intenderemo solo descrivere
in modo a noi pi`
u intelligibile il sottoinsieme descritto dalla relazione.
Vediamo su un esempio che cosa significhi: trasformiamo la descrizione di alcuni
insiemi applicando gli assiomi (si cerchi di comprendere ad ogni passaggio la sua
liceit`a, nel senso quali assiomi ci garantiscono che i due insiemi sono uguali)
{x X|3x + 1 > 4} = {x X|3x + 1 1 > 4 1} = {x X|3x > 3} = {x X|x >
1}
Ma ancora un insieme con queste propriet`a non ci basta. Infatti Q `e un esempio di
campo ordinato e abbiamo gi`a detto che in Q non `e possibile trovare un numero il
cui quadrato sia 2, cio`e risolvere lequazione x2 = 2.
Mostriamolo, ripercorrendo pi`
u o meno la prova dei greci per lincommensurabilit`a
della diagonale del quadrato.
Proposizione 1.1. Non esiste alcun elemento r Q tale che r2 = 2
Prova: Vogliamo provare che per nessun numero razionale m
si ha ( m
)2 = 2.
n
n
Supponiamo che al contrario ci`o sia vero: possiamo supporre che m, n siano primi
tra di loro (perche?) e quindi di diversa parit`a. Da m2 = 2n2 deduciamo che m
non puo esser dispari (altrimenti il suo quadrato sarebbe ancora dispari) quindi m2
`e divisibile per 4, quindi anche n2 `e pari e quindi anche n lo `e arrivando ad una
contraddizione..
5

Dedekind ( 1875) riprese il punto di vista dei greci e chiese un altro assioma, oggi
conosciuto come assioma di continuit`a o completezza.
16 Assioma di continuit`
a. Se A e B sono due sottoinsiemi non vuoti di X con
A B nel senso che a A, b B a b allora esiste in X un elemento c tale che
AcB
nel senso che a A, b B a c b

Un insieme verificante tutti i 16 assiomi esposti verr`a detto campo ordinato completo.
Assunzione: da questo momento supporremo che linsieme X sia un campo ordinato completo.
Mostriamo a solo titolo esemplificativo come lassioma di completezza garantisca
lesistenza in un campo ordinato completo della radice di 2.
Proposizione 1.2. Sia X un campo ordinato completo. Lequazione x2 = 2 ammette almeno una soluzione.
Prova: Indichiamo con A = {x X|x > 0 e x2 < 2} e B = {x X|x > 0 e x2 > 2}

Dagli assiomi risulta che A < B nel senso che ogni elemento di A `e minore di ogni
elemento di B e pertanto per lassioma 16 esiste un elemento separatore c in X.
A c B.
Quello che vogliamo provare `e che c2 = 2.

Supponiamo che c2 < 2. Se posso trovare in X un > 0 tale che (c + )2 < 2 ho


una contraddizione perche (c + )2 < 2 c A e > 0 c + > c contro il fatto
che ogni elemento di A `e minore di c.
Il fatto che c2 < 2 implica che esiste un altro elemento X tale che c2 + < 2.
2
, in quanto c2 < 2 c2 + 2 < 4 e quindi
Ad esempio posso prendere = 2c
2
2
c2 + 2c
< 2.
2
Risulta, applicando gli assiomi,
(c + )2 = c2 + 2c + 2 = c2 + (2c + )
Se posso trovare < c ho
(c + )2 = c2 + (2c + ) < c2 + 3c
e se posso trovare un <

3c

risulta

(c + )2 < c2 + 3c < c2 + < 2


Quindi prendendo = min{c, 3c } si ha c + A che, come abbiamo detto, `e in
contraddizione con c A.
6

Osserviamo che se chiediamo a tale elemento di essere positivo allora non solo esiste
ma `e anche unico. Siano infatti x e y due elementi in X tali che x2 = y 2 = 2
Da x2 = y 2 otteniamo (x y)(x + y) = 0 e dalla positivit`a di x e y otteniamo x = y.
Questo ragionamento opportunamente esteso prover`a che in X per ogni a > 0 e n
intero positivo lequazione xn = a ha soluzioni in X.

Alcune propriet`
a (importanti) di R.

Talvolta indicheremo con R un campo ordinato completo X. Tale notazione sar`a


giustificata tra qualche paragrafo quando avremo accennato allunicit`a di un siffatto
X che quindi potremo chiamare il campo dei reali
Proposizione 2.1. N non `e limitato in R
Prova: Ragioniamo per assurdo. Sia
M = {x R|x n n N}
e supponiamo che M sia non vuoto.
Essendo ogni elemento di N minore di ogni elemento di M per lassioma di continuit`a
esiste un elemento c separatore.
NcM

()

Esiste quindi un numero naturale m tale che


c1<mc
altrimenti c 1 apparterrebbe a M .

Si avrebbe pertanto c < m + 1 in contrasto con (*)

Da qui discende immediatamente


Proposizione 2.2 (Propriet`
a di Archimede). Siano x, y X con x > 0. Esiste
un intero positivo n tale che nx > y
Prova: La Proposizione 2.1 garantisce che esiste un n >

y
x

da cui la proposizione.
2

Proposizione 2.3. Per ogni elemento x X esiste (unico) un intero k tale che
k x<k+1
Prova: Suppuniamo x > 0. Linsieme S = {n N| n x} `e non vuoto e per la
Proposizione 2.1 finito. k = max S verifica le richieste. La prova per il caso in cui
x < 0 `e del tutto analoga.
2

Lintero la cui esistenza `e garantita da questa proposizione viene detto la parte intera
di x e viene comunemente indicato con [x]; cio`e si ha
[x] x < [x] + 1.
Proposizione 2.4. Dato un elemento x X ed un altro elemento X positivo,
esiste un numero razionale r Q X tale che
r x<r+
Prova: Per prima cosa scegliamo un naturale m, la cui esistenza `e assicurata dalla
Proposizione 2.1, tale che m > 1 , cio`e m1 < . Per Prop.2.2 esiste un intero n tale
che
n mx < n + 1
e quindi

Quindi

n
m

n
1
n
n
x<
+
<
+
m
m m
m
verifica le richieste.

Proposizione 2.5 (Densit`


a di Q in X). Dati due elementi x e y di X con x < y
esiste un numero razionale tra x e y.
Prova: Per la proposizione precedente esiste r Q tale che r y < r + (y x). Ne
segue che x = y (y x) < r e quindi
x<ry
.
2

Proposizione 2.6 (Non esistenza di infinitesimi). Se x X e |x|


N \ {0} allora x = 0.

Prova: Se fosse x 6= 0 si avrebbe che

1
n

1
contraddirrebbe la propriet`a di Archimede.
|x|
2

Estremo superiore ed estremo inferiore.

Partiamo da una considerazione: ogni sottoinsieme A X non vuoto e finito ammette massimo e minimo. Lo si pu`o facilmente provare per ricorrenza. Detto n il
numero di elementi di A la propriet`a `e banalmente vera se n = 1. Supponendo vera
la propriet`a per ogni insieme costituito da n 1 elementi, si tolga ad A un qualsiasi
elemento ......
Questa propriet`a non susssiste pi`
u per gli insiemi infiniti, come ci si convince facil` chiaro che un qualsiasi
mente considerando A = (0, 1) = {x R|0 < x < 1}. E
numero maggiore di 1 non `e il massimo di A perche non appartiene allinsieme ed `e
anche immediato che A non pu`o contenere un elemento pi`
u grande di tutti: se ad
< 1. Quindi
esempio d fosse tale elemento dovrebbe essere d < 1 e quindi d < 1+d
2
A non ha massimo ed analogamente si vede che non ha minimo.
Per`o lassioma di continuit`a ci assicura una cosa:
Proposizione 3.1 (Estremo superiore). Sia X un corpo ordinato completo ed
A X un sotoinsieme non vuoto limitato superiormente. Linsieme M dei maggioranti di A ammette minimo.
Prova: Gli insiemi A e M sono entrambi non vuoti e a A, m M a m.
Lassioma di continuit`a garantisce lesistenza di un elemento separatore c.
A c M.
Dunque per ogni a A si ha a c e questo prova che c `e un maggiorante. Daltra
parte per ogni m M si ha c m e questo basta a concludere che c `e il minimo
dei maggioranti.
2

Lelemento individuato nella proposizione precedente si chiama estremo superiore di


A e viene indicato spesso come sup A.
Proposizione 3.2 (Caratterizzazione del sup). Sia A un sottoinsieme non vuoto
di un corpo ordinato completo X limitato superiormente. Lelemento L = sup A `e
caratterizzato dalle seguenti propriet`a:
1. a A L a
2. > 0 a A : a > L
Prova: La condizione 1 dice che L `e un maggiorante mentre la 2 dice che ogni
elemento inferiore ad L non lo `e.
Se L `e il sup A verifica banalmente le propriet`a 1). Se non verificasse la propriet`a
2) esisterebbe un 0 > 0 tale che L 0 risulti maggiore o uguale ad ogni elemento
di A in contraddizione col fatto che L `e il minimo dei maggioranti.
9

Viceversa supponiamo che L verifichi le propriet`a (1) e (2) della proposizione.


Dobbiamo verificare che allora L `e il minimo dei maggioranti di A.
Supponiamo che non lo sia cio`e L 6= sup A. Poiche sup A `e il minimo dei maggioranti ed L `e un maggiorante si ha L sup A > 0; la condizione (2) prendendo
= L sup A ci dice che esiste a A con a > L = L L + sup A = sup A
contraddicendo il fatto che sup A `e un maggiorante di A.
2

Un teorema di unicit`
a.

Un teorema importante a questo punto `e quello che ci assicura lunicit`a di un tale


X.
Proposizione 4.1. Siano X1 e X2 due corpi ordinati completi. Allora esiste una
applicazione biunivoca : X1 X2 che rispetta le operazioni, nel senso che
1. (x + y) = (x) + (y)
2. (x y) = (x) (y)
3. x y (x) (y)
Lidea della prova `e di costruire questa a partire dalle mappe 1 e 2 che riconoscono Q dentro rispettivamente X1 e X2 .

Q1
~>>
~
~~
~~
~
~

Q@
@@

@@ 2
@@
@ 
1

X1

Q2



X2

Idea della prova. Siano Q1 e Q2 i razionali in X1 e in X2 , cio`e i sottoinsiemi i (Q).


Lapplicazione = 2 1
e una applicazione biunivoca che conserva
1 da Q1 a Q2 `
`
le operazioni e lordinamento. E possibile prolungare questa applicazione ponendo
per ogni x X1 (x) = sup{(y) y Q1 y < x}. Resta da provare, e viene lasciato
come esercizio, che tale estensione `e biunivoca e conserva la struttura.
Questo teorema ci garantisce che comunque noi troviamo un insieme che verifica
gli assiomi enunciati questo sar`a un modello di un tale X, insieme che dora in poi
chiameremo insieme dei numeri reali e che indicheremo con R

10

Rappresentazione decimale.

Cerchiamo di esprimere in una forma con cui poter trattare pi`


u agevolmente i numeri
reali. Innanzitutto ricordiamo che dentro questo insieme R abbiamo una copia dei
con m, n Z.
razionali che continuiamo a scrivere con labituale notazione m
n
a
Per numeri decimali intenderemo i razionali della forma m ove a `e un intero ed
10
m un naturale.
Osserviamo che i numeri decimali sono un sottoinsieme dei numeri razionali e che
sommando o moltiplicando tra loro due numeri decimali si ottiene ancora un numero
decimale. Cio`e in questo insieme si possono fare tutte le operazioni che si possono
fare sui razionali salvo il fatto che in generale linverso di un decimale non nullo non `e
detto che sia un decimale. Quindi questo insieme con le operazioni indotte da quelle
dei razionali verifica tutti gli assiomi di corpo tranne lassioma P4. (Sinteticamente:
non formano un campo ma una struttura diversa che viene detta anello .)
Seguendo la prova della Proposizione 2.5 possiamo provare che anche i decimali sono
densi in R: ci`o ci permetter`a fissato un n e dato un elemento x R di scegliere un
decimale che meglio approssimi per difetto x a meno di 10n , nel senso che si puo
trovare un m tale che 10mn x < m+1
.
10n

Useremo iterativamente questa osservazione: ci`o legittimer`a in R un procedimento


del tutto analogo al procedimento pitagorico per misurare due grandezze pensandole
come lunghezze, procedendo al confronto e dividendo successivamente lintervallo
residuo in 10 parti uguali al fine di cercare un sottomultiplo comune.

Dato x R iniziamo con l individuare come fatto nella Prop 2.3 il massimo intero
a0 minore o uguale a r, cio`e a0 = [x]. Ponendo r0 = x a0 avremo che 0 r0 < 1.
Quindi potremo pensare x = a0 + r0 e se 0 6= r0 ripetiamo il ragionamento ed
indichiamo con a1 il massimo intero tale che a1 10r0 , quindi si avr`a 0 a1 9.
a1
1
Quindi r0 = 10
e
1 + r1 con 0 r1 < 10 .Cio`
x = a0 +

a1
+ r1
10

1
. Ripetiamo il ragionamento con 100r1 e costruiamo a2 , r2 . Iterando
con r1 < 10
a2
1
avremo x = a0 + a101 + 10
2 + r2 con r2 < 102 .

Proseguendo iterativamente si ha rk1 = ak 101k + rk con 0 rk < 101k : pertanto si


a1
a2
an
viene a creare una successione di interi {ai } per cui a0 +
+ 2 + ... n x <
10 10
10
a1
a2
an + 1
a0 +
+
+ ...
.
10 102
10n
Ora se x `e per caso un numero decimale `e chiaro che questo procedimento si arresta
e si potr`a allora scrivere
a2
an
a1
+ 2 + ... n
10 10
10
scrittura che usulamente viene abbreviata con a0 , a1 a2 . . . an
x = a0 +

11

an
a1 a2
+ 2 +. . .+ n +. . .
10 10
10
con la scrittura a0 , a1 a2 . . ., scrittura che chiameremo espansione decimale (finita o
infinita) di x. Chiaramente si ha che x a0 , a1 a2 . . . an 101n .
Altrimenti questo processo non si arresta e indicheremo a0 +

Se consideriamo i due insiemi A e B composti, A dalle espansioni decimali finite


approssimanti per difetto e B da quelle approssimanti per eccesso, risulta chiaro da
tutto ci`o che precede e dalla prop 3.2 che x `e lelemento separatore tra questi due
insiemi.
Osserviamo che le cifre costruite con questa rappresentazione non possono essere
tutte definitivamente uguali a 9.
Infatti sia a0 , a1 a2 . . . ak 9999 . . . una espansione decimale con tutti 9 dalla (k +
1)-esima cifra in poi. Arrestando lo sviluppo alla n-esima cifra decimale con n
arbitrariamente grande (maggiore di k) abbiamo
a2
ak
9
9
a1
a2
ak
a1
+ 2 + . . . + k + k+1 + . . . + n = a0 +
+ 2 + ... + k +
a0 +
10
10
10
10
10
10
10
10
1
9
1
1
a1
a2
ak
9 1 10nk
=
(1 +
+ . . . nk1 ) = a0 +
+ 2 + . . . + k + k+1
1
10k+1
10
10
10
10
10
10
1 10
a2
ak
1
1
a1
a2
ak + 1
1
a1
+ 2 + . . . + k + k n = a0 +
+ 2 + ... +
n
a0 +
k
10 10
10
10
10
10 10
10
10
cosa che dimostra che lo svipluppo decimale coincide (perche?) con a0 , a1 . . . {ak +
1}0000 . . ..
Dora in poi useremo sempre la convenzione di identificare uno sviluppo decimale in
cui le cifre da un certo punto in poi, diciamo dalla k + 1-esima, siano tutte uguali a
9 con lo sviluppo decimale avente le stesse cifre fino alla k 1-esima, per k-esima la
k-esima aumentata di 1 e le restanti 0. In simboli
a0 , a1 a2 . . . ak 9999999 . . . = a0 , a1 a2 . . . (ak + 1)000000 . . .
iterando il procedimento qualora anche ak + 1 risultasse uguale a 9.
Chiameremo allineamento decimale ridotto un allineamento decimale a0 , a1 a2 . . . an . . .
in cui tutte le cifre non sono definitivamente uguali a 9 ed indicheremo con D
linsieme degli allineamenti decimali ridotti.
Proposizione 5.1. Il procedimento di approssimazione descritto induce una applicazione biunivoca di R su D.
Prova: Indichiamo con d lapplicazione da R a D che risulta dal procedimento
di approssimazione descritto. Dato un numero reale x e lespansione decimale d(x)
abbiamo gi`a osservato che x risulta essere lestremo superiore degli allineamenti
decimali. 1
Infatti a0 , a1 . . . x e n x 101n < a0 , a1 a2 . . . an e notare che per ogni x < x si pu`
o prendere
n in modo tale che x 101n > x cos`
1

x x

1
< a0 , a1 a2 . . . an .
10n

12

Indichiamo ora con s lapplicazione da D a R ora descritta che associa ad una


espansione decimale il sup dellinsieme A delle espansioni decimali approssimanti
per difetto
a0 , a1 a2 . . . an . . . x = sup{a0 , a1 a2 . . . an }
nN

Per quanto ora provato abbiamo che lapplicazione R D R `e lidentit`a di R.


Basta mostrare (esercizio) che anche laltra composizione D R D `e a sua volta
lidentit`a di D.
Infatti ci`o implica che le due applicazioni d e s risultano iniettive e suriettive.
Ragioniamo sulla d.
iniettivit`
a Se d(a) = d(b) si ha sd(a) = sd(b) ma essendo sd = id ci`o implica
a = b.
surgettivit`
a Sia u D. s(u) `e in R e ds(u) = u quindi lelemento v = s(u)
di R `e tale che d(v) = u.
2

Approssimazione.

La Proposizione 2.3 ci garantisce che i numeri razionali della forma


in R, cio`e per ogni x R ed R esistono b Z, m N tali che

a
10k

sono densi

b
b
x< m +
m
10
10
.
La rappresentazione tramite allineamenti decimali finiti ci fornisce una serie di coppie
di valori del tipo a0 , a1 a2 . . . ak che differiscono
u 10k . Per esempio
da x per al pi`
per trovare una
rappresentazione decimale di 2 non `e2 difficile con2 una calcolatrice
verificare che 2 `e compreso tra 1, 4 e 1, 5 poiche 1, 4 < 2 < 1, 5 , Analogamente
quadrando e confrontando otteniamo

1, 41 <

2 < 1, 42

1, 414 <

2 < 1, 415

1, 4142 <
1, 41421 <
1, 414213 <

2 < 1, 4143
2 < 1, 41422
2 < 1, 414214

13

1, 4142135 <
1, 41421356 <
1, 414213562 <

2 < 1, 4142136
2 < 1, 41421357
2 < 1, 414213563

Radici e potenze.

Abbiamo visto che nel corpo ordinato completo R lequazione x2 = 2 ha soluzioni.


Vediamo ora, con dimostrazione analoga, che dato un elemento a > 0 di R esiste un
solo elemento positivo in R tale che
Proposizione 7.1. Ogni numero reale positivo a ha ununica radice n-esima positiva.
Prova: Procediamo in modo analogo a quanto gi`a fatto per
Se 0 < x1 < x2 si ha 0 <
una radice positiva.

xn1

<

xn2

2.

quindi ogni numero reale non pu`o avere pi`


u di

Sia ora a > 0 e


A = {x R|x > 0 xn a}.
A `e non vuoto ed `e superiormente limitato. Infatti
c = min{1, a} A
d = max{1, a} M
.
Esiste pertanto lestremo superiore, poniamo x = sup A e proviamo che xn = a.
Poiche 0 < c x, si scelga un tale che 0 < < x. Allora, essendo 0 < x <
x < x + si ha
(x )n < xn < (x + )n .
Per le propriet`a caratterizzanti lestremo superiore, fra x e x vi `e certamente un
elemento di A mentre x + A. Pertanto
(x )n < a < (x + )n .
Da ci`o segue
|xn a| < (x + )n (x )n < 2n+1 xn1 .

Quindi |xn a| `e minore di ogni prefissato numero positivo e quindi (Prop 2.6)
|xn a| = 0 cio`e xn = a.
2
2

k=n1
X

(x + )n (x )n = ((x + ) (x ))(

k=0

14

(x + )n1k (x )k < 2 ((2x)n1 )

A questo punto diventa facile definire che cosa si possa intendere per potenza a
esponente reale. In R possiamo
definire xn = x x . . . x cio`e il prodotto di n
1
copie di x e indicando con x m = m x, che sappiamo esistere in bse alla proposizione
1
n
precedente, abbiamo che ha senso la scrittura x m = (xn ) m e se x 6= 0 definiamo
xn = x1n se xn esiste ed infine x0 = 1.
Dalle definizioni date si deducono le usuali regole di calcolo per le potenze

xr xs = xr+s
(xr )s = xrs
(x y)r = xr xs
Per definire la potenza xy nel caso di un esponente y reale qualunque ed una base x
positiva si procede cos` : supponiamo y > 0 e x > 1: consideriamo linsieme
E = {xr |r Q r y};
dalle considerazioni fatte risulta che tale insieme `e ben definito e che `e limitato
superiormente in quanto se r `e un razionale maggiore di y ogni elemento di E `e
minore di xr . Indichiamo con xy lestremo superiore dellinsieme E
xy = sup E.
` facile verificare che nel caso y sia razionale la definizione porta allo stesso valore
E
definito in precedenza.
Poniamo per definizione
1

( x1 )y
y
x = 1

1
xy

se y > 0 e 0 < x < 1


se x = 1 e y qualunque
se y < 0 e x qualunque positivo

e si verificano le usuali propriet`a dellelavzione a potenza.


A questo punto `e chiaro come fondare la seguente definizione
Definizione 7.2. Se a `e un numero reale positivo si definisce logarimo di b in base
a il numero reale l definito da
al = b.
Dalle regole di calcolo appena esposte risulta che
loga (b1 b2 ) = loga (b1 ) + loga (b2 )

propriet`a alla base del cosiddetto regolo calcolatoree che spiega lutilizzazione delle
scale logaritmiche.
15

Rappresentazione decimale e numeri razionali:


algoritmo della frazione generatrice.

Abbiamo identificato il corpo dei reali R con linsieme dei decimali illimitati D.
Ovviamente una espansione decimale finita rappresenta un razionale, ma ci si convince immediatamente che non ogni razionale `e rappresentabile con una espansione
decimale finita: si prenda ad esempio 31 e si vede con lusuale divisione che lespansione decimale `e 0, 333333 . . ., espansione che viene indicata convenzionalmente con
la scrittura 0, 3.
Ci chiediamo se abbiamo un modo di riconoscere le espansioni decimali che rappresentano un razionale e, in caso affermativo, un algoritmo per risalire a tale
decimale.
Visto che lespansione decimale `e una scrittura che possiamo interpretare come una
1
somma (eventualmente infinita) di potenze di 10
facciamo alcune considerazioni sulla
somma di una progressione geometrica.
Partiamo quindi dalla progressione geometrica di ragione x > 0
1 = x0 , x1 , x2 , . . . , xn , . . .
e consideriamo la successione di numeri in R
s0 = 1
s1 = 1 + x
s 2 = 1 + x + x2
...
s k = 1 + x + x2 + . . . + xk
Dalla diseguaglianza di Bernoulli abbiamo che se 0 < x < 1, xk decresce definitivamente, nel senso che fissata una quantit`a = 101h a piacere, esiste un intero nh per
cui per ogni k > nh , xk . 3
Dal fatto che

(1 x)(1 + x + x2 + . . . + xk ) = 1 xk+1
si ha che

1
xk+1

(+)
1x 1x
e quindi che la successione {sk } `e un insieme limitato superiormente. (Per ogni
1
k sk < 1x
.) Per lassioma di continuit`a tale insieme ammette quindi estremo
superiore e per la caratterizzazione di questultimo (Prop 3.2 ) da (+) risulta che
1
1
. Potremo pensare 1x
come somma delle infinite potenze della
esso `e proprio 1x
s k = 1 + x + x2 + + xk =

Da (1 + )n > 1 + n per > 0 ricaviamo che se |x| > 1 allora |x|n cresce indefinitamente, nel
senso che, fissato un qualsiasi elemento K R troviamo un nK per cui |x|n > K per ogni n > nK .
Infatti essendo |x| > 1 posto |x| = 1 + basta prendere n in modo tale che n > K1
. Quindi se
|x| < 1, | x1 |n cresce definitivamente da cui |x|n decresce definitivamente.
3

16

progrssione geometrica.4 Quindi porremo


1 + x + x2 + =
.

1
se 0 x < 1
1x

A questo punto `e facile provare la seguente proposizione


Proposizione 8.1. Sia lespansione decimale a0 , a1 a2 . . .. Supponiamo che esista una sequenza di cifre b1 . . . bp che a partire da un certo punto in poi si ripeta
costantemente, cio`e sia della forma
a0 , a1 . . . ah b 1 . . . b p b 1 . . . b p b 1 . . . b p . . . 5
Allora `e lespansione decimale di un numero razionale.
Useremo per un tale la notazione classica = a0 , a1 . . . ah b1 . . . bp , chimando
b1 . . . bp il periodo e a1 . . . ah lantiperiodo.
Dimostrazione. Una espansione decimale pu`o essere sempre pensata come la somma
di un intero pi`
u una espansione decimale con a0 = 0. Pertanto dimostreremo la cosa
per le espansioni del tipo 0, a1 . . . ah b1 . . . bp .
Iniziamo la prova, per semplicit`a, con un avente h = 0 e p = 1, cio`e della forma
0, b1 . Dalle considerazioni fatte allinizio del capitolo, abbiamo
0, b1 =

b1
b1
b1
1
1
1
b1
b1
+ 2 + . . . = (1 +
+ 2 + . . .) =

1 =
10 10
10
10 10
10 1 10
9

Se = 0, b1 b2 abbiamo
b1
b2
1
b1
b2
b1
b2
1
+ 2 + 3 + 4 + . . . = (1 + 2 + . . .) + 2 (1 + 2 + . . .) =
10 10
10
10
10
10
10
10
b2
b1 10 b2
1
b1 b2
b1
1
+ 2
=

+
=
=
10 1 1012
10 1 1012
99
99
99

0, b1 b2 =

A questo punto dovrebbe esser chiaro come dimostrare il caso generale di una
espansione decimale periodica senza antiperiodo.
Per il caso in cui ci sia un antiperiodo, iniziamo dal caso = 0, a1 b1 .
1
b1
1 a1 9 + b 1
a1
1
+
0, b1 = (a1 + ) = (
)=
10 10
10
9
10
9
1 a1 (10 1) + b1
1 a1 b 1 a1
a1 b 1 a1
(
)=

=
=
10
9
10
9
90

0, a1 b1 = 0, a1 + 0, 0b1 =

4
5

si torner`
a in seguito pi`
u dettagliatamente su tale concetto.
in altri termini

ah+1 = b1 , ah+2 = b2 , . . . , ah+p = bp , ah+p+1 = b1 , ah+p+2 = b2 , . . . , ah+2p = bp , ah+2p+1 = b1 . . .

17

Da queste considerazioni non dovrebbe esser difficile ricavare il noto algoritmo:


La frazione generatrice di un decimale periodico `e il numero razionale con al
numeratore il numero ottenuto dalle cifre di sottraendo lantiperiodo e al denominatore tanti 9 quante sono le cifre del periodo seguiti da tanti zeri quante sono le
cifre dellantiperiodo.
Esercizio 8.2.
1. Caratterizzare i razionali che si rappresentano con una espansione decimale finita.
2. Calcolare il numero delle cifre del periodo dellespansione decimale di

1
7

e di

1
9

3. Provare come conseguenza dellalgoritmo di divisione che lespansione decimale


che rappresenta un numero razionale `e finita o periodica.

18

Complessi.

Indice
1 Definizioni.

2 Forma trigonometrica: argomento e funzione arcotangente.

3 Potenze e radici.

4 Polinomi e radici.

5 Estensione di funzioni elementari al campo complesso.

6 Appendice per i lettori pi`


u interessati.

Definizioni.

In questa dispensa vogliamo presentare lestensione del campo dei numeri reali R
data dal campo dei numeri complessi C e lestensione a tale campo di alcune funzioni
elementari.
Si vuole quindi un insieme che contenga R, in cui sia possibile fare delle operazioni
somma e prodotto che estendano quelle definite su R e in cui sia possibile fare delle
cose che in R non si possono fare, segnatamente a proposito delle radici quadrate
di numeri negativi. Sar`a in effetti sufficiente richiedere che 1 abbia una radice
quadrata.
Consideriamo come insieme, linsieme delle scritture a + ib, ove a e b sono numeri
reali e i un simbolo e definiamo su questo insieme due operazioni nel modo seguente
1. (a + ib) + (c + id) = (a + c) + i(b + d)
2. (a + ib) (c + id) = (ac bd) + i(ad + bc)
Si osservi che con questa definizione risulta immediatamente che i i = 1, che la
somma ed il prodotto cos` definiti verificano le propriet`a di associativit`a, distributivit`a e commutativit`a come le operazioni in R, che 0 + i0 (che quindi dora il poi
indicheremo semplicemente con 0) `e lelemento neutro per la somma e che 1 + i0
(che quindi dora il poi indicheremo semplicemente con 1)`e quello per il prodotto.
Chiameremo C tale insieme dotato delle operazioni appena definite.
In tale insieme ritroviamo linsieme dei numeri reali come gli elementi del tipo a+i0:

si vede immediatamente che le operazioni definite inducono quelle dei reali su tale
insieme. 1
` immediato verificare che ogni elemento diverso da 0 ammette un inverso. Infatti
E
se a + ib un elemento non nullo di C, cerchiamo se esiste un elemento x + iy tale che
(a + ib) (x + iy) = 1 + i0. Applicando la definizione otteniamo che x, y debbono
verificare le condizioni
(
ax by = 1
bx + ay = 0
Tale sistema, essendo a2 + b2 6= 0 ammette una ed una sola soluzione, data da
(
a
x = a2 +b
2
b
y = a2 +b2
Coniugio. Dato un numero complesso z = a + ib, si definisce numero complesso

coniugato di z il numero complesso a ib e si indica con z. Il numero reale a2 + b2


viene detto il modulo di z e lo si indica con |z|.

Con tale definizione si ha

z+w = z+w
zw = z w

` di immediata verifica che


E
zz = |z|2
z
z 1 =
|z|2
Sempre di immediata verifica risulta che un numero complesso z `e reale se e solo se
z = z e che se z = a + ib si ha a = z+z
e b = zz
che vengono dette rispettivamente
2
2i
la parte reale e la parte immaginaria del numero complesso z.

Forma trigonometrica: argomento e funzione


arcotangente.

Se z = a + ib `e un numero complesso non nullo, i due numeri reali r1 = a2a+b2 e


r2 = a2b+b2 sono tali che r12 + r22 = 1. Esiste pertanto un numero reale (, ]
tale che z = |z|(cos + i sin ).
1

In altri termini lapplicazione iniettiva da R a C definita da (r) = r +i0 rispetta le operazioni,


nel senso che (r + r ) = (r) + (r ) e (r r ) = (r) (r ) dove i primi + e sono pensati in R
ed i secondi in C.

Tale viene detto argomento principale (talvolta fase) del numero z e lo si indica
con arg z. Linsieme dei tali che z = |z|(cos + i sin ) `e un sottoinsieme di R che
si chiama argomento di z e si indica con Arg z: risulta Arg z = arg z + 2k al variare
di k in Z. Pertanto il modulo e largomento di un numero complesso z verificano le
relazioni
(
|z| cos = a
|z| sin = b

()

Vogliamo, partendo da queste relazioni, esplicitare per un numero complesso a+ib il


suo modulo
e il suo argomento principale in termini di a e b. Per il modulo si ricava

2
|z| = a + b2 . Per ricavare largomento, osserviamo che per a 6= 0 largomento
verifica tan = ab . Si `e quindi portati, al fine di esplicitare tale funzione, a risolvere
una una equazione del tipo tan = ab e quindi appare naturale esprimere la funzione
argomento in termini della funzione arcotangente.
La funzione arcotangente `e la funzione inversa della funzione tangente, che `e una
funzione di variabile reale definita su R\{x| cos x = 0} = R\{ 2 +k}kxZ a valori in
R che non `e iniettiva nel suo dominio di definizione e che quindi che non `e invertibile.
Se consideriamo la funzione tangente ristretta allintervallo ( 2 , 2 ) tale funzione `e
invertibile, ma restituisce valori appunto compresi tra 2 e 2 mentre la funzione
arg pu`o assumere anche altri valori.
Pertanto ricaveremo la funzione argomento su C = C \ {0} in termini della funzione
arcotangente, a pezzi, cio`e sui 4 quadranti e poi vedremo dove le funzioni cos` definite
si rincollano.
Per i numeri complessi a + ib del I e IV quadrante pensati aperti, senza cio`e i bordi,
in altri termini per i numeri con a > 0, possiamo ricavare arg z dallequazione e
quindi abbiamo arg(z) = arctan ab .
Per quel che riguarda i bordi osserviamo che arg(z) =0 se z `e un reale positivo
mentre se z `e puramente immaginario, cio`e se a = 0 abbiamo arg z= 2 o 2 a
seconda se b > 0 o b < 0. Ricordiamo che abbiamo escluso lo 0.
Passiamo al II e III quadrante. Se a < 0 poniamo arg(z)= arctan ab + o arg(z)=
arctan ab a seconda che rispettivamente sia b > 0 (II quadrante) o b < 0 (III
quadrante).
Si osservi che, per i numeri complessi con a < 0 e b > 0, risulta


b

lim arctan + = + =
a0
a
2
2
Mentre per i numeri complessi con a < 0 e b < 0, risulta


b

lim arctan = =
a0
a
2
2
In conclusione la funzione di a e b cos` definita
3

(L1)

(L2)


arctan ab

arctan b
a
(a, b) =

arctan ab +

se
se
se
se
se
se

a < 0, b < 0
a = 0, b < 0
a>0
a = 0, b > 0
a < 0, b > 0
a < 0, b = 0

(1)

`e definita su tutti i punti di C : tale funzione `e costante


  lungo le semirette che
z
escono in direzione radiale dallorigine perche (z) = |z|
, e (L1) e (L2) provano

che `e continua in tutti i punti di C \ {x < 0, y = 0}. Tale funzione coincide con la
funzione arg(z). 2

2
2
+i
abbiamo che |z| = 1 e quindi
Ad esempio se z =
2
2
(

cos = 22

sin = 22
!

2
2
+i
da cui tan = 1 che, via le definizioni date, porta a dire che arg
=
2
2
3
.
4

Potenze e radici.

Utilizzando la forma trigonometrica, vediamo il significato della moltiplicazione di


due numeri complessi.
Se z = (cos + i sin ) e w = (cos + i sin ), risulta zw = (cos( + ) +
i sin( + )).
Da questa osservazione ricaviamo subito la formula per la potenza di un numero
complesso
z n = n (cos n + i sin n)
da cui la formula per le radici n-esime di un numero complesso:

+ 2k
+ 2k
+ i sin
cos
n
n

(+)

Osserviamo che le radici n-esime di un numero complesso sono n, poiche in (+) n


sono i termini che non differiscono per un multiplo di 2.
2

b
= tan ab , (a, b) 6= (a, b) se < 0
Attenzione: pur essendo vero che se 6= 0, tan a

Polinomi e radici.

Indichiamo con R[x] linsieme dei polinomi p(x) in una variabile a coefficienti reali,
cio`e linsieme delle scritture a0 + a1 x + . . . + an xn , in cui penseremo definite le operazioni di addizione, moltiplicazione tra polinomi e moltiplicazione di un polinomio
per un numero reale.
In questo insieme si pu`o operare la divisione euclidea .
Teorema 4.1. Dati due polinomi a e b con deg a = n e deg b = m, esistono unici
due polinomi q ed r con deg r < deg b tali che a = bq + r.
Lesistenza `e data dallalgoritmo di divisione per polinomi appreso nella scuola secondaria e lunicit`a sui ottiene dalla condizione deg r < deg b; infatti se q e r sono
altri due polinomi che verificano la stessa relazione si ha
0 = b(q q ) + (r r )
ed essendo deg(r r ) < deg b si deve avere q q = 0 e di conseguenza r r = 0.

Conseguentemente se p ammette come radice, cio`e se p() = 0, si ha, dividendo


il polinomio p per il polinomio x ,
p(x) = (x )q(x) + r(x)

Poiche deg r < deg(x ) = 1, il polinomio r `e una costante e calcolando questa


espressione in , si ha che r() = 0 che implica che tale costante `e 0. Quindi se
`e una radice del polinomio p, il polinomio `e divisibile per x , da cui deduciamo
che un polinomio p pu`o avere al massimo n = deg p radici.
Iterando questo procedimento abbiamo che in un ambiente ove il polinomio p ammette tutte le sue radici 1 , 2 , . . . , h , il polinomio pu`o scriversi nella forma
p(x) = (x 1 )m1 (x 2 )m2 (x h )mh .
Se p `e un polinomio a coefficienti reali una osservazione importante `e la seguente:
Teorema 4.2. Se C `e una radice del polinomio a coefficienti reali p anche lo
`e.
Questo segue dalle propriet`a del coniugio. Infatti se p(x) =
p() =

n
X

ai i =

i=1

n
X
i=1

ai i =

n
X

ai i =

i=1

n
X
i=1

da cui p() = p() = 0.

ai i =

Pn

i=1

n
X
i=1

ai xi si ha

ai i = p()

Il teorema fondamentale dellalgebra,3 che qui assumiamo senza prova, implica che
ogni polinomio a coefficienti reali assume tutte le sue radici in C, per cui per un
polinomio a coefficienti reali vale il teorema
Teorema 4.3. Ogni polinomio a coefficienti reali ammette in R[x] una decomposizione
p(x) = (x a1 )m1 (x a2 )m2 (x ah )mh q1n1 q2n2 qknk
ove i polinomi qi sono polinomi di secondo grado senza radici reali.
Gli interi mi vengono dette le molteplicit`
a delle radici ai .
I fattori di tipo x ai seguono direttamente da quanto detto e quelli di tipo qi si
ottengono accorpando i fattori coniugati, tenedo conto del fatto che se un polinomio
reale ammette una radice complessa ammette anche la coniugata e che (x a)(x
a) = x2 2(a + a)x + aa `e un polinomio a coefficienti reali.

Ad esempio x4 +1 = (x2 + 2x+1)(x2 2x+1). Per ottenere questa decomposizione


basta calcolare con la formula di De Moivre le radici quarte di 1 e poi accorparle.
Una ultima osservazione.

Dato un polinomio p di grado n in C indichiamo con con a1 , a2 , . . . , an le sue radici


trascurando il fatto che alcune di esse possano coincidere.
Il polinomio q(x) = (x a1 )(x a2 ) . . . (x an ) `e un polinomio monico (cio`e con
coefficiente direttore uguale a 1) di grado n che differisce dal polinomio dato per un
fattore costante (perche?).
Indicando con i i coefficienti del polinomio q, cio`e q(x) = xn + 1 xn1 + . . . +
n1 x1 + n , ed operando un calcolo, si mostra che i i sono le somme di tutti i
prodotti a i a i delle ai 4 .
Conseguenza immediata di questa osservazione `e che la somma delle radici n-esime
dellunit`a vale 0.

Estensione di funzioni elementari al campo complesso.

Vogliamo definire su C una funzione che estenda la funzione esponenziale ex definita


su R: indicheremo tale estensione con ez .
Per far questo poniamo, se z = x + iy
ez = ex (cos y + i sin y)
3

Il teorema fondamentale dellalgebra dice che ogni polinomio di grado positivo a coefficenti
complessi ha almeno una radice (e quindi tutte) in C.
4
In letteratura le i vengono dette le funzioni simmetriche elementari degli ai .

Si vede immediatamente che questa definizione 5 ristretta ai reali coincide con la


funzione esponenziale ex e che per la funzione ez valgono le usuali propriet`a della
funzione esponenziale, come, ad esempio che ez++w = ez ew etc.
Notiamo che, sempre da questa definizione, risulta

x, y ex+iy = ex+i(y+2k)
cio`e che la funzione esponenziale complessa `e una funzione periodica di periodo 2i.
Notiamo infine che tale espressione pu`o essere usata per estendere al campo complesso le funzioni trigonometriche elementari seno e coseno.
Tale espressione per lesponenziale pu`o essere usata anche per estendere al campo
complesso le funzioni trigonometriche elementari seno e coseno.
Infatti sempre da () risulta che per ogni x reale si ha
eix + eix
cos x =
2
eix eix
sin x =
2i
Quindi, partendo da queste espressioni, si pu`o definire per z complesso
eiz + eiz
2
iz
e eiz
.
sin z =
2i

cos z =

Appendice per i lettori pi`


u interessati.

In questo paragrafo vogliamo provare che la funzione definita in questo modo verifica in campo complesso unaltra propriet`a della funzione
reale e
 esponenziale
x n
precisamente quella che, se x `e un numero reale allora lim 1 +
= ex .
n
n

z n
provando
Pertanto, se z `e un numero complesso, proveremo che 6 ez = lim 1 +
n
n
che

z n
lim 1 +
= ex (cos y + i sin y)
()
n
n
Indichiamo, per brevit`a, con an la successsione 1 + nz che, pensandola in forma
trigonometrica, scriveremo come an = |an | (cos n + i sin n ).
5

Questa relazione ed altre analoghe sono conosciute come relazioni di Eulero


La definizione di limite per una successione {an } di numeri complessi `e del tutto analoga a
quella del caso reale: L = lim an se per ogni > 0 esiste un n0 tale che per ogni n > n0 risulta
6

|an L| < .

Pertanto risulta
n


z n
x 2  y 2 2
(cos n + i sin n)
(an ) = 1 +
= 1+
+
n
n
n
n

Poiche
"

2 # n2

2  y 2  n2 
n
y
x
x
1+
|(an )n | = 1 +
+
= 1+
=
n
n
n
x+n


= 1+

"

x n

si ha

1+

y
x+n

ny2 2
2
2(x+n)

2 #( x+n
)
y

lim |(an )n | = ex

Per calcolare lim nn osserviamo innanzitutto che per ogni z si ha lim an = 1 e


n

quindi definitivamente, cio`e per tutti gli n maggiori di un n0 (che dipende anche da
y
z) si ha che |arg an | < 2 . Pertanto per tali n si ha che arg an = arctan x+n
e quindi
y
definitivamente n = arctan x+n .
Ricordando che lim

x0

lim nn

arctan x
= 1 7 , si ha
x

y
= lim n arctan
= lim n
n
x + n n
y
ny arctan x+n
=y
= lim
y
n x + n
x+n

In un intorno di 0 si ha lim

x0

y
x+n



x+n
y

t
t
arctan x
= lim
= lim
cos t = 1
t0 tan t
t0 sin t
x

arctan

y
x+n

September 30, 2014


PRINCIPIO DI INDUZIONE

Linsieme dei numeri naturali N `e bene ordinato; questo significa che il familiare ordinamento dei
numeri naturali tale che per ogni n N, n n + 1 (in effetti n < n + 1), verifica le seguenti due
propriet`
a:
(1) E un ordinamento totale, cio`e due arbitrari numeri naturali sono sempre confrontabili, precisamente: dati arbitrariamente due numeri n, m N si ha che n m o m n.
(2) Dato comunque un sottoinsieme A N non vuoto, esso ha un elemento minimo a (necessariamente unico), cio`e a A e per ogni b A si ha che a b.
Questa propriet`
a fondamentale dei numeri naturali `e alla base del cosidetto principio di induzione
che qui descriviamo in termini delle sue principali applicazioni: le dimostrazioni per induzione, la
definizione di funzioni per induzione.
Dimostrazioni per induzione. Sia n0 N un fissato numero naturale. Supponiamo che P (n) sia
unaffermazione che dipende da un parametro n N, ha senso per ogni naturale n n0 e che pu`
o
essere vera o falsa. Ad esempio consideriamo:
n0 = 1, P (n) := 2n n .
Supponiamo di essere interessati a dimostrare che P (n) `e vera per ogni n n0 . In certi casi questo
pu`
o essere fatto per induzione applicando lo schema seguente:
Passo iniziale: Si verifica che P (n0 ) `e vera.
Passo induttivo: Per ogni n n0 , si dimostra che se P (n) `e vera, allora anche P (n + 1) `e vera.
Se riusciamo a realizzare questi due passi, allora possiamo concludere che effettivamente P (n) `e vera
per ogni n n0 .
Infatti, intuitivamente, P (n0 ) `e vera per il passo iniziale, allora P (n0 + 1), P ((n0 + 1) + 1), ,
sono tutte vere a cascata, luna di seguito allaltra, applicando ripetutamente infinite volte il passo
induttivo. Vedremo poi pi`
u rigorosamente come questa conclusione segua dal buon ordinamento di N.
Definizione di funzioni per induzione. Sia n0 N un fissato numero naturale. Una funzione
f : {n N|n n0 } X
(a valori in qualche insieme X) `e definita per induzione se `e ottenuta applicando il seguente schema:
Valore iniziale: Assegnamo il valore f (n0 ).
Passo induttivo: Per ogni n n0 , il valore f (n + 1) `e completamente specificato in termini del
valore f (n).
In questo modo la funzione f (n) `e effettivamente definita per ogni n n0 . Come prima il valore
iniziale f (n0 ) `e assegnato, i valori f (n0 + 1), f ((n0 + 1) + 1), , sono tutti definiti a cascata
applicando di seguito infinite volte il passo induttivo.
Vediamo alcuni esempi di entrambe le procedure. Cominciamo trattando per induzione lesempio
considerato prima:n0 = 1, 2n n.
Passo iniziale: P (1) := 21 = 2 1 che `e vera.
Passo induttivo Per ogni n 1, vogliamo dimostrare che 2n+1 n + 1 assumendo di sapere che
2n n. Infatti:
2n+1 = 2(2n ) 2n n + 1
dove lultima disuguaglianza vale perche n 1. Dunque possiamo concludere che 2n n per ogni
n 1.

PRINCIPIO DI INDUZIONE

Osservazione. In effetti 20 = 1 0, dunque laffermazione `e vera anche per n = 0. Per`o, se avessimo


preso n0 = 0 invece che n0 = 1, la precedente discussione del passo induttivo NON avrebbe funzionato
per tutti gli n n0 = 0 (2n n + 1 non `e vera se n = 0); quindi quella dimostrazione per induzione
non avrebbe funzionato per n0 = 0.
Esempio 1. n0 = 1. Definiamo per induzione
f : {n N| n 1} N
come segue:
- Valore iniziale: f (1) = 1.
- Passo induttivo: per ogni n 1, f (n + 1) = f (n) + (n + 1).
Calcoliamo alcuni valori della funzione cos` definita:
f (1) = 1, f (2) = 1 + 2, f (3) = 1 + 2 + 3, . . . , f (n) = 1 + 2 + + n, . . . .
Quindi, a parole, f (n) `e uguale alla somma dei primi n numeri naturali diversi da zero. La definizione
per induzione permette di dare un significato preciso ai puntolini nellespressione f (n) = 1 + 2 +
+ n. Consideriamo ora la funzione
g : {n N| n 1} N
n(n + 1)
2
Vogliamo dimostrare per induzione che g = f , cio`e g(n) = f (n) per ogni n 1. Infatti:
- Passo iniziale: g(1) = 1 = f (1).
(n + 1)(n + 2)
n(n + 1) + 2(n + 1)
=
=
- Passo induttivo: f (n+1) = f (n)+(n+1) = g(n)+(n+1) =
2
2
g(n + 1).
g(n) =

Osservazione. Un altro modo per dimostrare luguaglianza delle due funzioni, che spiega come la
funzione g sia emersa, `e il seguente: 2f (n) = (1+ +n)+(n+ +1) = (n+1)+ (1+n) = n(n+1).
Esempio 2. n0 = 1, f (1) = 1, f (n + 1) = f (n)(n + 1). Si reallizza che per ogni n 1, f (n) =
1 2 3 n, cio`e il prodotto dei numeri naturali compresi tra 1 e n. E una funzione importante. La
sua notazione corrente `e f (n) = n!, si legge n-fattoriale e viene estesa anche in 0, ponendo 0! = 1.
Esempio 3. n0 = 1, f (0) = 1, f (n + 1) = f (n) + (n + 1)2 . Si pu`
o riformulare usando il simbolo di
sommatoria:
n
X
i 2 = 1 + 2 2 + + n2 .
f (n) =
i=1

Dimostriamo per induzione che per ogni n 1,


f (n) = g(n) :=

n(n + 1)(2n + 1)
.
6

Passo iniziale: f (1) = 1 = (2 3)/6 = g(1).


Passo induttivo:
f (n + 1) = f (n) + (n + 1)2 = n(n + 1)(2n + 1)/6 + (n + 1)2 =
(n + 1)(2n2 + 7n + 6)/6 = (n + 1)(n + 2)(2n + 3)/6 = g(n + 1) .
Esempio 4. Fissiamo un numero a 6= 1; n0 = 1; f (1) = a0 = 1; f (n + 1) = f (n) + an . Quindi, per
ogni n 1,
n
X
ai = 1 + a2 + + an .
f (n) =
i=0

Dimostriamo per induzione che per ogni n 1


f (n) = g(n) :=

an+1 1
.
a1

PRINCIPIO DI INDUZIONE

Passo iniziale: f (1) = 1 =


Passo induttivo:

a1 1
= g(1).
a1

f (n + 1) = f (n) + an+1 =

an+1 1
an+2 1
+ an+1 =
= g(n + 1) .
a1
a1

Osservazione. Il risultato precedente si pu`


o ottenere in modo leggermente diverso. Il numero 1 `e una
radice del polinomio p(X) = X n+1 1 (cio`e p(1) = 0). Dunque p(X) `e divisibile per X 1 e facendo
la divisione tra polinomi (con resto uguale a zero) si ottiene (anche qui procedendo per induzione):
X n+1 1 = (X 1)(1 + X + X 2 + + X n ) .
Dunque sostituendo un numero a arbitrario (anche a = 1), si ha che
an+1 1 = (a 1)(1 + a + a2 + + an ) .
Se a 6= 1 possiamo dividere per a 1 ottenendo lidentit`
a voluta.
Esempio 5. (Disuguaglianza di Bernoulli) Fissiamo un numero x 1. Vogliamo dimostrare che
per ogni n 0,
(1 + x)n 1 + nx .
Procediamo per induzione.
Passo iniziale: (1 + x)0 = 1 1 = 1 + 0x.
Passo induttivo:
(1 + x)n+1 = (1 + x)n (1 + x) (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 1 + (n + 1)x .
Si osservi che per la prima disuguaglianza non abbiamo usato soltanto che (1 + x)n 1 + nx, ma
anche che 1 + x 0 (lipotesi x 1). Infatti per esempio la disuguaglianza non vale se prendiamo
x = 100, n = 2.
Concludiamo facendo vedere, come promesso, che il principio di induzione `e una conseguenza del
buon ordinamento di N. Facciamolo nel caso delle dimostrazioni per induzione, per le funzioni definite
per induzione largomento `e lo stesso. Nelle ipotesi date, supponiamo di avere verificato i due passi
(iniziale e induttivo). Vogliamo allora concludere che laffermazione `e vera per ogni n n0 . Vogliamo
cio`e dimostrare che linsieme
A = {n n0 |P (n) falsa} N
`e vuoto. Supponiamo invece per assurdo che non sia vuoto (cio`e esiste n n0 tale che P (n) `e falsa).
Allora, per il buon ordinamento di N, A ammette un elemento minimo a. Poiche P (n0 ) `e vera (passo
iniziale), allora a > n0 . Quindi a 1 n0 e P (a 1) `e vera (perche a `e lelemento minimo di A). Per
il passo induttivo anche P (a) = P ((a 1) + 1) `e vera, ma P (a) `e anche falsa perche a A. Questo
assurdo dimostra come volevamo che A `e vuoto.

October 28, 2014


SUCCESSIONI

In questa dispensa faremo riferimento a nozioni relative alla retta estesa R e ai sistemi di intorni di
ogni a R che sono definite nella dispensa [TOP].
1. Nozioni generali
Dato un insieme non vuoto X, una successione a valori in X `e una funzione della forma:
a : {n N| n n0 } X
dove n0 N `e un fissato numero naturale. Per semplicit`a scriveremo {n n0 } invece di {n N| n
n0 }; inoltre, di solito, per ogni n n0 , scriveremo an invece di a(n). Ogni an X `e detto un termine
della successione, linsieme dei termini `e un sottoinsieme di X, infatti non `e altro che limmagine della
funzione a:
Im(a) = {an X| n n0 } .
Una successione a `e costante se Im(a) = {b} cio`e consiste di un solo elemento, cio`e per ogni n n0 ,
an = b. E utile fissare la seguente nozione generale:
Successioni che verificano definitivamente una propriet`
a. Sia a : {n n0 } X una successione. Diciamo che essa verifica definitivamente una certa propriet`
a P se esiste n
N, n
n0
tale che per ogni n > n
, an verifica la propriet`
a P . Cio`e la propriet`
a pu`
o non valere per un numero
arbitrariamente grande di indici n, ma da un certo indice in poi vale sempre.
Ad esempio:
- Si consideri la successione a : N N, an = n per ogni n 0. Allora la successione a verifica
definitivamente la propriet`
a an > 5 (basta prendere as esempio n
= 7). Invece a non verifica
definitivamente la propriet`
a : an `e pari. Infatti per ogni n
N, n
+2 > n
+1 > n
e almeno uno
tra n
+2 e n
+ 1 non `e pari. Si noti che an `e pari per un insieme infinito di indici n; in casi cos` si
dice a volte che la propriet`
a `e verificata frequentemente, ma questo non basta affinche la propriet`
a sia
verificata definitivamente.
- Una successione a `e definitivamente costante se esiste n
n0 tale che per ogni m, n > n
, an = am .
Per esempio la successione a : N N tale che an = min(n, 700) `e definitivamente costante, infatti per
ogni n > 699, an = 700.
2. Successioni di numeri reali
Enunceremo in modo esauriente diverse nozioni e propriet`
a relative alle successioni di numeri reali.
Non le dimostreremo tutte, ma di tutte potremo fare liberamente uso.
Noi saremo particolarmente interessati al caso di successioni di numeri reali, cio`e quando X = R. In
questo caso `e conveniente introdurre alcune nozioni che sono definite usando le propriet`
a di R. Sia
a : {n n0 } R
una successione di numeri reali.
La successione a `e superiormente (risp. inferiormente) limitata se esiste M R tale che per
ogni n n0 , an M (risp. an M ).
La successione a `e limitata se `e contemporaneamente superiormente e inferiormente limitata.
La successione a `e crescente (risp. decrescente) se per ogni n, m {n n0 }, se n > m allora
an > am (risp. an < am ). Una successione `e detta strettamente monotona se `e crescente o
decrescente.
La successione a `e non decrescente (risp. non crescente) se per ogni n, m {n n0 }, se
n > m allora an am (risp. an am ). Una successione `e detta monotona se `e non crescente
o non decrescente.

SUCCESSIONI

Attenzione. Questa terminologia, benche largamente diffusa, pu`


o essere un po fuorviante.
Per esempio la definizione data di successione non crescente NON `e la negazione della
definizione di successione crescente data prima; infatti tale negazione `e:
Esistono n, m n0 tali che n > m e an am .
3. Limiti di successioni
Data una successione
a : {n n0 } R
dato un elemento della retta estesa L R = R {, +} vogliamo dare un senso alla scrittura
L = lim an
n+

che leggeremo:
L R `e limite della successione an quando n tende allinfinito.
A volte useremo anche la notazione abbreviata
an L
che leggeremo an tende a L per n che tende allinfinito.
Definizione sintetica del limite di una successione. Ricordiamo che per ogni L R, nella
dispensa [TOP] abbiamo definito un sistema di intorni aperti di L. Allora:
lim an = L

n+

se per ogni U elemento del sistema di intorni di L, an appartiene definitivamente ad U .


Adesso facciamo lesercizio di esplicitare completamente in modo analitico questa definizione sintetica,
distinguendo i casi in cui L R oppure L = .
Supponiamo che il valore limite L R. In questo caso il sistema di intorni di L `e formato dagli
intervalli I(L, ) di centro L e raggio , dove varia nei numeri reali strettamente positivi. Allora
abbiamo:
lim an = L R

n+

se e solo se per ogni > 0, esiste n


n0 tale che per ogni n > n
, an I(L, ) (cio`e, equivalentemente,
L < an < L + ).
Supponiamo che L = + ; In questo caso gli intorni di + sono le semirette (m, +), con m che
varia in R. Allora abbiamo: lim an = + se e solo se per ogni numero reale m , esiste n
n0 tale
n+

che per ogni n > n


, an (m, +) (cio`e an > m).
Supponiamo che L = ; in questo caso gli intorni di sono le semirette (, m), con m che
varia in R. Allora abbiamo:
lim an =

n+

se per ogni numero reale m, esiste n


n0 tale che per ogni n > n
, an (, m) (cio`e an < m).
Se esiste L R tale che
lim an = L

n+

diremo che la successione `e convergente (in R) o anche che `e regolare. Se un tale L non esiste diremo
che la successione `e irregolare.
Esempi
(1) Sia an = n, definita per n 0. Allora an +. Infatti, per ogni reale m esiste n
N tale che
n
> m (propriet`a di Archimede), quindi per ogni n > n
si ha che n = an > m.

SUCCESSIONI

(2) Sia an = min(n, 700), definita per n 0. Allora an 700. Infatti, per ogni > 0, sia n
= 699.
Allora per ogni n > n
, an = 700 I(700, ). In generale ogni successione definitivamente costante e
uguale a L R tende a L per n che tende a infinito.
(3) Sia an = 1/n, definita per n 1. Allora an 0. Infatti per ogni > 0, 1/n = |1/n| < se e solo
se n > 1/. Per la propriet`
a di Archimede, esiste n
> 1/, e per ogni n > n
, 1/n = |1/n| < 1/
n < .
Dunque an appartiene definitivamente a I(0, ).
(4) La successione an = (1)n , definita per n 0 `e irregolare. Infatti L = non `e valore limite
perche la successione `e limitata. Supponiamo che L R. Sia = min(2 = | 1 1|, |1 L|, |1 +
L|). Poniamo = /3. Allora an appartiene frequentemente a I(1, ) e a I(1, ), quindi non pu`
o
appartenere definitivamente a I(L, ) e nessun L pu`
o essere valore limite di an .
3.1. Propriet`
a dei limiti di successioni. Discutiamo alcune propriet`
a che sono conseguenza della
definizione di limite.
Unicit`
a del limite. Data una successione a : {n n0 } R, se L R `e tale che
L = lim an ,
n+

allora L `e lunico valore limite di an in R. Pertanto scriveremo anche

lim an = L intendendo che

n+

L `e il limite della successione per n che tende allinfinito.


Infatti, supponiamo per esempio che L R e facciamo vedere che non esiste un antro limite L R.
Infatti sia = |L L |/3 per cui I(L, ) I(L , ) = . Allora an non pu`
o stare definitivamente in
entrambi gli intorni I(L, ) e I(L , ). Facciamo vedere che neanche L = + pu`
o essere limite della
successione. Infatti, fissiamo > 0 e poniamo M = L + 3. Allora I(L, ) (M, +) = e ancora
una volta an non pu`
o stare definitivamente in entrambi gli intorni. Gli altri casi per cui L = si
trattano in modo simile .
Permanenza del segno.
Se lim an = L R e L 6= 0, allora an ha definitivamente lo stesso segno di L (dove conveniamo
n+

che + > 0 e < 0).


Infatti, supponiamo per esempio che L R e L > 0. Poniamo = L/3. Se x I(L, ), allora x > 0 e
an appartiene definitivamente a I(L, ). Gli altri casi si trattano in modo simile.
Sottosuccessioni. Data una successione
a : {n n0 } R
una sottosuccessione di a (detta anche una successione estratta da a) `e una successione
b:NR
tale che esiste una successione crescente
j : N {n n0 }
per cui b risulta essere la composizione
b=aj .
I termini della successione b vengono spesso indicati ajn , n N, dove jn = j(n). Ad esempio se an = n
e j(n) = 2n, allora ajn = 2n, cio`e la sottosuccesione `e formata dai termini pari di a. Se an = (1)n ,
e j(n) = 2n, allora ajn `e la successione costante uguale a 1.
Se an L R e ajn `e una sottosuccessione di a, allora ajn L. In altre parole: una sottosuccessione
di una successione convergente `e a sua volta convergente e le due successioni hanno lo stesso limite.
Infatti, dato un intorno U di L, sia n
n0 tale che per ogni n > n
, an U . Poiche j `e crescente,
esiste n1 > 0 tale che j(n1 ) > n
. Quindi per ogni n > n1 , ajn U .
Attenzione, una successione irregolare (per esempio an = (1)n ) pu`
o avere sottosuccessioni convergenti (per esempio la successione costante (1)2n = 1).

SUCCESSIONI

Propriet`
a algebriche dei limiti. Sono familiari le operazioni di somma e prodotto su R. Inoltre
se a R, a 6= 0 `e definito linverso 1/a R. Prima di enunciare le propriet`
a algebriche dei limiti di
successioni, estendiamo parzialmente queste nozioni alla retta estesa nel modo seguente:
Se a R o a = +, poniamo + + a = a + + = +.
Se a R o a = , poniamo + a = a + = .
Poniamo (+) (+) = +, () () = +, () (+) = (+) () = .
Se a R, a > 0, poniamo a () = () a = . Se a < 0, poniamo a () =
() a = .
Poniamo 1/ = 0.
Attenzione: NON abbiamo definito () + (), 0 (), () 0. Queste sono dette forme
indeterminate. Anche / (dove i due simboli possomo prendere indipendentemente i valori
), `e una forma indeterminata perche possiamo scrivere / = (1/) = 0 e ricondursi
cos` ad una forma indeterminata gi`
a vista.
Possiamo adesso enunciare alcune propriet`
a algebriche dei limiti di successioni.
(1) (Limite di una somma di successioni.) Siano a, b : {n n0 } R due successioni.
Supponiamo che
lim an = L R
n+

lim bn = L R

n+

e che L + L `e definito (cio`e non `e una forma indeterminata). Allora


lim (an + bn ) = L + L R .

n+

(2) (Limite di un prodotto di successioni.) Siano a, b : {n n0 } R due successioni.


Supponiamo che
lim an = L R
n+

lim bn = L R

n+

e che L L `e definito (cio`e non `e una forma indeterminata). Allora


lim (an bn ) = L L R .

n+

(3) (Limite della successione degli inversi.) Sia a : {n n0 } R una successione e


supponiamo che per ogni n n0 , an 6= 0. Supponiamo che
lim an = L R

n+

e che 1/L sia stato definito qui sopra. Allora


lim 1/an = 1/L R .

n+

(4) Nella situazione del punto precedente, supponiamo che L = 0. In generale non possiamo dire
(1)n
, definita per ogni
niente sulla convergenza della successione 1/an . Per esempio sia an =
n
n 1. Allora lim an = 0 (verificarlo per esercizio usando direttamente la definizione di
n+

limite), mentre la successione 1/an = (1)n n `e irregolare. Possiamo dire qualcosa se facciamo
un ipotesi pi`
u forte, supponiamo cio`e che tutti i termini an abbiano definitivamente lo stesso
segno + o (scriveremo che an 0 ). Allora
lim 1/an = .

n+

In particolare
lim 1/|an | = + .

n+

In altre parole non abbiamo definito 1/0, ma abbiamo definito 1/0 = , e in questo modo
possiamo unificare questi due ultimi punti (3) e (4).

SUCCESSIONI

A titolo di esempio dimostriamo laffermazione sul limite della somma nel caso in cui L, L R.
Fissiamo > 0, vogliamo dimostrare che (an + bn ) appartiene definitivamente allintorno I(L + L , ).
Se an appartiene definitivamente a I(L, 1 ) e bn appartiene definitivamente a I(L , 2 ) allora an + bn
appartiene definitivamente I(L + L , 1 + 2 ), perche definitivamente:
|(L + L ) (an + bn )| |L an | + |L bn | < 1 + 2 .
Per concludere basta prendere per esempio 1 = 2 = /3.
Esempi. I seguenti limiti si ottengono applicando diverse tra le propriet`
a algebriche viste sopra (per
esercizio dettagliare quali).
(1) Per ogni fissato k N, k > 0, alloraan := nk +; se invece k < 0, allora an := nk 0.
(2) Fissati numeri reali a, b, c, d, c 6= 0, allora an :=
(3) Sia an = nm +

m1
X

an + b
a
.
cn + d
c

cj nj , dove i numeri reali cj sono certi coefficienti fissi. Possiamo riscrivere

j=0

an = nm (1 +

m1
X

cj (1/nmj ). Si ha che an +.

j=0

Confronto di successioni. In certi casi si possono ricavare informazioni sulla convergenza di una
successione confrontandola con altre successioni di cui il comportamento sia noto.
Confronto 0. Due successioni che sono definitivamente uguali hanno lo stesso comportamento per
n +, cio`e luna converge se e solo se laltra convege e se sono convergenti allora hanno lo stesso
limite L R. Questo `e chiaro perche la definizione di limite usa solo propriet`
a che devono valere
definitivamente.
Confronto 1. Siano a : {n n0 } R e b : {n n1 } R due successioni. Supponiamo che
lim bn = +

n+

e che definitivamente an bn . Allora


lim an = + .

n+

Analogamente se
lim bn =

n+

e definitivamente an bn . Allora
lim an = .

n+

Confronto 2. Siano a,b,c tre successioni. Supponiamo che:


1) lim an = lim bn = L R;
n+

n+

2) Definitivamente an cn bn .
Allora:
lim cn = L .

n+

Questo risultato `e anche noto come teorema dei carabinieri (a e b) che tenendo dai due lati il ladro
(c) lo portano con loro in prigione (L).
Esempi.
(1) Fissato un reale a > 1, allora an := an +. Infatti possiamo scrivere a = 1 + b, b > 0.
Sappiamo (Bernoulli) che an = (1 + b)n 1 + bn. Poiche 1 + bn +, lo stesso vale per an .
(2) Come in (1) ma supponendo ora 0 < |a| < 1. Ne segue che 1/|a| > 1, quindi |an | = 1/(1/|a|)n 0.

SUCCESSIONI

(3) Fissato come prima a > 1, allora a1/n 1. Infatti possiamo porre a1/n = 1 + bn con bn > 0.
Allora (Bernoulli) a = (1 + bn )n 1 + nbn , da cui 0 < bn (a 1)/n. Per i carabinieri bn 0 e
quindi a1/n 1.
(4) Fissato a, |a| 1, allora an /n 0. Infatti se |a| < 1, an 0 e quindi an /n 0. Se |a| = 1, si
ha che 0 |an /n| 1/n. Per i carabinieri, an /n 0.
(5) Come in (4) ma supponendo ora che a > 1. Allora a = 1 + d per qualche d > 0.
 
n  
X
n k
n 2
n
n
a = (1 + d) =
d
d = n(n 1)d2 /2
k
2
k=0

da cui
an /n (n 1)d2 /2 ;
poiche (n 1)d2 /2 +, lo stesso vale per an /n.
Convergenza delle successioni monotone.
Le successioni monotone sono sempre regolari cio`e ammettono sempre limite L R.
Infatti, supponiamo che la successione an , definita per n n0 , sia non decrescente (risp. non crescente). Allora si hanno due possibilit`a
1) an `e superiormente (risp. inferiormente) limitata con estremo superiore (risp. inferiore) L =
sup{an | n n0 } R (risp. L = inf{an | n n0 } R) . Allora
lim an = L

n+

2) an non `e superiormente (risp. inferiormente) limitata. Allora:

lim an = + (risp.

n+

lim an =

n+

).
Dimostriamo per esempio la prima affermazione nel caso in cui la successione `e non decrescente e
superiormente limitata. Per le propriet`
a dellestremo superiore, per ogni > 0 esiste n
n0 tale che
an > L . Siccome la successione `e non decrescente, per ogni n > n
, an an , quindi an > L , da
cui an I(L, ). Gli altri casi si trattano in modo analogo.
1
Esempio importante: il numero di Nepero. Consideriamo la successione an = (1 + )n definita
n
per n 1. Dimostriamo intanto che `e una successione crescente. Infatti
n
n  
X
X
1 n(n 1)(n 2) (n h 1)
n 1
=
an =
h
h!
nh
h n
h=0

h=0

da cui, riorganizzando lultimo termine


n
X
1
2
h1
1
(1 )(1 ) (1
).
an =
h!
n
n
n
h=0

n+1

Se ora ripetiamo il calcolo per a


vediamo che ognuno dei termini (che sono positivi) della somma
al secondo membro non diminuisce e il numero di termini aumenta. Quindi possiamo concludere che
an < an+1 .
Vediamo ora che la successione an `e superiormente limitata. Infatti
(1 +

n
n1
X 1
1 n X 1
1
) <
<1+(
( )s < 1 + 1/(1 ) = 3 .
n
h!
2
2
s=0
h=0

Dunque la successione an converge al suo estremo superiore in R che viene indicato con la lettera e
ed `e chiamato il numero di Nepero. Riassumendo
1
e := lim (1 + )n
n+
n
che `e un numero reale 2 < e < 3.

SUCCESSIONI

Unapplicazione pratica. Questo limite notevole interviene per analizzare una situazione molto concreta, cio`e il comportamento di un libretto di risparmio a tasso fisso. Disponendo di un capitale c0
che prevediamo di non utilizzare per un tempo abbastanza lungo, possiamo aprire un libretto di
risparmio con capitale iniziale c0 , e farlo crescere grazie agli interessi composti maturati nel tempo. Il
meccanismo `e il seguente:
E fissato un intervallo di tempo (un anno, sei mesi,...) che possiamo prendere come unit`
a di
misura del tempo fissata una volta per tutte; si conviene che per maturare linteresse alla fine
di un tale intervallo, il capitale presente nel libretto allinizio dell intervallo `e vincolato, cio`e
non pu`
o essere toccato per tutta la durata dellintervallo.
E fissato un tasso di interesse fisso del p0 per cento (per esempio del 1 per cento). Poniamo
r0 = p0 /100.
Allora al tempo iniziale t = 0, abbiamo un capitale c(0) = c0 . Al tempo t = 1 si maturano
gli interessi e si determina il nuovo capitale c(1) = (1 + r0 )c(0); procedendo per induzione, al
tempo t = n, abbiamo un capitale
c(n) = (1 + r0 )c(n 1) = (1 + r0 )n c0 .
In questo modello sia lampiezza dellintervallo di tempo in cui il capitale `e vincolato, sia il tasso di
interesse sono parametri che possono essere modificati. E chiaro che in linea di principio il tasso
di interesse deve essere una funzione crescente dellampiezza dellintervallo di tempo: pi`
u `e il tempo
che il capitale `e bloccato, pi`
u deve crescere linteresse. In accordo con un ragionevole criterio di
semplicit`a, adottiamo il seguente modello lineare:
Per lintervallo unitario poniamo r0 = 1; se lintervallo di vincolo `e lungo > 0 (rispetto allunit`
a di
misuira che abbiamo scelto) allora il corrispondente tasso di interesse `e r = .
Calcolando tutto come prima ma tenendo conto del parametro reale (e avendo posto r0 = 1),
vediamo che al solito c(0) = c0 , mentre
c(n) = (1 + )c((n 1)) = (1 + )n c0 .
E interessante capire cosa succede quando + oppure 0+ e n +. Concretamente,
consideriamo la successione crescente e non limitata n = n. Vediamo allora che la gi`a la successione
dei capitali maturati al tempo n :
c(n ) = (1 + n)c0
`e crescente e diverge a +. Questo non `e sorprendente. Un comportamento pi`
u interessante si ha
prendendo la successione n = 1/n decrescente e converge a 0 e consideriamo la successione dei capitali
maturati al tempo nn = 1. Si ha:
1
c(nn ) = (1 + )n c0 .
n
Possiamo quindi applicare lanalisi del limite notevole fatta sopra e concludere che c(nn ) `e ancora
una successione crescente che per`
o adesso converge al limite finito ec0 , dove e `e proprio la costante di
Nepero.
Criterio di Cauchy.
Condizione necessaria e sufficiente affinche esista L R tale che an L R `e che per ogni > 0
esiste n
n0 tale che per ogni n, m > n
si ha che |an am | < .
Limitiamoci a dimostrare che la condizione `e necessaria. Supponiamo che an L R. Fissato > 0,
esiste n
tale che per ogni n > n
, an I(L, /3). Allora per ogni n, m > n
, |an am | < .
Criterio del rapporto.
Sia an una successione a termini positivi. Se an+1 /an L R e L < 1 allora an `e descrescente
e an 0. Se an+1 /an L R e L > 1, allora an `e crescente e an +. Se an+1 /an 1 la
situazione `e indeterminata.
Criterio della radice
Sia an una successione a termini positivi. Se (an )1/n L R e L < 1 allora an 0. Se (an )1/n
L R e L > 1, allora an +. Se (an )1/n 1 la situazione `e indeterminata.

SUCCESSIONI

Dimostriamo il criterio della radice: supponiamo che L > 1 e L R. Allora definitivamente (an )1/n
(L + 1)/2, quindi an ((L + 1)/2)n ; a := (L + 1)/2 > 1, quindi an + e per confronto an +.
Lasciamo per esercizio il caso in cui L = +. Se L < 1, allora definitivamente (an )1/n (L + 1)/2,
quindi 0 < an ((L + 1)/2)n ; a := (L + 1)/2 < 1, quindi an 0. Per i carabinieri anche an 0.
Osservazione. Quando diciamo che se L = 1 la situazione `e indeterminata vogliamo dire che si
danno effettivanente comportamenti diversi. Infatti per esempio an pu`
o essere convergente in R (si
consideri per esempio la successione costante uguale ad 1), convergente a + (si consideri an = n + 1
definita per n 0, allora an+1 /an 1).
Limiti delle medie. Sia an una successione definita per n 1. La successione mn delle medie
aritmetiche dei termini di an `e definita da
mn = (a1 + a2 + + an )/n .
Vale il seguente fatto:
Se

lim an = L R, allora

n+

lim mn = L R.

n+

Supponiamo ora che la successione an sia a termini positivi. La successione gn delle medie geometriche
dei termini di an `e definita da
gn = (a1 a2 an )1/n .
Vale il seguente fatto:
Se

lim an = L R, allora

n+

lim gn = L R.

n+

In altre parole: se una successione converge in R, allora anche le successioni delle medie (aritmetiche
e geometriche) sono convergenti e hanno lo stesso limite.
Osservazione. Sia an una successione a termini positivi, definita per n 0 e tale che a0 = 1.
Consideriamo la successione dei rapporti bn = an /an1 definita per n 1. In questo caso la successione
delle medie geometriche dei termini di bn `e uguale a (an )1/n . Quindi come caso particolare di quanto
visto prima, abbiamo che:
Data una successione a termini positivi an , se an+1 /an L R, allora (an )1/n L.
Come corollario abbiamo che il criterio del rapporto implica il criterio della radice.
Per esempio, n/(n 1) 1 e quindi (n)1/n 1.
4. Serie, cenni
Data una successione an , definita per n 0, possiamo definire una nuova successione
sn =

n
X

aj = a0 + a1 + + an .

j=0

Diciamo allora che queste sn sono le somme parziali della serie


+
X

an

n=0

e che gli an sono i termini della serie. Una serie `e detta regolare se esiste L R tale che
lim sn = L

n+

convergente se `e regolare e L R. Altrimenti la serie `e detta irregolare. Se la serie `e convergente


allora scriviamo
+
X
an = L
n=0

ed L `e per definizione la somma della serie.

SUCCESSIONI

Un esempio importante `e la serie geometrica che di fatto `e gi`a intervenuta, per esempio, quando
abbiamo trattato gli sviluppi decimali. Fissiamo a R. Allora e consideriamo la serie
+
X

an .

n=0

Abbiamo visto che se a 6= 1 allora


an+1 1
.
a1
Quindi se 0 < a < 1 allora la serie `e convergente e
sn =

+
X

an = 1/(1 a) .

n=0

Se a = 1, an `e la successione costante uguale a 1, sn = 1 + n +. Se a > 1, allora sn +.


Un altro esempio:
+
X

1
(n
+
1)(n
+ 2)
n=0
poiche

1
1
1
=

(n + 1)(n + 2)
n+1 n+2

risulta che
sn = 1

1
n+2

quindi la serie `e convergente e


+
X

1
=1.
(n + 1)(n + 2)
n=0
4.1. Serie a termini positivi. Consideriamo la serie

+
X

an e supponiamo che per ogni n, an 0.

n=0

Allora sicuramente sn `e una successione monotona non decrescente e quindi:


Ogni serie a termini positivi `e regolare e sn L 0 in R. La serie `e convergente se e solo se sn `e
(superiormente) limitata.
Si pu`
o dimostrare che:
Condizione necessaria affinche una serie a termini positivi sia convergente `e che an 0.
Tale condizione non `e per`
o sufficiente: si consideri la serie armonica
+
X

1
.
n
+
1
n=0
Se per assurdo sn L R, la successione delle somme parziali dovrebbe verificare la condizione
(necessaria) del criterio di Cauchy visto sopra. Ma questa non `e verificata perche per ogni n 0,
2n
X

sk > n

k=n+1

1
=2.
2n

Fissiamo a R, a > 0 e consideriamo la serie (armonica generalizzata)


+
X

1
.
(n
+
1)a
n=0
Ne vogliamo studiare il comportamento al variare di a. Se a = 1 ritroviamo il caso gi`a studiato. Se
a < 1, allora per ogni n
1
1

n+1
(1 + n)a

10

SUCCESSIONI

quindi per confronto anche sn +. Invece se a > 1 la serie `e convergente. Infatti si pu`
o verificare
che per ogni intero p > 1
p1
X
2a1
p
.
(1/2)a1 < a1
s2 1 <
2
1
j=0
Daltra parte, per ogni n esiste p tale che sn < s2p 1 , quindi la successione sn `e limitata e la serie
converge.
Criteri del rapporto e della radice per serie. Sono riformulazioni di quanto gi`a visto per le
successioni.
Data una serie a termini positivi, se an+1 /an L < 1 allora la serie `e convergente; se an+1 /an
L > 1 la serie `e regolare ma non convergente; se an+1 /an 1 la situazione `e indeterminata.
Data una serie a termini positivi, se (an )1/n L < 1 allora la serie `e convergente; se (an )1/n L > 1
la serie `e regolare ma non convergente; se (an )1/n 1 la situazione `e indeterminata.

3 Novembre 2014
Qualche limite e serie standard svolti.

Indice
1 Successioni

1.1

Confronti di crescita di esponenziali. . . . . . . . . . . . . . . . . . .

1.2

Qualche criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3

Altri confronti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.4

Varie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
n

1
.. . . . . . . . . . . . . . . . .
Variazioni sulla successione 1 +
n

1.5

2 Serie

2.1

Qualche serie di base. . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2

Serie telescopiche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.3

Miscellanea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

Queste note contengono lo studio di qualche limite e di qualche serie trattato nel
corso con qualche suggerimento per richiamare le idee delle prove.

Successioni

1.1

Confronti di crescita di esponenziali.

Abbiamo visto, come conseguenza della diseguaglianza di Bernoulli, che la successione an per a > 1 diverge, mentre converge a 0 se |a| < 1 e non ha limite se
a < 1. Confrontiamola, quando diverge, con qualche altra successione, anche essa
divergente.

an
= con a > 1 e k > 0
n nk
Lidea per comprendere il comportamento di questa successione `e di confrontarla
con

 una successione di coefficienti binomiali. Il coefficiente binomiale
n(n 1) (n k)
n
=
`e un polinomio in n di grado k + 1, pertanto
k+1
(k + 1)!

n
lim

lim

k+1
nk

Quindi per n abbastanza grande, diciamo n k + 1


n

a = (1 + (a 1)) =

 
X
n

h=0

(a 1) >


n
(a 1)k+1
k+1


n
an
k+1
(a 1)k+1 e pertanto, se a > 1 e k > 0
Quindi si ha k >
k
n
n
an
=
n nk
lim

an
= 0, con a > 1
n n!
lim

Si ottiene osservando che


nk
= 0 perche se n k + 1 n! n(n 1) (n k) e quindi
n n!
nk
nk

0
n!
n(n 1) (n k)
n n
n
nn
= perche
> n
lim
n n!
nn1
1

lim

a
an
e osservando che tutti i fattori
con n > [a] sono minori di 1, quindi
=
n
n!
a
a a
. la quantit`a a secondo membro risulta essere una costante C(a),
nn1
1
an
a a
a
a
che dipende solo da a, per na che tende a 0.
=
= C(a) .
n!
nn1
1
n
Possiamo riassumere quanto visto dicendo che definitivamente si ha, se a > 1 e k
intero positivo fissato,
nk < an < n! < nn .

1.2

Qualche criterio
a1 + . . . + an
ha lo stesso comportamento della successione an ;
n
a1 + . . . + an
in particolare se an l allora anche
l. Come conseguenza si
n
log n!
diverge.
ha che
n
Diamo un cenno della dimostrazione solo per il caso l = 0 lasciando al lettore
la cura di trattare gli altri casi e di evidenziare i dettagli anche per il caso che
diamo.
a1 + . . . + a n
Indichiamo con bn =
: vogliamo mostrare che bn 0. Sapn
piamo che an 0 e quindi che fissato un esiste un n0 tale che per n >

La successione

n0 |an | < . Il termine bk della successione `e somma di due termini bk =


a1 + . . . + an0 an0 +1 + . . . ak
a1 + . . . + an0 + an0 +1 + . . . ak
=
+
= b1k + b2k Ora
k
k
k
0
,
quantit`
a
questultima
che tende ad
il termine b2k viene maggiorato da kn
k
1; facendo crescere opportunamente k si ottiene che, essendo n0 fissato, anche
il termine b1k diventa definitivamente piccolo, diciamo minore di . Quindi in
definitiva il termine bk diviene definitivamente piccolo.1
an+1
= l. Se l < 1 allora an 0, se
n an

Sia an una successione tale che lim


l > 1 allora an .

Se l < 1 si pu`o scegliere un in modo che l + < 1. Indichiamo con M = l + .


| < M , quindi si ha che
Per definizione di limite si ha che per n > , | an+1
an
definitivamente an+1 < M an e cio`e che per n > |an+ | < M a . La tesi si
ottiene dal fatto che essendo M < 1 M j 0 e per confronto am+ 0.
an+1
1
= l allora anche limn (an ) n = l.
n an
Ripercorrere la prova precedente osservando che definitivamente (cio`e per n >
) | an+1
l| < da cui si ha che definitivamente vale
an

Sia an una successione. Se lim

(l )an < an+1 < (l + ).


Quindi ricorsivamente otteniamo
(l )m a < am+ < (l + )m a .
Prendendo le radici (m + )-esime si ha
m

(l ) m+ am+ (am+ ) m+ (l + ) m+ am+ .


m

Da questo si conclude osservando che am+ 1, (l ) m+ l + . . . e che


quindi definitivamente si ha
1

l 2 < ajj < l + 2


per cui converge a l.

1.3

Altri confronti.

Sappiamo che lim

n = 1 e che lim

a = 1 Calcolare

Se l 6= 0 basta osservare che la successione an = an l tende a 0 e che bn =


a1 l + . . . + an l
a1 + . . . + an
=
l
n
n

a1 + . . . + an
=
n

lim

n!

n!
n n

lim n a0 a1 an1 = lim an


lim

1.4

Varie.

Determinare il comportamento delle successioni seguenti


lim

log(n + 1)
log(n 1)

2
2
log(n 1)(1 + n1
)
log(n 1) + log(1 + n1
)
log(n + 1)
Sol. lim
= lim
= lim
=
n log(n 1)
n
n
log(n 1)
log(n 1)
2
2 n1
2
)
)
)
(n 1) log(1 + n1
log(1 + n1
log(1 + n1
= 1+ lim
= 1+ lim
=
1+ lim
n (n 1) log(n 1)
n (n 1) log(n 1)
n log(n 1)
log e2
1 + lim
=1
n (n 1) log(n 1)

Sulla base dellesempio precedente calcolare lim

log(an + b)
o pi`
u in generale
log(cn + d)

log(P (n))
ove P e Q sono due polinomi di gradi rispettivamente p e q.
n log(Q(n))

lim n + 1 n
n

( n + 1 n)( n + 1 + n)
1

= lim
Sol. lim n + 1 n = lim

=
n
n
n
n+1+ n
n+1+ n
0

n
Se 0 < a < b allora lim an + bn = b perche bn < an + bn < 2bn , quindi
n

b n an + bn n 2b e per confronto il risultato.


lim

1.5


n
1
Variazioni sulla successione 1 +
.
n

n
1
Sappiamo che la successione 1 +
`e convergente a un limite che `e un numero
n
reale compreso tra 2 e 3, numero che convenzionalmente si indica con e.


Qui di segito mostriamo qualche manipolazione che permette di ricondurre il calcolo


di alcuni limiti a quello della successione iniziale. 2
2

Attenzione: alcuni dettagli non sono esplicitati completamente; si invita pertanto lo studente
a esplicitarli.

Un limite che si calcola direttamente a partire dal limite di questa successione


`e
ln 1 +

lim

1
n

1
n

=1

()

Infatti
lim

ln 1 +
1
n

1
n

1
= lim n ln 1 +
n
n

1
= lim ln 1 +
n
n

n

=1

Si vede immediatamente che se k `e un intero fissato


lim

1
1+
n+k

n

=e

Infatti


1
1+
n+k

n

()

n+k
1
n+k
k
1
+ n+k

1+
1

La successione a numeratore converge ad e (perche?) e quella a denominatore,


essendo k un intero fissato, converge ad 1.
Con un ragionamento del tutto analogo si prova anche che se k `e un intero
fissato si ha

n+k
1
lim 1 +
= e.
n
n


 n a

1 a
a n
lim 1 +
= lim 1 + n
= ea .
n
n
n
a
Quindi, in modo del tutto analogo a () si ha

ln 1 + na
a
lim
=
b
n
b
n

A questo punto dovrebbe esser chiara la ragione e leffetto delle manipolazioni


nei due esempi seguenti.
1.
lim

2n2 + 5
2n2 + 4

n2

= lim

= lim

2n2 + 4 4 + 5
2n2 + 4

1
1+ 2
2n + 4
5

n2

(2n2 +4)

= lim

n2
2n2 +4


1

= e2

1
1+ 2
2n + 4

n2

2.
lim

3n + 1
3n 5

n2

= lim

= lim

3n 5 + 5 + 1
3n 5

6
1+
3n 5

n2

= lim

6(n2)
 3n5
3n5
6

6
1+
3n 5

n2

= e2

Sia an una successione tale che lim an = +. Proviamo che


n

lim

1
1+
an

a n

=e

.
Prova (cenno). Il fatto che lim an = + ci assicura che definitivamente
n

an > 0 e che la successione delle parti intere [an ] diverge (an 1 < [an ]).

Da qui abbiamo che, indicata con kn la parte intera di [an ] 3 , si ha


1+

1
1
1
<1+
1+
kn + 1
an
kn

e di conseguena

1+

1
kn + 1

kn

<

1
1+
an

an

<

1
1+
kn

kn +1

Ora in modo del tutto analogo a quanto fatto in (), si osservi per la successione
a sinistra che

kn +1
1
 kn

1
+
kn +1
1

= 
1+
kn + 1
1 + kn1+1

Quindi la successione al numeratore converge


ad e, essendo una sottosucce
1 n
sione della successione convergente 1 + n , e la successione al denominatore
converge a 1.
In modo analogo si vede che anche la successione a destra converge ad e, per
cui per il teorema del confronto (carabinieri) si ha che la successione al centro
converge ad e.

(kn an < kn + 1 )

Serie

2.1

Qualche serie di base.

Avvertenza: le serie trattate in queste note si intenderanno sempre a termini


positivi.
Come per le successioni, anche per le serie un metodo efficiente per determinarne la
natura `e quello di confrontarle con altre serie di cui si conosce il comportamento.
Serie numeriche che possono servire come confronto per stabilire la natura di altre
serie sono
P n
1. La serie geometrica
a
P1
2. La serie armonica
n

3. La serie armonica generalizzata

1
n

Questo appare evidente anche nella prova di due criteri analoghi a quelli del rapporto
e della radice provati per le successioni.
P
Criteri 2.1. Sia
an una serie a termini positivi. Allora
an+1
= l. Se l < 1 allora la serie converge, se l > 1
an
allora la serie diverge e nulla si puo dire se l = 1

(radice)Sia lim n an = l. Se l < 1 allora la serie converge, se l > 1 allora la


n
serie diverge e nulla si puo dire se l = 1
(rapporto)Sia lim

La prova `e del tutto analoga a quella degli analoghi criteri per le successioni. In
particolare per il criterio del rapporto si noti che se an+1
< C si ha che a2 < Ca1 , a3 <
an
P
2
n
C a1 , . . . , an+1 < C a1 e quindi la serieP an pu`oPessere maggiorata, a meno del
termine a1 , con una serie geometrica:
an a1 C n . Da qui le conclusioni se
C < 1.
Vediamo pi`
u da vicino il comportamento di queste serie. In particolare la serie
geometrica `e stata gi`a trattata diffusamente in varie altre dispense: qui ripetiamo
brevemente per completezza le considerazioni fatte al fine di stabilire la natura di
questa serie.
1. La serie geometrica
Ricordiamo che

an

(1 a)(1 + a + a2 + + an ) = 1 an+1

da cui abbiamo immediatamente che


n
X

aj =

1 an+1
1a

e quindi che se |a| < 1 la serie converge a


converge se a < 1).
P1
2. La serie armonica
n

1
1a

mentre diverge se a 1 (e non

Per stabilire la natura di questa serie maggioriamo le ridotte spezzando opportunamente il numero di elementi su cui sommiamo.
1<1
1
1
1 1
=2 < +
2
4
2 3
1
1 1 1 1
1
=4 < + + +
2
8
4 5 6 7

1
1
1
1
1
= 2k k+1 < k + k
+ k
2
2
2
2 +1
2 + 2k 1
Otteniamo quindi per la successione delle somme parziali dei termini fino al
2n+1 1-esimo la minorazione
n+1

2X
1
1
1
1 1
1 + + + + < 1 +
2 2
2
n
2

per cui la serie armonica diverge.


3. La serie armonica generalizzata.
Per studiare questa serie utilizziamo la stessa idea del punto precedente, cio`e
un opportuno spezzamento della lunghezza delle ridotte.
Lemma 2.2. (Lemma di condensazione) Sia an una serie a termini positivi decrescenti. Allora vale
n
X

2 a2j+1 <

j=0

n
X

aj <

j=0

n
X

2j a2j

j=0

Prova. Procediamo in maniera analoga a quanto fatto per la serie armonica.


a2 < a1 < a1
2a4 < a2 + a3 < 2a2
22 a8 < a4 + a5 + a6 + a7 < 22 a4
8

23 a16 < a8 + a9 + a10 + + a15 < 23 a8

2j a2j+1 < a2j +

+ a2j+1 1 < 2j a2j

Sommando otteniamo per le ridotte


n
X

2 a2j+1 <

j=0

n
X

aj <

j=0

n
X

2j a2j

j=0

Applicando questo alla serie armonica generalizzata abbiamo


n
X

j=0

1
2(j+1)

n
n
X
X
1
1
<
<
2j j

n
2
j=1
j=1

n
n
X
X
1
1 j
quindi
<
e quindi essendo questultima una serie geomen
21
j=0
j=0

trica di ragione

2.2

1
21

converge se > 1

Serie telescopiche.

Un tipo di serie abbastanza agevoli da trattare sono le cosiddette serie telescopiche,


cio`e le serie della forma
X
(ak ak+1 )

in cui, volendo serie a termini positivi, dobbiamo supporre P


che la successione an
`
sia decrescente. E immediato che per le sommeP
parziali n = n1 (ak ak+1 ) risulta
n = a1 an+1 e quindi se limn
P an = c allora (ak ak+1 ) = a1 c. In particolare
se limn an = 0 risulta che (ak ak+1 ) = a1 .

Ovviamente valgono considerazioni analoghe per le serie il cui termine generale `e


positivo e del tipo ak ak+ rimpiazzando a1 con la somma dei primi termini della
successione aj .
Vediamo alcuni esempi.
1.

1
n

1
.
n+1

` immediato che questa serie converge a 1


E
P 1
1
(n+2)
2.
2 . Serie telescopica in cui an =
n2
P 3
3.
.
n2 +3n

1
n2

` immediato ricondursi a una serie telescopica osservando che


E
P k
4.
con k numero intero.
n2 +kn
9

3
n2 +3n

1
= n1 n+3
.

5.

1
.
n2 n

Per la convergenza della serie basterebbe osservare che per n > 2 si ha 2n < n2
2
da cui n2 n > n2 per cui n21n < n22 , serie questultima che `e convergente
essendo una serie armonica generalizzata con esponente maggiore di 1. Riconoscere il carattere telescopico ci permette in pi`
u di calcolarne la somma.
1
1
1
= n1 n . Calcolando le somme parziali otteniamo n = 1 n1 e poiche
n2 n
limn n1 = 0 abbiamo che la somma `e 1.

2.3

Miscellanea.

Studiare il comportamento delle serie seguenti


1.

2.

3.

X n2 + 1

3n
Convergente. Dal criterio del rapporto abbiamo limn

an+1
an

= 31 .

X 7n

n!
Convergente. Dal criterio del rapporto.
X
nn

(2n + 1)n
Convergente. Dal criterio della radice.
X  n 3 n2
4.
6n
n

Convergente. Usando il criterio della radice abbiamo che lim

an = 6e3 < 1.

X n!
nn
Convergente. Criterio del rapporto.
X 1
1  4

.
6.
n
n+1

5.

7.

1
1
1
Osserviamo che per il termine generico si ha
=

n
n+1
n( n + 1)
1
. Pertanto la serie diverge essendo minorata da una serie armonica.
2n
X n n

n3 + 1
Convergente. Infatti operando manipolazioni algebriche sul termine generico

3
3
X 1
n n
n2
n2
1
otteniamo 3
= 3
3 3 . La serie
e `e
3 converge poich
n +1
n +1
n
n2
n2
una serie armonica generalizzata con esponente maggiore di 1.

Attenzione, questa serie non `e telescopica.

10

8.

X n + 1
n3 + 1

2
2 n
= 5 e quindi la serie
Convergente. Per il termine generico vale an
3
n
n2
pu`o essere maggiorata con una serie armonica convergente perche 25 > 1.

9.

2n
.
n3 + 1

Divergente. Operando sul termine generico otteniamo

2
1

n2

e poiche

1
2

2n
n3 +1

< 1 la serie armonica generalizzata diverge.

2n
n3 +n3

2
n

X n!
nn

X
1  n3
11.
1
n

10.

12.

X log n!

13.

X log n

n3

n2
n
< nn2 e che questa serie diverge essendo la serie armonica.
Osserviamo che log
n2
Se tentiamo di ottenere
2 informazioni dal criterio del rapporto abbiamo che
log(n+1)
an+1
n
= log n n+1 e entrambi i termini del prodotto convergono a 1.
an
Quindi entrambi i tentativi falliscono.

Proviamo con il criterio di condensazione. Otteniamo


X
X
X n log 2
log(2n )
n log 2
n
a2n =
=
quindi
a

2
a
=
. Quindi a
n
2n
22n
22n
2n
X n
meno del termine log 2 siamo ricondotti a studiare il carattere della serie
2n

n
n
cosa che si fa in modo agevole con il criterio della radice poiche lim
=
n 2
1
. Quindi in definitiva la serie data converge perche tramite il criterio di
2
condensazione si riesce a maggiorare con una serie convergente.

11

November 10, 2014


FUNZIONI REALI DI UNA VARIABILE REALE

Estendendo quanto visto per le successioni [SUCCESSIONI] consideriamo in generale funzioni


f :DR
definite su un arbitrario sottoinsieme D di R. Se D = {n N| n n0 } ritroviamo il caso delle
successioni. Trattando le propriet`
a dellinsieme D faremo riferimento alle nozioni introdotte nella
dispensa [TOP].
1. Limiti di funzioni
Supponiamo che x0 R sia un punto di accumulazione per linsieme D. Sotto questa ipotesi (e solo
sotto questa ipotesi), dato L R, vogliamo dare un senso alla scrittura
L = lim f (x)
xx0

che leggeremo
L `e (valore) limite della funzione f per x che tende a x0 .
Definizione sintetica di limite di una funzione.
Se x0 R `e un punto di accumulazione dellinsieme D e L R, allora
L = lim f (x)
xx0

se per ogni intorno U di L esiste un intorno W di x0 tale per ogni x W (D \ {x0 }) (cio`e per ogni
punto di D W diverso da x0 ), f (x) U .
Come nel caso dei limiti delle successioni possiamo fare lesercizio di esplicitare completamente questa
definizione in modo analitico, a seconda che x0 R o x0 = e rispettivamente L R o L = ,
considerando tutte le possibili 9 = 3 3 possibilit`a. Limitiamoci qui a trattare solo alcuni casi
(lasciando gli altri per esercizio).
- Supponiamo che x0 R e L R. Gli intorni W e U sono rispettivamente della forma I(x0 , ) e
I(L, ), dove e variano tra i numeri reali positivi. Allora la definizione si esplicita come segue:
Per ogni > 0, esiste un > 0 tale che per ogni x I(x0 , ) (D \ {x0 }) (cio`e ogni x D diverso da
x0 e tale che |x x0 | < ), f (x) I(L, ) (cio`e |f (x) L| < ).
- Supponiamo che x0 R e L = +. Gli intorni W sono come nel caso precedente, mentre U `e una
semiretta della forma U = (m, +). Allora la definizione si esplicita come segue:
Per ogni m R, esiste un > 0 tale che per ogni x I(x0 , ) (D \ {x0 }) (cio`e ogni x D diverso
da x0 e tale che |x x0 | < ), f (x) (m, +) (cio`e f (x) > m).
- Supponiamo che x0 = e L = +. Lintorno W `e una semiretta della forma W = (, k),
mentre U `e una semiretta della forma U = (m, +). Allora la definizione si esplicita come segue:
Per ogni m R, esiste k R tale che per ogni x (, k) (D \ {x0 }) (cio`e ogni x D diverso da
x0 e tale che x < k), f (x) (m, +) (cio`e f (x) > m).
Caratterizzazione dei limiti di funzione in termini di limiti di successioni. Vale il seguente
fatto:
Si ha che L = lim f (x) se e solo se per ogni successione a : N D \ {x0 } tale che an x0 , si ha
xx0

che

lim f (an ) = L.

n+

Infatti, supponiamo che L = lim f (x) e fissato arbitrariamente un intorno U di L sia W un intorno
xx0

di x0 tale f (W (D \ {x0 })) U . Se an a valori in D \ {x0 } converge a x0 , allora an appartiene


definitivamente a W (D \ {x0 }) e quindi f (an ) appartiene definitivamente a U . Dimostriamo ora

FUNZIONI REALI DI UNA VARIABILE REALE

la contronominale dellaltra implicazione. Dimostriamo cio`e che se L non `e limite di f (x) per x
x0 , allora esiste una successione an a valori in D \ {x0 } che converge a x0 e tale che f (an ) non
converge a L. Dallipotesi sappiamo che esiste un intorno U di L tale che per ogni n > 1, esiste
xn I(x0 , 1/n) (D \ {x0 }) tale che f (xn )
/ U . Poniamo allora a0 = 0, an = xn per ogni n 1. E
chiaro dalla costruzione che an x0 e che f (an ) non converge a L.
Questa caratterizzazione a volte pu`
o essere usata per dimostrare che una funzione non ammette alcun
limite costruendo due successioni a, b : N D \ {x0 } tali che an x0 , bn x0 mentre f (an ) L1
e f (bn ) L2 , con L1 6= L2 . Per esempio si consideri la funzione
f : (0, +) R, f (x) = sin(1/x) .
Si osserva che sin(1/x) = 1 se 1/x = /2 + 2n, cio`e se x = 1/(/2 + 2n), n N. Analogamente
sin(1/x) = 1 se x = 1/(/2 + 2n), n N. Poniamo dunque an = 1/(/2 + 2n), bn =
1/(/2 + 2n), n 0. Chiaramente an 0, bn 0, f (an ) 1, f (bn ) 1, quindi la funzione f
non ha alcun limite per x 0.
Enunciamo ora alcune propriet`
a dei limiti di funzione che sono conseguenza della definizione. Propriet`a
analoghe sono gi`
a state incontrate nel caso delle successioni. In effetti la caratterizzazione vista prima
permette proprio di estendere il caso delle successioni al caso generale.
In quanto segue sono dati una funzione f : D R e un punto x0 R di accumulazione per D.
Unicit`
a del limite. Se L R `e tale che L = lim f (x) , allora L `e lunico valore limite della
xx0

funzione f in R per x che tende a x0 . Pertanto scriveremo anche lim f (x) = L intendendo che L `e
xx0

il limite della funzione per x che tende a x0 .


Permanenza del segno. Se lim f (x) = L R e L 6= 0, allora esiste un intorno W di x0 tale che
xx0

per ogni x W (D \ {x0 }), f (x) ha lo stesso segno di L.


Propriet`
a algebriche dei limiti di funzione. Usando la caratterizzazione per mezzo del limite
di successioni vista prima, le propriet`
a algebriche dei limiti di successioni si estendono ai limiti di
funzioni generali. Per completezza le enunciamo di nuovo.
(1) (Limite di una somma di funzioni.) Siano a, b : D R due funzioni, x0 R di
accumulazione per D. Supponiamo che
lim a(x) = L R

xx0

lim b(x) = L R

xx0

e che L + L `e definito (cio`e non `e una forma indeterminata). Allora


lim (a(x) + b(x)) = L + L R .

xx0

(2) (Limite di un prodotto di funzioni.) Siano a, b : D R, x0 come sopra. Supponiamo


che
lim a(x) = L R
xx0

lim b(x) = L R

xx0

e che L L `e definito (cio`e non `e una forma indeterminata). Allora


lim a(x)b(x) = L L R .

xx0

(3) (Limite della funzione reciproca.) Sia a : D R una funzione e supponiamo che per
ogni x D, a(x) 6= 0. Supponiamo che
lim a(x) = L R

xx0

e che 1/L sia definito. Allora


lim 1/a(x) = 1/L R .

xx0

FUNZIONI REALI DI UNA VARIABILE REALE

(4) Nella situazione del punto precedente, supponiamo che L = 0 e che esista un intorno W di x0
tale f (x) abbia segno costante + o su W (D \ {x0 }). Allora
lim 1/a(x) = .

xx0

In particolare
lim 1/|a(x)| = + .

xx0

Confronto di funzioni. Come per le successioni, in certi casi si possono ricavare informazioni sui
limiti di una funzione confrontandola con altre funzioni di cui il comportamento sia noto.
Confronto 0. Due funzioni a, b : D R che coincidono su W (D \ {x0 }) per qualche intorno W del
punto x0 di accumulazione per D hanno lo stesso comportamento per x x0 , cio`e luna ha limite se
e solo se laltra ha limite ed eventualmente i limiti coincidono.
Confronto 1. Siano a, b : D R due funzioni. Supponiamo che
lim b(x) = +

xx0

e che esiste un intorno W di x0 tale che per ogni x W (D \ {x0 }), a(x) b(x). Allora
lim a(x) = + .

n+

Ce una versione analoga se


lim b(x) =

xx0

i cui dettagli sono lasciati al lettore.


Confronto 2. Siano a,b,c tre funzioni definite su D R. Supponiamo che:
1) lim a(x) = lim b(x) = L R;
xx0

xx0

2) Esiste un intorno W di x0 tale che per ogni x W (D \ {x0 }), a(x) c(x) b(x).
Allora:
lim c(x) = L .

xx0

Convergenza delle funzioni monotone Sia x0 di accumulazione per linsieme D e supponiamo


che x x0 per ogni x D \ {x0 }. Supponiamo che f : D R sia non decrescente e superiormente
limitata. Allora
lim f (x) = L = sup{f (x)| x D \ {x0 }} .
xx0

Se f `e non decrescente e superiormente illimitata, allora


lim f (x) = + .

xx0

Vale una versione analoga quando x0 x per ogni x D e f `e non crescente. Lasciamo i dettagli al
lettore.
Limiti di funzioni composte. Nel caso delle successioni abbiamo studiato il comportamento delle
sottosuccessioni di successioni regolari. Questo si estende allo studio dei limiti delle funzioni composte.
Vale il seguente fatto:
Siano f : D R tale che f (D) D R, e sia g : D R. Possiamo quindi considerare la funzione
composta g f : D R. Supponiamo che:
1) x0 R `e di accumulazione per D.
2) lim f (x) = L R e L `e di accumulazione per D .
xx0

3) lim g(y) = M R
yL

4) Esiste un intorno W di x0 tale che per ogni x W (D \ {x0 }), f (x) 6= L.


Allora lim g f (x) = M .
xx0

FUNZIONI REALI DI UNA VARIABILE REALE

Alcune osservazioni su questo enunciato. Se L = la condizione 4) `e automaticamente verificata. Se


L R, la condizione 4) `e necessaria. Infatti si considerino: f (x) = x sin(1/x) definita su D = {x 6= 0};
g(y) definita su D = R da g(y) = 0 se y 6= 0, g(0) = 1; x0 = 0. Allora lim f (x) = 0 (verificarlo
x0

per esercizio), 0 `e di accumulazione per D , lim g(y) = 0. Daltra parte g(x sin(1/x)) = 1 se e solo
y0

se sin(1/x) = 0, cio`e 1/x = n, x = (1/n), con n che varia in N. Altrimenti g(x sin(1/x)) = 0.
Applicando la caratterizzazione dei limiti per mezzo delle successioni si vede allora che gf `e irregolare.
Infatti lenunciato precedente non si applica perche non vale lipotesi 4). La dimostrazione `e una
conseguenza diretta delle definizioni e pu`
o essere svolta come utile esercizio.
Vedremo tra poco una variante di questo enunciato che far`a uso della nozione di continuit`
a.
Limiti destri e limiti sinistri. Dati x0 R e D R, diciamo che x0 `e un punto di accumulazione
bilaterale di D se `e un punto di accumulazione per entrambi i sottoinsiemi D+ = {x D; x > x0 }
e D = {x D; x < x0 }. Se f : D R `e una funzione definita su D indichiamo con f + e f
rispettivamente le restrizioni di f a D+ e D . Poniamo allora per definizione
lim f (x) := lim f + (x)
xx0

xx+
0

lim f (x) := lim f (x) .


xx0

xx
0

Vale il seguente fatto di facile verifica:


lim f (x) = L R se e solo se lim+ f (x) = lim f (x) = L.

xx0

xx0

xx0

In certi casi pu`


o essere conveniente ricondurre lo studio del limite di f per x x0 allo studio dei due
limiti destro e sinistro. Per esempio se lim f (x) = L+ , lim f (x) = L e L+ 6= L , allora possiamo
xx+
0

xx
0

concludere che non esiste il limite lim f (x). Ad esempio questo si applica alla funzione f (x) = 1/x
xx0

definita su D = R \ {0} e x0 = 0.
2. Funzioni continue
Funzioni continue in un punto. Siano f : D R una funzione e x0 D. Per definizione
la funzione f `e continua nel punto x0 D se per ogni intorno U di f (x0 ) esiste un intorno W di x0
tale che per ogni x W D, f (x) U .
In questo caso entrambi x0 e f (x0 ) appartengono a R, quindi la definizione appena data pu`
o essere
esplicitata come segue:
la funzione f `e continua nel punto x0 D se per ogni > 0 esiste > 0 tale che per ogni x
I(x0 , ) D (cio`e x D e |x x0 | < ) si ha che f (x) I(f (x0 ), ) (cio`e |f (x) f (x0 )| < ).
Ci sono due casi possibili riguardo alla posizione di x0 in D:
(1) x0 D ed `e di accumulazione per D;
(2) x0 D e non `e di accumulazione per D. Quindi esiste un intorno I(x0 , ) di x0 tale che I(x0 , )
D = {x0 } e si dice anche che x0 `e un punto isolato di D.
Valgono i seguenti fatti
(a) Se x0 D `e un punto isolato di D allora f `e continua in x0 .
(b) Se x0 D `e di accumulazione per D allora f `e continua in x0 se e solo se
lim f (x) = f (x0 ) .

xx0

Dimostriamo (a). Fissiamo un intorno W di x0 in R tale che DW = {x0 }. Allora f (DW ) = {f (x0 )}
che `e contenuto in qualsiasi intorno di f (x0 ). Dimostriamo (b). Supponiamo che f sia continua in
x0 . Fissato un intorno U di f (x0 ), sia W un intorno di x0 tale che f (W D) U . Allora a maggior
ragione f (W (D \ {x0 })) U e quindi lim f (x) = f (x0 ). Dimostriamo ora la contronominale
xx0

FUNZIONI REALI DI UNA VARIABILE REALE

dellaltra implicazione. Supponiamo che f (x0 ) non sia uguale a lim f (x) e dimostriamo che allora f
xx0

non `e continua in x0 . Usando lipotesi sappiamo che esiste un intorno U di f (x0 ) tale per ogni intorno
W di x0 esiste x W D, x 6= x0 , tale che f (x)
/ U . Quindi non esiste alcun intorno W di x0 tale
che f (D W ) U e f non `e continua in x0 .
Estensione di funzioni per continuit`
a. Siano D un sottoinsieme di R, x0 R di accumulazione
per D e supponiamo che x0
/ D. Sia f : D R tale che lim f (x) = L R. Allora possiamo definire
xx0
f : D {x0 } R, ponendo f(x) = f (x) se x D, f(x0 ) = L. E immediato che f `e continua in x0 ;
si dice allora che f `e stata ottenuta estendendo f al punto x0 per continuit`
a. Ad esempio la funzione
f (x) = x sin(1/x) `e definita su R \ {0}. Si verifica che lim f (x) = 0, quindi f pu`
o essere estesa al
x0

punto 0 per continuit`


a, ponendo f (0) = 0.
Funzioni globalmente continue. Si dice che una funzione f : D R `e continua se per ogni x D, f `e
continua in x. Per esempio:
- Ogni successione f : N R `e continua perche ogni n N `e isolato in N.
- Se D `e un sottoinsieme aperto di R (vedi [TOP]) allora f : D R `e continua se e solo se per ogni
x0 D
lim f (x) = f (x0 ) .
xx0

Infatti se D `e aperto ogni x0 D `e di accumulazione per D.


Esempi

fondamentali di funzioni continue. Le seguenti funzioni sono continue:


Le funzioni costanti x c definite su tutto R.
La funzione identit`
a x x definita su tutto R.
Le funzioni trigonometriche
x sin(x) e x cos(x)

definite su tutto R.
La funzione esponenziale x ex definita su tutto R.
La funzione logaritmo naturale x log(x) definita sulla semiretta aperta (0, +).
La verifica di queste affermazioni pu`
o essere fatta per esercizio.
Ancora sui limiti delle funzioni composte. Come promesso diamo qui una variante del risultato
gi`a visto, dove vegono modificate le ipotesi 2) e 4). Vale il seguente fatto:
Siano f : D R tale che f (D) D R, e sia g : D R. Possiamo quindi considerare la funzione
composta g f : D R. Supponiamo che:
1) x0 R `e di accumulazione per D.
2) lim f (x) = L R, L D ed `e di accumulazione per D .
xx0

3) lim g(y) = M R
yL

4) g `e continua in L.
Allora lim g f (x) = M .
xx0

La dimostrazione `e una conseguenza diretta delle definizioni e pu`


o essere svolta come utile esercizio.
Si noti che nellesempio dato in precedenza a commento della necessit`a dellipotesi 4), la funzione g
non `e continua in L = 0. Quindi quellesempio non verifica neanche l ipotesi 4).
Continuit`
a delle restrizioni e della composizione di funzioni continue. Valgono i seguenti
fatti:
(1) Se f : D R `e continua e D D `e un sottoinsieme di D, allora la restrizione di f a D
f| : D R `e continua.
(2) Siano f : D R tale che f (D) D R, e sia g : D R. Possiamo quindi considerare la
funzione composta g f : D R. Se f e g sono continue allora anche g f `e continua.

FUNZIONI REALI DI UNA VARIABILE REALE

Il punto (1) `e una conseguenza immediata delle definizioni. Per il punto (2), basta dimostrare che g f
`e continua in ogni punto x0 D che `e di accumulazione per D e il risultato voluto `e una conseguenza
di quanto osservato sui limiti delle funzioni composte.
Sulla (non) continuit`
a della funzione inversa. Sia f : D R continua e iniettiva. Quindi
`e definita la funzione inversa f 1 : Im(f ) D R. Possiamo allora chiederci se anche f 1 `e
continua. La risposta `e in generale negativa. Si consideri ad esempio f : N R, definita da f (0) = 0,
f (n) = 1/n per ogni n 1. Chiaramente f `e iniettiva ed `e continua perche tutti i punti di N sono
isolati. Limmagine di f `e
Im(f ) = {0} {1/n| n 1}
1

allora f `e continua in ogni punto del tipo 1/n perche questo `e isolato in Im(f ). Daltra parte f 1
non `e continua in 0. Infatti 0 `e di accumulazione per Im(f ), 1/n 0,
lim f 1 (1/n) = lim n = + 6= f 1 (0) = 0 .

n+

n+

E per`
o vero che per certe classi particolari di funzioni continue e invertibili linversa `e a sua volta
continua. Ad esempio vedremo in seguito che vale il seguente risultato:
Sia f : I R una funzione continua e iniettiva definita su un intervallo aperto I. Allora anche
J := Im(f ) `e un intervallo aperto e f 1 : J I `e continua.
Ancora sui limiti di funzione.
Sulle forme indeterminate. Nello studio delle propriet`
a algebriche dei limiti (di successioni o di
funzioni) abbiamo individuato delle cosiddette forme indeterminate. In questo paragrafo vogliamo
riorganizzarle un po. Poniamo per indicare senza fare distinzione . Prendiamo come forme
indeterminate fondamentali le due seguenti:
0
,
.
0
Individuiamo adesso altre forme indeterminate ed indichiamo come, almeno formalmente, possano
essere ricondotte a quelle fondamentali.
(0 ) Supponiamo che per x a, un prodotto di funzioni f (x)g(x) presenti una indetermif (x)
nazione del tipo 0 . Allora in un intorno di a, f (x)g(x) = 1 dove il rapporto presenta
g(x)

0
ora unindeterminazione di tipo . Se f e diversa da zero quando x a, allora possiamo
0

g(x)
.
anche usare f (x)g(x) = 1 ottenendo cos` una indeterminazione di tipo

f (x)
(+ ). Supponiamo che per x a, una somma di funzioni f (x) + g(x) presenti una
indeterminazione del tipo + (+). Allora f + g = log(ef +g ) = log(ef eg ), cos` che al
limite il prodotto ef eg presenta una indeterminazione di tipo 0 e ci possiamo ricondurre
al caso precedente.
(1 ). Supponiamo che per x a, la funzione f (x)g(x) = eg(x) log(f (x)) sia tale che f (x) > 0,
f (x) 1, g(x) . Si noti che lesponente g(x) log(f (x)) presenta una indeterminazione
di tipo 0 e possiamo quindi ricondurci ad un caso precedente. Questa situazione si pu`
o
1
anche trattare osservando che f (x)g(x) = ((1 + (f (x) 1)) f (x)1 )(f (x)1)g(x) , con f (x) 1 che
tende a 0 quando x a. Usando il limite
lim (1 + y)1/y = e

y0

che giustificheremo dopo, e un cambio di variabile, per x a siamo ridotti a studiare il limite
di e(f (x)1)g(x) e nellesponente troviamo ancora una indeterminazione di tipo 0 . Abbiamo
cos` individuato un nuovo tipo di indeterminazione indicato come 1 .

FUNZIONI REALI DI UNA VARIABILE REALE

(0 ). In una situazione analoga alla precedente supponiamo che f (x) > 0, f (x) ,
g(x) 0. Come prima consideriamo f (x)g(x) = eg(x) log(f (x)) e osserviamo che lesponente
g(x) log(f (x)) presenta ancora una indeterminazione di tipo 0 = 0 e possiamo quindi
ricondurci ad un caso precedente.
Alcuni limiti notevoli.
(1) Si consideri la funzione x sin(x)/x definita su D = R \ {0}. Il punto 0 `e di accumulazione per
D. Vale allora
lim sin(x)/x = 1 .
x0

Infatti valgono le seguenti disuguaglianze


sin(x) < x < sin(x)/ cos(x), 0 x /4
sin(x) > x > sin(x)/ cos(x), 0 > x /4
dividendo per per sin(x), otteniamo che per ogni x [/4, /4],
cos(x) < sin(x)/x < 1
e si conclude usando la continuit`
a del coseno e i carabinieri.
(2) Si consideri la funzione x (cos(x) 1)/x definita su D = R \ {0}. Il punto 0 `e di accumulazione
per D. Vale allora
lim (cos(x) 1)/x = 0 .
x0

Infatti, moltiplicando numeratore e denominatore per (cos(x) + 1) si pu`


o riscrivere la funzione nella
forma
x sin(x)( sin(x)/x)(1/(cos(x) + 1))
dove, quando x 0, i tre fattori del prodotto tendono rispettivamente a 0 (per la continuit`
a del seno),
1 (esempio (1)), 1/2 (per la continuit`
a del coseno). Il risultato segue per le propriet`
a algebriche dei
limiti. Ragionando in modo simile si dimostra che
lim (1 cos(x))/x2 = 1/2 .

x0

1 x
) = ex log(1+1/x) definita su D = {x R| (1 + 1/x) > 0}.
x
I punti R sono di accumulazione per D. Vale allora:
1
lim (1 + )x = e .
x
x
(3) Si consideri la funzione f (x) := (1 +

Consideriamo +. Indicando come al solito x [x] la funzione parte intera di x definita su R+ =


{x R| x > 0}. Poniamo
g(x) = (1 +

1
1 [x]+1
)[x] , h(x) = (1 +
)
.
[x] + 1
[x]

Si osserva che:
Poich`e [x] x [x] + 1, allora per ogni x > 0, g(x) f (x) h(x).
Se [x] = n, allora
1
1 n+1)
)
/(1 +
)
g(x) = (1 +
n+1
n+1
1
1
h(x) = (1 + )(1 + )n .
n
n
1
1
Poiche (1 +
) 1 e (1 + ) 1 quando n +, allora g(x) e e h(x) e (limite
n+1
n
notevole che definisce il numero di Nepero).
Infine, per i carabinieri anche f (x) e quando x +.

FUNZIONI REALI DI UNA VARIABILE REALE

Il caso di si tratta in modo analogo.


(4) Si consideri la funzione f (x) := (1 + x)1/x definita su D = (1, 1) \ {0}. Il punto 0 `e di accumulazione per D. Vale allora
lim (1 + x)1/x = e .
x0

Infatti f (x) = F (G(x)), dove G(x) = 1/x definita su D, F (y) = (1 + 1/y)y , definita quando |y| > 1.
Allora il limite segue da quelli dellesempio (3) e dalle propriet`
a dei limiti delle funzioni composte.
(5) Si consideri la funzione f (x) :=
lazione per D. Vale allora

log(1 + x)
definita su D = (1, 1) \ {0}. Il punto 0 `e di accumux

log(1 + x)
=1.
x
Infatti f (x) = log((1 + x)1/x , allora poiche log(e) = 1, il risultato segue dalla continuit`
a di log e dal
limite dellesempio (4).
lim

x0

(6) Si consideri la funzione f (x) := (ex 1)/x definita su D = R \ {0}. Il punto 0 `e di accumulazione
per D. Vale allora
lim (ex 1)/x = 1 .
x0

Infatti, poniamo ex = t+1, x = log(1+t). Quando x 0, ex 1 (per la continuit`


a dellesponenziale),
quindi t 0. Dunque il limite che ci interessa pu`
o essere espresso come il limite della funzione
t/ log(1 + t), quando t 0, che vale 1 (esempio (5) ).
(7) Si consideri la funzione f (x) := cos(x)1/x definita su D = R \ {0}. Il punto 0 `e di accumulazione
per D. E una forma indeterminata del tipo 1+ . Vale allora
lim cos(x)1/x = lim elimx0 (cos(x)1)/x = e0 = 1 .

x0

x0

November 12, 2014


SULLE FUNZIONI CONTINUE ELEMENTARI

Lo scopo di questa dispensa `e quello di individuare classi di funzioni continue che sono esplicitamente
costruibili a partire da un insieme dato di poche funzioni fondamentali, applicando determinate
procedure che preservano la continuit`
a.
Indichiamo con
F = {f : D R D R, D 6= }
linsieme di tutte le funzioni a valori reali, definite su qualche sottoinsieme non vuoto D di R.
Ricordiamo per comodit`
a del lettore la definizione di funzione continua gi`a studiata in [FUNZIONI]:
Sia f : D R un elemento di F . Diciamo che la funzione f `e continua su D se per ogni a D, per
ogni > 0, esiste = (, a) > 0 tale che per ogni b D tale che |b a| < si ha che |f (b) f (a)| < ;
in modo equivalente si pu`
o dire che: f ((a , a + ) D) (f (a) , f (a) + ).
Ricordiamo anche che se ogni elemento a D `e di accumulazione per D allora f `e continua su D se
e solo se per ogni a D si ha che:
lim f (x) = f (a) .

xa

Indichiamo con C F il sottoinsieme formato dalle funzioni continue.


`
1. Procedure che preservano la continuita
Conosciamo alcune semplici procedure che, a partire da (opportuni) elementi di F , producono un
altro elemento di F . Elenchiamole.
Procedure.
Supponiamo che f : D R e g : D R siano due funzioni nellinsieme F .
(Somma.) Se D D 6= , allora definiamo (f + g) : D D R.
(Prodotto.) Se D D 6= , allora definiamo (f g) : D D R.
(min e max.) Se D D 6= , definiamo allora due funzioni definite su D D ponendo
max{f, g}(x) = max{f (x), g(x)}, min{f, g}(x) = min{f (x), g(x)} .
(Reciproco.) Se f non `e costantemente nulla su D, poniamo D = D \ f 1 (0), e definiamo
1
: D R.
f
(Valore assoluto.) |f | : D R.
(Restrizione) Se D D allora possiamo considerare la restrizione f|D : D R tale che
per ogni x D , f|D (x) = f (x).
(Inversa.) Se f `e iniettiva, e D `e unione di intervalli aperti, poniamo allora D = Im(f ), e
definiamo f 1 : D D R.
(Composizione.) Se Im(f ) = f (D) D , definiamo g f : D R.
Indichiamo genericamente con P una di queste procedure.
La seguente proposizione riassume diverse propriet`
a strutturali delle funzioni continue.
Proposizione 1.1. C `e chiuso rispetto alle procedure P, cio`e se f `e ottenuta applicando una procedura
P a partire da funzioni continue, allora anche f `e continua.
Si noti che il valore assoluto `e in effetti conseguenza di min, max e di prodotto: |f | =
max(f, f ). A parte min e max laffermazione per le altre procedure segue dalle propriet`
a dei
limiti e delle funzioni continue gi`
a visti nella dispensa [FUNZIONI]. La continuit`
a di min e max
pu`
o essere giustificata per esercizio.

SULLE FUNZIONI CONTINUE ELEMENTARI

2. Funzioni continue elementari


Si tratta delle funzioni continue che possono essere costruite mettendo in opera il seguente schema:
(*) Fissiamo un insieme finito di funzioni continue fondamentali. Allora f `e una funzione continua elementare (relativamente al sistema dato di funzioni fondamentali) se e solo se si ottiene a
partire dalle funzioni fondamentali, applicando successivamente un numero finito (che per`
o pu`
o essere
arbitrariamente grande) di procedure P.
Per rendere tutto effettivo basta specificare quale sistema di funzioni fondamentali adottiamo.
Le funzioni continue fondamentali:
Le funzioni costanti definite su D = R.
La funzione identit`
a id : R R, id(x) = x per ogni x R.
La funzione esponenziale x ex definita su D = R.
La funzione sin : R R
Il sottoinsieme E di C formato dalle funzioni continue ottenute secondo quanto prescritto in (*),
a partire da questo insieme di funzioni continue fondamentali, viene detto linsieme delle funzioni
continue elementari. Vediamo alcuni esempi notevoli di funzioni elementari.
(Funzioni polinomiali.) Sono le funzioni, definite su D = R, della forma
p(x) = a0 + a1 x + . . . an xn , aj R .

Sono elementari perche si ottengono applicando ripetutamente le procedure somma o prodotto


a partire dalle funzioni costanti e dalla funzione identit`
a.
p
(Funzioni razionali.) Sono le funzioni della forma r = , dove p, q sono funzioni polinomiali,
q
q non `e la funzione polinomiale costantemente nulla, r `e definita su D = {q(x) 6= 0}. Sono
funzioni elementari perche si ottengono applicando ripetutamente le procedure somma o
prodotto a partire dalle funzioni costanti e dalla funzione identit`
a, per ottenere sia p sia q,
concludendo poi con una applicazione di reciproco seguita da prodotto.
La funzione logaritmo naturale log, definita su D = {x > 0}, `e elementare perche inversa
della funzione esponenziale.
Per ogni a > 0, la funzione esponenziale in base a x ax = elog(a)x `e elementare perche `e
composizione di funzioni elementari.
Per ogni a > 0, la funzione logaritmica in base a loga = log / log(a) `e elementare perche inversa
della funzione esponenziale di base a.
Per ogni a R la funzione potenza di esponente a, definita su D = {x > 0}, xa = ea log(x) `e
elementare.
La funzione coseno cos(x) = sin(x + /2) `e elementare perche composizione di funzioni elemtari.
Le funzioni trigonometriche tan(x) = sin(x)/ cos(x), cot(x) = cos(x)/ sin(x), (definite rispettivamente su D = R \ {(2m + 1)(/2); m Z}, D = R \ {m; m Z}) sono elementari perche
ottenute applicando reciproco seguito da prodotto a partire da funzioni elementari gi`a
costruite.
(Funzioni trigonometriche inverse.) Componendo, per ogni m Z, la restrizione allintervallo
intervallo (2m + 1)(/2), (2(m + 1) + 1)(/2) R, con la funzione tan si ottiene una funzione
bigettiva a valori in R. Possiamo allora considerare la corrispondente funzione elementare
inversa, definita su R, che viene detta un ramo dell arcotangente. Prendendo lintervallo
(/2, /2) si ottiene il cosiddetto ramo principale, che viene indicata con arctan. In modo
analogo si trattano le altre funzioni trigonometriche inverse, che sono quindi tutte elementari.
(Funzioni iperboliche.) Definiamo su D = R:
ex + ex
ex ex
, cosh(x) :=
.
2
2
Si noti che cosh2 (x) sinh2 (x) = 1 cio`e il punto (sinh(x), cosh(x)) appartiene ad una iperbole in R2 . Per analogia con le funzioni trigonometriche, queste due funzioni si chiamano
sinh(x) :=

SULLE FUNZIONI CONTINUE ELEMENTARI

rispettivamente il seno iperbolico e il coseno iperbolico. Poiche per ogni x R, cosh(x) 6= 0,


sinh(x)
che `e detta la tangente iperbolica;
possiamo definire su D = R la funzione tanh(x) =
cosh(x)
sinh(x) = 0 solo se x = 0. Dunque su D = {x 6= 0} possiamo definire la cotangente iperbolica
cosh(x)
coth(x) =
. Applicando opportunamente la procedura inversa possiamo definire
sinh(x)
anche (i rami) delle funzioni iperboliche inverse arc sinh, arc cosh, arc tanh ecc.
Sulle funzioni definite da formule. Quando diciamo per esempio:
Si consideri la funzione definita dalla formula log(sin(1/x)
intendiamo che questa formula definisce una funzione elementare e che quindi pu`
o essere ottenuta
applicando in successione un numero finito di procedure P. In particolare anche linsieme di definizione
non `e dato a priori ma risulter`
a alla fine delle procedure. Infatti:
(1) Applicando reciproco alla funzione fondamentale id otteniamo x 1/x definita su R \ {0}.
(2) Componendo x 1/x con la funzione fondamentale seno otteniamo x sin(1/x) definita
su R \ {0}.
(3) Sia D = {x R\{0}| sin(1/x) > 0}. D `e unione di intervalli aperti due a due disgiunti, infatti
D = (R \ {0}) \ {1/(k)| k Z}. D R \ {0}, e quindi possiamo restringere x sin(1/x)
su D.
(4) Poiche limmagine di D tramite la restrizione di cui sopra `e contenuta in {x R| x > 0},
possiamo comporre con la funzione elementare (inversa di una funzione fondamentale) log,
ottenendo infine la funzione elementare f (x) = log(sin(1/x), definita su D.
Attenzione, ci sono formule che non definiscono alcuna funzione perch`e risulterebbero definite sullinsieme
vuoto, ad esempio la formula log(|x|).
Poiche la stringa di procedure applicate a partire dalle funzioni fondamentali pu`
o essere arbitrariamente lunga, le funzioni elementari possono essere molto complicate e risultano essere molto plastiche; allo stesso tempo hanno per definizione un carattere costruttivo (a partire da pochi mattoni
fondamentali) che le rende particolarmente utili. Infatti esse sono spesso utilizzate per modellizzare
comportamenti presenti nella realt`
a (fisica, economica, biologica); un lettore particolarmente interessato pu`
o trovare maggiori informazioni in proposito nella dispensa [MODELLI]. Bisogna per`o tenere
presente che ci sono funzioni anche molto semplici e naturali, che non sono elementari (secondo la
definizione data sopra). Per esempio la funzione parte intera x [x], definita su D = R non
`e elementare (perche non `e continua). In effetti possiamo estendere la nostra nozione di funzione
costruibile applicando lo stesso schema (*) visto sopra, ma ammettendo come funzioni fondamentali opportune funzioni non continue (per esempio la stessa funzione parte intera). Anche questo tipo
di funzione costruibile non continua `e utile nelle applicazioni, per esempio in teoria dei segnali. Altri
esempi di funzioni costruite usando la funzione parte intera si trovano nella dispensa [INTSIGN].

November 12, 2014


SULLE FUNZIONI CONTINUE DEFINITE SU UN INTERVALLO

La definizione astratta di intervallo di R dice che si tratta di un sottoinsieme I R, che verifica la


seguente propriet`
a:
Per ogni coppia di punti x, y I tale che x y, si ha che [x, y] = {z R; x z y} I.
Si pu`
o dimostrare che I `e un intervallo se e solo se I ha una delle seguenti forme:
I = [x, y] per qualche coppia x y di elementi di R. In questo caso diciamo che I `e un
intervallo chiuso e limitato.
I = [x, +) per qualche x R.
I = (, y] per qualche y R.
I = (a, b) dove a, b R, a b (stipulando che per ogni x R, x +). A seconda dei
casi es = x, a, , ed = y, b, + vengono detti rispettivamente lestremo sinistro e l estremo
destro dellintervallo.
In pratica, quando parleremo di un intervallo I, intenderemo uno dei casi concreti sopra indicati. Un
altra caratterizzazione utile degli intervalli `e data dalla seguente proposizione, la cui dimostrazione `e
lasciata per esercizio.
Proposizione 0.1. I `e un intervallo di R se e solo se `e l unione di una successione crescente di
intervalli chiusi e limitati, cio`e esiste una successione di intervalli chiusi e limitati In = [n , n ], tali
che In I, In In+1 , I = n In .
Osserviamo che se x = y, allora [x, y] = {x} `e un intervallo degenere ridotto ad un punto, ed ogni
funzione definita su {x} `e costante e quindi continua. Daltra per ogni intervallo I non degenere e per
ogni a I, a `e un punto di accumulazione per I. Quindi sappiamo che:
Una funzione f : I R `e continua se e solo se, per ogni a I, lim f (x) = f (a).
xa

In questa nota vogliamo mettere in evidenza importanti propriet`


a qualitative (a volte vengono dette
topologiche) delle funzioni continue definite su un intervallo I. Qualitativo sta a significare che
tipicamente, in opportune ipotesi, dimostreremo l esistenza di punti di I che verificano certe propriet`
a,
senza per`o avere indicazioni quantitative sulla loro effettiva localizzazione.
1. Compattezza per successioni
Cominciamo con una importante propriet`
a degli intervalli chiusi e limitati. Premettiamo una definizione.
Definizione 1.1. Un sottoinsieme K R si dice compatto per successioni se per ogni successione
a : N K, esistono una successione estratta anj ed un elemento b K, tali che anj b. A volte
diremo semplicemente compatto, omettendo di dire per successioni.
Allora abbiamo:
Teorema 1.1. Ogni intervallo chiuso e limitato I = [, ] `e compatto per successioni.
Dim. Se = , I = {}, ogni successione a valori in I `e costante e quindi convergente ad .
Supponiamo che < . Sia a : N [, ] una successione a valori nellintervallo. Consideriamo il
+
punto medio di I, p =
. Questo divide I in due sottointervalli chiusi e limitati che si intersecano
2
in p. Possiamo senzaltro sceglierne uno, che denotiamo I1 = [1 , 1 ] I, che verifica le seguenti
propriet`
a:

;
(1) 1 1 =
2
(2) Esiste un sottoinsieme infinito A1 N tale che per ogni n A1 , an I1 .

SULLE FUNZIONI CONTINUE DEFINITE SU UN INTERVALLO

Procediamo adesso per induzione. Supponiamo di avere definito un intervallo In = [n , n ], In

, ed esiste un sottoinsieme infinito An An1 , tale che per


In1 I, tale che n n =
2n
n + n
di In e applicando a (In , An ) la
ogni m An , am In . Prendendo il punto medio pn =
2
stessa costruzione che ha prodotto (I1 , A1 ) a partire da (I, N), produciamo (In+1 , An+1 ) che verificano
le stesse propriet`
a. Quindi, per induzione concludiamo che tali (In , An ) esistono per ogni n 1. I
seguenti fatti seguono direttamente dalla costruzione:
La successione degli estremi sinistri n `e non decrescente. La successione degli estremi destri
n `e non crescente. Per entrambe le successioni `e un minorante e `e un maggiorante.
Dunque entrambe convergono in I = [, ]: n b I, n b I.

, da cui n n b b = 0.
I due limiti coincidono: b = b = b. Infatti n n =
2n
Possiamo infine costruire una sottosuccesione di a tale che anj b. Poniamo an0 dove n0 `e il minimo
elemento di A1 . Poi per induzione definiamo anj dove nj `e il minimo elemento di Aj+1 \{n0 , . . . , nj1 }
(che `e non vuoto perche Aj+1 `e infinito). Per costruzione, nj anj nj , e per confronto si
conclude appunto che anche anj b I. Dunque I `e compatto per successioni.
2
Non `e difficile dimostrare una specie di teorema inverso (lo lasciamo per esercizio).
Proposizione 1.2. Se I `e un intervallo compatto per successioni, allora I `e chiuso e limitato, cio`e
della forma I = [, ].
2. Funzioni continue definite su un intervallo chiuso e limitato
Teorema 2.1. (Teorema degli zeri) Sia I = [, ], < , un intervallo chiuso e limitato. Sia
f : I R una funzione continua. Supponiamo che f ()f () < 0. Allora esiste a I tale che
f (a) = 0.
Dim. Per ipotesi f () e f () hanno segni opposti, dunque i due corrispondenti punti del grafico
G(f ) I R R2 stanno da parti opposte rispetto al segmento I {0}. Lidea geometrica intuitiva `e
che siccome la funzione f `e continua, il grafico G(f ) `e una curva che pu`
o essere disegnata senza staccare
mai la matita dal foglio. Ma allora ci deve essere un punto di intersezione (a, 0) G(f ) I {0}, da
cui f (a) = 0. Vediamo di formalizzare questa idea intuitiva. Intanto (considerando se necessario la
funzione f ) non `e restrittivo supporre che f () < 0 e f () > 0. Poniamo E = {x I; f (x) < 0}.
Chiaramente E `e non vuoto e limitato superiormente. Poniamo a = sup E. E chiaro che a I.
Affermiamo che f (a) 0. Infatti se fosse f (a) > 0, per la continuit`
a di f e la permanenza del
segno esisterebbe un > 0 tale che (a , a + ) I e per ogni x (a , a + ), f (x) > 0. Per
le propriet`
a del sup, E (a , a + ) 6= , dunque esistebbe y tale che f (y) > 0 e f (y) < 0 che `e
impossibile. Vogliamo dimostrare che f (a) = 0. Se invece fosse f (a) < 0, ancora per la continuit`
a di
f e la permanenza del segno, ci sarebbe > 0 tale che (a , a + ) I e per ogni x (a , a + ),
f (x) < 0. Ma allora a + /2 > a ed appatiene ad E e questo `e contro il fatto che a = sup E.
2
Teorema 2.2. (Teorema del punto fisso) Sia I = [, ] un intervallo chiuso e limitato. Sia
f : I I una funzione continua. Allora f ha almeno un punto fisso, cio`e esiste a I tale che
f (a) = a.
Dim. Se I = {} il teorema `e banalmente vero. Supponiamo < . Se f () = o f () = , la
tesi `e verificata. Altrimenti si ha che necessariamente f () > e f () < . Cio `e i punti (, f ())
e (, f ()) def grafico G(f ) I 2 stanno da parti apposte rispetto alla diagonale (I) del quadrato
I 2 . Adesso lidea intuitiva `e che il grafico debba necessariamente intersecare la diagonale. In effetti
possiamo ricondurci al Teorema degli zeri. Poniamo infatti g : I R, g(x) = x f (x); g `e continua
e g()g() < 0. Dunque esiste a I tale che g(a) = a f (a) = 0.
2
Per il seguente teorema `e cruciale la compattezza degli intervalli chiusi e limitati.

SULLE FUNZIONI CONTINUE DEFINITE SU UN INTERVALLO

Teorema 2.3. (Teorema del massimo e del minimo) Sia I = [, ] un intervallo chiuso e
limitato. Sia f : I R una funzione continua. Allora f ha almeno un punto di minimo e un punto
di massimo, cio`e esistono a, b I tali che per ogni x I, f (a) = A f (x), f (b) = B f (x).
Dim. Dimostriamo intanto che f (I) `e limitata. Per esempio dimostriamo che `e limitata superiormente.
Altrimenti esisterebbe una successione a : N I, tale che f (an ) +. Per la compattezza di I
a di f avremmo
possiamo estrarre da a una sottosuccessione anj tale che anj b I. Per la continuit`
f (anj ) f (b) 6= +, che `e assurdo. Analogamente si dimostra che `e limitata inferiormente. Poniamo
allora A = inf f (I) R, B = sup f (I) R rispettivamente. Vogliamo dimostrare per esempio che
esiste b I tale che f (b) = B. Ragionando come prima (sostituendo B a +), costruiamo una
successione anj a valori in I tale che anj b I e f (anj ) f (b) = B. Analogamente possiamo
dimostrare che esiste a I tale che f (a) = A.
2
Il Teorema precedente pu`
o essere riformulato nel modo seguente:
Sia I = [, ] un intervallo chiuso e limitato. Per ogni funzione continua f : I R, esiste un
intervallo chiuso e limitato [A, B] tale che f (I) [A, B] (per cui possiamo scrivere f : I [A, B]) e
A, B f (I).
Il seguente teorema precisa che f : I [A, B] `e surgettiva.
Teorema 2.4. (Teorema dei valori intermedi) Siano I = [, ] un intervallo chiuso e limitato e
f : I [A, B] una funzione continua tale che A, B f (I). Allora f (I) = [A, B].
Dim. Se A = B la funzione `e costante e la tesi `e banalmente verificata. Supponiamo che A < B e sia
y un arbitrario valore intermedio A < y < B. La funzione g : I R, g(x) = f (x) y `e continua e
verifica lipotesi del teorema degli zeri. Quindi esiste a in I tale che g(a) = f (a) y = 0, cio`e y = f (a).
Poiche y `e arbitrario, questo mostra proprio che f (I) = [A, B].
2
Il seguente corollario `e giusto una riformulazione espressiva e concisa di alcuni dei fatti appena dimostrati.
Corollario 2.1. Sia f : D R una funzione continua definita su un arbitrario sottoinsieme D di R.
Allora f manda ogni intervallo compatto contenuto in D sopra un intervallo compatto di R.
3. Funzioni continue definite su un intervallo qualsiasi
I teoremi visti nel precedente paragrafo si applicano per ottenere risultati nel caso di intervalli qualsiasi.
Corollario 3.1. Siano I un intervallo, f : I R continua. Supponiamo che esistano , I tali
che f ()f () < 0. Allora esiste a I tale che f (a) = 0.
Dim. Basta applicare il Teorema degli zeri alla restrizione di f allintervallo [, ] I.

Lipotesi del corollario si realizza in molte circostanze. Per esempio, per la permanenza del segno
questo succede se lim f (x) = ls R, lim f (x) = ld R e ls ld < 0. Come caso particolare, si
xes

xed

pu`
o dimostrare in questo modo che ogni polinomio p(X) a coefficienti reali di grado dispari ha una
radice reale (metre se il grado `e pari possono non esistere radici reali, come succede per il polinomio
p(X) = X 2 + 1).
Corollario 3.2. Siano I un intervallo, f : I R continua. Allora anche f (I) `e un intervallo.
Dim. Realizziamo I = n In come l unione di una successione crescente di intervalli chiusi e limitati.
Allora f (I) = n f (In ) `e anchessa lunione di una successione crescente di intervalli chiusi e limitati,
dunque `e un intervallo.
2
Sia f : D R, D R, una qualsiasi funzione crescente o decrescente. E allora evidente che f `e
iniettiva. Nel caso di funzioni continue definite su un intervallo vale anche il viceversa ed inoltre la
funzione inversa `e continua.
Proposizione 3.3. Siano I un intervallo, f : I R continua e iniettiva. Allora:
(1) (Monotonia delle funzioni iniettive) f `e strettamente monotona, cio`e `e crescente o decrescente.
(2) (Continuit`
a dellinversa) La funzione inversa f 1 : f (I) I `e continua.

SULLE FUNZIONI CONTINUE DEFINITE SU UN INTERVALLO

Dim. (1) Supponiamo per assurdo che esistano tre punti in I, a < b < c tali che f (a) < f (b),
f (b) > f (c), oppure f (a) > f (b), f (b) < f (c). Ragioniamo nel primo caso (laltro sar`a analogo). Sia
y tale che f (a) < y < f (b) e y > f (c). Applicando il Teorema dei valori intermedi alla restrizione di
f su lintervallo [a, b] e sullintervallo [b, c] rispettivamente, vediamo che esistono t (a, b) e t (b, c)
tali che f (t) = f (t ) = y e questo `e contro lipotesi che f sia iniettiva.
(2) Sappiamo gi`
a che J := f (I) `e un intervallo. Se f `e crescente (risp. decrescente) anche f 1 `e
crescente (risp. decrescente). Supponiamo per semplicit`a che y0 = f (x0 ) sia interno a J. Eventualmente considerando f non `e restrittivo supporre che f sia crescente. Per la propriet`
a dei limiti delle
funzioni crescenti sappiamo che i due limiti destro e sinistro esistono e che
L := lim f 1 (y) f 1 (y0 ) lim f (x) := L+ .
yy0+

yy0

Basta dimostrare che i due limiti coincidono. Supponiamo per assurdo che invece
lim f 1 (y) < lim+ f (x) .

yy0

yy0

Quindi per y < y0 , f (y) L , mentre per y > y0 , f 1 (y) L+ . Quindi limmagine J = f (I) non
`e un intervallo e questa `e una contraddizione.
2
1

4. Estensione continua di funzioni definite su intervalli di Q.


Sia I un intervallo di R. Indichiamo con IQ = I Q. Se F : I R `e una funzione, indicheremo
con f : IQ R la sua restrizione. Siano F , G due funzioni continue definite su I. Supponiamo che
le restrizioni coincidano: f = g. Allora anche F = G. Infatti per la densit`
a di Q, per ogni b I,
esiste una successione a : N IQ tale che an b. Quindi, per la continuit`
a di F e di G abbiamo
F (b) = lim (f (an ) = g(an )) = G(b). Possiamo riformulare questa osservazione nel modo seguente:
n+

Proposizione 4.1. (Teorema di unicit`


a dellestensione continua) Se una funzione f : IQ R
si estende ad una funzione continua F : I R, allora tale estensione `e unica.
Ci rivolgiamo ora al problema della esistenza della estensione continua di una data f : IQ R.
Abbiamo gi`
a incontrato questa situazione quando nella dispensa sui numeri reali [Reali] abbiamo
accennato alla definizione delle funzioni esponenziali. Allora eravamo stati necessariamente un po
vaghi. Adesso, grazie agli argomenti che abbiamo sviluppato, possiamo dare sostanza al discorso
(torneremo sulle funzioni esponenziali alla fine di questa dispensa).
Allora sia data f : IQ R. Chiaramente, una condizione necessaria affinche esista una estensione
continua F : I R `e che f sia continua. Ma il seguente esempio mostra che questo non `e sufficiente.

Esempio 4.2. Consideriamo I = [ 21, 2+1]. Poniamo D = [ 21, 2)( 2, 2+1] = I I+ .


Definiamo F : D R tale che F (x) = 1 per ogni x I , F (x) = 1 per ogni x I+ . Chiaramente
F `e continua su D ma non pu`
o essere estesa ad una funzione continua definita su tutto I. Daltra
parte IQ = D Q e la restrizione f di F a IQ `e continua. Lunica estensione continua di f a D `e F
stessa, quindi f non pu`
o essere estesa ad una funzione continua definita su tutto I. Osserviamo che
f , benche sia continua su IQ ha il seguente sgradevole comportamento:
Per ogni > 0, esistono x, y IQ tali che |x y| < , mentre |f (x) f (y)| > 1.
Lultima osservazione nellesempio suggerisce la seguente definizione che punta ad escludere un tale
comportamento.
Definizione 4.3. Una funzione f : D R, definita su un arbitrario sottoinsieme D di R, si dice
uniformemente continua se per ogni > 0, esiste un > 0 tale per ogni coppia di punti x, y D tali
che |x y| < si ha che |f (x) f (y)| < .
Si noti che, come la continuit`
a, la continuit`
a uniforme `e conservata dalle restrizioni:
Se f : D R `e uniformemente continua e D D allora anche la restrizione di f a D `e uniformemente continua.

SULLE FUNZIONI CONTINUE DEFINITE SU UN INTERVALLO

La funzione f : IQ R dellesempio `e continua ma non `e uniformemente continua. Dunque la


continuit`
a uniforme `e una versione rafforzata della continuit`
a. Questo fatto `e ancora meglio messo in
evidenza dalla seguente caratterizzazione equivalente della continuit`
a uniforme. Ricordiamo ancora
una volta la definizione di funzione continua:
La funzione f : D R `e continua su D se per ogni a D, per ogni > 0, esiste = (, a) > 0 tale
che per ogni b D tale che |b a| < si ha che |f (b) f (a)| < .
Abbiamo messo in evidenza che = (, a) dipende da ma anche dal punto a. La funzione `e
uniformemente continua se dipende da ma pu`
o essere scelto in modo uniforme rispetto al punto a.
Precisamente abbiamo che:
La funzione f : D R `e uniformemente continua su D se per ogni > 0, esiste = () > 0 tale che
per ogni a D e ogni b D tale che |b a| < si ha che |f (b) f (a)| < .
Vediamo ora una ulteriore notevole propriet`
a degli intervalli chiusi e limitati che `e anchessa conseguenza della compattezza.
Teorema 4.1. (Teorema della continuit`
a uniforme) Sia I = [, ], un intervallo chiuso e limitato. Sia f : I R una funzione continua. Allora f `e uniformemente continua.
Dim. Supponiamo per assurdo che non lo sia. Allora esiste un > 0 tale che per ogni n = 1/n,
n > 1, esistono xn , yn I tali che |xn yn | < n e |f (xn ) f (yn )| > . Consideriamo a(n) = xn e
b(n) = yn come succesioni a valori in I. Per la compattezza di I, esiste una successione estratta da a
sia a g, tale che (a g)(n) c I. Consideriamo ora la successione estratta da b, (b g). Sempre
per la compattezza esiste una successione estratta t := (b g h) tale che tn c I. Consideriamo
infine s := (a g h); si ha ancora che sn c. Poiche |tn sn | < (gh)(n) 0, si ha che c = c . Per
la continuit`
a di f , f (tn ) f (c) e f (sn ) f (c). Daltra parte, poiche, |f (tn ) f (sn )| > , si avrebbe
che |f (c) f (c )| > 0. Questo `e impossibile, dunque f `e uniformemente continua.
2
Esempio 4.4. La condizione che lintervallo sia chiuso `e indispensabile. Infatti, per ogni I = (0, b],
b > 1/2, si consideri f : I R, f (x) = 1/x. f `e continua ma non `e uniformemente continua.
Infatti, per ogni b > > 0, poniamo x
= min{, 1/2}, y = x
/2. Allora |
x y| < , mentre
|f (
x) f (
y )| = 1/
x 2. Daltra parte sappiamo che per ogni 0 < a < b, la restrizione di f `e
uniformemente continua su [a, b].
Abbiamo allora, immediatamente, il seguente corollario:
Lemma 4.5. Sia I un intervallo di R, f : IQ R. Condizione necessaria affinche f si estenda ad
una funzione continua F : I R `e che per ogni sotto-intervallo chiuso e limitato J I, la restrizione
di f a JQ `e uniformemente continua.
Il risultato finale `e che questa condizione `e anche sufficiente.
Teorema 4.2. (Teorema di esistenza dellestensione continua) Siano I un intervallo di R e
f : IQ R una funzione. Allora esiste una estensione continua di f , F : I R, se e solo se per ogni
sotto-intervallo chiuso e limitato J I, la restrizione di f a JQ `e uniformemente continua.
Dim. Resta da dimostrare che la condizione `e sufficiente. Ci limiteremo a fornire alcune indicazioni (il
lettore volenteroso pu`
o cercare di esplicitare tutti i dettagli). Intanto si dimostra che la condizione `e
sufficiente quando I `e limitato e chiuso, e quindi per ipotesi f `e uniformemente continua su IQ . Fissato
x I, per la densit`
a di Q esiste una successione a : N IQ tale che an x. Usando luniforme
continuit`
a di f si dimostra che
f (an ) c R;
Il valore limite c := F (x) non dipende dalla scelta della successione an , ma dipende solo dal
punto x.
Se x IQ allora c = f (x).
Abbiamo cos` esteso f ad una F : I R. Infine, sempre usando la continuit`
a uniforme di f , si verifica
che la funzione F cos` definita `e continua. Se I `e ora un intervallo arbitrario, lo realizziamo come l
unione di una successione crescente di sottointervalli chiusi e limitati: I = In . Per il caso particolare

SULLE FUNZIONI CONTINUE DEFINITE SU UN INTERVALLO

gi`a dimostrato, per ogni n, la restrizione fn di f a (In )Q , si pu`


o estendere ad una funzione continua
Fn definita su In . Daltra parte, per il Teorema di unicit`
a dellestensione continua, per ogni n, la
restrizione di Fn+1 a In coincide con Fn . Quindi per induzione `e definita una estensione continua F
di f definita su tutto I = In .
2
5. Le funzioni esponenziali rivisitate
Riformuliamo, precisando un po le cose, quanto avevamo gi`a delineato nella dispensa sui numeri reali
[Reali] . Fissato un numero reale a > 0, vogliamo definire una funzione Fa : R R+ := {y > 0} che
verifichi le seguenti propriet`
a:
Fa (1) = a;
Per ogni x, y R, Fa (x + y) = Fa (x)Fa (y);
Fa `e continua (si noti che in [Reali] si alludeva in modo vago proprio a questa richiesta) .
Ragionando come in [Reali], si vede che la restrizione fa di Fa a Q `e forzata:
Per ogni m/n Q, necessariamente fa (m/n) = am/n = (am )1/n , dove per ogni b > 0, b1/n indica
lunica radice n-esima positiva di b.
Si pu`
o dimostrare allora che per ogni intervallo limitato e chiuso I di R, la restrizione di fa ad IQ
`e uniformemente continua. Dunque per il teorema precedente esiste ununica estensione continua
Fa : R R. Si pu`
o verificare infine che tale Fa soddisfa tutte le propriet`
a richieste. Di solito,
per ogni x R, si scrive Fa (x) = ax e questa funzione `e detta la funzione esponenziale di base a;
loga : R+ R `e la funzione inversa, `e continua e verifica
loga (a) = 1, per ogni z, t R+ , loga (tz) = loga (t) + loga (z) .
Se e `e la costante di Nepero, si verifica che ax = elog(a)x , dove log = loge `e il logaritmo naturale. La
funzione esponenziale di base e ha alcune propriet`
a speciali e a volte viene indicata come exp : R R+ .
Per esempio, abbiamo verificato che
ex 1
=1
lim
x0
x
mentre in generale vale:
ax 1
lim
= log(a) .
x0
x
Quando avremo sviluppato il calcolo differenziale e integrale, risulter`a che
exp(x) 1
1 = exp(0) = lim
= (exp) (0) .
x0
x
Pi`
u profondamente vedremo che la funzione exp `e caratterizzata come lunica funzione definita su R
derivabile tale che
Per ogni x R, (exp) (x) = exp(x).
exp(0) = 1.
Mentre la funzione log `e caratterizzata come lunica funzione definita su R+ derivabile tale che
1
Per ogni y R+ , (log) (y) = .
y
log(1) = 0.

3 Novembre 2014
Un anno di trigonometria e un po di logaritmi

Un poco di logaritmi

Nella dispensa Reali abbiamo visto che si pu`o definire per ogni reale a > 0 una
funzione f , che abbiamo indicato con aq , da Q a R+ con la propriet`a che perogni
abbiamo definito aq = n am .
q1 , q2 Q f (q1 + q2 ) = f (q1 ) f (q2 ) : se q = m
n
Dopodiche abbiamo esteso, tramite lassioma di continuit`a, questa funzione a tutto
m
< x}.
R definendo ax come il sup dellinsieme {a n con m
n

Abbiamo affermato , lasciando la verifica al lettore, che si verifica che questa funzione
se a > 1 `e crescente e che vale
ax+y = ax ay .

A questo punto, dati due numeri reali a e b positivi, definiamo logaritmo di b in base
a lesponente da dare a a per ottenere b,2 cio`e
aloga b = b
Dalla propriet`a
ab1 ab2 = ab1 +b2
otteniamo

loga b1 b2 = loga b1 + loga b2


loga bc = c loga b
Come ultima considerazione osserviamo che se x = loga c e y = logb c da
c = ax = b y
prendendo i logaritmi in base a di entrambi i membri otteniamo
loga c = logb c loga b

La crescenza deriva immediatamente da questo: se x < y allora y x > 0 e quindi se a > 1 si


ha ay = ax ayx > ax .
2
Stiamo sorvolando sullesistenza di un tale numero reale, cio`e sulla surgettivit`a di tale funzione
su R+

Un poco di trigonometria.

Nel paragrafo precedente abbiamo brevemente richiamato il fatto che fissato un


numero reale a, abbiamo definito una funzione expa da R a R+ con la propriet`a
che expa (x1 + x2 ) = expa (x1 ) expa (x2 ) e che per far questo abbiamo per prima cosa
definito la funzione sul sottoinsieme dei razionali e poi la abbiamo estesa tramite
lassioma di continuit`a a tutto R.
Consideriamo ora la circonferenza unitaria S di centro O in R2 . In S possiamo
definire una somma in questo modo. Fissiamo un punto (per esempio il punto
U (1, 0); per ogni P S `e ben definito langolo al centro U[
OP . Possiamo definire
[
[
[
P + Q come il punto R tale che U OR = U OP + U OQ
Per definire le funzioni seno e coseno assumeremo che si possa definire, in modo analogo a quanto fatto nel paragrafo precedente, una funzione h da R alla circonferenza
unitaria S con la propiet`a h(t1 + t2 ) = h(t1 ) + h(t2 ). Lesistenza di una tale funzione
sar`a pi`
u chiara in seguito, dopo aver introdotto la nozione di integrale.
Detto ci`o, definiamo le funzioni cos x e sin x come lascissa e lordinata del punto
P = h(x) sulla circonferenza S. 3
Risulta quindi immediatamente che vale la relazione sin2 x + cos2 x = 1.
Al fine di ottenere altre formule interessanti dimostriamo per prima cosa la formula
di addizione per il coseno: tutto il resto sar`a una conseguenza.
Lo scopo `e quindi di trovare una espressione per cos(x + y) in temini delle funzioni
seno e coseno di x e y.
La prova che forniamo si basa sulla considerazione che tutta la geometria che stiamo
considerando non varia se operiamo una isometria.
(cos x, sen x)

B (cos y, sen y)

U (1,0)

Consideriamo quindi la situazione nella figura e operiamo una rotazione che porti il
punto B (cos y, sin y) nel punto U (1, 0). Essendo una rotazione una trasformazione che conserva le distanze (isometria) la distanza dei punti A e B (cio`e la
lunghezza del segmento AB) e quella dei punti C e U (lunghezza del segmento CU )
sar`a la stessa. Calcolandole si ha
p
p
(cos x cos y)2 + (sin x sin y)2 = (cos(x y) 1)2 + (sin(x y) 0)2
3

Si noti quindi che queste funzioni sono funzioni della variabile reale x.

Svolgendo i calcoli otteniamo


p
p
1 + 1 2(cos x cos y + sin x sin y) = 1 + 1 2 cos(x y)
da cui quadrando e semplificando otteniamo
cos(x y) = cos x cos y + sin x sin y
Da questa formula se ne ricava immediatamente una analoga per la funzione seno
ricordando che sin x = cos( 2 + x)

sin(xy) = cos( +xy) = cos( +x) cos y+sin( +x) sin y = sin x cos ycos x sin y
2
2
2
Scriviamo ci`o che abbiamo ottenuto per x + y
cos(x + y) = cos x cos y sin x sin y
sin(x + y) = sin x cos y + cos x sin y
Da qui prendendo y = x si ottengono immediatamente le formule di duplicazione
cos 2x = cos2 x sin2 x
sin 2x = 2 sin x cos x
da cui quelle di bisezione
r
1 + cos x
x
cos
=
2
2
r
x
1 cos x
=
.
sin
2
2
Ovviamente si pu`o continuare ottenendo formule di trisezione etc. Le cosiddette
formule di prostaferesi si ottengono sommando (e sottraendo) le formule di addizione
e sottrazione per seno e coseno, cio`e sommando e sottraendo espressioni del tipo
sin(x + y) = sin x cos y + cos x sin y e sin(x y) = sin x cos(y) + cos x sin(y).
Ponendo x + y = p e x y = q abbiamo che x = p+q
e y = pq otteniamo
2
pq
p+q
cos
2
2
p+q
pq
sin p sin q = 2 cos
sin
2
2
p+q
pq
cos p + cos q = 2 cos
cos
2
2
p+q
pq
cos p cos q = 2 sin
sin
2
2
sin p + sin q = 2 sin

Continuit`
a delle funzioni trigonometriche e esponenziali.

Si suppone noto il contenuto sulla continuit`a della dispensa FUNZIONI.


Vogliamo provare che le funzioni trigonometriche ed esponenziali sono funzioni continue.
Funzioni trigonometriche.
Osserviamo che se per una funzione f vicino a un punto x0 vale
|f (x) f (x0 )| A|x x0 |

()

con A costante positiva, abbiamo immediatamente che la funzione f `e continua nel


punto x0 .4
La definizione di continuit`a chiede infatti che per ogni esista un tale che se
|x x0 | < allora |f (x) f (x0 )| < .
Se vale la relazione (*) basta prendere

e si ha che se |x x0 |

|f (x) f (x0 )| A|x x0 | A

allora

= .
A

Detto ci`o si osservi che dalla seconda formula di prostaferesi si ha







x + x0
x x0

cos
| sin x sin x0 | = 2 sin

2
2



x + x0

Essendo cos
< 1 si ha
2




x x0 5

x x0



| sin x sin x0 | 2 sin
2 2 = |x x0 |
2
In modo del tutto analogo si prova la continuit`a della funzione cos x oppure utilizzando le relazioni che legano le funzioni seno e coseno.
Funzioni esponenziali.
Proviamo ora che la funzione esponenziale ax una funzione continua.
Supporremo a > 1, lasciando al solito al lettore la cura di completare la prova negli
altri casi.
Vogliamo provare che lim ax = ax0 . Un modo potrebbe esser questo.
xx0

Fissiamo un > 0. Vogliamo vedere se esiste un tale che se |x x0 | < allora


|ax ax0 | < .
4

Una funzione per cui vale tale relazione si dice soddisfare alla condizione di Lipschitz o che `e
lipschitziana e A viene detta costante di Lipschitz.
5
Si `e usato il fatto che verr`
a dimostrato in seguito che | sin x| |x|



|ax ax0 | = ax0 (axx0 1)

Per comodit`a pensiamo x >x0 : abbiamo


axx0 > 1 e quindi |axx0 1| = axx0 1


e quindi se prendo loga x0 + 1 si ha che se |x x0 | allora


a
axx0

+1
ax 0

da cui
ax0 (axx0 1)
Il ragionamento `e perfettamente analogo per lintervallo sinistro, cio`e se x < x0 .

November 13, 2013


MODELLI E INTERPOLAZIONI

Senza alcuna pretesa di completezza, vogliamo mostrare come gli strumenti del calcolo che abbiamo
sviluppato e in particolare le funzioni elementari introdotte nelle dispense [EC] e [ED] intervengano
per costruire modelli di sistemi della realt`
a (fisica, economica, biologica, ...). In modo un po
grossolano ma abbastanza pertinente possiamo dire che tutti questi sistemi hanno delle caratteristiche
in comune: un sistema reale consiste in diverse grandezze, X, Y, . . . , che interagiscono tra loro. Per
ogni grandezza `e fissata ununit`
a di misura. Per ogni stato del sistema si possono misurare (almeno
in modo approssimato) le grandezze in gioco, ottenendo cos` un certo insieme di numeri reali x, y, . . . .
In generale si tratta di grandezze vettoriali, ma ai fini di questa discussione ci restringiamo a grandezze
scalari. Si cerca allora di determinare le leggi che governano le relazioni esistenti nella realt`
a tra
queste grandezza in termini delle rispettive misure. Di solito ci sono due tipi di legge: dinamico
in cui si tende a descrivere come, a partire da un certo stato iniziale, il sistema occupi in seguito
altri stati; statico i cui si determinano le relazioni tra le grandezze in un dato stato, specialmente in
uno stato di equilibrio nel quale il sistema tende a permanere (in assenza di agenti esterni). Almeno
nei casi pi`
u semplici, tali leggi hanno una forma del tipo y = f (x) cio`e esprimono il fatto che certe
grandezze sono funzione delle altre. E importante capire che questo `e solo un modello teorico del
nostro sistema reale, che sar`a corroborato (o meno) a seconda dellaccordo tra la previsione teorica e
le reali misure in un arbitrario stato del sistema. Un modello teorico y = f (x) comporta due aspetti,
uno di natura qualitativa che prescrive solo la forma della funzione f , uno di natura effettiva che
definisce esattamente chi `e f . Questa distinzione sar`a chiarita in seguito. A parte il necessario accordo
con i dati sperimentali gi`
a noti, in buona misura la scelta di un modello teorico `e spesso arbitraria
e dettata anche da fattori e pregiudizi di ordine psicologico, estetico, ideologico, religioso . . . (le
leggi della natura sono dettate da Dio che `e perfetto e dunque devono essere espresse in termini di
enti perfetti - `e evidente per esempio che le circonferenze sono le ellissi perfette . . . ). In ogni
caso il modello viene corroborato (o meno) a posteriori come gi`a detto.

1. Gerarchia delle funzioni elementari e dei modelli


Un pregiudizio o se preferiamo un criterio largamente condiviso `e che un modello teorico debba
essere il pi`
u possibile semplice. Limitandoci, come faremo, a modelli del tipo y = f (x), questo si
traduce in una richiesta di semplicit`a della funzione f . Allora possiamo intanto convenire che f debba
essere individuata tra le funzioni elementari derivabili , cio`e f E . Osserviamo poi che linsieme
di funzioni E pu`
o essere organizzato in una gerarchia di sottoclassi di complessit`
a crescente. Senza
formalizzare troppo questa idea, limitiamoci alle seguenti osservazioni:
Tra le funzioni fondamentali le costanti sono chiaramente le meno complicate; a seguire
le inclusioni x x (in particolare lidentit`
a di R). Seguono poi la funzione esponenziale
e il seno. La definizione dellesponenziale `e stata abbastanza pi`
u laboriosa ([Reali], [EC],
[D-Exp],..) dunque possiamo postulare che il seno viene prima dellesponenziale.
Una misura della complessit`
a di una funzione f E `e certamente data dal numero minimo

di procedure P necessarie per costruire f a partire dalle funzioni fondamentali.


Combinando in una specie di ordinamento lessicografico i due punti precedenti, otteniamo quella
gerarchia di sottoclassi che abbiamo sopra menzionato. E chiaro allora che la prima grossa sottoclasse
`e quella delle funzioni polinomiali che `e a sua volta organizzata in sottoclassi secondo il grado crescente
dei polinomi. Poi seguono le funzioni razionali, ad un certo punto della gerarchia troviamo la classe
delle funzioni polinomiali trigonometriche in cui ogni monomio si ottiene componendo ogni monomio
ordinario con funzioni seno o coseno, ect . . . .

MODELLI E INTERPOLAZIONI

2. Modelli di tipo lineare e quadratico


Applicando il criterio di semplicit`a, i modelli teorici y = f (x) (f E ) qualitivamente pi`
u semplici
sono quelli di tipo lineare, cio`e della forma
y = f (x) = mx + q
per qualche costante m, q R. In tal caso il grafico della funzione `e una retta in R2 di coefficiente
angolare m = tan(), passante per il punto (0, q). Una volta che avessimo postulato questa forma
qualitativa del nostro modello, per fissarlo effettivamente dovremmo specificare la coppia (m, q).
Esempio 2.1. La legge di Newton
a = F/m
che governa il moto di un punto materiale di massa m vincolato a muoversi lungo una retta, `e di tipo
lineare e esprime laccelerazione del punto in funzione della forza applicata al punto. La cosa si fa pi`
u
complicata se interpretiamo a = a(t) come derivata seconda della posizione x(t) del punto in funzione
del tempo. Entriamo qui nel campo delle equazioni differenziali, restando comunque in un contesto
lineare. Lequazione di stato dei gas ideali `e un altro esempio:
nR
T
p=
V
dove, essendo volutamente vaghi sulle unit`
a di misura in gioco, V indica il volume fissato occupato dal
gas, n `e il numero fissato di moli del gas, R `e la costante universale dei gas perfetti, T `e la temperatura
del gas, p `e la pressione. Dunque la legge `e un modello di tipo lineare che esprime la pressione in
funzione della temperatura.
I modelli immediatamente pi`
u complicati sono quelli con legge quadratica, cio`e del tipo:
y = f (x) = ax2 + bx + c
per qualche costante a, b, c R, a 6= 0. Sempre in riferimento al movimento del punto materiale,
1
e = mv 2
2
`e un esempio di legge quadratica che esprime lenergia cinetica in funzione della velocit`
a del punto.
Come `e ben noto il grafico di f `e una parabola. Il grafico di f si ottiene semplicemente per riflessione
rispetto allasse delle ascisse, dunque non `e restrittivo assumere a > 0. Possiamo analizzare f con gli
strumenti del calcolo differenziale. Allora, f (x) = 2ax + b e si annula solo quando x = b/2a; la
derivata `e < 0 se x < b/2a, `e > 0 se x > b/2a. Dunque b/2a `e un punto di minimo assoluto
per f . Il grafico `e simmetrico rispetto alla retta verticale {(x, y); x = b/2a} ed incontra lasse delle
y nel punto y = c. Il grafico incontra lasse delle x solo se = b2 4ac 0. La derivata seconda
f (x) = 2a > 0, dunque la funzione `e convessa.
2.1. Interpolazione lineare - metodo dei minimi quadrati. Questo paragrafo `e piuttosto rivolto
ad un lettore particolarmente interessato.
Supponiamo di avere a che fare con un dato sistema reale per il quale abbia senso cercare un modello
teorico della forma y = f (x). Supponiamo di avere qualche motivo (tra cui il solito pregiudizio/criterio
di semplicit`a) per congetturare che qualitativamente il modello sia di tipo lineare:
y = mx + q .
Vogliamo allora corroborare (o meno) sperimentalmente questa ipotesi qualitativa e (nel caso fosse
confermata) determinare con buona approssimazione leffettiva legge (cio`e la coppia (m, q) di costanti
di struttura del sistema ). Supponiamo inoltre di sapere preparare lesperienza in modo tale che le
misure x siano determinate con un errore trascurabile, mentre non possiamo trascurare la presenza
di errori sperimentali (e sistematici) nella misure y. Quello che possiamo fare `e allora produrre
sperimentalmente un insieme di coppie di misure (xj , yj ), j = 1, . . . , n. E chiaro che per essere
significativo n deve essere abbastanza grande, anche se per adesso non `e chiaro cosa significhi
abbastanza; daltra parte ci sono dei vincoli pratici per cui n non pu`
o essere davvero grande a piacere.

MODELLI E INTERPOLAZIONI

Se il modello qualitativo fosse corretto, se conoscessimo effettivamente la legge y = f (x) = mx + q e


fossimo in grado di effettuare misure esatte, allora si avrebbe che le coppie (xj , yj ) sarebbero allineate,
appartenendo al grafico rettilineo di f . Poiche non possiamo escludere errori nelle misure yj , anche
conoscendo effettivamente f , lerrore che misura la distanza tra il dato sperimetale e il dato teorico `e
per ogni j
dj = mxj + q yj .
Prendiamo come misura globale dellerrore:
S(a, b) =

1X 2
d .
n j j

Si noti abbiamo preso la media aritmetica dei quadrati degli errori individuali piuttosto che la media
aritmetica degli errori stessi. Ci sono varie ragioni per fare questo: intanto errori di segno opposto
(anche di valore assoluto grande) possono cancellarsi nella media aritmetica, mentre questo non succede prendendo i quadrati; inoltre con i quadrati si minimizza il contributo degli errori sperimentali
(che possiamo cercare di rendere piccoli) mentre amplifica gli eventuali errori grandi dovuti ad una
possibile inadeguatezza sistematica non eliminabile del nostro modello. Ricordiamoci ora che in effetti la retta teorica `e incognita, mentre il numero S(m, q) `e definito per ogni retta. E ragionevole
pensare che la retta teorica che cerchiamo (ammesso che esista) sia approssimata bene dalla retta che
minimizza S(m, q). Si tratta quindi di un problema di ricerca di punto di minimo assoluto per una
funzione di due variabili. Vediamo come questo specifico problema pu`o essere ricondotto alla ricerca
dei punti di minimo di due determinate funzioni quadratiche di una sola variabile, cosa che sappiamo
fare facilmente come abbiamo visto sopra. Per enunciare i prossimi risultati, conviene introdurre
alcune notazioni:
Notazioni Date due sequenze finite di numeri reali x = (x1 , . . . , xn ), y = (y1 , . . . , yn ), indichiamo con
x
la media aritmetica degli xj , xy
la media aritmetica dei prodotti xj yj , x2 , la media aritmetica dei
2
punti xj .
Procediamo allora nel modo seguente:
Per ogni m fissato, calcoliamo S(m, q) pensata come funzione della sola variabile q. Con calcoli
semplici che non riportiamo, si verifica allora che `e una funzione quadratica della forma:
S(m, q) = q 2 + bq + c
dove i coefficienti b, c possono essere calcolati esplicitamente, dipendono dagli xj , yj ed anche
dal parametro m. Dunque, per ogni m, esiste un unico punto di minimo q0 = q0 (m) = b/2,
che alla fine risulta essere
q0 (m) = y m
x.
Per ogni m, calcoliamo S(m, q0 (m)). Omettendo ancora una volta i dettagli, concludiamo che
anche questa `e una funzione quadratica di m, della forma:
S(m, q0 (m)) = am2 + hm + k
dove i coefficienti a, h, k possono essere calcolati esplicitamente in funzione dei soli xj , yj , ed
inoltre a > 0. Allora anche S(m, q0 (m)) ha un unico punto di minimo locale m0 = h/2a che
alla fine risulta essere:
xy
xy
.
m0 = 2
x x2
Infine il punto di minimo assoluto per S(m, q) cercato `e dato dalla coppia
(m0 , q0 (m0 )) .
Abbiamo trovato cos` questa retta y = m0 x + q0 (m0 ) che viene detta la retta di regressione
dei nostri dati sperimentali (xj , yj ). Si dice anche che tale retta `e ottenuta per interpolazione
lineare di quei dati.

MODELLI E INTERPOLAZIONI

Resta il problema di valutare quanto questa sia una buona approssimazione della retta teorica incognita
(ammesso che esista) e, in ultima analisi, se il modello teorico lineare stesso sia adeguato al nostro
sistema oppure no. Non `e qui il luogo di sviluppare i dettagli di questo argomento (probabilmente
questi temi saranno ripresi in altri corsi del corso di laurea). Ci limitiamo a dare il risultato finale.
Viene derivato il coefficiente di Pearson
xy
x
y
CP = q

2
2
(x x
)(y2 y2 )

che ha il seguente significato: se |CP | `e abbastanza vicino a 1 (per esempio dellordine di 0, 995) e n
`e abbastanza grande (per esempio n 5 meglio n 6) allora si pu`
o ritenere che il modello teorico
lineare `e adeguato e che la retta di regressione `e una buona approssimazione della retta teorica. Se CP
`e vicino allo zero, allora il modello teorico lineare va rigettato. Si noti che il modo in cui abbiamo
specificato i due abbastanza ha carattere prevalentemente empirico, viene abitualmente adottato
(seguendo protocolli internazionali) per esempio per molte analisi chimiche, ma non ha carattere
universale. Inoltre ci sono molti altri accorgimenti per migliorare lattendibilit`
a del risultato. Per
esempio, spesso per ogni xj si fanno almeno 3 misurazioni diverse per y e si prende poi come yj la
media dei valori ottenuti. Un altro punto delicato `e la distribuzione dei valori degli xj . Si potrebbe per
esempio prendere una distribuzione uniforme in cui questi si susseguono uno dopo laltro a distanza
d fissa (e ci sarebbe comunque da giustificare la scelta di d). In altri casi (questo `e soprattutto
vero per linterpolazione esponenziale di cui parleremo poi) conviene scegliere la posizione degli xj in
modo non uniforme, con opportuni addensamenti dettati dalle caratteristiche proprie del sistema
reale preso in considerazione.
3. Modelli di tipo sinusoidale o periodico
Un modello di tipo sinusoidale `e della forma
y = f (x) = A cos((x x0 )) + y0
dove i parametri A, y0 , x0 R, A > 0. A meno di comporre con una opportuna traslazione x x + r,
pu`
o essere riscritto in forma analoga, con la funzione sin al posto di cos. I i parametri determinano
completamente f , ed hanno ciascuno un significato preciso. Limmagine della funzione f `e lintervallo
[y0 A, y0 + A]. Quindi lampiezza delle oscillazioni (positive o negative) del grafico di f `e A, mentre
y0 `e il valor medio. La funzione f `e periodica di periodo
2
,
P =

:= 1/P
`e detta la frequenza di f , mentre
2
= 2 =
P
`e la frequenza angolare. Leffetto di x0 `e quello di traslare le ascisse. Ne segue che i punti di massimo di
f sono della forma x0 + kP , k Z. Grazie alla periodicit`
a di f , la funzione non cambia se sostituiamo
x0 prendendolo uguale al primo punto di massimo non negativo; scelto con questa convenzione, x0 `e
detto la fase di f .
Molti sistemi reali che presentano comportamenti ondulatori, oscillatori, vibranti, radianti (si
pensi allemissione del suono di praticamente qualsiasi strumento musicale, alle onde elettromagnetiche
. . . ) o anche semplicemente periodici, si prestano ad essere trattati con modelli sinusoidali o opportune
combinazioni di questi. A questo proposito facciamo un paio di osservazioni:
Si osserva che sommando per esempio funzioni sinusoidali di uguale ampiezza e periodo ma
con fasi differenti, si possono avere fenomeni di interferenza con associati effetti di risonanza
o di cancellazione che sono tipici dei sistemi di tipo ondulatorio. Per esempio usando note
formule di trigonometria si calcola che:
x0
x0
A cos(x) + A cos((x x0 )) = 2A cos( ) cos[(x )] .
2
2

MODELLI E INTERPOLAZIONI

P
=
le due funzioni si cancellano e la somma `e nulla. Questo si pu`
o

2
effettivamente realizzare in laboratorio illuminado un oggetto con due raggi di luce (che hanno
anche un carattere ondulatorio) della stessa intensit`a (ampiezza), colore (frequenza)
ma fasi che differiscono per P/2; il risultato `e che loggetto resta al buio. E curioso notare
come questa fenomenologia scientifica `e per una volta passata nel linguaggio comune in modo
pertinente: si usa dire infatti sono fuori fase per dire che non riusciamo ad accordarci con
il ritmo della realt`
a circostante e che i nostri sforzi anche intensi hanno effetti mediocri.
Sviluppando una funzione sinuosidale f usando ancora una volta note formule di trigonometria,
si verifica che f pu`
o essere riscritta nella forma
Se poniamo x0 =

f (x) = y0 +

n
X

aj cos(jx) +

n
X

bj sin(jx)

j=1

j=1

per un certo n N e opportuni coefficienti reali aj , bj . Chiameremo una tale scrittura un


polinomio trigonometrico di frequenza angolare . Dunque ogni funzione sinusoidale `e un
caso particolare di polinomio trigonometrico; ogni polinomio trigonometrico di data frequenza
2
. Sia ora y = g(x) una qualsiasi funzione continua
angolare `e periodico di periodo P =

su R, periodica di periodo P . Una parte dellanalisi matematica chiamata analisi di Fourier


permette, per ogni > 0, di determinare un polinomio trigonometrico p, di frequenza , tale
che per ogni x R, |g(x) p(x)| < . Dunque qualsiasi sistema reale che ammette un modello
teorico adeguato y = g(x) con g periodica, pu`
o essere ai fini pratici, in buona approssimazione,
trattato con modelli della forma y = p(x), dove p `e un polinomio trigonometrico.
4. Modelli di tipo esponenziale
Un modello di tipo esponenziale `e della forma
y = Aeax
dove A e a sono due costanti reali.
In molte situazioni concrete si hanno esempi di crescita esponenziale di una data popolazione. Un
caso estremo `e dato da certe ameba che se collocate in un ambiente ideale (per disponibilit`a di cibo,
temperatura, . . . ), sono virtualmente immortali, nel senso che ogni individuo sparisce in quanto tale
duplicandosi in due individui a lui identici, in un intervallo di tempo fisso a partire dal suo momento di
esistenza in quanto individuo. Prendendo tale intervallo come unit`
a di misura del tempo, e assumendo
che al tempo iniziale t = 0 la popolazione y `e formata da un solo individuo, al tempo n avremo 2n
individui, e questo pu`
o essere esattamente interpolato con il modello esponenziale continuo
y = 2t .

Un altro modello di tipo esponenziale compare per trattare fenomeni di decadimento radioattivo.
Supponiamo di avere una regione dello spazio occupata da un campione di isotopo radioattivo di un
certo atomo. Gli atomi radioattivi decadono (cessando di essere radioattivi) emettendo particelle
che tendono a rendere radioattivi altri atomi. Supponiamo che abbia senso definire e si possa misurare
una grandezza macroscopica V (t) che riflette la quantit`
a di atomi radioattivi presenti al tempo t, a
partire da un tempo iniziale t = 0. Il modello predice che se [t0 , t1 ] `e un intervallo di tempo piccolo,
allora:
V (t1 ) V (t0 ) = V (t0 )(t1 t0 )
dove > 0 `e la costante di decadimento propria di quellatomo. Il senso del modello `e che la quantit`
a
di atomi che decade `e proporzionale alla quantit`
a di atomi radioattivi presenti, e che quest ultima
diminuisce con il passare del tempo. Fissiamo t1 > 0 (piccolo) e calcoliamo per induzione V (nt1 ) per
ogni n 1 (notare che (n + 1)t1 nt1 = t1 `e piccolo per ogni n); ponendo t = nt1 si ottiene

MODELLI E INTERPOLAZIONI

V (t) = (1

t n
) V (0) .
n

In questo modo abbiamo un po arbitrariamente discretizzato il decadimento con passo t1 . Ma in


realt`
a il decadimento avviene continuamente, dunque ha senso considerare un arbitrario t1 e studiare
il compotamento della nostra funzione V (t) quanto t1 = t/n 0+ , cio`e n +. Riconosciamo uno
dei limiti notevoli e concludiamo con il seguente modello esponenziale:
V (t) = V (0)et .

Un modello dello stesso tipo `e adeguato per analizzare una situazione molto pi`
u familiare, cio`e il
comportamento di un libretto di risparmio a tasso fisso. Disponendo di un capitale c0 che prevediamo
di non utilizzare per un tempo abbastanza lungo, possiamo aprire un libretto di risparmio con capitale
iniziale c0 , e farlo crescere grazie agli interessi composti maturati nel tempo. Il meccanismo `e il
seguente:
E fissato un intervallo di tempo (un anno, sei mesi,...) che possiamo prendere come unit`
a
di misura del tempo; si conviene che per maturare linteresse alla fine di un tale intervallo, il
capitale presente nel libretto allinizio dell intervallo `e vincolato, cio`e non pu`
o essere toccato
per tutta la durata dellintervallo.
E fissato un tasso di interesse fisso del p0 per cento (per esempio del 2 per cento). Poniamo
r0 = p0 /100.
Allora al tempo iniziale t = 0, abbiamo un capitale c(0) = c0 . Al tempo t = 1 si maturano
gli interessi e si determina il nuovo capitale c(1) = (1 + r0 )c(0); procedendo per induzione, al
tempo t = n, abbiamo un capitale
c(n) = (1 + r0 )c(n 1) = (1 + r0 )n c0 .
La scelta di r0 e dell ampiezza dellintervallo di tempo su cui il capitale `e vincolato sono state
abbastanza arbitrarie. E chiaro che in linea di principio il tasso di interesse deve essere una funzione
crescente dellampiezza di quellintervallo. In accordo con il solito criterio di semplicit`a, adottiamo il
seguente modello:
Se lintervallo di vincolo `e lungo > 0 (rispetto allunit`
a che abbiamo scelto) allora il corrispondente
tasso di interesse `e r = r0 .
Calcolando tutto come prima ma tenendo conto del parametro , vediamo che al solito c(0) = c0 ,
mentre
c(n) = (1 + r0 )c((n 1)) = (1 + r0 )n c0 .
Adesso vogliamo capire, per esempio, cosa succede quando + oppure 0+ e n +.
Fissiamo per esempio una successione crescente divergente della forma n = 0 n. Vediamo allora che
la successione dei capitali al tempo 0 :
cn (0 ) = (1 + r0 0 n)c0
`e crescente e diverge a +. Questo non `e sorprendente. Un comportamento pi`
u interessante si ha
prendendo n = 0 /n che converge a 0. Allora si ha:
cn (0 ) = (1 +

r0 0 n
) c0 .
n

Usando fatti noti, vediamo che cn (0 ) `e ancora una successione crescente che per`o adesso converge al
limite finito er0 0 . In particolare se 0 = 1 = r0 , il limite `e esattamente la costante di Nepero.

MODELLI E INTERPOLAZIONI

5. Modelli di tipo logaritmico


Un modello di tipo logaritmico `e della forma
y = A log x + a
definito per x > 0, dove A e a sono due costanti reali. Un importante esempio `e la definizione
dellentropia data da Boltzman. Immaginiamo, per fissare le idee, di avere a che fare con un campione
di gas, composto da N molecole, in un contenitore nello spazio 3-dimensionale. Uno stato microscopico
del sistema `e dato dallinsieme delle posizioni e delle velocit`
a (istantanee) di tutte le molecole (6 gradi
di libert`
a per ogni molecola). Dunque linsieme S di tutti gli stati microscopici (detto anche lo spazio
delle fasi del sistema) pu`
o essere interpretato come una regione di R6N . La determinazione effettiva
degli stati microscopici pu`
o essere impraticabile, per cui si pu`
o cercare una riduzione di grana grossa
dello spazio delle fasi: decomponiamo S in celle con la propriet`
a che due stati che stanno nella stessa
cella sono macroscopicamente indistinguibili, mentre stati in celle diverse lo sono. Allora lentropia S
di uno stato corrispondente ad un punto x S `e definita da:
S = k log(V )
dove V `e il volume della cella che contiene x, e k `e la costante di Boltzman (k = 1.38 1023 per
una scelta opportuna delle unit`
a di misura in gioco). Luso del logaritmo ha unimportanza pratica
perch`e permette di maneggiare meglio i numeri molto grandi che di fatto intervengono maneggiando
lentropia (vedi la discussione qui sotto sulla scala logaritmica) e, soprattutto ha unimportanza
strutturale; infatti risulta che se un sistema S = S1 S2 `e lunione di due sistemi indipendenti, allora
lentropia associata al sistema totale `e la somma delle entropie associate ai sistemi costituenti. Il
secondo principio della termodinamica si pu`
o esprimere dicendo che ogni stato libero di evolvere nello
spazio delle fasi, tende a muoversi secondo traiettorie che incontrano celle di volume strettamente
crescente. Spesso il sistema ha una cella di volume molto pi`
u grande di tutte le altre, corrispondente
agli stati in equilibrio termico.
6. Altri modelli realistici
Modelli del tipo
y = Aebx cos(x + )
ottenuti come prodotto di una funzione sinusoidale e di una esponenziale, rappresentano bene sistemi
in cui sono presenti oscillazioni smorzate, per esempio quando x + se il parametro b < 0.
Il battimento `e un fenomeno che avviene per somma di due vibrazioni di pari ampiezza, ma che
differiscono luna dallaltra per una differenza di frequenza, in modo che per interferenza si sommano
e si cancellano periodicamente, dando luogo ad una vibrazione risultante con un andamento che pu`
o
essere racchiuso tra due onde sinusoiali identiche ma sfasate tra loro di . Fenomeni di battimento
intervengono per esempio quando si accordano gli strumenti musicali. Modelli di battimento sono dati
da funzioni elementari del tipo:
y = cos(ax) sin(2bx)
per una scelta opportuna delle costanti a e b.
Consideriamo le funzioni elementari del tipo:
y = f (x) = a(1 ek(xx0 ) ) + b
dove le costanti a, k, x0 , b R, a, k > 0. La derivata f (x) = kaek(xx0 ) , dunque `e sempre strettamente positiva, dunque f `e crescente. Inoltre lim f (x) = a + b, cos` che f ha un asintoto orizzontale
x+

y = a + b. Una variante sono le funzioni elementari del tipo:


a
+b
y = f (x) =
1 + ek(xx0 )
si verifica che anche in questo caso la funzione `e crescente, ha lasintoto orizzontale y = b per x ,
lasintoto orizzontale y = a + b per x +. Il primo tipo di funzione si presta ad essere modello
di sistemi che presentano un fenomeno di saturazione per x +, mentre il secondo tipo si presta
quando `e presente anche un fenomeno di saturazione inversa.

MODELLI E INTERPOLAZIONI

Esempio 6.1. Una modello del tipo


y = f (x) =

a
ek(xx0 )

1+
pu`
o essere realistico quando per esempio x rappresenta la concentrazione di un certo antibiotico,
mentre y rappresenta la mortalit`
a di un certo batterio. Linterpretazione qualitativa del modello
dice che a basse concentrazioni la mortalit`
a `e praticamente nulla (saturazione inversa); ad alte
concentazioni la mortalit`
a `e praticamente indipendente dal valore della concentrazione (saturazione);
in un intervallo di valori centrali della concentrazione lefficacia dellantibiotico `e massima, infatti
la derivata `e positiva, `e piuttosto grande (cio`e il grafico `e piuttosto ripido), cos` che anche piccole
variazioni della concentrazione provocano un significativo aumento della mortalit`
a.
Un altro esempio notevole di funzione elementare che incorpora un fenomeno di saturazione `e il
seguente
h
I = f () = 2h 3 (e kT 1)
dove si considera lintensit`a (lampiezza) I in funzione della frequenza (colore) della radiazione di un
corpo radiante (per esempio un forno) contenuto in una cavit`a nera che assicura che la radiazione
`e in equilibrio termico a temperatura T con il materiale circostante; k `e la costante di Boltzman
gi`a incontrata nella definizione dellentropia, mentre h `e la costante di Planck che in un opportuno
sistema di unit`
a di misura condiviso con k, prende un valore molto piccolo (circa h = 6.62 1034 ).
Studiando il grafico si vede che f (0) = 0, la funzione `e positiva, cresce fino a raggiungere un valore
di massimo assoluto, poi decresce ed ha lasintoto orizzontale I = 0 per +. Questo modello
proposto da Planck nel 1900, corregge quello quadratico proposto in precedenza da Rayleigh-Jeans,
sulla base della teoria ondulatoria classica:
I = 2kT 2 .
Il problema con questo precedente modello `e che pur essendo in accordo con i risultati sperimentali
per frequenze basse (nellinfrarosso) non lo `e in modo radicale quando `e molto grande (la cosiddetta
catastrofe ultravioletta). Il modello di Planck oltre ad essere del tutto corroborato dai risultati
sperimentali per ogni valore di , `e di fondamentale importanza, anche storica, per il modo in cui fu
derivato; la sofisticata analisi statistica di Planck che porta alla formula `e basata sul postulato cruciale
che h `e una nuova costante fondamentale della natura e che le oscillazioni elettromagnetiche possono
essere emesse o assorbite solo in modo quantizzato, cio`e in pacchetti di una specifica energia E,
legata alla frequenza secondo la relazione lineare E = h.
Il seguente esempio geometrico `e piuttosto rivolto ad un lettore particolarmente interessato.
Vediamo ora come opportune funzioni elementari concorrano nel costruire un modello di geometria non
2
euclidea, detta
p geometria iperbolica. Dati due punti P = (x, y) e Q = (s, t) del piano R ; indichiamo
con P Q = (x s)2 + (y s)2 la distanza euclidea tra i due punti che `e anche uguale alla lunghezza
(euclidea) del segmento rettilineo (non orientato) [P Q] di estremi P e Q. Si consideri ora nel piano il
disco unitario aperto D = {x2 + y 2 < 1} delimitato dalla circonferenza di bordo S = {x2 + y 2 = 1}.
Dati due punti distinti A, B D, il segmento [AB] `e tutto contenuto in D (si dice che D `e convesso).
Definiamo ora una nuova lunghezza, detta iperbolica, di [AB] nel modo seguente. Si consideri la
retta r che contiene [AB] e siano P e Q i due punti dellintersezione r S distribuiti rispetto ad una
orientazione ausiliaria di r in modo che P < A < B < Q. Poniamo allora
P B AQ
1
).
dh ([AB]) = log(
2
P A BQ
Se per semplicit`a supponiamo che A = O sia il centro di D e 0 < r = OB < 1 allora il raggio iperbolico
rh = dh ([0B]) si esprime in funzione del raggio euclideo r nel modo seguente.
1
1+r
rh = log(
).
2
1r
Si vede allora che lim rh = 0 mentre lim rh = +. Possiamo quindi dire che S `e il bordo allinfinito
r0+

r1

di D. Nella nuova geometria che stiamo descrivendo, avendo come termine di confronto quella euclidea,

MODELLI E INTERPOLAZIONI

D gioca il ruolo di R2 . I triangoli in D sono i (soliti) triangoli tutti contenuti in D; per la convessit`a
di D questo `e equivalente a richiedere che i vertici siano punti di D. Nella nuova geometria per`o la
lunghezza dei lati di un triangolo non `e quella euclidea che viene rimpiazzata da dh . Il primo fatto
che ci dice che stiamo trattando una onesta geometria `e che anche le nuove lunghezze verificano le
disuguaglianze triangolari: per ogni triangolo, comunque si scelga un lato la sua lunghezza `e minore
o uguale alla somma delle lunghezze degli altri due. Omettiamo la verifica di questa propriet`
a; ci
limitiamo a segnalare che la propriet`
a funzionale di log gioca un ruolo importante. Usando questi
fatti, generalizzando quanto fatto prima in un caso particolare, si verifica che per ogni punto A di D
e ogni punto S S del bordo di D, se B D appartiene al segmento di estremi A e S e B A
allora dh ([AB]) 0, mentre se B S, allora d([AB]) +. Dunque, ponendo dh ([AA]) = 0
per ogni A D, analogamente al caso euclideo dh ([AB]) = dh (A, B) definisce una distanza su D
tale che per ogni segmento [AB] contenuto in D la lunghezza del segmento `e uguale alla distanza
tra i suoi estremi. Per capire un po il carattere di questa nuova geometria, si consideri il seguente
problema: sia data una corda [ST ] di D con estremi S, T S. Siano A, B [ST ] due punti di D
giacenti su questa corda. Sia D il diametro di D parallelo alla corda [ST ] di estremi S , T S tali
che [SS ] e T T ] sono lati del trapezio di vertici S, T, S , T . Vogliamo determinare A , B su D in
modo tale che dh ([AB]) = dh ([A B ]). Questi si determinano geometricamente nel modo seguente: si
considerano le semirette di origine S e T rispettivamente, passanti per i punti S e T rispettivamente.
Queste due semirette si incontrano in un punto P esterno a D. Allora A `e dato dallintersezione
con il diametro D della semiretta di origine P passante per A (analogamente per B ). Il fatto che
le lunghezze dh siano le stesse segue dalla formula che definisce dh e dal teorema di Talete. Dunque
muovendo la corda parallelamente in modo che gli estremi di avvicinino rispetto alla distanza euclidea,
troviamo segmenti di lunghezza iperbolica costante che appaiono sempre pi`
u corti da un punto di
vista euclideo. Analogamente alla geometria euclidea definiamo le rette iperboliche come i segmenti
aperti non estendibili; dunque queste coincidono con i segmenti (aperti) in D con estremi allinfinito
cio`e su S. Come nella geometria euclidea, due rette iperboliche o non si intersecano (e diciamo allora
che sono parallele) oppure si intersecano in un solo punto (sono incidenti); inoltre, per ogni punto
passano infinite rette, per due punti distinti passa una sola retta. Ci sono per`o due modi in cui
due rette iperboliche possono essere parallele: possono avere coppie di estremi su S distinte (diciamo
allora che sono ultraparallele), oppure avere un estremo in comune sul bordo di D (parallele incidenti
allinfinito). Preso A in D e una retta iperbolica r che non passa per A, ci sono due rette passanti per
A e incidenti allinfinito con r, mentre ci sono infinite rette ultraparallele a r passanti per A. Quindi
in questa nuova geometria non vale il postulato delle parallele che vale per la geometria euclidea.
Si ricordi che per secoli `e stato discusso se lassioma delle parallele fosse o no indipendente dagli
altri assiomi della geometria euclidea. Il modello di geometria che stiamo descrivendo mostra che in
effetti quellassioma `e indipendente dagli altri. Il trattamento della misura degli angoli nella geometria
iperbolica `e pi`
u involuto. Si potrebbe congetturare che la misura dellangolo formato da due rette
iperboliche ordinate coincida con la misura euclidea. Ma `e questo il caso solo se le due rette sono
diametri. In generale descriviamo la ricetta senza giustificarla. Prendiamo una retta r in D di estremi
S e T in S che non sia un diametro e sia A un punto di r. Esiste ununica circonferenza C di centro
esterno a D tale che C e S si intersecano ortogonalmente in S e T . Consideriamo larco (aperto) di
circonferenza = C D. Sia A il punto di ottenuto intersecando con la semiretta di origine O,
passante per A. Se la retta r `e invece un diametro, poniamo = r e A = A. Se ora abbiamo due rette
ordinate r e r che si intersecano in A possiamo realizzare A come intersezione dei due rispettivi archi
ordinati e . Considerando le rispettive rette tangenti in A , questi archi determinano un angolo di
una data misura euclidea . Allora `e anche la misura iperbolica dellangolo formato dalle due rette
ordinate r e r . Ne segue che la somma delle misure degli angoli interni di un triangolo iperbolico `e
< (contro il fatto che nella geometria euclidea tale somma `e uguale a ). Si pu`
o sviluppare una
trigonometria iperbolica in cui le funzioni cosh e sinh (introdotte alla fine di [EC]) svolgono un ruolo
analogo alle funzioni cos e sin nella trigonometria classica. Inoltre la geometria iperbolica `e essenziale
per costruire modelli della cinematica della relativit`a ristretta.

10

MODELLI E INTERPOLAZIONI

Cogliamo qui loccasione per aggiungere qualche informazione sulle funzioni cosh e sinh. Ricordiamo
le definizioni (su tutto R)
sinh(x) :=

ex + ex
sinh(x)
ex ex
, cosh(x) :=
, tanh(x) =
.
2
2
cosh(x)

Notiamo intanto che cosh `e pari mentre sinh `e dispari. Per ogni x R, cosh2 (x) sinh2 (x) = 1.
Inoltre si verifica direttamente che cosh = sinh, sinh = cosh. Su lintervallo [0, +), entrambe cosh
e sinh sono > 0. Quando x +, cosh(x) > ex dunque tende a +. Daltra parte, cosh(x)
sinh(x) = ex che tende a 0. Ne deduciamo che sinh `e strettamente crescente su R, si annulla solo
per x = 0, ed `e bigettivo, per cui `e definita su tutto R la funzione inversa arc sinh. La funzione
cosh `e strettamente crescente per x > 0, decrescente per x < 0, ed ha un punto di minimo in
x = 0, cosh(0) = 1. La restrizione di cosh su [0, +) `e bigettiva sopra [1, +) e possiamo definire
la funzione inversa arc cosh : [1, +) [0, +). Lasciamo al lettore di aggiungere informazioni a
proposito della concavit`a di queste funzioni. Per quanto riguarda la tangente iperbolica, si verifica la
1
relazione tanh2 (x) = 1
.
cosh2 (x)
Un altro esempio importante di funzione elementare `e formato dalle funzioni Gaussiane cio`e della
forma
y = Aex

dove A e sono costanti > 0. Una tale funzione `e pari, positiva, con 0 come punto di massimo
assoluto, decrescente su x > 0 e con asintoto orizzontale y = 0 quando x +. Per molti fenomeni
aleatori (anche di grande importanza applicativa), le funzioni Gaussiane intervengono per definire la
corrispondente distribuzione di probabilit`
a.
7. Scala logaritmica ed altri esempi di interpolazione
Dato un sistema di coordinate cartesiane x, y su R2 (rispetto ad una fissata unit`
a di misura dei
segmenti), la scala logaritmica su uno degli assi (per esempio lasse delle y) si ottiene facendo il
seguente cambio di coordinata sul semiasse positivo:
t = log(y) .
Ci sono delle circostanze pratiche in cui conviene fare questo cambiamento di scala (su uno o entrambi
gli assi). Supponiamo per esempio che dobbiamo riportare su una pagina di un testo certe coppie
di dati numerici (xj , yj ), j = 1, . . . , n, e che per esempio le yj > 0 crescano molto rapidamente. E
facile allora che quelle coppie escano dalla pagina. Potremmo rimpicciolire lunit`a di misura, cio`e
rimpicciolire linearmente la figura, con il rischio per`o che adesso questa diventi troppo piccola e poco
log(y)
= 0, c`e pi`
u spazio sulla stessa pagina per riportare in modo efficace
leggibile. Siccome lim
y+
y
le coppie di dati (xj , tj ).
Luso della scala logaritmica permette di estendere i risultati sullinterpolazione lineare discussi prima
ad altri tipi di modello. Per analogia con la discussione fatta prima per i modelli lineari, supponiamo
di avere a che fare con un dato sistema reale e qualche motivo per congetturare che qualitativamente
il modello sia di tipo esponenziale:
y = Aeax , A > 0 .
Vogliamo allora corroborare (o meno) sperimentalmente questa ipotesi qualitativa e (nel caso fosse
confermata) determinare con buona approssimazione leffettiva legge (cio`e la coppia di costanti di
struttura del sistema (A, a)). Passando alla scala logaritmica rispetto allasse delle y, t = log(y),
riconduciamo questo problema a quello gi`a risolto nel caso lineare; infatti si ottiene la funzione
t = ax + log(A)
cio`e nelle nuove coordinate il modello diventa formalmente lineare. Se per esempio t = m0 x + q0 `e
la retta di regressione per certi dati (xj , tj ), otteniamo linterpolazione esponenziale dei dati (xj , yj )

MODELLI E INTERPOLAZIONI

11

nelle coordinate originali:


y = eq0 em0 x .
Se per esempio il modello congetturato `e di tipo potenza, definito per x > 0:
y = Axa = Aea log(x) , A > 0
allora prendendo la scala logaritmica su entrambi gli assi (z = log(x), t = log(y)) ci riconduciamo
ancora una volta ad un modello formalmente lineare:
t = az + log(A) .
Se il modello congetturato `e del tipo con saturazione y = f (x) = a(1 ek(xx0 ) ) + b, si vede che
f (x) b
f (x) b
, da cui, posto z = log(1
), si ricava z = kx + kx0 . Ammettendo
ek(xx0 ) = 1
a
a
di conoscere per altra via i valori a e b giusti, possiamo ricavare k e x0 per interpolazione lineare.

November 20, 2014


FUNZIONI DERIVABILI

`
1. Definizioni e prime proprieta
In questa dispensa consideriamo principalmente funzioni definite su insiemi aperti di R. Sia f : D R
una funzione definita su un insieme aperto di R. Dato a D definiamo sullinsieme D \ {a} la funzione
rapporto incrementale di f rispetto al punto a
f (x) f (a)
.
xa
Diciamo che la funzione f `e derivabile in a D se esiste finito il limite
x

f (x) f (a)
=LR.
xa
In tal caso L `e detta la derivata di f in a e scriviamo
lim

xa

L = f (a) .
Nella letteratura si trovano diverse altre notazioni per indicare la derivata oltre f (a), per esempio
d
f (a), f(a) .
dx
Potr`
a capitare anche a noi di usare luna o laltra notazione. A volte si preferisce scrivere il rapporto
incrementale nella forma
f (a + h) f (a)
x
h
dove abbiamo fatto il cambiamento di variabile h = x a. Questo in generale non ha senso su tutto D;
per`o, siccome D `e aperto, esiste > 0 tale che I(a, ) D, quindi basta assumere che |h| = |x a| < .
E chiaro allora che
f (x) f (a)
=LR
lim
xa
xa
se e solo se
f (a + h) f (a)
lim
=LR.
h0
h
Derivata e differenziale. Supponiamo che f sia derivabile in a D, f (a) = L R. Consideriamo
la funzione lineare
Dfa : R R, Dfa (x) = Lx .
Questa funzione `e detta il differenziale di f in a. E chiaro che la derivata e il differenziale in a si
ricavano luna dallaltro in modo automatico, per`o sono oggetti diversi perch`e la derivata `e uno scalare
mentre il differenziale `e una funzione. Possiamo allora riscrivere
(f (a + h) f (a)) Dfa (h)
=0
h0
h
o, ancora, usando la notazione o-piccolo di Landau,
lim

(f (a + h) f (a)) Dfa (h) = o(h) .


o ancora
f (a + h) f (a) = Da f (0) + o(h)
Si noti che g(h) = f (a + h) f (a) considerata come funzione di h (come sopra si considera |h| < )
`e tale che g(0) = 0 come naturalmente Dfa (0) = 0. Lespressione precedente esprime bene lidea
intuitiva che Dfa `e la funzione lineare di h che meglio approssima la funzione g(h) in un intorno di 0
(a volte si dice anche che Dfa linearizza g in un intorno di 0).

FUNZIONI DERIVABILI

Interpretazione geometrica del rapporto incrementale e della derivata. Ricordiamo che dati
due punti distinti (x0 , x1 ), (y0 , y1 ) R2 , tali che x0 6= y0 , la retta passante per i due punti `e parallela
alla retta passante per lorigine di equazione
x1 y1
x0 y0
ed m `e detto il coefficiente angolare della retta. Si vede allora che il rapporto incrementale `e proprio il
coefficiente angolare della retta passante per i due punti del grafico di f : (x, f (x)) e (a, f (a)). Dunque
se la funzione `e derivabile in a, la derivata f (a) pu`
o essere interpretata come il coefficiente angolare
di una retta limite di equazione y = f (a)x; la retta parallela a questa retta e passante per il punto
(a, f (a)) (che ha equazione y = f (a)x + q per un opportuno valore della costante q) `e detta la retta
tangente al grafico di f nel punto (a, f (a)). Si nota che la retta y = f (a)x `e proprio il grafico della
funzione lineare Da f . La retta tangente al grafico di f `e il grafico della funzione x Da f (x) + q.
y = mx, m =

Interpretazione cinematica della derivata. Restringiamoci come sopra ad un intervallo I(0, )


D. Allora interpretando t come una variabile temporale, lapplicazione definita su I(0, ), t
(a + t, f (a + t) pu`
o essere interpretata come la legge oraria di un punto del piano che si muove
nel tempo. La traiettoria `e una curva contenuta nel grafico di f . Allora il vettore v = (1, f (a))
rappresenta il vettore velocit`
a del punto che allistante t = 0 si trova nella posizione (a, f (a)). Questo
vettore `e una base della retta y = f (a)x considerata come sottospazio vettoriale di dimensione uguale
a 1 di R2 .
Derivate destre e sinistre. Dato un sottoinsieme D di R, diciamo che a D `e una estremit`
a locale
sinistra (risp. destra) se esiste > 0 tale che (a , a + ) D = [a, a + ) (risp. = (a , a]). Un
sottoinsieme D di R si dice buono se ogni a D `e interno oppure `e una estremit`
a locale. Se a `e
una estremit`
a locale sinistra di D ed esiste finito
lim+

h0

f (a + h) f (a)
=LR
h

f+
(a)

si dice che
= L `e la derivata destra di f in a. Analogamente si definisce la derivata sinistra

f
(a) in una estremit`
a destra. Molte delle cose che diremo potrebbero essere generalizzate agli insiemi
buoni e alle derivate destre e sinistre. Per semplicit`a ci limiteremo al caso degli insiemi aperti.
Funzioni globalmente derivabili. La funzione f si dice derivabile su D se lo `e in ogni punto di D.
In tal caso `e definita la funzione derivata di f :
f : D R .
Se f := f (1) `e a sua volta derivabile (localmente nel punto a o globalmente su tutto D, allora `e
definita la derivata seconda f (2) (a) in a, oppure la funzione derivata seconda f (2) : D R. In modo
induttivo, se `e definita la funzione derivata n-esima f (n) : D R, se questa `e localmente derivabile
in a `e definita f (n+1) (a); se `e derivabile su D, allora `e definita la funzione f (n+1) : D R. Diciamo
che f : D R `e di classe C 0 se `e continua su D. Per ogni n 1 diciamo che f `e di classe C n se per
ogni 1 j n, esiste la funzioni derivata j-esima f (j) : D R ed `e continua su D. La funzione f `e
di classe C se per ogni n 1, f `e di classe C n . Vale la seguente proposizione.
Proposizione 1.1. Se f : D R `e derivabile allora f C 0 (cio`e `e continua). Pi`
u in generale se
esistono le funzioni derivata m-esima f (m) per ogni 0 m k + 1, allora f C k . Se esistono le
funzioni derivata m-esima f (m) per ogni m 0, allora f C .
Dim. Ragionando poi per induzione, basta dimostrare che se f `e derivabile in a D, allora f `e
continua in a. Infatti, poiche
f (x) f (a)
f (x) = f (a) +
(x a)
xa
passando al limite per x a e usando alcune propriet`
a note dei limiti si vede che f (x) f (a).
2

FUNZIONI DERIVABILI

Esempi fondamentali. Le seguenti funzioni definite su tutto R sono derivabili (in effetti sono di
classe C ):
f (x) = c, f = 0
f (x) = x, f (x) = 1
f (x) = sin(x), f (x) = cos(x)
f (x) = cos(x), f (x) = sin(x)
f (x) = ex , f (x) = ex .
Infatti:
Per le funzioni costanti e per lidentit`
a `e chiaro.
Calcoliamo per ogni a R,
(exp) (a) = lim

h0

exp(a + h) exp(a)
h

si ha che
exp(a + h) exp(a) = exp(a)(exp(h) 1)
Dunque
exp(h) 1
= exp(a)
h0
h
abbiamo cos` verificato che (exp) = exp.
Calcoliamo per ogni a R,
sin(a + h) sin(a)
(sin) (a) = lim
h0
h
per note formule trigonometriche sappiamo che
(exp) (a) = exp(a) lim

sin(a + h) = sin(a) cos(h) + cos(a) sin(h)


da cui

sin(a + h) sin(a)
cos(h) 1
sin(h)
= sin(a)
+ cos(a)
h
h
h
Passando al limite per h 0 e ricordando gli opportuni limiti notevoli (vedi la scheda
[LIMITI]) si conclude che
(sin) (a) = cos(a) .
Il coseno si tratta in modo analogo.
.
`
2. Procedure che preservano la derivabilita
Abbiamo visto nella dispensa [C-elementari], alcune procedure che preservano la continuit`
a. Vogliamo
specializzare ed eventualmente restringere quelle procedure in modo da preservare la derivabilit`a.
Vediamo subito che dobbiamo eliminare le procedure min, max e quindi valore assoluto. Infatti
x |x|, definita su tutto R non `e derivabile in 0. Elenchiamo la lista ristretta delle procedure raffinate
che indicheremo genericamente Pd . In particolare vogliamo fare in modo di lavorare in ogni momento
con funzioni definite su aperti di R.
Siano f : D R, g : D R funzioni derivabili (quindi continue) definite su aperti di R.
(somma e prodotto) Supponiamo D D 6= . Poiche lintersezione di insiemi aperti `e un
insieme aperto, f + g e f g sono definite come al solito.
(restrizione) Per ogni insieme aperto D di R contenuto in D, consideriamo la restrizione f|D .
(reciproco). Poiche f `e derivabile, quindi continua, D \ {f = 0} `e automaticamente aperto
(verificarlo per esercizio) quindi la definizione usuale si specializza bene.
(inversa) Se f `e iniettiva e derivabile, quindi continua, sappiamo che f (D) `e aperto e f 1 :
f (D) D `e continua. Richiediamo inoltre che per ogni a D, f (a) 6= 0.

FUNZIONI DERIVABILI

(composizione) Nessuna modifica nella definizione della procedura.


La seguente proposizione riassume importanti propriet`
a strutturali delle funzioni derivabili.
Proposizione 2.1. Linsieme delle funzioni definite su aperti di R derivabili `e chiuso rispetto alle
procedure Pd , cio`e la funzione risultante da una tale procedura `e definita su un aperto e derivabile.
Si nota che la richiesta fatta in inversa che f (a) 6= 0 per ogni a D `e necessaria. Infatti si consideri
per esempio la funzione f : R R, f (x) = x3 `e derivabile con derivata f (x) = 3x2 , f (0) = 0; f `e
bigettiva con funzione inversa data da f 1 (0) = 0, f 1 (y) = y 1/3 se y > 0, f 1 (y) = |y|1/3 se y < 0.
Si verifica che f 1 non `e derivabile in 0 (infatti la retta tangente al grafico di f 1 nel punto (0, 0) `e
verticale e dunque ha coefficiente angolare infinito).
2.1. Regole di derivazione. Possiamo rafforzare lenunciato della proposizione precedente, dimostrando
non solo che ogni funzione risultante `e derivabile, ma esibendo anche esplicite formule per la sua
derivata in funzione dei dati iniziali.
(Somma) Per ogni a D D , (f + g) (a) = f (a) + g (a).
(Prodotto) Per ogni a D D , (f g) (a) = f (a)g (a) + f (a)g(a).
(Restrizione) Per ogni a D , (f|D ) (a) = f (a).
1
f (a)
(Reciproco) Per ogni a D = D \ f 1 (0), ( ) (a) = 2 .
f
f (a)
(Composizione) Per ogni a D, (g f ) (a) = g (f (a))f (a).
1
(Inversa) Per ogni b = f (a), (f 1 ) (b) = .
f (a)
- Nel caso di composizione e inversa le formule diventano particolarmente espressive se riformulate
in termini delle funzioni differenziali; infatti si ha:
Per ogni a D, Da (g f ) = Dgf (a) Dfa cio`e: la funzione differenziale della composizione
di due funzioni `e la composizione delle funzioni differenziali (nello stesso ordine).
1
Dff1
, cio`e il la funzione differenziale dellinversa `e linversa della funzione
(a) = (Dfa )
differenziale della funzione di partenza.
- La formula del prodotto, quando f = c `e una funzione costante diventa (cg) = cg . Insieme con la
regola per la somma, questo mostra che la derivata ha un comportamento lineare.
- La formula per il prodotto `e nota come formula di Leibniz. Dimostriamola: sommando e sottraendo
la quantit`
a f (a)f (x) al numeratore del rapporto incrementale di f g rispetto ad a D D , si realizza
che
f (x)g(x) f (a)g(a)
f (x) f (a) g(x) g(a)
=
+
xa
xa
xa
e passando al limite per x a il risultato segue.
La regola per la restrizione `e immediata perche la derivata dipende solo dal comportamento locale
della funzione.
Giustifichiamo la regola per la composizione. Poniamo b = f (a), y = f (x); consideriamo il rapporto
incrementale rispetto ad a di (g f ) (riscrivendolo astutamente):
f (x) f (a) g(y) g(b) g (b)(y b) f (x) f (a)
g(f (x)) g(f (a))
= g (b)
+
xa
xa
yb
xa
e studiamo il comportamento quando x a e quindi y b. Segue dalle ipotesi che f `e derivabile in
a e che g `e derivabile in b che tale limite `e uguale a g (b)f (a) = g (f (a))f (a) come volevamo.
La regola per reciproco si pu`
o ricavare da quella per prodotto, partendo da (f (1/f )) = (1) = 0.
La regola per inversa si pu`
o ricavare da quella di composizione, partendo da (f 1 f ) = id = 1.
Un paio di esempi:
- Usando inversa e il fatto gi`
a visto che (ex ) = ex , si verifica che log (x) = 1/x.
n
n1
- Per ogni n N, (x ) = nx
. Questo si ottiene per induzione usando prodotto. Il passo iniziale
(x) = x0 = 1 `e gi`
a stato verificato.

FUNZIONI DERIVABILI

- Per ogni R, la funzione x x := e log(x) `e definita e derivabile su D = {x > 0}. Usando


composizione si ha che (x ) = (/x)e log(x) = x1 . Giustifichiamo lultima uguaglianza:
x1 = e log(x) (elog(x) )1 = e log(x) x1
come volevamo.
3. Funzioni derivabili elementari
Procedendo come nel caso delle funzioni continue, una funzione derivabile elementare si ottiene applicando un numero finito di procedure Pd a partire dalle funzioni fondamentali
x c, x x, x sin(x), x ex
definite su tutto R. Indichiamo Ed linsieme di tutte le funzioni derivabili elementari. Tutte le famiglie
particolari di funzioni continue elementari elencate alla fine di [C-elementari] (polinomiali, razionali,
etc.) sono in effetti derivabili elementari.
Segue dalle regole di derivazione che:
Linsieme Ed `e chiuso per la derivata (la derivata di ogni funzione derivabile elementare `e derivabile
elementare). Tutte le funzioni derivabili elementari sono di classe C .
Concludiamo enunciando (senza dare la dimostrazione) unaltra propriet`
a interessante delle funzioni
derivabili elementari, la cosiddetta propriet`
a del prolungamento analitico.
Proposizione 3.1. Se f e g sono due funzioni derivabili elementari definite su un intervallo aperto
I che coincidono su un sotto-intervallo aperto I I, allora f e g coincidono su tutto I.
4. Una tabella di funzioni derivate
In questa scheda sono raccolte le derivate di alcune funzioni elementari. Se necessario, lo studente
dovrebbe essere in grado di ottenerle usando le varie regole di derivazione. Comunque questa scheda
potr`
a essere consultata e a volte essere di aiuto per il calcolo di altre derivate.
f (x) = xn , f (x) = nxn1 .

1
f (x) = x, f (x) = .
2 x
f (x) = xa = ea log(x) , f (x) =

a a log(x)
e
= axa1 , (x > 0)
x

f (x) = sin(x), f (x) = cos(x).


f (x) = cos(x), f (x) = sin(x).
1
f (x) = tan(x), f (x) =
.
cos2 (x)
1
.
f (x) = cot(x), f (x) =
sin2 (x)
1
f (x) = arcsin(x), f (x) =
, (|x| < 1).
1 x2
1
f (x) = arccos(x), f (x) =
, (|x| < 1).
1 x2
1
f (x) = arctan(x), f (x) =
.
1 + x2
f (x) = ax , f (x) = log(a)ax (a > 0).
1
f (x) = loga (x), f (x) =
, (x > 0).
log(a)x
f (x) = sinh(x), f (x) = cosh(x).
f (x) = cosh(x), f (x) = sinh(x).

FUNZIONI DERIVABILI

1
.
cosh2 (x)
1
f (x) = coth(x), f (x) =
.
sinh2 (x)
1
.
f (x) = arc sinh(x), f (x) =
1 + x2
1
.
f (x) = arc cosh(x), f (x) =
x2 1
1
f (x) = arc tanh(x), f (x) =
.
1 x2

f (x) = tanh(x), f (x) =

December 2, 2014
SULLE FUNZIONI DERIVABILI DEFINITE SU UN INTERVALLO

In questa nota assumiamo una volta per tutte di essere nella seguente situazione: [a, b], a < b, `e un
intervallo chiuso e limitato non degenere, mentre (a, b) `e il sotto-intervallo aperto dei punti interni di
[a, b]; f : [a, b] R `e una funzione continua tale che la restrizione a (a, b) `e derivabile. Utilizzeremo i
risultati stabiliti nella dispensa [C-INTERVALLI].
Lemma 0.1. Sia x0 (a, b) e supponiamo che f (x0 ) > 0. Allora esiste > 0 tale per ogni h R
tale che |h| < , si ha che x0 + h (a, b) e
f (x0 + h) f (x0 )
>0.
h
Si ha il risultato analogo invertendo le disuguaglianze.
Dim. Poiche lim

h0

f (x0 + h) f (x0 )
= f (x0 ) > 0, la tesi segue per la permanenza del segno.
h

Definizione 0.2. Un punto x0 (a, b) si dice punto di massimo (risp. minimo) locale per f se esiste
> 0 tale che (x0 , x0 + ) (a, b) e per ogni x tale che |x x0 | < si ha che f (x) f (x0 ) (risp.
f (x) f (x0 )).
Teorema 0.1. Se x0 (a, b) `e un punto di massimo (minimo) locale per f , allora f (x0 ) = 0.
Dim. Osserviamo che se x0 `e un punto di minimo locale per f , allora x0 `e di massimo locale per f .
Dunque basta argomentare il caso in cui sia un massimo locale. Supponiamo allora che x0 sia un punto
di massimo locale. Se fosse f (x0 ) > 0, e h > 0 come nel lemma precedente, allora f (x0 + h) > f (x0 )
contro il fatto che x0 `e un massimo locale. Se fosse f (x0 ) < 0 si conclude in modo analogo
2
I punti di (a, b) dove si annulla la derivata si dicono punti stazionari di f . Dunque abbiamo visto
che i massimi e minimi locali sono stazionari. Il viceversa `e falso: 0 `e stazionario per la funzione
f : (1, 1) R, f (x) = x3 , ma non `e un punto di massimo e neanche di minimo locale. Si nota
anche che, per esempio, 0 `e un punto di minimo (assoluto) di x |x| definita su tutto R, ma questa
funzione non `e derivabile in 0: la derivabilit`a non `e una condizione necessaria affinch`e f abbia massimi
o minimi locali.
Teorema 0.2. (Teorema di Rolle) Supponiamo che f (a) = f (b). Allora esiste x (a, b) tale che
f (x) = 0.
Dim. Sappiamo che [a, b] contiene un punto di massimo assoluto x0 e un punto di minimo assoluto y0 .
Se entrambi x0 y0 sono uno degli estremi a, b, allora f `e costante su [a, b] e dunque f `e identicamente
nulla su (a, b). Altrimenti almeno uno tra x0 e y0 , sia x, `e un punto interno e per il teorema precedente,
f (x) = 0.
2
Teorema 0.3. (Teorema di Cauchy) Siano f , g due funzioni definite su [a, b] che verificano
entrambe le ipotesi stabilite allinizio. Supponiamo che per ogni x (a, b), g (x) 6= 0. Allora g(a) 6=
g(b) ed esiste x (a, b) tale che
f (x)
f (b) f (a)
=
.
g(b) g(a)
g (x)
Dim. Se fosse g(a) = g(b), per il teorema di Rolle g non potrebbe essere sempre diversa da zero. Per
ogni coppia di costanti non entrambe nulle , R, la funzione h = f + g `e continua su [a, b] e
derivabile su (a, b). Scegliamo
= (g(b) g(a)), = (f (b) f (a))
Si verifica facilmente che con questa scelta, la funzione h verifica le ipotesi del Teorema di Rolle.
Quindi esiste x (a, b) tale che
h (x) = f (x) + g (x) = 0 .

SULLE FUNZIONI DERIVABILI DEFINITE SU UN INTERVALLO

Sostituendo a e le rispettive espressioni e dividendo membro a membro per (g(b) g(a))g (x) (che
`e diverso da zero), si ottiene la tesi.
2
Come corollario, usando g(x) = x, otteniamo
Teorema 0.4. (Teorema del valor medio) Esiste x (a, b) tale che
f (b) f (a)
= f (x) .
ba
2
Corollario 0.3. f `e costante su [a, b] se e solo se f (x) = 0 per ogni x (a, b).
Dim. Una implicazione `e evidente. Per dimostrare laltra, preso un arbitrario intervallo chiuso e
limitato [c, d] (a, b), applichiamo il Teorema del valor medio alla restrizione di f a [c, d]. Allora
f (d) f (c)
= f (x) = 0
cd
da cui f (c) = f (d). Per larbitrariet`
a di c, d si deduce che f `e costante su (a, b) e quindi su tutto [a, b]
perch`e `e continua.
2
Corollario 0.4. Supponiamo che la derivata f sia continua e si estenda ad una funzione continua
definita su tutto [a, b]. Allora esiste una costante K 0 tale che per ogni c < d [a, b], si ha che
|f (d) f (c)| K|d c|.
Dim. Riscriviamo la formula del valor medio nella forma f (d)f (c) = f (x)(dc), da cui |f (d)f (c)| =
|f (x)||d c|. La funzione x |f (x)| `e continua su [a, b], dunque prende un valore massimo K 0,
tale che per ogni x (a, b) |f (x)| K. Ne segue che la tesi vale su (a, b) e poi si estende per continuit`
a
su tutto [a, b].
2
Teorema 0.5. Se per ogni x (a, b), f (x) > 0 (risp. f (x) < 0) allora f `e crescente (risp.
decrescente) su (a, b).
Dim. Considerando se necessario f , non `e restrittivo considerare solo il caso in cui f `e positiva.
Siano c < d in (a, b). Allora per il Teorema del valor medio, esiste x (c, d) tale che
f (d) f (c)
= f (x) > 0
dc
da cui si deduce subito che f (d) > f (c).
Corollario 0.5. Sia f una funzione derivabile definita su un intervallo I aperto (non necessariamente
limitato). Allora se f (x) > 0 per ogni x I, f `e crescente su I.
0.1. Convessit`
a. Sia f : I R una funzione definita su di un intervallo aperto. Siano x0 , x1 I, e
consideriamo i punti corrispondenti del grafico G(f ) di f , cio`e P0 = (x0 , f (x0 )), P1 = (x1 , f (x1 )). Il
segmento di R2 di estremi P0 e P1 pu`
o essere descritto come limmagine dellapplicazione
s : [0, 1] R2 , s(t) = (1 t)P0 + tP1
mentre t (1 t)x0 + tx1 descrive al variare di t [0, 1] lintervallo [x0 , x1 ]. Allora f si dice
strettamente convessa su I, se per ogni x0 , x1 I, per ogni t [0, 1], si ha che
f ((1 t)x0 + tx1 ) < (1 t)f (x0 ) + tf (x1 )
cio`e, geometricamente, il segmento [P0 , P1 ] sta strettamente sopra il grafico di f ristretta allintervallo
[x0 , x1 ]. Invertendo la disuguaglianza (cos` che [P0 , P1 ] sta al di sotto del grafico) si ottiene la
definizione di funzione strettamente concava su I. Rilassando le disuguaglianze (considerando cio`e
o ) abbiamo la nozione di funzione convessa o concava. Abbiamo allora i seguenti risultati
che enunciamo senza dimostrazione (che per altro non sarebbe troppo difficile).

SULLE FUNZIONI DERIVABILI DEFINITE SU UN INTERVALLO

Proposizione 0.6. Sia f : I R definita sullintervallo aperto I.


(1) Se f `e derivabile su I allora f `e strettamente convessa (risp. strettamente concava) su I se e solo
se f `e crescente (risp. decrescente) su I.
(2) Se f `e derivabile due volte, allora f `e strettamente convessa (risp. strettamente concava) se e solo
se per ogni x I, f (x) < 0 (risp. f (x) > 0).
Abbiamo visto prima che se f : I R `e derivabile, allora i punti di massimo e minimo locale sono
stazionari, ma che in generale il viceversa non vale. Abbiamo per`o il seguente fatto
Proposizione 0.7. Sia f : I R come sopra, derivabile due volte. Supponiamo che x0 I sia un
punto stazionario per f (cio`e f (x0 ) = 0) e che f (x0 ) > 0 (risp. f (x0 ) < 0). Allora x0 `e un punto
di minimo (risp. massimo) locale.
Se f : I R `e derivabile, x0 I si dice un punto di flesso ascendente (risp. discendente) per f se
esiste un sottointervallo aperto (x0 , x0 + ) I, > 0, tale che f `e concava (risp. convessa) su
(x0 , x0 ) e convessa (risp. concava) su (x0 , x0 + ).
Proposizione 0.8. Sia x0 I un punto di flesso di f : I R di tipo discendente (ascendente).
(1) Se f `e derivabile allora x0 `e un punto di massimo (minimo) locale di f .
(2) Se f `e derivabile due volte, allora f (x0 ) = 0.

27 Novembre 2014
pital
1. Teoremi dellHo
In questo paragrafo enunceremo dei risultati che in certi casi permettono di trattare le forme di
0
0
indeterminazione o
. Cominciamo con lindeterminazione .
0
0
Prendiamo in considerazione due situazioni:
Sono date due funzioni f e g definite su un intorno (a , a + ) di un punto a R;
f (a) = 0 = g(a), f e g sono derivabili in a, g (a) = 0.
f e g sono definite su [a, a + ), sono continue, f (a) = 0 = g(a), f e g sono derivabili su
(a, a + ) e per ogni x (a, a + ), g (x) = 0.

Nel primo caso siamo interessati a

f (x)
xa g(x)
lim

nel secondo a
lim

xa+

f (x)
.
g(x)

Allora vale il seguente


0
Teorema 1.1. (Regole dellH
opital per )
0
Prima regola. Nella prima situazione
f (a)
f (x)
=
.
xa g(x)
g (a)
Seconda regola. Nella seconda situazione, se
lim

lim+

f (x)
=lR
g (x)

lim

f (x)
=lR
g(x)

xa

allora
xa+

C`e una versione simmetrica della seconda regola, dove f `e definita su (a , a] e x a+ `e sostituito
con x a .
Posponiamo la dimostrazione. Per il momento ci limitiamo a dire che il risultato nella prima situazione
`e facile e segue quasi direttamente dalla definizione di derivata xmentre il secondo `e pi`
u complicato e
si basa su una applicazione astuta del teorema di Cauchy.
La seconda regola ha la seguente importante applicazione.
Corollario 1.1. Supponiamo che f sia definita su I = (a , a + ), sia continua, sia derivabile in
I \ {a} e che lim f (x) = l R. Allora f `e derivabile in a e f (a) = l.
xa

Dim. Si applica due volte la seconda regola a


Passiamo ora lindeterminazione

f (x) f (a)
.
xa

. Prendiamo in considerazione la seguente situazione:

f e g sono definite su (a, a + ), sono derivabili, per ogni x (a, a + ), g (x) = 0 ed inoltre
lim f (x) = ,

lim g(x) = .

xa+

Siamo interessati al limite lim

xa+

xa+

f (x)
. Allora vale
g(x)

) Nella situazione precedente, se

f (x)
=lR
lim+
xa g (x)

Teorema 1.2. (Regole dellH


opital per

allora
f (x)
=lR.
xa g(x)
Esiste una versione della regola quando dove f `e definita su (a , a) e x a+ `e sostituito con
x a .
lim+

Anche in questo caso omettiamo la dimostrazione. Ci sono naturali varianti di queste regole. Per
esempio abbiamo:
Proposizione 1.2. Siano f, g funzioni definite su I = (b, +), derivabili e tali che per ogni x I,
f (x)
= l R allora
g (x) = 0. Supponiamo inoltre che lim f (x) = 0 e lim g(x) = 0. Se lim
x+
x+
x+ g (x)
f (x)
lim
= l.
x+ g(x)
Dim. Ci possiamo ricondurre alla seconda regola per
1/x.

0
per mezzo del cambiamento di variabile y =
0

Benche siano state omesse le dimostrazioni,`e importante che lo studente assimili bene gli enunciati,
per poterli applicare correttamente. In alcune situazioni si pu`o applicare ripetutamente le regole, nel
caso in cui le funzioni siano derivabili pi`
u volte e i rapporti tra le derivate continuino a presentare
una forma di indeterminazione. In certi casi questo processo porta a semplificazioni che permettono
alla fine di calcolare il limite in questione. In altri casi il processo pu`o progressivamente complicare
la situazione e quindi essere del tutto inutile. Con gli opportuni accorgimenti si possono applicare le
regole ad altre forme di indeterminazione (+ , 0 , 1 , 0 . . . ).
2. Dimostrazioni, esempi e alcune considerazioni.
Iniziamo con le prove delle due regole come enunciate nel Teorema 1.1.
Prima regola. Come detto, in questo caso la prova `e semplice e deriva direttamente dalla definizione
di derivata.
Osserviamo che lipotesi g (a) = 0 implica che in un opportuno intorno di a si ha g(x) = g(a) (la
funzione g in a `e crescente o decrescente). Quindi abbiamo
f (x) f (a)
f (x)
=
=
g(x)
g(x) g(a)

f (x)f (a)
xa
g(x)g(a)
xa

Passando al limite abbiamo la tesi.


Seconda regola. Supponiamo l finito. Vogliamo provare che le ipotesi
implicano
che se `e un
!
!
! f (x)
!
!
!
arbitrario reale positivo, allora esiste tale che se x (a, a + ) allora !
l! < .
g(x)
Ma
!
! !
!
! f (x)
! ! f ()
!
!
!
!
!
! g(x) l! = ! g () l!
dove `e un punto interno allintervallo (a, x) perche, dal teorema di Cauchy, per ogni x in (a, a + )
f (x) 1 f (x) f (a)
f ()
si ha che
=
=
dove `e un punto interno allintervallo (a, x).
g(x)
g(x) g(a)
g ()
Quindi, essendo
! del rapporto delle derivate, si ha che per tale esiste un tale che per
! l il limite
!
! f (x)
f (x)
l!! < . Pertanto, poiche a < < x < a + si ha che anche lim+
=l
x (a, a + ) !!
g (x)
xa g(x)
1si ricordi chef (a) = g(a) = 0

Altri casi. Come gi`


a detto nel precedente paragrafo, la prova degli altri casi o si riconduce direttamente o si ottiene in maniera sostanzialmente analoga alla dimostrazione fatta.
Ad esempio consideriamo il caso in cui, sempre sotto le stesse ipotesi, per x a+ la forma indeter
f (x)
minata sia del tipo
e si abbia che lim+
= l con l finito.

xa g (x)
ad
!Fissiamo
! arbitrio un > 0 e sia 1 < un numero > 0 tale che per a < x < a + 1 si abbia
!
! f (x)

!
!
! g (x) l! < 2 e g (x) = 0.
Sempre per il teorema di Cauchy, per un qualsiasi x (a, a + 1 ) esiste un (x, a + 1 ) tale che
f (x) f (a + 1 )
f ()
= . Essendo a < < a + 1 si avr`a
g(x) g(a + 1 )
g ()
l
da cui

f (x) f (a + 1 )

<
<l+
2
g(x) g(a + 1 )
2

f (x) 1
f (x) f (a + 1 )
=

g(x) g(a + 1 )
g(x) 1

f (a+1 )
f (x)
g(a+1 )
g(x)

f (x)
(x)
g(x)

ove la funzione tende a 1 per x a+ .


Pertanto in un intorno destro di a dove la `e positiva si avr`a
l 2
l + 2
f (x)
<
<
.
(x)
g(x)
(x)
` quindi possibile trovare un < 1 tale che per x (a, a + ) si abbia
E
l + 2
l 2
(x) > 0,
<l+ e
> l .
(x)
(x)
f (x)
f (x)
< l + e quindi possiamo concludere che lim
= l.
+
g(x)
xa g(x)
Lasciamo al lettore il caso che la forma indeterminata sia per x .
Osservazioni. Val la pena di considerare i seguenti esempi.
1
Applicare direttamente la regola dellHopital alle funzioni f (x) = ex e g(x) = per calcolare
x
f
ex
il lim
= 1 non migliora la situazione ma la peggiora. La cosa cambia se si pone il limite
x g
x
x
nella forma equivalente lim x
x e
La regola dellHospital nella sua seconda forma deduce lesistenza del limite del rapporto di
due funzioni dallesistenza del limite del rapporto delle derivate. Limplicazione inversa non
sussiste. Per convincersene basta considerare ad esempio come funzione f la funzione definita
in questo modo

x2 sin( 1 ) se x = 0
f (x) =
x
0
se x = 0
Con tale scelta avremo che l <

e come funzione g la la funzione x.

Polinomi di Taylor
27 Novembre 2014

Polinomio di Taylor.

Data una funzione abbastanza regolare in un intorno (unilatero o bilatero) di un


punto x0 , nel senso che in tale intorno ammette tutte le derivate fino allordine n,
vogliamo approssimarla con un polinomio seguendo un po la falsariga di quanto
fatto quando abbiamo costruito il modello dei decimali illimitati per i Reali.
Per semplicit`a di scrittura supponiamo che il punto sia lorigine: si otterr`a il caso
generale traslando il tutto in x0 , rimpiazzando cio`e x con x x0 .
Sia quindi f una funzione definita in un intorno (, ) o [0, ) dellorigine e che
sia derivabile in tale intorno fino allordine n: vogliamo sapere se esiste, e se si,
determinarlo, un polinomio di grado n tale che
f (x) = p + xn (x) con deg p = n e lim (x) = 0
x0

Supponiamo che tale polinomio esista e cerchiamo di determinarne i coecienti.


f (x) p(x)
= 0 e quindi applicando reiteratamente n volte la
Abbiamo che lim
x0
xn
regola dellHospital (si noti che siamo nelle condizioni di poterlo fare) si ottiene che
f (n) (0) p(n) (0)
f (n) (0)
= 0 da cui an =
n!
n!
In conclusione possiamo riassumere tutto ci`o nel seguente teorema, che enunciamo
per un punto generico x0
Teorema 1.1. Sia f una funzione derivabile n 1 volte nellintervallo [x0 , x0 + )
ed avente nel punto x0 derivata n-esima. Allora si ha
f (x) = f (x0 )+

f (x0 )
f (x0 )
f (n) (x0 )
(xx0 )+
(xx0 )2 +. . .+
(xx0 )n +(xx0 )n (x)
1!
2!
n!

con
lim (x) = 0

xx0

Resto.

La dierenza tra la funzione ed il polinomio approssimante, che `e un infinitesimo di


ordine superiore a n, viene comunemente detta resto e si puo esprimere in diversi

modi che possono venire pi`


u comodi nella pratica: quella utilizzata nella formula
precedente `e conosciuta come la forma di Peano. Unaltra espressione comoda `e la
forma di Lagrange, che in un certo senso generalizza il teorema del valor medio.

f (x) = f (x0 ) +
... +

f (x0 )
(x
1!

x0 ) +

f (x0 )
(x
2!
(n+1)

f (n) (x0 )
f
(x x0 )n +
n!

Indichiamo con h(x) la funzione f (x)

n
!
f (j) (x0 )
j=1

j!

x0 )2 + . . .

()(x x0 )n+1
(n + 1)!

(x x0 )j .

Consideriamo ora il punto x0 come una variabile e definiamo (t) in questo modo.
(t) = f (x)

n
!
f (j) (t)

j!

j=1

(x t)j h(x)

x tn+1
x x0 n+1

Chiaramente la (t) `e continua in ogni punto dellintervallo aperto e derivabile in


ogni punto distinto da x0 , Si verifica facilmente che (x) = (x0 ) = 0.
(x) = f (x)

"n

(x0 ) = f (x)

j=1

f (j) (x)
(x
j!

"n

j=1

n+1

(xx)
x)j h(x) (xx
n+1 = f (x) f (x) = 0
0)

f (j) (x0 )
(x
j!

n+1

(xx0 )
x0 )j h(x) (xx
n+1 = h(x) h(x) = 0
0)

Quindi applicando il teorema di Rolle abbiamo che esiste un punto interno allintervallo [x, x0 ] tale che () = 0.
Svolgendo i calcoli otteniamo per (t):
(t) = f
=

(n+1) (t)

n!

(xt)
(x t)n + (n + 1)h(x) (xx
n+1 =
0)

$
(n + 1)(x t)n # f (n+1) (t)(x x0 )n+1
h(x)
n+1
(x x0 )
(n + 1)!

e da () = 0 otteniamo che deve essere necessariamente


h(x) =

f (n+1) ()(x x0 )n+1


.
(n + 1)!

December 3, 2014
ESEMPI DI APPROSSIMAZIONI TRAMITE POLINOMI DI TAYLOR

In questa scheda elenchiamo gli sviluppi di Taylor nellorigine, di ordine arbitrariamente grande, di
alcune funzioni elementari. Il simbolo (x) indicher`
a una qualche funzione avente la propriet`
a che
lim (x) = 0; n N.

x0

xn
x
+ +
+ xn (x).
2!
n!
x2n+1
x3
+ + (1)n
+ x2n+1 (x).
sin(x) = x
3!
(2n + 1)!

ex = 1 + x +

cos(x) = 1

x2
x2n
+ + (1)n
+ x2n (x).
2!
(2n)!

( 1) . . . ( n + 1) n
x + xn (x).
n!
x2n+1
x3
+ + (1)n
+ +x2n+1 (x).
arctan(x) = x
3
2n + 1
1
= 1 x + x4 + + (1)n x2n + x2n (x).
1 + x2
xn+1
x2
+ + (1)n
+ xn+1 (x).
log(1 + x) = x
2
n+1
1
= 1 x + x2 + + (1)n xn + xn (x).
1+x
x3
1 3 (2n 1) x2n+1
arcsin(x) = x +
+ +
+ x2n+1 (x).
6
2n n!
2n + 1
x2
1
1 3 (2n 1) 2n

=1+
+ +
x + x2n (x).
2
2n n!
1 x2

(1 + x) = 1 + x + +

Asintoti

Il grafico di una funzione `e un riassunto visivo di informazioni sul comportamento


della funzione stessa, nel senso che vi annotiamo informazioni con un codice che ci
risulti rapidamente comprensibile; ad esempio, quando allavvicinarsi ad un punto
x0 il limite della funzione tende ad infinito, noi raffiguriamo questo comportamento
disegnando quello che si chiama un asintoto verticale, cio`e una retta verticale (x =
x0 ) la cui distanza dal grafico della funzione tende a zero al tendere di x ad x0 .
Analogamente se la funzione, al tendere di x ad , tende ad un limite finito k,
graficamente rappresentiamo la situazione con una retta orizzontale y = k la cui
distanza del grafico tende a zero al tendere di x ad : un asintoto orizzontale.

Tutto ci`o porta a immaginare queste rette come tangenti allinfinito.

Un po di criticismo. Tuttavia questa interpretazione, se pur suggestiva e magari


rafforzata da alcuni casi particolari, 1 merita qualche riflessione in pi`
u, dove lidea che
la funzione, o meglio il suo grafico, tenda a sdraiarsi in qualche senso sullasintoto,
anche in casi in cui le apparenze potrebbero suggerirlo, non corrisponde a realt`a.
E pi`
u facile convincerci di ci`o nel caso di asintoti orizzontali dove nulla vieta
al grafico di oscillare come vuole intorno allasintoto, cosa non possibile per la
definizione stessa di funzion nel caso di un asintoto verticale. Come vedremo pero
il fenomeno che andiamo a descrivere non `e legato alla presenza di oscillazioni.
2
Prendiamo ad esempio la funzione sinxx . Ci si convince facilmente che il grafico
di questa funzione oscilla come il seno tra i grafici delle due funzioni x1 e x1 che
sin x2
= 0 e che
rimodulano lampiezza delle oscillazioni. Si verifica inoltre che lim
x
x
quindi lasse delle x `e un asintoto orizzontale.

Lequazione della retta tangente al grafico della funzione f (x) in un punto (x0 , f (x0 ))
`e y f (x0 ) = f (x0 )(x x0 ); nel caso specifico il coefficiente angolare `e quindi
sin x2
sin x2
2 cos x2
.
Poich
e
per
x
tendente
ad
infinito
tende a 0, il limite di
x2
x2
2
sin x
f (x) = 2 cos x2
non esiste, come suggerisce anche il comportamento del
x2
grafico dove la retta tangente assume svariate posizioni senza tendere a stabilizzarsi,
ripetendosi periodicamente.
Pertanto, pur tendendo la funzione con i valori a 0, non vi tende con le derivate e
quindi lasse delle x non `e il limite delle rette tangenti.
Come si diceva il fenomeno non `e legato alla presenza di fenomeni oscillatori: ad
esempio anche nel caso di un asintoto verticale nulla vieta di immaginare una successione di punti xn tendente ad x0 , punto ove il limite della funzione va ad ,
Come ad esempio y = x1 dove gli asintoti sono effettivamente quelle rette che vengono interpretate come rette tangenti allinfinito.
1

che siano tutti punti di flesso orizzontale per f e con ordinate f (xn ) che vanno ad
infinito. Lasintoto ancora non `e il limite delle tangenti.
Talvolta `e utile conoscere in modo qualitativo il comportamento di una funzione per
valori molto grandi della variabile. Abbiamo sintetizzato due di queste situazioni
dicendo che la funzione, o meglio il suo grafico, ammette un asintoto (orizzontale o
verticale).
Pu`o darsi che una funzione al tendere di x allinfinito tenda ad infinito secondo una
precisa direzione. Esprimeremo ci`o con il concetto di asintoto obliquo che potremmo
definire come una retta la cui distanza dal grafico tende a zero al tendere della
variable x a infinito.
Se lequazione di una tale retta `e y = mx + n come possiamo calcolare m, n ?
La differenza f (x) (mx + n) delle due ordinate differisce per un fattore tipo cos
n
f (x)
m }
dalla distanza per cui si deve avere 0 = lim {f (x)(mx+n)} = lim x{
x
x
x
x
f (x)
f (x)
m} = 0 da cui lim
= m.
e quindi deve essere lim {
x x
x
x
Di conseguenza si deve avere n = lim {f (x) mx}. E ovviamente se i limiti m =
x

f (x)
lim
e n = lim {f (x) mx} allora la retta y = mx + n `e un asintoto obliquo.
x x
x
Anche qui `e bene tener presente quanto detto nellosservazione critica precedente,
e cio`e che ancora limmagine dellasintoto obliquo come tangente allinfinito non
significa che tale retta possa esser vista come posizione limite delle tangenti. Poiche
f (x)
con ogni probabilit`a si presenter`a come forma indeterminata, si avr`a, per
lim
x x
f (x)
= f (x): ma come abbiamo visto nella dispensa sul
l Hospital, m = lim
x x
teorema dellHospital, lesistenza del limite di f (x) `e condizione solo sufficiente e
f (x)
il limite
pu`o esistere anche se il limite di f (x) non esiste, come tra laltro
x
abbiamo visto anche nel caso dellasintoto orizzontale.

Si pu`o costriure immediatamente un esempio a partire da una situazione verificantesi


con un asintoto orizzontale perche `e immediato verificare che se f `e una funzione
tale che lim f (x) = k allora la funzione g(x) = f (x) k + mx + n ammette la retta
x
 f (x) k
g(x)
n
y = mx+n come asintoto oblquo. Infatti lim
=m
= lim
+m+
x x
x
x
x
ed analogamente lim {g(x) mx} = lim {f (x) k + n} = n.
x

Appendice1.Un esempio, che forse risulta pi`


u immediato, di una successione di funzioni n che tende ad una funzione senza per`o che ci`o avvenga per la successione
n delle derivate si pu`o visualizzare in questo modo.
Punto di partenza unafunzione il cui grafico 1 sia una semicirconferenza di centro
lorigine, del tipo y = 1 x2 . Si pensi poi alla funzione 2 il cui grafico `e formato
da due semicirconferenze entrambe di raggio 12 e di centro rispettivamente ( 21 , 0) e
( 21 , 0). Esplicitamente:
2

q
1 (x + 1 )2
4
2
2 (x) = q
1 (x 1 )2
4
2

se x [1, 0]
se x [0, 1]

Possiamo iterare il procedimento e considerare la curva n formata da 2n semicir1


e di centri in ( n1 , 0) e ( n1 , 0). Questa curva `e grafico
conferenze tangenti di raggio 2n
di una funzione definita a tratti sullintervallo [1, 1] in modo del tutto analogo
a 2 . Ci si convince facilmente che i valori delle funzioni n convergono alla curva
limite rappresentata dal segmento 1, 1 ma ci`o non pu`o avvenire per la successione
delle derivate avendo tutte le curve, a differenza del segmento, nel punto (1, 0)
tangente verticale.
Non `e difficile provare che un eventuale convincimento (errato) del fatto che la successione converga al segmento con tutte le derivate porterebbe a provare la razionalit`a di in quanto, indicata con l(n ) la lunghezza della curva n , si avrebbe
lim l(n ) = l([1, 1]) = 2 ed `e immediato che tutte le curve hanno la stessa lunghezza
. Il concetto di lunghezza coinvolge (vedi la nota[ARCHI] Archi di curve ) la
derivata e se la successione non converge con le derivate `e un po azzardato, anzi
non `e corretto, dire che la lunghezza delle curve converge alla lunghezza della curva
limite.
Appendice 2. Un asintoto obliquo `e una curva tale che la sua distanza dal grafico
della funzione tende a 0 al tendere di x ad infinito.
Possiamo estendere tale definizione chiamando curva asintotica una qualsiasi funzione g(x) tale che lim (f (x) g(x)) = 0. Ad esempio se consideriamo la funzione
x
log x
f (x) = p(x)+
la funzione y = p(x) `e una curva asintotica per f (x) per x .
x
in cui il grado di p sia maggiore
Analogamente se abbiamo una funzione razionale p(x)
q(x)
b(x)
di quello di q abbiamo, operando la divisione tra polinomi, che p(x) = a(x) +
q(x)
ed essendo deg b < deg q si ha che lim (p(x) a(x)) = 0 e quindi che il polinomio
x

a(x) `e una curva asintotica per p(x).

December 2, 2014
INTEGRAZIONE

1. Introduzione
Affronteremo due problemi detti entrambi di integrazione, apparentemente di natura diversa e che
invece risulteranno essere intimamente legati tra loro.
1.1. Integrazione come problema inverso della derivazione. Sia F : I R una funzione
derivabile sullintervallo aperto I. Dunque, ponendo f = F , diciamo che F `e una primitiva di f .
Supponiamo ora di avere assegnato una (qualsiasi) f : I R. Poniamo
Z
f (x)dx := {F : I R; F derivabile, F = f }
cio`e linsieme di tutte le primitive di F . A volte questo insieme `e chiamato lintegrale indefinito di
f . Si noti che la notazione (un po strana) che abbiamo scelto per denotarlo avr`
a una certa utilit`a
pratica in seguito, ma non sottintende alcun significato particolare. Potevamo avere utilizzato al suo
posto, per esempio, I(f ) e tutto il discorso sarebbe filato ugualmente. Inoltre anche la variabile x non
ha
Z in questa notazione alcun significato particolare, se ci conviene, potremo scrivere equivalentemente
f (t)dt. Dunque il problema `e di capire come `e fatto questo insieme al variare di f .
Z
Z
Osserviamo subito che se
f (x)dx non `e vuoto e F
f (x)dx `e una particolare primitiva di f ,

allora

f (x)dx = {G = F + c; c R} := F + R
Z

infatti da una parte `e chiaro che G = (F + c) = f . Dallaltra, se G f (x)dx `e unaltra primitiva di

f , allora (G F ) = 0, Zquindi G F `e una funzione costante sullintervallo I (vedi [D-INTERVALLI]).

Osserviamo anche che

f (x)dx pu`
o essere vuoto. Per esempio sia f : R R definita da f (x) = 0 se

x < 0, f (x) = 1 se x 0. Se fosse F = f su tutto R, questo fatto dovrebbe valere rispettivamente per
le due restrizioni alle due semirette (, 0), (0, ). Ma per quanto detto prima F = c `e una costante
sulla prima semiretta, F = x + c sulla seconda. Affinche F sia definita su tutto R e derivabile,
`e necessario che F sia continua, questo impone che c = c e F (0) = c. E facile allora verificare
che una tale F non `e derivabile in 0. Osserviamo Zche f in questo esempio non `e continua in 0.
Daltra parte ci sono funzioni non continue per cui
f (x)dx non `e vuoto. Ad esempio la funzione

F : R R, F (0) = 0, F (x) = x2 sin(1/x) se x 6= 0, `e derivabile su tutto R ma f = F non `e


continua in 0 (verificare queste affermazioni per esercizio). Dunque la continuit`
a di f non `e necessaria
affinche esista una primitiva, ma possiamo sperare che assumendo che f sia continua si eliminino delle
patologie che impediscono lesistenza di una primitiva. Abbiamo cos` individuato un sotto-problema
importante:
Z
Supponiamo che f : I R sia continua. E vero allora che
f (x)dx 6= ? Se f `e definita per

mezzo di qualche formula esplicita (per esempio f `e elementare derivabile) `e possibile determinare
una formula esplicita per una primitiva F di f ?

Discuteremo e sostanzialmente risolveremo questi problemi di integrazione indefinita delle funzioni


continue.

INTEGRAZIONE

1.2. Integrazione come problema della misurazione di sopra/sotto grafici di funzioni.


Premettiamo brevemente una discussione sulla misura degli intervalli e dei rettangoli orientati. Di
solito quando abbiamo scritto [a, b], abbiamo sottinteso che a < b. Se eliminiamo questa ipotesi (cio`e
permettiamo che a > b), la notazione [a, b] continua ad avere senso se la interpretiamo, in ogni caso,
come lintervallo dei punti compresi tra a e b orientato secondo la freccia che parte da a e arriva
in b. Avendo fissato come unit`
a di misura degli intervalli orientati lintervallo unitario [0, 1] (per cui
m([0, 1]) = 1), allora la misura m([a, b]) = b a, da cui m([a, b]) = m([b, a]) ed `e positiva se e solo
se b > a. Se a = b `e naturale porre m([a, a]) = 0. Cerchiamo ora di estendere questa discussione ai
rettangoli di R2 . Consideriamo cio`e rettangoli della forma R = [a, b][0, c] R2 . Fissata lorientazione
che va da a a b lungo il lato [a, b] contenuto nellasse delle ascisse, questa si propaga su tutti i lati
di R, per cui per esempio il lato verticale di vertice (b, 0) eredita lorientazione che va da (b, 0) a
(b, c), etc. Si vede allora che ci sono due possibilit`a: il perimetro di R `e percorso in senso antiorario,
oppure in senso orario. Se condideriamo R = [b, a] [0, c] (in quanto insiemi R e R coincidono,
ma abbiamo invertito lorientazione del lato sullasse delle ascisse) allora il verso di percorrenza del
perimetro si inverte. Abbiamo in questo modo introdotto una nozione di orientazione dei rettangoli,
cos` che ogni rettangolo ammette esattamente due orientazioni diverse. Fissiamo ora il quadrato
unitario Q = [0, 1] [0, 1] come unit`
a di misura dei rettangoli orientati, cos` che m(Q) = 1. Allora se
R = [a, b] [0, c] come prima
m(R) = (b a)c
da cui si deriva che
m(R ) = m(R) = m(R)
dove R = [a, b] [0, c]. La misura m(R) > 0, se e solo se b a 6= 0, c 6= 0 e il perimetro di R
`e percorso in senso antiorario. Se b = a o c = 0 `e naturale porre m(R) = 0. Si noti che questa
discussione sullorientazione `e compatibile e in effetti giustifica la familiare regola dei segni per il
prodotto: + + = +, + = + = , = +.
Sia data ora una funzione f : [a, b] R, su cui per il momento facciamo soltanto lipotesi che sia
limitata. Come prima non assumiamo che a < b. Associamo ad f la porzione di R2 compresa tra il
grafico di f e il segmento [a, b] contenuto nellasse delle ascisse; precisamente: scomponiamo [a, b] =
D+ D nei due pezzi disgiunti D+ = {f (x) 0}, D = {f (x) < 0}; chiaramente D+ D = .
Poniamo infine
T (f ) = {(x, y); x D+ , 0 y f (x)} {(x, y); x D , 0 y f (x)} .
Se per esempio f 0, cio`e [a, b] = D+ , allora T (f ) `e un trapezioide avente il lato orizzontale [a, b]
sullasse delle ascisse, i due lati verticali paralleli [(a, 0), (a, f (a))], [(b, 0), (b, f (b))] e un quarto lato
opposto a [a, b] formato dal grafico di f .
Fissiamo come sopra il quadrato unitario Q come unit`
a di misura delle porzioni di piano (orientate).
Possiamo allora formulare informalmente il nuovo problema di integrazione come segue:
Definire una procedura di misurazione tale che per una classe abbastanza ampia di funzioni limitate
f : [a, b] R, che includa almeno le funzioni continue, permetta di definire propriamente la misura
m(T (f )), cio`e il numero reale che esprime il rapporto tra la grandezza della porzione di piano T (f ) e
quella di Q.
Quando T (f ) sar`a misurabile, useremo un altra notazione
Z b
m(T (f )) :=
f (x)dx
a

e questo numero sar`a anche detto lintegrale definito della funzione f : [a, b] R. Come nel caso dei
rettangoli lintegrale definito dovr`
a essere sensibile al cambio di orientazione di [a, b], per cui
Z b
Z a
f (x)dx =
f (x)dx
a

ed inoltre

f (x)dx = 0 .

INTEGRAZIONE

Discuteremo una specifica procedura di misurazione, detta integrazione secondo Riemann che fornir`
a
una risposta al problema. Esistono procedure pi`
u raffinate che permettono di misurare T (f ) anche in
casi in cui lintegrale secondo Riemann non `e definito. Ma lintegrazione secondo Riemann `e sufficiente
per molte applicazioni.
1.3. Funzioni integrali. Come detto allinizio e come suggerito anche dalle notazioni adottate, c `e
un legame profondo tra questi due problemi di integrazione apparentemente di natura diversa. Un
ponte tra i due problemi si costruisce per mezzo della nozione di funzione integrale. Sia f : I R
una funzione definita sullintervallo aperto I che abbia la seguenti propriet`
a:
La restrizione di f ad ogni sotto-intervallo chiuso e limitato [a, b] I `e limitata ed esiste lintegrale
Z b
definito
f (x)dx.
a

Vedremo che questa propriet`


a `e verificata se per esempio f `e continua. Fissiamo ao I e per ogni
x I definiamo
Z x
f (t)dt .
F (x) =
a0

In questo modo abbiamo definito una nuova funzione F : I R detta funzione integrale di f di punto
base a0 . Usando le propriet`
a dellintegrazione secondo Riemann, dimostreremo il seguente Teorema
fondamentale del calcolo integrale:
Teorema 1.1. (1) Sia f : I R definita su lintervallo aperto I, tale che f ammette una primitiva F
ed esiste lintegrale definito della restrizione di f ad un intervallo chiuso e limitato [a, b] I. Allora
Z b
f (x)dx = F (b) F (a) .
a

(2) Se f `e continua ed F `e una funzione integrale di f (di punto base scelto arbitrariamente su I),
allora F `e una primitiva di f .
Nei capitoli seguenti, discuteremo prima separatamente i due problemi di integrazione ed infine il
teorema fondamentale.
` dellintegrale indefinito
2. Proprieta
Conosciamo molte funzioni che ammettono primitive, per esempio tutte le derivate delle funzioni
elementari derivabili. Per esempio la scheda alla fine di [DERIVATE] pu`o anche essere letta come
una lista di primitive di certe funzioni elementari date. E utile mettere in evidenza alcune propriet`
a
dellintegrale indefinito che in certi casi permettono di calcolare nuove primitive a partire da primitive
gi`a note. Queste sono in effetti riletture di propriet`
a della derivata che gi`a conosciamo.
Linearit`
a. Siano f, g : I R e F , G rispettive primitive. Allora F + G `e una primitiva di f + g. Se
c R, allora cF `e una primitiva di cf .
Integrazione per parti. Siano f , g, F , G come sopra. Ricordiamo la regola di derivazione di un
prodotto:
(F G) = f G + F g
da cui

f Gdx +
Z

F gdx = F G + R

f Gdx = F G

F gdx .

In questo modo F G realizza una parte dellintegrazione di f G e resta da integrare F g, che in certi
casi `e piu facile da trattare. Per esempio sia Gf = x cos(x). Per cui F = sin(x). Dunque
Z
Z
x cos(x)dx = x sin(x) sin(x) = (x sin(x) + cos(x)) + R .

INTEGRAZIONE

Integrazione per sostituzione diretta. Sia F una primitiva di f . Consideriamo una funzione
composta di funzioni derivabili, G(x) = F ((x)). La regola di derivazione in questo caso `e
G (x) = f ((x)) (x) .
Dunque
Z

f ((x)) (x)dx = F ((x)) + R

che si pu`
o anche riscrivere formalmente:
Z
Z
f ((x)) (x)dx = f (t)dt, t = (x) .
Ad esempio ponendo F (t) = 1/t, t = (x) = 1 + x2
Z
Z
Z
1
1
1
1
x
dx =
dt = log |t| + R .
F ((x))dx =
2
1+x
2
2
t
2
Notare che per la sotituzione diretta non facciamo ipotesi particolari su . In particolare non richiediamo che sia invertibile.
Integrazione per cambiamento di variabile. Supponiamo che x = (t) sia un cambiamento di
variabile, cio`e Zche `e invertibile
con inversa derivabile. Allora le considerazioni precedenti permettono
Z
di ricondurre
f (x)dx a
f ((t)) (t)dt. Infatti se G(t) `e una primitiva che appartiene allultimo
integrale indefinito, allora G(1 (x)) `e una primitiva di f . Ad esempio, ponendo x = sin(t), t
[/2, /2],
Z
Z p
1 x2 dx = cos2 (t)dt, t = arcsin(x) .
cos2 (t) pu`
o essere integrato per parti (esercizio) ottenendo
Z
t + sin(t) cos(t)
cos2 (t)dt =
+R .
2

Osservazioni 2.1. (Sulle notazioni adottate) (1) Le regole di integrazione per sostituzione diretta
o per cambiamento di variabile forniscono una giustificazione formale delle particolari notazioni che
abbiamo adottato per lintegrale indefinito. Ricordiamo che per la derivata si usa spesso unaltra
notazione:
d
=
dx
ponendo come sopra t = (x) formalmente possiamo scrivere
Z
Z
dt
f ((x)) (x)dx = f (t) dx
dx
dunque semplificando i due dx che appaiono al numeratore e al denominatore otteniamo proprio
laltro membro della regola di integrazione:
Z
f (t)dt .
Il problema `e che in tutto questo dx e dt sono puri simboli, non `e stata definita alcuna struttura algebrica consistente per cui quella semplificazione corrisponda ad una operazione effettiva. Dunque
`e bene considerarlo come un puro artificio formale che pu`
o avere una sua utilit`a pratica, tenendo per`o
sempre sotto controllo quello che sta succedendo sostanzialmente e non solo a livello formale.
(2) (Rivolta soprattutto ad un lettore particolarmente interessato.) La notazione deriva storicamente
dallimpostazione del calcolo differenziale che discende da Leibniz (uno dei due fondatori con Newton)
e che ha un approccio molto pi`
u algebrico. Sono state sviluppate diverse teorie (che possiamo
chiamare genericamente di analisi non-standard) che danno un significato sostanziale ai simboli
come dx, dt e per le quali la semplificazione formale diventa una operazione effettiva.

INTEGRAZIONE

3. Lintegrazione secondo Riemann


Il nostro problema `e misurare T (f ), quando f : [a, b] R `e una data funzione. Se per esempio f = c
`e una funzione costante, T (f ) `e un rettangolo R = [a, b] [0, c] e possiamo naturalmente porre
Z b
f (x)dx = m(R) = (b a)c .
a

Complichiamo di poco lesempio. Supponiamo per semplicit`a che a < b. Una partizione P di [a, b] `e
un insieme finito ordinato di punti di [a, b] della forma:
P = {x0 = a < x1 < < xn < xn+1 = b}.
Si chiama partizione perche determina la decomposizione di [a, b] come unione di sotto-intervarli
adiacenti:
I = [a = x0 , x1 ] [x1 , x2 ] . . . [xn , xn+1 = b] .
Date due partizioni P1 e P2 diremo che P2 `e pi`
u fine di P1 se P1 P2 .
Fissata P , una funzione a gradini f : [a, b] R rispetto alla partizione P , `e tale che la sua restrizione
ad ogni [xj , xj+1 ) `e una funzione costante fj = cj , e f (b) = cn . T (f ) `e allora un plurirettangolo.
E naturale porre:
Z b
X
(xj+1 xj )cj .
f (x)dx = m(T (f )) =
a

Si noti che il risultato pu`


o essere anche nullo perche possono esserci cancellazioni tra contributi positivi
e negativi. Lidea intuitiva alla base dellintegrazione secondo Riemann `e che risulteranno integrabili
(cio`e avranno T (f ) misurabile) quelle funzioni che possono essere approssimate bene per mezzo
di funzioni a gradini. Elaboriamo questa idea intuitiva. Sia data allora una funzione f : [a, b] R
limitata, supponiamo qui che a < b e siano rispettivamente m = inf f ([a, b]) e M = sup f ([a, b]).
Fissiamo una partizione P di [a, b] come sopra. La restrizione fj ad ogni intervallo [xj , xj+1 ] `e a sua
volta limitata. Siano mj e Mj i rispettivi inf e sup. Abbiamo allora 2 funzioni a gradini relative a P ,
cio`e le due funzioni
F (f, P ), F (f, P )
che su ogni intervallo [xj , xj+1 ) valgono mj e Mj rispettivamente. Passando agli integrali non `e molto
difficile verificare i seguenti comportamenti di queste due funzioni al variare della partizione P .
Per ogni P ,
Z b
Z b
F (f, P )
F (f, P ) .
a

Se P2 `e pi`
u fine di P1 (cio`e P1 P2 )) allora:
Z b
Z
F (f, P1 )dx
a

F (f, P2 )dx

F (f, P1 )dx
a

F (f, P2 )dx

Se P1 e P2 sono due arbitrarie partizioni, allora esiste P3 che `e pi`


u fine di entrambe (basta
prendere P3 = P1 P2 ).
Se P1 e P2 sono due arbitrarie partizioni, e P3 `e pi`
u fine di entrambe, allora:
Z b
Z b
Z b
Z b

m(b a)
F (f, P1 )dx
F (f, P3 )
F (f, P3 )dx
F (f, P2 ) M (b a) .
a

Ne segue allora che al variare della partizione P di [a, b]


Z b
Z
F (f, P )dx}
f = sup{
a

f = inf{

F (f, P )dx}

INTEGRAZIONE

sono ben definiti numeri reali e


Z

f .

Diciamo infine che f : [a, b] R limitata, a < b, `e integrabile secondo Riemann se tali estremi
coincidono e poniamo
Z
Z b
Z
f
f (x)dx = f =
a

f (x)dx =
b

f (x)dx

f (x)dx = 0 .

Nel seguito diremo semplicemente integrabile, omettendo di dire secondo Riemann. Mettiamo
in evidenza alcune propriet`
a di questa procedura di integrazione, che sono conseguenze abbastanza
semplici della definizione e delle disuguaglianze sopra indicate.
(1) Se f `e a gradini, allora f `e integrabile e ritroviamo lintegrale definito da cui siamo partiti.
(2) f `e integrabile se e solo se per ogni > 0, esiste una partizione P di [a, b] (che dobbiamo
immaginare sufficientemente fine) tale che
Z b
Z b
F (f, P )
F (f, P ) < .
a

(3) Addittivit`
a sugli intervalli. Consideriamo a < c < b, f : [a, b] R integrabile e tale che
anche le due restrizioni di f agli intervalli [a, c] e [c, b] siano integrabili. Allora:
Z b
Z c
Z b
f (x)dx =
f (x)dx +
f (x)dx .
a

(4) Linearit`
a. Se f, g : [a, b] R sono entrambe integrabili, allora anche f + g lo `e e
Z b
Z b
Z b
(f + g)(x)dx =
f (x)dx +
g(x)dx .
a

Per ogni c R,
Z

cf (x)dx = c

f (x)dx .

(5) Se f, g : [a, b] R sono entrambe integrabili e f g, allora


Z b
Z b
f (x)dx
g(x)dx .
a

(6) Se f `e integrabile su [a, b] (a < b) allora


Z b
m(b a)
f (x)dx M (b a)
a

Esistono funzioni che non sono integrabili. Per esempio la funzione f : [0, 1] R, f (x) = 1 se
x [0, 1] Q, f (x) = 0 altrimenti, non `e integrabile perch`e (a causa della densit`
a sia di Q sia del suo
complementare) risulta che
Z
Z
0 = f 6=
f =1.

Dimostriamo adesso che le funzioni continue sono integrabili.


Teorema 3.1. Sia f : [a, b] R, a < b, continua. Allora f `e integrabile.

INTEGRAZIONE

Dim. Sappiamo (vedi [C-INTERVALLI]) che f `e limitata e uniformemente continua. Basta dimostrare
che per ogni > 0, esiste una partizione abbastanza fine P di [a, b] tale che
Z b
Z b
F (f, P )dx
F (f, P )dx < .
a

Per la continuit`
a uniforme esiste > 0 tale che per ogni x, y [a, b] tali che |x y| < si ha che

|f (x) f (y)| <


. Sia allora P una partizione abbastanza fine tale che per ogni j, |xj xj+1 | < .
ba

, quindi
Ne segue che per ogni j, Mj mj <
ba
Z b
Z b
X
X
(Mj mj )(xj+1 xj ) <
(xj+1 xj ) = .
F (f, P )dx
F (f, P )dx =
ba j
a
a
j
2
4. Dimostrazione del teorema fondamentale
Dimostriamo infine il Teorema fondamentale del calcolo integrale enunciato nellIntroduzione.
Dimostriamo lenunciato (1). Sia f : I R, sia F una primitiva di f , sia [a, b] I, a < b, e
Z b
f (x)dx. Fissata una arbitraria partizione
supponiamo che esista lintegrale definito della restrizione
a

P di [a, b], si ha che


F (b) F (a) =

(F (xj+1 ) F (xj ))

perche i termini si cancellano due a due eccetto il primo e lultimo. Poiche f `e la derivata di F , per
il teorema del valor medio (vedi [D-INTERVALLI]), per ogni j esiste yj (xj , xj+1 ) tale che
X
X
f (yj )(xj+1 xj ) .
(F (xj+1 ) F (xj )) =
F (b) F (a) =
j

Poiche mj f (yj ) Mj , ne segue che


Z b
Z
F (f, P )dx (F (b) F (a))

Per larbitrariet`
a di P , deduciamo che
Z

F (f, P )dx .

f (F (b) F (a))

infine, sapendo che f `e integrabile concludiamo che


Z b
f (x)dx = F (b) F (a) .
a

2
Dimostriamo infine il punto (2). Supponiamo che f : I R sia continua, fissiamo arbitrariamente un
punto a0 in I e consideriamo la corrispondente funzione integrale
Z x
f (t)dt .
F (x) =
a0

Questa
funzione `e ben definita perche abbiamo visto prima che essendo f continua lintegrale definito
Z x
f (t)dt esiste per ogni x. Vogliamo dimostrare che F `e una primitiva di f . Premettiamo un lemma.
a0

Lemma 4.1. Sia f : I R continua, a, b I. Allora esiste y compreso tra a e b tale che
Z b
f (x)dx = f (y)(b a) .
a

INTEGRAZIONE

Dim. Supponiamo che a < b. Siano m e M rispettivamente il valore minimo e il valore massimo della
restrizione di f a [a, b]. Allora sappiamo che
Rb
f (x)dx
M
m a
ba
per il Teorema dei valori intermedi (vedi [C-INTERVALLI]) esiste y [a, b] tale che verifica la tesi.
Se a > b allora
Z
Z
a

f (x)dx = f (y)(a b) = f (y)(b a) .

f (x)dx =

Applicando il Lemma si pu`


o anche dimostrare il seguente fatto che a volte `e utile:
Corollario 4.2. Nelle ipotesi del lemma precedente, si ha
Z b
Z b
|
f (x)dx|
|f (x)|dx M |b a| .
a

Torniamo allenunciato (1). Analizziamo il rapporto incrementale


F (x + h) F (x)
.
h
Applicando la propriet`
a di addittivit`a sugli intervalli ricordata sopra,
R x+h
f (t)dt
F (x + h) F (x)
= x
.
h
h
Applicando il lemma, sappiamo che esiste y compreso tra x e x + h tale che
R x+h
f (t)dt
x
= f (y)
h
quando h 0, poiche f `e continua, f (y) f (x) e lo stesso vale per il rapporto incrementale. Abbiamo
quindi dimostrato che
F (x + h) F (x)
lim
= F (x) = f (x) .
h0
h
2
Osservazioni 4.3. (Sulluso pratico del teorema fondamentale) Sia come al solito f : I R
Z b
continua, [a, b] I e vogliamo calcolare lintegrale definito
f (x)dx. Possiamo allora studiare
a
Z
preliminarmente lintegrale indefinito
f (x)dx, determinare una primitiva F di f e poi concludere
Z b
che
f (x)dx = F (b) F (a). La cosa pu`
o essere particolarmente effettiva se per esempio f `e
a

elementare ed ammette una primitiva elementare che pu`


o essere esplicitata. Tutto bene, per`o nella
pratica bisogna agire con una certa cautela. Infatti nel trattare lintegrale indefinito si fanno spesso
delle manipolazioni (per esempio dei cambiamenti di variabile) che non hanno senso su tutto I ma
solo su certi sotto-intervalli. Perche la procedura sopra descritta sia corretta bisogna essere certi che
[a, b] sia contenuto in uno dei sottointervalli su cui abbiamo effettivamente determinato le primitive.
1
definita su I = R. Vogliamo
Il seguente esempio chiarisce questa osservazione. Sia f (x) =
1 + sin2 (x)
calcolare
Z
f (x)dx .
0
Z
Studiamo prima
f (x)dx. Facciamo il cambiamento di variabile t = tan(x). Semplici calcoli

mostrano che

f (x) =

1 + t2
1 + 2t2

INTEGRAZIONE

inoltre

1
dt
1 + t2

= (1/ 2) arctan( 2t) + R


dx =

Z
ed infine

dove

1
1 + 2t2
Z

1
dx = F (x) + R
1 + sin2 (x)

F (x) = (1/ 2) arctan( 2 tan(x)) .

Allora potremmo essere tentati di concludere che


Z
1
dx = F () F (0) = 0 .
2
0 1 + sin (x)
Ma questa conclusione `e certamente sbagliata perche f > 0 e cos` deve essere quel suo integrale
definito. Il punto `e che il cambiamento di variabile t = tan(x) ha senso solo sugli intervalli del
tipo (/2 + k, /2 + k) dove k Z. Nessuno di questi contiene [0, ]. In questo caso possiamo
aggiustare la cosa nel modo seguente. Consideriamo (/2, /2)(/2, (3/2)). Sul primo la generica

primitiva `e della forma F (x) + c, sul secondo della forma F (x) + c


, dove le due costanti c e c

sono tra loro indipendenti. Scegliendo (per esempio)


c = 0, c = 2, si verifica che la funzione

G(x) = F (x) su (/2, /2], G(x) = F (x) + 2 su [/2, (3/2)) `e continua e derivabile su tutto
lintervallo (/2, (3/2)) (che contiene [0, ]) e che G = f . Applicando adesso correttamente il
teorema fondamentale, si conclude che
Z

1
dx = G() G(0) = 2 .
2
0 1 + sin (x)
5. Complementi
(1)Approssimanti a gradini di funzioni continue. Se f : [a, b] R (a < b) `e continua, esistono
Z b
procedure pi`
u semplici di quelle suggerite dalla definizione, per approssimare
f (x)dx con lintegrale
a

definito di opportune funzioni a gradini. Possiamo procedere per esempio nel modo seguente: per ogni
n > 0 sia n = (b a)/n e fissiamo la partizione P (n) di [a, b] tale che per ogni j, |xj xj+1 | = n . Sia
G(f, n) : [a, b] R la funzione a gradini relativa a P (n) tale che, per ogni j, la restrizione allintervallo
[xj , xj+1 ) `e la costante cj = f (xj ). Chiaramente n 0 quando n +. Si pu`
o allora dimostrare
che
Z
Z
b

n+

f (x)dx .

G(f, n)(x)dx =

lim

(2)Sulle funzioni integrali. Come `e chiaro dalla definizione data nellIntroduzione, `e sufficiente ma
non necessario che f : I R sia continua affich`e esistano funzioni integrali di f . Per esempio se f
ha solo un numero finito di punti di discontinuit`
a, allora esistono le funzioni integrali di f (rispetto a
un punto base scelto arbitrariamente su I). Lo stesso fatto vale (anche se `e un po pi`
u complicato da
dimostrare) se f `e monotona (crescente o decrescente). Mentre la derivazione in generale fa perdere di
regolarit`
a (per esempio ci sono funzioni derivabili, quindi continue, la cui derivata non `e continua; in
generale la derivata di una funzione C k `e solo C k1 ), le funzioni integrali (quando esistono) hanno un
effetto regolarizzante. Per esempio se f `e continua (ma non derivabile), una sua funzione integrale
`e derivabile e di classe C 1 . Consideriamo lesempio gi`a usato prima: f : R R, f (x) = 0 se x < 0,
f (x) = 1 se x 0; f non `e continua solo in 0. La funzione F : R R, F (x) = 0 se x < 0, F (x) = x se
x 0 `e la funzione integrale di f di punto base a0 = 0. Come gi`a sappiamo F non `e una primitiva di
f perche non `e derivabile in 0. Per`
o `e continua su tutto R ed `e una primitiva di f ristretta a R \ {0}.
Possiamo dire che F `e derivabile quasi ovunque (intendendo sul complementare di un insieme finito
di punti) e che `e quasi ovunque una primitiva di f . Si osservi che: F `e la funzione integrale di

10

INTEGRAZIONE

punto base a0 = 0 anche della funzione g : R R, g(x) = 0 se x 0, g(x) = 1 se x > 0; g 6= f perch`e


1 = f (0) 6= g(0) = 0, per`
o g e f sono uguali quasi ovunque perch`e g(x) = f (x) se x 6= 0.
(3) Regole di integrazione definita. Il teorema fondamentale del calcolo integrale e luso delle
funzioni integrali, trasforma le propriet`
a dellintegrale indefinito viste prima in regole di integrazione
definita. Ci limitiamo a scrivere le formule:
Integrazione per parti.
Z

f (x)g (x) = f (b)g(b) f (a)g(a)

f (x)g(x)dx .

Integrazione per sostituzione diretta.


b

f ((x)) (x)dx =

(b)

f (t)dt .

(a)

Integrazione per cambiamento di variabile.


Z

f (x)dx =

1 (b)

f ((t)) (t)dt .

1 (a)

(4) Integrali impropri. Supponiamo che f : I R sia continua e definita su un intervallo


Z x I = (c, d)
f (x)dx e
dove c < d, c, d R. Fissato a I possiamo considerare la funzione integrale F (x) =
a

studiare il suo andamento quando x d oppure x c+ . Se uno di questi limiti esiste diciamo che
`e definito il corrispondente integrale improprio e poniamo
Z
Z

a
c

f (x)dx = lim F (x)


xd

f (x)dx = lim+ F (x) .


xc

Se esistono entrambi poniamo anche


Z d
Z
f (x)dx =
c

f (x)dx

f (x)dx .

Per trattare gli integrali impropri non `e necessario che f sia continua. Basta che per ogni a I
sia definita la funzione integrale di f di punto base a. In questo modo vediamo per esempio che lo
studio delle serie numeriche pu`
o essere visto
X come un caso particolare di studio di integrali impropri.
Si consideri infatti una serie numerica
an . Sia I = {x > 1}. Consideriamo la partizione di
n0

I = {x 0} di vertici in N. Consideriamo la funzione a gradini A su I che vale an su ogni intervallo


[n, n + 1) e estendiamola ad I ponendola uguale a a0 anche su (1, 0). Allora la serie `e convergente
se e solo se esiste lintegrale improprio di A per x + e risulta che la somma della serie
Z +
X
an =
A(x)dx .
n

(5) Metodi di integrazione pi`


u raffinati. (Queste considerazioni sono piuttosto rivolte ad un
lettore particolarmente interessato).
Abbiamo accennato nellIntroduzione che esistono metodi di integrazione pi`
u raffinati rispetto a quella
secondo Riemann. Unidea guida (mutuata anche dal semplice esempio visto nel punto (2) sopra)
`e la seguente:

INTEGRAZIONE

11

Quale che sia la procedura di misurazione adottata, se f, g : [a, b] R sono uguali quasi ovunque
allora T (f ) `e misurabile se e solo se T (g) lo `e; se sono misurabili allora m(T (f )) = m(T (g)).
E chiaro che dobbiamo dare un senso a quasi ovunque. Procediamo nel modo seguente. Dato
X [a, b], sia 1X : [a, b] R, 1X (x) = 1 se x X, 1X (x) = 0 se x [a, b] \ X. Questa `e anche
chiamata la funzione indicatrice di X. Supponiamo di avere fissato una procedura di integrazione.
Diciamo allora che X `e trascurabile (rispetto alla procedura) se 1X `e integrabile e il valore dellintegrale
Z b
1X (x)dx = 0. Per esempio, se adottiamo lintegrazione secondo Riemann, `e chiaro che
definito
a

se X `e finito allora `e trascurabile. Diremo infine che due funzioni f e g sono quasi ovunque uguali
(rispetto alla procedura di integrazione data) se esiste un insieme trascurabile X tale che f = g su
[a, b] \ X. Per esempio, se X `e trascurabile 1X `e quasi ovunque uguale alla funzione costante nulla.
Messa cos` la cosa, una caratteristica fondamentale di una procedura di integrazione `e la sua classe di
insiemi trascurabili. Come deve essere fatta la classe degli insiemi trascurabili affinche la procedura
di integrazione sia veramente soddisfacente? Potremmo richiedere per esempio che X `e trascurabile
non solo quando `e finito ma anche quando `e numerabile. Questo non `e il caso per lintegrazione
secondo Riemann: X = [a, b] Q `e numerabile ma abbiamo visto prima che 1X non `e integrabile
secondo Riemann. In effetti esistono procedure di integrazione pi`
u raffinate ( una `e detta integrazione
secondo Lebesgue) per le quali anche gli insiemi numerabili sono trascurabili.

December 10, 2014


PRIMITIVE ELEMENTARI

1. Introduzione
Abbiamo visto in [DERIVATE] che la derivata di una funzione derivabile elementare `e ancora derivabile ed elementare. Supponiamo ora che f : I R sia una funzione derivabile (quindi continua)
elementare definita sullintervallo aperto I. Grazie al Teorema fondamentale del calcolo integrale (vedi
[INTEGRAZIONE]) sappiamo che f ammette funzioni primitive. E naturale allora porsi la domanda
se ammette primitive elementari (poiche due primitive differiscono per una costante se una `e elementare lo sono tutte). Vedremo che per certe classi di funzioni elementari la risposta `e positiva e
possiamo ricavare formule esplicite per le rispettive primitive. In generale per`o la risposta `e negativa.
2. Miscellanea
Cominciamo indicando in modo sparso alcuni esempi di funzioni elementari con primitive elementari,
ricavate usando soprattutto le regole di integrazioni per parti o per sostituzione/cambio di variabile.
(1) Risalendo la gerarchia delle funzioni elementari (vedi [MODELLI]) la prima classe che troviamo `e quella delle funzioni polinomiali. Se
n
X
aj xj
p(x) =
j=0

una primitiva `e
P (x) =

n
X
j=1

1
aj xj+1
j+1

dunque `e un altro polinomio.


(2) Per ogni (k, m) N2 , k 1, poniamo Ik,m (x) =

xm ekx dx. Mostriamo un modo induttivo

1 kx
e + R.
k
(xm+1 ekx ) = (m + 1)xm ekx + kxm+1 ekx

di calcolare questo integrale indefinito. Per m = 0, Ik,0 =

da cui, integrando per parti e usando la linearit`a dellintegrale, ricaviamo:


Ik,m+1 = (1/k)(xm+1 ekx (m + 1)Ik,m ) .
Z Usando la linearit`a dellintegrale, il risultato si estende ad ogni integrale della forma
p(x, ex )dx, dove p(X1 , X2 ) `e un polinomio in due indeterminate.
Z
Z
(3) Poniamo Im (x) = xm sin(x)dx, Jm (x) =
xm cos(x)dx. Anche in questo caso otteniamo

una definizione per induzione, verificando cos` che sono funzioni elementari. Infatti per m = 0
lintegrazione `e immediata in entrambi i casi. Inoltre abbiamo:
(xm+1 sin(x)) = (m + 1)xm sin(x) + xm+1 cos(x)

(xm+1 cos(x)) = (m + 1)xm cos(x) xm+1 sin(x)


da cui, integrando per parti e usando la linearit`a dellintegrale, otteniamo:
Jm+1 = xm+1 sin(x) (m + 1)Im
Im+1 = xm+1 cos(x) + (m + 1)Jm .
Usando la linearit`a dellintegrale, il risultato si estende ad ogni integrale della forma
Z
o p(x) cos(x)dx dove p(x) `e polinomiale.

p(x) sin(x)dx

PRIMITIVE ELEMENTARI

(4) Poniamo f (x) = ex cos(x). Applicando due volte lintegrazione per parti
Z
Z
Z
x
x
x
x
f (x)dx = e cos(x) + e sin(x)dx = e cos(x) + e sin(x) f (x)dx
da cui

1 x
e (cos(x) + sin(x)) .
2
In modo analogo si possono trattare le funzioni della forma
Z

f (x)dx =

f (x) = eax cos(bx), f (x) = eax sin(bx) .


(5) Integrali del tipo
1
dt .
(1 + t2 )s
Usando ripetutamente lintegrazione per parti, si calcolano per induzione come segue:
Is =

I1 = arctan(t) + R
t
2s 3
Is =
+
Is1 .
2
s1
2(s 1)(1 + t )
2s 2
Ne segue che ogni primitiva `e una funzione elementare.
(6) Polinomi trigonometrici. Richiamiamo alcuni fatti gi`a visti in [COMPLESSI]. Nel trattare
le funzioni trigonometriche `e spesso utile fare uso della funzione di Eulero definita su R e a
valori complessi:
eix = cos(x) + i sin(x)
che soddisfa lidentit`
a fondamentale
eix eiy = (cos(x) cos(y) sin(x) sin(y)) + i(sin(x) cos(y) + cos(x) sin(y)) = ei(x+y)
che incorpora le formule di addizione di sin e cos e giustifica anche la notazione. Possiamo
anche estendere la funzione esponenziale da R a C ponendo
ez = ex+iy = ex eiy
che verifica anchessa lidentit`
a fondamentale nel campo dei numeri complessi:
ez1 +z2 = ez1 ez2 .
Inoltre le stesse funzioni cos e sin si possono esprimere in quanto rispettivamente la parte reale
e la parte immaginaria della funzione di Eulero
eix + eix
eix eix
, sin(x) =
.
2
2i
Praticamente tutte le formule della trigonometria elementare si possono riottenere manipolando
algebricamente queste formule di base. Vediamo per esempio le formule di Prostaferesi:
cos(x) =

eiA eiA eiB eiB


)(
)=
2i
2i
ei(AB) + ei(AB)
ei(A+B) + ei(A+B)
(1/2)(

)=
2
2
cos(A B) cos(A + B)
2
e analogamente si ottiene:
sin(A B) + sin(A + B)
sin(A) cos(B) =
2
cos(A B) + cos(A + B)
cos(A) cos(B) =
.
2
Sia ora p(X1 , X2 ) un polinomio in due indeterminate. Vogliamo trattare gli integrali indefiniti della forma
Z
p(cos(ax + b), sin(cx + d))dx
sin(A) sin(B) = (

PRIMITIVE ELEMENTARI

dove a, c 6= 0 e mostrare in particolare che sono elementari. Usando la linearit`a dellintegrale


ci riduciamo a studiare il caso in cui p(X1 , X2 ) `e un monomio, cio`e integrali della forma
Z
k coss (ax + b) sinr (cx + d)dx .
Affermiamo che il prodotto
coss (ax + b) sinr (cx + d)
si pu`
o scrivere come una somma di termini della forma
K cos(Ax + B), K sin(Cx + D) .
Questo pu`
o essere mostrato per induzione su m = s + r 1. Se m = 1 il fatto `e evidente. Se
s r, scriviamo
coss (ax + b) sinr (cx + d) = cos(ax + b)(coss1 (ax + b) sinr (cx + d))
se r s, scriviamo
coss (ax + b) sinr (cx + d) = sin(cx + d)(coss (ax + b) sinr1 (cx + d))
in entrambi i casi il secondo fattore ha la somma degli esponenti uguale a m 1, quindi
possiamo applicare lipotesi induttiva ottenendo una somma di termini di uno dei seguenti
tipi
K cos(ax + b) cos(Ax + B), K cos(ax + b) sin(Cx + D), K sin(cx + d) sin(Cx + D) .
Resta da dimostrare che la tesi vale per questi ultimi integrandi, cio`e quando m = 2. Ma
questo segue immediatamente dalle formule di Prostaferesi.
Un modo equivalente di ottenere lo stesso risultato (per i monomi) `e quello di sviluppare
completamente, usando in particolare la formula di Newton per le potenze di un binomio, la
seguente espressione in termini della funzione di Eulero:
ei(ax+b) + ei(ax+b s ei(cx+d) ei(cx+d) r
) (
) .
2
2i
Siamo cos` ridotti agli integrali della forma
Z
Z
cos(ax + b)dx,
sin(ax + b)dx
(

al variare dei parametri a, b, a 6= 0. Il cambio di variabile t = ax + b, x =


infine a
Z
Z
(1/a) cos(t)dt,
(1/a) sin(t)dt

tb
ci riduce
a

che sono immediati.


Gli integrali
Z

sinr (x) coss (x)dx

si trattano anche con opportuni cambiamenti di variabile. Vediamo per esempio due casi:
(1) r = 2m + 1 dispari e s = 2n sia pari. Allora riscriviamo lintegrale nella forma
Z
Z
(1 cos2 )m cos2n sin(x)dx = (1 t2 )m t2n dt
via la sostituzione t = cos(x). Si procede in modo analogo se invece r `e pari e s `e dispari.
(2) r = 2m + 1, s = 2n + 1 entrambi dispari. Allora
Z
Z
1t m 1+t n
) (
) dt
sin2m (x) cos2n sin(x) cos(x)dx = (1/4) (
2
2
via la sostituzione t = cos(2x) (si usano casi particolari delle formule di Prostaferesi).

PRIMITIVE ELEMENTARI

3. Funzioni razionali
Risalendo ancora la gerarchia delle funzioni elementari dopo le polinomiali troviamo le funzioni
razionali. E meno immediato, ma anche le funzioni razionali ammettono primitive elementari. Descriviamo la procedura che conduce al risultato (nel fare questo mostreremo anche numerosi esempi
espliciti di primitive elementari) :
N (x)
. Questa `e definita sullaperto D = {D(x) 6=
(1) Partiamo da una funzione razionale f (x) =
D(x)
0} che `e lunione di un numero finito di intervalli aperti. Supponiamo di avere selezionato un
sottointervallo (sia I) di uno di questi intervalli e conveniamo di considerare la restrizione di
f ad I. Grazie alla divisione con il resto per D(x), possiamo riscrivere f nella forma
f (x) = Q(x) +

R(x)
D(x)

dove Q(x) e R(x) sono polinomi e il grado del resto R(x) `e strettamente minore di quello
di D(x). Per la linearit`a dellintegrale indefinito, e poiche sappiamo integrare facilmente il
R(x)
.
polinomio Q(x), siamo ridotti a trovare una primitiva della funzione razionale g(x) =
D(x)
(2) Consideriamo due casi di base, cio`e quando il grado di D(x) `e uguale a 1 o a 2. Nel primo
caso la funzione `e della forma
a
g(x) =
x
dove a, R. Una primitiva immediata `e allora G(x) = a log(|x |) che `e elementare. Se
il gardo `e 2, allora
ax + b
g(x) = 2
x + px + q
per certe costanti a, b, p, q. Considerato = p2 4q, ci sono tre possibilit`a:
> 0, allora x2 + px + q = (x )(x ) 6= . Affermiamo che allora g(x) pu`
o essere
riscritta nella forma
a2
a1
+
g(x) =
x x
dove le costanti a1 e a2 sono le uniche che soddisfano le identit`
a
a1 + a2 = a, a1 + a2 = b
si ottengono cio`e come le uniche soluzioni di questo sistema lineare. Per la linearit`a
dellintegrale indefinito, lintegrale di g `e allora la somma di due integrali del tipo trattato
nel caso precedente.
Se = 0, allora x2 + px + q = (x )2 . In questo caso si pu`
o riscrivere
a1
a2
g(x) =
+
x (x )2
dove a1 = a, a2 = a + b. A questo punto una primitiva immediata di g `e
G(x) = a log(|x |)

a + b
x

che `e elementare.
Se < 0, allora x2 + px + q non ha radici reali ed `e sempre positivo. In questo caso il
trattamento `e un po pi`
u laborioso. Ci limitiamo ad esibire una primitiva di g anche in
questo caso (il lettore pu`
o verificare che `e una primitiva facendone la derivata).
G(x) =
che `e elementare.

2b ap
2x + p
a
log(x2 + px + q) +
arctan(
)
2

PRIMITIVE ELEMENTARI

(3) Nel caso generale, grazie al teorema fondamentale dellalgebra e alle propriet`
a dei polinomi
reali, il denominatore D(x) = p0 +p1 x+. . . pn1 xn1 +xn pu`
o essere decomposto nel prodotto
di fattori di due tipi
(x )m , (x2 + px + q)k
dove m, k n e il polinomio di secondo grado ha discriminante = p2 4q < 0, dunque
x2 + px + q > 0 per ogni x . Si riscrive allora g(x) come somma di certe funzioni razionali pi`
u
semplici. Ogni fattore del primo genere contribuisce con un pacchetto di addendi del seguente
tipo:
m
X
aj
(x )j
j=1
mentre ogni fattore del secondo genere con un pacchetto del tipo
k
X
s=1

ms x + n s
.
+ px + q)s

(x2

Linsieme delle costanti aj , ms , ns , per tutti i fattori di D(x), si determinano in modo univoco come soluzioni di un opportuno sistema di equazioni lineari che pu`
o a sua volta essere
determinato esplicitamente.
(4) Ancora grazie alla linearit`a dellintegrale, siamo cos` ridotti a calcolare una primitiva di due
tipi speciali di funzioni razionali:
aj
ms x + n s
g(x) =
, g(x) = 2
.
(x )j
(x + px + q)s
Per quelli del primo genere, il caso j = 1 `e gi`a stato trattato. Se j > 1 una primitiva immediata
`e
1
aj
G(x) =
.
1 j (x )j1
Per quelli del secondo genere, prima riscriviamo la funzione nella forma
1
2x + p
+B 2
g(x) = A 2
(x + px + q)s
(x + px + q)s
dove le costanti A e B sono facilmente calcolabili.
(5) Ancora per linearit`a siamo ridotti a determinare una primitiva di ulteriori due tipi speciali di
funzioni razionali
2x + p
1
g(x) = 2
, g(x) = 2
(x + px + q)s
(x + px + q)s
per quelle del primo genere, se s = 1 `e un caso gi`a trattato, se s > 1, una primitiva immediata
`e
1
1
.
2
1 s (x + px + q)s1
(6) Per quelle del secondo genere, mediante la sostituzione
2x p
t=

ci riduciamo al calcolo di integrali del tipo


Z
1
dt
Is =
(1 + t2 )s
che sono gi`
a stati trattati in precedenza.
Riassumendo possiamo concludere che ogni primitiva di una funzione razionale `e elementare derivabile.
Pi`
u precisamente
Le primitive di una funzione razionale sono combinazioni lineari di funzioni razionali e di funzioni
del tipo log(ax2 + bx + c) o arctan(ax + b).

PRIMITIVE ELEMENTARI

Osserviamo infine che il calcolo di una tale primitiva pu`


o essere portato in fondo esplicitamente solo a
condizione (niente affatto scontata) di conoscere esplicitamente la decomposizione in fattori irriducibili
del denominatore D(x).
4. Esempi di razionalizzazione
Per certe classi di funzioni elementari, opportune manipolazioni consentono di ricondurre il calcolo
di una primitiva al calcolo di una primitiva di una funzione razionale, che sappiamo trattare. Senza
alcuna pretesa di essere esaustivi, indichiamo alcuni esempi.
(1) Consideriamo una funzione della forma f (x) = R(y(x)) dove R(y) `e una funzione razionale
nella variabile y. Poniamo t = y(x) e supponiamo che y = S(t) dove S `e unaltra funzione
razionale. Allora
Z
Z
R(t)
dt
f (x)dx =
S(t)
e chiaramente lultima funzione `e razionale. Ad esempio
Z
Z
R(t)
R(ex )dx =
dt
t
Z
Z
R(t)
dt .
R(tan(x)) =
1 + t2
(2) (Funzioni razionali trigonometriche) Consideriamo una funzione della forma f (x) =
R(sin(x), cos(x)). Facendo la sostituzione (sugli intervalli della forma ( + 2k, + 2k)):
t = tan(x/2)
da cui

2t
1 t2
,
cos(x)
=
1 + t2
1 + t2

sin(x) =
si ottiene

f (x)dx =

R(

1 t2
2
2t
,
)
dt .
1 + t2 1 + t2 1 + t2

Ad esempio
Z

dx
=
sin(x)

dt
= log(|t|) + R = log(| tan(x/2)|) + R .
t

In certi casi altri cambiamenti di variabile razionalizzanti possono risultare praticamente


pi`
u convenienti. Per esempio
(i) Se R(sin(x), cos(x)) = R(sin(x), cos(x)) allora si pu`
o usare t = sin(x).
(ii) Se R(sin(x), cos(x)) = R( sin(x), cos(x)) allora si pu`
o usare t = cos(x).
(i) Se R(sin(x), cos(x)) = R( sin(x), cos(x)) allora si pu`
o usare t = tan(x).
(3) Consideriamo una funzione della forma f (x) = R(sin(x), cos2 (x)) cos(x). Facendo la sostituzione t = sin(x) ci riduciamo a
Z
R(t, 1 t2 )dt .
4.1. Integrali Abeliani. Si tratta di integrali della forma
Z
R(x, y(x))dx
al variare di x in un intervallo aperto I, dove:
(a) R(x, y) `e una funzione razionale nelle due variabili x, y (cio`e il rapporto di due funzioni polinomiali
nelle due variabili);
(b) Esiste un polinomio in due variabili P (X, Y ) tale che
P (x, y(x)) = 0 .

PRIMITIVE ELEMENTARI

Il luogo di zeri di P (X, Y ), = {(x, y) R2 ; P (x, y) = 0}, `e una curva in R2 , e x (x, y(x)) `e una
parametrizzazione di un arco di (vedi anche [ARCHI]). Un tale integrale si razionalizza se esistono
due funzioni razionali di una terza variabile t, definite su un intervallo aperto J:
x = (t), y = (t)
tali che:
(i) parametrizza I;
(ii) P ((t), (t)) = P ((t), y((t)) = 0.
Infatti in tal caso, usando la regola di integrazione per sostituzione abbiamo che
Z
Z
R(x, y(x))dx = R((t), (t)) (t)dt .
Vediamo alcuni esempi:
( conica) Supponiamo che il polinomio P (X, Y ) sia di grado uguale a 2. La curva `e una
conica e pu`
o essere un ellisse, una iperbole o una parabola. In questo caso `e sempre possibile trovare
funzioni razionalizzanti (, ) del tipo voluto. Il metodo geometrico per determinarle `e il seguente.
Supponiamo per semplicit`a che I 6= R. Preso x0 che non appartiene a I, sia (x0 , y0 ) . la generica
retta che passa per il punto (x0 , y0 ) ha equazione
y = tx + (y0 tx0 )
dove t `e un parametro che varia in R. Una tale retta interseca nel punto (x0 , y0 ) e in un solo
altro punto (x(t), y(t)) di coordinate che sono funzioni razionali di t. Si determina infine un intervallo
aperto J opportuno in modo che le restrizioni a J forniscano le funzioni ((t), (t)) cercate. Vediamo
come funziona in un esempio concreto:
Z
p
R(x, (x 1)(x 2))dx

I = {x > 2}. P (X, Y ) = Y 2 (X 1)(X 2). Prendiamo allora (x0 , y0 ) = (1, 0). La retta generica
per (1, 0) ha equazione
y = tx t
sostituendo in P (X, Y ) otteniamo
(x 1)(t2 (x 1) (x 2)) = 0
da cui
x=

t
t2 2
, y= 2
t2 1
t 1

ed infine J = {0 < t < 1}.


Non `e necessario che P (X, Y ) sia di grado 2, affinche esistano (, ) razionalizzanti. Si consideri ad
esempio
r
Z
ax + b
R(x, n
)dx
cx + d
n
assumendo che ad bc 6= 0. Il polinomio P (X, Y ) = Y (cx + d) (ax + d) ha grado n. Allora le
restrizioni di
dtn b
, y=t
x=
ctn + a
ad ogni sotto-intervallo J di {ctn + a 6= 0} forniscono valide (, ).
Gli integrali Abeliani della forma
Z
p
R(x, ax2 + bx + c)dx, a 6= 0

quindi basati su una conica possono essere razionalizzati in modo sistematico come segue:
(1) Se a > 0 si pone

ax2 + bx + c = ax + t

PRIMITIVE ELEMENTARI

da cui elevando al quadrato e risolvendo rispetto a x si ottiene


x=

t2 c

b 2 at

e quindi si razionalizza lintegrale.


(2) Se a < 0, necessariamente > 0, il polinomio si fattorizza
ax2 + bx + c = a(x )(x )
ed x varia nellintervallo [, ]. Si pu`
o allora riscrivere
r

x
ax + bx + c = a(x )
x
per cui ci riconduciamo ad un integrale del tipo visto prima, che si razionalizza mediante la sostituzione
r
x
t=
.
x
2

4.2. Integrali ellittici. Abbiamo affermato allinizio che non tutte le funzioni elementari hanno
primitive elementari. Anche se non giustificheremo laffermazione, indichiamo una classe di funzioni
elementari derivabili che in generale non hanno primitive elementari. Si tratta degli integrali Abeliani
della forma:
Z
p
R(x, q(x))dx

dove q(x) `e un polinomio di grado uguale a 3 o 4. Dunque P = Y 2 q(X) ha grado 3 o 4 e questo


significa in particolare che in generale questi integrali non possono essere razionalizzati. Si chiamano
integrali ellittici perche emersi inizialmente nello studio della lunghezza degli archi di una ellisse (vedi
[ARCHI]) e sono stati ampiamente studiati, a partire almeno da Eulero. Questo studio necessita per`o
dei metodi che vanno ben oltre gli scopi di questo corso.

Appendice alla nota Primitive Elementari.


Qui sono raccolte alcune osservazioni in margine alla nota Primitive Elementari
dove `e osservato che le funzioni razionali ammettono primitive elementari e viene
descritta una procedura per trovare tali primitive.
R(x)
D(x)
con deg R(x) < deg D(x) esiste una decomposizione in pacchetti di un certo
tipo, cio`e che se

1. A pagina 3 della Nota `e enunciato il fatto che per una funzione razionale

D(x) = (x 1 )m1 . . . (x r )mr (x2 + p1 x + q1 )k1 . . . (x2 + ps x + qs )ks


allora
R(x)
= L(1) + L(2) + . . . + L(k) + S (1) + S (2) + . . . + S (s)
D(x)

()

dove gli L(i) e S (i) sono pacchetti del tipo

(i)

mi
X
j=1

(i)

Aj
(x i )j

(i)

ki
X
j=1

(i)

(i)

Bj x + Cj
con p2i 4qi < 0.
2
j
(x + pi x + qi )

Fermo restando il fatto, gi`a notato a pag 4 della dispensa stessa, della non
banailt`a della procedura stessa, almeno dal punto di vista calcolistico, poiche
parte essenziale di tutto ci`o `e la conoscenza di una effettiva decomposizione
in fattori irriducibili del denominatore della funzione razionale, cosa tuttaltro
che ovvia, notiamo anche che una decomposizione del tipo presentato sussiste
in quanto i polinomi sono supposti a coefficienti reali e quindi se ammettono
una radice complessa anche `e radice e i fattori x2 + px + q con p, q reali
con discriminante negativo nascono per lappunto dal prodotto di due fattori
di questo tipo.
Un modo per convincersi dellesistenza di una tale decomposizione `e quello di
impostare il sistema lineare derivante da tutte le considerazioni fatte fino a
quel momento e vedere che ha una soluzione: qui esponiamo un altra via.
Supponiamo che la radice di D sia semplice e moltiplichiamo ambo i membri
della (*) per x . Otteniamo
(x )

R(x)
A
= (x )
+ (x )(x)
D(x)
(x )

e prendendo di entrambi i membri il limite per x tendente ad otteniamo


R() 1
.
A=
D ()
1

Se `e radice di D, da D(x) = (x )E(x) si ha D (x) = E(x) + (x )E (x) da cui


1
1
e ben
limx (x)
D(x) = E() = D () ; essendo radice semplice E() 6= 0 e quindi il denominatore `
definito.

Se invece la radice ha molteplicit`a m, moltiplicando per (x )m ambo i


membri della (*) otteniamo
R
= (x ) + 2
D
dove appunto `e un polinomio di grado m in x e il resto un infinitesimo di
ordine superiore a m. Pertanto per lunicit`a del polinomio di Taylor otteniamo
che i coefficienti Aj altro non sono che le derivate successive della funzione
R
(x )m (che `e regolare in ) calcolate appunto in .
D
Questa osservazione oltre a produrre, adattata al caso che le radici siano complesse, una prova dellesistenza e unicit`a della decomposizione in questione,
produce anche un mezzo di calcolo talvolta pi`
u rapido della soluzione di un
sistema lineare che pu`o essere di dimensioni ragguardevoli.
(x )m

2. Talvolta pu`o venir comoda la seguente osservazione. Ogni pacchetto L e S si


pu`o scrivere
L=

A
d PL
+
(x ) dx QL

S=

d PS
Bx + C
+
+ px + q) dx QS

(x2

e quindi in definitiva la decomposizione si riduce a


X B (i) x + C (i)
R X A(i)
d P
=
+
+
2
D
(x i )
(x + pi x + qi ) dx Q
i
i
In certi casi pu`o essere pi`
u semplice eseguire i calcoli lasciando incogniti i
PL
PS
coefficienti dei singoli QL o Q
e risolvere il sistema lineare derivante che si
S
presenta probabilmente pi`
u semplice.
3. Una
R 1idea della prova della formula per lintegrazione degli integrali del tipo
dt con s > 1.
(1+t2 )s
Punto di partenza `e la seguente relazione di ovvia verifica:
1
t2
1
=

(1 + t2 )s
(1 + t2 )s1 (1 + t2 )s

()

Indichiamo, coerentemente con la notazione usata nella Nota


Z
1
dt
Is =
(1 + t2 )s
Da () otteniamo
Is = Is1
2

t2
dt
(1 + t2 )s

Con le notazioni usate fino ad ora, indicando con L il pacchetto relativo alla radice e con
R
g(x) tutto il resto, abbiamo (x )m = (x )m L + (x )m g(x) = Am + Am1 (x ) + . . . +
D
A1 (x )m1 + (x )m g(x)

Calcoliamo per parti lultimo integrale.


Z
Z
t
2t
t2
dt =

dt =
2
s
(1 + t )
2 (1 + t2 )s
Z
1
1
1
1
t

dt =
=
2
s1
2 (1 s) (1 + t )
2(1 s)
(1 + t2 )s1
t
1
1
1
=
Is1

2
s1
2 (1 s) (1 + t )
2(1 s)
da cui la formula ricorsiva data a pag 2 punto 5 della Nota:
t
1
1
1

+
Is1 =
2
s1
2 (1 s) (1 + t )
2(1 s)
1
t
2s 3
Is1 +

=
2s 2
2(s 1) (1 + t2 )s1

Is = Is1

December 9, 2014
ARCHI DI CURVE

1. Introduzione
Nella definizione delle funzioni sin(t) e cos(t) siamo stati un po vaghi nellinterpretare t come la
lunghezza dellarco orientato della circonferenza unitaria che delimita il corrispondente angolo. In
particolare siamo stati vaghi nel definire 2 come la lunghezza della circonferenza unitaria. Uno degli
scopi di questa breve nota `e quello di precisare questo concetto, estendendolo ad una classe molto
ampia di curve nel piano (e non solo). Useremo molte delle nozioni del calcolo differenziale e integrale
che abbiamo sviluppato.
2. Interpretazione cinematica della derivata
Sia
f :IR
una funzione derivabile definita sullintervallo aperto I. Consideriamo la funzione associata
: I R2 , (t) = (t, f (t)) .
Allora questa funzione realizza una parametrizzazione del grafico G(f ) considerato come una curva
nel piano. Possiamo pensare t come il tempo e G(f ) come la traiettoria percorsa da un punto materiale
che si muove sul piano con legge del moto data da . Deriviamo ora le due componenti di ; otteniamo
v(t) := (t) = (1, f (t)) .
Si nota che per ogni t I, v(t) 6= (0, 0). Adesso la derivata di `e un vettore non nullo di R2 che per
ogni t I pu`
o essere interpretato come il vettore velocit`
a del punto allistante t ed `e tangente alla
curva G(f ) nel punto (t, f (t)).
Questa discussione si pu`
o estendere ad una qualsiasi funzione
= (f1 , f2 ) : I R2
dove le due componenti sono entrambe derivabili ed inoltre v(t) := (f1 (t), f2 (t)) 6= (0, 0) per ogni
t I. := (I) `e ora una curva che pu`
o essere molto pi`
u complicata di un grafico. In particolare
non richiediamo neanche che sia iniettiva, cio`e la traiettoria del punto che si muove nel piano pu`o
occupare la stessa posizione in istanti diversi. Il vettore velocit`
a `e ora appunto v(t) = (f1 (t), f2 (t)) e
per ogni t I determina la retta tangente a nellistante t.
3. Lunghezza di un arco di curva
Consideriamo
= (f1 , f2 ) : I R2
come sopra e supponiamo di pi`
u che le due componenti siano C 1 , cio`e che le due derivate siano continue.
Poniamo
q
|v(t)| = f1 (t)2 + f2 (t)2
cio`e il modulo del vettore velocit`
a. Questo definisce una funzione continua
|v| : I R .
Fissiamo un intervallo chiuso e limitato [t0 , t1 ] I; allora diciamo che
C = ([t0 , t1 ])
`e un arco chiuso e limitato di . Poiche |v| `e continua, esiste lintegrale definito
Z t1
|v(t)|dt .
t0

ARCHI DI CURVE

Sia
r:J I
1

unapplicazione C , iniettiva e con r > 0, definita su un intervallo aperto J e tale che [t0 , t1 ] r(J).
Allora esiste [s0 , s1 ] J tale che r([s0 , s1 ]) = [t0 , t1 ]. La composizione
:= r : [s0 , s1 ] R2 , (s) = (r(s))
`e tale che
C = ([s0 , s1 ])
e per questo `e detta una riparametrizzazione dellarco C. Usando le regole di derivazione per la
composizione vediamo che
v(s) := (s) = (r(s))r (s) = v(r(s))r (s)
|
v (s)| = |v(r(s))|r (s) ,
usando le regole di integrazione per cambiamento di variabile, abbiamo
Z t1
Z s1
|v(t)|dt .
|
v (s)|ds =
t0

s0

Dunque questo numero non dipende dalla scelta della parametrizzazione ma solo dall arco C e viene
definito la lunghezza di C e lo indichiamo con l(C). Notiamo anche che la funzione integrale
Z t
|v(x)|dx
l(t) =
t0

esprime la lunghezza del sotto-arco di C percorso dal punto al tempo t, partendo dallistante iniziale
t0 . Supponiamo adesso che |v(t)| = 1 per ogni t. In tal caso per ogni t [t0 , t1 ], l(t) = t t0 , dunque la
lunghezza del sotto-arco `e uguale alla lunghezza del corrispondente sotto-intervallo dei parametri [t0 , t].
Necessariamente in questo caso t1 t0 = l(C). La parametrizzazione che verifica queste propriet`
a `e
speciale e viene detta parametrizzazione secondo la lunghezza dellarco o anche parametrizzazione naturale. Supponiamo che sia una arbitraria parametrizzazione dellarco C e vogliamo riparametrizzare
mediante r : [0, l(C)] [t0 , t1 ] in modo che = r sia la parametrizzazione naturale. Consideriamo
come sopra la funzione integrale associata a
Z t
|v(x)|dx
l(t) =
t0

questa definisce unapplicazione crescente quindi bigettiva


l : [t0 , t1 ] [0, l(C)]
sia
r : [0, l(C)] [t0 , t1 ]
lapplicazione inversa; verifichiamo allora che = r `e la parametrizzazione naturale cercata, infatti:
1
.
(s) = (r(s))r (s), r (s) =
|v(r(s))|
Dunque esiste sempre ed `e unica la parametrizzazione secondo la lunghezza dellarco di un qualsiasi
arco di classe C 1 . Supponiamo ora che le componenti di siano C 2 . Allora, per ogni t, il vettore
a(t) = v (t)
si chiama il vettore accelerazione del punto (t) allistante t. Se `e la parametrizzazione speciale
secondo la lunghezza dellarco, allora derivando
|v(t)|2 = (f1 )2 (t) + (f2 )2 (t) = 1
otteniamo
2(f1 (t)f 1 (t) + f2 (t)f2 (t) = 0
cio`e, per ogni t, i vettori velocit`
a v(t) e accelerazione a(t) sono tra loro ortogonali.

ARCHI DI CURVE

4. Le funzioni sin, cos e rivisitati


Consideriamo la circonferenza unitaria C = {x2 + y 2 = 1} in R2 . Allora (t) = (cos(t), sin(t)),
t [0, l(C)] `e definita come la parametrizzazione secondo la lunghezza di arco di C tale che (0) =
(l(C)) = (1, 0) e C `e percorsa in senso antiorario. Si noti che tutto `e coerente perche v(t) =
( sin(t), cos(t)) da cui |v(t)| = 1 e a(t) = ( cos(t), sin(t)) `e ortogonale a v(t). Infine poniamo
2 = l(C).
Osserviamo infine che tutti gli argomenti possono essere applicati ad ogni parametrizzazione =
(f1 , . . . , fn ) : I Rn di una curva in Rn (per esempio se n = 3 abbiamo una curva nello spazio, se
n = 4 abbiamo una curva nello spazio-tempo etc.)

December 9, 2014
EQUAZIONI DIFFERENZIALI I

1. Introduzione
Un multirettangolo aperto Q di Rn+1 `e un prodotto di intervalli aperti della forma
Q = I0 In .
Una funzione F : Q R `e continua se per ogni p Q, per ogni > 0, esiste un multirettangolo
aperto Q Q tale che p Q e F (Q ) (F (p) , F (p) + ).
Fissiamo un multirettangolo aperto della forma:
T Q R Rn+1 = Rn+2
dove n 1 e lintervallo aperto T pu`
o essere pensato come un intervallo di tempi. Sia data una
funzione continua
F : T Q R, F (t, x) = F (t, x0 , . . . , xn ) .
Associata ad F abbiamo l equazione differenziale dell n-esimo ordine:
F (t, y, y (1) , . . . , y (n) ) = 0 .
Una soluzione di questa equazione `e una funzione
y:J R
tale che:
(1) J T `e un sotto-intervallo aperto dellintervallo dei tempi T .
(2) y `e n-volte derivabile, e per ogni t J, poniamo y (t) = y (1) (t), y (s) (t) = (y (s1) ) (t).
(3) Ponendo, per ogni t J,
y(t) = (y(t), y (1) (t), . . . , y (n) (t))
si definisce una funzione
y : J Q .
(4) Per ogni t J, si ha che
F (t, y(t)) = 0 .
Il grafico G(
y ) di y in J Q `e detto una curva integrale dellequazione. E chiaro che c`e una corrispondenza biunivoca canonica tra linsieme delle soluzioni e linsieme delle curve integrali. Linsieme
I(F ) di tutte le soluzioni (equivalentemente, di tutte le curve integrali) `e detto l integrale totale
dellequazione differenziale. Il problema generale `e quello di determinare I(F ) al variare di F . Una
soluzione y : J R (equivalentemente una curva integrale) `e detta massimale se non si pu`
o prolungare ad una soluzione y : J R, dove J contiene propriamente J. Dunque possiamo definire Im (F )
come linsieme di tutte le soluzioni massimali e specializzare un poco il problema sostituendo I(F )
con Im (F ), al variare di F . Un sotto-problema fondamentale `e il
Problema di Cauchy sullesistenza e unicit`
a di soluzioni massimali con dati iniziali assegnati.
Precisamente, assegnato un punto (t0 , x
0 ) T Q, il problema chiede se esiste ed `e unica una soluzione
massimale y : J R dellequazione tale che t0 J e (t0 , y(t0 )) = (t0 , x
0 ).
Ci possiamo aspettare che la difficolt`
a di questi problemi cresca con lordine e che soprattutto dipenda
da quanto `e complicata la funzione F . Una prima semplificazione consiste nel richiedere che F sia
in forma normale cio`e della forma
F (t, x
) = xn f (t, x0 , . . . , xn1 ) .
Ricordando poi, per esempio, le considerazioni sulla gerarchia delle funzioni elementari (vedi [MODELLI]) il tipo pi`
u semplice per F `e quello lineare, cio`e della forma:
F (t, x
) = xn + (a0 (t)x0 + . . . an1 (t)xn1 b(t))

EQUAZIONI DIFFERENZIALI I

X
aj (t)xj ) + b(t)) `e definita su T Rn .
dove f (t, x
) = (
j

Nel seguito ci occuperemo principalmente di equazioni del primo e del secondo ordine.
` sulle equazioni lineari
2. Generalita
Una equazione lineare (in forma normale) pu`
o essere scritta nella forma
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b(t)
dove le funzioni aj (t) sono continue. L equazione
y (n) + a0 (t)y + . . . an1 (t)y (n1) = 0
`e detta l equazione omogenea associata, mentre la funzione b(t) `e il termine noto di quella non omogenea. Il lettore probabilmente avr`
a riconosciuto la terminologia che si usa per i sistemi di equazioni
lineari e che avr`
a gi`
a incontrato nel corso di algebra lineare. Non `e un caso. Per ogni intervallo aperto
J T , linsieme C 0 (J) delle funzioni continue z : J R `e chiuso rispetto alle combinazioni
lineari,
X
j zj (t) C 0 (J).
cio`e, se z1 (t), . . . , zk (t) C 0 (J) e 1 , . . . , k R, allora la combinazione lineare
j

Dunque C 0 (J) `e un R-spazio vettoriale. Il sottoinsieme C n (J) di C 0 (J) formato dalle applicazioni
di classe C n `e un sottospazio vettoriale (cio`e `e a sua volta chiuso rispetto alle combinazioni lineari).
Lapplicazione
L : C n (J) C 0 (J), L(y) = y (n) + a0 (t)y + . . . an1 (t)y (n1)
`e unapplicazione lineare. Dunque trovare le soluzioni definite su J T dellequazione omogenea
coincide con determinare il nucleo Ker(L) di L. Sappiamo dallalgebra lineare (e la verifica `e facile)
che Ker(L) `e un sottospazio vettoriale di C n (J), in particolare, per ogni J T , non `e vuoto perche
contiene almeno la soluzione costantemente nulla y = 0.
Venendo allequazione non omogenea, fissato un sottointervallo J T , si hanno due possibilit`a: (1)
non esistono soluzioni definite su J; (2) esiste almeno una soluzione y 0 : J R. Nel secondo caso
possiamo descrivere completamente linsieme delle soluzioni dell equazione non omogenea:
y : J R `e una soluzione dellequazione non omogenea se e solo se `e della forma y = y 0 + z, dove
z Ker(L), cio`e z `e una soluzione dellequazione omogenea associata.
Abbiamo dunque ritrovato la struttura delle soluzioni di un sistema lineare non omogeneo. Lunica
differenza, rispetto ai sistemi lineari che probabilmente sono pi`
u familiari al lettore, `e che lo spazio
su cui `e definita lapplicazione lineare L non `e di dimensione finita e quindi, a priori, anche Ker(L)
potrebbe non esserlo. Si noti infatti che le funzioni monomiali
y = tn , n N
che sono definite e C su ogni intervallo J, sono infinite e tra loro linearmente indipendenti.
Le considerazioni precedenti suggeriscono di dividere lo studio di una data equazione lineare in due
parti complementari:
(1) Per ogni J T (in particolare T ) Determinare Ker(L), cio`e determinare lo spazio vettoriale
delle soluzioni dellequazione omogenea associata (in particolare decidere se `e di dimensione
finita, nel caso determinarla).
(2) Determinare se possibile una soluzione particolare y 0 dellequazione non omogenea.
Concludiamo osservando che per le equazioni lineari vale anche la seguente propriet`
a di sovrapposizione
(che `e di facile verifica):
Siano
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b1 (t)
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b2 (t)

EQUAZIONI DIFFERENZIALI I

due equazioni lineari non omogenee che hanno la stessa equazione omogenea associata. Allora se y1 e
y2 sono rispettivamente soluzioni di queste equazioni, definite su uno stesso intervallo J, allora y1 + y2
`e una soluzione dellequazione
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b1 (t) + b2 (t) .
3. Equazioni del primo ordine
Consideriamo
f :T I R
continua che determina una F : T (I R) R in forma normale, cio`e
F (t, x0 , x1 ) = x1 f (t, x0 ) .
Lequazione differenziale associata si pu`
o scrivere nella forma
y = f (t, y) .
Nel seguito scriveremo semplicemente x invece di x0 .
Possiamo interpretare la situazione nel modo seguente. La coordinata x individua la posizione di un
punto che si muove sullintervallo I. Allora f (t, x) pu`
o essere interpretato come il vettore velocit`
a
del punto che allistante t occupa la posizione x. Questo vettore `e tangente a I come deve essere.
Dunque la funzione f = f (t, x) pu`
o essere interpretata come:
Un campo di vettori tangenti (di velocit`
a istantanee nella nostra interpretazione cinematica) lungo
I che varia con il tempo.
Una soluzione y : J R dellequazione differenziale corrisponde ad una specifica legge del moto
del punto (su I) che ha in ogni istante la velocit`
a pre-assegnata dal campo f . Integrare lequazione
significa quindi ricostruire tutte le leggi del moto che realizzano quella assegnata distribuzione di
velocit`
a (dipendente dal tempo).
La cosa diventa forse ancora pi`
u espressiva se la rileggiamo in termini delle curve integrali. In quanto
segue svolgeremo un tipo di considerazioni gi`a incontrato in [ARCHI]. Associamo alla funzione
f :T I R
la funzione a valori vettoriali
S : T I R2 , S(t, x) = (1, f (t, x))
che a volte `e chiamata la sospensione di f . S pu`
o essere interpretato come:
Un campo di vettori tangenti su T I
Nel senso che il vettore S(t, x) = (1, f (t, x)) deve essere pensato applicato al punto (t, x) T I.
Se y : J R `e una soluzione dellequazione differenziale, allora t (t, y(t)) `e la legge del moto di
un punto che si muove nel piano lungo la curva integrale G(y), tale che il vettore S(t, y(t)) `e tangente
alla curva e rappresenta la velocit`
a del punto allistante t.
3.1. Un esempio gi`
a familiare. Supponiamo che
f (t, x) = f (t)
cio`e dipende solo da t ma non dalla posizione, come al solito
F (t, x, x1 ) = x1 f (t) .
Lungo ogni intervallo verticale della forma
{t} I T I
si applica il vettore costante
S(t) = (1, f (t)) .
In questo caso lequazione differenziale diventa
y = f (t)

EQUAZIONI DIFFERENZIALI I

dunque il suo integrale generale coincide con lintegrale indefinito

f (t)dt che abbiamo gi`a studiato.

Poiche f `e continua una qualsiasi funzione integrale di punto base t0 T


Z t
f (x)dx
y(t) =
t0

`e una soluzione massimale definita su tutto T , per cui


Z
Im (F ) = f (t)dt = y(t) + R .
Le corrispondenti curve integrali si ottengono traslando verticalmente il grafico G(y) e sono due a due
disgiunte. Imponendo (t0 , x0 ) = (t0 , y(t0 ) + c) = (t0 , c) si ricava c = x0 e si risolve affermativamente
il corrispondente problema di Cauchy di esistenza e unicit`
a della soluzione massimale passante per
(t0 , x0 ). Variando il punto base della funzione integrale, si vede cos` che il problema di Cauchy `e
sempre risolubile.
Il teorema fondamentale del calcolo integrale ci permette anche di riformulare il caso generale di
equazioni del primo ordine. Infatti vale:
Proposizione 3.1. Nelle solite ipotesi, y : J R `e una soluzione dellequazione differenziale y =
f (t, y) tale che y(t0 ) = x0 se e solo se per ogni t J verifica
Z t
f (s, y(s))ds .
y(t) = x0 +
t0

Si noti per`
o che non ci siamo ridotti come prima alla semplice determinazione di un integrale indefinito
perche la funzione incognita interviene ora sotto il segno di integrazione.
3.2. Enunciato del teorema di Cauchy-Lipschitz. Consideriamo di nuovo un equazione differenziale del primo ordine in forma normale
y = f (t, y)
dove come al solito f `e continua. Diciamo che f `e localmente Lipschitziana se per ogni (t0 , x0 ) T I
esistono un multirettangolo aperto Q T I (che possiamo pensare abbastanza piccolo) e una
costante positiva K > 0, tali che
(t0 , x0 ) Q.
Per ogni (t, x), (t, z) Q, si ha che |f (t, x) f (t, z)| < K|x z| .
Ricordando il Corollario del teorema del valor medio visto in [D-INTERVALLI], si verifica per esempio
che:
Proposizione 3.2. Se f `e continua e la restrizione di f ad ogni intervallo verticale {t} I T I
`e di classe C 1 , allora f `e localmente Lipschitziana.
Possiamo infine enunciare (omettendo la dimostrazione):
Teorema 3.1. (Cauchy-Lipschitz) Supponiamo che f : T I R sia continua e localmente
Lipschitziana. Allora per ogni (t0 , x0 ) T I esiste ed `e unica una soluzione massimale y : J R
dellequazione differenziale y = f (t, y), tale che t0 J e y(t0 ) = x0 .
Questo teorema pu`
o essere visto come unampia estensione del teorema fondamentale del calcolo
integrale per le funzioni continue; la sua dimostrazione `e pi`
u riposta. Si noti che adesso, a differenza
dellintegrale indefinito, lo stesso intervallo J pu`
o variare al variare del punto (t0 , x0 ).
Un risultato analogo vale pi`
u in generale per lintegrazione dei campi di vettori (di cui si parla alla
fine della dispensa).

EQUAZIONI DIFFERENZIALI I

3.3. Equazioni del primo ordine lineari. Si tratta di studiare equazioni della forma
y + a(t)y = b(t)
dove a(t) e b(t) sono continue. Quando a = 0, si riottiene il caso gi`a familiare dellintegrale indefinito.
In effetti queste equazioni lineari si integrano direttamente riconducendosi al caso degli integrali indefiniti. Secondo lo schema descritto sopra in generale per le equazioni di tipo lineare, determiniamo
prima le soluzioni dellequazione omogenea
y + a(t)y = 0
e poi determineremo una soluzione particolare di quella non omogenea.
(1) Fissiamo una primitiva A(t) di a(t) su tutto T . Poiche a `e continua, basta fissare t0 T `e
prendere la funzione integrale
Z t
a(x)dx .
A(t) =
t0

(2) Osserviamo che y : T R `e soluzione di y + a(t)y = 0 se e solo se


eA(t) (y (t) + a(t)y(t)) = 0, t T
che pu`
o essere riscritta nella forma
(y(t)eA(t) ) = 0
da cui si ricava
y = ceA(t) , c R .
Possiamo quindi concludere che:
Lo spazio vettoriale delle soluzioni massimali (definite su tutto T ) dellequazione omogenea
ha dimensione uguale a 1, e y(t) = eA(t) ne costituisce una base.
(3) Cerchiamo ora una soluzione particolare dellequazione non omogenea. Lo facciamo applicando
in questo caso particolare il metodo detto della variazione della costante arbitraria. Cio`e
cerchiamo una soluzione della forma:
y0 (t) = C(t)eA(t)
da cui
y0 (t) = (C (t) a(t)C(t))eA(t)
sostituendo nellequazione non omogenea si ottiene
C (t) = eA(t) b(t)
per cui possiamo infine scegliere
C(t) =

eA(x) b(x)dx .

t0

Riassumendo:
Linsieme delle soluzioni massimali (definite su tutto T ) dellequazione non omogenea `e
formato dalle funzioni della forma
Z t
eA(x) b(x)dx)eA(t) + ceA(t) , c R
y(t) = y0 (t) + ceA(t) = (
t0

A(t) =

t0

a(x)dx .

EQUAZIONI DIFFERENZIALI I

Riguardo al problema di Cauchy, considerando il punto (t0 , x0 ), ricaviamo univocamente


la costante
c = x0
che determina lunica soluzione massimale passante per (t0 , x0 ). Variando il punto base t0 ,
vediamo direttamente che il problema di Cauchy `e sempre risolubile (in accordo ma indipendentemente rispetto al teorema di Cauchy-Lipschitz).
Vediamo un esempio esplicito:
y tan(t)y = cos(t)
dove T = (/2, /2). Poiche
d
log(cos(t)) = tan(t)
dt
lintegrale massimale generale dellequazione omogenea `e
1
, cR.
cos(t)
Una soluzione particolare dellequazione non omogenea `e
Z t
1
=
y0 (t) = (
cos2 (x)dx)
cos(t)
0
y(t) = c

1
1
1
( t + sin(2t))
2
4
cos(t)
3.4. Equazioni del primo ordine a variabili separate. Si tratta di studiare equazioni della forma
y = a(t)b(y)
dove f (t, x) = a(t)b(x) `e definita su T I ed `e continua. E il tipo pi`
u semplice di equazioni non
lineari. Anche in questo caso ci ricondurremo allo studio di certi integrali indefiniti. Nonostante ci`o,
vedremo che a causa della non-linearit`
a le soluzioni possono avere comportamenti sostanzialmente pi`
u
complessi rispetto alle equazioni lineari. Le equazioni di questo tipo possono essere studiate seguendo
il seguente schema:
Si cercano gli eventuali zeri della funzione b(x). Se x0 I `e un tale zero, la funzione costante
y = x0 `e una soluzione dellequazione, la cui curva integrale `e lintervallo orizzontale T
{x0 }.
Si considerano tutti i sotto-intervalli aperti non vuoti di I contenuti in I \ {b = 0}. Per
ciascuno di questi intervalli, sia L, consideriamo la restrizione di f su T L e studiamo
la corrispondente equazione ristretta. Supponiamo per semplicit`a che per queste equazioni
ristrette si possa applicare il teorema di Cauchy-Lipschitz.
Fissiamo L come nel punto precedente. Lequazione pu`
o essere riscritta equivalentemente
nella forma
y
= a(t) .
b(y)
Se y : J R `e una soluzione (massimale), passando agli integrali indefiniti abbiamo
Z
Z
y (t)
dt = a(t)dt
b(y(t))
e usando le regole di integrazione per sostituzione otteniamo
Z
Z
1
dy = a(t)dt, y = y(t) .
b(y)
La cosa pu`
o essere detta in altri termini: se
F : L R, F (x) =

x0

1
dy
b(y)

EQUAZIONI DIFFERENZIALI I

`e una primitiva di

1
: L R, se
b
A : T R, A(t) =

a(s)ds

t0

`e una primitiva di a : T R, allora al variare di c R, lequazione cartesiana


F (x) = A(t) + c
determina una curva c in T L. Fissato un punto (t0 , x0 ) T L,
c0 = F (x0 ) A(t0 )
`e lunica costante tale che la curva c0 passa per (t0 , x0 ). Dunque lunica soluzione massimale
che passa per (t0 , x0 ) parametrizza un arco di c0 . Possiamo cos` affermare che le soluzioni
dellequazione sono determinate implicitamente dalle relazioni
F (y(t)) = A(t) + c, c R .
Per svolgere il ragionamento precedente abbiamo assunto che il teorema di Cauchy-Lipschitz
si potesse applicare allequazione ristretta, per cui aveva senso riferirsi allunica soluzione
massimale che passa per (t0 , x0 ) T L. In effetti si potrebbero sviluppare le considerazioni
del punto precedente dimostrando direttamente (come nel caso lineare) che le conclusioni del
teorema di C-L valgono in questo situazione. Ma non insistiamo su questo punto.
Un importante differenza che causa maggiori difficolt`
a, rispetto alle equazioni lineari, `e che
adesso, per ogni (t0 , x0 ) T L, anche lintervallo J T su cui `e definita lunica soluzione
massimale passante per (t0 , x0 ) `e una incognita del problema (ed in generale pu`
o variare al
variare del punto). Nel caso lineare invece J `e sempre uguale a tutto T .
In certi (rari) casi risulta che la primitiva F `e invertibile, per cui possiamo esplicitare le
soluzioni:
y(t) = F 1 (A(t) + c) .
In generale dobbiamo accontentarci della soluzione implicita che abbiamo ricavato.
Abbiamo cos` determinato due tipi di soluzioni: quelle costanti con linea integrale orizzontale;
quelle necessariamente non costanti per la restrizione dellequazione su T L, dove L varia
tra gli intervalli di I \ {b = 0}. Sia y = x0 una soluzione costante contenuta nel bordo
del rettangolo aperto T L. Allora bisogna studiare il comportamento delle soluzioni non
costanti rispetto a quelle costanti. In certi casi ci sono fenomeni di raccordo (tipo scambio
ferroviario) fra questi due tipi di soluzione. Questi fenomeni possono comportare che ci sono
diverse soluzione massimali passanti per un punto (t0 , x0 ) T I. Se si realizza questa perdita
di unicit`
a delle soluzioni, necessariamente non sono verificate le ipotesi del teorema di C-L.
Mettiamo in pratica lo schema studiando un paio di esempi.
(1)
y = a(t)b(y) = ty 2
dove f (t, x) = tx2 `e definita su T I = R R.
x = 0 `e uno zero doppio della funzione x2 . Consideriamo allora i due intervalli L+ = {x > 0},
L = {x < 0}. In entrambi i casi, separando le variabili su R L ,
1
F (x) =
x
1
1
= 2,
`e una primitiva di
b(x)
x
1
A(t) = t2
2
`e una primitiva di a(t) = t. Dunque la famiglia di curve cartesiane c in R L `e definita dalle
equazioni
1
1
= t2 + c, c R .
x
2

EQUAZIONI DIFFERENZIALI I


2
`e una soluzione massimale
Su R L+ , necessariamente c > 0 e t ( c, c). Allora y =
2
ct
dellequazione e la curva integrale cio`e il suo grafico in ( c, c) R `e simmetrico rispetto allasse
delle x, convesso con un punto di minimo assoluto per t = 0 e due asintoti verticali.
Su R L , ci sono due possibili`
a:
2
`e una soluzione massimale definita su tutto R. Il suo grafico `e
se c < 0, allora y =
c t2
simmetrico rispetto allasse delle x, ha punto di minimo assoluto in t = 0, due punti di flesso
simmetrici e asintoto orizzontale x = 0 per t .

Se c 0,
allora +ci sono
due soluzioni massimali definite rispettivamente sugli intervalli J =
(, c) e J = ( c, +). I grafici sono concavi e hanno lasintoto orizzontale x = 0 per
t , e ciascuno un asintoto verticale.
Linsieme di tutte le soluzioni cos` ottenute (costanti e non costanti) hanno curve integrali due a due
disgiunte e quindi in questo caso il problema di Cauchy di esistenza e unicit`
a ha soluzione positiva.
(2)
y = a(t)b(t)

dove a(t) = t , b(x) = x se x 0, b(x) = 0 se x < 0. Allora per ogni x0 0, si ha la soluzione


costante y = x0 . Consideriamo L = {x > 0} e restringiamo lequazione su R L.

F (x) = 2 x
1 2
t
2
quindi le curve c , c R, sono definite dalle equazioni

t2 + c
x=
.
4
Si ottengono allora le soluzioni massimali secondo la formula
A(t) =

t2 + c 2
)
4
e definite per t2 + c > 0. Quindi se c > 0 sono definite su tutto R; il grafico `e simmetrico rispetto
allasse delle x, convesso con punto di minimo
assoluto int = 0. Se c 0, allora ci sono due soluzioni
definite rispettivamente su J = (, c) e J + = ( c, +). I grafici sono convessi e
y=(

lim
y(t)

t c

=0.

E chiaro che per ogni (t0 , x0 ) R R esiste una soluzione massimale che passa per (t0 , x0 ). Si verifica
infine che ci sono delle soluzioni non costanti dellequazione
su tutto R, ottenute incollando

definite
per esempio la soluzione costante y = 0 definita su ( c, c) con le due soluzioni su R L
corrispondenti alla costante c < 0. Dunque per esempio per il punto (0, 0) R R passano infinite
soluzioni massimali dellequazione.
(3) (Equazione del primo ordine associata ad una famiglia di curve dipendente da un
parametro - traiettorie ortogonali) Prima abbiamo visto come lo studio di unequazione differenziale ha dato luogo ad una famiglia di curve piane dipendenti da un parametro che fanno da supporto
alle curve integrali. A volte questa procedura pu`
o essere invertita. Mostriamo come in un paio di
esempi.
(i) Consideriamo la famiglia di ellissi data dalle equazioni cartesiane:
t2 + 2x2 = c2 , c R .
sostituiamo formalmente x = y(t) e deriviamo rispetto al tempo:
t + 2y(t)y (t) = 0
allora lequazione
y =

t
2y

EQUAZIONI DIFFERENZIALI I

`e a variabili separate e le corrispondenti curve c sono contenute nella famiglia di ellissi di partenza.
(ii) Consideriamo la famiglia di parabole
x = c(t 1)2 , c R
sostituiamo formalmente x = y(t) e deriviamo rispetto al tempo:
y(t) = c(t 1)2
y = 2c(t 1)
otteniamo lequazione
y = 2

y
t1

(iii) Ricordiamo che in generale due rette di equazione


1
x = mt, x = t, (m 6= 0
m
sono tra loro ortogonali. Allora, data una equazione
y = f (t, y)
lequazione

1
f (t, y)
ha la propriet`
a che le sue linee integrali sono ortogonali alle linee integrali della prima equazione. Se applichiamo per esempio questa considerazione allequazione associata alla famiglia di ellissi dellesempio
(i), otteniamo lequazione
2y
y =
t
che ha come famiglia di curve integrali la famiglia di parabole
y =

x = ct2 .
3.5. Altri esempi di equazioni del primo ordine. Mostreremo alcuni altri tipi di equazione del
primo ordine che con opportune manipolazioni possono essere ricondotte al caso lineare o a variabili
separate.
Nota. Negli esempi che seguono metteremo pi`
u che altro in evidenza il tipo di manipolazione e la
forma delle soluzioni. Sar`
a cura del lettore specificare i dettagli, quali per esempio gli effettivi intervalli
di definizione delle soluzioni.
(1) (Equazione di Bernoulli) E unequazione della forma
y + a(t)y = b(t)y
dove R \ {0, 1}. Facciamo formalmente la sostituzione
y(t) = u(t)v(t)
dove le due funzioni u e v sono da determinare. Sostituendo nellequazione si ottiene
u (t)v(t) + u(t)v (t) + a(t)u(t)v(t) = b(t)(u(t)v(t))
da cui
v(u + au) + v u = b(uv)
Imponiamo allora che
u + a(t)u = 0
che sappiamo risolvere perche `e lineare. Sostituendo una soluzione u = u(t) nellequazione
otteniamo
v = [b(t)u(t)1 ]v
che `e a variabili separate. Vediamo un esempio concreto:

10

EQUAZIONI DIFFERENZIALI I

y y = t y
t
lequazione lineare ausiliaria `e allora
4
u u = 0
t
che ha come soluzione particolare
u = t4
sostituendo troviamo

v =

v
t

ed infine lintegrale generale `e della forma


v = t4 ((1/2) log(t) + c)2 , c R .

(2) (Equazioni omogenee) Laggettivo omogeneo ha qui un significato diverso da quello usato
per le equazioni lineari. Infatti consideriamo equazioni della forma
y
y = g( )
t
dove
x
f (t, x) = g( )
t
`e omogenea nel senso che per ogni R, 6= 0, per ogni (t, x),
f (t, x) = f (t, x) .
Poniamo formalmente
y = tu
y = u + tu
u + tu = f (u)
f (u) u
t
che `e a variabili separate. Vediamo un esempio concreto:
u =

y = ey/t + y/t .
Poniamo
y = tu
e svolgendo i conti otteniamo
u =

eu
eu + u u
=
t
t

integrando si trova
u = log(log(c/t)), c R
ed infine
y = t log(log(c/t)), c R .

EQUAZIONI DIFFERENZIALI I

11

(3) Consideriamo unequazione della forma


y = f (at + my + c)
dove a, m, c R, m 6= 0. Poniamo formalmente
u = at + my + c, y =

u a
m

da cui sostituendo otteniamo


u a
= f (u)
m
u = mf (u) a = b(u)
che `e a variabili separate con a(t) = 1.
(4) Consideriamo equazioni della forma
a1 t + b 1 y + c1
)
a2 t + b 2 y + c2
con la condizione che a1 b2 a2 b1 =
6 0. Lalgebra lineare ci dice che il sistema lineare ordinario
y = f (

a1 + b1 = c1 , a2 + b2 = c2
nelle incognite , ha ununica soluzione (0 , 0 ). Poniamo allora formalmente
t = u + 0 , y = v + 0
sostituendo nellequazione otteniamo
v = f (

v
a1 u + b 1 v
) = g( )
a2 u + b 2 v
u

dove

a1 + b1 z 1
a2 z + b 2
dunque ci siamo ricondotti ad una equazione omogenea gi`a trattata sopra.
g(z) = z

(5) (Equazioni non in forma normale) In certi casi unequazione non in forma normale pu`
o
essere ricondotta ad equazioni in forma normale. Vediamo alcuni esempi:
(i) Supponiamo che lequazione sia della forma
y = (t)(y ) + (t)
allora introduciamo formalmente il parametro p = y , riscriviamo
y = (t)(p) + (t)
e deriviamo rispetto a t, ottenendo
p = (t)(p) + (t) (p)p + (t)
da cui

p [ (t)(p) + (t)]
(t) (p)
che `e in forma normale. Se sappiamo risolvere questa equazione in p, sostituendo troviamo le
soluzioni in y. Vediamo un caso concreto
p =

t2
2
2
t
y = p2 tp +
2
p = 2pp p tp + t
y = y 2 ty +

da cui

12

EQUAZIONI DIFFERENZIALI I

p =

2p t
=1
2p t

per cui
p = t + c, c R
y = (t + c)2 t(t + c) +

t2
t2
=
+ ct + c2 .
2
2

(ii) Consideriamo lequazione


ty 2 + 2ty y = 0
che pu`
o essere trattata come prima facendo la sotituzione p = y . Si ottiene
y = tp2 + 2tp
p = p2 + 2tpp + 2p + 2tp
da cui

p
p + p2
=
2t(1 + p)
2t
che `e a variabili separate e quindi sappiamo studiare. In questo caso potevamo anche esplicitare
y ottenendo due equazioni in forma normale e omogenee
p
p
y = 1 + 1 + y/t, y = 1 1 + y/t
p =

a condizione che t(t + x) > 0.


Risulta che le curve c sono rispettivamente della forma
p
p
( 1 + x/t 1)2 = c/t, ( 1 + x/t + 1)2 = c/t, c R

che possono essere inglobate in ununica famiglia di parabole data da


(2t + x c)2 4(t2 + tx) = 0
cio`e
(x c)2 = 4ct .
Inoltre si verifica che y = t `e anchessa una soluzione dellequazione.
4. Integrazione di campi di vettori - sistemi di equazioni del primo ordine
(Rivolto soprattutto ad un lettore particolarmente interessato.)
Riconsideriamo il campo di vettori
S : T I R2 , S(t, x) = (1, f (t, x))
gi`a introdotto quando abbiamo cominciato a studiare le equazioni del primo ordine in forma normale.
Possiamo fare la seguente manipolazione formale:
Cambiamo nome alle variabili ponendo (t, x) = (z0 , z1 ) T I = I0 I1 .
Reintroduciamo un intervallo dei tempi T .
Consideriamo
f : T (I0 I1 ) R2 , f(t, z) = S(z0 , z1 )
cos` f pu`
o essere interpretato come un campo di vettori tangenti su I0 I1 che non dipende
dal tempo. A questo campo possiamo associare lequazione differenziale vettoriale (a volte
detto anche il sistema di equazioni differenziali del primo ordine)
(z0 , z1 ) = S(z0 , z1 )
Se y = y(t) `e una soluzione dellequazione differenziale originale, allora (t, y(t)) `e una soluzione
dellequazione vettoriale associata.

EQUAZIONI DIFFERENZIALI I

13

Queste considerazioni ci fanno concludere che la situazione pi`


u generale in cui intervengono equazioni
differenziali del primo ordine (in forma normale) `e la seguente. Si considera una funzione continua
f : T (I1 In ) I1 In
che interpretiamo come un campo di vettori tangenti su I1 In dipendente dal tempo. Abbiamo
lequazione differenziale vettoriale (equivalentemente, il sistema di equazioni) associata:
(y1 , . . . , yn ) = f (t, y1 , . . . , yn ) .
Una soluzione y = (y1 , . . . , yn ) : J Rn `e definita su un sotto-intervallo aperto J di T e per ogni
t J verifica
y (t) = (y1 (t), . . . , yn (t)) = f (t, y1 (t), . . . , yn (t)) .
Il grafico G(
y ) in J (I1 In ) `e una curva integrale dellequazione. Inoltre facendo la sospensione
di f , possiamo riformulare lequazione in modo equivalente nei termini di unaltra equazione vettoriale
associata ad un campo di vettori tangenti su T (I1 In ) = (I0 I1 In ) che non dipende
dal tempo.
4.1. Sui sistemi di equazioni differenziali del primo ordine lineari. Sia A(t) = (ai,j (t))i=1,...,m;j=1...,n )
una matrice m n dove ogni entrata `e una funzione continua definita sullintervallo T . Sia B(t) =
(b1 (t), . . . bm (t))t un vettore colonna con m righe, dove ogni bj (t) `e continua definita su T . Allora un
sistema di equazioni differenziali del primo ordine di tipo lineare `e della forma
y + A(t)y = B(t)
dove y = (y1 , . . . yn )t : T Rn . Si pu`
o verificare che lo spazio vettoriale delle soluzioni del sistema
omogeneo associato
y + A(t)y = 0
ha dimensione uguale a n. La cosa `e particolarmente semplice da verificare se A(t) `e diagonale; infatti
in tal caso ci riconduciamo ad un sistema di equazioni indipendenti in una variabile
yj + aj,j (t) = 0
che sappiamo trattare completamente. Una base dello spazio delle soluzioni sar`a formata dalle funzioni
di Rn . Per trovare una
a valori vettoriali yj = eAj,j ej , dove ej `e il j-esimo vettore della base canonica X
0
Cj (t)yj (t) (metodo
soluzione particolare del sistema non omogeneo, la cerchiamo della forma y =
j

della variazione delle costanti arbitrarie). Se A(t) `e diagonalizzabile (se per esempio A(t) = A `e
costante ritroviamo la nozione abituale di matrice diagonalizzabile del corso di algebra lineare), allora
possiamo ricondurci al caso diagonale per mezzo di un cambiamo globale di coordinate.

15 Dicembre 2014
Equazioni differenziali lineari.

Indice
1 Introduzione.

2 Dimensione dello spazio delle soluzioni di una equazione lineare


omogenea.
3
3 Equazioni lineari del secondo ordine.

4 Caso Generale Omogeneo.


4.1 Un caso particolare. . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Caso generale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5
6
6

5 Ricerca di una soluzione particolare.


5.1 Metodo della variazione delle costanti arbitrarie. . . . . . . . . . .
5.2 Alcuni casi speciali. . . . . . . . . . . . . . . . . . . . . . . . . . .

7
7
10

6 Appendice:Massimo Comun Divisore e Teorema di Bezout.

11

Introduzione.

In questa nota esponiamo alcuni metodi per il trattamento delle equazioni differenziali ordinarie lineari di ordine qualsiasi, omogeneee e non omogeneee, cio`e
delle equazioni del tipo
y (n) + an1 (t)y (n1) + + a0 (t)y = b(t).
Anche se particolare rilievo sar`a dato al caso in cui i coefficenti sono costanti,
cio`e quando gli ai sono numeri reali, alcune cose, come ad esempio la ricerca di
soluzioni particolari, valgono anche quando le ai non sono costanti ma funzioni
della variabile t.
Il caso delle equazioni al primo ordine, lineari o no, `e stato ampiamente trattato
nella Nota [EquaD1] a cui faremo sempre riferimento.
Inizieremo quindi con il caso delle equazioni lineari del secondo ordine a coefficienti costanti, caso che per liportanza delle sue applicazioni (oscillatori, moto armonico etc.) trattiamo direttamente, senza formalmente fare ricorso esplicito ad
argomenti di Algebra Lineare, anche se perfettamente deducibile dalla trattazione
generale.
Questo ed il caso del primo ordine renderanno, forse, pi`
u chiare alcune procedure
che vedremo subito dopo in cui faremo ricorso sistematicamente ad argomenti di
Algebra Lineare introdotti nel corso parallelo di Geometria: vedremo infatti che
lAlgebra Lineare fornisce un ottimo linguaggio e ottimi metodi per trattare le
equazioni differenziali lineari, in particolar modo quelle a coefficienti costanti,e
che le analogie nel linguaggio fin qui incontrate hanno una loro ragion dessere.
Osserviamo ad esempio che la funzione eax `e un autovettore di autovalore a della
derivazione pensata come applicazione lineare di un opportuno spazio vettoriale in
se. Non stupisce quindi, pensando ai teoremi di diagonalizzazione e agli argomenti
collegati, che tali funzioni abbiano un ruolo cos` importante.
In effetti abbiamo visto nel caso del primo ordine e vedremo in quello del secondo
che una base dello spazio delle soluzioni viene espressa in termini appunto di
queste funzioni.
Dovrebbe essere anche chiaro a questo punto del corso il perche convenga trattare per prima cosa il caso omogeneo e poi quello generale: tra i vari metodi
per la ricerca di una soluzione particolare illustreremo qui principalmente quello
detto della variazione delle costanti arbitrarie, che `e stato gi`a incontrato nel caso
dellequazione lineare di ordine 1.
Ci serviranno anche alcune nozioni come quella di Massimo Comun Divisore
tra polinomi che lo studente dovrebbe aver gi`a incontrato ma che in ogni caso
richiameremo in una appendice.

Dimensione dello spazio delle soluzioni di una


equazione lineare omogenea.

Si `e gi`a visto che nel caso di una equazione lineare omogenea (sia che i coefficienti siano costanti sia che non lo siano) linsieme delle soluzioni ha una struttura
di spazio vettoriale, precisamente `e un sottospazio vettoriale dello spazio delle funzioni differenziabili fino a un determinato ordine definite su un insieme
D. Vogliamo mostrare che tale spazio ha dimensione finita, pari allordine n
dellequazione. 1
Consideriamo il problema di Cauchy

y (n) + an1 (t)y (n1) + + a0 (t)y = 0

y(x0 ) = 1
y 0 (x0 ) = 0

...

y (n1) (x ) = 0
0
Tale problema ammette una sola soluzione che indicheremo con w1 ; analogamente
indichiamo con wi la soluzione del problema

y (n) + an1 (t)y (n1) + + a0 (t)y = 0

y(x0 ) = 0

y (x0 ) = 0
...

y (i1) (x0 ) = 1

...

y (n1) (x ) = 0
0
Abbiamo cos` individuato n funzioni {w1 , w2 , . . . , wn } che sono linearmente indipendenti; infatti una eventuale relazione di dipendenza lineare si trasferirebbe per
la linearit`a della derivazione, in una relazione di dipendenza lineare dei vettori
1

Attenzione. Si faccia attenzione al fatto che talvolta nel seguito con la stessa scrittura si
indicano cose dal significato profondamente diverso. Quando, ad esempio, si vuol provare che
le funzioni et e e2t sono linearmente indipendenti come elementi dello spazio vettoriale C (R),
significa che si vuol provare che se c1 , c2 sono due costanti tali che c1 et + c2 e2t = 0 allora ci = 0.
Lo 0 che compare nella scrittura indica lo 0 dello spazio vettoriale, cio`e la funzione nulla. Si
vuol provare quindi che se per ogni t in R c1 et + c2 e2t = 0 allora ci = 0 e NON si vuol risolvere
lequazione c1 et + c2 e2t = 0 nella incognita t, cosa che significherebbe provare che esistono dei
t in R per cui c1 et + c2 e2t = 0.

w1 (x0 )
w10 (x0 )
...
(n1)
w1
(x0 )

w2 (x0 )
w20 (x0 )
...
(n1)
w2
(x0 )

,......,

wn (x0 )
wn0 (x0 )
...
wn(n1) (x0 )

che invece sono palesemente indipendenti per costruzione.


Analogamente si vede che tali funzioni formano anche un sistema di generatori.
Se infatti w `e una qualsiasi
Xsoluzione dellequazione omogenea, indicate con i =
(i1)
w
(x0 ) si ha che w e
i wi sono soluzioni dello stesso problema di Cauchy

y (n) + an1 (t)y (n1) + + a0 (t)y = 0

y(x0 ) = 1

y (x0 ) = 2
...

y (i1) (x0 ) = i

...

y (n1) (x ) =
0
n
e quindi, per lunicit`a della soluzione, coincidono.

Equazioni lineari del secondo ordine.

In questo paragrafo tratteremo le equazioni del secondo ordine lineari a coefficienti


costanti. Anche se gli argomenti usati non si discosteranno molto da quelli per il
caso generale del paragrafo successivo, formalmente qui non useremo argomenti
di Algebra Lineare e quindi la cosa sar`a accessibile anche agli studenti che non
hanno quelle nozioni.
Partiamo dunque da una equazione del tipo
ay 00 + 2by 0 + cy = 0
e come nel caso lineare vediamo se esistono soluzioni del tipo y = ekt . Sostituendo
nella equazione otteniamo che una tale soluzione esiste se k verifica la relazione
ak 2 + 2bk + c = 0
Questa equazione di secondo grado ha, a seconda del segno del suo discriminante
= b2 ac 2 soluzioni reali o complese coniugate o due soluzioni coincidenti nel
caso che il discriminante sia uguale a 0.
Nel caso > 0 se indichiamo con k1 e k2 le due radici reali, lequazione di partenza
avr`a due soluzioni ek1 t e ek2 t ed ogni altra soluzione sar`a del tipo c1 ek1 t + c2 ek2 t .
4

Nel caso che le due radici k1 e k2 coincidano nella radice k `e facile vedere con
una verifica diretta che oltre alla soluzione ekt anche la funzione tekt `e soluzione.
Tale funzione pu`o esser vista, tramite il teorema dellHospital come il limite
ek2 t ek1 t
al tendere di k2 a k1 .
dellintegrale particolare
k2 k1
Resta il caso del negativo. Cerchiamo una soluzione del tipo f (t)ekt . La
derivata di y = f ekt `e f 0 ekt + kf ekt e la derivata seconda `e f 00 ekt + 2kf 0 ekt + k 2 f ekt
per cui sostituendo nellequazione otteniamo
a(f 00 ekt + 2kf 0 ekt + k 2 f ekt ) + 2b(f 0 ekt + kf ekt ) + cf ekt =
= ekt (af 00 + 2(ak + b)f 0 + ak 2 + 2kb + c).
b
b
otteniamo che la funzione f e a t verifica la nostra
a
b2 + ac
equazione differenziale se la funzione f `e tale che f 00 +
f = 0. Detto
a2
2
b + ac
soluzioni di f 00 = 2 f sono f = cos t e f = sin t.
2 =
2
a
Per cui una soluzione generale della equazione omogenea si ottiene

Quindi prendendo k =

(c1 cos t + c2 sin t)e a t


r

b2 + ac
a2
Si poteva giungere a questa espressione delle soluzioni anche ricordando lespressione dellesponenziale complesso

con =

e+i = e (cos + i sin ).


In questo caso le radici del polinomio caratteristico sonocomplesse e coniugate e
quindi anche
ei = e (cos i sin )
`e soluzione.

b
b2 + ac
Le due radici del polinomio caratteristico in questo caso sono k1 = +i
a
a

b2 + ac
b
e k2 = i
per cui sommando e sottraendo le due espressioni
a
a
riotteniamo le due soluzioni gi`a trovate.

Caso Generale Omogeneo.

In questo paragrafo trattiamo il caso di una equazione del tipo


y (n) + an1 y (n1) + + a0 = 0.
5

L osservazione a pag. 2 della Nota EquazioniDifferenzialiI ci permette di usare


metodi di algebra lineare. Se V `e uno spazio vettoriale,
X L una applicazione lineare
di V in se e p un polinomio nella variabile T ,p(T ) =
ai T i , con p(L) intendiamo
X
lapplicazione lineare
ai Li , ove con Li si intende la iterazione dellapplicazione
L i volte: Li = L L . . . L2 . Nel seguito applicheremo questa osservazione al
caso in cui V `e lo spazio delle funzioni da R a R con tutte le derivate continue
df
. Ad esempio partendo dal
e L lapplicazione lineare di derivazione D : f
dx
2
polinomio 3T + 2 possiamo associargli loperatore differenziale tra V e V dato
da 3D2 + 2Id, loperatore cio`e che ad ogni funzione f V associa la funzione
d2
3 2 f + 2f .
dx

4.1

Un caso particolare.

Iniziamo con loperatore (D aI)m f . Per caratterizzarne il nucleo osserviamo


che
(D aI)m f = eat Dm (eat f )
cosa che si dimostra molto facilmente per induzione.
Quindi Va = ker(D aI)m = {f |(D aI)m f = 0} = {f |eat Dm (eat f ) = 0} =
{f |Dm (eat f ) = 0}. Ci`o significa che la funzione eat f `e un polinomio di grado
minore di m, quindi Va `e lo spazio generato dalle funzioni
eat , teat , . . . , tm1 eat .
Resta da provare che queste funzioni sono linearmente indipendenti ma questa `e
una facile verifica.

4.2

Caso generale.

Per trattare il caso di un operatore associato a un polinomio generale P (T ) R[T ]


possiamo ricorrere alla usuale scomposizione del polinomio in fattori
P (T ) = (T a1 )m1 (T ah )mh
ove come al solito le ai sono le radici (complesse) del polinomio e mi le loro
molteplicit`a.3
Nella sezione precedente abbiamo descritto gli spazi Vai : ora vogliamo descrivere
lo spazio V = ker P (D).
Osserviamo preliminarmente che benche il prodotto di due operatori lineari non
sia commutativo (AB 6= BA) tuttavia risulta
2

L0 = Id
Il lettore in possesso delle opportune nozioni di algebra lineare riconoscer`a il parallelismo
tra il procedimento espsoto e la prova del teorema di Jordan.
3

Proposizione 4.1 Con le notazioni precedenti si ha


p(A)q(A) = q(A)p(A)
Essendo p e q polinomi, basta osservare che Ap(A) = p(A)A
Teorema 4.2
V = Vai
Per provare questo risultato abbiamo bisogno di una relazione nota come identit`a di Bezout e per la cui prova, una semplice conseguenza dellalgoritmo che
permette di calcolare il Massimo Comun Divisore tra due polinomi, rimandiamo
allappendice a questa Nota.
Teorema 4.3 Siano p e q due polinomi coprimi in R[T ], cio`e MCD (p, q) = c
con c R \ 0. Allora esistono due polinomi , R[T ] tali che p + q = 1
Questo risultato permette di dimostrare il teorema ?? nel caso di un polinomio
con due sole radici. Lasciamo al lettore il caso generale, facendo un minimo
attenzione alla definizione di somma diretta di piu spazi vettoriali.
Il teorema di Bezout ci dice che se p1 = (T a1 )m1 e p2 = (T a2 )m2 e p =
p1 p2 poiche (p1 , p2 ) = 1, risulta immediatamente Vp = Vp1 Vp2 . Infatti da
p1 +p2 = 1 si ha, detti f1 = (D)p1 (D)(f ) e f2 = (D)p2 (D)(f ) che f = f1 +f2
e f1 V2 , f2 V1
Resta da dimostrare che V1 V2 = {0}. Ma ancora lidentit`a di Bezout applicata
ad un vettore w V1 V2 ci dice che w = 0.
Lasciamo al lettore la cura di mettere a posto i dettagli del caso generale.

5
5.1

Ricerca di una soluzione particolare.


Metodo della variazione delle costanti arbitrarie.

Riprendiamo in questo paragrafo il procedimento per la ricerca di una soluzione


particolare gi`a visto nel caso delle equazioni del primo ordine, detto metodo della
variazione delle costanti arbitrarie.
Punto di partenza `e dunque una equazione del tipo
y (n) + an1 y (n1) + + a0 y = b(t) ()
di cui si conoscono n integrali y1 , y2 , . . . , yn dellequazione omogenea associata,
cio`e per ogni i = 1, . . . , n si ha
(n)

yi

(n1)

+ an1 yi

+ + a0 yi = 0.

Sappiamo che ogni soluzione y dellequazione omogenea `e combinazione lineare a


n
X
coefficienti costanti ci delle funzioni yi , y =
ci yi .
i=1

Come abbiamo gi`a fatto per le equazioni del primo ordine, cerchiamo se esiste
una soluzione particolare della (**) ottenuta come combinazione lineare delle yi
a coefficienti funzioni ci (t) della stessa classe delle yi .
n
X
Derivando la y =
ci (t)yi otteniamo
i=1
0

y =

n
X

c0i yi + ci yi0 .

i=1

Se imponiamo la condizione

n
X

c0i yi = 0 otteniamo per la derivata seconda delle

i=1

yi una espressione
00

y =

n
X

c0i yi0 + ci yi00 .

i=1

Ripetiamo il procedimento: imponiamo che le

c0i

verifichino

n
X

c0i yi0 = 0 e otte-

i=1

niamo per le derivate di ordine 3 delle yi


y (3) =

n
X

(2)

(3)

c0i yi + ci yi .

i=1

Ripetiamo il procedimento fino ad ottenere


y

(n1)

n
X

(n1)

ci y i

i=1

con

n
X

((n2)

c0i yi

= 0 e finalmente per la derivata n-esima

i=1

(n)

n
X

(n)

ci yi

(n1)

+ c0i yi

i=1

Sostituiamo ora i valori trovati per y, y 0 , . . . , y n nellequazione di partenza. Otteniamo


n
X

(n1)

c0i yi

(n)

+ ci yi

(n1)

+ an1 ci yi

+ . . . + an c i y i =

(n1)

+ . . . + an yi ) = b(t)

i=1

n
X

(n1)

c0i yi

(n)

+ ci (yi

+ . . . + an1 yi

i=1

Ricordando che ognuna delle yi `e soluzione della equazione omogenea, otteniamo


n
X
che una condizione affinche
ci yi sia una soluzione dellequazione non omogenea
i=1

`e

n
X

(n1)

= b(t).

+
+
...
+
+

. . . + c0n yn
. . . + c0n yn0

c0i yi

i=1

c0i (t)

verificano
Quindi se le
0
+
c1 y 1

0 0

+
c1 y 1
...

0 (n2)

cy
+

01 1(n1)
c1 y 1
+
le

n
X

il sistema
c02 y2
c02 y20
(n2)

c02 y2
(n1)
c02 y2

=
=

0
0

. . . + c0n yn(n2) = 0
. . . + c0n yn(n1) = b(t)

ci yi sono una soluzione dellequazione non omogenea.

i=1

Ai fini della risoluzione del sistema diventa interessante quindi lo studio del
determinate W (t) 4 della matrice dei coefficienti


y1
y2
...
yn

y10
y20
...
yn0



... ...
(n1) (n1)

(n1)
y
.
.
.
y
y
2
1
n
Questo determinante ha la propriet`a che se si annulla in un punto dellintervallo
di definizione dellequazione si annulla ovunque: questa `e una conseguenza immediata del teorema della unicit`a della soluzione ma si pu`o vedere anche in questo
modo. Deriviamo W (t): la derivata di un determinante D di ordine n, per la
regola della derivazione di un prodotto, `e la somma di n determinanti Di ove il
determinante Di ha le righe uguali a quelle di D tranne la i esima che `e derivata.
Osserviamo inoltre che nel caso di W tutti questi determinanti hanno due righe
uguali e pertanto sono nulli tranne lultimo che ha lultima riga composta dalle
derivate n-esime delle yi . Rimpiazzando queste ultime con le loro espressioni derivate dalla equazione di partenza, otteniamo di nuovo una somma di determinanti
tutti nulli (hanno due linee uguali) ad eccezione di




y
y
.
.
.
y
1
2
n


0
0
0


y1
y2
...
yn
0


W =

.
.
.
.
.
.


(n1)
(n1)
(n1)
a1 y

a1 y2
. . . a1 yn
1
4

Questa matrice prende il nome di Wronskiano dal matematico polacco Josef Hoene-Wronski.

cio`e il determinante W verifica l equazione differenziale


W 0 = a1 W,
R

equazione che integrata fornisce la cosiddetta formula di Liouville W = ce a1 dt .


Da ci`o otteniamo di nuovo che se W = 0 in un punto allora la costante c sar`a
nulla e quindi il determinante sar`a nullo ovunque.

5.2

Alcuni casi speciali.

Quando la funzione `e di qualche classe particolare i conti del paragrafo precedente possono semplificarsi in modo notevole. Questo accade quando la funzione
f (t) che `e al termine noto, appartiene a una classe in un certo senso chiusa per
derivazione.Vediamo di spiegare la cosa su degli esempi.
Distinguiamo innanzitutto se la f (t) sia o meno soluzione dellequazione omogenea
f (t) non `e soluzione dellequazione omogenea.
Esemplifichiamo il procedimento su un esempio concreto di f (t) prendendo f del
tipo a cos t + b sin t. Supponiamo cio`e di avere una equazione del tipo
F (y, y 0 , . . . , y (n) ) = a cos t + b sin t
ove F `e una funzione lineare nelle y (i) a coefficienti costanti. Le derivate di f
saranno una combinazione lineare delle due funzioni cos t e sin t. Pertanto
se cerchiamo una soluzione y del tipo c1 cos t + c2 sin t, la F calcolata per
una tale y risulter`a una combinazione lineare delle funzioni sin t e cos t e la
relazione F f = 0 si tradurr`a in una relazione di dipendenza lineare per queste
due funzioni. Il fatto che queste due funzioni siano linearmente indipendenti
implicher`a lannullarsi dei coefficienti della combinazione lineare otenuta e quindi
delle condizioni sulle costanti ci .
Vediamo su un esempio.
F = y 0 y = sin 5t
Chiaramente la funzione sin 5t non `e soluzione dellequazione omogenea. Provando a cercare una soluzione del tipo c1 cos 5t + c2 sin 5t otteniamo
5c1 sin 5t + 5c2 cos 5t c1 cos 5t c2 sin 5t = sin 5t
(c1 + 5c2 ) cos 5t + (5c1 c2 1) sin 5t = 0
Ricordando quanto detto nella nota 1 si ha che lindipendenza delle due funzioni
cos 5t e sin 5t implica
(
c1 + 5c2 = 0
5c1 c2 = 1
10

1
5
Quindi la funzione y = cos 5t sin 5t `e una soluzione particolare dellequa26
26
zione data.
Un tale procedimento si pu`o ripetere in modo analogo quando la funzione f (t) `e
un polinomio p(t) o una funzione esponenziale aebt o prodotti di funzioni di questo
tipo, cio`e per funzioni di tipo p(t)ebt , (a cos t+b sin t)p(t), (a cos t+b sin t)ebt .
La cosa importante `e che queste funzioni abbiano derivate dello stesso tipo, cio`e
che queste funzioni appartengano ad uno sottspazio (di dimensione finita) che
loperatore derivazione porta in se stesso, cio`e un sottospazio invariante per loperatore derivazione. La funzione con cui si fa il tentativo non `e altro che lelemento generico di tale sottospazio invariante. Pertanto nei vari casi la funzione
modello per una soluzione particolare sar`a della stessa forma della funzione f ,
cio`e rispettivamente una combinazione lineare di seni e coseni di t, un polinomio
dello stesso grado di f , un polinomio per un esponenziale con lo stesso esponente
etc.
f (t) `e soluzione dellequazione omogenea.
Se la funzione f (t) `e soluzione dellequazione omogenea questo procedimento
presenta degli inconvenienti.
Enunciamo un risultato che `e facile verificare in modo sperimentale, rinunciando
in questa sede a una spiegazione approfondita del fenomeno, spigazione che forse
esula dalla trattazione elementare fin qui data.
Nel caso che la f sia soluzione dellequazione omogenea caratteristica, indichiamo
con m la molteplicit`a della radice corrispondente nellequazione caratteristica:
cerchiamo una soluzione particolare dello stesso tipo di quelle cercate nei vari
casi quando la f non era soluzione dellomogenea, moltiplicata per un fattore tm .
Come abbiam detto lo studente pu`o verificare sperimentalmente la validit`a dellaffermazione di cui rinunciamo in questa sede a dare una spiegazione teorica.

Appendice:Massimo Comun Divisore e Teorema di Bezout.

Richiamiamo qui brevemente lalgoritmo della divisione euclidea, alcune sue conseguenze come la ricerca del Massimo Comun Divisore insieme a qualche applicazione. Ricordiamo che dati due numeri naturali o interi a, b si definisce Massimo
Comun Divisore di a e b e lo si indica con (a, b) un intero d tale che
d divide sia a che b
se d0 divide sia a che b allora d0 divide d.
Da questo segue immediatamente che se d e d0 sono due MCD allora debbono
dividersi vicendevolmente, cio`e d = hd0 e d0 = kd per cui d = hkd da cui hk = 1
11

che in Z significa h = k = 1 e quindi d = d0 . Iniziamo richiamando il teorema


di divisione di Euclide.
Teorema 6.1 (Divisione con resto) Dati due numeri interi a, b Z con b 6= 0,
esistono e sono unici due numeri interi q, r tali che a = bq + r e 0 r < |b|.
Esistenza. Consideriamo linsieme A = {a nb, n Z}. Poiche il sottoinsieme
dei naturali A N `e non vuoto, ha un minimo r. Quindi r = a bq per qualche
q Z. Un tale r risulta senza dubbio 0. Supponiamo ora che r |b|. Allora
a|b| = bq +r |b| da cui a|b|qb = r |b| e questo implica ab(q 1) = r |b|
Avendo supposto r |b| abbiamo che ab(q1) 0. Ma essendo 0 ci`o significa
che ab(q 1) AN. Questo genera un assurdo perche ab(q 1) = r|b| < r
e r era stato scelto come il minimo.
Unicit`a. Supponiamo che vi siano due coppie (qi , ri ) che soddisfino le due condizioni. Abbiamo
a = q1 b + r1 = q2 b + r2
Se r1 6= r2 , sia r1 > r2 quindi 0 < r1 r2 < |b|
Sottraendo le due equazioni membro a membro otteniamo
b(q2 q1 ) = r1 r2
cio`e
|b|(q2 q1 )| = |r1 r2 |.
Osserviamo che q2 q1 6= 0 implica |b|(q2 q1 )| |b|
Ma |r1 r2 | < |b|. Contraddizione. Quindi q1 = q2 e di conseguenza r1 = r2 .
La condizione |r| < |b| `e essenziale per lunicit`a di q e r: senza tale condizione
lunicit`a viene sicuramente meno potendosi sempre scrivere m = 0n + m.
Lalgoritmo di divisione di Euclide permette di costruire un algoritmo per la ricerca del MCD tra due numeri interi. Applichiamo infatti lalgoritmo di divisione
euclidea a due interi m, n che per semplicit`a supporremo positivi.
m = nq0 + r0
Ripetiamo la procedura dividendo n per r0
n = r0 ql + r1
e cos` via
r0 = r1 q2 + r2
r1 = r2 q3 + r3
...

12

fino ad ottenere resto 0


rk1 = rk qk+1 + rk+1
rk = rk+1 qk+2 + 0
Allora d = rk+1 `e il MCD (m,n). Infatti risulta immediato verificare, risalendo le
divisioni che d divide sia m che n e che se d0 divide sia m che n allora seguendo
in modo discendente sempre lalgoritmo di divisione euclidea risulta che d0 divide
d. Quindi d `e ilMCD tra m e n.
Ripercorrendo in senso ascendente la successione di tali divisioni si vede che
esistono due numeri interi (non necessariamente naturali) e tali che d =
rk+1 = m + n.
Tutto questo pu`o essere ripetuto mutatis mutandis per il caso di due polinomi a
coefficienti reali o complessi con la condizione che il resto della divisione sia di
grado minore del divisore.
Abbiamo il concetto di divisibilit`a, e usando appunto il grado al posto del modulo
possiamo ripetere la divisione euclidea e quindi lalgoritmo che ci da il MCD. Tra
laltro avremo il teorema di Bezout che enunciamo
Teorema 6.2 Siano p, q due polinomi non nulli con (p, q) = d. Esistono polinomi
, tali che p + q = d
Per provarlo basta ripercorrere a ritroso lalgoritmo di Euclide.
Abbiamo visto allinizio della Nota una applicazione del Teorema di Bezout
alla decomposizione di uno spazio vettoriale in sottospazi invarianti. Una altra applicazione interessante `e alla decomposizione di Hermite di una funzione
razionale.
Iniziamo con quello che viene detto sviluppo adico di un polinomio. Dato un
polinomio p R[x], R esistono costanti c0 , c1 , . . . , ck tali che p = c0 + c1 (t
) + c2 (t )2 + c3 (t )3 + . . . + ch (t )h . Basta scrivere il polinomio come
p((t ) + ) ed esplicitare lespressione. Osserviamo in pi`
u che tale scrittura `e
unica. Siano infatti
p = c0 + c1 (t ) + c2 (t )2 + c3 (t )3 + . . . + ch (t )h
p = d0 + d1 (t ) + d2 (t )2 + d3 (t )3 + . . . + dh (t )h
due tali scritture. Sottraendo membro a membro otteniamo
0 = c0 d0 + (c1 d1 )(t ) + (c2 d2 )(t )2 + . . . + (ch dh )(t )h
e se r `e il pi`
u piccolo intero per cui cr dr `e non nullo otteniamo
0 = (t )r ((cr dr ) + + (cn dn )(t )nr )
Da cui (cr dr ) + + (cn dn )(t )nr = 0 da cui ponendo t = otteniamo
cr = d r .
Un altro modo `e di considerare il fatto che i coefficienti ci sono determinati a
meno di un fattoriale dai valori delle derivate di p in .
13

Corollario 6.3 Sia p R[t], R ed m un intero positivo. Allora esistono


b1 , b2 , . . . , bm R e g(t) R[t]tali che
p(t)
bm
bm1
b1
+ g(t)
=
+
+
.
.
.
+
(t )m
(t )m (t )m1
(t )
Basta dividere ogni termine nella espressione precedente per (t )m . Si osservi
anche che le costanti bi sono univocamente determinate.
Consideriamo ora una funzione razionale f rapporto di due polinomi che pensep
remo senza fattori a comune, cio`e f = con (p, q) = 1.
q
Supponiamo che q = q1 q2 con (q1 , q2 ) = 1 Dal teorema di Bezout otteniamo che
esistono a1 , a2 tali che a1 q1 + a2 q2 = 1 da cui
1
1
a1 q 1 + a2 q 2
a1 a1
=
=
=
+ .
q
q1 q2
q1 q2
q2
q1
Il lettore avr`a riconosciuto la decomposizione usata per calcolare lintegrale di
1
. Con questi metodi otteniamo il seguente risultato
finzioni del tipo
(t a)(t b)
h(t)
una funzione razionale espressa come quoziente di due
k(t)
polinomi a coefficienti complessi. Sia

Teorema 6.4 Sia

k(t) = (t 1 )m1 (t r )mr


la fattorizzazione di k(t) tramite le sue radici distinte. Allora esistono in C[t]
polinomi h1 , . . . , hr (t) tali che
h1 (t)
h(t)
h2 (t)
hr (t)
+
+ ... +
,
=
m
m
1
2
k(t)
(t 1 )
(t 2 )
(t r )mr
Dai ragionamenti fin qui fatti deduciamo che se abbiamo una funzione razionale
h
h
con k1 e k2 primi tra loro, abbiamo una scomposizione
=
del tipo
k1 k2
k1 k2
h1 h2
+
k2
k1
Applicando questa osservazione ai polinomi k1 (t) = (t 1 )m1 e k2 (t) = (t
2 )m2 (t r )mr otteniamo
h(t)
h1
=
+ R1 (t)
k(t)
(t 1 )m1
dove R1 `e una funzione razionale il cui denominatore `e k2 . Iterando il procedimento arriviamo alla decomposizione voluta.
Abbiamo cos` ritrovato la decomposizione di Hermite usata per il calcolo di
integrali di funzioni razionali.
14

October 28, 2014


` TOPOLOGICHE
SOTTOINSIEMI DI R: NOZIONI E PROPRIETA

Questa `e una dispensa di servizio nel senso che altre dispense faranno in vario modo riferimento
alle nozioni qui introdotte. Le affermazioni che non saranno giustificate potrebbero esserlo per (utile)
esercizio.
Intervalli. Si tratta dei sottoinsiemi I di R non vuoti e che verificano la seguente propriet`
a:
Se a, b I, a b allora {x R| a x b} I.
Nella pratica si distinguono vari tipi di intervallo I:
(Intervalli limitati) Esistono a, b R, a b tali che
I := {x R| a?x?b}
dove i due simboli ? possono assumere indipendentemente sia il significato < sia . Si
distinguono allora diversi sottocasi:
- I limitato e aperto cio`e della forma I = (a, b) = {a < x < b}, dove a < b;
- I chiuso e limitato cio`e della forma I = [a, b] = {a x b}, dove a b; se a = b si ha il
caso degenere in cui I = {a} consiste di un solo punto.
- I limitato e semiaperto a destra (risp. sinistra) cio`e della forma I = [a, b) = {a x < b}
(risp. I = (a, b] = {a < x b}), dove a < b.
(Intervalli illimitati) Si tratta delle semirette aperte o chiuse, illimitate a destra o a sinistra,
oppure di tutta la retta reale R. Per esempio I della forma I := (a, +) := {x R| a < x}
`e una semiretta aperta illimitata a destra; invece I := (, b] := {x R| x b} `e una
semiretta chiusa illimitata a sinistra.
Sistema di intorni di un punto. Per ogni R, > 0, per ogni punto x0 R, indicheremo con
I(x0 , ) lintervallo aperto di centro in x0 e raggio definito:
I(x0 , ) := {x R| x0 < x < x0 + }
oppure equivalentemente:
I(x0 , ) := {x R| |x x0 | < } .
I(x0 , ) `e detto lo -intorno aperto di x0 . Al variare di > 0, gli I(x0 , ) formano il sistema (fondamentale) di intorni aperti di x0 in R. Si osserva che:
Se < allora I(x0 , ) I(x0 , ), in effetti `e strettamente contenuto.
Se x2 I(x0 , 0 ) I(x1 , 1 ) allora esiste 2 > 0 tale che
I(x2 , 2 ) I(x0 , 0 ) I(x1 , 1 ) .
Per ogni I(x0 , ) esiste n N, n > 0, tale che 1/n < e quindi I(x0 , 1/n) I(x0 , ).
Se x0 6= x1 , allora esiste > 0 tale che I(x0 , ) I(x1 , ) = (basta prendere per esempio
= |x0 x1 |/3).
Sottoinsiemi aperti di R. X R `e un sottoinsieme aperto di R se per ogni x0 X, esiste > 0
tale che I(x0 , ) X. Per esempio:
- R `e un sottoinsieme aperto perche la propriet`
a da verificare `e vuota ( non ha elementi).
- R R `e un sottoinsieme aperto. Pi`
u in generale un intervallo (limitato o illimitato) aperto secondo
la terminologia relativa agli intervalli introdotta in precedenza, `e anche un sottoinsieme aperto di R
secondo la definizione generale.
- Un intervallo chiuso (limitato o illimitato) diverso da R non `e un aperto.
Si osserva che:
Se A e B sono aperti di R allora anche A B e A B sono aperti.
Parte interna di un sottoinsieme di R. Dati x0 X R, x0 `e un punto interno di X se esiste
> 0 tale che I(x0 , ) X. La parte interna di X (indicata con Int(X) X) consiste dei punti interni

` TOPOLOGICHE
SOTTOINSIEMI DI R: NOZIONI E PROPRIETA

di X. Dunque X R `e un aperto di R se e solo se coincide con la sua parte interna (X = Int(X)).


Per esempio:
- Se I = [a, b], a < b `e un intervallo chiuso e limitato, allora la sua parte interna coincide con lintervallo
aperto (a, b).
- La parte interna di N R `e vuota.
Punti di accumulazione di un sottoinsieme di R. Siano X R, x0 R (non stiamo richiedendo
che x0 X). Si dice che x0 `e un punto di accumulazione per X se per ogni > 0,
(I(x0 , ) \ {x0 }) X 6= .
Si osserva che:
Se nella definizione non avessimo eliminato x0 dagli intervalli I(x0 , ), allora ogni x0 X
sarebbe stato di accumulazione per X. Invece con la definizione che abbiamo adottato, per
esempio N R non ha alcun punto di accumulazione in R.
Se X `e un aperto non vuoto di R, allora ogni x0 X `e di accumulazione per X. Infatti
si consideri un arbitrario I(x0 , ). Poiche X `e aperto esiste > 0 tale che I(x0 , ) X.
Poniamo = min(, ). Allora I(x0 , ) \ {x0 } `e non vuoto e tutto contenuto in X.
Per esempio, se I = (a, b) `e un intervallo limitato aperto, allora a e b non appartengono ad I
e sono entrambi punti di accumulazione per I.
Nelle solite ipotesi x0 `e di accumulazione per X se e solo se per ogni n N \ {0},
(I(x0 , 1/n) \ {x0 }) X 6= .
Un implicazione `e evidente perche gli I(x0 , 1/n) sono particolari intorni di x0 e la definizione
di punto di accumulazione riguarda tutti gli -intorni di x0 . Viceversa, sia I(x0 , ) un arbitrario
-intorno di x0 . Sappiamo che esiste n > 0 tale che I(x0 , 1/n) I(x0 , ). Per ipotesi
(I(x0 , 1/n) \ {x0 }) X 6=
e dunque la stessa cosa vale anche per I(x0 , ).
Caratterizzazione per mezzo delle successioni. Usando il punto precedente e quanto sviluppato
nella dispensa [SUCCESSIONI], si pu`
o facilmente ottenere la seguente caratterizzazione dei
punti di accumulazione:
Nelle solite ipotesi, x0 R `e di accumulazione per X se e solo se esiste una successione
a : N X \ {xo } tale che
lim an = x0 .
n+

Chiusura e frontiera di un sottoinsieme di R. Dato X R, la sua chiusura Ch(X) `e data


dallunione di X con i suoi punti di accumulazione. Chiaramente X Ch(X). Diciamo che X `e
chiuso se X = Ch(X). Si osserva che:
Per ogni X R, il complementare della sua chiusura CR (Ch(X)) `e un sottoinsieme aperto di
R.
Se A R `e aperto allora il suo complementare CR (A) `e chiuso.
X R `e chiuso se e solo se CR (X) `e aperto. Si osserva che e R sono contemporaneamente
aperti e chiusi (quindi essere aperto non `e la negazione di essere chiuso).
La frontiera di X R `e per definizione
F (X) := Ch(X) \ Int(X) .
Per esempio:
- N = Ch(N) = F (N)
- Se I = (a, b), a < b, allora Ch(I) = [a, b], F (I) = {a, b}.
- Se X = {1/n|n N \ {0}}, allora Ch(X) = X {0}, F (X) = Ch(X).
La retta estesa R. Consideriamo linsieme
R = R {, +} .

` TOPOLOGICHE
SOTTOINSIEMI DI R: NOZIONI E PROPRIETA

Cio`e abbiamo formalmente aggiunto ad R due punti indicati con . Arricchiamo la costruzione
specificando anche per i due punti aggiunti una conveniente nozione di intorno. Dato M R lo
M -intorno aperto di + `e per definizione la semiretta aperta (M, +) = {x R| x > M }. Lo M intorno aperto di `e per definizione la semiretta aperta (, M ) = {x R| x < M }. Al variare
di M R otteniamo i rispettivi sistemi (fondamentali) di intorni per . Possiamo estendere a R
lordinamento definito su R, imponendo che per ogni a R,
< a < + .
Possiamo estendere la nozione di punto di accumulazione di un sottoinsieme X R ai punti :
`e di accumulazione per X se per ogni M -intorno U di si ha che U X 6= . In particolare
i punti sono di accumulazione per X = R. Infine, per ogni sottoinsieme X R, possiamo anche
considerare la sua chiusura in R, ChR (X), per cui ad esempio ChR (R) = R.

You might also like