Professional Documents
Culture Documents
INSIEMI
In modo piuttosto informale si introducono nozioni e notazioni insiemistiche che vengono correntemente usate per sviluppare le teorie matematiche tra cui quella che `e argomento del corso.
1. Nozioni di base
La notazione fondamentale `e
aA
che si legge a `e un elemento dellinsieme A oppure, equivalentemente, a appartiene ad A. Il
simbolo indica quindi una relazione (di appartenenza) che pu`
o correlare (o no) un elemento ed
un insieme. La notazione a
/ A significa che a non `e un elemento di A cio`e che a non appartiene ad
A. I concetti di elemento e di insieme sono concetti primitivi, cio`e non vengono definiti in termini
di altri concetti pi`
u elemetari. Per dare sostanza al discorso postuleremo che certi enti sono insiemi.
Per esempio gli insiemi di numeri N, Z, Q, R (naturali, interi, razionali, reali) che assumiamo pi`
uo
meno familiari al lettore sono, appunto, insiemi. Inoltre fisseremo in modo preciso certe procedure
per manipolare gli insiemi, per esempio per costruire nuovi insiemi a partire da insiemi dati.
La notazione
AB
si legge dicendo che linsieme A `e un sottoinsieme dellinsieme B oppure, equivalentemente, che A
`e contenuto in B; significa che ogni elemento di A `e anche un elemento di B (cio`e se a A allora
a B). Quindi indica una relazione (di inclusione) che pu`
o correlare (o no) un insieme con
un altro insieme. Per ogni insieme A, si ha che A A. Postuliamo che esiste linsieme vuoto, cio`e
linsieme privo di elementi che `e indicato con il simbolo . Per ogni insieme A, A. A non `e
contenuto in B se esiste un elemento a A tale che a
/ B. A `e strettamente contenuto in B se A B
ed esiste b B che non appartiene a A.
Poniamo
A=B
se valgono entrambe le inclusioni
AB eBA.
Quindi A 6= B se esiste a A che non appartiene a B o esiste b B che non appartiene ad A, dove
questo o non `e esclusivo, ma significa che almeno una delle due circostanze si verifica.
Attenzione alle notazioni senza senso: se A e B sono insiemi, allora la notazione A B non ha
senso. Se a A, allora la notazione a A non ha senso. Invece ha senso scrivere {a} A, dove {a}
`e linsieme costituito dal solo elemento a; in particolare ha senso scrivere a {a}.
1.1. Unione, intersezione, complementare. Dati due insiemi A e B, linsieme unione
AB
`e caratterizzato dalla propriet`
a che x A B se e solo se x A o x B. Come sopra, questo o
non `e esclusivo: richiediamo che x appartenga ad almeno uno dei due insiemi A, B. E chiaro che
A, B A B, cio`e entrambi gli insiemi A e B sono sottoinsiemi dellinsieme unione A B.
Linsieme intersezione
AB
`e tale che x A B se e solo se x A e x B, cio`e x `e un elemento di entrambi gli insiemi A e B.
E chiaro che A B A, B, cio`e lintersezione `e un sottoinsieme di entrambi gli insiemi A e B.
Se A B, allora
CB (A) = {x B|x
/ A}
`e linsieme complementare di A in B. Si verifica che (farlo per esercizio):
INSIEMI
INSIEMI
che per ogni b f (A), f 1 ({b}) = {a}, oppure dicendo che per ogni coppia di elementi a1 , a2 A, se
a1 6= a2 allora f (a1 ) 6= f (a2 ).
Una funzione f : A B `e bigettiva se `e contemporaneamente iniettiva e surgettiva.
Per ogni A 6= ,
idA : A A, x A, idA (x) = x
`e la funzione identit`
a di A che `e evidentemente bigettiva. Se C A,
i : C A, x C, i(x) = x
`e la funzione di inclusione di C in A che `e evidentemente iniettiva.
Dati due insiemi non vuoti A e B indicheremo con
B A = {f : A B}
cio`e linsieme di tutte le applicazioni definite su A a valori in B.
1.5. Composizione di funzioni. Date due funzioni f : A B e g : B C, definiamo la funzione
composta
g f : A C, x A, (g f )(x) = g(f (x)) .
Se f `e bigettiva, possiamo definire la funzione inversa
f 1 : B A
dove per ogni b B, a = f 1 (b) `e lunico a A tale che f (a) = b; si ha che (f 1 f ) = idA ,
(f f 1 ) = idB .
Attenzione. Per ogni funzione f : A B e per ogni C B, abbiamo gi`a incontrato linsieme
immagine inversa f 1 (C). In questo caso non facciamo alcuna ipotesi particolare sulla funzione f .
Invece la funzione inversa f 1 `e definita solo se f `e bigettiva. Quindi il simbolo f 1 ha un significato
diverso nei due contesti. Attenti a non fare confusione.
2. Logichetta: proposizioni e teoremi
Allinterno di una teoria matematica (per esempio quella di Analisi I) si trattano proposizioni
sensate (in particolare formulate rispettando le regole di una certa sintassi - includendo nel nostro
caso le regole dellitaliano), che sono in modo esclusivo vere oppure false, cio`e non possono essere
contemporaneamente vere e false: capita una e una sola delle due possibilit`a. Il corpo della teoria in
un dato momento del suo sviluppo `e dato dallinsieme delle proposizioni che sono state riconosciute
come vere (e magari anche interessanti). La dimostrazione di un nuovo teorema della teoria accresce
il numero di proposizioni riconosciute come vere. Di solito la teoria non `e compiuta nel senso che
restano sul campo proposizioni sensate (e anche interessanti) che per`o sono ancora indeterminate,
cio`e non `e ancora noto se siano vere oppure false.
Si incontrano diversi tipi di proposizioni sensate. Per il tipo pi`
u semplice si fissa un insieme A, un
elemento a A e di predica una propriet`
a p che a pu`
o verificare (o no). La proposione `e vera se e
solo se a verifica la propriet`
a. Ad esempio
a = 5 N = A, p := 2|5 (cio`e 5 `e pari).
`e una proposizione (falsa) di questo tipo. A volte possiamo considerare famiglie di proposizioni di
questo tipo che dipendono da un parametro a che varia in A. Ogni volta che fissiamo il valore del
parametro, otteniamo una proposizione del tipo in questione. Una cosa di questo genere capita quando
definiamo un sottoinsieme si A per mezzo di una propriet`
a verificata dai suoi elementi. Per esempio
{n N| 2|n} N
definisce il sottoinsieme dei numeri pari.
Proposizioni pi`
u complicate si ottengono ammettendo che intervengano diversi elementi che variano
effettivamente e non necessariamente in un unico insieme. In questo caso `e essenziale luso corretto
dei due quantificatori esiste () e per ogni (). Esempi minimali di proposizioni di questo tipo
sono della forma:
INSIEMI
INSIEMI
INSIEMI
1C (x) = 0, cio`e f (C) 6= f (C ). Dimostriamo che f `e surgettiva. Infatti data g : A {0, 1},
sia C = g 1 (1). Allora f (C) = 1C = g.
Diamo ora un altra dimostrazione per induzione su n 0. Se n = 0, A = , P(A) = {},
1 = 20 . Supponiamo ora che |A| = n+1. Fissiamo a A. Definiamo X = {C P(A)| a C},
Y = {C P(A)| a
/ C}. Allora P(A) = X Y e X Y = . Ne segue che |P(A)| = |X| + |Y |.
Sia A = A \ {a}. |A | = n. Definiamo
: P(A ) X, (C) = C {a}
: P(A ) Y, (C) = C .
Si verifica facilmente che sono entrambe bigettive. Allora, per induzione |X| = |Y | = |P(A )| =
2n , |P(A)| = 2n + 2n = 2n+1 .
(3) Se |A| = n, |B| = m, m n 1, poniamo i(A, B) linsieme delle applicazioni iniettive definite
m!
su A a valori in B. Allora |i(A, B)| = m(m 1) . . . (m n + 1) =
. Operiamo per
(m n)!
induzione su n 1. Per n = 1, A = {a}, e ci sono m modi di definire b = f (a) B. Se
|A| = s + 1, s + 1 m, fissiamo a A, poniamo A = A \ {a}, |A | = s. Ci sono m modi di
assegnare b = f (a) B. Fissato uno di questi modi ci sono |i(A , B \ {b})| modi di completare
il dato b = f (a) ad unapplicazione iniettiva definita su tutto A. Dunque, per induzione,
INSIEMI
n
F (n, m) =
.
m
Ci sono almeno due modi per dimostrarlo; il primo consiste
nel verificare algebricamente che
n
F (n, m) verifica lo stesso schema induttivo che definisce
, cio`e che:
m
F (n, 0) = F (n, n) = 0
F (n, m) = F (n 1, m 1) + F (n 1, m) .
Il secondo metodo considera lapplicazione surgettiva
g : i(Im , A) Pm (A), g(h) = h(Im )
cio`e g associa ad ogni applicazione iniettiva h : Im A la sua immagine che ha appunto m
elementi. Si osserva poi che per ogni C Pm (A) ci sono m! funzioni h tali che g(h) = h(Im ) =
C. Si conclude che
|i(Im , A)|
n
= F (n, m) .
=
m!
m
Segue inoltre dalle considerazioni precedenti che:
n
n
X
X
n
|Pj (A)| = |P(A)| = 2n .
=
j
j=0
j=0
INSIEMI
n
si chiamano anche coefficienti binomiali perche intervengono nello sviluppo
m
delle potenze di un binomio secondo la formula di Newton:
n
X
n j nj
n
a b
(a + b) =
j
j=0
(5) I numeri
che si pu`
o dimostrare sia per induzione
su n 0, sia identificando esplicitamente il coefficiente
n
del monomio aj bnj con il numero
, usando la prima definizione che ne abbiamo dato.
j
`
4. Insiemi infiniti, cardinalita
Un insieme A `e infinito se non `e finito. Vogliamo estendere la nozione di numero degli elementi al
caso di insiemi arbitrari (finiti o infiniti). Prendiamo alcune delle propriet`
a del numero di elementi di
un insieme finito come modello della definizione generale.
Definizione 4.1. Dati due insiemi A e B diciamo che A ha cardinalit`
a (a volte si dice anche potenza)
maggiore o uguale a quella di B (e scriveremo |A| |B|) se esiste f : B A iniettiva. Diremo che A
e B hanno la stessa cardinalit`
a e scriveremo |A| = |B|, se esiste g : B A bigettiva. Diremo che A
ha cardinalit`
a strettamente maggiore a quella di B e scriveremo |A| > |B|, se |A| |B| ma |A| 6= |B|,
cio`e esiste f : B A iniettiva ma non esiste g : B A bigettiva.
Nel caso degli insiemi finiti ritroviamo lusuale numero di elementi |A| N. In generale la cardinalit`
a
non `e un numero ma una specie di qualit`a condivisa da due insiemi correlati da una applicazione
bigettiva. Se |A| = |N|, allora diciamo che A `e numerabile. Bisogna stare attenti perche diverse
propriet`
a che sono intuitivamente evidenti nel caso degli insiemi finiti, invece non sono pi`
u vere
per gli insiemi infiniti, come mostra il punto (2) nel seguente teorema. Questo sar`a conseguenza di
un ulteriore propriet`
a che postuliamo verificata dagli insiemi. Ancora una volta, questa propriet`
a `e
intuitivamente del tutto accettabile nel caso degli insiemi finiti, lo `e molto meno per quelli infiniti. Si
stratta dellesistenza di funzioni di scelta:
Per ogni insieme non vuoto A e per ogni X P(A) non vuoto tale che ogni C X, C 6= , postuliamo
lesistenza di una funzione (di scelta)
s:XA
tale che per ogni C X, s(C) C. In altre parole la funzione s sceglie un elemento s(C) in ogni
insieme C appartenente alla famiglia X di sottoinsiemi non vuoti di A.
Teorema 4.1. (1) Sia A un insieme infinito. Allora |A| |N|.
(2) Linsieme A `e infinito se e solo se esiste B A, B 6= A, tale che |A| = |B|.
Dim. (1) Sia X il sottoinsieme di P(A) formato dai sottoinsiemi non vuoti di A. Definiamo per
induzione f : N A iniettiva, partendo da una funzione di scelta s : X A (di cui abbiamo
postulato lesistenza). Poniamo allora f (0) = s(A), f (n + 1) = s(A \ {f (0), . . . , f (n)}). Si osservi che
f `e ben definita perche, essendo A infinito, per ogni n, A \ {f (0), . . . , f (n)} `e non vuoto. E immediato
che f cos` definita `e iniettiva.
(2) Se A `e finito sappiamo gi`
a che un tale B non esiste. Resta da dimostrare che invece esiste se A
`e infinito. Dimostriamo intanto la tesi quando A = N. Poniamo B = 2N, cio`e linsieme dei numeri
pari. g : N 2N, g(n) = 2n `e bigettiva, quindi |N| = |2N|. In generale sia f : N A iniettiva come
in (1). A = f (N) CA (f (N)) e poniamo: B = f (2N) CA (f (N)); G : A B, G(x) = f (g(f 1 (x)))
se x f (N), G(x) = x altrimenti. G `e bigettiva.
2
Altre propriet`
a del numero degli elementi invece si generalizzano alla cardinalit`
a degli insiemi (anche
infiniti). Indichiamone alcune.
Vale in generale il seguente Teorema di Bernstein la cui dimostrazione, abbastanza complicata,
viene omessa.
Teorema 4.2. Dati due insiemi A e B, se |A| |B| e |B| |A|, allora |A| = |B|.
INSIEMI
10
INSIEMI
12 Ottobre 2014
I Reali: un approccio quasi assiomatico.
Indice
1 Primi passi.
2 Alcune propriet`
a (importanti) di R.
4 Un teorema di unicit`
a.
10
5 Rappresentazione decimale.
11
6 Approssimazione.
13
7 Radici e potenze.
14
Primi passi.
X X X, (x, y) x + y
X X X, (x, y) x y
che verificano i seguenti assiomi:
1. assiomi per loperazione somma
S1 (associativit`a) x, y, z X
S2 (commutativit`a) x, y X
(x + y) + z = x + (y + z)
x+y =y+x
x+u=x
S4 (esitenza inverso) x Xx : x + x = u
2. assiomi per loperazione prodotto
P1 (associativit`a) x, y, z X
P2 (commutativit`a) x, y X
(x y) z = x (y z)
xy =yx
P4 (esitenza inverso) x 6= u x : x x = e
xe=x
x (y + z) = x y + x z
1. x X
x0=0x=0
Prova: x 0 = x (0 + 0) = x 0 + x 0 da cui x 0 = 0
3. (x)(y) = xy
Prova: Da (2) si ha (x) y = (x y). Sempre per (2) (x) (y) =
(x) (y) = x y per unicit`a dellopposto.
2
Anche qui si pu`o verificare rapidamente che da questi assiomi si possono dedurre le
usuali regole di calcolo.
Un insieme X dotato di queste propiet`a `e una estensione di Q, nel senso che esiste
una applicazione iniettiva : Q X che rispetta la struttura, cio`e
a, b Q
(a + b) = (a) + (b)
(a b) = (a) (b)
a b (a) (b)
Una tale si ottiene in questo modo: facciamo corrispondere allelemento 0 Q
lelemento neutro per la somma ed al numero razionale 1 lelemento neutro per il
prodotto; definiamo (n) la somma di n volte lelemento neutro per il prodotto
) = (m) ((n))1 si ha una estensione a tutto Q. L
ed infine ponendo ( m
n
applicazione cos` definita `e iniettiva (perche?).
Quindi in un insieme dotato di queste propriet`a sappiamo ritrovare i numeri naturali, gli interi ed i razionali. Continueremo ad indicare con la simbologia usuale
gli interi e i razionali anche pensati dentro X se la cosa non d`a adito a confusione.
Fatte queste premesse, dentro un campo ordinato completo possiamo rifare tutti gli
abituali calcoli dellaritmetica elementare, per esempio risolvere equazioni e disequazioni lineari. Per il momento con la parola risolvere intenderemo solo descrivere
in modo a noi pi`
u intelligibile il sottoinsieme descritto dalla relazione.
Vediamo su un esempio che cosa significhi: trasformiamo la descrizione di alcuni
insiemi applicando gli assiomi (si cerchi di comprendere ad ogni passaggio la sua
liceit`a, nel senso quali assiomi ci garantiscono che i due insiemi sono uguali)
{x X|3x + 1 > 4} = {x X|3x + 1 1 > 4 1} = {x X|3x > 3} = {x X|x >
1}
Ma ancora un insieme con queste propriet`a non ci basta. Infatti Q `e un esempio di
campo ordinato e abbiamo gi`a detto che in Q non `e possibile trovare un numero il
cui quadrato sia 2, cio`e risolvere lequazione x2 = 2.
Mostriamolo, ripercorrendo pi`
u o meno la prova dei greci per lincommensurabilit`a
della diagonale del quadrato.
Proposizione 1.1. Non esiste alcun elemento r Q tale che r2 = 2
Prova: Vogliamo provare che per nessun numero razionale m
si ha ( m
)2 = 2.
n
n
Supponiamo che al contrario ci`o sia vero: possiamo supporre che m, n siano primi
tra di loro (perche?) e quindi di diversa parit`a. Da m2 = 2n2 deduciamo che m
non puo esser dispari (altrimenti il suo quadrato sarebbe ancora dispari) quindi m2
`e divisibile per 4, quindi anche n2 `e pari e quindi anche n lo `e arrivando ad una
contraddizione..
5
Dedekind ( 1875) riprese il punto di vista dei greci e chiese un altro assioma, oggi
conosciuto come assioma di continuit`a o completezza.
16 Assioma di continuit`
a. Se A e B sono due sottoinsiemi non vuoti di X con
A B nel senso che a A, b B a b allora esiste in X un elemento c tale che
AcB
nel senso che a A, b B a c b
Un insieme verificante tutti i 16 assiomi esposti verr`a detto campo ordinato completo.
Assunzione: da questo momento supporremo che linsieme X sia un campo ordinato completo.
Mostriamo a solo titolo esemplificativo come lassioma di completezza garantisca
lesistenza in un campo ordinato completo della radice di 2.
Proposizione 1.2. Sia X un campo ordinato completo. Lequazione x2 = 2 ammette almeno una soluzione.
Prova: Indichiamo con A = {x X|x > 0 e x2 < 2} e B = {x X|x > 0 e x2 > 2}
Dagli assiomi risulta che A < B nel senso che ogni elemento di A `e minore di ogni
elemento di B e pertanto per lassioma 16 esiste un elemento separatore c in X.
A c B.
Quello che vogliamo provare `e che c2 = 2.
3c
risulta
Osserviamo che se chiediamo a tale elemento di essere positivo allora non solo esiste
ma `e anche unico. Siano infatti x e y due elementi in X tali che x2 = y 2 = 2
Da x2 = y 2 otteniamo (x y)(x + y) = 0 e dalla positivit`a di x e y otteniamo x = y.
Questo ragionamento opportunamente esteso prover`a che in X per ogni a > 0 e n
intero positivo lequazione xn = a ha soluzioni in X.
Alcune propriet`
a (importanti) di R.
()
y
x
da cui la proposizione.
2
Proposizione 2.3. Per ogni elemento x X esiste (unico) un intero k tale che
k x<k+1
Prova: Suppuniamo x > 0. Linsieme S = {n N| n x} `e non vuoto e per la
Proposizione 2.1 finito. k = max S verifica le richieste. La prova per il caso in cui
x < 0 `e del tutto analoga.
2
Lintero la cui esistenza `e garantita da questa proposizione viene detto la parte intera
di x e viene comunemente indicato con [x]; cio`e si ha
[x] x < [x] + 1.
Proposizione 2.4. Dato un elemento x X ed un altro elemento X positivo,
esiste un numero razionale r Q X tale che
r x<r+
Prova: Per prima cosa scegliamo un naturale m, la cui esistenza `e assicurata dalla
Proposizione 2.1, tale che m > 1 , cio`e m1 < . Per Prop.2.2 esiste un intero n tale
che
n mx < n + 1
e quindi
Quindi
n
m
n
1
n
n
x<
+
<
+
m
m m
m
verifica le richieste.
1
n
1
contraddirrebbe la propriet`a di Archimede.
|x|
2
Partiamo da una considerazione: ogni sottoinsieme A X non vuoto e finito ammette massimo e minimo. Lo si pu`o facilmente provare per ricorrenza. Detto n il
numero di elementi di A la propriet`a `e banalmente vera se n = 1. Supponendo vera
la propriet`a per ogni insieme costituito da n 1 elementi, si tolga ad A un qualsiasi
elemento ......
Questa propriet`a non susssiste pi`
u per gli insiemi infiniti, come ci si convince facil` chiaro che un qualsiasi
mente considerando A = (0, 1) = {x R|0 < x < 1}. E
numero maggiore di 1 non `e il massimo di A perche non appartiene allinsieme ed `e
anche immediato che A non pu`o contenere un elemento pi`
u grande di tutti: se ad
< 1. Quindi
esempio d fosse tale elemento dovrebbe essere d < 1 e quindi d < 1+d
2
A non ha massimo ed analogamente si vede che non ha minimo.
Per`o lassioma di continuit`a ci assicura una cosa:
Proposizione 3.1 (Estremo superiore). Sia X un corpo ordinato completo ed
A X un sotoinsieme non vuoto limitato superiormente. Linsieme M dei maggioranti di A ammette minimo.
Prova: Gli insiemi A e M sono entrambi non vuoti e a A, m M a m.
Lassioma di continuit`a garantisce lesistenza di un elemento separatore c.
A c M.
Dunque per ogni a A si ha a c e questo prova che c `e un maggiorante. Daltra
parte per ogni m M si ha c m e questo basta a concludere che c `e il minimo
dei maggioranti.
2
Un teorema di unicit`
a.
Q1
~>>
~
~~
~~
~
~
Q@
@@
@@ 2
@@
@
1
X1
Q2
X2
10
Rappresentazione decimale.
Dato x R iniziamo con l individuare come fatto nella Prop 2.3 il massimo intero
a0 minore o uguale a r, cio`e a0 = [x]. Ponendo r0 = x a0 avremo che 0 r0 < 1.
Quindi potremo pensare x = a0 + r0 e se 0 6= r0 ripetiamo il ragionamento ed
indichiamo con a1 il massimo intero tale che a1 10r0 , quindi si avr`a 0 a1 9.
a1
1
Quindi r0 = 10
e
1 + r1 con 0 r1 < 10 .Cio`
x = a0 +
a1
+ r1
10
1
. Ripetiamo il ragionamento con 100r1 e costruiamo a2 , r2 . Iterando
con r1 < 10
a2
1
avremo x = a0 + a101 + 10
2 + r2 con r2 < 102 .
11
an
a1 a2
+ 2 +. . .+ n +. . .
10 10
10
con la scrittura a0 , a1 a2 . . ., scrittura che chiameremo espansione decimale (finita o
infinita) di x. Chiaramente si ha che x a0 , a1 a2 . . . an 101n .
Altrimenti questo processo non si arresta e indicheremo a0 +
x x
1
< a0 , a1 a2 . . . an .
10n
12
Approssimazione.
a
10k
sono densi
b
b
x< m +
m
10
10
.
La rappresentazione tramite allineamenti decimali finiti ci fornisce una serie di coppie
di valori del tipo a0 , a1 a2 . . . ak che differiscono
u 10k . Per esempio
da x per al pi`
per trovare una
rappresentazione decimale di 2 non `e2 difficile con2 una calcolatrice
verificare che 2 `e compreso tra 1, 4 e 1, 5 poiche 1, 4 < 2 < 1, 5 , Analogamente
quadrando e confrontando otteniamo
1, 41 <
2 < 1, 42
1, 414 <
2 < 1, 415
1, 4142 <
1, 41421 <
1, 414213 <
2 < 1, 4143
2 < 1, 41422
2 < 1, 414214
13
1, 4142135 <
1, 41421356 <
1, 414213562 <
2 < 1, 4142136
2 < 1, 41421357
2 < 1, 414213563
Radici e potenze.
xn1
<
xn2
2.
Quindi |xn a| `e minore di ogni prefissato numero positivo e quindi (Prop 2.6)
|xn a| = 0 cio`e xn = a.
2
2
k=n1
X
(x + )n (x )n = ((x + ) (x ))(
k=0
14
A questo punto diventa facile definire che cosa si possa intendere per potenza a
esponente reale. In R possiamo
definire xn = x x . . . x cio`e il prodotto di n
1
copie di x e indicando con x m = m x, che sappiamo esistere in bse alla proposizione
1
n
precedente, abbiamo che ha senso la scrittura x m = (xn ) m e se x 6= 0 definiamo
xn = x1n se xn esiste ed infine x0 = 1.
Dalle definizioni date si deducono le usuali regole di calcolo per le potenze
xr xs = xr+s
(xr )s = xrs
(x y)r = xr xs
Per definire la potenza xy nel caso di un esponente y reale qualunque ed una base x
positiva si procede cos` : supponiamo y > 0 e x > 1: consideriamo linsieme
E = {xr |r Q r y};
dalle considerazioni fatte risulta che tale insieme `e ben definito e che `e limitato
superiormente in quanto se r `e un razionale maggiore di y ogni elemento di E `e
minore di xr . Indichiamo con xy lestremo superiore dellinsieme E
xy = sup E.
` facile verificare che nel caso y sia razionale la definizione porta allo stesso valore
E
definito in precedenza.
Poniamo per definizione
1
( x1 )y
y
x = 1
1
xy
propriet`a alla base del cosiddetto regolo calcolatoree che spiega lutilizzazione delle
scale logaritmiche.
15
Abbiamo identificato il corpo dei reali R con linsieme dei decimali illimitati D.
Ovviamente una espansione decimale finita rappresenta un razionale, ma ci si convince immediatamente che non ogni razionale `e rappresentabile con una espansione
decimale finita: si prenda ad esempio 31 e si vede con lusuale divisione che lespansione decimale `e 0, 333333 . . ., espansione che viene indicata convenzionalmente con
la scrittura 0, 3.
Ci chiediamo se abbiamo un modo di riconoscere le espansioni decimali che rappresentano un razionale e, in caso affermativo, un algoritmo per risalire a tale
decimale.
Visto che lespansione decimale `e una scrittura che possiamo interpretare come una
1
somma (eventualmente infinita) di potenze di 10
facciamo alcune considerazioni sulla
somma di una progressione geometrica.
Partiamo quindi dalla progressione geometrica di ragione x > 0
1 = x0 , x1 , x2 , . . . , xn , . . .
e consideriamo la successione di numeri in R
s0 = 1
s1 = 1 + x
s 2 = 1 + x + x2
...
s k = 1 + x + x2 + . . . + xk
Dalla diseguaglianza di Bernoulli abbiamo che se 0 < x < 1, xk decresce definitivamente, nel senso che fissata una quantit`a = 101h a piacere, esiste un intero nh per
cui per ogni k > nh , xk . 3
Dal fatto che
(1 x)(1 + x + x2 + . . . + xk ) = 1 xk+1
si ha che
1
xk+1
(+)
1x 1x
e quindi che la successione {sk } `e un insieme limitato superiormente. (Per ogni
1
k sk < 1x
.) Per lassioma di continuit`a tale insieme ammette quindi estremo
superiore e per la caratterizzazione di questultimo (Prop 3.2 ) da (+) risulta che
1
1
. Potremo pensare 1x
come somma delle infinite potenze della
esso `e proprio 1x
s k = 1 + x + x2 + + xk =
Da (1 + )n > 1 + n per > 0 ricaviamo che se |x| > 1 allora |x|n cresce indefinitamente, nel
senso che, fissato un qualsiasi elemento K R troviamo un nK per cui |x|n > K per ogni n > nK .
Infatti essendo |x| > 1 posto |x| = 1 + basta prendere n in modo tale che n > K1
. Quindi se
|x| < 1, | x1 |n cresce definitivamente da cui |x|n decresce definitivamente.
3
16
1
se 0 x < 1
1x
b1
b1
b1
1
1
1
b1
b1
+ 2 + . . . = (1 +
+ 2 + . . .) =
1 =
10 10
10
10 10
10 1 10
9
Se = 0, b1 b2 abbiamo
b1
b2
1
b1
b2
b1
b2
1
+ 2 + 3 + 4 + . . . = (1 + 2 + . . .) + 2 (1 + 2 + . . .) =
10 10
10
10
10
10
10
10
b2
b1 10 b2
1
b1 b2
b1
1
+ 2
=
+
=
=
10 1 1012
10 1 1012
99
99
99
0, b1 b2 =
A questo punto dovrebbe esser chiaro come dimostrare il caso generale di una
espansione decimale periodica senza antiperiodo.
Per il caso in cui ci sia un antiperiodo, iniziamo dal caso = 0, a1 b1 .
1
b1
1 a1 9 + b 1
a1
1
+
0, b1 = (a1 + ) = (
)=
10 10
10
9
10
9
1 a1 (10 1) + b1
1 a1 b 1 a1
a1 b 1 a1
(
)=
=
=
10
9
10
9
90
0, a1 b1 = 0, a1 + 0, 0b1 =
4
5
si torner`
a in seguito pi`
u dettagliatamente su tale concetto.
in altri termini
17
1
7
e di
1
9
18
Complessi.
Indice
1 Definizioni.
3 Potenze e radici.
4 Polinomi e radici.
Definizioni.
In questa dispensa vogliamo presentare lestensione del campo dei numeri reali R
data dal campo dei numeri complessi C e lestensione a tale campo di alcune funzioni
elementari.
Si vuole quindi un insieme che contenga R, in cui sia possibile fare delle operazioni
somma e prodotto che estendano quelle definite su R e in cui sia possibile fare delle
cose che in R non si possono fare, segnatamente a proposito delle radici quadrate
di numeri negativi. Sar`a in effetti sufficiente richiedere che 1 abbia una radice
quadrata.
Consideriamo come insieme, linsieme delle scritture a + ib, ove a e b sono numeri
reali e i un simbolo e definiamo su questo insieme due operazioni nel modo seguente
1. (a + ib) + (c + id) = (a + c) + i(b + d)
2. (a + ib) (c + id) = (ac bd) + i(ad + bc)
Si osservi che con questa definizione risulta immediatamente che i i = 1, che la
somma ed il prodotto cos` definiti verificano le propriet`a di associativit`a, distributivit`a e commutativit`a come le operazioni in R, che 0 + i0 (che quindi dora il poi
indicheremo semplicemente con 0) `e lelemento neutro per la somma e che 1 + i0
(che quindi dora il poi indicheremo semplicemente con 1)`e quello per il prodotto.
Chiameremo C tale insieme dotato delle operazioni appena definite.
In tale insieme ritroviamo linsieme dei numeri reali come gli elementi del tipo a+i0:
si vede immediatamente che le operazioni definite inducono quelle dei reali su tale
insieme. 1
` immediato verificare che ogni elemento diverso da 0 ammette un inverso. Infatti
E
se a + ib un elemento non nullo di C, cerchiamo se esiste un elemento x + iy tale che
(a + ib) (x + iy) = 1 + i0. Applicando la definizione otteniamo che x, y debbono
verificare le condizioni
(
ax by = 1
bx + ay = 0
Tale sistema, essendo a2 + b2 6= 0 ammette una ed una sola soluzione, data da
(
a
x = a2 +b
2
b
y = a2 +b2
Coniugio. Dato un numero complesso z = a + ib, si definisce numero complesso
z+w = z+w
zw = z w
Tale viene detto argomento principale (talvolta fase) del numero z e lo si indica
con arg z. Linsieme dei tali che z = |z|(cos + i sin ) `e un sottoinsieme di R che
si chiama argomento di z e si indica con Arg z: risulta Arg z = arg z + 2k al variare
di k in Z. Pertanto il modulo e largomento di un numero complesso z verificano le
relazioni
(
|z| cos = a
|z| sin = b
()
2
|z| = a + b2 . Per ricavare largomento, osserviamo che per a 6= 0 largomento
verifica tan = ab . Si `e quindi portati, al fine di esplicitare tale funzione, a risolvere
una una equazione del tipo tan = ab e quindi appare naturale esprimere la funzione
argomento in termini della funzione arcotangente.
La funzione arcotangente `e la funzione inversa della funzione tangente, che `e una
funzione di variabile reale definita su R\{x| cos x = 0} = R\{ 2 +k}kxZ a valori in
R che non `e iniettiva nel suo dominio di definizione e che quindi che non `e invertibile.
Se consideriamo la funzione tangente ristretta allintervallo ( 2 , 2 ) tale funzione `e
invertibile, ma restituisce valori appunto compresi tra 2 e 2 mentre la funzione
arg pu`o assumere anche altri valori.
Pertanto ricaveremo la funzione argomento su C = C \ {0} in termini della funzione
arcotangente, a pezzi, cio`e sui 4 quadranti e poi vedremo dove le funzioni cos` definite
si rincollano.
Per i numeri complessi a + ib del I e IV quadrante pensati aperti, senza cio`e i bordi,
in altri termini per i numeri con a > 0, possiamo ricavare arg z dallequazione e
quindi abbiamo arg(z) = arctan ab .
Per quel che riguarda i bordi osserviamo che arg(z) =0 se z `e un reale positivo
mentre se z `e puramente immaginario, cio`e se a = 0 abbiamo arg z= 2 o 2 a
seconda se b > 0 o b < 0. Ricordiamo che abbiamo escluso lo 0.
Passiamo al II e III quadrante. Se a < 0 poniamo arg(z)= arctan ab + o arg(z)=
arctan ab a seconda che rispettivamente sia b > 0 (II quadrante) o b < 0 (III
quadrante).
Si osservi che, per i numeri complessi con a < 0 e b > 0, risulta
b
lim arctan + = + =
a0
a
2
2
Mentre per i numeri complessi con a < 0 e b < 0, risulta
b
lim arctan = =
a0
a
2
2
In conclusione la funzione di a e b cos` definita
3
(L1)
(L2)
arctan ab
arctan b
a
(a, b) =
arctan ab +
se
se
se
se
se
se
a < 0, b < 0
a = 0, b < 0
a>0
a = 0, b > 0
a < 0, b > 0
a < 0, b = 0
(1)
che `e continua in tutti i punti di C \ {x < 0, y = 0}. Tale funzione coincide con la
funzione arg(z). 2
2
2
+i
abbiamo che |z| = 1 e quindi
Ad esempio se z =
2
2
(
cos = 22
sin = 22
!
2
2
+i
da cui tan = 1 che, via le definizioni date, porta a dire che arg
=
2
2
3
.
4
Potenze e radici.
+ 2k
+ 2k
+ i sin
cos
n
n
(+)
b
= tan ab , (a, b) 6= (a, b) se < 0
Attenzione: pur essendo vero che se 6= 0, tan a
Polinomi e radici.
Indichiamo con R[x] linsieme dei polinomi p(x) in una variabile a coefficienti reali,
cio`e linsieme delle scritture a0 + a1 x + . . . + an xn , in cui penseremo definite le operazioni di addizione, moltiplicazione tra polinomi e moltiplicazione di un polinomio
per un numero reale.
In questo insieme si pu`o operare la divisione euclidea .
Teorema 4.1. Dati due polinomi a e b con deg a = n e deg b = m, esistono unici
due polinomi q ed r con deg r < deg b tali che a = bq + r.
Lesistenza `e data dallalgoritmo di divisione per polinomi appreso nella scuola secondaria e lunicit`a sui ottiene dalla condizione deg r < deg b; infatti se q e r sono
altri due polinomi che verificano la stessa relazione si ha
0 = b(q q ) + (r r )
ed essendo deg(r r ) < deg b si deve avere q q = 0 e di conseguenza r r = 0.
n
X
ai i =
i=1
n
X
i=1
ai i =
n
X
ai i =
i=1
n
X
i=1
ai i =
Pn
i=1
n
X
i=1
ai xi si ha
ai i = p()
Il teorema fondamentale dellalgebra,3 che qui assumiamo senza prova, implica che
ogni polinomio a coefficienti reali assume tutte le sue radici in C, per cui per un
polinomio a coefficienti reali vale il teorema
Teorema 4.3. Ogni polinomio a coefficienti reali ammette in R[x] una decomposizione
p(x) = (x a1 )m1 (x a2 )m2 (x ah )mh q1n1 q2n2 qknk
ove i polinomi qi sono polinomi di secondo grado senza radici reali.
Gli interi mi vengono dette le molteplicit`
a delle radici ai .
I fattori di tipo x ai seguono direttamente da quanto detto e quelli di tipo qi si
ottengono accorpando i fattori coniugati, tenedo conto del fatto che se un polinomio
reale ammette una radice complessa ammette anche la coniugata e che (x a)(x
a) = x2 2(a + a)x + aa `e un polinomio a coefficienti reali.
Il teorema fondamentale dellalgebra dice che ogni polinomio di grado positivo a coefficenti
complessi ha almeno una radice (e quindi tutte) in C.
4
In letteratura le i vengono dette le funzioni simmetriche elementari degli ai .
x, y ex+iy = ex+i(y+2k)
cio`e che la funzione esponenziale complessa `e una funzione periodica di periodo 2i.
Notiamo infine che tale espressione pu`o essere usata per estendere al campo complesso le funzioni trigonometriche elementari seno e coseno.
Tale espressione per lesponenziale pu`o essere usata anche per estendere al campo
complesso le funzioni trigonometriche elementari seno e coseno.
Infatti sempre da () risulta che per ogni x reale si ha
eix + eix
cos x =
2
eix eix
sin x =
2i
Quindi, partendo da queste espressioni, si pu`o definire per z complesso
eiz + eiz
2
iz
e eiz
.
sin z =
2i
cos z =
In questo paragrafo vogliamo provare che la funzione definita in questo modo verifica in campo complesso unaltra propriet`a della funzione
reale e
esponenziale
x n
precisamente quella che, se x `e un numero reale allora lim 1 +
= ex .
n
n
z n
provando
Pertanto, se z `e un numero complesso, proveremo che 6 ez = lim 1 +
n
n
che
z n
lim 1 +
= ex (cos y + i sin y)
()
n
n
Indichiamo, per brevit`a, con an la successsione 1 + nz che, pensandola in forma
trigonometrica, scriveremo come an = |an | (cos n + i sin n ).
5
|an L| < .
Pertanto risulta
n
z n
x 2 y 2 2
(cos n + i sin n)
(an ) = 1 +
= 1+
+
n
n
n
n
Poiche
"
2 # n2
2 y 2 n2
n
y
x
x
1+
|(an )n | = 1 +
+
= 1+
=
n
n
n
x+n
= 1+
"
x n
si ha
1+
y
x+n
ny2 2
2
2(x+n)
2 #( x+n
)
y
lim |(an )n | = ex
quindi definitivamente, cio`e per tutti gli n maggiori di un n0 (che dipende anche da
y
z) si ha che |arg an | < 2 . Pertanto per tali n si ha che arg an = arctan x+n
e quindi
y
definitivamente n = arctan x+n .
Ricordando che lim
x0
lim nn
arctan x
= 1 7 , si ha
x
y
= lim n arctan
= lim n
n
x + n n
y
ny arctan x+n
=y
= lim
y
n x + n
x+n
In un intorno di 0 si ha lim
x0
y
x+n
x+n
y
t
t
arctan x
= lim
= lim
cos t = 1
t0 tan t
t0 sin t
x
arctan
y
x+n
Linsieme dei numeri naturali N `e bene ordinato; questo significa che il familiare ordinamento dei
numeri naturali tale che per ogni n N, n n + 1 (in effetti n < n + 1), verifica le seguenti due
propriet`
a:
(1) E un ordinamento totale, cio`e due arbitrari numeri naturali sono sempre confrontabili, precisamente: dati arbitrariamente due numeri n, m N si ha che n m o m n.
(2) Dato comunque un sottoinsieme A N non vuoto, esso ha un elemento minimo a (necessariamente unico), cio`e a A e per ogni b A si ha che a b.
Questa propriet`
a fondamentale dei numeri naturali `e alla base del cosidetto principio di induzione
che qui descriviamo in termini delle sue principali applicazioni: le dimostrazioni per induzione, la
definizione di funzioni per induzione.
Dimostrazioni per induzione. Sia n0 N un fissato numero naturale. Supponiamo che P (n) sia
unaffermazione che dipende da un parametro n N, ha senso per ogni naturale n n0 e che pu`
o
essere vera o falsa. Ad esempio consideriamo:
n0 = 1, P (n) := 2n n .
Supponiamo di essere interessati a dimostrare che P (n) `e vera per ogni n n0 . In certi casi questo
pu`
o essere fatto per induzione applicando lo schema seguente:
Passo iniziale: Si verifica che P (n0 ) `e vera.
Passo induttivo: Per ogni n n0 , si dimostra che se P (n) `e vera, allora anche P (n + 1) `e vera.
Se riusciamo a realizzare questi due passi, allora possiamo concludere che effettivamente P (n) `e vera
per ogni n n0 .
Infatti, intuitivamente, P (n0 ) `e vera per il passo iniziale, allora P (n0 + 1), P ((n0 + 1) + 1), ,
sono tutte vere a cascata, luna di seguito allaltra, applicando ripetutamente infinite volte il passo
induttivo. Vedremo poi pi`
u rigorosamente come questa conclusione segua dal buon ordinamento di N.
Definizione di funzioni per induzione. Sia n0 N un fissato numero naturale. Una funzione
f : {n N|n n0 } X
(a valori in qualche insieme X) `e definita per induzione se `e ottenuta applicando il seguente schema:
Valore iniziale: Assegnamo il valore f (n0 ).
Passo induttivo: Per ogni n n0 , il valore f (n + 1) `e completamente specificato in termini del
valore f (n).
In questo modo la funzione f (n) `e effettivamente definita per ogni n n0 . Come prima il valore
iniziale f (n0 ) `e assegnato, i valori f (n0 + 1), f ((n0 + 1) + 1), , sono tutti definiti a cascata
applicando di seguito infinite volte il passo induttivo.
Vediamo alcuni esempi di entrambe le procedure. Cominciamo trattando per induzione lesempio
considerato prima:n0 = 1, 2n n.
Passo iniziale: P (1) := 21 = 2 1 che `e vera.
Passo induttivo Per ogni n 1, vogliamo dimostrare che 2n+1 n + 1 assumendo di sapere che
2n n. Infatti:
2n+1 = 2(2n ) 2n n + 1
dove lultima disuguaglianza vale perche n 1. Dunque possiamo concludere che 2n n per ogni
n 1.
PRINCIPIO DI INDUZIONE
Osservazione. Un altro modo per dimostrare luguaglianza delle due funzioni, che spiega come la
funzione g sia emersa, `e il seguente: 2f (n) = (1+ +n)+(n+ +1) = (n+1)+ (1+n) = n(n+1).
Esempio 2. n0 = 1, f (1) = 1, f (n + 1) = f (n)(n + 1). Si reallizza che per ogni n 1, f (n) =
1 2 3 n, cio`e il prodotto dei numeri naturali compresi tra 1 e n. E una funzione importante. La
sua notazione corrente `e f (n) = n!, si legge n-fattoriale e viene estesa anche in 0, ponendo 0! = 1.
Esempio 3. n0 = 1, f (0) = 1, f (n + 1) = f (n) + (n + 1)2 . Si pu`
o riformulare usando il simbolo di
sommatoria:
n
X
i 2 = 1 + 2 2 + + n2 .
f (n) =
i=1
n(n + 1)(2n + 1)
.
6
an+1 1
.
a1
PRINCIPIO DI INDUZIONE
a1 1
= g(1).
a1
f (n + 1) = f (n) + an+1 =
an+1 1
an+2 1
+ an+1 =
= g(n + 1) .
a1
a1
In questa dispensa faremo riferimento a nozioni relative alla retta estesa R e ai sistemi di intorni di
ogni a R che sono definite nella dispensa [TOP].
1. Nozioni generali
Dato un insieme non vuoto X, una successione a valori in X `e una funzione della forma:
a : {n N| n n0 } X
dove n0 N `e un fissato numero naturale. Per semplicit`a scriveremo {n n0 } invece di {n N| n
n0 }; inoltre, di solito, per ogni n n0 , scriveremo an invece di a(n). Ogni an X `e detto un termine
della successione, linsieme dei termini `e un sottoinsieme di X, infatti non `e altro che limmagine della
funzione a:
Im(a) = {an X| n n0 } .
Una successione a `e costante se Im(a) = {b} cio`e consiste di un solo elemento, cio`e per ogni n n0 ,
an = b. E utile fissare la seguente nozione generale:
Successioni che verificano definitivamente una propriet`
a. Sia a : {n n0 } X una successione. Diciamo che essa verifica definitivamente una certa propriet`
a P se esiste n
N, n
n0
tale che per ogni n > n
, an verifica la propriet`
a P . Cio`e la propriet`
a pu`
o non valere per un numero
arbitrariamente grande di indici n, ma da un certo indice in poi vale sempre.
Ad esempio:
- Si consideri la successione a : N N, an = n per ogni n 0. Allora la successione a verifica
definitivamente la propriet`
a an > 5 (basta prendere as esempio n
= 7). Invece a non verifica
definitivamente la propriet`
a : an `e pari. Infatti per ogni n
N, n
+2 > n
+1 > n
e almeno uno
tra n
+2 e n
+ 1 non `e pari. Si noti che an `e pari per un insieme infinito di indici n; in casi cos` si
dice a volte che la propriet`
a `e verificata frequentemente, ma questo non basta affinche la propriet`
a sia
verificata definitivamente.
- Una successione a `e definitivamente costante se esiste n
n0 tale che per ogni m, n > n
, an = am .
Per esempio la successione a : N N tale che an = min(n, 700) `e definitivamente costante, infatti per
ogni n > 699, an = 700.
2. Successioni di numeri reali
Enunceremo in modo esauriente diverse nozioni e propriet`
a relative alle successioni di numeri reali.
Non le dimostreremo tutte, ma di tutte potremo fare liberamente uso.
Noi saremo particolarmente interessati al caso di successioni di numeri reali, cio`e quando X = R. In
questo caso `e conveniente introdurre alcune nozioni che sono definite usando le propriet`
a di R. Sia
a : {n n0 } R
una successione di numeri reali.
La successione a `e superiormente (risp. inferiormente) limitata se esiste M R tale che per
ogni n n0 , an M (risp. an M ).
La successione a `e limitata se `e contemporaneamente superiormente e inferiormente limitata.
La successione a `e crescente (risp. decrescente) se per ogni n, m {n n0 }, se n > m allora
an > am (risp. an < am ). Una successione `e detta strettamente monotona se `e crescente o
decrescente.
La successione a `e non decrescente (risp. non crescente) se per ogni n, m {n n0 }, se
n > m allora an am (risp. an am ). Una successione `e detta monotona se `e non crescente
o non decrescente.
SUCCESSIONI
che leggeremo:
L R `e limite della successione an quando n tende allinfinito.
A volte useremo anche la notazione abbreviata
an L
che leggeremo an tende a L per n che tende allinfinito.
Definizione sintetica del limite di una successione. Ricordiamo che per ogni L R, nella
dispensa [TOP] abbiamo definito un sistema di intorni aperti di L. Allora:
lim an = L
n+
n+
n+
n+
diremo che la successione `e convergente (in R) o anche che `e regolare. Se un tale L non esiste diremo
che la successione `e irregolare.
Esempi
(1) Sia an = n, definita per n 0. Allora an +. Infatti, per ogni reale m esiste n
N tale che
n
> m (propriet`a di Archimede), quindi per ogni n > n
si ha che n = an > m.
SUCCESSIONI
(2) Sia an = min(n, 700), definita per n 0. Allora an 700. Infatti, per ogni > 0, sia n
= 699.
Allora per ogni n > n
, an = 700 I(700, ). In generale ogni successione definitivamente costante e
uguale a L R tende a L per n che tende a infinito.
(3) Sia an = 1/n, definita per n 1. Allora an 0. Infatti per ogni > 0, 1/n = |1/n| < se e solo
se n > 1/. Per la propriet`
a di Archimede, esiste n
> 1/, e per ogni n > n
, 1/n = |1/n| < 1/
n < .
Dunque an appartiene definitivamente a I(0, ).
(4) La successione an = (1)n , definita per n 0 `e irregolare. Infatti L = non `e valore limite
perche la successione `e limitata. Supponiamo che L R. Sia = min(2 = | 1 1|, |1 L|, |1 +
L|). Poniamo = /3. Allora an appartiene frequentemente a I(1, ) e a I(1, ), quindi non pu`
o
appartenere definitivamente a I(L, ) e nessun L pu`
o essere valore limite di an .
3.1. Propriet`
a dei limiti di successioni. Discutiamo alcune propriet`
a che sono conseguenza della
definizione di limite.
Unicit`
a del limite. Data una successione a : {n n0 } R, se L R `e tale che
L = lim an ,
n+
n+
SUCCESSIONI
Propriet`
a algebriche dei limiti. Sono familiari le operazioni di somma e prodotto su R. Inoltre
se a R, a 6= 0 `e definito linverso 1/a R. Prima di enunciare le propriet`
a algebriche dei limiti di
successioni, estendiamo parzialmente queste nozioni alla retta estesa nel modo seguente:
Se a R o a = +, poniamo + + a = a + + = +.
Se a R o a = , poniamo + a = a + = .
Poniamo (+) (+) = +, () () = +, () (+) = (+) () = .
Se a R, a > 0, poniamo a () = () a = . Se a < 0, poniamo a () =
() a = .
Poniamo 1/ = 0.
Attenzione: NON abbiamo definito () + (), 0 (), () 0. Queste sono dette forme
indeterminate. Anche / (dove i due simboli possomo prendere indipendentemente i valori
), `e una forma indeterminata perche possiamo scrivere / = (1/) = 0 e ricondursi
cos` ad una forma indeterminata gi`
a vista.
Possiamo adesso enunciare alcune propriet`
a algebriche dei limiti di successioni.
(1) (Limite di una somma di successioni.) Siano a, b : {n n0 } R due successioni.
Supponiamo che
lim an = L R
n+
lim bn = L R
n+
n+
lim bn = L R
n+
n+
n+
n+
(4) Nella situazione del punto precedente, supponiamo che L = 0. In generale non possiamo dire
(1)n
, definita per ogni
niente sulla convergenza della successione 1/an . Per esempio sia an =
n
n 1. Allora lim an = 0 (verificarlo per esercizio usando direttamente la definizione di
n+
limite), mentre la successione 1/an = (1)n n `e irregolare. Possiamo dire qualcosa se facciamo
un ipotesi pi`
u forte, supponiamo cio`e che tutti i termini an abbiano definitivamente lo stesso
segno + o (scriveremo che an 0 ). Allora
lim 1/an = .
n+
In particolare
lim 1/|an | = + .
n+
In altre parole non abbiamo definito 1/0, ma abbiamo definito 1/0 = , e in questo modo
possiamo unificare questi due ultimi punti (3) e (4).
SUCCESSIONI
A titolo di esempio dimostriamo laffermazione sul limite della somma nel caso in cui L, L R.
Fissiamo > 0, vogliamo dimostrare che (an + bn ) appartiene definitivamente allintorno I(L + L , ).
Se an appartiene definitivamente a I(L, 1 ) e bn appartiene definitivamente a I(L , 2 ) allora an + bn
appartiene definitivamente I(L + L , 1 + 2 ), perche definitivamente:
|(L + L ) (an + bn )| |L an | + |L bn | < 1 + 2 .
Per concludere basta prendere per esempio 1 = 2 = /3.
Esempi. I seguenti limiti si ottengono applicando diverse tra le propriet`
a algebriche viste sopra (per
esercizio dettagliare quali).
(1) Per ogni fissato k N, k > 0, alloraan := nk +; se invece k < 0, allora an := nk 0.
(2) Fissati numeri reali a, b, c, d, c 6= 0, allora an :=
(3) Sia an = nm +
m1
X
an + b
a
.
cn + d
c
j=0
an = nm (1 +
m1
X
cj (1/nmj ). Si ha che an +.
j=0
Confronto di successioni. In certi casi si possono ricavare informazioni sulla convergenza di una
successione confrontandola con altre successioni di cui il comportamento sia noto.
Confronto 0. Due successioni che sono definitivamente uguali hanno lo stesso comportamento per
n +, cio`e luna converge se e solo se laltra convege e se sono convergenti allora hanno lo stesso
limite L R. Questo `e chiaro perche la definizione di limite usa solo propriet`
a che devono valere
definitivamente.
Confronto 1. Siano a : {n n0 } R e b : {n n1 } R due successioni. Supponiamo che
lim bn = +
n+
n+
Analogamente se
lim bn =
n+
e definitivamente an bn . Allora
lim an = .
n+
n+
2) Definitivamente an cn bn .
Allora:
lim cn = L .
n+
Questo risultato `e anche noto come teorema dei carabinieri (a e b) che tenendo dai due lati il ladro
(c) lo portano con loro in prigione (L).
Esempi.
(1) Fissato un reale a > 1, allora an := an +. Infatti possiamo scrivere a = 1 + b, b > 0.
Sappiamo (Bernoulli) che an = (1 + b)n 1 + bn. Poiche 1 + bn +, lo stesso vale per an .
(2) Come in (1) ma supponendo ora 0 < |a| < 1. Ne segue che 1/|a| > 1, quindi |an | = 1/(1/|a|)n 0.
SUCCESSIONI
(3) Fissato come prima a > 1, allora a1/n 1. Infatti possiamo porre a1/n = 1 + bn con bn > 0.
Allora (Bernoulli) a = (1 + bn )n 1 + nbn , da cui 0 < bn (a 1)/n. Per i carabinieri bn 0 e
quindi a1/n 1.
(4) Fissato a, |a| 1, allora an /n 0. Infatti se |a| < 1, an 0 e quindi an /n 0. Se |a| = 1, si
ha che 0 |an /n| 1/n. Per i carabinieri, an /n 0.
(5) Come in (4) ma supponendo ora che a > 1. Allora a = 1 + d per qualche d > 0.
n
X
n k
n 2
n
n
a = (1 + d) =
d
d = n(n 1)d2 /2
k
2
k=0
da cui
an /n (n 1)d2 /2 ;
poiche (n 1)d2 /2 +, lo stesso vale per an /n.
Convergenza delle successioni monotone.
Le successioni monotone sono sempre regolari cio`e ammettono sempre limite L R.
Infatti, supponiamo che la successione an , definita per n n0 , sia non decrescente (risp. non crescente). Allora si hanno due possibilit`a
1) an `e superiormente (risp. inferiormente) limitata con estremo superiore (risp. inferiore) L =
sup{an | n n0 } R (risp. L = inf{an | n n0 } R) . Allora
lim an = L
n+
lim an = + (risp.
n+
lim an =
n+
).
Dimostriamo per esempio la prima affermazione nel caso in cui la successione `e non decrescente e
superiormente limitata. Per le propriet`
a dellestremo superiore, per ogni > 0 esiste n
n0 tale che
an > L . Siccome la successione `e non decrescente, per ogni n > n
, an an , quindi an > L , da
cui an I(L, ). Gli altri casi si trattano in modo analogo.
1
Esempio importante: il numero di Nepero. Consideriamo la successione an = (1 + )n definita
n
per n 1. Dimostriamo intanto che `e una successione crescente. Infatti
n
n
X
X
1 n(n 1)(n 2) (n h 1)
n 1
=
an =
h
h!
nh
h n
h=0
h=0
n+1
n
n1
X 1
1 n X 1
1
) <
<1+(
( )s < 1 + 1/(1 ) = 3 .
n
h!
2
2
s=0
h=0
Dunque la successione an converge al suo estremo superiore in R che viene indicato con la lettera e
ed `e chiamato il numero di Nepero. Riassumendo
1
e := lim (1 + )n
n+
n
che `e un numero reale 2 < e < 3.
SUCCESSIONI
Unapplicazione pratica. Questo limite notevole interviene per analizzare una situazione molto concreta, cio`e il comportamento di un libretto di risparmio a tasso fisso. Disponendo di un capitale c0
che prevediamo di non utilizzare per un tempo abbastanza lungo, possiamo aprire un libretto di
risparmio con capitale iniziale c0 , e farlo crescere grazie agli interessi composti maturati nel tempo. Il
meccanismo `e il seguente:
E fissato un intervallo di tempo (un anno, sei mesi,...) che possiamo prendere come unit`
a di
misura del tempo fissata una volta per tutte; si conviene che per maturare linteresse alla fine
di un tale intervallo, il capitale presente nel libretto allinizio dell intervallo `e vincolato, cio`e
non pu`
o essere toccato per tutta la durata dellintervallo.
E fissato un tasso di interesse fisso del p0 per cento (per esempio del 1 per cento). Poniamo
r0 = p0 /100.
Allora al tempo iniziale t = 0, abbiamo un capitale c(0) = c0 . Al tempo t = 1 si maturano
gli interessi e si determina il nuovo capitale c(1) = (1 + r0 )c(0); procedendo per induzione, al
tempo t = n, abbiamo un capitale
c(n) = (1 + r0 )c(n 1) = (1 + r0 )n c0 .
In questo modello sia lampiezza dellintervallo di tempo in cui il capitale `e vincolato, sia il tasso di
interesse sono parametri che possono essere modificati. E chiaro che in linea di principio il tasso
di interesse deve essere una funzione crescente dellampiezza dellintervallo di tempo: pi`
u `e il tempo
che il capitale `e bloccato, pi`
u deve crescere linteresse. In accordo con un ragionevole criterio di
semplicit`a, adottiamo il seguente modello lineare:
Per lintervallo unitario poniamo r0 = 1; se lintervallo di vincolo `e lungo > 0 (rispetto allunit`
a di
misuira che abbiamo scelto) allora il corrispondente tasso di interesse `e r = .
Calcolando tutto come prima ma tenendo conto del parametro reale (e avendo posto r0 = 1),
vediamo che al solito c(0) = c0 , mentre
c(n) = (1 + )c((n 1)) = (1 + )n c0 .
E interessante capire cosa succede quando + oppure 0+ e n +. Concretamente,
consideriamo la successione crescente e non limitata n = n. Vediamo allora che la gi`a la successione
dei capitali maturati al tempo n :
c(n ) = (1 + n)c0
`e crescente e diverge a +. Questo non `e sorprendente. Un comportamento pi`
u interessante si ha
prendendo la successione n = 1/n decrescente e converge a 0 e consideriamo la successione dei capitali
maturati al tempo nn = 1. Si ha:
1
c(nn ) = (1 + )n c0 .
n
Possiamo quindi applicare lanalisi del limite notevole fatta sopra e concludere che c(nn ) `e ancora
una successione crescente che per`
o adesso converge al limite finito ec0 , dove e `e proprio la costante di
Nepero.
Criterio di Cauchy.
Condizione necessaria e sufficiente affinche esista L R tale che an L R `e che per ogni > 0
esiste n
n0 tale che per ogni n, m > n
si ha che |an am | < .
Limitiamoci a dimostrare che la condizione `e necessaria. Supponiamo che an L R. Fissato > 0,
esiste n
tale che per ogni n > n
, an I(L, /3). Allora per ogni n, m > n
, |an am | < .
Criterio del rapporto.
Sia an una successione a termini positivi. Se an+1 /an L R e L < 1 allora an `e descrescente
e an 0. Se an+1 /an L R e L > 1, allora an `e crescente e an +. Se an+1 /an 1 la
situazione `e indeterminata.
Criterio della radice
Sia an una successione a termini positivi. Se (an )1/n L R e L < 1 allora an 0. Se (an )1/n
L R e L > 1, allora an +. Se (an )1/n 1 la situazione `e indeterminata.
SUCCESSIONI
Dimostriamo il criterio della radice: supponiamo che L > 1 e L R. Allora definitivamente (an )1/n
(L + 1)/2, quindi an ((L + 1)/2)n ; a := (L + 1)/2 > 1, quindi an + e per confronto an +.
Lasciamo per esercizio il caso in cui L = +. Se L < 1, allora definitivamente (an )1/n (L + 1)/2,
quindi 0 < an ((L + 1)/2)n ; a := (L + 1)/2 < 1, quindi an 0. Per i carabinieri anche an 0.
Osservazione. Quando diciamo che se L = 1 la situazione `e indeterminata vogliamo dire che si
danno effettivanente comportamenti diversi. Infatti per esempio an pu`
o essere convergente in R (si
consideri per esempio la successione costante uguale ad 1), convergente a + (si consideri an = n + 1
definita per n 0, allora an+1 /an 1).
Limiti delle medie. Sia an una successione definita per n 1. La successione mn delle medie
aritmetiche dei termini di an `e definita da
mn = (a1 + a2 + + an )/n .
Vale il seguente fatto:
Se
lim an = L R, allora
n+
lim mn = L R.
n+
Supponiamo ora che la successione an sia a termini positivi. La successione gn delle medie geometriche
dei termini di an `e definita da
gn = (a1 a2 an )1/n .
Vale il seguente fatto:
Se
lim an = L R, allora
n+
lim gn = L R.
n+
In altre parole: se una successione converge in R, allora anche le successioni delle medie (aritmetiche
e geometriche) sono convergenti e hanno lo stesso limite.
Osservazione. Sia an una successione a termini positivi, definita per n 0 e tale che a0 = 1.
Consideriamo la successione dei rapporti bn = an /an1 definita per n 1. In questo caso la successione
delle medie geometriche dei termini di bn `e uguale a (an )1/n . Quindi come caso particolare di quanto
visto prima, abbiamo che:
Data una successione a termini positivi an , se an+1 /an L R, allora (an )1/n L.
Come corollario abbiamo che il criterio del rapporto implica il criterio della radice.
Per esempio, n/(n 1) 1 e quindi (n)1/n 1.
4. Serie, cenni
Data una successione an , definita per n 0, possiamo definire una nuova successione
sn =
n
X
aj = a0 + a1 + + an .
j=0
an
n=0
e che gli an sono i termini della serie. Una serie `e detta regolare se esiste L R tale che
lim sn = L
n+
SUCCESSIONI
Un esempio importante `e la serie geometrica che di fatto `e gi`a intervenuta, per esempio, quando
abbiamo trattato gli sviluppi decimali. Fissiamo a R. Allora e consideriamo la serie
+
X
an .
n=0
+
X
an = 1/(1 a) .
n=0
1
(n
+
1)(n
+ 2)
n=0
poiche
1
1
1
=
(n + 1)(n + 2)
n+1 n+2
risulta che
sn = 1
1
n+2
1
=1.
(n + 1)(n + 2)
n=0
4.1. Serie a termini positivi. Consideriamo la serie
+
X
n=0
1
.
n
+
1
n=0
Se per assurdo sn L R, la successione delle somme parziali dovrebbe verificare la condizione
(necessaria) del criterio di Cauchy visto sopra. Ma questa non `e verificata perche per ogni n 0,
2n
X
sk > n
k=n+1
1
=2.
2n
1
.
(n
+
1)a
n=0
Ne vogliamo studiare il comportamento al variare di a. Se a = 1 ritroviamo il caso gi`a studiato. Se
a < 1, allora per ogni n
1
1
n+1
(1 + n)a
10
SUCCESSIONI
quindi per confronto anche sn +. Invece se a > 1 la serie `e convergente. Infatti si pu`
o verificare
che per ogni intero p > 1
p1
X
2a1
p
.
(1/2)a1 < a1
s2 1 <
2
1
j=0
Daltra parte, per ogni n esiste p tale che sn < s2p 1 , quindi la successione sn `e limitata e la serie
converge.
Criteri del rapporto e della radice per serie. Sono riformulazioni di quanto gi`a visto per le
successioni.
Data una serie a termini positivi, se an+1 /an L < 1 allora la serie `e convergente; se an+1 /an
L > 1 la serie `e regolare ma non convergente; se an+1 /an 1 la situazione `e indeterminata.
Data una serie a termini positivi, se (an )1/n L < 1 allora la serie `e convergente; se (an )1/n L > 1
la serie `e regolare ma non convergente; se (an )1/n 1 la situazione `e indeterminata.
3 Novembre 2014
Qualche limite e serie standard svolti.
Indice
1 Successioni
1.1
1.2
Qualche criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3
Altri confronti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4
Varie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
n
1
.. . . . . . . . . . . . . . . . .
Variazioni sulla successione 1 +
n
1.5
2 Serie
2.1
2.2
Serie telescopiche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3
Miscellanea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Queste note contengono lo studio di qualche limite e di qualche serie trattato nel
corso con qualche suggerimento per richiamare le idee delle prove.
Successioni
1.1
Abbiamo visto, come conseguenza della diseguaglianza di Bernoulli, che la successione an per a > 1 diverge, mentre converge a 0 se |a| < 1 e non ha limite se
a < 1. Confrontiamola, quando diverge, con qualche altra successione, anche essa
divergente.
an
= con a > 1 e k > 0
n nk
Lidea per comprendere il comportamento di questa successione `e di confrontarla
con
una successione di coefficienti binomiali. Il coefficiente binomiale
n(n 1) (n k)
n
=
`e un polinomio in n di grado k + 1, pertanto
k+1
(k + 1)!
n
lim
lim
k+1
nk
a = (1 + (a 1)) =
X
n
h=0
(a 1) >
n
(a 1)k+1
k+1
n
an
k+1
(a 1)k+1 e pertanto, se a > 1 e k > 0
Quindi si ha k >
k
n
n
an
=
n nk
lim
an
= 0, con a > 1
n n!
lim
0
n!
n(n 1) (n k)
n n
n
nn
= perche
> n
lim
n n!
nn1
1
lim
a
an
e osservando che tutti i fattori
con n > [a] sono minori di 1, quindi
=
n
n!
a
a a
. la quantit`a a secondo membro risulta essere una costante C(a),
nn1
1
an
a a
a
a
che dipende solo da a, per na che tende a 0.
=
= C(a) .
n!
nn1
1
n
Possiamo riassumere quanto visto dicendo che definitivamente si ha, se a > 1 e k
intero positivo fissato,
nk < an < n! < nn .
1.2
Qualche criterio
a1 + . . . + an
ha lo stesso comportamento della successione an ;
n
a1 + . . . + an
in particolare se an l allora anche
l. Come conseguenza si
n
log n!
diverge.
ha che
n
Diamo un cenno della dimostrazione solo per il caso l = 0 lasciando al lettore
la cura di trattare gli altri casi e di evidenziare i dettagli anche per il caso che
diamo.
a1 + . . . + a n
Indichiamo con bn =
: vogliamo mostrare che bn 0. Sapn
piamo che an 0 e quindi che fissato un esiste un n0 tale che per n >
La successione
1.3
Altri confronti.
n = 1 e che lim
a = 1 Calcolare
a1 + . . . + an
=
n
lim
n!
n!
n n
1.4
Varie.
log(n + 1)
log(n 1)
2
2
log(n 1)(1 + n1
)
log(n 1) + log(1 + n1
)
log(n + 1)
Sol. lim
= lim
= lim
=
n log(n 1)
n
n
log(n 1)
log(n 1)
2
2 n1
2
)
)
)
(n 1) log(1 + n1
log(1 + n1
log(1 + n1
= 1+ lim
= 1+ lim
=
1+ lim
n (n 1) log(n 1)
n (n 1) log(n 1)
n log(n 1)
log e2
1 + lim
=1
n (n 1) log(n 1)
log(an + b)
o pi`
u in generale
log(cn + d)
log(P (n))
ove P e Q sono due polinomi di gradi rispettivamente p e q.
n log(Q(n))
lim n + 1 n
n
( n + 1 n)( n + 1 + n)
1
= lim
Sol. lim n + 1 n = lim
=
n
n
n
n+1+ n
n+1+ n
0
n
Se 0 < a < b allora lim an + bn = b perche bn < an + bn < 2bn , quindi
n
1.5
n
1
Variazioni sulla successione 1 +
.
n
n
1
Sappiamo che la successione 1 +
`e convergente a un limite che `e un numero
n
reale compreso tra 2 e 3, numero che convenzionalmente si indica con e.
Attenzione: alcuni dettagli non sono esplicitati completamente; si invita pertanto lo studente
a esplicitarli.
lim
1
n
1
n
=1
()
Infatti
lim
ln 1 +
1
n
1
n
1
= lim n ln 1 +
n
n
1
= lim ln 1 +
n
n
n
=1
1
1+
n+k
n
=e
Infatti
1
1+
n+k
n
()
n+k
1
n+k
k
1
+ n+k
1+
1
n a
1 a
a n
lim 1 +
= lim 1 + n
= ea .
n
n
n
a
Quindi, in modo del tutto analogo a () si ha
ln 1 + na
a
lim
=
b
n
b
n
2n2 + 5
2n2 + 4
n2
= lim
= lim
2n2 + 4 4 + 5
2n2 + 4
1
1+ 2
2n + 4
5
n2
(2n2 +4)
= lim
n2
2n2 +4
1
= e2
1
1+ 2
2n + 4
n2
2.
lim
3n + 1
3n 5
n2
= lim
= lim
3n 5 + 5 + 1
3n 5
6
1+
3n 5
n2
= lim
6(n2)
3n5
3n5
6
6
1+
3n 5
n2
= e2
lim
1
1+
an
a n
=e
.
Prova (cenno). Il fatto che lim an = + ci assicura che definitivamente
n
an > 0 e che la successione delle parti intere [an ] diverge (an 1 < [an ]).
1
1
1
<1+
1+
kn + 1
an
kn
e di conseguena
1+
1
kn + 1
kn
<
1
1+
an
an
<
1
1+
kn
kn +1
Ora in modo del tutto analogo a quanto fatto in (), si osservi per la successione
a sinistra che
kn +1
1
kn
1
+
kn +1
1
=
1+
kn + 1
1 + kn1+1
(kn an < kn + 1 )
Serie
2.1
1
n
Questo appare evidente anche nella prova di due criteri analoghi a quelli del rapporto
e della radice provati per le successioni.
P
Criteri 2.1. Sia
an una serie a termini positivi. Allora
an+1
= l. Se l < 1 allora la serie converge, se l > 1
an
allora la serie diverge e nulla si puo dire se l = 1
La prova `e del tutto analoga a quella degli analoghi criteri per le successioni. In
particolare per il criterio del rapporto si noti che se an+1
< C si ha che a2 < Ca1 , a3 <
an
P
2
n
C a1 , . . . , an+1 < C a1 e quindi la serieP an pu`oPessere maggiorata, a meno del
termine a1 , con una serie geometrica:
an a1 C n . Da qui le conclusioni se
C < 1.
Vediamo pi`
u da vicino il comportamento di queste serie. In particolare la serie
geometrica `e stata gi`a trattata diffusamente in varie altre dispense: qui ripetiamo
brevemente per completezza le considerazioni fatte al fine di stabilire la natura di
questa serie.
1. La serie geometrica
Ricordiamo che
an
(1 a)(1 + a + a2 + + an ) = 1 an+1
aj =
1 an+1
1a
1
1a
Per stabilire la natura di questa serie maggioriamo le ridotte spezzando opportunamente il numero di elementi su cui sommiamo.
1<1
1
1
1 1
=2 < +
2
4
2 3
1
1 1 1 1
1
=4 < + + +
2
8
4 5 6 7
1
1
1
1
1
= 2k k+1 < k + k
+ k
2
2
2
2 +1
2 + 2k 1
Otteniamo quindi per la successione delle somme parziali dei termini fino al
2n+1 1-esimo la minorazione
n+1
2X
1
1
1
1 1
1 + + + + < 1 +
2 2
2
n
2
2 a2j+1 <
j=0
n
X
aj <
j=0
n
X
2j a2j
j=0
2 a2j+1 <
j=0
n
X
aj <
j=0
n
X
2j a2j
j=0
j=0
1
2(j+1)
n
n
X
X
1
1
<
<
2j j
n
2
j=1
j=1
n
n
X
X
1
1 j
quindi
<
e quindi essendo questultima una serie geomen
21
j=0
j=0
trica di ragione
2.2
1
21
converge se > 1
Serie telescopiche.
1
n
1
.
n+1
1
n2
3
n2 +3n
1
= n1 n+3
.
5.
1
.
n2 n
Per la convergenza della serie basterebbe osservare che per n > 2 si ha 2n < n2
2
da cui n2 n > n2 per cui n21n < n22 , serie questultima che `e convergente
essendo una serie armonica generalizzata con esponente maggiore di 1. Riconoscere il carattere telescopico ci permette in pi`
u di calcolarne la somma.
1
1
1
= n1 n . Calcolando le somme parziali otteniamo n = 1 n1 e poiche
n2 n
limn n1 = 0 abbiamo che la somma `e 1.
2.3
Miscellanea.
2.
3.
X n2 + 1
3n
Convergente. Dal criterio del rapporto abbiamo limn
an+1
an
= 31 .
X 7n
n!
Convergente. Dal criterio del rapporto.
X
nn
(2n + 1)n
Convergente. Dal criterio della radice.
X n 3 n2
4.
6n
n
an = 6e3 < 1.
X n!
nn
Convergente. Criterio del rapporto.
X 1
1 4
.
6.
n
n+1
5.
7.
1
1
1
Osserviamo che per il termine generico si ha
=
n
n+1
n( n + 1)
1
. Pertanto la serie diverge essendo minorata da una serie armonica.
2n
X n n
n3 + 1
Convergente. Infatti operando manipolazioni algebriche sul termine generico
3
3
X 1
n n
n2
n2
1
otteniamo 3
= 3
3 3 . La serie
e `e
3 converge poich
n +1
n +1
n
n2
n2
una serie armonica generalizzata con esponente maggiore di 1.
10
8.
X n + 1
n3 + 1
2
2 n
= 5 e quindi la serie
Convergente. Per il termine generico vale an
3
n
n2
pu`o essere maggiorata con una serie armonica convergente perche 25 > 1.
9.
2n
.
n3 + 1
2
1
n2
e poiche
1
2
2n
n3 +1
2n
n3 +n3
2
n
X n!
nn
X
1 n3
11.
1
n
10.
12.
X log n!
13.
X log n
n3
n2
n
< nn2 e che questa serie diverge essendo la serie armonica.
Osserviamo che log
n2
Se tentiamo di ottenere
2 informazioni dal criterio del rapporto abbiamo che
log(n+1)
an+1
n
= log n n+1 e entrambi i termini del prodotto convergono a 1.
an
Quindi entrambi i tentativi falliscono.
2
a
=
. Quindi a
n
2n
22n
22n
2n
X n
meno del termine log 2 siamo ricondotti a studiare il carattere della serie
2n
n
n
cosa che si fa in modo agevole con il criterio della radice poiche lim
=
n 2
1
. Quindi in definitiva la serie data converge perche tramite il criterio di
2
condensazione si riesce a maggiorare con una serie convergente.
11
che leggeremo
L `e (valore) limite della funzione f per x che tende a x0 .
Definizione sintetica di limite di una funzione.
Se x0 R `e un punto di accumulazione dellinsieme D e L R, allora
L = lim f (x)
xx0
se per ogni intorno U di L esiste un intorno W di x0 tale per ogni x W (D \ {x0 }) (cio`e per ogni
punto di D W diverso da x0 ), f (x) U .
Come nel caso dei limiti delle successioni possiamo fare lesercizio di esplicitare completamente questa
definizione in modo analitico, a seconda che x0 R o x0 = e rispettivamente L R o L = ,
considerando tutte le possibili 9 = 3 3 possibilit`a. Limitiamoci qui a trattare solo alcuni casi
(lasciando gli altri per esercizio).
- Supponiamo che x0 R e L R. Gli intorni W e U sono rispettivamente della forma I(x0 , ) e
I(L, ), dove e variano tra i numeri reali positivi. Allora la definizione si esplicita come segue:
Per ogni > 0, esiste un > 0 tale che per ogni x I(x0 , ) (D \ {x0 }) (cio`e ogni x D diverso da
x0 e tale che |x x0 | < ), f (x) I(L, ) (cio`e |f (x) L| < ).
- Supponiamo che x0 R e L = +. Gli intorni W sono come nel caso precedente, mentre U `e una
semiretta della forma U = (m, +). Allora la definizione si esplicita come segue:
Per ogni m R, esiste un > 0 tale che per ogni x I(x0 , ) (D \ {x0 }) (cio`e ogni x D diverso
da x0 e tale che |x x0 | < ), f (x) (m, +) (cio`e f (x) > m).
- Supponiamo che x0 = e L = +. Lintorno W `e una semiretta della forma W = (, k),
mentre U `e una semiretta della forma U = (m, +). Allora la definizione si esplicita come segue:
Per ogni m R, esiste k R tale che per ogni x (, k) (D \ {x0 }) (cio`e ogni x D diverso da
x0 e tale che x < k), f (x) (m, +) (cio`e f (x) > m).
Caratterizzazione dei limiti di funzione in termini di limiti di successioni. Vale il seguente
fatto:
Si ha che L = lim f (x) se e solo se per ogni successione a : N D \ {x0 } tale che an x0 , si ha
xx0
che
lim f (an ) = L.
n+
Infatti, supponiamo che L = lim f (x) e fissato arbitrariamente un intorno U di L sia W un intorno
xx0
la contronominale dellaltra implicazione. Dimostriamo cio`e che se L non `e limite di f (x) per x
x0 , allora esiste una successione an a valori in D \ {x0 } che converge a x0 e tale che f (an ) non
converge a L. Dallipotesi sappiamo che esiste un intorno U di L tale che per ogni n > 1, esiste
xn I(x0 , 1/n) (D \ {x0 }) tale che f (xn )
/ U . Poniamo allora a0 = 0, an = xn per ogni n 1. E
chiaro dalla costruzione che an x0 e che f (an ) non converge a L.
Questa caratterizzazione a volte pu`
o essere usata per dimostrare che una funzione non ammette alcun
limite costruendo due successioni a, b : N D \ {x0 } tali che an x0 , bn x0 mentre f (an ) L1
e f (bn ) L2 , con L1 6= L2 . Per esempio si consideri la funzione
f : (0, +) R, f (x) = sin(1/x) .
Si osserva che sin(1/x) = 1 se 1/x = /2 + 2n, cio`e se x = 1/(/2 + 2n), n N. Analogamente
sin(1/x) = 1 se x = 1/(/2 + 2n), n N. Poniamo dunque an = 1/(/2 + 2n), bn =
1/(/2 + 2n), n 0. Chiaramente an 0, bn 0, f (an ) 1, f (bn ) 1, quindi la funzione f
non ha alcun limite per x 0.
Enunciamo ora alcune propriet`
a dei limiti di funzione che sono conseguenza della definizione. Propriet`a
analoghe sono gi`
a state incontrate nel caso delle successioni. In effetti la caratterizzazione vista prima
permette proprio di estendere il caso delle successioni al caso generale.
In quanto segue sono dati una funzione f : D R e un punto x0 R di accumulazione per D.
Unicit`
a del limite. Se L R `e tale che L = lim f (x) , allora L `e lunico valore limite della
xx0
funzione f in R per x che tende a x0 . Pertanto scriveremo anche lim f (x) = L intendendo che L `e
xx0
xx0
lim b(x) = L R
xx0
xx0
lim b(x) = L R
xx0
xx0
(3) (Limite della funzione reciproca.) Sia a : D R una funzione e supponiamo che per
ogni x D, a(x) 6= 0. Supponiamo che
lim a(x) = L R
xx0
xx0
(4) Nella situazione del punto precedente, supponiamo che L = 0 e che esista un intorno W di x0
tale f (x) abbia segno costante + o su W (D \ {x0 }). Allora
lim 1/a(x) = .
xx0
In particolare
lim 1/|a(x)| = + .
xx0
Confronto di funzioni. Come per le successioni, in certi casi si possono ricavare informazioni sui
limiti di una funzione confrontandola con altre funzioni di cui il comportamento sia noto.
Confronto 0. Due funzioni a, b : D R che coincidono su W (D \ {x0 }) per qualche intorno W del
punto x0 di accumulazione per D hanno lo stesso comportamento per x x0 , cio`e luna ha limite se
e solo se laltra ha limite ed eventualmente i limiti coincidono.
Confronto 1. Siano a, b : D R due funzioni. Supponiamo che
lim b(x) = +
xx0
e che esiste un intorno W di x0 tale che per ogni x W (D \ {x0 }), a(x) b(x). Allora
lim a(x) = + .
n+
xx0
xx0
2) Esiste un intorno W di x0 tale che per ogni x W (D \ {x0 }), a(x) c(x) b(x).
Allora:
lim c(x) = L .
xx0
xx0
Vale una versione analoga quando x0 x per ogni x D e f `e non crescente. Lasciamo i dettagli al
lettore.
Limiti di funzioni composte. Nel caso delle successioni abbiamo studiato il comportamento delle
sottosuccessioni di successioni regolari. Questo si estende allo studio dei limiti delle funzioni composte.
Vale il seguente fatto:
Siano f : D R tale che f (D) D R, e sia g : D R. Possiamo quindi considerare la funzione
composta g f : D R. Supponiamo che:
1) x0 R `e di accumulazione per D.
2) lim f (x) = L R e L `e di accumulazione per D .
xx0
3) lim g(y) = M R
yL
per esercizio), 0 `e di accumulazione per D , lim g(y) = 0. Daltra parte g(x sin(1/x)) = 1 se e solo
y0
se sin(1/x) = 0, cio`e 1/x = n, x = (1/n), con n che varia in N. Altrimenti g(x sin(1/x)) = 0.
Applicando la caratterizzazione dei limiti per mezzo delle successioni si vede allora che gf `e irregolare.
Infatti lenunciato precedente non si applica perche non vale lipotesi 4). La dimostrazione `e una
conseguenza diretta delle definizioni e pu`
o essere svolta come utile esercizio.
Vedremo tra poco una variante di questo enunciato che far`a uso della nozione di continuit`
a.
Limiti destri e limiti sinistri. Dati x0 R e D R, diciamo che x0 `e un punto di accumulazione
bilaterale di D se `e un punto di accumulazione per entrambi i sottoinsiemi D+ = {x D; x > x0 }
e D = {x D; x < x0 }. Se f : D R `e una funzione definita su D indichiamo con f + e f
rispettivamente le restrizioni di f a D+ e D . Poniamo allora per definizione
lim f (x) := lim f + (x)
xx0
xx+
0
xx
0
xx0
xx0
xx0
xx
0
concludere che non esiste il limite lim f (x). Ad esempio questo si applica alla funzione f (x) = 1/x
xx0
definita su D = R \ {0} e x0 = 0.
2. Funzioni continue
Funzioni continue in un punto. Siano f : D R una funzione e x0 D. Per definizione
la funzione f `e continua nel punto x0 D se per ogni intorno U di f (x0 ) esiste un intorno W di x0
tale che per ogni x W D, f (x) U .
In questo caso entrambi x0 e f (x0 ) appartengono a R, quindi la definizione appena data pu`
o essere
esplicitata come segue:
la funzione f `e continua nel punto x0 D se per ogni > 0 esiste > 0 tale che per ogni x
I(x0 , ) D (cio`e x D e |x x0 | < ) si ha che f (x) I(f (x0 ), ) (cio`e |f (x) f (x0 )| < ).
Ci sono due casi possibili riguardo alla posizione di x0 in D:
(1) x0 D ed `e di accumulazione per D;
(2) x0 D e non `e di accumulazione per D. Quindi esiste un intorno I(x0 , ) di x0 tale che I(x0 , )
D = {x0 } e si dice anche che x0 `e un punto isolato di D.
Valgono i seguenti fatti
(a) Se x0 D `e un punto isolato di D allora f `e continua in x0 .
(b) Se x0 D `e di accumulazione per D allora f `e continua in x0 se e solo se
lim f (x) = f (x0 ) .
xx0
Dimostriamo (a). Fissiamo un intorno W di x0 in R tale che DW = {x0 }. Allora f (DW ) = {f (x0 )}
che `e contenuto in qualsiasi intorno di f (x0 ). Dimostriamo (b). Supponiamo che f sia continua in
x0 . Fissato un intorno U di f (x0 ), sia W un intorno di x0 tale che f (W D) U . Allora a maggior
ragione f (W (D \ {x0 })) U e quindi lim f (x) = f (x0 ). Dimostriamo ora la contronominale
xx0
dellaltra implicazione. Supponiamo che f (x0 ) non sia uguale a lim f (x) e dimostriamo che allora f
xx0
non `e continua in x0 . Usando lipotesi sappiamo che esiste un intorno U di f (x0 ) tale per ogni intorno
W di x0 esiste x W D, x 6= x0 , tale che f (x)
/ U . Quindi non esiste alcun intorno W di x0 tale
che f (D W ) U e f non `e continua in x0 .
Estensione di funzioni per continuit`
a. Siano D un sottoinsieme di R, x0 R di accumulazione
per D e supponiamo che x0
/ D. Sia f : D R tale che lim f (x) = L R. Allora possiamo definire
xx0
f : D {x0 } R, ponendo f(x) = f (x) se x D, f(x0 ) = L. E immediato che f `e continua in x0 ;
si dice allora che f `e stata ottenuta estendendo f al punto x0 per continuit`
a. Ad esempio la funzione
f (x) = x sin(1/x) `e definita su R \ {0}. Si verifica che lim f (x) = 0, quindi f pu`
o essere estesa al
x0
definite su tutto R.
La funzione esponenziale x ex definita su tutto R.
La funzione logaritmo naturale x log(x) definita sulla semiretta aperta (0, +).
La verifica di queste affermazioni pu`
o essere fatta per esercizio.
Ancora sui limiti delle funzioni composte. Come promesso diamo qui una variante del risultato
gi`a visto, dove vegono modificate le ipotesi 2) e 4). Vale il seguente fatto:
Siano f : D R tale che f (D) D R, e sia g : D R. Possiamo quindi considerare la funzione
composta g f : D R. Supponiamo che:
1) x0 R `e di accumulazione per D.
2) lim f (x) = L R, L D ed `e di accumulazione per D .
xx0
3) lim g(y) = M R
yL
4) g `e continua in L.
Allora lim g f (x) = M .
xx0
Il punto (1) `e una conseguenza immediata delle definizioni. Per il punto (2), basta dimostrare che g f
`e continua in ogni punto x0 D che `e di accumulazione per D e il risultato voluto `e una conseguenza
di quanto osservato sui limiti delle funzioni composte.
Sulla (non) continuit`
a della funzione inversa. Sia f : D R continua e iniettiva. Quindi
`e definita la funzione inversa f 1 : Im(f ) D R. Possiamo allora chiederci se anche f 1 `e
continua. La risposta `e in generale negativa. Si consideri ad esempio f : N R, definita da f (0) = 0,
f (n) = 1/n per ogni n 1. Chiaramente f `e iniettiva ed `e continua perche tutti i punti di N sono
isolati. Limmagine di f `e
Im(f ) = {0} {1/n| n 1}
1
allora f `e continua in ogni punto del tipo 1/n perche questo `e isolato in Im(f ). Daltra parte f 1
non `e continua in 0. Infatti 0 `e di accumulazione per Im(f ), 1/n 0,
lim f 1 (1/n) = lim n = + 6= f 1 (0) = 0 .
n+
n+
E per`
o vero che per certe classi particolari di funzioni continue e invertibili linversa `e a sua volta
continua. Ad esempio vedremo in seguito che vale il seguente risultato:
Sia f : I R una funzione continua e iniettiva definita su un intervallo aperto I. Allora anche
J := Im(f ) `e un intervallo aperto e f 1 : J I `e continua.
Ancora sui limiti di funzione.
Sulle forme indeterminate. Nello studio delle propriet`
a algebriche dei limiti (di successioni o di
funzioni) abbiamo individuato delle cosiddette forme indeterminate. In questo paragrafo vogliamo
riorganizzarle un po. Poniamo per indicare senza fare distinzione . Prendiamo come forme
indeterminate fondamentali le due seguenti:
0
,
.
0
Individuiamo adesso altre forme indeterminate ed indichiamo come, almeno formalmente, possano
essere ricondotte a quelle fondamentali.
(0 ) Supponiamo che per x a, un prodotto di funzioni f (x)g(x) presenti una indetermif (x)
nazione del tipo 0 . Allora in un intorno di a, f (x)g(x) = 1 dove il rapporto presenta
g(x)
0
ora unindeterminazione di tipo . Se f e diversa da zero quando x a, allora possiamo
0
g(x)
.
anche usare f (x)g(x) = 1 ottenendo cos` una indeterminazione di tipo
f (x)
(+ ). Supponiamo che per x a, una somma di funzioni f (x) + g(x) presenti una
indeterminazione del tipo + (+). Allora f + g = log(ef +g ) = log(ef eg ), cos` che al
limite il prodotto ef eg presenta una indeterminazione di tipo 0 e ci possiamo ricondurre
al caso precedente.
(1 ). Supponiamo che per x a, la funzione f (x)g(x) = eg(x) log(f (x)) sia tale che f (x) > 0,
f (x) 1, g(x) . Si noti che lesponente g(x) log(f (x)) presenta una indeterminazione
di tipo 0 e possiamo quindi ricondurci ad un caso precedente. Questa situazione si pu`
o
1
anche trattare osservando che f (x)g(x) = ((1 + (f (x) 1)) f (x)1 )(f (x)1)g(x) , con f (x) 1 che
tende a 0 quando x a. Usando il limite
lim (1 + y)1/y = e
y0
che giustificheremo dopo, e un cambio di variabile, per x a siamo ridotti a studiare il limite
di e(f (x)1)g(x) e nellesponente troviamo ancora una indeterminazione di tipo 0 . Abbiamo
cos` individuato un nuovo tipo di indeterminazione indicato come 1 .
(0 ). In una situazione analoga alla precedente supponiamo che f (x) > 0, f (x) ,
g(x) 0. Come prima consideriamo f (x)g(x) = eg(x) log(f (x)) e osserviamo che lesponente
g(x) log(f (x)) presenta ancora una indeterminazione di tipo 0 = 0 e possiamo quindi
ricondurci ad un caso precedente.
Alcuni limiti notevoli.
(1) Si consideri la funzione x sin(x)/x definita su D = R \ {0}. Il punto 0 `e di accumulazione per
D. Vale allora
lim sin(x)/x = 1 .
x0
x0
1 x
) = ex log(1+1/x) definita su D = {x R| (1 + 1/x) > 0}.
x
I punti R sono di accumulazione per D. Vale allora:
1
lim (1 + )x = e .
x
x
(3) Si consideri la funzione f (x) := (1 +
1
1 [x]+1
)[x] , h(x) = (1 +
)
.
[x] + 1
[x]
Si osserva che:
Poich`e [x] x [x] + 1, allora per ogni x > 0, g(x) f (x) h(x).
Se [x] = n, allora
1
1 n+1)
)
/(1 +
)
g(x) = (1 +
n+1
n+1
1
1
h(x) = (1 + )(1 + )n .
n
n
1
1
Poiche (1 +
) 1 e (1 + ) 1 quando n +, allora g(x) e e h(x) e (limite
n+1
n
notevole che definisce il numero di Nepero).
Infine, per i carabinieri anche f (x) e quando x +.
Infatti f (x) = F (G(x)), dove G(x) = 1/x definita su D, F (y) = (1 + 1/y)y , definita quando |y| > 1.
Allora il limite segue da quelli dellesempio (3) e dalle propriet`
a dei limiti delle funzioni composte.
(5) Si consideri la funzione f (x) :=
lazione per D. Vale allora
log(1 + x)
definita su D = (1, 1) \ {0}. Il punto 0 `e di accumux
log(1 + x)
=1.
x
Infatti f (x) = log((1 + x)1/x , allora poiche log(e) = 1, il risultato segue dalla continuit`
a di log e dal
limite dellesempio (4).
lim
x0
(6) Si consideri la funzione f (x) := (ex 1)/x definita su D = R \ {0}. Il punto 0 `e di accumulazione
per D. Vale allora
lim (ex 1)/x = 1 .
x0
x0
x0
Lo scopo di questa dispensa `e quello di individuare classi di funzioni continue che sono esplicitamente
costruibili a partire da un insieme dato di poche funzioni fondamentali, applicando determinate
procedure che preservano la continuit`
a.
Indichiamo con
F = {f : D R D R, D 6= }
linsieme di tutte le funzioni a valori reali, definite su qualche sottoinsieme non vuoto D di R.
Ricordiamo per comodit`
a del lettore la definizione di funzione continua gi`a studiata in [FUNZIONI]:
Sia f : D R un elemento di F . Diciamo che la funzione f `e continua su D se per ogni a D, per
ogni > 0, esiste = (, a) > 0 tale che per ogni b D tale che |b a| < si ha che |f (b) f (a)| < ;
in modo equivalente si pu`
o dire che: f ((a , a + ) D) (f (a) , f (a) + ).
Ricordiamo anche che se ogni elemento a D `e di accumulazione per D allora f `e continua su D se
e solo se per ogni a D si ha che:
lim f (x) = f (a) .
xa
;
(1) 1 1 =
2
(2) Esiste un sottoinsieme infinito A1 N tale che per ogni n A1 , an I1 .
, da cui n n b b = 0.
I due limiti coincidono: b = b = b. Infatti n n =
2n
Possiamo infine costruire una sottosuccesione di a tale che anj b. Poniamo an0 dove n0 `e il minimo
elemento di A1 . Poi per induzione definiamo anj dove nj `e il minimo elemento di Aj+1 \{n0 , . . . , nj1 }
(che `e non vuoto perche Aj+1 `e infinito). Per costruzione, nj anj nj , e per confronto si
conclude appunto che anche anj b I. Dunque I `e compatto per successioni.
2
Non `e difficile dimostrare una specie di teorema inverso (lo lasciamo per esercizio).
Proposizione 1.2. Se I `e un intervallo compatto per successioni, allora I `e chiuso e limitato, cio`e
della forma I = [, ].
2. Funzioni continue definite su un intervallo chiuso e limitato
Teorema 2.1. (Teorema degli zeri) Sia I = [, ], < , un intervallo chiuso e limitato. Sia
f : I R una funzione continua. Supponiamo che f ()f () < 0. Allora esiste a I tale che
f (a) = 0.
Dim. Per ipotesi f () e f () hanno segni opposti, dunque i due corrispondenti punti del grafico
G(f ) I R R2 stanno da parti opposte rispetto al segmento I {0}. Lidea geometrica intuitiva `e
che siccome la funzione f `e continua, il grafico G(f ) `e una curva che pu`
o essere disegnata senza staccare
mai la matita dal foglio. Ma allora ci deve essere un punto di intersezione (a, 0) G(f ) I {0}, da
cui f (a) = 0. Vediamo di formalizzare questa idea intuitiva. Intanto (considerando se necessario la
funzione f ) non `e restrittivo supporre che f () < 0 e f () > 0. Poniamo E = {x I; f (x) < 0}.
Chiaramente E `e non vuoto e limitato superiormente. Poniamo a = sup E. E chiaro che a I.
Affermiamo che f (a) 0. Infatti se fosse f (a) > 0, per la continuit`
a di f e la permanenza del
segno esisterebbe un > 0 tale che (a , a + ) I e per ogni x (a , a + ), f (x) > 0. Per
le propriet`
a del sup, E (a , a + ) 6= , dunque esistebbe y tale che f (y) > 0 e f (y) < 0 che `e
impossibile. Vogliamo dimostrare che f (a) = 0. Se invece fosse f (a) < 0, ancora per la continuit`
a di
f e la permanenza del segno, ci sarebbe > 0 tale che (a , a + ) I e per ogni x (a , a + ),
f (x) < 0. Ma allora a + /2 > a ed appatiene ad E e questo `e contro il fatto che a = sup E.
2
Teorema 2.2. (Teorema del punto fisso) Sia I = [, ] un intervallo chiuso e limitato. Sia
f : I I una funzione continua. Allora f ha almeno un punto fisso, cio`e esiste a I tale che
f (a) = a.
Dim. Se I = {} il teorema `e banalmente vero. Supponiamo < . Se f () = o f () = , la
tesi `e verificata. Altrimenti si ha che necessariamente f () > e f () < . Cio `e i punti (, f ())
e (, f ()) def grafico G(f ) I 2 stanno da parti apposte rispetto alla diagonale (I) del quadrato
I 2 . Adesso lidea intuitiva `e che il grafico debba necessariamente intersecare la diagonale. In effetti
possiamo ricondurci al Teorema degli zeri. Poniamo infatti g : I R, g(x) = x f (x); g `e continua
e g()g() < 0. Dunque esiste a I tale che g(a) = a f (a) = 0.
2
Per il seguente teorema `e cruciale la compattezza degli intervalli chiusi e limitati.
Teorema 2.3. (Teorema del massimo e del minimo) Sia I = [, ] un intervallo chiuso e
limitato. Sia f : I R una funzione continua. Allora f ha almeno un punto di minimo e un punto
di massimo, cio`e esistono a, b I tali che per ogni x I, f (a) = A f (x), f (b) = B f (x).
Dim. Dimostriamo intanto che f (I) `e limitata. Per esempio dimostriamo che `e limitata superiormente.
Altrimenti esisterebbe una successione a : N I, tale che f (an ) +. Per la compattezza di I
a di f avremmo
possiamo estrarre da a una sottosuccessione anj tale che anj b I. Per la continuit`
f (anj ) f (b) 6= +, che `e assurdo. Analogamente si dimostra che `e limitata inferiormente. Poniamo
allora A = inf f (I) R, B = sup f (I) R rispettivamente. Vogliamo dimostrare per esempio che
esiste b I tale che f (b) = B. Ragionando come prima (sostituendo B a +), costruiamo una
successione anj a valori in I tale che anj b I e f (anj ) f (b) = B. Analogamente possiamo
dimostrare che esiste a I tale che f (a) = A.
2
Il Teorema precedente pu`
o essere riformulato nel modo seguente:
Sia I = [, ] un intervallo chiuso e limitato. Per ogni funzione continua f : I R, esiste un
intervallo chiuso e limitato [A, B] tale che f (I) [A, B] (per cui possiamo scrivere f : I [A, B]) e
A, B f (I).
Il seguente teorema precisa che f : I [A, B] `e surgettiva.
Teorema 2.4. (Teorema dei valori intermedi) Siano I = [, ] un intervallo chiuso e limitato e
f : I [A, B] una funzione continua tale che A, B f (I). Allora f (I) = [A, B].
Dim. Se A = B la funzione `e costante e la tesi `e banalmente verificata. Supponiamo che A < B e sia
y un arbitrario valore intermedio A < y < B. La funzione g : I R, g(x) = f (x) y `e continua e
verifica lipotesi del teorema degli zeri. Quindi esiste a in I tale che g(a) = f (a) y = 0, cio`e y = f (a).
Poiche y `e arbitrario, questo mostra proprio che f (I) = [A, B].
2
Il seguente corollario `e giusto una riformulazione espressiva e concisa di alcuni dei fatti appena dimostrati.
Corollario 2.1. Sia f : D R una funzione continua definita su un arbitrario sottoinsieme D di R.
Allora f manda ogni intervallo compatto contenuto in D sopra un intervallo compatto di R.
3. Funzioni continue definite su un intervallo qualsiasi
I teoremi visti nel precedente paragrafo si applicano per ottenere risultati nel caso di intervalli qualsiasi.
Corollario 3.1. Siano I un intervallo, f : I R continua. Supponiamo che esistano , I tali
che f ()f () < 0. Allora esiste a I tale che f (a) = 0.
Dim. Basta applicare il Teorema degli zeri alla restrizione di f allintervallo [, ] I.
Lipotesi del corollario si realizza in molte circostanze. Per esempio, per la permanenza del segno
questo succede se lim f (x) = ls R, lim f (x) = ld R e ls ld < 0. Come caso particolare, si
xes
xed
pu`
o dimostrare in questo modo che ogni polinomio p(X) a coefficienti reali di grado dispari ha una
radice reale (metre se il grado `e pari possono non esistere radici reali, come succede per il polinomio
p(X) = X 2 + 1).
Corollario 3.2. Siano I un intervallo, f : I R continua. Allora anche f (I) `e un intervallo.
Dim. Realizziamo I = n In come l unione di una successione crescente di intervalli chiusi e limitati.
Allora f (I) = n f (In ) `e anchessa lunione di una successione crescente di intervalli chiusi e limitati,
dunque `e un intervallo.
2
Sia f : D R, D R, una qualsiasi funzione crescente o decrescente. E allora evidente che f `e
iniettiva. Nel caso di funzioni continue definite su un intervallo vale anche il viceversa ed inoltre la
funzione inversa `e continua.
Proposizione 3.3. Siano I un intervallo, f : I R continua e iniettiva. Allora:
(1) (Monotonia delle funzioni iniettive) f `e strettamente monotona, cio`e `e crescente o decrescente.
(2) (Continuit`
a dellinversa) La funzione inversa f 1 : f (I) I `e continua.
Dim. (1) Supponiamo per assurdo che esistano tre punti in I, a < b < c tali che f (a) < f (b),
f (b) > f (c), oppure f (a) > f (b), f (b) < f (c). Ragioniamo nel primo caso (laltro sar`a analogo). Sia
y tale che f (a) < y < f (b) e y > f (c). Applicando il Teorema dei valori intermedi alla restrizione di
f su lintervallo [a, b] e sullintervallo [b, c] rispettivamente, vediamo che esistono t (a, b) e t (b, c)
tali che f (t) = f (t ) = y e questo `e contro lipotesi che f sia iniettiva.
(2) Sappiamo gi`
a che J := f (I) `e un intervallo. Se f `e crescente (risp. decrescente) anche f 1 `e
crescente (risp. decrescente). Supponiamo per semplicit`a che y0 = f (x0 ) sia interno a J. Eventualmente considerando f non `e restrittivo supporre che f sia crescente. Per la propriet`
a dei limiti delle
funzioni crescenti sappiamo che i due limiti destro e sinistro esistono e che
L := lim f 1 (y) f 1 (y0 ) lim f (x) := L+ .
yy0+
yy0
Basta dimostrare che i due limiti coincidono. Supponiamo per assurdo che invece
lim f 1 (y) < lim+ f (x) .
yy0
yy0
Quindi per y < y0 , f (y) L , mentre per y > y0 , f 1 (y) L+ . Quindi limmagine J = f (I) non
`e un intervallo e questa `e una contraddizione.
2
1
3 Novembre 2014
Un anno di trigonometria e un po di logaritmi
Un poco di logaritmi
Nella dispensa Reali abbiamo visto che si pu`o definire per ogni reale a > 0 una
funzione f , che abbiamo indicato con aq , da Q a R+ con la propriet`a che perogni
abbiamo definito aq = n am .
q1 , q2 Q f (q1 + q2 ) = f (q1 ) f (q2 ) : se q = m
n
Dopodiche abbiamo esteso, tramite lassioma di continuit`a, questa funzione a tutto
m
< x}.
R definendo ax come il sup dellinsieme {a n con m
n
Abbiamo affermato , lasciando la verifica al lettore, che si verifica che questa funzione
se a > 1 `e crescente e che vale
ax+y = ax ay .
A questo punto, dati due numeri reali a e b positivi, definiamo logaritmo di b in base
a lesponente da dare a a per ottenere b,2 cio`e
aloga b = b
Dalla propriet`a
ab1 ab2 = ab1 +b2
otteniamo
Un poco di trigonometria.
B (cos y, sen y)
U (1,0)
Consideriamo quindi la situazione nella figura e operiamo una rotazione che porti il
punto B (cos y, sin y) nel punto U (1, 0). Essendo una rotazione una trasformazione che conserva le distanze (isometria) la distanza dei punti A e B (cio`e la
lunghezza del segmento AB) e quella dei punti C e U (lunghezza del segmento CU )
sar`a la stessa. Calcolandole si ha
p
p
(cos x cos y)2 + (sin x sin y)2 = (cos(x y) 1)2 + (sin(x y) 0)2
3
Si noti quindi che queste funzioni sono funzioni della variabile reale x.
sin(xy) = cos( +xy) = cos( +x) cos y+sin( +x) sin y = sin x cos ycos x sin y
2
2
2
Scriviamo ci`o che abbiamo ottenuto per x + y
cos(x + y) = cos x cos y sin x sin y
sin(x + y) = sin x cos y + cos x sin y
Da qui prendendo y = x si ottengono immediatamente le formule di duplicazione
cos 2x = cos2 x sin2 x
sin 2x = 2 sin x cos x
da cui quelle di bisezione
r
1 + cos x
x
cos
=
2
2
r
x
1 cos x
=
.
sin
2
2
Ovviamente si pu`o continuare ottenendo formule di trisezione etc. Le cosiddette
formule di prostaferesi si ottengono sommando (e sottraendo) le formule di addizione
e sottrazione per seno e coseno, cio`e sommando e sottraendo espressioni del tipo
sin(x + y) = sin x cos y + cos x sin y e sin(x y) = sin x cos(y) + cos x sin(y).
Ponendo x + y = p e x y = q abbiamo che x = p+q
e y = pq otteniamo
2
pq
p+q
cos
2
2
p+q
pq
sin p sin q = 2 cos
sin
2
2
p+q
pq
cos p + cos q = 2 cos
cos
2
2
p+q
pq
cos p cos q = 2 sin
sin
2
2
sin p + sin q = 2 sin
Continuit`
a delle funzioni trigonometriche e esponenziali.
()
e si ha che se |x x0 |
allora
= .
A
Una funzione per cui vale tale relazione si dice soddisfare alla condizione di Lipschitz o che `e
lipschitziana e A viene detta costante di Lipschitz.
5
Si `e usato il fatto che verr`
a dimostrato in seguito che | sin x| |x|
|ax ax0 | = ax0 (axx0 1)
+1
ax 0
da cui
ax0 (axx0 1)
Il ragionamento `e perfettamente analogo per lintervallo sinistro, cio`e se x < x0 .
Senza alcuna pretesa di completezza, vogliamo mostrare come gli strumenti del calcolo che abbiamo
sviluppato e in particolare le funzioni elementari introdotte nelle dispense [EC] e [ED] intervengano
per costruire modelli di sistemi della realt`
a (fisica, economica, biologica, ...). In modo un po
grossolano ma abbastanza pertinente possiamo dire che tutti questi sistemi hanno delle caratteristiche
in comune: un sistema reale consiste in diverse grandezze, X, Y, . . . , che interagiscono tra loro. Per
ogni grandezza `e fissata ununit`
a di misura. Per ogni stato del sistema si possono misurare (almeno
in modo approssimato) le grandezze in gioco, ottenendo cos` un certo insieme di numeri reali x, y, . . . .
In generale si tratta di grandezze vettoriali, ma ai fini di questa discussione ci restringiamo a grandezze
scalari. Si cerca allora di determinare le leggi che governano le relazioni esistenti nella realt`
a tra
queste grandezza in termini delle rispettive misure. Di solito ci sono due tipi di legge: dinamico
in cui si tende a descrivere come, a partire da un certo stato iniziale, il sistema occupi in seguito
altri stati; statico i cui si determinano le relazioni tra le grandezze in un dato stato, specialmente in
uno stato di equilibrio nel quale il sistema tende a permanere (in assenza di agenti esterni). Almeno
nei casi pi`
u semplici, tali leggi hanno una forma del tipo y = f (x) cio`e esprimono il fatto che certe
grandezze sono funzione delle altre. E importante capire che questo `e solo un modello teorico del
nostro sistema reale, che sar`a corroborato (o meno) a seconda dellaccordo tra la previsione teorica e
le reali misure in un arbitrario stato del sistema. Un modello teorico y = f (x) comporta due aspetti,
uno di natura qualitativa che prescrive solo la forma della funzione f , uno di natura effettiva che
definisce esattamente chi `e f . Questa distinzione sar`a chiarita in seguito. A parte il necessario accordo
con i dati sperimentali gi`
a noti, in buona misura la scelta di un modello teorico `e spesso arbitraria
e dettata anche da fattori e pregiudizi di ordine psicologico, estetico, ideologico, religioso . . . (le
leggi della natura sono dettate da Dio che `e perfetto e dunque devono essere espresse in termini di
enti perfetti - `e evidente per esempio che le circonferenze sono le ellissi perfette . . . ). In ogni
caso il modello viene corroborato (o meno) a posteriori come gi`a detto.
MODELLI E INTERPOLAZIONI
MODELLI E INTERPOLAZIONI
1X 2
d .
n j j
Si noti abbiamo preso la media aritmetica dei quadrati degli errori individuali piuttosto che la media
aritmetica degli errori stessi. Ci sono varie ragioni per fare questo: intanto errori di segno opposto
(anche di valore assoluto grande) possono cancellarsi nella media aritmetica, mentre questo non succede prendendo i quadrati; inoltre con i quadrati si minimizza il contributo degli errori sperimentali
(che possiamo cercare di rendere piccoli) mentre amplifica gli eventuali errori grandi dovuti ad una
possibile inadeguatezza sistematica non eliminabile del nostro modello. Ricordiamoci ora che in effetti la retta teorica `e incognita, mentre il numero S(m, q) `e definito per ogni retta. E ragionevole
pensare che la retta teorica che cerchiamo (ammesso che esista) sia approssimata bene dalla retta che
minimizza S(m, q). Si tratta quindi di un problema di ricerca di punto di minimo assoluto per una
funzione di due variabili. Vediamo come questo specifico problema pu`o essere ricondotto alla ricerca
dei punti di minimo di due determinate funzioni quadratiche di una sola variabile, cosa che sappiamo
fare facilmente come abbiamo visto sopra. Per enunciare i prossimi risultati, conviene introdurre
alcune notazioni:
Notazioni Date due sequenze finite di numeri reali x = (x1 , . . . , xn ), y = (y1 , . . . , yn ), indichiamo con
x
la media aritmetica degli xj , xy
la media aritmetica dei prodotti xj yj , x2 , la media aritmetica dei
2
punti xj .
Procediamo allora nel modo seguente:
Per ogni m fissato, calcoliamo S(m, q) pensata come funzione della sola variabile q. Con calcoli
semplici che non riportiamo, si verifica allora che `e una funzione quadratica della forma:
S(m, q) = q 2 + bq + c
dove i coefficienti b, c possono essere calcolati esplicitamente, dipendono dagli xj , yj ed anche
dal parametro m. Dunque, per ogni m, esiste un unico punto di minimo q0 = q0 (m) = b/2,
che alla fine risulta essere
q0 (m) = y m
x.
Per ogni m, calcoliamo S(m, q0 (m)). Omettendo ancora una volta i dettagli, concludiamo che
anche questa `e una funzione quadratica di m, della forma:
S(m, q0 (m)) = am2 + hm + k
dove i coefficienti a, h, k possono essere calcolati esplicitamente in funzione dei soli xj , yj , ed
inoltre a > 0. Allora anche S(m, q0 (m)) ha un unico punto di minimo locale m0 = h/2a che
alla fine risulta essere:
xy
xy
.
m0 = 2
x x2
Infine il punto di minimo assoluto per S(m, q) cercato `e dato dalla coppia
(m0 , q0 (m0 )) .
Abbiamo trovato cos` questa retta y = m0 x + q0 (m0 ) che viene detta la retta di regressione
dei nostri dati sperimentali (xj , yj ). Si dice anche che tale retta `e ottenuta per interpolazione
lineare di quei dati.
MODELLI E INTERPOLAZIONI
Resta il problema di valutare quanto questa sia una buona approssimazione della retta teorica incognita
(ammesso che esista) e, in ultima analisi, se il modello teorico lineare stesso sia adeguato al nostro
sistema oppure no. Non `e qui il luogo di sviluppare i dettagli di questo argomento (probabilmente
questi temi saranno ripresi in altri corsi del corso di laurea). Ci limitiamo a dare il risultato finale.
Viene derivato il coefficiente di Pearson
xy
x
y
CP = q
2
2
(x x
)(y2 y2 )
che ha il seguente significato: se |CP | `e abbastanza vicino a 1 (per esempio dellordine di 0, 995) e n
`e abbastanza grande (per esempio n 5 meglio n 6) allora si pu`
o ritenere che il modello teorico
lineare `e adeguato e che la retta di regressione `e una buona approssimazione della retta teorica. Se CP
`e vicino allo zero, allora il modello teorico lineare va rigettato. Si noti che il modo in cui abbiamo
specificato i due abbastanza ha carattere prevalentemente empirico, viene abitualmente adottato
(seguendo protocolli internazionali) per esempio per molte analisi chimiche, ma non ha carattere
universale. Inoltre ci sono molti altri accorgimenti per migliorare lattendibilit`
a del risultato. Per
esempio, spesso per ogni xj si fanno almeno 3 misurazioni diverse per y e si prende poi come yj la
media dei valori ottenuti. Un altro punto delicato `e la distribuzione dei valori degli xj . Si potrebbe per
esempio prendere una distribuzione uniforme in cui questi si susseguono uno dopo laltro a distanza
d fissa (e ci sarebbe comunque da giustificare la scelta di d). In altri casi (questo `e soprattutto
vero per linterpolazione esponenziale di cui parleremo poi) conviene scegliere la posizione degli xj in
modo non uniforme, con opportuni addensamenti dettati dalle caratteristiche proprie del sistema
reale preso in considerazione.
3. Modelli di tipo sinusoidale o periodico
Un modello di tipo sinusoidale `e della forma
y = f (x) = A cos((x x0 )) + y0
dove i parametri A, y0 , x0 R, A > 0. A meno di comporre con una opportuna traslazione x x + r,
pu`
o essere riscritto in forma analoga, con la funzione sin al posto di cos. I i parametri determinano
completamente f , ed hanno ciascuno un significato preciso. Limmagine della funzione f `e lintervallo
[y0 A, y0 + A]. Quindi lampiezza delle oscillazioni (positive o negative) del grafico di f `e A, mentre
y0 `e il valor medio. La funzione f `e periodica di periodo
2
,
P =
:= 1/P
`e detta la frequenza di f , mentre
2
= 2 =
P
`e la frequenza angolare. Leffetto di x0 `e quello di traslare le ascisse. Ne segue che i punti di massimo di
f sono della forma x0 + kP , k Z. Grazie alla periodicit`
a di f , la funzione non cambia se sostituiamo
x0 prendendolo uguale al primo punto di massimo non negativo; scelto con questa convenzione, x0 `e
detto la fase di f .
Molti sistemi reali che presentano comportamenti ondulatori, oscillatori, vibranti, radianti (si
pensi allemissione del suono di praticamente qualsiasi strumento musicale, alle onde elettromagnetiche
. . . ) o anche semplicemente periodici, si prestano ad essere trattati con modelli sinusoidali o opportune
combinazioni di questi. A questo proposito facciamo un paio di osservazioni:
Si osserva che sommando per esempio funzioni sinusoidali di uguale ampiezza e periodo ma
con fasi differenti, si possono avere fenomeni di interferenza con associati effetti di risonanza
o di cancellazione che sono tipici dei sistemi di tipo ondulatorio. Per esempio usando note
formule di trigonometria si calcola che:
x0
x0
A cos(x) + A cos((x x0 )) = 2A cos( ) cos[(x )] .
2
2
MODELLI E INTERPOLAZIONI
P
=
le due funzioni si cancellano e la somma `e nulla. Questo si pu`
o
2
effettivamente realizzare in laboratorio illuminado un oggetto con due raggi di luce (che hanno
anche un carattere ondulatorio) della stessa intensit`a (ampiezza), colore (frequenza)
ma fasi che differiscono per P/2; il risultato `e che loggetto resta al buio. E curioso notare
come questa fenomenologia scientifica `e per una volta passata nel linguaggio comune in modo
pertinente: si usa dire infatti sono fuori fase per dire che non riusciamo ad accordarci con
il ritmo della realt`
a circostante e che i nostri sforzi anche intensi hanno effetti mediocri.
Sviluppando una funzione sinuosidale f usando ancora una volta note formule di trigonometria,
si verifica che f pu`
o essere riscritta nella forma
Se poniamo x0 =
f (x) = y0 +
n
X
aj cos(jx) +
n
X
bj sin(jx)
j=1
j=1
Un altro modello di tipo esponenziale compare per trattare fenomeni di decadimento radioattivo.
Supponiamo di avere una regione dello spazio occupata da un campione di isotopo radioattivo di un
certo atomo. Gli atomi radioattivi decadono (cessando di essere radioattivi) emettendo particelle
che tendono a rendere radioattivi altri atomi. Supponiamo che abbia senso definire e si possa misurare
una grandezza macroscopica V (t) che riflette la quantit`
a di atomi radioattivi presenti al tempo t, a
partire da un tempo iniziale t = 0. Il modello predice che se [t0 , t1 ] `e un intervallo di tempo piccolo,
allora:
V (t1 ) V (t0 ) = V (t0 )(t1 t0 )
dove > 0 `e la costante di decadimento propria di quellatomo. Il senso del modello `e che la quantit`
a
di atomi che decade `e proporzionale alla quantit`
a di atomi radioattivi presenti, e che quest ultima
diminuisce con il passare del tempo. Fissiamo t1 > 0 (piccolo) e calcoliamo per induzione V (nt1 ) per
ogni n 1 (notare che (n + 1)t1 nt1 = t1 `e piccolo per ogni n); ponendo t = nt1 si ottiene
MODELLI E INTERPOLAZIONI
V (t) = (1
t n
) V (0) .
n
Un modello dello stesso tipo `e adeguato per analizzare una situazione molto pi`
u familiare, cio`e il
comportamento di un libretto di risparmio a tasso fisso. Disponendo di un capitale c0 che prevediamo
di non utilizzare per un tempo abbastanza lungo, possiamo aprire un libretto di risparmio con capitale
iniziale c0 , e farlo crescere grazie agli interessi composti maturati nel tempo. Il meccanismo `e il
seguente:
E fissato un intervallo di tempo (un anno, sei mesi,...) che possiamo prendere come unit`
a
di misura del tempo; si conviene che per maturare linteresse alla fine di un tale intervallo, il
capitale presente nel libretto allinizio dell intervallo `e vincolato, cio`e non pu`
o essere toccato
per tutta la durata dellintervallo.
E fissato un tasso di interesse fisso del p0 per cento (per esempio del 2 per cento). Poniamo
r0 = p0 /100.
Allora al tempo iniziale t = 0, abbiamo un capitale c(0) = c0 . Al tempo t = 1 si maturano
gli interessi e si determina il nuovo capitale c(1) = (1 + r0 )c(0); procedendo per induzione, al
tempo t = n, abbiamo un capitale
c(n) = (1 + r0 )c(n 1) = (1 + r0 )n c0 .
La scelta di r0 e dell ampiezza dellintervallo di tempo su cui il capitale `e vincolato sono state
abbastanza arbitrarie. E chiaro che in linea di principio il tasso di interesse deve essere una funzione
crescente dellampiezza di quellintervallo. In accordo con il solito criterio di semplicit`a, adottiamo il
seguente modello:
Se lintervallo di vincolo `e lungo > 0 (rispetto allunit`
a che abbiamo scelto) allora il corrispondente
tasso di interesse `e r = r0 .
Calcolando tutto come prima ma tenendo conto del parametro , vediamo che al solito c(0) = c0 ,
mentre
c(n) = (1 + r0 )c((n 1)) = (1 + r0 )n c0 .
Adesso vogliamo capire, per esempio, cosa succede quando + oppure 0+ e n +.
Fissiamo per esempio una successione crescente divergente della forma n = 0 n. Vediamo allora che
la successione dei capitali al tempo 0 :
cn (0 ) = (1 + r0 0 n)c0
`e crescente e diverge a +. Questo non `e sorprendente. Un comportamento pi`
u interessante si ha
prendendo n = 0 /n che converge a 0. Allora si ha:
cn (0 ) = (1 +
r0 0 n
) c0 .
n
Usando fatti noti, vediamo che cn (0 ) `e ancora una successione crescente che per`o adesso converge al
limite finito er0 0 . In particolare se 0 = 1 = r0 , il limite `e esattamente la costante di Nepero.
MODELLI E INTERPOLAZIONI
MODELLI E INTERPOLAZIONI
a
ek(xx0 )
1+
pu`
o essere realistico quando per esempio x rappresenta la concentrazione di un certo antibiotico,
mentre y rappresenta la mortalit`
a di un certo batterio. Linterpretazione qualitativa del modello
dice che a basse concentrazioni la mortalit`
a `e praticamente nulla (saturazione inversa); ad alte
concentazioni la mortalit`
a `e praticamente indipendente dal valore della concentrazione (saturazione);
in un intervallo di valori centrali della concentrazione lefficacia dellantibiotico `e massima, infatti
la derivata `e positiva, `e piuttosto grande (cio`e il grafico `e piuttosto ripido), cos` che anche piccole
variazioni della concentrazione provocano un significativo aumento della mortalit`
a.
Un altro esempio notevole di funzione elementare che incorpora un fenomeno di saturazione `e il
seguente
h
I = f () = 2h 3 (e kT 1)
dove si considera lintensit`a (lampiezza) I in funzione della frequenza (colore) della radiazione di un
corpo radiante (per esempio un forno) contenuto in una cavit`a nera che assicura che la radiazione
`e in equilibrio termico a temperatura T con il materiale circostante; k `e la costante di Boltzman
gi`a incontrata nella definizione dellentropia, mentre h `e la costante di Planck che in un opportuno
sistema di unit`
a di misura condiviso con k, prende un valore molto piccolo (circa h = 6.62 1034 ).
Studiando il grafico si vede che f (0) = 0, la funzione `e positiva, cresce fino a raggiungere un valore
di massimo assoluto, poi decresce ed ha lasintoto orizzontale I = 0 per +. Questo modello
proposto da Planck nel 1900, corregge quello quadratico proposto in precedenza da Rayleigh-Jeans,
sulla base della teoria ondulatoria classica:
I = 2kT 2 .
Il problema con questo precedente modello `e che pur essendo in accordo con i risultati sperimentali
per frequenze basse (nellinfrarosso) non lo `e in modo radicale quando `e molto grande (la cosiddetta
catastrofe ultravioletta). Il modello di Planck oltre ad essere del tutto corroborato dai risultati
sperimentali per ogni valore di , `e di fondamentale importanza, anche storica, per il modo in cui fu
derivato; la sofisticata analisi statistica di Planck che porta alla formula `e basata sul postulato cruciale
che h `e una nuova costante fondamentale della natura e che le oscillazioni elettromagnetiche possono
essere emesse o assorbite solo in modo quantizzato, cio`e in pacchetti di una specifica energia E,
legata alla frequenza secondo la relazione lineare E = h.
Il seguente esempio geometrico `e piuttosto rivolto ad un lettore particolarmente interessato.
Vediamo ora come opportune funzioni elementari concorrano nel costruire un modello di geometria non
2
euclidea, detta
p geometria iperbolica. Dati due punti P = (x, y) e Q = (s, t) del piano R ; indichiamo
con P Q = (x s)2 + (y s)2 la distanza euclidea tra i due punti che `e anche uguale alla lunghezza
(euclidea) del segmento rettilineo (non orientato) [P Q] di estremi P e Q. Si consideri ora nel piano il
disco unitario aperto D = {x2 + y 2 < 1} delimitato dalla circonferenza di bordo S = {x2 + y 2 = 1}.
Dati due punti distinti A, B D, il segmento [AB] `e tutto contenuto in D (si dice che D `e convesso).
Definiamo ora una nuova lunghezza, detta iperbolica, di [AB] nel modo seguente. Si consideri la
retta r che contiene [AB] e siano P e Q i due punti dellintersezione r S distribuiti rispetto ad una
orientazione ausiliaria di r in modo che P < A < B < Q. Poniamo allora
P B AQ
1
).
dh ([AB]) = log(
2
P A BQ
Se per semplicit`a supponiamo che A = O sia il centro di D e 0 < r = OB < 1 allora il raggio iperbolico
rh = dh ([0B]) si esprime in funzione del raggio euclideo r nel modo seguente.
1
1+r
rh = log(
).
2
1r
Si vede allora che lim rh = 0 mentre lim rh = +. Possiamo quindi dire che S `e il bordo allinfinito
r0+
r1
di D. Nella nuova geometria che stiamo descrivendo, avendo come termine di confronto quella euclidea,
MODELLI E INTERPOLAZIONI
D gioca il ruolo di R2 . I triangoli in D sono i (soliti) triangoli tutti contenuti in D; per la convessit`a
di D questo `e equivalente a richiedere che i vertici siano punti di D. Nella nuova geometria per`o la
lunghezza dei lati di un triangolo non `e quella euclidea che viene rimpiazzata da dh . Il primo fatto
che ci dice che stiamo trattando una onesta geometria `e che anche le nuove lunghezze verificano le
disuguaglianze triangolari: per ogni triangolo, comunque si scelga un lato la sua lunghezza `e minore
o uguale alla somma delle lunghezze degli altri due. Omettiamo la verifica di questa propriet`
a; ci
limitiamo a segnalare che la propriet`
a funzionale di log gioca un ruolo importante. Usando questi
fatti, generalizzando quanto fatto prima in un caso particolare, si verifica che per ogni punto A di D
e ogni punto S S del bordo di D, se B D appartiene al segmento di estremi A e S e B A
allora dh ([AB]) 0, mentre se B S, allora d([AB]) +. Dunque, ponendo dh ([AA]) = 0
per ogni A D, analogamente al caso euclideo dh ([AB]) = dh (A, B) definisce una distanza su D
tale che per ogni segmento [AB] contenuto in D la lunghezza del segmento `e uguale alla distanza
tra i suoi estremi. Per capire un po il carattere di questa nuova geometria, si consideri il seguente
problema: sia data una corda [ST ] di D con estremi S, T S. Siano A, B [ST ] due punti di D
giacenti su questa corda. Sia D il diametro di D parallelo alla corda [ST ] di estremi S , T S tali
che [SS ] e T T ] sono lati del trapezio di vertici S, T, S , T . Vogliamo determinare A , B su D in
modo tale che dh ([AB]) = dh ([A B ]). Questi si determinano geometricamente nel modo seguente: si
considerano le semirette di origine S e T rispettivamente, passanti per i punti S e T rispettivamente.
Queste due semirette si incontrano in un punto P esterno a D. Allora A `e dato dallintersezione
con il diametro D della semiretta di origine P passante per A (analogamente per B ). Il fatto che
le lunghezze dh siano le stesse segue dalla formula che definisce dh e dal teorema di Talete. Dunque
muovendo la corda parallelamente in modo che gli estremi di avvicinino rispetto alla distanza euclidea,
troviamo segmenti di lunghezza iperbolica costante che appaiono sempre pi`
u corti da un punto di
vista euclideo. Analogamente alla geometria euclidea definiamo le rette iperboliche come i segmenti
aperti non estendibili; dunque queste coincidono con i segmenti (aperti) in D con estremi allinfinito
cio`e su S. Come nella geometria euclidea, due rette iperboliche o non si intersecano (e diciamo allora
che sono parallele) oppure si intersecano in un solo punto (sono incidenti); inoltre, per ogni punto
passano infinite rette, per due punti distinti passa una sola retta. Ci sono per`o due modi in cui
due rette iperboliche possono essere parallele: possono avere coppie di estremi su S distinte (diciamo
allora che sono ultraparallele), oppure avere un estremo in comune sul bordo di D (parallele incidenti
allinfinito). Preso A in D e una retta iperbolica r che non passa per A, ci sono due rette passanti per
A e incidenti allinfinito con r, mentre ci sono infinite rette ultraparallele a r passanti per A. Quindi
in questa nuova geometria non vale il postulato delle parallele che vale per la geometria euclidea.
Si ricordi che per secoli `e stato discusso se lassioma delle parallele fosse o no indipendente dagli
altri assiomi della geometria euclidea. Il modello di geometria che stiamo descrivendo mostra che in
effetti quellassioma `e indipendente dagli altri. Il trattamento della misura degli angoli nella geometria
iperbolica `e pi`
u involuto. Si potrebbe congetturare che la misura dellangolo formato da due rette
iperboliche ordinate coincida con la misura euclidea. Ma `e questo il caso solo se le due rette sono
diametri. In generale descriviamo la ricetta senza giustificarla. Prendiamo una retta r in D di estremi
S e T in S che non sia un diametro e sia A un punto di r. Esiste ununica circonferenza C di centro
esterno a D tale che C e S si intersecano ortogonalmente in S e T . Consideriamo larco (aperto) di
circonferenza = C D. Sia A il punto di ottenuto intersecando con la semiretta di origine O,
passante per A. Se la retta r `e invece un diametro, poniamo = r e A = A. Se ora abbiamo due rette
ordinate r e r che si intersecano in A possiamo realizzare A come intersezione dei due rispettivi archi
ordinati e . Considerando le rispettive rette tangenti in A , questi archi determinano un angolo di
una data misura euclidea . Allora `e anche la misura iperbolica dellangolo formato dalle due rette
ordinate r e r . Ne segue che la somma delle misure degli angoli interni di un triangolo iperbolico `e
< (contro il fatto che nella geometria euclidea tale somma `e uguale a ). Si pu`
o sviluppare una
trigonometria iperbolica in cui le funzioni cosh e sinh (introdotte alla fine di [EC]) svolgono un ruolo
analogo alle funzioni cos e sin nella trigonometria classica. Inoltre la geometria iperbolica `e essenziale
per costruire modelli della cinematica della relativit`a ristretta.
10
MODELLI E INTERPOLAZIONI
Cogliamo qui loccasione per aggiungere qualche informazione sulle funzioni cosh e sinh. Ricordiamo
le definizioni (su tutto R)
sinh(x) :=
ex + ex
sinh(x)
ex ex
, cosh(x) :=
, tanh(x) =
.
2
2
cosh(x)
Notiamo intanto che cosh `e pari mentre sinh `e dispari. Per ogni x R, cosh2 (x) sinh2 (x) = 1.
Inoltre si verifica direttamente che cosh = sinh, sinh = cosh. Su lintervallo [0, +), entrambe cosh
e sinh sono > 0. Quando x +, cosh(x) > ex dunque tende a +. Daltra parte, cosh(x)
sinh(x) = ex che tende a 0. Ne deduciamo che sinh `e strettamente crescente su R, si annulla solo
per x = 0, ed `e bigettivo, per cui `e definita su tutto R la funzione inversa arc sinh. La funzione
cosh `e strettamente crescente per x > 0, decrescente per x < 0, ed ha un punto di minimo in
x = 0, cosh(0) = 1. La restrizione di cosh su [0, +) `e bigettiva sopra [1, +) e possiamo definire
la funzione inversa arc cosh : [1, +) [0, +). Lasciamo al lettore di aggiungere informazioni a
proposito della concavit`a di queste funzioni. Per quanto riguarda la tangente iperbolica, si verifica la
1
relazione tanh2 (x) = 1
.
cosh2 (x)
Un altro esempio importante di funzione elementare `e formato dalle funzioni Gaussiane cio`e della
forma
y = Aex
dove A e sono costanti > 0. Una tale funzione `e pari, positiva, con 0 come punto di massimo
assoluto, decrescente su x > 0 e con asintoto orizzontale y = 0 quando x +. Per molti fenomeni
aleatori (anche di grande importanza applicativa), le funzioni Gaussiane intervengono per definire la
corrispondente distribuzione di probabilit`
a.
7. Scala logaritmica ed altri esempi di interpolazione
Dato un sistema di coordinate cartesiane x, y su R2 (rispetto ad una fissata unit`
a di misura dei
segmenti), la scala logaritmica su uno degli assi (per esempio lasse delle y) si ottiene facendo il
seguente cambio di coordinata sul semiasse positivo:
t = log(y) .
Ci sono delle circostanze pratiche in cui conviene fare questo cambiamento di scala (su uno o entrambi
gli assi). Supponiamo per esempio che dobbiamo riportare su una pagina di un testo certe coppie
di dati numerici (xj , yj ), j = 1, . . . , n, e che per esempio le yj > 0 crescano molto rapidamente. E
facile allora che quelle coppie escano dalla pagina. Potremmo rimpicciolire lunit`a di misura, cio`e
rimpicciolire linearmente la figura, con il rischio per`o che adesso questa diventi troppo piccola e poco
log(y)
= 0, c`e pi`
u spazio sulla stessa pagina per riportare in modo efficace
leggibile. Siccome lim
y+
y
le coppie di dati (xj , tj ).
Luso della scala logaritmica permette di estendere i risultati sullinterpolazione lineare discussi prima
ad altri tipi di modello. Per analogia con la discussione fatta prima per i modelli lineari, supponiamo
di avere a che fare con un dato sistema reale e qualche motivo per congetturare che qualitativamente
il modello sia di tipo esponenziale:
y = Aeax , A > 0 .
Vogliamo allora corroborare (o meno) sperimentalmente questa ipotesi qualitativa e (nel caso fosse
confermata) determinare con buona approssimazione leffettiva legge (cio`e la coppia di costanti di
struttura del sistema (A, a)). Passando alla scala logaritmica rispetto allasse delle y, t = log(y),
riconduciamo questo problema a quello gi`a risolto nel caso lineare; infatti si ottiene la funzione
t = ax + log(A)
cio`e nelle nuove coordinate il modello diventa formalmente lineare. Se per esempio t = m0 x + q0 `e
la retta di regressione per certi dati (xj , tj ), otteniamo linterpolazione esponenziale dei dati (xj , yj )
MODELLI E INTERPOLAZIONI
11
`
1. Definizioni e prime proprieta
In questa dispensa consideriamo principalmente funzioni definite su insiemi aperti di R. Sia f : D R
una funzione definita su un insieme aperto di R. Dato a D definiamo sullinsieme D \ {a} la funzione
rapporto incrementale di f rispetto al punto a
f (x) f (a)
.
xa
Diciamo che la funzione f `e derivabile in a D se esiste finito il limite
x
f (x) f (a)
=LR.
xa
In tal caso L `e detta la derivata di f in a e scriviamo
lim
xa
L = f (a) .
Nella letteratura si trovano diverse altre notazioni per indicare la derivata oltre f (a), per esempio
d
f (a), f(a) .
dx
Potr`
a capitare anche a noi di usare luna o laltra notazione. A volte si preferisce scrivere il rapporto
incrementale nella forma
f (a + h) f (a)
x
h
dove abbiamo fatto il cambiamento di variabile h = x a. Questo in generale non ha senso su tutto D;
per`o, siccome D `e aperto, esiste > 0 tale che I(a, ) D, quindi basta assumere che |h| = |x a| < .
E chiaro allora che
f (x) f (a)
=LR
lim
xa
xa
se e solo se
f (a + h) f (a)
lim
=LR.
h0
h
Derivata e differenziale. Supponiamo che f sia derivabile in a D, f (a) = L R. Consideriamo
la funzione lineare
Dfa : R R, Dfa (x) = Lx .
Questa funzione `e detta il differenziale di f in a. E chiaro che la derivata e il differenziale in a si
ricavano luna dallaltro in modo automatico, per`o sono oggetti diversi perch`e la derivata `e uno scalare
mentre il differenziale `e una funzione. Possiamo allora riscrivere
(f (a + h) f (a)) Dfa (h)
=0
h0
h
o, ancora, usando la notazione o-piccolo di Landau,
lim
FUNZIONI DERIVABILI
Interpretazione geometrica del rapporto incrementale e della derivata. Ricordiamo che dati
due punti distinti (x0 , x1 ), (y0 , y1 ) R2 , tali che x0 6= y0 , la retta passante per i due punti `e parallela
alla retta passante per lorigine di equazione
x1 y1
x0 y0
ed m `e detto il coefficiente angolare della retta. Si vede allora che il rapporto incrementale `e proprio il
coefficiente angolare della retta passante per i due punti del grafico di f : (x, f (x)) e (a, f (a)). Dunque
se la funzione `e derivabile in a, la derivata f (a) pu`
o essere interpretata come il coefficiente angolare
di una retta limite di equazione y = f (a)x; la retta parallela a questa retta e passante per il punto
(a, f (a)) (che ha equazione y = f (a)x + q per un opportuno valore della costante q) `e detta la retta
tangente al grafico di f nel punto (a, f (a)). Si nota che la retta y = f (a)x `e proprio il grafico della
funzione lineare Da f . La retta tangente al grafico di f `e il grafico della funzione x Da f (x) + q.
y = mx, m =
h0
f (a + h) f (a)
=LR
h
f+
(a)
si dice che
= L `e la derivata destra di f in a. Analogamente si definisce la derivata sinistra
f
(a) in una estremit`
a destra. Molte delle cose che diremo potrebbero essere generalizzate agli insiemi
buoni e alle derivate destre e sinistre. Per semplicit`a ci limiteremo al caso degli insiemi aperti.
Funzioni globalmente derivabili. La funzione f si dice derivabile su D se lo `e in ogni punto di D.
In tal caso `e definita la funzione derivata di f :
f : D R .
Se f := f (1) `e a sua volta derivabile (localmente nel punto a o globalmente su tutto D, allora `e
definita la derivata seconda f (2) (a) in a, oppure la funzione derivata seconda f (2) : D R. In modo
induttivo, se `e definita la funzione derivata n-esima f (n) : D R, se questa `e localmente derivabile
in a `e definita f (n+1) (a); se `e derivabile su D, allora `e definita la funzione f (n+1) : D R. Diciamo
che f : D R `e di classe C 0 se `e continua su D. Per ogni n 1 diciamo che f `e di classe C n se per
ogni 1 j n, esiste la funzioni derivata j-esima f (j) : D R ed `e continua su D. La funzione f `e
di classe C se per ogni n 1, f `e di classe C n . Vale la seguente proposizione.
Proposizione 1.1. Se f : D R `e derivabile allora f C 0 (cio`e `e continua). Pi`
u in generale se
esistono le funzioni derivata m-esima f (m) per ogni 0 m k + 1, allora f C k . Se esistono le
funzioni derivata m-esima f (m) per ogni m 0, allora f C .
Dim. Ragionando poi per induzione, basta dimostrare che se f `e derivabile in a D, allora f `e
continua in a. Infatti, poiche
f (x) f (a)
f (x) = f (a) +
(x a)
xa
passando al limite per x a e usando alcune propriet`
a note dei limiti si vede che f (x) f (a).
2
FUNZIONI DERIVABILI
Esempi fondamentali. Le seguenti funzioni definite su tutto R sono derivabili (in effetti sono di
classe C ):
f (x) = c, f = 0
f (x) = x, f (x) = 1
f (x) = sin(x), f (x) = cos(x)
f (x) = cos(x), f (x) = sin(x)
f (x) = ex , f (x) = ex .
Infatti:
Per le funzioni costanti e per lidentit`
a `e chiaro.
Calcoliamo per ogni a R,
(exp) (a) = lim
h0
exp(a + h) exp(a)
h
si ha che
exp(a + h) exp(a) = exp(a)(exp(h) 1)
Dunque
exp(h) 1
= exp(a)
h0
h
abbiamo cos` verificato che (exp) = exp.
Calcoliamo per ogni a R,
sin(a + h) sin(a)
(sin) (a) = lim
h0
h
per note formule trigonometriche sappiamo che
(exp) (a) = exp(a) lim
sin(a + h) sin(a)
cos(h) 1
sin(h)
= sin(a)
+ cos(a)
h
h
h
Passando al limite per h 0 e ricordando gli opportuni limiti notevoli (vedi la scheda
[LIMITI]) si conclude che
(sin) (a) = cos(a) .
Il coseno si tratta in modo analogo.
.
`
2. Procedure che preservano la derivabilita
Abbiamo visto nella dispensa [C-elementari], alcune procedure che preservano la continuit`
a. Vogliamo
specializzare ed eventualmente restringere quelle procedure in modo da preservare la derivabilit`a.
Vediamo subito che dobbiamo eliminare le procedure min, max e quindi valore assoluto. Infatti
x |x|, definita su tutto R non `e derivabile in 0. Elenchiamo la lista ristretta delle procedure raffinate
che indicheremo genericamente Pd . In particolare vogliamo fare in modo di lavorare in ogni momento
con funzioni definite su aperti di R.
Siano f : D R, g : D R funzioni derivabili (quindi continue) definite su aperti di R.
(somma e prodotto) Supponiamo D D 6= . Poiche lintersezione di insiemi aperti `e un
insieme aperto, f + g e f g sono definite come al solito.
(restrizione) Per ogni insieme aperto D di R contenuto in D, consideriamo la restrizione f|D .
(reciproco). Poiche f `e derivabile, quindi continua, D \ {f = 0} `e automaticamente aperto
(verificarlo per esercizio) quindi la definizione usuale si specializza bene.
(inversa) Se f `e iniettiva e derivabile, quindi continua, sappiamo che f (D) `e aperto e f 1 :
f (D) D `e continua. Richiediamo inoltre che per ogni a D, f (a) 6= 0.
FUNZIONI DERIVABILI
FUNZIONI DERIVABILI
1
f (x) = x, f (x) = .
2 x
f (x) = xa = ea log(x) , f (x) =
a a log(x)
e
= axa1 , (x > 0)
x
FUNZIONI DERIVABILI
1
.
cosh2 (x)
1
f (x) = coth(x), f (x) =
.
sinh2 (x)
1
.
f (x) = arc sinh(x), f (x) =
1 + x2
1
.
f (x) = arc cosh(x), f (x) =
x2 1
1
f (x) = arc tanh(x), f (x) =
.
1 x2
December 2, 2014
SULLE FUNZIONI DERIVABILI DEFINITE SU UN INTERVALLO
In questa nota assumiamo una volta per tutte di essere nella seguente situazione: [a, b], a < b, `e un
intervallo chiuso e limitato non degenere, mentre (a, b) `e il sotto-intervallo aperto dei punti interni di
[a, b]; f : [a, b] R `e una funzione continua tale che la restrizione a (a, b) `e derivabile. Utilizzeremo i
risultati stabiliti nella dispensa [C-INTERVALLI].
Lemma 0.1. Sia x0 (a, b) e supponiamo che f (x0 ) > 0. Allora esiste > 0 tale per ogni h R
tale che |h| < , si ha che x0 + h (a, b) e
f (x0 + h) f (x0 )
>0.
h
Si ha il risultato analogo invertendo le disuguaglianze.
Dim. Poiche lim
h0
f (x0 + h) f (x0 )
= f (x0 ) > 0, la tesi segue per la permanenza del segno.
h
Definizione 0.2. Un punto x0 (a, b) si dice punto di massimo (risp. minimo) locale per f se esiste
> 0 tale che (x0 , x0 + ) (a, b) e per ogni x tale che |x x0 | < si ha che f (x) f (x0 ) (risp.
f (x) f (x0 )).
Teorema 0.1. Se x0 (a, b) `e un punto di massimo (minimo) locale per f , allora f (x0 ) = 0.
Dim. Osserviamo che se x0 `e un punto di minimo locale per f , allora x0 `e di massimo locale per f .
Dunque basta argomentare il caso in cui sia un massimo locale. Supponiamo allora che x0 sia un punto
di massimo locale. Se fosse f (x0 ) > 0, e h > 0 come nel lemma precedente, allora f (x0 + h) > f (x0 )
contro il fatto che x0 `e un massimo locale. Se fosse f (x0 ) < 0 si conclude in modo analogo
2
I punti di (a, b) dove si annulla la derivata si dicono punti stazionari di f . Dunque abbiamo visto
che i massimi e minimi locali sono stazionari. Il viceversa `e falso: 0 `e stazionario per la funzione
f : (1, 1) R, f (x) = x3 , ma non `e un punto di massimo e neanche di minimo locale. Si nota
anche che, per esempio, 0 `e un punto di minimo (assoluto) di x |x| definita su tutto R, ma questa
funzione non `e derivabile in 0: la derivabilit`a non `e una condizione necessaria affinch`e f abbia massimi
o minimi locali.
Teorema 0.2. (Teorema di Rolle) Supponiamo che f (a) = f (b). Allora esiste x (a, b) tale che
f (x) = 0.
Dim. Sappiamo che [a, b] contiene un punto di massimo assoluto x0 e un punto di minimo assoluto y0 .
Se entrambi x0 y0 sono uno degli estremi a, b, allora f `e costante su [a, b] e dunque f `e identicamente
nulla su (a, b). Altrimenti almeno uno tra x0 e y0 , sia x, `e un punto interno e per il teorema precedente,
f (x) = 0.
2
Teorema 0.3. (Teorema di Cauchy) Siano f , g due funzioni definite su [a, b] che verificano
entrambe le ipotesi stabilite allinizio. Supponiamo che per ogni x (a, b), g (x) 6= 0. Allora g(a) 6=
g(b) ed esiste x (a, b) tale che
f (x)
f (b) f (a)
=
.
g(b) g(a)
g (x)
Dim. Se fosse g(a) = g(b), per il teorema di Rolle g non potrebbe essere sempre diversa da zero. Per
ogni coppia di costanti non entrambe nulle , R, la funzione h = f + g `e continua su [a, b] e
derivabile su (a, b). Scegliamo
= (g(b) g(a)), = (f (b) f (a))
Si verifica facilmente che con questa scelta, la funzione h verifica le ipotesi del Teorema di Rolle.
Quindi esiste x (a, b) tale che
h (x) = f (x) + g (x) = 0 .
Sostituendo a e le rispettive espressioni e dividendo membro a membro per (g(b) g(a))g (x) (che
`e diverso da zero), si ottiene la tesi.
2
Come corollario, usando g(x) = x, otteniamo
Teorema 0.4. (Teorema del valor medio) Esiste x (a, b) tale che
f (b) f (a)
= f (x) .
ba
2
Corollario 0.3. f `e costante su [a, b] se e solo se f (x) = 0 per ogni x (a, b).
Dim. Una implicazione `e evidente. Per dimostrare laltra, preso un arbitrario intervallo chiuso e
limitato [c, d] (a, b), applichiamo il Teorema del valor medio alla restrizione di f a [c, d]. Allora
f (d) f (c)
= f (x) = 0
cd
da cui f (c) = f (d). Per larbitrariet`
a di c, d si deduce che f `e costante su (a, b) e quindi su tutto [a, b]
perch`e `e continua.
2
Corollario 0.4. Supponiamo che la derivata f sia continua e si estenda ad una funzione continua
definita su tutto [a, b]. Allora esiste una costante K 0 tale che per ogni c < d [a, b], si ha che
|f (d) f (c)| K|d c|.
Dim. Riscriviamo la formula del valor medio nella forma f (d)f (c) = f (x)(dc), da cui |f (d)f (c)| =
|f (x)||d c|. La funzione x |f (x)| `e continua su [a, b], dunque prende un valore massimo K 0,
tale che per ogni x (a, b) |f (x)| K. Ne segue che la tesi vale su (a, b) e poi si estende per continuit`
a
su tutto [a, b].
2
Teorema 0.5. Se per ogni x (a, b), f (x) > 0 (risp. f (x) < 0) allora f `e crescente (risp.
decrescente) su (a, b).
Dim. Considerando se necessario f , non `e restrittivo considerare solo il caso in cui f `e positiva.
Siano c < d in (a, b). Allora per il Teorema del valor medio, esiste x (c, d) tale che
f (d) f (c)
= f (x) > 0
dc
da cui si deduce subito che f (d) > f (c).
Corollario 0.5. Sia f una funzione derivabile definita su un intervallo I aperto (non necessariamente
limitato). Allora se f (x) > 0 per ogni x I, f `e crescente su I.
0.1. Convessit`
a. Sia f : I R una funzione definita su di un intervallo aperto. Siano x0 , x1 I, e
consideriamo i punti corrispondenti del grafico G(f ) di f , cio`e P0 = (x0 , f (x0 )), P1 = (x1 , f (x1 )). Il
segmento di R2 di estremi P0 e P1 pu`
o essere descritto come limmagine dellapplicazione
s : [0, 1] R2 , s(t) = (1 t)P0 + tP1
mentre t (1 t)x0 + tx1 descrive al variare di t [0, 1] lintervallo [x0 , x1 ]. Allora f si dice
strettamente convessa su I, se per ogni x0 , x1 I, per ogni t [0, 1], si ha che
f ((1 t)x0 + tx1 ) < (1 t)f (x0 ) + tf (x1 )
cio`e, geometricamente, il segmento [P0 , P1 ] sta strettamente sopra il grafico di f ristretta allintervallo
[x0 , x1 ]. Invertendo la disuguaglianza (cos` che [P0 , P1 ] sta al di sotto del grafico) si ottiene la
definizione di funzione strettamente concava su I. Rilassando le disuguaglianze (considerando cio`e
o ) abbiamo la nozione di funzione convessa o concava. Abbiamo allora i seguenti risultati
che enunciamo senza dimostrazione (che per altro non sarebbe troppo difficile).
27 Novembre 2014
pital
1. Teoremi dellHo
In questo paragrafo enunceremo dei risultati che in certi casi permettono di trattare le forme di
0
0
indeterminazione o
. Cominciamo con lindeterminazione .
0
0
Prendiamo in considerazione due situazioni:
Sono date due funzioni f e g definite su un intorno (a , a + ) di un punto a R;
f (a) = 0 = g(a), f e g sono derivabili in a, g (a) = 0.
f e g sono definite su [a, a + ), sono continue, f (a) = 0 = g(a), f e g sono derivabili su
(a, a + ) e per ogni x (a, a + ), g (x) = 0.
f (x)
xa g(x)
lim
nel secondo a
lim
xa+
f (x)
.
g(x)
lim+
f (x)
=lR
g (x)
lim
f (x)
=lR
g(x)
xa
allora
xa+
C`e una versione simmetrica della seconda regola, dove f `e definita su (a , a] e x a+ `e sostituito
con x a .
Posponiamo la dimostrazione. Per il momento ci limitiamo a dire che il risultato nella prima situazione
`e facile e segue quasi direttamente dalla definizione di derivata xmentre il secondo `e pi`
u complicato e
si basa su una applicazione astuta del teorema di Cauchy.
La seconda regola ha la seguente importante applicazione.
Corollario 1.1. Supponiamo che f sia definita su I = (a , a + ), sia continua, sia derivabile in
I \ {a} e che lim f (x) = l R. Allora f `e derivabile in a e f (a) = l.
xa
f (x) f (a)
.
xa
f e g sono definite su (a, a + ), sono derivabili, per ogni x (a, a + ), g (x) = 0 ed inoltre
lim f (x) = ,
lim g(x) = .
xa+
xa+
xa+
f (x)
. Allora vale
g(x)
f (x)
=lR
lim+
xa g (x)
allora
f (x)
=lR.
xa g(x)
Esiste una versione della regola quando dove f `e definita su (a , a) e x a+ `e sostituito con
x a .
lim+
Anche in questo caso omettiamo la dimostrazione. Ci sono naturali varianti di queste regole. Per
esempio abbiamo:
Proposizione 1.2. Siano f, g funzioni definite su I = (b, +), derivabili e tali che per ogni x I,
f (x)
= l R allora
g (x) = 0. Supponiamo inoltre che lim f (x) = 0 e lim g(x) = 0. Se lim
x+
x+
x+ g (x)
f (x)
lim
= l.
x+ g(x)
Dim. Ci possiamo ricondurre alla seconda regola per
1/x.
0
per mezzo del cambiamento di variabile y =
0
Benche siano state omesse le dimostrazioni,`e importante che lo studente assimili bene gli enunciati,
per poterli applicare correttamente. In alcune situazioni si pu`o applicare ripetutamente le regole, nel
caso in cui le funzioni siano derivabili pi`
u volte e i rapporti tra le derivate continuino a presentare
una forma di indeterminazione. In certi casi questo processo porta a semplificazioni che permettono
alla fine di calcolare il limite in questione. In altri casi il processo pu`o progressivamente complicare
la situazione e quindi essere del tutto inutile. Con gli opportuni accorgimenti si possono applicare le
regole ad altre forme di indeterminazione (+ , 0 , 1 , 0 . . . ).
2. Dimostrazioni, esempi e alcune considerazioni.
Iniziamo con le prove delle due regole come enunciate nel Teorema 1.1.
Prima regola. Come detto, in questo caso la prova `e semplice e deriva direttamente dalla definizione
di derivata.
Osserviamo che lipotesi g (a) = 0 implica che in un opportuno intorno di a si ha g(x) = g(a) (la
funzione g in a `e crescente o decrescente). Quindi abbiamo
f (x) f (a)
f (x)
=
=
g(x)
g(x) g(a)
f (x)f (a)
xa
g(x)g(a)
xa
xa g (x)
ad
!Fissiamo
! arbitrio un > 0 e sia 1 < un numero > 0 tale che per a < x < a + 1 si abbia
!
! f (x)
!
!
! g (x) l! < 2 e g (x) = 0.
Sempre per il teorema di Cauchy, per un qualsiasi x (a, a + 1 ) esiste un (x, a + 1 ) tale che
f (x) f (a + 1 )
f ()
= . Essendo a < < a + 1 si avr`a
g(x) g(a + 1 )
g ()
l
da cui
f (x) f (a + 1 )
<
<l+
2
g(x) g(a + 1 )
2
f (x) 1
f (x) f (a + 1 )
=
g(x) g(a + 1 )
g(x) 1
f (a+1 )
f (x)
g(a+1 )
g(x)
f (x)
(x)
g(x)
x2 sin( 1 ) se x = 0
f (x) =
x
0
se x = 0
Con tale scelta avremo che l <
Polinomi di Taylor
27 Novembre 2014
Polinomio di Taylor.
f (x0 )
f (x0 )
f (n) (x0 )
(xx0 )+
(xx0 )2 +. . .+
(xx0 )n +(xx0 )n (x)
1!
2!
n!
con
lim (x) = 0
xx0
Resto.
f (x) = f (x0 ) +
... +
f (x0 )
(x
1!
x0 ) +
f (x0 )
(x
2!
(n+1)
f (n) (x0 )
f
(x x0 )n +
n!
n
!
f (j) (x0 )
j=1
j!
x0 )2 + . . .
()(x x0 )n+1
(n + 1)!
(x x0 )j .
Consideriamo ora il punto x0 come una variabile e definiamo (t) in questo modo.
(t) = f (x)
n
!
f (j) (t)
j!
j=1
(x t)j h(x)
x tn+1
x x0 n+1
"n
(x0 ) = f (x)
j=1
f (j) (x)
(x
j!
"n
j=1
n+1
(xx)
x)j h(x) (xx
n+1 = f (x) f (x) = 0
0)
f (j) (x0 )
(x
j!
n+1
(xx0 )
x0 )j h(x) (xx
n+1 = h(x) h(x) = 0
0)
Quindi applicando il teorema di Rolle abbiamo che esiste un punto interno allintervallo [x, x0 ] tale che () = 0.
Svolgendo i calcoli otteniamo per (t):
(t) = f
=
(n+1) (t)
n!
(xt)
(x t)n + (n + 1)h(x) (xx
n+1 =
0)
$
(n + 1)(x t)n # f (n+1) (t)(x x0 )n+1
h(x)
n+1
(x x0 )
(n + 1)!
December 3, 2014
ESEMPI DI APPROSSIMAZIONI TRAMITE POLINOMI DI TAYLOR
In questa scheda elenchiamo gli sviluppi di Taylor nellorigine, di ordine arbitrariamente grande, di
alcune funzioni elementari. Il simbolo (x) indicher`
a una qualche funzione avente la propriet`
a che
lim (x) = 0; n N.
x0
xn
x
+ +
+ xn (x).
2!
n!
x2n+1
x3
+ + (1)n
+ x2n+1 (x).
sin(x) = x
3!
(2n + 1)!
ex = 1 + x +
cos(x) = 1
x2
x2n
+ + (1)n
+ x2n (x).
2!
(2n)!
( 1) . . . ( n + 1) n
x + xn (x).
n!
x2n+1
x3
+ + (1)n
+ +x2n+1 (x).
arctan(x) = x
3
2n + 1
1
= 1 x + x4 + + (1)n x2n + x2n (x).
1 + x2
xn+1
x2
+ + (1)n
+ xn+1 (x).
log(1 + x) = x
2
n+1
1
= 1 x + x2 + + (1)n xn + xn (x).
1+x
x3
1 3 (2n 1) x2n+1
arcsin(x) = x +
+ +
+ x2n+1 (x).
6
2n n!
2n + 1
x2
1
1 3 (2n 1) 2n
=1+
+ +
x + x2n (x).
2
2n n!
1 x2
(1 + x) = 1 + x + +
Asintoti
Lequazione della retta tangente al grafico della funzione f (x) in un punto (x0 , f (x0 ))
`e y f (x0 ) = f (x0 )(x x0 ); nel caso specifico il coefficiente angolare `e quindi
sin x2
sin x2
2 cos x2
.
Poich
e
per
x
tendente
ad
infinito
tende a 0, il limite di
x2
x2
2
sin x
f (x) = 2 cos x2
non esiste, come suggerisce anche il comportamento del
x2
grafico dove la retta tangente assume svariate posizioni senza tendere a stabilizzarsi,
ripetendosi periodicamente.
Pertanto, pur tendendo la funzione con i valori a 0, non vi tende con le derivate e
quindi lasse delle x non `e il limite delle rette tangenti.
Come si diceva il fenomeno non `e legato alla presenza di fenomeni oscillatori: ad
esempio anche nel caso di un asintoto verticale nulla vieta di immaginare una successione di punti xn tendente ad x0 , punto ove il limite della funzione va ad ,
Come ad esempio y = x1 dove gli asintoti sono effettivamente quelle rette che vengono interpretate come rette tangenti allinfinito.
1
che siano tutti punti di flesso orizzontale per f e con ordinate f (xn ) che vanno ad
infinito. Lasintoto ancora non `e il limite delle tangenti.
Talvolta `e utile conoscere in modo qualitativo il comportamento di una funzione per
valori molto grandi della variabile. Abbiamo sintetizzato due di queste situazioni
dicendo che la funzione, o meglio il suo grafico, ammette un asintoto (orizzontale o
verticale).
Pu`o darsi che una funzione al tendere di x allinfinito tenda ad infinito secondo una
precisa direzione. Esprimeremo ci`o con il concetto di asintoto obliquo che potremmo
definire come una retta la cui distanza dal grafico tende a zero al tendere della
variable x a infinito.
Se lequazione di una tale retta `e y = mx + n come possiamo calcolare m, n ?
La differenza f (x) (mx + n) delle due ordinate differisce per un fattore tipo cos
n
f (x)
m }
dalla distanza per cui si deve avere 0 = lim {f (x)(mx+n)} = lim x{
x
x
x
x
f (x)
f (x)
m} = 0 da cui lim
= m.
e quindi deve essere lim {
x x
x
x
Di conseguenza si deve avere n = lim {f (x) mx}. E ovviamente se i limiti m =
x
f (x)
lim
e n = lim {f (x) mx} allora la retta y = mx + n `e un asintoto obliquo.
x x
x
Anche qui `e bene tener presente quanto detto nellosservazione critica precedente,
e cio`e che ancora limmagine dellasintoto obliquo come tangente allinfinito non
significa che tale retta possa esser vista come posizione limite delle tangenti. Poiche
f (x)
con ogni probabilit`a si presenter`a come forma indeterminata, si avr`a, per
lim
x x
f (x)
= f (x): ma come abbiamo visto nella dispensa sul
l Hospital, m = lim
x x
teorema dellHospital, lesistenza del limite di f (x) `e condizione solo sufficiente e
f (x)
il limite
pu`o esistere anche se il limite di f (x) non esiste, come tra laltro
x
abbiamo visto anche nel caso dellasintoto orizzontale.
q
1 (x + 1 )2
4
2
2 (x) = q
1 (x 1 )2
4
2
se x [1, 0]
se x [0, 1]
December 2, 2014
INTEGRAZIONE
1. Introduzione
Affronteremo due problemi detti entrambi di integrazione, apparentemente di natura diversa e che
invece risulteranno essere intimamente legati tra loro.
1.1. Integrazione come problema inverso della derivazione. Sia F : I R una funzione
derivabile sullintervallo aperto I. Dunque, ponendo f = F , diciamo che F `e una primitiva di f .
Supponiamo ora di avere assegnato una (qualsiasi) f : I R. Poniamo
Z
f (x)dx := {F : I R; F derivabile, F = f }
cio`e linsieme di tutte le primitive di F . A volte questo insieme `e chiamato lintegrale indefinito di
f . Si noti che la notazione (un po strana) che abbiamo scelto per denotarlo avr`
a una certa utilit`a
pratica in seguito, ma non sottintende alcun significato particolare. Potevamo avere utilizzato al suo
posto, per esempio, I(f ) e tutto il discorso sarebbe filato ugualmente. Inoltre anche la variabile x non
ha
Z in questa notazione alcun significato particolare, se ci conviene, potremo scrivere equivalentemente
f (t)dt. Dunque il problema `e di capire come `e fatto questo insieme al variare di f .
Z
Z
Osserviamo subito che se
f (x)dx non `e vuoto e F
f (x)dx `e una particolare primitiva di f ,
allora
f (x)dx = {G = F + c; c R} := F + R
Z
f (x)dx pu`
o essere vuoto. Per esempio sia f : R R definita da f (x) = 0 se
x < 0, f (x) = 1 se x 0. Se fosse F = f su tutto R, questo fatto dovrebbe valere rispettivamente per
le due restrizioni alle due semirette (, 0), (0, ). Ma per quanto detto prima F = c `e una costante
sulla prima semiretta, F = x + c sulla seconda. Affinche F sia definita su tutto R e derivabile,
`e necessario che F sia continua, questo impone che c = c e F (0) = c. E facile allora verificare
che una tale F non `e derivabile in 0. Osserviamo Zche f in questo esempio non `e continua in 0.
Daltra parte ci sono funzioni non continue per cui
f (x)dx non `e vuoto. Ad esempio la funzione
mezzo di qualche formula esplicita (per esempio f `e elementare derivabile) `e possibile determinare
una formula esplicita per una primitiva F di f ?
INTEGRAZIONE
e questo numero sar`a anche detto lintegrale definito della funzione f : [a, b] R. Come nel caso dei
rettangoli lintegrale definito dovr`
a essere sensibile al cambio di orientazione di [a, b], per cui
Z b
Z a
f (x)dx =
f (x)dx
a
ed inoltre
f (x)dx = 0 .
INTEGRAZIONE
Discuteremo una specifica procedura di misurazione, detta integrazione secondo Riemann che fornir`
a
una risposta al problema. Esistono procedure pi`
u raffinate che permettono di misurare T (f ) anche in
casi in cui lintegrale secondo Riemann non `e definito. Ma lintegrazione secondo Riemann `e sufficiente
per molte applicazioni.
1.3. Funzioni integrali. Come detto allinizio e come suggerito anche dalle notazioni adottate, c `e
un legame profondo tra questi due problemi di integrazione apparentemente di natura diversa. Un
ponte tra i due problemi si costruisce per mezzo della nozione di funzione integrale. Sia f : I R
una funzione definita sullintervallo aperto I che abbia la seguenti propriet`
a:
La restrizione di f ad ogni sotto-intervallo chiuso e limitato [a, b] I `e limitata ed esiste lintegrale
Z b
definito
f (x)dx.
a
In questo modo abbiamo definito una nuova funzione F : I R detta funzione integrale di f di punto
base a0 . Usando le propriet`
a dellintegrazione secondo Riemann, dimostreremo il seguente Teorema
fondamentale del calcolo integrale:
Teorema 1.1. (1) Sia f : I R definita su lintervallo aperto I, tale che f ammette una primitiva F
ed esiste lintegrale definito della restrizione di f ad un intervallo chiuso e limitato [a, b] I. Allora
Z b
f (x)dx = F (b) F (a) .
a
(2) Se f `e continua ed F `e una funzione integrale di f (di punto base scelto arbitrariamente su I),
allora F `e una primitiva di f .
Nei capitoli seguenti, discuteremo prima separatamente i due problemi di integrazione ed infine il
teorema fondamentale.
` dellintegrale indefinito
2. Proprieta
Conosciamo molte funzioni che ammettono primitive, per esempio tutte le derivate delle funzioni
elementari derivabili. Per esempio la scheda alla fine di [DERIVATE] pu`o anche essere letta come
una lista di primitive di certe funzioni elementari date. E utile mettere in evidenza alcune propriet`
a
dellintegrale indefinito che in certi casi permettono di calcolare nuove primitive a partire da primitive
gi`a note. Queste sono in effetti riletture di propriet`
a della derivata che gi`a conosciamo.
Linearit`
a. Siano f, g : I R e F , G rispettive primitive. Allora F + G `e una primitiva di f + g. Se
c R, allora cF `e una primitiva di cf .
Integrazione per parti. Siano f , g, F , G come sopra. Ricordiamo la regola di derivazione di un
prodotto:
(F G) = f G + F g
da cui
f Gdx +
Z
F gdx = F G + R
f Gdx = F G
F gdx .
In questo modo F G realizza una parte dellintegrazione di f G e resta da integrare F g, che in certi
casi `e piu facile da trattare. Per esempio sia Gf = x cos(x). Per cui F = sin(x). Dunque
Z
Z
x cos(x)dx = x sin(x) sin(x) = (x sin(x) + cos(x)) + R .
INTEGRAZIONE
Integrazione per sostituzione diretta. Sia F una primitiva di f . Consideriamo una funzione
composta di funzioni derivabili, G(x) = F ((x)). La regola di derivazione in questo caso `e
G (x) = f ((x)) (x) .
Dunque
Z
che si pu`
o anche riscrivere formalmente:
Z
Z
f ((x)) (x)dx = f (t)dt, t = (x) .
Ad esempio ponendo F (t) = 1/t, t = (x) = 1 + x2
Z
Z
Z
1
1
1
1
x
dx =
dt = log |t| + R .
F ((x))dx =
2
1+x
2
2
t
2
Notare che per la sotituzione diretta non facciamo ipotesi particolari su . In particolare non richiediamo che sia invertibile.
Integrazione per cambiamento di variabile. Supponiamo che x = (t) sia un cambiamento di
variabile, cio`e Zche `e invertibile
con inversa derivabile. Allora le considerazioni precedenti permettono
Z
di ricondurre
f (x)dx a
f ((t)) (t)dt. Infatti se G(t) `e una primitiva che appartiene allultimo
integrale indefinito, allora G(1 (x)) `e una primitiva di f . Ad esempio, ponendo x = sin(t), t
[/2, /2],
Z
Z p
1 x2 dx = cos2 (t)dt, t = arcsin(x) .
cos2 (t) pu`
o essere integrato per parti (esercizio) ottenendo
Z
t + sin(t) cos(t)
cos2 (t)dt =
+R .
2
Osservazioni 2.1. (Sulle notazioni adottate) (1) Le regole di integrazione per sostituzione diretta
o per cambiamento di variabile forniscono una giustificazione formale delle particolari notazioni che
abbiamo adottato per lintegrale indefinito. Ricordiamo che per la derivata si usa spesso unaltra
notazione:
d
=
dx
ponendo come sopra t = (x) formalmente possiamo scrivere
Z
Z
dt
f ((x)) (x)dx = f (t) dx
dx
dunque semplificando i due dx che appaiono al numeratore e al denominatore otteniamo proprio
laltro membro della regola di integrazione:
Z
f (t)dt .
Il problema `e che in tutto questo dx e dt sono puri simboli, non `e stata definita alcuna struttura algebrica consistente per cui quella semplificazione corrisponda ad una operazione effettiva. Dunque
`e bene considerarlo come un puro artificio formale che pu`
o avere una sua utilit`a pratica, tenendo per`o
sempre sotto controllo quello che sta succedendo sostanzialmente e non solo a livello formale.
(2) (Rivolta soprattutto ad un lettore particolarmente interessato.) La notazione deriva storicamente
dallimpostazione del calcolo differenziale che discende da Leibniz (uno dei due fondatori con Newton)
e che ha un approccio molto pi`
u algebrico. Sono state sviluppate diverse teorie (che possiamo
chiamare genericamente di analisi non-standard) che danno un significato sostanziale ai simboli
come dx, dt e per le quali la semplificazione formale diventa una operazione effettiva.
INTEGRAZIONE
Complichiamo di poco lesempio. Supponiamo per semplicit`a che a < b. Una partizione P di [a, b] `e
un insieme finito ordinato di punti di [a, b] della forma:
P = {x0 = a < x1 < < xn < xn+1 = b}.
Si chiama partizione perche determina la decomposizione di [a, b] come unione di sotto-intervarli
adiacenti:
I = [a = x0 , x1 ] [x1 , x2 ] . . . [xn , xn+1 = b] .
Date due partizioni P1 e P2 diremo che P2 `e pi`
u fine di P1 se P1 P2 .
Fissata P , una funzione a gradini f : [a, b] R rispetto alla partizione P , `e tale che la sua restrizione
ad ogni [xj , xj+1 ) `e una funzione costante fj = cj , e f (b) = cn . T (f ) `e allora un plurirettangolo.
E naturale porre:
Z b
X
(xj+1 xj )cj .
f (x)dx = m(T (f )) =
a
Se P2 `e pi`
u fine di P1 (cio`e P1 P2 )) allora:
Z b
Z
F (f, P1 )dx
a
F (f, P2 )dx
F (f, P1 )dx
a
F (f, P2 )dx
m(b a)
F (f, P1 )dx
F (f, P3 )
F (f, P3 )dx
F (f, P2 ) M (b a) .
a
f = inf{
F (f, P )dx}
INTEGRAZIONE
f .
Diciamo infine che f : [a, b] R limitata, a < b, `e integrabile secondo Riemann se tali estremi
coincidono e poniamo
Z
Z b
Z
f
f (x)dx = f =
a
f (x)dx =
b
f (x)dx
f (x)dx = 0 .
Nel seguito diremo semplicemente integrabile, omettendo di dire secondo Riemann. Mettiamo
in evidenza alcune propriet`
a di questa procedura di integrazione, che sono conseguenze abbastanza
semplici della definizione e delle disuguaglianze sopra indicate.
(1) Se f `e a gradini, allora f `e integrabile e ritroviamo lintegrale definito da cui siamo partiti.
(2) f `e integrabile se e solo se per ogni > 0, esiste una partizione P di [a, b] (che dobbiamo
immaginare sufficientemente fine) tale che
Z b
Z b
F (f, P )
F (f, P ) < .
a
(3) Addittivit`
a sugli intervalli. Consideriamo a < c < b, f : [a, b] R integrabile e tale che
anche le due restrizioni di f agli intervalli [a, c] e [c, b] siano integrabili. Allora:
Z b
Z c
Z b
f (x)dx =
f (x)dx +
f (x)dx .
a
(4) Linearit`
a. Se f, g : [a, b] R sono entrambe integrabili, allora anche f + g lo `e e
Z b
Z b
Z b
(f + g)(x)dx =
f (x)dx +
g(x)dx .
a
Per ogni c R,
Z
cf (x)dx = c
f (x)dx .
Esistono funzioni che non sono integrabili. Per esempio la funzione f : [0, 1] R, f (x) = 1 se
x [0, 1] Q, f (x) = 0 altrimenti, non `e integrabile perch`e (a causa della densit`
a sia di Q sia del suo
complementare) risulta che
Z
Z
0 = f 6=
f =1.
INTEGRAZIONE
Dim. Sappiamo (vedi [C-INTERVALLI]) che f `e limitata e uniformemente continua. Basta dimostrare
che per ogni > 0, esiste una partizione abbastanza fine P di [a, b] tale che
Z b
Z b
F (f, P )dx
F (f, P )dx < .
a
Per la continuit`
a uniforme esiste > 0 tale che per ogni x, y [a, b] tali che |x y| < si ha che
, quindi
Ne segue che per ogni j, Mj mj <
ba
Z b
Z b
X
X
(Mj mj )(xj+1 xj ) <
(xj+1 xj ) = .
F (f, P )dx
F (f, P )dx =
ba j
a
a
j
2
4. Dimostrazione del teorema fondamentale
Dimostriamo infine il Teorema fondamentale del calcolo integrale enunciato nellIntroduzione.
Dimostriamo lenunciato (1). Sia f : I R, sia F una primitiva di f , sia [a, b] I, a < b, e
Z b
f (x)dx. Fissata una arbitraria partizione
supponiamo che esista lintegrale definito della restrizione
a
(F (xj+1 ) F (xj ))
perche i termini si cancellano due a due eccetto il primo e lultimo. Poiche f `e la derivata di F , per
il teorema del valor medio (vedi [D-INTERVALLI]), per ogni j esiste yj (xj , xj+1 ) tale che
X
X
f (yj )(xj+1 xj ) .
(F (xj+1 ) F (xj )) =
F (b) F (a) =
j
Per larbitrariet`
a di P , deduciamo che
Z
F (f, P )dx .
f (F (b) F (a))
2
Dimostriamo infine il punto (2). Supponiamo che f : I R sia continua, fissiamo arbitrariamente un
punto a0 in I e consideriamo la corrispondente funzione integrale
Z x
f (t)dt .
F (x) =
a0
Questa
funzione `e ben definita perche abbiamo visto prima che essendo f continua lintegrale definito
Z x
f (t)dt esiste per ogni x. Vogliamo dimostrare che F `e una primitiva di f . Premettiamo un lemma.
a0
Lemma 4.1. Sia f : I R continua, a, b I. Allora esiste y compreso tra a e b tale che
Z b
f (x)dx = f (y)(b a) .
a
INTEGRAZIONE
Dim. Supponiamo che a < b. Siano m e M rispettivamente il valore minimo e il valore massimo della
restrizione di f a [a, b]. Allora sappiamo che
Rb
f (x)dx
M
m a
ba
per il Teorema dei valori intermedi (vedi [C-INTERVALLI]) esiste y [a, b] tale che verifica la tesi.
Se a > b allora
Z
Z
a
f (x)dx =
mostrano che
f (x) =
1 + t2
1 + 2t2
INTEGRAZIONE
inoltre
1
dt
1 + t2
Z
ed infine
dove
1
1 + 2t2
Z
1
dx = F (x) + R
1 + sin2 (x)
G(x) = F (x) su (/2, /2], G(x) = F (x) + 2 su [/2, (3/2)) `e continua e derivabile su tutto
lintervallo (/2, (3/2)) (che contiene [0, ]) e che G = f . Applicando adesso correttamente il
teorema fondamentale, si conclude che
Z
1
dx = G() G(0) = 2 .
2
0 1 + sin (x)
5. Complementi
(1)Approssimanti a gradini di funzioni continue. Se f : [a, b] R (a < b) `e continua, esistono
Z b
procedure pi`
u semplici di quelle suggerite dalla definizione, per approssimare
f (x)dx con lintegrale
a
definito di opportune funzioni a gradini. Possiamo procedere per esempio nel modo seguente: per ogni
n > 0 sia n = (b a)/n e fissiamo la partizione P (n) di [a, b] tale che per ogni j, |xj xj+1 | = n . Sia
G(f, n) : [a, b] R la funzione a gradini relativa a P (n) tale che, per ogni j, la restrizione allintervallo
[xj , xj+1 ) `e la costante cj = f (xj ). Chiaramente n 0 quando n +. Si pu`
o allora dimostrare
che
Z
Z
b
n+
f (x)dx .
G(f, n)(x)dx =
lim
(2)Sulle funzioni integrali. Come `e chiaro dalla definizione data nellIntroduzione, `e sufficiente ma
non necessario che f : I R sia continua affich`e esistano funzioni integrali di f . Per esempio se f
ha solo un numero finito di punti di discontinuit`
a, allora esistono le funzioni integrali di f (rispetto a
un punto base scelto arbitrariamente su I). Lo stesso fatto vale (anche se `e un po pi`
u complicato da
dimostrare) se f `e monotona (crescente o decrescente). Mentre la derivazione in generale fa perdere di
regolarit`
a (per esempio ci sono funzioni derivabili, quindi continue, la cui derivata non `e continua; in
generale la derivata di una funzione C k `e solo C k1 ), le funzioni integrali (quando esistono) hanno un
effetto regolarizzante. Per esempio se f `e continua (ma non derivabile), una sua funzione integrale
`e derivabile e di classe C 1 . Consideriamo lesempio gi`a usato prima: f : R R, f (x) = 0 se x < 0,
f (x) = 1 se x 0; f non `e continua solo in 0. La funzione F : R R, F (x) = 0 se x < 0, F (x) = x se
x 0 `e la funzione integrale di f di punto base a0 = 0. Come gi`a sappiamo F non `e una primitiva di
f perche non `e derivabile in 0. Per`
o `e continua su tutto R ed `e una primitiva di f ristretta a R \ {0}.
Possiamo dire che F `e derivabile quasi ovunque (intendendo sul complementare di un insieme finito
di punti) e che `e quasi ovunque una primitiva di f . Si osservi che: F `e la funzione integrale di
10
INTEGRAZIONE
f (x)g(x)dx .
f ((x)) (x)dx =
(b)
f (t)dt .
(a)
f (x)dx =
1 (b)
f ((t)) (t)dt .
1 (a)
studiare il suo andamento quando x d oppure x c+ . Se uno di questi limiti esiste diciamo che
`e definito il corrispondente integrale improprio e poniamo
Z
Z
a
c
f (x)dx
f (x)dx .
Per trattare gli integrali impropri non `e necessario che f sia continua. Basta che per ogni a I
sia definita la funzione integrale di f di punto base a. In questo modo vediamo per esempio che lo
studio delle serie numeriche pu`
o essere visto
X come un caso particolare di studio di integrali impropri.
Si consideri infatti una serie numerica
an . Sia I = {x > 1}. Consideriamo la partizione di
n0
INTEGRAZIONE
11
Quale che sia la procedura di misurazione adottata, se f, g : [a, b] R sono uguali quasi ovunque
allora T (f ) `e misurabile se e solo se T (g) lo `e; se sono misurabili allora m(T (f )) = m(T (g)).
E chiaro che dobbiamo dare un senso a quasi ovunque. Procediamo nel modo seguente. Dato
X [a, b], sia 1X : [a, b] R, 1X (x) = 1 se x X, 1X (x) = 0 se x [a, b] \ X. Questa `e anche
chiamata la funzione indicatrice di X. Supponiamo di avere fissato una procedura di integrazione.
Diciamo allora che X `e trascurabile (rispetto alla procedura) se 1X `e integrabile e il valore dellintegrale
Z b
1X (x)dx = 0. Per esempio, se adottiamo lintegrazione secondo Riemann, `e chiaro che
definito
a
se X `e finito allora `e trascurabile. Diremo infine che due funzioni f e g sono quasi ovunque uguali
(rispetto alla procedura di integrazione data) se esiste un insieme trascurabile X tale che f = g su
[a, b] \ X. Per esempio, se X `e trascurabile 1X `e quasi ovunque uguale alla funzione costante nulla.
Messa cos` la cosa, una caratteristica fondamentale di una procedura di integrazione `e la sua classe di
insiemi trascurabili. Come deve essere fatta la classe degli insiemi trascurabili affinche la procedura
di integrazione sia veramente soddisfacente? Potremmo richiedere per esempio che X `e trascurabile
non solo quando `e finito ma anche quando `e numerabile. Questo non `e il caso per lintegrazione
secondo Riemann: X = [a, b] Q `e numerabile ma abbiamo visto prima che 1X non `e integrabile
secondo Riemann. In effetti esistono procedure di integrazione pi`
u raffinate ( una `e detta integrazione
secondo Lebesgue) per le quali anche gli insiemi numerabili sono trascurabili.
1. Introduzione
Abbiamo visto in [DERIVATE] che la derivata di una funzione derivabile elementare `e ancora derivabile ed elementare. Supponiamo ora che f : I R sia una funzione derivabile (quindi continua)
elementare definita sullintervallo aperto I. Grazie al Teorema fondamentale del calcolo integrale (vedi
[INTEGRAZIONE]) sappiamo che f ammette funzioni primitive. E naturale allora porsi la domanda
se ammette primitive elementari (poiche due primitive differiscono per una costante se una `e elementare lo sono tutte). Vedremo che per certe classi di funzioni elementari la risposta `e positiva e
possiamo ricavare formule esplicite per le rispettive primitive. In generale per`o la risposta `e negativa.
2. Miscellanea
Cominciamo indicando in modo sparso alcuni esempi di funzioni elementari con primitive elementari,
ricavate usando soprattutto le regole di integrazioni per parti o per sostituzione/cambio di variabile.
(1) Risalendo la gerarchia delle funzioni elementari (vedi [MODELLI]) la prima classe che troviamo `e quella delle funzioni polinomiali. Se
n
X
aj xj
p(x) =
j=0
una primitiva `e
P (x) =
n
X
j=1
1
aj xj+1
j+1
1 kx
e + R.
k
(xm+1 ekx ) = (m + 1)xm ekx + kxm+1 ekx
una definizione per induzione, verificando cos` che sono funzioni elementari. Infatti per m = 0
lintegrazione `e immediata in entrambi i casi. Inoltre abbiamo:
(xm+1 sin(x)) = (m + 1)xm sin(x) + xm+1 cos(x)
p(x) sin(x)dx
PRIMITIVE ELEMENTARI
(4) Poniamo f (x) = ex cos(x). Applicando due volte lintegrazione per parti
Z
Z
Z
x
x
x
x
f (x)dx = e cos(x) + e sin(x)dx = e cos(x) + e sin(x) f (x)dx
da cui
1 x
e (cos(x) + sin(x)) .
2
In modo analogo si possono trattare le funzioni della forma
Z
f (x)dx =
I1 = arctan(t) + R
t
2s 3
Is =
+
Is1 .
2
s1
2(s 1)(1 + t )
2s 2
Ne segue che ogni primitiva `e una funzione elementare.
(6) Polinomi trigonometrici. Richiamiamo alcuni fatti gi`a visti in [COMPLESSI]. Nel trattare
le funzioni trigonometriche `e spesso utile fare uso della funzione di Eulero definita su R e a
valori complessi:
eix = cos(x) + i sin(x)
che soddisfa lidentit`
a fondamentale
eix eiy = (cos(x) cos(y) sin(x) sin(y)) + i(sin(x) cos(y) + cos(x) sin(y)) = ei(x+y)
che incorpora le formule di addizione di sin e cos e giustifica anche la notazione. Possiamo
anche estendere la funzione esponenziale da R a C ponendo
ez = ex+iy = ex eiy
che verifica anchessa lidentit`
a fondamentale nel campo dei numeri complessi:
ez1 +z2 = ez1 ez2 .
Inoltre le stesse funzioni cos e sin si possono esprimere in quanto rispettivamente la parte reale
e la parte immaginaria della funzione di Eulero
eix + eix
eix eix
, sin(x) =
.
2
2i
Praticamente tutte le formule della trigonometria elementare si possono riottenere manipolando
algebricamente queste formule di base. Vediamo per esempio le formule di Prostaferesi:
cos(x) =
)=
2
2
cos(A B) cos(A + B)
2
e analogamente si ottiene:
sin(A B) + sin(A + B)
sin(A) cos(B) =
2
cos(A B) + cos(A + B)
cos(A) cos(B) =
.
2
Sia ora p(X1 , X2 ) un polinomio in due indeterminate. Vogliamo trattare gli integrali indefiniti della forma
Z
p(cos(ax + b), sin(cx + d))dx
sin(A) sin(B) = (
PRIMITIVE ELEMENTARI
tb
ci riduce
a
si trattano anche con opportuni cambiamenti di variabile. Vediamo per esempio due casi:
(1) r = 2m + 1 dispari e s = 2n sia pari. Allora riscriviamo lintegrale nella forma
Z
Z
(1 cos2 )m cos2n sin(x)dx = (1 t2 )m t2n dt
via la sostituzione t = cos(x). Si procede in modo analogo se invece r `e pari e s `e dispari.
(2) r = 2m + 1, s = 2n + 1 entrambi dispari. Allora
Z
Z
1t m 1+t n
) (
) dt
sin2m (x) cos2n sin(x) cos(x)dx = (1/4) (
2
2
via la sostituzione t = cos(2x) (si usano casi particolari delle formule di Prostaferesi).
PRIMITIVE ELEMENTARI
3. Funzioni razionali
Risalendo ancora la gerarchia delle funzioni elementari dopo le polinomiali troviamo le funzioni
razionali. E meno immediato, ma anche le funzioni razionali ammettono primitive elementari. Descriviamo la procedura che conduce al risultato (nel fare questo mostreremo anche numerosi esempi
espliciti di primitive elementari) :
N (x)
. Questa `e definita sullaperto D = {D(x) 6=
(1) Partiamo da una funzione razionale f (x) =
D(x)
0} che `e lunione di un numero finito di intervalli aperti. Supponiamo di avere selezionato un
sottointervallo (sia I) di uno di questi intervalli e conveniamo di considerare la restrizione di
f ad I. Grazie alla divisione con il resto per D(x), possiamo riscrivere f nella forma
f (x) = Q(x) +
R(x)
D(x)
dove Q(x) e R(x) sono polinomi e il grado del resto R(x) `e strettamente minore di quello
di D(x). Per la linearit`a dellintegrale indefinito, e poiche sappiamo integrare facilmente il
R(x)
.
polinomio Q(x), siamo ridotti a trovare una primitiva della funzione razionale g(x) =
D(x)
(2) Consideriamo due casi di base, cio`e quando il grado di D(x) `e uguale a 1 o a 2. Nel primo
caso la funzione `e della forma
a
g(x) =
x
dove a, R. Una primitiva immediata `e allora G(x) = a log(|x |) che `e elementare. Se
il gardo `e 2, allora
ax + b
g(x) = 2
x + px + q
per certe costanti a, b, p, q. Considerato = p2 4q, ci sono tre possibilit`a:
> 0, allora x2 + px + q = (x )(x ) 6= . Affermiamo che allora g(x) pu`
o essere
riscritta nella forma
a2
a1
+
g(x) =
x x
dove le costanti a1 e a2 sono le uniche che soddisfano le identit`
a
a1 + a2 = a, a1 + a2 = b
si ottengono cio`e come le uniche soluzioni di questo sistema lineare. Per la linearit`a
dellintegrale indefinito, lintegrale di g `e allora la somma di due integrali del tipo trattato
nel caso precedente.
Se = 0, allora x2 + px + q = (x )2 . In questo caso si pu`
o riscrivere
a1
a2
g(x) =
+
x (x )2
dove a1 = a, a2 = a + b. A questo punto una primitiva immediata di g `e
G(x) = a log(|x |)
a + b
x
che `e elementare.
Se < 0, allora x2 + px + q non ha radici reali ed `e sempre positivo. In questo caso il
trattamento `e un po pi`
u laborioso. Ci limitiamo ad esibire una primitiva di g anche in
questo caso (il lettore pu`
o verificare che `e una primitiva facendone la derivata).
G(x) =
che `e elementare.
2b ap
2x + p
a
log(x2 + px + q) +
arctan(
)
2
PRIMITIVE ELEMENTARI
(3) Nel caso generale, grazie al teorema fondamentale dellalgebra e alle propriet`
a dei polinomi
reali, il denominatore D(x) = p0 +p1 x+. . . pn1 xn1 +xn pu`
o essere decomposto nel prodotto
di fattori di due tipi
(x )m , (x2 + px + q)k
dove m, k n e il polinomio di secondo grado ha discriminante = p2 4q < 0, dunque
x2 + px + q > 0 per ogni x . Si riscrive allora g(x) come somma di certe funzioni razionali pi`
u
semplici. Ogni fattore del primo genere contribuisce con un pacchetto di addendi del seguente
tipo:
m
X
aj
(x )j
j=1
mentre ogni fattore del secondo genere con un pacchetto del tipo
k
X
s=1
ms x + n s
.
+ px + q)s
(x2
Linsieme delle costanti aj , ms , ns , per tutti i fattori di D(x), si determinano in modo univoco come soluzioni di un opportuno sistema di equazioni lineari che pu`
o a sua volta essere
determinato esplicitamente.
(4) Ancora grazie alla linearit`a dellintegrale, siamo cos` ridotti a calcolare una primitiva di due
tipi speciali di funzioni razionali:
aj
ms x + n s
g(x) =
, g(x) = 2
.
(x )j
(x + px + q)s
Per quelli del primo genere, il caso j = 1 `e gi`a stato trattato. Se j > 1 una primitiva immediata
`e
1
aj
G(x) =
.
1 j (x )j1
Per quelli del secondo genere, prima riscriviamo la funzione nella forma
1
2x + p
+B 2
g(x) = A 2
(x + px + q)s
(x + px + q)s
dove le costanti A e B sono facilmente calcolabili.
(5) Ancora per linearit`a siamo ridotti a determinare una primitiva di ulteriori due tipi speciali di
funzioni razionali
2x + p
1
g(x) = 2
, g(x) = 2
(x + px + q)s
(x + px + q)s
per quelle del primo genere, se s = 1 `e un caso gi`a trattato, se s > 1, una primitiva immediata
`e
1
1
.
2
1 s (x + px + q)s1
(6) Per quelle del secondo genere, mediante la sostituzione
2x p
t=
PRIMITIVE ELEMENTARI
2t
1 t2
,
cos(x)
=
1 + t2
1 + t2
sin(x) =
si ottiene
f (x)dx =
R(
1 t2
2
2t
,
)
dt .
1 + t2 1 + t2 1 + t2
Ad esempio
Z
dx
=
sin(x)
dt
= log(|t|) + R = log(| tan(x/2)|) + R .
t
PRIMITIVE ELEMENTARI
Il luogo di zeri di P (X, Y ), = {(x, y) R2 ; P (x, y) = 0}, `e una curva in R2 , e x (x, y(x)) `e una
parametrizzazione di un arco di (vedi anche [ARCHI]). Un tale integrale si razionalizza se esistono
due funzioni razionali di una terza variabile t, definite su un intervallo aperto J:
x = (t), y = (t)
tali che:
(i) parametrizza I;
(ii) P ((t), (t)) = P ((t), y((t)) = 0.
Infatti in tal caso, usando la regola di integrazione per sostituzione abbiamo che
Z
Z
R(x, y(x))dx = R((t), (t)) (t)dt .
Vediamo alcuni esempi:
( conica) Supponiamo che il polinomio P (X, Y ) sia di grado uguale a 2. La curva `e una
conica e pu`
o essere un ellisse, una iperbole o una parabola. In questo caso `e sempre possibile trovare
funzioni razionalizzanti (, ) del tipo voluto. Il metodo geometrico per determinarle `e il seguente.
Supponiamo per semplicit`a che I 6= R. Preso x0 che non appartiene a I, sia (x0 , y0 ) . la generica
retta che passa per il punto (x0 , y0 ) ha equazione
y = tx + (y0 tx0 )
dove t `e un parametro che varia in R. Una tale retta interseca nel punto (x0 , y0 ) e in un solo
altro punto (x(t), y(t)) di coordinate che sono funzioni razionali di t. Si determina infine un intervallo
aperto J opportuno in modo che le restrizioni a J forniscano le funzioni ((t), (t)) cercate. Vediamo
come funziona in un esempio concreto:
Z
p
R(x, (x 1)(x 2))dx
I = {x > 2}. P (X, Y ) = Y 2 (X 1)(X 2). Prendiamo allora (x0 , y0 ) = (1, 0). La retta generica
per (1, 0) ha equazione
y = tx t
sostituendo in P (X, Y ) otteniamo
(x 1)(t2 (x 1) (x 2)) = 0
da cui
x=
t
t2 2
, y= 2
t2 1
t 1
quindi basati su una conica possono essere razionalizzati in modo sistematico come segue:
(1) Se a > 0 si pone
ax2 + bx + c = ax + t
PRIMITIVE ELEMENTARI
t2 c
b 2 at
x
ax + bx + c = a(x )
x
per cui ci riconduciamo ad un integrale del tipo visto prima, che si razionalizza mediante la sostituzione
r
x
t=
.
x
2
4.2. Integrali ellittici. Abbiamo affermato allinizio che non tutte le funzioni elementari hanno
primitive elementari. Anche se non giustificheremo laffermazione, indichiamo una classe di funzioni
elementari derivabili che in generale non hanno primitive elementari. Si tratta degli integrali Abeliani
della forma:
Z
p
R(x, q(x))dx
1. A pagina 3 della Nota `e enunciato il fatto che per una funzione razionale
()
(i)
mi
X
j=1
(i)
Aj
(x i )j
(i)
ki
X
j=1
(i)
(i)
Bj x + Cj
con p2i 4qi < 0.
2
j
(x + pi x + qi )
Fermo restando il fatto, gi`a notato a pag 4 della dispensa stessa, della non
banailt`a della procedura stessa, almeno dal punto di vista calcolistico, poiche
parte essenziale di tutto ci`o `e la conoscenza di una effettiva decomposizione
in fattori irriducibili del denominatore della funzione razionale, cosa tuttaltro
che ovvia, notiamo anche che una decomposizione del tipo presentato sussiste
in quanto i polinomi sono supposti a coefficienti reali e quindi se ammettono
una radice complessa anche `e radice e i fattori x2 + px + q con p, q reali
con discriminante negativo nascono per lappunto dal prodotto di due fattori
di questo tipo.
Un modo per convincersi dellesistenza di una tale decomposizione `e quello di
impostare il sistema lineare derivante da tutte le considerazioni fatte fino a
quel momento e vedere che ha una soluzione: qui esponiamo un altra via.
Supponiamo che la radice di D sia semplice e moltiplichiamo ambo i membri
della (*) per x . Otteniamo
(x )
R(x)
A
= (x )
+ (x )(x)
D(x)
(x )
A
d PL
+
(x ) dx QL
S=
d PS
Bx + C
+
+ px + q) dx QS
(x2
(1 + t2 )s
(1 + t2 )s1 (1 + t2 )s
()
t2
dt
(1 + t2 )s
Con le notazioni usate fino ad ora, indicando con L il pacchetto relativo alla radice e con
R
g(x) tutto il resto, abbiamo (x )m = (x )m L + (x )m g(x) = Am + Am1 (x ) + . . . +
D
A1 (x )m1 + (x )m g(x)
dt =
2
s
(1 + t )
2 (1 + t2 )s
Z
1
1
1
1
t
dt =
=
2
s1
2 (1 s) (1 + t )
2(1 s)
(1 + t2 )s1
t
1
1
1
=
Is1
2
s1
2 (1 s) (1 + t )
2(1 s)
da cui la formula ricorsiva data a pag 2 punto 5 della Nota:
t
1
1
1
+
Is1 =
2
s1
2 (1 s) (1 + t )
2(1 s)
1
t
2s 3
Is1 +
=
2s 2
2(s 1) (1 + t2 )s1
Is = Is1
December 9, 2014
ARCHI DI CURVE
1. Introduzione
Nella definizione delle funzioni sin(t) e cos(t) siamo stati un po vaghi nellinterpretare t come la
lunghezza dellarco orientato della circonferenza unitaria che delimita il corrispondente angolo. In
particolare siamo stati vaghi nel definire 2 come la lunghezza della circonferenza unitaria. Uno degli
scopi di questa breve nota `e quello di precisare questo concetto, estendendolo ad una classe molto
ampia di curve nel piano (e non solo). Useremo molte delle nozioni del calcolo differenziale e integrale
che abbiamo sviluppato.
2. Interpretazione cinematica della derivata
Sia
f :IR
una funzione derivabile definita sullintervallo aperto I. Consideriamo la funzione associata
: I R2 , (t) = (t, f (t)) .
Allora questa funzione realizza una parametrizzazione del grafico G(f ) considerato come una curva
nel piano. Possiamo pensare t come il tempo e G(f ) come la traiettoria percorsa da un punto materiale
che si muove sul piano con legge del moto data da . Deriviamo ora le due componenti di ; otteniamo
v(t) := (t) = (1, f (t)) .
Si nota che per ogni t I, v(t) 6= (0, 0). Adesso la derivata di `e un vettore non nullo di R2 che per
ogni t I pu`
o essere interpretato come il vettore velocit`
a del punto allistante t ed `e tangente alla
curva G(f ) nel punto (t, f (t)).
Questa discussione si pu`
o estendere ad una qualsiasi funzione
= (f1 , f2 ) : I R2
dove le due componenti sono entrambe derivabili ed inoltre v(t) := (f1 (t), f2 (t)) 6= (0, 0) per ogni
t I. := (I) `e ora una curva che pu`
o essere molto pi`
u complicata di un grafico. In particolare
non richiediamo neanche che sia iniettiva, cio`e la traiettoria del punto che si muove nel piano pu`o
occupare la stessa posizione in istanti diversi. Il vettore velocit`
a `e ora appunto v(t) = (f1 (t), f2 (t)) e
per ogni t I determina la retta tangente a nellistante t.
3. Lunghezza di un arco di curva
Consideriamo
= (f1 , f2 ) : I R2
come sopra e supponiamo di pi`
u che le due componenti siano C 1 , cio`e che le due derivate siano continue.
Poniamo
q
|v(t)| = f1 (t)2 + f2 (t)2
cio`e il modulo del vettore velocit`
a. Questo definisce una funzione continua
|v| : I R .
Fissiamo un intervallo chiuso e limitato [t0 , t1 ] I; allora diciamo che
C = ([t0 , t1 ])
`e un arco chiuso e limitato di . Poiche |v| `e continua, esiste lintegrale definito
Z t1
|v(t)|dt .
t0
ARCHI DI CURVE
Sia
r:J I
1
unapplicazione C , iniettiva e con r > 0, definita su un intervallo aperto J e tale che [t0 , t1 ] r(J).
Allora esiste [s0 , s1 ] J tale che r([s0 , s1 ]) = [t0 , t1 ]. La composizione
:= r : [s0 , s1 ] R2 , (s) = (r(s))
`e tale che
C = ([s0 , s1 ])
e per questo `e detta una riparametrizzazione dellarco C. Usando le regole di derivazione per la
composizione vediamo che
v(s) := (s) = (r(s))r (s) = v(r(s))r (s)
|
v (s)| = |v(r(s))|r (s) ,
usando le regole di integrazione per cambiamento di variabile, abbiamo
Z t1
Z s1
|v(t)|dt .
|
v (s)|ds =
t0
s0
Dunque questo numero non dipende dalla scelta della parametrizzazione ma solo dall arco C e viene
definito la lunghezza di C e lo indichiamo con l(C). Notiamo anche che la funzione integrale
Z t
|v(x)|dx
l(t) =
t0
esprime la lunghezza del sotto-arco di C percorso dal punto al tempo t, partendo dallistante iniziale
t0 . Supponiamo adesso che |v(t)| = 1 per ogni t. In tal caso per ogni t [t0 , t1 ], l(t) = t t0 , dunque la
lunghezza del sotto-arco `e uguale alla lunghezza del corrispondente sotto-intervallo dei parametri [t0 , t].
Necessariamente in questo caso t1 t0 = l(C). La parametrizzazione che verifica queste propriet`
a `e
speciale e viene detta parametrizzazione secondo la lunghezza dellarco o anche parametrizzazione naturale. Supponiamo che sia una arbitraria parametrizzazione dellarco C e vogliamo riparametrizzare
mediante r : [0, l(C)] [t0 , t1 ] in modo che = r sia la parametrizzazione naturale. Consideriamo
come sopra la funzione integrale associata a
Z t
|v(x)|dx
l(t) =
t0
ARCHI DI CURVE
December 9, 2014
EQUAZIONI DIFFERENZIALI I
1. Introduzione
Un multirettangolo aperto Q di Rn+1 `e un prodotto di intervalli aperti della forma
Q = I0 In .
Una funzione F : Q R `e continua se per ogni p Q, per ogni > 0, esiste un multirettangolo
aperto Q Q tale che p Q e F (Q ) (F (p) , F (p) + ).
Fissiamo un multirettangolo aperto della forma:
T Q R Rn+1 = Rn+2
dove n 1 e lintervallo aperto T pu`
o essere pensato come un intervallo di tempi. Sia data una
funzione continua
F : T Q R, F (t, x) = F (t, x0 , . . . , xn ) .
Associata ad F abbiamo l equazione differenziale dell n-esimo ordine:
F (t, y, y (1) , . . . , y (n) ) = 0 .
Una soluzione di questa equazione `e una funzione
y:J R
tale che:
(1) J T `e un sotto-intervallo aperto dellintervallo dei tempi T .
(2) y `e n-volte derivabile, e per ogni t J, poniamo y (t) = y (1) (t), y (s) (t) = (y (s1) ) (t).
(3) Ponendo, per ogni t J,
y(t) = (y(t), y (1) (t), . . . , y (n) (t))
si definisce una funzione
y : J Q .
(4) Per ogni t J, si ha che
F (t, y(t)) = 0 .
Il grafico G(
y ) di y in J Q `e detto una curva integrale dellequazione. E chiaro che c`e una corrispondenza biunivoca canonica tra linsieme delle soluzioni e linsieme delle curve integrali. Linsieme
I(F ) di tutte le soluzioni (equivalentemente, di tutte le curve integrali) `e detto l integrale totale
dellequazione differenziale. Il problema generale `e quello di determinare I(F ) al variare di F . Una
soluzione y : J R (equivalentemente una curva integrale) `e detta massimale se non si pu`
o prolungare ad una soluzione y : J R, dove J contiene propriamente J. Dunque possiamo definire Im (F )
come linsieme di tutte le soluzioni massimali e specializzare un poco il problema sostituendo I(F )
con Im (F ), al variare di F . Un sotto-problema fondamentale `e il
Problema di Cauchy sullesistenza e unicit`
a di soluzioni massimali con dati iniziali assegnati.
Precisamente, assegnato un punto (t0 , x
0 ) T Q, il problema chiede se esiste ed `e unica una soluzione
massimale y : J R dellequazione tale che t0 J e (t0 , y(t0 )) = (t0 , x
0 ).
Ci possiamo aspettare che la difficolt`
a di questi problemi cresca con lordine e che soprattutto dipenda
da quanto `e complicata la funzione F . Una prima semplificazione consiste nel richiedere che F sia
in forma normale cio`e della forma
F (t, x
) = xn f (t, x0 , . . . , xn1 ) .
Ricordando poi, per esempio, le considerazioni sulla gerarchia delle funzioni elementari (vedi [MODELLI]) il tipo pi`
u semplice per F `e quello lineare, cio`e della forma:
F (t, x
) = xn + (a0 (t)x0 + . . . an1 (t)xn1 b(t))
EQUAZIONI DIFFERENZIALI I
X
aj (t)xj ) + b(t)) `e definita su T Rn .
dove f (t, x
) = (
j
Nel seguito ci occuperemo principalmente di equazioni del primo e del secondo ordine.
` sulle equazioni lineari
2. Generalita
Una equazione lineare (in forma normale) pu`
o essere scritta nella forma
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b(t)
dove le funzioni aj (t) sono continue. L equazione
y (n) + a0 (t)y + . . . an1 (t)y (n1) = 0
`e detta l equazione omogenea associata, mentre la funzione b(t) `e il termine noto di quella non omogenea. Il lettore probabilmente avr`
a riconosciuto la terminologia che si usa per i sistemi di equazioni
lineari e che avr`
a gi`
a incontrato nel corso di algebra lineare. Non `e un caso. Per ogni intervallo aperto
J T , linsieme C 0 (J) delle funzioni continue z : J R `e chiuso rispetto alle combinazioni
lineari,
X
j zj (t) C 0 (J).
cio`e, se z1 (t), . . . , zk (t) C 0 (J) e 1 , . . . , k R, allora la combinazione lineare
j
Dunque C 0 (J) `e un R-spazio vettoriale. Il sottoinsieme C n (J) di C 0 (J) formato dalle applicazioni
di classe C n `e un sottospazio vettoriale (cio`e `e a sua volta chiuso rispetto alle combinazioni lineari).
Lapplicazione
L : C n (J) C 0 (J), L(y) = y (n) + a0 (t)y + . . . an1 (t)y (n1)
`e unapplicazione lineare. Dunque trovare le soluzioni definite su J T dellequazione omogenea
coincide con determinare il nucleo Ker(L) di L. Sappiamo dallalgebra lineare (e la verifica `e facile)
che Ker(L) `e un sottospazio vettoriale di C n (J), in particolare, per ogni J T , non `e vuoto perche
contiene almeno la soluzione costantemente nulla y = 0.
Venendo allequazione non omogenea, fissato un sottointervallo J T , si hanno due possibilit`a: (1)
non esistono soluzioni definite su J; (2) esiste almeno una soluzione y 0 : J R. Nel secondo caso
possiamo descrivere completamente linsieme delle soluzioni dell equazione non omogenea:
y : J R `e una soluzione dellequazione non omogenea se e solo se `e della forma y = y 0 + z, dove
z Ker(L), cio`e z `e una soluzione dellequazione omogenea associata.
Abbiamo dunque ritrovato la struttura delle soluzioni di un sistema lineare non omogeneo. Lunica
differenza, rispetto ai sistemi lineari che probabilmente sono pi`
u familiari al lettore, `e che lo spazio
su cui `e definita lapplicazione lineare L non `e di dimensione finita e quindi, a priori, anche Ker(L)
potrebbe non esserlo. Si noti infatti che le funzioni monomiali
y = tn , n N
che sono definite e C su ogni intervallo J, sono infinite e tra loro linearmente indipendenti.
Le considerazioni precedenti suggeriscono di dividere lo studio di una data equazione lineare in due
parti complementari:
(1) Per ogni J T (in particolare T ) Determinare Ker(L), cio`e determinare lo spazio vettoriale
delle soluzioni dellequazione omogenea associata (in particolare decidere se `e di dimensione
finita, nel caso determinarla).
(2) Determinare se possibile una soluzione particolare y 0 dellequazione non omogenea.
Concludiamo osservando che per le equazioni lineari vale anche la seguente propriet`
a di sovrapposizione
(che `e di facile verifica):
Siano
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b1 (t)
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b2 (t)
EQUAZIONI DIFFERENZIALI I
due equazioni lineari non omogenee che hanno la stessa equazione omogenea associata. Allora se y1 e
y2 sono rispettivamente soluzioni di queste equazioni, definite su uno stesso intervallo J, allora y1 + y2
`e una soluzione dellequazione
y (n) + a0 (t)y + . . . an1 (t)y (n1) = b1 (t) + b2 (t) .
3. Equazioni del primo ordine
Consideriamo
f :T I R
continua che determina una F : T (I R) R in forma normale, cio`e
F (t, x0 , x1 ) = x1 f (t, x0 ) .
Lequazione differenziale associata si pu`
o scrivere nella forma
y = f (t, y) .
Nel seguito scriveremo semplicemente x invece di x0 .
Possiamo interpretare la situazione nel modo seguente. La coordinata x individua la posizione di un
punto che si muove sullintervallo I. Allora f (t, x) pu`
o essere interpretato come il vettore velocit`
a
del punto che allistante t occupa la posizione x. Questo vettore `e tangente a I come deve essere.
Dunque la funzione f = f (t, x) pu`
o essere interpretata come:
Un campo di vettori tangenti (di velocit`
a istantanee nella nostra interpretazione cinematica) lungo
I che varia con il tempo.
Una soluzione y : J R dellequazione differenziale corrisponde ad una specifica legge del moto
del punto (su I) che ha in ogni istante la velocit`
a pre-assegnata dal campo f . Integrare lequazione
significa quindi ricostruire tutte le leggi del moto che realizzano quella assegnata distribuzione di
velocit`
a (dipendente dal tempo).
La cosa diventa forse ancora pi`
u espressiva se la rileggiamo in termini delle curve integrali. In quanto
segue svolgeremo un tipo di considerazioni gi`a incontrato in [ARCHI]. Associamo alla funzione
f :T I R
la funzione a valori vettoriali
S : T I R2 , S(t, x) = (1, f (t, x))
che a volte `e chiamata la sospensione di f . S pu`
o essere interpretato come:
Un campo di vettori tangenti su T I
Nel senso che il vettore S(t, x) = (1, f (t, x)) deve essere pensato applicato al punto (t, x) T I.
Se y : J R `e una soluzione dellequazione differenziale, allora t (t, y(t)) `e la legge del moto di
un punto che si muove nel piano lungo la curva integrale G(y), tale che il vettore S(t, y(t)) `e tangente
alla curva e rappresenta la velocit`
a del punto allistante t.
3.1. Un esempio gi`
a familiare. Supponiamo che
f (t, x) = f (t)
cio`e dipende solo da t ma non dalla posizione, come al solito
F (t, x, x1 ) = x1 f (t) .
Lungo ogni intervallo verticale della forma
{t} I T I
si applica il vettore costante
S(t) = (1, f (t)) .
In questo caso lequazione differenziale diventa
y = f (t)
EQUAZIONI DIFFERENZIALI I
Si noti per`
o che non ci siamo ridotti come prima alla semplice determinazione di un integrale indefinito
perche la funzione incognita interviene ora sotto il segno di integrazione.
3.2. Enunciato del teorema di Cauchy-Lipschitz. Consideriamo di nuovo un equazione differenziale del primo ordine in forma normale
y = f (t, y)
dove come al solito f `e continua. Diciamo che f `e localmente Lipschitziana se per ogni (t0 , x0 ) T I
esistono un multirettangolo aperto Q T I (che possiamo pensare abbastanza piccolo) e una
costante positiva K > 0, tali che
(t0 , x0 ) Q.
Per ogni (t, x), (t, z) Q, si ha che |f (t, x) f (t, z)| < K|x z| .
Ricordando il Corollario del teorema del valor medio visto in [D-INTERVALLI], si verifica per esempio
che:
Proposizione 3.2. Se f `e continua e la restrizione di f ad ogni intervallo verticale {t} I T I
`e di classe C 1 , allora f `e localmente Lipschitziana.
Possiamo infine enunciare (omettendo la dimostrazione):
Teorema 3.1. (Cauchy-Lipschitz) Supponiamo che f : T I R sia continua e localmente
Lipschitziana. Allora per ogni (t0 , x0 ) T I esiste ed `e unica una soluzione massimale y : J R
dellequazione differenziale y = f (t, y), tale che t0 J e y(t0 ) = x0 .
Questo teorema pu`
o essere visto come unampia estensione del teorema fondamentale del calcolo
integrale per le funzioni continue; la sua dimostrazione `e pi`
u riposta. Si noti che adesso, a differenza
dellintegrale indefinito, lo stesso intervallo J pu`
o variare al variare del punto (t0 , x0 ).
Un risultato analogo vale pi`
u in generale per lintegrazione dei campi di vettori (di cui si parla alla
fine della dispensa).
EQUAZIONI DIFFERENZIALI I
3.3. Equazioni del primo ordine lineari. Si tratta di studiare equazioni della forma
y + a(t)y = b(t)
dove a(t) e b(t) sono continue. Quando a = 0, si riottiene il caso gi`a familiare dellintegrale indefinito.
In effetti queste equazioni lineari si integrano direttamente riconducendosi al caso degli integrali indefiniti. Secondo lo schema descritto sopra in generale per le equazioni di tipo lineare, determiniamo
prima le soluzioni dellequazione omogenea
y + a(t)y = 0
e poi determineremo una soluzione particolare di quella non omogenea.
(1) Fissiamo una primitiva A(t) di a(t) su tutto T . Poiche a `e continua, basta fissare t0 T `e
prendere la funzione integrale
Z t
a(x)dx .
A(t) =
t0
eA(x) b(x)dx .
t0
Riassumendo:
Linsieme delle soluzioni massimali (definite su tutto T ) dellequazione non omogenea `e
formato dalle funzioni della forma
Z t
eA(x) b(x)dx)eA(t) + ceA(t) , c R
y(t) = y0 (t) + ceA(t) = (
t0
A(t) =
t0
a(x)dx .
EQUAZIONI DIFFERENZIALI I
1
1
1
( t + sin(2t))
2
4
cos(t)
3.4. Equazioni del primo ordine a variabili separate. Si tratta di studiare equazioni della forma
y = a(t)b(y)
dove f (t, x) = a(t)b(x) `e definita su T I ed `e continua. E il tipo pi`
u semplice di equazioni non
lineari. Anche in questo caso ci ricondurremo allo studio di certi integrali indefiniti. Nonostante ci`o,
vedremo che a causa della non-linearit`
a le soluzioni possono avere comportamenti sostanzialmente pi`
u
complessi rispetto alle equazioni lineari. Le equazioni di questo tipo possono essere studiate seguendo
il seguente schema:
Si cercano gli eventuali zeri della funzione b(x). Se x0 I `e un tale zero, la funzione costante
y = x0 `e una soluzione dellequazione, la cui curva integrale `e lintervallo orizzontale T
{x0 }.
Si considerano tutti i sotto-intervalli aperti non vuoti di I contenuti in I \ {b = 0}. Per
ciascuno di questi intervalli, sia L, consideriamo la restrizione di f su T L e studiamo
la corrispondente equazione ristretta. Supponiamo per semplicit`a che per queste equazioni
ristrette si possa applicare il teorema di Cauchy-Lipschitz.
Fissiamo L come nel punto precedente. Lequazione pu`
o essere riscritta equivalentemente
nella forma
y
= a(t) .
b(y)
Se y : J R `e una soluzione (massimale), passando agli integrali indefiniti abbiamo
Z
Z
y (t)
dt = a(t)dt
b(y(t))
e usando le regole di integrazione per sostituzione otteniamo
Z
Z
1
dy = a(t)dt, y = y(t) .
b(y)
La cosa pu`
o essere detta in altri termini: se
F : L R, F (x) =
x0
1
dy
b(y)
EQUAZIONI DIFFERENZIALI I
`e una primitiva di
1
: L R, se
b
A : T R, A(t) =
a(s)ds
t0
EQUAZIONI DIFFERENZIALI I
2
`e una soluzione massimale
Su R L+ , necessariamente c > 0 e t ( c, c). Allora y =
2
ct
dellequazione e la curva integrale cio`e il suo grafico in ( c, c) R `e simmetrico rispetto allasse
delle x, convesso con un punto di minimo assoluto per t = 0 e due asintoti verticali.
Su R L , ci sono due possibili`
a:
2
`e una soluzione massimale definita su tutto R. Il suo grafico `e
se c < 0, allora y =
c t2
simmetrico rispetto allasse delle x, ha punto di minimo assoluto in t = 0, due punti di flesso
simmetrici e asintoto orizzontale x = 0 per t .
Se c 0,
allora +ci sono
due soluzioni massimali definite rispettivamente sugli intervalli J =
(, c) e J = ( c, +). I grafici sono concavi e hanno lasintoto orizzontale x = 0 per
t , e ciascuno un asintoto verticale.
Linsieme di tutte le soluzioni cos` ottenute (costanti e non costanti) hanno curve integrali due a due
disgiunte e quindi in questo caso il problema di Cauchy di esistenza e unicit`
a ha soluzione positiva.
(2)
y = a(t)b(t)
F (x) = 2 x
1 2
t
2
quindi le curve c , c R, sono definite dalle equazioni
t2 + c
x=
.
4
Si ottengono allora le soluzioni massimali secondo la formula
A(t) =
t2 + c 2
)
4
e definite per t2 + c > 0. Quindi se c > 0 sono definite su tutto R; il grafico `e simmetrico rispetto
allasse delle x, convesso con punto di minimo
assoluto int = 0. Se c 0, allora ci sono due soluzioni
definite rispettivamente su J = (, c) e J + = ( c, +). I grafici sono convessi e
y=(
lim
y(t)
t c
=0.
E chiaro che per ogni (t0 , x0 ) R R esiste una soluzione massimale che passa per (t0 , x0 ). Si verifica
infine che ci sono delle soluzioni non costanti dellequazione
su tutto R, ottenute incollando
definite
per esempio la soluzione costante y = 0 definita su ( c, c) con le due soluzioni su R L
corrispondenti alla costante c < 0. Dunque per esempio per il punto (0, 0) R R passano infinite
soluzioni massimali dellequazione.
(3) (Equazione del primo ordine associata ad una famiglia di curve dipendente da un
parametro - traiettorie ortogonali) Prima abbiamo visto come lo studio di unequazione differenziale ha dato luogo ad una famiglia di curve piane dipendenti da un parametro che fanno da supporto
alle curve integrali. A volte questa procedura pu`
o essere invertita. Mostriamo come in un paio di
esempi.
(i) Consideriamo la famiglia di ellissi data dalle equazioni cartesiane:
t2 + 2x2 = c2 , c R .
sostituiamo formalmente x = y(t) e deriviamo rispetto al tempo:
t + 2y(t)y (t) = 0
allora lequazione
y =
t
2y
EQUAZIONI DIFFERENZIALI I
`e a variabili separate e le corrispondenti curve c sono contenute nella famiglia di ellissi di partenza.
(ii) Consideriamo la famiglia di parabole
x = c(t 1)2 , c R
sostituiamo formalmente x = y(t) e deriviamo rispetto al tempo:
y(t) = c(t 1)2
y = 2c(t 1)
otteniamo lequazione
y = 2
y
t1
1
f (t, y)
ha la propriet`
a che le sue linee integrali sono ortogonali alle linee integrali della prima equazione. Se applichiamo per esempio questa considerazione allequazione associata alla famiglia di ellissi dellesempio
(i), otteniamo lequazione
2y
y =
t
che ha come famiglia di curve integrali la famiglia di parabole
y =
x = ct2 .
3.5. Altri esempi di equazioni del primo ordine. Mostreremo alcuni altri tipi di equazione del
primo ordine che con opportune manipolazioni possono essere ricondotte al caso lineare o a variabili
separate.
Nota. Negli esempi che seguono metteremo pi`
u che altro in evidenza il tipo di manipolazione e la
forma delle soluzioni. Sar`
a cura del lettore specificare i dettagli, quali per esempio gli effettivi intervalli
di definizione delle soluzioni.
(1) (Equazione di Bernoulli) E unequazione della forma
y + a(t)y = b(t)y
dove R \ {0, 1}. Facciamo formalmente la sostituzione
y(t) = u(t)v(t)
dove le due funzioni u e v sono da determinare. Sostituendo nellequazione si ottiene
u (t)v(t) + u(t)v (t) + a(t)u(t)v(t) = b(t)(u(t)v(t))
da cui
v(u + au) + v u = b(uv)
Imponiamo allora che
u + a(t)u = 0
che sappiamo risolvere perche `e lineare. Sostituendo una soluzione u = u(t) nellequazione
otteniamo
v = [b(t)u(t)1 ]v
che `e a variabili separate. Vediamo un esempio concreto:
10
EQUAZIONI DIFFERENZIALI I
y y = t y
t
lequazione lineare ausiliaria `e allora
4
u u = 0
t
che ha come soluzione particolare
u = t4
sostituendo troviamo
v =
v
t
(2) (Equazioni omogenee) Laggettivo omogeneo ha qui un significato diverso da quello usato
per le equazioni lineari. Infatti consideriamo equazioni della forma
y
y = g( )
t
dove
x
f (t, x) = g( )
t
`e omogenea nel senso che per ogni R, 6= 0, per ogni (t, x),
f (t, x) = f (t, x) .
Poniamo formalmente
y = tu
y = u + tu
u + tu = f (u)
f (u) u
t
che `e a variabili separate. Vediamo un esempio concreto:
u =
y = ey/t + y/t .
Poniamo
y = tu
e svolgendo i conti otteniamo
u =
eu
eu + u u
=
t
t
integrando si trova
u = log(log(c/t)), c R
ed infine
y = t log(log(c/t)), c R .
EQUAZIONI DIFFERENZIALI I
11
u a
m
a1 + b1 = c1 , a2 + b2 = c2
nelle incognite , ha ununica soluzione (0 , 0 ). Poniamo allora formalmente
t = u + 0 , y = v + 0
sostituendo nellequazione otteniamo
v = f (
v
a1 u + b 1 v
) = g( )
a2 u + b 2 v
u
dove
a1 + b1 z 1
a2 z + b 2
dunque ci siamo ricondotti ad una equazione omogenea gi`a trattata sopra.
g(z) = z
(5) (Equazioni non in forma normale) In certi casi unequazione non in forma normale pu`
o
essere ricondotta ad equazioni in forma normale. Vediamo alcuni esempi:
(i) Supponiamo che lequazione sia della forma
y = (t)(y ) + (t)
allora introduciamo formalmente il parametro p = y , riscriviamo
y = (t)(p) + (t)
e deriviamo rispetto a t, ottenendo
p = (t)(p) + (t) (p)p + (t)
da cui
p [ (t)(p) + (t)]
(t) (p)
che `e in forma normale. Se sappiamo risolvere questa equazione in p, sostituendo troviamo le
soluzioni in y. Vediamo un caso concreto
p =
t2
2
2
t
y = p2 tp +
2
p = 2pp p tp + t
y = y 2 ty +
da cui
12
EQUAZIONI DIFFERENZIALI I
p =
2p t
=1
2p t
per cui
p = t + c, c R
y = (t + c)2 t(t + c) +
t2
t2
=
+ ct + c2 .
2
2
p
p + p2
=
2t(1 + p)
2t
che `e a variabili separate e quindi sappiamo studiare. In questo caso potevamo anche esplicitare
y ottenendo due equazioni in forma normale e omogenee
p
p
y = 1 + 1 + y/t, y = 1 1 + y/t
p =
EQUAZIONI DIFFERENZIALI I
13
della variazione delle costanti arbitrarie). Se A(t) `e diagonalizzabile (se per esempio A(t) = A `e
costante ritroviamo la nozione abituale di matrice diagonalizzabile del corso di algebra lineare), allora
possiamo ricondurci al caso diagonale per mezzo di un cambiamo globale di coordinate.
15 Dicembre 2014
Equazioni differenziali lineari.
Indice
1 Introduzione.
5
6
6
7
7
10
11
Introduzione.
In questa nota esponiamo alcuni metodi per il trattamento delle equazioni differenziali ordinarie lineari di ordine qualsiasi, omogeneee e non omogeneee, cio`e
delle equazioni del tipo
y (n) + an1 (t)y (n1) + + a0 (t)y = b(t).
Anche se particolare rilievo sar`a dato al caso in cui i coefficenti sono costanti,
cio`e quando gli ai sono numeri reali, alcune cose, come ad esempio la ricerca di
soluzioni particolari, valgono anche quando le ai non sono costanti ma funzioni
della variabile t.
Il caso delle equazioni al primo ordine, lineari o no, `e stato ampiamente trattato
nella Nota [EquaD1] a cui faremo sempre riferimento.
Inizieremo quindi con il caso delle equazioni lineari del secondo ordine a coefficienti costanti, caso che per liportanza delle sue applicazioni (oscillatori, moto armonico etc.) trattiamo direttamente, senza formalmente fare ricorso esplicito ad
argomenti di Algebra Lineare, anche se perfettamente deducibile dalla trattazione
generale.
Questo ed il caso del primo ordine renderanno, forse, pi`
u chiare alcune procedure
che vedremo subito dopo in cui faremo ricorso sistematicamente ad argomenti di
Algebra Lineare introdotti nel corso parallelo di Geometria: vedremo infatti che
lAlgebra Lineare fornisce un ottimo linguaggio e ottimi metodi per trattare le
equazioni differenziali lineari, in particolar modo quelle a coefficienti costanti,e
che le analogie nel linguaggio fin qui incontrate hanno una loro ragion dessere.
Osserviamo ad esempio che la funzione eax `e un autovettore di autovalore a della
derivazione pensata come applicazione lineare di un opportuno spazio vettoriale in
se. Non stupisce quindi, pensando ai teoremi di diagonalizzazione e agli argomenti
collegati, che tali funzioni abbiano un ruolo cos` importante.
In effetti abbiamo visto nel caso del primo ordine e vedremo in quello del secondo
che una base dello spazio delle soluzioni viene espressa in termini appunto di
queste funzioni.
Dovrebbe essere anche chiaro a questo punto del corso il perche convenga trattare per prima cosa il caso omogeneo e poi quello generale: tra i vari metodi
per la ricerca di una soluzione particolare illustreremo qui principalmente quello
detto della variazione delle costanti arbitrarie, che `e stato gi`a incontrato nel caso
dellequazione lineare di ordine 1.
Ci serviranno anche alcune nozioni come quella di Massimo Comun Divisore
tra polinomi che lo studente dovrebbe aver gi`a incontrato ma che in ogni caso
richiameremo in una appendice.
Si `e gi`a visto che nel caso di una equazione lineare omogenea (sia che i coefficienti siano costanti sia che non lo siano) linsieme delle soluzioni ha una struttura
di spazio vettoriale, precisamente `e un sottospazio vettoriale dello spazio delle funzioni differenziabili fino a un determinato ordine definite su un insieme
D. Vogliamo mostrare che tale spazio ha dimensione finita, pari allordine n
dellequazione. 1
Consideriamo il problema di Cauchy
y(x0 ) = 1
y 0 (x0 ) = 0
...
y (n1) (x ) = 0
0
Tale problema ammette una sola soluzione che indicheremo con w1 ; analogamente
indichiamo con wi la soluzione del problema
y(x0 ) = 0
y (x0 ) = 0
...
y (i1) (x0 ) = 1
...
y (n1) (x ) = 0
0
Abbiamo cos` individuato n funzioni {w1 , w2 , . . . , wn } che sono linearmente indipendenti; infatti una eventuale relazione di dipendenza lineare si trasferirebbe per
la linearit`a della derivazione, in una relazione di dipendenza lineare dei vettori
1
Attenzione. Si faccia attenzione al fatto che talvolta nel seguito con la stessa scrittura si
indicano cose dal significato profondamente diverso. Quando, ad esempio, si vuol provare che
le funzioni et e e2t sono linearmente indipendenti come elementi dello spazio vettoriale C (R),
significa che si vuol provare che se c1 , c2 sono due costanti tali che c1 et + c2 e2t = 0 allora ci = 0.
Lo 0 che compare nella scrittura indica lo 0 dello spazio vettoriale, cio`e la funzione nulla. Si
vuol provare quindi che se per ogni t in R c1 et + c2 e2t = 0 allora ci = 0 e NON si vuol risolvere
lequazione c1 et + c2 e2t = 0 nella incognita t, cosa che significherebbe provare che esistono dei
t in R per cui c1 et + c2 e2t = 0.
w1 (x0 )
w10 (x0 )
...
(n1)
w1
(x0 )
w2 (x0 )
w20 (x0 )
...
(n1)
w2
(x0 )
,......,
wn (x0 )
wn0 (x0 )
...
wn(n1) (x0 )
y(x0 ) = 1
y (x0 ) = 2
...
y (i1) (x0 ) = i
...
y (n1) (x ) =
0
n
e quindi, per lunicit`a della soluzione, coincidono.
Nel caso che le due radici k1 e k2 coincidano nella radice k `e facile vedere con
una verifica diretta che oltre alla soluzione ekt anche la funzione tekt `e soluzione.
Tale funzione pu`o esser vista, tramite il teorema dellHospital come il limite
ek2 t ek1 t
al tendere di k2 a k1 .
dellintegrale particolare
k2 k1
Resta il caso del negativo. Cerchiamo una soluzione del tipo f (t)ekt . La
derivata di y = f ekt `e f 0 ekt + kf ekt e la derivata seconda `e f 00 ekt + 2kf 0 ekt + k 2 f ekt
per cui sostituendo nellequazione otteniamo
a(f 00 ekt + 2kf 0 ekt + k 2 f ekt ) + 2b(f 0 ekt + kf ekt ) + cf ekt =
= ekt (af 00 + 2(ak + b)f 0 + ak 2 + 2kb + c).
b
b
otteniamo che la funzione f e a t verifica la nostra
a
b2 + ac
equazione differenziale se la funzione f `e tale che f 00 +
f = 0. Detto
a2
2
b + ac
soluzioni di f 00 = 2 f sono f = cos t e f = sin t.
2 =
2
a
Per cui una soluzione generale della equazione omogenea si ottiene
Quindi prendendo k =
b2 + ac
a2
Si poteva giungere a questa espressione delle soluzioni anche ricordando lespressione dellesponenziale complesso
con =
b
b2 + ac
Le due radici del polinomio caratteristico in questo caso sono k1 = +i
a
a
b2 + ac
b
e k2 = i
per cui sommando e sottraendo le due espressioni
a
a
riotteniamo le due soluzioni gi`a trovate.
4.1
Un caso particolare.
4.2
Caso generale.
L0 = Id
Il lettore in possesso delle opportune nozioni di algebra lineare riconoscer`a il parallelismo
tra il procedimento espsoto e la prova del teorema di Jordan.
3
5
5.1
yi
(n1)
+ an1 yi
+ + a0 yi = 0.
Come abbiamo gi`a fatto per le equazioni del primo ordine, cerchiamo se esiste
una soluzione particolare della (**) ottenuta come combinazione lineare delle yi
a coefficienti funzioni ci (t) della stessa classe delle yi .
n
X
Derivando la y =
ci (t)yi otteniamo
i=1
0
y =
n
X
c0i yi + ci yi0 .
i=1
Se imponiamo la condizione
n
X
i=1
yi una espressione
00
y =
n
X
i=1
c0i
verifichino
n
X
i=1
n
X
(2)
(3)
c0i yi + ci yi .
i=1
(n1)
n
X
(n1)
ci y i
i=1
con
n
X
((n2)
c0i yi
i=1
(n)
n
X
(n)
ci yi
(n1)
+ c0i yi
i=1
(n1)
c0i yi
(n)
+ ci yi
(n1)
+ an1 ci yi
+ . . . + an c i y i =
(n1)
+ . . . + an yi ) = b(t)
i=1
n
X
(n1)
c0i yi
(n)
+ ci (yi
+ . . . + an1 yi
i=1
`e
n
X
(n1)
= b(t).
+
+
...
+
+
. . . + c0n yn
. . . + c0n yn0
c0i yi
i=1
c0i (t)
verificano
Quindi se le
0
+
c1 y 1
0 0
+
c1 y 1
...
0 (n2)
cy
+
01 1(n1)
c1 y 1
+
le
n
X
il sistema
c02 y2
c02 y20
(n2)
c02 y2
(n1)
c02 y2
=
=
0
0
. . . + c0n yn(n2) = 0
. . . + c0n yn(n1) = b(t)
i=1
Ai fini della risoluzione del sistema diventa interessante quindi lo studio del
determinate W (t) 4 della matrice dei coefficienti
y1
y2
...
yn
y10
y20
...
yn0
... ...
(n1) (n1)
(n1)
y
.
.
.
y
y
2
1
n
Questo determinante ha la propriet`a che se si annulla in un punto dellintervallo
di definizione dellequazione si annulla ovunque: questa `e una conseguenza immediata del teorema della unicit`a della soluzione ma si pu`o vedere anche in questo
modo. Deriviamo W (t): la derivata di un determinante D di ordine n, per la
regola della derivazione di un prodotto, `e la somma di n determinanti Di ove il
determinante Di ha le righe uguali a quelle di D tranne la i esima che `e derivata.
Osserviamo inoltre che nel caso di W tutti questi determinanti hanno due righe
uguali e pertanto sono nulli tranne lultimo che ha lultima riga composta dalle
derivate n-esime delle yi . Rimpiazzando queste ultime con le loro espressioni derivate dalla equazione di partenza, otteniamo di nuovo una somma di determinanti
tutti nulli (hanno due linee uguali) ad eccezione di
y
y
.
.
.
y
1
2
n
0
0
0
y1
y2
...
yn
0
W =
.
.
.
.
.
.
(n1)
(n1)
(n1)
a1 y
a1 y2
. . . a1 yn
1
4
Questa matrice prende il nome di Wronskiano dal matematico polacco Josef Hoene-Wronski.
5.2
Quando la funzione `e di qualche classe particolare i conti del paragrafo precedente possono semplificarsi in modo notevole. Questo accade quando la funzione
f (t) che `e al termine noto, appartiene a una classe in un certo senso chiusa per
derivazione.Vediamo di spiegare la cosa su degli esempi.
Distinguiamo innanzitutto se la f (t) sia o meno soluzione dellequazione omogenea
f (t) non `e soluzione dellequazione omogenea.
Esemplifichiamo il procedimento su un esempio concreto di f (t) prendendo f del
tipo a cos t + b sin t. Supponiamo cio`e di avere una equazione del tipo
F (y, y 0 , . . . , y (n) ) = a cos t + b sin t
ove F `e una funzione lineare nelle y (i) a coefficienti costanti. Le derivate di f
saranno una combinazione lineare delle due funzioni cos t e sin t. Pertanto
se cerchiamo una soluzione y del tipo c1 cos t + c2 sin t, la F calcolata per
una tale y risulter`a una combinazione lineare delle funzioni sin t e cos t e la
relazione F f = 0 si tradurr`a in una relazione di dipendenza lineare per queste
due funzioni. Il fatto che queste due funzioni siano linearmente indipendenti
implicher`a lannullarsi dei coefficienti della combinazione lineare otenuta e quindi
delle condizioni sulle costanti ci .
Vediamo su un esempio.
F = y 0 y = sin 5t
Chiaramente la funzione sin 5t non `e soluzione dellequazione omogenea. Provando a cercare una soluzione del tipo c1 cos 5t + c2 sin 5t otteniamo
5c1 sin 5t + 5c2 cos 5t c1 cos 5t c2 sin 5t = sin 5t
(c1 + 5c2 ) cos 5t + (5c1 c2 1) sin 5t = 0
Ricordando quanto detto nella nota 1 si ha che lindipendenza delle due funzioni
cos 5t e sin 5t implica
(
c1 + 5c2 = 0
5c1 c2 = 1
10
1
5
Quindi la funzione y = cos 5t sin 5t `e una soluzione particolare dellequa26
26
zione data.
Un tale procedimento si pu`o ripetere in modo analogo quando la funzione f (t) `e
un polinomio p(t) o una funzione esponenziale aebt o prodotti di funzioni di questo
tipo, cio`e per funzioni di tipo p(t)ebt , (a cos t+b sin t)p(t), (a cos t+b sin t)ebt .
La cosa importante `e che queste funzioni abbiano derivate dello stesso tipo, cio`e
che queste funzioni appartengano ad uno sottspazio (di dimensione finita) che
loperatore derivazione porta in se stesso, cio`e un sottospazio invariante per loperatore derivazione. La funzione con cui si fa il tentativo non `e altro che lelemento generico di tale sottospazio invariante. Pertanto nei vari casi la funzione
modello per una soluzione particolare sar`a della stessa forma della funzione f ,
cio`e rispettivamente una combinazione lineare di seni e coseni di t, un polinomio
dello stesso grado di f , un polinomio per un esponenziale con lo stesso esponente
etc.
f (t) `e soluzione dellequazione omogenea.
Se la funzione f (t) `e soluzione dellequazione omogenea questo procedimento
presenta degli inconvenienti.
Enunciamo un risultato che `e facile verificare in modo sperimentale, rinunciando
in questa sede a una spiegazione approfondita del fenomeno, spigazione che forse
esula dalla trattazione elementare fin qui data.
Nel caso che la f sia soluzione dellequazione omogenea caratteristica, indichiamo
con m la molteplicit`a della radice corrispondente nellequazione caratteristica:
cerchiamo una soluzione particolare dello stesso tipo di quelle cercate nei vari
casi quando la f non era soluzione dellomogenea, moltiplicata per un fattore tm .
Come abbiam detto lo studente pu`o verificare sperimentalmente la validit`a dellaffermazione di cui rinunciamo in questa sede a dare una spiegazione teorica.
Richiamiamo qui brevemente lalgoritmo della divisione euclidea, alcune sue conseguenze come la ricerca del Massimo Comun Divisore insieme a qualche applicazione. Ricordiamo che dati due numeri naturali o interi a, b si definisce Massimo
Comun Divisore di a e b e lo si indica con (a, b) un intero d tale che
d divide sia a che b
se d0 divide sia a che b allora d0 divide d.
Da questo segue immediatamente che se d e d0 sono due MCD allora debbono
dividersi vicendevolmente, cio`e d = hd0 e d0 = kd per cui d = hkd da cui hk = 1
11
12
Questa `e una dispensa di servizio nel senso che altre dispense faranno in vario modo riferimento
alle nozioni qui introdotte. Le affermazioni che non saranno giustificate potrebbero esserlo per (utile)
esercizio.
Intervalli. Si tratta dei sottoinsiemi I di R non vuoti e che verificano la seguente propriet`
a:
Se a, b I, a b allora {x R| a x b} I.
Nella pratica si distinguono vari tipi di intervallo I:
(Intervalli limitati) Esistono a, b R, a b tali che
I := {x R| a?x?b}
dove i due simboli ? possono assumere indipendentemente sia il significato < sia . Si
distinguono allora diversi sottocasi:
- I limitato e aperto cio`e della forma I = (a, b) = {a < x < b}, dove a < b;
- I chiuso e limitato cio`e della forma I = [a, b] = {a x b}, dove a b; se a = b si ha il
caso degenere in cui I = {a} consiste di un solo punto.
- I limitato e semiaperto a destra (risp. sinistra) cio`e della forma I = [a, b) = {a x < b}
(risp. I = (a, b] = {a < x b}), dove a < b.
(Intervalli illimitati) Si tratta delle semirette aperte o chiuse, illimitate a destra o a sinistra,
oppure di tutta la retta reale R. Per esempio I della forma I := (a, +) := {x R| a < x}
`e una semiretta aperta illimitata a destra; invece I := (, b] := {x R| x b} `e una
semiretta chiusa illimitata a sinistra.
Sistema di intorni di un punto. Per ogni R, > 0, per ogni punto x0 R, indicheremo con
I(x0 , ) lintervallo aperto di centro in x0 e raggio definito:
I(x0 , ) := {x R| x0 < x < x0 + }
oppure equivalentemente:
I(x0 , ) := {x R| |x x0 | < } .
I(x0 , ) `e detto lo -intorno aperto di x0 . Al variare di > 0, gli I(x0 , ) formano il sistema (fondamentale) di intorni aperti di x0 in R. Si osserva che:
Se < allora I(x0 , ) I(x0 , ), in effetti `e strettamente contenuto.
Se x2 I(x0 , 0 ) I(x1 , 1 ) allora esiste 2 > 0 tale che
I(x2 , 2 ) I(x0 , 0 ) I(x1 , 1 ) .
Per ogni I(x0 , ) esiste n N, n > 0, tale che 1/n < e quindi I(x0 , 1/n) I(x0 , ).
Se x0 6= x1 , allora esiste > 0 tale che I(x0 , ) I(x1 , ) = (basta prendere per esempio
= |x0 x1 |/3).
Sottoinsiemi aperti di R. X R `e un sottoinsieme aperto di R se per ogni x0 X, esiste > 0
tale che I(x0 , ) X. Per esempio:
- R `e un sottoinsieme aperto perche la propriet`
a da verificare `e vuota ( non ha elementi).
- R R `e un sottoinsieme aperto. Pi`
u in generale un intervallo (limitato o illimitato) aperto secondo
la terminologia relativa agli intervalli introdotta in precedenza, `e anche un sottoinsieme aperto di R
secondo la definizione generale.
- Un intervallo chiuso (limitato o illimitato) diverso da R non `e un aperto.
Si osserva che:
Se A e B sono aperti di R allora anche A B e A B sono aperti.
Parte interna di un sottoinsieme di R. Dati x0 X R, x0 `e un punto interno di X se esiste
> 0 tale che I(x0 , ) X. La parte interna di X (indicata con Int(X) X) consiste dei punti interni
` TOPOLOGICHE
SOTTOINSIEMI DI R: NOZIONI E PROPRIETA
` TOPOLOGICHE
SOTTOINSIEMI DI R: NOZIONI E PROPRIETA
Cio`e abbiamo formalmente aggiunto ad R due punti indicati con . Arricchiamo la costruzione
specificando anche per i due punti aggiunti una conveniente nozione di intorno. Dato M R lo
M -intorno aperto di + `e per definizione la semiretta aperta (M, +) = {x R| x > M }. Lo M intorno aperto di `e per definizione la semiretta aperta (, M ) = {x R| x < M }. Al variare
di M R otteniamo i rispettivi sistemi (fondamentali) di intorni per . Possiamo estendere a R
lordinamento definito su R, imponendo che per ogni a R,
< a < + .
Possiamo estendere la nozione di punto di accumulazione di un sottoinsieme X R ai punti :
`e di accumulazione per X se per ogni M -intorno U di si ha che U X 6= . In particolare
i punti sono di accumulazione per X = R. Infine, per ogni sottoinsieme X R, possiamo anche
considerare la sua chiusura in R, ChR (X), per cui ad esempio ChR (R) = R.