You are on page 1of 267

Introduzione alla Matematica

La Matematica della Scuola Media


Renzo Sprugnoli
Dipartimento di Sistemi e Informatica
Viale Morgagni, 65 - Firenze (Italia)
27 settembre 2005

Indice
Introduzione

1 Il linguaggio della Matematica


1.1 Gli insiemi . . . . . . . . . . . . . . . .
1.2 Le relazioni . . . . . . . . . . . . . . .
1.3 Funzioni e operazioni . . . . . . . . . .
1.4 Il contare . . . . . . . . . . . . . . . .
1.5 Rappresentazione dei numeri naturali .
1.6 La nomenclatura della Matematica . .
1.7 Matematica e Logica . . . . . . . . . .
1.8 Predicati . . . . . . . . . . . . . . . . .
2 Aritmetica
2.1 Laddizione . . . . . . .
2.2 Confronto e sottrazione
2.3 Moltiplicazione . . . . .
2.4 Divisione . . . . . . . .
2.5 Divisibilit`a . . . . . . .
2.6 Numeri primi . . . . . .
2.7 Massimo comun divisore
2.8 Le altre operazioni . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

3 Numeri
3.1 I numeri interi . . . . . . . . .
3.2 I numeri razionali . . . . . . . .
3.3 I numeri decimali . . . . . . . .
3.4 I numeri reali . . . . . . . . . .
3.5 La costruzione dei numeri reali
3.6 Potenze, radici, logaritmi . . .
3.7 Espressioni e proporzioni . . . .
3.8 Matematica finanziaria . . . . .
4 Matematiche finite
4.1 Calcolo combinatorio . . . .
4.2 Permutazioni . . . . . . . .
4.3 Problemi combinatori . . .
4.4 Strutture dati . . . . . . . .
4.5 Il modello delle parole . . .
4.6 Il calcolo delle proposizioni
4.7 Calcolo delle probabilit`a . .
4.8 Distribuzioni . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
3

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

11
11
14
17
20
24
28
31
35

.
.
.
.
.
.
.
.

39
39
42
45
49
51
55
58
61

.
.
.
.
.
.
.
.

65
65
68
72
77
81
86
90
95

.
.
.
.
.
.
.
.

99
99
103
106
111
115
118
122
126

4
5 Algebra
5.1 Calcolo letterale . . . . . . .
5.2 I polinomi . . . . . . . . . . .
5.3 Risoluzione delle equazioni . .
5.4 Sistemi di equazioni . . . . .
5.5 Disequazioni . . . . . . . . . .
5.6 Numeri complessi . . . . . . .
5.7 Equazioni di grado superiore
5.8 Algebra astratta . . . . . . .

INDICE

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

133
133
136
140
143
147
151
155
158

6 Geometria Euclidea
6.1 Le basi della Geometria . . . . .
6.2 Perpendicolarit`a e parallelismo .
6.3 Congruenza e similitudine . . . .
6.4 La misura delle superfici . . . . .
6.5 Luoghi geometrici . . . . . . . . .
6.6 La geometria della circonferenza
6.7 Poligoni regolari e cerchio . . . .
6.8 Geometria dello spazio . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

163
163
168
172
176
180
183
187
191

7 Le altre Geometrie
7.1 Coordinate Cartesiane . . . . . .
7.2 Lequazione della retta . . . . . .
7.3 La parabola . . . . . . . . . . . .
7.4 Circonferenza, ellisse e iperbole .
7.5 Geometrie non-Euclidee . . . . .
7.6 Geometria descrittiva e proiettiva
7.7 Topologia . . . . . . . . . . . . .
7.8 Gli spazi vettoriali . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

199
199
202
206
208
211
215
215
215

8 Trigonometria e Calcolo
8.1 Le funzioni trigonometriche . . . .
8.2 Le formule di somma e sottrazione
8.3 Risoluzione dei triangoli . . . . . .
8.4 Il concetto di limite . . . . . . . . .
8.5 Logaritmo ed esponenziale . . . . .
8.6 Il calcolo differenziale . . . . . . .
8.7 Lo studio delle funzioni . . . . . .
8.8 Il calcolo integrale . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

217
217
221
225
229
234
238
244
249

.
.
.
.
.
.
.
.

Introduzione
noscenze umanistiche, quali la storia, la filosofia e la
stessa letteratura.
Si pensi, per fare qualche esempio, alla determinazione dellet`a dei reperti archeologici con il metodo del carbonio, allo studio statistico dellevoluzione
di una lingua, ai modelli matematici dellequilibrio
biologico di un determinato ambiente, alle strutture spaziali delle molecole, alle grammatiche formali
per comprendere la struttura di un linguaggio. Oggi,
poi, la diffusione pervasiva degli elaboratori elettronici richiede unimpostazione mentale e un bagaglio di
conoscenze di natura tecnologica e astratta, se non
si vuole rimanere utenti puramente passivi di macchine che inglobano in se, nei loro programmi, conoscenze logiche e matematiche molto profonde. E
se queste macchine ci risparmiano lavoro di routine
e la necessit`a di dover eseguire calcoli tanto numerosi quanto banali, non ci esimono dal conoscere i
loro principi operativi (algoritmi e programmi) pena
una sudditanza, psicologica ed economica, da chi `e in
grado di controllare queste macchine e quindi la parte di mondo, sempre pi`
u grande, che queste macchine
controllano.
Queste ed altre considerazioni ci spingono a tentare
di riunire in un unico testo, di dimensioni abbastanza
ridotte, le conoscenze di cui uno studente dovrebbe
essere padrone alla fine dei suoi studi elementari e
medi, e che quindi costituiscono il bagaglio di nozioni
con cui affrontare gli studi universitari. Da un punto di vista puramente pratico, perci`o, `e qui raccolta
tutta la Matematica che serve per laccesso a un Corso di Laurea di tipo scientifico o tecnologico di una
nostra Universit`a, sia per poter seguire utilmente gli
insegnamenti del primo anno, sia per superare i test
per laccertamento dei debiti formativi in Matematica, attualmente previsti. Questo testo ha lambizione
di poter colmare le eventuali lacune degli studenti che
intendono iscriversi al primo anno di Universit`a.

AVVERTENZA
Queste note devono ancora essere messe a
punto. Lautore `e consapevole del fatto che
esse contengono errori di forma e di sostanza.
I lettori sono invitati a segnalare tutto ci`o che
ritengono scorretto o comunque da modificare, togliere e aggiungere. Di tali segnalazioni
lautore ringrazia anticipatamente.
c R. Sprugnoli, 2002.

1. La conoscenza della Matematica `e diventata


unesigenza fondamentale del mondo moderno, dove
la scienza e la tecnica costituiscono una parte importante della cultura di ciascuna persona, che incontra, ad ogni passo, riferimenti precisi ai concetti
matematici. Intorno al 1600, Galileo aveva puntualizzato linizio del pensiero moderno affermando che
la natura `e un libro scritto in termini matematici, e
pertanto la Matematica `e lo strumento fondamentale
per la conoscenza della natura. Con questo spirito si
`e sviluppata la scienza moderna, che ha fatto della
Matematica un punto di riferimento e un ideale da
perseguire. Ma mentre nel 1700 e nel 1800 la scienza
e la tecnica erano appannaggio di una stretta minoranza di persone, con il 1900 la base si `e enormemente
allargata ed ora, allinizio del terzo millennio, le persone che hanno la necessit`a di usare la Matematica
per il proprio lavoro sono diventate la maggioranza.
Spesso la conoscenza della parte tecnica della Matematica `e limitata alle nozioni che si apprendono alle
scuole elementari e medie, sia inferiori che superiori;
comunque, queste conoscenze formano la base indispensabile per acquisire le tecniche pi`
u evolute che si
insegnano nelle Universit`a. Il sapere matematico `e
un sapere unitario, che non permette frammentazioni, e una lacuna in un qualsiasi settore, laritmetica,
lalgebra o la geometria, costituisce di fatto una mancanza in tutte le altre parti della Matematica. Per
questo la cosiddetta Matematica elementare `e una
base di conoscenza dalla quale `e difficile prescindere
se si vuole avere accesso alle conoscenze del mondo
scientifico e tecnologico, mondo che sempre pi`
u invade anche i campi tradizionalmente riservati alle co-

2. La Matematica non `e solo una serie di nozioni


tecniche che permettono di risolvere problemi pratici, ma `e anche, e soprattutto, un modo di pensare e
un atteggiamento culturale. Per i Greci, che queste
cose le avevano inventate, non cera distinzione tra la
Matematica (la Geometria) e la Filosofia. Talete e
5

6
Pitagora prima, Platone e Aristotele poi videro nella
Matematica la forma perfetta del sapere; solo Socrate
sembra non conformarsi a questa idea, ma sulla porta dingresso dellAccademia platonica stava scritto
Nessuno entri che non conosca la Geometria. Il ragionamento, nella vita di tutti i giorni come nella filosofia pi`
u astratta, segue un modello che `e quello della
Matematica, quello che la Matematica ha portato a
un rigore assoluto.
La necessit`a, il gusto della dimostrazione rigorosa
si apprendono pienamente con la Matematica; questa
d`a anche i limiti di applicabilit`a del metodo deduttivo, che, ad esempio, non pu`o entrare in un regressus ad infinitum, ma deve fondarsi su qualcosa che
diamo per buono e per certo: ed `e proprio la Matematica che ci fa capire come questo qualcosa di fondante abbia un senso o lo acquisti in un sistema di
assiomi che si autosostengono. E anche senza arrivare a queste finezze che confinano con la filosofia,
la Matematica ci d`a la forma mentis necessaria ad
affrontare, in modo rigoroso, tanto lo studio della natura quanto quello delluomo. Per questo motivo ho
voluto inserire in queste pagine la dimostrazione di
tutti i teoremi enunciati: le eccezioni credo si contino
sulle dita di una mano; e ho cercato di essere semplice e chiaro e allo stesso tempo rigoroso. Questo
`e pi`
u di quanto si faccia normalmente nella scuola,
che spesso (secondo me sbagliando) si accontenta di
enunciare risultati da usare per risolvere gli esercizi
ed essere promossi alla classe successiva. Il senso e
lamore del ragionamento vanno cos` a sperdersi e la
Matematica diviene una sequenza di nozioni, da applicare quando necessario, invece di un fatto culturale
che forma la mentalit`a delle persone e fa da riferimento nellaffrontare la realt`a che ci circonda (anche se
mia moglie sostiene che `e meglio cos`!) Analogamente, va coltivato il gusto delle definizioni precise, che
puntualizzano idee e concetti, spesso piuttosto vaghi
nel loro uso quotidiano, e quindi a rischio di diventare ambigui quando si cerchi di portarli alle estreme
conseguenze, procedimento utile tutte le volte che si
voglia criticare un atteggiamento o unimpostazione,
facendo vedere le estreme conseguenze (negative) a
cui potrebbe condurre. E, nello stesso spirito, ho cercato anche di introdurre vari concetti dei fondamenti
della Matematica, attraverso i quali spero di chiarire
cosa si intende per teoria, sia nella Matematica, sia
in qualsiasi altro settore del sapere umano.

INDICE
parte e di Apollonio dallaltra. Indubbiamente, questo fu favorito da una inadeguata rappresentazione
dei numeri e dalla mancanza di unAlgebra formalizzata. Quando per`o, dopo Vi`ete, Fermat e Cartesio,
lAlgebra (nel senso lato che oggi vi farebbe comprendere anche lAnalisi) prese il sopravvento, un tradimento fu perpetrato nei confronti di tutta la Matematica. La Geometria contemplava due metodologie
distinte, anche se utilizzate indifferentemente: la dimostrazione astratta e la costruzione geometrica. Ad
esempio, la prova che gli angoli alla base di un triangolo isoscele sono uguali (Teorema 6.12) `e puramente
astratta e fa riferimento solo a costatazioni di fatto
e a risultati gi`a noti. Il teorema di Pitagora, invece,
nella prova per mezzo del primo teorema di Euclide
(osservazione dopo il Teorema 6.27) fa uso di una costruzione, senza la quale la dimostrazione fallirebbe.
Allorche lAlgebra si impose alla Geometria, questultima tipologia di dimostrazione fu relegata in secondo
piano e, quando possibile, evitata.
La dimostrazione astratta `e, idealmente, atemporale. Si svolge nel tempo, come tutte le faccende umane, ma questo sembra e vuol essere pi`
u un accidente
che una parte intrinseca della prova. Si fanno certe valutazioni che valgono indipendentemente dal
momento in cui le facciamo; usiamo assiomi o teoremi gi`a dimostrati, che vengono prima logicamente,
ma che ci rifiutiamo di considerare veri temporalmente prima del teorema che stiamo dimostrando e che
ne fa uso. In altre parole, un teorema deve valere indipendentemente dal tempo, sia del momento in cui
`e stato dimostrato (il che sembra ovvio), ma anche
a prescindere da azioni che debbono essere eseguite
per dimostrarlo, e questo `e un po meno ovvio. La costruzione geometrica, invece, non pu`o prescindere dal
tempo: prima si fanno certe cose e poi se ne fanno altre, che non si sarebbero potute fare se non avessimo
completato quelle precedenti.

Lidea di una Matematica statica, del pensare che


la Matematica `e quella che `e risulta, proprio nel suo
essere vagamente blasfema, un qualcosa di attraente,
e pi`
u volte `e stata riecheggiata da vari matematici, come il Dio cre`o i numeri e il resto fu fatto dalluomo
di Frege e di Platone. E anche, per`o, una concezione vecchia che fa della Matematica uno strumento di
studio, cio`e di indagine di una natura scritta in caratteri matematici, piuttosto che di una Matematica
volta a operare nel mondo e quindi a provare interessi per i procedimenti e non solo pei teoremi. Daltra

parte, gli antichi avevano gi`a chiara questa differenza


3. Fino al 1600 la Matematica `e stata essenzial- ed `e nota laffermazione di Proclo sulla Geometria,
mente Geometria. Se si escludono Pitagora e i suoi nella quale si distinguono problemi e teoremi; i priseguaci di tutti i tempi, che ritenevano il numero co- mi contengono la generazione delle figure, i secondi
stituire lessenza dellUniverso, tutta la Matematica dimostrano le propriet`a delle figure.
ruotava intorno alla Geometria, di Euclide da una
In effetti, i procedimenti o, come `e pi`
u adeguato

INDICE
oggi dire, gli algoritmi sono da 300 anni relegati al
ruolo secondario di Matematica applicata, considerata spesso uno o pi`
u gradini inferiore alla Matematica Pura. Ad esempio, il metodo di Gauss per
la risoluzione dei sistemi lineari, di natura puramente algoritmica, `e pressoche ignorato nei testi di Matematica e relegato in quelli di Calcolo Numerico.
Ognuno ricorda come lunico algoritmo menzionato
dai programmi della scuola `e quello di Euclide per il
calcolo del massimo comun divisore, ma nessuno lo
impara, perch`e docenti e studenti preferiscono altri
metodi.
Oggi, per`o, laffermarsi dellInformatica ha riportato linteresse per le soluzioni costruttive dei problemi, cio`e per gli algoritmi, che costituiscono proprio la base teorica della programmazione. Gli algoritmi, tuttavia, non sono semplicemente un modo
astratto per arrivare a programmare un elaboratore; essi sono una metodologia per affrontare problemi
di qualsiasi natura e, quindi, per farne uno studio e
darne una soluzione rigorosa, analoga ad un teorema, anche se concettualmente diversa. Gli algoritmi
hanno influenzato anche parte della logica e stanno
prendendo piede in molte parti della Matematica (si
pensi al classico caso delle basi di Groebner). Cos`
le due metodologie antiche della Geometria classica,
quella deduttivo-astratta e quella costruttiva, stanno
avvicinandosi di nuovo. In questo testo ho cercato di
seguire tale linea, anche se il risultato `e a mio parere
ancora molto parziale poiche, con mentalit`a tuttora
vecchia, non riesco ad amalgamarle, e continuo a vedere il teorema come la fase di controllo della verit`a
di un risultato e lalgoritmo come il metodo di risoluzione pratica di un problema, che basa la propria
validit`a su un opportuno teorema.

4. C`e, credo, una differenza fondamentale tra lo


studio delle materie umanistiche e quello delle discipline scientifiche. Lo studio delle prime si svolge,
idealmente, dal particolare al generale, mentre lapprendimento delle seconde passa dal generale al particolare. Se, ad esempio, voglio capire che cos`e lo
Sturm und Drang, `e essenziale che io legga almeno
le opere principali degli autori che si rifanno a quel
movimento letterario. Solo prendendo atto delle somiglianze e delle differenze che esistono tra i vari autori, delle idee e delle emozioni che ciascuno di loro
esprime o cerca di esprimere, mi posso fare unidea
generale di cosa sia lo Sturm und Drang. Spesso `e utile leggere quello che `e stato scritto sullo Sturm und
Drang: un esperto professionista `e capace di mettere in evidenza aspetti che abbiamo appena intuito o
che non abbiamo afferrato nella loro importanza; un
critico geniale pu`o esprimere un punto di vista illuminante o originale. Tutto questo ci aiuta a formarci

unidea personale precisa, cio`e a capire che cosa sia lo


Sturm und Drang. Naturalmente, se leggiamo i commenti al posto delle opere originali, abbreviamo il
percorso, ma invece di idee personali avremo acquisito le idee dei commentatori; questo `e negativo, anche
se talvolta fa parte del gioco.
Al contrario, lo studio delle discipline scientifiche
(che voglio nettamente distinguere dalla scoperta
scientifica, di cui dir`o pi`
u avanti) parte da considerazioni e soluzioni generali di classi di problemi.
Infatti, sarebbe una perdita di tempo enorme cominciare ad esaminare soluzioni particolari di problemi
specifici per poter poi indurre un metodo globale di
soluzione di tutti i problemi della classe considerata. Se si pu`o dimostrare che tutti i problemi di
una certa classe hanno una determinata soluzione, si
studia tale soluzione e poi si verifica se si `e capito
andando ad utilizzare quella soluzione nei problemi
specifici. Questa impostazione vale non solo nel prosaico campo della soluzione pratica dei problemi (la
tecnica), ma anche per lapprendimento dei concetti,
che si cerca di dare sempre nella forma pi`
u generale possibile, discutendo poi come si specializzino in
idee particolari e casi speciali. Di nuovo, diventa un
esercizio utile alla comprensione quello di passare dal
generale allo specifico.
Questo d`a a molti limpressione che la scienza sia
dogmatica e che invece di favorire la formazione delle
idee, inquadri la mente a seguire certe strade preordinate senza sviluppare un apparato critico appropriato. Ci`o, ammettiamolo, pu`o esser vero a un livello
molto basso, ma non credo sia diverso dallo studiare
la letteratura in un manuale di critica, che presenta
le idee dellautore come verit`a apodittiche da imparare pi`
u o meno a memoria. In realt`a, la Matematica,
anche negli aspetti pi`
u tecnici, fornisce sempre metodi alternativi di soluzione, stimola a cercare strade
diverse, invoglia a dimostrare che una soluzione `e migliore di altre, almeno nella situazione considerata.
Di volta in volta, sta allintuito, alla bravura e alle
conoscenze del solutore trovare la strada pi`
u conveniente per affrontare il problema. Proviamo ad esempio a trovare le soluzioni dellequazione x2 x2 = 0:
avete cinque minuti di tempo a disposizione. . . .. Sono passati i cinque minuti; vediamo qual `e stata la
vostra soluzione:
1. avete applicato la formula classica, calcolando il
discriminante = 1 + 8 = 9 e ottenendo x =
2 e x = 1. Bene, conoscete ed apprezzate la
tecnica della Matematica, ma la vostra tendenza
`e quella di prendere le formule come verit`a da
non discutere;
2. visto che i coefficienti sono semplici, avete visto
ad occhio, o dopo un po di riflessione, che x2

INDICE
x 2 = (x + 1)(x 2) e quindi le soluzioni sono
2 e 1. Avete un buon intuito matematico e
fra pi`
u strade possibili sapete scegliere quella pi`
u
appropriata al problema;

ovvio o banale o chiaro `e una conseguenza diretta di


regole o propriet`a che sono state appena citate o che
fanno parte delle basi pi`
u semplici della Matematica,
quelle cio`e che il lettore non deve ignorare. Quindi, se
costui non riesce a capire, `e perche non sta ponendo
3. avete ragionato cos`: x2 x2 = x2 +x2x2 =
attenzione a ci`o che legge oppure ha qualche lacuna,
x(x + 1) 2(x + 1) = (x 2)(x + 1). Altre
che `e opportuno venga rimossa. Purtroppo, c`e anstrade analoghe sono possibili, ma una soluzione
che un uso scorretto dellovviet`a, quando lautore
di questo tipo rivela una notevole predisposizione
vuole nascondere qualche zona dombra del suo lavoper la Matematica;
ro (e questo ha a che fare con letica professionale),
4. non avete nemmeno tentato di risolvere lequa- oppure quando lautore ha preso un abbaglio. Spero,
zione e siete passati a leggere queste conside- in queste note, di non essere caduto in simili scorrazioni: avete un atteggiamento troppo pigro e rettezze, cercando di avvertire quando un punto pu`o
se non lo correggete le materie scientifiche non presentare qualche problema.
fanno per voi.
Ma, ci si pu`o chiedere, non `e forse vero che tutta
E impossibile studiare la Matematica semplicemente leggendo un testo. I libri di divulgazione matematica agiscono contro lapprendimento della Matematica. Possono fornire una serie di concetti, ma
questi rimarranno solo in superficie e, dopo la lettura,
ci si trova spesso al punto di prima. Per studiare la
Matematica occorre leggere, munirsi di carta e penna
(qualcuno preferisce la matita, ma va bene lo stesso)
e svolgere per proprio conto i calcoli e gli esercizi. Se
non si fa cos`, si perde tempo e basta. Lo sforzo personale non pu`o essere sostituito da alcun testo, per
chiaro che possa essere. Studiare seriamente cento
pagine di Matematica equivale a studiare un intero
scaffale di libri di una materia letteraria. Chi cerca
strade pi`
u brevi va incontro a un sicuro fallimento, a
meno che non sia un genio: non si sa mai.
Oggi esistono programmi sullelaboratore, quali
Mathematica e Maple, che riescono a svolgere quasi
tutta la Matematica conosciuta: se avete perso tempo a cercare la soluzione della precedente equazione,
a suo tempo questi programmi vi saranno di enorme utilit`a, ma prima dovrete esservi formate solide
basi. Se non avete nemmeno tentato di risolvere lequazione (caso 4) `e inutile che tentiate di utilizzarli:
nessuna macchina si pu`o sostituire a voi nel capire
e nello svolgere i concetti. O meglio, forse pu`o, ma
allora `e lei che pensa, e non voi. Non `e la stessa cosa.

5. I testi e gli articoli di Matematica sembrano


abbondare di avverbi come ovviamente, chiaramente e di espressioni quali `e banale dimostrare
che, si vede subito che, e cos` via. Poiche anche
in queste note non potremo evitare tali modi di dire,
`e bene si capisca il loro senso, che parrebbe introdurre un aspetto troppo personale (per taluni una cosa
pu`o essere chiara, per altri molto meno) nel mondo
oggettivo della Matematica. In realt`a tali espressioni
hanno un significato abbastanza preciso, e cio`e vogliono significare questo: ci`o che `e dichiarato essere

la Matematica `e conseguenza di una serie ristretta di


assiomi, ai quali vengono applicate regole di deduzione che man mano ci dimostrano tutti i teoremi ai
quali siamo interessati? Nella Sezione ?? parleremo
esplicitamente di questo aspetto, detto metodo assiomatico, e la risposta s` a questa domanda ci dice allora
che tutto nella Matematica dovrebbe essere ovvio e
banale, visto che assiomi e regole di deduzione non
possono [ovviamente] essere ignorati e tutto il resto
`e conseguenza diretta di quelli. Anche se c`e qualcosa di vero in tutto questo, e si pu`o pensare ad una
macchina che, da sola, sviluppasse tutta la Matematica, [s]fortunatamente le cose non stanno proprio cos`.
Vogliamo dare alcune motivazioni di questo fatto:
1) La derivazione meccanica di tutti i settori della
Matematica (a parte le difficolt`a intrinseche, di tempo e di spazio, che comporterebbe) ci darebbe una visione piatta della Matematica stessa. Con questo voglio dire che ogni teorema avrebbe la stessa rilevanza
di tutti gli altri e in effetti non sapremmo quali risultati, fra gli infiniti risultati che avremmo ottenuto, ci
pu`o servire pi`
u degli altri per risolvere un certo problema; anzi, addirittura, non sapremmo come e dove
andare a cercarlo. Questa argomentazione ci mostra
un punto importante della Matematica umana: noi
procediamo per problemi, non per catene deduttive;
per noi certi problemi sono importanti, altri meno.
Noi costruiamo modelli della realt`a e siamo interessati a sviluppare le teorie matematiche che stanno
dietro a tali modelli; procediamo, cio`e, in modo utilitaristico, non nel senso materialista del termine, ma
nel senso che cerchiamo risultati utili alla nostra conoscenza. Quindi operiamo delle scelte e tali scelte
dipendono da noi, non dalla consequenzialit`a della
Matematica. Da questo punto di vista, pi`
u utile sarebbe una macchina alla quale potesse essere dato
lenunciato di un possibile teorema e quella ci dicesse se `e vero oppure no. Questo si riesce a fare in
molti settori ben delineati, ma rimane al momento il
problema di una macchina dimostratrice universale.

INDICE

Forse un giorno verr`a realizzata, ma per ora si stanno risultato e cerca vari mezzi per convencersi che esso
solo sviluppando teorie matematiche su macchine del `e valido. Tali mezzi vanno dal proprio intuito alla
sperimentazione in casi particolari, dalla discussione
genere.
2) Se il precedente `e un criterio di opportunit`a, con i colleghi alla simulazione sul calcolatore, e tanesiste anche un criterio logico per preferire o repu- ti altri marchingegni fra i quali ci pu`o ben stare la
tare necessario un approccio umano alla Matemati- dimostrazione formale. Qualcuno, a questo propoca. Godel ha dimostrato che le nostre formalizzazioni sito, ha sostenuto e sostiene che la formalizzazione
u, e quando una cosa `e vedella Matematica non possono essere complete, inten- matematica `e un sovrappi`
ra
tutti
si
possono
convincere
(a loro modo) che tale
dendo con questo che non ci possono permettere di
essa
`
e
.
Questo
per`
o
`
e
del
tutto
irrazionale e, cosa
dimostrare tutti i risultati veri. In altre parole, la
pi`
u
importante,
io
non
ci
credo.
Riconosco
che ogni
macchina che pur potesse derivare tutta la Matematimatematico
si
possa
convincere
della
validit`
a di un
ca a partire dagli assiomi, non riuscirebbe comunque
teorema
nel
modo
che
crede
pi`
u
opportuno;
il fatto,
ad arrivare a dimostrare tutte le verit`a della Mateper`
o
,
`
e
che
non
deve
crederci
lui
solo,
specie
se `e un
matica stessa. Alcune di esse (in realt`a, infinite) ririsultato
al
quale
`
e
arrivato
per
primo,
ma
deve
conmarrebbero fuori. Non sappiamo se luomo sarebbe
vincere
anche
gli
altri
che
le
cose
stanno
come
lui
crecapace di fare di meglio, ne sappiamo se sia gi`a riude.
Ecco
allora
che
la
dimostrazione
diviene
il
mezzo
scito a fare qualcosa di pi`
u, ma naturalmente vale la
pena di tentare, anzi sarebbe eticamente scorretto se comunicativo per eccellenza, nella Matematica come
in tutta la scienza, poiche `e in grado di darci ragioni
non lo tentassimo.
obiettive, o anche semplicemente intersoggettive (per
3) Esiste, infine, anche un criterio estetico. Ogni chi non crede alluniversalit`a della scienza) per essere
teorema ha pi`
u dimostrazioni; la macchina che ab- convinti che una certa affermazione `e vera. Questo `e
biamo ipotizzato genererebbe tutte le prove possibili, il ruolo semantico fondamentale della dimostrazione
rendendo ancora pi`
u difficile il nostro eventuale lavoro matematica e la giustificazione dellesistenza dei libri
di ricerca dei teoremi interessanti, che apparirebbero, di Matematica nella forma che essi hanno. E questa
con tutti gli altri, innumerevoli volte. In effetti, ogni credenza, assieme al citato aspetto estetico delle didimostrazione umana ha un proprio carattere (se si mostrazioni, che creano ci`o che abbiamo chiamato il
preferisce, non ho obiezioni ad affermare che siamo gusto della dimostrazione, non acquisendo il quale
noi a darglielo), e alcune ci appaiono ovvie e scon- penso che si perda molto del fascino della Matematate nel senso detto, altre sono interessanti o geniali tica. Essa allora diviene semplice strumento tecnico,
per limpostazione adottata o il metodo utilizzato, al- semmai difficile da usare, e/o fonte di curiosit`a, meno
tre ancora rivelano connessioni inusitate con aspetti vicine alla scienza che allenigmistica (disciplina che
diversi, che semmai nulla hanno a che fare con largo- personalmente non disprezzo affatto).
mento trattato. Queste due ultime categorie sono le
dimostrazioni che preferiamo, sono quelle che danno

soddisfazione e meritano alla Matematica lappellativo di Arte. Il Mathematical Intelligencer, una rivista
6. Concludo questa non breve introduzione con alscientifica, nel 1998 ha indetto una specie di votazione cune osservazioni su come `e stata scritta questa serie
per le pi`
u belle dimostrazioni della storia della Mate- di appunti di Matematica, che naturalmente risenmatica. Ha vinto la prova di Eulero per ei = 1 (un tono del mio modo di vedere la materia, le mie varie
risultato che purtroppo trascende lambito di queste idiosincrasie e i pallini che ho acquisito con la frequennote). Questo mostra come laspetto estetico (une- tazione della materia del mio lavoro, e cio`e lInformastetica un po sui generis, se si vuole) abbia un ruolo tica. Va da se che non mi permetterei mai di scrivere
non indifferente nellarido mondo della Matematica. un libro sulla Matematica seria, dove i colleghi maQueste considerazioni si legano a un altro aspetto
che amo mettere in rilievo, e cio`e la differenza tra
un libro di Matematica e la soluzione matematica dei
problemi. Qui intendo per problema una qualsiasi
questione di Matematica, dallesercizio didattico ai
grandi temi della ricerca matematica (daltra parte,
per chi affronta per la prima volta un esercizio, esso
`e un tema di ricerca, lunica differenza essendo che
esso `e gi`a stato risolto da qualcuno). La scoperta
matematica non avviene mai (o quasi mai) nel modo
razionale in cui si espongono i risultati; piuttosto, il
matematico intuisce, o immagina, o si figura un certo

tematici sono ben pi`


u esperti e bravi di me: io mi
posso limitare a scrivere delle semplici note su quelle
parti della Matematica che tutti (e quindi, anche io)
dovrebbero sapere.
Note: Ho inserito nel testo un bel po di note che,
spero, non siano del tutto peregrine. La loro natura `e
piuttosto varia: alcune sono note di approfondimento
del materiale esposto nella sezione; altre sono considerazioni di carattere storico; alcune sono curiosit`a o
divagazioni sul tema; altre infine sono anticipazioni
o rimandi che non potevano essere inserite nel testo
vero e proprio. Questo dovrebbe essere intelligibile

10

INDICE

anche senza le note; in altre parole, se un lettore tra- per verificare i risultati dei programmi realizzati.
lascia (ad esempio ad una prima lettura, ammesso che
voglia leggere queste cose due volte) le note, dovrebbe riuscire a seguire tutti gli argomenti senza perdere
nulla di essenziale alla comprensione. Spero che le
note (questo `e almeno il compito che io intendo loro
affidare) soddisfino qualche curiosit`a e, soprattutto,
ne sollevino molte altre, invogliando cos` il lettore a
proseguire questi studi, per i quali potr`a utilmente
ricorrere a testi universitari specifici, che incontrer`a
andando avanti negli studi.
Punto decimale: La virgola che separa la parte
intera di un numero dalla sua parte decimale costituisce una mia piccola idiosincrasia. Di fronte alla
scrittura (5, 32) `e spesso difficile rendersi conto (specie nello stampato, quando gli spazi sono ridotti al
minimo indispensabile) se siamo di fronte al numero decimale cinque virgola trentadue o alla coppia di
numeri interi 5 e 32. Per questo, preferisco alla virgola il punto decimale della notazione anglosassone,
della quale ovviamente rifiuto luso della virgola per
indicare i raggruppamenti in migliaia, milioni, etc.:
a questo scopo user`o un punto situato in alto. Pertanto, senza ambiguit`a, scrivere (51, 328) indicher`a
la coppia di numeri 51 e 328; scrivere (51.328) vorr`a
significare il numero decimale 51 punto 328; scrivere
infine (51. 328) denoter`a il numero intero cinquantuno
mila trecentoventotto.
Esercizi: Come ho avuto modo di affermare, lo
studio della Matematica si deve fare con carte e penna
o matita, e soprattutto si devono risolvere problemi,
poiche solo la pratica ci rende familiari con i metodi
di risoluzione che la Matematica ci fornisce. Questo
testo `e privo di esercizi, e ci`o `e una grave lacuna. E
mia intenzione rimediare con un testo di esercizi, in
parte anche svolti. Per`o, siccome ho le mie idee su
come impostare un tale testo, per il momento la cosa
`e ancora in fieri e non so immaginare quando potr`a
essere realizzato. In queste note, spesso suggerisco di
scrivere programmi sullelaboratore che realizzano o
simulano certi risultati: poiche naturalmente penso
ai futuri studenti di Informatica, questi sono esercizi
pressoche indispensabili. Visto che oggi lInformatica
ha pervaso un po tutte le materie, gli stessi esercizi
penso possano essere utili anche agli altri, che avranno cos` occasione per imparare un po di programmazione. Il linguaggio da usare `e indifferente: il Pascal
va tanto bene quanto il C; oggi il C++ e il Java sono pi`
ua
` la page ed introducono alla programmazione
ad oggetti. Chi mai avesse a disposizione il Maple o
Mathematica, pu`o utilizzarli come linguaggi di programmazione a tutti gli effetti, anche se tanti degli
esercizi sono gi`a funzioni predefinite in tali linguaggi;
il trucco sta nel programmare ignorando (o facendo
finta di ignorare) tali funzioni e, semmai, utilizzarle

Capitolo 1

Il linguaggio della Matematica


fra di essi senza averne una coscienza esplicita. Cos`
diciamo che tutti gli uomini hanno un naso, aggregando in ununica classe tutte le persone (passate, presenti e future), e allo stesso tempo separando
quella che `e una semplice parte di una persona, cio`e
il naso.

Se lipotiposi del sentimento personale prostergando i prolegomeni della subcoscienza fosse capace di reintegrare il proprio soggettivismo alla
genesi delle concomitanze, allora io rappresenterei lautoprasi della sintomatica contemporanea che non sarebbe altro che la trasmificazione
esopolomaniaca. Che bel talento, eh? Ma io
non ci tengo ne ci tesi mai . . .
E. Petrolini Gastone

1.1

Gli insiemi

La Matematica costituisce un vero e proprio linguaggio. Esso serve per esprimere proposizioni che riguardano quantit`a o relazioni. La forma pi`
u elementare
di quantit`a `e il numero e la forma pi`
u elementare di
relazione `e il confronto tra numeri. I numeri hanno
avuto origine con il contare e al contare `e collegato
anche il confronto, per cui il numero cinque `e inferiore
al sette perche contando si arriva prima al cinque che
al sette. Altre quantit`a, come la lunghezza o il peso,
sono state acquisite dalluomo molto presto e con esse
`e nato il concetto di misura. Il confronto fra numeri
`e stato poi generalizzato al concetto di relazione tra
quantt`a diverse: in questo modo sono state definite
relazioni come quella che lega laltezza del sole al passare del tempo, o quella che vogliamo instaurare tra
il peso o la lunghezza di un oggetto e il suo costo.
Prima di parlare di numero, occorre che ci intendiamo su cosa vogliamo e possiamo contare. La nostra
mente concepisce la realt`a secondo due metodi apparentemente contrapposti. Il primo tende a comporre
vari oggetti in una entit`a unica, come quando pensiamo al salotto come allaggregazione tra una stanza,
mobili quali divano, poltrone e tavoli, e suppellettili quali quadri, soprammobili, ecc. Il secondo tende
a scomporre un individuo in varie parti, ad esempio
quando pensiamo a una persona come composta di
una testa, un tronco, due braccia e due gambe. Questi due modi di vedere la realt`a, detti rispettivamente
aggregazione e separazione, non sono nettamente distinti luno dallaltro e noi ci muoviamo mentalmente
11

Per intenderci, ogni volta che saremo di fronte a


processi di aggregazione o di separazione, distingueremo tra un individuo, considerato come un tutto
unico e che chiameremo insieme, dalle parti in cui lo
immaginiamo separato, che diremo elementi. In tal
modo, vedremo il salotto come un insieme composto
dagli elementi stanza, divano, ecc., e gli elementi testa, tronco e via di seguito come costituenti
linsieme persona. Gli insiemi e gli elementi sono
i primi concetti che si incontrano nella Matematica.
Volendo astrarre dalla loro natura specifica, useremo una notazione neutra, accettata ormai in tutte
le parti della Matematica. Gli elementi si denotano
con le prime lettere minuscole dellalfabeto latino e
gli insiemi con le lettere maiuscole. Per dire che un
insieme A `e composto dagli elementi a, b, c, d, si scrive
A = {a, b, c, d}, dove le parentesi graffe corrispondono
a ci`o che abbiamo chiamato aggregazione e le virgole
alla separazione. Lellissi . . . serve a denotare elementi che non si vogliono o non si possono specificare,
come quando scriveremo A = {a, b, c, . . . , z}.

Naturalmente, le convenzioni notazionali appena


date hanno senso per insiemi generici; per insiemi
specifici potremo adottare notazioni specifiche, disturbando lettere speciali, in grassetto o in gotico
o dallalfabeto greco, e simboli con significato particolare. Ad esempio, linsieme dei numeri naturali,
quelli con i quali contiamo (lo zero compreso), sar`a
indicato con N = {0, 1, 2, 3, . . .}, dove lellissi, questa volta, indica che non vogliamo scrivere i restanti
elementi (perche li conosciamo) e che non possiamo
riportarli tutti, in quanto non sono in numero finito.
I simboli 0, 1, 2, 3, etc. hanno un significato convenzionale, accettato quasi universalmente: nei testi
scritti in cirillico, arabo, cinese o giapponese, i numeri sono ormai scritti con le nostre dieci cifre arabiche,

12

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

da sinistra verso destra.

Per indicare il fatto che un certo elemento a appartiene ad un insieme A, si scrive a A e si dice
simbolo di appartenenza; la sua negazione `e a 6 A.
Se P `e linsieme dei numeri pari, 10 P e 15 6 P.
AB
AB
Siano A e B due insiemi tali che ogni elemento di B
sia anche elemento di A: si dice che B `e un sottoinsieA
B
A
B
me di A e si scrive B A; se poi A contiene almeno
un elemento che non sta in B, allora B `e un sottoinsieme proprio di A e si scrive B A. Ad esempio,
P N, dato che ogni numero pari `e un numero, ma
esistono numeri che non sono pari. Due insiemi A e
A\B
AB
B sono uguali, e si scrive A = B, se ogni elemento
di A `e anche elemento di B e, viceversa, ogni elemento di B `e anche elemento di A. In altre parole,
Figura 1.1: Diagramma di Venn
A = B significa che A B e, contemporaneamente,
B A. Spesse volte, per dimostrare che due insiemi
sono uguali, si applica questa osservazione, provando
che ogni elemento del primo appartiene al secondo, e legge tale che. Le seguenti tre operazioni tra insiemi ricorrono con estrema frequenza in tutte le parti
viceversa.
della Matematica:
E bene rendersi conto perfettamente della differenza fra il concetto di appartenenza e quello di conte Unione: lunione di due insiemi A e B si scrive
nuto: il primo mette in relazione un elemento con
A B ed `e linsieme composto dagli elementi che
un insieme, il secondo mette in relazione due insiemi.
stanno in A, stanno in B oppure stanno in tutti
Si sia certi di capire il seguente esempio: dato line due gli insiemi;
sieme A = {a, b, c, d}, si consideri lelemento b A e
si definisca B = {b}. In altre parole, B `e linsieme
Intersezione: lintersezione di due insiemi A e B
composto dal solo elemento b. Come insieme, si ha
si scrive A B ed `e linsieme degli elementi che
B A, ma non hanno senso nessuna delle scritture
stanno contemporaneamente in A e in B;
b A e B A. Infine, ricordiamo che se B A
(B A), si pu`o scrivere in modo equivalente A B
Differenza: la differenza tra due insiemi A e B
(A B), che si legge A contiene (propriamente) B
si scrive A\B ed `e linsieme degli elementi che
e si dice che A `e un soprainsieme di B.
stanno in A, ma non appartengono a B.
Un insieme privo di elementi, come linsieme degli unicorni si dice un insieme vuoto. Se pensiamo
allinsieme dei triangoli con quattro lati, ci rendiamo conto che di insiemi vuoti ne esiste uno solo, quello privo di qualsiasi elemento. Linsieme vuoto si indica con . Si considera che linsieme vuoto sia contenuto in (sia un sottoinsieme di) ogni altro insieme, e
quindi sia un sottoinsieme improprio di se stesso. Per
completezza, ricordiamo che un insieme pu`o essere
definito elencando tutti i suoi elementi, come quando
poniamo A = {1, 2, 3, 4, 6, 12}, e si dice che linsieme
`e definito per estensione. Alternativamente, possiamo definire un insieme come composto di tutti e soli
gli elementi che soddisfano una certa propriet`a; ad
esempio, possiamo porre B = {divisori di 12}, dove
le parentesi graffe si leggono ancora linsieme dei;
in questo caso A = B, ma si dice che B `e definito per
intensione (attenzione, questa parola si scrive con la
lettera s!). In modo pi`
u formale, si dovrebbe scrivere B = {x | x divide 12} e si legge linsieme degli
elementi x tali che x divide 12. Si osservi che x `e
una variabile di comodo e che la barra verticale si

Due insiemi A e B si dicono disgiunti se la loro intersezione `e linsieme vuoto, cio`e AB = . Lunione
disgiunta degli insiemi A, B si denota A B, e corrisponde allunione di A e di B quando questi siano
disgiunti, o siano stati resi tali marcando in modo
diverso i loro elementi cos` da renderli distinguibili.
Infine, la differenza simmetrica fra i due insiemi A, B
`e definita dalla relazione: AB = (A \ B) (B \ A).
Le operazioni tra insiemi si intuiscono facilmente
se ci aiutiamo graficamente con i ben noti diagrammi di Venn: in tali diagrammi un insieme `e rappresentato dai punti di un cerchio e quindi, disponendo
opportunamente due o pi`
u cerchi, si pu`o visualizzare
leffetto di una qualsiasi operazione tra insiemi. Nella Figura 1.1 abbiamo evidenziato in grigio le quattro
operazioni introdotte.
I diagrammi di Venn permettono anche di dare
una prova grafica alle propriet`a delle operazioni; ad
esempio, si vede immediatamente che:
AB = (A B) \ (A B),

1.1. GLI INSIEMI

13

come daltra parte si scopre facilmente la propriet`a lintersezione. Le propriet`a di idempotenza, ugualdistributiva dellunione rispetto allintersezione:
mente, non hanno corrispondenza nei numeri, ma ci
dicono che, al contrario di questi, operando con un
A (B C) = (A B) (A C).
solo insieme non possiamo ottenere molto di pi`
u. Le
regole che coinvolgono il complemento ci informano
A
B
A
B
che questo ha qualcosa delle propriet`a dellopposto o
dellinverso nei numeri, cio`e loperazione che da 4 ci
porta a 4 (opposto) oppure a 1/4 (inverso). Prima di tutto, lopposto dellopposto ci d`a il numero
di partenza, come ce lo d`a linverso dellinverso: cos`
agisce anche il complemento. Lanalogia esiste anche
C
C
con le regole a + (a) = 0 e a (1/a) = 1, ma qui,
anche identificando 0 con e 1 con U , le regole sono
A (B C)
(A B) (A C)
pi`
u stringenti, ed `e come avessimo a (a) = 1 e
a + (1/a) = 0, il che ben sappiamo non essere vero.
Infine, in P(U ) valgono le celebri regole di De MorIn modo analogo il lettore `e invitato a dimostra- gan); costui era un matematico inglese della prima
re la propriet`a distributiva dellintersezione rispetto met`a del 1800, che anticip`o alcune idee di Boole sulla
allunione, cio`e:
logica formale; insegn`o ad Ada Byron, la figlia del
poeta, che fu cos` brava da aiutare Charles BabbaA (B C) = (A B) (A C).
ge nelluso della Macchina Analitica, tanto da essere
considerata la prima programmatrice della storia (cirSpesso, si fissa un particolare insieme U , detto inca 1840). Le regole di De Morgan legano tra di loro
sieme universo, e si considerano tutti i suoi sottoinsietutte e tre le operazioni definite su P(U ); possono esmi, che costituiscono il cosiddetto insieme delle parti
sere facilmente verificate con luso dei diagrammi di
di U e si denota con P(U ). Chiaramente, U P(U )
Venn, ma invitiamo il lettore a riflettere un po sul
e P(U ), e per ogni A U si definisce il comloro significato per cercare di capirlo senza laiuto di
plemento di A (in U ) come la differenza A = U \ A;
un disegno. Le regole non sono banali e pu`o essere
ovviamente, U = e = U : in generale A = A. Le un esercizio utile quello di raffigurarci mentalmente
tre operazioni di unione, intersezione e complemento, il loro senso.
definite in P(U ), godono di una serie di propriet`a,
che elenchiamo nella Tabella 1.1: esse si dicono proNota 1.1
Quella che abbiamo considerato `e
priet`
a dellAlgebra Booleana e le ritroveremo anche
unimpostazione intuitiva della teoria degli insiemi.
pi`
u avanti. Il lettore `e invitato a dimostrare queste
Dopo la sua introduzione da parte di Boole, Frege e
propriet`a con il metodo dei diagrammi di Venn.
Cantor, il concetto di insieme venne variamente criticato e ci si accorse presto che tutta la teoria non poPossiamo dire due parole su questo elenco di regole.
teva essere lasciata allintuizione, ma doveva rientrare
Esse assomigliano, ma non coincidono, con le regole
nei canoni di un formalismo che, proprio in quelledelle operazioni numeriche, che tutti conosciamo. Ad
poca, si stava affermando e che, in un qualche moesempio, la propriet`a commutativa `e la stessa, mendo abbastanza miserevole, cercheremo di esporre nelle
tre la propriet`a distributiva sembra pi`
u ampia e vaprossime sezioni. Uno dei colpi di maglio che furono
le tanto per lunione rispetto allintersezione, quanto
sferrati contro limpostazione intuitiva della teoria denel caso opposto; per i numeri, possiamo distribuigli insiemi `e certamente il paradosso di Russell, che il
re il prodotto rispetto alla somma, ma non vicevermatematico e logico inglese propose nel 1902. Ecco cosa. Questa analogia ha portato, specie allinizio della
me ragion`
o Russell. Il concetto di insieme sembra postoria della teoria degli insiemi, a parlare dellunione
ter schematizzare quella capacit`
a di aggregazione che
la mente umana possiede e sulla quale si basa parte
come della somma tra insiemi e dellintersezione
della nostra conoscenza. Quindi possiamo aggregacome del prodotto. In effetti, se A e B sono due
re oggetti in insiemi, ma anche insiemi in insiemi di
insiemi disgiunti, rispettivamente con m ed n elemeninsiemi, e cos` via, allinfinito. Possiamo addirittura
ti, la loro unione A B = A B contiene esattamente
pensare allinsieme G di tutti gli insiemi. Questo inm + n elementi. Tuttavia, lanalogia finisce qui, dato
sieme globale gode di una strana propriet`
a: esso deve
che A B = e, in generale, A B ha meno elementi
contenere se stesso come elemento, in quanto contiedel solo A o del solo B.
ne tutti gli insiemi. Generalmente, un insieme non
Caratteristica degli insiemi `e la propriet`a di assorcontiene se stesso come elemento, ma G non `e certo
bimento: A B `e contenuto in A, per cui, se poi aglunico insieme con tale propriet`
a. Ad esempio, Lingiungiamo tutto A, quello che otteniamo `e proprio A;
sieme di tutti gli insiemi che possono essere definiti
con meno di venti parole italiane, `e un insieme deficos` A B contiene A, e quindi ritorniamo ad A dopo

14

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA


commutativa
associativa
distributiva
assorbimento
idempotenza
complemento
identit`a
zero
doppia negazione
de Morgan

AB =BA
AB =BA
A (B C) = (A B) C
A (B C) = (A B) C
A (B C) = (A B) (A C) A (B C) = (A B) (A C)
A (B A) = A
A (B A) = A
AA=A
AA=A
AA=
AA=U
A=A
AU =A
AU =U
A=
A=A
AB =AB
AB =AB
Tabella 1.1: Le regole dellAlgebra Booleana

nito per intensione che contiene se stesso, proprio per


come labbiamo definito. Allora, gli insiemi si suddividono in due grandi classi: linsieme P degli insiemi che
contengono se stessi, e linsieme N di tutti gli altri. Ci
chiediamo (cio`e, si chiese Russell): linsieme N dove si
trova, in P o in N ? Se N stesse in N , sarebbe allora
un elemento di se stesso, ma ci`
o contraddice la sua
definizione. Supponiamo allora che N stia in P ; ma
per definizione di P , N dovrebbe contenere se stesso,
e siamo di nuovo in contraddizione. Non ci sono per`
o
altre possibilit`
a, e siamo giunto a un paradosso.
Lo stesso Russell, con Whitehead, sviluppo`
o una
teoria assiomatica degli insiemi che permettesse di
evitare questo ed altri paradossi. Unaltra importante
assiomatizzazione `e dovuta a Fraenkel e Zermelo.
Ma noi, detto questo, ci dobbiamo arrestare. Avvertiamo solo che queste teorie rendono conto del
concetto di numero cardinale (che vedremo) e di
numero ordinale, che invece non vedremo. Questi
ultimi numeri vogliono generalizzare allinfinito
la categoria grammaticale di primo, secondo, terzo,
etc.; naturalmente, le cose si complicano e ce ne
possiamo rendere facilmente conto pensando di
scrivere linsieme (ordinato) dei numeri naturali,
seguito da unaltra serie di numeri naturali. In questo
insieme, qual `e il numero dordine del secondo 1?

1.2

Le relazioni

Gli insiemi, anche con la distinzione tra il tutto e i


singoli elementi, non esauriscono il nostro modo di
concepire il mondo; un altro aspetto essenziale `e dato dalle relazioni reciproche tra gli insiemi e tra gli
elementi. A ben guardare, tra questi oggetti abbiamo gi`a introdotto almeno due relazioni: quella di appartenenza, che associa elementi ed insiemi, e quella
di contenuto, che invece mette in relazione insiemi con insiemi. Se poi allarghiamo il nostro campo
visuale a tutta la Matematica, vediamo che fra i numeri esistono le relazioni di uguaglianza, di minoranza, di maggioranza, di divisibilit`a e tante altre. Nella
Geometria abbiamo la congruenza, la similitudine e

lequivalenza tra figure. E se passiamo al mondo che


ci circonda, ci rendiamo conto che di fatto viviamo in
un universo di relazioni tra persone, fra gruppi, fra
nazioni, fra oggetti, e cos` via. La parentela e lamicizia tra persone, lalleanza e il confinamento tra
stati, lesser sopra, sotto, dentro o fuori tra oggetti,
sono relazioni con le quali abbiamo a che fare in ogni
istante.
Volendo formalizzare, almeno un po, la nostra idea
di relazione, possiamo cominciare restringendo il
nostro interesse alle cosiddette relazioni binarie, quelle che cio`e coinvolgono solo due insiemi di elementi o,
se si vuole, mettono in connessione due soli elementi, che possono far parte o meno dello stesso insieme.
Ad esempio, spesso si parla di gruppi di amici, intendendo che la relazione coinvolga pi`
u persone contemporaneamente; tuttavia, in questo caso, `e facile
immaginare che lamicizia di gruppo sia il risultato
di una serie di amicizie tra coppie di persone, e di tre
amici A, B, C si possa dire che formano un gruppo di
amici se A `e amico di B, B di C e C di A. Talvolta
questa riduzione `e pi`
u difficile, ma immaginiamo che
la si possa fare, oppure immaginiamo di non interessarci ad altri tipi di relazione. Una relazione binaria
pu`o essere data in due maniere diverse:
1. elencando puntigliosamente tutte le coppie di
elementi che sono in relazione, cio`e dando una
definizione per estensione. La relazione di amicizia tra persone o di alleanza tra stati non pu`o
essere data che in questo modo;
2. dando una regola che permetta di stabilire, senza
ambiguit`a, quando due elementi sono in relazione. Due stati sono confinanti se hanno un tratto
di confine in comune, a prescindere da qualsiasi
elencazione. Siamo di fronte a una definizione
per intensione.
Lelencazione, con un po di buona volont`a, pu`o essere assimilata a una regola, o legge, e quindi spesso
si dice che una relazione `e data da una legge che permette di associare gli elementi in relazione tra di loro,

15

1.2. LE RELAZIONI
e quindi ci fornisce anche un criterio per dire quando
due elementi non sono in relazione. Intuitivamente,
avere un criterio per definire una relazione sembra
essere il modo pi`
u naturale di impostare il problema, e sar`a questo metodo intensionale che seguiremo
nella presente sezione per esporre i principali tipi di
relazione che si trovano nella Matematica. Tuttavia,
prima di far questo, vogliamo ricordare la definizione
matematica di relazione, che invece fa riferimento allidea di estensione. Se A e B sono due insiemi (fra i
quali vogliamo definire una relazione), si chiama prodotto cartesiano di A e B, e si indica con A B,
linsieme di tutte le coppie ordinate (a, b) dove a A
e b B. Ad esempio, se A `e linsieme di due elementi
A = {maglia, camicia} e B `e linsieme di tre elementi
B = {bianca, azzurra, fantasia}, il prodotto A B `e
costituito dalle sei coppie:
(maglia, bianca)
(camicia, bianca)
(maglia, azzurra) (camicia, azzurra)
(maglia, fantasia) (camicia, fantasia).
E bene distinguere chiaramente il concetto di coppia
(ordinata) da quello di insieme di due elementi: la
coppia (a, b) `e diversa dalla coppia (b, a), anche se a
e b appartengono allo stesso insieme; infatti, lordine
degli elementi `e essenziale. Viceversa, i due insiemi
{a, b} e {b, a} sono lo stesso insieme, composto dai
due elementi a e b, indipendentemente dallordine con
cui essi sono scritti.
Il nome di prodotto cartesiano deriva dalla Geometria Analitica, dove il piano cartesiano `e costituito
da tutte le possibili coppie di numeri reali, e quindi `e
proprio R R. E facile vedere che se A e B sono due
insiemi che contengono, rispettivamente, m ed n elementi, il loro prodotto cartesiano AB contiene proprio mn coppie distinte, il che, se si vuole, giustifica
il nome di prodotto per questa operazione.
Accettato questo concetto, che associa gli elementi
di A con quelli di B in tutti i modi possibili, la definizione di relazione `e semplice: si dice relazione o
corrispondenza tra A e B un qualsiasi sottoinsieme
del prodotto cartesiano A B. Il sottoinsieme determina le coppie di elementi in relazione tra di loro; le
coppie che non appartengono al sottoinsieme, quindi,
sono formate da elementi che non sono in relazione
tra di loro. Lesempio precedente pu`o essere illuminante: il mio guardaroba di maglie e camicie `e una
relazione che lega questi oggetti a possibili colorazioni: la relazione `e data dal fatto che tali oggetti sono
miei e non di qualcun altro (il guardaroba di unaltra persona costituir`a unaltra relazione). Se ho due
maglie, una bianca e una azzurra, e due camicie, una
bianca e una fantasia tipo hawaiano, si vede immediatamente come il mio guardaroba sia un sottoinsieme
di A B.

Nota 1.2

Aver insistito sulle relazioni binarie, `e


solo una semplificazione espositiva. Il prodotto cartesiano pu`
o essere esteso a un numero qualsiasi di insiemi: A1 A2 An `e linsieme delle n-uple
ordinate (a1 , a2 , . . . , an ) composte con a1 A1 , a2
A2 , . . . , an An . Come per le coppie, anche per le terne, le quadruple, . . ., le n-uple lordine degli elementi
`e essenziale, e ci`
o distingue queste entit`
a dagli insiemi
di 3, 4, . . . , n elementi. Quando i vari insiemi sono di
fatto lo stesso insieme A, si scrive A3 per A A A, e
via di seguito. Una relazione o corrispondenza n-aria
fra gli insiemi A1 , A2 , . . . , An `e un sottoinsieme D del
prodotto cartesiano A1 A2 An e gli elementi
a1 , a2 , . . . , an si dicono in relazione o in corrispondenza tra di loro se la n-upla ordinata da loro composta
appartiene a D.
Le relazioni cos` definite sono un concetto veramente
basilare del nostro modo di concepire il mondo che
ci circonda, tanto `e vero che oggi costituiscono le
strutture di riferimento per la modellazione della
realt`
a operata, in Informatica, dalle Basi di Dati.
Quando si vogliono gestire le informazioni di unAzienda, si costruisce la base di dati che rappresenta
il Sistema Informativo Aziendale. Tale base di dati
non `e altro che linsieme delle relazioni che legano
tra di loro le informazioni di tutta lazienda (Modello
Relazionale). Ad esempio, semplificando al massimo,
una delle relazioni pu`
o essere un sottoinsieme R del
prodotto N C D Q S, dove N `e linsieme
dei nomi propri, C quello dei cognomi, D quello delle
date di nascita, Q quello delle qualifiche e S quello
degli stipendi annuali. La quintupla (Luigi, Rossi,
04/12/1975, D8, 32000), se appartiene ad R significa
che il Sig. Luigi Rossi, nato il 4 Dicembre del 1975, ha
la qualifica D8 (qualunque cosa ci`
o voglia significare)
e guadagna 32 mila e allanno. E interessante
osservare come le relazioni, che costituiscono la base
dei dati, e le associazioni fra le relazioni (cio`e, le
relazioni tra relazioni) permettano una modellazione operazionale di realt`
a complesse come quelle di
aziende private e enti pubblici di qualsiasi dimensione.

Alcune relazioni hanno un ruolo molto importante nella Matematica; citiamo le relazioni di equivalenza e di ordine tra elementi dello stesso insieme,
e le funzioni tra elementi di insiemi (spesso) diversi.
Su queste relazioni vogliamo ora entrare in maggiori
dettagli. Luguaglianza (tra numeri, tra figure o tra
oggetti qualsiasi, non ha importanza) `e una relazione
che tutti conosciamo; essa fa parte di un gruppo di relazioni caratterizzate da alcune propriet`a e che `e noto
col nome di relazioni di equivalenza. Formalmente,
una relazione di equivalenza `e una relazione tra gli
elementi dello stesso insieme A (e, quindi, `e un sottoinsieme di coppie appartenenti ad A A = A2 ) che
gode delle seguenti propriet`a:
1. propriet`
a riflessiva: ogni elemento a A `e in
relazione con se stesso;

16

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

2. propriet`
a simmetrica: se un elemento a A `e in
relazione con un elemento b A, allora anche b
`e in relazione con a;
3. propriet`
a transitiva: se un elemento a A `e in
relazione con b A e questo, a sua volta, `e in
relazione con c A, allora anche a `e in relazione
con c.
La prima propriet`a sembra ovvia, ma non lo `e poi
tanto, visto che molte relazioni come a `e diverso
da b non ne godono affatto. Luguaglianza, la congruenza, la similitudine e lequiscomponibilit`a tra figure sono relazioni di equivalenza. Un esempio meno
ovvio lo si ha considerando le espressioni aritmetiche
(ad esempio, formate da numeri e le operazioni di
somma e sottrazione, come si studiano in IV elementare) e dire che sono equivalenti se e solo se hanno
lo stesso valore. Ogni espressione `e equivalente a se
stessa; se 2 + 3 = 1 + 4 allora 1 + 4 = 2 + 3 e, infine,
se `e anche 1 + 4 = 7 2, allora 2 + 3 = 7 2.
Nota 1.3

Sia definita su A una relazione che goda delle propriet`


a simmetrica e transitiva. Se a, b A
sono due elementi in relazione tra di loro, cio`e a `e in
relazione con b, per la propriet`
a simmetrica `e anche
b in relazione con a. Per la propriet`
a transitiva,
applicata a questi due casi, si ha che a `e in relazione
con se stesso. Deve allora valere la propriet`
a riflessiva.
Ci possiamo chiedere: se, come sembra da questo
ragionamento, la propriet`
a riflessiva consegue dalle
altre due, perche labbiamo inserita esplicitamente
nella definizione? In realt`
a il ragionamento vale solo
se a `e in relazione con almeno un altro elemento,
diverso da lui o no. Ma se nellinsieme esiste un
elemento che non `e in relazione con nessun altro
elemento (nemmeno se stesso) largomento viene a
cadere e la propriet`e riflessiva non vale pi`
u nella
globalit`
a dellinsieme.

Avere una relazione di equivalenza R su un insieme


A `e la stessa cosa che avere una suddivisione di A in
tanti sottoinsiemi che sono a due a due disgiunti tra di
loro; `e cio`e come se linsieme A fosse tagliato a fette.
Infatti, se a A, indichiamo con Ea la classe di tutti
gli elementi di A che sono in relazione con a; spesso,
in modo suggestivo, si usa la notazione [a] per Ea , che
mette bene in evidenza il ruolo di a. Comunque, se Eb
`e la classe di equivalenza di un altro elemento b A,
abbiamo Ea = Eb oppure Ea Eb = . Infatti, se a
`e in relazione con b, ogni elemento c equivalente ad
a `e anche equivalente a b per la propriet`a transitiva,
e viceversa, per cui Ea = Eb . Se invece b non `e
in relazione con a, nessun elemento c pu`o essere in
relazione tanto con a quanto con b, perche altrimenti
a e b sarebbero in relazione tra loro: quindi Ea
Eb = . Daltra parte, ogni elemento di A sta in

una classe di equivalenza, la sua, per la propriet`a


riflessiva, cos` che le classi di equivalenza ricoprono
tutto A. Linsieme delle classi di equivalenza degli
elementi di A rispetto alla relazione dequivalenza R
si dice linsieme quoziente di A modulo R e si indica
con la notazione A/R.
Si noti che `e vera anche la propriet`a inversa. Supponiamo che A sia diviso in tanti sottoinsiemi che:
i) sono tra loro a due a due disgiunti; ii) ricoprono
tutto A. Si dice che gli insiemi formano una partizione di A e se definiamo che due elementi a, b A
sono in relazione se e solo se appartengono allo stesso
sottoinsieme, vediamo che tale relazione `e di equivalenza. Per questo basta dimostrare che valgono le tre
propriet`a caratteristiche:
1. la relazione `e riflessiva perche ogni elemento
si trova in un sottoinsieme (propriet`a di ricoprimento ii)) e quindi `e in relazione con se
stesso;
2. se a `e nello stesso sottoinsieme di b, vale anche
il viceversa e quindi la propriet`a simmetrica `e
verificata;
3. se a `e nello stesso sottoinsieme di b, e questi di
c, essendo i sottoinsiemi disgiunti o coincidenti, a deve essere nello stesso sottoinsieme di c
(propriet`a transitiva).
Questo fatto `e spesso utile per ragionare in termini
di classi di equivalenza piuttosto che in termini dei
singoli elementi. Vedremo pi`
u casi di questo genere, ma qui, per fare un esempio preso dalla vita di
tutti i giorni, pensiamo al modo diverso con cui un
cliente e unazienda vedono i prodotti da acquistare o
vendere, rispettivamente. Il cliente `e interessato, per
esempio, a unautovettura ben determinata, lazienda
lavora invece per classi e, in fase di produzione, essa
produce un certo numero di vetture di un dato tipo,
indipendentemente dai desideri del singolo cliente, se
non per ci`o che riguarda eventuali analisi di mercato.
Solo recentemente, almeno nel settore degli autoveicoli, si `e passati a una produzione pi`
u personalizzata.
Naturalmente, la tipologia delle macchine prodotte `e
una partizione di tale insieme e la corrispondente relazione di equivalenza `e: la macchina a `e dello stesso
tipo della macchina b. Se non fosse per il numero del
motore, le due macchine sarebbero indistinguibili.
Unaltra importante relazione `e costituita dallordinamento. Sia A il solito insieme; si dice che gli
elementi di A sono ordinati in senso stretto secondo
una certa relazione, o che tale relazione `e una relazione dordine stretto per A, se valgono le seguenti tre
propriet`a:
1. propriet`
a antiriflessiva: nessun elemento `e in
relazione con se stesso;

17

1.3. FUNZIONI E OPERAZIONI


2. propriet`
a controsimmetrica: se un elemento a
A `e in relazione on b A, allora b non deve essere
in relazione con a;
3. propriet`
a transitiva: se un elemento a A `e in
relazione con b A e questo, a sua volta, `e in
relazione con c A, allora anche a `e in relazione
con c.

S = {a, b, c}

{a, b}

{a, c}

{b, c}

{a}

{b}

{c}

Un esempio significativo `e dato dalla relazione tra


numeri a < b. Pi`
u spesso, tuttavia, si usa la relazione
dordine non stretto, detta semplicemente relazione
dordine o relazione dordine parziale per le cose che
vedremo. Essa `e caratterizzata dalle tre propriet`a:
1. propriet`
a riflessiva: ogni elemento `e in relazione
con se stesso;
2. propriet`
a antisimmetrica: se un elemento a A
`e in relazione con b A, e b `e in relazione con a,
allora a e b coincidono;

3. propriet`
a transitiva: se un elemento a A `e in
relazione con b A e questo, a sua volta, `e in
relazione con c A, allora anche a `e in relazione
con c.

Figura 1.2: Diagramma di Hasse

Per avere un riferimento concreto, si pensi alla relazione tra numeri a b. Tuttavia, `e facile vedere che
anche tutti i sottoinsiemi di un insieme dato S, se
considerati con la relazione contenuto, godono di
queste stesse propriet`a: 1) ogni insieme si pu`o considerare come sottoinsieme di se stesso; 2) se A B e
B A, allora A = B; 3) A B e B C implicano
A C, come risulta immediatamente dalla definizione. Ad esempio, se S = {a, b, c}, `e facile disporre gli
8 sottoinsiemi di S in un diagramma (come nella Figura 1.2), detto diagramma di Hasse, che evidenzia
le reciproche relazioni di contenuto.
Se facciamo una cosa analoga per la relazione
fra i numeri {1, 2, 3, 4} troviamo un diagramma di
Hasse molto pi`
u semplice. In realt`a questultima relazione ha una caratteristica particolare: per fra
numeri vale la propriet`a aggiuntiva:
4. dati due elementi qualsiasi, il primo `e in relazione
col secondo oppure il secondo `e in relazione col
primo.
Chiaramente, questa propriet`a non `e valida per gli
insiemi {a} e {b, c}, che non hanno nessuna relazione di contenuto fra di loro. Quando questi due tipi
di ordinamento si vogliono distinguere, si dice che
quello fra gli insiemi `e un ordinamento parziale, mentre quello tra numeri `e un ordinamento totale. Un
esempio ulteriore di ordinamento totale `e costituito
dallordinamento lessicografico, cio`e quello delle parole nel dizionario: date due parole, si confrontano
le prime lettere e se liniziale della prima `e maggiore

(minore) delliniziale della seconda, la prima parola


segue (precede) la seconda. Se le prime due lettere
sono uguali, si confrontano le seconde due, e si va
avanti nello stesso modo finche non si trova la disuguaglianza che decide. Se una parola finisce prima
che si sia arrivati a distinguere i due termini, questa
precede laltra. Cos` mani < piedi, mani < manto,
mani < manica.
Un esempio, invece, di ordinamento parziale `e il
seguente. Si consideri un numero, diciamo 30, e linsieme di tutti i suoi divisori: {1, 2, 3, 5, 6, 12, 15, 30};
diciamo che il divisore d1 precede il divisore d2 se e
solo se d1 divide d2 . Cos` 5 precede 10, 3 precede 15,
ma nulla possiamo dire di 2 e 15. Il lettore `e invitato
a verificare che questo `e un ordinamento parziale, sia
nellesempio del 30 sia in generale, per ogni numero
naturale n. E anche invitato a disegnare il diagramma di Hasse per n = 30 e a confrontarlo con quello
della Figura 1.2.

1.3

Funzioni e operazioni

Il tipo pi`
u importante di relazione o corrispondenza `e
certamente costituito dalle funzioni. Una corrispondenza tra due insiemi A e B, cio`e un sottoinsieme
F A B, si dice una funzione se e solo se ad ogni
elemento di A corrisponde uno e un solo elemento di
B. Come si sa, espressioni come y = 3x + 2 oppure
y = x2 4x + 1 rappresentano due funzioni perche,
assegnato un valore ad x (la variabile indipendente),
il valore di y (la variabile dipendente) `e univocamente
determinato. In generale si scrive y = F (x), anche

18

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

se propriamente si dovrebbe scrivere (x, y) F . La


corrispondenza tra A e B pu`o essere di natura qualsiasi e non necessariamente numerica. Unazienda che
produce scarpe `e interessata alla produzione mensile: si tratta di una funzione nella quale, come corrispondente di ogni mese, si ha un numero, ma questo
numero non soddisfa necessariamente ad alcuna formula analitica analoga a quelle viste in precedenza.
Cos`, la data di nascita e lindirizzo di residenza sono
funzione della singola persona, come lo sono il nome e
il cognome. Invece, la data di nascita non `e funzione
del nome e del cognome, in quanto possono esistere due Giovanni Russo nati uno il 14 Aprile 1957 e
laltro il 21 Settembre 1961.

su questo ritorneremo pi`


u avanti.
La terminologia relativa alle funzioni `e alquanto
complicata, ma `e essenziale in tutta la Matematica.
Intanto, una generica funzione f dellinsieme A nellinsieme B si indica con la notazione: f : A B,
f
oppure A B; nel caso che f sia biunivoca, ci`o si
mette in evidenza scrivendo: f : A B o anche
f
A B. Linsieme A si dice dominio oppure insieme
di partenza della funzione e B si dice il rango o codominio o insieme di arrivo; linsieme degli elementi di
B che sono corrispondenti di almeno un elemento di
A si dice limmagine di A in B e si indica con f (A);
in generale, come s`e visto, f (A) B, e se f (A) = B
si dice che la funzione `e surgettiva. Se b B `e il
corrispondente di a A secondo f , cio`e (a, b) f ,
si dice che b `e limmagine di a secondo f e si scrive:
b = f (a).
Se abbiamo una corrispondenza D A B, cio`e
un insieme di coppie (a, b) D con a A e b
B, `e sempre possibile invertire tale corrispondenza
cambiando lordine degli elementi, cio`e considerando
le coppie (b, a) tali che (a, b) D. Quella che cos` si
ottiene `e una corrispondenza tra B ed A che si dice
linversa di D e pertanto si indica con D1 B A.
Formalmente:

Una funzione che faccia corrispondere ad elementi


diversi di A elementi diversi di B si dice iniettiva.
Le funzioni iniettive sono particolarmente simpatiche
perche sono invertibili, cio`e possiamo partire dagli
elementi di B e stabilire, per ciascuno, se esiste e
qual `e lelemento di A che lo ha come corrispondente;
infatti, o lelemento b B non `e determinato da alcun
elemento di A oppure `e determinato da uno solo. Ad
esempio, y = 2x `e una funzione iniettiva perch`e ad x
diversi corrispondono valori di y diversi; gli y, per`o,
non possono essere negativi. Pertanto, se partiamo
da un y 0, sappiamo che esso non `e determinato
D1 = {(b, a) B A | (a, b) D A B}.
da alcun valore di x; se per`o y > 0, esiste senzaltro
un valore di x tale che y = 2x ; tale valore `e dato da
Quando la corrispondenza `e una funzione, non `e detx = log2 y, cio`e il logaritmo in base 2 di y (si veda al
to che la sua inversa sia ancora una funzione; questo
Capitolo 3).
accade solo se a elementi distinti di A corrispondono
Ancora pi`
u simpatiche sono le funzioni iniettive che elementi distinti di B, di modo che nella corrisponper ogni b B hanno il corrispondente in A, cio`e le denza inversa esista ununica coppia che abbia come
funzioni che sono anche surgettive: queste funzioni primo elemento b B. In altre parole, la corrisponsi dicono biunivoche (o corrispondenze biunivoche) ed denza inversa di una funzione `e anchessa una funziohanno un ruolo fondamentale in tutta la Matematica. ne se e solo se f `e iniettiva. Se b = f (a), si scrive
Esse si possono definire come quelle corrispondenze anche a = f 1 (b) ed a si dice limmagine inversa di
che ad ogni elemento di A associano uno e un solo b.
elemento di B e, viceversa, ad ogni elemento di B
Se f : A B e g : B C si pu`o considerare la
associano uno e un solo elemento di A. Si osservi funzione h : A C definita nel modo seguente: si
che se due insiemi A e B sono finiti, hanno cio`e un parte da un qualsiasi elemento a A e si trova il corrinumero finito di elementi, e fra di essi esiste una corri- spondente di a in B secondo f , cio`e si trova b = f (a).
spondenza biunivoca, allora essi devono contenere lo Da questo elemento b si passa, tramite la g, allelestesso numero di elementi: infatti, per la definizione, mento c = g(b) e si definisce questo come immagine di
`e possibile associare ad ogni elemento a A un unico a secondo h. Questa corrispondenza h si dice la comb B, e nessuno degli elementi di B rimane fuori. posizione delle due funzioni f e g e si scrive di solito
Questo, come vedremo nella prossima sezione, sta a h = f g, di modo che h(a) = (f g)(a) = g(f (a)),
fondamento dei numeri naturali, i numeri con i quali qualunque sia a A. Una osservazione importansi conta. E bene comunque avvertire che limportan- te `e che se f `e una funzione biunivoca ed f 1 `e la
za delle corrispondenze biunivoche non `e limitata agli sua funzione inversa, allora f 1 (f (a)) = a per ogni
insiemi finiti. Ad esempio, la corrispondenza p = 2n a A, cio`e f f 1 `e la funzione identica su A, cio`e
tra i numeri naturali N e i numeri pari P `e chiara- la funzione che ad ogni elemento fa corrispondere se
mente biunivoca e la sua inversa `e n = p/2, che ha stesso. Spesso, tale funzione si indica con I ed f 1 si
senso perche p `e pari. Questo ci dice che i numeri pari dice linversa composizionale di f .
sono tanti quanti sono tutti i numeri, il che appare
Un insieme interessante di funzioni `e costituito dai
assurdo poiche P `e propriamente contenuto in N. Ma predicati. Un predicato su un insieme A `e una fun-

1.3. FUNZIONI E OPERAZIONI


zione p : A {0, 1}. Ad esempio, la funzione
p : N {0, 1} definita da:

p(n) = 1
se n `e pari
p(n) = 0
se n `e dispari
`e un predicato. Limportanza dei predicati (su A)
sta nel fatto che essi costituiscono un meccanismo
matematico per parlare delle propriet`a degli elementi
di A; nellesempio, la propriet`a `e: il numero n `e
pari. Di regola, si interpreta 1 come vero e 0 come
falso, cos` che p(10) = 1 significa il numero 10 `e
pari, mentre p(51) = 0 vuol dire il numero 51 non
`e pari.
Dato un insieme S e linsieme P(S) delle sue parti,
i predicati su S corrispondono ai sottoinsiemi di S.
Se infatti A S, il predicato A : S {0, 1} definito
da:

A (x) = 1
se x A
A (x) = 0
se x 6 A

19
in particolare, per i predicati su A si scrive 2A , dove il 2 sta a significare linsieme di due elementi
B = {0, 1}. Vista la corrispondenza tra i predicati su A e i sottoinsiemi di A, spesso si indica con la
stessa notazione 2A linsieme delle parti di A, cio`e
P(A). Ritorneremo in diverse occasioni sulle cose
appena dette, quando parleremo di cardinalit`a (si veda la Sezione 1.4), di calcolo combinatorio (vedere la
Sezione 4.1), di calcolo delle proposizioni (nella Sezione 4.6); ma questi concetti sono pervasivi di tutta
la Matematica.
Un caso particolarmente importante di funzione `e
dato dalle operazioni; si consideri ad esempio la somma tra numeri naturali; essa associa ai numeri 3 e 5 il
numero 8; si scrive 3+5 = 8 e pertanto siamo di fronte a una funzione che chiameremo S e che ha come
dominio il prodotto cartesiano N N, cio`e le coppie
di numeri naturali, e per codominio lo stesso N. Si
scrive pertanto: S : N N N, ed m + n al posto
di S(m, n). La stessa cosa si pu`o dire del prodotto
P : N N N, ove P (n, m) = n m. Si osservi
invece che la differenza e la divisione non sono funzioni nel senso detto: infatti, alla coppia (3, 5) non
corrisponde alcun numero naturale 3 5, ne alcun
numero naturale 3/5. In effetti, i numeri interi, cio`e
i numeri con il segno, sono stati introdotti per rendere la sottrazione una funzione, cio`e unoperazione
sempre eseguibile, e i numeri razionali per rendere la
divisione una funzione. Purtroppo, in questultima
operazione, come si sa, c`e un caso che non si risolve,
e cio`e la divisione per zero; a parte questo, nei numeri
razionali `e sempre possible fare a/b.
Le operazioni non hanno sempre necessariamente
due argomenti come le quattro operazioni di base,
cio`e addizione, sottrazione, moltiplicazione e divisione. Esistono operazioni con un solo argomento, come
la radice quadrata, il cambiamento di segno o il valore assoluto. Si possono inventare operazioni con tre
argomenti come logb (x + y), o anche a quattro come:
ax /by , e cos` via. Allora:

identifica univocamente il sottoinsieme A: il sottoinsieme definisce il predicato e dal predicato si ricava


linsieme senza alcuna ambiguit`a. Il predicato A si
dice la funzione caratteristica di A (in S) e per la precedente osservazione possiamo dire che esistono tanti
sottoinsiemi di S quante sono le possibili funzioni caratteristiche su S. Linsieme vuoto corrisponde alla
funzione caratteristica fatta tutta di 0 (la funzione
costante 0); S, come sottoinsieme di se stesso, ha come funzione caratteristica quella fatta tutta di 1 (la
funzione costante 1).
Supponiamo che gli insiemi A e B contengano,
rispettivamente, n ed m elementi; poniamo allora
A = {a1 , a2 , . . . , an } e B = {b1 , b2 , . . . , bm }. Una
funzione f : A B `e definita quando assegniamo a
ciascun elemento di A il corrispondente elemento di
B. Cos`, ad a1 possiamo assegnare uno qualsiasi degli
m elementi di B; si hanno perci`o m possibilit`a. Ad
a2 possiamo associare ancora uno qualunque degli m
elementi di B, e quindi abbiamo m2 possibili associazioni. Continuando nello stesso modo, vediamo che
anche ad an si possono associare m immagini distinte
le operazioni con un solo argomento, come |x|, si
e in tutto si hanno m m m = mn distinte
dicono monadiche;
funzioni di A in B. Ad esempio, se A = {a, b, c} e
B = {0, 1}, le funzioni di A in B, cio`e in questo caso
le operazioni con due argomenti, come x + y, si
i predicati su A, sono 23 = 8 e possono essere elendicono binarie o diadiche;
cati usando la notazione funzionale, che riporta nella
le operazioni con tre argomenti, come logb (x+y)
riga superiore gli elementi di A e in quella inferiore
si dicono ternarie o triadiche;
le rispettive immagini:

a b c
a b c
a b c
a b c
e cos` via. Il numero di argomenti di una operazione
0 0 0
0 0 1
0 1 0
0 1 1
si dice la sua ariet`
a o adicit`
a.

La notazione delle operazioni si `e sviluppata dal


a b c
a b c
a b c
a b c
1500 ad oggi in modo abbastanza caotico; essa con1 0 0
1 0 1
1 1 0
1 1 1
tinua ad evolversi perche alcune parti della MatemaDa queste osservazioni discende la notazione B A tica usano ancora notazioni ad hoc, scelte in manieper indicare linsieme di tutte le funzioni di A in B; ra piuttosto casuale, dettate spesso da considerazioni

20

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

estetiche piuttosto che razionali. Per le operazioni


monadiche due sembrano essere i tipi di notazione
pi`
u ragionevoli; di gran lunga da preferire `e la notazione prefissa o funzionale, nella quale il segno di
operazione precede largomento; cos` la negazione `e
x, la negazione logica p e si scrive cos(x) per il
coseno di x e ln(x) per il logaritmo naturale. Meno
usata `e la notazione postfissa, come n! per il fattoriale, e la fantasia dei matematici si `e sbizzarrita
a

cercare segni e disposizioni pi`


u originali: x indica
la radice quadrata, |x| il valore assoluto, ex lesponenziale, Ai lindiciamento, A il complemento, e chi
pi`
u ne ha, pi`
u ne metta. Per le operazioni diadiche
la forma pi`
u usata `e quella infissa: a + b, a/b, A B
e via di seguito; molto usata `e anche in questo caso la notazione prefissa o funzionale, adottata come
standard nei linguaggi di programmazione, fatta eccezione per le operazioni di base: MCD(m, n). Ma
anche per le
operazioni binarie
lo sfoggio di fantasia
`e notevole: n x, logb (x), an , nk , e tante altre. Fortunatamente, infine, per le operazioni con pi`
u di due
argomenti, la notazione funzionale `e canonica, anche
perche `e difficile trovare una notazione pi`
u compatta.
Le operazioni possono godere (o non godere) di
particolari propriet`a e possono possedere (o non possedere) particolari elementi che le caratterizzano.
Diamo qui un elenco delle principali propriet`a e dei
pi`
u importanti elementi speciali, supponendo che le
operazioni siano definite su un insieme A:

dono di questa propriet`a nei confronti dellaltra


operazione;
5. unoperazione binaria x y `e distributiva rispetto a unaltra operazione binaria x y se
per ogni terna di elementi x, y, z A si ha:
x(yz) = (xy)(xz); come si sa, il prodotto
`e distributivo rispetto alla somma e alla sottrazione; lunione e lintersezione sono distributive
una rispetto allaltra;
6. unoperazione binaria x y `e idempotente se per
ogni elemento x A si ha x x = x. Loperazione di Massimo Comun Divisore `e idempotente perche MCD(n, n) = n; nessuna delle quattro
operazioni di base `e tale.
7. data unoperazione binaria x y, si dice che un
elemento e A `e una identit`
a per loperazione se
e x = x e = x, per ogni elemento x A. Lo 0
`e lidentit`a per la somma e l1 lo `e per il prodotto.
Poiche si ha x 0 = x, ma 0 x = x, lo 0 non `e
identit`a per la sottrazione; talvolta, per mettere
in evidenza la prima uguaglianza, si dice che 0 `e
unidentit`
a destra per la sottrazione;
8. data unoperazione binaria x y, si dice che un
elemento z A `e uno zero per loperazione se si
ha z x = x z = z, per ogni elemento x A.
Lo 0 `e uno zero per la moltiplicazione e uno zero
sinistro per la divisione;

1. unoperazione binaria x y `e chiusa se, qualunque siano gli elementi x, y A, il risultato dello- 1.4
Il contare
perazione `e ancora un elemento di A. La somma
e il prodotto in N sono operazioni chiuse, mentre Una delle attivit`a di base delluomo `e il contare. Connon lo sono la sottrazione e la differenza; come tare significa associare agli elementi di un insieme una
s`e detto, ne 3 5, ne 3/5 sono numeri naturali; successione di parole convenzionali: uno, due, tre,
quattro, . . .. Il numero degli elementi di un insieme
2. unoperazione binaria xy `e commutativa se per
`e il nome al quale si arriva quando tutti gli elemenogni coppia di elementi x, y A si ha xy = y
ti sono stati esauriti. Idealmente, e talvolta anche
x. Addizione e moltiplicazione sono operazioni
praticamente, man mano che contiamo spostiamo gli
commutative; sottrazione e divisione non lo sono;
elementi dellinsieme in un altro insieme, in modo da
3. unoperazione binaria x y `e associativa se distinguere quelli gi`a considerati da quelli che ancora
per ogni terna di elementi x, y, z A si ha devono essere contati. In tal modo non si fanno con(x y) z = x (y z), cio`e lordine di ese- fusioni e si determina facilmente quando il conteggio
cuzione delloperazione non `e essenziale (si noti `e terminato.
In questa maniera, noi instauriamo una corrisponche la propriet`a commutativa si riferisce allordine degli elementi; la propriet`a associativa al- denza biunivoca tra gli elementi da contare e i numelordine delle operazioni). Di nuovo, addizione e ri: come abbiamo osservato nella sezione precedente,
moltiplicazione sono esempi positivi, sottrazione `e proprio lesistenza di una corrispondenza biunivoca
che ci permette di dire che gli oggetti di un insieme
e divisione negativi;
sono tanti quanti gli elementi di un altro insieme. Ora
u: se due insiemi
4. unoperazione binaria x y gode della propriet`a possiamo dire anche qualcosa di pi`
di assorbimento rispetto alloperazione x y se si hanno lo stesso numero di elementi, allora `e possibiha: x (y x) = x qualunque siano i due ele- le trovare tra di essi una corrispondenza biunivoca.
menti x, y A. Come abbiamo visto, le due ope- Infatti, dire che hanno lo stesso numero di elemenrazioni di unione ed intersezione tra insiemi go- ti significa che esiste una corrispondenza biunivoca

21

1.4. IL CONTARE
tra ciascun insieme e linsieme dei numeri che hanno
permesso di contarli; se facciamo corrispondere gli
elementi contati dallo stesso numero, abbiamo la corrispondenza biunivoca cercata. Non `e detto che essa
sia la sola, ma ci basta di essere convinti che: due insiemi (finiti) hanno lo stesso numero di elementi se e
solo se esiste tra di essi una corrispondenza biunivoca.
I numeri che servono per contare si dicono numeri
naturali: zero, uno, due, tre, quattro, . . .. Osserviamo esplicitamente che lo zero conta gli elementi
dellinsieme vuoto (quante caramelle ci sono in un
sacchetto vuoto?) e pertanto va considerato come
uno dei numeri naturali. Linsieme dei numeri naturali si indica con N. Essi costituiscono uno dei mattoni fondamentali della Matematica, anzi, come ha
dimostrato Peano (1858 1932) tutta la Matematica
che conosciamo pu`o essere fondata su una assiomatizzazione dei numeri naturali. Vedremo pi`
u avanti
qualcosa a questo proposito, anche se tali argomenti vanno un po oltre limpostazione elementare che
vogliono avere queste note.
Nota 1.4

Il resto della sezione `e costituito da


questa lunga nota, nella quale vogliamo riportare limpostazione moderna del contare, che ha permesso di
superare, in modo costruttivo e rigoroso, la barriera
del finito nel ragionamento matematico. Le idee di
base di tale impostazione sono dovute al matematico
George Cantor (1845 1918), nato a San Pietroburgo da una famiglia danese, ma vissuto in Germania
dallet`
a di undici anni; la sua opera fu inizialmente
osteggiata, tanto da acuire la sua innata debolezza
psicologica e da costringerlo a passare buona parte
della vita in manicomio, dove mor`.
Cantor part` dal concetto intuitivo di insieme, come
anche noi labbiamo visto, e dal concetto di corrispondenza biunivoca, che permette di associare gli elementi di due insiemi diversi: egli chiam`
o equipotenti due
insiemi A e B tra i quali `e possibile istituire una corrispondenza biunivoca; si scrive allora A
= B. Abbiamo
gi`
a osservato che, per gli insiemi finiti, questo significa proprio che gli insiemi hanno lo stesso numero di
elementi. Tuttavia, ci`
o che ha di interessante limpostazione di Cantor `e questo: il concetto di equipotenza
non si basa su unindefinita idea di numero data a priori, ma solo sui concetti di insieme e di corrispondenza
che sono sicuramente a un livello pi`
u basso di quello di
numero. Infatti, tali concetti fanno riferimento, anche
se in modo completamente astratto, a idee singolari,
come a singoli oggetti (elementi) o a loro raggruppamenti in insiemi singolari o ad associazioni specifiche
tra insiemi. Viceversa, lidea di numero ha a che vedere con unastrazione a livello superiore: il numero 4
si riferisce a tutti gli insiemi che hanno 4 elementi, e
sarebbe assurdo che ci riferissimo a certi insiemi di 4
elementi (quelli ad esempio di cui abbiamo esperienza
diretta) e non ad altri. Quello che vogliamo `e proprio
questo: che il numero 4 conti anche insiemi che non
conosciamo o con i quali mai avremo a che fare, come

i 4 cavalieri dellApocalisse o i 4 angoli dellUniverso


al di l`
a di tutte le galassie conosciute. La definizione
di numero cardinale proposta da Cantor, e che ora vedremo, cerca di cogliere proprio questo ulteriore livello
di astrazione
E facile vedere che la relazione di equipotenza `e in
effetti una relazione di equivalenza. La propriet`
a riflessiva vale in quanto la funzione identica, cio`e la funzione I : A A definita da I(a) = a qualunque
sia a A, `e certamente biunivoca; ci`
o significa che
A
= A. Se f : A B `e una corrispondenza biunivoca
tra A e B, abbiamo gi`
a osservato come la sua inversa
f 1 : B A sia anchessa biunivoca; vale pertanto la
propriet`
a simmetrica: A
= B implica B
= A. Infine,
se A
=B eB
= C, esistono due corrispondenze biunivoche f : A B e g : B C; la loro composizione
`e una funzione biunivoca fra A e C, il che significa
A
o dimostra la propriet`
a transitiva. Come
= C, e ci`
ormai sappiamo, dato un insieme A, la sua classe di
equivalenza [A] `e costituita da tutti gli insiemi equipotenti ad A. Definiamo allora la cardinalit`
a o potenza
di un insieme A la classe [A] di tutti gli insiemi ad
esso equipotenti. Tale classe si indica con card(A).
Leggendo o ascoltando questa definizione si ha spesso
la sensazione del gioco di parole; ma non `e cos` e anzi
`e bene capirne il senso veramente profondo. Riunire in un unico insieme (o classe) tutti gli insiemi con
4 elementi (cio`e equipotenti a un qualsiasi insieme di
4 elementi) `e unoperazione concettuale che possiamo
fare agevolmente (anzi, troppo agevolmente, tanto da
arrivare facilmente a qualche paradosso, come osserv`
o
Russell alcuni anni dopo la formulazione di Cantor)
e che d`
a un senso a quello che prima dicevamo sul
concetto di numero. Questa classe contiene insiemi i
pi`
u disparati e che, per la stessa definizione, possiamo anche non conoscere o non immaginare; ci`
o che li
caratterizza `e solo il numero dei loro elementi, quella
corrispondenza biunivoca che ci dice: s`, questo insieme `e equipotente a quello assegnato o considerato.
Ecco allora che la classe `e identificata e (in realt`
a, dal
punto di vista in cui ci siamo messi) identifica il numero di elementi dei suoi insiemi. Ora, la propriet`
a
che abbiamo osservato, e cio`e che esiste una corrispondenza biunivoca tra due insiemi se e solo se essi hanno lo stesso numero di elementi, non `e pi`
u qualcosa
da intuire o da dimostrare: `e giusto la definizione di
cardinalit`
a e quindi di numero.
Possiamo ora definire alcune operazioni sulle cardinalit`
a. Prima di tutto, date due cardinalit`
a card(A) e
card(B), la loro somma `e definita come la cardinalit`
a
dellunione disgiunta A B, cio`e:
card(A) + card(B) = card(A B).
Ci`
o `e fatto generalizzando quello che avviene tra gli
insiemi finiti; il numero degli elementi di A B non
coincide con la somma degli elementi di A con quelli
di B, basta che A e B abbiano qualche elemento in
comune, cio`e non siano disgiunti. Lunione disgiunta,
invece, funziona bene e corrisponde al nostro concetto

22

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA


intuitivo di somma: mettere assieme gli elementi dei
due insiemi senza confondere gli uni con gli altri.
Anche la moltiplicazione `e definita generalizzando il
caso degli insiemi finiti. Quando abbiamo introdotto
il prodotto cartesiano A B, abbiamo osservato che il
numero delle coppie che si formano `e dato da m n,
se m ed n sono il numero degli elementi di A e di B.
Si definisce allora:
card(A) card(B) = card(A B),
cio`e, il prodotto di due cardinalit`
a `e dato dalla cardinalit`
a del prodotto cartesiano di due insiemi, uno
appartenente a card(A) e laltro a card(B) (in concreto, possiamo prendere gli stessi insiemi A e B).
E bene osservare che le definizioni che stiamo dando,
non dipendono dagli insiemi A e B usati; sfruttando la corrispondenza biunivoca che `e implicita nella
definizione di cardinalit`
a, si dimostra che, cambiando
insiemi, non si cambia il risultato. Il lettore, al solito,
`e invitato a provare formalmente queste affermazioni.
Lultima operazione `e lelevamento a potenza. Abbiamo visto che il numero delle possibili funzioni da un
insieme A (finito e con n elementi) a un insieme B
(finito e con m elementi) `e dato da mn . Definiamo
allora:
card(B)card(A) = card(B A ),
cio`e come la cardinalit`
a dellinsieme delle funzioni da
A in B.
Il termine cardinalit`
a, pur riferendosi allespressione classica di numero cardinale che designa i numeri
naturali, ha lambizione di inglobare un concetto pi`
u
generale che comprenda anche gli insiemi infiniti. Una
definizione precisa di insieme infinito non `e banale; intuitivamente, possiamo dire che se da un insieme togliamo man mano un elemento, allora, nel caso di un
insieme finito, prima o poi rimarremo senza elementi
(cio`e, linsieme si riduce a ); viceversa, se linsieme `e
infinito potremo andare avanti in tale processo senza
mai ridurci a .
Queste idee portarono Cantor a proporre questa costruzione; sia A un insieme infinito secondo la precedente intuizione; prendiamo un elemento a0 A e togliamolo da A ottenendo A \ {a0 }; poiche A `e infinito,
A\{a0 } non `e vuoto, e quindi possiamo scegliere un altro elemento a1 A \ {a0 } e considerare A \ {a0 , a1 }.
Anche questo insieme non `e vuoto, e quindi possiamo scegliere un nuovo elemento a2 A \ {a0 , a1 }.
Cos` procedendo, si ottiene una successione infinita
{a0 , a1 , a2 , . . .} contenuta in A e composta da elementi tutti distinti. Tale sequenza `e equipotente ad N
poiche la banale corrispondenza biunivoca `e ai i,
per ogni i N. Allora, possiamo dire che un insieme
`e infinito se e solo se contiene un sottoinsieme equipotente ad N, linsieme dei numeri naturali. Questa
pu`
o essere assunta come definizione di insieme infinito,
poiche (sempre da un punto di vista intuitivo) `e chiaro
che da un insieme finito non si potr`
a mai estrarre una
successione infinita di elementi distinti.

Questa definizione `e, quindi, ragionevole e osserviamo


subito che essa ci suggerisce due considerazioni notevoli: primo, linsieme N viene ad assumere il ruolo
molto importante di pietra di paragone, in quanto ogni altro insieme verr`
a classificato finito o infinito
solo per confronto con N; questo consacra N come insieme infinito per eccellenza, quello di cui si pu`
o dire:
ecco un insieme infinito di cui siam certi di quello che
`e. Vorrei ricordare che lessere N infinito si basa su un
criterio di scommessa: vuoi scommettere che se tu
dici un numero, io son capace a dirne uno pi`
u grande? E sappiamo bene che se lavversario dice un n
qualsiasi, noi possiamo dire n + 1.
Il secondo fatto notevole `e che, dalla definizione, discende che N `e, in un certo senso, il pi`
u piccolo degli
insiemi infiniti, in quanto ogni altro insieme infinito
A viene a contenere un sottoinsieme che `e limmagine di N, quella successione {a0 , a1 , a2 , . . .} che siamo
riusciti a cavarne fuori. Certo, pu`
o succedere che la
successione esaurisca tutto A, ma la cosa non cambia,
perche allora A sar`
a equipotente ad N.
Data questa minimalit`
a di N, Cantor propose di assegnare un simbolo speciale alla sua cardinalit`
a, che
`e la pi`
u piccola delle cardinalit`
a degli insiemi infiniti.
A questo punto non sappiamo se esistono altre cardinalit`
a di insiemi infiniti, ma ci proponiamo in seguito
di dimostrare che questo `e proprio il caso. Allora, per
il momento, chiamiamo 0 (Alef con zero, dove Alef
`e la prima lettera dellalfabeto ebraico) la cardinalit`
a
di N e diciamo transfinite le cardinalit`
a degli insiemi
infiniti: per ribadire quanto detto, ci`
o che sappiamo
al momento attuale della nostra esposizione `e che 0
`e lunica o la pi`
u piccola della cardinalit`
a transfinite. Un insieme si dice numerabile se `e equipotente ad
N, cio`e ha cardinalit`
a 0 , che pertanto si dice anche
cardinalit`
a del numerabile.
Viene qui naturale fare un esempio: consideriamo P,
linsieme dei numeri pari; chiaramente P N e P `e
infinito: come si conciliano le due cose? In realt`
a il
problema ha una semplice soluzione: ad ogni numero
naturale k associamo il numero pari 2k; otteniamo cos`
la successione {a0 , a1 , a2 , . . .} dove ak = 2k e quindi:
P `e infinito e P `e in corrispondenza biunivoca con N,
anche se `e propriamente contenuto in tale insieme. Ma
non aveva detto Aristotele che una parte `e minore del
tutto? Qui, una parte propria, P, `e equipotente al tutto. Duecentocinquanta anni prima di Cantor, Galileo
aveva osservato che esiste una corrispondenza biunivoca tra i numeri naturali e i quadrati perfetti, che si
rarefanno sempre di pi`
u al crescere di n. Da questo,
per`
o, non era riuscito a dedurre altro che non solamente non si possa dire di un infinito esser maggiore
di un altro infinito, ma ne anco che e sia maggiore di
un infinito. Cantor fece vedere che le cose non stanno nemmeno cos` e che, in questo campo, Aristotele si
sbagliava.
Egli dimostr`
o addirittura che un insieme `e infinito se e
solo se `e equipotente a una sua parte propria. La prova
`e quasi banale: se linsieme A `e infinito, estraiamone

23

1.4. IL CONTARE
la successione S = {a0 , a1 , a2 , . . .} e sia B linsieme
(eventualmente vuoto) degli elementi che rimangono,
cio`e sia A = S B. Consideriamo ora A = A \ {a0 }
e vediamo che A e A sono equipotenti. Lovvia corrispondenza biunivoca `e la seguente: ad ogni elemento
di B (in A) facciamo corrispondere se stesso in A e ad
ogni elemento ak della successione facciamo corrispondere ak+1 . Ma A A (propriamente) e la prima parte
della prova `e fatta. Viceversa, se A `e finito e A A,
sappiamo che A ha meno elementi di A e i due insiemi
non possono essere messi in corrispondenza biunivoca
tra di loro.
Abbiamo cos` una seconda caratterizzazione degli insiemi infiniti, che ci rende conto di varie anomalie che
essi hanno nei confronti dei pi`
u usuali insiemi finiti.
Una tale propriet`
a, tuttavia, potrebbe indurci a pensare che sia possibile mettere in corrispondenza biunivoca due insiemi infiniti qualsiasi: se un insieme `e
equipotente a un suo sottoinsieme, possiamo immaginare linsieme pi`
u piccolo come sottoinsieme di
quello pi`
u grande e cercare una corrispondenza biunivoca (analoga a quella appena vista) per dimostrare questo fatto. Una serie di risultati sembrerebbe
confermare tale ipotesi:
1. se ad un insieme infinito A si aggiunge un insieme finito B = {b1 , b2 , . . . , bk }, quello che si
ottiene `e un insieme equipotente ad A. Sia
S = {a0 , a1 , a2 , . . .} la solita successione tratta da A e sia D = A \ S. La corrispondenza
biunivoca che ad ogni elemento di D fa corrispondere se stesso e per la quale: a0 b1 , a1
b2 , . . . , ak1 bk , ak a0 , . . . , ak+h ah , . . .,
prova la nostra affermazione. Se linsieme A
`e numerabile, in termini di cardinalit`
a, questo
risultato si esprime con la formula: 0 + k = 0 ;
2. se A e B sono due insiemi numerabili, allora
A B `e equipotente ad A. Dire che A `e numerabile significa che gli elementi di A sono ordinabili in una successione A = {a0 , a1 , a2 , . . .} per
la quale k ak , per ogni k N. Analogamente B = {b0 , b1 , b2 , . . .}. Allora la corrispondenza
biunivoca tra A B ed N `e (per ogni k N): se
k = 2h `e pari k ah , e se k = 2h + 1 `e dispari
k bh . Questo fatto si esprime con la formula:
0 + 0 = 0 ;
3. se A e B sono due insiemi numerabili, allora il
loro prodotto cartesiano AB `e anchesso numerabile. Siano A e B come prima e disponiamo gli
elementi di A B in una matrice infinita come
nella Figura 1.3. Il cammino segnato `e la corrispondenza biunivoca tra A B ed N. Questo
fatto si esprime con la formula: 0 0 = 0 .
Ma allora, ci chiediamo, esistono davvero cardinalit`
a
transfinite pi`
u grandi di 0 ? Apparentemente, dai tre
casi precedenti, sembra che con le normali operazioni
non si esca fuori del campo del numerabile. Ma Cantor dimostr`
o che di cardinalit`
a transfinite ne esistono
quante se ne vuole.

(a0 , b0 )

(a0 , b1 )
(a0 , b2 )

(a0 , b3 )

(a1 , b0 )

(a1 , b1 )

(a1 , b2 )

(a1 , b3 )

(a2 , b0 )

(a2 , b1 )

(a2 , b2 )
(a2 , b3 )

(a3 , b0 )

(a3 , b1 )

(a3 , b2 )

(a3 , b3 )

Figura 1.3: Scorrimento di una matrice infinita


Teorema 1.1 (di Cantor) Sia A un insieme qualsiasi e sia P(A) linsieme di tutti i sottoinsiemi
(le parti) di A; allora, la cardinalit`
a di P(A) `e
strettamente maggiore della cardinalit`
a di A.
Prova: La dimostrazione `e un classico della Matematica e consiste nel far vedere che: 1) A `e equipotente ad un sottoinsieme di P(A), cio`e che card(A)
card(P(A)); 2) che P(A) non `e equipotente ad A,
e quindi card(A) 6= card(P(A)), cio`e card(A) <
card(P(A)). La prima parte della dimostrazione `e ovvia, poiche ogni elemento a A si fa corrispondere
al sottoinsieme {a} P(A). Per la seconda parte,
supponiamo che esista una corrispondenza biunivoca
tra A e P(A), cio`e (a) A, per ogni a A.
Dato a A, (a) potr`
a contenere a oppure no; ad
esempio, se (a ) = allora a 6 (a ); se invece
(a ) = A, allora certamente a (a ). Possiamo
quindi dividere gli elementi di A in due sottoinsiemi:
P = {x A | x (x)}, gli elementi positivi,
ed N = {x A | x 6 (x)}, gli elementinegativi.
Poiche si suppone che sia biunivoca, deve esistere
un elemento b A tale che (b) = N , e quindi dovr`
a essere b N oppure b 6 N . Ma se b N , per
definizione di N deve essere b 6 (b) = N , il che `e
chiaramente assurdo. Daltra parte, se fosse b 6 N ,
cio`e b 6 (b), per la definizione di N dovremmo avere
b N , il che `e di nuovo assurdo. Ma questi sono gli
unici casi possibili, e quindi non pu`
o esistere.
Il lettore avr`
a notato lanalogia di questo ragionamento con il paradosso di Russell, ma questa volta
largomentazione `e corretta e la conclusione del teorema `e vera. Questo risultato permette di costruire
insiemi di cardinalit`
a grande quanto si vuole. Si parte
con N che ha cardinalit`
a 0 e si considera linsieme
delle parti di N, cio`e N1 = P(N). La cardinalit`
a di N1
`e strettamente maggiore di quella di N e si indica con
1 (questo spiega finalmente la presenza dello strano
indice). Si prende poi N2 = P(N1 ) la cui cardinalit`
a
`e 2 > 1 , e cos` si pu`
o continuare quanto si vuole.
Vedremo, quando avremo introdotto i numeri reali,
che la loro cardinalit`
a `e strettamente maggiore di 0 .
Tale cardinalit`
a si indica con c e si dice la cardinalit`
a
del continuo. Si dimostra che c = 1 > 0 e ci si pu`
o
porre la domanda se esistono insiemi di cardinalit`
a
compresa tra 0 e 1 (o, in generale, tra n e n+1 ).
Abbastanza stranamente, nel 1963, Paul Cohen ha

24

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA


dimostrato che non si pu`
o dimostrare ne che una tale
cardinalit`
a intermedia esista, ne che non esista.

1.5

Rappresentazione dei numeri naturali

Il concetto di contare, come s`e visto, si esprime nel


linguaggio naturale mediante una serie di nomi convenzionali: uno, due, tre, quattro, . . . . Le regole per
la formazione dei nomi dei numeri sono abbastanza
semplici e permettono di esprimere una grande quantit`a di numeri come cento miliardi o settanta miliardi
di miliardi. Tuttavia, diventa estremamente difficile
dare nomi a numeri molto grandi come ad esempio al
prodotto dei primi cento numeri 1 2 3 100
che vale esattamente:
9332621544394415268169923885626670049071
5968264381621468592963895217599993229915
6089414639761565182862536979208272237582
51185210916864000000000000000000000000.
Inoltre, i nomi usuali tendono a diventare presto molto lunghi e per esprimere 7. 546. 732. 449 bisogna dire:
sette miliardi, cinquecento quarantasei milioni, settecento trentadue mila, quattrocento quarantanove,
un nome lungo 85 lettere, pi`
u del triplo del celebre
precipitevolissimevolmente. Queste considerazioni
hanno fatto s` che molto presto si siano sviluppati
metodi formali per la rappresentazione dei numeri,
attraverso simboli opportuni o ricorrendo alle lettere
dellalfabeto. A tutti `e nota la numerazione romana,
che aveva linconveniente di essere inadeguata per i
numeri molto alti e nessuno si sognerebbe mai di tentare di scrivere il risultato del precedente prodotto in
quella notazione; gi`a per esprimere 12. 000 si doveva
scrivere XIIM e a scrivere milioni non ci si pensava
nemmeno. Inoltre, la numerazione romana aveva il
difetto di usare ogni simbolo con un significato univoco: X indica il 10 sia nellespressione LXXI quanto
in MCCCXXIV, quanto infine in XCIV (questa notazione in sottrazione fu introdotta solo nel Rinascimento; i Romani scrivevano LXXXXIIII). Questo
limita molto lespressivit`a della notazione, se si confronta con la nostra, dove la cifra 6 indica sei unit`a se
sta da sola, ma indica sessanta in 63, seicento in 1647
e sei milioni nel numero che prima abbiamo espresso in italiano. Nellantichit`a, apparentemente, solo i
Babilonesi avevano sviluppato una notazione analoga
alla nostra, anche se, misteriosamente, avevano scelto
come base di riferimento il 60 invece del 10, che a noi
sembra cos` naturale.
In effetti, la scelta della base 10 non `e cos` universale come ci pu`o apparire. Essa `e legata, quasi
sicuramente, al fatto che abbiamo dieci dita, ma per

la stessa ragione si conoscono numerazioni in base 5


(si considera una sola mano; la V dei romani rappresentava la mano aperta) e in base 20 (mani e piedi),
come `e ben noto dal modo francese di esprimere 80:
quatre-vingt, e 90: quatre-vingt dix. La nostra
notazione viene dal mondo arabo occidentale, e perci`o
le 10 cifre che usiamo si dicono cifre arabiche. A loro
volta, gli arabi avevano importato la loro notazione
dallIndia verso l800 d.C., e dal mondo arabo prima
Gherardo da Cremona e poi Leonardo Fibonacci lavevano diffusa in Europa verso il 1200. Tuttavia, fino
al 1600 la notazione arabica rimase limitata al mondo del commercio e della finanza, mentre nel mondo accademico e scientifico continu`o a dominare la
notazione romana.
La possibilit`a di esprimere in modo (abbastanza)
sintetico anche numeri molto grandi non `e per`o lunico merito, o il principale, della notazione arabica:
quello che la rende insostituibile `e il fatto che essa
permette di eseguire le operazioni di base (addizione, sottrazione, moltiplicazione, divisione e confronto) direttamente sulla rappresentazione dei numeri.
Nellantichit`a, contare e fare di conto erano operazioni avulse luna dallaltra, almeno dal punto di vista
tecnico. Contare consisteva nellassegnare un nome
convenzionale (o un simbolo) a una quantit`a di interesse; tale nome o simbolo non era per`o utilizzato
per fare le somme, per le quali si ricorreva a strumenti come labaco o, in mancanza di meglio, a pietruzze o sassolini disposti su varie righe. Ricordiamo, a
questo proposito, che la nostra parola calcolo deriva appunto dal termine latino calculus che significa sassolino. Leonardo Fibonacci nella sua opera
Liber Abaci non solo introduce la notazione arabica, ma mostra come con essa sia possibile effettuare le quattro operazioni fondamentali, grosso modo
con le regole che ancor oggi impariamo nelle prime
classi delle scuole elementari e che costituiscono il
nostro saper far di conto. Fibonacci chiam`o algorismi (dal nome del matematico arabo al-Khuwarizmi,
morto verso l850 d.C.) queste regole e per secoli lespressione apprendere gli algorismi ha significato
imparare a far di conto.
Nota 1.5

Come abbiamo accennato, la notazione


arabica fu snobbata dal mondo accademico e scientifico fino al 1600, in quanto il calcolo (detto logistica
e contrapposto allAritmetica) era considerato una
disciplina pratica e non liberale, cio`e facente parte
del Trivio (Grammatica, Dialettica, Retorica) o del
Quadrivio (Aritmetica, Geometria, Musica, Astronomia). Questo rallent`
o indubbiamente lo sviluppo
della scienza legata agli aspetti algebrico-formali.
Cos` non era raro trovare notevoli scienziati che,
letteralmente, non sapevano fare i conti. Lo stesso
Galileo non aveva molta dimestichezza con il calcolo,
anche se aveva inventato uno speciale compasso per

1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI


lesecuzione di conti approssimati. Le sue opere fanno
scarsi riferimenti ai numeri, e in questo differiscono
in modo straordinario dai lavori di Newton, che
`e di poco posteriore, essendo nato lanno stesso
della morte di Galileo (a sua volta questi, guarda
caso, era nato lanno in cui mor` Michelangelo).
Galileo non si sogn`
o mai di dire che la Natura fosse
un libro scritto in caratteri numerici (a lui poco
familiari), ma dichiar`
o anzi che tale libro era scritto
in forma di triangoli, quadrati, cerchi e altre figure
geometriche. Allopposto, commercianti e banchieri
del 1200 capirono subito limportanza dellopera di
Fibonacci, e la supremazia in Europa della Toscana in
questi settori fu in parte dovuta alla superiorit`
a degli
algorismi sugli altri metodi di calcolo. Quando,
nella prima met`
a del 1300 aveva in Firenze circa
XXV M duomini da portare armi da XV in LXX
anni, riferisce Giovanni Villani nella Nuova Cronica, I garzoni che stavano ad apprendere labaco
e lalgorismi in VI scole [erano] da M in MCC. E
quelli che stavano ad apprendere gramatica e loica in
IIII grandi scuole da DL in DC. Quindi, i ragazzi
avviati a diventare contabili (come diremmo oggi)
erano il doppio di quelli avviati alle lettere o alle leggi.

La notazione arabica `e una notazione posizionale


basata sul numero 10. Le dieci cifre arabiche 0, 1, 2,
3, 4, 5, 6, 7, 8, 9 assumono un valore diverso a seconda
della posizione che hanno nel numero. A partire da
destra, la prima `e la cifra delle unit`a, poi c`e quella
delle decine, delle centinaia, delle migliaia e cos` via.
Per essere esatti, se il numero n `e rappresentato dalla
sequenza di cifre dr dr1 . . . d1 d0 , allora il suo valore
`e:
n = 10r dr + 10r1 dr1 + + 10 d1 + d0 .
Ad esempio, 3223 = 3 103 + 2 102 + 2 10 + 3.
La notazione decimale dei numeri ci `e ormai diventata tanto familiare che non ne avvertiamo pi`
u laspetto di artificio, legato al fatto che abbiamo 10 dita.
Probabilmente, se come Paperino avessimo quattro
dita per mano, la base pi`
u naturale sarebbe stata 8.
Ma allora, ci possiamo chiedere, esiste una notazione
veramente naturale per i numeri? Lunica che pu`o
rivendicare una qualifica del genere `e la notazione
ad aste o a stecchini, cio`e la notazione che rappresenta il numero n con n aste (o stecchini o qualsiasi
altro simbolo) disposte una dietro laltra: il numero 7 sarebbe |||||||. In questa notazione, detta anche
numerazione primitiva, abbiamo veramente un accordo, cio`e una corrispondenza biunivoca evidente, fra
ci`o che vogliamo contare (seggiole, teste o stelle) e il
modo di rappresentare tale conteggio: ogni oggetto
unasta, e viceversa.
Gli inconvenienti di questa notazione sono la lunghezza e lilleggibilit`a. Provate a scrivere anche solo

25

157 e fatelo leggere a qualcuno che non sappia quale numero avete scritto, e vi accorgerete dellutilit`a
della nostra rappresentazione decimale. Qual `e allora il processo che sta dietro a tale notazione? Anche
questo lo abbiamo imparato alle scuole elementari.
Cominciamo col ricordare che esiste una notazione
convenzionale per i numeri piccoli: ad una sola asta
| associamo la cifra 1, a due aste || la cifra 2, e cos`
via fino a nove aste |||||||||, cui associamo la cifra 9.
Quando di aste non ve ne sono, indichiamo questo
fatto con la cifra 0.
Nota 1.6

Come abbiamo accennato, i Babilonesi


svilupparono una notazione posizionale, ancorche
basata sul numero 60. Purtroppo, la cifra 0 non
veniva considerata, di modo che 23 poteva indicare
tanto il numero 23 quanto il 203 o il 2003, e si doveva
capire dal contesto quale fosse linterpretazione
corretta. Ci`
o rendeva questa notazione inutilizzabile
per eseguire i calcoli, e fu proprio su questo punto
che i Babilonesi fallirono. Quando fu riscoperto, lo
zero venne rappresentato da un tondino; si pass`
o poi
a un semplice punto, e solo in seguito si `e arrivati
allattuale simbolo. Gli arabi usavano per lo zero
il nome sifr, che significa vuoto. Il termine fu
tradotto in latino con il termine zephyrum e da
questo sono derivate le parole zero e cifra.

Ecco allora che presentiamo il nostro primo


algoritmo:
Algoritmo 1.1 (Rappresentazione decimale)
Ingresso: Un numero n scritto nella notazione ad
aste;
Uscita: La rappresentazione decimale di n.
1. sia S linsieme contenente le aste che rappresentano n;
2. se S `e vuoto, rappresentiamo n con la cifra 0 e
usciamo;
3. altrimenti sia L una lista vuota;
4. se linsieme S contiene meno di 10 aste, poniamo in testa ad L la cifra corrispondente al numero di aste di S; si esce e la sequenza ordinata delle cifre che si trovano in L `e la rappresentazione
decimale del numero n;
5. altrimenti, raggruppiamo in sottoinsiemi di 10
aste tutte le aste di S;
6. se, arrivati alla fine delloperazione di raggruppamento, `e rimasto un gruppetto di k aste (k <
10) mettiamo in testa alla lista L la cifra corrispondente al numero k; se invece non `e rimasto
nessun gruppetto, mettiamo la cifra 0 in testa ad
L;

26

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

7. eliminiamo leventuale gruppetto di k aste rimasto; estraiamo da ciascuno dei gruppi di 10 aste
ununica asta e, con queste, formiamo un nuovo
insieme che chiamiamo ancora S;
8. si torna al punto 4.
Per il numero 34, il raggruppamento produce:
||||||||||
| {z }

||||||||||
| {z }

||||||||||
| {z }

||||,

La sequenza dei resti, letta da destra verso sinistra,


3245, d`a la rappresentazione del numero in base 7.
Per le basi maggiori di 10, le cifre ulteriori si indicano
con le lettere dellalfabeto: A = 10, B = 11, C = 12,
etc. Ad esempio, se si vuole esprimere 148710 in base
12 si ha:
1

4 8
2 8
4
1

7 1
1
7
1

2
2 3 1
0 3 1
3 1

2
0 1
0 0

per cui la prima cifra da porre in L `e 4. Lestrazione


delle aste dai gruppi d`a ||| e quindi la cifra 3 viene Questa volta la sequenza dei resti `e 10, 3, 11, e quindi
posta in testa ad L che diviene (3, 4). A questo pun- 1487 = A3B .
10
12
to si `e finito e in L si legge il numero 34, come cera
da aspettarsi. Il lettore `e invitato a immaginare quale
Nota 1.7
Nel caso che la base sia 2, le divisioni
semplificazione apporterebbe al precedente algoritmo
si fanno ad occhio e il resto `e ovviamente 0 oppure 1
a seconda che il numero sia pari o dispari. Limpostalidea di generalizzare il concetto di raggruppare in
zione `e allora la seguente e il numero in base 2 si legge
sottoinsiemi di 10 aste per intendere che tale ragdal basso verso lalto: 17810 = 101100102 :
gruppamento possa essere fatto (virtualmente) anche
quando le aste sono meno di 10.
178 0
Il metodo realizzato dallalgoritmo `e del tutto ge89 1
nerale e chiaramente univoco; permette perci`o di
44 0
formulare un risultato molto importante:
22 0
11
5
2
1
0

Teorema 1.2 Se dr dr1 . . . d1 d0 `e la rappresentazione decimale di un numero naturale n, allora tale


rappresentazione `e unica.
Lalgoritmo 1.1 ha unimportanza molto superiore alla sua apparente banalit`a, come cercheremo di
mettere ora in evidenza. La base 10, come s`e detto,
`e in larga parte arbitraria; potremmo usare la base
7 e avere una diversa rappresentazione dei numeri.
In questo caso, ad esempio, dovremmo utilizzare 7
cifre, diciamo 0, 1, 2, 3, 4, 5, 6, e un numero come 3245 avrebbe per significato: 3 73 + 2 72 +
4 7 + 5 = 1029 + 98 + 28 + 5 = 1160. Si scrive anche 32457 = 116010 , se si vogliono mettere in
evidenza le basi ed evitare possibili confusioni. Analogamente, in base 2 si usano le sole cifre 0,1, dette
bit (in inglese: BInary digIT, cifre binarie), e un
numero come 10110112 ha come valore in base 10:
1 26 + 0 25 + 1 24 + 1 23 + 0 22 + 1 2 + 1 =
64 + 16 + 8 + 2 + 1 = 91. Queste osservazioni permettono di capire il significato di un numero scritto
in una base qualsiasi.
Viceversa, se vogliamo scrivere un numero come
1160 in base 7, basta procedere come stabilito dallAlgoritmo 1.1, utilizzando il 7 al posto del 10. In
pratica, il metodo si dice delle divisioni successive e
si imposta, appunto, come una serie di divisioni:
1 1
4

6 0 7
6
1
4 0
5

6 5
2 5
4

7
2 3
2

7
3 7
3 0

1
1
0
1

Anche la conversione inversa pu`


o essere resa pi`
u veloce
impostandola nel modo seguente: a partire da destra,
si scrivono, sotto ogni cifra del numero binario di partenza, le potenze di due a partire da 20 = 1. Questo
si fa raddoppiando ad occhio ogni volta il numero precedente (cio`e, quello sulla destra). Alla fine, si sommano, sempre a mente, i numeri che stanno sotto i bit
uguali ad 1.
1
128

0
64

1
32

1
16

0
8

0
4

1
2

0
1

In questo caso si ha 128 + 32 + 16 + 2 = 178, come si


sapeva.
Una domanda abbastanza naturale a questo punto
`e: quant`e lunga la rappresentazione di un numero
n?
Pi`
u precisamente, quante cifre servono per
rappresentare il numero n nella base b? Per la regola
posizionale, servono k + 1 cifre se il numero `e compreso tra bk e bk+1 , cio`e se abbiamo: bk n < bk+1 .
Passando ai logaritmi in base b (siamo in una nota!)
si ottiene: k logb (n) < k + 1; poiche k `e un
numero intero, si ha k = logb (n), dove questa
notazione significa: Prendi la parte intera di . . ..
Aggiungendo 1, si ottiene il risultato generale: il
numero di cifre necessarie a scrivere il numero n nella
base b `e logb (n) + 1. Spesso e volentieri, quando
si usa un elaboratore, occorre passare rapidamente
dalla base 2 alla base 10, o viceversa. Se non si
deve essere molto precisi, e ci si accontenta del solo

1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI


ordine di grandezza, siano k2 e k10 il numero di
cifre necessario a scrivere il numero n in base 2 e in
base 10. Dallapprossimazione classica 210 103 si
ha la semplice proporzione: k2 : k10 = 10 : 3, che
permette il calcolo veloce di k2 conoscendo k10 , e
viceversa. Ad esempio, nella rappresentazione interna
dellelaboratore, di solito si riescono a rappresentare
i numeri fino a 2128 ; dalla precedente proporzione si
ricava che tale numero corrisponde, grosso modo, a
1038 .

La numerazione posizionale con base fissa, sia che


questa venga scelta come 10, sia che si preferisca 2,
8 o 12, `e in effetti il metodo pi`
u semplice di rappresentare i numeri e permette di eseguire direttamente
le operazioni elementari. Tuttavia, si possono concepire numerazioni posizionali con una base composta,
e nella realt`a esistono ancora oggi (e pi`
u ne esistevano nel passato) numerazioni di questo tipo. La pi`
u
utilizzata nella pratica `e la numerazione dei giorni,
per la quale un anno si compone di 12 mesi, un mese di (circa) 30 giorni, un giorno di 24 ore, unora
di 60 minuti e un minuto di 60 secondi. Limitandoci ai giorni, la scrittura 5d 14h 35 18 si legge: cinque
giorni, quattordici ore, trentacinque minuti e diciotto secondi. Cos` come nella base 10 ogni cifra deve
essere compresa nel rango 0 9, qui ogni indicazione
di ora deve essere compresa tra 0 e 23, ogni indicazione di minuto e di secondo deve rientrare nel rango
059; la base composta si scrive pertanto (24, 60, 60),
quando ci si limiti ai giorni, e (12, 31, 24, 60, 60) oppure (365, 24, 60, 60) quando la si voglia estendere a
tutto lanno.
In questa ottica, 4d 36h 154 78 `e apparentemente
una scrittura priva di senso, analoga al numero 2013
in base 2. Tuttavia, conviene dare un senso a tale
notazione, interpretando le varie quantit`a in funzione
del corrispondente valore della base. Ci`o, come vedremo, `e molto conveniente per eseguire le operazioni
e avviene nel modo seguente, procedendo da destra
verso sinistra:

27

1.1 permette, conoscendo i numeri che definiscono la


base composta, di trovare la rappresentazione di una
quantit`a data come numero di secondi (o di minuti o
di ore) interpretati come stecchini od aste. Naturalmente, le suddivisioni in gruppi non avvengono pi`
u
tutte nella stessa maniera, ma in funzione delle componenti della base: cos` i secondi vengono riuniti in
gruppi di 60, i minuti ancora in gruppi di 60, ma le
ore in gruppi di 24.
In questo caso, le abbreviazioni d, h per giorno ed
ora non vengono dallinglese day e hour, ma dal latino
dies ed hora, il che potr`a tranquillizzare pi`
u di una
persona. I minuti primi e i minuti secondi sono unespressione antica, nella quale minuto sta appunto
per piccolo, cio`e suddivisione piccola dellora; luso
ha poi portato a chiamare i primi semplicemente minuti e i secondi secondi (spero si voglia apprezzare il
bisticcio). La notazione con gli esponenti `e tipograficamente un po ostica; cos` dal quotidiano apprendo
che Gilberto Simoni ha vinto la tappa di ieri del Giro dItalia in 4h46 43 ; negli orari, ferroviari e non,
la partenza `e annunciata alle 15:46, evitando giustamente il punto o la virgola decimale, visto che questi
numeri decimali non sono. Anche gli orologi digitali
e i calcolatori elettronici hanno adottato questa notazione con i due punti, riferendola costantemente alle
ore del giorno. Mi capita anche di vedere 18:37:58
per 18h 37 58 e, costretti dagli orari, perfino gli anglosassoni oggi accettano di scrivere 15:46 invece di
3:46 p.m., arrivando a pronunciare fifteen hundred
forty six. Dove si andr`a a finire?
Analoghe considerazioni valgono per la notazione relativa agli angoli, dove la base composta `e
(360, 60, 60), con lulteriore precisazione che non si
possono superare i 360 , corrispondenti a un angolo giro completo. Un angolo `e dato in gradi compresi tra 0 e 359 (si ripetono poi ciclicamente); un
grado `e composto di 60 primi e un primo di 60 secondi. Cos` 1000 324 97 `e una brutta rappresentazione di un angolo di 285 25 37 , come il lettore
avr`a la compiacenza di verificare con quattro calcoli
elementari.

78 si interpreta come 1 minuto e 18 , visto


che un minuto corrisponde a 60 secondi; queIl sistema metrico decimale, prodotto dallIllumisto minuto va a incrementare i 154 portandoli a nismo del 1700 e messo in atto dalla Rivoluzione
155 ;
Francese, ha in pratica lasciato alle basi composte
soltanto il computo del tempo e la misurazione de

155 si interpreta come 2 ore (cio`e, 120 ) e 35 ; le gli angoli. Nel mondo anglosassone, pi`
u restio ad
h
due ore vanno ad incrementare le 36 portandole accettare le novit`a venute dalla Francia, fino al 14
h
a 38 ;
Gennaio del 1971 la sterlina si divideva in 20 scellini
38h si interpreta come 1 giorno (cio`e, 24h ) pi`
u (ma la ghinea valeva 21 scellini), e lo scellino in 12
14h ; questo giorno incrementa di 1 il numero pence (plurale, questo, di penny, anche se tre monete da un penny erano three pennies); la base era
complessivo dei giorni.
quindi (, 20, 12) o anche (20, 12) e lo straniero era
In definitiva, abbiamo 4d 36h 154 78 = 5d 14h 35 18 e guardato in modo supercilioso se si imbrogliava anquesta `e la rappresentazione standard. LAlgoritmo che un po. Ancora oggi, le unit`a di misura lineare,

28

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

e di conseguenza le misure di superficie e di volume,


non si rifanno alla base 10: il pollice (2.54 cm) ha come multipli il piede, composto di 12 pollici, la yarda,
formata da 3 piedi, e il miglio, che di yarde ne conta
esattamente 1760. Come sottomultipli del pollice si
usano il mezzo pollice, il quarto, lottavo e anche il
sedicesimo di pollice, il che porta in ballo, del tutto
inaspettatamente, la base 2. Facco grazia al lettore
delle misure di peso (oncia, libbra, etc.) e di quelle
di volume (quarto, pinta e gallone).

1.6

La nomenclatura della Matematica

Gli insiemi e i numeri, di cui abbiamo parlato, sono


sicuramente concetti che appartengono alla Matematica, anche se non `e chiaro perche il concetto di mandorla non ne debba far parte. Si pensa, in genere,
che concetti troppo specifici, come appunto quello di
mandorla, non possano portare a conclusioni generali: o la mandorla `e vista come elemento di un insieme,
e allora il concetto di insieme viene a inglobare quello
di mandorla, oppure vogliamo contare le mandorle, e
allora dobbiamo proprio astrarre dal fatto di contare mandorle, e di nuovo linteresse per tale concetto
viene a cadere. Ma allora, ci chiediamo, quanto deve
essere generale un concetto per poter appartenere alla Matematica? Questo `e difficile a dirsi e se si pensa
che per secoli la rappresentazione arabica dei numeri
non `e stata presa in considerazione dalla Matematica
accademica, ci si rende conto come la demarcazione
sia estremamente labile. Diciamo che un concetto o,
meglio, una serie di concetti fanno parte della Matematica quando si riesce a creare una teoria che li
comprende. Che cos`e allora una teoria?
La misurazione dei campi potrebbe, oggi come oggi, difficilmente essere considerata una parte, perfino
importante, della Matematica: il suo grado di generalit`a sembra alquanto basso se confrontato, ad esempio, con la Fisica nucleare, lastronomia o la ricerca
operativa. In effetti la Geometria (cio`e la misurazione
dei terreni) `e uno dei pi`
u classici esempi di teoria matematica. Partendo dalla considerazione delle figure
dei campi, i geometri dellantichit`a hanno individuato
alcuni concetti che costituiscono la base di ogni altro
concetto geometrico. Per far questo hanno cercato di
dare una definizione di triangolo e di rettangolo, ma
queste implicano una definizione di angolo e di lato, e
quindi la definizione di segmento e di semiretta, e cos`
via. Questo processo che ci porta a concetti sempre
pi`
u generali non pu`o continuare allinfinito, ma dobbiamo interromperlo da qualche parte. Fu deciso di
interromperlo ai concetti di punto, retta, piano, spazio e alle loro reciproche disposizioni. Ci`o significa

che non possiamo (e non vogliamo) definire che cosa


`e un punto, che cosa `e una retta o che cosa vuol dire
che un punto si trova su una retta. Ma allora, come
possiamo sapere che cosa sono questi oggetti e queste
relazioni?
Gli antichi (ad esempio Euclide) avevano dato una
risposta a livello di intuizione: i concetti primitivi,
cio`e non definiti e non definibili, sono astrazioni estreme di concetti evidenti e, come tali, noi li accettiamo
per buoni. La realt`a, di cui sono astrazione, ci assicura della loro esistenza e della validit`a delle loro
propriet`a. In questa ottica, una retta pu`o essere infinitamente lunga e infinitamente smilza, anche se nella realt`a non `e cos`: le propriet`a sono intuite quando
operiamo latto di pensare di restringere sempre pi`
u
una retta reale e di farla continuare oltre ogni limite
fisico. In ogni modo, ai concetti di base della teoria
rimane legata una realt`a che permette di applicare
al mondo che ci circonda i risultati della teoria stessa.
Cos`, nella visione antica, la Geometria, oltre ad essere una teoria, `e uno strumento pratico, ed `e proprio
questo aggancio al mondo reale che rende una teoria vera: se scoprissimo qualche divario tra teoria e
pratica, la teoria non andrebbe pi`
u bene e dovrebbe
essere abbandonata.
Questa dipendenza della teoria dalla pratica ha fatto molto pensare i matematici, che non erano soddisfatti proprio per niente. Cos`, durante il 1800 hanno
cambiato le carte in tavola, invertendo completamente il vecchio punto di vista: non `e la realt`a che determina o convalida una teoria, ma questa `e unentit`a
autonoma che, semmai, trova un suo modello nella
realt`a, o almeno in quella parte della realt`a che ha
il buon gusto di adeguarsi alla teoria. Cosa significa
questo per la Geometria? Significa che punto, retta,
piano e spazio non sono astrazioni della realt`a, ma
sono dei puri nomi o simboli, le cui reciproche relazioni sono definite negli assiomi della teoria. Gli assiomi,
cio`e le verit`a che nella concezione antica erano stabiliti dalla realt`a e accettate come tali, ora sono concepiti come propriet`a che regolano le relazioni reciproche
fra i simboli della teoria. In questo senso, gli assiomi potrebbero essere del tutto arbitrari; esiste per`o
unovvia limitazione: essi non si possono contraddire
tra di loro, ne portare a contraddizioni interne alla
teoria. Cos`, in altre parole, non deve mai succedere che si dimostri una certa affermazione insieme alla
sua contraria. La mancanza di contraddizioni si dice
coerenza della teoria.
Nota 1.8

Aristotele dava significati distinti alle


parole assioma e postulato (si veda al Capitolo
6 sulla Geometria Euclidea). Gli assiomi, o nozioni
comuni, sono affermazioni evidenti di per se e comuni
a tutte le scienze (ad esempio: se due oggetti sono
uguali ad un terzo, allora sono anche uguali tra di
loro). I postulati sono invece verit`
a specifiche della

1.6. LA NOMENCLATURA DELLA MATEMATICA

29

direttamente. La coerenza della teoria di Peano ci


dice che tutte le affermazioni che possiamo dimostrare sono vere nel senso detto: vorremmo anche che,
viceversa, tutte le affermazioni vere potessero essere
dimostrate. Qui entra in ballo la completezza e ci
farebbe piacere dimostrare che la teoria di Peano `e
completa, cosa che potrebbe essere ragionevolmente
vera, visto che i Matematici sono riusciti a costruire
(quasi) tutta la Matematica conosciuta partendo da
quegli assiomi. Qui, per`o, viene il difficile, poiche si
tratta di dimostrare qualcosa di generale sulla teoria agendo dallinterno della teoria stessa. Nel 1928,
il logico e Matematico austriaco Kurt Godel riusc` a
dimostrare (proprio dallinterno della teoria) che gli
assiomi di Peano non sono completi, cio`e che esistono
affermazioni vere, ma indimostrabili. Non solo, ma
egli fece vedere che qualunque teoria che comprenda
gli assiomi di Peano (e quindi voglia assiomatizzare
lAritmetica e la Matematica) `e di per se non comIn un certo senso, la coerenza di una teoria si rife- pleta. In altre parole, la nostra speranza di poter
risce al nostro desiderio che, allinterno della teoria, dimostrare tutto ci`o che `e vero nella Matematica `e
non si riescano a dimostrare troppe affermazioni, un sogno destinato comunque a fallire.
cos` tante da includere anche la negazione di un teoreUn aspetto, infine, forse meno importante ma cerma gi`a dimostrato vero. Allopposto, desidereremmo
to
interessante, `e costituito dallindipendenza dei vari
anche che la teoria non fosse troppo ristretta da non
assiomi
di una teoria. Un assioma si dice indipenpermetterci di dimostrare affermazioni che sappiamo
dente
dagli
altri considerati, se, togliendolo dalla foressere vere e che vorremmo fossero incluse nellambito
mulazione
della
teoria, questa perde una parte dei
della teoria. Se i nostri assiomi sono troppo specifici o
le regole con cui effettuiamo i nostri ragionamenti non suoi teoremi. Questa affermazione pu`o essere messa
sono abbastanza potenti, rischiamo di non arrivare a in positivo dicendo che un assioma dipende dagli altri
dimostrare fatti che, invece, per la nostra esperien- assiomi della teoria, se esso pu`o essere dimostrato a
za o anche solo per la nostra volont`a, dovrebbero far partire da quelli (e pertanto non `e un vero assioma).
parte della teoria che stiamo sviluppando. Una teo- Fondare una teoria su assiomi indipendenti vuol dire
ria (coerente) nella quale si possono dimostrare tutti riuscira a svilupparla con un numero minimo di coni teoremi che sono veri si dice completa. Quindi, cetti dati per buoni; questo rientra in quel gusto
in altre parole, una teoria ideale o perfetta `e una estetico che i matematici hanno per la loro scienza e
teoria coerente e completa, nel senso preciso che in del quale parlavamo gi`a nella Premessa.
disciplina che stiamo studiando; la loro evidenza `e
subordinata al fatto che si abbia idea della disciplina
in questione. Ad esempio, un postulato della Geometria Euclidea `e: Tutti gli angoli retti sono uguali,
il che `e s` apparentemente vero, ma occorre che si
sappia che cos`e un angolo retto. Il famoso postulato
Per un punto P esterno a una retta r passa una
e una sola retta parallela ad r (dato da Euclide
in tuttaltra forma; si veda ancora il capitolo sulla
Geometria Euclidea) non `e stato mai considerato
troppo evidente e, come `e noto, ha dato origine alle
Geometrie non Euclidee, teorie che sono coerenti (se
ne danno semplici modelli nella nostra realt`
a forse
Euclidea), ma nelle quali `e evidente che per P
possono passare infinite rette parallele ad r, o anche
nessuna. Oggi la distinzione tra assioma e postulato
`e caduta e si usano indifferentemente i due termini
per indicare gli elementi di base di una teoria.

una tale teoria si riescono a dimostrare tutte e sole le


affermazioni vere.
Possiamo forse essere pi`
u precisi facendo un esempio importante. Nella Nota 2.8 vedremo lassiomatizzazione dellAritmetica proposta da Peano; in realt`a,
essa `e molto di pi`
u, poiche pu`o essere presa come
base dellassiomatizzazione di tutta la Matematica.
Che essa sia coerente, `e ragionevole pensarlo, dato
che gli assiomi sembrano adattarsi bene alle propriet`a
dei numeri naturali che essi vogliono descrivere; ci
aspettiamo pertanto che tutti i teoremi che in essa
riusciamo a dimostrare siano veri. Dire che unaffermazione `e vera significa qui che essa `e verificata
nel mondo della Matematica, reale o ideale che esso
sia. Ma come possiamo dire che unaffermazione `e vera in questo senso? Le affermazioni della Matematica
(ma basta considerare quelle dellAritmetica) coinvolgono in generale un numero infinito di oggetti (cio`e,
di numeri) e quindi `e impensabile poterli verificare

Ma cosa significa dimostrare? Il senso comune ci


fornisce alcune regole che ci permettono di stabilire se
una frase `e conseguenza logica di unaltra frase, come
Se non ti metti le scarpe, andrai scalzo. Lesperienza ce ne fornisce altre di tipo pi`
u specifico, come: Se
non ti metti la maglia, prenderai un raffreddore. Come si vede, le prime regole prescindono dal contenuto
particolare della frase e si basano su una riformulazione dello stesso concetto: non mettersi le scarpe o
andare scalzi significano la stessa cosa. Queste regole
possono sembrare ovviet`a, ma spesso si rivelano pi`
u
utili di quanto non ci si aspetterebbe: esse sono le comuni regole della logica e tutti i ragionamenti, sia in
Matematica sia nella vita di tutti i giorni, ne fanno
largo uso. Il secondo tipo di regole `e specifico dellargomento che si sta trattando, cio`e della teoria che
stiamo elaborando: la frase precedente sul raffreddore fa parte (con un po di fantasia) della Medicina
e non della Matematica, ma si possono fare esempi

30

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

come Se A, B, C sono tre punti su una retta ed A


`e compreso tra B e C, allora la distanza di A da B
`e minore della distanza di B da C. Le regole di
deduzione specifiche di una teoria si dicono regole di
inferenza della teoria e, assieme agli assiomi, costituiscono la base della teoria stessa. Sviluppare una
teoria significa dedurre le conseguenze possibili degli
assiomi usando le regole della logica e le regole di inferenza. Nella prossima sezione vedremo le tecniche
pi`
u importanti che ricorrono nelle dimostrazioni della
Matematica.
Che gli assiomi siano coerenti tra di loro `e, di solito,
facile a vedersi; pi`
u difficile `e capire se, procedendo
nello sviluppo della teoria, non si arriver`a mai a qualche contraddizione. Un metodo consiste nel cercare
nella realt`a un modello della teoria, cio`e una parte
della realt`a che soddisfi gli assiomi della teoria. Se
abbiamo fiducia nella coerenza della realt`a (che cio`e
questa non cada in contraddizione con se stessa), questo adeguarsi del modello alla teoria ci pu`o rassicurare sulla coerenza di questultima. Riassumendo, una
teoria `e costituita:

parola teorema `e oggi un termine generico che indica tutte le conseguenze possibili degli assiomi. Nella
pratica, si lascia il nome di teorema ai risultati veramente importanti, e si preferisce usare i seguenti
termini in situazioni pi`
u specifiche:
osservazione e proposizione: allargando un
po il concetto di affermazione singolare questi
nomi indicano risultati di semplice verifica, cio`e
dimostrabili senza sforzi, in maniera elementare
e di solito non interessante;
lemma: indica un teorema che non `e un risultato importante di per se, ma che serve a semplificare la dimostrazione di uno o pi`
u risultati
interessanti (che probabilmente saranno definiti
teoremi);
corollario: si riferisce a un teorema che `e una
immediata conseguenza di un altro teorema appena dimostrato. La dimostrazione di un corollario si riduce spesso a una o due righe e, talvolta,
si pu`o omettere addirittura.

da un insieme di assiomi, che consideriamo veNon tutte le affermazioni che riteniamo vere possori per definizione e che legano tra di loro i vari no essere dimostrate; come abbiamo osservato, questo
concetti di base della teoria stessa, definendoli fatto `e intrinseco alle teorie formali e non possiamo
implicitamente;
che prenderne atto. Tuttavia, di fronte a unaffermazione che ha resistito allattacco di generazioni di
da un insieme di regole di inferenza, cio`e di mematematici, i quali hanno miseramente fallito, ma che
todi di ragionamento specifici della teoria che
ci sembra vera per varie ragioni (la sensatezza, lespeci permettono di passare dagli assiomi ad alrienza, le prove effettuate, la ricerche mediante luso
tre affermazioni vere, sempre pi`
u profonde e che
di calcolatori elettronici), non possiamo sapere se: 1)
costituiscono il corpo della teoria.
stiamo sbagliando e laffermazione `e in realt`a falsa;
2) siamo imbranati e nono siamo riusciti a trovare la
Partendo dagli assiomi e lavorando con le regole di
strada giusta per la dimostrazione, che perci`o verr`a
inferenza e le regole comuni della logica si ottengofuori fra qualche annetto; 3) siamo davvero sfortunati
no nuove affermazioni vere che si dicono teoremi. La
e ci siamo imbattuti in una proposizione pevista dal
forma generale di un teorema `e: Se `e vero un certo
teorema di incompletezza di Godel. Si usa per questa
insieme di affermazioni A1 , A2 , . . . , Ar , allora `e vera
situazione il termine:
laffermazione B; si dice che A1 , A2 , . . . , Ar costituiscono le ipotesi del teorema e che B `e la tesi. Se il
congettura: si riferisce ad affermazioni che
teorema risulta vero, si dice anche che A1 , A2 , . . . , Ar
pensiamo essere vere, ma per le quali non
sono condizioni sufficienti per B, o che B `e condizione
conosciamo (ancora) alcuna dimostrazione.
necessaria per A1 , A2 , . . . , Ar . Talvolta un teorema si
esprime nella forma pi`
u sintetica dellimplicazione A
Come esempio della terminologia introdotta, conimplica B. Alcuni teoremi assumono la forma A `e sideriamo la seguente sequenza di dimostrazioni. Covero se e solo se tale `e B; questo equivale ai due minciamo con losservare che se sommiamo i primi
teoremi A implica B e B implica A, e cio`e A `e due numeri dispari 1 e 3 otteniamo 4 = 22 . Sommancondizione necessaria e sufficiente per B. In questo do i primi tre dispari si ha 1 + 3 + 5 = 9 = 32 , e se
caso la forma sintetica `e A se e solo se B, e si dice sommiamo i primi quattro otteniamo proprio 42 . E
una doppia implicazione.
possibile dimostrare che la somma dei primi n numeri
I teoremi sono sempre affermazioni di carattere ge- dispari `e proprio n2 ? Prima di tutto dimostriamo il
nerale; ad esempio, 52 + 19 = 71 `e unaffermazione seguente:
deducibile dagli assiomi dellaritmetica. Tuttavia, essa non verr`a mai considerata un teorema, ma sempli- Lemma 1.3 I primi n numeri dispari sono
cemente una affermazione singolare della teoria. La 1, 3, . . . , 2n 1.

1.7. MATEMATICA E LOGICA


Prova: Se escludiamo lo 0, i primi n numeri sono 1, 2, . . . , n e quindi i primi n numeri pari sono
2, 4, . . . , 2n. I primi n numeri dispari sono quelli che
precedono i primi n numeri pari e quindi sono proprio
1, 3, . . . , 2n 1.
Questo risultato ci serve ora a dimostrare:
Teorema 1.4 La somma dei primi n numeri dispari
vale:
1 + 3 + + (2n 1) = n2 .
Prova: Posto S = 1 + 3 + + (2n 1), si ha anche
S = (2n 1) + + 3 + 1. Sommando le coppie
di elementi corrispondenti si ha: 2S = 2n + 2n +
+ 2n + 2n = 2n2 , essendo la somma composta di
n termini tutti uguali a 2n. Dividendo per 2 si ha il
risultato desiderato.
Questo `e il nostro teorema importante che ha come
conseguenza immediata:
Corollario 1.5 La media dei primi n numeri dispari
`e uguale ad n.
Prova: Essendo n i numeri, la media `e S/n =
n2 /n = n.
Ricordiamo infine che la forma canonica o normale
di un oggetto matematico `e unespressione che denota quelloggetto in una maniera standard, secondo
opportune convenzioni, ed `e adatta a semplificare le
elaborazioni relative a quelloggetto. Ad esempio, la
forma canonica di unequazione di secondo grado `e
ax2 + bx + c = 0, e da questa forma si deducono le
eventuali soluzioni. La forma normale di una retta
(non perpendicolare allasse delle x) `e y = mx + b,
dove m `e la pendenza e b `e lintercetta, cio`e il valore dellintersezione con lasse delle y. Tuttavia, in
particolari contesti, si considera come forma canonica
della retta ax + by + c = 0 e quando si voglia trovare
lintersezione di due rette si preferisce una terza forma canonica, e cio`e ax + by = c, che vale anche per
le rette perpendicolari allasse delle x.

1.7

Matematica e Logica

Il ragionamento matematico `e un caso particolare del


ragionamento logico e, pi`
u in generale, le teorie matematiche sono parte delle teorie logiche. Spesso, oggi, si tende ad identificare Matematica e Logica, perche questultima pu`o essere formalizzata in una teoria
matematica. Dal nostro punto di vista, volutamente
elementare, questa identit`a interessa come curiosit`a,
piuttosto che come situazione effettiva. Tuttavia, non
possiamo ignorare le grandi e importanti connessioni che legano Matematica e Logica. In particolare,
`e bene mettere in evidenza quelle parti, o almeno

31
quei concetti della Logica che hanno un immediato
riscontro nella Matematica.
La teoria logica pi`
u elementare `e senza dubbio il
Calcolo proposizionale o Logica delle proposizioni. Inventata da Boole (1815 1864) alla met`a del 1800,
e sviluppata dai matematici inglesi di quel periodo,
questa teoria tratta in modo del tutto generale delle
proposizioni, ove informalmente con questo termine
si intende ogni affermazione che possa essere vera o
falsa. Questo esclude dalla teoria le domande e le
esclamazioni, ma comprende quasi tutto il discorso
comune. Per questo la sua connessione con la Matematica `e forte e deve essere conosciuta. Gli esempi
che faremo sono presi dalla lingua parlata, ma cercheremo di dare anche significativi agganci alle proposizioni della matematica, in particolare ai teoremi.
Nel Capitolo 4 dedicheremo la Sezione 4.6 al calcolo
delle proposizioni; per il momento ci accontentiamo
di introdurre i concetti e le tecniche principali.
Le proposizioni che si prendono in considerazione
devono sempre essere ben determinate; cos` la frase
domani `e domenica suppone che si stia ragionando in un preciso giorno e che quindi la frase sia vera
(siamo di sabato) o falsa (siamo in qualche altro giorno della settimana); va cio`e esclusa lidea che la frase
possa dipendere dal giorno in cui `e stata pronunciata.
Le frasi con questultimo intendimento, che prevedono una variabilit`a del discorso in funzione di quale
giorno della settimana `e oggi, non sono proposizioni,
ma nella terminologia della Logica si dicono predicati
e hanno una propria teoria, alla quale accenneremo
nella Sezione 1.8. Analogamente, la frase Carlo `e
andato a Roma presuppone che sia perfettamente
individuato il Carlo di cui si parla, e questo `e un
coltello faccia riferimento a un oggetto ben definito,
che pu`o essere o non essere un coltello.
La negazione di una proposizione `e unaltra proposizione, che risulta vera o falsa a seconda che quella
originaria fosse falsa o vera. Ovviamente, se il Carlo di cui parliamo `e andato a Roma, la proposizione
Carlo non `e andato a Roma `e una proposizione falsa. Ci`o pu`o essere espresso sinteticamente per mezzo
della tabella di verit`
a che esprime, in funzione dei
possibili valori di verit`a di p, il valore di verit`a della
negazione p; assumendo come convenzione che 1 indichi il valore vero e 0 il valore falso, la tabella
`e:
p p
0 1
1 0
La congiunzione di due proposizioni `e la proposizione che si ottiene interponendo la congiunzione e
fra le due proposizioni; ad esempio Carlo `e andato
a Roma e si `e iscritto allUniversit`a. La congiunzione `e vera se e solo se risultano vere entrambe le

32

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

con p q. Questa `e la forma dei teoremi della Matematica, ma naturalmente la lingua comune `e piena
di implicazioni: Se vai da Carlo [allora] riportagli il
suo libro. La doppia implicazione si esprime . . . se e
solo se . . . , `e assai comune in Matematica, molto meno nei discorsi di tutti i giorni, dove, creando sovente
pi`
u di qualche ambiguit`a, si preferisce esprimersi con
semplici implicazioni: Pagher`o se mi conviene di
solito significa Pagher`o se e solo se mi conviene,
anche se, letteralmente, chi ha pronunciato la frase
non ha detto se pagher`o allora mi conviene, ma si
`e limitato a dire: se mi conviene allora pagher`o. La
notazione per la doppia implicazione `e p q.
La verit`a o falsit`a di una implicazione `e un problema non del tutto banale. Normalmente, come si
`e detto, se p q `e unimplicazione, p si dice lipotesi e q la tesi. Se lipotesi `e vera e ragioniamo in
modo corretto, vogliamo che sia vera anche la tesi,
anzi non possa essere falsa. Se la tesi risulta falsa,
significa semplicemente che abbiamo sbagliato la deTale formalismo, che qui `e appena accennato, ma
duzione, cio`e siamo di fronte a una non-implicazione.
che svilupperemo nel Capitolo 4, serve almeno a dare
Secondo la tradizione, questa regola si dice modus pounespressione semplice ad antichi principi:
nens e si enuncia: se p `e vera e p implica q `e vera,
allora
`e vera q:
principio del terzo escluso (tertium non datur): la proposizione p `e vera o falsa, cio`e p = 1
((p (p q)) q.
oppure p = 0. Questo principio, per noi, fa parte
della stessa definizione di proposizione;
Daltra parte, se una deduzione `e corretta, ma la te-

proposizioni che la compongono. La disgiunzione di


due proposizioni si ottiene interponendo tra di esse
la congiunzione oppure con significato disgiuntivo,
cio`e che la verit`a di una proposizione non esclude la
verit`a dellaltra. Un esempio significativo `e manger`o
il dolce oppure [manger`o] la frutta, volendo intendere che comincer`o a mangiare uno dei due e poi, se
avr`o ancora fame, manger`o anche laltro (conoscendomi, avrei potuto dire manger`o il dolce e la frutta,
ma un po di ritegno non guasta mai). La disgiunzione `e vera quando almeno una delle due proposizioni
di partenza `e vera, o sono vere tutte due, come illustrato nellesempio. Le rispettive tabelle di verit`a
sono:
p q pq
p q pq
0 0
0
0 0
0
0
1
0 1
0 1
0
1
1 0
1 0
1 1
1 1
1
1

principio di non contraddizione: la verit`a si `e manifestamente falsa, dobbiamo concludere che


di p esclude la verit`a di p, e viceversa, cio`e lipotesi era falsa. Nella logica aristotelica questo si
p p = 0. La congiunzione di p e della sua dice modus tollens e si formalizza:
negazione `e sempre una proposizione falsa, cio`e
((p q) q) p.
`e una contraddizione.
Questo `e ragionevole, ma quando lipotesi `e falCome avremo modo di ribadire pi`
u volte, nella Logica
sa, cosa ci possiamo aspettare? Se lipotesi `e falsa,
e nella Matematica moderne, questi principi non si
supporla vera `e un controsenso o una contraddizione,
reputano pi`
u validi in senso assoluto.
e da una contraddizione possiamo ricavare tutto ci`o
Boole dimostr`o che i tre modi di connettere le proche vogliamo, cio`e possiamo ricavare tanto tesi false
posizioni (e il loro nome tecnico `e appunto connettivi
quanto tesi vere. Quindi, in conclusione, limplicalogici) sono sufficienti a generare tutti i possibili lezione sar`a vera qualunque sia la verit`a o falsit`a della
gami tra proposizioni, e noi lo vedremo nella sezione
tesi.
dedicata al calcolo delle proposizioni. Esistono tuttavia altri connettivi logici importanti. Lesclusione
Nota 1.9
Questo punto non `e intuitivo poiche
fra due proposizioni si ottiene, come la disgiunzione,
tendiamo a rifiutare lidea che se partiamo da
mettendole insieme con la congiunzione oppure, ma
unipotesi falsa ragionando bene possiamo arrivare
tanto a conclusioni vere che false. Ma limplicazione
il significato di questa deve essere esclusivo, cio`e lun
p q indica la correttezza della deduzione, e quindi
caso deve escludere laltro; cos` possiamo dire: Non
dal
vero non possiamo dedurre il falso, ma dal falso
abbiamo molto tempo: passiamo dal supermercato o
possiamo
dedurre tutto ci`
o che vogliamo. Si narra
andiamo dal commercialista intendendo che se facche ad una conferenza Bertrand Russell (1872 1970)
ciamo una cosa non potremo fare laltra. Lesclusiocercasse di spiegare questo punto. Uno dei presenti,
ne, pertanto, `e vera se e solo se una sola tra le due
allora, lo sfid`
o a dimostrare dallipotesi falsa 1 = 2
proposizioni `e vera; essa si indica con la notazione
che lui, Russell, e la Regina di Inghilterra erano la
p q.
stessa persona. Russell non ci stette a pensar molto
Limplicazione si esprime di solito con se . . . , ale propose il seguente ragionamento: Io sono una
lora . . . , dove le ellissi stanno ad indicare le due
persona; La Regina dInghilterra `e una persona;
quindi io e la Regina di Inghilterra siamo due
proposizioni da collegare; simbolicamente, si denota

1.7. MATEMATICA E LOGICA


persone, Ma se 1 = 2, allora queste due persone
sono una persona sola; In conclusione, io e la
Regina dInghilterra siamo la stessa persona. Laneddoto `e probabilmente inventato, ma illustra bene
come lipotesi falsa serva a cambiare le carte in tavola pur rimanendo nellambito della corretta deduzione.

Possiamo mettere le cose in modo un po diverso.


Quando diciamo se piove apro lombrello, possiamo
dire, con lo stesso significato, Non piove oppure apro
lombrello. Analogamente, Se ti affretti arriverai in
tempo alla stazione si pu`o dire: Non ti affretti oppure arriverai in tempo alla stazione. Questo significa che p implica q `e equivalente alla disgiunzione
fra la negazione dellipotesi da una parte, e la tesi
dallaltra. Il proverbio Chi non risica non rosica
significa se non rischi non ottieni niente, il che si
pu`o anche dire o rischi oppure non ottieni nulla. E
chi dorme non piglia pesci vale come o sei sveglio
oppure non pigli pesci, e si potrebbe continuare con
uninteressante carrellata sui pi`
u noti proverbi. La
conclusione `e che limplicazione p q equivale alla
disgiunzione p q.
Un aspetto importante di questa constatazione riguarda il fatto che la disgiunzione `e vera anche quando tutte e due le proposizioni coinvolte sono vere.
Pertanto, nellesempio di chi dorme non piglia pesci
si pu`o verificare, come tutti sappiamo per esperienza,
che uno sia sveglio, ma non riesca a prendere pesci.
In effetti, quello che il proverbio assicura `e che per
poter prendere pesci bisogna essere svegli, ma questo
fatto, di per se, non assicura che i pesci li prenderemo
davvero. Questo significa che la proposizione inversa
chi non piglia pesci, dorme non `e necessariamente vera, cio`e non `e deducibile dal proverbio. Il mio
esempio favorito `e un altro proverbio: Fortunato in
amor non giochi a carte che significa Se sei fortunato in amore, sarai sfortunato alle carte. Talvolta
il proverbio si usa per consolare chi perde al gioco,
suggerendo che questo fatto voglia dire che la persona `e fortunata in amore. Ma il proverbio non afferma
questo, come si capisce con un attimo di riflessione; se
poi lo parafrasiamo come O sei sfortunato in amore
oppure sei sfortunato al gioco, si intende bene che
una persona, ahim`e, pu`o essere sfortunata tanto in
amore quanto al gioco.
Il seguente schema fa il punto su una terminologia
che va conosciuta:
p

q
implicazione diretta
p q implicazione inversa
Se
q

p
implicazione contraria
q p implicazione contropositiva
la verit`a di una implicazione non comporta la verit`a
della sua contraria, comporta per`o la verit`a della cosiddetta contropositiva, cio`e la proposizione che dalla
negazione della tesi fa discendere la negazione del-

33
lipotesi. Esemplificando, possiamo osservare che `e
la stessa cosa dire Se sei fortunato in amore, sarai
sfortunato al gioco oppure Se sei fortunato al gioco, allora sarai sfortunato in amore. O anche Se
dormi non pigli pesci o Se pigli pesci allora non
dormi. In altre parole, una implicazione e la sua
contropositiva sono proposizioni equivalenti e una `e
vera se e solo se `e vera laltra, cio`e p q risulta vera se e solo se tale risulta q p. Questo viene
sfruttato ampiamente in Matematica dove, spesso, si
usa dimostrare la proposizione contropositiva invece
di dimostrare direttamente un teorema. Questo tipo
di prova viene di solito introdotto cos`: Supponiamo
per assurdo che la tesi sia falsa e prosegue tentando di dimostrare che `e vera la negazione dellipotesi.
Talvolta, del tutto impropriamente, questa tecnica `e
detta dimostrazione per assurdo, che in realt`a `e
tutta unaltra cosa e la vedremo un po pi`
u avanti.
Facciamo un semplice esempio di dimostrazione
nella quale, invece di provare lasserto del teorema,
dimostriamo la proposizione contropositiva:
Teorema 1.6 Se il numero intero positivo n non `e
un quadrato perfetto ed n = p q, allora il quadrato
di uno dei fattori `e minore di n e il quadrato dellaltro
fattore `e maggiore di n.
Prova: Intanto, non pu`o essere p2 = n o q 2 = n, altrimenti n sarebbe un quadrato perfetto. Allora deve
essere p 6= q. Se supponiamo falsa la conclusione del
teorema, allora i due quadrati p2 e q 2 devono essere
tutti e due minori o maggiori di n. Nel primo caso per`o abbiamo p2 q 2 < n2 , cio`e p q < n e in
modo analogo nel secondo p q > n, contro lipotesi
p q = n.
Spesso, come s`e ricordato, questo tipo di dimostrazione `e detto per assurdo, ma le vere dimostrazioni
per assurdo hanno uno schema un po pi`
u complicato. Per dimostrare limplicazione p q si suppone
che valga p e che q sia falsa, cio`e sia vera la sua negazione. In altre parole, si parte immaginando vera
la proposizione p q e da essa si cerca di ottenere
una contraddizione o assurdit`a, che `e quello che d`a il
nome al modello di dimostrazione. Una contraddizione `e semplicemente una proposizione senzaltro falsa,
cio`e la negazione di un assioma A o di un teorema
T che abbiamo gi`a dimostrato essere vero. Cos` facendo sappiamo che p q deve essere falsa, perche
altrimenti avremmo la dimostrazione che lassioma A
o il teorema T sono tanto veri che falsi, cio`e la nostra
teoria (la Matematica) non `e coerente, il che sarebbe
un tantino grave. Ma se p q `e falsa, allora o p `e
falsa oppure, se p `e vera, q `e falsa, cio`e q `e vera. Ma
questo, per la discussione fatta in precedenza, vuol
dire proprio che p implica q, cio`e che p q `e vera.
Una celebre e antichissima dimostrazione per assur-

34

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

do `e la prova che 2 non `e un numero razionale; si 3n(n + 1) = 6h; si ha allora m3 m = 6k + 6h =


veda, per questo, il Teorema 3.18. Se indichiamo con 6(k+h), cio`e m3 m `e divisibile per 6. Ecco lassurdo:
quindi m non pu`o esistere e V deve essere vuoto.
r lassioma A o il teorema T , lo schema `e:
Conclusione, la propriet`a vale per ogni n N.
(r ((p q) r)) (p q).
Infine, un ultimo schema di dimostrazione che vogliamo ricordare `e il seguente. Cominciamo con losservare che ogni sottoinsieme di N possiede un elemento minimo, cio`e pi`
u piccolo di tutti gli altri. Spesso e volentieri non ha un massimo, come linsieme dei
numeri pari o quello delle potenze del 3, ma un minimo ce lha sempre. Supponiamo allora di voler dimostrare che una certa propriet`a vale per tutti i numeri
naturali; questo, in altre parole, significa che linsieme V dei numeri naturali che non godono di quella
propriet`a `e vuoto. Immaginiamo allora che V non
sia vuoto e che quindi contenga un elemento minimo
m. Cerchiamo ora di dimostrare due cose: primo, che
per 0 la propriet`a `e valida. Questo prova che m > 0 e
quindi che se poniamo m = n + 1, per n la propriet`a
deve essere valida. Come seconda cosa cerchiamo di
dimostrare che se la propriet`a `e vera per il numero n,
allora deve essere vera anche per n + 1, cio`e per m.
Se ci riusciamo siamo giunti ad un assurdo, e quindi
lipotesi che V non sia vuoto `e errata. Ma V = vuol
dire che la propriet`a `e valida per tutti i valori di N,
che `e proprio quello che volevamo.
Un esempio potr`a essere illuminante. Dimostriamo
la proposizione: per ogni valore di n N, n3 n `e
divisibile per 6. Il lettore pu`o divertirsi a calcolare
n3 n per 0, 1, 2, 3, 4 e verificare che la propriet`a vale; ma, ci chiediamo, `e davvero valida per ogni n N?
Certo, se tentiamo per uno specifico valore, diciamo
n = 364, troviamo che davvero 3643 364 = 48228180
`e divisibile per 6, ma chi ci dice che non esista un numero (semmai grandissimo) per cui la verifica fallisce?
Procediamo allora come s`e visto:
Teorema 1.7 Qualunque sia il numero naturale n
N, la quantit`
a n3 n `e divisibile per 6.
Prova: Supponiamo che esista qualche numero n
per cui n3 n non `e divisibile per 6 e chiamiamo V
linsieme di questi numeri. Per le prove effettuate, i
numeri da 0 a 4 non stanno in V , e quindi sia m 6= 0
il pi`
u piccolo elemento di V . Se n `e il numero che
precede m, n 6 V e dobbiamo avere n3 n = 6k, per
qualche k N. Consideriamo m = n+1 e calcoliamo:
m3 m = (n+1)3 (n+1) = n3 +3n2 +3n+1n1 =
= n3 n + 3(n2 + n) = 6k + 3n(n + 1).
Osserviamo ora che 3n(n + 1) `e un numero senzaltro
divisibile per 6, poiche il fattore 3 `e presente in modo
esplicito e, sicuramente, uno dei numeri n o n + 1 `e
pari (se non `e pari n, deve esserlo n + 1). Poniamo

Nota 1.10

Questo tipo di dimostrazione `e molto


importante, anche se noi ne limiteremo luso al minimo
indispensabile. La tecnica viene detta dimostrazione
per induzione matematica e spesso si formula nella seguente maniera. Sia P (n) una propriet`
a che dipende
dal numero naturale n. Se P (0) `e vera e possiamo
dimostrare che dalla verit`
a di P (n), con n un generico numero naturale, discende la verit`
a di P (n + 1),
allora P (n) `e vera per ogni n N. Il procedimento
che abbiamo visto sopra `e la dimostrazione di questo
principio di induzione matematica. Infatti, abbiamo
verificato che il minimo numero m che non verifica
la propriet`
a non pu`
o esistere. Intuitivamente, il senso
del principio `e il seguente: se verifichiamo direttamente che P (0) `e vera, dal fatto che P (n) implica P (n+1)
possiamo dedurre che anche P (1) `e vera. In modo analogo, da P (1) discende la verit`
a di P (2), e cos` via per
ogni valore di n.
Il principio di induzione `e molto usato in tante parti
della Matematica, dove si rivela un potente metodo di
dimostrazione. Tuttavia, esso ha una serie di inconvenienti, il primo dei quale `e che per poterlo applicare
occorre gi`
a conoscere la soluzione del problema che
vogliamo affrontare. Ad esempio, di fronte alla quantit`
a n3 n, occorre gi`
a sapere che essa `e divisibile per
6, se vogliamo dimostrare tale fatto per induzione. In
altre parole, il principio funziona da verifica, ma non
`e un metodo costruttivo, cio`e un metodo che ci faccia
capire come si `e arrivati alla soluzione del problema.
Da questo punto di vista, il principio di induzione `e
antieducativo e proprio per questo ne limiteremo luso, anche se si tratta di un metodo validissimo di dimostrazione. Ci si deve rendere conto che, di regola,
`e molto pi`
u facile verificare una certa propriet`
a che
scoprirla; il principio di induzione ci d`
a una prova di
quella propriet`
a, ma nulla ci dice su come affrontare
la ricerca di propriet`
a analoghe. Noi lo considereremo
una specie di ultima spiaggia a cui ricorrere quando
proprio non c`e altro da fare.
Per chiudere questa nota in modo poco serio, vediamo
come lapplicazione del principio di induzione richieda
qualche cautela. Chi ha mai contato il numero delle
foglie di un albero? Ebbene, ora dimostreremo che
(qualunque sia tale numero) tutti gli alberi hanno la
stessa quantit`
a di foglie! Il nostro ragionamento parte
con una base P (1), cio`e con un insieme costituito
da un unico albero: tale albero ha un certo numero
di foglie, che ovviamente `e lo stesso per tutti gli
alberi dellinsieme, cio`e lui. Supponiamo allora di
aver dimostrato che tutti gli insiemi di n alberi sono
costituiti da alberi con la stessa quantit`
a di foglie e
prendiamo un insieme A composto di n + 1 alberi. Se
da A togliamo un albero a, rimaniamo con un insieme
di n alberi che, per lipotesi di induzione, hanno

35

1.8. PREDICATI
tutti lo stesso numero di foglie. Rimettiamo a in A e
togliamo ora un albero b diverso da a. Abbiamo un
altro insieme di n alberi e, di nuovo, tutti debbono
avere lo stesso numero di foglie. Quindi, anche a ha
lo stesso numero di foglie di tutti gli altri, e quindi
gli n + 1 alberi di A hanno tutti la stessa quantit`
a
di foglie. La conclusione, ora, `e la straordinaria
affermazione fatta in precedenza. Dove abbiamo
sbagliato?

1.8

Predicati

Una teoria ben pi`


u vasta del calcolo proposizionale `e il cosiddetto calcolo dei predicati. A suo tempo abbiamo definito un predicato come una funzione
p : A {0, 1}, dove A `e un insieme qualsiasi. Abbiamo fatto anche esempi significativi, ma veniamo
ora a spiegare qual `e laggancio fra predicati e proposizioni. Un esempio semplice di predicato su N `e
n 5; se indichiamo con p(n) tale predicato, si ha
p(10) = 1 e p(2) = 0, poiche p(10) `e la proposizione vera 10 5, mentre p(2) `e la proposizione falsa
2 5. Questo ci fa intendere che un predicato si
trasforma in una proposizione ogni volta che specifichiamo lelemento di A che funge da argomento del
predicato stesso. Linsieme A pu`o anche essere il prodotto cartesiano di vari insiemi; se A = B C, un
predicato p : B C {0, 1} `e un predicato binario
p(x, y) che diviene una proposizione (e quindi assume
uno dei due valori 0 = falso oppure 1 = vero) quando
assegniamo ad x uno specifico elemento b B e ad y
uno specifico elemento c C. Secondo la terminologia classica, x ed y si dicono le variabili, nel senso che
il loro valore pu`o variare nel dominio del predicato
(B e C nel caso presente, A in precedenza). Quindi,
p(b, c) `e una proposizione, ma p(b, y) e p(x, c) sono
predicati monadici, il primo su C e il secondo su B.
In modo analogo, si parla di predicati ternari o triadici, quaternari, e cos` via. A causa di questa relazione
tra proposizioni e predicati, questi ultimi si dicono
forme proposizionali o anche forme enunciative; noi
preferiremo sempre il termine predicato.
Nota 1.11
Il problema della soddisfacibilit`
a di un predicato k-ario p(x1 , x2 , . . . , xk ) su
A1 A2 Ak `e quello di scoprire (se esistono)
k valori a1 A1 , a2 A2 , . . . , ak Ak che rendono
vero il predicato, tali cio`e che p(a1 , a2 , . . . , ak ) = 1.
Anche se gli insiemi A1 , A2 , . . . , Ak sono finiti, e
quindi il problema `e senzaltro risolubile, la sua
complessit`
a `e esponenziale, cio`e cresce in modo tale,
al crescere di k, che nessun calcolatore, per veloce
che sia, `e in grado di arrivare alla soluzione in tempi
ragionevoli. Tecnicamente, un problema del genere
`e detto di complessit`
a NP (si veda anche la Nota
4.4). In particolare, la soddisfacibilit`
a `e un problema

NP completo, tale cio`e che se potesse essere risolto


in modo veloce (cio`e in tempo polinomiale nel
numero dei suoi argomenti k) dimostrerebbe che tutta
una classe di problemi di complessit`
a NP avrebbero
anchessi una soluzione veloce. Questo sarebbe molto
importante per linformatica che trova nei problemi
NP una classe di problemi ostica, particolarmente
difficile ad essere risolta in tempi di calcolo ragionevoli, diciamo in qualche giorno, se questo vi pare poco.

La natura dei predicati pu`o essere la pi`


u varia. E
un predicato la frase p(x) = Il signor x `e nato a
Scandicci. Il mio amico Carlo `e nato a Lastra a
Signa, per cui p(Carlo) = 0, mentre mio cugino Luigi
`e nato proprio a Scandicci, per cui p(Luigi) = 1. In
Matematica, siamo di solito interessati a predicati di
tipo numerico, tipo p(n) =Il numero n3 n, per
n N, `e divisibile per 6 oppure q(x) = Il numero
reale x `e tale ch x2 + 1 = 0. Ogni equazione `e in
effetti un predicato, come x2 + x 2 = 0; ogni valore
che rende vero questo predicato si dice una soluzione
o radice dellequazione (si veda la Sezione 5.2); in
questo specifico esempio, le soluzioni sono x = 1 ed
x = 2, come si verifica facilmente facendo i calcoli
o risolvendo lequazione. Se una equazione `e vera
qualunque sia il valore assunto dalla sue variabili, essa
si dice pi`
u propriamente una identit`
a. Un classico
esempio di identit`a `e dato dalla regola della differenza
dei quadrati, ovvero del prodotto di una somma per
la differenza, a secondo del punto di vista da cui si
legge:
x2 y 2 = (x + y)(x y).
Quello di assegnare un valore specifico ad ognuna
delle variabili non `e il solo modo per trasformare un
predicato in una proposizione. A proposito del precedente predicato su n N, abbiamo gi`a visto che `e
vera la proposizione: per ogni valore di n N, il numero n3 n `e divisibile per 6. Naturalmente, proprio
il fatto che sia vera ci assicura che questa `e una proposizione; se osserviamo bene, ci rendiamo conto che
il predicato originale si `e trasformato in una proposizione perche vogliamo considerare che cosa succede
per ogni valore di n N. In modo analogo, se consideriamo la frase: Per ogni numero reale x si ha
x2 + 1 > 0 basata sul predicato: x2 + 1 > 0. La
frase `e vera perche x2 0, qualunque sia x R, e
quindi aggiungendo 1 si ha la disuguaglianza asserita. Lespressione: per ogni n N oppure per ogni
x R si dice quantificazione universale e lespressione stessa si scrive in modo compatto: n N
e x R. Il simbolo si dice quantificatore
universale e si legge sempre per ogni o qualunque
sia. Le proposizioni vere di questo tipo si dicono
verit`a generali; abbiamo visto come il principio di

36

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

induzione matematica sia un metodo per dimostrare


verit`a generali sui numeri naturali.
Talvolta `e impossibile dimostrare verit`a generali,
anche semplicemente perche non sono vere; ad esempio, non `e vero che (x R) x2 + x 2 = 0, visto
che per x = 0 si avrebbe 2 = 0, il che `e ovviamente
falso. In queste situazioni, pu`o gi`a essere utile dimostrare una verit`
a esistenziale, cio`e che esiste almeno
un numero reale x tale che x2 + x 2 = 0. Come
si sa (e come vedremo col Teorema 5.10), ci`o `e assicurato dal fatto che il determinante dellequazione,
= 1 + 8 = 9, `e non negativo, per cui possiamo
concludere che: esiste almeno un numero x R per
cui x2 + x 2 = 0. Lespressione: esiste almeno un x R si dice quantificazione esistenziale e
si abbrevia scrivendo: x R; il simbolo si
dice quantificatore esistenziale e si legge esiste almeno uno; talvolta, in modo familiare, si legge semplicemente esiste. Naturalmente, per ogni predicato
p(x), se `e vero (x A) p(x) ed A non si riduce allinsieme vuoto, allora in particolare `e vero che
(x A) | p(x), dove il simbolo si legge tale
che e pu`o essere spesso sottinteso.
Ci possono essere occasioni in cui siamo interessati
a una verit`
a esistenziale forte, cio`e un predicato che
risulti vero per un unico valore della variabile. Ad
esempio, alcuni giovani dallanimo poetico, si sforzano di dimostrare che la ragazza del momento `e lunica
donna che amano; alcuni matematici sono interessati al fatto che una certa equazione abbia ununica
radice compresa tra 0 ed 1 (ognuno ha i suoi problemi). Il quantificatore esiste uno ed un solo elemento x A si abbrevia talvolta con lespressione:
!x A. Tuttavia, si `e restii ad assegnargli un nome specifico, poiche pu`o essere parafrasato in vario
modo, come ad esempio: esiste almeno un elemento
x A tale che p(x) = 1, e se x1 , x2 A sono tali
che p(x1 ) = p(x2 ) = 1, allora `e x1 = x2 . Questo dimostra che non `e necessario introdurre esplicitamente
questo ulteriore quantificatore.
I due quantificatori e sono, in un certo
senso che ora vedremo, uno linverso dellaltro. E
chiaro che non esiste alcun numero reale x che sia
contemporaneamente minore di 5 e maggiore di 10.
Se allora p(x) =x R `e minore di 5 e q(x) =x R
`e maggiore di 10, laffermazione appena enunciata si
pu`o formalizzare scrivendo:

La precedente proposizione diviene pertanto:


(x R) (p(x) q(x))
che si legge: qualunque sia il numero reale x, non pu`o
essere vero che x < 5 e, allo stesso tempo, x > 10
(naturalmente, la negazione di a < b `e a b!). Questo passaggio ci convince, ed ora possiamo procedere
applicando la regola di De Morgan. Si ha cos`:
(x R) (p(x) q(x))
che si legge: per ogni numero reale x si ha x 5
oppure x 10. Anche questo passaggio suona bene
e ci permette di renderci conto della validit`a della
regola enunciata. Essa va di pari passo con la duale:
La negazione del quantificatore universale applicato a un predicato equivale al quantificatore
esistenziale della negazione del predicato stesso.
Continuando lesempio precedente, possiamo osservare che: Non `e vero che per ogni numero reale x,
si ha che x `e minore di 5 oppure che x `e maggiore di
10; infatti, i numeri 7 ed 8 (insieme agli infiniti altri
compresi tra 5 e 10) non sono ne minori di 5, ne maggiori di 10. La formulazione di questa proposizione
`e:
(x R) (p(x) q(x)).
Da questa si passa a:
(x R) | (p(x) q(x))
cio`e: esiste almeno un numero reale x per il quale non
`e vero che x < 5 oppure x > 10 (naturalmente, vanno
ancora bene gli esempi di prima). Infine si passa a:
(x R) | (p(x) q(x));

questo significa: esiste almeno un numero reale x per


il quale x 5 e, allo stesso tempo, x 10. Questo,
ovviamente, `e proprio vero!
I matematici, spesso, sembrano insistere un po
troppo sulla esistenza di certi oggetti matematici, come ad esempio soluzioni di equazioni, elementi
particolari, etc.. In realt`a, questo atteggiamento `e
giustificato dal fatto che, se qualcosa non esiste, si
arriva a evidenti paradossi quando si ragioni come se
invece esistesse. Lesempio classico `e il seguente: sia
N il pi`
u grande dei numeri naturali; se consideriamo
(x R) | (p(x) q(x)).
N 2 si deve avere N 2 N , dato che N non `e superaTrasformiamo questa proposizione usando la seguente to da nessun altro naturale. Semplificando, abbiamo
N 1, cio`e N = 0 oppure N = 1. Poiche 1 > 0,
regola:
abbiamo dimostrato che 1 `e il pi`
u grande dei numeri
La negazione del quantificatore esistenziale ap- naturali!
plicato a un predicato equivale al quantificatore
Esiste unevidente asimmetria tra le verit`a geneuniversale della negazione del predicato stesso.
rali e quelle esistenziali. Per dimostrare infatti che

37

1.8. PREDICATI
unaffermazione di questultimo tipo non `e vera occorre far vedere che essa non `e verificata da alcun
elemento dellinsieme S considerato, il che potrebbe
richiedere anche un tempo infinito, se infiniti sono
gli elementi di S. Viceversa, per dimostrare la non
validit`a di unaffermazione generale basta fornire un
esempio in cui essa non vale. Tale esempio costituisce
un controesempio dellaffermazione e assume il ruolo
di una vera e propria dimostrazione, ancorche negativa. Ricordiamo che da questa osservazione deriva il
concetto di falsicabilit`
a, su cui Popper costruisce la
sua filosofia della scienza.
Per dare unidea pi`
u matematica dei predicati, vorrei cercare di esporre un semplice ma importante
esempio di struttura algebrica. Con questo termine
si intende un insieme S sul quale sono definite una
o pi`
u operazioni, secondo quanto visto nella Sezione
1.3. Rispetto a tali operazioni linsieme pu`o godere
di alcune propriet`a che permettono di caratterizzare
il significato della struttura. I numeri, con le quattro
operazioni elementari sono un esempio di struttura
algebrica e tale concetto serve a generalizzare le propriet`a degli insiemi numerici rendendole indipendenti
dal concetto stesso di numero. In effetti, le strutture algebriche costituiscono largomento fondamentale
dellAlgebra Astratta, detta anche Algebra Moderna, perche si `e sviluppata negli ultimi centocinquanta anni. Ritorneremo sopra a questo argomento nel
Capitolo 5 sullAlgebra; per il momento limitiamoci
ad introdurre alcuni concetti sia validi di per se, sia
a mo di esempio dellidea di predicato che stiamo
discutendo.
Lesempio pi`
u semplice di struttura algebrica `e costituito certamente dal monoide, un insieme S con
unoperazione diadica indicata con un puntino (o la
semplice giustapposizione), detta prodotto, rispetto
alla quale S `e chiuso, gode della propriet`a associativa
e dellesistenza di una identit`a. Formalmente, il monoide si indica con la coppia (S, ) e le sue propriet`a
si riassumono cos`:
1. x, y S, il prodotto x y sta in S;
2. x, y, z S, si ha (x y) z = x (y z);
3. e S tale che x S si ha e x = x e = x.
E abbastanza naturale sentirsi sconfortati quando
ci si trovi davanti per la prima volta a una definizione del genere. Ma bisogna abituarsi poiche le strutture algebriche sono sempre definite in questo modo;
e bisogna andare oltre laspetto formale e cercare di
costruirsi unidea pi`
u concreta cercando esempi significativi. A loro volta, tali esempi permettono di
indurre propriet`a della struttura algebrica che ce la
fanno conoscere in modo pi`
u approfondito. La cosa a cui bisogna stare attenti `e di non confondere le

propriet`a specifiche dellesempio con propriet`a generali della struttura: per questo `e sempre opportuna
dare dimostrazioni formali ed astratte delle propriet`a
interessanti.
Lesempio pi`
u semplice di monoide `e costituito
dai numeri naturali con loperazione di somma, cio`e
(N, +); le sue propriet`a sono quelle stesse della somma e lidentit`a `e il numero 0. In effetti, questo `e un
monoide un po particolare, poiche per la somma vale
anche la propriet`a commutativa, cio`e:
x, y S si ha x y = y x.
Non `e per`o difficile trovare esempi nei quali la propriet`a commutativa non vale. Se A = {a1 , a2 , . . . , ak }
`e un insieme di simboli (o lettere, per cui A si dice anche alfabeto), chiamiamo A linsieme delle parole (o
stringhe) su A, cio`e le sequenze finite di simboli di A;
fra le parole mettiamo anche la parola vuota, cio`e la
sequenza priva di simboli. La concatenazione di due
parole w1 , w2 A `e la sequenza formata dai simboli
di w1 seguiti da quelli di w2 . Linsieme A con questa
operazione `e un monoide (non commutativo). Infatti,
la concatenazione di due parole `e ancora una parola
(chiusura) e la concatenazione di tre parole, comunque la si esegua w1 (w2 w3 ) oppure (w1 w2 ) w3
d`a sempre la parola formata dai simboli di w1 , seguiti da quelli di w2 , seguiti da quelli di w3 . Infine,
concatenando la parola vuota a unaltra parola, sia
che la si metta a sinistra, sia che la si metta a destra,
questultima parola non cambia.
Un terzo esempio di monoide `e costituito da
(N0 , ), cio`e linsieme dei numeri naturali (senza
lo zero) con loperazione di moltiplicazione. Questi
esempi cos` diversi ci fanno capire (o almeno intuire)
limportanza delle strutture algebriche: ragionando
in astratto sulla struttura si ottengono propriet`a che
valgono per tutti i monoidi, indipendentemente dalla
loro natura specifica. Questo, speriamo, sar`a ancora pi`
u chiaro quando, nella Sezione 5.8, faremo vari
esempi di tali dimostrazioni.
Nota 1.12

Se si pensa alla notazione a stecchini


e ai numeri naturali come a sequenze di aste, ci si accorge che i due monoidi (N, +) e (A , ) non hanno poi
natura tanto diversa, ed N altro non `e che A quando A = {|}. La commutativit`
a in N `e semplicemente
dovuta al fatto che lalfabeto si riduce a un solo elemento. Daltra parte, `e spesso importante considerare
sequenze di simboli che formalizzano espressioni e formule. Ad esempio, lAritmetica tratta sequenze del
tipo 3+(12/4), lAlgebra ha a che fare con sequenze
come 3x2 5x 8 = 0 e la logica formale considera sequenze come (p q) r, ognuna costruita su
un dato insieme di simboli. La manipolazione di tali sequenze `e un lavoro effettuato usando loperazione
di concatenazione e la sua inversa, cio`e lestrazione di

38

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA


una sottosequenza da una sequenza data. Se si vuole, lAlgebra e la Logica formale sono semplicemente
lelaborazione di simboli mediante regole di trasformazione. Questo punto di vista si `e rivelato fondamentale
per la Logica ed `e limpostazione che usano gli elaboratori elettronici per ogni applicazione non numerica.
Proprio grazie agli elaboratori attuali si ritiene ovvia la corrispondenza tra numeri e simboli (si pensi
alla codifica ASCII per i caratteri), ma tale corrispondenza, cambiando sequenze di simboli in sequenze di
numeri, non sempre `e appropriata agli scopi che soprattutto la Logica si prefigge. Pi`
u interessante sarebbe trovare una corrispondenza tra parole e numeri
tale che ad ogni parola corrispondesse un numero ben
preciso. Se lalfabeto A contiene k simboli, possiamo
pensare a w A come a un numero scritto in base
k + 1 (spiegare perche non si pu`
o pensare ai numeri in
base k). Purtroppo, in Logica si deve poter disporre
di un alfabeto (potenzialmente) infinito, per rappresentare le proposizioni e le variabili. In questo caso, il
trucco precedente non funziona pi`
u. Verso la fine degli
anni 1920, G
odel pens`
o a questa corrispondenza. Sia
A = {a1 , a2 , . . .} linsieme infinito dei possibili simboli
e sia w = ai1 ai2 . . . ain una parola non vuota su A. Se
pi indica li-esimo numero primo a partire da 2 (cio`e
p1 = 2, p2 = 3, p3 = 5, p4 = 7, p5 = 11, etc.), allora il
numero naturale corrispondente a w `e dato da:
G(w) = pi11 pi22 . . . pinn .
Ad esempio, se A = {a, b, c, d, . . .}, la parola bacca `e
rappresentata da:
22 31 53 73 111 = 5. 659. 500.
Il numero `e piuttosto alto, ma quello che interessa
non `e la manipolazione effettiva di questi numeri,
quanto piuttosto la possibilit`
a di trovare funzioni numeriche che, in principio, agiscano come le operazioni
sulle parole; questo, infatti, permette di simulare le
operazioni sulle parole o sulle espressioni per mezzo
di operazioni aritmetiche, le cui propriet`
a noi meglio
conosciamo. Il lettore volenteroso si pu`
o impegnare
a trovare funzioni che calcolano la lunghezza di una
parola (vista come numero), la concatenazione di due
parole (viste come numeri), il fatto che una parola
(numero) sia contenuta in unaltra (un altro numero),
e cos via. Naturalmente, la prima cosa da fare `e di
definire due funzioni per trasformare una parola in
un numero, e viceversa.

Una struttura algebrica un po pi`


u complessa del
monoide, ma anche molto pi`
u importante, `e il gruppo. Anche in questo caso, abbiamo un insieme G e
unoperazione , ma oltre alle propriet`a di chiusura,
associativit`a ed esistenza dellidentit`a, si richiede che
ogni elemento abbia un inverso, cio`e:
4. x G, esiste y G tale che x y = y x = e.

Un elemento y che goda di tale propriet`a si scrive


x1 e si dimostra che `e unico. Supponiamo infatti
che anche z sia un inverso di x; si ha allora:
z = z e = z (x y) = (z x) y = e y = y,
dove si sono applicate varie regole dei gruppi, in particolare la propriet`a associativa e quella dellidentit`a.
Questo, osserviamo, `e un teorema generale dei gruppi, valido, cio`e, per ogni gruppo, indipendentemente
dalla natura particolare dei suoi elementi.
A questo punto, per`o, ci arrestiamo e rimandiamo
il lettore a ci`o che diremo nella Sezione 5.8 o, meglio
ancora, ai testi universitari sullAlgebra Astratta.

Capitolo 2

Aritmetica
Legati ai numeri primi ci sono fondamentali concetti
come quello di divisibilit`a e di massimo comun divisore che, definiti dai Greci, si sono andati sempre pi`
u
sviluppando, e le loro problematiche si incontrano e
si scontrano, oggi, con quelle dei moderni elaboratori. Ad esempio, il problema della scomposizione di
un numero in fattori primi si `e rivelato essere uno dei
problemi intrattabili per eccellenza, cio`e uno dei
problemi per i quali non si conosce (e probabilmente
non `e nemmeno possibile conoscere) una soluzione in
G. Rodari Filastrocche in cielo e in terra
tempi ragionevoli (ovviamente, quando il numero `e
u poLAritmetica `e la scienza dei numeri, pi`
u propria- abbastanza grande) perfino con i calcolatori pi`
mente dei numeri naturali N = {0, 1, 2, 3, . . .}, ed `e tenti che esistono oggi o potranno esistere nel prosperci`o strettamente connessa al concetto di conta- simo futuro. Questo, per il momento, ha permesso
re, visto nel capitolo precedente. Oggi, lAritmetica di utilizzare la scomposizione dei numeri nei moder`e indissolubilmente associata alle operazioni elemen- ni metodi di cifratura per la trasmissione sicura di
tari, ed `e con queste che si affronta lo studio dellArit- informazioni riservate nelle reti di calcolatori.
metica, non appena ci siamo impadroniti dei numeri
attraverso il contare. Non sempre `e stato cos`, anzi,
fino al 1600 il saper fare di conto (detto anche logi- 2.1
Laddizione
stica) era considerata unattivit`a volgare, riservata
u semplice e naturale `e
a commercianti e banchieri piuttosto che a scienziati Certamente loperazione pi`
e filosofi. Questi, invece, erano dotti nellAritmeti- quella di sommare due numeri. Lantico pastore col
ca, inclusa come s`e detto nel Quadrivio, intesa come suo gregge di 57 pecore, alla fine dellinverno, quanscienza che studia le propriet`a dei numeri naturali. do trovava che erano nati 14 agnellini, era interessato
In questo senso, lAritmetica `e nata in Grecia, e i a sapere di essere diventato proprietario di ben 71
Pitagorici consideravano i numeri come lessenza del animali. Con numeri cos` piccoli, la somma si pu`o rimondo. Con Platone e Euclide la Geometria prese condurre al contare: il pastore poteva prima contare
il sopravvento, ma negli Elementi Euclide dedica le vecchie pecore (o ricordare quante fossero, incidentre libri allAritmetica. In particolare, i numeri pri- do delle tacche su un osso o un tronco), arrivare cos`
mi hanno sempre attratto matematici professionisti e a 57, e poi continuare a contare gli agnelli appena nadilettanti per le loro propriet`a, spesso tra il meravi- ti: cinquantotto, cinquantanove, e via di seguito fino
glioso e lincredibile, sempre comunque imprevedibili. a 71. Non sono rari reperti archeologici, risalenti anCi sono state persone che hanno dedicato la propria che a trentamila anni fa, costituiti da ossa di animali,
vita allo studio dei numeri primi, alla loro elencazio- sulle quali sono incise tacche con levidente scopo di
ne, nella vana ricerca di regolarit`a, di leggi e di regole registrare conteggi: queste tacche sono la prima rappresentazione pratica di ci`o che abbiamo chiamato la
specifiche.
Bisogna dire che la curiosit`a per i numeri primi notazione ad aste.
`e comune a tutta lumanit`a e non `e solo appannagQuando i numeri cominciano a superare il centinagio della cultura occidentale, derivata da quella gre- io, la conta diretta e la notazione ad aste diventano
ca. Oltre ai grandi matematici arabi, il celeberrimo inadeguate, ed `e per questo che si sono cercati metoteorema cinese dei resti ci dice come anche nella di pi`
u veloci per eseguire la somma, come labaco o
lontana Cina (si parla del 1200) linteresse fosse vivo. luso sapiente dei ciottoli. Questi, come le biglie delMa cosa era successo?
Che lUno e lo Zero
seduti vicini,
uno qua laltro l`
a
formavano un gran Dieci:
nientemeno, unautorit`
a!
Da quel giorno lo Zero
fu molto rispettato,
anzi da tutti i numeri
ricercato e corteggiato.

39

40
labaco, sono disposti su pi`
u linee, ognuna preposta a
rappresentare le unit`a, le decine, le centinaia e cos` di
seguito. Tale modo di disporre ciottoli o biglie prefigura la nostra notazione, ma, come s`e visto, non ci si
`e resi conto, fino a tempi relativamente recenti, come
la scrittura potesse essere direttamente utilizzata per
fare i conti.
Nella notazione posizionale, lidea fondamentale `e
che le unit`a si sommano alle unit`a, le decine alle decine, le centinaia alle centinaia, e cos` via. Questo
funziona bene se facciamo 125 + 342, e il risultato `e
proprio 467. Quando per`o tentiamo lo stesso metodo
su 347 + 158, ci troviamo subito di fronte alla difficolt`a che 7 + 8, la somma delle unit`a, ci d`a un valore
maggiore di 9 che quindi non `e rappresentabile con
ununica cifra. Tuttavia, si osserva, se prendiamo la
cifra delle unit`a di 7 + 8 = 15, cio`e 5, la decina in
pi`
u pu`o andare a incrementare il numero totale delle
decine della somma, cio`e 4 + 5, che diventa 4 + 5 + 1.
Questo `e il concetto di riporto, che ci `e ormai familiare e che spiega come comportarci ogni volta che
una somma di unit`a, di decine, di centinaia, etc., ci
porta fuori del proprio ambito. Il riporto `e la parte
che va al di l`a del gruppo di appartenenza delle cifre considerate, e quindi va ad aggiungersi alla cifra
della successiva potenza del 10: da unit`a a decine,
da queste a centinaia, e cos` via. Nel nostro esempio,
4 + 5 + 1 = 10, e di nuovo dobbiamo considerare lo
0 come cifra della somma (delle decine, questa volta)
e l1 come il riporto verso le centinaia. Qui, infine,
abbiamo 3 + 1 + 1 = 5, e quindi 505 `e il risultato
corretto. Naturalmente, il gioco del riporto spiega
perche, nel caso che avessimo avuto riporto con la cifra di valore pi`
u alto (in questo caso, delle centinaia)
avremmo dovuto scrivere il riporto stesso come cifra
della successiva potenza del 10, delle migliaia nellesempio. Cos`, 735 + 517 d`a : 5 + 7 = 12, 2 come cifra
delle unit`a e 1 come riporto; 3 + 1 + 1 = 5, che `e la
cifra delle decine; 7 + 5 = 12, cos` che 2 `e la cifra delle
centinaia e il riporto 1 diviene la cifra delle migliaia, anche se nei due numeri di partenza la cifra delle
migliaia era assente.
Limpostazione pratica della somma prevede di
scrivere i due numeri da sommare uno sotto laltro, allineati a destra. Questo fa s` che cifre omologhe, cio`e
che si riferiscono alla stessa potenza del 10, si trovino
una sotto laltra. E cos` pi`
u agevole eseguire le somme parziali procedendo da destra verso sinistra. Per
rendere spedito il calcolo, `e bene sapere a memoria
il risultato della somma di tutte le coppie possibili di cifre decimali, che riportiamo nella Tabella 2.1.
Luso della tabella `e ben noto: quando il risultato `e
ununica cifra, questa `e la cifra da trascrivere nella
somma e non si ha alcun riporto (o, se si preferisce,
il riporto `e 0); quando il risultato `e costituito da due

CAPITOLO 2. ARITMETICA

9
8
7
6
5
4
3
2
1
0

9 10
8 9
7 8
6 7
5 6
4 5
3 4
2 3
1 2
0 1
0 1

11
10
9
8
7
6
5
4
3
2
2

12
11
10
9
8
7
6
5
4
3
3

13
12
11
10
9
8
7
6
5
4
4

14
13
12
11
10
9
8
7
6
5
5

15
14
13
12
11
10
9
8
7
6
6

16
15
14
13
12
11
10
9
8
7
7

17
16
15
14
13
12
11
10
9
8
8

18
17
16
15
14
13
12
11
10
9
9

Tabella 2.1: La tavola della somma


cifre, quella delle unit`a va trascritta nella somma, e
quella delle decine rappresenta il riporto da sommare
alle due cifre successive pi`
u a sinistra. In termini pi`
u
formali abbiamo il seguente algoritmo per eseguire
laddizione:
Algoritmo 2.1 (Addizione di numeri decimali)
Ingresso: due numeri n = dr dr1 . . . d1 d0 ed
m = cs cs1 . . . c1 c0 scritti in notazione decimale;
Uscita: la somma n + m = bt bt1 . . . b1 b0 .
1. se r < s scambiamo tra di loro i due numeri n
ed m;
2. se s < r, aggiungiamo alla sinistra di m esattamente r s cifre 0. Questo non cambia il valore di m avendo aggiunto 0 10r + 0 10r1 +
+ 0 10rs+1 = 0. Questa operazione corrisponde allallineamento a destra dei due numeri,
ma in questo modo possiamo assumere che i due
numeri abbiano la stessa lunghezza;
3. si pone p := 0, dove p indica il riporto;
4. Procedendo da destra verso sinistra,
ponendo successivamente j := 0, 1, . . . , r:

cio`e

(a) poniamo v := dj + cj secondo quanto


riportato nella Tabella 2.1;
(b) poniamo v := v + p. Poiche il riporto p
pu`
o valere solo 0 oppure 1, questa somma
richiede, al pi`
u, di conoscere il successivo
dei numeri da 0 a 18;
(c) si pone bj uguale alla cifra delle unit`
a di v
e si assegna al riporto p la cifra delle decine
di v (che sar`
a 0 oppure 1);
(d) si incrementa j e se risulta j r si cicla
tornando al punto 4a.;

41

2.1. LADDIZIONE
5. se il riporto p `e zero, si pone t := r e la somma
`e finita; altrimenti (p = 1) si pone br+1 := 1,
t := r + 1 e la somma `e finita.

4
3
2
1
0

4
3
2
1
0
0

10
4
3
2
1
1

11
10
4
3
2
2

12
11
10
4
3
3

13
12
11
10
4
4

Il lettore si pu`o divertire a riformulare questo algoritmo in modo da prevedere tutte le azioni svolte da
un operatore umano, come lallineamento a destra e
le operazioni da fare quando si siano esaurite le cifre
del numero pi`
u corto. Abbiamo evitato questi passi
Tabella 2.2: La somma in base 5
estendendo le cifre del numero corto con una serie opportuna di zeri, un trucco che si usa sui calcolatori,
la stessa quantit`a di aste, gli insiemi rimangono
ma che non viene insegnato agli scolari.
uguali.
Si osservi che, di proposito, abbiamo utilizzato una
nomenclatura esatta, ma un po vaga; ora `e bene Queste propriet`a formali della somma sono molto
utili anche nella pratica; ad esempio, per sommare
ricordare la terminologia ufficiale.
68 + 14 + 32, ci si rende conto che 68 + 32 = 100,
Definizione 2.1 Loperazione definita dal preceden- e quindi il risultato `e 114. Formalmente, occorrono i
te algoritmo si dice propriamente addizione e il suo seguenti passaggi, ma noi li eseguiamo ormai in modo
risultato `e detto somma o totale. I numeri che si meccanico:
sommano si dicono addendi o termini.
(68 + 14) + 32 = 68 + (14 + 32) = 68 + (32 + 14) =
Questultimo nome `e un po ambiguo, poiche si parla
= (68 + 32) + 14 = 100 + 14 = 114.
anche di termini di unespressione, di termini di
una successione, e cos` via, per`o `e del tutto approIl richiamo alla notazione ad aste ci vuol far capire
priato. La parola addendo si usa soprattutto per che queste propriet`a non dipendono in alcun modo
enfatizzare il fatto che loperazione che si sta conside- dalla notazione adottata, sia essa decimale od altra,
rando `e proprio unaddizione. Di solito `e tollerato la- ma sono intrinseche ai numeri come tali. Le ritrobuso di termine operazione di somma, ma `e meglio veremo pertanto in vari capitoli, tra i quali quello
evitarlo, quando sia possibile (cio`e quasi sempre).
dellAlgebra, dove si trattano le propriet`a formali dei
La notazione ad aste, molto pi`
u di quella decimale, numeri, ignorando la loro rappresentazione, nascosta
`e utile per dimostrare:
di proposito con luso delle lettere.
Naturalmente, lAlgoritmo 2.1 non `e limitato, al la propriet`a commutativa delladdizione: a + b =
meno nello spirito, ai soli numeri decimali; esso vale
b + a. Mettere in fila a aste e poi aggiungerne
per una qualsiasi base, purche si cambi opportunaaltre b `e lo stesso che mettere b aste e aggiungerne
mente la Tabella 2.1. Ad esempio, per la base 5 si
a. In altri termini, a + b aste possono essere
usa la Tabella 2.2, dove tutti i numeri sono scritti in
immaginate anche come b + a aste;
quella base, per cui 125 = 710 , come ognuno saspetta
la propriet`a associativa: a + (b + c) = (a + b) + c. quando si sommi 3 con 4. I numeri di due cifre, come
Con le aste, comunque si proceda, si arriva alla appunto 12, stanno ad indicare un risultato (la cifra
delle unit`a) e un riporto (la cifra delle decine, che qui
fine con a + b + c aste;
sarebbe meglio dire delle cinquine).
lelemento neutro, o identit`a, per laddizione `e
Pu`o essere un buon esercizio partire con due nu0: 0 + a = a + 0 = a. Aggiungere 0 aste vuol meri decimali, ad esempio 732 e 473, convertirli in
dire non cambiare proprio niente in un insieme base 5 mediante il metodo delle divisioni successive
di aste gi`a predisposto, sia pur esso vuoto (cio`e, (v. Sezione 1.5) ed eseguire la loro somma usando la
0 + 0 = 0).
Tabella 2.2. Si trova 73210 = 104125 e 47310 = 33435 ;
i due numeri vanno allineati a destra, e la somma si
la propriet`
a dissociativa: se a = b + c allora
imposta in questo modo:
a + d = b + c + d; nella notazione ad aste, questo
significa che un gruppo di aste pu`o essere dis1 1 1
sociato in due (o pi`
u) gruppi senza cambiare
1 0 4 1 2 +
il risultato finale; formalmente, questa propriet`a
3 3 4 3 =
si pu`o far discendere da quella associativa, ma
1 4 3 1 0
nella pratica `e comodo distinguerla;
Abbiamo evidenziato i riporti, come si fa quando
la propriet`
a di eliminazione: se a + c = b + c si impara a fare la somma e a questo punto basta riallora a = b; questo vuol dire che se abbiamo convertire il risultato 143105 = 120510 per controllare
due insiemi uguali di aste e da entrambi togliamo che loperazione `e ben fatta.

42

CAPITOLO 2. ARITMETICA

Il caso pi`
u semplice si ha quando la base `e 2; non
serve nemmeno scrivere esplicitamente la tabella, visto che 0 + 0 = 0, 0 + 1 = 1 + 0 = 1 e 1 + 1 = 0
con riporto di 1. Quando il riporto 1 si aggiunge a
una somma parziale 1 + 1 si ha come risultato 1 e un
nuovo riporto unitario. Con queste cinque regole si
provi ad eseguire 90 + 57 = 147; procedendo come
sopra si ha:
1

1 0
1
0 0

1 1
1 1
1 0

0 1 0
0 0 1
0 1 1

+
=

e di nuovo lasciamo che il lettore si eserciti nella conversione tra basi diverse per controllare che il risultato `e corretto e non lo stiamo ingannando con un
gioco di cifre.
Ma lAlgoritmo 2.1 funziona bene, con pochi accorgimenti in pi`
u, anche quando abbiamo di fronte
una base composta. Un esempio sar`a sufficiente a
capire come si opera. Si considerino due angoli di
32 47 54 e 18 23 8 ; la somma si imposta allineando a destra sia le quantit`a, sia le loro parti omogenee
ed eseguendo poi le singole somme:
32
18
50

47
23
70

54
8
62

+
=

Ora teniamo conto di quanto detto nella Sezione 1.5


per i numeri scritti fuori dei limiti della base composta; partendo da destra, 62 corrispondono ad 1 2 ,
cos` che 1 va a sommarsi agli altri 70 . Ora, 71 corrispondono a 1 11 , e il grado si somma agli altri 50 .
Il risultato finale `e pertanto 51 11 2 . Come si vede,
il riporto avviene ora passando dai secondi ai primi e
da questi ai gradi; infatti, secondi, primi e gradi sono le vere cifre della notazione e son loro che devono
rientrare nei limiti della base composta (360, 60, 60).
Allinterno dei secondi, dei primi e dei gradi la somma avviene regolarmente, poiche in essi rispettiamo
la notazione decimale. Nessuno ci vieterebbe di usare
per le tre parti una base diversa da 10, ed eseguire
le somme di conseguenza; lelaboratore elettronico,
ad esempio, rappresenta tutto in binario. Ma questultima, ulteriore complicazione lasciamola perdere
e accontentiamoci di aver capito come si opera quando la notazione allinterno delle varie cifre `e quella
decimale.

2.2

Confronto e sottrazione

Unaltra operazione elementare `e il confronto tra numeri; il risultato non `e questa volta un numero, come
per laddizione, ma un valore di verit`a, cio`e vero o

falso. Ad esempio, 5 = 3 `e falso, mentre 3 < 5 `e


vero. Di regola si considerano sei tipi di confronto
che si spiegano bene in termini di conteggio o nella
notazione ad aste:
n = m (n `e uguale ad m): i due numeri n ed m
sono uguali se sono indicati con lo stesso nome
ovvero se le loro rappresentazioni ad aste sono
lunghe uguali, quindi se c`e una corrispondenza biunivoca tra le aste che rappresentano i due
numeri;
n 6= m (n `e diverso da m): i due numeri non sono
uguali, cio`e sono indicati da nomi diversi ovvero
la lunghezza delle loro rappresentazioni ad aste
sono differenti;
n < m (n `e minore di m): il nome di n precede il nome di m nel conteggio, ovvero c`e una
corrispondenza biunivoca tra le aste di n e un
sottoinsieme proprio delle aste di m (questo significa che la rappresentazione ad aste di n `e pi`
u
corta di quella di m);
n m (n `e minore o uguale ad m): i due numeri
sono uguali (n = m) oppure n `e minore di m,
secondo le precedenti specifiche;
n > m (n `e maggiore di m): il nome di n segue il nome di m nel conteggio, ovvero c`e una
corrispondenza biunivoca tra le aste di m e un
sottoinsieme proprio delle aste di n (questo significa che la rappresentazione ad aste di n `e pi`
u
corta di quella di m);
n m (n `e maggiore o uguale ad m): i due
numeri sono uguali (n = m) oppure n `e maggiore
di m, secondo le precedenti specifiche.
Nota 2.1

I concetti di uguale e diverso sono


tanto elementari che una loro definizione appare
assurda o fuorviante, perche cerca di spiegare cose
semplici con argomenti complessi. A ben guardare,
la nostra definizione di uguaglianza tra numeri `e
riportata alluguaglianza verbale (il che pu`
o avere
abbastanza senso) o ad una corrispondenza biunivoca.
Questultima impostazione, come s`e visto, ha un
senso molto profondo e permette di ragionare di
uguaglianza anche per quantit`
a non finite. Per tali
quantit`
a, una impostazione puramente nominalista
non d`
a alcun risultato.

Dovrebbe essere chiaro dalla precedente elencazione che, in realt`a, i confronti si riducono a due soli:
n = m ed n < m. Per gli altri si ha:
n 6= m: non `e vero che n = m;
n > m: m < n;

2.2. CONFRONTO E SOTTRAZIONE


n m: non `e vero che n > m;
n m: non `e vero che n < m.
Come abbiamo visto per la somma, la notazione ad
aste `e utile per dimostrare certe propriet`a dei numeri relativamente ai confronti; formuliamo le seguenti
propriet`a per la relazione , ma esse valgono anche per <, , > e =. Per la relazione 6=
valgono le prime due, ma non vale la terza, come il
lettore dimostrer`a con un controesempio, cio`e fornendo quattro numeri a, b, c, d per i quali si ha a 6= b e
c 6= d, ma risulta a + c = b + d:
propriet`
a di eliminazione: se a + c b + c allora
a b; se abbiamo due gruppi di aste, il primo
con un numero di aste non superiore al secondo,
ed eliminiamo dai due gruppi lo stesso numero
di aste, il primo rimane con un numero di aste
non superiore al secondo;
propriet`
a di aggiunzione: se a b allora a + c
b+c; questa `e la propriet`a inversa della precedente e si dimostra allo stesso modo rifacendosi
alla notazione ad aste;

43
1. se r < s, cio`e le cifre di n sono in numero minore
delle cifre di m, si esce con il risultato vero;
2. altrimenti, se r > s, cio`e se m ha pi`
u cifre di n,
si esce col risultato falso;
3. altrimenti (in questo caso r = s, i due numeri
hanno lo stesso numero di cifre), si pone j := r
e si procede da sinistra verso destra:
(a) se dj < cj si esce col risultato vero, poiche la cifra di 10j in n `e minore di quella
in m e le cifre delle potenze superiori sono
uguali (se ce ne sono);
(b) altrimenti, se dj > cj si esce col risultato
falso;
(c) altrimenti (dj = cj ) si decrementa j di uno
e se `e ancora maggiore o uguale a 0 si cicla
tornando al punto 3a.
4. se si arriva a questo punto (uscendo dal ciclo 3.)
significa che tutte le cifre di n sono ordinatamente uguali alle cifre di m, cio`e n = m, e quindi si
esce col risultato falso.

Il lettore che abbia provato a scrivere lalgoritmo


propriet`
a di monotonia: se a b e c d allora
per
m = n o che abbia seguito lalgoritmo precedente,
a + c b + d; se mettiamo insieme gruppi piccosi
sar`
a certamente accorto che, cos` come stanno, queli di aste otteniamo gruppi piccoli; se mettiamo
sti
algoritmi
sono errati. Infatti, ad esempio, gi`a nel
insieme gruppi grandi, otteniamo gruppi grandi.
passo 1. ci si chiede se r < s: ma questo `e proprio lo
Per portare questi confronti nel campo della rap- scopo dellalgoritmo! Lo stesso succede quando, per
presentazione decimale possiamo procedere con un controllare la condizione A), ci chiediamo se r = s,
teorema e con un algoritmo. Il teorema riguarda il laddove lalgoritmo vuol proprio servire a controllare
caso delluguaglianza e dal teorema discende unov- luguaglianza di due numeri. Come si risolve questo
via procedura, la cui formulazione lasciamo al piacere problema? La soluzione `e semplice se trasformiamo
del lettore. Lalgoritmo che diamo si riferisce invece questi algoritmi in algoritmi ricorsivi, cio`e in procedure che, giunte a dover stabilire se r < s, o r = s,
al confronto n < m.
richiamano se stesse per effettuare tale controllo.
Teorema 2.1 Siano n, m N; allora n = m se
Ha senso una cosa del genere, oppure ci trascina in
e solo se le rappresentazioni decimali di m ed n un circolo vizioso in cui lalgoritmo richiama se stesso
coincidono.
infinite volte senza riuscire a trovare alcun risultato
definitivo? In realt`a tutto procede in modo molto
Prova: Come abbiamo visto nella Sezione 1.5, la semplice, poiche la lunghezza di un numero `e di regorappresentazione decimale di un numero `e unica, e la molto inferiore al suo valore: bisogna escludere da
quindi le rappresentazioni coincidono se e solo se i questa regola i numeri 0 ed 1, ma per essi vedremo
numeri sono lo stesso.
tra un momento. Ad esempio, supponiamo di doNaturalmente, per controllare che le rappresentazio- ver confrontare un numero di 1274 cifre con uno di
ni di n ed m sono uguali occorre: A) stabilire se 853, cio`e due numeri piuttosto grandi. Per effettuare
le lunghezze delle due rappresentazioni coincidono; tale confronto dobbiamo pertanto confrontare queste
B) se ci`o `e vero, stabilire se le cifre decimali sono lunghezze (r = 1273 ed s = 852, visto che gli indici
partono da 0). Luso ricorsivo dellalgoritmo implica
ordinatamente uguali.
di dover valutare le lunghezze di questi due numeri,
che sono 4 e 3 rispettivamente (in effetti, il nuovo r `e
Algoritmo 2.2 (Stabilire se n `
e minore di m)
Ingresso: Due numeri n, m N con la loro rap- 3 e il nuovo s `e 2, ancora per la storia degli indici).
A questo punto, per`o, possiamo osservare che il
presentazione decimale n = dr dr1 . . . d1 d0 ed m =
confronto fra cifre pu`o essere codificato in una tabelcs cs1 . . . c1 c0 ; dr 6= 0, cs 6= 0.
Uscita: vero se n < m, falso altrimenti.
la, analoga a quella delladdizione, ma che per ogni

44

CAPITOLO 2. ARITMETICA
9
8
7
6
5
4
3
2
1
0

0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
1
1

0
0
0
0
0
0
0
0
1
1
2

0
0
0
0
0
0
0
1
1
1
3

0
0
0
0
0
0
1
1
1
1
4

0
0
0
0
0
1
1
1
1
1
5

0
0
0
0
1
1
1
1
1
1
6

0
0
0
1
1
1
1
1
1
1
7

0
0
1
1
1
1
1
1
1
1
8

0
1
1
1
1
1
1
1
1
1
9

leffettuabilit`a della sottrazione; fatto questo, la


giustificazione della propriet`a `e del tutto analoga
alla .precedente.

Lesecuzione della sottrazione avviene con un ben


noto algoritmo, nel quale il punto pi`
u complesso `e
costituito dal prestito, cio`e lanalogo del riporto nelladdizione. Purtroppo, il concetto di prestito `e un
po pi`
u complicato: infatti il riporto agisce sulla cifra immediatamente a sinistra del punto in cui si `e
verificato. Invece, il prestito pu`o coinvolgere una cifra pi`
u lontana, quando nel mezzo ci siano degli 0.
Daltra parte, come si sa, da chi non ha niente come
lo 0 non si possono ottenere prestiti. Nel seguente
Tabella 2.3: La tavola del confronto per minore
algoritmo si usa la Tabella 2.1 che gi`a conosciamo
dalladdizione. In realt`a, il suo uso avviene allinconcoppia di cifre (d, d ) ci d`a 1 per vero se d < d , trario secondo quanto stabilito dalla Definizione 2.2:
e 0 per falso in caso contrario; si veda la Tabella per vedere quanto vale a b occorre cercare nella riga
2.3. Questa tabella, molto meno interessante di quel- di b il valore a e quindi leggere il risultato nella base
la della somma, si ricorda per`o molto pi`
u facilmente e, della colonna corrispondente.
di solito, non viene data esplicitamente, come invece
abbiamo fatto noi ora, presi da un raptus di amore Algoritmo 2.3 (Sottrazione)
Ingresso: Due numeri n, m N con m n e la
di completezza.
Legata al concetto di confronto, c`e la seconda loro rappresentazione decimale n = dr dr1 . . . d1 d0
ed m = cs cs1 . . . c1 c0 ;
operazione di base dellaritmetica: la sottrazione:
Uscita: la rappresentazione della differenza p = n
Definizione 2.2 Dati due numeri n ed m tali che m = b b
r r1 . . . b1 b0
m n, si dice differenza di m da n, e si indica con
n m, il numero p tale che n = m + p. Il numero n
1. si procede da destra verso sinistra ponendo
si dice il minuendo mentre il numero m si chiama il
successivamente j := 0, 1, . . . , r;
sottraendo. Loperazione che permette di calcolare la
(a) se dj cj si pone bj = dj cj secondo
differenza si dice sottrazione.
quanto riportato nella Tabella 2.1 e si va al
Da questa definizione discende che la sottrazione
passo 1f.;
`e loperazione inversa delladdizione. Per questo mo(b) altrimenti (dj < cj ) sia k il primo indice
tivo, le propriet`a di eliminazione e di aggiunzione,
maggiore di j tale che dk 6= 0 (per lipotesi
viste per la somma in relazione ai confronti, valgono,
che sia n m tale indice esiste senzaltro);
allinverso, per la sottrazione, e invitiamo il lettore a
(c) si pone dk := dk 1 (si effettua il prestito);
formularle in modo esplicito. La propriet`a di monotonia, invece, non vale pi`
u e, anche in questo caso,
(d) per ogni indice h compreso tra k + 1 e j (se
il lettore `e invitato a fornire qualche controesempio.
ce ne sono) si pone dh := 9 (era dh = 0);
Due nuove propriet`a, che possono essere chiamate di
(e) si pone bj := (10 + dj ) cj , secondo la
antimonotonia, risultano importanti; la prima `e limiTabella 2.1;
tata a e <, la seconda `e limitata a e a
(f ) si incrementa j e se `e ancora j r si
>, :
riprende il ciclo al punto 1a.;
se a b, c d e d a, allora a d b c; si os2. se, come pu`
o succedere, cr = 0 si eliminano le
servi che le condizioni date implicano c b, per
cifre iniziali br , br1 , . . . , bh che siano 0 (e sia
cui le due sottrazioni sono entrambe valide; la
invece bh1 6= 0).
giustificazione `e abbastanza ovvia: se abbiamo
due insiemi di aste, il primo con un numero di
Dal significato della rappresentazione posizionale
aste non superiore al secondo, e dal primo togliadiscende
la giustificazione del prestito, che si spiemo tante o pi`
u aste di quante non ne togliamo
ga
meglio
con un esempio: se dobbiamo eseguire
al secondo, questo rimane con un numero di aste
10038,
la
prima azione da compiere `e eseguire 38,
non inferiore al primo;
che non si pu`o fare. Daltra parte, il prestito non
se a b, c d, a d e b c, allora a d b c; pu`o essere ottenuto ne dalle decine ne dalle centinaqui dobbiamo avere condizioni che ci assicurino ia; ottenerlo dalle migliaia vuol dire in effetti eseguire

45

2.3. MOLTIPLICAZIONE
proprio 1003 8. Ci si rende conto, allora, che un
prestito da 1000 pu`o esser visto come un prestito da
990 + 10: il 10 si porta alle unit`a e il 990 rappresenta
le 9 decine e le 9 centinaia che abbiamo sostituito agli
0 preesistenti. Limpostazione tradizionale `e:
0

10

0 0

9 9

3
8
5

e lo 0 iniziale si toglie per ottenere la rappresentazione


consueta.
Anche per il confronto e la sottrazione, pensare ad
una base diversa da 10 non crea grossi problemi. Il
confronto rimane inalterato, ed equivarrebbe ad un
insulto per il lettore riscrivere la Tabella 2.3 nel caso della base 5. La sottrazione, invece, prevede di
utilizzare la tabella della somma allinverso e quindi,
se vogliamo sottrarre due numeri scritti in base 5, `e
bene avere sottocchio la Tabella 2.2. La parte interessante `e fornita dal gioco del prestito che va seguito
attentamente. Utilizzando ancora i numero 732 e 473
(liberando il lettore dal tedio di altre conversioni) la
sottrazione si imposta cos`:
10

0
3
2

4
3
0

10

10

1
4
1

2
3
4

Partendo da destra ci accorgiamo che da 14 non


possono essere sottratti 26 ; si prende allora 1 in
prestito dai 12 del minuendo; questi sono ridotti ad
11 , ma i secondi crescono a 74 , in quanto 1 = 60 .
Abbiamo allora 74 26 = 48 come risultato per i secondi. Passando ai primi, non possiamo togliere 32
dagli 11 rimasti; si chiede un grado in prestito dai
28 del minuendo e si passa a 71 , cio`e 60 + 11. La
differenza 71 32 = 39 ci aggiusta il risultato per i
primi e quindi non rimane che sottrarre dai 27 rimasti gli 8 del sottraendo. Si ha cos` il risultato finale
19 39 48 . Il lettore pu`o utilmente provare con altri
angoli o passare ad ore, minuti e secondi, per un pi`
u
diretto aggancio con la realt`a di tutti i giorni. Quando si passa ai mesi e agli anni i calcoli si complicano
assai a causa della variabilit`a della lunghezza dei mesi e dellintercalarsi degli anni bisestili. Il lettore pu`o
provare a calcolare la propria et`a in numero di giorni
vissuti, basandosi sul giorno corrente e sulla data di
nascita e non trascurando i 29 di Febbraio che gli `e
capitato di incontrare lungo la vita.
Concludiamo ricordando un altro metodo per eseguire la sottrazione. Fissiamo ad m + 1 il numero
delle cifre decimali con cui rappresentare i numeri,
cos` che n = dm dm1 . . . d1 d0 con le cifre pi`
u a sinistra eventualmente 0. Si dice complemento a 9 di n il
numero n
= cm cm1 . . . c1 c0 definito da cj = 9 dj ,
per ogni indice 0 j m. Si dice invece complemento a 10 di n il numero n
b =n
+ 1. Lasciamo al
lettore la dimostrazione di questo fatto, dove p `e un
numero naturale qualsiasi:

Ogni cifra che effettua un prestito va considerata come diminuita di 1; cos` la cifra 1, seconda da destra,
diviene 0 e, dopo il prestito da 4, d`a 104 = 1. Ora il
p+n
b 10m+1 = p n.
4 diviene 3 e 3 3 = 0. Anche in questo caso il lettoQuesto ci d`a il metodo alternativo per eseguire la
re verificher`a la correttezza del risultato mostrando
che 20145 = 25910 e 259 = 732 473 nella nostra sottrazione. Sia m = 5 cos` che 1003 = 001003 e 8 =
000008, di modo che il complemento a 9 sia 999992 e
tradizionale base 10.
Non possiamo tralasciare un esempio in base 2, al- il complemento a 10: 999993. Eseguendo la somma:
meno come omaggio a sua maest`a lElaboratore Elet0 0 1 0 0 3 +
tronico, campione di stenaritmia. La differenza tra
9 9 9 9 9 8 =
49 e 42 si calcola cos`:
(1) 0 0 0 9 9 5
1

1 1
1 0
0 0

10

0 0
1 0
0 1

0
1
1

1
0
1

dove il gioco del prestito `e ben messo in evidenza.


Il risultato ignora i primi 0 e corrisponde al nostro
numero 7, come deve essere.
Aver capito il meccanismo del prestito significa
aver capito la sottrazione, anche nel caso dei numeri
scritti in una base composta. Facciamo un esempio
utilizzando ancora gli angoli e la notazione in gradi.
Si debba eseguire:
28
7

12
32

14
26

si trova il risultato che ci aspettavamo. Lelaboratore preferisce questo metodo, anche se naturalmente
trasposto alla base 2.

2.3

Moltiplicazione

La moltiplicazione altro non `e che una sequenza di


somme; ad esempio, 5 4, che si pu`o leggere 5 per
4 volte, rappresenta la somma del numero 5 per 4
volte, cio`e 5 4 = 5 + 5 + 5 + 5. Analogamente,
7 5 = 7 + 7 + 7 + 7 + 7 e scopo delloperazione
di moltiplicazione `e quello di abbreviare il calcolo di
queste somme ripetute. Ricordiamo che, tecnicamente, il termine moltiplicazione indica loperazione,

46

CAPITOLO 2. ARITMETICA

mentre con prodotto ci si riferisce al risultato ottenuto; spesso si tende a usare queste due parole come
sinonimi, ma `e bene che si impari a fare la distinzione per intendersi senza ambiguit`a. Il primo dei due
numeri da moltiplicare si dice moltiplicando, mentre
il secondo si chiama moltiplicatore; quando non sia
necessario distinguere tra i due, si usa il termine pi`
u
generico, ma perfettamente appropriato, di fattore.
Quindi, riassumendo, il prodotto `e il risultato delloperazione di moltiplicazione svolta tra due (o pi`
u)
fattori.
La propriet`a associativa della somma permette di
eseguire il prodotto raggruppando in modo qualsiasi
i vari addendi; cos` 7 5 = (7 + 7 + 7) + (7 + 7) =
7 3 + 7 2, cio`e si ha: a b = a b1 + a b2 purche
sia b = b1 + b2 . Questo si pu`o scrivere:
a b1 + a b2 = a (b1 + b2 ),
e questa si chiama la propriet`
a distributiva del prodotto rispetto alla somma. Un po meno ovvia `e la
propriet`
a commutativa, che cio`e sia a b = b a;
infatti, non `e affatto evidente che a sommato a se
stesso per b volte sia la stessa cosa che b sommato a
se stesso per a volte. Tuttavia, se rappresentiamo il
numero 7 come una colonna di 7 palline, 7 5 vuol
dire mettere di seguito 5 colonne, ognuna formata di
7 palline. Otteniamo cos` un rettangolo di palline e se
lo leggiamo in ordine di riga, ci accorgiamo che esso
`e composto di 7 righe di 5 palline ognuna. Invertendo il ruolo tra righe e colonne, questo significa che
le stesse palline possono essere contate da 5 7, cio`e
5 7 = 7 5.
e e e e e e e
e e e e e e e
e e e e e e e
e e e e e e e
e e e e e e e

Lo stesso tipo di difficolt`a rilevato per la propriet`a


commutativa, si trova quando vogliamo renderci conto della propriet`
a associativa, cio`e la propriet`a secondo la quale lordine di esecuzione di pi`
u moltiplicazioni consecutive non cambia il prodotto finale. Formalmente, questo si esprime con lidentit`a
a (b c) = (a b) c. In questo caso pu`o aiutare la visione spaziale del risultato. Prendiamo una
colonna di a palline; come s`e visto, a b corrisponde
a un rettangolo di palline; ora, (a b) c vuol dire ripetere questo rettangolo per c volte; questo si fa bene
sovrapponendo i c rettangoli su c strati; si ha cos` un
parallelepipedo contenente a b c palline. Quando
si considera a (b c), dobbiamo prima eseguire il
prodotto bc: partendo da una fila con c palline e replicandola b volte, otteniamo un rettangolo con b c
palline; immaginiamo di disporlo verticalmente nello
spazio e replichiamolo a volte; otteniamo ancora un
parallelepipedo composto da abc palline, e quindi
con lo stesso numero di palline di quello ottenuto in
precedenza. Luguaglianza `e cos` provata. Naturalmente, vale anche una propriet`a dissociativa, per la
quale al prodotto a b possiamo sostituire a c d
se b = c d.
Per quanto riguarda moltiplicazione e confronti, si
hanno propriet`a analoghe a quelle della somma e che
si possono dimostrare proprio a partire da quelle:
per tutte e sei le relazioni vale la propriet`a di
aggiunzione: se a R b e c 6= 0, allora ac R bc;
per tutte e sei le relazioni vale la propriet`a di
eliminazione: se ac R bc e c 6= 0, allora a R b;
per le cinque relazioni , <, , > e =
vale la propriet`a di monotonia: se a R b e c R d,
allora ac R bd (con a, b, c, d 6= 0).

Partendo da queste propriet`a possiamo cercare un


metodo per eseguire la moltiplicazione a partire dalla notazione posizionale dei numeri. Procediamo
Da questo modo di concepire il prodotto (che `e per gradi, formulando via via alcune osservazioni.
poi del tutto naturale) seguono alcune propriet`a re- La prima osservazione costituisce un vero e proprio
lative a fattori particolari quali lo 0 e l1. Intanto, lemma:
1 a = a deriva dal fatto che ripetere 1 per a volte ci fa chiaramente ottenere a. Si noti che questo `e Lemma 2.2 Per moltiplicare un numero per 10 `e
diverso da a 1 che significa ripetere a per una sola sufficiente aggiungere uno 0 in fondo a destra alla
volta, e ottenere comunque a. Quello che sorprende sua rappresentazione decimale.
nella moltiplicazione `e proprio il fatto che valga la
propriet`a commutativa a b = b a, quando linter- Prova: Se n `e il numero considerato, sia:
pretazione che diamo dei due fattori `e completamente
n = dr dr1 . . . d1 d0 =
diversa: di numero puro il moltiplicando e di ripetitore il moltiplicatore. Anche nel caso di un fattore
= dr 10r + dr1 10r1 + + d1 10 + d0 ;
0 questa diversit`a `e evidente: 0 a significa ripetere
0 per a volte, laddove a 0 vuol dire ripetere a per per le propriet`a associativa e distribuita si ha allora:
0 volte. Comunque, il risultato `e sempre zero, cio`e
10n = dr 10r+1 +dr1 10r + +d1 100+d0 10
a 0 = 0 a = 0.

47

2.3. MOLTIPLICAZIONE
e quindi la rappresentazione di 10 n `e proprio
dr dr1 . . . d1 d0 0 come si voleva.
Naturalmente, questo lemma si pu`o estendere al
caso di moltiplicazione per 100, 1000 e cos` via: basta aggiungere alla rappresentazione decimale di n
lappropriato numero di 0, cio`e quanti ne compaiono nellaltro fattore. La seconda osservazione `e tanto
semplice che la possiamo fare in modo discorsivo: se
i due fattori di una moltiplicazione sono semplici cifre decimali, allora il prodotto `e minore di 100, cio`e
contiene al pi`
u due cifre decimali. Daltra parte, come ben si sa, il valore massimo `e 9 9 = 81. Pi`
u
complessa `e la terza osservazione:
Lemma 2.3 Se n `e un numero qualsiasi ed m `e rappresentato da ununica cifra m = c, allora ogni cifra
di n c `e unicamente determinata dalla corrispondente cifra di n e dalleventuale riporto del prodotto
di c con la precedente cifra di n.
Prova: Sia al solito dr dr1 . . . d1 d0 la rappresentazione decimale di n; abbiamo allora:

9
8
7
6
5
4
3
2
1
1

18
16
14
12
10
8
6
4
2
2

27
24
21
18
15
12
9
6
3
3

36
32
28
24
20
16
12
8
4
4

45
40
35
30
25
20
15
10
5
5

54
48
42
36
30
24
18
12
6
6

63
56
49
42
35
28
21
14
7
7

72
64
56
48
40
32
24
6
8
8

81
72
63
54
45
36
27
18
9
9

Tabella 2.4: La Tavola Pitagorica


(b) sia sj la cifra delle unit`
a di v; questa `e la
j-esima cifra del risultato;
(c) sia k la cifra delle decine di v; questo `e il
nuovo riporto;
(d) si riprende dallinizio del ciclo;
3. Se k 6= 0 si pone sr+1 := k, mentre se k = 0 il
valore di sr+1 `e nullo.

nc=
dr c10r +dr1 c10r1 + +d1 c10+d0 c.
La precedente osservazione ci assicura che d0 c 81,
e quindi tale prodotto determina la cifra delle unit`a
e pu`o avere un riporto che influenzer`a la cifra delle
decine; sia k tale riporto. La cifra delle decine si
calcola facendo d1 c + k; questo valore non supera
81 + 8 = 89 e quindi genera al pi`
u un riporto verso
la cifra delle centinaia, ma non oltre. Si noti che
anche questa volta il riporto pu`o essere al massimo 8.
Procedendo in modo analogo per le cifre successive,
si dimostra quanto affermato dal lemma.
Questo lemma porta a un algoritmo che stabilisce operativamente cosa dobbiamo fare per eseguire
la moltiplicazione fra un moltiplicando generico e un
moltiplicatore costituito da una sola cifra decimale.
Algoritmo 2.4 (Moltiplicazione per una cifra)
Ingresso: Un moltiplicando n = dr dr1 . . . d1 d0
e un moltiplicatore m costituito da ununica cifra c.
Uscita: La rappresentazione decimale del prodotto
n m = sr+1 sr sr1 . . . s1 s0 .
1. Si pone k := 0 come riporto iniziale;
2. Procedendo da destra verso sinistra,
ponendo j := 0, 1, . . . , r:

9
8
7
6
5
4
3
2
1

cio`e

(a) sia v := dj c + k, dove il valore di dj c


risulta dalla Tabella 2.4, la ben nota Tavola
Pitagorica;

Sapendo moltiplicare n per un numero composto


da una sola cifra, il Lemma 2.3 ci permette ora di
moltiplicare due numeri qualsiasi. Infatti, sia m =
dr dr1 . . . d1 d0 e si consideri n m = n dr 10r +
n dr1 10r1 + + n d1 10 + n d0 . Qui,
n d0 `e il prodotto di n per la cifra delle unit`a d0 , e
questo pu`o essere eseguito con lalgoritmo precedente;
n d1 10 `e il prodotto di n per la cifra delle decine
(e anche questo lo sappiamo fare) con uno zero in
fondo, e cos` via fino a n dr , che deve essere seguito
da r zeri. A questo punto, basta fare le somme di
tutti questi prodotti parziali. Questo `e il principio
che tutti conosciamo, come conosciamo lalgoritmo e
la costruzione che servono ad eseguire comodamente
il prodotto nel suo complesso:
Algoritmo 2.5 (Moltiplicazione)
Ingresso: il moltiplicando n e il moltiplicatore m =
dr dr1 . . . d1 d0 ;
Uscita: La rappresentazione decimale di n m.
1. si scrive il moltiplicando n, il simbolo del prodotto e, accanto o sotto, il moltiplicatore
m. Si scrive una linea di divisione dei fattori
dai risultati parziali e dal prodotto;
2. procedendo da destra verso sinistra, si considerano le varie cifre (j := 0, 1, . . . , r) del
moltiplicatore;
(a) si moltiplica n per dj e si aggiungono j zeri
alla fine;

48

CAPITOLO 2. ARITMETICA
(b) si aggiunge il prodotto cos` ottenuto ai risultati parziali, allineandolo a destra con quelli
gi`
a presenti (se ce ne sono);
(c) si incrementa j e se non si `e superato r si
cicla tornando al passo 2a.;

3. si scrive una linea di separazione che chiude i


risultati parziali cos` ottenuti;
4. si esegue la somma dei risultati parziali,
ottenendo il prodotto finale.
Ad esempio, per moltiplicare 732 per 263 si procede
nel modo seguente:
263

732
2196
43920
146400
192516

Spesso, al posto degli zeri finali si preferisce operare


una scalatura dei prodotti n dj , ma ovviamente il
significato e il risultato sono gli stessi.
Nota 2.2

La Tavola Pitagorica `e stata la croce


di tanti scolari. Daltra parte, essa costituisce il perno
dellesecuzione della moltiplicazione e, come tale, va
saputa a memoria, anche oggi che cos` spesso demandiamo a calcolatori elettronici la maggior parte dei
nostri conti. La tavola serve per eseguire il prodotto
anche secondo unimpostazione che nei tempi passati ha avuto molto successo; se, ad esempio, vogliamo
calcolare 27 184, loperazione si imposta cos`:

1
7
2

8
7

4
6

2
0

6
1

8
8
0

8
6

Si noti che ogni quadrato contiene il prodotto di due


cifre, cio`e proprio il risultato dato dalla Tavola Pitagorica. Procedendo da destra verso sinistra, si eseguono le somme per diagonale alto/sinistra verso basso/destra e il risultato 4968 si legge facilmente. Questo metodo evita luso dellalgoritmo classico di moltiplicazione e riduce tutto alla Tavola Pitagorica. Ci`
o
lo rende abbastanza simpatico, lunica difficolt`
a essendo lesecuzione delle somme per diagonale, almeno
ai primi tentativi. Il lettore `e invitato a formulare
lalgoritmo per realizzare questo metodo.
Quasi non fa uso della Tavola Pitagorica la tecnica
detta dei contadini russi. Scritti uno accanto allaltro moltiplicatore e moltiplicando, al di sotto si

scrivono rispettivamente la met`


a del primo (ignorando punto decimale e resto) e il doppio del secondo. Si
va avanti cos` fino a che il moltiplicatore non `e ridotto
ad 1, e si sommano infine i vari doppi del moltiplicando che corrispondono a valori dispari delle met`
a
del moltiplicatore. Ecco come si sviluppa il calcolo di
25 347:

25
12
6
3
1

347
(694)
(1388)
2776
5552
8675

12 `e pari
6 `e pari

Conviene prendere sempre come moltiplicatore il fattore pi`


u piccolo. Si d`
a per scontato che si sappia calcolare senza difficolt`
a il doppio di un numero, senza
usare la Tavola Pitagorica. La somma finale `e inevitabile ed `e opportuno aver cancellato bene i termini
da ignorare per non incorrere in facili errori. Perche
questo metodo funziona? Se convertiamo il moltiplicatore 25 in binario, si ottiene 11001, dove gli 1 corrispondono alle potenze di 2 da considerare per formare il 25 = 24 + 23 + 20 (si veda la Sezione 1.5).
Allora, 25 347 = 24 347 + 23 347 + 347 e questo `e proprio ci`
o che si `e fatto applicando il metodo
dei contadini russi. Costoro, c`e da scommeterci, non
immaginavano nemmeno che la loro tecnica di moltiplicazione sarebbe stata adottata dagli odierni elaboratori. Nel sistema binario la moltiplicazione per 2
(cio`e il raddoppio) e la divisione per 2 (cio`e il dimezzamento) sono operazioni particolarmente facili. Poiche
210 = 102 , raddoppiare un numero binario significa
aggiungergli uno 0 in fondo: il doppio di 510 = 1012
`e 10102 = 1010 . Analogamente, dimezzare un numero vuol dire togliergli lultima cifra. Fra laltro,
questa rappresenta il resto ella divisione: la met`
a di
2110 = 101012 `e 10102 = 1010 con il resto di 1; la met`
a
di 2810 = 111002 `e 11102 = 1410 con resto 0. Ecco allora come si imposta il prodotto di 2510 = 110012 per
2710 = 110112 :
11001
1100
110
11
1

11011
(110110)
(1101100)
11011000
110110000

resto 0
resto 0

A questo punto, dobbiamo sommare i doppi corrispondenti al resto 1; sappiamo fare la somma di due
addendi alla volta e quindi il risultato `e dato da:
11011
11011000
11110011
110110000
1010100011

+
=
+
=

La conversione finale mostra che questo numero binario significa 675, il risultato corretto. A onor del

49

2.4. DIVISIONE
vero, se eseguiamo la moltiplicazione tra numeri binari secondo la tecnica consueta esposta per la base 10,
otteniamo gli stessi risultati parziali del metodo dei
contadini russi: basta osservare che, usando 25 come
moltiplicatore, ogni 0 non d`
a niente da sommare, e
ogni 1 d`
a lo stesso moltiplicando, scalato del numero opportuno di posizioni, cio`e con la coda di 0 che
gli compete. La somma dei risultati parziali, infine, `e
proprio quella appena eseguita. Volendo filosofeggiare, si vede cos` come, qualche volta, strade diverse si
riuniscano per formare un unico, grande viale.
Questi metodi per eseguire la moltiplicazione, comunque, vanno bene solamente per numeri relativamente
piccoli, diciamo qualche decina di cifre binarie. Oggi,
per`
o, come vedremo nel prossimo capitolo, la tecnica
richiede il prodotto di numeri espressi da qualche
centinaio di cifre binarie. Fortunatamente, esiste
almeno un metodo che permette di effettuare le
moltiplicazioni in modo molto pi`
u veloce, basato
sulla tecnica detta della trasformata veloce di Fourier
(FFT = Fast Fourier Transform), della cui esistenza
informiamo il lettore, ma il cui trattamento lasciamo
ai testi universitari.

Concludiamo accennando alla moltiplicazione dei


numeri scritti in una base composta. In effetti, non
moltiplicheremo due numeri del genere, ma ci limiteremo a moltiplicare un angolo per un numero
scritto in base 10. Ad esempio, cerchiamo il triplo
di 28 32 54 ; moltiplicando separatamente per 3 le
tre componenti, si ha 84 96 162 e a questo punto
scriviamo correttamente questa quantit`a: 162 sono 2 42 , e quindi i 2 si aggiungono ai 96 presenti.
Ora, 98 sono 1 38 e il grado si aggiunge agli 84 gi`a
trovati. In conclusione, il prodotto vale 85 38 42 .

2.4

Divisione

Come la moltiplicazione `e unoperazione che abbrevia


lesecuzione di somme successive della stessa quantit`a, cos` la divisione abbrevia la sottrazione da un
quantit`a data di un certo valore, tante volte quanto ci`o risulti fattibile. Con un semplice esempio, la
divisione di 19 per 5 corrisponde a sottrarre da 19
il numero 5 tante volte quanto sia possibile. Cos`,
19 5 = 14, 14 5 = 9, 9 5 = 4 e a questo punto
non `e lecito sottrarre ulteriormente 5 dalla differenza ottenuta, cio`e 4. Poiche abbiamo potuto sottrarre
per tre volte il 5 dal 19, il numero 3 costituisce il risultato della divisione. Talvolta si dice che il 5 sta 3
volte nel 19.
La terminologia legata alla divisione `e la seguente:

risultato si dice quoziente della divisione e il numero


che rimane dopo aver effettuato tutte le sottrazioni
(cio`e il 4) vien detto resto o modulo. Se il resto di
una divisione `e zero, si dice che la divisione `e esatta,
o anche che il divisore sta nel dividendo. Infine, dati
due numeri n, m N si dice che n `e divisibile per m,
o che n `e multiplo di m, o che m divide n, o anche
che m `e un divisore o un fattore di n, se esiste un
numero q N tale che n = m q.

Da questa definizione consegue che il resto della


divisione `e sempre strettamente minore del divisore, altrimenti si potrebbe eseguire almeno unaltra
sottrazione. Il concetto di divisione esatta innesca
un importante capitolo della Matematica: quello della divisibilit`
a. Esso merita una speciale attenzione e
verr`a compiutamente trattato pi`
u avanti. Il fatto che
n sia un multiplo di m (o che m sia un divisore di n) si
pu`o esprimere affermando che il resto della divisione
di n per m `e zero, cio`e n = m q + 0. Talvolta, per
indicare questo concetto, si scrive m|n ovvero m[n.
Lo 0 si considera divisibile per ogni numero naturale
m, in quanto soddisfa la definizione precedente con
q = 0.
Quella che abbiamo definito `e talvolta detta divisione intera per mettere in evidenza che sono coinvolti solo numeri interi e mai numeri con il punto decimale, che, fra laltro, finora non abbiamo nemmeno
introdotto. Il quoziente tra 19 e 5 `e, come s`e visto,
3 e non 3.8, un numero che ancora non conosciamo
ufficialmente. Se n, m N, il quoziente si indica con
n/m, anche se talvolta si trovano le notazioni n//m
oppure n div m, per distinguere la divisione intera
dalla divisione decimale. Se q `e il quoziente della divisione di n per m, ed r ne `e il resto, si ha chiaramente
n = m q + r, con 0 r < m. Infatti, m q ha leffetto opposto delle differenze successive e ristabilisce,
a parte il resto r, il dividendo; questo lo si ottiene poi
in modo esatto aggiungendo r.
Naturalmente, loperazione di divisione non si esegue effettuando una dopo laltra le sottrazioni necessarie: se il risultato fosse anche solo dellordine
delle migliaia, occorrerebbero ore ed ore per portare a termine unoperazione. Anche in questo caso si
pu`o sfruttare la rappresentazione decimale dei numeri. Bisogna tuttavia essere coscienti del fatto che la
divisione `e loperazione pi`
u difficoltosa fra le quattro
operazioni di base. Daremo ora il ben noto algoritmo
per eseguire la divisione, ma vedremo come almeno
un passo rimane abbastanza oscuro e arbitrario, ancorche del tutto corretto. Questo parzialmente giustifica coloro che si trovano in difficolt`a nel fare le
divisioni, specie quelle a pi`
u cifre.

Definizione 2.3 Il numero sul quale si effettua la Algoritmo 2.6 (La divisione)
divisione (il 19 nellesempio) si dice il dividendo; il Ingresso: il dividendo n e il divisore m;
numero da sottrarre (cio`e il 5) si chiama divisore. Il Uscita: il quoziente q e il resto r della divisione.

50

CAPITOLO 2. ARITMETICA

1. se n < m si pone q := 0, r := n e loperazione `e trovare come scoprirlo, senza perdere troppo tempo.
terminata;
Questo fatto rende la divisione a due cifre uno scoglio fra i pi`
u complessi della matematica applicata,
2. altrimenti, siano n = nt nt1 . . . n1 n0 ed m = oggi superato grazie alluso massiccio dei calcolatori
ms ms1 . . . m1 m0 le rappresentazioni decimali da tasca.
dei due numeri; deve essere t s dato che `e
Un esempio di come si imposta la divisione pu`o torn m;
nare utile; per maggiore chiarezza, abbiamo riportato
3. si considerano le prime s + 1 cifre di n, cio`e esplicitamente le sottrazioni, anche se di regola viene
nt nt1 . . . nts+1 nts = n e si confrontano con insegnato come evitare tale passaggio:
m; se n m si prosegue al passo successivo,
1 7 4 4 8 2 8
altrimenti si aggiunge ad n la cifra successiva di
1 6 8
6 2 3
n, ponendo ora n := nt nt1 . . . nts nts1 . Si
6 4
osservi che in questo caso `e certamente n > m,
5 6
visto che n ha una cifra in pi`
u rispetto ad m;
8 8
4. sia k il massimo numero intero tale che m k
8 4
n . Tale numero `e 9: infatti, per come si `e
4
proceduto al punto precedente abbiamo n < 10
Per le divisioni molto complesse, come per esempio
m e quindi k = n /m < 10. Quindi k `e una cifra
.
.
.
e rappresenta la cifra decimale pi`
u a sinistra del 347 586 344 812 diviso per 1758, pu`o essere conveniente scriversi, da una parte, la tabella dei multipli
quoziente q;
del divisore, cos` da averla sempre sottocchio e sco5. si esegue la sottrazione n k m = prire immediatamente quante volte il 1758 sta nella
pv pv1 . . . p1 p0 , come rappresentazione decimale; parte considerata del dividendo.
La divisione per 2 si dovrebbe saper eseguire a men6. per ognuna delle cifre nj del dividendo non consite
o, almeno, senza dover impostare loperazione coderate al passo 3. e procedendo da sinistra verso
me
nel caso generale. Le divisioni per 10, 100, 1000,
destra:
. . . , si fanno togliendo lultima cifra, le ultime due
(a) si aggiunge tale cifra nj a destra di cifre, le ultime tre, e cos` via; le cifre tolte costituipv pv1 . . . p1 p0 e questo numero lo si asse- scono il resto della divisione. Le divisioni per 4 si
gna ad n (si dice che si abbassa la cifra fanno bene dividendo due volte per 2; cos`, 147/4 si
nj );
esegue dimezzando 147 in 73 e poi questo in 36. Ana(b) si trova il massimo numero k per cui k logamente, le divisioni per 8 richiedono di dimezzare
m < n (qui possiamo anche avere k = 0 se per tre volte. Le divisioni per 5 si fanno raddoppiann < m, eventualit`
a da escludere al punto do il dividendo e poi dividendo per 10, cio`e togliendo
4.; anche questa volta, k `e ununica cifra e lultima cifra. Infine, ricordarsi sempre che la divicostituisce la cifra successiva del quoziente); sione per 0 non ha senso (loperazione `e impossibile),
mentre la divisione per 1 d`a sempre come quoziente
(c) si esegue la sottrazione n k m = il dividendo stesso.
pv pv1 . . . p1 p0 , e, se ci sono altre cifre nel
Per quanto concerne divisione e confronti, possiadividendo n si cicla tornando al passo 6a.;
mo limitarci a riprendere dalla moltiplicazione la pro7. la sequenza delle cifre k ottenute ai passi 4. e priet`a di eliminazione: se c `e un numero diverso da
6b. costituisce il quoziente q; lultima differenza 0 e si ha ac R bc, allora possiamo dividere per c ed
ottenere a R b. La relazione R `e una qualsiasi delle
pv pv1 . . . p1 p0 `e il resto r della divisione.
sei relazioni di base , <, , >, = e 6=.
Come si vede, questo `e lalgoritmo pi`
u complicato
Il resto della divisione intera ha un ruolo fondamenper ora incontrato; inoltre, come si diceva, c`e un pun- tale in Aritmetica e, di fatto, in tutta la Matematica.
to difficile costituito dai passi 4. e 6b. (che sono del Pertanto, e importante la seguente:
tutto analoghi): dati n ed m, come si trova k? cio`e,
come si stabilisce quante volte m sta in n ? Quando Definizione 2.4 Il resto o modulo della divisione si
m `e costituito da ununica cifra, la Tavola Pitagorica, indica con la notazione n mod m, e se due numeri n1
usata allinverso di come la si usa nella moltiplicazio- ed n2 hanno lo stesso resto nella divisione per m, si
ne, fa al nostro scopo, ma quando m `e fatto di pi`
u scrive n1 n2 (mod m), che si legge: n1 `e concifre, `e solo lintuito matematico, lesperienza o la for- gruo ad n2 , modulo m. Loperazione che ci fa pasza bruta del provare che ci possono aiutare. E chiaro sare da un numero n N al resto n mod m si dice
che il valore di k `e ben determinato, ma il difficile `e riduzione modulo m.

`
2.5. DIVISIBILITA
Ad esempio, abbiamo 19 14 (mod 5).
Dati due qualsiasi numeri n1 , n2 N, e fissato un
numero m N, possiamo sempre dire se n1 `e congruo,
o non `e congruo, ad n2 , modulo m: basta eseguire la
divisione e calcolare i due resti, cos` che n1 n2
(mod m) se e soltanto se n1 mod m = n2 mod m.
Questo significa che abbiamo definito una relazione
su N, cio`e una regola per correlare (o non correlare)
due qualsiasi numeri naturali. La cosa curiosa `e che
questa relazione, detta di congruenza, gode delle stesse propriet`a formali delluguaglianza: 1) la propriet`a
riflessiva: ogni numero `e congruente con se stesso (infatti, il resto della divisione per m non pu`o cambiare);
2) la propriet`a simmetrica: se un numero n1 `e congruo ad n2 , anche n2 `e congruo ad n1 (infatti, si tratta
ancora delluguaglianza dei due resti); 3) la propriet`a
transitiva: se n1 `e congruo ad n2 , e questo `e congruo
ad n3 , allora il numero n1 `e congruo ad n3 (infatti,
i tre numeri hanno lo stesso resto nella divisione per
m). Si tratta quindi di una relazione di equivalenza
e, per quanto detto a suo tempo, possiamo mettere
assieme tutti i numeri che hanno lo stesso resto nella divisione per il numero fissato m. Ad esempio, se
m = 3 si hanno tre classi di equivalenza:
numeri con resto 0: [0] = {0, 3, 6, 9, . . .};
numeri con resto 1: [1] = {1, 4, 7, 10, . . .};
numeri con resto 2: [2] = {2, 5, 8, 11, . . .}.
Non vi possono essere altri casi e gli insiemi cos` ottenuti si dicono classi di resti. Ogni classe, infatti, `e
individuata dal resto r che i suoi elementi hanno nella divisione per m. Fissato m, esistono esattamente
m classi, ciascuna corrispondente a uno dei possibili
resti 0, 1, . . . , m 1. Per m = 2 le due classi sono
costituite, rispettivamente, dai numeri pari e dispari.
Linsieme delle classe di resti modulo m si indica con
la notazione Zm .
Di solito, per semplificare le notazioni, si scrive
semplicemente r invece di [r] e Zm = {0, 1, . . . , m1}.
Le operazioni di addizione e di moltiplicazione su N
inducono operazioni analoghe su Zm :

51
Lasciando perdere, per ragioni di semplicit`a, la divisione, si chiama Aritmetica modulare di base m
linsieme Zm con le operazioni dette. Il calcolatore elettronico rappresenta i numeri naturali con una
quantit`a fissa di bit, cio`e di cifre binarie; di solito sono 16 o 32, cos` che laritmetica del calcolatore `e in
realt`a unaritmetica modulare, in cui m = 216 oppure m = 232 . Poiche 216 = 65536, questo significa che
27438 + 49512 = 11414 e 1000 100 = 34464; il programmatore ben conosce queste limitazioni e adotta
i necessari accorgimenti se un programma richiede
luso di numeri che possono superare m.
La somma, a causa dei riporti che si propagano
da destra verso sinistra, va eseguita sequenzialmente in questa direzione, di modo che, pi`
u sono i bit
usati nella rappresentazione dei numeri, pi`
u tempo
loperazione richiede. Allinizio della storia degli elaboratori, pertanto, furono proposte tecniche di rappresentazione che, sfruttando comunque laritmetica modulare, potessero accelerare le operazioni, rendendole eseguibili in modo pi`
u parallelo, cio`e senza un uso massiccio dei riporti. Se fissiamo k numeri (m1 , m2 , . . . , mk ), a due a due primi tra loro, possiamo rappresentare univocamente un numero
naturale a < M = m1 m2 mk mediante
una k-upla (a1 , a2 , . . . , ak ), dove ai a (mod mi ),
per i = 1, 2, . . . , k. Per le propriet`a del modulo, se
b = (b1 , b2 , . . . , bk ) si ha:
a+b
ab

= (a1 + b1 , a2 + b2 , . . . , ak + bk )
= (a1 b1 , a2 b2 , . . . , ak bk )

dove ogni operazione `e eseguita modulo mi ; il vantaggio `e che le k operazioni sono indipendenti luna
dallaltra e quindi possono essere eseguite in parallelo, accelerando cos` il calcolo. Prendiamo ad esempio
m1 = 32 e m2 = 27, di modo che M = 32 27 = 864,
il numero 100 `e rappresentato dalla coppia (4, 19) e
il numero 8 da (8, 8). Per esempio, si ha:
(20, 23) + (24, 20)
(14, 14) (8, 13)

=
=

(12, 14)
(16, 20)

Il problema, a questo punto, `e risalire da una coppia (o, in generale, da una k-upla) al numero che
a + b = a + b (mod m)
a b = a b (mod m). essa rappresenta; il lettore `e invitato (per non dire
sfidato) a trovare i numeri naturali che hanno daQueste operazioni godono (pi`
u o meno) delle stesse to origine ai due esempi precedenti. Su questo punto
propriet`a formali delladdizione e delle moltiplicazio- (anche se non solo su questo) sono falliti questi strani
ne in N: chiusura, commutativit`a, associativit`a, di- calcolatori.
stributivit`a. Inoltre, per ogni elemento r Zm , la
classe m r agisce da opposto, poiche r + (m r) =
Divisibilit`
a
m = 0 (mod m), e quindi possiamo definire la 2.5
sottrazione in Zm :
Alcune propriet`a dei numeri relative alla divisibilit`a
sono tanto importanti che `e opportuno partire proa b = a + (m b),
prio da esse per parlare pi`
u diffusamente di questo
e questo `e qualcosa di nuovo rispetto ad N.
concetto.

52

CAPITOLO 2. ARITMETICA

Teorema 2.4 Siano a, b due numeri naturali; allora: Prova: Consideriamo il caso del 9 e dimostriamo
qualcosa di pi`
u forte, e cio`e che: la somma delle cifre
se a e b sono divisibili per m, allora anche a + b decimali di un numero n ha lo stesso resto di n nella
e a b (se a b) sono divisibili per m;
divisione per 9. Sia infatti n = ds ds1 . . . d1 d0 la rappresentazione decimale di n. Per la regola posizionale
se a `e divisibile per m, allora a b `e divisibile
abbiamo:
per m; se poi anche b `e divisibile per m, allora
a b `e divisibile per m2 ;
n = 10s d + 10s1 d
+ + 10 d + d .
s

s1

se a `e divisibile per m e b `e divisibile per n, allora La somma delle cifre di n `e = d +d + +d +d


s
s1
1
0
a b `e divisibile per m n.
e quindi:
n =
Prova: Dire che a `e divisibile per m significa che

esiste un numero naturale q tale che a = m q; ana- (10s 1)d +(10s1 1)d
s
s1 + +99d2 +9d1 .
logamente, esiste r N tale che b = mr. Per la propriet`a distributiva del prodotto rispetto alla somma Gli addendi di questa somma sono tutti divisibili per
9 e quindi n = 9 k per qualche k. Questo ci dice
si ha:
che n e hanno lo stesso resto nella divisione per 9.
a + b = (m q) + (m r) = m (q + r)
Da ci`o segue che n `e divisibile per 9 se e solo se tale `e
. Il risultato si estende ora immediatamente al caso
e questo significa che a + b `e divisibile per m. Nello del numero 3.
stesso modo si dimostrano le altre propriet`a.
Osserviamo esplicitamente che se > 9, si pu`o calLesecuzione della divisione `e il metodo generale colare la somma delle cifre di , che deve ancora
per determinare se un numero m divide o meno un godere della stessa propriet`a. Applicando eventualaltro numero n (con n > m). Tuttavia, nella pratica, mente pi`
u volte questo procedimento, si arriva sempre
si possono dare alcuni criteri per stabilire ad occhio se a un valore compreso tra 0 e nove. Su questa proun numero n N `e divisibile per un numero piccolo priet`a, e sullaritmetica modulare in base 9, si fonda
assegnato. Sono facili i criteri di divisibilit`a per 2, la famosa prova del nove. Sia ad esempio m p = n e
3, 4, 5, 6, 8, 9, 10, 11, 12; pi`
u difficili e perci`o non si voglia controllare che il risultato n della moltiplicapraticati sono i criteri per il 7 e per i numeri pi`
u zione sia esatto. Dividendo per 9 si ha: n = 9a+rn ,
grandi, eccetto qualche caso particolare come 16, 25, m = 9b+rm , p = 9c+rp . Eseguendo il prodotto si
50, 100 e cos` via.
trova mp = 81bc+9brp +9crm +rm rp .
I primi tre addendi sono divisibili per 9 e quindi il reTeorema 2.5 Un numero n N `e divisibile per 2 se sto della divisione di m p per 9 deve essere uguale
e solo se la sua ultima cifra `e tale; n `e divisibile per al resto r della divisione di rm rp per 9, e questo
4 se e solo se le sue due ultime cifre sono tali; n `e r deve coincidere con rn . La prova del nove della
divisibile per 8 se e solo se le sue tre ultime cifre sono moltiplicazione consiste nel valutare r ed rn : se sotali.
no diversi, sicuramente la moltiplicazione `e errata; se
sono uguali c`e una buona probabilit`a (non la certezProva: Se d `e lultima cifra decimale di n, si ha za) che sia stata eseguita correttamente. Ad esemn = 10k+d; poich`e 10k `e certamente divisibile per pio, 25 37 = 925 e si ha rm = 7, rp = 1, quindi
2, n sar`a tale se e solo se tale `e d. Lo stesso argomento r = 7 che coincide con rn = 7. Si osservi per`o che
`e valido per 4, quando si scriva n = 100 k + h ed se avessimo ottenuto come risultato 952 (effettuando
h rappresenta il numero dato dalle due ultime cifre per errore il classico rovescione) la prova del nove
di n. Infine, per 8 si procede in modo analogo dopo avrebbe comunque dato un risultato positivo!
aver scritto n = 1000 k + h, essendo questa volta h
il numero costituito dalle ultime tre cifre decimali di Teorema 2.7 Un numero n N `e divisibile per 5 se
n.
e solo se tale `e la sua ultima cifra decimale (cio`e, se
e solo se termina per 0 o per 5); `e divisibile per 10
Un numero si dice pari se e solo se `e divisibile per 2;
se e solo se termina per 0.
dispari altrimenti. Lo 0 `e pertanto un numero pari.
Il criterio dato dal teorema precedente ci permette
Prova: Analoga al caso del criterio di divisibilit`a
di stabilire se un numero `e pari o dispari guardando
per 2.
semplicemente la sua cifra finale.
Naturalmente, da questo criterio discendono i
Teorema 2.6 Un numero `e divisibile per 3 o per 9 se criteri di divisibilit`a per 25, 50, 100 e cos` via.
e solo se tale risulta la somma delle sue cifre decimali. Analogamente, si ha il seguente risultato:

`
2.5. DIVISIBILITA

53

Corollario 2.8 Un numero n N `e divisibile per 6 primo se `e divisibile soltanto per se stesso e per lua. Un numero che non sia primo si dice composto.
se e solo se `e divisibile sia per 2 che per 3; `e divisibile nit`
Il numero 1 `e convenzionalmente considerato primo.
per 12 se e solo se `e divisibile sia per 3 che per 4.
Diamo infine, senza dimostrazione che ormai dovrebbe essere alla portata del lettore, il seguente
criterio:
Teorema 2.9 Un numero n N `e divisibile per 11
se e solo se: detta d la somma delle sue cifre di posto
dispari e p la somma delle sue cifre di posto pari, si
ha che la differenza:
|d p| = (d p) se d p, (p d) altrimenti
`e divisibile per 11.

Se indichiamo con Dm linsieme dei divisori del numero m, dire che m ed n sono primi tra loro significa
che Dm Dn = {1}. Ad esempio, 24 e 35 sono primi tra loro, in quanto D24 = {1, 2, 3, 4, 6, 8, 12, 24}
e D35 = {1, 5, 7, 35}. Poiche lo 0 `e divisibile per
qualsiasi altro numero, non lo si considera affatto
nel concetto di coprimalit`a. Si osservi infine che
Z12 = {1, 5, 7, 11} e Z15 = {1, 2, 4, 7, 8, 11, 13, 14};
quindi (12) = 4 e (15) = 8. Se due numeri sono
primi tra loro, non `e detto che siano primi; lesempio
pi`
u semplice `e dato dai numeri 4 e 9. Viceversa, come
vedremo, se due numeri sono primi, essi sono anche
primi tra di loro. I numeri primi verranno trattati
pi`
u compiutamente nella prossima sezione.
La funzione toziente `e molto importante nella teoria dei numeri e merita qualche considerazione, anche
se del tutto elementare. Dimostriamo il seguente:

Ad esempio, con questo criterio si vede subito che


83413 e 3465 sono entrambi divisibili per 11.
I criteri che abbiamo presentato dipendono dalla
base con cui i numeri sono scritti; pertanto, non ci
possiamo aspettare che essi siano ancora validi per
i numeri scritti in base 7 o in base 2. Ad esempio,
Teorema 2.10 Siano p, q due numeri primi; si ha
poiche in base 2 si ha 210 = 102 , un numero scritto in
allora:
base 2 `e pari se e solo se termina per 0. Analogamen1. (p)
= p1
te, sar`a divisibile per 4 se termina per 00, divisibile
2. (pq)
= (p 1)(q 1)
per 8 se termina con 000, e cos` via. Come esercizio,
3. (pk )
= pk pk1
il lettore `e invitato a dimostrare che un numero bik h
4. (p q ) = (pk pk1 )(q h q h1 )
nario `e divisibile per 3 se e solo se vale il criterio del
Teorema 2.9. Trasposto al caso corrente, esso signifi- Prova: 1. e 3. sono casi particolari di 2. e 4.
ca: siano d e p le somme delle cifre di posto dispari e
1. Si considerino i p numeri da 0 a p 1; quando p
di posto pari; il numero `e divisibile per 3 se e solo se
`e primo, tutti questi numeri, eccetto lo 0, sono
|d p| `e divisibile per 3. Si provi con 1365.
primi con p.
I criteri di divisibilit`a fanno parte della stenaritmia, cio`e quellinsieme di regole che permettono di
2. Si considerino i pq numeri da 0 a pq 1; ci sono
accelerare i conteggi. A parte il matematico profesq multipli di p: 0, p, 2p, . . . , (q 1)p, e p multipli
sionista (che per`o per principio preferisce non fare i
di q: 0, q, 2q, . . . , (p 1)q. Questi numeri sono
conti) sapere se un numero `e divisibile per 2, 3, 4,
gli unici a non essere primi con pq e sono tutti
5 e cos` via risulta utile quando si paga alla romana
distinti tra di loro, eccetto lo 0, che si trova in
o si debbono suddividere certe risorse tra un numero
entrambe le sequenze. Pertanto si ha:
di persone. Oggi si fanno i conti con i calcolatori,
(pq) = pq p q + 1 = (p 1)(q 1).
sia quelli grandi, sia quelli da tasca, ma saper destreggiarsi mentalmente tra i numeri `e utile (anche i
3. Fra i pk numeri da 0 a pk 1, solo quelli dicalcolatori, se impostati male, sbagliano) e salutare
visibili per p non sono primi con pk ; essi sono:
(un po di ginnastica al cervello non fa mai male).
0, p, 2p, . . . , pk p = p(pk1 1), cio`e sono pk1
Comunque pi`
u importanti sono altri concetti legati
in tutto. Da questo segue la formula.
alla divisibilit`a, come i numeri primi tra loro (che vedremo tra un istante), i numeri primi e il massimo
4. Il ragionamento `e analogo a quello del punto 2.
comun divisore, che invece saranno introdotti nelle
Fra i pk q h numeri compresi tra 0 e pk q h 1, non
sezioni successive.
sono primi con pk q h tutti e soli i multipli di p
e i multipli di q; ma i primi sono pk1 q h e i seDefinizione 2.5 Due numeri si dicono primi tra locondi pk q h1 , che vanno perci`o esclusi dal totale
ro o coprimi se non hanno divisori comuni, eccetto
di pk q h numeri. In questo modo, per`o, abbiamo
l1. Se m N `e un numero diverso da 0, si inditolto due volte i multipli di pq, che sono in tutca con Zm linsieme dei numeri minori di m e primi
to pk1 q h1 e devono essere di nuovo inclusi nel

con m; la cardinalit`
a di Zm si indica con (m) e la
totale:
funzione : N N cos` definita si dice la funzione
(pk q h ) = pk q h pk1 q h pk q h1 + pk1 q h1
toziente di Eulero. Infine, un numero p N si dice

54

CAPITOLO 2. ARITMETICA
e questa `e la formula desiderata.

Queste formule permettono di calcolare la funzione (n) senza dover cercare esplicitamente i numeri
primi con n, come abbiamo dovuto fare dopo la Definizione 2.5; il lettore pu`o ora verificare che i valori l`a
trovati son quelli che si calcolano col precedente teorema e non avr`a difficolt`a a valutare (72) e (100),
o anche (1. 000. 000). Nei primi due casi, lo invitiamo a scrivere esplicitamente gli elementi di D72 e di
D100 .
Ma quanto vale (30)? Poiche 30 = 2 3 5, il
teorema non si pu`o utilizzare; la sua dimostrazione,
per`o, fornisce il metodo per risolvere il problema generale. Si consideri il numero n = pqr, dove p, q, r
sono numeri primi; il metodo usato nella dimostrazione del teorema si dice principio di inclusione ed
esclusione e possiamo ora applicarlo in questo modo:
i numeri minori di n sono in tutto pqr e da questa
quantit`a partiamo;
dal numero precedente dobbiamo escludere i
multipli di p (che sono qr), i multipli di q (che
sono pr) e i multipli di r (che sono pq), e si ha
pertanto pqr pq qr rp;
in questo modo, per`o, abbiamo escluso due volte
i multipli di pq (che sono r), i multipli di qr (che
sono p) e i multipli di rp (che sono q); essi devono
essere inclusi di nuovo, ottenendo cos` pqr pq
qr rp + p + q + r;
ci accorgiamo ora che lo 0 (che deve essere escluso e che `e lunico multiplo di pqr), `e stato prima
incluso, poi escluso 3 volte e quindi incluso 3
volte ancora; quindi va escluso di nuovo.
In conclusione, si ha:
(pqr) = pqr pq qr rp + p + q + r 1 =
= (p 1)(q 1)(r 1),

e il lettore verificher`a direttamente che (30) =


1 2 4 = 8, trovando esplicitamente D30 =
{1, 7, 11, 13, 17, 19, 23, 29}.
Nota 2.3

Questa tecnica fa vedere che il toziente


`e una funzione moltiplicativa; con tale termine si indica una funzione f : N N per la quale vale la seguente
propriet`
a. Sia n = pk1 1 pk2 2 pkuu la decomposizione in
fattori primi (si veda la sezione successiva); allora:
f (n) = f (pk1 1 pk2 2 pkuu ) = f (pk1 1 )f (pk2 2 ) f (pkuu ).
Naturalmente, dobbiamo sapere quanto vale la f sulle
potenze di un numero primo, ma per il toziente sappiamo che (pk ) = pk pk1 , qualunque sia k, e quindi
la funzione risulta completamente definita.

Unosservazione interessante `e la seguente: siano


x, y Zm e consideriamo il loro prodotto xy; poiche ne
x ne y hanno un divisore comune con m, nemmeno xy
pu`
o averne. Ad essere rigorosi, questo fatto discende
dal Corollario 2.12 che ancora dobbiamo dimostrare;
tuttavia, siamo in una nota e possiamo permetterci
qualche libert`
a. Prendiamo ora il resto r della divisione di xy per m, cio`e sia xy = km + r. Se r avesse
un fattore comune con m, tale fattore potrebbe essere
messo in evidenza nel membro destro e, ancora per
il futuro Corollario 2.12, xy dovrebbe essere divisibile
per tale fattore, cosa che abbiamo gi`
a escluso. Con
ci`
o abbiamo dimostrato che loperazione x y = xy
(mod m) `e chiusa. Ad esempio, in Z15 si ha 47 = 13,
7 8 = 11, 11 13 = 8, 8 8 = 82 = 4 e cos` via. Valgono ovviamente le propriet`
a associativa e commutativa,
in quanto tali propriet`
a valgono per la moltiplicazione
usuale, sulla quale x y si basa. L1 agisce da identit`
a
e ogni elemento ha il suo inverso: 2 8 = 1, 4 4 = 1,
7 13 = 1, 11 11 = 1, 14 14 = 1, di modo che 2
e 8, 7 e 13 sono linverso luno dellaltro, mentre 4,
11, 14 hanno come inverso se stessi. Siamo quindi di
fronte a un gruppo (v. Sezione [1.8]). I matematici
si sono dati da fare per studiare questi strani gruppi

, ) e ne hanno trovato tante propriet`


a. Inaspet(Zm
tatamente, alla met`
a degli anni 1970, Rivest mostr`
o
come questi gruppi potessero essere utili per assicurare la privatezza dei messaggi, ad esempio durante la
loro trasmissione in una rete pubblica come Internet.
Essi infatti permettono di cifrare i messaggi in modo
particolarmente efficace.
Il metodo si basa su questa propriet`
a, gi`
a dimostrata
da Eulero 200 anni prima: per ogni elemento x Zm
si ha x(m) = 1, cio`e in Z: x(m) 1 (mod m).
Il lettore `e invitato a verificare questa propriet`
a su
Z15 , ma la dimostrazione (che vedremo parlando di
Algebra Astrattanella Sezione 5.8) ci assicura che la
regola vale in generale. Quello che interessa `e questo:
moltiplicando i due membri delluguaglianza per x si
ha: x(m)+1 = x. Se abbiamo due numeri p ed s,
tali che ps = k(m) + 1, possiamo procedere a cifrare e decifrare un messaggio con la seguente tecnica.
Sia x il messaggio, interpretato come numero; questo `e sempre possibile poiche possiamo, ad esempio,
interpretare ogni lettera come cifra in un sistema di
numerazione in base 21 (vedere la Sezione 1.5). Prendiamo xp Zm come codifica cifrata del messaggio e
usiamo laltro numero s per decifrarlo; in effetti si ha:
(xp )s = xps = xk(m)+1 = x(x(m) )k = x1k = x
(tutte le operazioni sono fatte modulo m) e quindi abbiamo ottenuto il messaggio di partenza, decifrando il messaggio cifrato. Naturalmente, affinche
il marchingegno funzioni si devono verificare certe
condizioni:
1. il numero s sia segreto, conosciuto solo da chi
deve ricevere il messaggio, altrimenti addio privatezza. Viceversa, il numero p deve essere pubblico, noto a tutti, in modo da poter essere usato

55

2.6. NUMERI PRIMI


da chiunque voglia mandare un messaggio a chi
conosce s;

3. Si cancellano dalla lista L tutti i multipli di p, p


escluso;

2. dalla conoscenza di p e di m non si possa risalire


a (m), altrimenti dal fatto che ps = k(m) + 1
si potrebbe conoscere s e rompere il codice;

4. Si considera il primo numero della lista


successivo a p che non sia stato cancellato;

3. sia facile (almeno per un calcolatore) eseguire le


potenze xp ed (xp )s modulo m.

5. Se tale numero esiste, lo si assegna a p e si torna


al punto 3.

La prima condizione `e una questione personale di


chi conosce s: poiche lo conosce solo lui, star`
a a lui
non rivelarlo a nessun altro. La seconda condizione
sembra assurda, perche m deve essere noto a tutti
per poter fare le operazioni modulo m, e da m si deve
poter risalire a (m). In realt`
a, questo `e il punto
interessante del metodo, ma ci ritorneremo sopra un
po pi`
u avanti, non appena avremo approfondito il
concetto di numero primo, per il momento, diamola
per buona. La terza condizione, invece, `e semplice:
per calcolare xp (mod m) non si deve calcolare xp
e poi ridurre modulo m, il che comporterebbe la
manipolazione di numeri enormi. Conviene piuttosto
ridurre modulo m ad ogni operazione. E questo uno
dei casi in cui la tecnica dei contadini russi risulta
particolarmente utile, come mostra un semplice
esempio. Si voglia calcolare 513 (mod 7); valutiamo
le potenze raddoppiando ogni volta lesponente:
52 = 4, 54 = (52 )2 = 42 = 2, 58 = (54 )2 = 22 = 4,
tutto modulo 7. A questo punto sarebbe inutile
calcolare 516 , ma usiamo piuttosto le potenze trovate
per calcolare 513 : 512 = 58 54 = 4 2 = 1, e infine
513 = 512 5 = 1 5 = 5. Si noti che (7) = 6,
e quindi questa `e anche una verifica del precedente
risultato di Eulero. Nella realt`
a, come vedremo, sono
coinvolti numeri con oltre 200 cifre decimali, ma,
fortunatamente, i conti non devono essere fatti a
mano e i bravi calcolatori pensano loro a tutto.

6. Altrimenti, avendo esaurito la scansione della lista L, si `e finito ed L contiene i numeri primi
desiderati.

2.6

Numeri primi

Ad esempio, per i numeri da 1 a 25, si comincia


con la lista:
(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,
18, 19, 20, 21, 22, 23, 24, 25)
dove abbiamo marcato il valore di p. Cancelliamo i
multipli di 2:
(1, 2, 3, 4 , 5, 6 , 7, 8 , 9, 10 , 11, 12 , 13, 14 , 15,
16 , 17, 18 , 19, 20 , 21, 22 , 23, 24 , 25).
Il nuovo valore di p `e 3 e se ne cancellano i multipli
rimasti:
(1, 2, 3, 5, 7, 9 , 11, 13, 15 , 17, 19, 21 , 23, 25).
A questo punto il successivo valore di p `e 5, e il suo
unico multiplo nella lista L `e 25. Tolto anche lui,
abbiamo:
L = (1, 2, 3, 5, 7, 11, 13, 17, 19, 23);
i numeri rimasti non hanno multipli in L, e quindi
questo `e linsieme dei numeri primi minori o uguali a
25.
La determinazione del fatto che un numero sia primo o composto pu`o essere fatta senza costruire in
modo esplicito una tabella di numeri primi. Si osservi che se un numero p `e composto, cio`e p = nm con
n ed m diversi da 1, allora uno dei due fattori deve

essere minore o uguale a p. Infatti, se avessimo

m > p e n > p, sarebbe anche m n > p (si


veda il Teorema 1.6). Si ha allora il seguente metodo:

I numeri primi rappresentano sicuramente uno dei pi`


u
antichi e misteriosi concetti della Matematica. Sono
primi i numeri 2, 3, 5, 7, 11, 13, 17. Sono composti
tutti i numeri pari, eccetto il 2, nonche 9, 15, 21, etc.
Se si esclude il 2, tutti i numeri primi sono dispari.
Un elenco di tutti i numeri primi minori o uguali a
un assegnato numero n si pu`o ottenere con il seguente algoritmo, noto fin dallantichit`a come crivello di Algoritmo 2.8 (Numero primo o composto?)
Eratostene:
Ingresso: Un numero n N.
Uscita:
Primo se n `e un numero primo,
Algoritmo 2.7 (Crivello di Eratostene)
Composto altrimenti.
Ingresso: un numero n N maggiore di 2;
Uscita: lelenco dei numeri primi minori o uguali ad
1. Si pone p := 2;
n.
2. Se n `e divisibile per p, allora il numero n non `e
1. Si dispongono in una lista L tutti i numeri da 2
primo e si esce dopo aver scritto Composto;
fino ad n.
3. Altrimenti (p non divide n) si considera il
2. Si pone p := 2;
numero primo successivo a p;

56

CAPITOLO 2. ARITMETICA

4. Detto ancora p tale numero primo, se p2 > n il la scomposizione in fattori primi `e da seguire con
numero n non ha divisori e quindi si esce dopo attenzione:
aver scritto Primo;
Algoritmo 2.9 (Scomposiz. in fattori primi)
5. Altrimenti (p2 n) si torna la punto 2.
Ingresso: Un numero n N;
Uscita: La sua scomposizione in fattori primi.
Come esempio, si consideri n = 317. I numeri primi
con cui provare la divisibilit`a sono 2, 3, 5, 7, 11, 13,
1. si pone m := n, p := 2 e si inizializza L come
17, in quanto 192 = 361 > 317. Nessuno di questi
lista vuota;
numeri primi divide 317, e quindi si pu`o concludere
che 317 `e un numero primo.
2. se m `e divisibile per p allora:
Per un numero composto n ha senso trovare la sua
scomposizione in fattori primi, cio`e linsieme dei nu(a) si aggiunge p alla lista L;
meri primi p1 , p2 , . . . , pk tali che n = p1 p2 pk .
(b) si divide m per p e il quoziente diviene il
Naturalmente, anche un numero primo p ha una
nuovo valore di m;
scomposizione che si riduce al solo fattore p. Convenzionalmente, la scomposizione di un numero si
(c) se m = 1 allora lalgoritmo `e terminato; L
scrive n = pk11 pk22 . . . pkuu dove p1 , p2 , . . . pu sono nucontiene la lista ordinata dei fattori primi
meri primi distinti; ki si dice la molteplicit`
a di pi .
di n;
Unosservazione importante `e il seguente:
(d) altrimenti (m 6= 1) si riprende il ciclo dal
punto 2.
Teorema 2.11 Se n N `e un numero naturale qualsiasi, allora la sua scomposizione in fattori primi `e
3. altrimenti, cio`e se m non `e divisibile per p:
unica, a parte lordine con cui i vari fattori sono
considerati.
(a) si considera il numero primo successivo a
Prova: Supponiamo che n abbia due scomposizioni
p;
pk11 pk22 . . . pkuu e q1h1 q2h2 . . . qshs . Alcuni fattori possono
(b) si chiama ancora p tale numero primo;
essere uguali, per cui dividiamo entrambe le scompo(c) se p2 > n allora lalgoritmo `e finito: si agsizioni per tali fattori. Si ottengono cos` due scompo
giunge m alla lista L che viene a contenere
sizioni di un numero n che non hanno fattori comuni.
lelenco ordinato dei fattori primi di n;
Vogliamo dimostrare che n = 1. Se cos` non `e, sia
p un fattore della prima scomposizione, per cui si ha
(d) altrimenti (p2 n) si riprende dal punto 2.
n = p t. Daltra parte p non pu`o dividere nessuno
dei q dellaltra scomposizione, che sono tutti primi,
Il passo 3a non `e particolarmente semplice, poiper cui si deve avere n = p t + r, con 0 < r < p. che richiede di sapere gi`a quali sono i numeri primi;
Uguagliando le due espressioni si ha p t = p t + r, per questo si sostituisce in pratica con listruzione:
cio`e p (t t ) = r. Ora, se t = t si ricava r = 0
(a) si pone p := p + 2; cio`e si considerano tutti i
contro lipotesi su r; se viceversa t > t (in quanto numeri dispari; ci`o rallenta un po lesecuzione, ma
non ha senso che sia t < t ), allora abbiamo che p `e non lede la correttezza dellalgoritmo. Si osservi inolun fattore di r, contro lipotesi che r sia minore di p. tre che il punto 3c. prende in considerazione anche
Quindi lipotesi delle due scomposizioni `e assurda, a leventualit`a che n possa essere un numero primo.
meno che non sia n = 1, ma questo, di fatto, significa
Nella lista L il numero primo p compare k volte, se
che le due scomposizioni di n erano uguali.
k `e la molteplicit`a di p in n. Ad esempio, il numero
Vale la pena di scrivere esplicitamente il seguente
fatto:
Corollario 2.12 Se p `e un numero primo che divide
il prodotto m n, allora p deve dividere m o n.
Prova: Se p divide m n, deve comparire nella sua
scomposizione in fattori primi. Se non compare ne
in quella di n, n`e in quella di m, per lunicit`a della
scomposizione, non pu`o comparire nemmeno nel loro
prodotto.

792 d`a luogo alla seguente computazione:


792
396
198
99
33
11
1

2
2
2
3
3
11

Si scrive 792 = 23 32 11; il fattore 2 ha molteplicit`a


Poiche un certo numero primo p pu`o divide- 3, il fattore 3 ha molteplicit`a 2 e il fattore 11 ha
re n pi`
u di una volta, lalgoritmo di ricerca del- molteplicit`a 1.

57

2.6. NUMERI PRIMI


Nota 2.4

Se n persone si volessero scambiare tra


loro messaggi mantenendone la privatezza, `e facile vedere che occorrerebbero n(n1)/2 chiavi di ciframento
diverse, una per ogni coppia di utenti. Cos`, un milione di persone richiederebbero 500 miliardi di chiavi
distinte. Pi`
u ragionevole `e il metodo seguente: ogni
persona ha una chiave pubblica di ciframento P , nota
a tutti, e una chiave di deciframento segreta S, nota
a lui solo. Se qualcuno gli deve spedire un messaggio M , lo codifica con la chiave pubblica ottenendo
un messaggio cifrato P (M ), ed `e questo che spedisce.
Chiunque lo intercetti, non conoscendo la chiave di deciframento S non lo potr`
a leggere in chiaro; solo chi lo
deve ricevere, applicando a P (M ) la chiave S otterr`
a
S(P (M )) = M . Questo metodo richiede solamente
due milioni di chiavi (un milione di P e un milione di
S) per il nostro milione di persone, e questo `e un bel
risparmio.
Per trovare praticamente le chiavi, si fissano due numeri primi x ed y piuttosto grandi, diciamo con 100
cifre decimali; fortunatamente, esistono metodi abbastanza veloci per determinare se un numero `e primo o
composto senza dover fare tutte le prove di divisibilit`
a.
Si pone poi m = xy di modo che (m) = (x1)(y1);
si osservi che m `e un numero di 200 cifre decimali. I
due fattori x ed y sono tenuti segreti, mentre m `e
reso pubblico. I metodi conosciuti per trovare la decomposizione in fattori primi di m sono riconducibili
tutti al metodo esaustivo di cercare sistematicamente
i divisori mediante il precedente algoritmo; questo metodo, applicato a un numero grande come m richiede
qualche centinaio di anni di lavoro del pi`
u potente calcolatore attuale. Ci`
o d`
a la sicurezza che, in pratica, la
scomposizione m = xy non verr`
a mai trovata, poiche
non c`e alcuna certezza nel cercarla. A questo punto si
procede cos`: se un utente U chiede di poter usufruire
del servizio (ad esempio su Internet), il sistema o lente
preposto a queste cose estrae a caso un numero primo
p, diverso da x ed y e dai numeri gi`
a assegnati. Anche
p `e un numero di circa 100 cifre decimali, cos` che se ne
possano trovare in abbondanza. Viene poi determinato un numero s (non necessariamente primo) tale che
ps 1 (mod (m)), cio`e ps = k(m) + 1 per qualche numero intero k. Il numero p viene reso pubblico
e inserito nellelenco delle chiavi pubbliche associato
al nome dellutente U ; il numero s viene comunicato
ad U e costituisce la sua chiave segreta.
Quando un utente V vuole spedire ad U un messaggio
M , cerca nellelenco (una specie di elenco telefonico elettronico delle chiavi pubbliche) il numero
p corrispondente ad U . Trasforma il messaggio M
in una sequenza di numeri di 200 cifre ciascuno
M1 , M2 , . . . , Mr ; applica ad ogni numero la chiave
pubblica ottenendo M1p , M2p , . . . , Mrp e spedisce il
messaggio cos` codificato (ogni numero Mi deve
essere un numero minore di m e viene trasformato in
un altro numero minore di m). Il ricevente U applica
la chiave s a ciascuno dei numeri ricevuti, ottenendo
(M1p )s = M1 , (M2p )s = M2 , . . . , (Mrp )s = Mr , per
quanto detto. Ma questa `e la sequenza di partenza

che, letta in lettere invece che in cifre, `e il messaggio


in chiaro che doveva ricevere. Questo `e quanto e, se U
non rivela il suo numero s, il metodo `e praticamente al
sicuro da ogni tentativo di rottura. Naturalmente,
i conti da eseguire richiedono luso di un calcolatore, ma tutto questo `e, in realt`
a, fatto per il calcolatore!

I numeri primi sono molti allinizio, ma vanno poi


diradandosi poiche cresce la probabilit`a di trovare divisori. Tuttavia, `e facile vedere che esistono numeri
primi grandi quanto si vuole. Si ha infatti il seguente
risultato:
Teorema 2.13 (di Euclide) Esistono infiniti numeri primi.
Prova: Supponiamo per assurdo che il numero dei
numeri primi sia finito e che quindi esistano solo k
numeri primi p1 , p2 , . . . , pk . Si consideri il numero
n = p1 p2 pk + 1. Questo numero n non
pu`o essere divisibile ne per p1 , ne per p2 , . . . , ne per
pk , poiche la corrispondente divisione dar`a sempre
1 come resto. Allora n `e un numero primo, contro
lipotesi che p1 , p2 , . . . , pk fossero tutti e soli i numeri
primi.
Nota 2.5

La precedente dimostrazione, che i numeri primi sono infiniti, `e considerata una delle pi`
u
belle della Matematica (figuriamoci le altre, si potrebbe dire!), classificandosi al terzo posto nel sondaggio promosso dal Mathematical Intelligencer nel
1988. In generale i numeri primi sono uno degli argomenti pi`
u interessanti (e misteriosi) della Matematica,
tanto da affascinare moltitudini di ricercatori professionisti e dilettanti. Sono state compilate tavole di
numeri primi e, con i moderni calcolatori, ci si `e divertiti a scoprire numeri primi sempre pi`
u grandi; attualmente, a quanto mi risulta, il record `e costituito
.
.
da 213 466 917 1, un numero composto da 4. 053. 946
cifre decimali, ma le cose cambiano da un momento allaltro. Non esistono formule che permettano di
trovare tutti e soli i numeri primi; curiosamente, gi`
a
Eulero aveva scoperto espressioni che producono molti
numeri primi; ad esempio, n2 + n + 41 genera numeri
primi per n = 0, 1, 2, . . . , 39, come il lettore curioso e
interessato pu`
o verificare, ad esempio utilizzando un
semplice programma su un elaboratore.
I numeri primi sono una fonte inesauribile di misteri
matematici, cio`e di proposizioni che, per quanto ne
sappiamo, sono vere, ma che nessuno `e mai stato in
grado di dimostrare. La congettura pi`
u famosa `e quasi
certamente quella di Goldbach: ogni numero pari `e la
somma di due primi. Ad esempio, 100 = 11+89, e con
il calcolatore si `e riusciti a verificare questa congettura fino a numeri grandissimi; non esistono tuttavia
dimostrazioni che essa sia vera in generale. Goldbach era un matematico russo che verso il 1750 scrisse
ad Eulero proponendogli la sua congettura e invitandolo a darne una dimostrazione; ma questa fu una

58

CAPITOLO 2. ARITMETICA
delle poche cose che Eulero non riusc` a fare. Oggi,
la congettura di Goldbach `e diventata nota al grande pubblico grazie al libro di Apostolos Doxiadis Lo
zio Petros e la Congettura di Goldbach, un libro interessante sia per gli agganci alla Matematica, sia, e
soprattutto, per la ricerca psicologica sui personaggi
dello zio e del nipote.
Unaltra famosa congettura `e legata ai cosiddetti primi gemelli: esistono coppie di numeri primi separati
soltanto da due unit`
a, o, se si preferisce, costituite da
due dispari contigui. Esempi semplici sono 3 e 5, 5 e
7, 11 e 13, 17 e 19, e cos` via. I numeri di ciascuna
coppia si dicono appunto gemelli e, pur rarefacendosi,
se ne continuano a trovare man mano che si considerano numeri sempre pi`
u grandi. Prima del miliardo ne
esistono 3. 424. 506, cos` che `e stata proposta la congettura che di primi gemelli ne esistano infiniti. Anche questa congettura `e rimasta tale,perche nessuno
ne ha mai dato una dimostrazione, nonostante che i
matematici si siano accaniti a cercarne una prova.
Come s`e detto, man mano che si va avanti con numeri sempre pi`
u grandi, i numeri primi diminuiscono
di frequenza. Ad esempio, il numero di numeri primi
compresi tra 1 ed un milione, calcolati di centomila in
centomila `e:
0
9592

1
8392

2
8013

3
7863

4
7678

5
7560

6
7445

7
7408

8
7323

9
7224

Una domanda che viene abbastanza naturale (almeno ai matematici) `e quella relativa alla frequenza dei
numeri primi. La precedente tabella `e abbastanza significativa, ma possiamo dire qualcosa di pi`
u quantitativo? Tecnicamente, si parla della densit`
a dei numeri
primi e, per essere pi`
u precisi, consideriamo un numero n N qualsiasi e chiediamoci: quanti sono i numeri
primi che precedono n? Questa quantit`
a si indica con
la notazione (n), cio`e : N N `e la funzione che ad
ogni n N associa il numero di numeri primi minori
o uguali ad n. Per n piccolo, il calcolo `e facile e si
vede subito che (10) = 4 e (20) = 8; gi`
a trovare che
(100) vale 25 richiede un bel po di lavoro, a meno
di non avere a disposizione un elenco di numeri primi.
Dalla tabellina precedente si ha (100. 000) = 9592 e,
facendo le somme, (1. 000. 000) = 78. 498. Purtroppo,
come abbiamo detto, i numeri primi non sembrano godere di alcun senso della regolarit`
a e il calcolo di (n)
si basa sul banale conteggio di un primo dopo laltro.
Nonostante questo, i matematici non si sono arresi e
gi`
a alla fine del 1700 Gauss (sembra allet`
a di 14 anni)
ipotizz`
o la formula:
(n)

n
.
ln n

Ci volle un secolo prima che, nel 1896, due altri matematici, de la Vallee Poussin e Hadamard riuscissero a
dimostrare questa formula, indipendentemente luno
dallaltro.

Si tratta di una formula asintotica, cio`e di una


formula che, quando n `e piccolo, pu`
o non essere
molto buona, ma lerrore relativo (v. Sezione 3.7)
fra il valore vero e quello approssimato va calando
al crescere di n. Ad esempio, la formula precedente
d`
a per n = 100. 000 il valore 8686, con un errore di
oltre il 10% sul valore vero. Ma per n = 1. 000. 000
si ottiene 72. 382 e lerrore si `e gi`
a ridotto all8.4%.
E questi, naturalmente, di fronte allinfinito, sono
numeri ancora molto piccini! Si veda la Sezione 8.8
per qualche specifica ulteriore.

2.7

Massimo comun divisore

Per definizione, un numero primo p ha due soli divisori: 1 e p stesso. In generale, `e facile calcolare il
numero di divisori di un numero n N quando se ne
conosca la scomposizione in fattori primi:
Teorema 2.14 Se n N ha scomposizione in fattori
primi n = pr11 pr22 prkk , con p1 , p2 , . . . , pk
numeri primi distinti, allora il numero dei divisori di
n `e:
(r1 + 1)(r2 + 1) (rk + 1).
Prova: Un divisore m di n deve avere gli stessi
divisori primi di n; quindi, relativamente al fattore
primo p1 , dovr`a avere un fattore p01 (cio`e, in effetti,
m non sar`a divisibile per p1 ), oppure un fattore p11 ,
oppure p21 , . . . , oppure pr11 , per un totale di r1 + 1
possibilit`a. La stessa cosa vale per p2 , . . . , pk , e da
questo segue la formula data.
Ad esempio, il numero 792 = 23 32 11 avr`a
(3 + 1)(2 + 1)(1 + 1) = 24 divisori. Esplicitamente,
essi sono:
{1, 2, 3, 4, 6, 8, 9, 11, 12, 18, 22, 24, 33, 36, 44,
66, 72, 88, 99, 132, 198, 264, 396, 792}.
Il teorema pu`o essere seguito meglio con un caso pi`
u
semplice come n = 12 = 22 3, che deve avere (2 +
1)(1 + 1) = 6 divisori. I fattori con 2 e con 3 sono:
{1 = 20 , 2 = 21 , 4 = 22 } e {1 = 30 , 3 = 31 } e danno
le sei possibilit`a:
11=1 13=3 21=2
2 3 = 6 4 1 = 4 4 3 = 12.
Nota 2.6

I Pitagorici furono molto interessati


al concetto di divisibilit`
a. Definirono perfetto un
numero che fosse la somma di tutti i suoi divisori, eccetto ovviamente se stesso. Lesempio pi`
u semplice `e
6 = 1+2+3, ma perfetto `e anche 28 = 1+2+4+7+14
e quindi seguono 496 = 24 31, 8128 = 26 127 e
33550336 = 212 8191; non si sa se i numeri perfetti
siano infiniti. Un concetto analogamente sviluppato

59

2.7. MASSIMO COMUN DIVISORE


dai Pitagorici fu quello di numeri amicabili. Consideriamo tutti i divisori di 220 = 22 5 11; come
s`e visto essi sono 12 e cio`e 1, 2, 4, 5, 10, 11, 20, 22,
44, 55, 110, 220. Se sommiamo tutti questi numeri
eccetto il 220, troviamo 284. Procedendo nello stesso
modo per questo numero 284 = 22 71, troviamo
5 divisori propri: 1, 2, 4, 71, 142 e la loro somma
`e 220. Abbiamo ritrovato il numero di partenza e
per questo 220 e 284 si dicono amicabili, ognuno
essendo la somma dei divisori propri dellaltro. I
Pitagorici probabilmente conoscevano questa sola
coppia, che `e la pi`
u piccola possibile. I matematici
arabi al-Fars e al-Banna scoprirono le coppie 17296
18416 e 9. 363. 584 9. 437. 056, che pi`
u tardi furono
riscoperte da Cartesio e da Fermat. Nel 1700, Eulero
scopr` una trentina di nuove coppie, me nel 1866 un
ragazzo italiano di 16 anni, un certo B. N. I. Paganini
(nessuna parentela col violinista) trov`
o la coppia
(1184, 1210), la pi`
u piccola dopo (220, 284), ma che
era sfuggita a tutti, perfino a Eulero. Oggi, con
laiuto dei calcolatori elettronici, se ne conoscono una
quantit`
a enorme, tutte formate da due numeri pari o
da due numeri dispari. Nessuno sa se esistono coppie
di numeri amicabili formate da un numero pari e uno
dispari.

Prendiamo ora due numeri n, m


consideriamo i loro divisori:

N e

Questo metodo d`a MCD(12, 30) = MCD(22 3, 2


35) = 23 = 6 e MCD(792, 220) = MCD(23 32
11, 22 5 11) = 22 11 = 44. Sicuramente questo
metodo `e molto pi`
u efficiente dellapplicazione diretta
della definizione, che richiede la costruzione delle liste
di tutti i divisori di m ed n. Tuttavia, la necessit`a
di eseguire la scomposizione in fattori primi, rende il
teorema di non facile applicazione quando i numeri
coinvolti sono piuttosto grandi. Allora, fin dallantichit`a, `e stato proposto un algoritmo che rende estremamente facile il calcolo del massimo comun divisore
anche di numeri grandi. Cominciamo con losservare
una semplice conseguenza del teorema precedente:
Corollario 2.16 Dati due numeri m, n N, se n `e
un divisore di m (in particolare, se n = m), allora
MCD(m, n) = n.
Lalgoritmo si basa sul fatto che MCD(m, n) =
MCD(m n, n) se m > n. Infatti, se s `e il massimo
comun divisore cercato, si ha m = s k e n = s h;
quindi m n = s (k h), cio`e s divide m n.
Se m n `e ancora maggiore di n, continuando si ha
MCD(m, n) = MCD(m 2 n, n), e cos` via fino a
MCD(m d n, n) quando sia m d n < n. Ma
questo significa che d `e il quoziente della divisione di
m per n e m d n `e semplicemente il resto della
stessa divisione. Ecco allora il celebre:

Definizione 2.6 Si dice Massimo Comun Divisore


di m ed n, e si indica con MCD(m, n), o anche Algoritmo 2.10 (Algoritmo di Euclide)
semplicemente con (m, n), il pi`
u grande dei divisori Ingresso: due numeri m, n N;
comuni ad m ed n.
Uscita: il MCD(m, n).
Si osservi che, nel peggiore dei casi, m ed n hanno
almeno il fattore comune 1. Ad esempio, abbiamo
MCD(12, 30) = 6; infatti, 30 = 2 3 5 ha 8 divisori
che sono (1, 2, 3, 5, 6, 10, 15, 30); confrontandoli con i
divisori di 12 dati sopra, si trova che il divisore comune pi`
u grande `e proprio 6. Il seguente teorema d`a
un modo abbastanza pratico per calcolare il massimo
comun divisore di due numeri:

1. Se m = n lalgoritmo termina e il massimo


comun divisore `e n;
2. Se m < n, si scambiano tra di loro m ed n (cos`
dora in avanti possiamo supporre che sia m >
n);

Teorema 2.15 Dati due numeri m, n N, il


MCD(m, n) si trova considerando il prodotto dei divisori primi comuni ad m ed n, presi col minimo esponente che compare nelle due scomposizioni in fattori
primi.

3. Sia r il resto della divisione di m per n;

Prova: Sia s = MCD(m, n); i fattori primi di s devono ovviamente essere a comune tra m ed n. Inoltre, se
p `e un fattore primo comune, e k `e lesponente minore
con cui p compare nella scomposizione di m ed n, pk
deve dividere s. Infatti, un esponente pi`
u piccolo di
k non darebbe il valore massimo di s e un esponente
pi`
u grande di k farebbe s` che s non dividerebbe pi`
u
quello fra m ed n corrispondente allesponente pi`
u
piccolo per p.

5. Altrimenti (0 < r < n), si cambiano i nomi:


n diviene il nuovo m, r diviene il nuovo n e si
torna al punto 3.

4. Se r = 0, allora n `e un divisore di m e per il corollario precedente lalgoritmo termina col valore


del MCD in n;

Si noti che lalgoritmo termina sempre: siccome m


ed n vanno continuamente a diminuire pur rimanendo
positivi, nel peggiore dei casi arriveremo ad avere n =
1; al passaggio successivo il resto della divisione di m
per 1 sar`a senzaltro 0 e lalgoritmo finir`a. La ricerca

60

CAPITOLO 2. ARITMETICA

di MCD(792, 220) si imposta cos`:


792
220
132
88

= 3 220
= 1 132
= 1 88
= 2 44.

+
+
+

132
88
44

Nota 2.7
Il pi`
u delle volte, lalgoritmo di Euclide
`e ignorato dalla Scuola Media, e per trovare il MCD
gli si preferisce il Teorema 2.15. Per i numeri piccoli,
quando la scomposizione in fattori primi si pu`
o fare
pi`
u o meno ad occhio, tale metodo `e pi`
u semplice,
anche perche la maggior parte dei nostri studenti ha
difficolt`
a a fare le divisioni con pi`
u di una cifra, richieste dallalgoritmo di Euclide. Purtroppo, quando
i numeri crescono, la scomposizione in fattori primi
diviene unoperazione molto complessa, e non si conoscono modi per accelerare la ricerca esaustiva di un
fattore dopo laltro, ricerca che richiede un numero di
prove molto elevato (e tali prove, ohim`e, sono divisioni
a pi`
u cifre!). In effetti, dato il numero n, la ricerca del

primo fattore, se non `e piccolo, richiede n/2 divisioni (Algoritmo 2.9), che per n nellordine di 10 miliardi
`e gi`
a circa 50. 000.
Per vedere cosa succede con lalgoritmo di Euclide,
e fare un confronto, possiamo chiederci quali numeri innescano il processo pi`
u laborioso per trovare il
MCD. Nellesempio di MCD(792, 220), la prima divisione, che ha dato quoziente 3, ha ridotto drasticamente le dimensioni dei numeri coi quali continuare
lalgoritmo, che sono diventati 220 e 132. Pi`
u alto `e
il quoziente, pi`
u netta `e la riduzione; quindi, il quoziente 1 d`
a la minima riduzione dei numeri. Ma avere
quoziente 1 per due numeri m, n (m > n) significa
m = 1 n + r, cio`e m = n + r. In altre parole, il pi`
u
grande dei due numeri `e la somma dellaltro (che lo
sostituer`
a al passo successivo) e del resto, che sostituer`
a n. Questa stessa propriet`
a dovr`
a verificarsi al
passo successivo, cio`e dovremo avere n = r + s, e cos`
via, fino a che non ci saremo ridotti ad 1.
Si definisce sequenza di Fibonacci una sequenza di numeri F0 , F1 , F2 , F3 , . . . tale che F0 = 0, F1 = 1 e ogni
altro numero `e dato dalla somma dei due precedenti,
cio`e Fn = Fn1 + Fn2 . Gli Fk si dicono numeri di
Fibonacci e i primi dieci sono:
n
Fn

0
0

1
1

2
1

3
2

4
3

5
5

6
8

7
13

8
21

9
34

Il lettore pu`
o calcolare i valori successivi, cominciando
con F10 = 55. Per verificare quanto detto, basta ora
prendere due numeri consecutivi di questa sequenza e
cercare il loro MCD; ad esempio, per 55 e 34 si ha:
55
34
21
13
8
5
3
2

=
=
=
=
=
=
=
=

1 34
1 21
1 13
18
15
13
12
2 1.

+
+
+
+
+
+
+

21
13
8
5
3
2
1

Si osservi che sullultimo quoziente non si pu`


o migliorare e che, per costruzione, due numeri di Fibonacci
consecutivi sono primi tra loro. Per rendersi conto che
queste 8 divisioni costituiscono davvero un massimo,
si provi a calcolare MCD(55, 33) e MCD(55, 35) con
lo stesso algoritmo. Ad ogni modo, questo prova che
dati due numeri m, n (m > n) e trovato quellFk tale
che Fk > m, la ricerca del MCD(m, n) col metodo di
Euclide richieder`
a meno di k divisioni (in effetti, meno
di k 1).
I numeri di Fibonacci sembrano crescere in modo abbastanza contenuto; ma questa `e solo lapparenza dei
primi termini della sequenza. In realt`
a essi crescono
molto rapidamente ed F50 = 12. 586. 269. 025, come si
pu`
o trovare facilmente con un calcolatore o applicando
la formula (che dimostreremo pi`
u avanti nella Sezione
4.3):

k !
k
1
1 5
1+ 5
Fk =
;

2
2
5
per quanto incredibile, questa formula produce
numeri interi! In conclusione, tutto questo significa
che, per trovare il MCD di due numeri dellordine
di 10 miliardi, lalgoritmo di Euclide richiede al pi`
u
50 divisioni, gi`
a un bel po di meno della semplice
ricerca del primo divisore di uno dei due numeri!

Una importante definizione `e la seguente:


Teorema 2.17 Due numeri n, m N hanno
MCD(m, n) = 1 se e solo se sono primi tra loro.
Prova: Per definizione di Massimo Comun Divisore,
MCD(m, n) = 1 significa che i due numeri non hanno
divisori comuni diversi dallunit`a, cio`e sono primi tra
loro.
Le propriet`a formali del massimo comun divisore,
visto come operazione tra numeri naturali, sono le
seguenti:
commutativa
associativa
idempotenza
identit`a
zero

MCD(m, n) = MCD(n, m)
MCD(m, MCD(n, p)) =
= MCD(MCD(m, n), p)
MCD(n, n) = n
MCD(n, 0) = n
MCD(n, 1) = 1

Assieme al massimo comun divisore, si `e soliti considerare anche il minimo comune multiplo di due numeri m, n N, definito come il pi`
u piccolo dei multipli comuni ad m ed n, e si indica con la notazione
mcm(m, n). In analogia a quanto fatto per il massimo
comun divisore, si dimostra che:
Teorema 2.18 Il minimo comune multiplo di due
numeri m, n N si trova considerando, nella scomposizione di m ed n in fattori primi, il prodotto

61

2.8. LE ALTRE OPERAZIONI

dei fattori primi comuni e non comuni, presi con questa notazione si scrive: max{x N | P (x)} per inil maggiore degli esponenti che compaiono nelle due dicare il massimo numero naturale per cui vale la proscomposizioni.
priet`a P (x). Analoga notazione si usa per il minimo,
ed `a facile vedere come esempio che 15 = min{x
La dimostrazione `e analoga a quella vista per il N | x2 > 200}.
massimo comun divisore e la lasciamo perci`o al letQueste operazioni ci permettono di osservare che,
tore. Dal teorema segue la seguente propriet`a, an- da un punto di vista logico, le uniche operazioni che
chessa usata spesso per il calcolo del minimo comune sarebbe necessario introdurre sono il confronto e ladmultiplo:
dizione, tutte le altre essendo definibili in termini di
queste. Abbiamo appena visto come min e max siano
mn
mcm(m, n) =
.
dipendenti dal solo confronto; per le altre operazioni
MCD(m, n)
abbiamo:
Anche le propriet`a formali del minimo comune multinm
= max{x N | m + x n}
plo sono simili a quelle del massimo comun divisore:
nm
= min{x N | m + x n}
propriet`a commutativa, associativa e di idempotenza.
nm
= m + m + + m (n volte)
Si ha invece:
n/m
= max{x N | m x n}
mcm(n, 0) = 0

mcm(n, 1) = n.

Infine, vogliamo osservare che per le operazioni di


MCD e mcm valgono le propriet`a distributiva e di assorbimento, che lasciamo alla delizia del lettore, sia
per la formulazione, sia per una eventuale dimostrazione. Confrontando queste propriet`a con quelle viste per gli insiemi (Sezione 1.1) e quelle che vedremo
(Sezione 4.6) per il calcolo delle proposizioni, non si
pu`o non essere colpiti dalla fortissima analogia. Siamo infatti di fronte ad esempi diversi di una struttura algebrica particolare, nota come Algebra Booleana. Ritorneremo su questi fatti pi`
u avanti, quando
parleremo un po di Algebra Astratta (Sezione 5.8.

2.8

Le altre operazioni

Le quattro operazioni fondamentali sono la base del


calcolo e, come vedremo, non solo del calcolo dei numeri naturali, ma di tutti gli insiemi numerici che
man mano introdurremo. Tuttavia, esse non costituiscono, assieme al confronto, la totalit`a delle operazioni e, anzi, molte altre possono essere definite a partire
da quelle; in questa sezione introdurremo le principali
operazioni che si incontrano nella pratica. Prima di
tutto, basate sul confronto, ci sono le operazioni di
minimo e di massimo:

a se a b
min(a, b) =
b altrimenti
max(a, b) =

a se a b
b altrimenti.

n mod m

= n (n/m) m.

Si osservi che con queste definizioni 3 5 non `e definito mentre 35 = 0. Questultima operazione si usa
quando `e necessario far s` che la sottrazione sia unoperazione su N, nel senso della Sezione 1.3, e quindi
sia definita per ogni possibile valore di m ed n.
Unaltra operazione che si basa sul principio di abbreviare literazione di unoperazione elementare `e
lelevamento a potenza. Con la notazione nm si indica il prodotto di n per se stesso per m volte, cio`e:
nm = nn n per m volte. Con questo si suppone m 2, ma, come per la moltiplicazione, possiamo
estendere la definizione ad m = 0 ed m = 1. Ricordando che nellespressione nm il numero n si dice la
base e il numero m si dice lesponente, si ha:
0
n
= 1
nm+1 = n nm m 0.
Ad esempio, per n = 5 si ha: 50 = 1, 51 = 50 5 =
1 5 = 5, 52 = 51 5 = 5 5 = 25, e via di seguito. Questo fa vedere la convenienza di avere n0 = 1.
Questa regola vale anche per n = 0, cio`e si ha: 00 = 1,
01 = 0 00 = 0 1 = 0, e cos` di seguito. Il fatto che
sia 00 = 1 `e alquanto controintuitivo, ma `e in accordo con altre definizioni e con argomenti dellAnalisi
Matematica, in cui si dimostra che limx0 xx = 1,
come lo studente vedr`a nei corsi universitari. Per il
resto, dalla definizione discendono alcune importanti
(e ben note) propriet`a delle potenze:
Teorema 2.19 Se n, m, p N, si hanno le seguenti
identit`
a:
a) nm+p = nm np
c) (nm )p = nmp

b) nmp = nm /np (m p)
d) np mp = (n m)p .

E ovvio osservare, ed `e altrettanto semplice dimostrare, che valgono le propriet`a della Tabella 2.5. La
propriet`a associativa permette di scrivere min(a, b, c) Prova: Si consideri nm np = (n n n)
e max(a, b, c) al posto di una delle pi`
u complicate (n n n), dove il fattore n `e ripetuto m volte
espressioni date nella tabella. Come estensione di entro le prime parentesi e p volte entro le seconde.

62

commutativa
associativa
distributiva
assorbimento
idempotenza
identit`a
zero

CAPITOLO 2. ARITMETICA

min(a, b) = min(b, a)
min(min(a, b), c) = min(a, min(b, c))
min(a, max(b, c)) = max(min(a, b), min(a, c))
min(a, max(a, b)) = a
min(a, a) = a

max(a, b) = max(b, a)
max(max(a, b), c) = max(a, max(b, c))
max(a, min(b, c)) = min(max(a, b), max(a, c))
max(a, min(a, b)) = a
max(a, a) = a
max(a, 0) = a

min(a, 0) = 0
Tabella 2.5: Propriet`a del minimo e del massimo

Per la propriet`a associativa del prodotto le parentesi


possono esser tolte e quindi il fattore n `e ripetuto
m + p volte. La dimostrazione delle altre propriet`a si
effettua in modo del tutto analogo e, per lultima, si
fa uso anche della propriet`a commutativa per riunire
(o separare) i fattori n ed m.

famoso laneddoto che si racconta sul mitico inventore del gioco degli scacchi. Al re che gli chiedeva
cosa volesse come ricompensa per la sua invenzione,
chiese tanto grano quanto se ne poteva ottenere associando un chicco alla prima casella della scacchiera,
due chicchi alla seconda, quattro alla terza, otto alla
quarta, e cos` via, raddoppiando ogni volta il numeE un utile esercizio quello di provare ad esprimere,
ro di chicchi. Lingenuo sovrano acconsent`, senza
con proprie parole per evitare la citazione di formule,
rendersi conto che il numero totale di chicchi sareble quattro propriet`a di questo teorema.
be stato 1 + 2 + + 262 + 263 1.84 1019 ben
Nonostante il fatto che, per definizione, una potendi pi`
u di quanto grano sia mai stato prodotto sulza sia labbreviazione di una sequenza di moltiplicala terra. Probabilmente, linventore degli scacchi fu
zioni, non esiste un algoritmo specifico per il calcodecapitato per aver voluto fare troppo il furbo.
lo delle potenze, come invece abbiamo visto per la
E bene dare la seguente:
moltiplicazione, che ha un proprio algoritmo, pressoche indipendente da quello delladdizione, di cui Definizione 2.7 Un numero naturale p N si dice
`e pure unabbreviazione. Per potenze con esponen- una potenza m-esima perfetta se esiste un numero
te piccolo, diciamo 2 o 3, il metodo di calcolo pi`
u naturale n tale che p = nm . In tal caso, si dice anche
conveniente `e lesecuzione delle relative moltiplica- che n `e la radice m-esima perfetta di p e che m `e il
zioni; cos` 53 = 5 5 5 = 25 5 = 125. Per logaritmo in base n di p, e si scrive rispettivamente

esponenti pi`
u grandi si pu`o adottare il metodo dei n = m
p ed m = logn p.
contadini russi, analogo a quello visto per la moltiplicazione (vedere anche la Nota 2.3). Ad esempio, In generale, le potenze con esponente 2 si dicono meper calcolare 54 conviene calcolare 52 = 25 e quindi glio quadrati e le potenze con esponente 3 si dicono
54 = (52 )2 = 252 = 625; e cos` si procede per espo- cubi; ad esempio, 0, 1, 4, 9, 16, 25 sono quadrati pernenti che siano potenze di 2. Pi`
u in generale, per cal- fetti, mentre 0, 1, 8, 27, 64 sono cubi perfetti. Ana13
colare 5 si osserva che 13 pu`o essere espresso come logamente, le radici seconde si dicono radici quadrate
radici terze radici cubiche. Essendo 64 = 43 , si
somma di potenze di 2: 13 = 8 + 4 + 1 e quindi 513 = e le
3
ha 64 = 4 e log4 64 = 3; cos`, da 81 = 34 si deduce
58+4+1 = 58 54 51 . Procedendo come visto prima,
4
81 = 3 e log3 81 = 4. Le radici e i logaritmi sono le
abbiamo 52 = 25, 54 = 625, 58 = 6252 = 390. 625.
13
.
.
.
.
operazioni
inverse delle potenze; per definizione, se n
Quindi 5 = 390 625 625 5 = 1 220 703 125. In
`
e
una
potenza
p-esima perfetta, cio`e n = mp ; allora
altri termini, come per la moltiplicazione, disposti ac
p
log n
p
canto base ed esponente, si eseguono successivamen- si ha ( n) = n e m m = n.
Le principali propriet`a delle radici e dei logaritte i quadrati a partire dalla prima, e si calcolano le
mi
derivano da quelle delle potenze e descritte nel
met`a a partire dal secondo. Si fa poi il prodotto dei
Teorema
2.19. Per le radici p-esime abbiamo:
quadrati corrispondenti alle met`a di valore dispari:

Teorema 2.20 Se m ed n sono potenze perfette


5 13
opportune, si ha:
25
6
q
625
3

p
p
p
p
q
.
m

n
=
m

n
n = pq n.
390 625
1
Come ci si accorge facilmente, le potenze crescono ra- Prova: La prima propriet`a deriva dalla d) del Teopidamente al crescere dellesponente. Gi`a con la base rema 2.19, se m ed n sono potenze p-esime perfette;
2, 220 supera il milione e 230 supera il miliardo. E elevando alla potenza p-esima, il membro sinistro d`a

63

2.8. LE ALTRE OPERAZIONI

mn e il membro destro d`a ( p m)p ( p n)p = mn.


La seconda propriet`a, in modo analogo, si deduce
dalla c) dello stesso Teorema 2.19.
Per i logaritmi si ottiene:
Teorema 2.21 Se i numeri naturali a, b sono potenze perfette della stessa base n, diciamo a = nm e
b = np , allora logn a b = logn a + logn b.
Prova: Per la propriet`a a) del Teorema 2.19, si ha:
logn (a b) = logn (nm np ) =
= logn nm+p = m + p = logn a + logn b
come si desiderava.
Anche se hanno senso solo per le potenze perfette,
si possono dare definizioni opportune di radici e di
logaritmi per tutti i numeri naturali. Dato un numero
naturale p N, si dicono radici m-esime di p per
difetto e per eccesso le quantit`a:

m p = max{x N | xm p}

m p = min{x N | xm p}
Analogamente, si dicono logaritmi in base n di p per
difetto e per eccesso:
logn p =
logn p =

max{x N | nx p}
min{x N | nx p}

Se p `e una potenza m-esima perfetta, le due approssimazioni coincidono con la radice m-esima e col logaritmo in base n. Anticipando cose che dovremmo dire
pi`
u avanti, dato un numero reale r qualsiasi, con la
notazione r si indica il massimo numero intero che
sia minore o uguale ad r, e con la notazione r si indica il minimo numero intero maggiore o uguale ad r.
Queste operazioni hanno, in inglese, nomi fantasiosi
che, tradotti in italiano, suonano a dir poco inusitati;
la prima si dice pavimento di r (in inglese, floor of
r) e la seconda soffitto di r (in inglese, ceiling of
r).
Unultima operazione di abbreviazione `e il fattoriale: si dice fattoriale del numero n N il prodotto di tutti i naturali da 1 fino ad n. Ad esempio,
4! = 1 2 3 4 = 24. Una definizione ricorsiva
permette di introdurre anche il valore di 0!:

0!
= 1
(n + 1)! = (n + 1) n!
Cos`, 4! = 4 3! = 4 3 2! = 4 3 2 1! =
4 3 2 1 0! = 4 3 2 1 = 24. Come
nel caso di 00 , definire 0! = 1 sembra controintuitivo,
ma in realt`a `e consistente col resto della definizione
e con altre impostazioni dello stesso concetto, come
ad esempio la funzione Gamma (x). Come vedremo,
loperazione di fattoriale si incontra comunemente nel
calcolo combinatorio e nel calcolo delle probabilit`a.

Nota 2.8

LAritmetica, cio`e la teoria dei numeri


naturali, `e la base di tutta la Matematica, che pu`
o
essere costruita a partire dalle propriet`
a dei naturali. Come vedremo concretamente, i numeri interi e
quelli razionali, i numeri reali e quelli complessi sono costruzioni che si fondano sui numeri naturali e le
loro operazioni sono estensione delle analoghe operazioni fra naturali, delle quali mantengono le propriet`
a
principali. Daltra parte, le propriet`
a dei naturali si
basano sulle quattro operazioni elementari e il confronto; la definizione delle altre operazioni parte da
quelle e si basa su due semplici principi: i) sia priva di
ambiguit`
a, e 2) permetta di arrivare al risultato in un
tempo finito. Questo modo di porre le cose pu`
o essere
formalizzato in una teoria, secondo quanto visto nel
primo capitolo.
Questo modo di concepire la Matematica si dice aritmetizzazione e sembra che lidea risalga a Ohm, che
la introdusse in un suo libro del 1832. Verso il 1860
si cominciarono ad avere le prime definizioni formali dei numeri reali (noi ne vedremo una nel prossimo
capitolo) e questo dette un enorme impulso al processo di aritmetizzazione, che si propose di dare una
teoria completa dellAritmetica, dalla quele si potesse partire per aritmetizzare tutta la Matematica. La
pi`
u famosa formulazione della teoria dellAritmetica
`e senzaltro quella del matematico torinese Giuseppe
Peano (1858 1932), uno dei grandi logici vissuti a
cavallo tra 800 e 900. Egli introduce tre enti fondamentali: numero, zero e successore che, secondo il concetto moderno di teoria assiomatica, non
sono definiti, ma che sono completamente determinati
dalle propriet`
a specificate negli assiomi. Naturalmente, noi possiamo immaginare che questi tre termini si
riferiscano a ci`
o che comunemente intendiamo per numero, per zero e per successore (di un numero), ma
questo pu`
o aiutare la nostra comprensione, non certo
la costruzione logica che intendiamo affrontare, cio`e
lo sviluppo dellAritmetica e di tutta la Matematica.
Ecco comunque i cinque assiomi:
1. zero `e un numero;
2. ogni numero ha un successore;
3. zero non `e successore di alcun numero;
4. se i successori di due numeri sono uguali, allora
anche i numeri sono uguali;
5. se unaffermazione `e vera per zero, e supposta
vera per un numero risulta vera anche per il suo
successore, allora essa `e vera per ogni numero.
Questultimo assioma altro non `e se non il principio di
induzione, il quale, secondo Peano, `e il modo naturale
per dimostrare le propriet`
a dei numeri naturali.
Normalmente, i tre enti si denotano con i simboli
N, 0, , e si introducono le abbreviazioni: 0 = 1, 0 =
1 = 2, 0 = 1 = 2 = 3, e cos` via. La somma si
definisce allora mediante la ricorsione:

n+0
= n
n + m = (n + m)

64

CAPITOLO 2. ARITMETICA
Questo significa che se il secondo argomento `e zero, la
somma si riduce al primo argomento; se non `e zero,
allora `e il successore di qualche numero m, e la somma
`e il successore della somma di n ed m. Occorre capire
bene questo punto che sembra definire la somma in
termini di se stessa, cio`e mordendosi illegalmente la
coda. In realt`
a, come gi`
a c`e capitato di osservare, m `e
minore del suo successore e la riduzione del secondo
argomento porta inevitabilmente a ridursi al caso m =
0, che finalmente `e trattabile con la prima regola. In
altre parole, il ripiegarsi su se stessa `e solo apparente
o provvisorio e la ricorsione a un certo punto termina,
rendendo buona la definizione. Supponiamo di voler
eseguire 3 + 2; poiche 2 non `e zero, esso `e il successore
di un numero; per definizione `e 2 = 1 e quindi si ha:
3 + 2 = 3 + 1 = (3 + 1) . Ancora, 1 non `e zero e
perci`
o `e il successore di un numero; per definizione
sappiamo 1 = 0 e quindi (3 + 1) = (3 + 0 ) = (3 +
0) . Finalmente, il secondo argomento `e zero e di
conseguenza: 3 + 2 = (3 + 0) = 3 = 4 = 5.
Se dovessimo fare cos` per eseguire ogni somma, la
Matematica non avrebbe proceduto oltre questa definizione. Il senso di questa `e di farci capire come,
concettualmente, loperazione di successore sia sufficiente per introdurre la somma. Quello che importa `e
comprendere la semplificazione logica di questo modo
di procedere.
Il processo non termina con la definizione delloperazione; occorre ora dimostrare che la somma, cos` definita, gode delle propriet`
a commutativa e associativa,
e ammette 0 come identit`
a. Per fare ci`
o risulta essenziale il principio di induzione, che pertanto a buon
diritto `e stato inserito tra gli assiomi. Naturalmente,
si va avanti con lo stesso spirito, e la moltiplicazione
`e definita ricorsivamente cos`:

n0
= 0
n m = n m + n
dove si sfrutta la somma, ormai acquisita. Non
possiamo sviluppare qui, partendo dagli assiomi di
Peano, tutta lAritmetica, e men che mai tutta la
Matematica; il lettore interessato potr`
a utilmente
approfondire largomento dando altre definizioni
per le varie operazioni conosciute e tentando la
dimostrazione delle loro propriet`
a.

Concludiamo introducendo una speciale notazione


(pi`
u che una nuova operazione). Capita spesso di dover eseguire somme con molti addendi: quando facciamo la spesa al supermercato o quando tiriamo le
somme del bilancio personale alla fine del mese. Se indichiamo con c1 , c2 , . . . , cn il costo dei singoli prodotti
acquistati o con v1 , v2 , . . . , vm le spese effettuate, interessa calcolare le somme c1 + c2 + + cn ovvero
v1 + v2 + + vm . Una comoda notazione `e:
n
X
i=1

ci = c1 + c2 + + cn

m
X
i=1

vi = v1 + v2 + + vm .

P
Qui, il simbolo , che `e una sigma maiuscola stilizzata, si dice simbolo di somma. La prima somma, ad
esempio, si legge: somma per i che va da 1 ad n dei
ci . In generale avremo:
n
X
i=k

ci = ck + ck+1 + + cn

dove k ed n sono gli estremi della somma ed i `e la


variabile di somma che assume i propri valori da k
fino ad n. Si suppone che n k e se k = n la somma
si riduce al solo elemento ck ; si conviene inoltre che
quando k n la somma sia 0. Gli elementi che si
sommano costituiscono un vettore, cio`e un insieme di
valori presi in un certo ordine e ciascuno distinto da
un proprio indice. Cos`P
, se v1 = 8, v2 = 7, v3 = 8,
5
v4 = 6, v5 = 7, si ha:
i=1 vi = 36. Si osservi che,
per le propriet`a della somma, abbiamo:
n
X

i=m

ci =

p
X

ci +

i=m
n
X

i=m

n
X

ci

se

i=p+1

rci = r

n
X

mp<n

ci ;

i=m

infatti, la prima `e la propriet`a associativa e la seconda


`e la propriet`a distributiva. La propriet`a commutativa
scambia la posizione dei vari addendi, cio`e scombussola il vettore, e pertanto si usa solo in situazioni
particolari.

Capitolo 3

Numeri
. . . chi `e abituato a sbrigare le proprie faccende
col regolo calcolatore non pu`
o ormai prendere
sul serio una buona met`
a delle asserzioni umane. Il regolo calcolatore consta di due sistemi di
numeri e di lineette combinati con straordinaria
accortezza: due tavolette scorrevoli verniciate di
bianco, a sezione trapezoidale piatta, mediante il quale si risolvono i pi`
u intricati problemi,
senza sciupare inutilmente un solo pensiero. . .
Quando si possiede un regolo calcolatore, e arriva qualcuno con grandi affermazioni e grandi
sentimenti, si dice: Un attimo, prego, prima
calcoliamo il limite derrore e il valore probabile
di tutto ci`
o!
R. Musil Luomo senza qualit`
a

3.1

I numeri interi

I numeri naturali, nonostante le difficolt`a presentate


dalla loro definizione, hanno un aggancio immediato
con la realt`a, in quanto servono a contare. Le frazioni, che vedremo pi`
u avanti in questo capitolo, hanno
anchesse un rapporto preciso con la realt`a e fin dallantichit`a `e stato chiaro cosa significasse mezza mela
o tre quarti di focaccia. Invece, i numeri negativi hanno rappresentato per lungo tempo un concetto strano,
poco comprensibile e, quindi, spesso bandito dalle acque limpide della Matematica. Oggi, lesempio delle
temperature o della contabilit`a, con i soldi a credito (numeri positivi) o a debito (numeri negativi), ci
`e tanto familiare che stentiamo a credere che fino a
300 anni fa il segno non fosse accettato come qualcosa di ovviamente utile, ma fosse ricacciato come
ambiguo o, addirittura, come un attributo diabolico.
Comunque, in molte persone perdura ancora lidea
che qualcosa di satanico sia intrinseco nella regola
dei segni, per la quale meno per meno fa pi`
u.
La necessit`a di introdurre i numeri negativi sorge
dal desiderio di poter eseguire una differenza come
3 5, che con i numeri naturali non ha senso: come `e infatti possibile prendere cinque caramelle da
un insieme di tre? Linterpretazione insiemistica dei
numeri esclude questa possibilit`a ed `e proprio questo
65

che gli antichi avevano in mente, pur senza aver dato una definizione formalizzata di cardinalit`a. Alla
met`a del 1500, il matematico olandese Stevin (1487
1567) chiamava numeri absurdi i numeri negativi, che pure si era visto essere utili nella risoluzione
delle equazioni. Per i Greci i numeri erano legati alla
misura delle grandezze (specie dei segmenti) e anche
per loro pensare a misure negative era praticamente
assurdo. Tuttavia, a posteriori, si `e visto come avere
3 e e spenderne 5 significa avere un debito di 2 e;
e se la temperatura `e a 3 sopra lo 0 e scende di 5 ,
allora si trover`a a 2 sotto zero. Ma tutto questo `e
venuto dopo laccettazione dei numeri negativi.
Formalmente, un numero intero `e 0 oppure un numero naturale preceduto da uno dei segni + o ; i
numeri preceduti da + si dicono interi positivi; quelli preceduti dal segno si dicono interi negativi. Il
numero privato del segno si dice valore assoluto dellintero, ed `e pertanto un numero naturale; il valore
assoluto si indica ponendo il numero intero tra barre;
cos` | + 6| = 6, | 5| = 5 e |0| = 0. I due segni +,
si dicono opposti tra di loro; convenzionalmente, il
segno positivo si tende a sottintendere, cosa che cercheremo di non fare in questa sezione per distinguere
chiaramente i numeri interi positivi dai numeri naturali, anche se la regola `e che i loro insiemi vengano
identificati, regola che naturalmente adotteremo anche noi. Si osservi la seguente definizione che talvolta
torna utile:

+1 se a `e positivo
0 se a `e zero
sgn(a) =

1 se a `e negativo.
Il significato dei segni +, `e definito dal loro
comportamento nelle usuali operazioni:

Definizione 3.1 Siano a, b due numeri interi; si definisce somma di a e b e si indica con a + b, il numero
intero cos` ottenuto: a) se a, b sono entrambi positivi, la loro somma `e il numero positivo che si ottiene
sommando i valori assoluti dei due numeri; b) se a, b
sono entrambi negativi, la loro somma `e il numero
negativo che ha per valore assoluto la somma dei valori assoluti di a e di b; c) se a, b sono discordi (cio`e,

66

CAPITOLO 3. NUMERI

esatta) ed n 1. Prima di tutto, la divisione opera sempre con un divisore positivo, quindi se questo
risulta negativo, gli si cambia il segno, cambiandolo contemporaneamente anche al dividendo. Se ora
a Z e b > 0 sono i due numeri da dividere, il quoziente `e dato dal numero q tale che a = b q + r, con
0 r < b. Pertanto (14) : (+5) = 3 con resto 1,
Lopposto di un numero a si indica con a ed `e il che `e la stessa cosa di (+14) : (5).
numero intero che ha lo stesso valore assoluto di a,
Questo modo di concepire i numeri interi `e quello
ma segno opposto a quello di a. Quindi (+7) = 7 e classico usato nelle Scuole Medie e quello che si ritro(5) = +5. La sottrazione ab `e, per definizione, la va nella struttura logica degli elaboratori elettronici,
somma di a con lopposto di b. Linsieme dei numeri dove il segno `e costituito da un bit, 0 per positivo e
interi si indica con Z, dal tedesco Zahl = numero.
1 per negativo. Tuttavia, limpostazione matematica
Il prodotto di due numeri interi a, b `e il numero pi`
u rigorosa ed elegante `e completamente diversa e,
intero a b (o semplicemente a b, oppure ab) che ha come vedremo, spiega automaticamente la regola dei
come valore assoluto il prodotto dei valori assoluti di segni.
a e di b, e come segno quello stabilito dalla cosiddetta
Il problema generale che ci poniamo `e quello di
regola dei segni:
estendere linsieme numerico di partenza S (in questo
caso, i numeri naturali N) in modo da ottenere un
a\b +
nuovo insieme T che:
+ +
1. permetta di definire le quattro operazioni ele +
mentari e i confronti, mantenendo le stesse propriet`a di S ed eventualmente acquisendone di
Perche questa regola dei segni? Perche, soprattutnuove;
to, meno per meno fa pi`
u, come di solito si esprihanno uno segno positivo e laltro negativo) la loro
somma ha come segno lo stesso segno del numero che
ha valore assoluto pi`
u alto e come valore assoluto la
differenza tra il pi`
u grande e il pi`
u piccolo dei due valori assoluti (se a, b hanno segno opposto ma uguale
valore assoluto si ha a + b = 0).

me la regola pi`
u misteriosa? Il fatto fondamentale `e questo, che vogliamo conservare ai numeri interi le principali propriet`a formali, gi`a viste per i numeri naturali e le relative operazioni. Cos`, `e facile vedere che per laddizione valgono ancora le propriet`a commutativa ed associativa, e lo 0 fa da identit`a. Per la moltiplicazione, vogliamo che propriet`a
commutativa, associativa e distributiva siano valide. Consideriamo allora, come esempio, il prodotto
(+3) ((+2) + (2)); se prima eseguiamo la somma abbiamo (+3) 0 = 0, poiche 0 deve operare
da zero, cio`e annullare il prodotto. Daltra parte, se
vale la propriet`a distributiva, lespressione diviene:
(+3) (+2) + (+3) (2) e deve essere 0 per quanto
appena detto. Poiche abbiamo identificato gli interi
positivi con i naturali, si ha (+3) (+2) = 3 2 = 6.
Si ha pertanto 6 + (+3) (2) = 0, e sommando
6 ai due membri: (+3) (2) = 6; questo spiega la regola pi`
u per meno uguale meno, e in modo
analogo si trova che meno per pi`
u uguale meno.
A questo punto abbiamo: (3) ((+2) + (2)) =
(3) 0 = 0 ancora per la propriet`a distributiva,
e quindi (3) (+2) + (3) (2) deve dare 0.
Ma ora sappiamo che (3) (+2) = 6 e quindi
(3) (2) = (6) = 6, cio`e `e giocoforza accettare
la regola che meno per meno fa pi`
u.
Infine, per la divisione, abbiamo una regola molto complicata (certo pi`
u complicata di quella della
divisione fra naturali) per rispettare la regola fondamentale del resto, cio`e che nella divisione per n il resto deve essere un numero compreso tra 0 (divisione

2. contenga propriamente S, nel senso che si possa


definire un sottoinsieme T T identificabile
con S, tale cio`e che esista una corrispondenza
biunivoca tra T ed S per cui se s, s S danno come risultato s rispetto a una qualsiasi delle
quattro operazioni o ad un confronto (nel qual
caso s = 0/1) allora i corrispondenti elementi
(s), (s ) T diano come risultato della stessa operazione o dello stesso confronto proprio il
corrispondente (s ).
Questultima propriet`a si dice tecnicamente di isomorfismo e si dice anche che S e T sono isomorfi.
Nel caso in questione, i numeri interi che vogliamo
costruire, devono godere di tutte le propriet`a dei nu` il fatto che la sottrazione sia sempre
meri naturali piu
definita. Come si sa (ma che qui, prima della costruzione, dobbiamo far finta di non sapere) sono gli interi
positivi, compreso lo 0, che si identificano con i numeri naturali. Formalmente, c`e da dimostrare che
Z+ ed N sono isomorfi.
Il metodo seguito per estendere un insieme numerico `e in sostanza sempre lo stesso. Tanto la costruzione
di Z da N, quanto la costruzione dei numeri razionali
da Z, quanto ancora la costruzione dei numeri reali
dai razionali, seguono uno schema ben preciso. Vediamolo allora in generale. Sia, come sopra, S linsieme
numerico di partenza e si voglia costruire linsieme
esteso T :
1. si definisce un insieme U basandoci sugli
elementi di S;

3.1. I NUMERI INTERI

67

2. si definisce su U una relazione di equivalenza e (c, d) (e, f ) cio`e c + f = d + e, sommando mem;


bro a membro si ha a + d + c + f = b + c + d + e,
ovvero a + f = b + e che vuol dire (a, b) (e, f ). Pos3. si definiscono su U le quattro operazioni e i siamo allora dividere N N in classi di equivalenza,
confronti;
e si dice numero intero ciascuna delle classi ottenu4. si dimostra che sono compatibili con la relazio- te. Nellinterpretazione vista, (a, b) e la sua classe di
ne , cio`e elementi equivalenti danno risultati equivalenza identificano il numero a b poiche tutte
le coppie hanno la stessa differenza. Se a > b questa
equivalenti;
d`a un numero positivo, se a = b si ha lo 0 e se a < b
5. si definisce T come linsieme quoziente di U si ha un numero negativo.
modulo ;
Definiamo ora la somma (a, b) + (c, d) = (a +
c,
b
+ d): affinche questa definizione abbia senso non
6. si definisce un opportuno sottoinsieme T T e
deve
dipendere dalle particolari coppie scelte. Ma
si dimostra che T `e isomorfo ad S.
se (a, b) (a , b ) e (c, d) (c , d ) e si esegue
Linsieme U `e un insieme di comodo, che ingloba la (a , b ) + (c , d ) = (a + c , b + d ), vediamo che
nostra idea di estensione, ad esempio che sia sempre (a +c , b +d ) (a+c, b+d). Infatti abbiamo per ipodefinita la sottrazione. La costruzione di U `e di regola tesi a+b = a +b e c+d = c +d e sommando membro
pleonastica e si ottiene un insieme troppo grande; per a membro: a + b + c + d = a + b + c + d che definisce
questo si definisce la relazione di equivalenza che per- proprio lequivalenza tra le due somme. Pu`o essemette di ridurre gli elementi a quelli essenziali. Gli re divertente dimostrare ora tutte le propriet`a della
elementi sono in effetti classi di equivalenza: questa somma (commutativit`a, associativit`a e identit`a dello
`e una delle difficolt`a concettuali maggiori, poiche le 0), ma ci limitiamo a far vedere che se (a, b) `e positivo,
prime volte ci risulta ostico accettare che un numero (c, d) `e negativo e il valore assoluto di (a, b) `e maggio` una classe di equivalenza. Daltra parte, questo `e re di quello di (c, d), allora il risultato della somma `e
e
proprio ci`o che si fa con le frazioni (anche se non lo si |(a, b)| |(c, d)|. Infatti, abbiamo (a, b) (a b, 0)
dice in questi termini) dove 3/5, 6/10 e 33/55 sono se a > b, e (c, d) (0, d c) se c < d. Quindi
lo stesso numero razionale.
(a, b) + (c, d) = (a b, 0) + (0, d c) = (a b, d c),
Il fatto che un numero sia una classe di equivalenza ma questo numero rappresenta proprio la differenza
impone di dimostrare che le operazioni e i confronti dei due valori assoluti. Si noti infine che lopposto di
sono indipendenti dai particolari elementi di U usati (a, b) `e (b, a), per cui la differenza si definisce molto
per la loro esecuzione. Questo d`a piena validit`a al- semplicemente:
la costruzione di T . Infine, bisogna far vedere che T
(a, b) (c, d) = (a, b) + (d, c).
estende S e quindi, fra le classi di U , dobbiamo iden
tificare quelle che costituiscono limmagine T di S e
Il confronto fra due coppie si fa definendo:
dobbiamo far vedere che le operazioni e i confronti in
S e in T danno proprio gli stessi risultati.
(a, b) (c, d) se e solo se a + d b + c,
Per la costruzione di Z si comincia col considerare le coppie di numeri naturali (a, b) N N, che il cio`e estendendo la relazione di equivalenza; a destra
lettore `e bene immagini di interpretare come a b, abbiamo un confronto tra numeri naturali, e quindi
anche (e soprattutto) quando a < b. Naturalmen- sappiamo come funziona. Anche questa definizione
te, questo `e logicamente scorretto perche non si sa ha un senso abbastanza ovvio se guardiamo alla noancora ufficialmente cosa sia a b proprio quando stra interpretazione; infatti, a b c d significa
a < b, ma lidea ci permette di entrare nello spirito proprio a + d b + c. Facciamo ora vedere che la
di questa impostazione. Si dice che due coppie so- relazione cos` definita `e una relazione dordine che
no equivalenti, e si scrive (a, b) (c, d) se e solo se estende la relazione fra i numeri naturali. La proa + d = b + c; questa `e unuguaglianza tra numeri priet`a riflessiva `e ovvia, poiche (a, b) (a, b) significa
naturali, e quindi sappiamo cosa significa. Nellinter- a + b a + b. Per lantisimmetria, se (a, b) (c, d) si
pretazione suggerita, due coppie sono equivalenti se ha a + d b + c, e se (c, d) (a, b) si ha b + c a + d;
e solo se hanno la stessa differenza: a b = c d, da queste sono relazioni su N, insieme in cui la procui a + d = b + c, ma osserviamo di nuovo che questo priet`a antisimmetrica vale, per cui a + d = b + c,
avr`a senso solo a posteriori. E facile vedere che la cio`e (a, b) = (c, d). Infine, per la propriet`a transitiva,
relazione definita `e proprio di equivalenza: propriet`a se (a, b) (c, d) si ha a + d b + c e se (c, d) (e, f )
riflessiva (a, b) (a, b) ovvia perche a+b = a+b; pro- si ha c + f d + e; sommando membro a membro
priet`a simmetrica: se (a, b) (c, d), cio`e a+d = b+c, si ha a + c + d + f b + c + d + e e semplificando
allora c + b = a + d che significa (c, d) (a, b); pro- a+f b+e, cio`e (a, b) (e, f ). Lasciamo al lettore il
priet`a transitiva: se (a, b) (c, d) cio`e a + d = b + c compito di far vedere che se restringiamo il confronto

68

CAPITOLO 3. NUMERI

a elementi positivi (quelli che corrispondono con N)


il confronto d`a gli stessi risultati che d`a in N.
Il prodotto `e definito da:

che produce un Do, si ha ancora un Do, ma unottava


pi`
u bassa. Gli altri rapporti sono: 9/8 per il Re, 5/4
per il Mi, 4/3 per il Fa, 3/2 per il Sol, 5/3 per il La
e 15/8 per il Si:

(a, b) (c, d) = (ac + bd, ad + bc).


Questa regola non `e poi tanto misteriosa; se (a, b)
rappresenta a b e (c, d) rappresenta c d, allora
il loro prodotto deve rappresentare (a b)(c d) =
ac ad bc + bd, e quindi basta separare gli addendi
positivi da quelli negativi per ottenere la formula del
prodotto. Anche per questa operazione, le propriet`a
formali valgono integralmente, ma lasciamo la loro
verifica alla pazienza del lettore volenteroso. Veniamo invece alla regola dei segni, che pi`
u ci interessa.
Cominciamo con losservare che ogni numero positivo ha, fra le coppie che lo definiscono, una del tipo
(n, 0), mentre ogni numero negativo ne ha una del
tipo (0, n). Se consideriamo i quattro casi possibili,
abbiamo:
(n, 0) (m, 0)
(n, 0) (0, m)
(0, n) (m, 0)
(0, n) (0, m)

= (nm, 0)
= (0, nm)
= (0, nm)
= (nm, 0)

positivo
negativo
negativo
positivo.

Purtroppo, la divisione `e unoperazione piuttosto


complicata, e qui la lasciamo perdere.

3.2

I numeri razionali

Lidea di numero frazionario `e molto antica e, bisogna dire, anche molto naturale, al contrario del concetto di numeri negativo che si `e affermato soltanto
nel 1600 e non senza notevoli difficolt`a. Le frazioni
scaturiscono direttamente dalla realt`a: come ci sono
2 mele o 10 arance, cos` c`e mezza mela, un quarto di
pollo o un ottavo di torta. Storicamente, le frazioni
con numeratore unitario, come 1/2, 1/3 o 1/12, hanno avuto un ruolo privilegiato fino al 1600, quando si
impose la notazione decimale con il punto o la virgola di separazione. Gli Egizi usavano solo tali frazioni,
con leccezione di 2/3, per cui per esprimere 3/5 dovevano scrivere 1/2 + 1/10, e per esprimere 4/5 si
rifacevano a 1/2 + 1/5 + 1/10. Questo uso, come s`e
detto, si protrasse per tutto il Medio Evo, e anche in
seguito. Invitiamo il lettore a scrivere un algoritmo
che trasformi una frazione nella somma di frazioni
con il numeratore unitario.
Nella Matematica Greca le frazioni avevano un ruolo molto importante e su di esse era in pratica basata
la teoria delle proporzioni, che a lungo domin`o la Geometria e lAritmetica, fin da quando Pitagora aveva
scoperto i rapporti armonici, cio`e i rapporti che regolano la lunghezza delle corde per produrre, vibrando,
le varie note: raddoppiando la lunghezza della corda

Do Re

Mi Fa

Sol

La

Si

Do

Nota 3.1

Questi rapporti corrispondono alla cosiddetta scala naturale, che `e un po diversa dalla scala
pitagorica nella quale il Mi ha rapporto 81/64, il La
27/16 e il Si 243/128. Queste differenze dipendono dal
fatto che, verosimilmente, il nostro orecchio percepisce
una certa nota se la frequenza del suono `e compresa in
un dato intervallo e non solo quando tale frequenza ha
un valore preciso. Entrambe le scale sono approssimazioni che, comunque, appartengono a questi supposti
intervalli. Quale `e allora il loro valore centrale? Per
determinarlo possiamo fare tre ipotesi:
le note si ripetono di ottava in ottava; si passa da
unottava allaltra raddoppiando la frequenza;
per motivi fisiologici, educativi e convenzionali
riusciamo a distinguere 12 note in ciascuna ottava, cos` come riusciamo a distinguere un numero finito di colori dallinsieme infinito delle
lunghezze donda luminose;
il rapporto r tra due note consecutive `e costante (natura non facit saltus), contrariamente a quanto si suppone nelle scale naturale e
pitagorica.
Se poniamo uguale ad 1 la frequenza del Do in una
qualsiasi ottava, la nota successiva (che propriamente
`e il Do diesis o il Re bemolle) avr`
a frequenza 1 r = r,
la nota successiva, cio`e il Re, avr`
a frequenza r2 , e cos`
via, fino al Do dellottava successiva, che avr`
a frequenza r12 . Ma questa frequenza, per la prima ipotesi for12
mulata,
`e uguale a due e quindi si ha r = 2, cio`e
12
2 1.059463. Questi nuovi rapporti, costituiti
r=
in effetti da numeri irrazionali (si veda pi`
u avanti in
questo capitolo), formano la cosiddetta scala temperata. Trascurando le note intermedie, date dai diesis
e dai bemolle delle note corrispondenti agli intervalli
maggiori, si ha la seguente tabellina:

nota
Do
Re
Mi
Fa
Sol
La
Si
Do

scala
pitagorica
1
1.125
1.266
1.333
1.500
1.688
1.898
2

scala
naturale
1
1.125
1.250
1.333
1.500
1.667
1.875
2

scala
temperata
1
1.122
1.260
1.334
1.498
1.682
1.888
2

69

3.2. I NUMERI RAZIONALI


Da questa tabella si vede come le approssimazioni
pitagoriche siano migliori di quelle naturali.

Inizialmente, i Greci credevano che presi comunque


due segmenti (o due grandezze omogenee) fosse sempre possibile trovare un loro sottomultiplo comune: se
questo era 1/n del primo segmento e 1/m del secondo, il secondo risulta m/n del primo (e il primo n/m
del secondo). I filosofi rimasero sconcertati quando
Pitagora dimostr`o che questo non `e sempre vero. Vedremo pi`
u avanti come stanno le cose, ma, nonostante questo risultato negativo, le frazioni rimasero al
centro del concetto di misura delle grandezze.
Nota 3.2

La costruzione formale dei numeri


razionali segue fedelmente la loro introduzione pratica
tradizionale. Questo `e lunico caso in cui ci
o avviene,
e aiuter`
a la fantasia del lettore a capire bene anche
le altre costruzioni in cui, come nel caso dei numeri
interi, la costruzione matematica e limpostazione
pratica differiscono. In effetti, la costruzione matematica dei razionali introduce coppie appartenenti
allinsieme Z N0 , fra le quali `e definita la relazione
di equivalenza (a, b) (c, d) se e solo se ad = bc. Ma
allora, nella coppia (a, b) ri riconosce sotto mentite
spoglie la frazione a/b e il trucco `e subito svelato. Con
queste definizioni, si applicano tutte le considerazioni
viste nella Sezione 3.1 e relative allestensione degli
insiemi numerici.

cio`e, semplificando, mn = m n. Questa `e una uguaglianza tra numeri interi, e quindi sappiamo come gestirla. Purtroppo il ragionamento che ci ha portato a
questa uguaglianza `e basato sul nulla, in quanto sono
proprio le regole di comportamento delle frazioni che
ci mancano. Il trucco (se di trucco si puo parlare)
`e allora proprio quello di assumere i nostri desideri
come punto di partenza:
Definizione 3.2 Date due frazioni m/n ed m /n , si
dice che esse sono equivalenti se e solo se mn = m n,
e in tal caso scriveremo m/n m /n .
Il nome `e giustificato dal seguente teorema:
Teorema 3.1 La relazione m/n m /n `e una
relazione di equivalenza.

Prova: La propriet`a riflessiva afferma che ogni frazione deve essere equivalente a se stessa; qui dovremmo avere m/n m/n, ma in effetti questo significa
mn = mn, il che `e senzaltro vero. La propriet`a simmetrica parte supponendo che sia m/n m /n , cio`e
mn = m n; da questo dovremmo dedurre m /n
m/n, cio`e m n = mn , che per`o `e valido grazie alla propriet`a simmetrica delluguaglianza. Infine, se
supponiamo m/n m /n ed m /n m /n , cio`e
mn = m n e m n = m n , possiamo moltiplicare
queste due uguaglianze membro a membro e ottenere
mn m n = m nm n . Semplificando, per la propriet`a di eliminazione del prodotto (v. Sezione 2.3),
si ha mn = m n, il che vuol dire m/n m /n , e
Formalmente, una frazione `e il rapporto di due nuquesta `e proprio la propriet`a transitiva.
meri interi, il primo detto numeratore e il secondo
denominatore, con questultimo diverso da zero. Ad
Useremo il seguente risultato:
esempio, sono frazioni 3/5, 7/6, 5/(8), 3/(1).

Convenzionalmente, non si considerano le frazioni che Teorema 3.2 Due frazioni m/n e m /n sono equi
siano il rapporto di due numeri negativi, che, per la valenti se e solo se esistono due numeri interi k, k


regola dei segni, `e uguale a un opportuno rappor- tali che mk = m k e nk = n k .
to tra numeri positivi. In modo analogo, le frazioni
Se le due frazioni sono equivalenti si ha
con numeratore positivo e denominatore negativo si Prova:

mn
=
m
n,
ma `e anche nn = n n e quindi possiamo
considerano uguali a quelle analoghe con numerato

re negativo e denominatore positivo. In altre parole, porre k = n e k = n. Viceversa, supponiamo che


in
mentre il numeratore `e un numero intero qualunque, esistano k, k con la propriet`a detta; moltiplicando
croce le due uguaglianze si ha: mkn k = m k nk;
il denominatore `e un intero strettamente positivo.
non nullo kk pu`o essere eliminaIl problema che nasce in modo naturale con le fra- il fattore comune

zioni `e quello della loro uguaglianza. Sappiamo tutti to e quindi mn = m n, e questo significa che le due
frazioni
sono
equivalenti.
per esperienza che mezza mela `e la stessa quantit`a di
due quarti di mela, cio`e 1/2 = 2/4, e quindi la rappresentazione delle frazioni non `e unica. A livello intuitivo, vorremmo che per le frazioni valesse la stessa
regola che conosciamo per i numeri interi, cio`e che due
frazioni uguali rimangono tali se le moltiplichiamo o
le dividiamo per la stessa quantit`a diversa da zero.
Ad esempio, se m/n = m /n , vorremmo che questa rimanesse unuguaglianza quando moltiplichiamo
tutto per nn ; questo ci darebbe mnn /n = m nn /n,

Se abbiamo due frazioni equivalenti e facciamo la


scomposizione in fattori primi di numeratori e denominatori, possiamo semplificare i fattori comuni;
si ottengono cos` frazioni identiche, nel senso che
coincidono tanto i numeratori che i denominatori.
Teorema 3.3 Siano m/n ed m /n due frazioni equivalenti; esiste allora ununica frazione r/s equivalente
alle due frazioni date e tale che MCD(r, s) = 1.

70
Prova: Consideriamo m/n ed eliminiamo eventuali
fattori primi comuni a numeratore e denominatore
ottenendo cos` la frazione r/s tale che MCD(r, s) = 1.
La semplificazione ci assicura che m/n ed r/s sono
frazioni equivalenti e quindi esistono due interi h, h
tali che mh = rh ed nh = sh . Daltra parte, per
lequivalenza delle frazioni assegnate, devono esiste
k, k tali che mk = m k ed nk = n k . Poiche, dalla
divisione fra naturali, si ha m = rh /h ed n = sh /h,
sostituendo si ottiene: rh k/h = m k , cio`e rh k =
m hk , e analogamente sh k/h = n k , cio`e sh k =
n hk . Ma questo significa che r/s `e equivalente anche
ad m /n . Quindi frazioni equivalenti si riducono alla
stessa frazione r/s, con MCD(r, s) = 1. Vediamo
ora che tale frazione `e unica. Se ne esistesse unaltra
r /s , essa dovrebbe comunque essere equivalente ad
r/s e quindi avremo rs = r s. Poiche r non divide
s, r dovr`a dividere r , cio`e r = kr; questo porta
a rs = rks, cio`e s = ks; in altre parole, r /s `e
la frazione kr/ks; ma dallipotesi MCD(r , s ) = 1
deriva k = 1 e quindi r/s = r /s .
Le frazioni r/s tali che MCD(r, s) = 1 si dicono ridotte ai minimi termini; poiche rappresentano
il modo pi`
u semplice di scrivere una frazione della
propria classe di equivalenza, costituiscono un punto
di riferimento preciso e spesso `e conveniente rifarsi
direttamente a loro.
Secondo una vecchia classificazione, le frazioni si
dividono in proprie, improprie ed apparenti. Le frazioni proprie sono quelle in cui il numeratore `e inferiore al denominatore; queste sono le vere frazioni,
nel senso che corrispondono a una parte propria del
tutto, come 1/3, 2/5 o 7/10. Frazioni come 7/5 o
9/2 indicano quantit`a maggiori del tutto, e pertanto si dicono improprie; esse possono essere espresse come un numero intero pi`
u una frazione propria:
7/5 = 1 + 2/5 e 9/2 = 4 + 1/2; queste espressioni si
ottengono eseguendo la divisione intera fra numeratore e denominatore e poi considerando il resto come
frazione propria. Infine, una frazione come 6/3 `e solo
tale in apparenza ed eseguendo la riduzione ai minimi termini si trova come sia equivalente al numero
intero 2. Da questo punto di vista, linsieme delle frazioni `e pi`
u esteso dellinsieme dei numeri interi, che
corrispondono solamente alle frazioni apparenti. Vedremo fra poco come si estende e si formalizza tale
osservazione.
Quel che ora ci preoccupa `e: come si eseguono le
operazioni fra frazioni e come si confrontano due frazioni? Abbiamo visto come il confronto e le operazioni siano aspetti essenziali dei numeri naturali e dei
numeri interi; vogliamo che sia cos` anche per le frazioni. Consideriamo come emblematici il confronto e
loperazione di addizione. Se dobbiamo sommare 1/4
e 2/5 ci troviamo in imbarazzo perche sembra di voler

CAPITOLO 3. NUMERI
sommare una mela con due pere: infatti, 1/4 di torta
`e una certa quantit`a che possiamo immaginare come una bella fetta; 2/5 di torta li vediamo come due
fette, ma ciascuna un po pi`
u piccola della fetta corrispondente a 1/4. Allora, limbarazzo `e quello di dover
sommare fette grosse con fette piccole. Per vedere le
cose da un altro punto di vista, se dovessimo sommare 1/4 e 2/4, loperazione non risulterebbe difficile,
perche le fette sono della stessa grandezza e il risultato sarebbe 3/4 senza dubbio. Allora `e importante
il seguente procedimento:
Algoritmo 3.1 (Stesso denominatore)
Ingresso: due frazioni m/n ed m /n ;
Uscita: due frazioni r/s ed r /s, equivalenti a quelle
date, ma con lo stesso denominatore s;
1. si pone s := mcm(n, n );
2. si pone r := m s/n;
3. si pone r := m s/n;
4. si esce con le due frazioni r/s ed r /s.
La dimostrazione che r/s m/n `e immediata; infatti, per costruzione, abbiamo r/s = ms/ns e questa
frazione `e chiaramente equivalente ad m/n. Lo stesso
vale per r /s m /n .
Sapendo riportare due frazioni a un denominatore
comune, scatta losservazione fatta in precedenza:
Algoritmo 3.2 (Confronto tra frazioni)
Ingresso: due frazioni m/n ed m /n ;
Uscita: Maggiore, Uguale o Minore a seconda
che tale sia m/n nei confronti m /n ;
1. si pone s := mcm(n, n ) e si considerano le due
frazioni r/s ed r /s equivalenti ad m/n ed m /n ,
secondo il precedente algoritmo;
2. se r < r allora si esce con Minore;
3. altrimenti, se r
Maggiore;

>

r allora si esce con

4. altrimenti (r = r ) si esce con Uguale.


Essendo i denominatori uguali, cio`e avendo ridotto le
fette della torta a fettine delle stesse dimensioni, il
numeratore regola il confronto, secondo lovvio criterio che la frazione con il maggior numero di fettine `e
quella pi`
u grande. In modo analogo si procede per la
somma:
Algoritmo 3.3 (Somma di due frazioni)
Ingresso: due frazioni m/n ed m /n ;
Uscita: la somma m/n + m /n ;
1. si pone s := mcm(n, n ) e si considerano le due
frazioni r/s ed r /s equivalenti ad m/n ed m /n ;

3.2. I NUMERI RAZIONALI


2. si esce col risultato (r + r )/s.

71
Teorema 3.4 Siano m/n ed m /n due frazioni tali
che m/n < m /n . Allora, per ogni altra frazione
/ m/n e / m /n , si ha / < / .

La differenza si esegue come laddizione, per cui non


diamo lalgoritmo in modo esplicito. Il prodotto
segue la logica delle parti, propria del concetto di Prova: Siano r/s ed r /s le due frazioni di partenza
frazione. Ad esempio, (2/3) (3/5) significa:
ridotte ai minimi termini. Questo significa m = rk,
n = sk, m = r h ed n = s h. Supponiamo anche
dividere un oggetto in 5 parti e prenderne 3;
che le frazioni siano positive (negli altri casi la proavanti nello stesso modo); la
di quello che si ottiene, dividere in 3 parti e va `e banale o si porta

condizione
m/n
<
m
/n
equivale a mn < m n. Per
prenderne 2.
le uguaglianze viste si ha allora: rks h < skr h, cio`e
Ma dividere prima in 5 parti e poi in 3 `e come divi- rs < sr il che significa r/s < r /s . Poiche il ragiodere loggetto in 15 parti; fatto questo, si prendono 2 namento si pu`o invertire, vediamo che m/n < m /n
parti per ognuna delle 3 parti considerate nella prima equivale ad r/s < r /s . Ma questo si pu`o ripetere ansuddivisione: in definitiva, si prendono 6 parti delle che per / e / , che si riducono alle stesse frazioni
r/s ed r /s . Quindi la disuguaglianza si trasferisce a
15 della divisione. In generale, abbiamo:
tutte le frazioni equivalenti ad m/n ed m /n , come
m m
mm
si voleva.
=
.
n
n
nn
Questo teorema ha una dimostrazione noiosa, ma `e
Se anche le due frazioni sono ridotte ai minimi ter- importante perche ci permette di capire come la defimini, pu`o accadere che il prodotto non lo sia: questo nizione di confronto data in precedenza non dipenda
perche ci possono essere fattori a comune tra m ed n dalla particolare frazione con cui stiamo lavorando,
oppure tra n ed m . Pu`o essere allora conveniente ese- ma valga per tutte le frazioni ad essa equivalenti. La
guire una semplificazione prima della moltiplicazione, stessa propriet`a vale per la somma:
come ad esempio in:
Teorema 3.5 Siano m/n ed m /n due frazioni; se
8
4 8
32
20
r/s m/n e r /s m /n , allora m/n + m /n

= =
.
7
15
7 3
21
r/s + r /s .
Concludiamo con la divisione; loperazione, come Prova:
Se r/s m/n, si ha rn = ms e se
si sa, `e linversa della moltiplicazione, e quindi si ha: r /s m /n `e anche r n = m s . Moltiplicando
la prima uguaglianza per n s e la seconda per ns,
m m
m
n
mn
: =
=
.
si ottiene rnn s = msn s e nsr n = nsm s . Somn n
n
m
nm
mando membro a membro si ha rnn s + nsr n =
Se le due frazioni di partenza sono equivalenti, cio`e msn s +nsm s , cio`e (rs +r s)nn = (mn +m n)ss .
mn = m n, il loro rapporto `e 1, come ci si pu`o Ma questo significa:
aspettare.
rs + r s
mn + m n
r r
m m
La relazione di equivalenza m/n m /n ci per
o
+

+
ss
nn
s s
n
n
mette di raggruppare insieme frazioni equivalenti,
cio`e frazioni che hanno lo stesso significato, come 1/2
che `e giusto quello che si voleva.
e 2/4. Abbiamo anche visto come si fanno i confronti
Questo tipo di dimostrazione pu`o essere esteso al
e come si eseguono le operazioni fra frazioni. Formalmente, potremmo considerarci a posto, ma in realt`a prodotto, alla differenza e alla divisione. I dettagli
il lettore si sar`a sentito a disagio per un motivo mol- interessano abbastanza poco, ma quello che vogliamo
to profondo: quando ad esempio confrontiamo 2/3 e sottolineare `e come, in tutti i casi, frazioni equivalenti
3/5 e, portandoli allo stesso denominatore, confron- si comportino nello stesso modo. C`e quindi qualcosa
tiamo di fatto 10/15 e 9/15, ci chiediamo: se fossimo in pi`
u della semplice somiglianza formale fra frazioni
partiti da due frazioni equivalenti a 2/3 e 3/5, ad equivalenti: c`e addirittura lo stesso significato, nel
esempio 20/30 e 27/45, saremmo comunque arrivati senso di comportamento nei confronti delle operazioalla stessa conclusione, e cio`e che la prima `e maggiore ni. Questo `e il vero motivo (e non certo la sola nostra
della seconda? Propriamente, per confrontare 20/30 intuizione) che ci porta ad identificare in un concete 27/45 dobbiamo riportare tutto allo stesso deno- to unico tutte le frazioni equivalenti. Pertanto, da
minatore 90, e cio`e a 60/90 e 54/90: vediamo che questo momento in avanti, come si fa di regola, non
il primo `e ancora maggiore, ma come assicurarci che diremo pi`
u che due frazioni sono equivalenti, ma adquesto vale per tutte le infinite frazioni equivalenti a dirittura uguali, e useremo il segno = invece del segno
2/3 e 3/5? Vale il seguente:
.

72

CAPITOLO 3. NUMERI

Definizione 3.3 Un numero razionale `e la classe di oggi. Fino al 1600 non si ebbe idea della rappretutte le frazioni fra loro equivalenti. Linsieme dei sentazione decimale delle frazioni, se si eccettuano i
numeri razionali si indica con Q.
Babilonesi, che anche in questo furono precursori di
concezioni moderne. Come le cifre prima del punto
Anche se ormai ci dovremmo essere abituati, questa decimale indicano multipli di potenze del 10, cos` le
`e una definizione ben strana, visto che afferma cos` cifre dopo il punto decimale denotano multipli di pocategoricamente che una classe (cio`e un insieme) `e tenze di 1/10. Pertanto 154.327 sta a rappresentare
un numero. Ma ormai sappiamo che la Matematica il numero:
`e ricca di queste apparenti incongruenze e le consi2
7
3
derazioni e le prove precedenti ci assicurano che il
+ 2 + 3;
1 102 + 5 10 + 4 +
10
10
10
confronto e le quattro operazioni sono ben definite
in Q, perche non dipendono dal particolare elemen- come si sa, la prima cifra dopo il punto indica i decito scelto per eseguire il confronto o loperazione. Di mi, la seconda i centesimi, la terza i millesimi, e cos`
fatto, il senso della definizione `e proprio questo: `e in- via allinfinito, anche quando mancano nomi specifici
differente considerare una qualsiasi delle frazioni che di riferimento; tuttavia, tutti sappiamo cosa signifistanno in una certa classe; il risultato di un confronto ca 3/1035 e quale posto la cifra 3 occuperebbe in un
o di unoperazione sar`a sempre lo stesso, cio`e sar`a in- numero di cui tale frazione facesse parte.
dipendente da quel particolare valore che scegliamo,
Partendo da una frazione specifica, ad esempio
o siamo costretti a scegliere, allinterno della classe. 24/7, il numero decimale ad esso corrispondente si
Spesso, come si sa, si preferisce avere a che fare con trova eseguendo la divisione decimale, o, secondo lule frazioni ridotte ai minimi termini, ma si tratta solo so, la divisione tout-court, quando si chiami, come
di una questione di convenienza, data dal fatto che gi`a detto, divisione intera la divisione che produce un
una frazione ridotta ai minimi termini ha il numera- quoziente intero e un resto. Lesecuzione della divitore e il denominatore pi`
u piccoli fra le frazioni equi- sione avviene in modo analogo a quanto visto nellalvalenti, cio`e nella stessa classe. Cos` preferiamo 2/3 goritmo della divisione intera, solo che quando sono
a 52/78 o a 4354/6531, ma se confrontiamo questul- esaurite le cifre della parte intera del dividendo, si
tima frazione con 1/2, troviamo che essa `e maggiore, mette il punto decimale al quoziente e si continua,
esattamente come lo `e 2/3.
abbassando o calando le cifre decimali del dividendo
Concludiamo dimostrando una delle propriet`a im- (se ce ne sono) o la cifra 0, quando quelle manchino o
portanti dei numeri razionali. I numeri interi costi- siano esaurite. Qui riportiamo la divisione di 24 per
tuiscono un insieme numerico discreto, tale cio`e che 7:
tra due interi consecutivi, diciamo 5 e 6, esiste un
7
2 4
vuoto, ovvero un intervallo nel quale non esistono
3
0
3.
4 2 6 5 7 1
numeri interi. Per i razionali questo non `e vero, e vale
2
0
invece:
6 0
Teorema 3.6 (di densit`
a) Se q1 < q2 sono due
4 0
numeri razionali qualsiasi, esiste sempre un numero
5 0
q Q tale che q1 < q < q2 .
1 0
3
Prova:
Basta considerare la semisomma q =
(q1 + q2 )/2, che gode chiaramente della propriet`a Teorema 3.7 Se due frazioni m/n ed m /n sodesiderata.
no equivalenti, allora esse corrispondono allo stesso
numero decimale.
Come vedremo nella Sezione 3.5, i numeri reali hanno una propriet ancora pi`
u forte, detta continuit`
a. Prova: Come osservato a suo tempo, un rapporto
La propriet`a dei razionali appena dimostrata si dice non cambia se moltiplichiamo o dividiamo dividendo
invece densit`
a e si esprime con la frase: i numeri e divisore per una stessa quantit`a diversa da 0. Ma se
razionali sono densi.
r/s `e la frazione ridotta ai minimi termini equivalente

3.3

I numeri decimali

ad m/n, tale sar`a anche per m /n . Quindi m/n,


m /n e r/s devono dare lo stesso risultato quando si
divide numeratore per denominatore onde ottenere il
corrispondente numero decimale.

Come s`e detto, le frazioni hanno unorigine antichisLa divisione potrebbe continuare, determinando
sima, dovuta alla loro natura intuitiva e fondamentalmente pratica. Curiosamente, gli Egizi rappresenta- spesso (come nel caso dellesempio precedente) uno
vano le frazioni in modo analogo a quanto facciamo sviluppo infinito del numero decimale:

3.3. I NUMERI DECIMALI


Teorema 3.8 Sia m/n una frazione e sia r/s
m/n la stessa frazione ridotta ai minimi termini. Se
il denominatore s contiene solo i fattori 2 e 5, allora
la frazione corrisponde a un numero decimale finito.

73

insieme; e vale anche per linsieme C dei numeri complessi che noi tratteremo solo superficialmente, e che
verr`a approfondito nei corsi universitari. Fissiamo
allora uno di questi insiemi e chiamiamo successione numerica una regola che ad ogni elemento di N
Prova: Sia s = 2i 5j , con i e j eventualmente 0,
associa uno ed uno solo degli elementi dellinsieme
ma non entrambi. Sia k il massimo tra i e j, e
numerico fissato. Ad esempio, se la regola associa a 0
moltiplichiamo r ed s per 2ki 5kj . Allora si ha:
lo stesso numero 0, ad 1 il numero 2, a 2 il numero 4,
ki
kj
ki
kj
a 3 il 6, e cos` via, ci`o che otteniamo `e la successione
r2
5
r2
5
r
=
=
dei numeri pari.
s
2k 5k
10k
Formalmente , una successione `e una funzione f :
e questo, come sappiamo, `e un numero decimale con N K, dove K `e un opportuno insieme numerik cifre dopo il punto decimale.
co. Convenzionalmente, limmagine f (k) si scrive fk
3
e
lintera successione si denota come {fk }kN . La
Come esempio consideriamo 77/250 = 77/(2 5 ) =
2
3
3
successione:
77 2 /(2 5 ) = 308/1000 = 0.308.
Limportante caso alternativo `e il seguente:
x0 = 0, x1 = 1, x2 = 4, x3 = 9, x4 = 16, x5 = 25, . . .
Teorema 3.9 Sia m/n una frazione e sia r/s
m/n la stessa frazione ridotta ai minimi termini. rappresenta chiaramente la successione dei quadrati,
Se s contiene fattori diversi da 2 e da 5, allora la il cui elemento generico sar`a scritto xk = k 2 e la
frazione corrisponde a un numero decimale periodico. successione nel suo insieme {xk }kN = {n2k }kN . Un
altro esempio `e dato dalla successione:
Prova: Si immagini di effettuare la divisione decimale fra r ed s; come visto, ad ogni passaggio dob1
2
3
4
x0 = 0, x1 = , x2 = , x3 = , x4 = , . . .
biamo stabilire quante volte s sta in un numero che
2
3
4
5
termina per 0; questo `e divisibile per s soltanto se s
contiene fattori 2, 5 e nessun altro. Quindi, s non il cui elemento generico `e xk = k/(k + 1), cio`e, glosar`a mai un divisore dei numeri con i quali viene con- balmente, {xk }kN = {k/(k + 1)k }kN . Una succesfrontato, ma ci`o significa che il numero decimale che sione molto famosa, e che abbiamo gi`a incontrato, `e
man mano si ottiene non pu`o essere finito. Daltra quella di Fibonacci (vedere Nota 2.7):
parte, i possibili resti che si hanno nella divisione soF0 = 0, F1 = 1, F2 = 1, F3 = 2, F4 = 3, F5 = 5,
no solo 1, 2, . . . , s1, quindi dopo al pi`
u s1 passaggi
si avr`a la ripetizione di un resto; da quel momento in
F6 = 8, F7 = 13, . . .
poi i resti si ripeteranno nello stesso ordine e quindi
il numero sar`a periodico.
nella quale ogni elemento (a partire da F2 ) `e dato dalLesempio precedente della frazione 24/7 `e signifi- la somma dei due che lo precedono. Possiamo definire
cativo; quando si ottiene il resto 3, che gi`a si era avu- anche successioni arbitrarie, scegliendo casualmente i
to, la divisione continuer`a con i resti 2, 6, 4, . . . corri- vari elementi; in questo caso, per`o, non possiamo daspondenti alle cifre del quoziente 4, 2, 8, . . .. Quindi, re una formula esplicita per calcolare il generico eleil periodo `e costituito dalle cifre 428571, che si ripe- mento xk . Generalmente, si incontrano successioni
teranno un numero infinito di volte. Secondo luso, il definite con regole abbastanza semplici e chi ha espeperiodo si denota soprallineando le cifre che lo com- rienza di Excel, un programma di foglio elettronico,
pongono, e pertanto scriveremo 24/7 = 3.428571, cos` sa che dando allelaboratore i primi elementi di una
come 1/3 = 0.3, 7/11 = 0.63 e 39/22 = 1.772. Il let- successione, quello cercher`a di indurre gli elementi
tore curioso pu`o divertirsi a trovare (e a confrontare) successivi ipotizzando una regola di formazione che
il periodo delle frazioni 1/7, 2/7, 3/7, 4/7, 5/7 e 6/7. sia abbastanza semplice.
Il concetto che ora vogliamo introdurre `e molto imQuando siamo interessati soltanto ai primi elemenportante e riguarda le cosiddette successioni numeri- ti di una successione (x1 , x2 , . . . , xr ), tale sequenza
che. Intuitivamente, una successione `e una sequenza finita `e detta pi`
u propriamente progressione. Qui ci
ordinata di numeri nella quale si distinguono un pri- occuperemo di due tipi particolari di progressione. Si
mo elemento, un secondo elemento, e cos` via. Questo dice progressione aritmetica di ragione q una progresnon spiega granche, per cui cerchiamo di essere pi`
u sione il cui primo elemento `e un numero qualsiasi x0 e
precisi. Consideriamo un insieme numerico; abbiamo ogni altro elemento `e ottenuto aggiungendo q a quelgi`a introdotto N, Z e Q, e su di questi ci baseremo. lo precedente. Pertanto, x1 = x0 + q, x2 = x0 + 2q,
Tuttavia, in seguito, introdurremo linsieme dei nu- x3 = x0 + 3q e cos` via fino ad xr = x0 + rq. La promeri reali R e ci`o che diremo ora vale anche per tale gressione aritmetica pi`
u semplice `e (0, 1, . . . , r), nella

74

CAPITOLO 3. NUMERI

S
S
2S

=
x0
= x0 + rq
= 2x0 + rq

+
x0 + q
+ x0 + (r 1)q
+
2x0 + rq

+
+
+

+ x0 + (r 1)q
+
x0 + q
+
2x0 + rq

+
+
+

x0 + rq
x0
2x0 + rq

Tabella 3.1: Somma di una progressione aritmetica


quale x0 = 0 e q = 1. Una progressione aritmetica di ragione 3 `e (5, 8, 11, . . . , 44) e si pu`o considerare aritmetica anche una progressione costante come
(5, 5, . . . , 5), dove x0 = 5 e q = 0.
Il risultato pi`
u importante relativo alle progressioni
aritmetiche riguarda la somma di tutti i suoi elementi:

metodo ingenuo di far la somma di tutti gli elementi,


laltro sfruttando la formula del corollario. Discuta
poi quale dei due algoritmi `e da preferire.

Il secondo tipo di progressione che vogliamo considerare `e quello delle progressioni geometriche: queste
Teorema 3.10 Sia (x0 , x0 + q, x0 + 2q, . . . , x0 + rq) sono definite dalle regole: x0 = 1 e xj+1 = qxj , cio`e,
una progressione aritmetica; detta S la somma dei a parte x0 , ogni altro elemento della progressione `e il
prodotto dellelemento precedente per una quantit`a q,
suoi elementi, si ha:
detta la ragione della progressione. Questo significa:
x0 + xr
r(r + 1)q
=
(r + 1).
S = x0 (r + 1) +
x0 = 1, x1 = q, x2 = q 2 , . . . , xr = q r .
2
2
Nel seguito considereremo valori di q > 0; osserviamo esplicitamente che se q > 1 allora gli elementi
della progressione vanno crescendo e diventano sempre pi`
u grandi al crescere di r. Viceversa, se q < 1 la
progressione va decrescendo e i suoi elementi si avvicinano sempre di p`
u a 0. Invitiamo fin dora il lettore a modificare (dimostrandole) le formule successive
nellipotesi che sia x0 = a 6= 0, e quindi xj = aq j .
La quantit`a pi`
u interessante `e ancora la somma di
Un caso particolarmente importante corrisponde tutti gli elementi della progressione; il risultato `e il
alla progressione (0, 1, 2, . . . , r):
seguente:

Prova:
Scriviamo gli elementi della progressione da sinistra a destra e poi, al di sotto, da destra a sinistra. Si ha allora la situazione della Tabella 3.1. Sommando termine a termine, nellultima riga abbiamo la somma di r + 1 termini tutti uguali a 2x0 + rq = x0 + xr , per cui si trova:
2S = (r + 1)(2x0 + rq) = (x0 + xr )(r + 1). Ricavando
S, si ha la formula desiderata.

Corollario 3.11 La somma dei primi r numeri Teorema 3.12 Sia (1, q, q 2 , . . . , q r ) una progressiointeri positivi vale:
ne geometrica di ragione q 6= 1; allora:
1 + 2 + + r =

r(r + 1)
.
2

Prova: Basta porre x0 = 0, xr = r e q = 1 nelle


formule del teorema precedente.
Nota 3.3

Gauss (1777 1855) `e considerato uno


dei pi`
u grandi matematici mai esistiti, essendosi interessato di tutti i rami della Matematica e ottenendo
ovunque fondamentali risultati. Si dice che quando
frequentava la scuola elementare, un giorno il maestro
desse alla classe il compito di trovare la somma dei
primi cento numeri. Sperava cos` di avere un po di
tranquillit`
a per potersi dedicare a qualche propria
occupazione. Ma dopo appena due minuti Gauss si
alz`
o affermando di aver gi`
a risolto il problema. Il
maestro, incredulo, gli chiese il risultato, che era naturalmente quello esatto: 5050. Gauss aveva intuito
la formula data nel corollario e aveva semplicemente
calcolato il prodotto 100 101/2 = 50 101 = 5050.
Il lettore `e invitato a scrivere due algoritmi per la
somma dei primi r numeri interi: uno applicando il

S = 1 + q + q2 + + qr =

q r+1 1
.
q1

Prova: Consideriamo il prodotto qS = q + q 2 + q 3 +


+ q r+1 e la differenza qS S; in questa i termini
q, q 2 , . . . , q r si eliminano lun laltro e, in conclusione, non rimane che qS S = q r+1 1. Ricavando
S da questa equazione si ottiene proprio lidentit`a
desiderata.
Si osservi che abbiamo escluso il caso q = 1; la
somma sarebbe banale, ma la formula del teorema
porterebbe alla forma indeterminata 0/0. Nel caso
q = 2, la somma 1 + 2 + 4 + + 128, cio`e da 1 a 27 ,
d`a 28 1 = 255. Si osservi anche il caso in cui q < 1;
ad esempio, ponendo q = 1/2 si ha per r = 10:
1+

1
1/2048 1
1 1
+ + +
=
=
2 4
1024
1/2 1
=

1 1/2048
1
=2
.
1 1/2
1024

75

3.3. I NUMERI DECIMALI


Questo numero differisce per meno di un millesimo da
2. Che succede se passiamo ora ad r = 20, o addirittura ad r = 100? La differenza da 2 diventa sempre
pi`
u piccola. Questa osservazione ci verr`a molto utile
nelle considerazioni successive.
Come abbiamo osservato, ogni frazione corrisponde a un numero decimale, necessariamente finito (se
il denominatore contiene solo potenze del 2 e del 5)
o periodico. Vogliamo ora affrontare il problema opposto: dato un numero decimale finito o periodico, `e
vero che questo corrisponde a una frazione, cio`e a un
numero razionale? La risposta sar`a s`, e vedremo anche qual `e lalgoritmo che, dato il numero decimale,
permette di trovare la frazione equivalente.
Intanto, la cosa `e semplice per i numeri decimali
finiti. Cominciamo col dimostrare il seguente teorema
sulla divisione per 10:
Teorema 3.13 Se la rappresentazione decimale del
numero a `e dr dr1 . . . d1 d0 .c1 c2 . . ., allora la rappresentazione di a/10 `e dr dr1 . . . d1 .d0 c1 c2 . . ., cio`e
a/10 si ottiene spostando il punto decimale di una
posizione a sinistra.

1
=
10
=

1
1
1+
+ . . . + r1
10
10

1 1 1/10r
1
1
=
.
10 1 1/10
9 9 10r

Possiamo osservare che quando r `e 10 o 20, questa


quantit`a `e molto vicina a 1/9 e, anzi, man mano che
r cresce, la vicinanza a 1/9 `e sempre pi`
u marcata,
nel senso che la differenza 1/(9 10r ) `e praticamente nulla. Se allora consideriamo il numero periodico
1
+ 1012 + 1013 + e lo vediamo come la som0.1 = 10
ma di infiniti termini, possiamo immaginare che esso
divenga 1/9 in quanto la r `e infinitamente grande: la
differenza 1/(9 10r ) deve diventare 0. Questo ragionamento `e plausibile e ha solo linconveniente di
tirare in ballo quantit`a infinite: un numero infinito
di termini del tipo 1/10r , un r che diviene infinito,
un errore che tende ad essere infinitamente piccolo.
Ha senso tutto questo? In effetti s`, e la riprova sta
nel semplice fatto che se partiamo da 1/9 ed eseguiamo la divisione, troviamo appunto 0.111 . . . = 0.1.
La conclusione `e quindi 0.1 = 1/9, nel senso preciso
che luguaglianza si pu`o leggere tanto da sinistra verso destra, quanto da destra verso sinistra. Possiamo
allora generalizzare questo ragionamento:

Prova: Per le propriet`a della notazione posizionale,


a/10 vale:

1
c1
dr 10r + + d1 10 + d0 +
+ =
Lemma 3.15 Sia (1, q, q 2 , q 3 , q 4 , . . .) una successio10
10
ne di infiniti termini in cui ognuno `e ottenuto moltic1
d0
plicando per q < 1 il precedente. La somma S di tutti
r1
+
+
= dr 10
+ + d1 +
10 102
gli elementi della successione `e allora S = 1/(1 q).
e questo, riportato alla notazione decimale, ci d`a il
Prova: Naturalmente, non sappiamo eseguire una
risultato cercato.
somma con infiniti termini; arrestiamo allora la sucNaturalmente, la stessa propriet`a vale per le divi- cessione al termine q r , ottenendo cos` una progressiosioni per 100, 1000 e cos` via; pertanto un corollario ne geometrica di ragione q.Il Teorema [3.11] ci dice
del teorema `e:
che la somma Sr (lindice r serve a ricordarci che ci
siamo
fermati al termine q r ) `e:
Corollario 3.14 Se un numero decimale finito ha
k cifre dopo il punto decimale, diciamo a =
1 q r+1
1
q r+1
dr dr1 . . . d1 d0 .c1 . . . ck , allora a `e equivalente alla
Sr =
=

.
1q
1q 1q
frazione:
dr dr1 . . . d1 d0 c1 . . . ck
.
10k

Essendo q < 1, la quantit`a q r+1 diviene sempre


pi`
u piccola al crescere di r e tale, perci`o, `e anche
r+1
q
/(1 q). Man mano quindi che consideriamo
Quindi, la semplice regola per trasformare a in una
pi`
u
termini
della successione, la differenza di Sr da
frazione `e: togliere il punto decimale e dividere per
1/(1

q)
si
avvicina a 0 e, in conclusione, possiamo
k
10 , se k `e il numero delle cifre di a dopo il punto
assumere
che,
per la successione completa, si abbia
decimale. Pertanto 5.7 = 57/10 e ci possono essere
S
=
1/(1

q).
semplificazioni come in 8.375 = 8375/1000 = 67/8.
Per affrontare il caso dei numeri decimali non fiSe q = 1/2 come nella sezione precedente, e pensianiti, e quindi periodici, `e opportuno partire conside- mo a sommare 1+1/2+1/4+ , intuitivamente comrando progressioni geometriche con ragione q minore prendiamo che la somma totale deve essere 2; questo
di 1. Prendiamo il caso q = 1/10 che `e quello che ci `e in accordo con la formula S = 1/(1 1/2) = 2. Nel
interessa e cerchiamo la somma della progressione:
caso q = 1/10 abbiamo 1+1/10+1/100+ = 10/9 =
u ci interessa `e il seguente
1, 1. Ma quello che pi`
1
1
1
1
+ 2 + 3 + + r =
risultato:
10 10
10
10
a=

76

CAPITOLO 3. NUMERI

Corollario 3.16 Sia r N, r 1; allora vale Nellesempio abbiamo:


luguaglianza:
1
1
0.57999 . . . = 0.57 +
+
+ =
1
1
1
1
1000 10000
+
+
+

=
,
10r
102r
103r
10r 1
1
= 0.57 + 0.01 = 0.58.
= 0.57 +
100
cio`e la somma `e uguale a una frazione il cui numeratore `e 1 e il cui denominatore `e costituito da r cifre Questa propriet`a ci dice che i numeri con periodo 9 sotutte uguali a 9.
no dei doppioni, e quindi possono essere (anzi, devono
essere) ignorati. Da questo momento in avanti, quanProva: Basta applicare il lemma precedente:
do parleremo di rappresentazione decimale dei numeri, escluderemo, esplicitamente o implicitamente,
1
1
1
+ 2r + 3r + =
quelle che presentano il periodo 9.
r
10
10
10
Un altro passo pu`o ora essere fatto considerando

1
1
1
un numero con una parte intera diversa da 0. Sia
= r 1 + r + 2r + =
a = dh dh1 . . . d1 d0 .c1 c2 . . . cr il numero decimale pe10
10
10
riodico che vogliamo considerare; per quanto visto,
r
1
1
1
10
= r
=
;
abbiamo:
10 1 1/10r
10r 10r 1
c1 c2 . . . cr
=
a = dh dh1 . . . d1 d0 +
questa espressione si semplifica dando quella deside10r 1
rata.
dh . . . d1 d0 10r + c1 c2 . . . cr dh . . . d1 d0
Questo corollario ci dice che il numero periodi=
.
10r 1
co 0.01 equivale alla frazione 1/99 essendo 0.01 =
1/100 + 1/10000 + . Lestensione a un numero del La quantit`a dh dh1 . . . d1 d0 10r + c1 c2 . . . cr `e semplicemente la sequenza delle cifre che compongono a,
tipo 0.c1 c2 . . . cr `e immediata:
senza il punto decimale e senza la soprallineatura del
0.c1 c2 . . . cr =
periodo; pertanto possiamo dire che a equivale a una
frazione cos` composta:
c1 c2 . . . cr
c1 c2 . . . cr
c1 c2 . . . cr
=
+
+
+ =
r
2r
3r
10
10
10
il numeratore si ottiene sottraendo le cifre della
c1 c2 . . . cr
parte intera dal numero composto di tutte le cifre
=
10r 1
di a senza punto decimale e soprallineatura;
cio`e, il numero periodico 0.c1 c2 . . . cr equivale a una
il denominatore `e il numero composta da tante
frazione il cui numeratore `e costituito dalle cifre
cifre 9 quante sono le cifre del periodo.
c1 , c2 , . . . , cr e il cui denominatore `e il numero composto di r cifre 9. Quindi, 0.324 = 324/999 = 12/37,
Lultimo passo `e ora quello di considerare un nucome si pu`o verificare direttamente eseguendo la di- mero periodico nella sua forma pi`
u generale, con una
visione. Unaltra conseguenza del precedente corol- parte intera dh dh1 . . . d1 d0 , un antiperiodo (cio`e la
lario riguarda unanomalia della notazione decima- parte che segue il punto decimale, ma precede il pele, e cio`e i numeri che presentano il periodo 9, come riodo) p1 p2 . . . ps , e un periodo c1 c2 . . . cr . Ma se s
0.579999. . .. Precisamente si ha:
sono le cifre dellantiperiodo, abbiamo:
Corollario 3.17 Un numero decimale che abbia come periodo 9 `e equivalente a un numero decimale
finito.
Prova:
Se il periodo inizia dalla r-esima cifra
decimale, esso vale:

9
10r1

9
9
9
+ r+1 + r+2 + =
10r
10
10

1
1
9
1
1
+
+ = r1 = r1
10 102
10
9
10

a=

dh dh1 . . . d1 d0 p1 p2 . . . ps
+
10s

c1 c2 . . . cr
1 c1 c2 . . . cr
+
+

=
10s
10r
102r
c1 c2 . . . cr
dh dh1 . . . d1 d0 p1 p2 . . . ps
+ s r
=
=
10s
10 (10 1)
+

= (dh . . . d1 d0 p1 p2 . . . ps 10r + c1 c2 . . . cr
dh . . . d1 d0 p1 p2 . . . ps )/(10s (10r 1)).

Di nuovo, dh dh1 . . . d1 d0 p1 p2 . . . ps 10r + c1 c2 . . . cr


dove abbiamo applicato il corollario precedente. Que- `e il numero composto da tutte le cifre di a senza il
sta quantit`a, sommata alla parte non periodica, d`a un punto decimale e la soprallineatura. Possiamo perci`o
chiudere questa sezione con il classico:
numero decimale finito.

77

3.4. I NUMERI REALI


Algoritmo 3.4 (Conversione in frazione)
Ingresso: a = dh dh1 . . . d1 d0 .p1 p2 . . . ps c1 c2 . . . cr ,
dove s pu`
o anche essere 0;
Uscita: La frazione equivalente ad a, ridotta ai
minimi termini.
1. si assegna a t il numero naturale costituito da
tutte le cifre di a, senza punto decimale e senza
soprallineatura, cio`e:
t := dh dh1 . . . d1 d0 p1 p2 . . . ps c1 c2 . . . cr ;
2. si assegna ad f il numero naturale costituito dalle cifre della parte intera e delleventuale
antiperiodo di a, cio`e:
f := dh dh1 . . . d1 d0 p1 p2 . . . ps ;
3. := t f ;
4. si assegna a il numero costituito da r cifre 9
(tante quante sono le cifre del periodo), seguite
da s cifre 0 (tanta quante sono le cifre dellantiperiodo; se s = 0 lantiperiodo manca e le cifre
0 non vengono generate);
5. := MCD(, );
6. se 6= 1, poniamo := / e := /;
7. i numeri e costituiscono il numeratore e il
denominatore della frazione corrispondente ad a
e ridotta ai minimi termini.

3.4

I numeri reali

Il teorema e lalgoritmo che hanno concluso la precedente sezione sono di fondamentale importanza per
approfondire il nostro concetto di numero. Poiche le
frazioni corrispondono ai numeri decimali finiti o periodici, i numeri razionali (cio`e le stesse frazioni) non
possono esaurire tutti i numeri pensabili. E del tutto ovvio che esistono numeri decimali infiniti che non
sono periodici, come:
= 2.131133111333111133331 . . .
e infiniti altri se ne possono concepire sullo stesso
schema o su schemi analoghi. Per i Greci, che non
avevano una notazione decimale analoga alla nostra,
le cose non erano cos` semplici. Essi rappresentavano
i numeri come segmenti: fissato un segmento come
unit`a di misura, un numero era semplicemente il rapporto tra un segmento e lunit`a di misura, cio`e la
sua lunghezza. A lungo essi credettero che fosse sempre possibile trovare un sottomultiplo comune tra il
segmento e lunit`a di misura. Questo equivale a dire che se questo sottomultiplo `e la n-esima parte del

segmento e la m-esima parte dellunit`a di misura, la


misura del segmento `e il numero razionale n/m. Lesistenza di un sottomutiplo comune era cos` intuitiva
che fino ai tempi di Pitagora si pens`o che le cose non
potessero stare che in questo modo: si diceva che tutte le lunghezze sono commensurabili. Fu dunque uno
shock intellettuale notevole quando qualcuno (un discepolo di Pitagora, se non Pitagora stesso) dimostr`o
che esistono lunghezze incommensurabili, cio`e per le
quali non esiste alcun sottomultiplo comune con il
segmento fissato come unit`a di misura, per quanto
piccolo possiamo immaginare tale sottomultiplo. Le
grandezze che provocarono questa rivoluzione furono
il lato e la diagonale del quadrato
e questo, nei nostri
termini, vuol dire che il numero 2 non `e un numero
razionale. I Pitagorici erano riuniti in una setta dalle
regole molto rigide e non divulgavano i loro segreti.
Si racconta che a rivelare la scoperta delle grandezze incommensurabili fu Ippaso di Metaponto, che poi
abbandon`o la setta. I suoi ex compagni, comera luso
in questi casi, gli eressero una stele funeraria per dire
che per loro Ippaso era morto. Qui diamo la classica
dimostrazione per assurdo, notando che essa vale per
la radice quadrata di un qualsiasi numero che non sia
un quadrato perfetto:

2 non `e un numero
Teorema 3.18 Il numero
razionale.

Prova: Supponiamo per assurdo che 2 sia un numero


razionale, e cio`e esista una frazione m/n =

2, che possiamo supporre ridotta ai minimi termini. Elevando al quadrato si ha: m2 /n2 = 2, cio`e
m2 = 2n2 . Il fattore 2, presente a destra, deve essere
presente anche a sinistra, cio`e m deve essere divisibile
per 2, diciamo m = 2k. Lidentit`a diventa 4k 2 = 2n2 ,
ovvero 2k 2 = n2 . Questo significa, per`o, che 2 deve
essere anche un fattore di n, il che contraddice lipotesi che m/n fosse ridotta ai minimi termini, cio`e che
m
ed n fossero primi tra di loro. Lipotesi che fosse 2 = m/n `e quindi assurda e 2 non pu`o essere
razionale.
Nota 3.4

I numeri reali sono pi`


u numerosi dei numeri naturali. Questa affermazione pu`
o essere considerata banale se si osserva, come s`e fatto, che N R;
`e meno banale se si ritorna alla teoria di Cantor e al
fatto che la frase significa: non esiste alcuna corrispondenza biunivoca tra N ed R. Questo `e vero, come
fra poco vedremo, ma la dimostrazione non `e affatto
banale.
Intanto, abbiamo introdotto, dopo N, gli insiemi numerici Z e Q, ma `e facile vedere che essi sono numerabili. La dimostrazione `e in pratica gi`
a stata effettuata
nel primo capitolo, ma pu`
o tornare utile rivederla nel
caso specifico. Se consideriamo Z come lunione di numeri positivi e negativi, cio`e lunione disgiunta di due

78

CAPITOLO 3. NUMERI
insiemi numerabili, possiamo scrivere esplicitamente
la corrispondenza biunivoca con N:
0 0,
4 2,

1 1,
5 3,

2 1,
6 3,

3 2,
.
...

Anche Q pu`
o essere visto come il prodotto cartesiano
Z N0 , cio`e di due insiemi numerabili; la corrispondenza biunivoca, limitata a Q+ `e la seguente, derivata
da quella schematizzata nella Figura 1.3:
1/1

1/2
1/3

1/4

2/1

2/2

2/3

2/4

3/1

3/2

3/3
3/4

4/1

4/2

4/3

4/4

E facile vedere che la corrispondenza funziona, a maggior ragione per il fatto che le frazioni sono di pi`
u
dei numeri razionali.
Quando si arriva ai numeri reali le cose si complicano,
ma Cantor riusc` a dimostrare che la cardinalit`
a di R
`e maggiore di 0 con una prova che costituisce unaltra pietra miliare nella tecnica matematica. Essa `e
nota come diagonalizzazione di Cantor ed `e stata pi`
u
volte utilizzata per dimostrare risultati importanti in
vari settori della Matematica e della Logica formale.
Vediamo in che cosa consiste e come si dimostra che
c > 0 .
Intanto, una semplice dimostrazione geometrica permette di stabilire che un qualsiasi segmento `e equipotente a tutta la retta, cio`e, in termini numerici, che un
intervallo aperto (a, b) `e in corrispondenza biunivoca
con R.

X
C

r
X

Sia r la retta e, spezzato il segmento AB di modo


che A, B, C siano equidistanti dal punto P ed A, B
giacciano sulla parallela ad r passante per P , `e facile vedere che la proiezione da P (che ad X, Y fa
corrispondere X , Y ) `e una corrispondenza biunivoca. Allora, `e sufficiente dimostrare che linsieme dei
numeri reali nellintervallo [0, 1) (immaginiamo che lo
0 sia presente; questo semplifica il ragionamento e non
cambia sostanzialmente la corrispondenza che abbiamo visto) ha cardinalit`
a maggiore di N0 perche la tesi

c > 0 sia provata. Supponiamo che tale corrispondenza esista e scriviamola, esprimendo i numeri reali
in forma decimale:
1
2
3
4

0.d1,1 d1,2 d1,3 d1,4 . . .


0.d2,1 d2,2 d2,3 d2,4 . . .
0.d3,1 d3,2 d3,3 d3,4 . . .
0.d4,1 d4,2 d4,3 d4,4 . . .

Nellintervallo [0, 1) i numeri hanno tutti la forma


0.d1 d2 d3 . . . e quindi di,j indica la j-esima cifra del
numero reale corrispondente al numero naturale i. In
questo elenco devono essere compresi tutti i numeri
dellintervallo, altrimenti la corrispondenza non sarebbe biunivoca. Costruiamo ora un numero reale
x = 0.x1 x2 x3 . . . con la seguente regola: xi deve essere
diverso da di,i e da 9. Il numero x sta nellintervallo
[0, 1) ed `e un numero decimale legale visto che, per costruzione, non pu`
o avere periodo 9. Quindi deve essere
uno dei numeri dellelenco. Tuttavia, non pu`
o essere
il corrispondente di 1 perche x1 6= d1,1 ; non pu`
o essere
il corrispondente di 2 perche x2 6= d2,2 , e cos` via, non
pu`
o essere il corrispondente di n perche xn 6= dn,n .
Quindi x non si trova nellelenco, il che `e assurdo e
prova che la corrispondenza biunivoca ipotizzata non
pu`
o esistere. Conclusione: c > 0 .

Come detto nella Sezione 1.4, si sa che c = 1 , cio`e i


numeri reali sono tanti quanti i sottoinsiemi di N. Il
fatto che i numeri reali siano cos` numerosi ha molte interessanti applicazioni. Ad esempio, gli elementi
dellinsieme R\Q si dicono numeri irrazionali, e poiche
Q `e numerabile, ne consegue che i numeri irrazionali
hanno cardinalit`
a c, cio`e sono pi`
u numerosi dei razionali. Unaltra categoria di numeri che `e facile contare
`e costituita dai numeri algebrici: questi sono definiti
come le soluzioni reali delle equazioni algebriche, cio`e
delle equazioni polinomiali a coefficienti razionali, ovvero a coefficienti interi, poiche a queste ci si riduce
sempre dalle prime moltiplicando per il denominatore comune (v. Sezione 5.2 per varie affermazioni che
stiamo facendo in questa Nota). Tutti i numeri razionali m/n sono algebrici, in quanto soluzione del
lequazione nx m = 0. Anche tutte le radici k m
sono numeri algebrici se k, m N; sono infatti soluzione dellequazione di grado k: xk m = 0. Sono
numeri algebrici anche le espressioni pi`
u complicate
che comprendono radicali
di
numeri
razionali,
come
p
p

3
(3 + 5/2 4 7)/ 2 5 2 e anche numeri che non
sappiamo esprimere come radicali. E noto infatti che
le equazioni di grado superiore al quarto non sono in
generale risolubili per radicali. Quindi, i numeri algebrici sono tantissimi; tuttavia, ogni equazione di grado
k ha al pi`
u k soluzioni reali e possiamo procedere in
questa maniera per dimostrare che i numeri algebrici
sono una quantit`
a numerabile.
Cominciamo con losservare che le equazioni algebriche di primo grado sono numerabili: esse hanno la
forma ax + b = 0 e quindi sono tante quante le possibili coppie ordinate (a, b) di numeri interi, che per`
o gi`
a
sappiamo essere numerabili. Perci`
o, i numeri algebrici

79

3.4. I NUMERI REALI


di primo grado (cio`e le soluzioni delle corrispondenti
equazioni algebriche) sono numerabili. Passando alle
equazioni di secondo grado, come ax2 +bx+c = 0 possiamo immaginarle come coppie (a, bx + c) di numeri
e di equazioni algebriche di primo grado. Quindi anchesse sono numerabili e poiche i numeri algebrici di
secondo grado sono al pi`
u il doppio delle corrispondenti equazioni, anchessi costituiscono un insieme numerabile. Aggiunto al precedente, come sappiamo fin dal
primo capitolo, ci d`
a ancora un insieme numerabile.
Possiamo allora ripetere il ragionamento per le equazioni algebriche di terzo grado ax3 + bx2 + cx + d = 0,
viste come coppie (a, bx2 + cx + d), e provare che i
numeri algebrici di primo, secondo e terzo grado sono
una quantit`
a numerabile. Procedendo nella stessa maniera si arriva alla conclusione preannunciata, e cio`e
che tutti i numeri algebrici costituiscono un insieme
numerabile.
I numeri non algebrici si dicono trascendenti e
possiamo ora affermare che essi costituiscono un
insieme di cardinalit`
a c. E stato dimostrato che
= 3.14159 . . ., il rapporto tra la circonferenza e il
diametro di un cerchio, ed e = 2.71828 . . ., la base dei
logaritmi naturali, sono numeri trascendenti. Anche
tante altre propriet`
a di questi numeri sono ben note,
ma noi, naturalmente, qui ci dobbiamo fermare.

Se tentiamo di forzare la nostra logica finita per


indulgere, come spesso si fa, a considerazioni che
coinvolgono linfinito, possiamo dare la seguente:
Pseudodefinizione: si intende per numero pseudoreale un numero intero D, seguito da un punto,
detto punto decimale, seguito da infinite cifre decimali che non siano definitivamente tutte uguali a
9.
Per luso del punto decimale si veda il punto 6 dellIntroduzione. Come abbiamo appena detto, definitivamente significa da un certo momento in poi,
senza ulteriore specificazione del punto del quale si
parla. Abbiamo gi`a visto che senso ha la condizione
sul 9; notiamo invece esplicitamente che non si vieta che le cifre possano essere definitivamente tutte
uguali a 0: questa situazione corrisponde ai numeri
decimali finiti. Il punto debole di questa definizione,
ci`o che la rende una semplice pseudodefinizione, `e il
tentativo di voler attualizzare il concetto di infinito,
parlando di infinite cifre dopo il punto decimale.
Questo non ha molto senso e dobbiamo preferire una
definizione che faccia uso solo dellaspetto potenziale dellinfinito. Ad esempio, si potrebbe modificare
la pseudodefinizione e parlare di una corrispondenza
(nel senso del primo Capitolo) che associa ad ogni
posizione decimale (cio`e dopo il punto) una cifra ben
definita. Cos`, associando ad ogni posizione la cifra 5, e definendo la parte intera come 3, si ha il
numero 3.555 . . ., corrispondente al numero razionale
3.5 = 32/9. Associando invece alle cifre di posto p

(p numero primo) la cifra 2 e a quelle di posto p non


primo la cifra 3 (la parte intera sia 1) , si ottiene il numero 1.22232323332 . . ., irrazionale perche i numeri
primi non presentano alcun tipo di periodicit`a.
Questa impostazione, per`o, presenta diversi inconvenienti. Ad esempio, lega la definizione a una specifica base, il 10, il che `e chiaramente limitativo, se non
addirittura scorretto. Ci obbliga a cercare associazioni che funzionano cifra per cifra: questo pu`o essere
molto complicato come nel caso del numero visto
in precedenza (provare per credere), o molto limitativo, come per il numero 0.12345678910111213 . . .. Ad
onor del vero, se non ci leghiamo a regole che funzionano cifra per cifra, questo metodo permette di
definire i numeri reali computabili, come sono trattati nella teoria della Computabilit`a. Purtroppo, questi
numeri hanno la cardinalit`a del numerabile e quindi
non comprendono tutti i numeri reali.
Nota 3.5

La notazione decimale dei numeri reali


estende quella dei numeri razionali, vista nella sezione
precedente. Ma mentre tutti i numeri razionali hanno
anche una rappresentazione finita, data dalla frazione
corrispondente, ci`
o non succede per i numeri irrazionali. Come abbiamo visto, possono esistere regole (o
leggi) di carattere finito che determinano la successione delle cifre decimali; altre volte esistono regole (o
leggi o algoritmi) che determinano tante cifre
decimali quante se ne vogliono, come succede per 2 e per
(si vedano le Sezioni 3.6 e 6.7). Si pone allora il problema di dare la migliore rappresentazione finita di un
numero reale. Di solito, sulla carta o nella memoria
di un elaboratore, si lavora con un certo numero di
cifre (la precisione); per semplicita desempio, supponiamo di fare i nostri conti con quattro cifre decimali.
Questo significa che dobbiamo ignorare la quinta cifra
e le cifre successive, creando unapprossimazione della
quantit`
a considerata. Se semplicemente troncassimo il
numero alla quarta cifra, avremmo dei problemi man
mano che si procede con i conti. Tali approssimazioni per difetto, infatti, tenderebbero ad accumularsi,
creando errori sempre pi`
u consistenti. Si operano allora approssimazioni per difetto e per eccesso secondo
una regola precisa:
1. se la quinta cifra decimale `e 0, 1, 2, 3, 4, il
numero viene troncato alla quarta cifra;
2. se la quinta cifra decimale `e 5, 6, 7, 8, 9, la quarta
cifra viene incrementata di 1 (ci`
o si pu`
o riflettere
anche sulle cifre precedenti).
In questo modo, avremo il 50% di approssimazioni per
difetto, secondo il caso 1, e il 50% per eccesso, secondo
il caso 2. Ad esempio:
3.14159 . . .
3.14153 . . .
3.14197 . . .

3.1416
3.1415
3.1420

In questo modo, gli 0 finali diventano significativi;


continuando lesempio, il numero 3.142 indica il

80

CAPITOLO 3. NUMERI
numero razionale finito 3.142, mentre 3.1420 indica
lapprossimazione di un numero (razionale o reale)
con almeno quattro cifre decimali. Queste regole si
ritrovano in Fisica; se una costante `e specificata come
4.2, vuol dire che di essa si conosce una sola cifra
decimale: Se `e specificata come 4.2000, significa che si
conoscono quattro cifre decimali e si sa che le ultime
tre sono 000 (o anche 1999, e la cifra successiva `e
alta, 8 o 9 pur non essendo ancora nota).

Vedremo nella prossima sezione una costruzione


sensata dei numeri reali e giustificheremo il fatto che
tale costruzione `e consistente con la pseudodefinizione
appena data. Qui, analogamente a quanto abbiamo
fatto per i numeri naturali, dedichiamo un po di tempo alla rappresentazione dei numeri reali e alla loro
conversione da una base allaltra. Dato un numero
decimale dk dk1 . . . d1 d0 .c1 c2 c3 . . ., rappresentazione
e conversione della parte intera dk dk1 . . . d1 d0 sono
gi`a state considerate e quindi possiamo limitarci alla
parte decimale 0.c1 c2 c3 . . .. Come per la parte intera,
il caso pi`
u semplice si ha partendo con un numero
0.c1 c2 c3 . . . scritto in base b e cercandone la conversione in base 10. Anche questa volta basta applicare la regola posizionale, cio`e il fatto che il numero
considerato `e, per definizione:

A sinistra abbiamo ottenuto un numero (in base


b) la cui parte intera `e c1 e la cui parte decimale `e 0.c2 c3 . . .. Questo deve corrispondere al valore di destra, e in particolare la parte intera di
b 0.c1 c2 c3 . . . deve coincidere con c1 . In altre parole, la cifra b-aria c1 `e data dalla parte intera del
prodotto b 0.c1 c2 c3 . . .. Iterando questo processo, si
ottengono via via le altre cifre c2 , c3 , . . .. Tutto ci`o `e
descritto dal seguente:
Algoritmo 3.5 (Conversione in base b)
Ingresso: un numero decimale C = 0.c1 c2 c3 . . . e due
numeri naturali b, n > 0;
Uscita: le prime n cifre del numero equivalente C =
0.c1 c2 c3 . . . in base b;
1. si pone i := 1;;
2. si pone ci uguale alla parte intera di b C;
3. si ridefinisce C come la parte decimale dello
stesso prodotto b C;
4. si incrementa i di 1;
5. se i n si torna al passo 2., altrimenti si `e
finito.

Questo algoritmo, naturalmente, funziona qualunque sia il numero n, determinando n cifre del risultato; occorre stare attenti al numero delle cifre di C
+
+
+ .
0.c1 c2 c3 . . . =
b
per non correre il rischio di perdere precisione a causa
E quindi sufficiente eseguire i vari conti; ad esempio, delle varie moltiplicazioni. In effetti, se C `e razionale, si pu`o utilizzare la frazione equivalente, invece del
per 0.6427 si ha:
valore decimale. Consideriamo, come primo esempio,
6
4
2
la trasformazione di 0.944 in base 7; si procede cos`:
0.642 = + 2 + 3 = 0.944606413.
7 7
7
0.944 7 = 6.608
Pu`o essere questo il momento di osservare che la
0.608 7 = 4.256
propriet`a dei numeri razionali di corrispondere ai nu0.256 7 = 1.792
meri decimali finiti o periodici, non `e limitata alla
0.792 7 = 5.544
base 10, ma vale in generale, come si capisce dalle di0.554 7 = 3.808
mostrazioni delle sezioni precedenti: basta sostituire

la base b alla base 10. La finitezza pu`o essere interpretata come la presenza di un periodo 0, e questo Si ha pertanto 0.94410 = 0.64153 . . .7 , e dallo svilupci fa capire che un numero finito in una base b pu`o po ottenuto si capisce facilmente che si otterr`a un
essere un numero periodico in unaltra base b , e vi- numero periodico. La frazione 1/3 in base 5 si scrive:
ceversa. Qui abbiamo visto che 0.642, finito in base
1/3 5 = 5/3 = 1 + 2/3
7, diviene periodico in base 10. Nessuna meraviglia.
2/3 5 = 10/3 = 2 + 1/3
Per la conversione inversa, osserviamo quanto se1/3 5 = 5/3 = 1 + 2/3
gue; sia 0.c1 c2 c3 . . . un numero decimale (in base

10) e sia 0.c1 c2 c3 . . . il suo equivalente in una base


b qualsiasi. Avremo pertanto:
La prima frazione propria che si ripete, innesca il
calcolo di un periodo, e quindi si ha:
c1
c2
c3
+ 2 + 3 + = 0.c1 c2 c3 . . . .
b
b
b
1
= 0.310 = 0.135 .
3
Moltiplicando ora i due membri per b:
c1

c1 +

c2
b2

c3
b3

c2
c
+ 23 + = b 0.c1 c2 c3 . . . .
b
b

Il lettore `e invitato a fare altri esempi e, in particolare, ad usare la base 2, per capire bene cosa fa

3.5. LA COSTRUZIONE DEI NUMERI REALI

81

proporre costruzioni di R che fossero concettualmente semplici, ma rigorose da un punto di vista formale. Tutte queste proposte, per ci`o che si `e detto,
coinvolgono oggetti matematici infiniti, cio`e strutture contenenti un numero infinito di numeri razionali. Emblematico, a questo proposito, `e il metodo delle
` linsezioni di Dedekind, nel quale un numero reale e
sieme di tutti i numeri razionali che gli sono minori
(o uguali); questo, automaticamente, definisce anche
linsieme dei numeri razionali che gli sono maggiori,
e questi due insiemi costituiscono
una sezione di Q.
dalla mantissa 1100010011001 . . ., con un nu- Ad esempio, il numero irrazionale 2 `e dato da:
mero di bit legato allhardware e alle istruzioni
+
2
dellelaboratore (spesso 32, 64 o pi`
u);
Q
0 {q Q | q < 2};

un elaboratore elettronico. Allinterno di questo, un


numero come 12.3 `e rappresentato nel modo seguente. Prima di tutto, lelaboratore converte il numero
in binario secondo il precedente algoritmo, ottenendo
1100.01001. In secondo luogo, divide questo numero
per unopportuna potenza di 2, in modo da portare l1 pi`
u a sinistra come prima cifra dopo il punto decimale. Nellesempio corrente, dividendo per 24
si ha 0.1100010011001. Il numero `e univocamente
rappresentato:

dallesponente 4 cui occorre elevare il 2 per naturalmente, luguaglianza pu`o essere considerata
riportare la mantissa alleffettivo valore del soltanto se il numero reale da definire `e, di fatto, un
numero.
numero razionale.
Il metodo delle sezioni `e abbastanza intuitivo; se,
Si osservi che tanto la mantissa quanto lesponente come facevano i Greci e facciamo anche noi nella Geopossono essere negativi; il numero scritto come coppia metria Analitica, pensiamo ad R come ad una retta,
(mantissa, esponente) si dice normalizzato.
un numero reale r `e individuato dalle due semirette in
cui il punto corrispondente ad r divide la retta stessa. Questo implica la scelta sulla retta di un punto di
3.5 La costruzione dei numeri origine, di un verso (positivo) e di una unit`a di misura, seconda la quale r risulta la misura del segmento
reali
determinato dal punto e dallorigine fissata. In effetNelle sezioni precedenti abbiamo visto come i numeri ti, i Greci identificavano il concetto di numero reale
interi possano essere costruiti a partire dai nume- con quello della misura (in particolare, la misura delri naturali, e come i numeri razionali si costruiscano le lunghezze), e da ci`o derivava la loro idiosincrasia
dai numeri interi. Le due costruzioni si assomiglia- per i numeri negativi. Nel metodo delle sezioni, dono abbastanza: 1) si considerano coppie di elementi vremmo immaginare la retta come costituita solo dai
dellinsieme numerico di partenza; 2) su tali coppie si punti razionali, sui quali fondare poi i numeri reali.
definisce una relazione di equivalenza; 3) si definisco- Per questo, limpostazione geometrica lascia perplesno le quattro operazioni di base e il confronto in modo si ed `e meglio affrontare il problema da un punto di
da essere compatibili con la relazione di equivalenza; vista puramente numerico, come di fatto fa il metodo
4) si osserva infine che un sottoinsieme dellinsieme delle sezioni.
cos` costruito `e identificabile con (`e isomorfo a) linDaltra parte, il metodo delle sezioni non sembra
sieme di partenza. Questultima affermazione signi- avere un aggancio pratico consistente. Se vogliamo
fica che, effettuata lidentificazione, il risultato delle usare un numero reale (per sommarlo, confrontarlo,
operazioni e dei confronti `e lo stesso, sia nellinsieme etc.) la sua sezione `e ben poco utile, anzi ci impaccia
di partenza, sia nel sottoinsieme dellinsieme definito. perche introduce troppi numeri razionali, la maggioQueste costruzioni avvengono in termini finiti, cio`e ranza dei quali nulla hanno a che vedere col numero
tutte le definizioni coinvolte operano su espressioni stesso. Ad esempio, i numeri 3,1/2 e 127/343 apfinite, ovvero le coppie che sono gli oggetti costituti- partengono tutti alla sezione di 2, ma
questo non
vi dellinsieme costruito. Questo, in modo intuitivo, ci `e molto utile quando lavoriamo con 2. Preferiagiustifica il fatto che tanto Z quanto Q non vanno al mo pertanto un altro metodo che ci pare pi`
u consono
di l`a del numerabile.
ad un uso effettivo e che, comunque, mantiene quelPur ribadendo un procedimento gi`a visto nella Se- la dote di intuibilit`a che caratterizza il metodo delle
zione 3.1, la costruzione dei numeri reali non pu`o es- sezioni. Alla fine di questa sezione, comunque, risere altrettanto semplice. Come abbiamo osservato torneremo a considerare il metodo delle sezioni (ci si
nella Nota 3.4, la loro cardinalit`a `e maggiore del nu- perdoni il bisticcio).
merabile, e questo significa che una costruzione fiRiprendiamo il concetto di sequenza o successione
nita, fatta di coppie o di terne di numeri razionali, gi`a introdotta nella Sezione 3.3. Formalmente, posnon `e ragionevolmente possibile. A partire dalla se- siamo specificare che in questa sezione considerereconda met`a del 1800, i matematici hanno cercato di mo solo successioni di numeri razionali, cio`e funzioni

82

CAPITOLO 3. NUMERI

a : N Q, per le quali si usa scrivere ak invece di


a(k), come per le altre funzioni. Spesso, una successione si indica con la notazione {ak }kN e possiamo
dare la seguente:

infatti il nostro avversario virtuale fissa = 1/1000,


ci basta considerare lelemento 2.131 (m = 3) e osservare che ogni altro elemento `e minore di 2.132,
per essere sicuri che le differenze |an a3 | sono tutte
minori
di . Se poi costui fissasse come un miDefinizione 3.4 Una successione (di numeri raziolionesimo,
`e sufficiente prendere lelemento 2.131133
nali) {ak }kN si dice di Cauchy se assegnato un nu(m
=
6),
per
assicurarsi che tutti i successivi elementi
mero razionale positivo (piccolo quanto si vuole),
sono
a
distanza
minore di da questo am . Quindi, la
`e possibile determinare un indice m N tale che,
successione
`
e
di
Cauchy.
qualunque sia n > m, si abbia |an am | < .
Questa definizione `e, riconosciamolo, abbastanza
astrusa e non `e banale capirla di primo acchito. Cerchiamo allora di spiegare informalmente il suo significato per arrivare ad afferrarne, infine, il senso logico.
Una successione di Cauchy `e, nelle nostre intenzioni,
una sequenza di numeri razionali i cui valori si vanno
concentrando sempre di pi`
u. Questo significa due cose: primo, che questi numeri razionali si avvicinano
tra di loro man mano che lindice della successione
cresce, e secondo che tutti (almeno da un certo punto
in poi) rimangono tra di loro a una distanza limitata.
Purtroppo, queste due condizioni coinvolgono un numero infinito di elementi della successione: quelli che
vanno da un certo punto in poi, e questo `e difficile
da tenere sotto controllo con i nostri mezzi disgraziatamente finiti. Abbiamo gi`a trovato questa difficolt`a
quando abbiamo voluto esprimere il concetto che i
numeri naturali sono infiniti (v. Nota nella Sezione
1.4); abbiamo allora introdotto il criterio della scommessa, un metodo per parlare di infinito potenziale
che ci evita lintroduzione, surrettizia o meno, dellinfinito in atto. Intuitivamente, il restringersi e il
limitarsi dei valori della successione significa che la
distanza fra due elementi qualsiasi (purche abbastanza avanti nella sequenza) diviene sempre pi`
u piccola. Facciamo perci`o la seguente scommessa contro un
ipotetico avversario: la successione `e data e siamo
sicuri che essa `e di Cauchy; se il nostro avversario
sceglie un numero (chiamiamolo ), piccolo quanto
vuole, un millesimo, un milionesimo o anche un miliardesimo, noi siamo capaci di trovare una posizione
nella nostra successione (diciamo, m), tale che tutti
gli elementi successivi differiscono da am per meno di
. E chiaro che se ci riusciamo per valori piccoli di ,
a maggior ragione ci riusciamo per valori grandi. Pertanto, la specifica piccolo quanto si vuole non ha
funzione logica, ma solo psicologica e potrebbe essere
cancellata (labbiamo messa, almeno, tra parentesi!).
Facciamo un semplice esempio; si consideri la
successione:
2 2.1
2.131133

2.13

2.131

2.1311331

2.1311

2.13113

2.13113311

...

la cui legge di formazione dovrebbe essere chiara. Essa `e formata da numeri decimali finiti, cio`e da elementi di Q, e il criterio della scommessa funziona bene. Se

Nota 3.6

I primi elementi della successione possono essere scelti anche a caso e presentare ampie variazioni. Ci`
o vuol dire, semplicemente, che dobbiamo
spostare in avanti il nostro indice m che ci assicura
la vincita della scommessa. Limportante `e che, da
un certo momento in poi (cio`e dopo m), si verifichi e
si possa accertare la vicinanza di tutti gli an ad am .
Come si dice, vogliamo che la differenza |am an | sia
minore dell avversario definitivamente, cio`e per tutti
gli infiniti valori di n maggiori di m.
Vogliamo anche osservare che gli elementi della successione possono andare crescendo, come nellesempio
precedente, ma possono anche decrescere o oscillare:
lunica condizione essenziale `e che non si allontanino
pi`
u di da am . Naturalmente, il criterio della scommessa ha senso se possiamo dimostrare che esso vale
realmente. Per questo `e essenziale conoscere la regola
(o legge) di formazione della successione. In situazioni come quella dellesempio, ci si accorge, o si sa,
che la prima parte del numero rimane invariata e ad
ogni passo si aggiunge un decimale ulteriore. Questa `e la ben nota regola del valori per difetto di una
certa quantit`
a, e analoga `e la regola del valori per
eccesso. Pi`
u avanti vedremo di generalizzare queste
regole, ma il loro significato `e ben noto, e son proprio esse a permetterci di valutare un numero reale
(che per ora, ricordiamo, non abbiamo ancora definito
propriamente).

Un punto delicato `e il seguente. Si potrebbe pensare che se gli elementi di una successione si avvicinano sempre di pi`
u luno allaltro, allora la successione
sia sicuramente di Cauchy. In altre parole, pi`
u formalmente, si potrebbe sostituire al criterio di Cauchy la condizione che per ogni n > m si debba avere
|an+1 an | < , una condizione che potrebbe essere
pi`
u semplice da verificare. Purtroppo, questo non `e
vero, come si prova col semplice esempio che stiamo
per fare, e la condizione di Cauchy va espressa come labbiamo definita, senza ulteriori semplificazioni.
Lesempio concerne i numeri armonici, cio`e i numeri
definiti dalla relazione:
Hn = 1 +

1
1
1
+ + ... + ;
2
3
n

i primi elementi sono H1 = 1, H2 = 3/2, H3 = 11/6,


H4 = 25/12, e cos` via.; convenzionalmente, si pone
H0 = 0. Gli elementi della successione {Hk }kN si
avvicinano sempre di pi`
u, dal momento che Hn+1
Hn = 1/(n + 1), ma dimostriamo che essa cresce oltre
ogni limite:

3.5. LA COSTRUZIONE DEI NUMERI REALI


Teorema 3.19 Se H2k `e il 2k -esimo numero armonico, allora H2k > 1 + k/2 e quindi la successione dei
numeri armonici non `e limitata.

83

ad r, cos` che possiamo affermare che la successione definisce r; sfrutteremo tra poco questa propriet`a intuitiva. Prima di tutto, facciamo vedere che
esiste almeno un numero pseudoreale r con la proProva: Consideriamo ad esempio:
priet`a desiderata. Si consideri = 10(k+1) e sia am
lelemento della successione di Cauchy per il quale
1 1
1
1
1
1
1
+ + + + + +
H8 = H 23 = 1 +
|am an | < 10(k+1) , qualunque sia n > m. Que2
6 {z 7
8}
|{z}
|3 {z 4} |5
sto significa che an coincide con am per tutte le cifre
decimali (oltre ovviamente alla parte intera) fino ale sommiamo i 2k1 elementi compresi tra 1/(2k1 +1) la k-esima compresa. Definiamo, in questo modo, la
e 1/2k . Si tratta ovviamente di 2k1 termini, ognuno
parte intera e le prime k cifre di r. A questo punto si
dei quali `e maggiore di 1/2k . La loro somma `e pertanha |an r| < 10k e quindi il criterio della scommesto maggiore di 1/2, e quindi, oltre all1 iniziale, H2k
o applicare ogni volta che il nostro avversario
`e composto di k gruppi, ognuno dei quali vale almeno sa si pu`
abbia
posto
= 10k . Che poi tale r sia unico, di1/2. Da questo discende laffermazione del teorema.
scende dallosservazione che se r 6= r godesse delle
stesse propriet`a, dovrebbe esistere un indice k per il
I numeri armonici costituiscono una successione quale la k-esima cifra dopo il punto decimale relativa
importante e perci`
o avremo modo di incontrarli di ad r `
e diversa dalla k-esima cifra di r . Si ha allora
nuovo in queste note.
|r r | > 10(k+1) . Daltra parte, per definizione,
posto = 10(k+1) , esistono due indici m ed m per
i quali si ha |r an | < e |r an | < , qualunque
A questo punto, possiamo cercare di aiutare la no- sia n maggiore del pi`
u grande fra m ed m . Poiche
stra intuizione portando avanti, e distinguendo accu- il valore assoluto di una somma `e sempre minore o
ratamente, sia un discorso rigoroso sulla natura dei uguale alla somma dei valori assoluti, segue:
numeri reali, sia un discorso meno rigoroso, ma pi`
u
suggestivo, su come possiamo pensare a tali nume|r r | = |r an (r an )|
ri. Riprendiamo il concetto di numero pseudoreale
|r an | + |r an | < + < 10k .
introdotto nella precedente sezione. Come osservato
per = 2.131133 . . ., aggiungere una cifra decima- Questa disuguaglianza contraddice quanto avevamo
le alla volta ci permette di ottenere una successione trovato in precedenze, rivelando che lesistenza di due
di Cauchy che definisce il numero per difetto. Pos- valori distinti r ed r non `e possibile.
siamo immaginare altre successioni di Cauchy, come
A questo punto, possiamo essere ragionevolmente
la sequenza delle approssimazioni (decimali) per eccesso, e vedremo pi`
u avanti il caso del calcolo della convinti che ogni successione di Cauchy determina
radice quadrata col metodo di Newton e il calcolo un numero (pseudo)reale; come osservato, il viceverdi col metodo della media aritmetico/geometrica. sa `e ovvio e quindi lidentificazione dei due concetti
Comunque, i metodi di questo genere portano a par- si presenta del tutto naturale (almeno per un mateticolari successioni di Cauchy, quelle appunto in cui matico). Dobbiamo per`o superare un ultimo ostaco`e esplicitamente suggerito essere della forma 10m e lo: ogni successione di Cauchy determina un unico
u
gli elementi della successione aumentano di una o pi`
u pseudoreale, ma a questo possono corrispondere pi`
cifre decimali alla volta. Tanto vale, allora, definire successioni; ad esempio, una successione di valori per
le successioni di Cauchy in termini generali e rigorosi difetto e una per eccesso. Definiamo allora:
e usarle poi per la definizione dei numeri reali come
Definizione 3.5 Due
successioni
di
Cauchy
la vedremo tra breve.
{ak }kN e {bk }kN si dicono equivalenti se per ogni
Per sottolineare meglio il rapporto tra le succes razionale positivo, esiste un indice m tale che per
sioni di Cauchy e la pseudodefinizione precedente,
ogni n > m si abbia: |an bn | < .
insistiamo dimostrando il seguente:
Pseudoteorema: Per ogni successione di Cauchy
Si osservi prima di tutto che, a differenza di quanto
{ak }kN esiste uno ed un solo numero pseudoreale r abbiamo fatto nella prova del precedente pseudoteotale che, fissato un qualsiasi numero razionale po- rema, la differenza an bn `e fatta tra numeri razionali,
sitivo, esiste almeno un indice m tale che, qualunque e quindi ha perfettamente senso. La definizione `e insia lindice n > m, si ha che an differisce da r per tuitivamente chiara: due successioni sono equivalenti
meno di .
se si avvicinano sempre di pi`
u quando le confrontiamo
Prova: Si osservi che lo pseudoteorema `e un mo- termine a termine. Anche qui applichiamo strategido complicato di dire che gli elementi della successio- camente il criterio della scommessa: le due successione si accumulano definitivamente sempre pi`
u vicino ni si avvicinano se, fissato piccolo ad arbitrio dal

84

CAPITOLO 3. NUMERI

nostro avversario, riusciamo a stabilire che ogni differenza |an bn | `e definitivamente minore di tale .
Questo `e evidente, ad esempio, quando si considerano le approssimazioni per difetto e per eccesso di un
numero reale. Il punto importante `e, comunque, che
siamo di fronte a una relazione di equivalenza, come
il nome suggerisce:

poiche operazioni e confronto sono parte essenziale


della nostra idea intuitiva di numero. Cominciamo
con la somma: dati due numeri reali r ed s come
classi di equivalenza [{ak }kN ] e [{bk }kN ], la loro
somma `e definita come r + s = [{ak + bk }kN ]. Affinche questa definizione abbia senso, occorre dimostrare
tre cose:

la propriet`a riflessiva si riduce a |an an | = 0 <


, il che `e banale;

1. che la sequenza {ak + bk }kN `e una successione


di Cauchy, altrimenti saremmo fuori dellambito
dei numeri reali come li abbiamo appena definiti;

la propiet`a simmetrica `e anchessa ovvia poiche


|an bn | = |bn an | e se luno `e minore di , tale
`e anche laltro;
la propriet`a transitiva `e un po pi`
u complessa;
siano {ak }kN , {bk }kN e {ck }kN tre successioni tali che la prima sia equivalente alla seconda e
questa alla terza. Fissato , cerchiamo un indice
m per cui |an bn | < /2 (per ogni n > m) e
un indice m per cui |bn cn | < /2 (per ogni
n > m ). Se ora M `e il pi`
u grande fra m ed m ,
per ogni n > M si ha:
|an cn | = |an bn + bn cn |

2. che la definizione di somma `e indipendente dalle successioni scelte a rappresentare la classe,


altrimenti la somma non sarebbe compatibile
con la relazione dequivalenza e loperazione non
sarebbe pi`
u sotto controllo;
3. che se r ed s corrispondono a due numeri razionali r ed s allora la somma r + s come classe dequivalenza di successioni di Cauchy coincide con il numero razionale r + s ; questo permette di concludere che i numeri reali sono davvero unestensione dei numeri razionali che gi`a
conosciamo.

+ = ,
2 2
Fissato > 0 dal nostro avversario, siano m e p i
valori
per cui, rispettivamente, si ha |am an | < /2
e questo ci d`a lequivalenza tra la prima e la terza
per
ogni
n > m, e |bp bn | < /2 per ogni n > p.
successione.
Poniamo M al valore del pi`
u alto fra m e p, cos` che
Possiamo finalmente dare la vera definizione:
si ha:
|(aM + bM ) (an + bn )|
Definizione 3.6 Si dicono numeri reali le classi di
equivalenza delle successioni di Cauchy secondo la

|aM an | + |bM bn | < + = .


precedente relazione.
2 2
|an bn | + |bn cn | <

Intuitivamente, supponiamo che una successione


di Cauchy determini un numero pseudoreale r e che
unaltra successione, equivalente alla prima, determini un altro numero pseudoreale r . Per lequivalenza
delle successioni deve essere r = r e quindi tutte le
successioni di una classe determinano lo stesso numero pseudoreale. Astraendo, possiamo finalmente lasciar perdere i numeri psudoreali, che essendo pseudo ci sono ora di impaccio e basta, e consideriamo,
secondo la definizione, un numero reale come la classe di tutte le sequenze di Cauchy equivalenti tra di
loro. Se una persona riesce a superare lo shock de` una classe di
rivato dal fatto che un numero reale e
successioni di Cauchy, si rende conto che la definizione `e perfettamente corretta, formalmente accettabile
e semanticamente utile e ineccepibile.
Come abbiamo osservato fin dal principio, la definizione di numero reale non conclude il nostro lavoro:
occorre ora far vedere che anche le quattro operazioni
di base e il confronto sono compatibili con tale definizione ed estendono le analoghe operazioni sui razionali. In mancanza di questo, tutto verrebbe a cadere,

Per dimostrare che la somma `e indipendente dalle


particolari successioni {ak }kN e {bk }kN che abbiamo considerato, sia {ak }kN equivalente a {ak }kN ,
e {bk }kN equivalente a {bk }kN . Fissato un > 0
arbitrario, siano m ed m tali che |an an | < /2 per
ogni n > m, e |bn bn | < /2 per ogni n > m ; per
ogni n pi`
u grande del maggiore tra m ed m si ha
allora:
|an +bn (an +bn )| |an an |+|bn bn | <


+ =
2 2

che prova lequivalenza della somma delle diverse successioni. Infine, se r ed s sono razionali, esiste fra le
successioni della classe di equivalenza di r la successione costante i cui elementi sono tutti uguali ad r ,
il razionale che identifichiamo con il numero reale r.
La stessa cosa vale per s se anchesso `e razionale. Si
vede allora facilmente che la somma di r ed s come
numeri reali, data dalla successione costante r + s
viene ad essere identificata proprio con il numero razionale r + s . (Consigliamo di seguire almeno due
volte questo ragionamento).

85

3.5. LA COSTRUZIONE DEI NUMERI REALI


Esattamente nello stesso modo si procede per la
differenza. Per quanto riguarda il confronto, un ovvio risultato `e che dati due numeri reali r ed s per
mezzo di due successioni di Cauchy {ak }kN per r e
{bk }kN per s, essi sono uguali se e solo se definiscono la (o appartengono alla) stessa classe di equivalenza. Analogamente semplice `e osservare che r > s
oppure r < s se e solo se la successione delle differenze [{ak bk }kN ] `e definitivamente composta di
elementi positivi oppure `e definitivamente composta
di elementi negativi.
La moltiplicazione richiede un ragionamento pi`
u
delicato. Siano r ed s due numeri reali definiti come sopra e si consideri il prodotto definito da rs =
[{ak bk }kN ]. Per la limitatezza delle due successioni
di Cauchy prese a rappresentare r ed s, esistono due
numeri razionali, chiamiamoli a e b, che sono maggiori (in valore assoluto) rispettivamente di tutti gli elementi di {ak }kN e di tutti gli elementi di {bk }kN .
Fissato positivo (ma comunque piccolo) sia m lindice corrispondente alla relazione |am an | < /(2b)
(per ogni n > m) e p lindice per cui |bp bn | < /(2a)
(per ogni n > p). Sia ora M il pi`
u grande fra m e p;
per ogni n > M si ha allora:
|aM bM an bn | = |aM bM an bM + an bM an bn | =
= |(aM an )bM + an (bM bn )|
|aM an | |bM | + |an | |bM bn | <

b+a
= .
2b
2a

Questo dimostra che la successione che definisce il


prodotto di r per s `e una successione di Cauchy, quindi non rimane che provare come la definizione sia indipendente dalle due successioni scelte. A questo punto il lettore dovrebbe aver capito come si procede in
modo formale e quindi ci rifiutiamo di procedere oltre
con sviluppi in buona parte scontati. Lo stesso lettore, invece, `e vivamente consigliato di riprendere foglio
e matita (se per caso li avesse riposti: male, male!) e
impegnarsi a portare avanti tutti i passaggi necessari. Se poi r ed s sono razionali, la compatibilit`a dei
risultati `e di nuovo ovvia.
Per quanto riguarda la divisione, conviene prima
definire loperazione per il calcolo dellinverso, cio`e
s1 = 1/s, e quindi osservare che r/s = rs1 . Anche
per linverso dobbiamo dimostrare tutti e tre le condizioni viste per la somma. Se il numero reale s 6= 0
`e definito dalla classe [{ak }kN ], dobbiamo supporre (senza per questo venir meno alla generalit`a dei
nostri ragionamenti) che tutti gli elementi della successione siano diversi da 0; ha allora senso definire la
successione {1/ak }kN e assumerne la classe di equivalenza come il numero reale s1 . Ci limiteremo ora
a dimostrare la prima condizione, e cio`e che la nuova
successione non esce dallambito delle successioni di

Cauchy; lasciamo poi che il lettore si cimenti a dimostrare che la definizione `e indipendente dalla successione scelta e che essa `e compatibile con loperazione
di inverso nei numeri razionali.
Sia a 6= 0 un numero razionale maggiore, in valore
assoluto, a tutti i numeri della successione {ak }kN ;
tale numero esiste per la limitatezza della successione.
Fissato > 0 a piacere, determiniamo un indice m
per il quale |am an | < a2 per tutti gli n > m; si ha
allora:

1
1 am an |am an |
a2

<
=
am
an am an
a2
a2

e questo conclude il nostro lavoro.


Le successioni di Cauchy, come abbiamo appena
visto, costituiscono un metodo, astratto ma effettivo, di definire i numeri reali. Il nostro insistere sulle
approssimazioni per difetto e per eccesso non riveste
un aspetto casuale: spesso, la determinazione di un
numero reale eseguita valutando un numero sempre
maggiore di cifre decimali (anche una alla volta) pu`o
essere una procedura effettiva ed anche efficiente. Altre volte, il numero `e isolato valutando un intervallo di numeri razionali che lo contiene, e ad ogni passo lintervallo viene dimezzato: si hanno cos` ancora
approssimazioni per difetto e per eccesso, ma invece
di determinare una cifra decimale, si determina una
cifra binaria dopo laltra; in definitiva, non c`e poi
una grande differenza. Come abbiamo detto, accanto
a questi metodi ne esistono altri che permettono di
valutare pi`
u cifre alla volta: capito il procedimento,
in linea di principio tutti i metodi vanno bene, ma si
possono avere comportamenti molto diversi dal punto
di vista dellefficienza del calcolo.
Lidea di poter identificare linsieme dei numeri reali R con la retta della Geometria, ha portato alleseguenti considerazioni. Si torni per un attimo a 2,
che non `e razionale per il Teorema 3.18. Possiamo
allora dividere linsieme Q in due parti disgiunte:
+
2
Q< = Q
0 {q Q | q < 2}

Q> = {q Q+ | q 2 > 2}.


Chiaramente, Q< Q> = Q e Q< Q> = ; daltra
parte, per il citato teorema, Q< non ha alcun elemento massimo e Q> non ha alcun elemento minimo.
Questo ricorda un po la propriet`a degli interi di essere discreti, anche se il buco fra Q< e Q> `e per
cos dire infinitesimo, e non vasto come quello tra 5
e 6. Nella retta R della Geometria tali buchi proprio
non esistono e quindi, se vogliamo che R possa essere
identificato con R, dobbiamo escludere che si verifichi
un fenomeno come quello dei razionali.
Per essere pi`
u specifici, definiamo sezione di Q ogni
coppia (Q1 , Q2 ) tale che: i. (q1 Q1 ) e (q2 Q2 )

86

CAPITOLO 3. NUMERI

si abbia q1 < q2 ; ii. Q1 Q2 = Q; iii. Q1 Q2 = .


Come abbiamo accennato allinizio di questa sezione,
il metodo di Dedekind definisce i numeri reali come
sezioni dellinsieme dei numeri razionali; in particolare, una sezione (Q1 , Q2 ) di Q corrisponde a un numero razionale se Q1 ha elemento massimo (oppure se
Q2 ha elemento minimo, ma convenzionalmente questo caso non si considera). Di conseguenza, i numeri
irrazionali corrispondono alle sezioni di Q in cui Q1
non ha massimo e Q2 non ha minimo. Se ora, in modo analogo a quanto fatto per Q, definiamo le sezioni
in R, questultimo caso non si deve verificare, per non
creare quella sorta di buco che si diceva, e ci`o si pone
come assioma:
Assioma (di continuit`
a) Sia (R1 , R2 ) una sezione di R. Allora R1 ha un elemento massimo oppure
R2 ha un elemento
minimo.

2
Nel caso di 2, definendo
R1 = R {x R | x
2}, allora R1 possiede 2 come elemento massimo,
mentre definendo R1 = R {x R | x2 < 2} si
fa s` che R2 venga a contenere lelemento massimo

2. Lassioma afferma che non vi possono essere altri

modi per dividere R nel punto corrispondente a 2.


Questo concetto di continuit`a ha un ruolo molto
importante nel concetto di limite, e lo ritroveremo
appunto quando affronteremo tale argomento nella
Sezione 8.4. Ad esso `e legato il concetto di intervallo:
Definizione 3.7 Si dice intervallo di estremi a, b
R linsieme di tutti i numeri reali x tali che a x
b. Propriamente, questo si dice un intervallo chiuso,
in quanto comprende i suoi estremi, e si indica con
la notazione [a, b]. Si dice invece intervallo aperto
linsieme dei numeri reali x tali che a < x < b, che
non comprende perci`
o gli estremi a e b; tale intervallo
si indica con (a, b). Si usano anche intervalli misti
come [a, b), chiuso a sinistra e aperto a destra, e (a, b]
aperto a sinistra e chiuso a destra.

3.6

Potenze, radici, logaritmi

I numeri reali sono lambiente ideale per parlare di


potenze e, quindi, delle loro operazioni inverse, le radici e i logaritmi. Abbiamo gi`a introdotto queste operazioni per i numeri naturali, e come questi si sono
estesi agli interi, ai razionali e ai reali, cos` lo stesso
tipo di estensione deve essere fatta per le potenze. Intanto, la base di partenza rimane la stessa e se r R,
n N, si definisce:
0
r =1
rn+1 = r rn .

se q `e un numero razionale, q = n/m, cosa vuol dire


rq = rn/m ? E se infine s `e un numero reale, ha senso
una potenza come rs , e, se ha senso, qual `e il suo
valore?
Cominciamo con i numeri interi, dei quali ci interessano i negativi, visto che i positivi coincidono
con i naturali e le potenze con tali esponenti sono
state definite un attimo fa. Per i numeri reali vale
la stessa regola vista per i naturali: rm+n = rm rn ;
la dimostrazione `e esattamente la stessa. Naturalmente, se estendiamo le potenze agli esponenti negativi, vogliamo che questa regola continui a valere, altrimenti dovremmo considerare propriet`a diverse per due operazioni che, invece, vorremmo vedere
come una sola. Pertanto vogliamo che sia: rm rm =
rm+(m) = r0 = 1; ma questo significa che rm `e
linverso di rm , cio`e, in termini di numeri reali, deve
essere rm = 1/rm . Questa `e una buona definizione
e conferma cose che gi`a ci sono note: abbiamo visto
che per i numeri naturali abbiamo k mn = k m /k n se
m n; interpretando k come numero reale, questo
significa k mn = k m (1/k n ), proprio la regola appena
vista, anche se limitata a k N ed m n. Questo `e
molto confortante.
Visto il successo con i numeri negativi, poniamoci
il problema di definire cosa significa rm/n , cominciando col supporre m, n > 0. Anche qui ricordiamo che
per i numeri naturali vale la regola (k m )n = k mn ,
che naturalmente vogliamo conservare. Dovr`a essere allora (rm/n )n = rnm/n = rm , e in particolare
(r1/n )n = r1 = r. Questa condizione ci fa venire in
mente come, per definizione, il numero che elevato
alla potenza n-esima ci d`a r `e ci`o che si chiama laradice n-esima di r: ma allora deve essere r1/n = n r.
Per i numeri naturali eravamo condizionati dal fatto che r doveva essere una potenza n-esima perfetta.
Qui, tra i numeri reali, questa condizione non `e pi`
u
necessaria e ogni numero reale positivo pu`o essere visto come potenza n-esima perfetta, come vedremo ora
con un esempio. E bene osservare esplicitamente che
la cosa non `e vera per i numeri reali negativi; 4 non
pu`o essere un quadrato perfetto, poiche il quadrato
di un numero reale `e sempre una quantit`a positiva.
Allora vediamo che 2, come numero reale, `e un cubo
perfetto, cio`e `e il cubo di un qualche numero reale.

Applichiamo quanto detto nella sezione precedente:


si comincia
con losservare che 13 < 2 < 23 e quindi

3
1 < 2 < 2, il che ci d`a una prima
approssimazione

per difetto e per eccesso di 3 2. Possiamo migliorare lapprossimazione provando successivamente per
1.1, 1.2, 1.3, . . . ; si trova facilmente anche a mano
1.13 = 1.331, 1.23 = 1.728, 1.33 = 2.197. Qui
ci posMa se lesponente non `e un numero naturale, ci chie- siamo arrestare e abbiamo trovato 1.2 < 3 2 < 1.3.
diamo, possiamo dare un significato alla potenza? Ad Cerchiamo di migliorare ancora trovando lapprossiesempio, se k < 0 `e un intero, cosa significa rk ? E mazione a meno di un centesimo; osservando dai de-

87

3.6. POTENZE, RADICI, LOGARITMI

u vicina a 1.3 che a 1.2, proviamo


cimali che 3 2 `e pi`
a partire da 1.25, 1.26, . . . . Anche questa volta si
3
3
ha subito
1.25 = 1.953125, 1.26 = 2.000376, per cui
1.25 < 3 2 < 1.26. Come si vede dal cubo, 1.26 `e
unapprossimazione gi`a molto
buona e infatti con un
qualsiasi calcolatore si trova 3 2 1.2599210498, cio`e
lerrore che si commette ponendo 3 2 = 1.26 `e minore
di un decimillesimo.
A questo punto possiamo definire ogni potenza che
ha come esponente un numero razionale
n/m; si ha
n
n/m
1/m n
m
infatti:
r
=
(r
)
=
(
r)
=
(rn )1/m =

m
rn . Poiche m `e un intero positivo ed n `e un intero qualsiasi, entrambe le operazioni di elevamento a potenza e di radice sono ben definite. Osserviamopesplicitamente che se n `e negativo, si ha:
rn/m = m 1/r|n| .
Lultimo passo consiste nel definire rs quando s sia
un numero reale qualsiasi, cio`e, in pratica, sia un numero irrazionale. Intanto, se s `e negativo, per essere
coerenti con quanto affermato fin ora, dobbiamo porre: rs = 1/r|s| . Supponiamo allora che s sia positivo e consideriamo due successioni {si }iN e {si }iN
di numeri razionali (la prima crescente e la seconda decrescente) che determinano s, cio`e lo approssimano per difetto e per eccesso. Sappiamo calcolare

rsi e rsi e quindi possiamo ottenere approssimazioni per difetto e per eccesso di rs , la cui differenza

rsi rsi = rsi (1 rsi si ) diviene piccola quanto si


vuole al crescere di i: infatti, per ipotesi, la differen

za si si tende a diventare 0 e quindi rsi si tende


a diventare 1. In questa maniera, rs risulta definito
come numero reale.
Calcoliamo, come esempio, ; come prima approssimazione abbiamo 3 < < 4 e questi numeri li
sappiamo calcolare. Poi abbiamo 3.1 < < 3.2 e
possiamo calcolare anche queste limitazioni in quanto
3.1 e 3.2 sono numeri razionali: qui non ci dobbiamo
preoccupare della difficolt`a di tali calcoli; quello che
ci interessa `e laspetto teorico dellapprossimazione e
non il tempo impiegato ad ottenerla; questo fa parte
della complessit`a degli algoritmi e, tradizionalmente,
si chiama stenaritmia. Come gi`a detto, andando
avanti calcoleremo 3.14 < < 3.15 , e cos` via,
restringendo sempre di pi`
u lintervallo che comprende . Nella Tabella 3.2 riportiamo i primi passi,
ricordando che si ha 36.4621596072.
Le propriet`a formali delle potenze, pur cos` estese, rimangono quelle gi`a viste per i numeri naturali,
senza pi`
u il vincolo delle potenze perfette:
rs rt
(rs )t
r0
r1
0s

=
=
=
=
=

rs+t
rst
1
r
0

ma

rs /rt
rs v s
1s
1
r
00

=
=
=
=
=

rst
(rv)s
1
1/r
1

Qui, ricordiamo, le basi r e v sono numeri reali po-

sitivi, mentre gli esponenti s e t sono numeri reali


qualsiasi, anche negativi. Abbiamo
avuto modo di

osservare come (3)1/2 = 3 non ha significato


dal momento che nessun numero elevato al quadrato pu`o dare un numero negativo come 3. Quindi,
in generale, non possiamo prendere in considerazione potenze reali di numeri negativi. Questo naturalmente non vuol dire che, in casi particolari, non
abbiano senso anche tali potenze. Infatti, mentre r2k
(k N) `e sempre positivo, r2k+1 ha lo stesso segno di r e quindi sono definite
le radici dispari di
numeri negativi. Ad esempio, 3
8 = 2, in quanto
= 3; ma, in
(2)3 = (2)(2)(2) = 8, e 5 243

4
16
(attenzione!
modo altrettanto
ovvio,
non
esiste

scrivere 4 16 = 4 `e uno strafalcione che `e opportuno evitare per scansare sacrosante rappresaglie da
parte del docente).

Dalla precedente definizione r1/m = m r, siha


unovvia estensione a tutti i numeri reali: r1/s = s r,
che definisce completamente il concetto di radice
come operazione inversa dellelevamento a potenza,
quando questa regola si legga da destra verso sinistra. Si hanno allora le seguenti propriet`a, conseguenza diretta della definizione e delle propriet`a delle
potenze:

st
s
r t r = r1/s r1/t = r(s+t)/st =
rs+t
p

t s
s
s
s
ts
r
r v =
rv
r =

s
s
1 = 1
0 = 0 (s 6= 0).
La radice che si trova pi`
u di frequente `e naturalmente la radice quadrata e per questo si sono
sviluppati algoritmi che permettono il calcolo di r in modo diretto e senza incorrere nelle lungaggini di trovare
per tentativi un
decimale dopo laltro, come si `e fatto
per calcolare 3 2. Lalgoritmo che viene insegnato `e
laborioso, ma effettivo:
Algoritmo 3.6 (La radice quadrata)
Ingresso: un numero reale s = dr dr1 . . . d1 d0 .c1 c2 . . .
e un numero naturale k;

Uscita: la rappresentazione decimale di s con k


cifre decimali;
1. a partire dal punto decimale, si divide la parte
intera di s in blocchi di due cifre; la parte decimale `e anchessa divisa in k blocchi, utilizzando 2k cifre decimali, aggiungendo eventualmente
alcuni 0 per raggiungere tale numero;
2. sia a il valore del primo blocco a sinistra, cio`e
a = dr oppure a = dr dr1 ; si pone come prima
cifra del risultato, fr/2 , la massima cifra f tale
che f 2 a;
3. sia la differenza a f 2 ;
4. per ogni ulteriore blocco in cui sia stato suddiviso
s:

88

CAPITOLO 3. NUMERI

3
3.1
3.14
3.141
3.1415
3.14159

31.00628
34.76679
36.39574
36.43743
36.45829
36.46204

<
<
<
<
<
<

<
<
<
<
<
<

97.40909
38.98339
36.81477
36.47916
36.46246
36.46246

4
3.2
3.15
3.142
3.1416
3.14160

Tabella 3.2: Calcolo di


(a) si considerano le cifre della radice x0 = 1:

fr/2 fr/21 . . . fj finora ottenute e si


2
3
1
chiama a il doppio del numero da esse
1+
= = 1.5
x1 =
2
1
2

rappresentato;
1 3
17
2
x
=
=
+
= 1.41666
2
(b) si abbassa il blocco corrente, nel senso che
2 2 3/2
12
a si aggiungono le due cifre del blocco
2
577
1 17
+
=
= 1.4142156
x3 =
considerato: := 100 + 10 d + d1 ;
2 12 17/12
408
(c) si cerca la massima cifra f tale che (10 Come si vede, gi`a dopo 3 iterazioni il valore ottenuto
a + f ) f ; tale cifra si aggiunge come `e abbastanza buono; la quarta iterazione d`a 12 cifre
cifra ulteriore del risultato;
decimali esatte, e cos` via. Naturalmente, ci accor(d) se ci sono altri blocchi da elaborare, si cicla giamo che il valore ottenuto `e buono quando la differenza dal valore ottenuto alliterazione precedente `e
tornando al punto 4a);
trascurabile.
5. si mette il punto decimale dopo la r/2-esima cifra
Il lettore `e fortemente invitato a formulare lalgoritdel risultato, e si esce.
mo che realizza questo metodo e a scrivere e provare
un programma sullelaboratore. Il metodo pu`o essere
Limpostazione delloperazione
`e quella della Figu- adottato anche al calcolo delle altre radici, ma per

ra 3.1, dove si cerca 200 con 3 cifre decimali. Lal- questo rimandiamo allesposizione generale del megoritmo risale a Fibonacci, ma il metodo pi`
u semplice todo di Newton come si trova nei testi di Calcolo
3
ed interessante per trovare la radice quadrata di un Numerico. Invitiamo per`o il lettore a calcolare
2
numero risale ai Babilonesi, anche se oggi `e di soli- mediante la formula iterativa:
to citato come metodo diNewton. Sia r un numero

1
r
reale e si voglia calcolare r; se x0 `e unapprossimaxn+1 =
2xn + 2
3
xn
zione di tale radice, `e immediato dimostrare questa
propriet`a:
dove r = 2 e x0 = 1.
Naturalmente, una espressione aritmetica pu`o conTeorema 3.20 Sia r un numero
reale positivo

e sia tenere una o pi`


u radici; se queste si trovano a denox0 unapprossimazione
di r. Se x0 < r allora

minatore
di
una
frazione, `e preferibile eliminarle con
r/x0 > r, mentre se x0 > r allora r/x0 < r.
una tecnica che `e detta
di razionalizzazione. Si consi
Prova: Si consideri il caso x0 < r; se fosse anche deri ad esempio 1/ 3, che risulta di difficile calcolo;

se moltiplichiamo numeratore e denominatore per 3


r/x0 < r, moltiplicando
membro a membro, avremmo: x0 r/x0 < r r, cio`e r < r, il che `e assurdo. si ottiene:

Analogamente si procede nellaltro caso.


3
1.732
1 3
1
= =

0.577,
Stando
3
3
3
3 3
cos` le cose, qualunque sia lapprossimazione
x0 di r, se eseguiamo la media: x1 = (x0 + r/x
0 )/2, una forma molto pi`
u ragionevole. Se a denominatore
questa sar`a unapprossimazione migliore a r di
c`e una somma o una differenza di radicali quadratici
quanto non lo fosse x0 . Possiamo ora applicare iteraconviene procedere in questo modo:
tivamente il metodo ad x1 e ottenere unapprossima

zione ancora migliore, e cos` di seguito. Il merito di


2
2( 6 + 2)

=

=
Newton `e stato quello di dimostrare che questo algo6 2
( 6 + 2)( 6 2)
ritmo trova
velocemente approssimazioni molto accu

rate
6+ 2
2( 6 + 2)
di r. Vediamo infatti come si possa determina=
.
=
re 2 1.414213562 partendo dallapprossimazione
62
2

89

3.6. POTENZE, RADICI, LOGARITMI

2
1
1

0 0.
0
9

0
6
4
2
1
1

0 0

0
8
1
1

0
1
9
2
6
5

0 0

0
9
0
6
3

0
6
4
5
8

0 0

1
2
2
2
2

4
4
8
8
8

. 1 4 2
4 = 9 6
1 1 = 2 8
2 4 4 = 1
2 8 2 2 =

1
1
5

2 9 6
6 5 6

0 0
6 4
3 6

Figura 3.1: La radice quadrata


Lasciamo al lettore, come esercizio, la razionalizzazione di:
1
,
3+ 2

1
1

,
,
3
5 3+ 2
5

3
25 + 3 10 + 3 4
1
=

.
3
3
5 32

Ma questa espressione `e proprio il quadrato del membro sinistro. Poiche le due quantit`a sono entrambe
positive, luguaglianza `e verificata.

Questa formula `e particolarmente interessante


quando a2 b `e un quadrato perfetto; in tal caso,
infatti, le radici quadrate interne scompaiono e il radicale doppio di sinistra si trasforma nella somma (o
nella differenza) di due radicali semplici. Lesempio
Non `e raro incontrare espressioni che richiedono il
precedente `e significativo:p
poiche 62 20 = 16 = 42 ,
p
calcolo di radici p
di altre espressioni composte da radi

la formula del teorema d`a 6 20 = (6 + 4)/2

ci; ad esempio, 6 20 = 1.2360679777 . . .. Se si p


(6 4)/2 = 5 1, il che dimostra che la coinconsidera la quantit`a 5 1, molto pi`
u semplice (sia
cidenza
dei decimali non `e limitata alle sole prime
da portarsi dietro sia da calcolare), si pu`o osservacifre.
re che anchessa vale 1.2360679777 . . . e ci chiediamo
se le due espressioni sono davvero uguali o se sono
Nota 3.7
Verificare che due numeri reali hanno
soltanto molto simili, ma, proseguendo col calcolo di
alcune
cifre
iniziali
uguali, non significa e non prova
altri decimali, si trovi poi una discrepanza. E questo
che
i
due
numeri
siano
uguali. Per far ci`
o occorre una
il problema dei cosiddetti radicali doppi, argomento
vera dimostrazione, come quella derivante dal teoremolto bello e molto amato dal mitico matematico inma precedente. Un semplice esempio
contrario `e dato

diano Srinavasa Ramanujan. Per i radicali quadratici


dalla falsa uguaglianza = 2 + 3; se ci si limita
vale il seguente risultato:
alle prime due cifre decimali si ha: 1.41 + 1.73 = 3.14,
p

ma gi`
a la terza cifra `e diversa. La frazione 355/113
Teorema 3.21 Sia data lespressione a b con
vale 3.14159292 e le prime sette cifre coincidonocon
2
a, b > 0; se a > b allora vale lidentit`
a:
quelle di . Ancora pi`
u eclatante `e il caso di 2 e
della frazione 665857/470832, frazione che il lettore
s
s

q
industrioso avr`
a gi`

a + a2 b
a a2 b
a incontrato applicando il Teorema
a b=

.
a per entrambi il
3.20 al calcolo di 2. Il calcolatore d`
2
2
Prova:
Si osservi prima di tutto che a >

a2 b. Se eleviamo al quadrato il secondo membro


delluguaglianza nellenunciato, si ottiene:

a + a2 b a a2 b
+

2
2
s

a + a2 b a a2 b
=
2
2
2
r

a2 (a2 b)
= a b.
=a2
4

valore 1.41421356237, ma naturalmente, nonostante


questa identit`
a, i due numeri
non possono coincidere,

poiche come sappiamo 2 non `e un numero razionale.

Come abbiamo avuto gi`a modo di osservare, lelevamento a potenza ab = c ha due operazioni inverse:
se si conoscono c e b, per ricavare a si esegue lestrazione di radice, che abbiamo visto essere una semplice estensione dellelevamento a potenza. Possiamo per`o anche conoscere a e c e cercare lesponente
b: questa operazione si chiama calcolo del logaritmo. Quindi, per definizione, il logaritmo in base a

90

CAPITOLO 3. NUMERI

di c `e lesponente b al quale occorre elevare a per ottenere c; questa quantit`a si scrive: b = loga c. Se
sappiamo fare le potenze, possiamo trovare qualsiasi logaritmo applicando il metodo delle approssimazioni successive. Ad esempio, calcoliamo il log2 10;
poiche 23 < 10 < 24 , si ha 3 < log2 10 < 4. Dal
momento che 23 `e pi`
u vicino a 10 di quanto non
lo sia 24 , partiamo da 3.1 e calcoliamo le varie potenze: 23.1 = 8.574, 23.2 = 9.189, 23.3 = 9.849,
23.4 = 10.556, e quindi 3.3 < log2 10 < 3.4. Ancora, 23.3 `e pi`
u vicino a 10 di 23.4 , e cos` abbiamo:
3.31
2
= 9.917, 23.32 = 9.986, 23.33 = 10.056, per cui
3.32 < log2 10 < 3.33. Cos` procedendo si pu`o trovare
il valore approssimato log2 10 3.32192809.
Le regole fondamentali dei logaritmi sono le
seguenti:
loga (rv)
loga (r/v)
loga (rs )
loga s r
loga a
loga 1

=
=
=
=
=
=

loga r + loga v
loga r loga v
s loga r
1
s loga r
1
0

Inoltre, `e importante la seguente propriet`a che permette di cambiare la base di un logaritmo, operazione
abbastanza frequente:
Teorema 3.22 Vale la seguente identit`
a:
loga b = 1/ logb a.
Prova: Sia x = loga b; per definizione `e b = ax e se
si prende il logaritmo in base b dei due membri si ha:
logb b = logb ax = x logb a. Ma logb b = 1 e se diamo
ad x il suo valore si ha: 1 = (loga b)(logb a), da cui
deriva immediatamente la formula desiderata.
Ad esempio, si calcola: log10 2 = 1/ log2 10 =
1/3.32192809 . . . = 0.301029995 . . ..
Lutilit`a dei logaritmi `e legata alle loro propriet`a:
le moltiplicazioni sono ridotte ad addizioni, le divisioni a sottrazioni, le potenze a moltiplicazioni e le
radici a divisioni. Oggi, con luso intensivo dei calcolatori elettronici di ogni dimensione, non ci rendiamo
conto delle difficolt`a pratiche dei calcoli. Molti studenti, oggi, non conoscono neppure le tabelline (cio`e
la Tavola Pitagorica) e non sanno eseguire le divisioni. Se vogliamo estrarre la radice quinta di 1639,
il calcolatore ci d`a immediatamente 4.39456397, ma
nel 1600 o nel 1800, applicando i metodi che abbiamo visto, sarebbe occorsa una giornata di duro lavoro
per arrivare ad ottenere cinque o sei decimali. I logaritmi permettono di risolvere il problema in pochi
minuti. Su una
tavola si trova log10 1639 = 3.21458
e quindi log10 5 1639 = 3.21458/5 = 0.64292 e, ancora dalla tavola, si ricava: 100.64292 = 4.3946, il che `e
sufficiente per la maggior parte delle applicazioni. In

questo esempio abbiamo immaginato di usare tavole


dei logaritmi in base 10 con 5 cifre decimali; in effetti
queste erano le tavole di uso pi`
u comune, ma ne sono
esistite anche con 15 o 20 decimali.
I logaritmi furono inventati dal matematico scozzese John Napier (Giovanni Nepero era il suo nome latinizzato) verso la fine del 1500 e le sue tabelle a 14 decimali, con relativo manuale duso, furono pubblicate nel 1614, dopo 20 anni di laboriosi
calcoli (si veda anche il Capitolo 8). I logaritmi di
Napier erano, grosso modo, ci`o che oggi chiamiamo
logaritmi naturali, cio`e i logaritmi nella particolare
base e = 2.7182818284 . . ., sul cui significato avremo
molto da dire pi`
u avanti. Immediatamente, lopera di
Napier venne apprezzata, utilizzata e imitata. Henry
Briggs, dopo aver discusso con Napier nel 1615, introdusse i logaritmi decimali (cio`e in base 10), che da
allora divennero quelli pi`
u popolari ed utilizzati nella
pratica. Fino allintroduzione dei calcolatori elettronici da tasca verso il 1970, i logaritmi decimali sono
rimasti lo strumento pi`
u largamente usato nei calcoli
di precisione, battuto per i calcoli approssimati solo
dal regolo calcolatore, uno strumento meccanico derivato proprio dai logaritmi. In effetti, una tavola di
logaritmi era maneggevole e alla portata economica
di tutti; gi`a il regolo calcolatore, come strumento di
calcolo, era pi`
u costoso e, come s`e detto, meno preciso, per cui era usato solo per calcoli veloci, come
il puntamento delle armi o la misurazione dei terreni
sul posto. Meno maneggevoli e molto pi`
u care erano
le macchine calcolatrici meccaniche: inventate da Pascal verso il 1640, estese alla moltiplicazione da Leibniz, erano pesanti e ingombranti, e quindi adatte solo
ai conti che potevano esser fatti in un ufficio o in uno
studio. Per questo, molti altri strumenti di calcolo
furono proposti, come il gi`a citato celebre compasso, inventato e commercializzato da Galileo intorno
al 1600.

3.7

Espressioni e proporzioni

La rappresentazione di un conto, come 3 + 5 oppure


14 (424 35/5), si suol chiamare una espressione
aritmetica. Lordine di esecuzione delle operazioni `e
regolato da alcune norme convenzionali:
1. le operazioni si eseguono da sinistra verso destra,
ma moltiplicazione e divisione hanno la precedenza su somma e sottrazione. Quindi 5 2 + 1
vale 4, ma 522 vale 1 poiche il prodotto 22
si esegue prima della sottrazione;
2. le parentesi possono essere usate per modificare
questo ordine. Pertanto (52)2 d`a come valore
6, poiche la sottrazione viene eseguita prima del
prodotto.

3.7. ESPRESSIONI E PROPORZIONI


Operando in questa maniera, il risultato di unespressione aritmetica `e determinato univocamente e due
persone (o anche una persona e un elaboratore elettronico) devono ottenere lo stesso valore se partono
con la medesima espressione. Alla Scuola Media si
insegna ad usare vari tipi di parentesi: le parentesi
tonde sono quelle a pi`
u basso livello; per raggruppare espressioni che gi`a contengono parentesi tonde si
usano le parentesi quadre; e infine, a livello pi`
u alto
si usano le parentesi graffe. In realt`a, nella pratica,
si tende ad usare solamente le parentesi tonde, eventualmente di dimensione crescente man mano che si
sale di livello. E molto raro lutilizzo di parentesi
quadre e graffe allinterno delle espressioni aritmetiche: a queste parentesi viene di solito dato un significato diverso e che non ha niente a che fare con
il raggruppamento dei termini in unespressione aritmetica. Abbiamo gi`a incontrato le notazioni {a, b, c}
e {x N | x2 < 200}, che usano le parentesi graffe
per denotare un insieme, sia che lo si voglia definire per estensione o per intensione. C`e stata anche
loccasione di introdurre le parentesi quadre nella notazione delle liste, ed esistono altri usi pi`
u specifici di
queste parentesi. Pertanto, eviteremo di mescolare
le parentesi dando loro lo stesso significato e, per le
espressioni aritmetiche, useremo soltanto le parentesi
tonde.
A voler essere precisi (e in Matematica questo `e
proprio il caso) non tutte le espressioni aritmetiche
danno un risultato numerico; ad esempio 4/(5 5)
diviene 4/0 e questa `e unoperazione che non ha risultato. Infatti, 4/0 starebbe a indicare quel numero
che moltiplicato per 0 d`a 4, ma nessun numero gode
di questa propriet`a. Poiche nei vari insiemi numerici
che abbiamo visto la divisione per 0 `e sempre vietata
per gli stessi motivi, dobbiamo vietarla in generale
nelle espressioni aritmetiche e considerare valide solo
quelle che, al termine della computazione, ci danno
un valore numerico. Definiamo allora una relazione di
equivalenza tra espressioni: due espressioni aritmetiche A e B sono equivalenti se e solo se sono entrambe
valide e danno lo stesso valore numerico come risultato. Il termine equivalente `e giustificato dal fatto
che tale relazione risulta veramente essere una relazione di equivalenza, e al lettore baster`a un momento
di riflessione per rendersi conto della validit`a delle tre
propriet`a riflessiva, simmetrica e transitiva. Pu`o, al
solito, essere un buon esercizio verificare formalmente queste propriet`a, ma lasciamo la cosa alla buona
volont`a e allinteresse del lettore. Per indicare che
due espressioni aritmetiche A e B sono equivalenti si
scrive A = B che si legge A uguale a B; la relazione
di equivalenza si dice propriamente uguaglianza e ci
si riferisce ad A e a B come al membro sinistro e al
membro destro delluguaglianza.

91
Questa relazione di equivalenza pu`o essere arricchita da altre propriet`a che risulteranno molto
importanti:
Teorema 3.23 Siano A e B due espressioni aritmetiche valide ed equivalenti fra di loro, e sia C
una terza espressione aritmetica valida; si ha allora A + C = B + C, A C = B C e A C = B C.
Infine, se il valore dellespressione C `e diverso da 0,
si ha anche A/C = B/C.
Prova: Se A e B hanno lo stesso valore numerico,
diciamo n, e C ha valore numerico m, allora A + B
ha valore numerico n + m come lo ha B + C. La
stessa osservazione vale anche negli altri casi; per la
divisione, se C ha valore 0, dividendo A o B per C si
hanno espressioni non valide.
Una semplice osservazione notazionale `e la seguente: se le espressioni contengono pi`
u di un numero, `e
bene scrivere A (C), (A) (C) e (A)/(C), usando opportunamente le parentesi per assicurarsi che le
operazioni vengano eseguite nellordine giusto. E bene anche osservare che somma e sottrazione agiscono
in modo simmetrico: nel caso che A e B siano espressioni equivalenti, se prima si somma e poi si sottrae C
(o viceversa), si torna a due espressioni equivalenti.
Lo stesso succede per moltiplicazione e divisione, se
C non vale 0. Se invece C vale 0, non solo `e vero che
da A = B si ricava A C = B C, ma questa uguaglianza si ottiene anche quando fosse A 6= B, cio`e A
e B non fossero equivalente: infatti, il valore comune
delle due espressioni ottenute sarebbe comunque 0.
Naturalmente, a questo punto non si pu`o pi`
u tornare
indietro dividendo per C. Questo, se si vuole, `e un
altro argomento per spiegare la necessit`a di evitare
moltiplicazione e divisioni per 0.
Il teorema precedente pu`o essere esteso nel modo
seguente:
Teorema 3.24 Siano A, B, C, D quattro espressioni
aritmetiche valide tali che A = B e C = D; se se
sommano o si sottraggono tali uguaglianze membro a
membro si hanno ancora espressioni equivalenti, cio`e
A + C = B + D e A C = B D. Inoltre, se il valore
comune di C e D non `e 0, si ha anche AC = B D
e A/C = B/D.
Prova: Per il teorema precedente, da A = B si ricava A + C = B + C e da C = D si ha C + B = D + B,
ovvero B + C = B + D per la propriet`a commutativa
della somma; si ha allora A + C = B + D. Per la
sottrazione non vale la propriet`a commutativa ed occorre perci`o unosservazione in pi`
u: se C = D allora
C = D, come si vede immediatamente pensando
al valore comune di C e di D. Allora, da A = B
si ha A C = B C e da C = D si ricava

92
C + B = D + B, cio`e B C = B D, questa volta per la propriet`a commutativa della somma. Per la
moltiplicazione e la divisione si procede in modo analogo, osservando che da C = D discende 1/C = 1/D
purche il valore comune di C e D sia diverso da 0.

CAPITOLO 3. NUMERI
se: 1) ogni antecedente si inverte col proprio conseguente (propriet`
a dellinvertendo); 2) si permutano
gli estremi e/o i medi (propriet`
a delle permutando).

Prova: La proporzione originale `e equivalente a


ad = bc; `e facile osservare che ciascuna delle altre proUnosservazione importante `e la seguente: se A = porzioni `e equivalente alla stessa identit`a. Ad esemB e il valore delle espressioni `e diverso da 0, molti- pio, permutando gli estremi si ha: d : b = c : a, il che
plicando questa uguaglianza membro a membro per significa ancora ad = bc.
se stessa, si ha A2 = B 2 . Tuttavia, da A2 = B 2 non
Due altre propriet`a sono utili per risolvere molti
si pu`o dedurre A = B, come prova il controesempio
problemi:
2
2
(2) = 2 . Il teorema precedente, infatti, afferma
2
2
solo che se A = B e A = B allora (dividendo mem- Teorema 3.27 Si abbiano quattro numeri in proporbro a membro) si ricava A = B; ma questo non `e zione a : b = c : d. Allora, la somma (o la differenza)
particolarmente interessante.
degli antecedenti sta alla somma (o alla differenza)
Queste propriet`a delle espressioni aritmetiche si ge- dei conseguenti, come ciascun antecedente sta al proneralizzeranno pi`
u avanti alle espressioni algebriche; prio conseguente (propriet`
a del componendo e dello
per il momento ci interessa la loro applicazione alla scomponendo). Equivalentemente, la somma (o la
teoria delle proporzioni.
differenza) del primo e del secondo sta al primo (o al
secondo) come la somma (o la differenza) del terzo e
Definizione 3.8 Una proporzione `e luguaglianza di del quarto sta al terzo (o al quarto).
due rapporti: a/b = c/d. Quattro numeri a, b, c, d si
Formalmente, il componendo corrispondicono in proporzione se il rapporto dei primi due `e Prova:
uguale al rapporto degli ultimi due. Si scrive a : b = de alla proporzione: (a + c) : (b + d) = a : b o
c : d e si legge a sta a b come c sta a d. I quattro (a + c) : (b + d) = c : d, mentre la seconda formulanumeri si dicono termini della proporzione; a e d si zione corrisponde a (a + b) : a = (c + d) : c o anche
dicono gli estremi e b e c i medi; a e c si dicono gli (a + b) : b = (c + d) : d. Permutando i medi nella
proporzione di partenza, si ha a : c = b : d e quindi la
antecedenti e b e d i conseguenti.
prima formulazione ci d`a (a+b) : (c+d) = b : d e perLa propriet`a fondamentale delle proporzioni `e data mutando di nuovo i medi: (a + b) : b = (c + d) : d, che
dal seguente:
`e la seconda formulazione. Visto che le due formulazioni sono equivalenti, basta dimostrare la validit`a di
Teorema 3.25 Quattro numeri sono in proporzione
questultima proporzione. Ma essa equivale a:
se e solo se il prodotto dei medi `e uguale al prodotto
degli estremi.
a+b
c+d
a
c
=
o
+ 1 = + 1;
b
d
b
d
Prova: Supponiamo che a : b = c : d, cio`e a/b =
c/d; ovviamente dobbiamo avere b 6= 0 e d 6= 0, e sottraendo 1 ad entrambi i membri, si ottiene proprio
per il Teorema 3.23 possiamo moltiplicare entrambi i la proporzione di partenza. Una prova analoga vale
membri diquesta uguaglianza per bd e semplificando ovviamente per lo scomponendo.
si ha ad = bc come si voleva. Viceversa, se ad = bc
Una applicazione del componendo si ha nella rie i quattro numeri sono diversi da 0, sempre per il soluzione di questo tipo di problemi: di due numeri
teorema 3.23 possiamo dividere entrambi i membri si sa che il loro rapporto `e 3/5 e che la loro somma
per bd 6= 0; si ottiene a/b = c/d, cio`e proprio a : b = `e 32; quali sono i due numeri? Se chiamiamo i due
c : d.
numeri x ed y, la prima condizione ci d`a la propor-

zione x : y = 3 : 5 e quindi la seconda formulazione


del componendo ci dice: (x + y) : x = (3 + 5) : 3,
cio`e 32 : x = 8 : 3. Per la propriet`a fondamentale,
questo ci permette di scrivere luguaglianza 8x = 96;
dividendo i due membri per 8 si ha allora x = 12. La
proporzione di partenza diviene ora 12 : y = 3 : 5 e di
nuovo la propriet`a fondamentale ci d`a 3y = 60, cio`e
y = 20.
La propriet`a del componendo si pu`o utilmente
estendere alle catene di rapporti: si dice catena di
Teorema 3.26 Si abbiano quattro numeri in propor- rapporti luguaglianza di due o pi`
u rapporti. Ad
zione a : b = c : d. Si ottengono nuove proporzioni esempio, costituisce una catena di rapporti la serie

I Greci svilupparono la teoria delle proporzioni basandola su questo teorema, che rimane il fulcro dellapplicazione pratica delle propriet`a delle proporzioni. Ad esempio, poiche 2 12 = 3 8, si ha subito:
2 : 3 = 8 : 12. E chiaro che dalla uguaglianza si possono ottenere altre proporzioni, quali 12 : 3 = 8 : 2
oppure 2 : 8 = 3 : 12, e cos` via. Queste variazioni rientrano fra alcune propriet`a caratteristiche,
contemplate dalla teoria:

93

3.7. ESPRESSIONI E PROPORZIONI


di tre uguaglianze: 8 : 2 = 12 : 3 = 20 : 5. In
questo caso il componendo assume la forma: in una
catena di rapporti la somma degli antecedenti sta alla
somma dei conseguenti, come ogni antecedente sta al
proprio conseguente. Nellesempio precedente si ha:
(8 + 12 + 20) : (2 + 3 + 5) = 8 : 2, cio`e 40 : 10 = 8 : 2,
che `e ovviamente una proporzione, come si verifica
con il teorema fondamentale: 40 2 = 10 8.
Nella risoluzione dei problemi legati alle proporzioni, come nellesempio dei due numeri visto in precedenza, si cerca di determinare un termine della proporzione quando se ne conoscano gli altri. La regola
fondamentale delle proporzioni `e la panacea universale per tali problemi e la sua applicazione porta facilmente a un risultato positivo. Esiste tuttavia una
nomenclatura precisa, che `e opportuno conoscere:
Definizione 3.9 Dati tre numeri a, b, c si dice quarto proporzionale (dopo a, b, c) il numero x tale che:
a : b = c : x. Dati due numeri a, b si dice terzo proporzionale (dopo a, b) il numero x tale che:
a : b = b : x. Infine, dati due numeri a, c si dice
medio proporzionale tra a e c il numero x tale che:
a : x = x : c.
I Greci, come s`e detto, svilupparono la teoria delle
proporzioni, introdussero questi concetti a proposito
della similitudine delle figure (si veda al Capitolo sulla
Geometria Euclidea) e trovarono costruzioni geometriche per calcolare il quarto, il terzo e il medio proporzionale di segmenti assegnati; essi, infatti, erano
pi`
u bravi con la geometria che col calcolo e si trovavano pi`
u a loro agio con i segmenti che con i numeri.
Per noi le cose sono diametralmente opposte, anche
se, a suo tempo, vedremo le costruzioni proposte dai
Greci.

un confronto: se cio`e, dati due oggetti A, B G,


si possa dire se il primo A `e uguale, maggiore o
minore del secondo B;
una somma: se cio`e A, B G sono due oggetti,
si pu`o trovare in G un oggetto che sia la somma A + B dei due oggetti; naturalmente, tale somma deve godere delle propriet`a consuete
della somma tra numeri;
un prodotto scalare: se cio`e A G ed r `e un
numero reale qualsiasi, si pu`o trovare in G un
oggetto che sia r volte loggetto A; tale oggetto si
indica con rA. Si deve avere: r(A+B) = rA+rB
e (r + s)A = rA + sA.
Se gli oggetti sono di natura fisica, si parla di grandezza fisica; se sono di natura matematica, si parla
di grandezza matematica. Fra queste, viene naturale pensare ai segmenti e agli angoli, e in effetti studieremo queste grandezze (e altre) nel capitolo sulla
Geometria Euclidea. Fra le classi di grandezze fisiche, ricordiamo gli oggetti pesanti o i conduttori di
elettricit`a. Ogni classe di grandezze G pu`o essere associata a una misura: si definisce arbitrariamente un
oggetto U G della classe come unit`
a di misura e si
dice che un oggetto A G ha misura r = (A) se
r `e il numero reale tale che A = rU . Nel caso degli
oggetti pesanti, lunit`a di misura `e il peso di un litro
dacqua distillata alla temperatura di 4 centigradi.
Tale quantit`a si dice convenzionalmente kilogrammo
o chilogrammo (kg) e il peso di un oggetto pesante `e
il rapporto delloggetto con tale unit`a di misura. La
misura deve godere delle due propriet`a formali:
(rA)
= r(A)
(A + B) = (A) + (B).

Teorema 3.28 1) Il quarto proporzionale dopo i numeri a, b, c, `e il numero x = bc/a; 2) il terzo proporIl conteggio costituisce una specie di misura per alzionale dopo a, b `e il numero: x = b2 /a; 3) il medio
cuni
oggetti, sia del mondo fisico, sia di quello mate
proporzionale fra i numeri a e c `e il numero x = ab. matico (si veda il Capitolo 4); tuttavia, in questo caProva: Come accennato, basta applicare la regola so, il prodotto scalare ha senso solo per r N. Questo
fondamentale; ad esempio, da a : b = c : x si ha porta a distinguere le grandezze in due categorie:
ax = bc e dividendo i due membri per a (supposto
diverso da 0) per il Teorema 3.23 si trova x = bc/a.
La dimostrazione degli altri punti `e simile.
Lambito naturale di applicazione della teoria delle
proporzioni `e costituito dalle grandezze proporzionali. Vediamo allora di ricordare brevemente cosa si
intende per grandezza, un concetto legato al mondo
fisico, anche se trova molti riscontri nella Matematica
tradizionale, specie nella Geometria che, come abbiamo ricordato, `e il settore in cui si `e originariamente
sviluppata la teoria delle proporzioni.
Una classe di grandezze `e un insieme G di oggetti
(di natura fisica o matematica) per i quali `e possibile
definire:

le grandezze continue o analogiche per le quali il


prodotto scalare `e definito per ogni r R;
le grandezze discrete o digitali per le quali il
prodotto scalare `e definito solo per r N.
La teoria delle proporzioni tratta solamente grandezze continue; tradizionalmente, si dice che due
(classi di) grandezze sono direttamente proporzionali (si pensi al peso di una merce e al suo costo) se
raddoppiando, triplicando, etc. la prima anche la seconda raddoppia, triplica, etc. Analogamente, si dice
che due grandezze sono inversamente proporzionali
se raddoppiando, triplicando, etc. la prima, la seconda diviene la met`a, un terzo, etc. Queste espressioni

94

CAPITOLO 3. NUMERI

danno bene lidea intuitiva di proporzionalit`a diretta


e inversa, ma formalmente non sono granche; infatti,
se gli etc. ci stimolano ad afferrare un concetto di
variabilit`a che riusciamo intuitivamente a cogliere, in
sostanza non ci dicono niente. Migliore `e allora la
seguente:
Definizione 3.10 Due grandezze si dicono direttamente proporzionali quando il rapporto fra ogni valore della prima e il corrispondente valore della seconda
`e costante. Si dicono invece inversamente proporzionali se il prodotto di ogni valore della prima per il
corrispondente valore della seconda `e costante.
Nel caso del prezzo e del peso, se K `e il costo di
una merce al chilogrammo, e al peso W corrisponde
il prezzo P , si avr`a: P/W = K, qualunque siano P
e W . Invece, se v `e la velocit`a oraria di unautovettura che impiega il tempo t a percorrere la distanza
d, si scrive: vt = d. Viceversa, si osservi che, fissata
la velocit`a v di percorrenza, la distanza percorsa e il
tempo per percorrerla sono grandezze direttamente
proporzionali, e questa osservazione, che si generalizza facilmente, ci fa capire come i due concetti siano
strettamente collegati, e non solo per il nome. Daltra
parte, la precedente definizione rende perfettamente
conto della relazione tra grandezze proporzionali e
proporzioni. Ad esempio, una volta stabilito (o dato per definizione) che il costo di una merce `e direttamente proporzionale al suo peso, e supposto che
questa costi 3.5 e al Kg, chiederci quanto vengono a
costare 2.7 Kg della stessa merce vuol dire risolvere
la proporzione: 3.5 : 1 = x : 2.7. Invertendo si ha:
1 : 3.5 = 2.7 : x, e quindi, come abbiamo visto, si
trova: x = 3.5 2.7 = 9.45 e. La regola esplicita `e:
costo1 : peso1 = costo2 : peso2 .
Quando le grandezze sono inversamente proporzionali, il secondo rapporto va invertito; cos` se una macchina che va a 75 km/h impiega 45 minuti a percorrere una certa distanza, per sapere quanto impiegherebbe se andasse a 90 km/h, la proporzione da impostare
`e: 75 45 = x 90, cio`e 75 : 90 = x : 45, secondo lo
schema:
velocit`
a1 : tempo1 = tempo2 : velocit`
a2
ovvero:
velocit`
a1 : velocit`
a2 = tempo2 : tempo1
dove si deve notare linversione degli indici. In questo
caso troviamo x = 37.5, cio`e x = 37 30 .
Una celebre classe di problemi legati alle grandezze
inversamente proporzionali `e costituito dai problemi
relativi al riempimento di una vasca. Ad esempio,
una vasca di capacit`a ignota ha due rubinetti e uno

scarico; se il primo rubinetto fosse aperto da solo (con


lo scarico chiuso) impiegherebbe 24 minuti per riempire la vasca; il secondo rubinetto, sempre da solo,
riempirebbe la vasca in 30 minuti. Invece lo scarico, se agisse da solo, vuoterebbe la vasca piena in 20
minuti. La domanda `e: se si aprono contemporaneamente i due rubinetti e lo scarico, in quanto tempo si
riempie la vasca? Solo i matematici possono inventare
problemi tanto assurdi, ma, una volta posto, il quesito va risolto. Il fatto `e che i tempi di riempimento
sono una grandezza inversamente proporzionale alla quantit`a di acqua immessa nella (o estratta dalla)
vasca, mentre `e questa grandezza che si somma o si
sottrae per stabilire quando la vasca si `e riempita o
si `e svuotata.
Questa inversione di solito imbarazza il solutore,
ed `e opportuno ragionare in questo modo: in un minuto il primo rubinetto riempie 1/24 della vasca e il
secondo ne riempie 1/30; lo scarico ne vuota 1/20 e
sono queste le grandezze che si possono sommare e
sottrarre. In un minuto la vasca si riempie per:
1
1
1
5+46
1
+

=
=
24 30 20
120
40
e quindi occorrono in tutto 40 minuti per il riempimento. Tutto qui. Il lettore pu`o ora risolvere il
problema dei due automobilisti Carlo e Dario: Carlo `e in grado di percorrere lautostrada da A a B in
60 minuti; Dario la percorre in 40 minuti. Se Carlo parte da A e Dario da B, dopo quanto tempo si
incontreranno?
Importante `e il seguente concetto:
Definizione 3.11 La percentuale di una quantit`
aq
rispetto a una quantit`
a Q `e il rapporto q/Q riportato
a 100.
In altre parole, la percentuale x di q a Q `e il quarto
proporzionale: q : Q = x : 100, e quindi per il Teorema 3.28 `e: x = 100q/Q. Ad esempio, se un oggetto
costa 60 e e viene scontato di 12 e, in percentuale
lo sconto `e dato dalla proporzione: 12 : 60 = x : 100,
cio`e x = 1200/60 = 20 per cento (o, come si scrive,
20%). Viceversa, se su un oggetto che costa 70 e
viene operato lo sconto del 15%, tale sconto si calcola risolvendo la proporzione. x : 70 = 15 : 100,
cio`e x = 70 15/100 = 10.5 e. Naturalmente, una
proporzione risolve anche il caso della percentuale di
pagamento (e non dello sconto); ad esempio, per sapere quanto dobbiamo pagare per acquistare un abito
all80% del suo costo di 370 e, basta impostare la proporzione: x : 370 = 80 : 100 e scoprire che x = 296
e.
Infine, le percentuali sono spesso usate per valutare
lerrore commesso in una misurazione, in una valutazione o in un conteggio approssimato. Ad esempio, se

95

3.8. MATEMATICA FINANZIARIA


di una persona alta 172 cm diciamo che `e alta 170 cm,
quale errore commettiamo? Intanto, si distingue tra
errore assoluto ed errore relativo: lerrore assoluto `e
il valore assoluto della differenza fra il valore reale e
quello considerato. Pertanto: Ea = |172 170| = 2
cm. Naturalmente, un tale errore su 172 cm `e abbastanza sensibile ma non troppo; un errore di 2 cm
su 1 km `e trascurabile; un errore di 2 cm su 10 cm `e
enorme. Questo ci fa capire che lerrore assoluto, pur
essendo significativo, non ci d`a unidea della rilevanza
dellerrore stesso, cio`e non ci dice se il valore approssimato `e vicino o lontano dal valore vero. Per questo si
introduce il concetto di errore relativo, definito come
il rapporto tra lerrore assoluto e il valore vero della
quantit`a considerata. In altre parole: Er = Ea /qv , se
qv `e il valore vero della nostra quantit`a. Nel caso dellaltezza abbiamo Er = 2/172 0.0116, e questo ci
fa capire immediatamente che lerrore `e abbastanza
modesto. Lerrore relativo si esprime spesso in percentuale; questa `e semplicemente 100Er , e la si pu`o
ottenere in modo diretto impostando e risolvendo la
proporzione: Ea : qv = x : 100. Se qa `e il valore
approssimato di qv , abbiamo |qv qa | : qv = x : 100
e a formula si scrive:
100|qv qa |
= Er %.
qv
Nel caso dellaltezza, lerrore `e stato dell1.16%.

3.8

Matematica finanziaria

Unapplicazione importante delle cose dette `e la Matematica finanziaria, largamente usata nel commercio, nelle banche e nella finanza. In effetti, la Matematica finanziaria `e un argomento che presenta diversi caratteri interessanti. Intanto, almeno nelle parti
iniziali, `e abbastanza elementare da consentire un facile approccio da parte di tutti: le operazioni coinvolte sono le quattro operazioni elementari, le potenze,
le radici e, per alcuni problemi meno comuni, i logaritmi. Questi, guarda caso, non vengono trattati
proprio in quelle scuole nelle quali la Matematica finanziaria costituisce uno dei principali argomenti di
insegnamento. In secondo luogo, la materia ha un
aggancio immediato con il mondo reale e ognuno ha
costantemente a che fare con gli interessi bancari sui
conti correnti, gli investimenti, gli sconti e gli scoperti, con le polizze o le rate dellassicurazione e del
mutuo, e via discorrendo. In terzo luogo, specie per
quello che ci riguarda, si presta a darci labitudine a
fare un po di conti e di esercizi su vari argomenti che
abbiamo toccato, quali le conversioni di base, le proporzioni e le percentuali, le potenze e i logaritmi. A
questo proposito, `e bene che, leggendo questa sezione,

ci si munisca di un calcolatore da tasca, possibilmente


in grado di eseguire potenze, radici e logaritmi.
Sicuramente, il problema pi`
u elementare `e quello dellinteresse semplice. Supponiamo di avere una
certa somma, che indicheremo con C; questo ci introduce nella terminologia, piuttosto specifica, della
Matematica finanziaria. Infatti C sta per capitale, ed
`e la quantit`a di denaro di riferimento: quanto possediamo, quanto vogliamo investire o spendere, quanto
possiamo mettere in campo. Se impieghiamo il nostro capitale C, ad esempio depositandolo in banca
sul nostro conto corrente, ci aspettiamo che, nel giro di un anno, esso aumenti. Pensiamo infatti che
la banca ottenga un guadagno finanziando imprese
con i soldi che ha raccolto da noi e da altri cittadini e che pertanto ne dar`a in parte anche a noi, che
abbiamo partecipato, indirettamente, al loro finanziamento. Per questo concordiamo con la banca (o,
meglio, la banca concorda con noi) un certo tasso di
interesse, indicato di regola con i o con r, cio`e la frazione di capitale che costituir`a il nostro guadagno.
Tale tasso di interesse `e di norma considerato su base
annua e quindi, dopo un anno, noi ritroveremo il nostro capitale C pi`
u la quantit`a rC che `e appunto ci`o
che il nostro capitale ha fruttato. Di conseguenza, il
nostro capitale sar`a:
C = C + rC = C(1 + r).
Il tasso di interesse `e dato tradizionalmente in percentuale; pertanto, un tasso del 3% significa r = 0.03.
Ad esempio, se impieghiamo 2000.00 e al 3%, dopo
un anno avremo guadagnato 2000 0.03 = 60.00 e e
il nostro capitale sar`a 2000 1.03 = 2060.00 e. Naturalmente, il vantaggio che ci offre la formula precedente `e quello di permetterci una facile soluzione
di problemi inversi. Ad esempio, quale somma devo
impiegare al 4.5% per avere, dopo un anno, 2000.00
e? Questa volta, il capitale C `e la nostra incognita
e quindi dalla formula ricaviamo:
C = C /(1 + r)
che ci d`a C = 2000/1.045 = 1913.88 e. Analogamente, se vogliamo sapere a quale tasso occorre impiegare
1900.00 e per averne, dopo un anno, 2000.00, dalla
formula otteniamo:
1+r =

C
C

ovvero

r=

C
C C
1=
.
C
C

Nellesempio, abbiamo r = 100/1900 = 0.0526, e cio`e


il tasso deve essere del 5.26%. Questi problemi, nel
gergo commerciale e finanziario, sono noti come problemi di sconto. Supponiamo infatti di dover pagare
2000.00 e fra un anno a un nostro fornitore; trattiamo con lui e quello `e disposto, se paghiamo subito, a
farci uno sconto del 4.5%; col ragionamento di sopra

96

CAPITOLO 3. NUMERI

vediamo che ce la possiamo cavare pagando (subito)


1933.88 e, e ci`o ci pu`o essere conveniente, se non abbiamo problemi finanziari. Similmente, supponiamo
che, ancora trattando con il fornitore, quello ci dica
che si accontenta di incassare 1900.00 e, se paghiamo subito (forse ha problemi di liquidit`a). Qual `e lo
sconto che `e disposto a farci? Come abbiamo visto si
tratta del 5.26%, una bella roba!
Tornando al nostro investimento, se, alla fine dellanno, ritiriamo il nostro guadagno rC e lasciamo
il capitale C alla banca ancora per un anno, alla
fine del secondo anno avremo un nuovo guadagno
rC e quindi (se ancora non abbiamo speso niente) possiamo considerarci possessori di un capitale
C = C + rC + rC = (1 + 2r)C. Se si va avanti cos`
per n anni, si avr`a in tutto il capitale (1+nr)C. Tanti
anni fa, quando ero ragazzo, linteresse semplice era
presentato proprio cos`. Nella realt`a, specie al giorno
doggi, le cose sono un po pi`
u complicate. Se mettete
un po di denaro in banca allinteresse r, la banca vi
richiede di partecipare alle spese (costo del personale,
delle attrezzature, e cos` via) con una cifra fissa S oppure proporzionale al vostro capitale, diciamo sC. In
questultimo caso, in effetti, il vero tasso di interesse
`e per voi r s; infatti, in fondo allanno, il vostro
capitale sar`a C = C(1 + r) sC = C(1 + (r s)),
per cui dovete stare attenti che s sia abbastanza minore di r, se non volete andare a rimetterci. Occorre
ricordare, inoltre, che sul vostro guadagno dovete pagare le tasse, che oggi, inizio del terzo millennio, in
Italia, sono del 12.5%. Questo significa che il vero
tasso di interesse `e r 0, 125r = 0.875r, cos` che, fatti tutti i conti, alla fine dellanno il vostro capitale
sar`a C = C(1 + 0.875r s), con un tasso di interesse
reale dato da 0.875r s. E bene rendersi conto che
se la banca vi offre un tasso di interesse del 2% e le
spese assommano allo 0.5% del capitale investito, il
tasso reale `e:
0.875 0.02 0.005 = 0.0125 = 1.25%.
Quindi, se dai vostri 2000.00 e pensate di ricavare
un guadagno di 2000 0.02 = 40.00 e, scordatevelo
e cominciate a rassegnarvi allidea di ottenere invece
2000 0.0125 = 25.00 e.
Un discorso diverso va fatto se la banca vi trattiene
una cifra fissa S; ve la pu`o trattenere allinizio o alla
fine del periodo, cio`e dellanno. Se ve la trattiene
allinizio (in modo anticipato) il vostro capitale finale
sar`a C = (C S)(1 + r) in quanto, di fatto, voi
state impiegando un capitale decurtato delle spese
sostenute. Se invece S vi viene trattenuto alla fine del
periodo (posticipato), avrete C = C(1 + r) S. A
parit`a di S, ovviamente, questa seconda soluzione vi
sar`a pi`
u favorevole; altrettanto ovviamente, la banca
si trattiene sempre le spese S allinizio dellanno. Pu`o

essere un utile ed interessante esercizio vedere, anche


in questo caso, cosa succede introducendo la tassa
governativa del 12.5%.
Il fatto che, convenzionalmente, il tasso di interesse sia considerato su base annua (almeno nel 90% dei
casi) fa s` che occorra ritornare a ci`o che abbiamo
detto sulle basi composte, quando si voglia impiegare
un capitale per alcuni mesi o per un certo numero di
giorni. Supponiamo di impiegare 2000.00 e per 9 mesi al tasso del 3% annuo. La cosa migliore `e riportare
i mesi o i giorni alla frazione di anno corrispondente,
e quindi ragionare su questo numero, che `e diventato un numero decimale. Nellesempio, 9 mesi sono
9/12 di anno, cio`e, eseguendo la divisione, 0.75 parti
di anno. Linteresse r viene ridotto in proporzione:
3 : 1 = x : 0.75, cio`e x = 2.25, e il nostro guadagno (sempre al lordo delle spese e delle tasse) sar`a
2000 0.0225 = 45.00 e. Quando il periodo si conta in giorni, la Matematica finanziaria introduce un
altro livello di complessit`a: si considera infatti un anno civile, composto convenzionalmente di 365 giorni
(anche se lanno considerato `e bisestile) e un anno
commerciale, ridotto a 360 giorni. Di fatto, le cose
cambiano di poco, ma bisogna essere coscienti di cosa
si sta facendo. Impieghiamo i nostri 2000.00 e per
215 giorni; se si usa lanno civile, la proporzione `e:
3 : 365 = x : 215, e quindi x = 1.7671233, che ci d`a
un guadagno di 35.34 e. Se si usa lanno commerciale, si ha: 3 : 360 = x : 215, cio`e x = 1.7916667 con
un guadagno di 35.83 e. Per una qualche misteriosa
ragione, la banche adottano ormai sistematicamente lanno civile nel trattamento dei conti correnti in
attivo per il cliente.
Quando dagli investimenti di un anno passiamo a
investimenti pluriennali, linteresse semplice va bene
solo se, alla fine di ogni anno, ritiriamo gli interessi
maturati (le cedole) e, quindi, il capitale investito
C rimane costante nel tempo. Spesso per`o succede
che il capitale venga lasciato a fruttare per diversi
anni senza ritirare alcuna cifra. In questo caso, gli
interessi si accumulano al capitale o, come si dice,
reinvestiamo gli interessi stessi. Questo significa che
in fondo al primo anno, reinvestiamo per intero il
nostro capitale, che `e diventato C(1 + r); se il tasso di interesse rimane r, alla fine del secondo anno
abbiamo:
C(1 + r)(1 + r) = C(1 + r)2 .
Continuando cos`, dopo n anni il nostro capitale sar`a
diventato:
C = C(1 + r)n ;
`e questo il concetto, e la formula relativa,
dellinteresse composto, per il quale gli interessi si accumulano mano mano e vanno quindi ad incrementare gli interessi successivi. Quando facevo le Scuole

3.8. MATEMATICA FINANZIARIA


Elementari, allinizio degli anni 1950, il sussidiario
non mancava di tentare il nostro stupore con questo
problema: sapete, ragazzi, quanto sarebbe diventata oggi una Lira se, al tempo di Giulio Cesare, fosse
stata messa in banca allinteresse composto dell1%?
A quellepoca, giravano le lire, ma ora possiamo senzaltro passare allEuro. La risposta, che ci veniva
fornita senza spiegarci come era stata ottenuta, era:
quasi mezzo miliardo di Lire (o di Euro), una somma
davvero stratosferica. La formula precedente ci d`a la
soluzione che allora ci mancava:
1 (1.01)2000 = 431. 286. 205.72.

97
Pi`
u complicato `e il caso che siano fissati il capitale
C e il montante M , e si voglia determinare il tasso
di interesse necessario a raggiungere lo scopo in un
numero di anni n assegnato. Ancora dalla formula,
si ha:
p
M = C(1 + r)n ovvero 1 + r = n M/C.

Se C = 10. 000, 00, M = 15. 000, 00 e ed n = 10 anni,


si ha:
r

10
10 15000
1.5 = 1.04138,
1+r =
=
10000

Oggi potremmo osservare che, a cinquantanni di corrispondente a un tasso del 4.138%. E addirittura
distanza, saremmo gi`a a:
necessario introdurre ed utilizzare i logaritmi quando
2050
.
.
siano assegnati capitale, montante e tasso dinteresse,
1.01
= 722 464 071.72,
e si voglia determinare il numero n di anni necessari
che mette bene in evidenza la crescita esponenziale a raggiungere il montante M impiegando al tasso r il
(n, il numero di anni, si trova allesponente) del no- capitale iniziale C. La formula M = C(1 + r)n ci d`a:
stro capitale, impiegato allinteresse composto. Viceversa, se avessimo impiegato la Lira o lEuro iniziale
n = log1+r M/C = log1+r M log1+r C.
allinteresse semplice, oggi avremmo:
Purtroppo, il calcolatore non d`a direttamente il lo1 (1 + 2050 0.01) = 21.50
garitmo in base 1 + r; di solito fornisce il logaritmo
Lire (o Euro), una cifra del tutto insignificante, do- naturale, che per`o vedremo nel Capitolo 8, e il logavuta alla crescita lineare del capitale: in questo ca- ritmo decimale. Come sappiamo, si ha: log1+r x =
so, il numero degli anni n sta a moltiplicare il tasso log10 x/ log10 (1 + r), e questo riporta tutto al calcolo
.
dinteresse. Proprio per questo modo di crescere, il dei logaritmi decimali. Se abbiamo M = 15 000, 00,
.

C
=
10
000,
00
e
ed
r
=
2.50%,
si
ha
M/C
= 1.5,
capitale risultante C dallinteresse composto si dice
log
1.5
=
0.17609126
e
log
1.025
=
0,
01072387,
montante, cio`e che monta, che cresce.
10
10
Problemi pi`
u concreti riguardano investimenti plu- per cui n = 16.42. Occorrono pertanto 16 anni e
riennali. Anche in questo caso, se astraiamo dalle spe- 42/100 di anno; per riportare questa frazione a giorse e dalle tasse, un capitale di 2000.00 e, impiegato ni secondo lanno civile, si imposta la proporzione:
42 : 100 = x : 365, e da questa si ricava x 153.
al 3% annuo per 7 anni, ammonter`a a:
Il tempo richiesto `e perci`o di 16 anni e 153 giorni,
2000 1.037 = 2459.75e.
ovvero, se preferiamo, 16 anni e 5 mesi. Tutto arriva
La formula, come nel caso dellinteresse semplice, per- per chi sa aspettare.
Linteresse composto richiede un pizzico dattenmette di risolvere anche i problemi inversi. Ad esemzione
quando, dalla base annua, lo si voglia portare a
pio, ci possiamo chiedere qual `e il capitale C che
una
base
frazionaria, come il semestre, il trimestre, il
dobbiamo impiegare al 2.50% per avere, dopo 10 an.
mese
o
addirittura
il giorno. Ad esempio, un interesse
ni, 20 000, 00 e; la formula ci dice che deve essere
10
annuo
del
4%
non
`e un interesse composto semestra20000 = C1.025 , cio`e C = 20000/1.28 = 15623.97
le
del
2%,
come
si
potrebbe pensare e come talvolta
e. Come nel caso dellinteresse semplice, questo pu`o
si
assume
per
semplicit`
a. Secondo la regola generale,
essere visto come un problema di sconto; nella realt`a,
poich
e
un
semestre
`
e
la
met`
a di un anno, il capitale
tuttavia, `e raro avere pagamenti dilazionati per pi`
u di
al
1/2
1+r
la
fine
del
semestre
sar`
a
:
C
=
C(1+r)
=
C
un anno. Ha senso invece porsi come obiettivo quello

1
+
r.
Facendo
i
calcoli
nel
caso
e
il
tasso
sar`
a
1

di arrivare ad avere un montante M nel giro di n an


di
r
=
4%,
si
ha
1

1.04
=
0.0198,
cio`
e
1.98%,
che
ni, impiegando una certa somma a un interesse noto.
`
e
un
po
pi`
u
basso
del
2%
ipotizzato.
Si
osservi
che,
Allora, la cifra C di partenza si dice il valore attuale
del montante M . Ad esempio, qual `e il valore attuale sempre considerando un tasso del 4% su base annua,
di un montante di 10. 000, 00 e scadente fra 5 anni e si ha:

78 giorni, al 3%? Usando lanno civile, 78 giorni cor3


1.04 = 1.316%
base quadrimestrale 1
rispondono a 78/365 = 0.2137 parti di anno, e quindi
4
base trimestrale
1 1.04 = 0.985%
dalla formula ricaviamo:
6
base bimestrale
1
1.04 = 0.656%
5.2137
12
10000 = C 1.03
ovvero C = 8571.77e.
base mensile
1 1.04 = 0.327%

98

CAPITOLO 3. NUMERI

Chiaramente, il tasso cos` calcolato `e sempre inferiore


al tasso ingenuo ottenuto dividendo r per la periodicit`a: infatti gli interessi si accumulano col passare
del tempo. Ad esempio, se comprate dei BOT a tre
mesi, il tasso viene calcolato cos`, poiche si suppone
che, finito il periodo, reinvestiate il ricavato.
Affrontiamo, come conclusione di queste note sulla
Matematica Finanziaria, un problema classico e non
del tutto banale. Se volete comprar casa, molto probabilmente avrete necessit`a di fare un mutuo, cio`e di
chiedere soldi in prestito a una Banca per pagare lattuale proprietario, il notaio, le tasse e quanto altro sia
necessario. Se C `e la cifra che desiderate, la Banca
sar`a disposta a prestarvelo mettendo unipoteca sulla casa e chiedendovi un ragionevole interesse. La
Banca vi fornisce la somma C comprensiva delle spese delloperazione fra voi e la Banca stessa, e voi vi
impegnate a restituire a rate, in un certo periodo di
anni, la somma e gli interessi. Questo significa, prima
di tutto, che la Banca vi fornir`a una cifra C < C,
essendo C C il costo delloperazione; daltra parte,
poiche C `e comunque la somma che dovete restituire,
c`e il problema del calcolo degli interessi. Poiche restituite la cifra a rate, di solito semestrali, alla prima
rata avrete gi`a accumulato gli interessi dei primi sei
mesi. Alla fine dei secondi sei mesi avrete accumulato
altri interessi da restituire, ma solo sulla cifra precedente diminuita della rata pagata alla fine dei primi
sei mesi. Chiamiamo allora Ck la quantit`a di danaro
da restituire alla fine del k-esimo periodo di sei mesi;
in particolare, sar`a C0 = C il capitale (si fa per dire)
iniziale.
Le modalit`a di restituzione possono essere varie,
ma di solito si riducono a due: a rate fisse e a rate
variabili. Questultima modalit`a prevede come regola
un adeguamento del tasso di interesse a quello praticato dalla Banca al momento della rata; ci`o implica
un ricalcolo semestrale della rata da pagare, che sar`a
pi`
u alta se il tasso corrente cresce e sar`a pi`
u bassa se
il tasso decresce. Pi`
u interessante, almeno dal punto
di vista matematico, `e laltro caso; la Banca fissa per
gli anni di restituzione un tasso annuo r (di regola
pi`
u alto di quello corrente) e calcola le rate, di importo costante x, secondo tale tasso. Vediamo come
si esegue il calcolo.
Alla fine del primo periodo (che per fissare le idee
e seguendo luso stabiliamo essere un semestre), il
capitale iniziale C0 sar`a cresciuto secondo il tasso di
interesse a C0 (1 + r/2), ma pagando la rate x ci si
riporta a un nuovo capitale:

r
C1 = C0 1 +
x.
2
Si riparte cos` per il secondo periodo di sei mesi con
C1 e un ragionamento analogo ci porta a un capitale

da restituire dopo il secondo pagamento pari a:

r
r
r 2
C2 = C1 1 +
x 1 +
x = C0 1 +
x.
2
2
2

Alla fine dei successivi sei mesi il capitale da restituire


sar`a:

r
C3 = C2 1 +
x=
2

r 2
r
r 3
x 1+
x 1+
x.
= C0 1 +
2
2
2
Cos` continuando, alla fine dei 2n periodi semestrali
corrispondenti alla durata del prestito, si arriva a:

r
C2n = C2n1 1 +
x=
2

r 2n
r 2n1
r
= C0 1 +
x.
x 1 +
x 1 +
2
2
2
Poiche a questo punto il prestito deve risultare restituito completamente, occorre che sia C2n = 0, e
questo ci permette di calcolare il valore di x. La
precedente equazione si scrive infatti:

r 2n
=
C0 1 +
2

r 2n2
r 2n1
+ 1+
+ + 1 .
=x 1+
2
2

Lespressione compresa nelle ultime due parentesi `e


una progressione geometrica di ragione 1 + r/2 e
quindi sappiamo come calcolarla:

(1 + r/2)2n 1
r 2n
=x
C0 1 +
2
1 + r/2 1
e da questo si ricava il valore della rata:
x=

C0 (1 + r/2)2n r/2
.
(1 + r/2)2n 1

Facciamo un esempio, per renderci conto di ci`o che


pu`o dare questa formula. Se avete bisogno di 50. 000
e (la Banca, per quanto detto, vi dar`a un po di
meno, trattenendo le sue spese) e riuscite ad avere
un tasso fisso del 6% per restituire il tutto in 15 anni,
la rata sar`a:
x=

0.03 50000 1.0330


2550.96.
1.0330 1

Dovete quindi prepararvi a dare alla banca questa


cifra ogni sei mesi (pi`
u di 400 e al mese da risparmiare). Alla fine dei 15 anni avrete restituito pi`
u di
76. 528 e, cio`e avrete pagato per interessi ben 26. 528
e, ma questo, si sa, fa parte del gioco, anche se ne `e
la parte meno piacevole.

Capitolo 4

Matematiche finite
Mi pareva che il calcolo in se stesso servisse
molto poco e non avesse affatto quellimportanza che molti giocatori gli attribuiscono. Essi
se ne stanno seduti davanti a foglietti di carta rigata, segnano i colpi, contano, deducono
le probabilit`
a, fanno calcoli e infine puntano e
perdono come noi, semplici mortali, che giochiamo senza calcoli. In compenso ho tratto
una conclusione che mi pare giusta: realmente,
nel susseguirsi delle probabilit`
a favorevoli c`e, se
non un sistema, un certo quale ordine, il che `e,
naturalmente, molto strano.
F. Dostoevskij Il giocatore

Il calcolo combinatorio `e la parte della Matematica


che conosco un po meglio, poiche `e in questo settore, applicato allInformatica, che lavoro e pubblico i
miei articoli. Per questo motivo, voglio rifarmi alle
parole di un vero matematico per presentare largomento. Jean Dieudonne `e uno, se non il primo, dei
matematici reali che costituiscono il matematico virtuale Nicolas Bourbaki, la cui opera, a partire dal
1935, `e riuscita a sistematizzare grande parte della
Matematica attuale, attraverso il concetto di struttura e mediante un formalismo molto spinto. Alla
met`a degli anni 1980, Dieudonne ha scritto un libro
di divulgazione matematica che intitol`o Pour lhonneur de lesprit humaine; nella presentazione di uno
schema dei vari settori della Matematica moderna,
dedica alla Combinatoria le seguenti parole, che cito
dalla traduzione italiana Larte dei numeri a pagina
143:
Inizialmente si pu`o dire che ci`o che si indica con
questo nome [la Combinatoria] costituiva una parte
della teoria degli insiemi, cio`e la teoria degli insiemi
finiti, e i problemi relativi alla valutazione del numero di elementi di insiemi di questo tipo costruiti
mediante procedimenti diversi; alcuni di questi problemi risalgono allantichit`a, per esempio il numero
delle coppie di elementi di un insieme di n elementi,
uguale ad n(n 1)/2; [. . .] un altro esempio [`e] il calcolo del numero n! delle permutazioni di un insieme
di n elementi.
I metodi collegati a questi problemi sono stati a
99

lungo considerati di scarso interesse da molti matematici, che li collocavano volentieri nel settore che
prende il nome di giochi matematici, a cui sono
appassionati molti lettori di divulgazione scientifica.
Ma nel volgere di poche dozzine danni la situazione `e
notevolmente cambiata: ci si `e accorti che certi metodi combinatori potevano avere importanti applicazioni in settori della Matematica del tutto rispettabili, come la teoria dei gruppi, la teoria delle algebre
di Lie, la geometria algebrica e la topologia algebrica; sono stati utilizzati con successo perfino in varie
applicazioni della Matematica, tra cui lInformatica.
La Combinatoria o Analisi Combinatoria, o anche
Calcolo Combinatorio, `e, come dice Dieudonne, lo
studio delle propriet`a degli insiemi finiti. Pertanto,
problemi combinatori vengono fuori ogni volta che
consideriamo insiemi e strutture finite, per le quali
essere composte da un numero finito di oggetti `e essenziale; vedremo, come esempi, la schedina del totocalcio o il gioco del lotto. Se le partite della schedina
fossero infinite o fossero infiniti i numeri del lotto, tali
giochi non esisterebbero nemmeno oppure nessuno li
prenderebbe in considerazione. Ma, come dice ancora
Dieudonne, lambito dellAnalisi Combinatoria `e ben
pi`
u ampio di quello dei giochi; unapplicazione molto
importante `e legata al Calcolo delle Probabilit`a, almeno nelle impostazioni insiemistica e frequentistica.
Per questo, dedicheremo parte del Capitolo alle nozioni di base del Calcolo delle Probabilit`a, lasciando
al lettore il problema di approfondire (quando sar`a il
momento) quegli aspetti legati alla Teoria della Misura e che possono essere affrontati solo dopo aver
studiato il Calcolo Integrale.

4.1

Calcolo combinatorio

Il problema pi`
u semplice dellanalisi combinatoria `e
certamente quello di contare gli elementi di un insieme, e su questo abbiamo discusso in abbondanza
al momento opportuno. Vediamo pertanto problemi un po pi`
u complessi. Sia A = {a1 , a2 , . . . , an }
un insieme di n elementi e consideriamo le possibi-

100
li sequenze di elementi di A, cio`e le parole su A,
come abbiamo visto nella Sezione 1.8. Ad esempio, se A = {a, b, c} le sequenze di lunghezza 2 sono [a, a], [a, b], [a, c], [b, a], [b, b], [b, c], [c, a], [c, b], [c, c],
cio`e 9 in tutto. E facile vedere che le sequenze
di lunghezza 3 sono 27 e quelle di lunghezza 4, 81.
Possiamo anche osservare che le sequenze di elementi di A di lunghezza 1 sono esattamente n, essendo
in corrispondenza biunivoca con gli elementi di A:
[a1 ], [a2 ], . . . , [an ]. Lunica sequenza di lunghezza 0 `e
la sequenza vuota [ ] e quindi in generale abbiamo:

CAPITOLO 4. MATEMATICHE FINITE


stinti di A; di nuovo, se A = {a, b, c}, tali sequenze di lunghezza k, dette disposizioni a k a k, per
k = 2 sono: [a, b], [a, c], [b, a], [b, c], [c, a], [c, b], poiche
nessun elemento pu`o essere ripetuto. Dette Dn,k le
disposizioni a k a k, `e facile dimostrare:
Teorema 4.2 Se A `e un insieme di n elementi, le
disposizioni a k a k di tali elementi sono: Dn,k =
n(n 1) (n k + 1).

Prova: Il primo elemento della sequenza pu`o essere


uno qualsiasi degli n elementi dellinsieme. Il secondo elemento pu`o essere uno degli n elementi, escluso
Teorema 4.1 Il numero delle sequenze di lunghezza quello che ha occupato la prima posizione: quindi vi
m degli elementi di un insieme A di cardinalit`
a n `e sono n(n 1) possibili sequenze di 2 elementi, o diesattamente nm .
sposizioni a 2 a 2. Analogamente, il terzo elemento
Prova: I due casi m = 0 ed m = 1 sono stati vi- pu`o essere uno qualsiasi degli n elementi di A eccetsti in precedenza; se m > 1, nella prima posizione to i due che hanno occupato i primi due posti: si
della sequenza possiamo mettere uno qualsiasi degli hanno quindi n(n 1)(n 2) disposizioni a 3 a 3.
n elementi; indipendentemente da questa, nella se- Continuando, si ottiene la formula desiderata.
conda posizione possiamo ancora inserire uno degli
E chiaro che disposizioni con pi`
u di n elementi
n elementi ottenendo cos` n2 sequenze di 2 elementi. non sono possibili; le disposizioni ad n ad n hanno
Come terzo elemento possiamo inserire uno degli n un interesse particolare e si dicono permutazioni. Ad
elementi ottenendo n3 sequenze di 3 elementi, e cos` esempio, le permutazioni di un insieme con 3 elementi
via fino ad m. Naturalmente, questa dimostrazione sono: [a, b, c], [a, c, b], [b, a, c], [b, c, a], [c, a, b], [c, b, a] e
potrebbe espremersi in modo pi`
u formale usando il dalla formula si ha D3,3 = 321 = 6. Linsieme delprincipio di induzione, ma accontentiamoci di quanto le permutazioni di un insieme di n elementi si indica
detto.
con Pn e il numero dei suoi elementi `e n(n1) 21;
per
la sua importanza, questo numero che abbiamo
Questo teorema permette di risolvere qualche progi`
a
introdotto
ha una speciale notazione: esso si inblema pratico di tipo elementare. Ad esempio, quante
dica
con
il
simbolo
n! che si legge n fattoriale. Un
sono le possibili schedine del Totocalcio? Una schesemplice
esempio
`
e
costituito dai possibili anagramdina pu`o essere vista come una sequenza di lunghezmi
della
parola
spero;
come sequenza di 5 lettere, si
za 13 dellinsieme {1, X, 2} e quindi il teorema ci d`a
hanno
5!
=
120
permutazioni;
di queste, alcune come
13
.
.
come numero complessivo 3 = 1 594 323. Questo
spore,
preso,
perso
hanno
un
senso compiuto; alsignifica che se avessimo a disposizione tanto denatre,
come
eoprs
e
reops
sono
semplici
accostamenti
ro da poter giocare tutto questo milione e mezzo di
di
lettere.
schedine saremmo sicuri di fare un 13 e tredici 12.
Per definizione si ha 1! = 1 e per convenzione si
Naturalmente, il numero 13 `e stato scelto in modo da
pone
0! = 1. I fattoriali crescono molto rapidamente,
non rendere conveniente una strategia del genere.
come
si vede dalla seguente tabella:
Questo `e un caso molto semplice; talvolta il ragionamento pu`o essere pi`
u complesso. Ad esempio, ci
possiamo chiedere quanti sono i possibili sottoinsiemi
di un insieme di n elementi. Usiamo per questo il
concetto di funzione caratteristica, gi`a introdotto nel
Capitolo 1. Ad ogni sottoinsieme possiamo associare
una sequenza di lunghezza n composta da 0 ed 1 con
questa propriet`a: se A = {a1 , a2 , . . . , an } e B A, il
j-esimo elemento della sequenza corrispondente a B
`e 1 se e solo se aj B (altrimenti, questo elemento
`e 0). Ad esempio, se A = {a, b, c, d} e B = {a, c},
abbiamo la sequenza B = [1, 0, 1, 0], e se B =
abbiamo B = [0, 0, 0, 0]. Si vede allora che i sottoinsiemi sono tanti quanti queste sequenze, che per
il teorema precedente sono esattamente 2n .
Un problema diverso, anche se analogo, `e quello di contare le sequenze ottenute con elementi di-

1!
2!
3!
4!
5!

1
2
6
24
120

6!
7!
8!
9!
10!

720
5040
40320
362880
3628800

Si veda la Sezione 1.5 per il valore esatto di 100!; si


veda anche la nota alla fine di questa sezione per il
valore approssimato di n!.
Il concetto pi`
u importante dellanalisi combinatoria
`e tuttavia quello di combinazione. Sia A un insieme
di n elementi; si dicono combinazioni a k a k degli elementi di A i sottoinsiemi di A contenenti esattamente
k elementi. Ad esempio, se A = {a, b, c}, le combinazioni a 2 a 2 sono i sottoinsiemi {a, b}, {a, c}, {b, c}.
Le combinazioni differiscono dalle disposizioni per il

101

4.1. CALCOLO COMBINATORIO


semplice fatto che le prime non tengono conto dellordine; cos` abbiamo le disposizioni [a, b] e [b, a], ma
solo la combinazione {a, b}. Questo ci d`a un semplice
metodo per contare quante sono le combinazioni a k
a k di un insieme di n elementi:
Teorema 4.3 Se A `e un insieme di n elementi, i
sottoinsiemi di A contenenti esattamente k elementi
sono:
n(n 1) (n k + 1)
.
Cn,k =
k!
Prova: Se Cn,k sono le combinazioni che dobbiamo contare, si osservi, come s`e fatto, che ad ogni
combinazione corrispondono pi`
u disposizioni; in effetti, da una combinazione si ottengono disposizioni
permutando in tutti i modi possibili gli elementi del
sottoinsieme. Ma se il sottoinsieme ha k elementi,
le sue possibili permutazioni sono k! e quindi si ha:
k!Cn,k = Dn,k . Da questa si ha la formula desiderata,
quando si sostituisca a Dn,k il valore precedentemente
trovato.
I numeri Cn,k si dicono coefficienti binomiali perche legati alle potenze di un binomio, come vedremo nella Sezione 5.1. Esiste una notazione accettata
universalmente:

n
n(n 1) (n k + 1)
=
Cn,k =
k!
k
che si legge n su k. Un semplice problema consiste
nel contare quanti ambi e quanti terni esistono nel
gioco del lotto; gli ambi sono i sottoinsiemi di due
elementi dellinsieme dei primi 90 numeri; i terni sono
i sottoinsiemi di tre elementi. Quindi gli ambi sono:

90 89
90
=
= 4005
2
21
e i terni:

0
1
2
3
4
5
6

0
1
1
1
1
1
1
1

5 6

1
2
3
4
5
6

1
3
6
10
15

1
4
10
20

1
5
15

1
6 1

Tabella 4.1: Il triangolo aritmetico


Europa e nel mondo arabo. Sicuramente, i coefficienti binomiali sono le quantit`a pi`
u utilizzate in tutta
la Matematica, in quanto legati alla numerazione dei
sottoinsiemi di un insieme.
Come si costruisce il triangolo aritmetico? Intanto osserviamo che la prima colonna e la diagonale
principale sono composte unicamente da 1:


n
n
=1
n N.
=1
n
0
Infatti, il primo di questi coefficienti binomiali conta
i sottoinsiemi di 0 elementi di un insieme di n elementi, ma tale `e solo linsieme vuoto (anche quando
n = 0). Per il secondo, si osserva invece che lunico
sottoinsieme di n elementi di un insieme di n elementi
`e linsieme stesso. Detto questo, ogni altro elemento del triangolo `e la somma dei due elementi che lo
sovrastano: quello nella riga precedente una posizione a sinistra e quello, ancora nella riga precedente,
ma proprio sopra di lui. Questo fatto si pu`o dimostrare facilmente; qui ne diamo una prova combinatoria, cio`e che fa uso della definizione dei coefficienti
binomiali come sottoinsiemi. Pi`
u avanti ne vedremo una dimostrazione algebrica, che cio`e fa uso delle
propriet`a numeriche dei coefficienti binomiali.

Teorema 4.4 Se n e k sono due interi positivi, si


ha:

n
n1
n1
=
+
.
k
k
k1
Poiche su una ruota (ad esempio, Napoli) vengono
estratti 5 numeri, questi corrispondono a:
Prova: Prima di cominciare la dimostrazione, si sia


certi di aver capito che questa identit`a corrisponde
5
5
= 10 ambi e a
= 10 terni diversi.
alla propriet`a del triangolo aritmetico enunciata pi`
u
2
3
sopra. Si consideri allora un insieme A di n elemenI coefficienti binomiali si possono disporre in un ti e se ne isoli un elemento particolare, diciamo a.
triangolo numerico infinito, noto come Triangolo di I sottoinsiemi di A composti di k elementi (che per
Tartaglia o triangolo di Pascal, o, per antonomasia, definizione sono nk ) si dividono in due classi: quelcome triangolo aritmetico (si veda la Tabella 4.1). li che contengono a e quelli che non lo contengono.
Tartaglia lo aveva scoperto nella prima met`a del 1500; Sono due classi chiaramente disgiunte e che esauriPascal laveva riscoperto intorno al 1650, quando si scono tutti i sottoinsiemi considerati; basta allora diinteressava alle prime ricerche sul calcolo delle pro- mostrare che le loro cardinalit`a sono proprio quelle
babilit`a. In realt`a, esso era gi`a noto ai cinesi del che formano il membro destro della formula delle1200 e se ne possono trovare anticipazioni anche in nunciato. Consideriamo la classe A1 dei sottoinsiemi
90
3

90 89 88
= 117. 480.
321

102

CAPITOLO 4. MATEMATICHE FINITE

che contengono a e immaginiamo di togliere a da A e denominatore per (n k)!, si ha:


e da questi sottoinsiemi: ci`o che si ottiene sono i sot
n
n(n 1) (n k + 1)
toinsiemi di k 1 elementi dellinsieme A \ {a}, un
=
=
k
k!
insieme di n1 elementi (`e facile vedere che sono proprio tutti:
basta
aggiungere di nuovo a); quindi A1
n(n 1) (n k + 1) (n k) 2 1
=
=
contiene n1
k1 elementi. Per la classe A2 dei sottoink!
(n k) 2 1
siemi che non contengono a, eliminare a da A vuol
n!
dire ottenere i sottoinsiemi di k elementi dellinsieme

(4.1)
=
A \ {a} di n 1 elementi; questi sono in tutto n1
,
k!(n
k)!
k
e il teorema `e dimostrato.
e questo permette di esprimere i coefficienti binomiali
in termini del solo fattoriale. Da questo discende la
a di simmetria:
Nota 4.1
Un problema che avevamo lasciato vo- propriet`
lutamente in sospeso `e il seguente: se si ha una parola
formata da n lettere diverse, i suoi anagrammi sono
n!, ma se la parola contiene alcune lettere uguali? Ad
esempio, con non si possono comporre solamente onn
e nno, cio`e vi sono in tutto tre possibilit`
a contro le sei
di ahi e di mio. E se volessimo sapere quanti sono gli
anagrammi di abracadabra?. Vale il seguente:
Teorema 4.5 Sia A = {a1 , a2 , . . . , an } un insieme di
n elementi e si considerino k1 repliche di a1 , k2 repliche di a2 , . . . , kn repliche di an . Il numero delle
sequenze distinte che si possono formare utilizzando
tutte queste repliche degli elementi di A `e:
(k1 + k2 + + kn )!
.
k1 ! k2 ! kn !
Prova: Cominciamo col distinguere le varie repliche
degli elementi di A, di modo che ci appaiano come elementi distinti. In questo caso le sequenze distinte che
si ottengono sono le permutazioni di tutti gli elementi
(con le loro repliche), cio`e sono (k1 + k2 + + kn )!.
Eliminiamo ora la distinzione tra le varie repliche di
a1 ; questo significa che tutte le sequenza distinte perche avevano repliche distinte di a1 nelle stesse posizioni, collassano nella medesima sequenza; ma tali sequenze si distinguono solo per lordine assunto dalle
k1 repliche di a1 e quindi sono k1 !. Questo vuol dire che, togliendo la distinzione tra le repliche di a1 ,
si hanno (k1 + k2 + + kn )!/k1 ! sequenze. Procedendo nello stesso modo per le repliche di a2 si passa
a (k1 + k2 + + kn )!/(k1 ! k2 !) sequenze. Alla fine,
naturalmente, si ottiene la formula desiderata.
Nel caso di abracadabra si hanno 5 repliche di a, 2
repliche di b e di r, 1 replica di c e di d; naturalmente,
k1 + k2 + + kn `e la lunghezza della parola e quindi
i possibili anagrammi sono:

Teorema 4.6 Per ogni valore di n e k n si ha:


n
n
.
=
k
nk
Prova: Passando alla espressione con i fattoriali, si
ha:

n!
n
=
=
nk
(n k)!(n (n k))!

n
n!
=
=
(n k)!k!
k
come si voleva.

Questa propriet`
a `e interessante perche, ad esempio,
per calcolare 20
17 dalla definizione occorre eseguire 32
prodotti, o addirittura 40 se applichiamo la formula
(4.1). Ma per la simmetria si ha:

20
20 19 18
20
=
=
= 1140.
3
17
6
Si osservino i seguenti casi particolari:

n
n
=n
=n
1
n1


n
n(n 1)
n
.
=
=
n2
2
2

La dimostrazione algebrica del Teorema 4.4 `e ora


semplice, anche se richiede un po di attenzione poiche si tratta di aggiungere e togliere fattori da certe
frazioni:

n1
n1
(n 1) (n k + 1)
+
+
=
(k 1)!
k1
k

(n 1) (n k + 1)(n k)
;
k!
moltiplichiamo e dividiamo la prima frazione per k,
la maggior parte dei quali non ha nessun senso ottenendo k! a denominatore. Le due espressioni sono
compiuto.
ora uguali eccetto per un fattore k nella prima e un
fattore (n k) nella seconda; ma la somma `e proprio
n, per cui:

Alcune propriet`a dei coefficienti binomiali sono den1


n1
=
+
gne dattenzione. Intanto, moltiplicando numeratore
k
k1
11!
= 83160,
5! 2! 1! 1! 2!

103

4.2. PERMUTAZIONI
(k + n k)(n 1) (n k + 1)
=
=
k!
Unaltra propriet`a `e:


n
.
k

Teorema 4.7 Per ogni valore di n e k n si ha:


n
n n1
=
k k1
k
Prova: Applicando la definizione:

n
n(n 1) (n k + 1)
=
=
k
k!
=

n (n 1) (n k + 1)
k
(k 1)!

come desiderato.

Questa formula fornisce un metodo efficiente per calcolare i coefficienti binomiali mediante il calcolatore.
Si ha infatti:
Algoritmo 4.1 (Coefficienti binomiali)
Ingresso: due numeri naturali n,k con n k;
Uscita: il coefficiente binomiale nk .

1. se k > n/2 si pone k := n k [si applica la


propriet`
a di simmetria];

2. se k = 0 si esce col risultato 1;


3. altrimenti, si pone m := n, h := k ed r := 1 e
quindi:
(a) si calcola r := r m/h;

(b) si diminuiscono m ed h di 1;

(c) se h 6= 0 si cicla tornando al punto 3a;


4. si esce col valore r = Cn,k .

Questa formula si prova in modo quasi immediato,


una volta accettata lapprossimazione di Stirling e
pertanto lasciamo la dimostrazione alla buona volont`
a
del lettore.

4.2

Permutazioni

Le permutazioni, che abbiamo introdotto nella precedente sezione, meritano unattenzione speciale, e ad
esse dedicheremo ora un po di spazio. Permutare
gli elementi dellinsieme {a, b, c} o quelli dellinsieme {1, 2, 3} `e la stessa cosa, una volta che abbiamo
identificato, ad esempio, a con 1, b con 2 e c con 3.
Pertanto, dora in avanti, salvo avviso contrario, considereremo linsieme di n elementi Nn = {1, 2, , n}
e le permutazioni su di esso. La classe di tutte le
permutazioni di tale insieme si indica con Pn ; le permutazioni stesse hanno varie notazioni, delle quali `e
bene conoscere le tre principali.
Osserviamo prima di tutto che laver definito le permutazioni per mezzo delle disposizioni d`a immediatamente un ovvio modo di scriverle: in testa il primo
elemento scelto, poi il secondo e cos` via. Si ottiene cos` una lista, nella quale lordine degli elementi
`e essenziale, perche indica lordine di scelta. Pertanto, (3, 2, 1) `e una permutazione diversa da (2, 1, 3) e
da (1, 3, 2); come si vede, gli elementi si raggruppano tra parentesi tonde, ed in effetti una permutazione cos` scritta `e una n-upla o un vettore, e il modo
di rappresentarla si dice notazione vettoriale. Le sei
permutazioni di P3 si denotano:
(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1).

Si osservi che per scrivere sistematicamente tutte


le
permutazioni di Pn si pu`o fissare il primo elemenI coefficienti binomiali che richiedono pi`
u temto,
facendolo variare da 1 ad n, e scrivendogli accanto
po per il calcolo
2nsono i cosiddetti coefficienti bino- tutte le permutazioni degli altri n 1 elementi, che
miali centrali n ; infatti, per essi la propriet`a di
(tenendo presente lelemento messo in prima posiziosimmetria non fornisce alcun aiuto.
ne) si ottengono esattamente nella stessa maniera. In
Nota 4.2
Verso il 1730 il matematico inglese Ja- questo modo abbiamo scritto le permutazioni di P3 e
mes Stirling trov`
o una formula approssimata per invitiamo il lettore a fare lo stesso per le 24 permutan!:
n n
zioni di P4 . La notazione vettoriale `e particolarmente

n! 2n
utile quando si trattano le permutazioni con lelaboe
dove e = 2.7182818284 . . . `e la base dei logaritmi na- ratore, dove i vettori sono una struttura dati molto
turali. Ad esempio, per n = 10 il valore vero `e quello semplice da definire ed utilizzare. Essa, tuttavia, non
visibile nella precedente tabella sui fattoriali, mentre `
e la notazione preferita dai matematici.
la formula di Stirling d`
a: 3. 598. 695.62, con un erroUn attimo di riflessione ci fa capire che una permure dello 0.84%. Purtroppo, la dimostrazione di questa tazione `
e una funzione di Nn con se stesso: scegliere
formula famosissima va al di l`
a della struttura elemen- un primo elemento vuol dire associare al numero 1
tare di questo testo. La formula di Stirling ci permet- proprio quellelemento; scegliere un secondo elemente di trovare un valore approssimato per i coefficienti
to significa associare tale elemento al numero 2, e
binomiali centrali:
cos` di seguito. Abbiamo visto che tutte le funzioni
!
(2n)!
4n
2n
Nn Nn sono nn , mentre le permutazioni non sono
.
=
n!2
n
proprio tutte le funzioni, poiche le immagini devono
n

104
essere tutte differenti; questo ci dice che n! nn (in
effetti, per n > 2 si ha n! < nn ). Ma a quali funzioni
corrispondono le permutazioni? Il fatto che le immagini debbano essere tutte diverse ci dice che siamo
di fronte a funzioni iniettive; poiche poi, per costruzione, una permutazione prende tutti gli elementi del
suo codominio Nn , le funzioni sono anche surgettive.
Concludendo, le permutazioni di Nn sono tutte e sole
le corrispondenze biunivoche di Nn .
Questa `e la definizione preferita dai matematici ed
essa ci porta immediatamente a un altro tipo di notazione: la notazione funzionale. Si scrivono i numeri
da 1 ad n su una riga e, sotto ad ognuno di essi, si
scrive lelemento corrispondente nella permutazione,
cio`e limmagine nella corrispondenza biunivoca. Le 6
permutazioni di P3 sono:

1 2 3
1 2 3
1 2 3
1 2 3
1 3 2
2 1 3

1 2 3
1 2 3
1 2 3
.
2 3 1
3 1 2
3 2 1
Per scrivere le permutazioni, c`e ancora un altro
modo che fa furore in Matematica. Prendiamo lultima delle sei permutazioni e partiamo dal numero 1; la
sua immagine `e il 3, e limmagine di questo `e ancora
1. Con un modo di dire caratteristico, ci`o si esprime
cos`: l1 va nel 3 e il 3 va nell1. Se prendiamo una
permutazione di P8 :

1 2 3 4 5 6 7 8
5 4 8 6 3 2 1 7

abbiamo una catena pi`


u lunga: l1 va nel 5, il 5 va
nel 3, il 3 va nell8, l8 va nel 7, e infine il 7 va (o
torna) nell1. Una catena siffatta si dice tecnicamente un ciclo, e in questa permutazione ne troviamo un
secondo, composto da 2, 4 e 6. Un ciclo si pu`o ridurre
a un elemento solo, come il 2 nellultima permutazione di P3 ; in questo caso lelemento si dice un punto
fisso della permutazione. Dovrebbe essere chiaro che
una permutazione `e composta sempre da un numero
finito di cicli, e due cicli, o contengono gli stessi elementi o sono disgiunti tra di loro. Questo permette
di definire una notazione a cicli per le permutazioni:
ogni ciclo si scrive tra parentesi tonde, a partire dallelemento pi`
u piccolo. La precedente permutazione
di P8 viene denotata come (1 5 3 8 7) (2 4 6) e le
solite permutazioni di P3 sono:

CAPITOLO 4. MATEMATICHE FINITE


questo infatti permette di distinguere la permutazione (1 3 2), formata da un unico ciclo, dalla notazione
vettoriale (1, 3, 2) che rappresenta una permutazione
completamente diversa. Con le convenzioni adottate,
scrivere un ciclo con in testa lelemento pi`
u piccolo
e ordinare i cicli secondo il primo elemento, fa s` che
la rappresentazione a cicli di una permutazione sia
unica. E bene avvertire, tuttavia, che non sempre
si adotta tale convenzione e capiter`a anche a noi di
considerare cicli non disgiunti e/o non ordinati.
Questa lunga premessa notazionale `e indispensabile, perche occorre avere ben presenti le tre notazioni
e saper passare agilmente dalluna allaltra. Infatti,
a seconda di come si vuol trattare una permutazione (o un insieme di permutazioni) conviene ricorrere
a una notazione specifica. Veniamo ora ad effettive
propriet`a delle permutazioni. In ogni insieme Pn c`e
sempre una permutazione nella quale ogni elemento
ha se stesso come immagine; questo significa che ogni
elemento `e un punto fisso o, nella definizione con le
disposizioni, alla scelta k-esima si prende proprio il
numero k. Questa speciale permutazione si chiama
identit`
a e, come ora vedremo, ha un ruolo particolare. La preferenza dei matematici per laspetto funzionale delle permutazioni non `e ovviamente dovuta a
qualche ghiribizzo; queste serissime persone agiscono
a ragion veduta e sanno bene che per le funzioni in
generale (e quindi per le permutazioni in particolare) `e possibile considerare unoperazione speciale: la
composizione (v. Sezione 1.3).
Si considerino le seguenti permutazioni di P5 :

1 2 3 4 5
1 2 3 4 5
=
=
.
3 5 2 1 4
4 2 5 1 3

Ricordiamo che la composizione di due funzioni e


avviene cos`: si prende un qualsiasi elemento x nel
dominio di e se ne considera limmagine (x); se
questa appartiene al dominio di , le si applica la
stessa ottenendo ((x)), che, per definizione, `e
limmagine di x secondo la composizione , cio`e:
( )(x) = ((x)). Si dice allora composizione o
prodotto di due permutazioni la loro composizione come funzioni. Per le permutazioni in Pn dominio e codominio coincidono, e quindi la composizione `e sempre possibile e applicabile a tutti gli elementi. Si ha
pertanto:

1 2 3 4 5
1 2 3 4 5
=

=
3 5 2 1 4
4 2 5 1 3

(1)(2)(3), (1)(2 3), (1 2)(3), (1 2 3), (1 3 2), (1 3)(2).


1 2 3 4 5
=
.
5 3 2 4 1
I punti fissi spesso non si scrivono; lunica eccezione `e
la permutazione composta di tutti punti fissi; essa si Infatti, limmagine di 1 secondo `e 3, e limmagine
scrive semplicemente (1), ignorando gli altri elemen- di 3 secondo `e 5, di modo che ((1)) = 5. Per
ti. Si osservi che, per convenzione, la separazione fra gli altri elementi si procede in modo analogo. Queldue elementi di un ciclo `e data da uno spazio bianco; la che si ottiene `e ancora una permutazione di P5 ,

4.2. PERMUTAZIONI
in quanto, come sappiamo, la composizione di due
corrispondenze biunivoche `e ancora biunivoca. Loperazione di composizione `e allora chiusa in Pn , e
ci possiamo chiedere di quali altre propriet`a essa goda. E facile vedere che la composizione `e associativa,
cio`e che date tre permutazioni di Pn , diciamo , , ,
si ha ( ) = ( ) : in effetti, considerato un
qualsiasi elemento k Nn , comunque si costruisca la
composizione, il risultato finale `e sempre (((k))).
Non vale invece la propriet`a commutativa; un unico
esempio, cioe un controesempio, `e sufficiente a farci
vedere che in generale `e 6= . Prendendo le
due permutazioni di P5 gi`a considerate si ha:

1 2 3 4 5
1 2 3 4 5
=

=
4 2 5 1 3
3 5 2 1 4

105
infiniti; ad esempio, sono tali Z, linsieme dei numeri
interi con loperazione di somma; i numeri razionali
positivi Q+ con loperazione di prodotto; i numeri
reali positivi R+ con la stessa operazione, e cos` via.

Una permutazione che si riduca allo scambio di due


elementi si dice una trasposizione; ad esempio, in P5
una trasposizione `e:

1 2 3 4 5
;
1 5 3 4 2

nella notazione a cicli essa si scrive semplicemente


(2 5), in quanto i due elementi che si scambiano formano un ciclo, tutti gli altri sono punti fissi. E interessante osservare che un ciclo pu`o sempre essere
immaginato come il risultato (cio`e, la composizione)

1 2 3 4 5
di un certo numero di trasposizioni. Ad esempio,
=
6= .
1 5 4 3 2
(2 5 3), per cui 2 va in 5 e questi va in 3, pu`o esLa permutazione con tutti punti fissi, che abbia- sere visto come la trasposizione (2 3) composta con
mo chiamato identit`a, si comporta come tale nella laltra trasposizione (3 5). Infatti abbiamo:
composizione; infatti, essa manda ogni elemento in
1. il 2 va in 3 e questo va in 5, cio`e, nella
se stesso e quindi lascia invariata la destinazione che
composizione, il 2 va nel 5;
ogni altra permutazione ha assegnato a ciascun ele2. il 3 va nel 2 e poi questo rimane fisso nella
mento, cio`e: (1) = (1) = . Questo giustifica
seconda trasposizione;
il nome che le abbiamo dato. Ci`o che per`o `e pi`
u interessante `e il fatto che ogni permutazione abbia un
3. il 5 rimane fisso nella prima trasposizione e poi
inverso, cio`e una permutazione, indicata da 1 , tale
va nel 3.
che 1 = 1 = (1). Si scambino infatti le
due linee che definiscono nella notazione funzionale Tutti gli altri elementi rimangono fissi, ma losservae si riordinino gli elementi in modo da far appari- zione vale in generale, anche se gli altri elementi core in sequenza quelli della linea divenuta superiore, stituiscono cicli per proprio conto (purche non intere cambiando di posizione anche i corrispondenti ele- feriscano con quello considerato). Esiste una regola
menti della linea inferiore. Per la permutazione gi`a generale per capire da quali trasposizioni `e composto
considerata, si ha ad esempio:
un ciclo (a b c . . . m n): basta considerare il prodotto


(a n)(n m) (d c)(c b). A parte la prima trasposi3 5 2 1 4
1 2 3 4 5
1 =
=
. zione, nella quale il primo elemento va nellultimo,
1 2 3 4 5
4 3 1 5 2
le altre mandano ogni elemento nel precedente. Eseguendo la composizione, a va in n, che va in m, che
Questa nuova permutazione gode della seguente
va . . ., che va in d, che va in c, che va in b: in conpropriet`a derivata proprio dalla sua costruzione: se
clusione, a va in b. A questo punto b va in c, il che
manda k in h, allora 1 manda h in k. Quando si va
`e definitivo poiche c non `e presente in trasposizioni
a fare la composizione, pertanto, k va in h e e questo
successive. Cos` c va in d, non pi`
u coinvolto nelle tratorna in k, cio`e `e un punto fisso. Ci`o accade per ogni
sposizioni
successive,
e
via
di
seguito.
Infine, n va in
k Nn , e perci`o 1 = (1). Analogamente si
a,
chiudendo
il
ciclo,
come
si
voleva.
trova 1 = (1).
Riprendendo come esempio la permutazione di P8
vista
sopra, possiamo scrivere:
Nota 4.3
Queste, come vedremo nella Sezione
5.8, sono le propriet`
a di gruppo (non commutativo).
I gruppi sono la pi`
u importante struttura algebrica
e, storicamente, i gruppi di permutazioni, cio`e i
nostri Pn , sono stati i primi considerati allinizio
del 1800.
Essi costituiscono un importantissimo
esempio di gruppi finiti, cio`e contenenti un numero
finito di elementi. Si pu`
o addirittura dimostrare che
ogni gruppo finito `e un sottogruppo di un gruppo
di permutazioni. Si scoprirono poi anche gruppi

(1 5 3 8 7)(2 4 6) = (1 7)(7 8)(8 3)(3 5)(2 6)(6 4)


e il lettore `e invitato caldamente ad eseguire il prodotto delle trasposizioni per verificare che la permutazione ottenuta `e proprio quella di partenza. Quando abbiamo un punto fisso, osserviamo che anchesso
`e esprimibile come prodotto di due trasposizioni; ad
esempio, (1) = (1 2)(1 2). Anche 2 rimane fisso in

106
questo prodotto, il che `e corretto: se 2 `e un punto
fisso di tutta la permutazione, rimane ancora fisso;
se non lo `e, queste due trasposizioni non cambiano
nulla e nulla viene modificato in ci`o che segue e in
ci`o che precede nellespressione della permutazione.
Abbiamo cos` dimostrato:
Teorema 4.8 Ogni permutazione pu`
o essere espressa come prodotto di trasposizioni.
Un altro esempio, che coinvolge anche punti fissi,
`e:
(1 4 6 7)(2)(5 9 8) = (1 7)(7 6)(6 4)(2 5)(2 5)(5 8)(8 9).
In realt`a, il teorema precedente pu`o essere rafforzato
nel modo seguente. Se a un prodotto di trasposizioni ne aggiungiamo 2 come (a b)(a b) il risultato non
cambia; questo significa che una permutazione pu`o
essere scritta in vario modo come prodotto di trasposizioni; si pu`o per`o dimostrare (anche se noi non lo
facciamo) il seguente:
Teorema 4.9 Se una permutazione `e esprimibile
come numero pari (dispari) di trasposizione, ogni altra rappresentazione di contiene un numero pari
(dispari) di trasposizioni.
Una permutazione si dice allora pari o dispari a seconda del numero di trasposizioni con cui pu`o essere
scritta. Poiche il prodotto si ottiene semplicemente scrivendo le trasposizioni di seguite da quelle
di , si ha immediatamente:
Teorema 4.10 Il prodotto di due permutazioni entrambi pari o entrambi dispari `e sempre pari; il prodotto di una permutazione pari e una dispari (o
viceversa) `e sempre dispari.
Una rappresentazione mediante trasposizioni della
permutazione contiene, per costruzione, cicli non
disgiunti, cio`e cicli nei quali un elemento pu`o comparire pi`
u volte. Questo non `e vero, come si `e osservato,
per la rappresentazione standard. Questa, per certe
permutazioni, pu`o essere composta da soli punti fissi
e trasposizioni; detta una tale permutazione, se si
esegue il prodotto = 2 si trova che: i) i punti fissi rimangono tali; ii) gli elementi di una trasposizione
(a b), moltiplicando questa per se stessa, divengono
due punti fissi (a)(b). In conclusione, 2 contiene solo punti fissi, cio`e 2 = (1). Una permutazione che
gode di questa propriet`a si dice una involuzione; risulta facile vedere che tutte e sole le involuzioni sono
composte di cicli disgiunti di un solo elemento (punti fissi) e/o di due elementi (trasposizioni). Si provi
ad esempio ad eseguire il quadrato di P8 con
= (1 4)(2 5)(6 8).

CAPITOLO 4. MATEMATICHE FINITE


Nota 4.4

Le permutazioni hanno un ruolo fondamentale in molte parti dellInformatica. Il problema


dellordinamento consiste nel partire da una permutazione qualsiasi Pn e trovare un algoritmo (pi`
u
veloce possibile) che permetta di rimettere in ordine
gli elementi di . Il caso in cui il dominio di sia Nn
non `e molto interessante, in quanto la soluzione `e lo
stesso Nn . Se invece il dominio di `e, ad esempio,
un insieme di nomi, di numeri qualsiasi o di codici,
il problema ha un interesse pratico effettivo e soluzioni non banali. Si pensi allanagrafe di un comune,
ai dipendenti di unazienda, ai codici fiscali dei contribuenti, ai codici dei prodotti di un supermercato.
In questi casi, elenchi disordinati non servono a nulla,
come sono inutili dizionari non ordinati o elenchi telefonici con i nomi messi a caso. Per questo, ordinare un
elenco `e considerata unoperazione fondamentale, che
oggi facciamo compiere agli elaboratori. Questi usano
algoritmi molto veloci, e lo studio e la realizzazione di
tali algoritmi costituiscono un problema di base dellInformatica. Su di essi si sono cimentati scienziati di
primo piano, che hanno proposto algoritmi oggi usati
universalmente, anche se le ricerche in questo settore
continuano senza tregua.
Un altro importante problema in cui intervengono
le permutazioni `e quello cosiddetto del commesso
viaggiatore. Un commesso viaggiatore, partendo da
una citt`
a X (diciamo, la citt`
a in cui abita) deve
visitare le citt`
a A1 , A2 , , An , in un ordine che egli
pu`
o scegliere, ma che, ovviamente, sia quello che gli
procura meno spese. Il nostro commesso conosce i
costi che gli si presenteranno in ogni tratta Ai Aj e
quindi, teoricamente, potrebbe considerare tutte le
n! possibili permutazioni, far eseguire allelaboratore
i relativi conteggi, e scegliere infine la permutazione
per lui pi`
u conveniente. Purtroppo, il numero di
permutazioni cresce, come s`e visto, in modo troppo
veloce e gi`
a per un numero di citt`
a piuttosto limitato,
come potrebbe essere 20, il numero di strade da
tentare `e dellordine di 1019 , un numero enorme
anche per il pi`
u veloce dei nostri elaboratori. A
tuttoggi non si conoscono metodi migliori di quello
(abbastanza ovvio) di tentare tutte le permutazioni
per essere sicuri di trovare il percorso ottimo. Per
questo il problema del commesso viaggiatore costituisce uno dei problemi difficili; tecnicamente, si dice un
problema intrattabile o che fa parte dei problemi NP.
Insieme al problema della scomposizione in fattori
primi, a quello della soddisfacibilit`
a dei predicati
visto nella Nota 1.11 (e a tanti altri) `e una delle
bestie nere dellInformatica.

4.3

Problemi combinatori

I problemi dellAnalisi Combinatoria sono, in generale, problemi di conteggio e, come tali, possono sorgere
in qualsiasi contesto; come s`e detto, si pu`o affermare
che lAnalisi Combinatoria si interessa degli insiemi

107

4.3. PROBLEMI COMBINATORI


finiti, dei quali vuole contare i sottoinsiemi che posseggono una qualche propriet`a caratteristica. Le disposizioni e le combinazioni sono esempi elementari,
ma significativi; spesso si ha a che fare con situazioni
particolari, come quando si desidera contare le possibili posizioni delle regine su una scacchiera, disponendole in modo che non si possano reciprocamente
mangiare. In questi casi, il problema specifico viene
generalizzato, e si cerca una formula che dia il numero
di posizioni quando si hanno n regine e una scacchiera di n n caselle. Quello, che `e forse il pi`
u antico
dei problemi combinatori, si trova citato in testi egizi
e babilonesi; ha resistito ai secoli ed oggi si ritrova
in forma di filastrocca in tanti paesi. In Italia suona
cos`:
Per una strada che mena a Camogli
passava un uomo con sette mogli.
E ogni moglie aveva sette sacche,
e ogni sacca aveva sette gatte,
e ogni gatta sette gattini.
Fra gatti e gatte e sacchi e mogli,
in quanti andavano, dite, a Camogli?
Il lettore pu`o usare i teoremi che abbiamo visto
nella Sezione 3.2, relativamente alle progressioni
geometriche, per risolvere la questione.
Un problema combinatorio molto pi`
u interessante
risale a Fibonacci, il quale invent`o il seguente quesito:
un contadino possiede una coppia di conigli appena
nati; i conigli diventano fertili dopo un mese, e un
mese `e anche il loro periodo di gestazione. Ogni coppia di conigli genera ogni mese (eccetto il primo dopo
la nascita, durante il quale giunge alla maturit`a sessuale) unaltra coppia di conigli. Pertanto, il contadino, allinizio del secondo mese, avr`a ancora ununica
coppia, ma allinizio del terzo mese avr`a due coppie.
Allinizio del quarto mese, la prima coppia avr`a generato una seconda coppia, e siamo cos` a tre coppie.
Al quinto mese, sia la coppia primigenia, sia la prima coppia generata avranno dei figli; in tal modo,
le coppie saranno diventate cinque. Si chiede quante
coppie di conigli possieder`a il nostro contadino dopo
n mesi, nellipotesi (abbastanza teorica) che nessun
coniglio muoia, per cause naturali o alimentari?
Sia Fn il numero di coppie di conigli in possesso
del contadino allinizio delln-esimo mese; allinizio
del successivo egli avr`a queste n coppie, pi`
u le coppie nate quel mese; ma queste sono esattamente tante
quante le coppie fertili alln-esimo mese, cio`e le coppie
presenti il mese precedente, ovvero Fn1 . Abbiamo
quindi la relazione Fn+1 = Fn + Fn1 , che possiamo
considerare assieme alle condizioni iniziali F1 = 1
ed F2 = 1, le coppie di conigli possedute allinizio
del primo e del secondo mese. Abbiamo gi`a incontrato questa sequenza di numeri e possiamo supporre F0 = 0 mantenendo tutte le caratteristiche viste.

Questa storia giustifica il nome di numeri di Fibonacci dato agli elementi della sequenza. La soluzione
del problema di Fibonacci `e dato dal seguente:
Teorema 4.11 Ln-esimo numero di Fibonacci vale:

!n !
!n
1
1 5
1+ 5
Fn =

.
2
2
5
Prova: Procedendo per induzione, osserviamo che,
dalla formula, discende subito F0 = 0 e:

1
1+ 51+ 5
F1 =
= 1.
2
5
Il lettore pu`o continuare e verificare altri valori, ma
questi due sono sufficienti come base del ragionamento. Supponiamo che ci siano valori di n per i quali la
formula del teorema non sia valida; chiamiamo m il
loro valore pi`
u piccolo, che deve esistere e deve essere
maggiore di 1 per le verifiche fatte. Per m1 ed m2
la formula deve perci`o essere valida e proviamo a calcolare Fm1 + Fm2 che per la propriet`a dei numeri
di Fibonacci deve essere uguale proprio ad Fm :
Fm = Fm1 + Fm2 =

!m1
!m1
1 5
1 1+ 5

+
=
2
2
5

!m2
!m2
1+ 5
1 5
=
+

2
2

!m2
!
1+ 5
1 1+ 5
1+
+
=
2
2
5

!
!m2
1 5
1 5
.
1+

2
2

Ora osserviamo che:

!2

1+ 5
1+2 5+5
1+ 5
=
=
1+
2
4
2

e unanaloga identit`a vale per 1+(1 5)/2. Pertanto


si ha:
Fm1 + Fm2 =

!m
!m !
1+ 5
1
1 5
=
= Fm

2
2
5
contro lipotesi che per Fm non valesse questa formula. Questo dimostra che non esiste un valore di m,
per cui la formula non valga, cio`e, in altre parole, la
formula `e valida per ogni numero naturale n.

108
Questa dimostrazione, che abbiamo voluto portare avanti secondo la formulazione delle prove per induzione vista nel primo capitolo, mette in evidenza
lutilit`a e i limiti dellinduzione. I conti che abbiamo
fatto sono elementari, e quindi ci convincono che la
formula per Fn `e proprio quella data dal teorema. Ma
come ha fatto lo scopritore di questa formula a immaginare unespressione del genere che, allapparenza, `e
notevolmente complessa? In realt`a si `e arrivati alla
scoperta della formula per tuttaltra via e, come abbiamo gi`a avuto modo di dire, linduzione non ci aiuta
affatto a scoprire le formule. Si provi, ad esempio, ad
immaginare una formula per Gn , definito dalla relazione Gn = Gn1 + 2Gn2 , apparentemente simile a
quella dei numeri di Fibonacci. Anche se imponiamo
le condizioni iniziali G0 = 0 e G1 = 1, la soluzione `e
completamente diversa. Essa `e riportata in fondo a
questa sezione ed `e molto pi`
u semplice di quella dei
numeri di Fibonacci. Se il lettore `e comunque riuscito a scoprirla dopo aver osservato alcuni elementi
della sequenza, merita i nostri complimenti. Va detto, tuttavia, che esistono metodi del tutto generali
per trovare la soluzione di tutte le sequenze, i cui
elementi sono definiti da ricorrenze del tipo visto.
I conigli di Fibonacci o le mogli che vanno a Camogli ci mostrano che i problemi combinatori possono nascere in qualsiasi contesto. Per semplificarne
lanalisi, e quindi la risoluzione, i matematici hanno
proposto e studiato alcune classi standard di oggetti,
ai quali tentare di ricondurre problemi nati in situazioni diverse. Queste classi, o i loro elementi, sono
detti genericamente oggetti combinatori e su di essi
si concentra lAnalisi Combinatoria; `e chiaro che se
un problema qualsiasi pu`o essere ricondotto a uno
equivalente ma che si riferisce a qualche tipo di oggetto combinatorio noto, allora o se ne ha gi`a una
soluzione o si `e sulla strada per trovarla, poiche `e pi`
u
facile trattare oggetti con propriet`a ben conosciute,
piuttosto che gli strani insiemi, nei quali era stato
formulato il problema originale. Vedremo pi`
u avanti
una serie di oggetti combinatori utilizzati dai matematici; come sempre accade, alcuni sono stati studiati maggiormente, altri un po meno; alcuni sono
pi`
u ricchi di propriet`a, altri pi`
u poveri; alcuni hanno maggiormente stimolato la fantasia, altri non sono
stati altrettanto fortunati. Non potremo certo essere
esaurienti in un campo per molti versi assai ricco di
proposte, di alternative e di mode.
Alcune classi di oggetti combinatori si sono affermate in modo speciale, costituendo punti di attrazione tanto da diventare veri e propri paradigmi a cui
ricondurre la dimostrazione di propriet`a combinatorie
molto disparate. Per questo motivo, tali classi hanno
assunto il ruolo di modelli combinatori, strutture di
riferimento a cui ricondursi quasi costantemente. La

CAPITOLO 4. MATEMATICHE FINITE


variet`a e limprevedibilit`a dei problemi combinatori
fanno s` che anche questi modelli non esauriscano le
possibilit`a di soluzione da prendere in considerazione, ma di sicuro sono i primi oggetti a cui cercare di
riportare un problema nuovo.
Il modello delle urne. Uno dei modelli combinatori pi`
u vecchi e pi`
u usati `e quello detto delle urne.
Si supponga di avere un certo numero di contenitori, detti convenzionalmente urne, e degli oggetti che,
a seconda dei gusti di chi usa il modello, sono detti
gettoni o palline. Le urne possono essere tutte uguali
(cio`e, come si dice, indistinguibili) o possono essere
una distinta dallaltra, ad esempio per mezzo di un
numero di identificazione; analogamente, le palline
possono essere indistinguibili o di diverso colore. Ad
esempio, se le urne sono n e tutte uguali, e le palline
dello stesso colore, possiamo immaginare di mettere
o non mettere una pallina in ciascuna delle urne. Se
ci chiediamo in quanti modi diversi possiamo inserire
una pallina in ciascuna delle urne, otteniamo lo stesso problema del lancio delle monete. Allopposto, se
le urne sono numerate 1, 2, . . . , n e in ciascuna di esse
inseriamo una pallina fra n palline distinte da n colori diversi, otteniamo esattamente le n! permutazioni
che ben conosciamo. Come si vede da questi esempi,
le urne e le palline simulano gli insiemi e gli elementi,
e numerazione e colorazione possono simulare le funzioni. Oggi, quando ormai il linguaggio degli insiemi
`e insegnato (quando lo `e) fin dalla scuola elementare
ed `e diventato abbastanza comune, `e spesso pi`
u facile ragionare in termini di insiemi, elementi e funzioni
piuttosto che di urne, palline e colori. Per questo motivo il modello delle urne non si usa pi`
u molto spesso
e, personalmente, devo dire che non mi `e mai stato
particolarmente simpatico.
Ad onor del vero, il modello delle urne serve bene
a introdurre un principio che risulta utile in diversi ragionamenti. In inglese si chiama pigeon hole
principle, un nome che, come ora vedremo, `e perfettamente appropriato. Il termine principio vuole
mettere in evidenza che si tratta di una verit`a piuttosto ovvia, anche se di ampia applicazione. Noi lo
possiamo enunciare come un vero e proprio teorema:
Teorema 4.12 (pigeon hole principle) Se supponiamo di avere n urne ed almeno n + 1 palline
da distribuire nelle urne, esiste almeno unurna che
verr`
a a contenere pi`
u di una pallina.
Prova: Se nessuna urna contenesse pi`
u di una pallina, queste potrebbero essere al pi`
u n, contro lipotesi
fatta.
Naturalmente, il nome inglese del principio fa riferimento al fatto che n + 1 piccioni non possono tutti
avere un proprio buco sotto il tetto, se i buchi a disposizione sono solo n. Alcuni problemi, che sembrano

109

4.3. PROBLEMI COMBINATORI


formidabili, si risolvono facilmente applicando il principio. Ci si pu`o chiedere, ad esempio, se in una citt`a
di 200. 000 abitanti ci sono due donne che hanno lo
stesso numero di capelli (parliamo di donne, poiche
due uomini completamente calvi hanno, in modo banale, lo stesso numero di capelli: zero). Di fronte a
questo problema ci si sente un po sconcertati, ma
basta pensare a questo: il numero dei capelli di una
donna pu`o variare da 40 a 50 mila; possiamo allora
immaginare di avere, diciamo, 60 mila urne numerate da 1 a 60. 000, dove il numero k rappresenta k
capelli; ogni donna inserisce una pallina nellurna designata col numero dei propri capelli. La procedura
`e solo ideale, ma ci fa capire che due almeno delle
100. 000 palline, per il principio dei piccioni, devono
finire nella stessa urna. In modo analogo, visto che
in citt`a viaggio spesso in autobus, mi `e capitato di
chiedermi se mi `e mai successo di viaggiare due volte
sullo stesso mezzo. Ormai ho preso lautobus per pi`
u
di mille volte e lAzienda dei trasporti pubblici ha al
massimo a disposizione un paio di centinaia di mezzi:
il principio dei piccioni permette di dare una risposta immediata. Ignoro invece se ho preso almeno una
volta ciascuno degli autobus dellAzienda; su questo
quesito, purtroppo, il principio non ci aiuta.
Numeri figurati. Probabilmente, i pi`
u antichi
oggetti combinatori sono i cosiddetti numeri figurati. Tutti sappiamo che 25 `e il quadrato di 5 perche
occorrono 25 gettoni per disporli su un quadrato che
abbia per lato 5 gettoni. I numeri quadrati si ottengono appunto in questo modo e, partendo da un
unico gettone, si ottengono gli altri numeri quadrati
procedendo come nella Figura 4.1. Si pu`o osservare che ogni volta si aggiunge un numero dispari di
gettoni: prima 3, poi 5, poi 7 e cos` via. Come ricordiamo, abbiamo dimostrato fin dal primo capitolo che
la somma dei primi n numeri dispari `e uguale ad n2 ,
ed ora, se si vuole, abbiamo una prova combinatoria
di tale fatto.

Figura 4.1: Numeri quadrati e numeri triangolari


I Pitagorici, accanto ai numeri quadrati, considerarono i numeri triangolari, pentagonali, esagonali e,
in generale, i numeri poligonali. Ln-esimo numero
triangolare Tn ha una base composta da n gettoni;

sopra ad essa sono disposti n 1 gettoni, e sopra ancora n 2, fino a ridursi a un solo gettone. Pertanto
si ha:
n(n + 1)
Tn = 1 + 2 + + n =
2
come abbiamo dimostrato nel Corollario 3.11. Gli
stessi Pitagorici si divertirono a trovare molte propriet`a dei numeri triangolari che, bisogna dire, sono
piuttosto curiose. Limitiamoci qui a qualche considerazione elementare. Intanto, `e immediato dimostrare
che Tn + Tn1 = n2 ; una dimostrazione algebrica si
ottiene sostituendo a Tn e Tn1 il loro valore appena
trovato. Pi`
u interessante `e dare di questa relazione
una dimostrazione combinatoria, cio`e basata sugli oggetti combinatori considerati. Nel nostro caso, basta
dividere un numero quadrato mediante una retta, ad
esempio al di sotto della diagonale che va da sinistra
in alto a destra in basso, e osservare che al di sopra
della retta si hanno Tn gettoni e al di sotto Tn1 .
Meno immediato `e il seguente:
Teorema 4.13 Per ogni numero naturale n si ha:
2
Tn2 Tn1
= n3 .
Prova: Questa relazione lega i numeri triangolari ai
numeri cubi, che possiamo considerare numeri figurati in tre dimensioni. La dimostrazione algebrica `e
abbastanza immediata:
2
Tn2 Tn1
=

n2 (n + 1)2 (n 1)2 n2
n2

=
((n+1)2 (n1)2 ) =
4
4
4

n2
n2
(n + 1 + n 1)(n + 1 n + 1) =
2n 2 = n3
4
4

dove abbiamo applicato il prodotto notevole della


differenza di due quadrati.
Unosservazione importante che conviene fare a
questo punto `e la seguente: ogni volta che sappiamo
qualcosa sulla differenza di due elementi consecutivi
di una sequenza, sappiamo automaticamente qualcosa sulle somme della sequenza di tali differenze. Per
essere pi`
u precisi, dimostriamo il seguente risultato;
esso `e un po ridotto rispetto a quello che potremmo
fare, ma `e sufficiente ai nostri scopi:
Teorema 4.14 Si abbiano due sequenze {An }nN e
{Bn }nN con A0 = B0 = 0; allora An An1 = Bn
se e solo se An = B1 + B2 + + Bn .
Prova: Supponiamo dapprima che An sia la somma
dei primi n elementi della sequenza {Bn }nN ; allora
sar`a anche: An1 = B1 +B2 + +Bn1 , e sottraendo
membro a membro questa relazione dalla precedente,
si ha An An1 = Bn , cancellandosi tutti gli altri

110

CAPITOLO 4. MATEMATICHE FINITE

elementi. Se, viceversa, An An1 = Bn ,, avremo


anche:
An An2 = An An1 +An1 An2 = Bn +Bn1 .
Si pu`o andare avanti con An An3 = Bn + Bn1 +
Bn2 , e cos` via fino ad ottenere:
An A0 = Bn + Bn1 + + B1 ,
da cui deriva la conclusione, essendo per ipotesi A0 =
0.
Da questo teorema otteniamo, come immediato corollario, che ogni numero triangolare Tn `e dato dalla
Figura 4.2: Numeri pentagonali
radice quadrata della somma di tutti i cubi da 1 fino
ad n. Ad esempio, T5 = 15 ed infatti abbiamo:
Teorema 4.16 Ln-esimo numero pentagonale vale:
p

13 + 23 + 33 + 43 + 53 = 225 = 15.
n(3n 1)
Pn =
.
2
Per quanto riguarda i numeri quadrati, ci limitiamo
a dimostrare il seguente risultato che ha moltissime Prova: Per la scomposizione appena vista, si ha:
applicazioni (si veda ad esempio la Sezione 8.8):
Pn = Tn + 2Tn1 =
Teorema 4.15 Il valore della somma dei primi n
numeri quadrati `e dato da:
n
n(n + 1)
+ n(n 1) = (2n 2 + n + 1)
=
2
2
n
X
n(n + 1)(2n + 1) che d`a esattamente la formula desiderata.
2
2
2
2
k =
Sn = 1 + 2 + + n =
.
6
k=0

Prova: Procediamo per induzione, verificando che


S0 = 0, S1 = 1 e S2 = 5 sono dati effettivamente
dalla formula proposta. Se questa per`o non fosse vera
per ogni n N, esisterebbe un numero m > 2 per il
quale la formula `e falsa. Allora, se n = m 1, per n
la formula deve essere vera e quindi:
Sn+1 = Sn +(n+1)2 =

n(n + 1)(2n + 1)
+(n+1)2 =
6

Nota 4.5

Ragionare sui numeri triangolari, quadrati e pentagonali permette di generalizzare abbastanza agevolmente alcuni risultati e ottenere pro[k]
priet`
a di questi numeri. Chiamiamo n ln-esimo
[3]
[4]
numero k-gonale, di modo che n = Tn , n = n2
[5]
[k]
e n = Pn ; per costruzione, se disegniamo n , per
[k]
disegnare n+1 occorre aggiungere k 2 lati (si veda
la Figura 4.2 relativa ai Pn ); ogni lato ha n + 1 gettoni, ma uno `e in comune con il lato successivo, eccetto
lultimo. Si ha pertanto la ricorrenza:
[k]

n+1
(n + 1)(n + 2)(2n + 3)
=
(2n2 + 7n + 6) =
.
6
6
Ma questa `e la stessa espressione data dal teorema,
quando si consideri n + 1 al posto di n, e ci`o dimostra
che anche per n + 1 = m la formula `e valida, contro
lipotesi fatta.
Dopo i numeri triangolari e quadrati, vengono i
numeri pentagonali, la cui sequenza comincia con
P1 = 1, P2 = 5, P3 = 12, P4 = 22, P5 = 35, come si vede dalla Figura 4.2. Per trovare una formula
che ci dia ln-esimo numero pentagonale, si osservi
che le due rette tratteggiate dividono i pentagoni in
tre zone: in quella centrale, che comprende gli estremi dei lati opposti al vertice centrale, riconosciamo i
numeri triangolari Tn , mentre nelle due zone laterali
riconosciamo i numeri triangolari Tn1 .
Si ha pertanto:

n+1 = [k]
n + n(k 2) + 1,
[k]

da mettere insieme alla condizione iniziale 1 = 1.


Ci si accorge ora del ruolo fondamentale dei numeri
triangolari: con una decomposizione analoga a quella
dei numeri quadrati e pentagonali, si vede che:
[k]
n = Tn + (k 3)Tn1
[k]

che permette di calcolare una formula per ogni n :


Teorema 4.17 Il valore delln-esimo numero kgonale `e dato da:
[k]
n =

kn(n 1) 2n(n 2)
.
2

Prova:
Applichiamo la formula dei numeri
triangolari alla precedente relazione:
Tn + (k 3)Tn1 =

n(n 1)
n(n + 1)
+ (k 3)
=
2
2

4.4. STRUTTURE DATI


kn(n 1) 2n2 + 4n
2
da cui discende la formula desiderata.
=

Esistono altri approcci ai numeri k-gonali, ma noi


possiamo accontentarci di quanto detto fin qui, non
senza aver citato un risultato ottenuto dal solito
Eulero: ogni numero naturale `e la somma di al pi`
uk
numeri k-gonali, cio`e di al pi`
u tre numeri triangolari,
di al pi`
u quattro numeri quadrati, e cos` via.

111
i dati che potrebbero servire per accertare, al di l`a di
ogni dubbio, se la persona, non solo `e un cliente, ma
`e veramente lindividuo che pretende di essere. Questo, per`o, grazie allInformatica. Una volta, non poi
tanti anni fa, le cose non andavano cos`. Tutto era
semplice se il cliente era conosciuto dal cassiere o da
qualche altro impiegato; ma, in caso contrario, era
necessario far partire una procedura di ricerca che,
attraverso la consultazione di elenchi, la presentazione di documenti, la firma di moduli e ammennicoli
vari permetteva, alla fine, di dire: s`, costui `e uno
dei clienti della banca, oppure no, si tratta di un millantatore e nulla gli pu`o essere concesso. Lo stesso
problema si presenta in mille occasioni: lutente di
una biblioteca ha diritto al prestito? un certo farmaco `e prodotto o meno dalla casa farmaceutica XYZ?
esiste in Italia un comune che si chiama Cogoleto?
Oggi, poi, il problema si `e allargato a dismisura. Un
biologo si chiede se una certa sequenza di aminoacidi
`e presente fra i miliardi di aminoacidi che formano
lelica del DNA di un crostaceo. Un navigatore di Internet cerca informazioni su Teofilo Folengo, sperando di trovar qualcosa tra i miliardi di dati presenti
nel Web, la tela che tutti ci avvolge.

I numeri poligonali sono i numeri figurati pi`


u semplici, ma ne esistono, e se ne possono inventare, molti
altri, fra i quali i numeri stellati hanno ricevuto molta attenzione. Si pu`o anche passare dal piano allo
spazio e immaginare di avere delle palline al posto
dei gettoni; esse possono essere disposte in forma di
piramide con base triangolare, quadrata o esagonale.
Si possono pensare altre costruzioni e si pu`o addirittura immaginare di passare a 4, 5 o m dimensioni; per
queste note, tuttavia, pensiamo di poterci fermare a
questo punto.
Il modello delle urne e i numeri figurati si riferiscono ai pi`
u antichi problemi combinatori; oggi si sono
sviluppati altri modelli e altri oggetti, alcuni dei quali sono legati alle strutture dati dellInformatica. A
In tutti questi casi, il calcolatore `e stato fornito, o
questi aspetti dellAnalisi Combinatoria dedicheremo
ha creato lui stesso, un elenco delle informazioni che
le prossime sezioni, naturalmente dopo aver dato la
gli servono: gli utenti della biblioteca, i farmaci della
formula a suo tempo promessa:
ditta XYZ, e cos` via. Questi elenchi possono essere
2n (1)n
lunghissimi, contenere anche miliardi di dati diversi,
.
Gn =
e certo lelaboratore non pu`o consultarli uno dietro
3
laltro: cos` facendo, anche il calcolatore pi`
u veloce
impiegherebbe minuti ed ore a trovare una particola4.4 Strutture dati
re informazione, e nessun utente di queste macchine
LInformatica ha portato alla ribalta alcuni proble- potenti accetterebbe di aspettare cos` a lungo. Un
mi che la Matematica aveva ignorato o sottovalutato metodo usato dallelaboratore `e derivato da un trucperche sembravano non presentare risvolti teorici ap- co che adoperiamo quando cerchiamo una parola nel
prezzabili. Lesempio pi`
u eclatante `e costituito dal dizionario o un cognome sullelenco telefonico: invece
problema della ricerca: dato un insieme S e un ele- di partire dallinizio, scegliamo ad occhio una pagina
mento x, si vuole sapere se x S oppure x 6 S. Per ragionevolmente vicina a ci`o che cerchiamo. Il trucco
un matematico, questo non `e neppure un problema; `e reso sistematico nel modo seguente. Supponiamo
come abbiamo osservato fin dallinizio, elementi e in- che le informazioni nellelenco dellelaboratore siano
siemi sono entit`a che non si definiscono nemmeno e ordinate, cos` come lo sono quelle del dizionario o della loro esistenza `e legata al fatto di poter istituire lelenco telefonico. Si comincia allora la ricerca dalletra di esse alcune relazioni che le caratterizzano; una lemento mediano, cio`e linformazione che sta proprio
di queste `e proprio lappartenenza, per cui, dato S e nella posizione di mezzo. Si potrebbe essere fortunadato x, `e immediato sapere se x S, o meno. Tutti ti e trovare al primo colpo ci`o che si cerca, ma non
i nostri ragionamenti su elementi e insiemi si basano siamo cos` ottimisti: se linformazione cercata `e misul fatto (anche se non solo su quello) che si possa nore (cio`e, viene prima) di quella individuata, allora
dire senza problemi quando x sta o non sta in S.
possiamo escludere dalla ricerca successiva tutta le
Nella pratica, le cose non stanno proprio cos`. Se seconda met`a dellelenco; se linformazione cercata `e
una persona si presenta alla cassa di una banca e vuol maggiore (cio`e, viene dopo) si escluder`a la prima parritirare del denaro, il problema che si presenta al cas- te. In ogni caso, il tentativo successivo sar`a limitato
siere `e: questa persona `e o non `e cliente della banca? a una sola met`a dellelenco, e questo fa una bella difOggi, basta digitare sul terminale il nome della perso- ferenza. Tale metodo si dice ricerca binaria e per essa
na e il calcolatore fornisce la risposta, insieme a tutti vale il seguente risultato:

112

CAPITOLO 4. MATEMATICHE FINITE

Teorema 4.18 Sia S un insieme di n elementi, dato combinatori detti alberi binari di ricerca, che qui cacome elenco ordinato; il numero massimo di confronti dono giusto a proposito. Per brevit`a, spesso diremo
necessari a determinare se un elemento x appartiene albero binario per albero binario di ricerca.
o non appartiene ad S `e log2 (n + 1).
Definizione 4.1 Un albero binario di ricerca `e una
Prova: Onde semplificare i conti necessari, limitia- struttura finita cos` fatta: `e vuota oppure `e costituita
moci a considerare i valori per cui n `e 1 meno di una da un nodo etichettato dal quale partono due rami,
potenza di 2, cio`e vale 0, 1, 3, 7, 15, 31, . . .. Questi nu- allestremit`
a dei quali si trovano due alberi binari di
meri hanno la caratteristica che, quando procediamo ricerca, detti rispettivamente il sottoalbero di sinistra
nella ricerca e riduciamo a met`a lelenco, il numero e di destra dellalbero binario.
degli elementi rimasti `e ancora dello stesso tipo. Indichiamo allora con Cn il massimo numero di confronti Un nodo etichettato `e semplicemente un nodo che
necessari alla ricerca in un elenco di n elementi e po- contiene unetichetta, cio`e un nome o un numero, in
niamo ck = Cn = C2k 1 . Per losservazione fatta, ogni caso lidentificazione di un elemento dellinsieme
abbiamo C2k 1 = 1 + C2k1 1 , la qual formula si- S. Il primo nodo dellalbero si dice la radice, e le radignifica che il numero totale dei confronti `e uguale ad ci dei due sottoalberi di sinistra e di destra si dicono
1 (il confronto effettuato) pi`
u il numero di confronti i figli sinistro e destro della radice, alla quale ci si
per la met`a rimasta dellelenco. Questa relazione si riferisce come nodo genitore. Per capire bene il conscrive: ck = 1 + ck1 e quindi, iterando, si ha:
cetto di albero binario, la cosa migliore `e utilizzarlo
e pertanto vedremo ora come si costruisce e come si
ck = 1 + ck1 = 2 + ck2 = = k + c0 .
usa. Alluopo, useremo linsieme S delle parole contenute nella Divina Commedia; si d`a per scontato che
Ma c0 = C20 1 = C0 = 0, poiche se un elenco non ha lincipit sia conosciuto da tutti. La prima parola nel
elementi (cio`e, S = ) non c`e bisogno di confronti per viene a costituire letichetta della radice:
stabilire che x 6 S. In conclusione, abbiamo Cn = k,
dove n = 2k 1. Ricavando k si ha k = log2 (n + 1),
nel
come si voleva.

@
q
@q
Se n `e un milione, Cn 20 e se n vale un miliardo
si ha Cn 30. Per un potente elaboratore, fare 20 o I due rami che si dipartono da questa radice punta30 confronti `e pressoche immediato, e questo spiega no, per il momento, a due alberi vuoti che, per`o, preperche la nostra domanda su Teofilo Folengo ottenga sto, si riempiranno. Per inserire nellalbero la seconda
parola mezzo, si procede cos`: si confronta la nuova
una risposta in una frazione di secondo.
La ricerca binaria funziona se lelenco `e ordinato. parola con letichetta della radice; poiche mezzo `e alPurtroppo, i dati grezzi ben raramente sono ordinati, fabeticamente inferiore, si procede lungo il ramo di
basti pensare alle informazioni su Internet. Il cal- sinistra. Lalbero che si trova `e vuoto e perci`o lo si
colatore, perci`o, ha anche il problema di ordinare i sostituisce con un nodo avente mezzo come etichetta:
dati dellelenco, e questa `e unaltra operazione che la
nel
Matematica classica ha sottovalutato. In pratica, n

@
elementi diversi possono assumere una qualsiasi delle

@q
mezzo
n! permutazioni possibili, e ci`o rende conto della variabilit`a del problema. Abbiamo a suo tempo visto

@
q
@q
quanto vale 100!, e pensare a 1. 000. 000! `e semplicemente assurdo. Questo pone il problema generale del- Per la terza parola del si procede in modo analogo:
lordinamento, che `e considerato, assieme alla ricerca, confrontata con la radice, essa `e minore e quindi si
uno dei problemi di base dellInformatica.
segue il ramo di sinistra. Qui si trova il nodo con etiSi rifletta un attimo come un elenco non ordina- chetta mezzo, di cui del `e minore. Continuando a sito sia praticamente illeggibile, cos` come ogni uscita nistra, si trova lalbero vuoto, che perci`o sostituiamo
prodotta dallelaboratore deve essere ordinata, se vo- con un nodo nuovo etichettato del:
gliamo che serva a qualcosa. Gli informatici hanno
nel
inventato metodi ingegnosi per ordinare velocemente

@
gli insiemi di dati, metodi che non fanno propriamen
@q
te parte dellAnalisi Combinatoria; ma questo argomezzo
mento va al di l`a degli scopi di queste note. Acconten
@

@q
tiamoci allora di introdurre un metodo che permette
del
di ottenere ordinamento e ricerca in tempi decisa
@
q
@q
mente buoni. Questo metodo `e legato a certi oggetti

113

4.4. STRUTTURE DATI


Linserimento di cammin e di di `e semplice e basta osservare che di `e maggiore di del e quindi verr`a posto
alla sua destra. Analogo caso avviene per nostra,
che si colloca alla destra della radice. Nella Figura 4.3 mostriamo il nostro albero dopo linserimento
delle prime 15 parole. Ora, la ricerca di un termine avviene con lo stesso criterio dellinserimento. Si
supponga di voler cercare oscura. Si confronta con
la radice nel e poiche `e maggiore si procede col ramo
di destra. Qui troviamo nostra, di cui oscura `e ancora maggiore, per cui continuaiamo verso destra. La
parola oscura `e invece minore di vita e noi procediamo verso sinistra. Cos` andiamo avanti finche non
recuperiamo oscura. Lo stesso procedimento avrebbe avuto luogo per ricercare oscuro, una parola per il
momento non ancora presente nel nostro albero; naturalmente, per`o, lultimo confronto ci avrebbe portato in un sottoalbero vuoto, il che denota le ricerche
con insuccesso.
La propriet`a fondamentale degli alberi binari di ricerca `e che, preso un qualsiasi nodo N , il suo sottoalbero di sinistra contiene solo etichette minori di
quella in N , e il suo sottoalbero di destra contiene solo
etichette maggiori. Questo `e vero per costruzione e ci
suggerisce che le etichette sono virtualmente ordinate. Il seguente algoritmo ricorsivo produce un elenco
ordinato di tutte le etichette di un albero binario:
Algoritmo 4.2 (Ordinamento)
Ingresso: un albero binario di ricerca;
Uscita: lelenco ordinato delle etichette dellalbero.
1. se il sottoalbero di sinistra non `e vuoto, chiamare
ricorsivamente questo programma per ordinarlo;
2. scrivere nellelenco letichetta della radice di
questo albero;
3. se il sottoalbero di destra non `e vuoto, chiamare
ricorsivamente questo programma per ordinarlo.

fr
Q

Q
Q e
d
r
Qr
Q

D Q

D
Q

Q c
Q

Qr
D

J
D

J
D

J
D
J
a D
r
Jr b
Figura 4.4: Un grafo connesso
(x, y) ed (y, x) si scrive una doppia freccia. Un grafo
pesato `e un grafo nel quale ad ogni arco `e associato
un numero reale non negativo, detto il peso dellarco.
Nei grafi orientati e pesati, il peso dellarco (x, y) pu
o
essere diverso dal peso dellarco (y, x). Un sottografo
di G `e un grafo G = (V , A ) dove V V e A A.
Se x `e un vertice, il grado di x `e il numero di archi
che hanno x come vertice. Se il grafo `e orientato, si
distingue il grado di ingresso, cio`e il numero di archi
che arrivano ad x, dal grado duscita, cio`e il numero
di archi che partono da x.
La figura riporta il grafo definito da V =
{a, b, c, d, e, f } e composto di 8 archi. Abbiamo gi`a
avuto modo di incontrare grafi; `e chiaro che un grafo
`e un modo di rappresentare una qualsiasi relazione
simmetrica su un insieme finito V ; in generale, una
relazione su V corrisponde a un grafo orientato. Per
le relazioni di ordine, possiamo limitare gli archi a
quelle coppie (x, y) per le quali x y e non esiste
alcun altro elemento z tale che x z y; in questo caso, prendendo come convenzione che un arco `e
sempre diretto dal basso verso lalto, ritroviamo i diagrammi di Hasse, introdotti nella Sezione 1.2. Una
corrispondenza tra due insiemi A e B pu`o essere rappresentata da un grafo i cui vertici sono gli elementi
di A B e i cui archi collegano elementi di A e di B
in corrispondenza tra loro; si tratta di un grafo un
po particolare e lo si dice bipartito. La terminologia
relativa ai grafi riflette la loro generalit`a.

Il concetto di albero binario di ricerca fa parte


di una serie di oggetti combinatori importanti, che
possiamo classificare addirittura come modello.
Il modello dei grafi. La seguente definizione introduce il concetto di grafo e di alcune sue
Definizione 4.3 Sia dato un grafo G = (V, A); si
varianti.
dice cammino di G una sequenza finita di vertici di
Definizione 4.2 Un grafo `e una coppia G = (V, A), V , diciamo (v0 , v1 , . . . , vh ), per i quali {vi , vi+1 } `e un
dove V `e un insieme finito di elementi detti vertici o arco di A per i = 0, 1, . . . , h 1. Un cammino per il
nodi, di solito rappresentati graficamente da punti; se quale v0 = vh si dice un ciclo. Nei grafi orientati pu`
o
D `e linsieme dei sottoinsiemi di due elementi di V , si esistere il ciclo formato dal solo arco (v, v), il quale
ha A D; ogni {x, y} A si dice un arco o spigolo, e pi`
u propriamente viene detto laccio. Se G `e un grafo
si rappresenta con una linea che unisce i due vertici pesato, il peso di un cammino `e la somma dei pesi
interessati. Un grafo orientato `e una coppia Go = degli archi che lo compongono. Il grafo G si dice con(V, A), dove V `e come prima, ed A V 2 , di modo nesso se, presi comunque due suoi vertici v, v , esiste
che ogni arco orientato (x, y) A `e rappresentato da almeno un cammino che va da v a v . Dato un vertiuna freccia da x ad y; se sono presenti i due archi ce v, si dice componente connessa di v linsieme dei

114

CAPITOLO 4. MATEMATICHE FINITE


nel

mezzo
mi

@
@

di
@
@
che

nostra
q

@
@

del

cammin

HH
H

@
@q

@
@q

@
@q

vita

ritrovai

HH
H

@
@q

per

oscura
q

@
@

@
@q

@
@q
una

selva

@
@q

@
@q

Figura 4.3: La parte iniziale dellalbero binario di ricerca della Divina Commedia
vertici v del grafo per i quali esiste un cammino da v
a v ; un grafo connesso ha ununica componente connessa. Un albero `e un grafo connesso e privo di cicli.
Se G `e un grafo connesso, un albero di ricoprimento
di G `e un sottografo di G che sia un albero contenente tutti i vertici di G. Se G `e pesato, un albero
minimo di ricoprimento `e un albero di ricoprimento
che abbia peso minimo rispetto a tutti gli altri alberi
di ricoprimento.

che i sottoalberi di sinistra e di destra non possono


essere scambiati tra di loro, cio`e, in altre parole, i rami che partono da un nodo hanno un ordine che non
pu`o essere ignorato.
La teoria dei grafi `e vastissima e qui non possiamo
dare che una vaga idea di alcune parti molto limitate.
Un problema classico `e il seguente: riprendiamo il
grafo connesso della Figura 4.4 e chiediamoci se `e
possibile partire da uno dei suoi vertici e disegnarlo
in un unico tratto, senza staccare la matita dal foglio,
Lalbero minimo di ricoprimento ha grande impor- e senza ripassare due volte per lo stesso arco. Gi`a
tanza in molte applicazioni dei grafi, poiche rappre- Eulero aveva dimostrato:
senta il modo di raggiungere tutti i vertici del grafo
con un costo, o peso, globalmente minimo. Il con- Teorema 4.19 Sia G = (A, V ) un grafo; `e possibile
cetto di albero, presentato in questa maniera, pu`o partire da un vertice v V e disegnare il grafo con
lasciare abbastanza sconcertati, almeno in un primo un sol tratto di matita (senza staccare la matita dal
momento, e sarebbe forse meglio parlare di struttu- foglio) e senza ripassare due volte per lo stesso arco
ra arborescente, ma tant`e. Se fra i nodi di un albe- se e solo se il numero dei vertici di grado dispari `e al
u 2 (cio`e, `e 0 oppure 2).
ro scegliamo un nodo particolare, questo viene detto pi`
la radice dellalbero e lalbero, pi`
u propriamente, si
Prova: Per poter entrare e uscire da un vertice senza
chiama albero con radice; da un albero con n nodi si
usare lo stesso arco occorre che il grado del vertice
possono derivare n alberi con radice. Come abbiamo
sia 2, o comunque sia pari. Se il grado `e dispari, vi
gi`a fatto con gli alberi binari di ricerca, si preferisce
si pu`o entrare ma non uscire, o viceversa. Quindi,
mettere la radice in alto e far crescere lalbero verso
se i vertici di grado dispari sono pi`
u di 2, uno di
il basso; `e una semplice convenzione, che torna bene
questi nodi bloccher`a il disegno (lasciamo al lettore
per il nostro modo di scrivere da sinistra a destra e
la dimostrazione, abbastanza ovvia, che non possono
dallalto in basso. Nella Figura 4.5 abbiamo riportaesistere grafi con un numero dispari di nodi di grado
to un albero con radice e la sua rappresentazione pi`
u
dispari!).
usuale.
Il grafo della Figura 4.4 ha due vertici di grado
La presenza della radice fa s` che, praticamente, gli
archi (detti anche rami) di un albero con radice sia- tre: uno si pu`o usare come vertice di partenza, laltro
no orientati, esattamente dallalto verso il basso. Da darrivo; con questa considerazione il disegno riesce
questo fatto deriva lusanza di parlare del grado di un facilmente. Lo stesso Eulero aveva osservato la senodo come del suo grado duscita; cos` nellesempio guente propriet`a fondamentale. Un grafo si dice plaprecedente, il grado di a `e 4, quello di c `e 2 e quello di nare se si pu`o disegnare sul piano senza che i suoi
e `e 0. In questo senso, gli alberi binari di ricerca sono archi si incrocino; si chiama faccia di un grafo plaalberi con radice i cui nodi hanno grado 0 oppure 2. nare ogni parte del piano delimitata dagli archi del
Si aggiunge che sono orientati per sottolineare il fatto grafo, cio`e da alcuni dei suoi cicli; si considera che la

115

4.5. IL MODELLO DELLE PAROLE

rd
A
A
A

rb

A
Acr

r e

rf

f
r

i
r
HH

jr

kr

HHr
h

r
g

ar
f
PP

@
@ PP P

PPi r
@r

r
r
b
c
S
A
S
A

A
S

S
A

Ar
Sr
r
r
r
d
e
g
h
j
rk

Figura 4.5: Albero con radice e sua rappresentazione convenzionale


cio`e la loro rappresentazione lineare, come stringa di
caratteri, invece che quella grafica. Per costruire un
albero binario, noi partiamo da una delle n! permutazioni di un insieme S di n elementi; `e facile tuttavia
rendersi conto che non esistono n! alberi binari diverTeorema 4.20 Sia G = (V, A) un grafo connesso e si. Ad esempio, con n = 3 si hanno 6 permutazioni,
indichiamo con v, a, f il numero dei suoi vertici, dei ma solo 5 alberi binari:
suoi archi e delle sue facce. Si ha allora la relazione
s
s
s
s
s
di Eulero: f + v = a + 2.
@
@

@
@
@

Prova: Usiamo il principio di induzione matematica


@s @ s
s
s
s
@s

sul numero dei vertici che compongono il grafo. Se


@

il grafo si compone di un unico vertice, si hanno due


@
@s
s
s
@s
possibili situazioni:
parte esterna al grafo costituisca una delle sue facce.
Nel caso della Figura 4.4, si hanno in tutto 6 facce.
Un albero ha ununica faccia, essendo per definizione
privo di cicli. Si ha allora:

Infatti, lalbero centrale viene generato tanto dalla


permutazione (2, 1, 3) quanto da (2, 3, 1). Si pone alv
s
lora il problema: quanti alberi binari distinti corrispondono alle permutazioni di n elementi? Ragioniamo in questa maniera: consideriamo un albero con
n + 1 nodi; esso sar`a composto dalla radice, da un
La prima situazione corrisponde a (v = 1, f = 1, a = sottoalbero di sinistra con k nodi (con k variabile tra
0) e la seconda a (v = 1, f = 2, a = 1) e per entrambe 0 ed n) e un sottoalbero di destra che, di conseguenza,
vale la relazione di Eulero. Si supponga allora che tale conterr`a n k nodi. Sia Ck il numero totale di alberi
relazione valga per v vertici e aggiungiamo un vertice distinti con k nodi; poiche ogni sottoalbero di siniulteriore x. Poiche il grafo deve rimanere connesso, si stra con k nodi pu`o essere associato un sottoalbero
devono aggiungere anche 1 o pi`
u archi che partono da di destra con n k nodi, si hanno in tutto:
o arrivano ad x, mantenendo la planarit`a del grafo.
n
X
Se se ne aggiunge uno solo, il numero della facce non
C
=
Ck Cnk

n+1
cambia e si ha (v = v +1, f = f, a = a+1), e quindi
k=0
la relazione di Eulero vale ancora. Se si aggiungono
k archi, questi devono dividere la stessa faccia, quella
alberi binari con n+1 nodi. Questa formula permette
in cui abbiamo inserito x; ma questo genera k 1
di calcolare uno dietro laltro il valore dei Cn , partenfacce, che si aggiungono alla precedente e quindi si
do dalla condizione iniziale C0 = 1; infatti, esiste
ha (v = v + 1, f = f + k 1, a = a + k), e la
un unico albero con 0 nodi, ed esattamente lalbero
relazione di Eulero vale ancora.
vuoto. Si ha allora:
m
s
v

4.5

Il modello delle parole

Il modello delle parole: Il secondo problema posto


dagli alberi binari di ricerca `e la loro linearizzazione,

C1
C2
C3
C4

=
=
=
=
=

C0 C0 = 1 1 = 1
C0 C1 + C1 C0 = 1 1 + 1 1 = 2
C0 C2 + C1 C1 + C2 C0 = 2 + 1 + 2 = 5
C0 C3 + C1 C2 + C2 C1 + C3 C0 =
5 + 2 + 2 + 5 = 14.

116

CAPITOLO 4. MATEMATICHE FINITE

Dopo aver capito bene il gioco degli indici di questa somma di prodotti, il lettore `e caldamente invitato a calcolare il valore di C4 ed, eventualmente, di
C5 . E possibile dimostrare (ma noi non ci proveremo
nemmeno) che vale la formula generale:

1
2n
Cn =
n+1 n
che per`o il lettore verificher`a con i valori appena calcolati. I numeri Cn si dicono numeri di Catalan, dal
nome del matematico belga che li studi`o per primo
alla met`a del 1800.
Unespressione parentesizzata `e una sequenza di
parentesi [ e ] che si conformi alle usuali regole di
apertura e chiusura. Esiste ununica espressione con
una sola coppia di parentesi: [ ]; ne esistono due con
due coppie: [[ ]], [ ][ ], e ne esistono 5 con tre coppie:
[[[ ]]], [[ ][ ]], [[ ]][ ], [ ][[ ]], [ ][ ][ ].
Si considera la sequenza vuota come lunica
espressione con 0 coppie di parentesi. Si ha:
Teorema 4.21 Esistono tanti alberi binari di ricerca
con n nodi quante espressioni parentesizzate con n
coppie di parentesi.
Prova: Consideriamo un albero binario e indichiamo con una coppia di parentesi la sua radice; quindi
inseriamo tra queste due parentesi la rappresentazione del suo sottoalbero di sinistra e alla loro destra
la rappresentazione del suo sottoalbero di destra. La
rappresentazione dellalbero vuoto `e la stringa vuota.
Di conseguenza, ad ogni albero binario con n nodi
corrisponde unespressione parentesizzata con n coppie di parentesi (una per nodo). Ad alberi diversi
corrispondono ovviamente espressioni diverse (la corrispondenza `e iniettiva) ed ogni espressione parentesizzata proviene da un albero, in quanto la costruzione si pu`o invertire (la corrispondenza `e surgettiva).
In conclusione, la corrispondenza `e biunivoca, come
si voleva.
Nella prima met`a degli anni 1950, il linguista Noam
Chomski introdusse il concetto di linguaggio formale
nel tentativo di creare uno strumento adatto a modellare il linguaggio naturale. Il suo concetto di grammatica formale (o semplicemente grammatica) `e stato
effettivamente usato a tale scopo, ma il maggior successo lha avuto in Informatica. Qui, esso `e stato
usato per almeno tre scopi fondamentali:
1. come strumento teorico per formulare la teoria
della computabilit`
a, cio`e la teoria che cerca di
stabilire quali problemi sono risolubili da un punto di vista computazionale. Le grammatiche di
Chomski di tipo 0 sono una formulazione alternativa alle macchine di Turing, alle funzioni parzialmente ricorsive, al -calcolo, agli algoritmi

normali di Markov e alle altre impostazioni della


teoria;
2. come metodo pratico per definire con precisione quelle lingue artificiali che sono i linguaggi di
programmazione. Le grammatiche di tipo 2 sono
correntemente usate sia per dare una formulazione esatta di linguaggi come Pascal, C o Java, sia
per dirigere la loro traduzione nel linguaggio
macchina del particolare elaboratore utilizzato
dal programmatore;
3. come strumento per la definizione formale delle
strutture dati usate nei programmi, per lo studio del loro comportamento e, quindi, per la valutazione della loro efficienza nella risoluzione di
determinati problemi.
Questo ultimo `e largomento che qui particolarmente ci interessa, anche se dovremo limitare
drasticamente le nostre considerazioni.
Prima di addentrarci negli aspetti pi`
u formali; cerchiamo di capire, con un semplice esempio non del
tutto banale, qual era lidea di Chomski. Nella Tabella 4.2 riportiamo una piccola grammatica formale che vorrebbe dare una vaga idea di come si possa
definire una frase nominale, qui indicata dal simbolo
hfrasei; le parentesi a punta h e i sono utilizzate
per delimitare un simbolo che si vuole considerare come unico, anche se composto da lettere e altri segni,
che danno un aiuto mnemonico per capire e ricordare
il significato del simbolo stesso, in questo caso una
frase nominale.
Il simbolo ::= significa si pu`o pensare come, e
quindi una frase nominale si pu`o pensare come: un
soggetto, seguito da uno spazio (il simbolo ), seguito da una copula, seguito da uno spazio, seguito
infine da una sequenza di aggettivi. Questo, semplificando molto, `e ci`o che ci aspettiamo da una frase
nominale. Il soggetto si pu`o pensare come un nome
proprio hnomei oppure (tale `e il significato della barra verticale |) un articolo seguito da un sostantivo.
I nomi propri che consideriamo sono solo quattro, ma
potrebbero essere tutti quelli che riusciamo ad immaginare, purche in numero finito. La barra verticale si
usa per creare tante alternative quante si desiderano.
Si noti che una lista di aggettivi `e costituita da un
unico aggettivo, oppure da vari aggettivi separati da
virgole (cio`e, una sequenza di aggettivi), ma lultimo
`e separato dagli altri dalla congiunzione E.
Ogni alternativa `e detta una produzione, nel senso che il simbolo di sinistra produce i vari simboli
di destra. Partendo da hfrasei, lapplicazione delle
produzioni, da sinistra verso destra, cambia hfrasei
in altre sequenze, generando alla fine una sequenza di
lettere (senza pi`
u simboli tra parentesi a punta) che

4.5. IL MODELLO DELLE PAROLE

hfrasei
hsoggettoi
hnomei
harticoloi
hsostantivoi
hfinalei
hcopulai
hseq. agg.i
hlista agg.i
haggettivoi

::=
::=
::=
::=
::=
::=
::=
::=
::=
::=

117

hsoggettoi hcopulai hseq. agg.i


hnomei | harticoloi hsostantivoi
PAOLO | CHIARA | SARA | ANTONIO
IL | LO | LA | I | GLI | LE
RAGAZZhfinalei | SARThfinalei | CAVALLhfinalei
A|E|I|O
E | SONO | ERA | ERANO
haggettivoi | hlista agg.i E haggettivoi
haggettivoi | hlista agg.i, haggettivoi
BELLhfinalei | BIONDhfinalei | PICCOLhfinalei | ALThfinalei
Tabella 4.2: Una grammatica formale

costituisce un esempio valido di frase nominale. Ecco


un semplice esempio di generazione:

che `e davvero sgrammaticata. In realt`a, la grammatica formale non tiene conto del contesto, cio`e di cosa
sta vicino a ciascun elemento della frase: larticolo
hfrasei
deve concordare in numero e genere con il sostantivo;
questo determina il numero della copula, e cos` via.
hsoggettoi hcopulai hseq. agg.i
Per questo, una grammatica del genere si dice libera
dal
contesto. Chomski introdusse anche grammatiharticoloihsostantivoihcopulaihseq. agg.i
che contestuali pi`
u realistiche, ma dal nostro punto
LA hsostantivoi hcopulai hseq. agg.i
di vista sono troppo complesse e meno interessanti.
La notazione adottata nella Tabella 4.2 si dice BacLA SARThfinalei hcopulai hseq. agg.i
kus Normal Form (BNF) perche inventata da Backus
per adattare le grammatiche di Chomski alla definiLA SARTA hcopulai hseq. agg.i
zione dei linguaggi di programmazione, in particolare
LA SARTA ERA hseq. agg.i
dellAlgol60. Essa fa capire in modo immediato il
LA SARTA ERA hlista agg. E haggettivoi significato dei vari simboli, il che `e molto utile quando si ha a che fare con decine o centinaia di simboli
LA SARTA ERA haggettivoi E haggettivoi diversi, come accade in linguaggi abbastanza vasti
LASARTAERAPICCOLhfinaleiEhaggettivoi (anche se relativamente semplici), quali sono quelli
usati nella programmazione. Normalmente, tali simLA SARTA ERA PICCOLA E haggettivoi
boli si dicono non terminali e si indicano con lettere dellalfabeto greco. Formalmente, una grammatica
LA SARTA ERA PICCOLA E BIONDhfinalei
libera dal contesto, o anche, con terminologia inglese
abbastanza accettata, context-free `e una quadrupla
LA SARTA ERA PICCOLA E BIONDA
G = (T, N, , P) dove:
Questo `e laspetto generativo della grammatica,
cio`e delle produzioni che costituiscono la gramma1. T `e linsieme dei simboli terminali;
tica formale. Tante altre frasi di senso compiuto si
2. N `e linsieme dei simboli non terminali; T N =
possono generare, come:
;
PAOLO E ALTO
3. N `e il simbolo iniziale;
I RAGAZZI SONO BIONDI, ALTI E BELLI
4. P `e un insieme di produzioni: una produzione `e
Se leggiamo la derivazione dal basso verso lalto, abuna coppia (, x) dove N e x (T N ) , cio`e
biamo la divisione strutturale della frase, che metx `e una parola di T N , eventualmente vuota.
te in chiaro quale sia il soggetto, quale la copula e
quale o quali gli aggettivi (aspetto strutturale della Supponiamo che w = w1 w2 sia una parola su T N ,
che N e w1 non contenga il simbolo , cio`e l
grammatica).
u a sinistra di tale simbolo.
Purtroppo, la grammatica genera anche frasi del indicata sia loccorrenza pi`
Se w = w1 yw2 e (, y) `e la i-esima produzione di P,
tipo:
allora si dice che w genera immediatamente w e si
scrive w i w o semplicemente w w , se non si
GLI CAVALLE ERA PICCOLA E ALTI

118

CAPITOLO 4. MATEMATICHE FINITE

vuol mettere laccento sulla produzione considerata. `e ambigua; 2) le parole di L(G) sono le sequenze di
Si dice poi che w0 genera wn se esistono n 1 parole 0/1 nelle quali lo 0 `e isolato e non si trova ne in cima
ne in fondo; 3) le parole di L(G) di lunghezza n sono
w1 , w2 , . . . , wn1 tali che risulti:
contate dalln-esimo numero di Fibonacci Fn .
w0 w1 w2 wn1 wn ;
Accenniamo alla dimostrazione di questultima
propriet`a. Sia L(G) il linguaggio generato dalla
questa catena di generazioni si dice la derivazione sigrammatica; la produzione (, 1) ci dice che 1 L(G)
nistra di wn da w0 e si scrive w0 wn . Si dice
e che quindi 6 L(G), se `e la sequenza vuota; quininfine linguaggio generato dalla grammatica G lindi L(G) non contiene sequenze di lunghezza 0, e ne
sieme delle parole su T generate dal simbolo iniziale
contiene una sola di lunghezza 1. Ci`o corrisponde alle
, cio`e formalmente:
condizioni iniziali F0 = 0 e F1 = 1 dei numeri di Fibo

nacci.
Per quanto riguarda la ricorrenza, osserviamo
L(G) = {w T | w}.
che la produzione (, 1) ci dice che una sequenza di
La grammatica G si dice non ambigua se ogni parola lunghezza n che termina con 1 proviene da ununica
di L(G) pu`o essere generata in uno e un solo modo sequenza di lunghezza n 1. La produzione (, 01)
da attraverso una derivazione sinistra.
ci dice che una sequenza che termina con 01 provieA questo punto un esempio `e fortemente richiesto. ne da ununica sequenza di lunghezza n 2. Poiche
Sia T = {[, ]}, di modo che i simboli terminali del queste sono le uniche produzioni, tali considerazionostro linguaggio siano le due parentesi; sia poi N = ni corrispondono alla ricorrenza Fn = Fn1 + Fn2 ,
{} e, di conseguenza, = ; infine, linsieme delle e ci`o `e sufficiente a dimostrare il nostro asserto, che
produzioni sia:
le parole di Fibonacci di lunghezza n sono proprio
contate delln-esimo numero di Fibonacci.
P = {(, [ ])1 , (, [])2 , (, [ ])3 , (, [])4 },
dove lindice sta ad indicare il numero dordine del4.6 Il calcolo delle proposizioni
la produzione per semplificare la comprensione del
seguente esempio. Vediamo infatti la derivazione
Il calcolo delle proposizioni `e una teoria che tratta del
sinistra della parola [[ ]][ ]:
modo in cui si possono elaborare le espressioni proposizionali per calcolarne il valore di verit`a e/o per
4 [] 1 [[ ]] 1 [[ ]][ ].
trasformare proposizioni in altre equivalenti. Questo
Si osservi che, quando sono presenti pi`
u simboli non calcolo si basa sul concetto di equivalenza tra proterminali uguali, la produzione si deve applicare al posizioni: due proposizioni sono equivalenti quando,
simbolo pi`
u a sinistra e da questa regola `e nato il ter- scelti comunque i valori di verit`a delle proposizioni
mine di derivazione sinistra. Questa grammatica elementari che le compongono, i valori di verit`a delnon `e ambigua; lasciamo al lettore il non facilissimo le due proposizioni coincidono. Il lettore verificher`a
compito di provare questo fatto; suggeriamo di di- che si tratta proprio di una relazione di equivalenza.
mostrare che ogni parola di L(G) ha una e una sola Le proposizioni sono costruite a partire da un certo
decomposizione secondo le produzioni di P. E invece numero (non meglio specificato) di proposizioni elefacile osservare che L(G) `e composto di tutte e sole mentari p, q, r, . . . e dai tre connettivi logici negazione
le espressioni parentesizzate (eccetto quella vuota), e , congiunzione , disgiunzione , e le parentesi per
quindi G `e un metodo formale per definire gli albe- regolare la precedenza delle operazioni.
ri binari di ricerca, nella loro forma linearizzata. Da
La tabella di verit`
a di una proposizione `e una taquesta definizione, in effetti, `e possibile derivare una bella che, in funzione dei diversi e possibili valori di
serie di propriet`a degli alberi binari di ricerca, delle verit`a delle funzioni elementari, d`a il valore di verit`a
quali, tuttavia, facciamo grazia al lettore. Notiamo della proposizione. Una tabella di verit`a si costruisolo che questa `e una delle tante vie per dimostrare sce a partire dalle tabelle di verit`a dei tre connetla validit`a della formula di Catalan.
tivi logici, viste nel Capitolo 1. Possiamo dire che
Concludiamo con due ulteriori grammatiche. La due proposizioni sono equivalenti se e solo se hanno
prima `e abbastanza ovvia e fa uso della paro- la stessa tabella di verit`a. Si consideri ad esempio
la vuota : T = {a, b, c}, N = {} e P = la proposizione: (p q) r, e si osservi la Tabella
{(, ), (, a), (, b), (, c)}. Lasciamo al lettore 4.3. Sulla sinistra abbiamo riportato tutte le possibili
la dimostrazione, questa volta semplice, del fatto combinazioni dei valori di verit`a delle tre proposizioche L(G) = {w T }. La seconda grammati- ni elementari p, q, r. Nella colonna q si `e riportato
ca `e meno ovvia: T = {0, 1}, N = {}, = , il valore della negazione di q e, analogamente, nelP = {(, 1), (, 1), (, 01)}. In questo caso il let- la colonna p q abbiamo valutato il risultato della
tore dovrebbe dimostrare che: 1) la grammatica non disgiunzione tra p e la negazione di q. Infine, con

119

4.6. IL CALCOLO DELLE PROPOSIZIONI


p
0
0
0
0
1
1
1
1

q
0
0
1
1
0
0
1
1

r q
0 1
1 1
0 0
1 0
0 1
1 1
0 0
1 0

p q
1
1
0
0
1
1
1
1

(p q) r
0
1
0
0
0
1
0
1

Tabella 4.3: Calcolo di una tabella di verit`a

vuol dire (p q) (q p) = (p q) (p p)
(q q)(pq) = (pq)(pq) = (pq) (pq):
il lettore `e invitato a costruire le varie tabelle di verit`a. La proposizione p q indica lesclusione fra p e
q e la sua tabella di verit`a `e giusto la negazione della
doppia implicazione:
p
0
0
1
1

q pq
0
0
1
1
0
1
0
1

la tabella di verit`a della congiunzione, si `e calcolata E bene osservare che essa si calcola facendo la somma
lultima colonna, che rappresenta proprio la tabella (modulo 2) dei valori di verit`a di p e q: nel caso che
sia p = q = 1, si ha p + q = 2, ma: 2 mod 2 = 0
di verit`a della proposizione (p q) r.
(vedere Definizione 2.4).
Nota 4.6
Il calcolo combinatorio ci dice che vi
Ci`o che `e interessante nella Tabella 4.4 `e il fatsono 8 possibili combinazioni dei valori 0/1 da asso- to che le regole esposte non solo trasformano una
ciare alle tre proposizioni p, q, r. Esistono vari metodi, proposizione in unaltra proposizione ad essa equiestendibili a 4 o pi`
u proposizioni, per scriverle in modo valente, ma date due espressioni equivalenti, cio`
e con
sistematico.
la stessa tabella di verit`a, esse permettono di tra1. la colonna di p `e costituita da quattro 0 e da sformare luna nellaltra. Per il momento, limitiaquattro 1; la colonna di q da due 0 e da due moci ad un esempio. Si consideri la proposizione:
1, seguiti da altri due 0 e due 1; la colonna di (p q r) (p q r) (p q r) e se ne
r `e fatta da 0 e 1 in sequenza. Lasciamo per costruisca la tabella di verit`
a: si osserva allora che
esercizio estendere questa regola a quattro o pi`
u tale tabella coincide con quella di (p q) r. Come
proposizioni;
possiamo trasformare questa in quella? Se riusciamo
2. partendo dalla combinazione composta di tutti in tale impresa, applicando le regole allinverso (esse
0, si procede cambiando da 0 in 1 lultimo 0 pre- sono tutte simmetriche) si ottiene una trasformaziosente nella combinazione. Contemporaneamen- ne di quella in questa: `
e quindi sufficiente trovare
te, si cambiano in 0 tutti gli 1 che lo seguono una qualsiasi della due trasformazioni. Partiamo da
(se ce ne sono). La validit`
a di questo modo di (p q) r e applichiamo la propriet`
a distributiva;
procedere `e pi`
u nascosta, ma il metodo funziona! si ha:
3. se leggiamo le combinazioni come numeri in base
(p q) r (p r) (q r).
2 (v. alla fine della Sezione 1.5) vediamo apparire tutti i numeri da 0 a 7. In generale, si hanno i
numeri da 0 a 2n 1 e un po di esercizio insegna
come scriverli facilmente uno dopo laltro.

Qualche prova `e sufficiente a capire come procedere.

Per mezzo delle tabelle di verit`a `e possibile dimostrare una serie di propriet`a formali del calcolo delle
proposizioni; lasciando al lettore la cura delle verifiche, abbiamo elencato nella Tabella 4.4 le principali
propriet`a. Una proposizione che come p p risulta sempre vera si dice una tautologia; una che come
p p `e sempre falsa, si dice una contraddizione.
Per quanto abbiamo visto nella Sezione 1.7, limplicazione p q `e equivalente a p q. Questo
ci dice subito che p q non `e la stessa cosa della sua contraria q p, che equivale a p q. Invece, la contropositiva di p q `e q p, cio`e
q p = q p = p q, quindi coincide proprio
con p q. La doppia implicazione (p q) (q p)

Questo `e un passo notevole, poiche ci ha portato a


una disgiunzione di congiunzioni, proprio come la
proposizione darrivo. Linconveniente `e che nella prima disgiunzione manca la q e nella seconda manca la
p. La regola di identit`a p 1 = p ci dice che possiamo
inserire degli 1 in ogni congiunzione:
(p r) (q r) (p 1 r) (1 q r)
La regola del complemento p p = 1 ci permette
ora di inserire q e p nei posti giusti:
(p (q q) r) ((p p) q r)
Di nuovo, la legge distributiva ci permette di tornare
ad una disgiunzione di congiunzioni:
(pq r)(pq r)(pq r)(pq r)
Naturalmente, le varie applicazioni delle propriet`a associativa e commutativa nemmeno si citano: per`o ci

120

CAPITOLO 4. MATEMATICHE FINITE


commutativa
associativa
distributiva
assorbimento
idempotenza
complemento
identit`a
zero
doppia negazione
de Morgan

pq =qp
pq =qp
p (q r) = (p q) r
p (q r) = (p q) r
p (q r) = (p q) (p r) p (q r) = (p q) (p r)
p (q p) = p
p (q p) = p
pp=p
pp=p
p p = 1
p p = 0
p0=p
p1=p
p1=1
p0=0
p = p
(p q) = p q
(p q) = p q

Tabella 4.4: Le regole del calcolo proposizionale


sono. Ora osserviamo che la due congiunzioni cen- sono falsi (la sua tabella di verit`a `e la negazione della
trali sono la stessa, e la propriet`a di idempotenza ci disgiunzione, detta or in inglese, da cui il nome nor).
Per il lemma precedente: p nor q = p q. Tale
permette di concludere:
lemma sembra molto particolare, ma si pu`o estendere
(p q r) (p q r) (p q r),
immediatamente, coinvolgendo anche la disgiunzione:
che `e quanto volevamo dimostrare.
Questo successo potrebbe essere solo un caso, come potrebbe essere casuale il fatto che in precedenza
siamo riusciti ad esprimere i connettivi dellimplicazione, della doppia implicazione e dellesclusione mediante i connettivi booleani. Ci poniamo pertanto le
seguenti, fondamentali questioni:

Lemma 4.23 Si consideri un connettivo che abbia


una tabella di verit`
a composta da almeno un 1; allora
tale connettivo `e esprimibile mediante i tre connettivi
booleani.

Prova: Si considerino, nella tabella di verit`a del connettivo, le linee corrispondenti al valore 1; il lemma
precedente ci d`a modo di esprimere (mediante nega1. E vero che i connettivi booleani permettono zione e congiunzione) il connettivo che avesse quel sodi esprimere tutti i possibili connettivi fra lo 1. La disgiunzione di tutti questi connettivi vale 1
proposizioni?
solo in corrispondenza delle linee per cui il connettivo
`e vero, cio`e, in altre parole, il connettivo di partenza
2. E vero che due proposizioni sono equivalenti
e tale disgiunzione di congiunzioni sono equivalenti.
(hanno la stessa tabella di verit`a) se e solo se
`e possibile trasformare luna nellaltra mediante
Si riprenda la tabella di verit`a dellesclusione; il
le regole della Tabella 4.4?
lemma ci dice:
La risposta ad entrambe le domande `e positiva ed ora
cercheremo di darne la dimostrazione. Cominciamo
p q = (p q) (p q)
con il seguente
il che vuol dire: (non andremo al supermercato ma
Lemma 4.22 Si consideri un connettivo che abbia andremo dal commercialista) oppure (andremo al suuna tabella di verit`
a composta da un unico 1, men- permercato ma non andremo dal commercialista), il
tre tutti gli altri valori sono 0; allora, tale connettivo che `e proprio quello che ci aspettiamo. La conclusione
si pu`
o esprimere tramite i due connettivi booleani di `e allora:
negazione e di congiunzione.
Teorema 4.24 Un qualsiasi connettivo `e esprimibile
Prova: Siano p, q, r, . . . le proposizioni elementari mediante i tre connettivi booleani.
su cui `e costruito il connettivo. Si osservi che una
congiunzione `e vera se e soltanto se risultano vere le Prova: Se la tabella di verit`a del connettivo consingole proposizioni elementari che la compongono. tiene almeno un 1, vale il lemma precedente. Se non
Se allora si considera la congiunzione delle proposi- contiene alcun 1, il connettivo `e una contraddizione.
zioni elementari per cui il connettivo risulta vero e Se ne consideri la negazione; essa ha una tabella tutta
della negazione delle proposizioni per cui risulta fal- composta di 1, per la quale vale ancora il lemma preso, tale congiunzione `e vera se e solo se risulta vero il cedente; la negazione di ci`o che si ottiene `e pertanto
equivalente al connettivo dato.
connettivo, cio`e `e ad esso equivalente.
Un connettivo molto importante `e il cosiddetto
Secondo questo teorema, ogni connettivo `e esprinor, definito come vero se e solo se i suoi argomenti mibile in una forma standard, come disgiunzione di

121

4.6. IL CALCOLO DELLE PROPOSIZIONI


tante congiunzioni, ognuna contenente tutte le proposizioni elementari coinvolte (o la loro negazione).
Tale forma si dice la forma canonica disgiuntive della proposizione. Esiste anche una forma canonica
congiuntiva, composta dalla congiunzione di tante disgiunzioni. Non insistiamo oltre su questo punto, ma
vediamo piuttosto come la forma canonica disgiuntiva ci permetta di rispondere alla seconda domanda
che ci eravamo posti.
Teorema 4.25 Data una qualsiasi proposizione
espressa mediante i connettivi booleani, essa pu`
o essere trasformata nella sua forma canonica disgiuntiva
mediante le regole della Tabella 4.4.
Prova: Le due propriet`a distributive e le leggi di
de Morgan permettono di ridurre ogni proposizione
composta ad una serie di disgiunzioni di congiunzioni. Nelle congiunzioni possono non essere presenti
tutte le proposizioni elementari: mediante laggiunta
di 1 = pp si introducono le proposizioni elementari
mancanti. Si usano di nuovo le propriet`a distributive
per riportarci a una disgiunzione di congiunzioni, che
questa volta contengono tutte le proposizioni elementari. Infine, la propriet`a di idempotenza permette di
togliere le congiunzioni uguali.
Lesempio precedente illustra in modo semplice
questo teorema, dal quale discende la risposta alla
nostra domanda:
Teorema 4.26 Due proposizioni sono equivalenti se
e solo se possono essere trasformate luna nellaltra
mediante le regole della Tabella 4.4.
Prova: Siano P e Q le due proposizioni; se si pu`o
trasformare P in Q, allora P e Q sono equivalenti,
poiche ogni regola della Tabella 4.4 conserva lequivalenza. Viceversa, supponiamo che P e Q siano equivalenti. Per il lemma precedente possiamo trasformare
P e Q nelle loro forme canoniche disgiuntive P1 e Q1 ;
avendo P e Q la stessa tabella di verit`a, deve essere P1 = Q1 . La trasformazione che da P porta a P1
pi`
u la trasformazione inversa da Q1 a Q costituiscono
una trasformazione di P in Q, come si voleva.
I due teoremi meriterebbero diversi commenti; ci
limitiamo ai seguenti due:
1. Per la propriet`a espressa dal Teorema 4.24, i tre
connettivi booleani si dicono costituire un insieme universale di connettivi. In realt`a i tre connettivi sono sovrabbondanti perche, per le leggi
di de Morgan, si ha: (p q) = p q =
p q e quindi la disgiunzione pu`o essere sostituita da congiunzione e negazione (`e vero anche
che la congiunzione pu`o essere sostituita da disgiunzione e negazione; non `e vero invece che la
negazione possa essere sostituita dagli atri due

connettivi: provare a dimostrare!). Naturalmente, esistono altri insiemi universali di connettivi:


uno famoso e importante `e costituito da negazione e implicazione. Per vederlo, basta dimostrare
che la disgiunzione `e esprimibile tramite questi
due connettivi; ma poiche p q = p q, abbiamo p q = (p) q. Ma la cosa pi`
u straordinaria `e che, nella seconda met`a del 1800, il
famoso logico (e geologo e astronomo e mille altre cose) Charles Peirce dimostr`o lesistenza di
connettivi che, da soli, costituiscono un insieme
universale. Uno di questi `e p nor q = (p q),
il nor che abbiamo gi`a introdotto. Un altro `e
p nand q = (p q), il cui nome `e coniato dallinglese and che indica la congiunzione. Si noti
che p nor p = p nand p = p, ma lasciamo al
lettore il piacere di esprimere congiunzione o disgiunzione o implicazione mediante nor e nand.
Forse qui `e bene ricordare che Peirce `e anche
linventore delle tabelle di verit`a.
2. Il calcolo delle proposizioni, con i suoi teoremi
conclusivi, `e un esempio di teoria troppo semplice: praticamente, sappiamo tutto ci`o che c`e
da sapere su ogni proposizione. Questo, purtroppo, non succede nella realt`a, che `e molto pi`
u
complicata. Ci`o `e dovuto alla rigidit`a del concetto di proposizione; come osservato a suo tempo,
le frasi vere o false in assoluto sono poche e, soprattutto, poco interessanti, in quanto riguardano fatti specifici o convenzioni verbali. Di solito
siamo interessati (specie in Matematica) ad affermazioni molto generali. Ad esempio, asserire
che un certo triangolo rettangolo ha i lati lunghi
3, 4 e 5 m, `e asserire un fatto apparentemente accidentale; molto pi`
u interessante `e il teorema di Pitagora, che ci dice qualcosa su tutti
i triangoli rettangoli. Come abbiamo visto, per
questo esiste una teoria pi`
u vasta del calcolo delle proposizioni, cio`e il calcolo dei predicati. Nel
calcolo dei predicati, teoremi conclusivi analoghi
ai precedenti proprio non esistono.
Nota 4.7

Il calcolo delle proposizioni si `e rivelato


di fondamentale importanza in Informatica. Prima
di tutto, le tabelle di verit`
a permettono di progettare
i calcolatori elettronici. Il principio `e il seguente: si
consideri la somma di due bit, che indicheremo con p
e q. La loro somma `e data da p q e il riporto da
p q; se si possono realizzare fisicamente i connettivi
booleani (o un qualsiasi altro insieme universale di
connettivi) si possono realizzare anche questi connettivi e quindi ottenere marchingegni che eseguono
la somma (o qualsiasi altra operazione). Un metodo
per realizzare elettricamente i connettivi booleani `e
quello di mettere due circuiti in serie (congiunzione)
e in parallelo (disgiunzione), oppure di comandare un
circuito mediante un rele (negazione). Cos` furono

122

CAPITOLO 4. MATEMATICHE FINITE

costruiti i primi calcolatori elettrici; si pass`


o poi a
quelli elettronici, ma i principi rimasero gli stessi,
e sono gli stessi anche oggi quando le operazioni
vengono eseguite tramite circuiti integrati. Il contributo del calcolo delle proposizioni allInformatica
non si limita a questo: esso governa le condizioni
di esecuzione di un programma, intervenendo nelle
istruzioni condizionali (tipo if e case) e in quelle
iterative (tipo for, while e repeat).

4.7

Calcolo delle probabilit`


a

Il 1600 `e stato un secolo interessante da molti punti


di vista. In concomitanza con il nascere della scienza
moderna, si vide, con il consolidarsi dei grandi stati
nazionali, il sorgere di un interesse nuovo dei governi
nei confronti dei cittadini, visti fino ad allora come
semplici oggetti del potere. Gi`a alla fine del 1500 il
sovrano francese Enrico IV (1553 1610, re dal 1594
dopo aver giudicato che Parigi valeva bene una messa) aveva affermato Voglio che ogni paesano abbia il
suo pollo in pentola. Ma questo atteggiamento paternalistico dei sovrani era motivato da tre esigenze
di razionalizzazione:
1. come far rimpinguare le casse dello stato attraverso le tasse e altri mezzi per spillare soldi ai
cittadini;
2. come gestire i nuovi, grandi eserciti nazionali, al
tramonto delle milizie mercenarie;

le due facce come testa (T ) e croce (C). Se le lanciamo e registriamo le facce che si presentano, possiamo ad esempio avere a = T, b = T, c = C, d = T .
Possiamo gettare unaltra volta le monete e ottenere ora a = C, b = T, c = C, d = C. Se ci chiediamo quante possibili configurazioni diverse si possono
ottenere, un ragionamento che abbiamo gi`a visto e
tipico dellanalisi combinatoria, ci dice che esse sono
24 = 16. Come si sa, e come vedremo, la connessione
tra calcolo delle probabilit`a e analisi combinatoria `e
fortissima. Infatti, se ora vogliamo sapere quante volte possiamo ottenere due teste e due croci, lanalisi
combinatoria ci viene ancora in aiuto. Pensiamo alle quattro monete come a un insieme A = {a, b, c, d}
e a un singolo lancio come a un sottoinsieme di A,
esattamente composto dalle monete che hanno dato
testa: le altre sono determinate di conseguenza. Ad
esempio, il primo dei lanci precedenti `e equivalente al
sottoinsieme {a, b, d} e il secondo a {b, d}. E chiaro
che, viceversa, il sottoinsieme vuoto corrisponde a un
lancio con tutte croci e il sottoinsieme A a un lancio
con tutte teste. Allora, i lanci con due teste e due
croci corrispondono ai sottoinsiemi di A formati di
due elementi, cio`e sono le combinazioni di
4 elementi
a 2 a 2, che, come ora sappiamo, sono 42 = 6. In
altre parole, sulle 16 configurazioni possibili, che si
ottengono lanciando quattro monete, 6 corrispondono a 2 teste e 2 croci. In generale, possiamo dire che,
se abbiamo n monete, le possibili configurazioni otte
nute in un lancio sono 2n ; di queste, ve ne sono nk
che presentano k teste e, di conseguenza, n k croci.

3. come interagire con la borghesia, sempre pi`


u
Di solito, questi problemi si formulano come quesiti
economicamente rilevante, sia nelle attivit`a
sulle
probabilit`a: quante sono le probabilit`a che lantradizionali sia nella nascente industria.
ciando quattro monete si ottengano esattamente due
Fu allora inventata una nuova scienza che, trattan- teste e due croci? Il ragionamento di prima ci dice
do della conduzione razionale dello Stato, fu detta che tali probabilit`a sono 6 su 16. Cerchiamo di formaStatistica.
lizzare un po meglio questi concetti: si supponga di
Da quel tempo la Statistica si `e evoluta, sia nei voler considerare un certo insieme di eventi, ad esemmetodi di ricerca sia nei campi applicativi; di fatto pio il lancio di monete. Si dicono eventi possibili gli
essa `e diventata una metodologia di studio di tut- elementi dellinsieme, talvolta detto insieme univerti i fenomeni, naturali e artificiali, indispensabile alla so. Si noti che il concetto di evento non `e definibile;
Fisica, alla Chimica, alla Biologia, alla Medicina e al- con un tipico gioco verbale abbiamo appena cambiato
lInformatica. La Statistica `e una scienza tipicamente lidea di evento in quella di elemento di un insieme,
sperimentale, che rileva ed elabora dati, e, come tutte concetto che a questo punto ci dovrebbe essere pi`
u fale scienze sperimentali, si avvale di una serie di meto- miliare, ancorche esso pure sia stato lasciato, ai suoi
di e di tecniche matematiche, che nel loro insieme e tempi, indefinito. Si isoli ora una classe particolare
nella loro formulazione costituiscono una vera e pro- di eventi nellinsieme considerato, come ad esempio
pria teoria, il cosiddetto calcolo delle probabilit`
a. Ci i lanci che danno 2 teste e 2 croci; gli elementi di
proponiamo pertanto di introdurre i primissimi rudi- questa classe si dicono eventi favorevoli. La probabimenti di questa branca della Matematica, e di cercare lit`
a che si verifichi un evento della classe particolare
di capire i rapporti che essa ha con la sua controparte si definisce come il rapporto tra il numero degli evensperimentale, cio`e la statistica.
ti favorevoli e il numero degli eventi possibili. Nel
Supponiamo di avere quattro monete, che distin- nostro esempio, la probabilit`a di avere 2 teste e 2
gueremo con le lettere a, b, c, d; distinguiamo anche croci o, se si preferisce, esattamente due teste sulle 4

`
4.7. CALCOLO DELLE PROBABILITA
monete del lancio, `e:
4,2 =

6
= 0.375.
16

Da questa definizione discende che la probabilit`a


`e sempre un numero compreso tra 0 ed 1: 0 1.
Se la classe degli eventi favorevoli coincide con linsieme degli eventi possibili, allora la probabilit`a `e 1;
considerato che un qualsiasi evento possibile `e certamente anche un evento favorevole, la probabilit`a
= 1 si dice anche certezza. Viceversa, se la classe
degli eventi favorevoli `e vuota, il rapporto che ci d`a
la probabilit`a `e = 0; in questo caso, `e impossibile che un qualsiasi evento sia favorevole, e quindi la
probabilit`a = 0 si dice anche impossibilit`
a.
Fissato linsieme di tutti gli eventi da considerare,
la divisione in classi dei singoli eventi dipende ovviamente dal problema che stiamo trattando. Se, ad
esempio, gli eventi sono gli alunni di una scuola,
possiamo pensare a diverse divisioni: in maschi e femmine, in base al mese di nascita, in base al colore dei
capelli o degli occhi, e cos` via. Gli eventi che appartengono a classi disgiunte si dicono indipendenti tra
di loro; `e questo un concetto molto importante, sul
quale ritorneremo tra breve. Il numero di eventi che
appartengono a una certa classe si dice la frequenza
di quella classe. Nellesempio del lancio delle monete,
la divisione degli eventi (o lanci) in base al numero di
monete che presentano testa, `e una divisione in classi
disgiunte. In tal caso si pu`o dare una rappresentazione grafica della distribuzione dei vari eventi nelle diverse classi, disegnando un diagramma nel quale ogni
classe `e raffigurata da una colonna, la cui altezza `e
proporzionale alla frequenza degli eventi nella classe.
Poiche, come s`e visto, la probabilit`a `e data dal rapporto fra la frequenza e il totale degli eventi possibili,
tali colonne risultano automaticamente proporzionali anche alla probabilit`a che si verifichi un evento di
quella classe. Se consideriamo il lancio di 8 monete,
la probabilit`a che in un lancio si ottengano k teste `e
data dalla formula:


1 8
1 8
=
.
8,k = 8
2 k
256 k
Basta prolungare il triangolo aritmetico fino alla riga
n = 8 per ottenere le frequenze di ciascuna classe.
Nella Figura 4.6 abbiamo dato questa rappresentazione, che `e detta istogramma. Un istogramma evidenzia visivamente la distribuzione degli eventi nelle
classi che ci interessano, purche queste siano a due
a due disgiunte, cio`e corrispondano a classi di eventi tra loro indipendenti. Il concetto di indipendenza
`e molto importante e le seguenti regole, che abbiamo gi`a avuto occasione di adoperare, vanno tenute
sempre presenti:

123
1. la probabilit`a che si verifichi almeno uno di due
o pi`
u classi di eventi indipendenti `e dato dalla
somma delle probabilit`a di ciascuna delle classi;
2. la probabilit`a che si verifichi una data sequenza di classi di eventi indipendenti `e data dal
prodotto delle probabilit`a delle singole classi.

Figura 4.6: Distribuzione binomiale


Nota 4.8

Il nostro insistere sul fatto che gli eventi non sono altro che elementi di un insieme non `e
ovviamente casuale. Riprendendo cose che abbiamo
introdotto proprio allinizio, linsieme degli eventi possibili pu`
o essere identificato con linsieme universo U ;
se questo `e finito, saranno finiti anche i suoi sottoinsiemi. Una partizione di U (Sezione 1.1) `e un modo
per definire una distribuzione degli elementi di U . Se
A U , la frequenza di A coincide con card(A), e
quindi si ha:
card(A)
(A) =
card(U )
come definizione di probabilit`
a. Ad ogni operazione
sullinsieme delle parti di U , cio`e P(U ), corrisponde un
assegnamento di probabilit`
a al risultato. Ad esempio,
(A) = 1 (A); se A e B sono disgiunti, si ha (A
B) = (A)+(B) e (AB) = 0, in quanto (U ) = 1
e () = 0: qui si ritrovano i concetti di certezza e impossibilit`
a. Purtroppo, se A e B non sono disgiunti,
card(AB) pu`
o assumere diversi valori, ed esattamente 0 card(A B) min(card(A), card(B)); questo
implica che per le probabilit`
a si abbia:
0 (A B) min((A), (B)).
Se ne deduce subito, guardando i diagrammi di Venn
della Figura 1.1:
(A B) = (A) + (B) (A B).
(A B) = (A) + (B) (A B).

Unaltra propriet`
a importante `e la seguente: sia
P1 , P2 , . . . , Pn , una partizione di U e sia A U ; allora
si ha:
(A) = (A P1 ) + (A P2 ) + + (A Pn ).

124

CAPITOLO 4. MATEMATICHE FINITE

Naturalmente, esistono infinite altre propriet`


a, ma su
di esse qui non possiamo insistere.
Si voglia risolvere il seguente problema: in una classe
vi sono 12 maschi e 14 femmine; di questi allievi, 16
abitano nel centro della citt`
a e 10 vengono dalla periferia. Sapendo che il totale delle femmine e di coloro
che abitano in periferia `e di 20 allievi, qual `e la probabilit`
a che un maschio abiti in citt`
a? Dette M, F e
C, P le due partizioni di U , possiamo indifferentemente ragionare sulle cardinalit`
a o sulle probabilit`
a. Lultima condizione significa (F P ) = 20/26 e quindi
la probabilit`
a che una femmina abiti in periferia `e:
(F P ) = (F ) + (P ) (F P ) =
10
20
4
14
+

=
.
26
26
26
26
Da questo segue che (M P ), cio`e la probabilit`
a che
un maschio abiti in periferia, `e:
=

(M P ) = (P ) (F P ) =

10
4
6

=
.
26
26
26

Infine, quello che ci interessa `e:


(M C) = (M ) (M P ) =
=

6
6
12

=
23.1%.
26
26
26

Questa impostazione dei concetti della probabilit`


a va
bene per gli insiemi finiti, ma non funziona pi`
u per
quelli infiniti, quando card(U ) non `e un numero naturale. Si consideri ad esempio un quadrato di lato
nel quale `e contenuto un triangolo equilatero con la
base coincidente con uno dei lati del quadrato; si vuol
sapere qual `e la probabilit`
a che, preso a caso un punto del quadrato, esso appartenga al triangolo. Il ruolo
della cardinalit`
a `e qui preso dallarea che, in qualche
modo, conta il numero di punti contenuti in una figura. Larea del quadrato
`e Aq = 2 , mentre larea

u avanti, il
del triangolo `e At = 32 /4 (si veda, pi`
Teorema 6.29); la probabilit`
a cercata `e pertanto:

3 2 1
3
At
2 =
0.433 = 43.3%.
=
Aq
4

4
Questa osservazione, per quanto banale, `e alla base
della teoria moderna del calcolo delle probabilit`
a,
che fa parte della pi`
u vasta Teoria della Misura, quel
settore della Matematica che si interessa del calcolo
integrale.

Pascal inizi`o a interessarsi del triangolo aritmetico


per studiare i giochi che allora si stavano affermando,
sia per divertire i ricchi, sia per cavare soldi alla povera gente per mezzo delle varie lotterie, a carattere
locale e nazionale. Un gioco si dice equo se una puntata x su un evento E viene ricompensata, in caso di
vittoria, con una cifra y inversamente proporzionale
alla probabilit`a di verificarsi dellevento E. Ad esempio, sulla roulette la probabilit`a che la pallina si fermi

su un dato numero n `e 1/37 a causa della presenza


dello 0. Il gioco sarebbe equo se, in caso di vittoria, il banco pagasse 37 volte la puntata, cio`e la cifra
giocata. Ci`o assicurerebbe un equilibrio statistico fra
vincite e perdite, cos` che a lungo andare ci sarebbe
un sostanziale pareggio tra banco e giocatori (almeno
nella loro globabilit`a, non certo per ogni singolo giocatore). Come `e noto la roulette paga solo 36 volte la
posta, congelando le puntate nel caso che la pallina si
fermi sullo 0. Questo rende il gioco non equo; statisticamente, ad ogni giro il banco guadagna, in media,
quasi 1/37 di tutte le giocate; alla fine della giornata
(o della nottata) il vantaggio `e enorme e questo costituisce il guadagno del gestore (a parte le tasse di
concessione che deve dare allo Stato). Analogamente,
come abbiamo visto, giocando un ambo su una ruota,
la probabilit`a di vincere `e:
.
5
90
10
=
=
.
2
2
4005

Quindi, alla giocata di 1 e, in caso di vincita dovrebbe essere pagati 400.50 e; in effetti, lo Stato paga
242.50 e e il resto va a favore dellerario. In pratica,
se 10 mila giocatori giocano un ambo puntando 1 e
ciascuno, lo Stato incassa 10. 000 e e paga 6062.50 e
ai 25 vincitori (in media, uno ogni 400). Il guadagno
medio dello stato `e pertanto di 3937.50 e.
Occorre ora chiarire qual `e il rapporto tra il calcolo delle probabilit`a e la statistica. Fino a questo
punto abbiamo parlato soprattutto di insiemi, e la
realt`a concreta `e stata appena accennata, citando il
lancio delle monete, il gioco del lotto e la roulette.
In effetti, abbiamo guardato a questi giochi come a
giochi astratti, senza effettuare dei veri lanci o delle
vere estrazioni. Prendiamo allora 4 monete e, muniti
di santa pazienza, facciamo una serie di lanci, registrando ogni volta su un foglio il numero delle teste
che otteniamo. Fare anche solo 100 lanci `e alquanto noioso, e servirebbe meglio ai nostri scopi farne
1000 o 10. 000. Oggi queste cose si fanno col calcolatore, simulando con opportuni programmi il lancio
delle monete, e allora `e un attimo simulare centomila o un milione di lanci. Nel 1600 sera costretti a
procedere a mano e cera gente che passava la vita
a fare esperimenti del genere; nel 1800 le cose non
erano diverse, come ci informa Dostoevskij. Tutti sono invitati a provare, manualmente e/o al calcolatore,
perche lesercizio `e veramente utile per rendersi conto
delle cose.
Quando diciamo che la probabilit`a di ottenere testa
nel lancio di una moneta `e il 50%, in realt`a non abbiamo misurato proprio niente, ne tanto meno abbiamo
contato una qualche quantit`a legata alla moneta o
ai suoi lanci. Ci`o che intendiamo, `e affermare che
non esiste alcuna ragione plausibile perche testa debba uscire invece di croce. La stessa cosa si pu`o dire

`
4.7. CALCOLO DELLE PROBABILITA

125

quando affermiamo che ogni faccia di un dado uscir`a


con probabilit`a 1/6. Tali probabilit`a, che assegniamo con un qualche vago criterio di equit`a, si dicono
probabilit`
a a-priori, e riflettono le nostre aspettative
sul verificarsi (o meno) di certi eventi. Al contrario, quando si effettuano dei lanci, reali o simulati
sullelaboratore, possiamo contare gli eventi che mano mano si verificano, ottenendo cos` vere frequenze. E da queste frequenze che ricaviamo le probabilit`a, che pertanto si dicono prababilit`
a statistiche o
a-posteriori.
Non `e filosoficamente banale tradurre uno nellaltro
i due concetti di probabilit`a a-priori e a-posteriori.
Nel caso della moneta, se su mille lanci otteniamo
ft = 504 teste ed fc = 496 croci, non ci sentiamo
affatto di rivedere la nostra intuizione che vorrebbe
si verificassero 500 teste e altrettante croci. Ottenere un risultato cos` equo, andrebbe contro il nostro
concetto di casualit`a, ricordandoci alla larga una sequenza 0, 1, 0, 1, 0, . . ., tuttaltro che casuale. La distribuzione 504/496 ci porta a dire che la probabilit`a
a-posteriori conferma la probabilit`a a-priori. Lidea che coltiviamo `e proprio questa: al crescere del
numero n dei nostri lanci, i rapporti ft /n e fc /n tendano entrambi ad avvicinarsi ad 1/2, e affibbiamo
limaginifico nome di fluttuazioni statistiche alle differenze, che speriamo piccole, fra frequenza statistica
ft o fc e frequenza teorica n/2. Vedremo nella prossima sezione di dare criteri pi`
u oggettivi per stabile
se e quando una distribuzione empirica (fatta di probabilit`a a-posteriori) si conforma a una distribuzione
teorica (composta di probabilit`a a-priori).
Facciamo un esempio un po pi`
u articolato. Con
laiuto dellelaboratore, simulando 160. 000 lanci di
quattro monete, ho ottenuto questi risultati:
n. teste
simulaz.
teoria

0
10063
10000

1
39951
40000

2
60060
60000

3
39891
40000

4
10035
10000

`e gi`a convincente, ma in Matematica non si possono


fare le cose ad occhio. Esistono dei test (ad esempio,
il cosiddetto test del chi quadro) che ci permettono
di dire quand`e che, ragionevolmente, laccordo c`e e
quando, invece, possiamo con buona sicurezza asserire che tale accordo non ci sia. Vedremo queste cose
nella prossima sezione, anche se in modo piuttosto
veloce e senza troppi approfondimenti.
Una domanda abbastanza naturale `e la seguente:
lanciamo s` le nostre quattro monete, ma qual `e il
numero medio di teste che ci aspettiamo di ottenere
in un gran numero di lanci? Cominciamo col considerare una sequenza di dati che indicheremo con
{x1 , x2 , . . . , xn }; si dice media o valor medio o valore
atteso di questi dati il rapporto tra la loro somma e
il loro numero, cio`e:
n

1
1X
x = (x1 + x2 + + xn ) =
xj
n
n j=1

P
dove il simbolo
indica la somma di termini omogenei, individuati da un indice, variabile dallestremo
indicato in pedice fino allestremo indicato in apice
(vedere la fine della Sezione 2.8). Ad esempio, se in
una stanza vi sono cinque persone di altezza, rispettivamente: 1.72, 1.63, 1.84, 1.80, 1.71, la loro altezza
media `e (1.72+1.63+1.84+1.80+1.71)/5 = 8.70/5 =
1.74. Si noti che, nonostante il nome di valore atteso, la media non `e il valore che ci aspettiamo possa
avere un elemento del nostro insieme, preso a caso;
infatti, nessuna delle persone nella stanza `e alta 1.74.
Piuttosto, la media indica il valore che ci permette di
prevedere, col minor errore possibile, il valore di un
elemento qualsiasi della serie considerata.
Talvolta, come nel caso dei nostri lanci, abbiamo
una divisione degli elementi in classi e di ogni classe
abbiamo la frequenza: 0 teste si ottengono con una
sola configurazione, 1 testa con 4 configurazioni, e
cos` via. In altre parole, se si hanno h classi, il valore
x1 `e assunto con frequenza f1 , il valore x2 con frequenza f2 , e via di seguito fino al valore xh assunto
con frequenza fh . In tal caso il numero totale di dati
`e f1 + f2 + + fh = n e quindi la media `e data dalla
formula:
Ph
x1 f1 + x2 f2 + + xh fh
j=1 xj fj
.
x=
= Ph
f1 + f2 + + fh
j=1 fj

Lultima riga contiene il numero di lanci teorico, cio`e


quanti avrebbero dovuto essere i lanci di ciascun tipo se la prova pratica, la simulazione, si conformasse perfettamente alla teoria. Tali valori si ottengono
moltiplicando 160.000, il numero di prove, per la probabilit`a di ottenere quel certo numero di teste, ovvero
4,k = k4 /16. In pratica `e impossibile che i dati relativi a una simulazione coincidano pari pari con ci`o
che prevede la teoria: anzi, quando in un esperimento Nel caso dei lanci si ha:
di statistica ci d`a valori troppo vicini a quelli previ10+41+62+43+14
sti dalla teoria, si pu`o addirittura pensare a qualche
= 2.
x=
1+4+6+4+1
imbroglio, messo in atto per far tornare le cose.
Daltra parte, quanto al pi`
u si possono discostare i
Nota 4.9
La media non corrisponde nemmeno al
dati sperimentali da quelli teorici affinch`e si possa
valore con la massima frequenza, anche se lesempio
affermare che i primi confermano i secondi (o viceprecedente ci potrebbe far pensare una cosa del geneversa)? Nel nostro caso, un confronto ad occhio
re. Ad esempio, allultimo appello 13 studenti hanno

126
superato il mio esame: due hanno preso 21, sei hanno
avuto 24, uno solo ha preso 25 e ci sono poi stati tre
28 e un 30. La media (2 21 + 6 24 + 1 25 +
3 28 + 1 30)/13 = 325/13 = 25, e uno solo degli
studenti ha avuto 25. Il valore della sequenza che ha
la frequenza maggiore, cio`e il pi`
u gettonato, si dice
la moda; nellesempio, la moda `e costituita dal valore
24. Pi`
u importante `e per`
o il concetto di mediana. Si
consideri la nostra sequenza di dati (riprendiamo ad
esempio quella dellaltezza delle cinque persone) e la
si ordini in modo tale da mettere i dati stessi con valori mai decrescenti; tale ordinamento si dice sequenza
per rango e la posizione assunta da ogni elemento si
dice il rango di quellelemento. Per le altezze si ha
(1.63, 1.71, 1.72, 1.80, 1.84). Il valore mediano o mediana della distribuzione `e lelemento centrale di tale
sequenza ordinata. Nellesempio delle altezze, la mediana vale 1.72; nel caso dei voti `e 24, corrispondente
al settimo voto nella disposizione per rango. Se i dati
sono in numero pari, ci sono due elementi centrali; in
tal caso, la mediana `e data dalla semisomma di tali
due elementi.
La media considerata si chiama anche aritmetica, per
distinguerla da altri tipi di media che si considerano
talvolta, anche se pi`
u raramente. La media geometrica
sostituisce il prodotto alla somma e, di conseguenza,
la radice n-esima alla divisione per n. Formalmente,
se i dati sono a1 , a2 , . . . , an , la loro media geometrica
`e definita da:

G = n a1 a2 . . . a n ;

CAPITOLO 4. MATEMATICHE FINITE


dei quadrati degli scostamenti dei singoli dati dalla
loro media. Lo scostamento di xj dalla media x `e la
differenza (xj x) e quindi si ha:
2 =

(x1 x)2 + (x2 x) + + (xn x)2


=
n
n

1X
(xj x)2 .
n j=1

Il simbolo 2 `e universalmente usato per indicare la


varianza di una distribuzione; , la radice quadrata
della varianza, indica la cosiddetta deviazione standard. Nel caso delle persone nella stanza, le altezza
uguali danno varianza 0, le altezze che crescono uniformemente danno varianza 0.0002 e la distribuzione
di partenza d`a 0.0086. In generale, la varianza `e zero
se e solo se tutti i dati coincidono col valore medio, e
va crescendo mano mano che i dati se ne discostano.
In altre parole, la varianza `e tanto pi`
u grande quanto
pi`
u i dati tendono ad essere lontani dalla media, cio`e
la varianza `e un indicatore della dispersione dei dati
intorno al loro valore medio.

4.8

Distribuzioni

Un po di buon senso, o lesperienza, ci fanno intuire


che, lanciando le nostre otto monete, `e pi`
u probabile
se tutti i dati sono uguali ad a, abbiamo G = a, come ottenere una distribuzione bilanciata, come 4 teste
ci si deve aspettare. La media armonica `e un po pi`
u e 4 croci, piuttosto che una molto sbilanciata, come
8 teste oppure 8 croci. Invece, giocando a carte, alla
complessa e si definisce come:
roulette o al lotto, ci aspettiamo che ogni carta o ogni
1
1
1
H = ((a1
,
1 + a2 + + an )/n)
numero sia equiprobabile, e anche se qualcuno insiste
cio`e come linverso della media aritmetica degli nel voler giocare al lotto i numeri che non escono
u tempo, sa razionalmente che tale metodo non
inversi delle quantit`
a considerate. Si pu`
o dimostrare da pi`
a pi`
u favorevole del giocare del tutto a caso,
che la media armonica `e sempre minore o uguale alla gli sar`
media geometrica che, a sua volta, `e sempre minore essendo impossibile che le giocate passate possano in
o uguale della media aritmetica A, cio`e H G A; qualche modo influenzare la prossima estrazione.
luguaglianza si ha se e solo se tutti i dati sono uguali.
Si dice che, durante la seconda guerra mondiale,
Il lettore pu`
o controllare che con due soli dati a1 = 5 quando ormai la Statistica era una disciplina ben noe a2 = 7 si ha A = 6, G = 5.916 e H = 5.833.
ta, lesercito americano ordinasse a una ditta di conCome vedremo con lAlgoritmo 6.8, la media geofezioni bel 35. 000 divise in sette misure diverse; e la
metrica fornisce un metodo assai interessante per
o 7. 000 divise di ciascuna misura. Fu
il calcolo di , il rapporto tra circonferenza e diametro. ditta consegn`
cos` che le misure medie non bastarono e quelle piccole e grandi avanzarono in grande quantit`a. Non so
Se nella nostra stanza avessimo cinque persone come fin` la storia, ma oggi qualsiasi negozio di scarpe
tutte alte 1.74, la loro altezza media sarebbe an- ordina molte misure medie (37 38 per la donna, 41
cora 1.74; e cos` sarebbe se le persone fossero alte 42 per luomo) e poche misure estreme come un 35
(1.72, 1.73, 1.74, 1.75, 1.76). La vecchia distribuzione o un 41 femminili, un 39 o un 45 maschili. Chi, come
`e la meno omogenea, mentre la pi`
u omogenea `e quella me, calza il 39, sa quante difficolt`a si incontrano per
delle persone con la stessa altezza. Questa osserva- trovare un modello di nostro gradimento, proprio per
zione ci dice che la media di una distribuzione non la scarsit`a delle scarpe di tale numero.
Com`e che ci aspettiamo uniformit`a da una parte
mette in evidenza come i vari elementi si discostano
dal loro valore medio. Per questo esiste il concetto di (roulette, lotto) e variabilit`a dallaltra (altezza, nuvarianza : la varianza di una distribuzione `e la media mero di scarpe, taglia)? Come dimostra il caso della

127

4.8. DISTRIBUZIONI
ditta americana, le nostre previsioni sono legate allintuito, allesperienza o alla mancanza delluno e/o
dellaltra. Per questo, la Statistica e il Calcolo delle Probabilit`a cercano di dare unimpostazione pi`
u
scientifica e razionale al nostro modo di affrontare
quella parte della realt`a che appare governata dalla
casualit`a.
Fortunatamente, la natura sembra adeguarsi ad alcuni schemi (non molti, per la verit`a) che possono essere studiati in modo sistematico: come conclude Dostoevskij, nel susseguirsi delle probabilit`a favorevoli
c`e, se non un sistema, un certo qual ordine. In tal
modo, pur rimanendo impossibile prevedere il singolo
caso (come cerca di fare il giocatore), `e abbastanza
facile prevedere in modo accurato landamente di un
gran numero di eventi: `e questo che aiuta le aziende
di scarpe e di confezioni, che hanno dalla Statistica
indicazioni precise sulle percentuali da produrre per
ciascuna taglia. Se consideriamo il numero di persone che calzano una certa misura di scarpe, otteniamo
la distribuzione dei numeri di scarpa; se misuriamo
laltezza degli abitanti di Milano e raggruppiamo tali
altezze di centimetro in centimetro, abbiamo la distribuzione dellaltezza dei milanesi; se, come facevano i
giocatori di Dostoevskij, contiamo le volte che viene
estratto ciascun numero della roulette, abbiamo la
distribuzione di tali numeri. Queste sono distribuzioni empiriche, legate alla frequenza dei singoli eventi,
ma `e possibile studiare teoricamente tali distribuzioni chiamando in campo il Calcolo delle Probabilit`a.
Come si diceva, le distribuzioni teoriche alle quali si
conformano la gran parte delle distribuzioni empiriche, sono stranamente poche. Noi, poi, ne introdurremo solo quattro, per semplificarci ancor di pi`
u la
vita.
1. Distribuzione uniforme. Lanciando una moneta o un dado, giocando al lotto o alla roulette, ci
aspettiamo che ogni evento (testa o croce, una faccia
da 1 a 6, un numero tra 0 e 36, o un numero tra 1
e 90) abbia la stessa probabilit`a di verificarsi di ciascun altro evento. La corrispondente distribuzione di
frequenze `e perci`o costituita da un istogramma con
tutte le colonne della stessa altezza. I giocatori di Dostoevskij avrebbero dovuto trovare che ognuno dei 37
numeri della roulette ha una frequenza duscita vicina
a tutti gli altri. Le oscillazioni che si possono riscontrare sono irrisorie di fronte alla frequenza registrata
e possono essere compensate continuando a registrare le uscite successive. Semmai, si pone il problema
di avere un criterio (o test, come si dice tecnicamente) per stabilire se, effettivamente, queste oscillazioni
sono casuali o siano dovute a una possibile truccatura dellapparecchio della roulette. Vedremo pi`
u
avanti un possibile test.
Nota 4.10

La distribuzione uniforme ha assunto

un ruolo fondamentale con lavvento degli elaboratori elettronici. Infatti, per mezzo di essa `e possibile
simulare anche le altre distribuzioni. E quindi importante avere un metodo efficace per produrre elementi
distribuiti in modo uniforme. In realt`
a, lelaboratore
non `e assolutamente in grado di produrre eventi casuali, in quanto esso `e, per definizione, una macchina
deterministica, cio`e prevedibile in tutto quello che fa.
Fortunatamente, la Matematica mette a disposizione
alcune tecniche che permettono di produrre distribuzioni che, pur non essendo casuali, hanno tutti i crismi
della casualit`
a. Vengono pertanto dette distribuzioni pseudocasuali, e possono essere usate benissimo in
luogo della distribuzione uniforme. Si consideri un numero primo p e il gruppo Zp composta da (p) = p 1
elementi. Tale gruppo `e ciclico, e quindi esistono numeri a, con 0 < a < p che generano tutto il gruppo, cio`e {a, a2 , a3 , . . . , ap1 } sono tutti gli elementi di
Zp . Questi elementi, nellordine appena detto, anche
se tale ordine `e del tutto determinato, posseggono le
caratteristiche delle sequenza casuali, e costituiscono
pertanto una sequenza pseudocasuale. Ad esempio, se
p = 11, le potenze di 7 sono:
7 5 2 3 10 4 6 9 8 1
che, ad occhio, forniscono una permutazione ragionevolmente casuale dei numeri da 1 a 10, cio`e gli elementi
di Z11 . Se poniamo a = 7 ed s = 1, il calcolo della sequenza pu`
o essere impostato semplicemente ponendo,
iterativamente:
s = as mod p
di modo che il calcolo di ogni potenza successiva di
a richiede solo un prodotto e una divisione; da questa formula, questo metodo di generazione viene detto
congruenziale. Se volessimo utilizzare la sequenza per
generare una serie di lanci di una moneta o di un dado, basterebbe ridurre i numeri modulo 2 e modulo
6. Nel caso del dado, bisogna poi aggiungere 1, ma
questo `e banale. Le sequenze sono:
moneta
dado

1101000101
2634551432

e ad occhio ci appaiono anchesse ragionevolmente


casuali.
Naturalmente, p = 11 `e solo un esempio, e dopo
10 numeri la sequenza si ripete, di modo che non
possiamo proprio pensare di utilizzarla in applicazioni
che coinvolgono migliaia, o anche milioni, di scelte casuali. Un numero pi`
u adeguato `e p = 999999999989,
assai vicino a 1012 . In questo modo, il numero
s/1012 `e un numero reale compreso tra 0 ed 1, e ci`
o
serve ad avere una distribuzione uniforme continua;
essa permette di ottenere ciascun numero reale
nellintervallo [0, 1) (con 12 cifre decimali) con la
stessa probabilit`
a. Questi numeri possono essere
interpretati come probabilit`
a e quindi costituiscono
una buona distribuzione per tutti i problemi pratici
che li debbano utilizzare.

128

CAPITOLO 4. MATEMATICHE FINITE

2. Distribuzione binomiale. Se lanciamo due o


pi`
u monete e contiamo il numero di teste e di croci
ottenute, abbiamo visto come non si ottenga pi`
u una
distribuzione uniforme, ma entrino in gioco i coefficiente binomiali. La probabilit`a che gettando n monete si abbiano k teste, e quindi n k croci, `e data
dalla formula:
.
n
2n .
n,k =
k

Infatti, nk corrisponde agli eventi favorevoli, mentre 2n sono gli eventi possibili. La stessa cosa capita
nel lancio di due o pi`
u dadi, anche se in questo caso
la faccenda `e pi`
u complicata a causa delle sei facce. Prendiamo n dadi, lanciamoli e chiediamoci qual
`e la probabilit`a che escano esattamente k facce col
numero 1. Ognuna delle k facce ha probabilit`a 1/6
di apparire e poiche i dadi hanno un destino indipendente luno dallaltro, la probabilit`a che appaiano esattamente k facce `e (1/6)k . Ricordiamo infatti,
dalla sezione precedente, che le probabilit`a si moltiplicano quando corrispondono al verificarsi successivo
di eventi indipendenti. Analogamente, la probabilit`a
che una faccia non presenti il numero 1 `e 5/6, e quindi
la probabilit`a che n k facce non presentino il nujmero 1 `e (5/6)nk . Infine, occorre valutare in quanti
modi diversi vi siano esattamente k facce 1 fra le n
facce
n dei nostri dadi. Ma questo `e facile e i modi sono
che la probabilit`a cercata `e:
k , cos`
n,k

due dadi `e dato dalle combinazioni: 1 + 4, 2 + 3,


3 + 2 e 4 + 1. Poiche due dadi danno luogo a 36
diverse configurazioni, la probabilit`a di ottenere 5 `e
4/36 = 1/9 0.1111 . . ., cio`e un po pi`
u dell11%. Se
il numero dei dadi cresce, `e un interessante problema
combinatorio trovare tutte le possibili configurazioni
che danno un certo numero N . Il problema `e uno
dei classici di questa disciplina, studiato fin dai tempi di Eulero e detto il problema delle partizioni di un
intero. Originariamente, il problema consisteva nel
trovare in quanti modi `e possibile formare un numero
intero; ad esempio:
4=1+3=2+2=3+1=1+1+2=1+2+1=
= 2 + 1 + 1 = 1 + 1 + 1 + 1.
La configurazione 1 + 3 pu`o essere considerata uguale
alla 3 + 1 e allora il modello cambia. Nel nostro caso,
`e richiesto che gli addendi siano un numero fissato
n e il loro valore non ecceda un limite superiore (6
nel caso dei dadi). Non ci possiamo addentrare in
questa materia, ma usando quattro dadi si ottiene
listogramma della Figura 4.7, che ci introduce alla
terza delle nostre distribuzioni.

k nk
n
1
5
=
=
k
6
6


n
n 1
5
1 n nk
5
=
= n
6 k
6
k 5k
dove entrano, appunto, i coefficienti binomiali che
danno il nome a questa distribuzione.
In generale, se un evento ha probabilit`a p di verificarsi, la probabilit`a che esso non si verifichi `e
q = 1 p. Nelle monete abbiamo p = q = 1/2,
poiche testa e croce sono alternative. Nel caso del
dado, se levento `e il comparire di una faccia determinata, la sua probabilit`a `e 1/6; che perci`o compaia
uno degli altri numeri `e 5/6. Pertanto, la probabilit`a
che si verifichino k fra gli eventi considerati in una
sequenza di n eventi, `e dato dalla formula:

n k nk
p q
.
n,k =
k

Figura 4.7: Distribuzione quasi normale

3. Distribuzione normale. La forma a campana della distribuzione in Figura 4.7 `e caratteristica di


molti fenomeni naturali. Se misuriamo laltezza delle
persone o la lunghezza del loro piede; la circonferenza
del tronco degli alberi in una foresta o la velocit`a delle molecole in un corpo a una certa temperatura; osserveremo sempre la caratteristica forma a campana.
Questa formula generalizza tanto il lancio delle Gauss, il principe dei matematici, studi`o teoricamenmonete, quanto quello dei dadi.
te questa distribuzione e la chiam`o normale proprio
Quando si gioca a dadi, si pu`o puntare sul nume- perche sembra essere la normale distribuzione dei fero totale che costituisce la somma di tutte le facce nomeni naturali. Egli trov`o una formula che descrive
dei dadi tirati. Cos` il verificarsi di 5 nel lancio di la curva e che dipende da due parametri: la media

129

4.8. DISTRIBUZIONI
e la deviazione standard della distribuzione. In altre
parole, la forma della campana cambia a seconda del
valore dei due parametri, alzandosi o ingrossandosi,
pur rimanendo sostanzialmente la stessa. Per curiosit`a diamo qui la formula, ma per il momento rimane,
appunto, una mera curiosit`a:

2 !
1
1 x
N, (x) = exp
.
2

2
La media corrisponde al punto pi`
u alto della curva,
che `e simmetrica rispetto alla retta x = . Un fatto caratteristico `e costituito dalla percentuale degli
eventi che si verificano in certi intervalli:
il 68.27%
il 95.45%
il 99.75%

si pone tra
si pone tra
si pone tra

e +
2 e + 2
3 e + 3;

questo significa che ben 2/3 degli eventi si addensano nella zona che ha distanza pari alla deviazione
standard dalla media e praticamente tutti si trovano a distanza della media per meno di tre volte la
deviazione. Ci`o giustifica limportanza di .

pu`
o non essere del tutto agevole. Per questo, si
usano molto le tavole numeriche e alcune regole
empiriche divenute standard. Le tavole contengono
i valori di probabilit`
a della distribuzione N0,1 (x),
cio`e della distribuzione normale di media 0 e di
deviazione standard 1. Vi sono poi semplici formule
di conversione a qualsiasi N, (x). Uno degli approcci
empirici pi`
u utilizzati `e il seguente. Abbiamo visto,
definendo il concetto di mediana, cosa sia lordinamento per rango di una certa distribuzione empirica,
riferita ad n eventi. Sia allora x1 x2 xn
tale ordinamento e poniamo k = n/10. Si dice
che gli elementi x1 x2 xk costituiscono
il primo decile della distribuzione; gli elementi
xk+1 xk+2 x2k il secondo decile, e cos` via.
In altre parole, il primo decile contiene il primo 10%
dei dati nellordinamento per rango, e via di seguito
fino al decimo decile, che contiene lultimo 10%. Il
valore estremo di un certo decile si dice il valore
del decile. I valori del primo e del nono decile sono
molto usati per indicare convenzionalmente i valori
di norma di una distribuzione. Ad esempio, in
auxologia, si riportano in un grafico, per le varie et`
a,
il valore mediano dellaltezza e i valori del primo e
del nono decile. Di norma la crescita deve avvenire
costantemente nellintervallo fra questi due decili,
che rappresenta laltezza dell80% della popolazione
a quellet`
a. Valori al di fuori della norma, relativi
perci`
o al solo 20% della popolazione, possono indicare
qualche disfunzione nel processo di crescita e vanno
considerati con la debita attenzione. Concetti analoghi al decile sono quelli di percentile e di quartile,
che per`
o lasciamo alla buona volont`
a del lettore,
dato che non presentano alcuna differenza concettuale.

4. Distribuzione di Poisson. Una distribuzione non simmetrica `e quella di Poisson, definita in


funzione di un parametro , che ne indica la media:
pk = e
Figura 4.8: La campana della distribuzione normale
Il carattere generale della distribuzione normale si
suole giustificare con la cosiddetta legge dei grandi
numeri, che vede la distribuzione normale come una
specie di limite al quale tendono tutte le distribuzioni, quando vengano iterate, come abbiamo fatto per il
lancio delle monete. La legge (grosso modo) afferma
che dato un fenomeno, il quale segua una qualsiasi
distribuzione di probabilit`a, se lo si itera un numero sufficientemente grande di volte e si considera la
distribuzione di probabilit`a del fenomeno cos` iterato, allora tale distribuzione si pu`o identificare con la
distribuzione normale.
Nota 4.11

Come si pu`
o intuire dalla formula di
Gauss, lavorare con la matematica della distribuzione

k
k!

dove e `e la funzione esponenziale che introdurremo


ufficialmente nella Sezione 8.5. Questa distribuzione
`e discreta, ma assume valori per infiniti k; ben presto,
tuttavia, i pk si riducono praticamente a 0 e le possibilit`a possono essere considerate in numero finito. La
distribuzione di Poisson `e molto frequente e ad essa
si adeguano, ad esempio, le lunghezze degli intervalli
con cui le persone arrivano ad uno sportello (banca,
uffici pubblici, etc.).
Come abbiamo gi`a osservato, quelle viste non sono le uniche distribuzioni degne di nota. A cavallo
dellanno 1900, leconomista Pareto osserv`o che molti fenomeni economici seguono una distribuzione caratteristica. Ad esempio, se si mettono in ordine i
contribuenti dal pi`
u ricco al pi`
u povero e chiamiamo
R il reddito del pi`
u ricco, allora il reddito del secondo `e (allincirca) R/2, il reddito del terzo `e R/3, e

130

CAPITOLO 4. MATEMATICHE FINITE

cos` via. Allo stesso modo sembra funzionare la produzione delle industrie e la popolazione delle citt`a.
Qualche anno dopo, il linguista Zipf fece notare che
anche molti fenomeni linguistici, come la frequenza
delle parole in un testo, hanno pi`
u o meno la stessa
distribuzione. Essa viene perci`o detta di Pareto-Zipf
e si formula nel modo seguente: se r `e il rango (cio`e
la posizione) che un evento viene ad assumere nellordinamento rispetto ad un parametro assegnato ed Rr
`e il valore di tale parametro, allora il prodotto rRr `e
costante.
Nei fatti, abbastanza analoga alla legge di ParetoZipf `e quella cos` detta dell80/20. Nel caso del reddito, essa afferma che il 20% dei contribuenti si suddividono l80% del totale dei redditi. Nel caso delle
citt`a, il 20% delle citt`a di un paese riuniscono l80%
di tutti gli abitanti. E cos` via, dando spesso una valutazione numerica alle ingiustizie di questo mondo.
Noi ci possiamo accontentare di aver ricordato tutto
ci`o.
Concludiamo queste note dando una breve spiegazione del metodo del chi quadro. Nella sezione precedente, abbiamo visto una distribuzione empirica relativa al lancio di quattro monete ed essa si dovrebbe
accordare con la distribuzione teorica binomiale. I
dati empirici difficilmente coincidono con i dati teorici, anzi, se coincidessero, si potrebbe avere qualche
sospetto proprio sulla rilevazione dei dati empirici. Al
di l`a di generiche differenze, com`e possibile dire (ammesso che lo sia) se una certa distribuzione empirica
si conforma a una distribuzione teorica?
Una possibile risposta `e data dal test del chi quadro (2 ), che vogliamo ora descrivere. Si supponga di
avere una distribuzione empirica discreta, data dalle frequenze f1 , f2 , . . . , fn se n sono le classi in cui il
fenomeno `e suddiviso. Sia N = f1 + f2 + + fn il
numero totale dei dati rilevati e supponiamo che ogni
fk sia non inferiore a 5: altrimenti possiamo accorpare pi`
u classi in una sola, fino a che questa condizione
non sia soddisfatta. La distribuzione teorica preveder`a certe probabilit`a p1 , p2 , , pn in corrispondenza di ciascuna classe, e quindi possiamo parlare di
frequenze attese se moltiplichiamo ciascuna di queste
probabilit`a per N , il numero totale di osservazioni.
Tali frequenze attese saranno perci`o:
e1 = N p1 ,

e2 = N p2 ,

en = N pn .

Con queste frequenze attese e quelle osservate


calcoliamo la quantit`a:
2 =

n
X
(fk ek )2

k=1

ek

Questa quantit`a `e detta appunto chi quadro e osserviamo subito che se le frequenze osservate coincidessero con le frequenze attese avremmo 2 = 0.

Questo ci dice che pi`


u alto `e il valore del 2 , pi`
u
lontana dalla distribuzione teorica risulta essere la
distribuzione empirica. Il valore del 2 ottenuto va
confrontato con i valori di una tabella predisposta,
secondo regole che vedremo fra un istante. Se il 2 `e
compreso tra due opportuni valori della tabella potremo dire che distribuzione empirica `e in accordo con
la distribuzione teorica. Non si ha accordo, invece, se
il 2 `e maggiore del pi`
u grande dei valori indicati.
Nellesempio precedente abbiamo gi`a calcolato le
frequenze attese della distribuzione teorica, per cui
calcoliamo:
2 =

(10063 10000)2
(39951 40000)2
+
+
10000
40000

(60060 60000)2
(39891 40000)2
+
+
60000
40000
+

(10035 10000)2
= 0.9364.
10000

Ottenuto questo valore, vediamo come ci si deve comportare con la tabella del 2 . Prima di tutto, occorre
stabilire quanti sono i gradi di libert`
a della nostra distribuzione empirica. Grosso modo, i gradi di libert`a
di una distribuzione sono i dati (o i gruppi di dati) che possiamo scegliere in modo arbitrario (libero)
senza cambiare la natura della distribuzione. Questo
`e piuttosto vago, ma concretamente, nel nostro caso, abbiamo considerato cinque classi e le frequernze
di tali classi sono libere, eccetto per il fatto che in
tutto abbiamo effettuato 160. 000 prove. Ci`o significa che se possiamo scegliere liberamente il valore di
quattro classi, quello della quinta `e determinato dalla differenza fra 160. 000 e la somma delle frequenze
delle prime quattro classi. Abbiamo perci`o 4 gradi di
libert`a.
Nella Tabella 4.5 del 2 , dobbiamo considerare la
riga corrispondente a 4 gradi di libert`a. Cosa significano i valori presenti in tale linea? Nella testata
della tabella troviamo delle probabilit`a: ad esempio,
nella quarta riga c`e il valore 9.488 in corrispondenza
della probabilit`a 0.95; questo significa che sperimentando con una distribuzione empirica che si adegua
alla distribuzione teorica considerata, nel 95% dei casi si ottiene un 2 con valore minore o uguale a 9.488.
Cos` nel 5% dei casi troviamo 2 0.711. Si noti che
non ha rilevanza quale tipo di distribuzione teorica si
consideri.
E chiaro che qualunque sia il valore del 2 ottenuto, esso rientra nel 100% degli esperimenti; ci`o si
pu`o vedere dalla tabella, i cui valori crescono man
mano che si procede verso la parte destra. Nel caso
di conformit`a, bisogna essere molto sfortunati per ottenere valori altissimi e, di fronte a un 2 molto elevato saremmo propensi a pensare che qualcosa non

131

4.8. DISTRIBUZIONI

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
25
30
35
40
50
75
100

2.5%
0.001
0.051
0.216
0.207
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
9.591
13.12
16.79
20.57
24.43
32.36
52.94
74.22

5%
0.004
0.103
0.352
0.484
1.146
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.892
6.571
7.261
10.85
14.61
18.49
22.47
26.51
34.76
56.05
77.93

95%
3.842
5.992
7.815
9.488
11.07
12.59
14.07
15.51
16.92
18.31
19.68
21.03
22.36
23.69
25.00
31.41
37.65
43.77
49.80
55.76
67.51
96.22
124.3

97.5%
5.024
7.378
9.348
11.14
12.83
14.45
16.01
17.54
19.02
20.48
21.92
23.34
24.74
26.12
27.49
34.17
40.65
46.98
53.20
59.34
71.42
100.8
129.6

Tabella 4.5: La tabella del 2


va, piuttosto che ad accettare supinamente il risultato dellesperimento. Daltra parte `e sospetto anche
un valore del 2 molto vicino a 0 che, come si vede dalla tabella, corrisponde a una piccolissima parte
degli esperimenti.
Vedendo invece la cosa dal punto di vista di chi
non sa se la distribuzione empirica si conforma o meno a quella teorica, possiamo procedere cos`: scegliamo due probabilit`a, una bassa e laltra abbastanza
alta: spesso si prendono il 5% e il 95%; nella Tabella 4.5 abbiamo considerato anche il 2.5% e il 97.5%.
Se il 2 ottenuto sperimentalmente `e compreso fra
questi valori, allora possiamo ragionevolmente accettare lipotesi che la distribuzione empirica si conformi davvero a quella teorica. Se il 2 supera il valore corrispondente alla probabilit`a del 95%, saremo
piuttosto dellopinione di rigettare lipotesi, e saremo
tanto pi`
u convinti di ci`o quanto pi`
u alto `e il valore
del 2 . Infine, se il 2 `e minore del valore corrispondente al 5%, dobbiamo sospettare che qualcosa nel
nostro esperimento non va, e c`e qualche vizio logico
o di rilevazione dei dati.
Il nostro 0.9364 `e giusto compreso tra 0.711 e 9.488;
quindi la nostra distribuzione empirica si trova nellintervallo di probabilit`a corretto per una distribuzione che si adegui a quella binomiale considerata.
Ci`o ci fa inclinare ad accettare lipotesi che la distribuzione binomiale sia effettivamente la distribuzione

teorica che descrive quella dei nostri lanci.

132

CAPITOLO 4. MATEMATICHE FINITE

Capitolo 5

Algebra
Rischiai di dare lo spettacolo di un prigioniero messo a forza fuori di prigione. Erano le
cinque. Uno dei convitati mi accompagn`
o fino
alla porta, mi abbracci`
o, e promise di venirmi
a trovare uscendo di prigione. Doveva fare ancora due o tre mesi. Era linfelice Galois che
non rividi mai pi`
u, perche lindomani della sua
liberazione venne ucciso in duello.
G. de Nerval Le mie prigioni

5.1

Calcolo letterale

Lassociazione tra Algebra e calcolo letterale `e piuttosto recente e risale alla fine del 1500, nonostante
che fino dallantichit`a si siano cercate regole e metodi per la risoluzione di equazioni. Gi`a nel papiro di
Rhind (ca. 1650 a.C.) e su tavolette babilonesi (ancora pi`
u vecchie) si trovano problemi di Algebra; ma
furono gli Arabi, dopo l800 d.C., che dettero i maggiori contributi a questa disciplina. Al-Khuwarizmi
sapeva risolvere le equazioni di secondo grado, e dal
suo libro Al-jabr wal muqabalah `e stato tratto il
termine Algebra. Cosa significhino le parole al-jabr
e al-muqabalah `e oscuro; si ritiene che al-jabr indichi
il trasferimento di un termine da un membro allaltro di unequazione, e al-muqabalah si riferisca alla
cancellazione di termini uguali nei due membri, ma
questa interpretazione non `e sicura. Dalla traduzione latina Liber Algebrae et Almucabala (che toglie
tutti i dubbi sul significato delle due parole!) fino
al 1600 ci si rifer` alla risoluzione delle equazioni come alla scienza dellAlgebra e dellAlmucabala, poi
lAlmucabala venne a cadere e lAlgebra `e rimasta.
Fino al 1500 la formulazione delle equazioni era
puramente discorsiva e ci si riferisce a quellAlgebra
come allAlgebra retorica. Prima del 1500 il francese Chuquet cominci`o a introdurre forme abbreviate
e le equazioni si iniziarono a formulare in modo pi`
u
convenzionale: la variabile (che oggi diremmo x) era
detta la cosa, il suo quadrato x2 era il censo e il
suo cubo x3 era il cubo. Si usarono anche espressio
ni simili a formule: 5p : Rm : 15 stava per 5 + 15,

dove p e m era la notazione, detta italiana, per


i simboli + e . Questi ultimi furono introdotti in
Germania verso il 1550 e il segno = fu inventato dallinglese Recorde pi`
u o meno negli stessi anni. Questo
nuovo tipo di notazione fu detto Algebra sincopata.
Ma il vero e proprio calcolo letterale `e nato, verso la
fine del 1500, col francese Vi`ete e mezzo secolo dopo Cartesio usava gi`a una notazione molto simile a
quella moderna.
Sino al 1600 lAlgebra era concepita come un metodo per la risoluzione di problemi numerici specifici,
o poco pi`
u. Poiche non si volevano considerare numeri negativi (che non si capivano) le due equazioni
di secondo grado x2 + ax = b (il censo pi`
u la cosa
uguale a numero) e x2 = ax + b (il censo uguale
alla cosa pi`
u un numero) erano considerate diverse
e trattate pertanto con regole risolutive differenti. Le
lettere si imposero prima come incognite e solo successivamente per le costanti (cio`e i parametri). Oggi,
il calcolo letterale `e alla base di tutta lAlgebra e tutti
gli studenti ne hanno familiarit`a.
Le lettere (dellalfabeto latino o greco) hanno in
realt`a significati ed accezioni di natura assai diversa,
ma, fortunatamente, la loro trattazione e manipolazione avviene in modo omogeneo. Ricordiamo che
una lettera:

133

1. se indica un simbolo astratto, da non confondere


con indicazioni di numeri o altre entit`a, si dice
una indeterminata;
2. se indica valori che possono essere assunti da
un insieme prestabilito (ad esempio, un insieme
o un campo numerico) `e detta variabile; nella
notazione funzionale y = f (x), x `e la variabile
indipendente, y quella dipendente;
3. se indica, in unequazione, un valore non noto e
che vogliamo determinare, `e detta incognita;
4. se indica, in unequazione, un valore che si suppone noto (e quindi non deve essere determinato,
ma anzi `e da usare per trovare il valore della o
delle incognite) si dice un parametro.

134

CAPITOLO 5. ALGEBRA

polinomi si tratti. Quando le indeterminate sono pi`


u
In ogni caso, per le lettere valgono sempre le regole
di una, esse si indicano tra parentesi: Z[x, y] oppure
di calcolo che estendono le regole di calcolo dei nuZ[x][y]. Questultima notazione mette in evidenza
meri. Come `e ben noto, in Algebra il segno della
che possiamo prima considerare i polinomi nella
moltiplicazione si sottintende o, al pi`
u, si denota con
indeterminata x, e quindi quelli nella indeterminata y
un puntino, cio`e invece di a b si preferisce scrivere
aventi come coefficienti i polinomi di Z[x]. Eseguendo
ab o a b. Le propriet`a commutativa ed associativa
i prodotti si ha ovviamente luguaglianza dei due
permettono di scrivere ab(ax(ba)xy) come aaabbxxy,
insiemi.
seguendo la regola generale di disporre le varie lettere in ordine alfabetico. Il prodotto di una lettera
per se stessa si pu`o abbreviare con la notazione delle
Sui polinomi `e possibile definire le operazioni di
potenze e, anche per le lettere, si definisce:
somma e prodotto in modo da estendere la somma

e il prodotto tra numeri; prima di tutto diamo la


a0 = 1
seguente:
n+1
n
a
= aa
Definizione 5.3 La somma di due monomi simili `e
Si scriver`a pertanto: aaabbxxy = a3 b2 x2 y.
un monomio la cui parte letterale `e uguale a quella dei
Definizione 5.1 Si dice monomio il prodotto di un due addendi e il cui coefficiente `e la somma algebrinumero per un prodotto di lettere; il numero si dice ca dei coefficienti dei due monomi. Il prodotto di due
coefficiente o parte numerica del monomio, mentre le monomi `e un monomio il cui coefficiente `e il prodotto
lettere ne costituiscono la parte letterale. Due mono- dei due coefficienti e la cui parte letterale `e costituimi si dicono simili se hanno la stessa parte lettera- ta dalle lettere comuni e non comuni dei due monole; se questa non `e presente, il monomio si dice una mi, quelle non comuni col proprio esponente e quelle
comuni con esponente uguale alla somma degli espocostante.
nenti. La somma e il prodotto di polinomi estendono
a
Sono monomi 3a2 b, 5ax2 y, 7, 2.7xyz, ax2 y e il secon- queste regole in modo tale che sia valida la propriet`
do `e simile al quarto; un coefficiente 1 `e di norma distributiva del prodotto rispetto alla somma.
sottinteso. I monomi costituiscono la base per la
moltiplichiamo i due polinomi x2
costruzione delle espressioni letterali, le pi`
u semplici Come esempio,
2
delle quali sono i polinomi: si dice polinomio la som- 2x + 1 e x + x 1; la propriet`a distributiva impone
ma di uno o pi`
u monomi. Ricordando che si scrive di moltiplicare ogni monomio del primo polinomio per
2
2
3ax 2a x invece di 3ax2 + (2a2 x), sono polinomi ogni monomio del secondo; pertanto si ottiene:
a2 + 2ab + b2 , x2 3x + 1 e y 5 4.
(x2 2x + 1)(x2 + x 1) =
Come abbiamo visto, si scrive a2 per aa; quindi a1
sta per a e a0 per il monomio costante 1. Come si sa,
= x4 + x3 x2 2x3 2x2 + 2x + x2 + x 1.
1
0
a e a non si scrivono mai, e questo ci permette di
A questo punto possiamo sommare i monomi simili
introdurre la seguente:
ed ottenere:
Definizione 5.2 Si dice grado di un monomio la
somma degli esponenti della sua parte letterale; il gra- (x2 2x + 1)(x2 + x 1) = x4 x3 2x2 + 3x 1.
do di un polinomio `e il massimo dei gradi dei suoi
Si osservi (a + b)(a + b) = a2 + ab + ab + b2 = a2 +
monomi.
2ab + b2 . Questo `e il pi`
u semplice esempio di potenza
Il grado dei monomi nellesempio precedente `e, ri- di un binomio; un binomio `e un polinomio con due soli
spettivamente, 3, 4, 0, 3, 4. Il grado di un monomio termini, come x2 y+3wyz, ma possiamo indicarlo concostante `e sempre 0 eccetto, convenzionalmente, il venzionalmente come a + b. Dalla regola precedente
grado di 0 che si pone (meno infinito), cosa che abbiamo: (x2 y+3wyz)2 = x4 y 2 +6wx2 y 2 z+9w2 y 2 z 2 .
torner`a utile in varie occasioni.
Sviluppando i prodotti si ha:

Nota 5.1

Esplicitamente, abbiamo considerato


polinomi i cui coefficienti appartengono ai numeri
reali. Pu`
o essere utile trattare anche polinomi a
coefficienti in altri insiemi numerici. Se fissiamo una
lettera x (che in questo caso ha il ruolo di indeterminata) linsieme dei polinomi in x a coefficienti in un
insieme numerico K si indica con K[x]; ad esempio,
x2 3x + 1 Z[x] e 12 x3 41 x + 5 Q[x]. In generale,
considereremo R[x], a meno che non si dichiari esplicitamente il contrario, specificando di quale insieme di

(a + b)0
(a + b)1
(a + b)2
(a + b)3
(a + b)4

=
=
=
=
=

1
a+b
a2 + 2ab + b2
a3 + 3a2 b + 3ab2 + b3
a4 + 4a3 b + 6a2 b2 + 4ab3 + b4

Come si vede, nellespressione (a + b)n le potenze di


a vanno decrescendo e quelle di b vanno crescendo in
modo tale che in ai bj si abbia i + j = n. I coefficienti

135

5.1. CALCOLO LETTERALE


sono dati dal triangolo di Tartaglia o triangolo di Pascal, nel quale, come sappiamo, ogni elemento `e ottenuto sommando il numero che gli sta immediatamente sopra e quello che gli sta sopra, ma alla sinistra: il
lettore `e caldamente invitato a dare una dimostrazione per induzione di questa regola, basandosi sul fatto
che (a + b)n+1 = (a + b)(a + b)n , supponendo di conoscere lespressione per (a + b)n e sviluppando quindi
il prodotto. In generale, si ha il seguente risultato:
Teorema 5.1 Vale la formula:

G
ab

ab

a2

H
b

ab

F b E

b
A

ab

b
J

Figura 5.1: Prodotti notevoli per via geometrica

(a + b)n =
Nota 5.2
I Greci, pur con la loro preferenza per


n n 0
n n1 1
n
n 0 n la Geometria e lignoranza per il calcolo letterale, co1 n1
a b +
a
b + +
a b
+
a b .
noscevano alcune di queste regole e ne davano una
0
1
n1
n

Prova: Si consideri lespansione (a + b)n = (a +


b)(a + b) (a + b) per n volte. Applicando la propriet`a distributiva si ottengono tanti termini, ognuno
composto di n fattori a oppure b, cio`e del tipo ak bnk .
Quanti sono i termini di questo tipo? Sono quelli corrispondenti alla scelta di a da k dei fattori (a + b), e
quindi la scelta di b dagli altri n k fattori. Ma la
scelta dei k fattori a `e come la scelta di k elementi
dallinsieme degli n fattori (a + b), e quindi si hanno
Cn,k termini ak bnk .
Naturalmente, si ha:
(a b)2
(a b)3

= a2 2ab + b2
= a3 3a2 b + 3ab2 b3

e cos` via, dove si osserva che i segni + e procedono


in modo alternato.
Le potenze di un binomio sono, a loro volta, un
esempio di prodotto notevole; con questo termine si
indicano identit`a che `e bene ricordare a mente perche permettono di semplificare molti conti. Un caso
molto famoso `e fornito dal prodotto di una somma
per una differenza:
(a + b)(a b) = a2 b2
che si dimostra ancora eseguendo i conti. Letto da
destra verso sinistra, questo prodotto notevole si dice
anche differenza di due quadrati e fa parte di una
casistica pi`
u generale, di cui diamo i primi esempi:
a2 b2
a3 b3
a4 b4
a5 b5

=
=
=
=
=

(a b)(a + b)
(a b)(a2 + ab + b2 )
(a b)(a + b)(a2 + b2 )
(a b)(a3 + a2 b + ab2 + b3 )
(a b)(a4 + a3 b + a2 b2 + ab3 + b4 )

Per le somme di due potenze si ottengono prodotti


solo per esponenti dispari:
a3 + b3
a5 + b5

=
=

(a + b)(a2 ab + b2 )
(a + b)(a4 a3 b + a2 b2 ab3 + b4 )

dimostrazione geometrica (vedere la Figura 5.1). Lidentit`


a (a + b)2 = a2 + 2ab + b2 `e ovvia, come appare a
sinistra della figura. Il lettore pu`
o utilmente costruire
un cubo di lato a + b mettendo assieme un cubo di
lato a, uno di lato b, tre parallelepipedi di dimensioni
a a b e tre parallelepipedi di dimensioni a b b.
In quanto alla a2 b2 = (a + b)(a b) si osservi che,
nella Figura 5.1, togliendo al quadrato ABF G di area
a2 il quadrato BCIJ di area b2 , si ottiene la stessa
scomposizione del rettangolo DEGH, che ha dimensioni (a b)(a + b). I restanti prodotti notevoli, naturalmente, sono pi`
u difficilmente dimostrabili per via
geometrica.
I prodotti notevoli si prestano a introdurre qualche
curiosit`
a, utile a ricordare che certe manipolazioni
sono errate, come abbiamo avvertito parlando delle
espressioni aritmetiche. Tali manipolazioni possono
portare a errori gravissimi nella risoluzione delle
equazioni, come vedremo tra poco. Ecco allora due
dimostrazioni esemplari: la prima ci informa che tutti
i numeri sono uguali; la seconda, pi`
u modestamente,
ci fa vedere come 1 sia uguale a 2. Siano a, b R
due numeri reali diversi tra loro e si chiami c la loro
differenza, cio`e a b = c. Moltiplicando entrambi
i membri per a b e osservando che (a b)2 `e un
prodotto notevole, si ha a2 + b2 2ab = ca cb.
Questa si scrive anche a2 ab ac = ab b2 bc
ovvero a(a b c) = b(a b c) e semplificando
a = b pur avendo supposto i due numeri differenti. La
seconda dimostrazione parte invece da due numeri
uguali a = b e li moltiplica per a: a2 = ab. Sottraendo
b2 si ha a2 b2 = ab b2 , cio`e (a b)(a + b) = b(a b).
Ora si pu`
o semplificare e ottenere a + b = b, e
poiche s`e supposto a = b si conclude 2b = b ovvero
2 = 1. Il lettore ha subito individuato dove `e
stato commesso lerrore, consistente in una indebita divisione per 0. Ci si pu`
o sbizzarrire e trovare
analoghe perle; ma, per il momento, qui ci arrestiamo.

Indubbiamente, i polinomi sono le espressioni letterali pi`


u semplici, e li studieremo in modo abbastanza approfondito. Altre espressioni importanti e duso assai frequente sono i rapporti tra polinomi, detti

136

CAPITOLO 5. ALGEBRA

funzioni razionali fratte:


x4 3x3 + x2 3x + 5
.
x3 + 2x2 x + 6
Nota 5.3

Come vedremo nella prossima sezione,


eseguendo la divisione fra numeratore e denominatore, possiamo trasformare ogni funzione razionale
fratta nella somma di un polinomio (il quoziente,
eventualmente 0) e una funzione razionale fratta nella
quale il grado del numeratore `e inferiore a quello del
denominatore. Nella Sezione 5.4 vedremo unulteriore
semplificazione delle funzioni razionali fratte detta
riduzione a frazioni parziali, che ha un notevole
numero di applicazioni, le pi`
u importanti delle quali
riguardano il calcolo integrale (vedere Sezione ??) e
la risoluzione delle ricorrenze (vedere Sezione ??),
argomento, questo, trattato purtroppo qui con pochi
dettagli.

Espressioniletterali pi`
u complesse coinvolgono le
radici, come x2 + 1, che possono apparire tanto al
numeratore che al denominatore di espressioni frazionarie. Come abbiamo osservato nella Sezione ??,
avere un radicale a denominatore di una frazione `e
particolarmente noioso e quindi `e bene liberarsi di situazioni del genere mediante unopportuna razionalizzazione. Ci sono problemi connessi allequivalenza delle espressioni, che vedremo nella Sezione 5.3,
ma le tecniche da adottare sono semplici e legate
ai prodotti notevoli che abbiamo appena visto. Se
il denominatore si riduce a un semplice radicale, la
razionalizzazione `e ovvia:

1
3x + 1

=
3x + 1
3x + 1

avendo moltiplicato sopra e sotto per 3x + 1.


Se invece abbiamo la somma o la differenza di due
o pi`
u radicali quadratici, la razionalizzazione `e legata
alla differenza di due quadrati. In questo
esempio,
dobbiamo
moltiplicare
sopra
e
sotto
per
3x + 1 +

2x 3:

1
3x + 1 + 2x 3

=
=
3x 1 2x + 3
3x + 1 2x 3

3x + 1 2x 3
=
.
x+2
I radicali cubici si affrontano nello stesso modo con
la regola per a3 b3 :
1

=
3
3x + 1 3 2x 3
p
p
p
3
(3x + 1)2 + 3 (3x + 1)(2x 3) + 3 (2x 3)2
.
=
x+2

5.2

I polinomi

Fra le espressioni letterali hanno un ruolo molto importante i polinomi, che abbiamo introdotto nella sezione precedente. Abbiamo anche visto come si eseguono tre delle operazioni di base: addizione, sottrazione e prodotto. Se K[x] `e linsieme dei polinomi
a coefficienti in un insieme numerico K e nellindeterminata x, le tre operazioni sono chiuse in K[x],
cio`e la somma, la differenza e il prodotto di due polinomi in K[x] sono ancora polinomi in K[x] e valgono
le consuete propriet`a, elencate nella Tabella 5.1.
Anche il grado di un polinomio `e stato introdotto
nella sezione sul calcolo letterale; `e bene aver presenti
i seguenti risultati:
Lemma 5.2 Sia gr(p(x)) il grado del polinomio
p(x); allora si ha:
gr(p(x) + q(x))
gr(p(x)q(x))

max(gr(p(x), gr(q(x))
= gr(p(x) + gr(q(x)

Prova: Per definizione i monomi che compaiono in


p(x) + q(x) sono simili ai monomi che compaiono in
p(x) e/o q(x), a meno che, nella somma, due monomi simili, ma con coefficienti uno lopposto dellaltro, non si eliminino a vicenda. In ogni caso
gr(p(x) + q(x)) non pu`o superare il massimo dei gradi dei due polinomi addendi. Per il prodotto, sia axn
con a 6= 0 il monomio di grado massimo in p(x) e sia
bxm con b 6= 0 il monomio di grado massimo in q(x).
Allora, p(x)q(x) conterr`a il monomio abxn+m , essendo ab 6= 0. Tutti gli altri monomi che compongono il
prodotto hanno pertanto grado inferiore ad n + m, e
questo dimostra lasserto.
Il lettore attento avr`a osservato, a questo punto,
limportanza di aver definito gr(0) = ; quello un
po meno attento `e invitato a calcolare il grado della
somma e del prodotto dei tre polinomi 0, 5, 7x2 +
4x 1, presi due a due. Si osservi anche la seguente
conseguenza del lemma precedente:
Corollario 5.3 Se due polinomi p(x) e q(x) hanno
grado diverso, allora p(x)+q(x) ha grado esattamente
uguale al pi`
u grande dei gradi di p(x) e q(x).
Ma la conseguenza veramente importante del lemma precedente `e la seguente propriet`a analoga a
quella dei numeri interi:
Teorema 5.4 Se il prodotto di due polinomi
p(x), q(x) `e zero, allora almeno uno di essi `e il
polinomio 0.
Prova: Se m `e il grado di p(x) ed n `e quello di q(x),
il grado del prodotto p(x)q(x) `e m + n, ma affinche
sia m + n = , uno almeno tra m ed n deve essere
, cio`e il corrispondente polinomio deve essere 0.

137

5.2. I POLINOMI

commutativa
associativa
distributiva
identit`a
zero

p(x) + q(x) = q(x) + p(x)


p(x)q(x) = q(x)p(x)
p(x) + (q(x) + r(x)) = (p(x) + q(x)) + r(x) p(x)(q(x)r(x)) = (p(x)q(x))r(x)
p(x)(q(x) + r(x)) = p(x)q(x) + p(x)r(x)
0 + p(x) = p(x) + 0 = p(x)
1p(x) = p(x)1 = p(x)
0p(x) = p(x)0 = 0
Tabella 5.1: Somma e prodotto di polinomi

Nota 5.4
Invitiamo naturalmente il lettore a
formulare gli algoritmi per laddizione e la moltiplicazione di due polinomi; quello per la sottrazione `e
un banale adattamento dellalgoritmo delladdizione. Per coloro che hanno un po di esperienza di
programmazione, consigliamo lesercizio di scrivere
esplicitamente, nel linguaggio di programmazione conosciuto, i programmi per le tre operazioni. Si usano,
di solito, due rappresentazioni di un polinomio: la
prima `e una coppia costituita da un numero naturale
(un integer) e un vettore di numeri reali (cio`e
real); il numero rappresenta il grado e il vettore i
coefficienti dei vari monomi (ricordarsi di non saltare
eventuali coefficienti 0, altrimenti la posizione nel
vettore non corrisponde pi`
u al grado del monomio, ed
`e impossibile lavorare). La seconda rappresentazione
`e a lista, ogni elemento della lista costituito da una
coppia (grado, coefficiente). Se si procede in senso
decrescente, il grado del primo monomio `e anche il
grado del polinomio e si possono saltare i monomi con
parte numerica 0; questa volta non ci sono problemi
di interpretazione dei vari monomi, visto che il grado
`e scritto in modo esplicito.

Molto pi`
u complicata delle altre operazioni `e la divisione tra polinomi; questa si pu`o eseguire solo se il
grado del dividendo `e maggiore o uguale al grado del
divisore, e alla fine si ottengono un quoziente e un resto, che sono ancora due polinomi. Il resto ha grado
minore del divisore e, se si riduce a 0, la divisione si
dice esatta. La terminologia `e analoga a quella per la
divisione tra numeri e se la divisione `e esatta si dice
che il divisore sta nel dividendo, o che il divisore divide o `e un fattore del dividendo; questo, a sua volta,
`e un multiplo del divisore. La procedura per eseguire
la divisione `e la seguente:
Algoritmo 5.1 (Divisione tra polinomi)
Ingresso: due polinomi: p(x) il dividendo e d(x) 6= 0
il divisore;
Uscita: quoziente e resto della divisione.
1. se gr(d(x)) > gr(p(x)) si esce con 0 come
quoziente e p(x) come resto;
2. altrimenti, si assegna p(x) ad r(x) e chiamiamo
A il monomio di grado pi`
u elevato in d(x);

(a) poniamo in B il monomio di grado pi`


u alto in r(x) [per la condizione sui gradi dei
polinomi, gr(B) gr(A)];

(b) si assegna a C il rapporto fra i due monomi B ed A; inseriamo tale monomio nel
quoziente q(x) e poniamo m(x) = C d(x)
[m(x) ha pertanto lo stesso grado di r(x) e
i monomi di grado massimo hanno lo stesso
coefficiente];
(c) si pone r(x) := r(x) m(x) [per le osservazioni precedenti, il grado di r(x) `e diminuito
di almeno una unit`
a];

(d) se gr(r(x)) gr(d(x)) si cicla tornando al


punto 2.;
(e) altrimenti si esce con q(x) come quoziente
ed r(x) come resto della divisione.
Un esempio di divisione con resto chiarir`a eventuali dubbi; supponiamo di voler dividere 2x5 + 4x4
3x2 + 2x 1 per x2 x + 1. Limpostazione `e analoga a quella della divisione tra interi ed `e bene non
dimenticare i monomi con coefficiente 0 che possono
non comparire esplicitamente nellespressione dei polinomi. Nella Figura 5.2 `e riportata lintera divisione;
il quoziente vale 2x3 + 6x2 + 4x 5 e il resto 7x + 4.
Un semplice esercizio `e verificare questo risultato eseguendo d(x)q(x) + r(x). Il polinomio che si ottiene
deve essere p(x), il dividendo.
Come la nomenclatura relativa alla divisione tra
polinomi ricalca quella della divisione tra interi, cos`
i concetti derivati sono simili e si pu`o introdurre una
nozione di divisibilit`a tra polinomi con tutti gli annessi e connessi che conosciamo: modulo, polinomio
primo, scomposizione in fattori primi, massimo comun divisore e minimo comune multiplo. Tuttavia,
linquadramento di tutti questi concetti richiede una
certa attenzione e lintroduzione di una serie di nuove
definizioni.
Definizione 5.4 Si dice equazione luguaglianza fra
due espressioni letterali; se A = B `e la rappresentazione di tale uguaglianza, lespressione letterale A
si dice il membro sinistro dellequazione, e B si dice il membro destro. Se x, y, . . . , z sono le incognite
che compaiono in unequazione, una sua soluzione `e

138

CAPITOLO 5. ALGEBRA
2x5
2x5

+4x4
2x4
+6x4
+6x4

2x
2x3
6x3
+4x3
+4x3

3x2

+2x 1

3x2
+6x2
9x2
4x2
5x2
5x2

+2x 1
+2x
+4x
2x
+5x
7x

x2
2x3

x
+6x2

+1
+4x 5

1
1
5
+4

Figura 5.2: Divisione tra polinomi


un assegnamento a tali lettere di valori specifici che
rendono vera luguaglianza. Se unequazione ha come
soluzione ogni possibile assegnamento alle incognite
dei valori di un insieme numerico K, allora si dice
pi`
u propriamente una identit`a in K. Unequazione si
dice algebrica se `e costituita dalluguaglianza di due
polinomi. Due equazioni si dicono equivalenti se e solo se hanno le stesse soluzioni. La forma canonica di
unequazione `e unequazione equivalente a quella data,
ma della forma: espressione algebrica uguale a zero.
Il grado di unequazione algebrica `e il massimo grado
dei monomi che compaiono nella sua forma canonica. Si dice zero o radice di un polinomio una qualsiasi
soluzione dellequazione che si ottiene uguagliando a
zero quel polinomio.

A(x, y, . . . , z) + C(x, y, . . . , z) = B(x, y, . . . , z) +


C(x, y, . . . , z); sostituendo alle incognite i valori della soluzione si ottiene una uguaglianza
tra due somme di espressioni numeriche uguali,
che sappiamo essere uguali. La stessa cosa vale per il prodotto A(x, y, . . . , z)C(x, y, . . . , z) =
B(x, y, . . . , z)C(x, y, . . . , z),
il quale,
quando
C(x0 , y0 , . . . , z0 ) 6= 0, d`a luguaglianza di due
prodotti di numeri uguali. Tuttavia, `e bene osservare
esplicitamente, che se C(x0 , y0 , . . . , z0 ) = 0, si ottiene
luguaglianza 0 = 0 anche se
A(x0 , y0 , . . . , z0 ) 6= B(x0 , y0 , . . . , z0 ),
per cui lequazione derivata non `e equivalente a quella
data.

E facile vedere e dimostrare che il concetto di


equazioni equivalenti `e effettivamente una relazione
di equivalenza; lasciamo al lettore il compito di sviluppare i dettagli di questa affermazione e osserviamo
invece che lequivalenza si mantiene con le operazioni
di al-jabr e di al-muqabalah:
Teorema 5.5 Data una qualsiasi equazione,
ottiene unequazione equivalente se:

Usando la prima delle due regole, ogni equazione


pu`o essere portata in forma normale: basta aggiungere ai due membri lespressione letterale opposta a
quella che costituisce il membro destro. Una identit`a
ha come forma normale lequazione 0 = 0.
Nel caso delle equazioni algebriche, si ha unultesi riore specializzazione:

Teorema 5.6 (di Ruffini) Sia p(x) un polinomio;


regola della somma: si aggiunge o si sottrae ad allora un numero a `e radice del polinomio se e solo
entrambi i membri dellequazione la stessa se p(x) `e divisibile per (x a).
espressione letterale;
Prova: Se p(x) = q(x)(x a), `e chiaro che andando
regola del prodotto: si moltiplicano o si dividono a sostituire x con a si trova p(a) = q(a) 0 = 0. Viceentrambi i membri dellequazione per la stessa versa, eseguiamo la divisione di p(x) per (x a); sia
espressione letterale, purche questa sia sempre q(x) il quoziente, mentre il resto, dovendo avere gradiversa da zero.
do inferiore ad (x a), sar`a una costante b. Abbiamo
Prova: Sia K linsieme numerico sul quale consi- quindi p(x) = q(x)(x a) + b. Sostituendo a ad x
deriamo lequazione; siano x, y, . . . , z le incognite che e sfruttando lipotesi che a sia una radice di p(x), si
compaiono nei due membri, di modo che lequazione ha: 0 = q(a) 0 + b, e questo implica b = 0.
si scriva A(x, y, . . . , z) = B(x, y, . . . , z). Una soluzioConseguenza di questo teorema `e che, se conosciane sia x = x0 , y = y0 , . . . , z = z0 , cos` che sia vera la mo le radici di un polinomio, diciamo a , a , . . . , a ,
1 2
k
proposizione
allora possiamo scrivere tale polinomio come (x
A(x0 , y0 , . . . , z0 ) = B(x0 , y0 , . . . , z0 ).

Se C(x, y, . . . , z) `e la quantit`a che aggiungiamo ai due membri, si ha la nuova equazione

a1 )(x a2 ) (x ak ). In realt`a, possiamo anche


moltiplicarlo per una costante (diversa da zero) senza
cambiare la validit`a del risultato. Naturalmente, basta eseguire i prodotti per avere la forma tradizionale.

139

5.2. I POLINOMI
Ad esempio, se le radici sono 1, 2 e 3, il polinomio `e
(x 1)(x 2)(x 3) = x3 6x2 + 11x 6.
Il matematico italiano Paolo Ruffini (1765 1822)
anticip`o Abel nella dimostrazione della irrisolubilit`a
delle equazioni di 5 grado, anche se in modo non del
tutto soddisfacente. Invent`o anche una tecnica, detto regola di Ruffini, per dividere un polinomio per il
binomio (x a) senza eseguire direttamente la divisione secondo il metodo visto. Se ad esempio si vuole
eseguire (x4 2x2 +x+1)/(x1), il calcolo si imposta
cos`:
1 0 2 1 1
1 1 1 0
1
1 1 1 0 1
La prima riga contiene i coefficienti del dividendo,
dove occorre non dimenticare quelli nulli; il primo
elemento della seconda riga `e lopposto del termine
costante del divisore (x a). Si abbassa poi nella
terza riga il primo coefficiente e si pone il suo prodotto
per a nella colonna successiva della seconda riga. Si
esegue poi la somma 0 + 1, ottenendo l1 della terza
riga, e si procede in modo analogo fino alla fine. Nella
terza riga si leggono il quoziente x3 +x2 x ed il resto,
che in questo caso `e 1.
Per quanto riguarda i polinomi e le equazioni algebriche, teoricamente possiamo considerare tre insiemi
distinti: Z[x], Q[x] e R[x]; tuttavia, i primi due sono
associati dal seguente risultato:
Teorema 5.7 Un numero razionale r `e radice di un
polinomio in Q[x] se e solo se `e radice di un polinomio
in Z[x].
Prova: Poiche Z[x] Q[x], se un polinomio in Z[x]
ha come soluzione r, lo stesso polinomio, visto come
appartenente a Q[x], ha ancora r come radice. Viceversa, sia r una radice di p(x) Q[x] e sia m il
minimo comune multiplo dei denominatori dei coefficienti di p(x); se consideriamo lequazione p(x) = 0,
abbiamo p(r) = 0 e se moltiplichiamo i due membri
per m 6= 0 si ha mp(r) = 0, cio`e r `e una radice del
polinomio mp(x) Z[x].
Si considerano allora due soli insiemi di polinomi:
i polinomi a coefficienti interi (che coincidono, nel
senso visto, con i polinomi a coefficienti razionali) e
i polinomi a coefficienti reali, che sono linsieme pi`
u
ampio. Le propriet`a di questi due insiemi sono un po
diverse e, quindi, quando necessario, li distingueremo
chiaramente per evitare confusioni ed ambiguit`a.
Definizione 5.5 Un polinomio di K[x] si dice irriducibile su K se non ha alcuna soluzione in
K.
Pertanto, un polinomio di Z[x] `e irriducibile se non
ha soluzioni razionali; un polinomio di R[x] `e irriducibile se non ha soluzioni reali. Per i polinomi di Z[x]

vale il seguente teorema che permette di verificare


facilmente se esso `e o non `e irriducibile:
Teorema 5.8 (di Eisenstein) Le soluzioni razionali di un polinomio p(x) Z[x], p(x) = a0 xn +
a1 xn1 + + an1 x + an , se esistono, sono da ricercare tra i numeri razionali il cui denominatore `e
un divisore di a0 e il cui numeratore `e un divisore di
an .
Prova: Sia m/d leventuale soluzione, ridotta ai minimi termini; sostituendo tale valore nellequazione si
ottiene:
m n
m n1
m
a0
+ a1
+ + an1 + an = 0
d
d
d
e quindi, moltiplicando tutto per dn 6= 0 si ha:

a0 mn + a1 mn1 d + + an1 mdn1 + an dn = 0.


Portando tutti i termini, eccetto il primo, a destra
dellequazione, si trova che a0 mn deve avere un fattore d, e poiche d ed m sono per ipotesi primi tra di
loro, d deve essere un divisore di a0 . Analogamente, portando tutti i termini a destra eccetto lultimo,
si vede che m deve essere un divisore di an , come si
voleva.
Ad esempio, se il polinomio 27x3 +6x12 Z[x] ha
soluzioni razionali, basta cercarle fra le frazioni m/d
dove m {1, 3, 9, 27} e d {1, 2, 3, 4, 6, 12}
(come notato a suo tempo, nelle frazioni il segno pu`o
essere lasciato al solo numeratore). Si tratta di 24
valori diversi e quindi il procedimento pu`o essere alquanto noioso; tuttavia, la soluzione (quando esista)
si trova con un po di buona volont`a, aiutandosi eventualmente con un calcolatore. Nel caso attuale si trova la soluzione 2/3 e applicando la regola di Ruffini si
ricava 27x3 + 6x 12 = 9(3x2 + 2x + 2)(x 2/3), e vedremo nelle prossime sezioni come 3x2 +2x+2 non abbia addirittura soluzioni reali. Comunque, una nuova
applicazione del teorema di Eisenstein con le possibili radici razionali 1, 2, 1/2, 2/3 mostra subito
che il polinomio non ha altri fattori lineari x a, con
a Q.
Per i polinomi di R[x] le cose stanno in modo
alquanto diverso. Nella prima met`a del 1800 fu
dimostrato il seguente:
Teorema 5.9 I polinomi irriducibili di R[x] sono:
1. le costanti;
2. i polinomi di primo grado ax + b;
3. i polinomi di secondo grado ax2 + bx + c per i
quali si abbia b2 4ac < 0.

140

CAPITOLO 5. ALGEBRA

La prova di questo teorema va, per il momento, al


di l`a delle nozioni che abbiamo e anche degli scopi
di questi appunti. Comunque, vedremo in una nota
successiva le linee generali della dimostrazione. Sono
quindi irriducibili i polinomi x 3 e 3x2 + 2x + 2 in
quanto b2 4ac = 4432 = 20. Si pu`o osservare
che il polinomio x2 + 1 `e anchesso irriducibile per
lo stesso criterio; tuttavia, la dimostrazione della sua
irriducibilit`a `e diretta ed immediata. Le sue eventuali
radici sono le soluzioni dellequazione x2 + 1 = 0, cio`e
x2 = 1; ma non esiste alcun numero reale il cui
quadrato valga 1, un numero negativo. A questo
punto possiamo dare la seguente:
Definizione 5.6 I polinomi irriducibili di K[x] si
dicono anche polinomi primi.
Dato un polinomio p(x) K[x], una sua scomposizione in
fattori irriducibili (primi) `e il prodotto p(x) =
aq1 (x)q2 (x) . . . qk (x), dove a K e i polinomi
q1 (x), q2 (x), . . . , qk (x) sono irriducibili su K. Si dice
massimo comun divisore di due polinomi p(x), q(x)
K[x] un polinomio di grado massimo che divida tanto p(x) quanto q(x). Si dice minimo comune multiplo
un polinomio di grado minimo che sia divisibile tanto
per p(x) che per q(x).
Il lettore avr`a notato che nella definizione non si afferma mai che la scomposizione, il massimo comun
divisore e il minimo comune multiplo siano unici: infatti, moltiplicare o dividere per una costante (non
nulla) non cambia le propriet`a di un polinomio. Si
dimostra tuttavia (anche se noi non lo faremo) che
questa `e lunica eccezione; in altre parole, scomposizione, MCD e mcm di polinomi sono unici a meno
di costanti moltiplicative. Per il MCD e il mcm valgono le stesse propriet`a di calcolo viste per i numeri
naturali: ad esempio, il massimo comun divisore pu`o
essere trovato prendendo i fattori (irriducibili) comuni a p(x) e a q(x) col minimo esponente. Qui si richiede molta attenzione perche la non unicit`a della
scomposizione pu`o trarre in inganno il principiante e
chi voglia fare le cose con troppa fretta.

5.3

Risoluzione delle equazioni

Secondo le definizioni della sezione precedente, unequazione algebrica di primo grado ha come forma canonica ax + b = 0. In questo caso (e solo in questo
caso) si preferisce considerare come canonica la forma
ax = b, con a 6= 0. Tale equazione ammette almeno
la soluzione x = b/a, che si verifica sostituendo ad x
tale valore e notando che essa si riduce alluguaglianza b = b, senzaltro vera. A questo punto `e chiaro che
questa `e lunica soluzione. Detta infatti r una soluzione diversa, scriviamola nella forma b /a, con b = ra.
Deve essere b 6= b, altrimenti r coinciderebbe con la

prima soluzione; sostituendo b /a nellequazione, si


ha b = b, il che `e falso.
Se a = 0, lequazione ax = 0 perde di significato, ma per completezza introduciamo la seguente
terminologia:
1. se a = b = 0, ogni numero reale rende vera luguaglianza; questa `e pertanto ridotta allidentit`a
0 = 0 e si dice che lequazione `e indeterminata o
che ammette infinite soluzioni;
2. se a = 0, ma b 6= 0, luguaglianza non pu`o
mai essere verificata; si dice allora che lequazione `e impossibile ovvero che non ammette alcuna
soluzione.
Ci`o torna utile quando si voglia scrivere un algoritmo
che, partendo da unequazione che si suppone essere
di primo grado, ne trovi la soluzione:
Algoritmo 5.2 (Equazioni di 1 grado)
Ingresso: Unequazione di primo grado in x;
Uscita: La soluzione x0 , oppure uno dei termini
Impossibile o Indeterminata.
1. Usando ripetutamente la regola della somma, si
portano a membro sinistro tutti i termini che
contengono x e a membro destro tutti i termini
che non lo contengono;
2. usando la regola della somma di monomi omogenei, si riduce il membro sinistro a unespressione
del tipo ax; eventualmente, questa espressione si
riduce a zero e si pone allora a := 0;
3. usando le regole della somma, si riduce il
membro destro alla costante b;
4. se a = b = 0, si esce dallalgoritmo dopo aver
scritto Indeterminata;
5. altrimenti, se a = 0 ma b 6= 0, si esce
dallalgoritmo dopo aver scritto Impossibile;
6. altrimenti, lequazione ha lunica soluzione b/a,
determinata dallapplicazione della regola del
prodotto.
Come semplice esempio si consideri lequazione
3x + 2 x = 1 + 5x 2; per il punto 1. dellalgoritmo
abbiamo 3x + 2 x 2 5x = 1 + 5x 2 5x 2,
cio`e 3x x 5x = 1 2 2. Ora si applica il punto 2.
e si ottiene 3x = 3; questa `e lequazione in forma
canonica e possiamo applicare il passo 6. che d`a la
soluzione x0 = 3/(3) = 1. Naturalmente, andando a sostituire il valore 1 cos` ottenuto nellequazione
originale si ha: 3 + 2 1 = 1 + 5 2, cio`e 4 = 4, il che
`e vero e verifica la validit`a della soluzione trovata.
Pi`
u interessante `e la risoluzione delle equazioni di
secondo grado, che supponiamo essere gi`a scritte in
forma canonica:

141

5.3. RISOLUZIONE DELLE EQUAZIONI

Ad esempio, data lequazione 2x2 + x 6 = 0, si


Teorema 5.10 Sia ax2 + bx + c = 0 unequazione di
ha = 1 + 48 = 49 = 72 ; lequazione quindi ha
secondo grado in forma canonica; essa ammette:
due soluzioni che sono x1 = (1 + 7)/4 = 3/2 e x2 =
a. due soluzioni se il discriminante = b2 4ac `e (17)/4 = 2. Nella pratica, `e talvolta conveniente
maggiore di 0; in tal caso le soluzioni sono date la seguente formula ridotta, che si applica quando il
dallespressione:
coefficiente b `e un intero pari, diciamo b = 2b . Si ha
allora:

x=
;
2b 4b2 4ac
b b2 ac
2a
x=
=
.
2a
a
b. una soluzione se il discriminante `e uguale a 0;
I tre coefficienti a, b, c contengono tutte le informatale soluzione `e x = b/(2a);
zioni relative allequazione considerata; la formula di
c. nessuna soluzione se < 0.
Prova: Si consideri il seguente procedimento detto metodo del completamento del quadrato e derivato dalle regole di somma e prodotto della sezione
precedente:

risoluzione ne `e un esempio convincente, ma vi sono


altri aspetti che possono essere rivelati da tali parametri. Cominciamo con una propriet`a abbastanza
ovvia:

Teorema 5.11 Se lequazione ax2 + bx + c = 0 ha


due soluzioni reali, allora la somma di tali soluzioni
`
e
b/a e il loro prodotto vale c/a.
1. si moltiplica per 4a 6= 0: 4a2 x2 + 4abx + 4ac = 0;
2. si somma b2 4ac ai due membri: 4a2 x2 +4abx+
b2 = b2 4ac;

Prova: Dalla formula risolutiva si ha:

b b +
b
+
=
2a
2a
a

3. il membro sinistro `e un quadrato: (2ax + b)2 =


e ancora:
b2 4ac.

!
!
b
b +
b2 (b2 4ac)
c
Si osservi che un quadrato `e sempre non negativo e
=
=
2
2
2a
2a
4a
a
quindi se b 4ac = < 0, lequazione non pu`o avere
alcuna soluzione (caso c.). Se b2 4ac = 0, lequazione si riduce a 2ax + b = 0; questa `e unequazione di dato che il prodotto dei numeratori `e il prodotto di
primo grado che, come si `e visto, ha come soluzione una somma per una differenza.
x = b/(2a) (caso b.). Infine, se > 0, estraendo la
radice quadrata algebrica si
hanno le due equazioni
Nota 5.5
Come vedremo nelle prossime sezioni,

la distinzione dei tre casi di soluzione di unequazione


di primo grado 2ax + b = + e 2ax + b = ,
di 2 grado `e dovuta semplicemente allambito troppo
dalle quali si ricavano i valori delle due soluzioni.
Dal teorema discende un semplice algoritmo:
Algoritmo 5.3 (Soluzione equazioni 2 grado)
Ingresso:
I coefficienti a, b, c del polinomio
ax2 + bx + c;
Uscita: Le eventuali soluzioni dellequazione.

ristretto in cui ci stiamo movendo, cio`e i numeri reali.


Quando si passi ai numeri complessi, ogni equazione
di secondo grado ha sempre due soluzioni: nel caso
b) esse coincidono, nel caso c) sono costituite da due
numeri complessi coniugati. La propriet`
a espressa
dal teorema precedente risulta vera in generale, e la
si dimostra nello stesso modo. Infatti nel caso b) si
ha = 0 e nel caso c) pur essendo < 0 i conti fatti
sono ancora validi.

1. si calcola il discriminante = b2 4ac;


2. se < 0 si scrive Lequazione non ammette
soluzioni;
3. altrimenti, se = 0, si scrive Lunica
soluzione `e: e si calcola x = b/(2a);
4. altrimenti ( > 0) si calcolano le due soluzioni:

b
x1 =
2a

b +
x2 =
.
2a

Unaltra propriet`a che i coefficienti a, b, c permettono di prevedere facilmente `e il segno delle radici. Siano e le due radici reali dellequazione
ax2 +bx+c = 0 che si pu`o anche scrivere x2 + ab x+ ac =
0. Per il Teorema di Ruffini 5.6 questa si pu`o anche
scrivere (x )(x ) = 0; sviluppando il prodotto
si ha: x2 ( + )x + = 0. Abbiamo cos` ottenuto, se si vuole, unaltra dimostrazione del teorema precedente, ma vediamo di interpretarla nel modo
seguente:

142
1. se le due soluzioni , sono entrambe positive,
allora ( + ) = b/a `e un numero negativo
mentre = c/a `e positivo. Si osservi che il
coefficiente di x2 , che dopo la divisione per a `e
diventato 1, `e sempre positivo;
2. se le due soluzioni , sono entrambe negative,
allora ( + ) = b/a `e positivo, come lo `e =
c/a; quindi i tre coefficienti 1, b/a, c/a sono tutti
positivi;
3. se le due soluzioni , sono discordi, diciamo
> 0 e < 0, allora ( + ) = b/a sar`a positivo o negativo a seconda che || > || oppure
|| < ||. Il prodotto = c/a `e invece sempre
negativo. Pertanto, se || > || i tre coefficienti
sono nellordine: positivo, negativo, negativo. Se
invece || < ||, i tre coefficienti sono: positivo,
positivo, negativo.

CAPITOLO 5. ALGEBRA
= 10 e = 7; oppure, = 7 e = 10. La sciamo
al lettore la risoluzione nel caso si conosca la differenza dei numeri e il loro prodotto. Unosservazione
banale ma importante `e la seguente: ogni equazione
di secondo grado `e simmetrica rispetto alle sue due
soluzioni, nel senso che esse possono essere scambiate, ma lequazione rimane la stessa. Nel nostro caso,
trovati e , anche scambiando con si ottiene
ancora una soluzione. Conclusione: ogni problema
del tipo visto ha due soluzioni.
Unequazione pu`o essere originata dalluguaglianza
di due espressioni razionali fratte, o comunque riconducibili a una forma del genere. Applicando le regole
al-jabr e al-muqabalah ci si riduce sempre alluguaglianza a 0 di ununica espressione razionale fratta.
Ad esempio:
9x + 13
9
=
+6
x+1
x2

Naturalmente, se a era inizialmente positivo, i se- dopo facili passaggi d`a:


gni dei tre coefficienti nellequazione di partenza era3(x2 x 6)
no proprio gli stessi; se a era negativo, vanno cam= 0.
x2 x 2
biati scambiando positivo con negativo. Possiamo
riassumere tutto in una tabellina:
Una frazione si annulla solo quando il numeratore `e
zero e, allo stesso tempo, il denominatore `e diver, > 0
++ +
so da 0. Quindi, intanto, le soluzioni sono comprese
, < 0
+++
fra quelle dellequazione ottenuto uguagliando a 0 il
> 0, < 0
numeratore. Nel nostro caso sono comprese tra le
|| > ||
+ ++
soluzioni di x2 x 6 = 0, cio`e x = 3 e x = 2.
|| < ||
++ +
A questo punto, per`o, il problema non `e concluso,
Se, come si fa di solito, chiamiamo permanenza il fat- poiche occorre verificare che le soluzioni trovate non
to che, passando da un coefficiente al successivo, il annullino il denominatore. Se succede una cosa del
segno non cambia (cio`e si ha ++ oppure ), e va- genere, la soluzione o le soluzioni incriminate vanno
riazione il fatto che il segno cambia (cio`e si ha + tolte dal novero di quelle accettabili. Nel nostro caoppure +), la precedente discussione e la relativa so, fortunatamente, il denominatore si annulla solo
tabella dimostrano:
per x = 1 e per x = 2, e quindi quelle trovate sono
soluzioni legali.
2
Teorema 5.12 (dei segni di Cartesio) Sia ax +
Non `e strano il caso in cui unequazione presenbx + c = 0 unequazione di secondo grado con due
ti lincognita sotto un segno di radice; ad esempio,
soluzioni distinte. Ad ogni variazione corrisponde a
lequazione x + 2 = 3 ha lovvia soluzione x = 7,
una soluzione positiva e ogni permanenza a una socome si verifica direttamente. Queste equazioni venluzione negativa. Quando si ha una variazione e una
gono dette irrazionali e il metodo di risoluzione che
permanenza, la prima precede la seconda se la solusubito si presenta alla nostra mente `e quello di elezione positiva `e maggiore del valore assoluto di quella
vare al quadrato entrambi i membri. Si ha infatti
negativa, mentre la seconda precede la prima in caso
x + 2 = 9, unequazione lineare la cui facile soluziocontrario.
ne ci d`a appunto x = 7, a conferma della validit`a
I teoremi precedenti permettono di risolvere in mo- della nostra
intuizione. Tuttavia, se consideriamo
do elementare problemi del tipo: di due numeri e lesempio x + 2 = x 4, elevando al quadrato si
si conosce la somma (o la differenza) A e il prodotto ha: x + 2 = x2 8x + 16, cio`e in forma normale:
B; quali sono i due numeri? Immaginando che e x2 9x + 14 = 0. Le due soluzioni x = 7 ed x = 2,
siano le due soluzioni di unequazione di secondo per`o, hanno un comportamento strano: la x = 7 sogrado, tale equazione deve essere x2 Ax + B = 0, stituita nellequazione di partenza ci d`a il risultato
se A `e la somma + . Facciamo un esempio: se la atteso 0 = 0 (e perci`o va bene), ma la x = 2 ci d`a
somma di due numeri `e 17 e il loro prodotto `e 70, si 2 = 2, e questo proprio non va. Delle due soluzioni
deve risolvere lequazione x2 17x + 70 = 0, il cui di- trovate, solo una `e accettabile. Questo, tuttavia, fa
scriminante `e = 172 +470 = 9 = 32 , per cui si ha parte di una situazione generale:

143

5.4. SISTEMI DI EQUAZIONI

x = 12. A questo punto basta verificare che tale


soluzione non `e estranea. D) Lasciamo al lettore il
compito di cavarsela quando i radicali sono tre o pi`
u,
ma tali casi, per fortuna, si trovano quasi soltanto
negli esercizi dei testi di Matematica.
Prova: Lequazione A(x)k = B(x)k si pu`o scrivere
2. Se uno o pi`
u radicali sono a denominatore, bisoanche A(x)k B(x)k = 0, e per quanto visto sui
gna ricordarsi di escludere, dalle eventuali soluzioni,
prodotti notevoli equivale a:
quelle che annullano il denominatore, secondo la regola generale che ben conosciamo: la divisione per 0
(A(x) B(x))
non `e unoperazione lecita. Ad esempio, consideriamo
(A(x)k1 + A(x)k2 B(x) + . . . + B(x)k1 ) = 0.
lequazione irrazionale:
Un prodotto vale 0 quando uno dei suoi fattori `e 0;
1
questo implica che deve essere A(x) B(x) = 0,

+ 1 = x.
1
+x
che d`a le stesse soluzioni di A(x) = B(x), oppure
A(x)k1 + . . . + B(x)k1 = 0, ma le soluzioni di La regola ci dice che uneventuale soluzione x = 1
questa equazione (se non coincidono con quelle di dovr`a essere rifiutata. Portato il termine 1 a destra,
A(x) = B(x)) sono del tutto estranee allequazione si ha: 1 = (x 1)1 + x, e a questa uguaglianza
di partenza.
applichiamo lelevamento a potenza. Si ottiene 1 =
Teorema 5.13 Sia A(x) = B(x) unequazione nella
variabile x; lequazione A(x)k = B(x)k ha le stesse soluzioni dellequazione di partenza, pi`
u eventuali
altre soluzioni, dette estranee.

Questo giustifica la scoperta della soluzione x = 2


nellesempio precedente e ci avverte che le soluzioni
estranee devono essere scartate. Il solutore di equazioni irrazionali `e avvertito di stare bene attento a
ci`o che ottiene applicando meccanicamente la tecnica dellelevamento a potenza. Tale tecnica, daltra
parte, `e il metodo standard per affrontare le equazioni irrazionali, e non ci rimane che suggerire (o ricordare) alcuni accorgimenti per portare a buon fine
la soluzione di specifiche forme che lequazione pu`o
assumere.
1. Consideriamo quattro casi interessanti: A) Se
lequazione presenta un unico radicale, `e bene che
esso venga isolato, cos` da costituire un membro dellequazione, mentre laltro membro contiene
i termini

razionali. Ad esempio, per risolvere x + 2 + 4 = x,


si porta il termine 4 a destra,
il che ci riconduce allequazione gi`a considerata x + 2 = x 4. B) Se i
radicali (quadratici) sono due e non ci sono termini
razionali, se ne porta uno a membro sinistro e laltro almembro
destro, prima di elevare a potenza.
Cos`, x 6 2 x = 0 ci porta a x 6 = 2 x,
cio`e x = 4. Purtroppo, andando
nel
a sostituire
lequazione di partenza, si trova 2 2 = 0,
che non ha senso nel campo dei numeri reali. C)
Se invece, oltre ai due radicali, sono presenti termini razionali, questi si portano tutti a membro destro,
mentre i radicali si spostano tutti a sinistra. Lelevamento a potenza, questa volta, non elimina i radicali, ma, nel caso dei radicali quadratici, ne cala
il numero a uno solo, in modo che si pu`o iterare
quanto gi`a detto in precedenza.
Se ad esempio ab
x
+
4

1
=
x

3,
ci
si
porta alla forma
biamo

x + 4 x 3p= 1, e si eleva al quadrato. Si ottiene:


x + 4 2 (x + 4)(x 3) + x 3 = 1, cio`e
p
(x + 4)(x 3) = x. Dobbiamo di nuovo elevare al
quadrato, ottenendo infine: x2 + x 12 = x2 , cio`e

x3 x2 x + 1, cio`e x(x2 x 1) = 0. Le soluzioni


b dove , come
sono allora x = 0, x = e x = ,

sappiamo, indica il rapporto armonico ( 5 + 1)/2 e


b = 1/. Nessuna di queste tre soluzioni `e 1
e non rimane che provarle nellequazione originale.
Solo x = d`a risultato positivo e quindi rappresenta
lunica soluzione dellequazione di partenza.
3. Per convenzione, i radicali pari, come le radici quadrate, si considerano in senso aritmetico, cio`e
con valore non negativo. Viceversa, i radicali dispari
si considerano in senso algebrico, cio`e con lo stesso
segno delradicando. Ci limitiamo
qui al semplice
esempio 3 x3 26 x = 2, cio`e 3 x3 26 = x + 2,
dopo aver separato la parte razionale da quella irrazionale. Elevando al cubo e semplificando, si ottiene
lequazione di secondo grado x2 + 2x 3 = 0, cio`e
x = 3 e x = 1. Ora sitratta di effettuare la verifica;
per x = 3 si ha 3 27 + 26 = 3 + 2, cio`e

3
1 = 1, il che `e corretto quando si considerino
le radici algebriche, come s`e convenuto. Per x = 1
la verifica `e immediata, e quindi i due valori trovati
sono entrambi radici legali dellequazione.

5.4

Sistemi di equazioni

E abbastanza intuitivo che un problema possa essere


risolto mediante ununica equazione se c`e ununica
quantit`a da determinare. Se le quantit`a sono due,
una sola equazione, cio`e una sola condizione, pu`o non
essere sufficiente a darci le informazioni necessarie a
risolvere il problema. Ad esempio, un amico burlone
pu`o farci una domanda di questo genere: di un numero di due cifre sappiamo che la somma di queste `e sei
e se invertiamo la loro posizione il numero aumenta
di 18 unit`a. Qual `e il numero? Pur essendo una domanda tipicamente accademica, o forse proprio per

144
questo, ci sentiamo sfidati a trovare la soluzione. Numeri che soddisfano la prima condizione ce ne sono
diversi, come 15, 24, 33 o 60; e anche 6 se lo vediamo
scritto come 06. Parimenti, di numeri che soddisfano la seconda condizione ce ne sono pi`
u duno, come
13, 24 o 35. Possiamo allora ricorrere a un metodo
esaustivo: scriviamo separatamente tutti i numeri che
soddisfano ciascuna condizione e osserviamo quali sono (se ce ne sono) quelli che compaiono in tutti e due
gli elenchi. Quando, come in questo caso, i due elenchi sono finiti e siamo sicuri di riuscire a trovare tutti
i numeri che soddisfano ciascuna condizione, questo
pu`o essere un metodo effettivo. Ma, ci chiediamo, c`e
un metodo un po pi`
u generale e meno sensibile ad
eventuali errori di elencazione?
Lalgebra fornisce un metodo di risoluzione che, oggi, ci appare molto naturale, ma che ha richiesto secoli per essere scoperto, e la cui scoperta ha richiesto
linvenzione di un formalismo che non `e per niente
banale, almeno fino a quando non lo si conosca e non
lo si sia capito. Chiamiamo x ed y le due cifre del
numero che stiamo cercando, cio`e sia 10x + y tale numero, secondo la consueta notazione posizionale. La
prima condizione si scrive facilmente x+y = 6. Per la
seconda, cominciamo ad osservare che, invertendo le
due cifre, si ha il numero 10y +x, e quindi la condizione si scrive: 10y + x = 10x + y + 18. Se A `e linsieme
delle coppie (x, y) che soddisfano la prima condizione, cos` che, ad esempio, (1, 5) A e (6, 0) A, e B
`e linsieme delle coppie (x, y) che soddisfano la seconda condizione, di modo che (1, 3) B e (2, 4) B,
le soluzioni che cerchiamo sono A B. Si dice allora sistema di equazioni in k incognite un insieme di
equazioni nelle quali compaiono esattamente k incognite x, y, . . . , z e che devono diventare proposizioni
vere per i medesimi valori di tali incognite. Una soluzione del sistema `e appunto una k-upla di valori
(x = x0 , y = y0 , . . . , z = z0 ) che sostituiti nelle varie equazioni le rendono tutte vere; in altre parole, le
soluzioni del sistema sono gli elementi dellintersezione delle possibili soluzioni delle varie equazioni che
compongono il sistema. Le equazioni si scrivono una
sotto laltra, riunite da una parentesi graffa: questa
ha lo scopo di mettere in rilievo il fatto che uneventuale soluzione deve soddisfare tutte le equazioni; `e
pertanto parte essenziale della notazione e non pu`o
essere sottintesa. Nel nostro esempio abbiamo:

x+y =6
10y + x = 10x + y + 18.

CAPITOLO 5. ALGEBRA
che lo compongono (nel nostro esempio: 1 1 = 1).
Nella sezione presente ci occuperemo soltanto della
soluzione dei sistemi lineari in due e tre incognite.
Un sistema lineare di due equazioni in due
incognite `e sempre riducibile alla forma normale:

ax + by = c
(5.1)
a x + b y = c
mediante le usuali regole di semplificazione. Ad esempio, la seconda delle nostre equazioni d`a 9y9x = 18,
cio`e, per il Teorema 5.5, y x = 2, e quindi il sistema
ha come forma normale:

x+y =6
x y = 2.
Esistono almeno due metodi diretti per risolvere un
sistema ridotto a forma normale:
per sostituzione: si ricava una delle due incognite da una delle due equazioni (come se laltra
incognita fosse un semplice numero) e la si sostituisce nellaltra equazione. Questa diviene unequazione lineare in una sola incognita, e quindi
sappiamo come risolverla. Trovato il valore di
questa incognita, la si sostituisce in una qualsiasi delle due equazioni, ricavando cos` il valore
della prima incognita;
per somma e sottrazione: moltiplicando le due
equazioni per opportune costanti, si rendono
uguali (od opposti) i coefficienti della x; sottraendo (risp. sommando) membro a membro
le due equazioni, la variabile x scompare e si ottiene unequazione lineare in y, che si sa risolvere. Agendo in modo analogo sulla y, si ricava il
valore della x.

Applicando il primo metodo, dalla prima equazione


si ottiene y = 6 x; sostituendo questo valore nella
seconda si ha: x 6 + x = 2, cio`e 2x = 4 che ci
d`a x = 2. Sostituendo questo valore in y = 6 x si
ottiene y = 4, e perci`o il numero da indovinare era
24. Applicando il metodo di somma e sottrazione (in
questo caso `e il metodo da preferire), sommando si
ottiene 2x = 4, cio`e x = 2, e sottraendo 2y = 8, cio`e
y = 4, e di nuovo si trova la soluzione 24. Come cera
da aspettarsi.
In questo esempio, la soluzione esiste ed `e unica;
ma, ci chiediamo, `e questo sempre il caso o, come per
le equazioni ad una incognita, vi sono anche altre posPoiche, in questo caso, le equazioni che compongono sibilit`a? Per rispondere a questo quesito, ripartiamo
il sistema sono tutte lineari, il sistema si dice lineare; dalla forma canonica generale e vediamo di trovare
propriamente, si tratta di un sistema lineare di due unespressione per la (o le) possibili soluzioni, quanequazioni in due incognite. In generale il grado di un do almeno una soluzione esista. Usando il metodo di
sistema `e il prodotto dei gradi delle singole equazioni somma e sottrazione, si moltiplicano opportunamente

145

5.4. SISTEMI DI EQUAZIONI


le due equazioni:

aa x + ba y = ca
aa x + ab y = ac

Nota 5.6

ab x + bb y = cb
ba x + bb y = bc

Si sottraggono le due coppie di equazioni e si ottiene


(a b ab )y = a c ac dalla prima e (ab a b)x =
b c cb dalla seconda. Quindi la soluzione generale
`e:
ac a c
b c bc
y=
.
x=

ab a b
ab a b

La discussione relativa alle possibili soluzioni `e ora


piuttosto semplice. Tutto dipende dallespressione
ab a b che si trova al denominatore; se essa `e diversa
da zero la soluzione `e unica e perfettamente determinata dalle formule precedenti. Se invece ab a b = 0,
la soluzione non `e pi`
u determinata; questa condizione
equivale a a/a = b/b , cio`e il rapporto dei coefficienti
della x e della y `e lo stesso. Pu`o allora succedere che
il rapporto c/c ha ancora lo stesso valore, oppure ha
un valore diverso. Nel primo caso le due equazioni
ax + by = c e a x + b y = c sono in effetti la stessa
equazione; quindi ogni soluzione della prima equazione `e anche soluzione della seconda, e viceversa. Ma
la prima equazione ha infinite soluzioni perche, assegnato un valore alla x, la y resta determinata di
conseguenza. Il sistema si dice allora indeterminato.
Se invece c/c 6= a/a , le due equazioni sono incompatibili, in quanto se ax + by `e uguale a c non si pu`o
anche avere a x + b y = c ; quindi il sistema `e impossibile. Queste considerazioni portano a scrivere il
seguente algoritmo:
Algoritmo 5.4 (Soluzione di un sistema 2 2)

Una matrice 2 2 `e costituita da 4


numeri disposti su 2 righe e 2 colonne:

a b
M=
;
a b

si dice determinante di M e si scrive det(M ) la quantit`


a ab a b, ottenuta sottraendo il prodotto degli
elementi della diagonale secondaria da quello degli elementi della diagonale principale. Da un punto di vista
notazionale, una matrice viene delimitata da una coppia di parentesi quadre (o tonde); un determinante `e
delimitato da linee verticali analoghe a quelle del valore assoluto. Nel caso del sistema 5.1, la precedente
matrice (ottenuta disponendo in ordine i coefficienti
della variabili nelle due espressioni) si dice la matrice
del sistema e il suo determinante si dice determinante
del sistema. Se, nella matrice del sistema, al posto
della prima colonna sostituiamo i termini noti, si ha
come determinante:


c b
c b

= cb bc .
det
=
c b
c b
Se poi sostituiamo i termini
colonna:

a c
a c
=
det
a c
a c

noti nella seconda

= ac a c.

Si hanno allora le seguenti formule di Cramer per la


risoluzione del nostro sistema:

c b
a c

c b
a c
y=
.
x=
det(M )
det(M )

Queste formule, che sembrano complicare, invece che


semplificare, la soluzione del nostro problema, sono
in realt`
a estendibili a sistemi lineari di n equazioni
in n incognite, e quindi rendono pi`
u agevole la
formulazione della soluzione, anche se, spesso, non ne
semplificano la soluzione numerica.

Ingresso: i coefficienti a, b, c e a , b , c delle due


equazioni del sistema;
Uscita: la soluzione del sistema, oppure la parola
Il metodo di somma e sottrazione risulta di solito
Indeterminato con la formula delle soluzioni, pi`
u simpatico del metodo di sostituzione; questo per`o
oppure il termine Impossibile;
`e del tutto generale e pu`o essere esteso a sistemi di
n equazioni in n incognite. Nel caso n = 3 spesso si
1. si calcola il valore := ab a b;
applica un metodo intermedio: si ricava da unequazione unincognita in funzione delle altre due e la si
2. Se 6= 0 allora:
sostituisce nella rimanenti due equazioni, che perci`o
(a) si calcola x := (b c bc )/ e y := (ac vengono a formare un sistema di due equazioni in due
incognite. Questo si risolve per somma e sottrazione e
a c)/;
(b) si esce scrivendo il valore ottenuto per x e i valori trovati si sostituiscono nella prima equazione
per ricavare il valore dellultima incognita. Ad esemper y;
pio, di un numero di tre cifre sappiamo: 1) la somma
3. altrimenti ( = 0) si calcola il rapporto r := delle tre cifre `e 12; 2) la somma delle prime due cifre
`e uguale alla terza; 3) il numero formato dalle prime
a/a ;
due cifre `e quattro volte la terza cifra. Dette allora
(a) se r 6= c/c si esce scrivendo Impossibile; x, y, z le tre cifre, si ha il sistema:

(b) altrimenti (r = c/c ) si scrive Indeter x + y + z = 12


minato e si esce con lespressione y =
x+y =z

(c ax)/b.
10x + y = 4z.

146

CAPITOLO 5. ALGEBRA

La seconda equazione ci d`a gi`a una determinazione che 6x2 7x 3 = (3x + 1)(2x 3), e a questo punto
di z in termini di x ed y; sostituendo tale valore di vediamo che la frazione si pu`o scrivere come:
z nelle altre due equazioni si trova un sistema di 2
A
B
x7
equazioni in 2 incognite:
=
+
,
(3x + 1)(2x 3)
3x + 1 2x 3

x+y =6
2x + 2y = 12
dove A e B sono due numeri reali opportuni. In effet2x y = 0.
6x 3y = 0
ti, dimostreremo ora che questa scomposizione, detta
Sommando, si trova 3x = 6, cio`e x = 2 e quindi in frazioni parziali, `e possibile proprio determinando
y = 4. A questo punto, usando z = x+y `e immediato il valore di A e di B. Portando le due frazioni allo
dedurre z = 6, cio`e il numero cercato `e 246. In questo stesso denominatore si ottiene:
caso la forma normale `e:
2Ax 3A + 3Bx + B
x7
=
.

(3x + 1)(2x 3)
(3x + 1)(2x 3)
x + y + z = 12
x+yz =0

Affinche queste due espressioni siano uguali (come


10x + y 4z = 0.
deve essere) occorre che i due numeratori coincidano,
cio`e sia x 7 = (2A + 3B)x 3A + B. Essendo x
Nota 5.7
Nellesempio, la matrice del sistema `e:
una
indeterminata, le due espressioni sono uguali se

1 1
1
e solo se coincidono i coefficienti della x e i termini
M = 1 1 1
noti. Deve cio`e essere:
10 1 4

2A + 3B = 1
e il determinante di una matrice 3 3 si trova con la
3A + B = 7
regola di Sarrus, o

delle diagonali:

a
b
c


a
b
c =
a b c

= ab c + bc a + ca b cb a ba c ac b .

Nel nostro caso il determinante vale: 4 10 + 1


10 + 4 + 1 = 18. Esso costituisce il denominatore per
applicare le formule di Cramer. Sostituendo la colonna dei termini noti alla prima colonna della matrice
del sistema si trova:

12 1
1

0 1 1 = 48 + 0 + 0 0 0 + 12 = 36,

0 1 4

e quindi x = 36/(18) = 2. Analogamente si


trovano i valori di y e di z, lelaborazione dei quali
lasciamo al lettore (che sia arrivato fin qui) come
semplice, ma assai utile esercizio.

Unimportante applicazione della risoluzione dei sistemi lineari `e costituita dalla semplificazione delle
funzioni razionali fratte. Abbiamo gi`a accennato nella Sezione 5.1 che esse possono sempre essere ridotte
a frazioni il cui numeratore abbia grado inferiore al
denominatore. Se poi questo pu`o essere scomposto
in fattori del tipo ax + b, la frazione si semplifica ulteriormente in somme di funzioni razionali fratte col
denominatore semplice del tipo (ax + b)k . Il metodo
si spiega bene con un esempio, che pu`o essere generalizzato. Si consideri la funzione razionale fratta
(x 7)/(6x2 7x 3). E un semplice esercizio sulla
risoluzione delle equazioni di secondo grado scoprire

e questo `e un sistema lineare di due equazioni nelle


due incognite A e B. Possiamo risolverlo per sostituzione, osservando che B = 3A 7 dalla seconda
equazione. Questo d`a 11A = 22 dalla prima equazione, cio`e A = 2, e di conseguenza B = 1. Si ha
pertanto:
2
1
x7
=

.
(3x + 1)(2x 3)
3x + 1 2x 3
Nota 5.8

In generale, avremo situazioni come:

ux + v
A
B
=
+
(ax + b)(a x + b )
ax + b
a x + b
dove ax + b e a x + b non sono equivalenti, cio`e non
esiste alcun numero reale k per cui a = ak e b = bk.
Procedendo come nellesempio, si arriva al sistema:

Aa + Ba = u
Ab + Bb = v.
Il determinante di questo sistema vale a b ab , che `e
0 se e solo se a/a = b/b , cio`e proprio solo nel caso
che abbiamo escluso. Questo ci assicura che il metodo ha sempre successo, purche i binomi a denominatore non siano, di fatto, lo stesso binomio. Il caso
delle funzioni razionali fratte (ux + v)/(ax + b)2 non
pu`
o essere risolto ne con questo metodo, ne con altri.
Analogamente, non possono essere risolte le situazioni
in cui a denominatore ci sia un polinomio di secondo
grado irriducibile, cio`e con discriminante minore di
0. Senza entrare in dettagli e dimostrazioni, lasciamo
al lettore la verifica delle due seguenti scomposizioni,
che esemplificano il metodo nei due casi noiosi appena
detti.

147

5.5. DISEQUAZIONI
Quando `e presente una potenza k 2, occorre far
intervenire tutte le potenze minori o uguali a k:
A
B
C
x2 7x + 1
=
+
+
.
(x + 1)2 (x 2)
(x + 1)2
x+1
x2
Questo porta al sistema:

B+C
A B + 2C

2A 2B + C

=
=
=

1
7
1

e quindi si ottiene:

3
2
1
x2 7x + 1
=
+

.
(x + 1)2 (x 2)
(x + 1)2
x+1
x2
Per i polinomi irriducibili occorre un numeratore pi`
u
complesso, cio`e un binomio di primo grado:
2x2 + x 5
Ax + B
C
= 2
+
,
(x2 + 1)(x 2)
x +1
x2
che porta alla scomposizione:
x+3
1
2x2 + x 5
= 2
+
,
(x2 + 1)(x 2)
x +1
x2
attraverso la soluzione di un sistema di tre equazioni
in tre incognite, che lasciamo alle amorevoli attenzioni
del lettore.

Come sappiamo, il grado di unequazione algebrica


`e il pi`
u alto dei gradi dei monomi che lo compongono,
dopo aver effettuato tutte le semplificazioni possibili.
Il grado di un sistema `e il prodotto dei gradi delle
equazioni che lo compongono. Come abbiamo visto,
se tutte le equazioni sono lineari, allora il grado del
sistema `e 1; se si considerano invece:

2
x+y =
x + y2 =
oppure
xy =
xy =
si hanno, rispettivamente, un sistema di secondo e un
sistema di quarto grado. In via del tutto teorica, la
soluzione di uno di questi sistemi pu`o avvenire operando per sostituzione; ad esempio, da x + y = si
ricava y = x e quindi, sostituendo nella seconda,
x2 x+ = 0 (vedere anche la Sezione 5.3). In questo modo, si capisce come ogni volta si arrivi ad avere
unequazione con lo stesso grado di tutto il sistema,
giustificando cos` la definizione stessa di grado.
Talvolta, il metodo di sostituzione `e lunico o il
pi`
u appropriato metodo di procedere. In realt`a, esiste una bellissima teoria sulla risoluzione dei sistemi
polinomiali, ma non possiamo parlarne qui. Ci`o che
invece `e importante fare `e spingere il solutore ad utilizzare la propria intelligenza e le proprie conoscenze

per cercare metodi indiretti di risoluzione. Ad esempio, per il secondo sistema si pu`o procedere osservando che x2 +2xy +y 2 = +2 e x2 2xy +y 2 = 2.
Questo d`a il nuovo sistema lineare:

x + y = + 2
x y = 2
che si pu`o risolvere per somma e sottrazione. La scelta dei segni permette di trovare le quattro soluzioni
previste, purche sia +2 > 0 e 2 > 0; altrimenti,
il numero delle radici reali potr`a essere minore.
I sistemi di equazioni che abbiamo considerato prevedono una soluzione in termini di numeri reali o, se i
coefficienti sono interi, in termini di numeri razionali.
Spesso per`o accade che certi problemi richiedono una
soluzione in numeri interi, come nel celebre caso del
vecchio cammelliere arabo. Costui possiede 17 cammelli e li lascia in eredit`a ai tre figlioli, specificando
che il primo debba averne la met`a, il secondo un terzo
e il terzo (che `e un po birichino) solamente un nono.
Ma come fare la divisione se, come sembra, i cammelli non possono essere divisi a fette? La soluzione del
Visir, chiamato a risolvere la questione, `e pi`
u astuta
che matematicamente corretta. In realt`a, le equazioni e i sistemi di equazioni per i quali si ricercano solo
soluzioni intere sono stati studiati fin dallantichit`a e
vengono detti diofantei, in onore di Diofanto, il matematico greco - alessandrino che li affront`o in modo
sistematico nel III secolo d.C.. Oggi si sa che questi
problemi sono di difficile soluzione e, addirittura, `e
impossibile trovarne un metodo generale di risoluzione. Se sono coinvolte n variabili, le possibili soluzioni
sono contenute in Zn , un insieme numerabile, e quindi si potrebbe pensare di provarle sistematicamente
tutte, fino a che una soluzione non salti finalmente
fuori. Questo, per`o, succede se almeno una soluzione
esiste; purtroppo, si dimostra che `e impossibile dimostrare che, per un dato sistema diofanteo, almeno
una soluzione esista. Pertanto, procedendo per tentativi, potremmo andare avanti, andare avanti e non
arrivare mai al termine della verifica. Tecnicamente,
si dice che il problema della soluzione delle equazioni diofantee `e indecidibile. Questo `e uno dei casi in
cui il principio del terzo escluso e il principio di non
contraddizione non sono pi`
u applicabili.

5.5

Disequazioni

Non vi `e dubbio che molti problemi si risolvono con


luso delle equazioni, specie quando si ricerchino valori precisi o caratteristici. Tuttavia, nella pratica sono molto frequenti i problemi nei quali si cerca un rango di valori che ci permettano una certa
flessibilit`a, o che comunque abbiano a che fare con
quantit`a che devono essere maggiori (o minori) di un

148
valore assegnato. Ad esempio, vorremmo sapere a
che ora (al pi`
u tardi) dobbiamo partire per arrivare a Roma entro mezzogiorno, sapendo che il traffico non ci permetter`a di superare gli 80 km/h. Nel
classico problema del trasporto, unazienda ha, diciamo, tre stabilimenti di produzione S1 , S2 , S3 , ciascuno dei quali, in un mese, pu`o produrre una quantit`a
q1 , q2 , q3 di un certo prodotto, compresa tra un minimo e un massimo: mi qi Mi , i = 1, 2, 3, legato
agli impianti e al personale. Ha poi n punti vendita V1 , V2 , . . . , Vn che possono smaltire certe quantit`a
ri , anchesse comprese tra un minimo e un massimo: ti ri Ti , i = 1, 2, . . . , n. Si conosce poi il
costo del trasporto della merce (per unit`a di prodotto) da ciascuno stabilimento a ciascun punto vendita.
Il problema `e quello di determinare le quantit`a Qi,j
da trasportare dallo stabilimento Si al punto vendita
Vj in modo da soddisfare i vincoli, cio`e le condizioni
sulle quantit`a della produzione e delle vendite, e da
minimizzare i costi di trasporto.
Una disequazione `e unespressione del tipo
A(x, y, . . . , z) B(x, y, . . . , z) dove A(x, y, . . . , z) e
B(x, y, . . . , z) sono due espressioni letterali nelle incognite x, y, . . . , z ed `e uno dei quattro relatori:
<, , >, . Una soluzione della disequazione `e un
qualsiasi assegnamento di valori reali alle variabili:
x = x0 , y = y0 , . . . , z = z0 tale che la proposizione A(x0 , y0 , . . . , z0 ) B(x0 , y0 , . . . , z0 ) risulti vera. Il
grado di una disequazione `e definito in modo analogo al grado di una equazione: ridotta la disequazione alla forma canonica C(x, y, . . . , z) 0, il grado
della disequazione `e il grado dellespressione letterale C(x, y, . . . , z). Per arrivare alla forma canonica di
una disequazione, si applicano le regole di al-jabra e
di al-muqabalah, ma con qualche attenzione:
1. se si aggiunge o si toglie ad entrambi i membri di una disequazione la stessa quantit`a, la
disequazione non cambia;
2. se si moltiplicano o si dividono entrambi i membri di una disequazione per la stessa quantit`a
maggiore di 0, la disequazione non cambia;

CAPITOLO 5. ALGEBRA
dobbiamo moltiplicare i due membri per lespressione C(x), dobbiamo dividere il nostro problema in due
sottoproblemi: C(x)A(x) C(x)B(x) e C(x) 0 il
primo, e C(x)B(x) C(x)A(x) e C(x) 0 il secondo. Si tratta, propriamente, di due sistemi di disequazioni, ma come ora vedremo, questo fa parte della
regola generale, secondo la quale ogni disequazione si
risolve mediante lo studio di un opportuno sistema di
disequazioni.
Oggi, problemi analoghi a quello del trasporto nascono in molte modellazioni della realt`a, spesso legati alla produzione di beni, alla progettazione ingegneristica ed economica; se le disequazioni sono tutte lineari, si dice che siamo di fronte a un sistema
di programmazione lineare; esistono algoritmi, come
quello famoso del simplesso che permettono di risolvere, con laiuto dellelaboratore, sistemi con migliaia
di incognite e decine di migliaia di disequazioni. Qui,
naturalmente, ci occuperemo di problemi molto pi`
u
semplici, ma che sono alla base di questo settore dellAlgebra, talvolta molto interessante e spesso assai
complicato.
Una disequazione lineare nella sola incognita x `e di
facile soluzione; la sua forma pi`
u generale, una volta
applicate le regole viste sopra, `e ax b e, applicando
ancora la regola 3, se a > 0 si ha x b/a, mentre
se a < 0 si trova b/a x. Cos`, se la distanza da
Roma a cui ci troviamo `e 180 km, il tempo minimo di
percorrenza sar`a: 180/80 = 9/4 = 2h 15 ; se vogliamo
arrivare entro mezzogiorno, dobbiamo partire prima
che manchi un quarto alle dieci. Le soluzioni di una
disequazione si rappresentano in modo convenzionale,
ma suggestivo, disegnando la retta reale e dividendola
secondo i punti di transizione dalle zone di soluzione a
quelle di non-soluzione; queste ultime si denotano con
una linea tratteggiata, mentre le prime si indicano
con una linea continua. Nel nostro esempio abbiamo:
9/4

La risoluzione delle disequazioni di primo grado `e


un
passo importante. In pratica ci limiteremo a consi3. se si moltiplicano o si dividono entrambi i memderare
disequazioni di tipo polinomiale o determinate
bri di una disequazione per la stessa quantit`a
da
espressioni
razionali fratte (con una sola incogniminore di 0, la disequazione cambia senso (cio`e,
ta), accennando appena alle disequazioni irrazionali,
se A(x) B(x), allora cB(x) cA(x)).
comunque riconducibili ai tipi precedenti. Dovendo
La quantit`a a sommare o a moltiplicare pu`o an- implicitamente considerare anche i sistemi di diseche dipendere da una o pi`
u delle variabili x, y, . . . , z, quazioni, ad essi non dedicheremo una trattazione
ma nel caso della moltiplicazione questo introduce particolare.
una nuova disequazione che ci permetta di manteCome vedremo nella prossima sezione sui numeri
nere (o di invertire) il senso della disequazione mo- complessi, un polinomio p(x) R[x] `e sempre scomdificata. Ad esempio, se A(x) B(x) e sappiamo ponibile in polinomi di primo e di secondo grado con
che x > 0, allora possiamo cambiare la disequazione discriminante minore di 0 (polinomi irriducibili). In
in xA(x) xB(x), se ci`o ci conviene. Viceversa, se generale, queste scomposizione non si pu`o ottenere

149

5.5. DISEQUAZIONI
facilmente e richiede la ricerca delle radici del polinomio. Se questo `e di secondo grado, sappiamo come
procedere; se `e di terzo o di quarto grado, si conoscono tecniche di scomposizione (si veda la Sezione 5.7),
che spesso sono per`o assai complesse. In generale,
per i polinomi di grado superiore al secondo si usano
metodi numerici per determinare buone approssimazioni delle radici, e anche a questo accenneremo nella
stessa Sezione 5.7, pur essendo la faccenda non del
tutto banale. Pertanto, lo strumento pi`
u disponibile
e simpatico (anche se talvolta piuttosto noioso) `e dato dal Teorema di Eisenstein, che per`o funziona solo
se i coefficienti del polinomio sono numeri interi (o
razionali) e almeno una delle radici `e razionale. Trovata questa, la regola di Ruffini permette di effettuare
la prima scomposizione e ridurre il polinomio di un
grado, semplificando cos` (si spera) i passi successivi.
Immaginando (con un po di buona volont`a) di esser riusciti a scomporre in fattori irriducibili il nostro
polinomio, la tecnica da utilizzare `e standard e cercheremo ora di esporla; essa si basa su considerazioni
relative a ciascun fattore e per quelli di primo grado losservazione precedente sul grafico con la retta
reale `e tutto ci`o che serve. Per quanto riguarda i polinomi irriducibili di secondo grado, si ha il seguente
risultato:

risulta positiva per valori di x < e di x > , mentre


risulta negativa per < x < .
Prova: Il prodotto di due fattori risulta positivo se
e solo se i due fattori hanno lo stesso segno; ma x
`e positivo per x > e x per x > . Quindi, solo
per < x < i due fattori hanno segno discorde.
Utilizzando ancora la retta reale, la seguente figura
rappresenta molto bene la situazione (e pu`o essere
facilmente generalizzata):

(x )
(x )
(x )(x )

dove la terza linea (x )(x ) deriva dalla diretta applicazione della regola dei segni alle due linee
precedenti, quando si ricordi che la linea tratteggiata corrisponde a valori negativi e quella continua a
valori positivi.
La generalizzazione ad espressioni di grado superiore `e allora immediata. Supponiamo di avere leLemma 5.14 Sia ax2 + bx + c (con a 6= 0) une- spressione, gi`a fattorizzata, (x + 1)(x 1)(x 2) =
3
2
spressione di 2 grado con il discriminante negativo; x 2x x + 2; le tre linee corrispondenti ai tre
allora tale espressione, al variare di x, risulta sempre fattori ci dicono subito il risultato:
negativa se a < 0 e sempre positiva se a > 0.
1
1
2
(x + 1)
Prova: Usiamo qui unargomentazione che risulter`a pienamente giustificata solo quando parleremo
(x 1)
di continuit`a (vedere la Sezione 8.4); per il momento
ci dobbiamo basare solo sulla nostra intuizione. Se
(x 2)
il risultato esposto nellenunciato non fosse vero, si
avrebbe un valore x0 di x per cui ax20 + bx0 + c < 0
e un valore x1 di x per cui ax21 + bx1 + c > 0. Poiche
a piccole variazioni di x corrispondono piccole variazioni dellespressione, deve esistere un valore x
di x, Lespressione `e positiva per 1 < x < 1 poiche risulcompreso tra x0 ed x1 , tale che a
x2 + b
x + c = 0, cio`e tano positivi due fattori su tre; `e di nuovo positiva
un valore che risulta radice dellespressione, contro per x > 2 poiche tutti e tre i fattori sono positivi.
lipotesi che il discriminante fosse negativo, e quindi Lespressione `e invece negativa per x < 1 poiche `e
lespressione senza radici reali.
composta da tre fattori negativi, e per 1 < x < 2 poich
e solo il fattore (x 3) risulta negativo. La regola
Lasciamo al lettore il compito di estendere que`
e
:
i) lespressione `e positiva se i fattori negativi sono
sto risultato al caso del discriminante nullo, mentre
in
numero
pari; ii) `e negativa se i fattori negativi soci interessa vedere cosa succede se il discriminante `e
no
in
numero
dispari. Anche se tutti lo dovrebbero
positivo e quindi esistono due soluzioni e delle2
sapere,
il
numero
0 `e pari!
quazione ax + bx + c = 0. Possiamo allora scrivere
2
Ogni espressione polinomiale d`a origine ad una diax +bx+c = a(x)(x) e supporre che sia a > 0;
il caso a < 0 si tratta in modo del tutto analogo. Si sequazione risolubile con il metodo descritto, purche
sia scomponibile in fattori irriducibili. Ci baster`a osha allora:
servare il seguente esempio, che ci permette di deTeorema 5.15 Data lespressione ax2 + bx + c = scrivere il metodo generale. Il lettore `e invitato (cala(x )(x ) con a > 0 e < , tale espressione damente) a formalizzare il procedimento in un vero

150

CAPITOLO 5. ALGEBRA

e proprio algoritmo, il che gli permetter`a di chiari- dei suoi coefficienti contiene uno o pi`
u parametri, cio`e
re e di chiarirsi i vari passi necessari. Sia data la quantit`a non definite da un preciso valore, ma che, a
disequazione:
seconda dei casi, possono assumere valori precisi. Ad
esempio, consideriamo lequazione di secondo grado:
x4 + 2x3 x 2 > 0
x2 (m + 2)x (4m + 8) = 0,
e si cerchi di fattorizzare il polinomio di quarto grado.
Il Teorema di Eisenstein ci dice che, se esistono radici per la quale siamo interessati a scoprire per quali
razionali, esse sono comprese tra 1 e 2. Provando, valori di m (il parametro), lequazione ha due sosi vede che x = 1 `e proprio una radice, e applicando luzioni reali (come sottoprodotto, scopriremo anche
quando essa ha ununica soluzione). Naturalmente,
la regola di Ruffini ci si riduce allespressione:
lesistenza delle soluzioni `e legata al discriminante:
(x 1)(x3 + 3x2 + 3x + 2) > 0.
= (m + 2)2 + 4(4m + 8) = m2 + 20m + 36.
Confidando ancora nella fortuna e in Eisenstein, si
trova la radice x = 2 e di nuovo si usa Ruffini per Perche si abbiano due soluzioni, deve essere2 > 0 e
quindi dobbiamo risolvere la disequazione m +20m+
ottenere lespressione:
36 > 0. La scomposizione in fattori d`a: m2 + 20m +
36 = (m+2)(m+18) e, in accordo a quanto detto, due
(x 1)(x + 2)(x2 + x + 1) > 0.
soluzioni si hanno per m < 18 e m > 2, e il lettore
Lultima espressione di secondo grado ha discrimi- verificher`a che per m = 20 e per m = 0 si hanno
nante negativo e quindi, per il lemma precedente, ha davvero due soluzioni. A questo punto, per m = 18
sempre valore positivo. Basta allora disegnare il gra- e per m = 2 lequazione di partenza ha ununica
fico per i fattori (x 1) e (x + 2) e vedere che la soluzione, e infatti si ha: x2 + 16x + 64 = (x + 8)2 = 0
disequazione di partenza `e vera per x < 2 e per e x2 = 0.
Spesso, questa doppia soluzione di equazioni di sex > 1.
Se invece che da un polinomio, abbiamo una dise- condo grado risulta ostica e lo studente, specie le priquazione costituita da unespressione razionale fratta, me volte, tende a perdere il filo del ragionamento (io
il metodo di risoluzione non cambia, visto che anche lo perdo ancora). Il ragionamento, in realt`a, non `e
un rapporto `e positivo se e solo se numeratore e de- poi troppo complicato e richiede solo un po di attennominatore sono concordi. Un esempio deve essere zione. Perci`o il consiglio `e quello di rileggere tutta
questa tiritera e provare ancora una volta, ad esempio
sufficiente:
con lequazione x2 (m + 1)x (2m + 5) = 0.
x2 + x 2
(x + 2)(x 1)
Le disequazioni sono utili anche per la risoluzio=
>0
x2 2x
x(x 2)
ne delle equazioni irrazionali, vista nella Sezione 5.3.
Riprendiamo
lesempio
considerato in quella occasio

che si risolve col solito diagramma:


x + 4 x 3 = 1. Affinche una soluzione
ne:
x0 sia accettabile, deve permettere lestrazione di en2
0
1
2
(x + 2)
trambe le radici, cio`e deve essere x0 > 4 e x0 > 3,
cio`e, in definitiva, x0 > 3. Questa osservazione evita
(x 1)
di dover controllare la soluzione ottenute eseguendo
i calcoli nellequazione di partenza; quindi `e proprio
x
un metodo da seguire. Osserviamo che, risolvendo
la precedente equazione,
p eravamo arrivati a unaltra
(x 2)
equazione irrazionale: (x + 4)(x 3) = x. Se fosse
stata questa la nostra equazione di partenza, il metodo dei grafici ci avrebbe mostrato che le soluzioni accettabili devono stare negli intervalli x < 4 e x > 3.
di modo che la soluzione `e data dai tre intervalli x < Questa non `e la stessa condizione vista in precedenza
2, 0 < x < 1 e x > 2. Naturalmente, il lettore e relativa alla vera equazione di partenza. Lo stu`e invitato a controllare questi risultati provando con dente prenda questa osservazione come un ulteriore
qualche valore significativo.
avvertimento a non considerare lequazione, ottenuta
Un problema che si incontra abbastanza spesso, elevando a potenza i due membri, equivalente senzalspecie nella Geometria Analitica, `e quello di deter- tro allequazione di partenza. Il Teorema 5.13 `e un
minare quando unequazione di secondo grado para- punto troppo importante e non va mai trascurato.
metrica ammette due radici o ne ammette una sola.
In modo analogo, le disequazioni ci permettono di
Unequazione si dice parametrica quando almeno uno trattare in modo sistematico le equazioni (e le dise-

151

5.6. NUMERI COMPLESSI


quazioni) contenenti qualche valore assoluto. Il valore assoluto di una espressione `e uguale allespressione stessa, se essa `e positiva, ed `e uguale allopposto
(cio`e allespressione cambiata di segno) se lespressione `e negativa. Tutto allora si accomoda e diviene
semplice, se operiamo una separazione delle soluzioni, andando a sostituire al valore assoluto lespressione stessa o il suo opposto. Come spesso succede,
`e pi`
u complicato esprimere il procedimento che attuarlo nella pratica. Si consideri pertanto lequazione
|x 2| = x2 ; quando x > 2 si ha |x 2| = x 2 e
quindi lequazione `e equivalente a x 2 = x2 . Quando, viceversa, x < 2, si ha |x 2| = (x 2) e quindi
lequazione `e equivalente a 2 x = x2 . In questo modo, la soluzione della nostra equazione `e ricondotta
alla soluzione dei due sistemi:

x 2 = x2
2 x = x2
e
x > 2
x < 2.
In modo esplicito osserviamo che il caso x = 2 pu`o,
indifferentemente, essere considerato in proprio, essere inserito in uno dei due sistemi (ad esempio, il primo, ponendo x 2) o addirittura in tutti e due. La
cosa pi`
u semplice `e quello di vederlo come terzo caso
e notare che non porta ad alcuna soluzione. Il lettore ora verificher`a che il primo sistema non presenta
soluzioni, mentre il secondo d`a x = 2 e x = 1.
Questo esposto `e un caso molto semplice, ma le cose
non cambiano molto quando si debbano affrontare
equazioni, disequazioni o sistemi pi`
u complicati. Una
volta riportato tutto a diversi sistemi (giusto come s`e
visto) la difficolt`a `e scaricata sulle singole equazioni
e/o sulle singole disequazioni. Ci si riconduce cos` a
cose discusse in questa e nelle precedenti sezioni.
Questa visione ottimistica relativa alla soluzione
di equazioni e di disequazioni pu`o andare incontro
a qualche delusione, specie se un problema richiede
soluzioni in numeri interi. Abbiamo gi`a visto le difficolt`a relative ai sistemi diofantei, e qui mi piace dare
come esempio uno dei problemi pi`
u belli che io conosca. Fortunatamente, la soluzione non `e difficile se la
si imposta in modo razionale.
Due amici matematici, Alberto e Biagio, si incontrano dopo tantissimi anni e si scopre che B. si `e
sposato e ha avuto tre figli.
A.: Quanti anni hanno?
B.: Il prodotto delle loro et`a `e 36.
A.: Non mi basta per risolvere il problema,
visto che `e un problema quello che mi proponi!
B.: Be, la somma delle loro et`a `e il numero
civico su questo portone.
A.: Mi spiace, ma non `e ancora sufficiente.
B.: Hai ragione, ma devi sapere che il pi`
u

grande ha gli occhi azzurri.


A.: Ora s` che mi hai detto tutto!
e gli spiattella le et`a dei tre figlioli. La domanda ora
si impone: `e il lettore in grado di trovare anche lui
queste benedette et`a?
La soluzione coinvolge soltanto numeri interi e
quindi `e facile trovare tutte le terne di numeri
che hanno come prodotto 36; scriviamo, accanto a
ciascuna terna, la somma dei tre numeri:
1
1
1
1
1
2
2
3

+
+
+
+
+
+
+
+

1
2
3
4
6
2
3
3

+
+
+
+
+
+
+
+

36
18
12
9
6
9
6
4

=
=
=
=
=
=
=
=

38
21
16
14
13
13
11
10

Il lettore deve essere convinto che quelle elencate sono tutte e sole le terne possibili; mettendole in modo
che sia a b c si ha un metodo sistematico per generarle. Ora osserviamo che se il numero civico (che
noi non conosciamo, ma che Alberto vede) fosse stato 16, la soluzione avrebbe dovuto essere (1, 3, 12).
Il fatto che Alberto avesse qualche dubbio vuol dire
che la somma corrisponde a pi`
u soluzioni; ma ci`o ci
dice che tale somma `e 13, il numero civico misterioso. A questo punto, lultima informazione (che esiste
un figlio pi`
u grande) ci permette di escludere la soluzione (1, 6, 6), nella quale ci sono due gemelli pi`
u
grandi, e quindi rispondere (2, 2, 9). Formalmente, il
sistema si scrive:

xyz = 36

x+y+z = k

x > max(y, z)
ma bisogna dire, con buona pace dei matematici formalisti, che questo `e di ben poco aiuto alla
soluzione.

5.6

Numeri complessi

Come abbiamo detto, i numeri reali si dividono in


due grandi categorie: i numeri algebrici, che sono i
numeri soluzione delle equazioni algebriche a coefficienti razionali, e i numeri trascendenti, cio`e tutti gli
altri. Abbiamo anche visto che i numeri algebrici sono una infinit`a numerabile, cio`e la loro cardinalit`a `e
0 , mentre i numeri trascendenti hanno la cardinalit`a
del continuo.Consideriamo ora un numero algebrico,
ad esempio 2, e denotiamolo con un simbolo particolare, diciamo . Lequazione algebrica di cui `e
soluzione sar`a x2 2 = 0, e quindi `e caratterizzato
dal fatto che 2 = 2. Prendiamo allora tutti i numeri

152

CAPITOLO 5. ALGEBRA

reali del tipo a


+ b, dove a, b Q. Questo insieme
si denota con Q[ 2] = Q[] e si dice una estensione
algebrica di Q. Il punto interessante `e che la somma
(a + b) + (a + b ) = (a + a ) + (b + b ) rimane
nellambito dellinsieme, cio`e, come si dice, `e chiusa e naturalmente, essendo eseguita su numeri reali,
gode delle varie propriet`a di associativit`a e commutativit`a. Inoltre, se consideriamo 0 = 0 + 0 uno dei
nostri numeri, esso si comporta da identit`a e si ha
(a + b) + (a b) = 0, cio`e a b `e lopposto di
a + b.
Ancora pi`
u notevole `e il prodotto:

(a + b) (a + b ) = aa + ab + a b + bb =

= (ab + a b + aa ) + (aa + bb ).
Se poi intervengono radici di equazioni di grado superiore al secondo, occorre considerare anche
le po
tenze intermedie. Ad esempio, se = 4 2, allora
`e la soluzione di x4 2 = 0 e quindi le espressioni
da considerare sono del tipo a3 + b2 + c + d. Il
prodotto richiede unelaborazione pi`
u complicata:
(a3 + b2 + c + d)(a 3 + b 2 + c + d ) =
= aa 6 + (ab + a b)5 + (ac + bb + a c)4 +
+(ad + bc + cb + da )3 +
+(bd + cc + db )2 + (cd + dc ) + dd .

= (ab + a b) + (2aa + bb )

Ora occorre osservare che da 4 = 2 discende 5 = 2


e
6 = 22 , per cui, continuando i calcoli, il prodotto
dato che 2 = 2. Quindi, anche il prodotto `e unopeviene
a valere:
razione chiusa e, di nuovo, essendo eseguito tra numeri reali, `e senzaltro associativo, commutativo e (ad + bc + cb + da )3 + (2aa + bd + cc + db )2 +
distributivo rispetto alla somma. Inoltre, scrivendo
1 = 0+1, si ha (a+b)1 = a+b, cio`e 1 fa da iden- +(2ab + 2ba + cd + dc ) + (2ac + 2bb + 2ca + dd ).
tit`a rispetto al prodotto. Ci possiamo allora chiedere
Questa espressione `e alquanto complessa, ma non poi
se esiste un inverso di a+b: la risposta `e affermativa.
pi`
u di tanto, e permette anche di calcolare linverSia a + b leventuale inverso di a + b; si deve avere
so
di a3 + b2 + c + d come soluzione di un si(a+b)(a +b ) = (ab +a b)+(2aa +bb ) = 0+1,
stema lineare di quattro equazioni nelle quattro incio`e ab + a b = 0 e 2aa + bb = 1. Questo `e un sistecognite a , b , c , d : basta uguagliare la precedente
ma lineare di due equazioni nelle due incognite a , b
espressione allidentit`a 1 = 03 + 02 + 0 + 1.
e, come sappiamo, ha una e una sola soluzione se il
Di conseguenza, da un punto di vista formale, quedeterminante del sistema `e diverso da 0; ma:
sti
insiemi di numeri hanno le stesse propriet`a di Q

b a
e
di
R, cio`e sono dei campi, pi`
u vasti di Q, ma pi`
u
2
2

2a b = b 2a
smilzi di R. Anche R, come sappiamo, non `e completo rispetto alla soluzione delle equazioni: non `e detto
e questa espressione non pu`o mai essere0, altrimenti che unequazione a coefficienti in R debba per forza
2
avremmo b2 = 2a2 , cio`e 2 = b
/a2 o 2 = b/a, ed avere una soluzione reale. Ad esempio, x2 +1 = 0 non
essendo a, b Q sarebbe anche 2 Q. La soluzione ha soluzioni reali perche ogni numero reale elevato al
del sistema d`a:
quadrato d`a un numero non negativo, e aggiungendogli 1 si ha sempre un numero maggiore di 0. Come
a
b
a = 2
b = 2
,
2
2
prima era la soluzione ipotetica di una equazione
b 2a
b 2a
irriducibile su Q, chiamiamo ora i limmaginaria soe questo permette di trovare linverso di ogni numero luzione della precedente equazione; deve pertanto esdel tipo a + b. Ad esempio, linverso di 2 + 3 si sere i2 + 1 = 0, ovvero i2 = 1. Proprio per questa
trova calcolando:
asserzione, i viene detta lunit`
a immaginaria e su di
2
essa possiamo costruire un nuovo campo R[i], che si

= 2
b = 3;
a =
chiama il campo dei numeri complessi e si indica diso98
lito con C. In analogia a quanto si diceva per Q[ 2],
in effetti, eseguendo il prodotto (2 + 3)(2 + 3) =
gli elementi di C hanno la forma bi + a, che tradizio42 + 6 6 + 9 = 4 2 + 9 = 1.
nalmente si scrive a + bi, e la somma `e ovviamente
Questo stesso
procedimento pu`o esser fatto, ad definita da:
esempio, per 5, ma la regola del prodotto diviene:
(a + b)(a + b ) = (ab + a b) + (5aa + bb ).

(a + bi) + (a + b i) = (a + a ) + (b + b )i.

Un po pi`
u complicato pu`o essere considerare la radice Questa volta non conosciamo alcun campo che con dellequazione x2 x 1 = 0; in questo caso `e tenga C, e quindi dovremmo verificare che le propriet`a associativa e commutativa valgono effettiva2 = + 1 e quindi il prodotto `e definito da:
mente. Per la propriet`a commutativa, ad esempio,
si ha: (a + bi) + (a + b i) = (a + a ) + (b + b )i =
(a + b)(a + b ) = (ab + a b) + aa 2 + bb =

153

5.6. NUMERI COMPLESSI

(a +a)+(b +b)i = (a +b i)+(a+bi), e questo prova termine immaginario `e, a questo proposito, molto
che anche in C possiamo contare su questa propriet`a significativo).
della somma. Naturalmente, 0 + 0i `e lidentit`a e si
scrive semplicemente 0; a bi `e lopposto di a + bi
3 + 2i
poiche (a + bi) + (a bi) = (a a) + (b b)i = 0.
Per il prodotto abbiamo:
2 + i

2
(a + bi) (a + b i) = aa + ab i + ba i + bb i =
= (aa bb ) + (ab + ba )i

essendo per definizione i2 = 1. Anche qui dovremmo verificare le propriet`a commutativa, associativa e
distributiva rispetto alla somma. Per la commutativit`a abbiamo: (a + bi) (a + b i) = (aa bb ) +
(ab + ba )i = (a + b i) (a + bi), dato che per i numeri reali la propriet`a vale. Lasciamo alla pazienza e alla buona volont`a del lettore la dimostrazione noiosa (ma che almeno una volta nella vita `e bene fare) delle altre due propriet`a. Piuttosto, chi `e
lidentit`a rispetto al prodotto? Se (a + b i) indica
questa presunta identit`a ed a + bi 6= 0, deve essere
(a + bi) (a + b i) = (aa bb ) + (ab + ba )i = a + bi,
cio`e aa bb = a e ab +a b = b. Abbiamo qui un sistema lineare di due equazioni nelle due incognite a , b ;
moltiplicando la prima equazione per b e la seconda
per a si ottiene: aba b2 b = ab e aba + a2 b = ab;
sottraendo membro a membro si ha: (a2 + b2 )b = 0.
Ma qui osserviamo che lipotesi a+bi 6= 0 implica che
sia a2 + b2 > 0, poiche a2 + b2 `e 0 se e solo se sia a
che b valgono 0. Un prodotto in R, daltra parte, `e
0 solo se un fattore `e 0 e quindi possiamo concludere
b = 0. Sostituendo questo valore in aa bb = a (se
a 6= 0) e in ab +a b = b (se a = 0 e quindi b 6= 0) si ha
a = 1. Quindi, come ci si poteva aspettare, lidentit`a
`e 1 + 0i, che di regola si scrive semplicemente 1.
In generale, tutti i numeri complessi della forma
a + 0i si scrivono a e si identificano con i numeri reali: il numero complesso 5 + 0i `e da intendersi come
il numero reale 5. I numeri della forma 0 + bi si dicono immaginari e si scrivono nella forma abbreviata
bi. I numeri complessi, nel loro insieme, si possono
rappresentare come i punti del piano con le seguenti
convenzioni: assimiliamo il numero complesso a + bi
alla coppia ordinata (a, b) e quindi facciamo corrispondere il numero complesso a un punto del piano
cartesiano. Propriamente, lasse delle x diviene lasse
contenente tutti e soli i numeri reali, e pertanto viene detto lasse reale. Lasse y invece contiene i punti
corrispondenti ai numeri immaginari e si dice perci`o
lasse immaginario. Nella Figura 5.3 sono riportati
alcuni punti con i corrispondenti numeri complessi;
il piano cartesiano, cos` modificato e interpretato, si
dice piano dArgand, dal nome del matematico dilettante francese che lha introdotto alla fine del 1700 e
che ha permesso di dare una rappresentazione concreta a un concetto ritenuto completamente astratto (il

1i
1 2i
Figura 5.3: Il piano di Argand
Abbiamo di proposito tralasciato lultimo problema sulla struttura algebrica dei numeri complessi:
dato un numero a + bi 6= 0, qual `e il suo inverso? Se,
al solito, a + b i `e tale ipotetico inverso, si deve avere
(a + bi) (a + b i) = (aa bb ) + (ab + ba )i = 1 + 0i,
il che equivale al sistema:

aa bb = 1
ba + ab = 0
nelle due incognite a , b . Il determinante di questo
sistema `e:

a b
2
2

b a =a +b

che `e sempre diverso da 0, nellipotesi che sia a +


bi 6= 0. Allora il sistema ha sempre una e una sola
soluzione:
a =

a
a2 + b2

b =

b
.
a2 + b2

Ad esempio, dato il numero complesso 2 3i, lin2


3
verso `e 13
+ 13
i, come `e facile verificare eseguendo il
prodotto:

3
4
9
6
6
2
+ i =
+
+

i = 1.
(23i)
13 13
13 13
13 13
Gauss, intorno allanno 1800, riusc` a dimostrare che
ogni equazione algebrica a coefficienti in C ha in C
almeno una soluzione, risultato noto come Teorema
fondamentale dellAlgebra. Tale propriet`a che, come
sappiamo, non vale ne in Q ne in R, ci dice che il
campo dei numeri complessi `e il campo numerico pi`
u
adeguato nel quale si possano trattare le equazioni
algebriche. Abbiamo esplicitamente visto che da Q
si pu`o passare a campi pi`
u ampi, se si aggiungono
le radici di equazioni che non hanno soluzioni in Q;
la stessa cosa si pu`o fare in R, e proprio con tale
metodo siamo arrivati a C. Qui la cosa non procede

154

CAPITOLO 5. ALGEBRA

oltre, poiche ogni equazione algebrica ha soluzioni in


C stesso.
Se invece di partire dallequazione x2 + 1 = 0 fossimo partiti da unaltra equazione irriducibile, ad esempio x2 + 2x + 3 = 0, avremmo ottenuto un campo leggermente diverso, ma isomorfo a C, cio`e con le stesse
propriet`a di C. Se j `e una radice di x2 + 2x + 3, il
prodotto (a + bj) (a + b j) sarebbe stato:
aa + (ab + a b)j + bb j 2 =

= aa + (ab + a b)j + bb (2j 3) =


= (aa 3bb ) + (ab + ba 2bb )j,
e questi numeri complessi avrebbero comunque
avuto una rappresentazione su un piano analogo a
quello di Argand. Da un altro punto di vista, se applichiamo la formula per la risoluzione delle equazioni
di
p abbiamo = 412
secondo
= 8
e quindi:
grado,
= 8 = (1) 8 = 1 8 = i2 2, e quine j `e esprimibile in
di: x = 1 i 2, cio`
C come uno

dei due valori: 1 + i 2 oppure 1 i 2. Scelto ad


esempio il primo valore e posto j = 1 + i 2, si ha:

2
2
i = (j + 1)/ 2 =
+
j,
2
2
il che fa vedere come j ed i siano esprimibili uno in
funzione
Questo naturalmente non succede
dellaltro.
per Q[ 2] e Q[ 3], anche se questi due campi hanno
propriet`a formali del tutto simili luno allaltro.
Partendo da un polinomio di grado n, se questo ha
una radice C, dividendo per x si ottiene un
polinomio di grado n 1. Questo, a sua volta, avr`a
una radice che permette di ridurre il grado di 1, e
cos` via. Corollario del Teorema di Gauss `e che ogni
equazione algebrica di grado n ha in C esattamente n
soluzioni (alcune delle quali, in particolare, possono
essere uguali tra loro).
I due numeri complessi a + bi e a bi si dicono
coniugati; nel piano di Argand sono rappresentati da
punti simmetrici rispetto allasse reale. Elevando al
quadrato si ha:
(a + bi)2 = (a + bi) (a + bi) = (a2 b2 ) + 2abi
2

(a bi) = (a b ) 2abi,
cio`e si ottengono ancora due numeri complessi coniugati. Iterando, si ha che coniugate rimangono tutte le
loro potenze. Se z C, il suo coniugato si indica con
z, e quindi possiamo scrivere: z k = (z k ), qualunque
sia k N. Si noti poi che un numero complesso z `e
uguale al suo coniugato, z = z, se e solo se z R: infatti, se z = a + 0b, il suo coniugato `e a 0b = a = z,
e se a + bi = a bi allora `e 2bi = 0, cio`e b = 0. Si ha
allora il seguente:

Teorema 5.16 Sia p(x) un polinomio a coefficienti reali; allora, se z C `e una radice di p(x), cio`e
p(z) = 0, allora anche p(z) = 0.
Prova: Sia p(x) = a0 xn + a1 xn1 + + an1 x + an ,
dove a0 , a1 , . . . , an R. Abbiamo allora a0 z n +
a1 z n1 + + an1 z + an = 0 e prendendo il
coniugato:
a0 z n + a1 z n1 + + an1 z + an = 0 = 0.
Si applicano ora le regole del coniugato viste sopra e
si ha:
a0 z n + a1 z n1 + + an1 z + an = 0.
Ma i coefficienti sono numeri reali e quindi:
a0 z n + a1 z n1 + + an1 z + an = 0
il che prova che z `e una soluzione dellequazione
p(x) = 0.
Se p(x) ha come soluzione il numero complesso a +
bi, ha come soluzione anche abi, e quindi `e divisibile
per x a bi e per x a + bi; di conseguenza `e
divisibile per il loro prodotto: (xabi)(xa+bi) =
(x a)2 (ib)2 = x2 2ax + a2 + b2 . Ma questo `e
un polinomio di secondo grado a coefficienti reali, per
cui abbiamo dimostrato il seguente:
Teorema 5.17 Sia p(x) un polinomio a coefficienti
reali; allora esso `e scomponibile in fattori di primo e
di secondo grado in R[x].
In altre parole, questo dimostra che i polinomi irriducibili di R[x] sono soltanto i polinomi di primo e
di secondo grado; naturalmente, per ci`o che si `e visto
sulla risoluzione delle equazioni di secondo grado:
Corollario 5.18 I polinomi irriducibili di R[x] sono
(oltre alle costanti) tutti i polinomi di primo grado e
i polinomi di secondo grado ax2 + bx + c per i quali
si ha: = b2 4ac < 0. Non vi sono in R[x] altri
polinomi irriducibili.
Unaltra conseguenza del teorema `e:
Corollario 5.19 Un polinomio p(x) R[x] di grado
dispari ha almeno una soluzione reale.
Questo risultato pu`o essere molto utile nella risoluzione delle equazioni a coefficienti reali, specialmente
quelle di terzo grado. Queste, infatti, trovata la radice reale possono essere ridotte di grado usando
la regola di Ruffini, e tale riduzione porta a unequazione di secondo grado, le cui soluzioni possono
essere reali (se il discriminante 0) o complesse
coniugate per il Teorema 5.16: potranno comunque
essere trovate col Teorema 5.10 oppure col Teorema
5.21 che vedremo nella prossima sezione. Il punto,
allora, `e: come si determina la radice reale? Due casi
interessanti sono i seguenti:

5.7. EQUAZIONI DI GRADO SUPERIORE


lequazione `e reciproca, cio`e della forma ax3 +
bx2 +bx+a = 0 oppure ax3 +bx2 bxa = 0. Nel
primo caso ha la soluzione x = 1, nel secondo
la soluzione x = 1, come si verifica direttamente;
se lequazione ha coefficienti interi e ammette
una radice razionale, questa pu`o essere trovata
col metodo di Eisenstein (Teorema 5.8). Abbiamo proprio visto lesempio 27x3 + 6x 12 =
0.
Considerazioni analoghe valgono per le equazioni
di quinto grado.

5.7

Equazioni di grado superiore

Affrontiamo in questa sezione il problema della risoluzione delle equazioni di grado superiore al secondo.
Alcune situazioni particolari possono essere trattate
agevolmente con metodi ad-hoc:
si dicono biquadratiche le equazioni del tipo ax4 +
bx2 + c = 0. Ponendo y = x2 esse si riducono ad
equazioni di secondo grado che sappiamo
risolvere. Se `e una soluzione, si ha x = e quindi
dobbiamo avere 0 se vogliamo soluzioni reali. Ad esempio, lequazione x4 x2 12 = 0 si
trasforma in y 2 y 12 = 0, con le soluzioni
y = 4 ed y = 3; questivalori danno luogo alle
due soluzioni reali x = 4 = 2
e alle soluzioni
complesse immaginarie x = i 3;

155
il giunto cardanico) non scopr` proprio niente e si divertiva pi`
u a fare il medico e il mago che non a fare il
matematico. Il metodo di risoluzione delle equazioni
di terzo grado sembra sia dovuto a Scipione del Ferro,
che in punto di morte lo rivel`o a un suo allievo. Le
formule furono pi`
u tardi riscoperte da Niccol`o Tartaglia che le rivel`o a Cardano. Il metodo di risoluzione
delle equazioni di quarto grado fu scoperto da Ludovico Ferrari, segretario di Cardano, al quale le pass`o.
Nessuno, invece, nonostante ripetuti e approfonditi
studi, riusc` a trovare formule risolutive per le equazioni di grado superiore. Si cominci`o allora a pensare che soluzioni generali per tali equazioni potessero
non esistere. Che questo fosse il caso, fu dimostrato
finalmente da Evariste Galois nel 1832, in una nota
scritta la sera prima di morire in duello, allet`a di 21
anni. La forma esatta del risultato di Galois `e: per
le equazioni algebriche di grado superiore al quarto
non esistono formule risolutive nelle quali compaiano
solamente le quattro operazioni di base e lestrazione
di radici. Di solito, si abbrevia questa affermazione
dicendo che le equazioni di grado superiore al quarto
non sono risolubili per radicali. Naturalmente, esistono metodi numerici per trovare anche le soluzioni
di queste equazioni, con approssimazioni spinte quanto si vuole: tali metodi verranno accennati in questa
sezione e saranno studiati durante i corsi universitari.
Consideriamo una semplice equazione di secondo
grado, ad esempio x2 + x 6 = 0; sfruttando il fatto che, per il Teorema 5.11, il prodotto delle radici
deve essere 6 e la loro somma 1, vediamo subito che le soluzioni sono x1 = 3 e x2 = 2. Se ora
operiamo una trasformazione della nostra incognita,
ponendo ad esempio x = X + 1, otteniamo una nuova
equazione:

si dicono trinomie le equazioni del tipo ax2k +


bxk +c = 0. Analogamente a quanto fatto prima,
si pone y = xk riportandosi a unequazione di

(X + 1)2 + (X + 1) 6 =
secondo grado; questa volta abbiamo x = k y

se k `e pari, e x = k y se k `e dispari. Ad esempio,


6
3
= X 2 + 2X + 1 + X + 1 6 = X 2 + 3X 4.
x 7x 8 = 0 si risolve ponendo y = x3 e
trovando
y = 1 e y = 8, quindi Questa nuova equazione ha come radici X = 4
le due soluzioni
x = 3 1 = 1 e x = 3 8 = 2;
e X = 1. Potevamo prevedere facilmente questo
si dicono reciproche le equazioni del tipo axn + risultato, poiche la trasformazione si scrive anche:
bxn1 + cxn2 + + cx2 + bx + a = 0 (I specie) X = x 1 e deve valere anche per la radici, che non
oppure axn +bxn1 +cxn2 + cx2 bxa = 0 sono altro che particolari valori, quelli che rendono
(II specie). Si verifica immediatamente che se vera lequazione. Ma allora si deve avere X1 = x1 1
`e una radice, allora anche 1/ `e tale. Abbiamo e X2 = x2 1, come infatti si `e verificato. Ocvisto il caso n = 3 e per x4 2x3 + 34 x2 2x+1 = corre stare attenti a come opera la trasformazione
0, sostituendo, si vede subito che sia 2, sia 1/2 x = X + : se conosciamo una soluzione x1 dellequazione di partenza, la soluzione dellequazione trasono soluzioni.
sformata `e X1 = x1 ; ma se conosciamo X1 , si ha
ovviamente:
x1 = X + .
Durante il 1500, alcuni matematici italiani scoprirono formule e algoritmi per la risoluzione delle equaLe trasformazioni di questo tipo, dette trasformazioni algebriche di terzo e di quarto grado. Il tutto zioni lineari sono necessarie in Geometria Analitica
`e riportato nel libro Ars Magna di Gerolamo Car- quando si voglia cambiare sistema di riferimento. In
dano del 1545. Tuttavia, Cardano (al quale si deve Algebra sono utili se semplificano la risoluzione di

156
una equazione. Ad esempio, se riuscissimo ad eseguire una trasformazione che annulla il termine noto,
almeno una soluzione sarebbe X0 = 0, e quindi, se abbiamo operato la trasformazione x = X + , sapremmo immediatamente che una soluzione dellequazione
di partenza era x0 = X0 + = . Per la regola di
Ruffini, ci`o consentirebbe di abbassare di grado lequazione di partenza, e quindi semplificare il nostro
problema. Purtroppo la cosa non `e banale, ma esiste una semplice trasformazione che ci permetter`a di
dare una seconda prova della formula risolutiva delle
equazioni di secondo grado e, soprattutto, ci consentir`a di risolvere le equazioni di terzo e di quarto grado.
Formuliamo e dimostriamo allora:

CAPITOLO 5. ALGEBRA
Operiamo ora la trasformazione del lemma 5.20 con
n = 2 e ponendo x = X b/(2a):

b
X
2a

b
+
a

b
c
b2 4ac
X
+ = X2
= 0.
2a
a
4a2

Questo significa:
X2 =

b2 4ac
.
4a2

Il denominatore 4a2 `e sempre positivo, per cui se b2


4ac > 0 si hanno le due soluzioni:

b2 4ac
X=
2a

Lemma 5.20 Data lequazione xn +bxn1 +cxn2 +


+ d = 0, la trasformazione x = X b/n annulla il da cui discende la formula operando la trasformazione
coefficiente del termine di grado n 1 e lequazione x = X b/(2a). In modo analogo si procede quando
diviene X n + c X n2 + + d = 0.
= 0, mentre se < 0 le soluzioni per X sono
due valori immaginari opposti; la trasformazione li
Prova: Supporre che il coefficiente di xn sia 1 non
cambia allora in due numeri complessi coniugati:
`e restrittivo, perche se fosse a 6= 0 e a 6= 1 potremp
mo dividere tutta lequazione per a. Eseguendo la
|b2 4ac|
b
x= i
trasformazione e applicando la regola del binomio di
2a
2a
Newton, il membro sinistro diviene:
come si voleva.

n
n1
n2
b
b
b
X
+b X
+c X
++d =
Vediamo allora come si risolvono le equazioni di
n
n
n
terzo grado. Usando il teorema sulle trasformazioni,
facciamo scomparire il termine in x2 , per cui possiab n1 n(n 1) b2 n2
n1
n
+
X
+ + bX
+ mo senzaltro considerare unequazione della forma
= X n X
n
2
n2
x3 = px + q; questa si dice lequazione ridotta delb n2
n2
lequazione originale. Cerchiamo ora le soluzioni del
+b(n 1) X
+ + cX
+ + d =
n
tipo x = u + v, dove u e v sono due quantit`a incon2
n2
n n 1 2 n2 n 1
gnite.
Questo sembra complicare le cose, ma facendo
b X
+
bX
+cX
+ +d.
=X +
2n
n
i conti e applicando la regola del binomio di Newton
Questa espressione ci d`a anche il valore di c , e ci per la terza potenza, abbiamo:
potrebbe dare il valore di tutti gli altri coefficienti,
u3 + 3u2 v + 3uv 2 + v 3 = p(u + v) + q
ma questo non `e importante come il fatto che sia
n1
sparito il termine in X
.
u3 + v 3 + (3uv p)(u + v) = q.
Vediamo allora come questo lemma ci permetta di
dare una dimostrazione alternativa della formula per Qui ora possiamo sfruttare il fatto che u e v sono numeri qualsiasi e li possiamo scegliere con una qualche
la risoluzione delle equazioni di secondo grado:
libert`a; ad esempio, possiamo far s` che il termine con
Teorema 5.21 Sia ax2 + bx + c = 0 una qualunque (u + v) scompaia, e per far ci`o basta che sia 3uv = p.
equazione di secondo grado in forma canonica. Le Allora (u + v) `e una soluzione della nostra equazione
sue soluzioni sono:
se abbiamo contemporaneamente:

2
2
b + b 4ac
b b 4ac
uv = p/3
x1 =
x2 =
.
2a
2a
u3 + v 3 = q.
se > 0 sono distinte. Se = 0 si ha la soluzione
Ricavando u dalla prima equazione e sostituendolo
x0 = b/(2a) con molteplicit`
a 2, mentre se < 0
nella seconda si trova:
lequazione ha due soluzioni complesse coniugate.
p3
Prova: Dividendo lequazione per a, essa diventa:
=q
u3 +
27u3
c
b
x2 + x + = 0.
27u6 27qu3 + p3 = 0.
a
a

5.7. EQUAZIONI DI GRADO SUPERIORE


Sostituiamo ora U ad u3 ; si ha una semplice
equazione di secondo grado:

157

distanti, y1 e y2 , possiamo immaginare, almeno in linea teorica, di trovare due valori di x, diciamo x1 e
x
2 , tali che y1 = p(x1 ) e y2 = p(x2 ), e questi valori
27U 2 27qU + p3 = 0
di x saranno vicini tra di loro. Possiamo disegnare il
grafico della funzione y = p(x) su un foglio di carta
che sappiamo risolvere. Questa equazione si dice la
millimetrata, considerando diversi valori di x, diciarisolvente dellequazione di terzo grado, e ci d`a:
mo x1 , x2 , . . . , xn , e calcolando i corrispondenti valori
r
p
della y, cio`e y1 = p(x1 ), y2 = p(x2 ), . . . , yn = p(xn ).
q
p3
q2
27q 729q 2 108p3
=
.
U=
Lavorando con valori discreti x1 , x2 , . . . , xn , il grafico
54
2
4
27
sar`a costituito da punti, ma losservazione precedenNaturalmente, se avessimo ricavato u dalla 3uv = te ci fa intuire che possiamo unire i punti ottenuti
p, avremmo ottenuto esattamente la stessa soluzio- cos` da rappresentare, in modo continuo, tutti i valori
ne, per cui possiamo arbitrariamente associare ad u3 di y corrispondenti ai valori di x, almeno nellinterla soluzione con il segno positivo e a v 3 quella con vallo finito che la carta millimetrata ci permette di
il segno negativo. Dalla x = u + v abbiamo infine tabulare.
la sospirata soluzione dellequazione ridotta di terzo
Le radici dellequazione corrispondono ai valori delgrado:
la x per cui si ha p(x) = 0, cio`e ai punti in cui la curva
s
s
attraversa la base delle nostre computazioni, cio`e la
r
r
3
2
3 q
3 q
p
p3
q
q2
linea y = 0; nella figura questi punti sono compresi in
+

.
x=
2
4
27
2
4
27
due intervalli, il primo che va da 2 a 1, il secondo
che va da 0 ad 1. Questo significa che se a sinistra
Ora, facendo allindietro la trasformazione che ci ha di una radice il valore di p(x) `e positivo, a destra deportato alla forma ridotta, si trova la soluzione del- ve essere negativo, e viceversa. Tale osservazione ci
lequazione originale, cio`e dellequazione generale di permette di fare unasserzione fondamentale: se per
terzo grado, da cui siamo partiti.
due valori x1 e x2 con x1 < x2 si ha che p(x1 ) e p(x2 )
Come abbiamo detto, esistono formule risolutive hanno segni opposti, allora deve esistere almeno una
anche per le equazioni di quarto grado, ma non in- radice compresa tra x ed x . Naturalmente, fra x e
1
2
1
tendiamo addentrarci ulteriormente in questa giungla x ce ne potrebbero essere anche 3 o 5 o pi`
u, ma que2
di formule. In effetti, il problema della ricerca delle sto non muta il senso dellosservazione. Si badi bene
soluzioni di unequazione algebrica, se affrontato op- che dallosservazione NON discende che se p(x ) e
1
portunamente, non `e poi complicato come sembra, p(x ) hanno lo stesso segno, allora non esiste alcu2
purche si abbandoni lidea di trovare una formula na radice compresa tra x e x : basta ricordarsi del
1
2
che esprima tali soluzioni. Pu`o anche essere diverten- valore della contropositiva e della contraria di una
te programmare su un elaboratore il metodo che ora proposizione. Nellesempio, p(2) = p(1) = 1, ma
andiamo a descrivere; esso non `e certamente il meto- fra 2 e 1 vi sono ben due radici (comunque, in quedo migliore che si conosca, ma certo `e il pi`
u elemen- sta situazione, le radici possono solo essere in numero
tare e diretto. Per chi non sa usare la programmazio- pari: 0, 2, 4, etc.).
ne, sar`a utile fare un po di conti a mano, aiutati da
Una volta, il primo passo per trovare le radici conun calcolatore tascabile; anzi, anche chi vuol tentare
sisteva
proprio nel disegnare il grafico di p(x) e deterdi automatizzare il metodo, `e bene che cominci con
minare
gli intervalli di separazione delle varie radici,
qualche elaborazione manuale, per cercare di capire
cio`
e
gli
intervalli [x1 ..x2 ] che isolano ciascuna radice.
fino in fondo cosa si sta facendo.
Questo
procedimento non pu`o essere portato avanti
Prima di tutto, prendiamo il polinomio che deterdallelaboratore,
ma lo si pu`o simulare in vari modi.
mina lequazione e usiamolo come formula, cio`e come
Ad
esempio,
si
pu`
o valutare p(x) per valori interi di
espressione che, dato un valore specifico della variabix
o
per
valori
che
siano potenze di 2, restringendo
le x, permette di calcolare il valore y del polinomio nel
2
poi
tali
intervalli
se
nulla si `e riusciti a trovare. Nel
punto x. Ad esempio, dallequazione x + x 1 = 0,
2
caso
che
il
polinomio
p(x) abbia grado dispari, un inconsideriamo lespressione y = x + x 2 che, posto
2
tervallo
di
separazione
si trova sempre; infatti, per
x = 1, ci d`a il valore y = 1 + 1 1 = 1, e posto
2
valori
molto
grandi
in
valore
assoluto, ma positivi e
invece x = 2 ci d`a y = 2 + 2 1 = 5. E questa la
negativi,
p(x)
deve
assumere
per forza valori di senotazione funzionale y = p(x); x si dice la variabile
gno
diverso.
Il
caso
del
grado
pari `e pi`
u complesso e
indipendente ed y la variabile dipendente. E bene
una
tale
equazione
potrebbe
anche
non
avere alcuna
osservare che se prendiamo due valori vicini tra di
2
radice
reale,
come
succede
a
x
+
1
=
0.
loro, ad esempio x1 = 1 e x2 = 1.01, i corrisponSupponiamo allora di essere riusciti a trovare un
denti valori della y sono ancora vicini tra di loro. E
viceversa, se partiamo da due valori di y non molto intervallo [x1 ..x2 ] che separi (almeno) una radice; per

158

CAPITOLO 5. ALGEBRA

4
3
2
1
-3

-2

-1 0

Figura 5.4: La parabola y = x2 + x 1


fissare le idee, immaginiamo che sia p(x1 ) < 0 e
p(x2 ) > 0. Consideriamo ora il punto di mezzo di
tale intervallo, x3 = (x1 + x2 )/2 e calcoliamo p(x3 );
se esso `e positivo, allora losservazione di partenza ci
dice che una radice deve essere compresa nellintervallo [x1 ..x3 ], se invece `e negativo, la radice sar`a in
[x3 ..x2 ]. Qualunque sia lintervallo, possiamo iterare
il procedimento e restringerci ad intervalli sempre pi`
u
piccoli. Se siamo partiti con [x1 ..x2 ] ed x2 = x1 + 1
(come spesso accade), allora x1 `e unapprossimazione
per difetto della soluzione, e x2 ne `e unapprossimazione per eccesso. Dimezzando lintervallo ad ogni
iterazione, occorrono dieci iterazioni per avere un intervallo di circa 1/1000, cio`e per aver trovato tre cifre
decimali della soluzione. Naturalmente il calcolatore
pu`o eseguire tante iterazioni quante se ne vogliono in
tempi del tutto trascurabili. Ad esempio, cinquanta
iterazioni corrispondono ad un intervallo di lunghezza 250 1015 , il che vuol dire avere circa quindici
cifre decimali esatte.

tradizionale, si trova essere ( 5 1)/2 0.618034.


Facendo i conti a mano, pu`o essere preferibile (pi`
u
per ragioni psicologiche che altro) determinare una
cifra decimale dopo laltra. Riprendendo lesempio
precedente, scoperto lintervallo di separazione [0..1],
sappiamo che la soluzione avr`a la forma 0.d1 d2 d3 . . .
e possiamo scoprire d1 calcolando il polinomio nei
punti 0.1, 0.2, 0.3, . . . , 0.9. In particolare, si trova
p(0.6) = 0.04 e p(0.7) = 0.19, il che restringe lintervallo a [0.6..0.7]. Si continua, calcolando
p(x) nei punti 0.61, 0.62, . . . , 0.69, per i quali si ha
p(0.61) = 0.0179 e p(0.62) = 0.0044. Si `e cos` ottenuto lintervallo [0.61..0.62] che gi`a ci fa intravedere
il risultato finale.
Questa tecnica decimale `e probabilmente un po
pi`
u intuitiva, ma richiede un numero maggiore di operazioni per arrivare alla stessa precisione della precedente. Si osservi infatti che per avere la precisione
di un centesimo abbiamo calcolato p(x) in nove punti
diversi, cio`e da 0.1 a 0.7 e poi 0.61 e 0.62. Col metodo
binario, 9 operazioni permettono di ridurre lintervallo a 1/512, cio`e a un intervallo pi`
u piccolo di oltre 5
volte. Con un po di esperienza, si pu`o ottimizzare il metodo; ad esempio, poiche p(0.61) = 0.0179
e p(0.62) = 0.0044, cos` che lapprossimazione a 0 `e
migliore per 0.62, `e probabile che il decimale successivo sia superiore a 5. Allora, invece di cominciare i
calcoli da 0.611 si pu`o cominciare direttamente con
0.615, e questo porta un bel risparmio. A ben guardare, per`o, questo accorgimento `e un modo diverso
per introdurre dalla finestra il criterio binario che
avevamo appena scacciato dalla porta.
Il lettore si sar`a accorto che abbiamo gi`a utilizzato questa tecnica in varie occasioni, in particolare nella Sezione 3.6 Potenze, radici, logaritmi; in
realt`a, esso rappresenta un metodo molto generale.
In situazioni particolari pu`o essere migliorato, come
mostra, nella stessa sezione, il metodo iterativo per
calcolare la radice quadrata. Ci`o, tuttavia, non fa
perdere di interesse al metodo. Nei corsi di Calcolo Numerico, allUniversit`a, si studier`a il metodo di
Newton, o di Newton-Raphson, che funziona assai
meglio. Qualche volta anche noi, un po surrettiziamente, abbiamo avuto modo (e ne avremo ancora) di
citare e di applicare tale metodo. Tornando alla tecnica esposta sopra, il lettore pu`o inventarsi le proprie
equazioni e cercare di trovarne le soluzioni reali; questo sar`a un buon esercizio per capire i passi descritti,
scrivere poi un opportuno algoritmo e portarlo infine
sullelaboratore.

Come esempio (v. Figura 5.4), riprendiamo la precedente equazione e supponiamo di essere riusciti a
determinare lintervallo [0..1], cio`e x1 = 0 e x2 = 1;
corrispondentemente, si ha p(x1 ) = 1 e p(x2 ) = 2.
Calcolando il valore del polinomio per x3 = 1/2, si
trova p(x3 ) = 1/4, e perci`o la radice si deve trovare tra 1/2 ed 1. La divisione successiva ci porta
a x4 = 3/4 e si calcola p(3/4) = 0.3125; il nuovo intervallo `e [1/2..3/4]. Il passo ulteriore ci d`a
x5 = 5/8 e p(5/8) = 0.015; lintervallo si riduce
a [1/2..5/8]. Il nuovo passo permette di calcolare
x6 = 9/16 e p(9/16) = 0.12, cos` che lintervallo
`e [9/16..5/8] = [0.5625..0.625]. A questo punto il lettore pu`o andare avanti per conto proprio, considerando gli intervalli che man mano ottiene e i cui estremi 5.8
Algebra astratta
costituiscono unapprossimazione per difetto e per eccesso della soluzione. Per controllo, tali estremi van- Abbiamo visto come la parola algebra derivi dalno confrontati con la soluzione esatta che, col metodo larabo, nel quale sembra indicasse il trasferimento di

5.8. ALGEBRA ASTRATTA


un termine da un membro allaltro di una equazione. Pur cos` specifico, il termine era consono ad una
disciplina incentrata sulla soluzione dei problemi per
mezzo della manipolazione delle espressioni, in questo caso delle equazioni. Con Vi`ete, lAlgebra venne
ad inglobare tutte le manipolazioni formali di simboli, e quindi si contrappose alla Geometria, dominata
dal concetto di figura, e successivamente allAnalisi,
cio`e allo studio analitico delle funzioni. Lo studio delle equazioni impose, nella prima met`a dellOttocento
e, in modo pi`
u marcato, nella seconda, lintroduzione di strutture formali atte a comprendere il comportamento delle soluzioni di una data equazione o
di unintera classe di equazioni. Lesempio pi`
u eclatante `e costituito dalla permutazioni e dal loro uso,
come struttura di gruppo, nella dimostrazione della
non risolubilit`a per radicali delle equazioni algebriche di grado superiore al quarto. Ad un certo punto,
queste strutture hanno, per cos` dire, preso la mano agli algebristi, e le loro propriet`a si sono rivelate
importanti di per se e nei confronti di altri settori
della Matematica. Cos` si cominciarono a studiare le
strutture algebriche (cio`e insiemi muniti di operazioni) in modo indipendente da qualsiasi connessione numerica, come era invece implicito nellidea di
risoluzione delle equazioni. Questo studio `e stato
pertanto detto Algebra astratta ed oggi `e diventato uno dei settori fondamentali della Matematica,
dal quale nessun matematico pu`o prescindere. Daltra parte, i successi ottenuti dallAlgebra astratta in
tanti campi applicativi, dalla cristallografia alla fisica atomica e subatomica, alla biologia, hanno fatto
s` che alcuni suoi concetti siano diventati patrimonio
comune di tutta la scienza.
Alla base dellAlgebra astratta, sta, come abbiamo detto, il concetto di struttura algebrica; si intende
con questa espressione un insieme S, detto il sostegno della struttura, munito di una o pi`
u operazioni
(si veda il primo Capitolo), caratterizzate da alcune
propriet`a formali, come la chiusura, lassociativit`a o
la commutativit`a.
Come abbiamo visto nella Sezione ??, la struttura
algebrica pi`
u semplice `e il monoide, ma certamente quella pi`
u importante `e il gruppo. Abbiamo gi`a
incontrato vari esempi di gruppo, ma rivediamo qui
le situazioni pi`
u caratteristiche. I numeri interi con
loperazione di somma, cio`e (Z, +), `e un gruppo nel
quale e = 0 e linverso di x `e x; in questo caso si
preferisce parlare di opposto, piuttosto che di inverso,
ma il concetto `e quello. Linsieme dei numeri razionali positivi con loperazione di moltiplicazione, cio`e
(Q+ , ), nel quale lidentit`a `e 1 e linverso di x `e x1 ,
cio`e proprio linverso in senso tradizionale. Questi sono due esempi di gruppi commutativi o abeliani, visto
che vale anche la propriet`a commutativa. Questa non

159
vale invece per le permutazioni Pn su {1, 2, . . . , n} con
loperazione di composizione, cio`e (Pn , ), come si `e
visto nel Capitolo 4. Storicamente, questo `e stato il
primo esempio di gruppo finito e non commutativo, e
fu introdotto da Ruffini e da Abel nei loro studi sulla
non risolubilit`a per radicali delle equazioni di grado
superiore al quarto. Le rotazioni intorno a un punto e le traslazioni del piano costituiscono un gruppo
quando si consideri loperazione di composizione, cio`e
loperazione che esegue una trasformazione dopo laltra. E interessante prendere una figura e un punto
sul piano della figura, e considerare poi le rotazioni
che trasformano a figura in se stessa: si provi con un
quadrato, un rettangolo o un poligono regolare e il
relativo centro. Questo ci fa capire perche il centro
si chiama in questo modo.
Nel Capitolo 2 sullAritmetica abbiamo trovato altri esempi di gruppo finito: linsieme Zm dei numeri {0, 1, . . . , m 1} con loperazione x y = x + y
(mod m), e linsieme Zm , dei numeri minori di m e
primi con m con loperazione xy = xy (mod m).
Le propriet`a l`a messe in evidenza non servivano ad
altro se non a dimostrare le propriet`a di gruppo di tali strutture. Ritorneremo tra breve su questi esempi,
quando parleremo di gruppi finiti.
Noi non possiamo addentrarci nella meravigliosa
teoria dei gruppi, ma val la pena di dimostrare un
risultato astratto di notevole interesse. Un sottoinsieme H di un gruppo G si dice un sottogruppo di
G se `e esso stesso un gruppo con loperazione definita in G. Questo modo di esprimersi `e formalmente
scorretto e dovremmo dire: se H `e un sottoinsieme
del sostegno di un gruppo (G, ) e . . .; naturalmente,
si preferisce la forma pi`
u snella. Un semplice esempio di sottogruppo di (Z, +) `e dato dai numeri pari,
cio`e {. . . , 4, 2, 0, 2, 4, . . .}, che costituisce un sottogruppo di (Z, +). I numeri pari sono i multipli di
2; si vede facilmente che linsieme dei multipli di k
(k fissato, multipli positivi e negativi) sono un sottogruppo di (Z, +). Se prendiamo una permutazione
Pn e tutte le permutazioni che da essa si ottengono eseguendo i prodotti 2 = , 3 = 2 ,
etc., vediamo subito che esse sono un sottogruppo di
(Pn , ). Sia infatti P = {, 2 , 3 , . . .} e osserviamo
prima di tutto che esso `e finito; infatti P Pn per la
chiusura della composizione, e quindi card(P ) n!.
Sia ora r la prima potenza che si ripete; necessariamente, deve essere r = , poiche se cos` non fosse
avremmo r = s , con s 1. Ma se 1 `e linverso
di avremmo 1 r = 1 s , cio`e r1 = s1 ,
contro lipotesi che r fosse la prima potenza a ripetersi. Se allora r = , componendo ancora con
1 si ha r1 = I, lidentit`a, che pertanto appartiene a P . Finalmente, se i , j P , anche il loro prodotto i j = i+j sta in P ; in particola-

160

CAPITOLO 5. ALGEBRA

re, dato i , la potenza ri1 `e tale che il prodotto


i ri1 = r1 = I, cio`e i e ri1 sono linverso luna dellaltra. Ci`o significa che (P , ) `e un
sottogruppo di (Pn , ). Esso si dice il (sotto)gruppo
ciclico generato da e si indica con hgi. In P4 il sottogruppo ciclico generato da = (1234) `e costituito
dalle permutazioni:

g2 H, diciamo g2 h e mostriamo che esso sta anche in


g1 H. Usando la precedente espressione per g2 si ha:

hki = { , 2k, k, 0, k, 2k, }.

x(m) = xkr = (xr )k = 1k = 1,

g2 h = g1 h1 h1
2 h g1 H

in quanto h1 h1
a di chiusura
2 h H per la propriet`
in H. Naturalmente, in modo del tutto analogo, si
dimostra che ogni elemento di g1 H sta anche in g2 H
e quindi g1 H = g2 H come si voleva. Di conseguenza,
2
3
4
= (1234), = (13)(24), = (1432), = I.
gli insiemi gH determinano, al variare di g, una partiConvenzionalmente, si pone 0 = I e quindi r1 = zione di G (a g diversi, si noti, possono corrispondere
0 = I. In generale, il minimo numero k per il qua- gH uguali), ogni parte composta dallo stesso numero
le un elemento g G dia g k = e, si dice periodo di elementi, cio`e proprio m. Se le parti sono k, di
deve perci`o avere n = mk.
dellelemento g. Il periodo di `e pertanto r 1.
Se il gruppo G `e infinito, pu`o contenere sottogruppi
Il caso precedente di P , che ha 4 elementi, `e un
finiti o infiniti; ad esempio, (Q+
0 , ) contiene il sotto- esempio di questo risultato. In generale, possiamo
gruppo finito {1, 1} e il sottogruppo infinito com- enunciare il seguente:
posto da tutte le potenze (positive e negative) del
numero 5: {. . . , 52 , 51 , 50 = 1, 5, 52 , . . .}. Questo Corollario 5.23 Se (G, ) `e un gruppo finito e g
`e, in effetti, il sottogruppo ciclico h5i; nel caso in- G, il periodo di g `e un divisore di card(G).
finito, il sottogruppo ciclico deve contenere tanto le Prova: Il periodo di g coincide, per quanto detto,
potenze positive quanto quelle negative del suo gene- con il numero di elementi del sottogruppo generato
ratore. Un gruppo (G, ) si dice ciclico se esiste un da g, e questo `e un divisore di card(G).
elemento g G che genera tutto il gruppo. Ad esemUn esempio importante di questo corollario `e dato
pio, (Z, +) `e generato dal numero 1; si osservi che in
dai
gruppi (Zm , ), la moltiplicazione intesa modulo
questo caso, essendo la somma loperazione del grup(m) elementi e quindi
po, le potenze sono in realt`a i multipli. Il lettore `e m. Tali gruppi contengono

invitato a dimostrare che i sottogruppi di un gruppo ogni elemento x Zm ha come periodo un numero
ciclico sono anchessi ciclici. Nellesempio di (Z, +) si che divide (m) (diciamo r); si ha pertanto kr =
(m), per qualche intero k. Ma allora:
ha:
Una delle pi`
u interessanti propriet`a dei gruppi finiti
un risultato che abbiamo sfruttato parlando dei
`e data dal seguente:
metodi di ciframento a chiave pubblica.
I gruppi sono probabilmente la struttura algebrica
Teorema 5.22 (di Lagrange) Se (G, ) `e un gruppi`
u
importante, e sono stati studiati in modo molto
po finito ed H `e un sottogruppo di G, allora il numeapprofondito.
Inoltre, sul concetto di gruppo si basaro degli elementi di H `e un divisore del numero degli
no
altre
strutture
algebriche che si avvicinano magelementi di G.
giormente alle strutture numeriche pi`
u familiari. PriProva: Sia n = card(G) ed m = card(H); sia g G ma di tutto, definiamo cosa si intende per anello;
e consideriamo linsieme gH composto da tutti i pro- si parte da un insieme A e si suppone che in A siano
dotti di g per gli elementi di H; esiste allora una definite due operazioni, indicate convenzionalmente
corrispondenza biunivoca tra H e gH data dalla fun- con + (laddizione) e con (la moltiplicazione),
zione h gh, h H. In effetti, essa `e surget- questultima scritta spesso con la semplice giustappotiva per definizione e se non fosse iniettiva dovrem- sizione. La struttura algebrica (A, +, ) si dice anello
mo avere due elementi distinti h1 , h2 H tali che se (A, +) `e un gruppo commutativo, (A, ) `e un mogh1 = gh2 ; se cos` fosse, moltiplichiamo per g 1 ot- noide commutativo e vale la propriet`a distributiva del
tenendo g 1 gh1 = g 1 gh2 , cio`e eh1 = eh2 e h1 = h2 , prodotto rispetto alla somma, cio`e: x, y A si ha
u importante
contro lipotesi. Daltra parte, se g1 , g2 sono due ele- x (y + z) = x y + x z. Lesempio pi`
menti di G, gli insiemi g1 H e g2 H o coincidono op- di anello `e sicuramente (Z, +, ), con le usuali operapure sono disgiunti. Supponiamo infatti che g1 H e zioni di somma e prodotto, ma sono anelli anche gli
g2 H non siano disgiunti; hanno allora almeno un ele- altri insiemi numerici (Q, +, ), (R, +, ), (C, +, ). Si
mento in comune, diciamo g1 h1 = g2 h2 (notare che tratta per`o di casi un po particolari, e per questo ne
u avanti. Altri anelli importanti sono
h1 e h2 possono benissimo essere distinti). Ma questo riparleremo pi`
significa g2 = g1 h1 h1
2 , ottenuto moltiplicando i due costituiti dai polinomi, con le operazioni che conomembri per h1
2 . Prendiamo ora un altro elemento di sciamo; essi si indicano con (Z[x], +, ), (Q[x], +, ),

161

5.8. ALGEBRA ASTRATTA


+
0
1
2
3
4
5

0
0
1
2
3
4
5

1
1
2
3
4
5
0

2
2
3
4
5
0
1

3
3
4
5
0
1
2

4
4
5
0
1
2
3

5
5
0
1
2
3
4

0
1
2
3
4
5

0
0
0
0
0
0
0

1
0
1
2
3
4
5

2
0
2
4
0
2
4

3
0
3
0
3
0
3

4
0
4
2
0
4
2

5
0
5
4
3
2
1

Tabella 5.2: Somma e prodotto in Z6


e cos` via. Unaltra classe importante di anelli e data dagli (Zm , +, ), dove, questa volta, la somma e il
prodotto vanno intesi modulo m; poiche questi anelli sono finiti, le operazioni possono essere riassunte
in due tabelline; riportiamo nella Tabella 5.2 il caso
di (Z6 , +, ) e il lettore `e invitato a scrivere almeno
quelle relative ad m = 5.
Un caso particolare di anello `e il seguente; sia U un
insieme e sia P = P(U ) linsieme delle sue parti, cio`e
dei suoi sottoinsiemi. In P si consideri loperazione
di differenza simmetrica AB = (A B) \ (A B) =
(A \ B) (B \ A) (v. Capitolo 1); tale operazione `e chiusa e associativa, come il lettore vorr`a verificare con i diagrammi di Venn. Si ha inoltre:
A = A = A, qualunque sia A P, e questo
ci dice che `e lidentit`a rispetto a . Si ha anche
AA = ed AB = BA, per cui (P, ) `e un
gruppo commutativo. Consideriamo ora loperazione
di intersezione in P; rispetto a tale operazione P `e
un monoide e si ha:
A (BC) = (A B)(A C),

(qualunque esso sia), si ottiene 0 = x 0. In modo


analogo si prova 0 = 0 x. Un elemento di A pu`o avere o pu`o non avere un inverso rispetto al prodotto; in
(Z6 , +, ) gli elementi 1 e 5 hanno un inverso, come
si vede dalla Tabella 5.2, mentre non lo hanno 2, 3
e 4. Gli elementi muniti di inverso si dicono unit`
a
dellanello; lo 0 non pu`o essere ununit`a poiche, come abbiamo appena visto, 0 x d`a sempre 0, mentre
se x fosse linverso di 0 si dovrebbe avere 0 x = 1.
Daltra parte, 1 `e per definizione una unit`a, e questo
ci fa capire che, in un anello, lo 0 e l1 non possono mai coincidere (eccetto nellanello banale, quello
composto dal solo elemento 0: riflettere un attimo).
Un elemento che, come 2, 3, 4 in Z6 , d`a come prodotto 0 anche quando sia moltiplicato per un numero
diverso da 0, si dice un divisore dello zero: poiche lo
0 non pu`o avere un inverso rispetto alla moltiplicazione, cos` non lo possono avere nemmeno i divisori
dello zero; pertanto, la presenze in un anello di divisori dello zero fa s` che certe semplificazioni, legate a
moltiplicare per linverso di un elemento (come siamo
abituati), non si possano fare. Ha allora importanza
il concetto di dominio di integrit`
a, col quale termine
si indica un anello privo di divisori dello zero. Ancora (Z, +, ), (Z[x], +, ), (R[x], +, ) sono domini di
integrit`a nei quali non tutti gli elementi diversi da 0
sono unit`a. Ad esempio, in Z solo 1 e 1 sono unit`a,
mentre in R[x] sono unit`a tutte le costanti diverse da
0, cio`e, in pratica, R \ {0}. Vediamo allora dove si
manifesta limportanza dei domini di integrit`a.
Si dice campo o corpo ogni anello nel quale tutti gli
elementi, tranne lo 0, sono unit`a, cio`e ogni elemento
diverso da 0 possiede un inverso (rispetto alla moltiplicazione). Sono campi infiniti (Q, +, ), (R, +, ),
(C, +, ), ma esistono anche molti campi finiti; tutti
gli (Zp , +, ) (somma e prodotto modulo p), con p numero primo sono campi. Infatti, Zp \ {0} = Zp , che
come sappiamo `e un gruppo rispetto alla moltiplicazione, il che vuol proprio dire che ogni elemento non
nullo ha un inverso. Il pi`
u importante di questi campi `e Z2 = {0, 1} (toh! chi si incontra di nuovo!), che
oltre ad essere un campo `e anche un anello Booleano.
Col significato 1 =vero e 0 =falso lo abbiamo gi`a
visto in azione nel calcolo delle proposizioni e dei predicati. I campi sono la struttura algebrica che compendia le propriet`a degli insiemi numerici pi`
u ampi, e
cio`e Q, R, C; da qui la loro fondamentale importanza.
Certi campi si costruiscono a partire dai domini di
integrit`a, che perci`o costituiscono dei quasi-campi:

ancora da verificare con i diagrammi di Venn. La


conclusione `e che (P, , ) `e un anello, detto anello
Booleano. Il lettore `e invitato a consultare le Tabelle 1.1, 1.3, 2.5 e la fine della Sezione 2.7 sul Massimo Comun Divisore per trovare altri esempi di anelli
Booleani.
Quando si parla di anelli, lidentit`a rispetto alla
somma si indica con 0 e quella relativa al prodotto
con 1. Formalmente, si ha x 0 = 0 x = 0, qualunque
Teorema 5.24 Sia D un dominio di integrit`
a e sia
sia lelemento x A; infatti:
D linsieme delle coppie di elementi di D il cui secondo elemento non sia 0. La relazione (x, y) (x , y )
x 0 = x (0 + 0) = x 0 + x 0,
valida se e solo se xy = x y, `e una relazione di equidove si sono sfruttate le propriet`a dellanello; som- valenza su D. Sia allora [x, y] la classe di equivalenza
mando ora ai due membri estremi lopposto di x 0 di (x, y) ed F linsieme di tali classi di equivalenza;

162

CAPITOLO 5. ALGEBRA

se definiamo su F le operazioni:
[x, y] + [x , y ]
[x, y] [x , y ]

=
=

[xy + x y, yy ]
[xx , yy ]

allora tali operazioni sono indipendenti dagli elementi presi a rappresentare le classi ed (F, +, ) `e un
campo.
Prova: La prova di questo teorema, in realt`a, `e
gi`a stata fatta quando abbiamo costruito il campo
(Q, +, ) a partire dal dominio di integrit`a (Z, +, ) e
il lettore potr`a ripetere i passi l`a effettuati astraendo dal caso numerico e concentrandosi sulle sole
propriet`a formali definite in D, D ed F.
Partendo da (Z[x], +, ) e da (R[x], +, ) si costruiscono i due campi delle funzioni razionali fratte su Z e
su R, che si indicano rispettivamente con (Z(x), +, )
e (R(x), +, ). Nella sezione sui numeri complessi abbiamo visto un altro metodo per costruire un tipo
diverso di campi, il pi`
u importante dei quali `e certamente il campo dei numeri complessi. Esso consiste nellaggiungere uno (o pi`
u) elementi algebrici al
campo, in modo da rispettarne la definizione.

Capitolo 6

Geometria Euclidea
pubblicati testi che rivedevano limpostazione di Euclide secondo i nuovi criteri, anche se `e limpianto
Euclideo quello che si studia a tuttoggi.

Mandai il triangolo equilatero a Treviranus. Sapevo che lei avrebbe aggiunto il punto che mancava: il punto che determinava il rombo perfetto, il punto che prefissava il luogo dove unesatta
morte lattendeva.

6.1

J. L. Borges Finzioni

Secondo Aristotele la Geometria (cio`e la misurazione dei terreni) nacque in Egitto, dove ogni anno,
dopo le inondazioni del Nilo, era necessario ristabilire i confini dei campi, assegnare un nuovo terreno
a chi, eventualmente, avesse perduto il proprio, invaso in modo permanente dalle acque. Anche i Babilonesi coltivarono la Geometria, un po per ragioni
analoghe, ma assai di pi`
u per il loro interesse allAstronomia. Tuttavia, nessuno di questi popoli and`o
pi`
u in l`a delle considerazioni pratiche ed elementari,
necessarie ai loro intendimenti. Ad esempio, nessuno sent` mai il bisogno di dimostrare alcunche o di
speculare in forma astratta. Lo studio teorico della
Geometria cominci`o in Grecia e uno dei precursori fu
Talete (624 545 a.C.), il primo dei Sette Savi. Con
i Pitagorici si afferm`o anche il concetto di dimostrazione e al tempo di Platone (427 347 a.C.), che fu
un buon cultore di Geometria, le conoscenze teoriche
erano abbastanza ampie da costituire un corpus di
notevole rispetto. Fu per`o circa un secolo dopo che
la Geometria trov`o la sua sistemazione, in un certo
senso definitiva, con lopera di Euclide (sec. III a.C.)
Elementi. Certo, gli Elementi non costituiscono
la fine dello sviluppo della Geometria, che trover`a in
Archimede (287 212 a.C.) e Apollonio (262 180
a.C.) due altri grandi. Le scoperte si sono protratte fino ai nostri giorni, ma quel libro mostr`o come si
costruisce una teoria matematica, partendo dagli assiomi e edificando man mano un insieme organico di
conoscenze (teoremi e problemi) logicamente fondati
e perci`o incontrovertibili. Gli Elementi di Euclide
sono stati forse il libro pi`
u letto e pi`
u amato dopo la
Bibbia e hanno costituito la base dello studio della
Geometria fino al 1800. Con la revisione della Logica
operata in quel periodo (che port`o alla formulazione
delle Geometrie non Euclidee), cominciarono a venir

Le basi della Geometria

Euclide fonda la Geometria su 10 verit`a, che egli reputa evidenti di per se, e che quindi non richiedono
alcuna dimostrazione. Egli le divide in 5 assiomi (che,
ricordiamo, secondo Aristotele sono verit`a generali,
indipendenti dal sapere geometrico) e in 5 postulati (cio`e verit`a specifiche della materia in oggetto, la
Geometria):
Assiomi o nozioni comuni:

163

1. oggetti uguali a uno stesso oggetto sono uguali


tra loro;
2. se oggetti uguali vengono aggiunti ad oggetti
uguali, gli oggetti risultanti sono uguali tra loro;
3. se oggetti uguali vengono sottratti da oggetti
uguali, gli oggetti risultanti sono uguali tra loro;
4. oggetti che si possono sovrapporre e far
coincidere sono uguali tra loro;
5. lintero `e maggiore di ciascuna delle sue parti
proprie.
Postulati:
1. per due punti qualsiasi si pu`o tracciare una retta;
2. ogni segmento si pu`o prolungare indefinitamente;
3. su un piano si pu`o tracciare una circonferenza di
centro e raggio arbitrari;
4. tutti gli angoli retti sono uguali;
5. se due rette formano, con una retta che le interseca, da una stessa parte di questa, due angoli
la cui somma `e minore di due angoli retti, allora
le due rette, prolungate allinfinito, si incontrano
proprio da tale parte.

164

CAPITOLO 6. GEOMETRIA EUCLIDEA

Quando Euclide parla di punti, rette e piani, egli


ha in mente precise astrazioni degli analoghi concetti
concreti e crede che tali astrazioni siano non un semplice modello della realt`a, ma siano davvero la realt`a,
la sostanza rivelata del fenomeno concreto. Quindi,
gli assiomi servono solo ad evitare il regressum ad infinitum che si creerebbe se tentassimo di definire tutti
i concetti, il che richiederebbe di introdurne altri, e
poi ancora altri, e cos` via. Ma, a parte questo, gli
assiomi sono veri in senso semantico, cio`e sono veri
nella realt`a. Con laffermarsi della Logica moderna
questa idea `e venuta a cadere e gli assiomi della Geometria sono stati rivisitati, per far loro inglobare la
definizione implicita degli enti geometrici (punto, retta, piano) e delle loro reciproche relazioni. Volendo
vedere le cose da un punto di vista un po diverso,
mentre nella Geometria di Euclide le figure e le costruzioni geometriche hanno un ruolo fondamentale
nello sviluppo della teoria, nelle formulazioni moderne deve essere possibile derivare tutti i teoremi in modo puramente formale, cio`e utilizzando solo i simboli
(e i modi di metterli insieme) definiti dagli assiomi o
che man mano si introducono partendo da quelli.
Lassiomatizzazione pi`
u famosa della nuova Geometria `e quella di Hilbert, che elenca ben ventitre
postulati. Diamo qui una versione semplificata con
gli assiomi divisi in gruppi:
Assiomi di incidenza
1. due punti distinti, presi a piacere, appartengono a una retta e a una soltanto;
2. ad ogni retta appartengono almeno due
punti;
3. esistono due punti che non appartengono
alla stessa retta;

8. dati un segmento AB e una semiretta r di


origine C, esiste un unico punto D della
semiretta r tale che AB sia congruente a
CD (e si scrive AB = CD);
9. Se AB = CD ed AB = EF allora CD =
EF ; ogni segmento `e congruente a se stesso;
10. siano dati tre punti A, B, C su una retta,
tali che B giaccia tra A e C, e altri tre punti
D, E, F su unaltra retta, tali che E giaccia
tra D ed F . Se AB = DE e BC = EF ,
allora AC = DF ;
Assiomi di congruenza tra angoli
b e una semiretta DF ,
11. dato un angolo B AC
esiste ununica semiretta DE, da una parte
b `e congruente
fissata di DF , tale che B AC
b (e si scrive B AC
b = E DF
b ).
a E DF

12. dati tre angoli , , , se = e = ,


allora = ; ogni angolo `e congruente a se
stesso;
13. dati due triangoli ABC e DEF , si supponga che sia AB = DE, AC = DF e
b = E DF
b . Allora i due triangoli sono
B AC
b = DEF
b
congruenti, cio`e BC = EF , ABC
b
b
e ACB = DF E.

Assioma della parallela

14. data una retta r e un punto P fuori di essa,


per P passa una e una sola parallela ad r.
Assioma di continuit`a o di Archimede
15. dati due segmenti AB e CD, esiste sempre
un multiplo di AB che sia maggiore di CD.

Proprio per la sua astrattezza, la formulazione di


Hilbert va bene da un punto di vista sistematico, ma
non certo didattico e fa parte di quella che si chiama
4. se il punto B giace tra A e C, allora A, B, C la Matematica elementare considerata da un punto
sono tre punti distinti di una retta, e B di vista superiore. Essa non sviluppa il cosiddetto
senso geometrico e si preferisce insegnare seguendo
giace tra C ed A;
limpostazione euclidea, anche se rivista e aggiorna5. dati due qualsiasi punti A e B, si pu`o trovata. Anche noi ci atterremo a questa regola, e vedremo
re un terzo punto C tale che B giaccia tra
soprattutto la Geometria del piano; lasciamo allultiA e C;
ma sezione del capitolo quelle nozioni di Geometria
6. dati tre punti su una retta, ne esiste uno e dello spazio che riteniamo possano essere utili: ci`o, lo
uno solo che giace tra i restanti due;
riconosciamo, `e un difetto, poiche `e con questo tipo
7. siano A, B, C tre punti non allineati e sia r di Geometria che si pu`o coltivare il nostro senso spauna retta che non contiene nessuno di que- ziale, tanto utile anche quando si affrontano problemi
u di due dimensioni.
sti tre punti. Se r contiene un punto D che di Geometria analitica a pi`
La costruzione della Geometria richiede lintrodugiace tra A e B, allora r deve anche contenere un punto che giaccia tra A e C o tra zione di un certo numero di concetti, derivati dagli
enti primitivi di punto, retta e piano, ma indispensaB e C;
bili per poter progredire fissando la nostra mente sulle
Assiomi di congruenza tra segmenti
cose importanti e, di conseguenza, lasciando perdere
Assiomi dordine

165

6.1. LE BASI DELLA GEOMETRIA

costruzione di opportune figure; la validit`a di tali costruzioni `e garantita dai teoremi, ma non `e raro che
la verit`a di un teorema sia dimostrata per mezzo di
unopportuna costruzione. Per questo, la Geometria
euclidea mescola in modo indissolubile le dimostrazioni formali e le costruzioni geometriche; queste ultime sarebbero formalmente proibite nellimpostazione
moderna di Hilbert.
Le costruzioni geometriche vengono effettuate con
due strumenti: la riga non graduata e il compasso. La
riga serve per tracciare la retta che unisce due punti
A
B O
(o, almeno, parte di tale retta); il compasso serve a
tracciare le circonferenze, gli archi di circonferenza e a
Si noti che molti assiomi fanno uso del concetto riportare gli estremi di un segmento. Per questo, si fa
di segmento; questo significa semplicemente che gli centro su uno dei due estremi e si regola il compasso
assiomi non si danno prima dello sviluppo della teo- in modo che laltra delle sue punte coincida col seconria, ma le due cose procedono in parallelo, con lunica do estremo. In questa maniera `e possibile traslare il
avvertenza che luso di un concetto non ne preceda segmento, poiche lampiezza o apertura del compasso
la definizione. Questa stessa osservazione vale per il pu`o essere riportata ovunque si voglia, a partire da
concetto di semiretta; data una retta r e un punto un punto prestabilito e/o su una retta assegnata (si
O su di essa, si dice semiretta ciascuno dei due trat- veda il terzo postulato di Euclide). Ci`o permette di
ti infiniti che si dipartono da O, detto origine della dare un definizione precisa: due segmenti sono uguasemiretta. In modo analogo, dato un piano e una li se e solo se, riportando il primo sul secondo (cio`e
retta r su di esso, si dice semipiano ciascuna delle puntando su uno dei due estremi) laltra punta del
parti di piano in cui r divide . Si dice angolo (v. compasso si pu`o far coincidere col secondo estremo.
Figura 6.1 ciascuna delle parti di piano compresa fra
s
s
due semirette che hanno lorigine O in comune; tale
C
C
origine si dice il vertice dellangolo. Infine, tre punti
si dicono allineati se giacciono su una stessa retta.
le cose meno rilevanti: sono proprio le definizioni che,
operando una scelta, danno uno specifico indirizzo alla strada che vogliamo percorrere. Prima di tutto, si
dice segmento il tratto di retta compreso tra due punti A e B e che appartengono alla retta stessa; i due
punti A e B si dicono estremi del segmento. Il primo postulato di Euclide e il primo assioma di Hilbert
ci dicono che, dati due punti qualsiasi A e B, esiste
sempre il segmento AB.

r
A

r
B

Figura 6.2: Traslazione di un angolo


B
s

Figura 6.1: Definizione dellangolo


Di fondamentale importanza in tutta la Geometria
`e il concetto di uguaglianza; qui siamo interessati alluguaglianza tra segmenti e tra angoli; vedremo pi`
u
avanti luguaglianza tra poligoni, specie tra triangoli,
concetto estremamente importante in tutta la Geometria euclidea. Come afferma il quarto assioma di
Euclide, i Greci ritenevano uguali due figure che, sovrapposte, vengono a coincidere. In termini moderni,
noi diciamo che luguaglianza si conserva per traslazioni e rotazioni. Tuttavia, questa idea intuitiva deve essere specificata meglio e rigorosamente, e ci`o ci
permette di introdurre le costruzioni geometriche. I
problemi di Geometria hanno soluzione in termini di

Solo un po pi`
u complessa `e la traslazione di un angolo, che mostriamo nella Figura 6.2. Si supponga di
b e lo si voglia traslare a partire dalavere langolo rAs

la retta r con vertice in A . Con centro in A e raggio


arbitrario si traccia larco BC e, con la stessa apertura e centro in A , si disegna una circonferenza che
taglia r in B . Ora, si apre il compasso con ampiezza BC e facendo centro in B si traccia un arco che
intersechi la precedente circonferenza in C . Unendo,
mediante la retta s , i punti A e C si ha, per costruc s `e la traslazione dellangolo
zione, che langolo r A
di partenza. Osserviamo esplicitamente che langolo
potrebbe essere riportato anche dalla parte di sotto,
ottenendo un angolo speculare, ma comunque uguale
a quello di partenza (sarebbe semplicemente ruotato
di un angolo pari allangolo stesso, a meno che non si
vogliano identificare le due rette r ed r .
Dati due segmenti AB e CD, si definisce la loro
somma in questo modo: si prolunga il segmento AB

166

CAPITOLO 6. GEOMETRIA EUCLIDEA

dalla parte di B e si riporta CD su tale semiretta a


partire da B e in modo che D non cada tra A e B:
il segmento AD `e la somma richiesta. Il confronto
tra AB e CD si fa riportando CD sulla retta AB a
partire da A e nel verso in cui si trova B: se D cade
tra A e B allora AB `e maggiore di CD, altrimenti
(se i due segmenti non sono uguali) AB `e minore di
CD. Infine, se CD `e minore di AB, la differenza tra
AB e CD si trova procedendo come per il confronto
e considerando infine il segmento DB.
BC

A
AC

D
B

secondo m di CD. La frazione n/m si dice il rapporto fra AB e CD. Allinizio, i Greci pensarono che
due segmenti qualsiasi fossero comunque commensurabili tra di loro, ma poi Pitagora scopr` che il lato
e la diagonale del quadrato non possono essere tali.
Dovettero perci`o introdurre il concetto di segmenti
incommensurabili e si disse rapporto fra i segmenti
AB e CD il numero (che oggi diciamo reale) che si
ottiene eseguendo il seguente procedimento:
Algoritmo 6.1 (Rapporto fra due segmnti)
Ingresso: due segmenti AB e CD.
Uscita: il rapporto r fra AB e CD.
1. si determina il massimo multiplo r di CD che
sia minore o uguale ad AB;
2. se AB = rCD si esce con r come risultato;

A A0 A1

A2

A3

A4 B A5

3. altrimenti, si pone U V = CD, P Q = AB rCD


e j = 1;
4. si divide U V in dieci parti uguali e sia U V una
di tali parti;

U1
U2
U3

5. si trova il massimo multiplo dj di U V che non


superi P Q;

U4
U5

6. si pone r := r + dj /10j ;
7. se P Q = dj U V si esce con r come risultato;

Figura 6.3: Divisione di un segmento in parti uguali


Nota 6.1
Un segmento AB pu`
o essere facilmente
diviso in n parti uguali mediante la costruzione che
mostriamo nella Figura 6.3. Da A disegniamo una
semiretta AP e su di essa riportiamo n repliche consecutive di un segmento arbitrario; siano U1 , U2 , . . . , Un
i secondi vertici di tali segmenti; si unisca Un con
B e si traccino le parallele ad Un B che passano
per ciascuno degli Ui e incontrano il segmento AB
nel punto Ai (i = 1, 2, . . . , n 1). Posto A0 A e
An B, per il Teorema 6.16 di Talete, i vari segmenti
A0 A1 , A1 A2 , . . . , An1 An sono tutti uguali.
Il segmento AB si dice multiplo secondo m del segmento CD se e solo se AB pu`o essere suddiviso in
m parti tutte uguali a CD; in tal caso, si dice anche che CD `e un sottomultiplo secondo m di AB. Si
scrive AB = mCD o anche CD = AB/m. Due segmenti AB e CD si dicono commensurabili se esistono
due numeri interi m ed n tali che AB risulta essere il
multiplo secondo n del sottomultiplo secondo m del
segmento CD. Si scrive:
n
AB = CD;
m
si osservi che in tal caso il multiplo secondo m di AB
`e uguale al multiplo secondo n di CD, ovvero il sottomultiplo secondo n di AB `e uguale al sottomultiplo

8. altrimenti, si pone U V := U V , P Q := P Q
dj U V , j := j + 1 e si torna al passo 4.
In modo analogo si definiscono la somma, il confronto e la differenza tra due angoli (v. Figura 6.4).
b e A O
c B , si trasla questultimo
Dati due angoli AOB
in modo che la semiretta O A venga a coincidere con
la semiretta OB cos` che O B sia dalla parte opposta
b cos` otdi OA rispetto a OB O A ; langolo AOB

b +A O
c B . Per il confronto e
tenuto `e la somma AOB
c B in modo da far
la differenza, invece, si trasla A O

coincidere O A con OA e laltra semiretta O B sia
dalla stessa parte di OB; naturalmente, se ruotando da OA in senso antiorario si trova O B prima di
c B `e minore di AOB,
b mentre
OB, allora langolo A O
`e maggiore in caso contrario (naturalmente, se i due
angoli non sono uguali, e cio`e non si sovrappongono
b `e
esattamente). La differenza `e definita quando AOB
c
maggiore di A O B , e il risultato `e costituito dallanb
golo B OB.
Naturalmente, i multipli di un angolo si
definiscono di conseguenza.
Definita cos` come sovrapponibilit`a luguaglianza
tra segmenti e tra angoli, nonche le operazioni tra tali enti, possiamo passare al concetto di misura, strettamente legato a quello di uguaglianza. Si consideri,
una volta per tutte, un segmento U V , che indicheremo genericamente con u e che si dice lunit`
a di misura; si definisce allora come misura del segmento AB

167

6.1. LE BASI DELLA GEOMETRIA

B
B
A

O
B

B
A

Figura 6.4: Operazioni sugli angoli

analogamente, il primo multiplo `e 100 volte lunit`a di


misura. Il primo sottomultiplo dellunit`a di volume
`e 1/1000 dellunit`a stessa, e il primo multiplo `e 1000
volte pi`
u grande. Per ragioni pratiche si considerano anche gli altri multipli e sottomultipli rispetto a
10, ma essi creano abbastanza confusione. Ad esempio, il multiplo secondo 10 dellunit`
a di superficie `e

un quadrato che ha il lato pari a 10u, cio`e circa


3.16227766 volte lunit`a di lunghezza u. Ho visto
persone di buona cultura tentennare di fronte a un
fatto del genere!
Anche per gli angoli devono valere le consuete propriet`a delle misure. Per essi sembra esistere una misura naturale, cio`e che non dipende dalla scelta dellunit`a di misura. Infatti, langolo giro ha una rilevanza
tutta propria, essendo langolo pi`
u grande che si possa considerare in modo naturale. Certo, possiamo
girare e rigirare intorno al vertice di un angolo quante volte vogliamo, ma si torna sempre a un angolo
compreso tra langolo nullo e quello giro. Arbitraria
`e invece la suddivisione dellangolo giro in sottomultipli; seguendo una tradizione risalente ai Babilonesi, langolo giro si suddivide in 360 parti, assumendo
una di queste parti come unit`a di misura standard:
il grado; esso si indica con un circoletto ad esponente
del valore. Quindi, la misura di un angolo giro `e di
360 , e 180 `e quella dellangolo piatto. Essendo 360
il massimo valore della misura di un angolo, multipli
del grado non si prendono in considerazione. Vi sono
invece i sottomultipli che, sempre per tradizione, non
si conformano alla base 10:

(rispetto allunit`a di misura u) il rapporto tra AB ed


U V ; la misura del segmento AB si dice anche la sua
lunghezza e spesso si denota con AB, sottintendendo
lunit`a di misura, che si suppone fissata.
E bene ribadire che il segmento U V `e arbitrario e
non esiste ununit`a di lunghezza preferibile ad unaltra. Nella pratica si usa il metro definito come la
lunghezza di una certa barra di platino-iridio conservata al Bureau International de Poids et Mesures
di S`evres. Originariamente, nel 1791, il metro doveva essere la quarantamilionesima parte del meridiano
terrestre, ma la misurazione di questo si `e rivelata alquanto aleatoria; oggi si preferisce una definizione pi`
u
operativa, che non obblighi a recarsi a S`evres ogni volta che si debba controllare la precisione di uno strumento di misura. Si definisce allora il metro come la
distanza percorsa dalla luce nel vuoto in un intervallo
1. si dice primo la sessantesima parte del grado e si
di tempo pari a 1/299. 792. 458 secondi. Ricordiamo
indica con un apice dopo il valore;
infatti che, secondo la Fisica, la velocit`a della luce `e
una costante universale; il problema, semmai, `e di definire lunit`a di tempo, cio`e il secondo. Naturalmente,
una volta definita lunit`a di misura, sono automati2. si dice secondo la sessantesima parte del primo e
camente determinati i suoi multipli e sottomultipli,
si indica con un doppio apice dopo il valore.
sui quali pertanto non stiamo a insistere.
Stabilita lunit`a di lunghezza, le unit`a di superficie e di volume risultano conseguenza di quella; Un angolo di 22 gradi, 12 primi e mezzo si indica:
anticipando la definizione di quadrato e di cubo:
22 12 30 . Dopo i secondi, si torna alla suddivisione
decimale, con decimi, centesimi, millesimi, etc. del
1. si dice unit`
a di misura di superficie il quadrato
secondo. Come vedremo quando tratteremo la tri2
di lato u; lunit`a stessa si denota come u ;
gonometria, c`e una misura degli angoli meno artifi2. si dice unit`
a di misura di volume il cubo di lato ciosa di questa; essa assume come unit`a di misura il
radiante, definito come langolo che sottende un arco
u; lunit`a di misura stessa si denota con u3 .
di circonferenza uguale al raggio della circonferenza
I multipli e sottomultipli si ottengono moltiplican- stessa. Il radiante, quindi, risulta indipendente daldo o dividendo opportunamente le varie dimensioni lunit`a di lunghezza usata per la circonferenza, come
del quadrato e del cubo; pertanto il primo sottomul- ci aspettiamo che debba essere. Per il momento, tuttiplo (secondo 10) dellunit`a di superficie si ottiene tavia, in questa parte che riguarda la Geometria Eudividendo due lati consecutivi in 10 parti ciascuna, e clidea, limiteremo le nostre considerazioni alla misura
perci`o tale sottomultiplo `e 1/100 dellunit`a di misura; tradizionale in gradi, primi e secondi.

168

6.2

CAPITOLO 6. GEOMETRIA EUCLIDEA

Perpendicolarit`
a e parallelismo

Due concetti molto importanti sono quelli di rette perpendicolari e di rette parallele; su di essi
si basano moltissimi sviluppi della Geometria Euclidea, che dedica loro due postulati, il quarto e il quinto. Cominciamo col quarto postulato, che pu`o essere
enunciato nel modo seguente: tutti gli angoli retti
sono uguali. Naturalmente, affinche questa affermazione abbia senso, occorre aver definito langolo retto;
allora, la seguente definizione ha il duplice scopo di
farci intendere cosa `e un angolo retto e quand`e che
due rette sono perpendicolari tra loro:
Definizione 6.1 Se due rette, incontrandosi, formano quattro angoli uguali, si dicono perpendicolari;
ciascuno dei quattro angoli si dice un angolo retto.
Il quarto postulato ci assicura che, qualunque coppia di rette perpendicolari si consideri, gli angoli ottenuti sono non solo uguali tra di loro, ma uguali
a quelli di ogni altra coppia di rette perpendicolari. Questo ci permette di affermare che un angolo
piatto `e la somma di due angoli retti e un angolo
giro `e la somma di quattro angoli retti. Secondo le
convenzioni introdotte nella precedente sezione sulla
misurazione degli angoli, possiamo dire che un angolo
retto misura 90 , come quarta parte dellangolo giro.
La terminologia relativa agli angoli `e ben nota; sia
b langolo considerato:
AOB
piatto: le due semirette OA ed OB sono
allineate, cio`e sono luna il prolungamento
dellaltra;

giro: le due semirette OA ed OB coincidono;


convesso: un angolo minore di un angolo piatto;

Nota 6.2

Esistono vari metodi per costruire un


angolo retto; qui diamo per esteso un algoritmo che
sfrutta poco spazio, come mostrato nella parte sinistra
della Figura 6.5:

Algoritmo 6.2 (Angolo retto)


Ingresso: una semiretta di origine A;
Uscita: la semiretta per A perpendicolare alla
semiretta data;
1. se r `e la semiretta assegnata, con centro in A
e con raggio arbitrario si disegna un arco di
circonferenza che taglia r in B;
2. con centro in B e con lo stesso raggio di prima
si disegna un arco che taglia il precedente in C;
3. con centro in C e con lo stesso raggio di prima
si disegna un arco che taglia il primo in D;
4. con centro in D e ancora lo stesso raggio si
traccia un arco che taglia il precedente in E;
5. la semiretta per A passante per E `e perpendicolare ad r.
La dimostrazione che questa costruzione `e corretta `e
facile ed `e lasciata allo studente dopo che avr`
a appreso
(se non li conosce gi`
a) i teoremi delle prossime sezioni
di questo capitolo. Come talvolta accade, le costruzioni geometriche richiedono conoscenze che non vanno in parallelo con lesposizione sistematica dei vari
concetti. Unaltra costruzione `e mostrata nella parte
destra della Figura 6.5, e il lettore la potr`
a schematizzare sotto forma di algoritmo come semplice esercizio:
si prolunga la semiretta r oltre A, e con centro in A
e raggio arbitrario si disegna una semicirconferenza
che taglia r e il suo prolungamento in B e in C; con
centro in B e C e raggio superiore al precedente, si
disegnano due archi che si incontrano in D; la retta
che congiunge A con D `e perpendicolare ad r.

E
D

concavo: un angolo maggiore di un angolo piatto;


acuto: un angolo minore di un angolo retto;
ottuso: un angolo maggiore di un angolo retto
(ma minore di un angolo giro).
Inoltre, dati due angoli, essi si dicono:
opposti al vertice se ciascuno di essi `e determinato dal prolungamento delle semirette dellaltro;
due angoli opposti al vertice sono uguali;
complementari: due angoli la cui somma sia
uguale ad un angolo retto;
supplementari: due angoli la cui somma sia
uguale ad un angolo piatto;
esplementari: due angoli la cui differenza sia un
angolo piatto.

C
r
A

r
C

Figura 6.5: Costruzioni dellangolo retto


Vale la pena di ricordare, infine, il metodo egizio,
cos` detto perche adottato dagli antichi Egizi (e
non solo da loro) (v. Figura 6.6. A partire da A
si riporta quattro volte un segmento arbitrario P Q,
determinando cos` il punto B. Con centro in A si
traccia un arco di raggio tre volte P Q e con centro
in B un arco di raggio cinque volte P Q. Se C `e il
punto di intersezione dei due archi, la retta AC `e
perpendicolare ad AB per il Teorema di Pitagora,
che d`
a: 32 + 42 = 52 .

` E PARALLELISMO
6.2. PERPENDICOLARITA

Figura 6.6: Il metodo Egizio


Il concetto di parallelismo `e legato al quinto postulato di Euclide e richiede di aver gi`a introdotto la
perpendicolarit`a e langolo retto. Il postulato fa uso,
quando parla di angoli interni, di una terminologia
specifica che bisogna conoscere:

169
Dal quinto postulato si deduce che se r ed s formano con t coppie di angoli la cui somma `e uguale a due
retti, esse, anche se prolungate indefinitamente, non
si incontrano mai. Da questa osservazione intuitiva, discende la pseudo-definizione che comunemente
si d`a di rette parallele: due rette si dicono parallele se, prolungate indefinitamente, non si incontrano
mai. Questa non pu`o essere una vera definizione, perche prolungando due rette possiamo s` determinare se
esse si incontrano, ma `e impossibile stabilire che esse
non si incontrano; infatti, una cosa del genere richiederebbe uno spazio e un tempo infiniti che, di solito, non abbiamo a disposizione. Il senso del quinto
postulato di Euclide, quindi, `e di fornire un criterio
finito per stabilire se due rette sono o non sono
parallele: si tagliano con una trasversale e si misurano gli angoli; se la somma di due angoli interni `e
uguale a due retti, le rette assegnate sono parallele,
altrimenti non lo sono e, in tal caso, dalla somma dei
due angoli sappiamo da quale parte si incontreranno.
Quindi la definizione corretta `e: due rette sono parallele se, tagliate con una trasversale, formano angoli
coniugati interni la cui somma `e uguale a due angoli
retti. A questo punto possiamo enunciare il famoso e
importante risultato:

Definizione 6.2 Siano r, s una coppia di rette e sia


t una trasversale che le taglia. Gli angoli per i quali
la semiretta della trasversale non incontra laltra retta della coppia, si dicono esterni; gli altri si dicono
interni. Le coppie di angoli che stanno dalla stessa
parte rispetto a t e dalla stessa parte rispetto ad r ed
s si dicono corrispondenti; essi sono sempre uno interno e uno esterno. Le coppie di angoli che stanno Teorema 6.1 Due rette r ed s sono parallele se e
da parti opposte rispetto a t e da parti opposte rispet- solo se, tagliandole con una trasversale, si verifica
to ad r ed s si dicono alterni; quindi una coppia pu`
o una delle seguenti condizioni:
essere costituita da angoli alterni esterni o da angoli
1. angoli alterni (interni o esterni) sono uguali;
alterni interni. Infine, le coppie di angoli che stanno
2. angoli corrispondenti sono uguali;
dalla stessa parte rispetto a t, ma da parti opposte
rispetto ad r ed s si dicono coniugati; anche in que3. angoli coniugati (interni o esterni) sono supplesto caso una coppia pu`
o essere costituita da angoli
mentari.
coniugati interni o angoli coniugati esterni.
Prova: Se r ed s sono parallele, per definizione vale la propriet`a 3) relativamente agli angoli coniugati
t
interni; i corrispondenti angoli coniugati esterni sono

r
supplementari agli angoli coniugati interni e quindi
devono essere supplementari tra di loro. Dei due an
goli corrispondenti, uno `e uguale e laltro `e supplementare ad uno di due angoli coniugati, e quindi i

s

due angoli sono uguali tra loro. La stessa osserva
zione vale per gli angoli alterni, che perci`o devono
anchessi essere uguali tra di loro.
Figura 6.7: Rette parallele tagliate da una trasversale

Le tre condizioni costituiscono altrettanti criteri di


parallelismo e come tali verranno usate ogni volta che
Schematicamente, la situazione pu`o essere rappre- dovremo ragionare su rette parallele. Ad esempio, disentata dalla Figura 6.7, nella quale , , , sono mostriamo questa celeberrima conseguenza del quinto
angoli interni e , , , sono angoli esterni. Il qua- postulato:
dro completo `e dato dalla Tabella 6.1, nella quale
Teorema 6.2 Data una retta r ed un punto P fuori
alt, cor e conj stanno per alterni, corrispondendi essa, per P passa una ed una sola parallela ad r.
ti e coniugati; per gli angoli che non sono in alcuna di queste relazioni abbiamo usato il simbolo = Prova: Si consideri la Figura 6.8, a sinistra. Da P
quando sono uguali e il simbolo quando risultano si costruisca la perpendicolare t ad r e quindi si cosupplementari (vedere il successivo Teorema 6.1).
struisca la retta s perpendicolare a t e passante per P .

170

CAPITOLO 6. GEOMETRIA EUCLIDEA

=
conj

alt
=

cor

conj
=
alt

=
cor

alt
=
conj

cor
=

alt

conj
=
cor

cor
=
conj

alt

=
cor

conj
=
alt

cor
=

alt
=
conj

cor

=
alt

conj
=

Tabella 6.1: Corrispondenza tra angoli

S
P

s
t

Figura 6.8: Rette parallele


Per il teorema precedente, le rette r ed s sono parallele. Supponiamo allora che esista unaltra parallela
s ad r passante per P . Le due rette s, s formano un
angolo non nullo (altrimenti coinciderebbero) e quinb `e minore di
di la somma degli angoli S PbQ e RQP
due retti. Per definizione, allora, s non pu`o essere
parallela ad r.
La costruzione della retta s si pu`o semplificare molto rispetto al metodo suggerito dalla dimostrazione
del teorema. Al solito, questo richiede la conoscenza
di propriet`a che ancora non abbiamo ne visto ne tanto meno dimostrato, anche se lo faremo pi`
u avanti.
La dimostrazione del teorema, invece, correttamente
usa solo nozioni che gi`a sono state introdotte e provate. Facendo riferimento alla Figura 6.8, a destra,
si ha:
Algoritmo 6.3 (Parallela ad r passante per P )
Ingresso: la retta r e il punto P fuori di essa;
Uscita: la retta s passante per P e parallela ad r;
1. si considera un punto A qualsiasi sulla retta r;
2. con centro in A e raggio AP si traccia un arco
di circonferenza che interseca r in B;
3. con centro in B e in P e stesso raggio si
tracciano due archi che si incontrano in C;
4. la retta P C `e parallela ad r.

Come `e noto, le possibili alternative al precedente


teorema hanno dato origine alle Geometrie non Euclidee. Se supponiamo che per P passino infinite rette
parallele ad r si ottiene la Geometria Iperbolica di
Lobacevsky e Bolyai ; se invece si suppone che per
P non passi alcuna retta parallela ad r si ottiene la
Geometria Ellittica di Beltrami e Riemann.
Lasciamo al lettore il compito di provare che anche la perpendicolare alla retta r passante per P `e
unica. Se tale perpendicolare interseca r nel punto
Q, si definisce distanza di P da r la lunghezza del
segmento P Q; Q si dice il piede della perpendicolare.
Invitiamo inoltre il lettore a scrivere lalgoritmo per
la costruzione della perpendicolare ad r passante per
P , quando P non sta sulla retta; il caso in cui P A
sta su r `e stato visto nella Nota 6.2. La Figura ??
suggerisce il metodo classico: con centro in P si traccia un arco di circonferenza che incontra r in X ed
Y . Il punto di mezzo Q del segmento XY `e il piede
della perpendicolare cercata.
Dati tre punti non allineati A, B, C, la parte di
piano comune ai tre semipiani determinati dalle rette
AB, BC, CA che contengono il terzo punto, si dice
triangolo. I tre punti A, B, C si dicono i vertici, i
tre segmenti AB, BC, CA si dicono i lati del triangolo e i tre angoli che contengono il triangolo si dicono gli angoli del triangolo. Il triangolo `e la pi`
u
semplice di una serie di figure geometriche di notevole importanza. Sia A0 , A1 , . . . , An una sequenza
di n punti distinti del piano; la sequenza di segmenti A0 A1 , A1 A2 , . . . , An1 An si dice poligonale; se An
coincide con A0 la poligonale si dice pi`
u propriamente poligono di n lati. Per estensione, si dice poligono
anche la parte di piano racchiusa dalla poligonale. La
definizione di vertice, lato ed angolo della poligonale e del poligono sono analoghe alle stesse definizione
date per il triangolo, che risulta semplicemente essere
un poligono di tre lati.
Se ogni lato Ai Ai+1 del poligono `e tale che la retta Ai Ai+1 lascia da una stessa parte tutti gli altri
vertici del poligono, allora questo si dice convesso.
Si dimostra che la seguente definizione `e equivalente:
un poligono `e convesso se, presi comunque due pun-

` E PARALLELISMO
6.2. PERPENDICOLARITA
ti che gli appartengono, il segmento che li unisce `e
formato tutto di punti appartenenti al poligono stesso. Per definizione, infatti, P e Q appartengono a
tutti i semipiani determinati dai lati e contenenti gli
altri vertici del poligono; vi appartengono pertanto
anche tutti i punti del segmento P Q. Un poligono
che non sia convesso si dice concavo. In questultimo caso, pu`o succedere che due lati si intersechino,
cio`e abbiano un punto in comune diverso da ciascuno
dei vertici; il poligono si dice allora intrecciato. Al
variare del numero dei lati (e degli angoli) i poligoni
prendono il nome di triangoli, quadrilateri, pentagoni, esagoni, e cos` via. Un poligono che abbia tutti i
lati e tutti gli angoli uguali si dice regolare; per questi
poligoni si veda la Sezione 6.8.

A5

A1

A4

A1
A3
A0

A6

A2

A0 A5

A2
A7

A4

A3

Figura 6.9: Poligonale e poligono


I triangoli sono i poligoni pi`
u semplici e tutti
i triangoli sono poligoni convessi; per essi vale il
seguente risultato:
Teorema 6.3 In ogni triangolo ciascun lato `e minore della somma degli altri due e maggiore della loro
differenza.

171
A

Figura 6.10: Gli angoli di un triangolo


Questa costanza della somma dei tre angoli di un
triangolo risulter`a importante in molte applicazioni; ad esempio, se chiamiamo angolo esterno langolo che il prolungamento di un lato forma con il lato
successivo, si ha il seguente:
Teorema 6.5 In un triangolo ogni angolo esterno `e
uguale alla somma dei due angoli non adiacenti.
Prova: Se nel triangolo ABC della Figura 6.10 prob `e il supplemenlunghiamo il lato AB, langolo C BD
b
tare di ABC. Ma per il teorema precedente, anche
b + ACB
b `e supplementare di ABC
b per
la somma B AC
b
b
b
cui abbiamo: C BD = B AC + ACB.
D

E
C

Prova: Siano AB, CD, EF i tre lati di un triangolo;


se AB > CD + EF e facciamo coincidere A con C
A
B
e B con E, i punti D ed F non possono incontrarsi
e quindi non pu`o esistere nessun triangolo con tali
Figura 6.11: Somma degli angoli interni
tre lati. Si osservi che se AB = CD + EF , allora D
ed F verrebbero a coincidere in un punto di AB, e
Tutti i poligoni hanno costante la somma dei loro
quindi il triangolo degenera in un semplice segmento.
Se daltra parte fosse AB < CD EF si avrebbe angoli interni:
CD > AB + EF , e questo `e proibito dalla prima
Teorema 6.6 Sia dato un poligono di n lati; allora
parte del teorema.
la somma dei suoi angoli interni `e uguale ad n 2
E interessante osservare il seguente invariante angoli piatti.
dei triangoli:
Teorema 6.4 La somma dei tre angoli di un Prova: Si consideri la Figura 6.11 e fissato un vertice A del poligono, lo si unisca a tutti gli altri vertici,
triangolo `e uguale a due angoli retti.
escluso i due vertici adiacenti ai quali `e gi`a unito da
Prova: Sia ABC un qualsiasi triangolo (si veda la due lati. Si ottiene cos` una divisione del poligono in
Figura 6.10) e costruiamo per C la parallela ad AB. n 2 triangoli, ognuno dei quali ha un angolo piatto
b e B AC
b sono uguali perche alterni come somma dei suoi angoli interni. Poiche la somma
Gli angoli A CA
b e ABC.
b
Quindi, la degli angoli interni del poligono `e uguale alla sominterni, e lo stesso vale per B CB
b
somma dei tre angoli del triangolo `e uguale a A CA+
ma degli angoli interni di questi triangoli, il teorema
b
b
ACB + B CB, che `e un angolo piatto.
risulta dimostrato.

172

CAPITOLO 6. GEOMETRIA EUCLIDEA

Per i quadrilateri, cio`e per i poligoni a quattro mo visto tanto per i segmenti quanto per gli angoli.
lati, esiste una nomenclatura nota fin dalle scuole Quello che si fa, `e di traslare una figura sullaltra, in
modo da far coincidere certi punti, e osservare che anelementari:
che tutti gli altri coincidono; se questo non avviene,
Definizione 6.3 Un quadrilatero che abbia due lati
la due figure non sono congruenti. Talvolta, oltre alla
opposti paralleli si dice un trapezio. Un quadrilatero
traslazione, occorre operare un ribaltamento delle fiche abbia le due coppie di lati opposti paralleli si dice
gure; questo deve avvenire nello spazio, ma di regola
un parallelogramma. Un quadrilatero che abbia tutti
questa invasione della terza dimensione non `e consigli angoli uguali si dice un rettangolo. Un quadriderata fuori legge. Con il criterio di sovrapponibilit`a
latero che abbia tutti i lati uguali si dice un rombo.
in mente, possiamo dare un teorema che potrebbe
Un quadrilatero che abbia tutti i lati e tutti gli angoli
anche essere preso come definizione:
uguali si dice un quadrato. I segmenti che uniscono vertici opposti di un quadrilatero si dicono le sue Lemma 6.9 Due triangoli sono uguali se e solo se
diagonali.
hanno i tre lati e i tre angoli ordinatamente uguali.
Vale il seguente, importante risultato:

Prova: I due triangoli possono essere sovrapposti,


Teorema 6.7 Un quadrilatero `e un parallelogramma o direttamente o tramite una rotazione nello spazio,
se e solo e le due coppie di angoli opposti sono uguali. come richiesto ad esempio dai triangoli della Figura
6.13. Il viceversa `e del tutto ovvio.
D

B B

Figura 6.13: Triangoli congruenti


Figura 6.12: Un parallelogramma
Prova: Se ABCD `e un parallelogramma, gli angoli
b e in D
b sono corrispondenti e quindi supplementain A
b eC
b sono supplementari e quindi
ri; anche gli angoli D
b
b
b = B.
b ViceverA = C. Analogamente si dimostra D
sa, per il teorema precedente la somma degli angoli
interni di un quadrilatero `e uguale a quattro angoli
b=C
b eB
b = D,
b si ha che A
b+D
b e
retti; quindi se A
b
b
B + C sono uguali a due angoli retti. Questo significa
che AB `e parallelo a DC. In modo analogo, si trova
che AD `e parallelo a BC e quindi il quadrilatero `e un
parallelogramma.
Come semplice conseguenza si ha:
Corollario 6.8 Il rettangolo e il quadrato sono
parallelogrammi.
Vedremo pi`
u avanti che un quadrilatero `e un parallelogramma se e solo se i lati opposti sono uguali.
Questo ci dir`a che anche un rombo `e un parallelogramma e ci dar`a altre propriet`a dei rettangoli e dei
quadrati.

6.3

Congruenza e similitudine

Normalmente, la verifica di queste sei uguaglianze


`e troppo pesante; come ora vedremo, bastano tre opportune uguaglianze per assicurare la congruenza di
due triangoli. I tre teoremi seguenti sono noti pertanto come criteri di congruenza dei triangoli, e
costituiscono la base di gran parte della geometria
dei triangoli.
Teorema 6.10 (I criterio di congruenza) Due
triangoli che abbiano uguali due lati e langolo tra
essi compreso sono congruenti.
Prova: Con riferimento alla Figura 6.13, si abbia
b = BA
c C . Se
AB = A B , AC = A C e B AC

portiamo A a coincidere con A e B con B , per le


precedenti uguaglianze anche C deve coincidere con
C , eventualmente dopo aver fatto ruotare il triangolo
nello spazio. Ma se B e C coincidono con B e C , il
segmento BC coincide con B C e anche gli angoli in
B e in C devono essere uguali agli angoli in B e C .
Questo assicura che i due triangoli sono congruenti.
Analogamente si dimostra il secondo criterio:

Teorema 6.11 (II criterio di congruenza) Due


Il concetto di congruenza per le figure geometriche triangoli che abbiano uguali un lato e i due angoli ad
coincide con quello di sovrapponibilit`a, come abbia- esso adiacenti sono congruenti.

173

6.3. CONGRUENZA E SIMILITUDINE


Prova: Sempre con riferimento alla Figura 6.13, sia
AB = A B e portiamo i due lati a sovrapporsi. Poiche langolo in A `e uguale allangolo in A , il lato AC
viene a sovrapporsi (anche se non necessariamente
a coincidere) con A C . Allo stesso modo, essendo
b = B
c , i segmenti BC e B C si sovrappongono,
B
anche se non coincidono. Ma i due lati AC e BC si
incontrano in C, che per la costruzione effettuata si
deve trovare anche sulle rette A B e A C . Poiche
due rette non parallele si incontrano in un solo punto, allora C e C devono coincidere. Questo implica
la congruenza dei due triangoli.

Figura 6.14: Triangolo isoscele

Per arrivare a dimostrare il terzo criterio di conla mediana. Merita un po pi`


u di enfasi il seguente
gruenza, occorre introdurre alcuni concetti, nuovi ma
risultato:
importanti:
Definizione 6.4 Un triangolo con tutti e tre i lati Corollario 6.13 Un triangolo `e equilatero se e solo
uguali si dice equilatero. Un triangolo con i tre lati se i suoi tre angoli sono uguali (e, di conseguenza,
tutti diversi si dice scaleno. Un triangolo che abbia misurano 60 ciascuno).
due lati uguali (e il terzo eventualmente diverso) si
dice isoscele; in tal caso, i due lati uguali si dicono
lati obliqui, mentre il terzo lato si dice la base. I
segmenti che uniscono ciascun vertice al punto medio
del lato opposto si dicono le mediane del triangolo.
Se dal vertice A costruiamo la perpendicolare al lato
opposto BC e H `e il piede di tale perpendicolare, il
segmento AH si dice laltezza del triangolo relativa
al lato BC. In modo analogo si definiscono le altezze
relative ai lati AB e AC.
Si ha allora il seguente:

Prova: Sia ABC un triangolo equilatero; se consideriamo AB come base di un triangolo isoscele, langolo
in A risulta uguale allangolo in B; se consideriamo
BC come base, langolo in B risulta uguale allangolo in C. Per la propriet`a transitiva delluguaglianza i
tre angoli sono tutti uguali e la loro misura discende
dal Teorema 6.4. In viceversa si dimostra in modo
del tutto analogo.
Siamo ora in grado di dimostrare:

Teorema 6.14 (III criterio di congruenza)


Due triangoli che abbiano tutti e tre i lati uguali
Teorema 6.12 Un triangolo `e isoscele se e solo se i
sono congruenti.
due angoli adiacenti alla base sono uguali.
Prova: Con riferimento alla Figura 6.14, sia CM Prova: Facciamo ora riferimento alla Figura 6.15.

il segmento che si ottiene dividendo a met`a langolo Portiamo AB a coincidere con A B e supponiamo

b
b
in C, di modo che ACM
= M CB.
I due triangoli che, cos` facendo, C non venga a coincidere con C.

ACM e M CB sono congruenti per il primo criterio: I due triangoli ACC e BCC sono isosceli per co

AC = CB perche il triangolo `e isoscele, CM `e a struzione e per ipotesi (AC = A C e BC = B C ) e
b = M CB
b per costruzione. Quindi quindi hanno gli angoli alla base uguali. Tuttavia, se
comune ed ACM
c
c
in particolare langolo in A `e uguale allangolo in B. la disposizione `e quella della figura: AC C > B C C e

b
b
c
Viceversa, supponiamo che gli angoli adiacenti al lato ACC < B CC = B C C, il che `e assurdo. Ci possono

AB siano uguali. Questo vuol dire che sono acuti e essere altre disposizioni dei punti C e C , ma in modo
quindi, se da C tracciamo laltezza relativa ad AB, del tutto analogo si arriva sempre a una conclusione

questa cade in un punto M compreso tra A e B. Si assurda. Quindi, deve essere C C .


considerino allora i triangoli AM C e M BC; i due
be
angoli in M sono retti e quindi uguali, gli angoli A
C C
b sono uguali per ipotesi e questo implica che langolo
B
b `e uguale ad M CB.
b
ACM
I due triangoli sono allora
congruenti per il secondo criterio (CM `e in comune)
e, in particolare, CA = CB; quindi il triangolo `e
isoscele.
A A
B B
Come conseguenza di questa dimostrazione, si pu`o
cC =
osservare che, in un triangolo isoscele, AM
c
Figura 6.15: Terzo criterio di congruenza
B M C, che quindi risultano retti; perci`o CM `e laltezza del triangolo. Inoltre, AM = M B, e CM `e anche

174

CAPITOLO 6. GEOMETRIA EUCLIDEA

Teorema 6.15 Un quadrilatero `e un parallelogramma se e soltanto se le due coppie di lati opposti sono
formate da segmenti uguali.

B H

C K

Prova: Se ABCD `e un parallelogramma, considerando le rette parallele AB e CD tagliate dalla trab = B DC


b perche angoli altersversale DB, si ha ABD
ni interni. In modo analogo, partendo dalle parallele
b = DBC.
b
AD e BC si ha ADB
Allora i due triangoli
ABD e BCD sono congruenti per il primo criterio
e perci`o si ha AB = DC e AD = BC. Viceversa,
supponiamo che sia AB = DC e AD = BC; i due
triangoli ABD e BCD sono ora uguali per il terzo crib = B DC
b
terio di congruenza e quindi abbiamo ABD
b
b
e ADB = DBC; questo implica che AB e DC sono
paralleli, come lo sono AD e BC.

Un immediato corollario di questo teorema `e che


ogni rombo `e un parallelogramma. Nella dimostrazione del teorema abbiamo usato la diagonale DB; potevamo usare anche laltra diagonale AC e arrivare allo
stesso risultato. Pertanto, una seconda conseguenza
`e:

Corollario 6.16 Ogni diagonale divide un parallelogramma in due triangoli uguali.


Uno dei primi risultati astratti ottenuti nella
Geometria `e stato, quasi sicuramente, il teorema di
Talete, che ora vedremo. Talete si interessava alle proporzioni e indubbiamente osserv`o la propriet`a
enunciata dal suo teorema, ma, altrettanto indubbiamente, non ne dette alcuna dimostrazione come ora si
intende e come, un paio di secoli dopo di lui, intendevano i Greci. A quellepoca, la necessit`a di una prova
rigorosa in Matematica non era avvertita e una verifica sperimentale era pi`
u che sufficiente. Ci`o non toglie
che lintuizione di Talete non fosse giusta e, a quel che
si dice, egli stesso la adoper`o, quando gli capit`o di recarsi in Egitto, per calcolare con esattezza laltezza
delle piramidi, operazione ritenuta impossibile prima
di lui.
Definizione 6.5 Si dice fascio di rette linsieme di
tutte le rette che passano per un punto, detto il centro
del fascio, oppure linsieme di tutte le rette parallele
a una retta assegnata, detta la direzione del fascio.
Teorema 6.17 (di Talete) Sia dato un fascio di
rette parallele e si considerino due trasversali r ed
s a tale fascio (v. Figura 6.16); queste trasversali sono pertanto tagliate in segmenti dalle rette parallele;
allora, a segmenti proporzionali tagliati su r corrispondono segmenti nella stessa proporzione tagliati
su s, e viceversa.
Prova: A onor di Talete, la dimostrazione di questo teorema non `e affatto ovvia e richiede unimpo-

BB

B A
B
B
H BB
B
K B C
B
B
B D
B
B E
B
B
sB

Figura 6.16: Teorema di Talete

stazione che tenga conto della definizione di numero reale, concetto che, al tempo di Talete, nemmeno esisteva! Si comincia osservando che a segmenti
uguali su r corrispondono segmenti uguali su s. Sia
AB = BC; se si tirano le perpendicolari al fascio
AH e BK, i due triangoli ABH e CBK sono uguab = H BA
b e
li, essendo AB = BC per ipotesi, K CB
b = C BK
b come angoli corrispondenti. PortiaB AH
mo ora le perpendicolari A H e B K : questo implica che AA H H e BB K K sono parallelogrammi e quindi A H = AH = BK = B K . Da
questo deriva che i triangoli A H B e B K C sono congruenti, ancora per il primo criterio di conc B = K B
c C perche corrispondenti,
gruenza (H A
c = K
c perche retti). Finalmente, questo ci dice
H

A B = B C . Supponiamo ora (seconda parte della
dimostrazione) che due segmenti, ad esempio AB e
CD, stiano tra di loro in un rapporto razionale m/n.
Questo significa che dividendo AB in n parti uguali e CD in m parti uguali, queste parti hanno tutte
la stessa lunghezza. Possiamo applicare allora la prima parte della dimostrazione immaginando che ogni
parte sia individuata dal taglio di r ed s con rette
parallele del fascio. Questo implica che A B e C D
stanno ancora nel rapporto m/n, essendo le parti tagliate in s tutte uguali tra di loro. La terza parte
della dimostrazione riguarda il caso in cui i due segmenti, diciamo ancora AB e CD non siano tra loro in
un rapporto razionale. Se z `e tale rapporto, possiamo
pensare a due successioni (di Cauchy) di numeri razionali che approssimano z per difetto e per eccesso.
Considerando segmenti che approssimano CD secondo i rapporti di tali sequenze con AB, per la seconda
parte della dimostrazione si ottengono segmenti che
approssimano C D secondo gli stessi rapporti con il
segmento A B . Questo ci dice che anche il rapporto
tra A B e C D deve essere z.

175

6.3. CONGRUENZA E SIMILITUDINE


A Talete bast`o sfruttare la prima parte del teorema
per misurare laltezza della piramide. Secondo Plutarco, aspett`o che la propria ombra avesse una lunghezza pari alla sua altezza e segn`o il punto in cui arrivava lombra della punta della piramide. Sfruttando
poi il fatto che la base della piramide era quadrata
e le sue misure potevano essere prese direttamente,
non gli fu difficile calcolare laltezza esatta. Questo
metodo `e noto in generale come principio dei triangoli simili, e in effetti il teorema di Talete costituisce
la base della teoria geometrica della similitudine, che
fra poco vedremo. Prima, per`o, osserviamo che esiste
anche un teorema inverso a quello di Talete:
Teorema 6.18 Sia dato un fascio di rette, delle quali non si sappia se sono parallele. Se, prese comunque
due trasversali r ed s si ha che a segmenti proporzionali staccati su r corrispondono segmenti nella stessa proporzione staccati su s, allora le rette del fascio
sono parallele tra di loro.
Prova: Se nel fascio esistesse una retta non parallela alle altre, chiamiamo A la sua intersezione con la
retta r. Per A facciamo passare la parallela al fascio
che incontrer`a s nel punto A diverso da A . Per il
teorema di Talete, i segmenti con vertice in A hanno
le stesse proporzioni con gli altri segmenti determinate dai corrispondenti segmenti con vertice in A. Ma
questa `e la stessa propriet`a di cui devono godere i
segmenti con vertice in A e quindi A e A devono
coincidere. Questo vuol dire che la retta originale per
A deve coincidere con quella costruita, cio`e risulta in
effetti parallela alle altre rette del fascio.

Come per la congruenza, la verifica della loro similitudine pu`o essere semplificata rispetto a ci`o che comporterebbe la definizione. Queste semplificazioni sono stabilite dai tre criteri di similitudine dei triangoli,
abbastanza analoghi ai tre criteri di congruenza.

C
@
@
C
@D
C
@
@
@
@
@

@
@
@

@
@
@

@
@
@

@
@
@
A
B
B A
B

Figura 6.17: Triangoli simili


Teorema 6.20 (I criterio di similitudine) Due
triangoli che abbiano due coppie di lati in proporzione e langolo fra essi compreso uguale, sono simili
tra di loro.

Prova: Con riferimento alla Figurs 6.17, siano ABC


e A B C due triangoli per i quali AB : A B =
b = A
c . Prendiamo sul segmento
AC : A C e A

AB un punto B (che potrebbe anche seguire B)


tale che AB = A B e da B costruiamo la parallela B C a BC. Il teorema di Talete ci dice che
AB : AB = AC : AC , e quindi, per lunicit`a del
quarto proporzionale deve essere AC = A C . I due
E importante unaltra conseguenza del Teorema di triangoli AB C e A B C sono quindi uguali per il
Talete:
b=B
c = B
c
primo criterio di congruenza e perci`o B

b
c
c
e C = C = C . Infine, portando la parallela C D
Corollario 6.19 Se r ed s sono due rette parallele,
ad AB si ha C D = B B, essendo B BDC un
allora tutti i punti di r hanno la medesima distanza
parallelogramma, e dal teorema di Talete si deduce
da retta s.
AC : AC = BC : BC . Questa equivale alla pro

Ha senso allora definire la distanza di due rette paral- porzione AC : A C = BC : B C , il che prova che
lele r ed s come la distanza di un qualsiasi punto p anche il terzo lato `e nella stessa proporzione degli
altri due.
di una delle due rette dallaltra retta.
Finalmente, diamo la seguente:

Anche il secondo criterio di similitudine `e analogo


al secondo criterio di congruenza:

Definizione 6.6 Due poligoni con k lati si dicono simili se i lati sono ordinatamente nella stessa Teorema 6.21 (II criterio di similitudine) Due
proporzione e se gli angoli che essi formano sono triangoli che abbiano due coppie di angoli uguali
ordinatamente uguali.
sono simili (a meno di una eventuale rotazione
intorno a un lato).
Osserviamo esplicitamente che le due condizioni non
possono, in generale, essere ridotte; questo `e dimo- Prova: Naturalmente, se due coppie di angoli sostrato dallesempio del quadrato e del rombo (che no uguali, anche la terza coppia `e tale; inoltre, non
hanno i lati in proporzione, ma gli angoli diversi) e ha senso parlare di proporzionalit`a di due soli ladallesempio del rettangolo e del quadrato (che hanno ti. Con riferimento alla Figura 6.17, siano ABC e
b=A
c , B
b=B
c e, di congli stessi angoli, ma non i lati in proporzione). Il caso A B C due triangoli con A

b
c
pi`
u importante e interessante `e quello dei triangoli. seguenza, C = C . Riportiamo su AB il punto B

176

CAPITOLO 6. GEOMETRIA EUCLIDEA

di modo che sia AB = A B e costruiamo la parallela B C a BC. I due triangoli AB C e A B C


sono uguali per il secondo criterio di congruenza e
quindi AC = A C e B C = B C . Per il teorema di Talete abbiamo AB : AB = AC : AC , cio`e
AB : A B = AC : A C . In modo analogo, oppure
costruendo la parallela C D ad AB, si provano le altre proporzioni, che si riducono a AB : A B = AC :
A C = BC : B C per la propriet`a transitiva.

C Q
QQ

Q
Q

Q
Q

Q
A
H
B
Figura 6.18: Triangolo rettangolo

Infine, in analogia al terzo criterio di congruenza:


Teorema 6.22 (III criterio di similitudine) Se
Prova: Facendo riferimento alla Figura 6.18, i
due triangoli hanno i tre lati in proporzione, allora due triangoli ABC e ACH sono simili per il seconsono simili (a meno di una rotazione intorno a uno do criterio di similitudine in quanto langolo in A `e
dei lati).
comune e gli angoli in C e in H sono retti. Quindi
AH : AC = AC : AB, il che prova il primo punto.
Prova: Con riferimento alla Figura 6.17, siano ABC Anche i due triangoli AHC e CHB sono simili in
e A B C due triangoli tali che AB : A B = AC : quanto entrambi simili ad ABC, e quindi vale la proA C = BC : B C . Si consideri su AB il punto B porzione AH : CH = CH : HB, e questo dimostra il
tale che AB = A B e su AC il punto C tale che secondo punto.
AC = A C . Per linverso del teorema di Talete,
Come vedremo, il celeberrimo teorema di Pitagora
B C deve essere parallelo a BC, e costruendo C D
parallelo ad AB si trova, come in precedenza, che `e una conseguenza, pressoche immediata, del primo
deve essere B C = B C . I due triangoli AB C e teorema di Euclide.
A B C sono pertanto congruenti per il terzo criterio.
b=A
c
Ma ora `e immediato osservare che deve essere A
La misura delle superfici

b
c
b
c
ABC = AB C = A B C e ACB = AC B = 6.4
c
A C B , il che prova che i due triangoli sono simili.
Ci`o che intuitivamente chiamiamo lestensione di
Sfruttando questi criteri, Talete non avrebbe avuto una superficie pu`o essere misurata se fissiamo unopla necessit`a di aspettare che la sua ombra fosse lunga portuna unit`a di misura. Se u `e il segmento che abtanto quanto lui era alto, ma in qualsiasi momento biamo assunto come unit`a di misura di lunghezza,
a di
avrebbe potuto usare il fattore di proporzionalit`a da- convenzionalmente stabiliamo di usare come unit`
misura
di
superficie
lestensione
di
un
quadrato
di
lato dal rapporto della sua altezza e la lunghezza della
to
u.
Naturalmente,
non
possiamo
pensare
che,
data
sua ombra. Anzi, avrebbe potuto approfittare del
momento in cui i raggi del sole erano perpendicolari una superficie qualsiasi, si riesca a trovare il modo
a un lato della piramide, perche in quel momento i di sovrapporle tanti quadrati u u da ricoprirla perconti sarebbero stati pi`
u semplici. Se capisco bene la fettamente. Come per le lunghezze e gli angoli, `e
descrizione che fu data del calcolo di Talete, sembra opportuno definire multipli e sottomultipli, in modo
che questi aspettasse il giorno e lora in cui la sua da poter associare ad una superficie qualsiasi un cerombra misurava quanto la sua altezza e il sole risul- to numero di quadrati unit`a di misura, ma, se ne `e
tava perpendicolare a un lato della piramide. Santa il caso, anche una certa quantit`a di sottomultipli. Se
la superficie `e grande, potr`a essere inoltre convenienPazienza!
La pi`
u famosa applicazione del teoria della te usare qualche multiplo dellunit`a di misura (vedi
similitudine `e costituita dai due teoremi di Euclide: Sezione 6.1). Con questo in mente, dimostriamo il
seguente teorema che `e alla base della teoria della
Teorema 6.23 (Teoremi di Euclide) Sia ABC misura:
un triangolo rettangolo e sia CH laltezza relativa
Teorema 6.24 Se un rettangolo ha i lati di dimenallipotenusa; allora:
sioni a, b R+ rispetto allunit`
a di lunghezza u, alprimo teorema di Euclide: ciascun cateto `e me- lora la superficie del rettangolo misura ab rispetto aldio proporzionale tra la proiezione di quel cateto lunit`
a di misura delle superfici, cio`e il quadrato di
sullipotenusa e lipotenusa stessa;
dimensioni u2 = u u.
secondo teorema di Euclide: laltezza relativa al- Prova: La prova, come di regola succede per le prolipotenusa `e medio proporzionale fra le due priet`a che chiamano in causa i numeri reali, si divide
proiezioni dei cateti sullipotenusa.
in pi`
u parti, quattro nel caso attuale. Primo caso:

177

6.4. LA MISURA DELLE SUPERFICI


siano a, b N; allora, dividiamo il lato di misura a in
a parti, ciascuna di lunghezza u, e il lato che misura b
in b parti, e tiriamo le parallele allaltro lato passanti
per tali punti di divisione: si ottengono cos` esattamente ab quadrati unitari, e questo prova lasserto.
Secondo caso: siano a, b Q e supponiamo a = m/n
e b = p/q (le due frazioni possono essere ridotte ai
minimi termini, ma la cosa non `e strettamente necessaria). Dividiamo u in nq parti uguali, di modo che
il quadrato unitario viene a contenere n2 q 2 quadretti. Tirando al solito le parallele ai lati dai punti di
divisione, si ottengono mq parti dal primo lato e pn
parti dal secondo. Gli mqnp quadratini cos` ottenuti
vanno divisi per gli n2 q 2 quadretti dellunit`a di misura; si ottiene quindi mqnp/n2 q 2 = mp/nq = ab. La
terza parte riguarda il caso a Q e b R: non si pu`o
pi`
u agire come prima, ma si prendono due sequenze
di Cauchy di numeri razionali {si }iN e {ti }iN che
approssimano, per difetto e per eccesso, il numero b.
Per a e gli si , come per a e i ti , si pu`o procedere
analogamente a quanto fatto nel secondo caso e si ottengono misure {asi }iN e {ati }iN che determinano
la misura ab. Infine, se entrambe le misure a, b sono
numeri reali, si procede in modo simile prendendo
successioni di Cauchy che approssimano, per eccesso
e per difetto, le due quantit`a a, b R.

za tra gli altri due lati paralleli, allora larea del


parallelogramma vale ah.
Prova: Nella Figura 6.19, sia E il punto di incontro
di AB con la perpendicolare da C al lato DC; sia poi
DF perpendicolare ad AB. I due triangoli AF D e
BEC sono congruenti per il secondo criterio e quindi
ABCD `e equivalente al rettangolo F ECD, la cui area
`e proprio bh.
C
A

B
B

D
C
H

Figura 6.20: Area del triangolo


Naturalmente, larea del triangolo `e di importanza
non trascurabile:
Teorema 6.26 Sia dato un triangolo ABC, sia
AB = b un suo lato e CH = h laltezza relativa a
tale lato; allora larea del triangolo `e bh/2.

Di solito, la misura della superficie di una figura si Prova: Si consideri la Figura 6.20. Sia D il punto
mediano dellaltezza e da D tiriamo la parallela al ladice area e si d`a la seguente definizione:
to AB fino ad incontrare i lati AC e BC nei punti A e
Definizione 6.7 Due figure si dicono equivalenti se
B , rispettivamente. Su tale retta si consideri il punhanno la stessa area. Si dicono invece equiscompoto C tale che B C = A B . Per il teorema di Talete
nibili se sono scomponibili nello stesso numero finito
`e anche CB = BB e A C = AA = BC . Quindi
di parti congruenti.
i due triangoli A B C e BC B sono congruenti per
Chiaramente, due figure equiscomponibili hanno la il primo criterio. In particolare, BC risulta parallestessa area. Lequiscomponibilit`a `e un metodo for- lo ad AC; quindi il triangolo ABC `e equivalente al
te per trovare la misura della superficie delle figu- parallelogramma ABC A la cui area `e bh/2.
re, e non sempre risulta sufficiente, come capita nel
La Figura 6.21 mostra come larea del trapezio sia
ben noto problema della quadratura del cerchio, e data dalla formula (a + b)h/2 e quella del rombo da
cio`e trovare un quadrato equivalente a un cerchio ab/2; il lettore `e invitato a specificare i dettagli deldato: questo problema richiede unaltra impostazio- le dimostrazioni, che costituiscono un buon esercizio,
ne che vedremo pi`
u avanti. Per i poligoni, lequi- anche se molto semplice, di ragionamento geometrico.
scomponibilit`a `e il concetto adeguato al calcolo delle
aree.
a
b
b
a
D
C
a

Figura 6.21: Area del trapezio e del rombo


A

Figura 6.19: Area del parallelogramma


Teorema 6.25 Sia ABCD un parallelogramma e
sia a = AB = CD un lato. Se h `e la distan-

Vogliamo osservare che i due teoremi di Euclide si


possono formulare in termini di figure equivalenti:
1. il quadrato costruito su un cateto `e equivalente al rettangolo che ha per lati lipotenusa e la
proiezioni del cateto sullipotenusa;

178

CAPITOLO 6. GEOMETRIA EUCLIDEA

2. il quadrato costruito sullaltezza relativa allipo- centrale ha lato b a, la differenza dei due cateti;
tenusa `e equivalente al rettangolo che ha per lati pertanto, larea del quadrato grande `e:
le proiezioni dei cateti sullipotenusa.
ab
c2 = 4 + (b a)2
2
b

a
a

b
a

c
b

Figura 6.22: Teorema di Pitagora


Sulla stessa linea di questi teoremi c`e il
fondamentale:
Teorema 6.27 (di Pitagora) Un triangolo `e rettangolo se e solo se il quadrato costruito sullipotenusa `e equivalente alla somma dei quadrati costruiti
sui cateti.

e semplificando si trova c2 = a2 + b2 . Una semplice applicazione del primo teorema di Euclide d`a una
terza dimostrazione del teorema di Pitagora. Come si vede dalla Figura 6.24, il quadrato costruito
sul cateto AC `e equivalente al rettangolo ADKH e
il quadrato costruito sul cateto BC `e equivalente al
rettangolo HKEB. Gi`a nel 1928 il matematica inglese Loomis ha pubblicato un libro nel quale raccoglie oltre centocinquanta dimostrazioni del Teorema
di Pitagora.

C
Prova: Esistono moltissime dimostrazioni di questo
teorema. Una delle pi`
u belle fa diretto riferimento allequiscomponibilit`a. I due quadrati della figura sono
cos` formati: il primo da quattro triangoli rettangoli
A
H
B
congruenti e dai quadrati dei due cateti; il secondo
dagli stessi quattro triangoli e dal quadrato dellipotenusa. Per differenza, si ha immediatamente il teorema. Viceversa, supponiamo che i tre lati a, b, c di
un triangolo siano tali che a2 + b2 = c2 ; costruiamo il
quadrato di lato a + b come nel primo disegno della
D
K
E
figura: i quattro triangoli sono congruenti per il primo criterio e quindi sia c la lunghezza di ciascuno dei
due segmenti obliqui. Costruiamo ora il secondo quaFigura 6.24: Pitagora ed Euclide
drato della figura, nella quale il lato obliquo risulta
essere di lunghezza c per la prima parte del teorema;
Il teorema di Pitagora era noto agli Egizi, almeno
questo per`o implica a2 + b2 = c2 , cio`e c2 = c2 . Es- nel caso delle misure (3, 4, 5) dei lati, come s`e visto
sendo c, c positivi questo significa c = c e perci`o il nella costruzione delle rette perpendicolari. Le tertriangolo originale era rettangolo.
ne di numeri naturali (a, b, c) tali che a2 + b2 = c2
si dicono terne Pitagoriche e il lettore pu`o direttamente verificare che tali sono (5, 12, 13) e (8, 15, 17),
oltre naturalmente alla citata (3, 4, 5). Se abbiamo
una terna Pitagorica e moltiplichiamo i tre numeri
per uno stesso valore, otteniamo ancora una terna
Pitagorica, come (6, 8, 10). In realt`a, si vede immeba
diatamente che i tre numeri a, b, c sono a due a due
primi tra loro, oppure hanno tutti e tre un fattore comune. Infatti, se ad esempio a, b avessero un fattore
a
a
comune k, allora sarebbe a = kr e b = ks e quindi
c
c2 = k 2 r2 + k 2 s2 = k 2 (r2 + s2 ), cos` che k risulterebbe anche un divisore di c. Le terne Pitagoriche per
Figura 6.23: Pitagora per differenza
le quali a, b, c non hanno fattori comuni si dicono primitive. E possibile trovare tante terne Pitagoriche
Unaltra bella dimostrazione richiede luso di un quante si vogliono:
po di Algebra; si consideri la Figura 6.23. Il quadrato

179

6.4. LA MISURA DELLE SUPERFICI

Teorema 6.28 Dati due qualsiasi numeri interi ABC. Si ha pertanto la proporzione AC : AF =
m, n con m > n, la terna costituita dei numeri AB : BF . Vale allora il seguente:
a = m2 n2 , b = 2mn, c = m2 + n2 `e Pitagorica.
Teorema 6.30 Se `e la misura del lato obliquo nel
Prova: Basta eseguire semplici calcoli:
triangolo
armonico, allora la misura della base `e

( 5 1)/2.
a2 + b2 = (m2 n2 )2 + 4m2 n2 =
Prova: Se poniamo AF = AB = x e BF = CB
= m4 + 2m2 n2 + n4 = (m2 + n2 )2
CF = x nella precedente proporzione, otteniamo
: x = x : ( x). Questo equivale allequazione

che danno il risultato desiderato.


x2 +x2 = 0 che ha come soluzioni (1 5)/2; la
Lasciamo al lettore la dimostrazione del fatto che soluzione col segno `e negativa e quindi deve essere
se m ed n sono primi tra loro, allora la terna Pitago- scartata (una lunghezza non pu`o essere negativa) e
rica che si ottiene `e primitiva. Questo dimostra che le quindi segue lasserto del teorema.

terne Pitagoriche diverse sono infinite. Meno semIl numero (


5 1)/2 0.6180339887, o meglio,
plice `e dimostrare che quelle cos` ottenute sono tutte
5 + 1)/2 1.6180339887, `e detto
il
suo
inverso
(
le terne Pitagoriche possibili e questo noi qui non lo
rapporto
armonico
o rapporto aureo e si indica con
vedremo.
la
lettera
greca
.
Abbiamo gi`a incontrato questa
Dal teorema di Pitagora discendono infinite conquantit`
a
a
proposito
dei numeri di Fibonacci, nella
seguenze importanti. Qui ci limitiamo a ricordare
Sezione
4.3;
esiste
infatti
una stretta connessione tra
quelle che interessano direttamente alcuni particolari
questi
due
concetti.
Dato
un segmento AB `e facile
triangoli.
costruire un segmento CD che sia in rapporto con
Teorema 6.29 Se `e la misura del latodi un qua- AB e che si dice costituirne la sezione aurea.
drato, allora la sua diagonale misure 2. Se `e
la misura del lato
la sua Algoritmo 6.4 (Sezione aurea)
di un triangolo equilatero,

Ingresso: un segmento AB di lunghezza .


altezza misura 3/2 e la sua area 2 3/4.
Uscita: un segmento CD di lunghezza /.
Prova: Due lati consecutivi del quadrato e la diago1. si riporti due volte consecutive il segmento AB su
nale d costituiscono
un
triangolo rettangolo, per cui

una retta r; siano A B e B B i due segmenti;


si ha d = 2 + 2 = 2. Analogamente, se ABC
`e un triangolo equilatero, esso risulta anche un trian2. da B si costruisca la perpendicolare ad r e su di
golo isoscele.
Dalla
Figura
6.14,
posto
h
=
CM
,
si
questa, a partire da B , si riporti un segmento
p

ha h = 2 + 2 /4 = 3/2. La formula per larea


B C di lunghezza ;
si ha eseguendo h/2.
3. siunisca A con C (il segmento A C ha lunghezza
Un caso interessante `e il seguente. Si consideri un
5);
triangolo isoscele che abbia langolo opposto alla base di 36 , come nella Figura 6.25. Questo significa
4. a partire da A , si riporti un segmento A D =
che ogni angolo alla base vale (180 36 )/2 = 72 .
AB
su AC (il segmento DC ha come lunghezza
Tale triangolo viene detto triangolo armonico per la
( 5 1));
propriet`a che vedremo.
5. si divida a met`
a, nel punto M , il segmento CD;
uno qualsiasi
C
dei due segmenti DM e CM ha
lunghezza ( 5 1)/2 = /.
36

Nota 6.3

F
A

Figura 6.25: Il triangolo armonico


Da A portiamo la bisettrice AF allangolo in A;
b = F AC
b = 36 e AFbB = 72 . I triangoli
quindi B AF
AF C e ABF sono isosceli e questultimo `e simile ad

I Greci consideravano particolarmente


armonioso il rapporto aureo; se si costruisce un rettangolo di dimensioni AB = e BC = /, e si riporta
laltezza AD sulla base AB, il rettangolo EBCF `e di
nuovo tale che EB = BC/. La costruzione si pu`
o
ripetere allinfinito, come mostrato nella Figura 6.26.
Si osservi infatti che, per costruzione, `e AE = AB/
e quindi vale la proporzione AB : AD = AD : EB
in quanto EB = AB AE, e questo significa
AD : EB = AB : AE = . E interessante la curva
che si ottiene dai quarti di circonferenza che uniscono
vertici opposti e detta spirale armonica. Si dice che i

180

CAPITOLO 6. GEOMETRIA EUCLIDEA


F

A
A

templi greci fossero costruiti in modo da conformarsi


alla sezione aurea e il rapporto armonico fu (sembra)
molto utilizzato da colui che `e considerato il maggiore
artista greco, e cio`e Fidia; la lettera `e presa infatti
dalliniziale del suo nome. Curiosamente, il rapporto
tra due numeri consecutivi della successione di
Fibonacci tende a diventare uguale a ; ad esempio,
55/34 = 1.618, e ln-esimo
numero si pu`
o scrivere

come (n (1/)n )/ 5: provare per credere, ma


il risultato `e esatto (v. Teorema 4.11). Il numero
ha colpito anche la fantasia dei moderni, ed `e famoso
il Modulor, il canone inventato da Le Corbusier e
basato sul rapporto aureo; il famoso architetto lo
propose per costruire edifici e oggetti a misura
duomo. Per ulteriori informazioni si legga il libro
di Mario Livio La sezione aurea edito in Italia da
Rizzoli (2003).

Luoghi geometrici

@
B

Figura 6.26: La spirale armonica

6.5

P
@
@

Figura 6.27: Asse di un segmento


AM P e M BP sono congruenti per il primo criterio.
Infatti, AM = BM per costruzione, P M `e in comune e gli angoli in M sono uguali perche retti. Quindi
AP = P B e il punto P appartiene allasse. Viceversa, prendiamo un punto P tale che P A = P B (cio`e
stia sullasse) e uniamolo ad M , punto medio di AB.
Questa volta i due triangoli AM P e M P B sono congruenti per il terzo criterio, essendo AP = P B per
ipotesi, AM = BM per costruzione e P M in comune.
cP = B M
cP , che pertanto risultano retti.
Quindi AM
In conclusione, P si trova sulla retta r perpendicolare
ad AB.
Duale del concetto di asse di un segmento `e il
concetto di bisettrice di due rette:
Definizione 6.9 Date due rette [che si intersecano],
si dice bisettrice delle due rette il luogo dei punti da
esse equidistanti.
Abbiamo messo tra parentesi quadre il fatto che le
rette si intersechino; se non lo fanno, se cio`e sono parallele, il concetto di bisettrice ancora sussiste, ma
in tal caso la bisettrice si riduce alla retta, parallela alle rette date e passante a met`a distanza tra le
due. Il lettore trover`a utile lesercizio di dimostrare
rigorosamente questo fatto. Se invece le due rette si
incontrano:

Una figura `e costituita da un insieme di punti; ad


esempio, un triangolo `e la parte finita del piano delimitata da tre rette, a due a due non parallele. Talvolta, la propriet`a che definisce i punti di una figura
`e particolarmente semplice e suggestiva: si parla allora di tali figure come di luoghi geometrici o luoghi
di punti. Lesempio pi`
u semplice `e senzaltro lasse di
un segmento:
Teorema 6.32 La bisettrice di una coppia di rette
incidenti in O `e costituita da due rette passanti per
Definizione 6.8 Dato un segmento AB, si dice as- O, perpendicolari tra loro, che tagliano a met`
a gli
se di tale segmento linsieme (il luogo) dei punti che angoli formati dalle rette date.
hanno la stessa distanza da A e da B.
Prova:
Sia P un punto della retta tale che
Chiaramente, il punto di mezzo M del segmen- AOP
b = B OP
b ed uniamo P alle due rette r ed s
to appartiene allasse, ed `e facile vedere che lasse con le perpendicolari P A e P B. I due triangoli BOP
`e semplicemente una retta:
e OAP sono congruenti per il secondo criterio: il lato
b
b
b
Teorema 6.31 Lasse del segmento AB `e la retta OP `e in comune, AOP = B OP per costruzione e A
b
b
b
perpendicolare ad AB che passa per il suo punto di e B retti. Quindi abbiamo anche AP O = B P O e
P A = P B, cio`e P appartiene alla bisettrice. Per il
mezzo M .
viceversa, se P `e tale che P A = P B, P O `e in comub e in B
b sono retti, per il teorema
Prova: Si consideri la Figura 6.27. Sia r la perpen- ne e gli angoli in A
dicolare per M ad AB; se il punto P sta su r e lo di Pitagora `e anche AO = BO, onde i due triangouniamo con A e con B, vediamo che i due triangoli li P OA e P OB sono congruenti per il terzo criterio.

181

6.5. LUOGHI GEOMETRICI


H

HH

s
HHA

HH

b
HH

H
PA
H
O
HH
A

HH
AA

HH
r
B

W
X

M
Y

B
Figura 6.31: Baricentro

Figura 6.28: Bisettrici di due rette incidenti


b = B OP
b e quindi P appartiene
In particolare, AOP
b
alla retta che divide in due langolo AOB.
Lo stesso

ragionamento vale per la retta b . Infine, i quattro


angoli formati da b e b sono uguali tra loro come
b + AOb
b ) e
somma di angoli uguali (ad esempio, P OA
quindi sono angoli retti.
Dato un angolo, per bisettrice dellangolo si intende
la semiretta compresa nellangolo, e si ignorano le
altre tre semirette.

1. gli assi dei tre lati si incontrano in un punto,


detto il circumcentro o circocentro del triangolo;
2. le bisettrici dei tre angoli si incontrano in un
punto, detto lincentro del triangolo;
3. le altezze relative ai tre lati si incontrano in un
punto detto ortocentro del triangolo;
4. le mediane dei tre lati si incontrano in un punto
detto il baricentro del triangolo.

Prova: (1) Nella Figura 6.29, gli assi dei lati AB


e BC si incontrano in un punto D che, per costruzione, `e equidistante da tutti e tre i vertici; quindi, tale punto deve appartenere anche allasse di CA.
(2) Analogamente, nella stessa figura, le bisettrici deb e C
b si incontrano in un punto E che,
N
gli angoli A
per costruzione, `e equidistante da tutti e tre i laE
ti, e quindi deve appartenere anche alla bisettrice
D
b (3) Con riferimento alla Figura 6.30, si codi B.
struiscano le rette per A, B, C parallele, rispettivamente, ai lati BC, AC, AB del triangolo. Esse deA
M
B
terminano il triangolo P QR e considerati i paralleFigura 6.29: Incentro e circocentro
logrammi ABP C, BCQA, ARBC, si trova che i lati
P Q, QR, P R sono il doppio di AB, BC, CA. Pertanto, le altezze AHA , BHB , CHC sono gli assi dei lati
Q
C
P
QR, RP, P Q, che si incontrano in un punto H per
H
A
il
primo asserto. (4) Infine, facendo riferimento alla
HB
Figura 6.31, siano M, N, P i punti di mezzo dei lati
del triangolo ABC. Sia W il punto di incontro delle
due mediane BN ed AM e si considerino i segmenti
M
N ed XY , dove X ed Y sono i punti mediani di
A
B
HC
AW e BW . Per il Teorema di Talete, M N = XY ed
entrambi sono met`a di AB. I due triangoli W M N e
W XY sono uguali, avendo uguali i tre angoli ed i lati
M N ed XY . Questo significa che W divide sia BN
che AM in due parti, di cui una `e doppia dellaltra.
R
Si esegua la stessa costruzione relativa alle mediane
Figura 6.30: Ortocentro
AM e CP : si trova che il punto di intersezione W
le divide in due parti, di cui una `e doppia dellalAssi e bisettrici sono importanti nei triangoli, dove tra. Questo per`o significa che M W = M W , essendo
abbiamo il seguente risultato:
entrambi un terzo di AM , e quindi W = W .
C

Teorema 6.33 Sia ABC un triangolo; allora:

E allora immediato il seguente:

182

CAPITOLO 6. GEOMETRIA EUCLIDEA

Corollario 6.34 Il baricentro di un triangolo divide la circonferenza, che rimane tutta dalla stessa parte
ciascuna delle tre mediane in due parti, di cui una `e rispetto ad r. Viceversa, sia s una retta per P non
perpendicolare ad OP . Tiriamo da O la perpendidoppia dellaltra.
colare ad s, che incontrer`a s in un punto M ; per il
Eulero osserv`o che lortocentro, il baricentro e il cir- teorema di Pitagora OM < OP e quindi M `e intercumcentro sono allineati; lasciamo per`o da parte la no alla circonferenza. Se P `e il punto su s tale che
dimostrazione di questa curiosa propriet`a.
P M = M P (ma dalla parte opposta di P rispetto ad
Sicuramente, il luogo geometrico pi`
u importante `e M ), abbiamo P O = P O e quindi P sta sulla circoncostituito dalla circonferenza:
ferenza. Quindi la retta s incontra la circonferenza in

Definizione 6.10 Si dice circonferenza di raggio r il almeno due punti P e P e non la lascia tutta dalla
luogo dei punti che hanno distanza r da un punto fis- stessa parte. Quindi r `e unica.
sato O, detto centro della circonferenza. Si dice cerchio di raggio r il luogo dei punti che hanno distanza
minore o uguale ad r da un punto O detto centro del
cerchio. Ogni segmento (di lunghezza r) che unisce
il centro del cerchio o della circonferenza al bordo del
cerchio o alla circonferenze si dice raggio. Due raggi
distinti che giacciono sulla stessa retta costituiscono
un diametro, la cui lunghezza `e pertanto 2r.
Naturalmente, una circonferenza determina un cerchio, costituito da tutti i punti interni alla circonferenza, e viceversa un cerchio determina una circonferenza, data dai punti del suo bordo o contorno. E
bene tuttavia usare la terminologia appropriata per
non creare confusione o ambiguit`a; ad esempio, la misura della circonferenza `e una misura lineare, mentre
la misura del cerchio `e una misura di superficie.

P
Q

O
r

Figura 6.32: Tangente a una circonferenza


Teorema 6.35 Sia data una circonferenza di centro
O e raggio r, e sia P un punto su di essa. Esiste
una e una sola retta r che passa per P e lascia tutta
la circonferenza dalla stessa parte. Tale retta risulta
perpendicolare al raggio OP e si dice la tangente in
P alla circonferenza.

Tornando un attimo ai triangoli, si osservi che il circumcentro D `e equidistante dai tre vertici del triangolo e quindi se si disegna una circonferenza di centro
D e passante per uno dei vertici, essa toccher`a anche gli altri due, lasciando il triangolo al suo interno.
Questa circonferenza risulta circoscritta al triangolo,
ed `e per questo che il circumcentro ha tale nome. In
modo simile, lincentro E `e equidistante dai tre lati,
pertanto se disegniamo una circonferenza di centro
E e raggio dato dalla distanza di E da uno qualsiasi
dei tre lati del triangolo, questa circonferenza risulta
tangente ai tre lati ed `e tutta contenuta allinterno
del triangolo; si dice che questa `e la circonferenza inscritta nel triangolo, ed `e per questo che E si dice
lincentro.
Altri luoghi geometrici importanti sono le cosiddette coniche: lellisse, la parabola e liperbole; come
si sa, queste curve hanno il nome di coniche perche
possono essere ottenute intersecando un cono con un
piano. Per cono si intende la figura solida originata
da una retta che ruota nello spazio intorno ad unaltra retta ad essa incidente: la retta ruotante si dice
la generatrice del cono, mentre la retta fissa `e detta
lasse del cono, e il loro punto dincontro si dice il
vertice del cono (si veda anche la Sezione 6.8). Se si
considera un piano incidente con lasse del cono, lintersezione risulta unellisse; nel caso particolare in cui
il piano sia perpendicolare allasse si ottiene una circonferenza, che pertanto deve essere considerata una
conica, caso particolare di ellisse. Se il piano `e parallelo alla generatrice, la figura che si ottiene `e una
parabola. Infine, se il piano `e parallelo allasse, si ha
uniperbole.
Queste definizioni classiche sono, comunque, meno
utili nella pratica delle definizioni di queste curve come luoghi geometrici; come vedremo, le definizioni saranno utilizzate in Geometria Analitica per ottenere
lequazione delle curve.

Definizione 6.11 Dati due punti F1 ed F2 , detti


Prova: Nella Figura 6.32 si consideri la retta r pas- fuochi, si dice ellisse il luogo geometrico dei punti la
sante per P e perpendicolare ad OP . Se prendiamo su cui somma delle distanze da F ed F `e costante.
1
2
r un punto Q diverso da P , il triangolo OP Q `e retto
Come conseguenza di questa definizione, lellisse
in P e quindi, per il teorema di Pitagora, OQ > OP ;
quindi r non ha altri punti in comune, se non P , con (vedi Figura 6.33) risulta essere una figura limitata,

183

6.6. LA GEOMETRIA DELLA CIRCONFERENZA

P
b

b
b

b
b

F1

F2

b
b

bF

d
Figura 6.33: Costruzione dellellisse
Figura 6.35: Costruzione della parabola

cio`e racchiusa in una porzione finita del piano, come


la circonferenza; in effetti, se i due fuochi coincidono lellisse diventa proprio una circonferenza avente
F1 = F2 come centro, e per raggio la met`a della costante, somma delle distanze dai fuochi. In modo
analogo:

`e la costruzione dellellisse, che generalizza il metodo


empirico per disegnare una circonferenza, cio`e piantare uno spillo nel centro della circonferenza e tenere
una matita a distanza fisse collegandola allo spillo con
una cordicella. Per lellisse, come si vede nella Figurs
Definizione 6.12 Dati due punti F1 ed F2 , detti 6.33, fissati due spilli nei fuochi e unitoli con una corfuochi, si dice iperbole il luogo geometrico dei punti dicella di lunghezza uguale alla somma delle distanze,
la cui differenza delle distanze da F1 ed F2 `e costante. la figura si ottiene facendo scorrere la matita lungo la
corda, cos` che questa rimanga sempre distesa. Ancora oggi i giardinieri tracciano i confini delle aiole
a forma di cerchio e di ellisse con questi metodi; al
posto degli spilli usano paletti e invece di filo utilizzano una corda. Pi`
u complessa `e la costruzione pratica
delliperbole e della parabola, che si possono comunque disegnare per punti seguendo le corrispondenti
definizioni. Comunque, liperbole della Figura 6.34 `e
Fb1
Fb2
stata costruita per punti in modo analitico, come si
imparer`a nel prossimo capitolo.

6.6

Figura 6.34: Liperbole


In questo caso (v. Figura 6.34), i punti delliperbole possono essere distanti dai fuochi quanto si vuole,
purche la differenza rimanga fissata; pertanto, liperbole `e una figura non limitata. Analogamente non
limitata `e la parabola:
Definizione 6.13 Dato un punto F detto fuoco e
una retta d detta direttrice, si dice parabola il luogo
dei punti equidistanti da F e da d.
Le definizioni possono essere utilizzate per costruire effettivamente le curve. Particolarmente semplice

La geometria della circonferenza

Le propriet`a della circonferenza sono interessanti


quanto quelle dei triangoli, e, come questi sono i poligoni che pi`
u spesso si incontrano nella pratica, cos` la
circonferenza `e la curva non poligonale pi`
u frequente.
Il fatto che possa essere disegnata in modo elementare
con il compasso, la rende di facile uso e, daltra parte, sembra che la Natura si sia ispirata pi`
u alle forma
rotonde che a quelle poligonali. Una caratteristica
importante `e costituita dal fatto che la circonferenza `e determinata univocamente da tre dei suoi punti.
Ci`o `e stabilito da un teorema e dalla corrispondente
costruzione:
Teorema 6.36 Dati tre punti non allineati A, B, C
esiste una e una sola circonferenza che passi per tali
tre punti

184

CAPITOLO 6. GEOMETRIA EUCLIDEA


C

Figura 6.36: Circonferenza per tre punti


Prova: Si consideri la Figura 6.36. Sia r lasse
del segmento AB e sia s lasse del segmento BC. Se
A, B, C non sono allineati, r ed s non sono paralleli
e si incontrano nel punto O. Questo punto ha la
stessa distanza da A e da B (trovandosi sullasse r del
relativo segmento) e da B e da C (trovandosi sullasse
s del relativo segmento). Quindi, la circonferenza di
centro O e raggio OA = OB = OC passa per i tre
punti, ed `e unica, avendo centro e raggio determinati.

C e D, langolo determinato dalle due semirette si


dice angolo alla circonferenza. Se un angolo al centro
e un angolo alla circonferenza determinano lo stesso arco AB, si dicono corrispondenti; se invece uno
determina larco AB e laltro larco esplementare, si
dicono corrispondenti esplementari.
Si osservi che raddoppiando langolo al centro anche
larco circolare corrispondente raddoppia; ci`o ci dice che angoli ed archi sono grandezze direttamente
proporzionali, e questo fatto, importante di per se,
verr`a usato in Trigonometria per definire la misura
in radianti degli angoli.
P
Ob

Ob

Figura 6.38: Angoli al centro e alla circonferenza - 1


Le propriet`a principali della circonferenza sono leQuesta lunga definizione introduce una serie di congate alla seguente definizione, per la quale si faccia
cetti importanti, che vanno ritenuti esattamente, inriferimento alla Figura 6.37.
sieme alla definizione di retta tangente. Si ha allora
il fondamentale risultato:
P

Teorema 6.37 Sia data una circonferenza di centro


b `e
O e sia P un punto qualsiasi su di essa; se AOB
un angolo al centro ed APbB un suo corrispondente
angolo alla circonferenza, allora il primo `e il doppio
del secondo.

Prova: Sono da considerare tre casi, a seconda delle


posizioni reciproche dei punti. Nel primo caso (Figura 6.37) si osservi che i triangoli AOP e BOP sono
AC
BD
b =
isosceli; per il teorema dellangolo esterno: QOA
b + APbO = 2APbO e QOB
b = OBP
b + B PbO =
OAP
Q
2B PbO; sommando membro a membro queste due
b = 2APbB. Nel secondo caso
uguaglianze si ha: AOB
Figura 6.37: Propriet`a della circonferenza
(Figura 6.38, a sinistra) AOP e BOP sono ancora
isosceli; il teorema dellangolo esterno questa volta
d`a:
Definizione 6.14 Data una circonferenza, si dice
b = OPbA + AOP
b = 2OPbA
AOQ
angolo al centro ogni angolo che abbia come vertice il
b = OPbB + P BO
b = 2OPbB;
B OQ
centro O della circonferenza. Se le due semirette che
formano langolo incontrano la circonferenza nei pun- facendo la differenza si ha AOB
b = 2APbB. Infine, nel
ti A e B, la parte di circonferenza interna allangolo caso di transizione (Figura 6.38, a destra), il teorema
si dice arco circolare interno; laltra parte si dice arco
b = OPbB +P BO
b =
dellangolo esterno d`a subito AOB
circolare esterno o esplementare. La parte di cerchio
b
2AP B, essendo isoscele il triangolo BOP .
compresa nellangolo si dice settore circolare e il segCome si capisce dalla dimostrazione, la posizione
mento che unisce i due punti A e b `e detto corda. Se
P `e un punto della circonferenza e da esso partono del punto P sulla circonferenza `e inessenziale. Cosa
due semirette che tagliano la circonferenza nei punti succede allora quando P si avvicina ad A o a B, tanto

185

6.6. LA GEOMETRIA DELLA CIRCONFERENZA


da confondersi con tali punti? Quando P tende ad
A, la semiretta P B rimane ben identificata, ma cosa
accade alla semiretta P A? Si pu`o intuire che essa si
trasformi nella tangente passante per A P e quindi
ci possiamo aspettare che il teorema valga anche in
questo caso limite. Possiamo comunque stabilire questo fatto con un teorema che consideri la situazione
come un problema a se stante, e non un problema al
limite (vedere Figura 6.39 a sinistra):

Ob

O
A

B
r

B
P

Corollario 6.41 Un triangolo inscritto in una semicirconferenza `e retto e, viceversa, ogni triangolo rettangolo pu`
o essere inscritto in mezza
circonferenza.
Prova: Se un triangolo `e inscritto in mezza circonferenza, allora lipotenusa coincide con un diametro;
esso determina un angolo al centro di 180 , e quindi
langolo opposto, come corrispondente alla circonferenza, vale 90 . Per il viceversa, basta osservare che il
circumcentro del triangolo `e giusto il punto di mezzo
dellipotenusa.
Questo corollario `e alla base di molte considerazioni
sui triangoli rettangoli ed `e quasi importante come il
Teorema di Pitagora. Vediamo, a mo di esempio, come questo corollario, abbinato ai teoremi di Euclide,
ci permetta di trovare il medio proporzionale tra due
segmenti (vedere Figura 6.40):

Figura 6.39: Angoli al centro e alla circonferenza - 2


b un angolo al centro e sia
Teorema 6.38 Sia B OA
b
B Ar langolo formato dalla retta AB e dalla retta
b =
tangente alla circonferenza r in A; allora B OA
b
2B Ar, che pertanto pu`
o essere considerato un angolo
alla circonferenza di tipo degenere.

M BCH D

Figura 6.40: Costruzione del medio proporzionale


b `e retto, si ha: B Ar
b =
Prova: Poiche langolo OAr
b
90 OAB;
il triangolo BAO `e isoscele e quindi
b
b cio`e B OA
b = 180 2(90 Algoritmo 6.5 (Medio proporzionale)
B OA = 180 2OAB,
Ingresso: Due segmenti AB e CD;
b
b
B Ar) = 2B Ar, che `e ci`o che volevamo dimostrare.
Uscita: Il segmento P H tale che AB : P H = P H :
Ci possiamo ora chiedere cosa succede se consi- CD.
deriamo langolo esplementare (vedere Figura 6.39 a
1. si riportano su una retta i due segmenti in modo
destra):
che B C; si ottiene cos` il segmento AD;
b
b
Teorema 6.39 Sia AOB un angolo al centro e AP B
2. dal punto di mezzo M di AD si traccia una
un angolo alla circonferenza che insiste sullarco
semicirconferenza di raggio AM ;
b
b `e doppio del
esplementare di AOB.
Allora AOB
3. dal punto B C H si traccia la perpendicolasupplementare di APbB.
re ad AD fino ad incontrare la semicirconferenza
b langolo esplementare di
Prova: Sia 360 AOB
nel punto P (si osservi che ADP `e un triangolo
b che insiste sullarco esplementare AB; per il
AOB
rettangolo, di cui AB e CD sono le proiezioni
b = 2APbB, cio`e
Teorema 6.37 si ha allora: 360 AOB
dei cateti sullipotenusa);

b
b
AOB = 2(180 AP B) che `e proprio la propriet`a che
4. il segmento P H `e il medio proporzionale cercato
volevamo dimostrare.
(P H `e laltezza relativa allipotenusa).
Ricco di applicazioni `e anche il seguente:
Corollario 6.40 Se un quadrilatero `e inscritto in
una circonferenza, allora gli angoli opposti sono
Teorema 6.42 Sia data una circonferenza e sia P
supplementari.
un punto fuori di essa. Sia P T una tangente da P
alla circonferenza e sia P AB una retta secante la cirProva: Infatti sono angoli alla circonferenza che
conferenza che la taglia nei punti A e B. Vale allora
insistono su un arco e sul suo esplementare.
la proporzione: P A : P T = P T : P B, cio`e il segmenUna conseguenza molto importante dei teoremi to di tangente `e medio proporzionale tra i segmenti
visti `e il seguente:
staccati su una secante della circonferenza.

186

CAPITOLO 6. GEOMETRIA EUCLIDEA


leggermente semplificare e si ottiene una formula interessante quando come secante alla circonferenza si
considera la retta OP :

d
A

A
B
Figura 6.41: Tangente e secanti dallo stesso punto
Prova: Si congiungano (v. Figura 6.41) A e B con
T e si considerino i triangoli P AT e P T B; essi sono
simili perche hanno langolo Pb in comune e gli angoli
b e ATbP uguali, poiche entrambi insistono sulABT
larco AT (quindi anche i terzi angoli sono congruenti). Da questa similitudine discende la proporzione
cercata.
Questo significa che il prodotto P A P T `e costante
e quindi se, come in figura, P A B `e unaltra secante
alla circonferenza, si ha P A?P B = P AP B = P T 2 .
Poiche il medio proporzionale si sa costruire, questo
teorema permette di trovare il punto T di tangenza
alla circonferenza di una retta passante per P :
Algoritmo 6.6 (Tangenti da un punto esterno)
Ingresso: Una circonferenza e un punto P ad
essa esterno;
Uscita: I punti di tangenza sulla circonferenza delle
rette passanti per P ;
1. Si traccia una secante P AB qualsiasi;
2. Si costruisce, come visto in precedenza, il medio
proporzionale tra i segmenti P A e P B; sia CH
tale segmento;
3. con il compasso, facendo centro in P , si traccia
una circonferenza di raggio CH;
4. i punti in cui questa circonferenza taglia quella
data sono i punti di tangenza cercati;
5. si uniscono, se si vuole, al punto P .
Sia data una circonferenza di centro O. Se P `e
un punto del piano che non sia il centro della circonferenza, si dice distanza di P dalla circonferenza
la lunghezza del segmento P A, dove A `e il punto di
intersezione della circonferenza con la retta P O. E
chiaro che se P O, la distanza `e il raggio della
circonferenza e che se P si trova sulla circonferenza
la distanza `e zero. I risultati precedenti si possono

Corollario 6.43 Se P `e un punto esterno a una


circonferenza di raggio r e d `e la distanza di P
dalla circonferenza, allora la misura t del segmento Pp
T che unisce P a uno dei punti di tangenza `e:
t = d(d + 2r).

Prova: Come detto, basta considerare come secante


la retta P O.

La quantit`a t2 si dice la potenza del punto P rispetto


alla circonferenza. Dalla Figura 6.41, si ha t2 = P A
P B = P A P B .
Il problema di determinare la misura della circonferenza e il calcolo dellarea del cerchio assillarono (se
cos` si pu`o dire) i matematici antichi, e anche quelli
pi`
u moderni, diciamo fino al XIX secolo. Il problema
consiste nel determinare il valore esatto del numero
, il rapporto tra circonferenza e diametro. Gli Egizi
e i Babilonesi si erano accorti che questo rapporto `e
fisso, cio`e indipendente dalla particolare circonferenza o dal particolare cerchio considerato. Essi usavano
stime pi`
u o meno approssimate: stime grossolane come 3 o molto pi`
u accurate come il valore razionale
22/7 = 3.142857 . . .. Immaginando appunto che
fosse un numero razionale, si tent`o di trovare un metodo di scomposizione del cerchio che ne dimostrasse
lequivalenza con una figura, della quale si potesse
trovare direttamente larea (problema della quadratura del cerchio). In effetti, la
cosa avrebbe potuto
funzionare anche se , come 2, fosse stato un numero irrazionale, ma esprimibile per mezzo di radicali. Nonostante infiniti tentativi, nessuno fu capace
di quadrare il cerchio, finche, nel 1882, Lindemann
riusc` a dimostrare che `e un numero trascendente,
cio`e non pu`o essere soluzione di unequazione algebrica (polinomiale) a coefficienti interi. Ci`o implica
che la quadratura del cerchio (o la rettificazione della
circonferenza) `e impossibile se si usano solo la riga
e il compasso. Infatti, come vedremo studiando la
Geometria Analitica, la retta corrisponde ad unequazione algebrica di primo grado e la circonferenza
a una di secondo grado; quindi, ogni problema risolubile con la riga e il compasso corrisponde a un
sistema di equazioni algebriche, equivalente a ununica equazione algebrica, come si pu`o intuire pensando
al metodo di sostituzione.
La determinazione di `e il problema di base della
misurazione di circonferenze e cerchi; infatti, vale il
seguente:
Teorema 6.44 Sia il rapporto tra la misura di una
circonferenza e il suo diametro; dato un cerchio di
raggio r, la sua area misura r2 , e la circonferenza
che lo delimita ha lunghezza 2r.

187

6.7. POLIGONI REGOLARI E CERCHIO


Prova: La misura della circonferenza `e ovvia, per
la definizione di . Per larea, possiamo immaginare
di suddividere il cerchio in tanti triangoli isosceli congruenti con il vertice opposto alla base nel centro e gli
altri vertici in punti molto vicini della circonferenza,
diciamo a distanza a luno dallaltro. Se n `e il numero
di tali triangoli, la lunghezza del perimetro sar`a na
e questa quantit`a `e assimilabile alla lunghezza della
circonferenza 2r quando n `e molto grande. Daltra
parte, quando n `e molto grande, a `e molto piccolo
e quindi lapotema (cio`e laltezza dei vari triangoli)
`e assimilabile al raggio. Questo vuol dire che larea
di ciascun triangolo `e ar/2 e larea del cerchio sar`a
assimilabile a:
nar/2 = 2rr/2 = r2

un suo valore approssimato per difetto e per eccesso. In quanto allarea, `e chiaro che lapotema dei vari
poligoni, al crescere di n, si avvicina sempre di pi`
u
al raggio, e ci`o rende conto di quanto affermato nel
teorema precedente.
Concludiamo questa sezione con la seguente
definizione:
Definizione 6.15 Si dicono concentriche due o pi`
u
circonferenze che hanno lo stesso centro. Larea
compresa tra due circonferenze concentriche si dice
corona circolare.
Per differenza, `e immediato osservare che larea di
una corona circolare determinata da due circonferenze di raggio R ed r (con R > r) `e: A = (R2
r2 ).

come desiderato.

6.7

Figura 6.42: Area del cerchio


Questa dimostrazione, anche se intuitivamente valida, non `e certamente molto rigorosa, almeno nella
forma in cui labbiamo messa. Per cercare di renderla pi`
u precisa, si immagini di costruire dei poligoni
inscritti e circoscritti alla circonferenza che si vuole
misurare (v. Figura 6.42); se questi poligoni hanno
lo stesso numero di lati n e facciamo crescere n tanto quanto vogliamo, il perimetro e larea dei poligoni
si avvicineranno alla lunghezza della circonferenza e
allarea del cerchio, e differiranno tra di loro sempre
meno, fino a che questa differenza non divenga praticamente nulla. Se Pn `e il perimetro del poligono
circoscritto, pn di quello inscritto e c `e la misura della circonferenza, si ha Pn c pn e Pn pn tanto
piccolo da essere pressoche 0; nella terminologia delle successioni di Cauchy, esse determinano lo stesso
numero reale. Ma Pn e pn possono essere calcolati e
questo ci dar`a una forte caratterizzazione di , cio`e

Poligoni regolari e cerchio

Riprendiamo ora la definizione di poligono regolare data nella Sezione 6.2. Se dai vertici disegniamo
le bisettrici agli angoli, queste si intersecano in un
punto detto centro del poligono: infatti, tutti i triangoli determinati dai lati e da queste bisettrici devono
essere uguali per il secondo criterio di congruenza.
Quindi il centro del poligono `e equidistante da tutti
i vertici, e questo significa che il poligono pu`o essere
circoscritto da una circonferenza che ha per raggio la
distanza dal centro di ciascun vertice. Daltra parte, i triangoli considerati sono tutti isosceli, avendo
gli angoli alla base uguali. Quindi la circonferenza
di centro il centro del poligono e raggio la distanza di tale centro dai lati (cio`e laltezza dei triangoli
isosceli), `e inscritta nel poligono. In altri termini, il
poligono `e delimitato da una circonferenza inscritta
e da una circoscritta; il raggio del cerchio inscritto
si dice apotema del poligono ed ha un ruolo molto
importante.
Teorema 6.45 Il perimetro di un poligono regolare
`e dato dal prodotto della misura di ciascuno dei suoi
lati per il numero dei lati stessi. Larea `e data dal
perimetro moltiplicato per lapotema e diviso per 2.
Prova: La relazione per il perimetro `e ovvia. Per
larea, si divida come visto il poligono in tanti triangoli congruenti; larea di ciascun triangolo si ottiene
moltiplicando il lato per lapotema e dividendo per 2.
Moltiplicando ora questo per il numero dei lati, si ha
la formula richiesta.
Da questa formula discende limportanza del concetto
di apotema, la cui misura sar`a indicata con a. Quando frequentavo le Scuole Elementari, ci insegnavano
a trovare larea di un poligono regolare calcolando
lapotema; questo si trovava moltiplicando il lato

188

CAPITOLO 6. GEOMETRIA EUCLIDEA

per un numero fisso, variabile per`o da poligono a poE


D
ligono. Tali numeri erano la mia ossessione, perche
non riuscivo a figurarmi come venissero fuori. Solo
alla Scuola Media il mistero si cominci`o a sciogliere e
quella fu per me una bella conquista. La TrigonomeO
tria risolve il problema, ma nei casi pi`
u semplici sono
F
C
sufficienti considerazioni elementari. Ci proponiamo
pertanto di determinare il valore dellapotema di molti poligoni regolari, esprimendolo in funzione del lato
(la cui lunghezza sar`a indicata con ) e in funzione
A
M
B
del raggio del cerchio circoscritto (la cui lunghezza
sar`a indicata con r); un minimo di algebra ci perFigura 6.44: Esagono regolare
metter`a pertanto di calcolare una qualsiasi delle tre
quantit`a a, , r da ciascuna delle altre. In questa ricerca escluderemo quei poligoni, come lettagono (il Teorema 6.48 Per il poligono
regolare consei lati,
poligono regolare con sette lati) che richiedono no- lesagono, abbiamo: a = 3/2 ed a = r 3/2
zioni che saranno viste solo nel capitolo relativo alla 0.866 r.
Trigonometria. Cominciamo col caso pi`
u semplice:
b vale 360 /6 = 60 e quindi il
Prova: Langolo AOB
triangolo
ABO
`
e
equilatero.
Di conseguenza AB =
Teorema 6.46 Per il pi`
u semplice dei poligoni
regoOB,
cio`
e

=
r
e
questo
conclude
la dimostrazione,
lari, il triangolo equilatero, si ha: a = 3/6
poich
e
lapotema
OM
`
e
laltezza
di
tale triangolo.
0.289 ed a = r/2 = r 0.5.
C

C
D
O

O
A

B
A

N
B

O
Figura 6.43: Triangolo e quadrato
A
Prova: Facendo riferimento alla Figura 6.43, il
centro O `e anche il punto di incontro delle mediane
Figura 6.45: Pentagono e decagono
e quindi lapotema `e OM = OC/2 e questo d`a la seconda formula. Inoltre, come
Il caso del pentagono si affronta meglio se risolvia sappiamo, CM `e anche
laltezza, per cui CM = 3/2; applicando ancora mo il problema per il decagono, il poligono regolare
laregola della mediana abbiamo: OM = CM /3 = con dieci lati:
3/6.
Teorema 6.49 Per il poligono regolare con dieci
Anche per il quadrato la valutazione `e semplice:
lati, il decagono, si ha:
s

Teorema 6.47 Per il poligono regolare conquattro


5+1
5+ 5
1.539
a=
lati, il quadrato, si ha: a = /2 ed a = r 2/2
2
8
0.707 r.
s

5+ 5
Prova: Facendo riferimento alla Figura 6.43, laa=r
0.951 r
potema OM `e chiaramentemet`a del lato CB.Inol8
tre, come si sa, OB = OM 2 da cui OM = r 2/2.
Prova: Con riferimento alla Figura 6.45 dove AB `e il
b vale 360 /10 = 36
lato del decagono, langolo AOB
Saltiamo per il momento il pentagono e passia- e quindi ABO `e il triangolo armonico che conosciamo ad occuparci dellesagono, un altro caso molto mo. Per quanto
visto nel Teorema 6.30 abbiamo:

semplice:
= r ( 5 1)/2; questo permette di calcolare

189

6.7. POLIGONI REGOLARI E CERCHIO

Prova: Facciamo ancora riferimento alla Figura


6.45, immaginando che AC sia il lato del quadrato
e AB = sia quello dellottagono. Poiche ON
`e lapotema del quadrato, abbiamo N B = r r 2/2 =

2
2
2
r(2 2)/2 e di conseguenza AB
= AN + N B =
p

. Quindi AB = = r 2 2 e, vicever(2 2)r2p

2
2
sa, r = / 2 2. Ora, da OM = r2 AM si
2
2
trova OM = (2 + 2)r /4 = a2 , da cui si ricava la
Siamo ora in grado di risolvere il caso del seconda formula. Poi, essendo a2 = r2 (/2)2 , si ha:
pentagono:

2
2
3+2 2 2

a2 =
=
,
Teorema 6.50 Per il poligono regolare con cinque
4
4
2 2
lati, il pentagono, si ha:
espressione equivalente alla prima formula.

s
1+ 5 5+ 5
Per lennagono e lundecagono le cose si fanno pi`
u
0.688
a=
4
10
difficili, ma il lettore potr`a affrontare lutile esercizio

di trovare le espressioni per lapotema del dodecagono


1+ 5
(il poligono regolare con 12 lati) partendo dallesagoa=r
0.809 r.
4
no e procedendo in modo analogo a quanto si `e fatto
Prova: Facendo ancora riferimento alla Figura 6.45, per lottagono.
il segmento AC rappresenta il lato del pentagono e
Abbiamo gi`a osservato che ogni poligono regolare,
ON lapotema. Si prenda B simmetrico di B rispetto oltre ad essere inscritto nella circonferenza di ragb = CB
c B = 72 , si ha B CB
b = gio OA, la distanza del centro del poligono da uno
ad AC, e poiche C BB

18 , per cui CBB `e simile a BOA. Quindi BB : qualsiasi dei suoi vertici, `e anche circoscritto alla cirAB = BC : OB, e poiche BC = AB si ricava:
conferenza che ha per centro O e raggio OM , lapo
!2
tema dello stesso poligono. Vogliamo ora affrontare

51
3 5
1
il calcolo approssimato di seguendo limpostazione
r=
r.
BN =
2
2
4
appena accennata. Ci saranno utili due risultati, il
primo dei quali gi`a lo conosciamo, almeno in un paio
Sottraendo questa quantit`a da OB = r si ha per la- di casi particolari.
potema lespressione desiderata. Per il segmento CN
Teorema 6.52 Sia la misura del lato di un poligosi ottiene allora:
no regolare con n lati inscritto in una circonferenza
s

!2

di raggio unitario; allora la misura del lato del po1+ 5


5 5
2
CN = r2
r2 ; CN = r
.
ligono di 2n lati inscritto nella stessa circonferenza
4
8
`e:
q
p
Facendo infine il rapporto tra lapotema gi`a trovato
= 2 4 2 .
e il lato AC = 2 CN si trova:
Prova: Sia, come nella Figura 6.45, AC = il la s

s
to del poligono di n lati inscritto nella circonferenza
1+ 5
a
2
1+ 5 5+ 5
=
=
unitaria di centro O; sar`a quindi AB = il lato del

4
4
10
5 5
b
poligono di 2n lati, essendo OB la bisettrice di AOC.
Poiche OAC `e un
AN = /2
come desiderato.
ptriangolo isoscele, si hap
e quindi ON = 1 2 /4 e BN = 1 1 2 /4.
Lottagono, il poligono regolare con 8 lati, ha ri- Poiche langolo in M `e retto, si ha il valore di BA:
spetto al quadrato la stessa relazione che il decagov
s
!2
u
r
r
no ha con il pentagono; questa volta, per`o, proceu
2
2

diamo allinverso, sfruttando le nostre conoscenze sul


+
= 22 1
=
1 1
4
4
4
quadrato.

lapotema OM applicando il teorema di Pitagora ad

2
AM O: OM = r2 r2 ( 51)2 /4 = r2 (10+2 5)/16,
cio`e:
s

5+ 5
r.
OM =
8

Sostituendo ora ad r il valore 2/( 5 1) = ( 5 +


1)/2, si ha subito anche la prima espressione.

Teorema 6.51 Per lottagono si ha:


p

3+2 2
1.207
a=
2
p

2+ 2
a=r
0.924 r
2

e questo d`a =

2 4 2 .

Questo teorema si trasforma facilmente in un algoritmo per calcolare il perimetro di un poligono di


2n lati; come sappiamo il quadrato inscritto nella circonferenza
di raggio unitario ha come semiperimetro

2 2 2.828, per cui:

190

CAPITOLO 6. GEOMETRIA EUCLIDEA

Algoritmo 6.7 (Valori per difetto di )


Ingresso: Un numero naturale n > 2;
Uscita: Il perimetro del poligono regolare con 2n lati;

1. si pone := 2 e j := 2;
2. fino a che risulta j n si calcola:
(a) j := j + 1;
p

(b) := 2 4 2 ;

lati
4
8
16
32
64
128
256
512
1024

per difetto
2.8284271247
3.0614674589
3.1214451523
3.1365484905
3.1403311570
3.1412772509
3.1415138011
3.1415729404
3.1415877253

per eccesso
4.0
3.3137084990
3.1825978781
3.1517249074
3.1441183852
3.1422236299
3.1417503692
3.1416320807
3.1416025103

3. si esce con p := 2n .

Per i poligoni circoscritti si ha il seguente:

Tabella 6.2: Valori di per difetto e per eccesso

Teorema 6.53 Sia la misura del lato del poligono


regolare di n lati circoscritto alla circonferenza uni- cio`e:
!

r
taria; allora la misura del lato del poligono con 2n
.
2
2

lati circoscritto alla stessa circonferenza vale:


1+
=
AS = 1 +
2
4
4
2
p
= 4( 1 + 2 /4 1)/
r
!
.
2
.
=
1+
1
,
4
2
e questa `e la met`a del lato del poligono con 2n lati.
B

Figura 6.46: Poligono circoscritto


Prova: Nella Figura 6.46, sia AT = /2 met`a
del lato del poligono di n lati. Sia OS la bisettrib ; i due triangoli BAT e OST sono simili
ce di AOT
b `e langoperche langolo Tb `e comune e langolo B AT
lo alla circonferenza corrispondente allangolo al cenb del quale, pertanto, vale la met`a. Si ha
tro AOB
allora la proporzione: OT : AT = T S : BT , cio`e
OT : AT = (AT AS) : (OT OB). Daltra parte,
abbiamo AT = /2 e quindi:
OT =

OA + AT =

1 + 2 /4.

La proporzione diviene:
p
p
1 + 2 /4 : /2 = (/2 AS) : ( 1 + 2 /4 1).

Pertanto:

AS =
2

!r
2
2 .
1+
1+
1
,
4
4
2

Un algoritmo analogo al precedente ci d`a allora i


valori di approssimati per eccesso. Nella Tabella
6.2 riportiamo i valori ottenuti fino al poligono con
1024 lati. Si osservi che la media degli ultimi due
valori `e 3.1415951178 contro un valore effettivo =
3.1415926536 . . ..
Nota 6.4

Il valore di , come rapporto tra la circonferenza e il diametro, `e stato oggetto di curiosit`


ae
di ricerca fino dalla pi`
u remota antichit`
a. Nella Bibbia
si trova il valore 3 e nel papiro di Rhind viene utilizzata una quantit`
a che vale 3.1605. Lapprossimazione razionale che ha avuto pi`
u successo `e stata
22/7 3.142857 . . ., anche se i cinesi e gli occidentali
conoscevano 355/113, che ha ben sette cifre decimali
esatte. In effetti, queste approssimazioni hanno spesso carattere empirico, senza essere sostenute da una
teoria che permetta di migliorarle o almeno valutare
il loro grado di precisione. Il metodo dei poligoni inscritti e circoscritti `e stato il primo metodo veramente scientifico e fu inventato da Archimede, che riusc` a
portare avanti i conti fino al poligono di 96 lati; la precisione da lui trovata rimase imbattuta fino ai tempi
moderni.
Verso il 1600, quando nacque la Matematica moderna,
i metodi per calcolare si affinarono con la trigonometria e le serie di potenze. Si verific`
o allora una specie di corsa per determinare con sempre maggiore
precisione. Leibniz scopr` che:

1
1
1
1
= 1 + + ,
4
3
5
7
9

191

6.8. GEOMETRIA DELLO SPAZIO


ma computazionalmente questa formula non vale molto. Pi`
u successo ebbe John Machin che trov`
o un metodo per calcolare le prime cento cifre decimali (si veda
al capitolo sulla Trigonometria) e i suoi epigoni migliorarono man mano questo record finche, nel 1853, William Shanks arriv`
o a 707 cifre. Purtroppo, nel 1947 ci
si accorse che tali cifre erano sbagliate a partire dalla
528-esima. Con lavvento dei calcolatori elettronici, la
gara ebbe unaltra impennata e nel 1983 si riuscirono
a calcolare oltre 16 milioni di cifre decimali.
Occorre dire che questo calcolo ha dello straordinario
perche non usa la forza bruta, ma utilizza un nuovo
metodo, anche se basato su alcune idee di Gauss vecchie di oltre 150 anni. Al calcolatore fu dato questo
semplice algoritmo:
Algoritmo 6.8 (Media aritmetico/geometrica)
Ingresso: Un numero naturale n > 2;
Uscita: il numero con oltre 2n cifre decimali esatte;

1. si pone a := 1, x := 1, b := 2/2, c := 1/4;


2. fino a che risulta j n + 1 si calcola:

(a) y := a, a := (a + b)/2, b := b y;
(b) c := c x (a y)2 , x := 2 x;
(c) si scrive in uscita il valore di (a+b)2 /(4c);

tridimensionale; secondo, per il lettore, interpretare correttamente ci`o che `e stato disegnato. Ancora
pi`
u difficile `e possedere e/o sviluppare unappropriata intuizione spaziale per poter affrontare e risolvere problemi tridimensionali; scultori e architetti sono
in questo molto bravi, ma spesso la gente ha difficolt`a a raffigurarsi mentalmente cosa succede nello
spazio. Naturalmente, esercitarsi con la geometria
pu`o giovare ad accrescere il nostro senso spaziale.
In accordo con gli assiomi generali, due punti nello
spazio determinano una retta, proprio come sul piano. Per avere un piano , occorre che siano assegnati
tre punti non allineati, il che equivale ad avere una
retta e un punto fuori di essa, oppure due rette incidenti in un punto. Ad esempio (v. Figura 6.47), se
i tre punti non allineati sono A, B, C, si possono anche avere il punto A e la retta BC, oppure la coppia
di rette AB, BC. Una domanda che pu`o imbarazzare, se fatta fuori di questo contesto, `e la seguente:
abbiamo visto che tre punti non allineati determinano nel piano una e una sola circonferenza; allora, tre
punti non allineati nello spazio, quante circonferenze
determinano?

Si osservi che, ad ogni iterazione, a rappresenta la


media aritmetica e c la media geometrica di a e b;
per questo il metodo `e detto della media aritmetico/geometrica. Il programma ha lincredibile propriet`
a di raddoppiare, ad ogni iterazione, il numero
delle cifre esatte del risultato:
3.140579250522168248311331268975823311773
3.141592646213542282149344431982695774314
3.141592653589793238279512774801863974381
3.141592653589793238462643383279502884197
3.141592653589793238462643383279502884197
Questa tabella contiene le prime cinque iterazioni
(lultima `e data per controllo) e per arrivare al
risultato desiderato furono sufficienti 25 iterazioni.
Naturalmente, la parte pesante del programma `e
data dalle routine per eseguire le operazioni con la
necessaria precisione; escluso questo, il risultato `e
pi`
u un problema di gestione della memoria che daltro.

6.8

Geometria dello spazio

Il problema della geometria dello spazio `e costituito


dalla difficolt`a che tutti abbiamo a rappresentare sia
mentalmente, sia figurativamente gli oggetti a tre dimensioni. Ci`o che possiamo disegnare su un foglio `e
solamente una proiezione della realt`a spaziale e ci`o
pone un doppio problema: primo, per il disegnatore, trovare una proiezione che non nasconda, ma anzi
metta in evidenza i punti nevralgici di una situazione

b
b

Figura 6.47: Piani e angolo diedro


Quando abbiamo un piano, esso definisce due semispazi, cos` come una retta sul piano definisce due
semipiani e un punto su una retta due semirette. Due
piani che si intersecano, si intersecano lungo una retta, e quindi dividono lo spazio in quattro parti, ognuna delle quali `e detta un diedro o angolo diedro, per
analogia con gli angoli del piano (v. Figura 6.47).
Normalmente, per assegnare un diedro, si assegnano i due semipiani che lo definiscono e che hanno
origine nella retta di intersezione, detta spigolo del
diedro. Come gli angoli, i diedri formano una classe
di grandezze e su tale aspetto torneremo pi`
u avanti.
Ovviamente, due piani che non si intersecano si dicono paralleli; purtroppo, come per le rette nel piano,
questa non pu`o essere una definizione valida, poiche
implica una procedura infinita per accorgersi che i
due piani non si incontrano mai. Occorre allora trovare un metodo finito e questo, come ora vedremo,
non `e del tutto banale.

192

CAPITOLO 6. GEOMETRIA EUCLIDEA


Q

s
r

Figura 6.48: Posizione di due rette


Cominciamo col definire la posizione reciproca di
due rette nello spazio (vedere Figura ??). Questo
pu`o esser fatto costruttivamente e in termini finiti
mediante il seguente:
Algoritmo 6.9 (Posizione di due rette)
Ingresso: due rette r, s nello spazio.
Uscita: La posizione reciproca di r ed s.

e di una retta r. Questa volta procediamo discorsivamente, lasciando al lettore il compito di riportare
ad un algoritmo quanto ora diremo. Prima di tutto
`e facile vedere se r giace su prendendo due punti
distinti P, Q della retta e verificando se si trovano su
. Se r non giace su , si prende P su (e non su
r) e si determina il piano passante per r e per P .
Ora, sia s la retta di intersezione tra e ; si hanno due possibilit`a verificabili direttamente, in quanto
r, s sono complanari:
(caso della retta r1 nella Figura 6.49) r ed s sono
parallele: allora r `e parallela al piano ; infatti,
se r incontrasse in Q, le due rette r e P Q determinerebbero un piano e questo dovrebbe coincidere con quello considerato (determinato da r
e P );
(caso della retta r2 nella Figura 6.49) r ed s sono
incidenti in Q: allora r ed si incontrano nel
punto Q, che si dice il piede di r su .

1. si prende un punto P su s;
2. se P giace su r, allora r ed s sono incidenti in P
e quindi sono coincidenti o complanari; si esce;

3. altrimenti, si considera il piano determinato


da r e da P ;

4. si prende un punto Q su s diverso da P ;

6. se Q non si trova su , allora le due rette non


hanno punti in comune e si dicono sghembe;

r2
b

u
s

Figura 6.50: Posizione reciproca di due piani

r1

5. se Q giace su , allora le rette sono complanari.


Il Teorema condparallel permette di stabilire se
sono coincidenti, incidenti o parallele; si esce;

Figura 6.49: Rette incidenti


Nella Figura 6.48 sono schematizzati i due casi
principali: r ed s sono sghembe, mentre r ed s sono
parallele. Pu`o essere utile ricordare che la distanza
tra due rette `e la minima distanza tra i punti di una
retta e i punti dellaltra. Ora, il secondo passo consiste nel determinare le posizioni reciproche di un piano

Questo ci fa capire che se la retta r `e parallela al


piano , e consideriamo un qualsiasi piano contenente r, allora se , si intersecano nella retta s,
questa risulta parallela ad r. Il lettore `e invitato a
dare una dimostrazione formale di questo fatto, che
ci serve per il terzo passo, cio`e per definire la posizione reciproca di due piani. Siano dati due piani
, e si consideri un terzo piano le cui intersezioni
con , siano le due rette r, s. Se r, s si intersecano in un punto P , allora P appartiene tanto ad
che a e quindi i due piani si intersecano. Se invece
r, s sono parallele (il che pu`o essere verificato, dato
che sono complanari in ), esse potrebbero essere tali
semplicemente perche abbiamo preso parallela allintersezione di e . Consideriamo allora un piano
che abbia intersezione con , , , e consideriamo

193

6.8. GEOMETRIA DELLO SPAZIO

Torniamo ora ai diedri. Se r `e lo spigolo dei due


semipiani , che determinano il diedro, si consideri uno qualsiasi dei piani perpendicolari ad r e siano
s, t le rette di intersezione con , ; langolo formato
dalle semirette s, t che giacciono sui semipiani si dice
la sezione normale del diedro e si prende come misura del diedro stesso. Naturalmente, a questo punto,
i diedri possono essere considerati grandezze, esattamente come gli angoli. La definizione della somma,
dei multipli e dei sottomultipli `e ovvia e si parla di
diedri acuti, ottusi, convessi, complementari e supplementari proprio come si fa per gli angoli. E naturale allora, come sul piano, definire due piani come
Teorema 6.54 Sia data una retta p insieme ad un perpendicolari quando formano quattro diedri uguali.
punto P su di essa; il luogo delle perpendicolari a p
Si prendano ora n rette parallele nello spain P `e un piano passante per P .
zio; siano r1 , r2 , . . . , rn in questordine e consideriamo gli n piani determinati dalle coppie
r1 r2 , r2 r3 , . . . , rn1 rn , rn r1 . Se ciascuno di questi piap
ni lascia tutte le altre rette da una stessa parte dello
Q
spazio, la zona a comune tra tutti gli n semispazi, si
dice prisma indefinito (convesso). Se tagliamo questa

figura con due piani paralleli , , la zona del prisma


indefinito compresa tra questi piani si dice prisma
S
(convesso). Le rette di intersezione tra e e i piani
P
s
del prisma indefinito determinano due poligoni uguaT
li, che si dicono le basi del prisma. I parallelogrammi
R
t
determinati da due rette parallele consecutive e dalle
r
basi si dicono le facce laterali del prisma. La distanza tra i due piani e si dice laltezza. A seconda
che la base sia un triangolo, un quadrilatero, un pentagono, etc., il prisma si dice triangolare, quadranFigura 6.51: Piano perpendicolare a una retta
golare, pentagonale, etc.. Se i due piani e sono
perpendicolari
alle rette r1 , . . . , rn , il prisma si dice
Prova: Le perpendicolari a p passanti per P sono
retto.
determinate sui piani passanti per p; ad ogni piano
corrisponde una retta perpendicolare a p per P , come
sappiamo dalla Geometria del piano. Due di queste

rette, r, s, essendo incidenti in P , determinano un


piano che vogliamo dimostrare essere il luogo cercato. Siano Q, Q due punti di p equidistanti da P , ed
R, S due punti su r, s rispettivamente. Dalle ipotesi
b = Q RS,
b
si ha QR = Q R, QS = Q S e quindi QRS
essendo uguali i due triangoli QRS e Q RS. Sia T
lintersezione della retta RS con t, una generica retta
r1
r2
r3
passante per P e giacente sul piano . Dalluguaglianza dei triangoli QRT, Q RT si ha QT = Q T e

quindi P T `e lasse di QQ nel piano QQ T , cio`e t `e


perpendicolare ad r. Daltra parte, se una retta passa
per P ma non si trova su , `e facile vedere che essa
non pu`o essere perpendicolare ad r, e ci`o conclude la
prova.
le rette t, u di intersezione di con , . Nella Figura 6.50 non abbiamo di proposito indicato il piano ,
la cui disposizione `e per`o del tutto chiara tramite le
rette t ed u. Se t, u si incontrano in Q, di nuovo tale
punto sta sia in sia in , che pertanto si intersecano. Ma se t, u sono parallele, allora e devono
essere paralleli. Se infatti si intersecassero nella retta
v, questa dovrebbe essere parallela tanto ad r che a t
(o, se si preferisce, tanto ad s che ad u) che per`o, per
costruzione, non sono parallele tra di loro.
Stabiliti i criteri di parallelismo, si pu`o passare alla
perpendicolarit`a.

Questo teorema permette di parlare del piano


perpendicolare alla retta r in un punto P di questa;
viceversa, dato un piano e un suo punto P , `e definita la retta perpendicolare ad passante per P , detto
piede della perpendicolare.

Figura 6.52: Prisma indefinito e definito


I prismi sono le figure tridimensionali pi`
u semplici. Per essi si definiscono tre misure, che risultano
importanti nelle applicazioni:

194
la superficie laterale: `e la somma delle aree delle
facce laterali del prisma; se p `e il perimetro della
base ed h `e laltezza del prisma, si ha: S = ph;
la superficie totale: e la somma della superficie
laterale e dellarea delle due basi; se ciascuna di
queste vale S, si ha: St = S + 2S;
il volume: `e la misura dello spazio occupato dalla
figura e vale: V = Sh.
Mentre le misure di superficie si rifanno a concetti
gi`a introdotti per la Geometria piana, il volume `e un
concetto nuovo. Il volume di un solido `e una grandezza, e pertanto ci si aspetta che il volume dellunione
di due figure sia la somma dei singoli volumi, e cos`
via per tutte le altre propriet`a delle grandezze. Lunit`a di misura `e definita come il cubo che ha per lato
lunit`a di misura delle lunghezze. Si noti che un cubo `e un prisma retto a base quadrata, la cui altezza
`e uguale a ciascuno dei lati di base. Occorrerebbero
qui dimostrazioni analoghe a quelle fatte a suo tempo
per la misura delle aree, ma ne risparmiamo il lettore
(e noi stessi!). Naturalmente, la relazione tra figure solide avere lo stesso volume `e una relazione di
equivalenza, e si dice appunto equivalenza tra solidi.
Si danno diverse regole per determinare quando due
figure sono equivalenti; la pi`
u semplice, che discende
da quanto appena detto, `e che due figure solide sono equivalenti se sono equiscomponibili. Tuttavia, la
regola pi`
u importante `e costituita dal seguente principio, che Archimede gi`a conosceva, ma che Cavalieri
teorizz`o e us`o in modo sistematico:
Principio 6.16 (di Cavalieri) Due figure solide
che, tagliate con piani paralleli a un piano fisso,
generano figure piane equivalenti, sono equivalenti.
Questo principio `e stato antesignano del calcolo integrale; esso diviene intuitivamente accettabile se pensiamo a una pila di fogli di carta: comunque li spostiamo, lasciandoli paralleli a se stessi, determinano lo
stesso volume, anche se la forma complessiva cambia
radicalmente.
Applicando il principio di Cavalieri a un prisma,
si dimostra immediatamente che esso `e equivalente a
un prisma retto che abbia la stessa base e la stessa
altezza; da questo si passa ad un prisma retto con
la stessa altezza e con la base quadrata, equivalente
al poligono originale. A questo punto il volume `e
proprio V = Sh, come si voleva. In particolare, un
cubo di lato (ed altezza) a ha volume V = a3 ; inoltre,
S = 4a2 e St = 6a2 .
Consideriamo ora un punto O ed n semirette che
partano da O, nellordine r1 , r2 , . . . , rn . Se gli n piani r1 r2 , r2 r3 , . . . , rn1 rn , rn r1 sono tali che ognuno di
essi lascia da una stessa parte dello spazio le altre

CAPITOLO 6. GEOMETRIA EUCLIDEA


n2 semirette, la parte di spazio comune a tutti questi semispazi si dice piramide indefinita (convessa) di
vertice O. Se la tagliamo con un piano , la parte
di piramide indefinita compresa tra ed O si dice
piramide. La distanza di O da si dice laltezza della
piramide. Ognuno dei triangoli di vertice O si dice
una faccia laterale, e il poligono determinato da si
dice la base della piramide. In funzione di n si hanno piramidi triangolari, quadrangolari, pentagonali,
etc.. Se il poligono di base `e un poligono regolare, la
piramide si dice regolare; se la base pu`o essere circoscritta a una circonferenza di centro K e la retta OK
risulta perpendicolare ad , la piramide si dice retta.

r1

r3
r2

Figura 6.53: Angoloide e piramide


Le misure relative alle piramidi sono:
la superficie laterale: `e la somma delle aree delle facce laterali; se la piramide `e retta ed r `e
il raggio della circonferenzainscritta nel poligono di base, si ha: S = p r2 + h2 /2, se p `e il
perimetro della base;
la superficie totale: `e la somma della superficie
laterale e dellarea della base: St = S + S;
il volume: `e dato dalla formula V = Sh/3.
Anche in questo caso, la misura delle superfici `e un
esercizio, risolubile di volta in volta con le regole viste
per la geometria piana. Il volume, invece, presenta
qualche difficolt`a, ma fin dallantichit`a si sa che:
Teorema 6.55 Il volume di una piramide `e un terzo
del volume di un prisma che abbia la stessa base e la
stessa altezza.
Prova: Consideriamo una piramide triangolare
(Figura 6.54), in quanto lestensione ad una base
qualsiasi `e banale. Data la piramide OABC, si costruiscano i segmenti BB e CC paralleli e della stessa lunghezza di OA. La figura solida ABCOB C `e

6.8. GEOMETRIA DELLO SPAZIO

C
OX
X
Q
C@QXXX
C
XXX B
C @Q
C
X
X
C @ QQ
C
C
@ Q
C
C
C
@ QQ
C
C
C
@
C
Q C
C
Q
@
C
C
Q
C
@
C
Q
C QC
@
CX
QC
C
XX X
C
A
XXX@ C
X@
X
@C
X
B
Figura 6.54: Il volume della piramide
un prisma triangolare di volume Sh, se S `e larea del
triangolo ABC. Se uniamo B con C , la figura solida
BOB C `e una piramide di vertice B, base OB C
uguale ad ABC e altezza h; essa `e perci`o equivalente ad OABC. Daltra parte, le piramidi OBB C e
OBCC sono uguali avendo la stessa altezza e uguale
superficie di base. Il prisma, di conseguenza, risulta
diviso in tre piramidi equivalenti.

195
no poligoni regolari uguali, e sono uguali anche tutti
i diedri e tutti gli angoloidi che lo compongono. Gi`a
Platone nel Timeo mostra che di tali poliedri ne esistono solo 5, e per questo i poliedri regolari sono detti
anche solidi platonici. Il ragionamento `e semplice: se
gli angoloidi devono essere tutti uguali, basta prenderne in considerazione uno solo. Le sue facce sono
formate da almeno tre poligoni, che possono essere
triangoli equilateri, quadrati, pentagoni regolari, etc..
Se le facce sono triangoli equilateri, ogni loro angolo `e
di 60 , e quindi langoloide pu`o essere formato da 3, 4
o 5 facce. Infatti, 6 triangoli equilateri darebbero un
angolo giro e langoloide degenererebbe in un piano,
come si era visto con losservazione precedente. Se le
facce sono quadrati, langolo `e di 90 e langoloide ne
pu`o contenere solo 3, poiche gi`a 4 arrivano a 360 .
Se le facce sono pentagoni, ogni angolo `e 108 e di
nuovo langoloide ne pu`o contenere solo 3. Con altri
poligoni regolari (a partire dagli esagoni che hanno
langolo di 120 ) tre facce superano i 360 , e quindi
`e impossibile formare un angoloide.
Fin qui si `e solo dimostrata la possibilit`a di esistenza di 5 poliedri regolari; per dimostrarne leffettiva
realt`a basta ora costruirli:

per il triangolo e langoloide a tre facce, il poliedro regolare `e il tetraedro, o piramide triangolaLa parte di spazio compresa nella zona convessa
re; il tetraedro ha in tutto 4 facce, 6 spigoli e 4
della piramide indefinita si dice propriamente un anvertici (o angoloidi);
goloide; la misura degli angoloidi `e troppo complessa
perche la si possa prendere seriamente in considera per il triangolo e langoloide a 4 facce, si
zione. Due facce consecutive dellangoloide formano
ha lottaedro, o doppia piramide quadrata;
un diedro, e quindi un angoloide con k facce determilottaedro ha 8 facce, 12 spigoli e 6 vertici;
na k diedri. Anche questi possono non presentare una
struttura omogenea, dato che le loro sezioni normali
per il triangolo e langoloide a 5 facce, si ha
corrispondono a piani che sono disposti irregolarmenlicosaedro; esso ha 20 facce (e da questo deriva
te uno rispetto allaltro. Unosservazione importante
il suo nome), 32 spigoli e 12 vertici;
riguarda invece gli angoli che ogni coppia di semirette, partenti dal vertice O, forma sul piano della faccia
per il quadrato e langoloide a tre facce, si ha
corrispondente. Prendiamo un piano passante per
lesaedro o cubo; esso ha 6 facce, 12 spigoli e 8
O e che non interseca langoloide (se non in O stesso);
vertici;
consideriamo uno degli spigoli dellangoloide e imma per il pentagono e langoloide a tre facce, si ha
giniamo di tagliarlo lungo tale spigolo. Ruotiamo ora
il dodecaedro, una specie di pallone da calcio
tutte le facce dellangoloide intorno ad O in modo
spigoloso; esso ha 12 facce, 30 spigoli e 20 vertici.
da portarle (consecutivamente) sul piano ; in corrispondenza dello spigolo tagliato, avremo un angolo
Se con f, s, v indichiamo il numero delle facce, degli
vuoto, che `e la differenza fra un angolo giro e la
spigoli e dei vertici di un poliedro, vale sempre la
somma dei vari angoli dellangoloide. In questo moformula di Cartesio-Eulero: f + v = s + 2.
do vediamo che la somma degli angoli di un angoloide

`e minore di 360 .
Nota 6.5
I poliedri regolari sono facilmente coQuesta osservazione ha notevole importanza quanstruibili a partire dal loro sviluppo piano, che qui diado si studiano i poliedri regolari. In generale, un pomo schematicamente per il tetraedro (Figura 6.55) e
il cubo (Figura 6.56.
liedro `e una figura solida delimitata da un numero
finito di facce costituite da poligoni piani. Rientrano
Conservo ancora il quaderno di bella della terza mein questa definizione sia i prismi, sia le piramidi, ma
dia nel quale sono riportate le costruzioni di geomefin dallantichit`a ci si `e chiesti se esistono, e quanti
tria dello spazio che la Prof. Del Francia ci faceva
sono, i poliedri regolari, cio`e i poliedri le cui facce sopreparare a latere dei compiti a casa. Con aghi, fili,

196

CAPITOLO 6. GEOMETRIA EUCLIDEA


A3

A2

Tali poliedri sono noti come poliedri archimedei, ma


qui noi terminiamo la nostra nota.

A1

Figura 6.55: Tetraedro e suo sviluppo

D
A

Figura 6.57: Cilindro e cono

C
B

Figura 6.56: Esaedro (cubo) e suo sviluppo


stecchini e cartoncino Bristol ci sono ancora costruzioni non del tutto banali. Il lettore, da parte sua, `e
invitato a costruire almeno i cinque poliedri regolari a
partire dal loro sviluppo piano. Queste poliedri furono anche detti figure cosmiche per una presunta corrispondenza con gli elementi costitutivi delluniverso.
Pu`
o essere curioso leggere la seguente dimostrazione
mistica del fatto che i poliedri regolari devono essere cinque, non di pi`
u ne di meno. Il brano si trova nel
libro del celebre matematico Luca Pacioli De Divina
Proportione (1496 98) e precede la dimostrazione
matematica vista; i disegni dei poliedri riportati dal
Pacioli sono di Leonardo da Vinci: Onde li decti sono
chiamati regulari perche sono de lati e angoli e basi
equali, e luno dallaltro apunto se contiene como se
mostrer`
a e conrespondono a li 5 corpi semplici in natura, cio`e terra, aqua, aire, fuoco e quinta essentia
cio`e virt`
u celeste che tutti gli altri sustenta in suo essere. E s` como questi corpi semplici sono bastanti
e sufficienti in natura, altramente ser`a arguire Idio
superfluo overo diminuto al bisogno naturale, la qual
cosa `e absurda, como afferma il filosofo che Idio e la
natura non opera invano cio`e non manca al bisogno e
non excede quello.
I solidi platonici sono i pi`
u regolari dei poliedri, ma
ve ne sono altri, ancora altamente simmetrici, ma
con le facce formate da poligoni regolari di vario tipo.

Dalle figure poliedriche `e facile passare alle figure


rotonde. Il cilindro indefinito `e il luogo dei punti che
hanno distanza minore o uguale a un certo valore r
(detto il raggio del cilindro) da una retta assegnata
c. Tagliando questa figura con due piani paralleli
(vedere Figura 6.57), si ottiene un cilindro, che si
dice retto se i due piani sono perpendicolari alla retta
c. La distanza h fra questi due piani `e laltezza del
cilindro. Come `e noto, si ha:
S = 2rh,

St = 2r2 + 2rh,

V = r2 h.

Il cilindro pu`o essere immaginato come generato da


una retta g (detta appunto generatrice) che ruota intorno alla retta c a distanza r da questa. Ci`o permette di cogliere lanalogia con la figura successiva,
il cono. Data una retta c e una retta g incidente con
c in un punto O, il cono indefinito `e la figura che si
ottiene ruotando g intorno a c in modo che il punto
O rimanga fisso. Se tagliamo il cono indefinito con
un piano incidente con c (v. Figura 6.57), lo spazio
interno compreso tra O e il piano si dice cono, che
`e in particolare retto se `e perpendicolare a c. In
generale, la base di un cono cos` definito `e unellisse,
ma la base di un cono retto `e un cerchio; si dice apotema la distanza a del vertice O da uno qualsiasi dei
punti della circonferenza di base, mentre laltezza `e la
distanza h di O dalla base stessa. Per il cono retto,
si ha chiaramente:
p
p
a = r 2 + h2
h = a2 r2
S = ra,

St = ra + r2 ,

V = r2 h/3.

197

6.8. GEOMETRIA DELLO SPAZIO


La formula del volume `e certo la pi`
u interessante, e
si dimostra approssimando il cono con una piramide
la cui base `e un poligono iscritto o circoscritto alla
circonferenza di base del cono. Poiche, analogamente,
un cilindro pu`o essere approssimato con prismi, la
formula deriva dal Teorema 6.55.
Il solido rotondo per eccellenza `e la sfera; essa pu`o
essere definita come il luogo dei punti dello spazio che
hanno distanza minore o uguale ad r (il raggio della
sfera) da un punto assegnato O, detto il centro. La
sfera, per`o, si pu`o vedere anche come il solido ottenuto dalla rotazione di una semicirconferenza intorno
alla retta determinata dai suoi estremi.
Nota 6.6

E bene insistere sul fatto che molti


solidi rotondi possono essere ottenuti per rotazione,
poiche, come il lettore vedr`
a studiando Analisi
Matematica allUniversit`
a, esistono semplici metodi
del calcolo integrale per valutare superficie e volume
di solidi di rotazione. Anche storicamente, `e opportuno ricordare, un antesignano del calcolo integrale
fu Keplero: nel 1615 scrisse il libro Stereometria
Doliorum, dove, studiando come calcolare superficie e
volume delle botti, in qualche modo e con vari errori,
anticipa considerazioni proprie del calcolo integrale.
Naturalmente, sia Keplero, sia Cavalieri, furono a
loro volta anticipati di circa 18 secoli da Archimede,
come ora vedremo.

Prova: Si faccia riferimento alla Figura 6.58 nella


quale cilindro, semisfera e cono sono stati tagliati con
un piano parallelo alla base del cilindro e del cono.
Se riusciamo a dimostrare che la corona circolare di
raggio AB (relativa alla scodella) `e equivalente al cerchio di raggio CD (relativo al cono), per il Principio
di Cavalieri avremo dimostrato il nostro asserto. Se
poniamo OC = CD = c e BC = s, per il Teorema
di Pitagora si ha: s2 = r2 c2 , e quindi larea della
corona circolare `e:
r2 s2 = r2 (r2 c2 ) = c2 .
Ma questa `e larea del cerchio di raggio CD.
La conseguenza `e pressoche immediata:
Teorema 6.57 Il volume V di una sfera di raggio r
`e: V = 4r3 /3.
Prova: Sempre con riferimento alla Figura 6.58, il
volume del cilindro `e Vc = r2 r = r3 , e quello della
scodella, essendo uguale a quello del cono, `e un terzo
di questo: Vs = r3 /3. Il volume della semisfera si
ottiene per differenza: V /2 = Vc Vs = 2r3 /3, e
questo `e il risultato desiderato.
Concludiamo con la formula per il calcolo della superficie della sfera; anche questa fu dimostrata per la
prima volta da Archimede con un ragionamento che
anticipa i metodi del calcolo differenziale e integrale:
Teorema 6.58 La superficie di una sfera di raggio r `e quattro volte la superficie di un suo cerchio
massimo, cio`e S = 4r2 .

B
D

O
Figura 6.58: Volume della sfera
Il calcolo del volume di una sfera si basa sul seguente lemma; si dice che Archimede volle che sulla sua
tomba fosse incisa la Figura 6.58, sulla quale si basa
la sua dimostrazione. Per fissare la terminologia, se
abbiamo un cilindro retto di raggio r ed altezza ancora r, in esso possiamo inserire una semisfera di raggio
r; la figura solida che si ottiene scavando la semisfera
dal cono si dice scodella.

Prova: Suddividiamo la superficie della sfera in


tanti piccoli poligoni (arrotondati) di dimensione arbitraria Si , non necessariamente uguale per tutti, e
uniamo i punti di questi poligoni con il centro O della sfera. Otteniamo cos` delle piramidi di base Si e
altezza r, cio`e di volume Vi = Si r/3. Il volume V
della sfera `e dato dalla somma di tutte queste piramidi, cio`e dalla somma dei Vi . Mettendo in evidenza
r/3 in tale somma e osservando che la somma di tutti gli Si d`a proprio S, si ha la relazione: V = Sr/3,
ovvero, per il teorema precedente: 4r3 /3 = Sr/3, e
da questa si ricava subito S.

Il lettore `e stato avvertito che le piramidi hanno la


base arrotondata, in quanto la superficie segue quella
della sfera; cos` come sta, pertanto, il ragionamento
`e solo approssimativo. Lo si pu`o rendere esatto considerando poligoni che tagliano e poligoni che sono
tangenti alla sfera, mantenendo i lati delle varie basi.
Al diminuire di Si , queste basi sono sempre pi`
u vicine
tra
di
loro.
Lasciamo
al
lettore
il
godimento
di comLemma 6.56 Il volume della scodella di raggio r `e
pletare
il
ragionamento
che,
daltra
parte,
abbiamo
uguale al volume di un cono che ha r sia come altezza,
gi`a impostato altre volte.
sia come raggio della circonferenza di base.

198

CAPITOLO 6. GEOMETRIA EUCLIDEA

Capitolo 7

Le altre Geometrie
Il titolo di questo capitolo vuol fare riferimento
esplicito al fatto che nella Matematica moderna non
esiste soltanto la Geometria Euclidea, lunica ad essere considerata nellantichit`a e fino al 1600, ma vanno
considerate altre geometrie, che si sono sviluppate e
hanno assunto una propria identit`a e una propria rilevanza, contribuendo in vario modo allampliamento
delle nostre conoscenze e al miglioramento della nostra capacit`a ad affrontare e a risolvere i problemi.
Oggi possiamo dire che i primi passi verso le altre
geometrie furono fatti nel Rinascimento, quando pittori praticanti e speculatori teorici studiarono la prospettiva, dando inizio alla Geometria Proiettiva e alla
Geometria Descrittiva. Tuttavia, le proiezioni erano
note fin dai tempi antichi, almeno nel caso classico
delle coniche, per cui la prospettiva fu fatta rientrare
nelle Geometria Euclidea.
Fu nella prima met`a del 1600 che Fermat, Cartesio
e Desargues posero le basi per lo sviluppo di geometrie alternative. I primi due fondarono la Geometria
Analitica; questa voleva essere un modo diverso di
vedere la Geometria Euclidea, ma i suoi metodi, algebrici anziche sintetici, di fatto cambiarono lidea
stessa di geometria. Desargues, poi, con la nuova
idea dei punti allinfinito, praticamente introduceva
enti diversi da quelli delle Geometria di Euclide.
Tradizionalmente, la geometria aveva sempre usato
metodi sintetici, cio`e basati sulla costruzione di figure, riconducendo addirittura a questo metodo la risoluzione dei problemi algebrici, come il calcolo delle
radici di unequazione. Fermat e Cartesio rivoltarono
questo modo di procedere, riportando i problemi geometrici a problemi algebrici. Da allora si sono sempre avuti due modi di vedere la geometria, talvolta in
contrapposizione, talaltra in simbiosi. Cos` la Geometria Proiettiva ha una versione sintetica, che studia
geometricamente le proiettivit`a, e una versione analitica, dedicata alla caratterizzazione algebrica delle
coniche e delle quadriche (lequivalente delle coniche
in tre dimensioni).
A cavallo del 1800, Monge sistematizz`o la Geometria Descrittiva e pochi anni dopo si svilupparono le
Geometrie non Euclide, dovute a Lobaceskij e Bolyai.

La formalizzazione di tutte queste nuove geometria fu


allinizio di tipo sintetico, ma le generalizzazioni di
Riemann erano di natura analitica. Le curve furono
di fatto sostituite da equazioni, e le propriet`a delle
prime si studiarono attraverso le propriet`a analitiche
delle seconde, dando cos` origine alla Geometria Algebrica. Analogamente, la Topologia nacque alla met`a
del 1800 come studio geometrico-sintetico delle propriet`a dei corpi che si mantengono per trasformazioni
continue: un palloncino si pu`o trasformare in un cubo o in un cilindro, se lo premiamo, ma non in una
ciambella, a meno che non lo rompiamo. Ma la continuit`a richiede uno studio locale, cio`e di cosa succede
intorno a un punto. Se c`e del materiale intorno a
un punto, non possiamo toglierlo se non facendo uno
strappo, e questa non `e pi`
u una trasformazione continua, anche nel senso intuitivo del termine. Ci`o port`o
ad una impostazione analitica della Topologia, che si
trasform`o nello studio degli spazi di Hausdorf e degli
spazi metrici. Questi si basano sui concetti di intorno e di limite, che noi vedremo pi`
u avanti in modo
accurato nel caso importantissimo del calcolo differenziale e integrale. Infatti, gli insiemi R, R2 , R3 che
tratteremo sono casi particolari di spazi di Hausdorf
e di spazi metrici, e si dicono di solito spazi Euclidei.
Ovviamente, non potremo vedere tutte queste diverse geometrie. Ci dilungheremo un po di pi`
u sulla Geometria Analitica, daremo una rapida occhiata storica alle Geometrie non Euclidee e cercheremo di dare unidea, vaga ma sperabilmente non peregrina, della Geometria Proiettiva, della Geometria
Descrittiva e della Topologia.

7.1

Coordinate Cartesiane

Ufficialmente, la Geometria Analitica `e stata introdotta da Cartesio nel 1637 con la pubblicazione di La
Geometrie, una delle tre appendici al Discours de
la methode. Oggi sappiamo che Cartesio era stato
anticipato da Fermat, che per`o non aveva pubblicato
i propri studi, come era solito fare. Da un punto di vista storico, questa invenzione `e stata di fondamentale

199

200

CAPITOLO 7. LE ALTRE GEOMETRIE

importanza. Fino ad allora la regina della Matematica era sempre stata la Geometria, tanto che lAlgebra
era appena agli inizi con la sua notazione sincopata
e, di fatto, le dimostrazioni che oggi eseguiamo per via
algebrica erano regolarmente riportate alla Geometria. Cos`, la soluzione delle equazioni era effettuata
per via geometrica e Galileo, quando volle dire che lo
studio della natura deve essere affrontato con metodi
matematici, afferm`o che la Natura `e scritta in caratteri di triangoli, quadrati, cerchi, . . . , ignorando
di fatto i numeri. La stessa notazione arabica o posizionale, portata in Europa allinizio del 1200, aveva
avuto rilevanza solo nel mondo commerciale e finanziario, mentre nellambito scientifico ed accademico
si era conservata la numerazione romana. Cartesio e
Fermat, con lintroduzione della Geometria Analitica,
dimostrarono che tutto ci`o che si fa con la Geometria
si pu`o fare anche con lAlgebra e con il calcolo, cos`
che queste discipline non hanno pi`
u un ruolo subordinato, ma possono vantare pari dignit`a della Geometria. E in effetti, pochi anni dopo, esplose, con
Newton e Leibniz, il nuovo grande filone del calcolo
differenziale, che difficilmente sarebbe potuto nascere e svilupparsi senza il cambiamento di mentalit`a
portato dalla Geometria Analitica di Cartesio.
A

1 u.m.
Figura 7.1: Rappresentazione Cartesiana dei punti:
A `e positivo, A `e negativo
Losservazione di base consiste nel considerare la
corrispondenza biunivoca che lega i punti di una retta
con i numeri reali. Pu`o essere curioso e interessante
ricordare che ne Cartesio ne Fermat considerarono la
parte negativa della retta, secondo luso del tempo
che non riconosceva validit`a alle quantit`a negative
(v. Sezione 3.1). Se su una retta r fissiamo un punto
O, detto origine, e scegliamo, una volta per tutte,
un verso o orientamento sulla retta e una unit`
a di
misura, cio`e un segmento la cui lunghezza diciamo
unitaria per definizione, allora:
1. ad ogni punto A della retta facciamo corrispondere il numero che `e la misura (secondo lunit`a
scelta) del segmento OA, con la convenzione che
il numero `e positivo se A si trova dopo O seguendo il verso stabilito, ed `e invece negativo se
A si trova prima di O; tale misura `e detta la
coordinata o ascissa di A;
2. ad ogni numero reale a facciamo corrispondere
un punto A sulla retta di modo che OA = |a|

ed A sia collocato prima o dopo lorigine O (in


accordo al verso prefissato) a seconda che a sia
negativo o positivo.
Lesistenza di una corrispondenza biunivoca tra
punti della retta e numeri reali era nota fin dallantichit`a e, come s`e visto, i Greci (probabilmente Pitagora) erano stati costretti a introdurre i numeri irrazionali quando si erano accorti che esistono grandezze tra loro incommensurabili. Merito di Cartesio
fu quello di estendere la corrispondenza al piano e allo spazio e di far vedere come si potessero esprimere
i concetti della geometria in questo ambiente in cui
ogni punto ha una sua individuazione numerica.
Unosservazione di primaria importanza `e la seguente. Se abbiamo due punti A e B sulla retta ed a e
b sono, rispettivamente, i numeri reali corrispondenti
ai due punti, allora la distanza AB `e data dal valore
assoluto della differenza fra a e b, cio`e AB = |a b|.
Questa formula vale sia che a e b siano entrambi positivi, entrambi negativi o siano di segno opposto. La
distanza tra A e B `e la lunghezza del segmento AB; il
lettore osserver`a anche che il punto medio del segmento AB ha come ordinata (a+b)/2, cio`e la semisomma
delle ordinate di A e B. Occorre anche considerare il
fatto che la differenza ba `e positiva se B segue A nel
verso prefissato, mentre `e negativa in caso contrario;
quindi b a ci d`a uninformazione in pi`
u rispetto alla
semplice distanza.
Un sistema di coordinate cartesiane nel piano `e costituito da due rette incidenti in un punto O, detto
origine, sulle quali `e stato fissato un verso di orientamento e una unit`a di misura, non necessariamente
la stessa per le due rette. Queste sono dette assi di
riferimento o semplicemente assi. Si consideri quella
delle due rette che si sovrapponga allaltra (coincidendo anche per lorientamento) con una rotazione
in senso antiorario inferiore a 180 ; tale retta si dice
asse delle ascisse o asse delle x. Laltra si dice asse
delle ordinate o asse delle y. Normalmente, si considerano assi fra loro perpendicolari, con lasse delle
x disegnato orizzontalmente e col verso da sinistra
verso destra. Lasse delle y, allora, `e una retta verticale orientata dal basso verso lalto. Questo si dice
propriamente un sistema di coordinate cartesiane ortogonali, ed `e quello riportato nella Figura 7.2 e che
considereremo costantemente nel seguito.
Un punto A del piano `e individuato dalle sue coordinate: si tracciano per A le parallele ai due assi; la
parallela allasse y incontra lasse x in un punto A ,
e la parallela allasse x incontra lasse y in un punto
A . La coordinata xA di A rispetto allunit`a di misura fissata sullasse delle x si dice lascissa del punto
A; la coordinata yA di A rispetto allunit`a di misura
fissata sullasse y si dice lordinata di A. La coppia di numeri reali (xA , yA ) identifica univocamente

201

7.1. COORDINATE CARTESIANE


100
II

I
B

80

60
40

20
x

O
III

-3

-2

-1

O 1
-20

IV

-40
Figura 7.3: Curve molto allungate

Figura 7.2: Riferimento Cartesiano

il punto A e si scrive A (xA , yA ); i due numeri si


chiamano le coordinate di A. I punti che hanno tutte
e due le coordinate positive si dicono appartenere al
I quadrante; il II quadrante `e costituito dai punti con
ascissa negativa e ordinata positiva; il III quadrante
comprende i punti con entrambe le coordinate negative e, infine, i punti con ascissa positiva e ordinata
negativa appartengono al IV quadrante.
Lidea delle coordinate cartesiane ortogonali, con la
stessa unit`a di misura tanto sullasse delle x quanto
su quello delle y, `e arbitraria e pu`o essere abbandonata non appena altre convenzioni possano rivelarsi
pi`
u convenienti. Prima fra tutte, pu`o cadere la convenzione di usare ununica unit`a di misura; spesso `e
molto pi
u opportuno utilizzare una certa unit`a sullasse x e unaltra, pi`
u grande o pi`
u piccola, sullasse y. Anticipando cose che vedremo pi`
u avanti, ma
che sono del tutto ovvie, se dobbiamo rappresentare
una retta dandamento molto ripido, o una parabola
molto stretta, conviene adoprare ununit`a di misura sullasse delle y molto pi`
u piccola dellaltra, cos`
che su unarea abbastanza ristretta si possano vedere porzioni non trascurabili delle curve; nella Figura
7.3 vediamo la retta y = 40x e la parabola y = 10x2
che sono ragionevolmente rappresentate, avendo scelto lunit`a di misura sulle y venti volte minore di quella
sulle x. Naturalmente, la scelta deve essere del tipo
opposto se la curva `e molto piatta. Queste variazioni
sulle unit`a di misura sono molto comuni e di solito non creano problemi di comprensione, anzi aiutano a capire meglio la natura della curva (basta fare
attenzione!).
Molto meno utilizzati sono i riferimenti non ortogonali. Nella Figura 7.4 abbiamo un caso del genere,
nel quale il punto P ha coordinate (1, 3) e il punto
Q ha coordinate (3, 2). Come si vede, le coordinate
vengono prese tracciando, da un punto, le parallele

y
P

3
Q
b

2
1
O
-1

x
1

Figura 7.4: Assi non ortogonali


ai due assi e considerando poi il punto di intersezione
con laltro asse. In questa figura abbiamo supposto,
di nuovo, che lunit`a di misura sia la stessa per i due
assi, ma nulla osta a che le due unit`a siano diverse.
La misurazione delle coordinate sui due assi avviene, in tutti i casi considerati finora, in modo lineare;
questo significa che un punto P `e a distanza 1, 2, 3,
. . . dallorigine O se la misura del segmento OP `e 1,
2, 3, . . . volte quella dellunit`a di misura. Nella pratica, si sogliono talvolta usare sistemi di coordinate
in scale diverse da quella lineare. Ad esempio, sullasse delle y si pu`o usare una scala quadratica, il che
significa che la misura valutata sullasse y deve essere considerata come il quadrato delleffettivo valore
della seconda coordinata. Nella Figura 7.5 abbiamo
rappresentato la parabola y = x2 in scala quadratica
per le y: come si vede, la curva si riduce a una coppia
di semirette che escono dallorigine.
In effetti, luso delle scale non lineari `e proprio questo: se la curva non `e una retta, scegliendo in modo
opportuno la scala dellasse delle y la curva si trasforma in una retta, semplificandone la rappresentazione
e lo studio pratico. Cos` una scala esponenziale riduce a una retta la funzione esponenziale e una scala
logaritmica riduce a una retta la funzione logaritmica

202

CAPITOLO 7. LE ALTRE GEOMETRIE


16

della somma degli altri due, o uguale, se i tre punti sono allineati. Questa propriet`a si dice disuguaglianza
9
triangolare.
Queste tre propriet`a sono caratteristiche della di4
stanza e possono essere prese come assiomi di una
teoria: si consideri un insieme M sul quale sia defini1
ta una funzione d : M M R per la quale valgano le tre propriet`a; allora d pu`o essere assunta come
-4 -3 -2 -1
2
3
4
O 1
distanza tra due elementi di M (che, convenzionalmente, vengono detti punti), e la coppia (M, d) si
dice uno spazio metrico. I teoremi che si deducono in
Figura 7.5: Una parabola in scala quadratica
questa teoria valgono, in particolare, in R, R2 , R3 e in
generale in Rn . La teoria degli spazi metrici fa parte
(si veda la Sezione 8.5). Difficilmente si trovano rap- della Topologia, alla quale accenneremo brevemente
u avanti.
presentazioni di curve su scale entrambi non lineari, un po pi`
ma il loro utilizzo non `e vietato, se questo pu`o portare
a qualche semplificazione.
Lequazione della retta
Di fondamentale importanza `e saper trovare la di- 7.2
stanza tra due punti. Sia A (xA , yA ) e B
(xB , yB ) (si veda la Figura 7.2). Se si tracciano le Un punto, come s`e visto, `e individuato da una coppia
parallele agli assi passanti per A e per B, si deter- di numeri reali. Una curva `e un insieme di punti sul
mina AB considerando il triangolo rettangolo ACB. piano, di solito un insieme composto di infiniti eleLa distanza AC `e semplicemente la distanza tra A e menti, come si pu`o immaginare pensando a una retta
B che, come sappiamo, `e |xB xA |; analogamente, o a una circonferenza. Lidea di Cartesio fu di defiCB = A B = |yB yA |. Quando si eleva al qua- nire una curva per mezzo di una equazione nelle vadrato un valore assoluto, esso pu`o essere ignorato, e riabili x ed y: un punto appartiene alla curva quando
sostituendo a x ed y le sue coordinate si ottiene unuquindi si ha:
guaglianza, mentre non appartiene alla curva in caso
2
contrario. Ad esempio, data lequazione 3x 2y = 0,
AB = (xB xA )2 + (yB yA )2
secondo questo criterio il punto (2, 3) appartiene alla
p
curva (qualunque essa possa essere), mentre il punto
AB = (xB xA )2 + (yB yA )2
(1, 1) non vi appartiene.
dove la radice quadrata `e presa in senso aritmetico
per salvaguardare il fatto che la lunghezza di un segmento `e sempre una quantit`a positiva. Si invita il
B
lettore a scrivere il semplicissimo algoritmo che, date
B
le coordinate dei punti A e B, trova la loro distanza.
La distanza tra due punti A e B si pu`o indicare con
C
C
la notazione d(A, B) e si osserva che essa gode delle
tre seguenti propriet`a:
B0
A
1. d(A, B) 0, e si ha d(A, B) = 0 se e solo se
C0
A
A = B;
2. d(A, B) = d(B, A);

3. d(A, B) d(A, C) + d(C, B).


la prima propriet`a discende dalla definizione stessa:
la radice quadrata `e zero se e solo se il suo argomento `e zero; questo `e la somma di due quantit`a non
negative e pertanto `e zero se e soltanto se entrambe
sono 0; ma questo succede se e solo se xA = xB e
yA = yB , cio`e i due punti coincidono. La seconda
propriet`a `e veramente ovvia, mentre la terza si rif`a a
una propriet`a vista nella Geometria Euclidea. I tre
punti A, B, C determinano un triangolo, e la disuguaglianza dice semplicemente che un lato `e minore

Figura 7.6: Tre punti allineati


Sicuramente, la curva pi`
u semplice `e la retta. Secondo la Geometria, fissati due punti distinti A e B
esiste una e una sola retta che passa per tutti e due;
in altre parole, la retta `e determinata dai due punti.
Siano allora A (xA , yA ) e B (xB , yB ) due punti
distinti e vediamo sotto quali condizioni un generico
punto C (x, y) appartiene alla retta AB, cio`e `e collineare con A e con B. Come si vede nella Figura 7.6,

203

7.2. LEQUAZIONE DELLA RETTA


C `e collineare con A e con B se e solo se i due triangoli AC0 C e AB0 B sono simili, in quanto langolo in
A deve essere lo stesso per i segmenti AC e AB. Si
ha allora la seguente proporzione tra i cateti dei due
triangoli:
AC0 : AB0 = CC0 : BB0

2. allora, se yA = yB
(a) allora (punti coincidenti) si avverte che i
due punti coincidono e pertanto la retta `e
indeterminata;
(b) altrimenti, (retta verticale) si pone a :=
1, b := 0, c := xA e si esce;

ovvero (senza valori assoluti!):


y yA
x xA
=
.
xB xA
yB yA

(7.1)

3. altrimenti, se yA 6= yB
(a) allora (retta orizzontale) si pone a :=
0, b := 1, c := yB e si esce;

Questa `e lequazione della retta passante per i due


(b) altrimenti (caso generale) si pone a := yA
punti assegnati e non coincidenti; si osservi che se
yB , b := xB xA , c := xA yB xB yA e si `e
fosse A B, cio`e xA = xB e yA = yB , la proporzione
finito.
non avrebbe senso. Tuttavia, il rapporto perde senso
anche quando xA = xB oppure yA = yB . Il primo
Un aspetto molto interessante, e curioso, della Geocaso corrisponde a una retta parallela allasse y, e il
metria Analitica `e che spesso, per non dire sempre,
secondo a una retta parallela allasse x. In questi casi
le formule generali valgono anche nei casi particolalequazione della retta `e:
ri. Qui, ad esempio, se xA = xB e yA 6= yB , il
x = xA e y = yA ;
(7.2) calcolo del punto 3b. ci d`a a = yA yB , b = 0,
c = xB yA xA yB = xA (yB yA ); se dividiamo questi
queste equazioni sono soddisfatte da ogni valore di tre valori per yA yB (il che non cambia lequazione
y la prima, e da ogni valore di x la seconda, il che della retta, come si `e osservato) troviamo a = 1, b = 0
conferma la nostra intuizione su come devono essere e c = xA , come abbiamo posto nel caso particolare.
fatte queste rette.
Lo stesso succede per yA = yB e xA 6= xB , mentre se
Eseguendo qualche calcolo sullequazione (7.1), si anche xA = xB si trova a = b = c = 0. Questo sugtrova facilmente:
gerisce un algoritmo, equivalente al precedente, ma
alquanto pi`
u semplice:
(yA yB )x + (xB xA )y xB yA + xA yB = 0
Algoritmo 7.2
che ha la forma ax + by + c = 0. Questa si dice la for- Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti
ma canonica della retta ed `e la forma generale che pu`o A e B;
assumere tale equazione, come si vede considerando Uscita: i tre coefficienti a, b, c della retta.
anche le due formule (7.2). Essendo ax + by + c = 0
1. Si pone a := yA yB , b := xB xA , c := xA yB
unequazione, la si pu`o moltiplicare o dividere per una
xB yA ;
quantit`a diversa da zero senza cambiare linsieme dei
punti che ne sono soluzione. Questo fatto lo si sfrutta
2. se (a = 0)(b = 0)(c = 0) allora si avverte che
spesso per semplificare i valori di a, b, c o evidenziare
i due punti coincidono, altrimenti si esce con i
casi particolari, come quando abbiamo a = 1 o b = 1.
valori di a, b, c.
Per completare il ragionamento, se consideriamo una
qualsiasi equazione lineare nelle due incognite x ed y,
Supponiamo che nellequazione di una retta ax +
essa sicuramente rappresenta una retta: facendo al- by + c = 0 sia b 6= 0, cio`e supponiamo che la retta
linverso i ragionamenti di prima, si vede come, presi non sia parallela allasse delle y. Lequazione si pu`o
comunque tre punti che verificano lequazione, essi ri- scrivere allora y = ax/b c/b e ponendo m = a/b
sultano collineari. Infatti, i triangoli che si ottengono e q = c/b si ha la forma canonica:
hanno lati in proporzione, quindi sono simili e sono
y = mx + q.
uguali gli angoli in A dei triangoli AC0 C e AB0 B.
Tutte queste considerazioni portano a scrivere il
seguente algoritmo per determinare lequazione della Se arriviamo a questa stessa forma partendo
dallequazione (7.1), troviamo:
retta che passa per due punti assegnati:
Algoritmo 7.1 (Retta per due punti)
Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti
A e B;
cio`e:
Uscita: i tre coefficienti a, b, c della retta.
1. se xA = xB (probabilmente retta verticale)

y=

m=

xB yA xA yB
yB yA
x+
xB xA
xB xA

yB yA
xB xA

q=

xB yA xA yB
.
xB xA

204

CAPITOLO 7. LE ALTRE GEOMETRIE

Il significato di q `e semplice: ponendo x = 0 si ha


A
y = q, cio`e q `e lordinata del punto di intersezione
della retta con lasse y; per questo q si dice lintercetta
della retta. In quanto ad m, come si vede dalla Figura 7.6, `e il rapporto tra il cateto opposto e il cateto
r
adiacente allangolo in A del triangolo ACB; come
si sa dalla trigonometria (e quindi qui stiamo un po
C
anticipando cose che vedremo pi`
u avanti), questa `e la
P
B
tangente dellangolo che la retta forma con lasse delle ascisse, ed m si dice la pendenza della retta: essa
x0 x0 x0 +
O
misura linclinazione della retta rispetto allasse delle
ascisse, crescendo man mano che cresce linclinazione.
Nel caso che abbiamo escluso, di una retta parallela
Figura 7.7: Rette perpendicolari
allasse delle ordinate, si dice che la pendenza `e infinita. Lintercetta `e 0 se e solo se la retta passa per
lorigine. Si ha quindi il seguente risultato:
a x + b y + c = 0, cio`e dalla soluzione del sistema:

Teorema 7.1 Una retta passa per lorigine se e solo


ax + by + c = 0
se ha unequazione della forma ax + by = 0.
a x + b y + c = 0.
Abbiamo cos` introdotto due forme canoniche per
la
la retta. La forma ax + by + c = 0 `e lespressione Come s`e visto nel capitolo dedicato allAlgebra,

soluzione
esiste
ed
`
e
unica
se
e
solo
se
ab

a
b
=
6
0,
pi`
u generale dellequazione della retta e comprende

ab = a b, cio`e vale la proanche le rette parallele ad uno degli assi cartesiani. cio`e ab 6= a b. Se invece

due possibilit`a: i)
Laltra forma, y = mx + q non permette di rappre- porzione: a : a = b : b , si hanno

lo
stesso
rapporto
vale
per
c,
c
,
e
allora
lequazione `e
sentare le rette parallele allasse delle y, ma ha due
indeterminata
(ha
infinite
soluzioni),
o
ii)
il rapporto
vantaggi: esplicita il valore della y in funzione della

tra
c
e
c
`
e
diverso
e
allora
lequazione
`
e
impossibile
x e mette bene in evidenza le caratteristiche fisiche
della retta, cio`e la sua pendenza rispetto allasse x (non ha alcuna soluzione). Geometricamente, questa
e lintersezione con lasse y. Per questo, nella prati- `e la condizione di parallelismo, mentre il primo caca si tende ad usare di pi`
u la seconda forma, anche so riguarda la coincidenza delle due rette, che hanno
se meno generale, ragionando poi in modo specifico infiniti punti a comune.
La corrispondenza tra intersezioni di curve e soper le rette parallele allasse y. Pertanto, `e bene esluzione
di sistemi di equazioni `e lidea fondamentale
sere pronti a passare da una forma canonica allaltra
della
Geometria
Analitica e, come abbiamo fatto per
quando sia necessario o conveniente.
le
rette,
la
ritroveremo
molto spesso, sia nella teoria
I risultati precedenti permettono di affrontare il
che
nella
pratica.
Come
ora vedremo, faremo ricorso
problema del parallelismo tra rette. Date due retallo
stesso
concetto
nello
studio della perpendicola

te ax + by + c = 0 e a x + b y + c = 0, esse sorit`
a
tra
rette,
un
problema
un po pi`
u complesso del
no parallele se e solo se le loro pendenze coincidono,
parallelismo.
Cominciamo
col
considerare
una retta r

cio`e se e solo se a/b = a /b , ovvero se vale la
qualsiasi
e
un
punto
P
su
di
essa,
e
cerchiamo
di tro

proporzione a : a = b : b . Se si ha addirittura
vare
lequazione
della
perpendicolare
ad
r
passante

a : a = b : b = c : c , allora esiste un coefficiente di


proporzionalit`a k per cui a = ka, b = kb, c = kc; di- per P . Nel caso che r sia parallela allasse x o allasvidendo tutto per k si trova che le due rette in effetti se y, la soluzione `e banale: se P (x0 , y0 ) sta sulla
sono la stessa (coincidono) e non solo sono parallele. retta e questa `e parallela allasse x, la sua equazione
Ad esempio, data la retta x + 2y 3 = 0, la retta `e y = y0 e la sua perpendicolare `e x = x0 , dovendo
2x + 4y = 0 risulta ad essa parallela (passante per essere parallela allasse y. Ovviamente le cose si inlorigine), mentre la retta 2x + 4y 6 = 0 `e proprio vertono, ma le rette restano le stesse, se si parte da
una retta parallela allasse y. Consideriamo allora il
coincidente.
Un altro modo per affrontare il problema del pa- caso in cui r ha equazione y = mx + q, con m 6= 0; si
rallelismo `e riferirsi alla definizione di rette parallele ha allora:
come di rette che non hanno punti in comune. Poiche Teorema 7.2 La retta perpendicolare alla retta r di
un punto (x0 , y0 ) appartiene alla retta ax+by +c = 0 equazione y = mx + q (m 6= 0) passante per il punto
se e solo se `e una soluzione di questa equazione, cio`e P (x , y ) di r ha equazione: yy = (xx )/m.
0 0
0
0
se ax0 + by0 + c = 0 `e una proposizione vera, il punto
Prova: Con riferimento alla Figura 7.7, sulla retta
di intersezione di due rette `e costituito dalla soluzione comune alle due equazioni ax + by + c = 0 e r consideriamo due punti B, C di ascissa x0 e

205

7.2. LEQUAZIONE DELLA RETTA


x0 + ; si ha pertanto: B (x0 , mx0 m +
q) = (x0 , y0 m) e C (x0 + , mx0 + m +
q) = (x0 + , y0 + m); per il teorema di Pitagora essi
hanno la stessa distanza da P . Come sappiamo, la
perpendicolare ad r in P `e lasse del segmento BC
e quindi un generico punto A (x, y) sta su tale
perpendicolare se e solo se le sue distanze da B e da
C sono uguali. Abbiamo infatti:
2

AB = (x x0 + )2 + (y y0 + m)2 = (x x0 )2 +
+2(x x0 ) + 2 + (y y0 )2 + 2m(y y0 ) + m2 2
2

AC = (x x0 )2 + (y y0 m)2 = (x x0 )2

Teoricamente, a questo punto, potremmo trovare


la formula della distanza di un punto P qualsiasi da
una retta di cui sia nota lequazione ax + by + c = 0.
Infatti, il teorema precedente d`a modo di trovare lequazione della perpendicolare da P alla retta e quindi, facendo il sistema delle due equazioni, il punto di
intersezione H, che `e la proiezione di P sulla retta. La
lunghezza del segmento P H `e poi la distanza cercata. Un metodo un po pi`
u indiretto, ma che richiede
meno conti, pu`o essere il seguente:
Teorema 7.5 Sia r la retta di equazione ax+by+c =
0 e sia P (x0 , y0 ) un punto qualsiasi; allora la
distanza di P da r `e dato dalla formula:

2(x x0 ) + 2 + (y y0 )2 2m(y y0 ) + m2 2 .

d=

Uguagliando e semplificando si ottiene 4m(y y0 ) =


4(x x0 ) e quindi:
y=

x0 + my0
1
x+
.
m
m

Si osservi che, come deve essere, questa espressione


non dipende da , cio`e dai punti B e C considerati.

|ax0 + bx0 + c|

.
a2 + b2

y
r

P
B

Al variare del punto P sulla retta r cambia lintercetta della perpendicolare (poiche dipende da x0 ), ma
non cambia il coefficiente angolare, che rimane fisso,
uguale a 1/m; si ha quindi questo importantissimo
corollario:

H
A

O
Corollario 7.3 Se una retta r ha equazione y =
mx + q, (m 6= 0), ogni retta perpendicolare ad r ha
Figura 7.8: Distanza di un punto da una retta
1
equazione y = m
x + q . Pi`
u in generale, se la retta
r ha equazione ax+by+c = 0, ogni sua perpendicolare
Prova: Se la retta r `e perpendicolare ad uno degli
ha equazione bx ay + c = 0.
assi, il risultato `e banale. Altrimenti abbiamo a 6= 0
Prova: Per le rette r che non siano perpendicolari e b 6= 0. Il punto A, proiezione verticale del punto P
ad uno degli assi, sappiamo che m = a/b e quindi sulla retta r, ha coordinate (x0 , (ax0 +c)/b) e quindi
1/m = b/a. Altrimenti abbiamo a = 0 oppure b = 0 il segmento P A ha lunghezza |y0 (ax0 + c)/b| =
(ma non entrambi) e questo si riflette sui coefficienti |(ax0 + by0 + c)/b|. Analogamente, si trova P B =
delle rette perpendicolari secondo la discussione fatta |(ax0 + by0 + c)/a|. Ora si osservi che P A P B =
P H AB, doppia area del triangolo rettangolo ABP .
prima del teorema precedente.
Applicando il teorema di Pitagora si ha:
Questa caratterizzazione delle rette perpendicolari
q
permette di risolvere il problema di scrivere lequazio- AB = P A2 + P B 2 = pa2 + b2 |(ax +by +c)|/|ab|
0
0
ne della retta perpendicolare ad r che passa per un
punto assegnato, sia esso sulla retta o fuori di essa:
e quindi P H = P A P B/AB, cio`e:
Teorema 7.4 Sia ax + by + c = 0 lequazione di una
(ax0 + bx0 + c)2
|ab|

PH =
retta r e sia P (x0 , y0 ) un punto qualsiasi; lequa|ab|
a2 + b2 |(ax0 + by0 + c)|
zione della retta per P perpendicolare ad r `e allora
a(y y0 ) = b(x x0 ).
e questo ci d`a immediatamente il risultato cercato.
Prova: Una generica retta perpendicolare ad r ha
equazione bx ay + c = 0; affinche passi per P dobbiamo avere bx0 ay0 + c = 0, cio`e c = ay0 bx0 .
Sostituendo questo valore nellequazione della retta
si ha la formula desiderata.

Dati tre punti, essi determinano univocamente un


triangolo; il perimetro si trova semplicemente calcolando le reciproche distanze dei tre punti. Per larea,
la situazione `e abbastanza pi`
u complicata, ma esiste
una formula molto semplice:

206

CAPITOLO 7. LE ALTRE GEOMETRIE

Teorema 7.6 Siano A (xA , yA ), B (xB , yB ),


C (xC , yC ) tre punti non allineati del piano; larea
del triangolo ABC `e data da:
A=

Corollario 7.7 Tre punti A, B, C sono allineati se e


solo se il determinante (7.3) vale 0.

1
|xA yB +yA xC +xB yC xA yC yA xB yB xC |.
2

Prova: In modo arbitrario possiamo scegliere AB


come base del triangolo; la retta per A e per B `e,
come sappiamo:

7.3

La parabola

Come abbiamo osservato, il concetto fondamentale


della Geometria Analitica `e trovare la corrispondenza tra curve ed equazioni, il che giustifica lo studio
della Geometria (le curve) per mezzo dellAlgebra (le
e quindi laltezza del triangolo `e data dalla distanza equazioni). Abbiamo discusso come le equazioni di
di C da questa retta, cio`e:
primo grado in x ed y identifichino le rette e vicever

sa,
per cui ha interesse studiare cosa succede quando
xC xA
C yA
xB xA yyB
si abbandoni lipotesi di linearit`a in x e/o in y. StrayA
=
h= q
namente, le curve pi`
u semplici dopo le rette risultano
1
1
(xB xA )2 + (yB yA )2
essere le parabole, che abbiamo introdotto fra i luoghi geometrici. Dimostreremo che le parabole con la
x x
(xB xA )(yB yA )
yC yA
C
A
. direttrice parallela allasse x sono tutte e sole le curve
=

p
xB xA yB yA
(xB xA )2 + (yB yA )2 definite da unequazione del tipo y = ax2 + bx + c,
Il denominatore `e chiaramente la base del triangolo, dove a, b, c sono tre numeri reali qualsiasi (a 6= 0, altrimenti si ritorna al caso della retta). Naturalmente,
cio`e la lunghezza di AB. Pertanto:
possiamo scambiare la x con la y e concludere che
1
le
parabole con la direttrice parallela allasse y sono
A = |(xC xA )(yB yA ) (yC yA )(xB xA )|
2
tutte e sole le curve di equazione x = ay 2 + by + c
(a 6= 0). Si pu`o anche dimostrare (ma qui non lo fareche sviluppato d`a la formula cercata.
mo) che una parabola di direttrice una retta qualsiasi
soddisfa unequazione completa di secondo grado in
Nota 7.1
Chi ci ha seguito nella Nota 5.7 relativa
x e in y: ax2 + bxy + cy 2 + dx + ey + f = 0. La
ai determinanti delle matrici 3 3, osserver`
a che la
parabole non `e per`o lunica curva a soddisfare uneformula dellarea si pu`
o ottenere prendendo il valore
quazione del genere; un importante risultato afferma
assoluto del determinante:
che tutte le coniche sono definite da una tale equa

xA yA 1
zione: parabola, ellisse, iperbole e i casi particolari

1
xB yB 1 .
(7.3) circonferenza e coppia di rette. Ci`

o che distingue i
2
xC yC 1
vari tipi di conica `e una specifica condizione sui coefa visto nei corsi
Il valore assoluto si giustifica ricordando che larea de- ficienti dellequazione. Ma questo verr`
ve essere un numero positivo o, al pi`
u, nullo, per le universitari.
figure che degenerano in un segmento. Tuttavia, ci
Secondo la definizione, una parabola `e il luogo dei
possiamo chiedere se il puro e semplice determinante punti equidistanti da una retta (la direttrice) e da
ha un significato preciso. Ebbene, `e proprio cos`: se i un punto (il fuoco); dimostriamo allora il seguente
tre punti non sono allineati e li consideriamo in senso risultato:
x xA
y yA
=
xB xA
yB yA

orario, cio`e partendo da A incontriamo prima B e poi


C quando si ruoti come lorologio (in senso orario),
allora il valore del determinante `e negativo. Se, viceversa, si passa da A a B e poi a C nel verso contrario
alle lancette dellorologio (in senso antiorario), il determinante `e positivo. Si sviluppi un esempio ponendo
A (0, 0), B (4, 0) e C (2, 3): il determinante
vale 12, proprio il doppio dellarea del triangolo. Se
si scambia B con C, il determinante risulta negativo. Questo fatto curioso `e legato al concetto stesso
di determinante, e quindi non lo possiamo affrontare
qui. Unultima osservazione, del tutto ovvia, ci dice che larea del triangolo `e zero se e solo se i tre
punti A, B, C sono allineati; pertanto vale il seguente
criterio di allineamento:

Teorema 7.8 Sia y = d una retta parallela allasse


x che assumiamo come direttrice, e sia F (x0 , y0 )
un punto, non appartenente alla direttrice, che assumiamo come fuoco. La parabola che essi determinano
ha equazione:
y=

1
x0
x2 + y02 + d2
x2
x+ 0
2(y0 d)
(y0 d)
2(y0 d)

Prova: Sia (x, y) un punto generico della parabola;


la sua distanza
p dalla direttrice `e yd e la distanza dal
fuoco vale (x x0 )2 + (y y0 )2 . Uguagliando ed
elevando al quadrato si ha: y 2 2yd+d2 = x2 2x0 x+

207

7.3. LA PARABOLA

x20 + y 2 2y0 y + y02 . Semplificando ed esplicitando la Teorema 7.10 Sia y = ax2 + bx + c (a 6= 0)


una parabola; allora il vertice ha coordinate V
y si ottiene la formula desiderata.
(b/2a, (4ac b2 )/4a) e lasse ha equazione x =
Questo teorema dimostra che ogni parabola del tib/2a.
po detto ha unequazione y = ax2 + bx + c, con a 6= 0
perche y0 6= d dal momento che il fuoco non sta sulla Prova: Poiche lasse passa per il fuoco ed `e perpendirettrice. Vediamo ora il viceversa:
dicolare allasse delle x, per il precedente teorema la
sue equazione `e x = b/2a. Lo stesso vale per la2
Teorema 7.9 Sia y = ax + bx + c, con a 6= 0.
scissa del vertice, la cui ordinata `e data (come punto
Tale equazione rappresenta una parabola di fuoco e
di mezzo di F D) da:
direttrice:

1 4ac b2 + 1 4ac b2 1
4ac b2
b 4ac b2 1
4ac b2 1
+
=
.
F =
,
y=
.
2
2a
2a
4a
2a
4a
4a
Prova: Vediamo algebricamente che i tre parametri a, b, c determinano univocamente le coordinate del
fuoco e lequazione della direttrice. Uguagliando tali
parametri ai valori ottenuti nel teorema precedente si
ha il sistema:

a = 1/(2(y0 d))
b = x0 /(y0 d)

c = (x20 + y02 d2 )/(2(y0 d))

nelle tre incognite x0 , y0 , d. Pertanto, il teorema risulta vero se e solo se questo sistema ammette ununica
soluzione. Dalla prima equazione si ha: y0 d = 1/2a
e quindi dalla seconda si ricava: x0 = b(y0 d),
cio`e: x0 = b/2a. Nella terza equazione scriviamo
y02 d2 = (y0 d)(y0 + d) e sostituiamo i valori noti.
Con la prima equazione, si ha il sistema:

y0 d = 1/2a
y0 + d = 2c b2 /2a
che si pu`o risolvere per somma e sottrazione. La
soluzione d`a i valori desiderati.
La pi`
u semplice delle parabole `e y = x2 e il lettore `e invitato a disegnarla, insieme al fuoco e alla direttrice. Possono essere importanti i seguenti
concetti:

Definizione 7.1 Si dice asse di una parabola la retta


passante per il fuoco e perpendicolare alla direttrice.
Si dice vertice della parabola lintersezione dellasse
con la parabola stessa.
Lasse `e, in effetti, un ase di simmetria, cio`e se P `e un
punto della parabola, il simmetrico Q di P rispetto
allasse `e anchesso un punto della parabola. Infatti,
Q ha la stessa ordinata di P e quindi la stessa distanza dalla direttrice; inoltre, per definizione di punto
simmetrico, lasse della parabola risulta essere anche
lasse del segmento P Q, e quindi F ha la stessa distanza da P e da Q. Il vertice V `e il punto estremo
della parabola, nel senso che esso `e il punto della parabola pi`
u vicino alla direttrice e si trova a met`a del
segmento F D, se D `e il punto di intersezione dellasse
con la direttrice. Si ha allora:

A seconda che il fuoco abbia ordinata maggiore o


minore della direttrice, la parabola risulta avere la
concavit`a rivolta verso lalto o verso il basso; questo
purche la curva non pu`o tagliare la direttrice, taglio
in cui avrebbe distanza zero da questa e distanza positiva dal fuoco. Si ha allora un modo semplice per
determinare come `e disposta la concavit`a:
Teorema 7.11 La concavit`
a della parabola y =
ax2 + bx + c (a 6= 0) `e rivolta verso lalto se e solo se
`e a > 0.
Prova: Secondo il Teorema 7.9 abbiamo: a =
1/2(y0 d) e quindi a ha lo stesso segno di y0 d; ma
questo `e positivo se e solo se y0 > d, cio`e se il fuoco `e
posto al di sopra della direttrice e quindi la concavit`a
`e rivolta verso lalto.
Capire da che parte `e rivolta la concavit`a della parabola pu`o aiutare a risolvere vari problemi. Si consideri, ad esempio, il fatto di voler determinare se
il punto (x0 , y0 ) `e interno o esterno alla parabola
y = ax2 + bx + c (a 6= 0), dove per interno intendiamo contenuto nella concavit`a della parabola. Se
la concavit`a `e rivolta verso lalto e y = ax20 + bx0 + c
`e il valore che la parabola assume in x0 , chiaramente il punto `e interno se e solo se y0 > y, cio`e
y0 > ax20 + bx0 + c. Questo `e importante quando
si vogliano condurre le tangenti alla parabola da un
punto P (x0 , y0 ) assegnato; la cosa `e possibile se e
solo se il punto `e esterno alla parabola o si trova su di
essa. Daltra parte, trovare lequazione delle tangenti
alla parabola passanti per P non `e difficile:
Teorema 7.12 Sia y = ax2 + bx + c (a 6= 0) una
parabola e sia P (x0 , y0 ) un punto ad essa non
interno; allora i coefficienti angolari m delle tangenti alla parabola passanti per P sono le soluzioni
dellequazione:
m2 2m(2ax0 + b) + b2 + 4ay0 4ac = 0.
Prova: Una retta generica di coefficiente angolare
m passante per P ha equazione y y0 = m(x x0 )

208
e quindi si pu`o far sistema tra questa equazione e
quella della parabola: le soluzioni del sistema saranno
i punti di intersezione della retta con la parabola. Le
tangenti sono caratterizzate dal fatto che i due punti
di intersezione in effetti coincidono. Eliminando la y,
dal sistema si ottiene lequazione di secondo grado in
x: mx mx0 + y0 = ax2 + bx + c, cio`e: ax2 (m
b)x + mx0 y0 + c = 0, che d`a le ascisse dei punti di
intersezione. Affinche questi coincidano `e necessario
e sufficiente che il discriminante dellequazione sia 0,
cio`e sia: (m b)2 4a(mx0 y0 + c) = 0. Eseguiti i
pochi calcoli necessari, si trova che questa `e proprio
lequazione desiderata.
Il fatto che siamo partiti da un punto esterno alla parabola ci assicura che le soluzioni dellequazione
esistono senzaltro. Affrontiamo allora il problema da
un altro punto di vista e proviamo ad immaginare che
questo possa non essere il caso, cio`e immaginiamo di
non conoscere la posizione di P rispetto alla parabola.
Il ragionamento per trovare le tangenti rimane invariato, solo che alla fine non sappiamo se lequazione
del teorema precedente ha soluzioni o meno. Possiamo allora osservare che tale equazione deve avere
due soluzioni se il punto P `e esterno, una sola soluzione se P si trova sulla parabola (si pu`o tracciare
solo la tangente in quel punto), e nessuna soluzione
se P `e interno. Ma tutto ci`o `e dato dal discriminante
dellequazione, che vale:
(b + 2ax0 )2 b2 4ay0 + 4ac = 4a(ax20 + bx0 + c y0 ),
e si ritrovano esattamente le condizioni gi`a viste. Infatti, perche non vi siano soluzioni (punto interno) a
e ax20 + bx0 + c y0 devono essere discordi, e quindi
se a > 0 deve essere ax20 + bx0 + c < y0 , e se a < 0
deve essere ax20 + bx0 + c > y0 .
Lultimo problema che vogliamo risolvere `e la determinazione della parabola che passi per certi punti
assegnati. Poiche ax2 + bx + c `e un polinomio di
secondo grado, algebricamente bastano tre valori distinti della x per determinarlo completamente; daltra parte, geometricamente, la y non pu`o assumere
pi`
u di due valori uguali, e anche questo si deve riflettere sulle condizioni di esistenza della parabola. In
effetti si ha:

CAPITOLO 7. LE ALTRE GEOMETRIE


sostituendo nellequazione della parabola i valori dei
tre punti si ottiene il sistema:

yA = ax2A + bxA + c
yB = ax2B + bxB + c

yC = ax2C + bxC + c

nelle tre incognite a, b, c. Affinche il sistema abbia soluzione, la matrice del sistema deve avere il
determinante diverso da 0; ma:

x
2A xA 1
x
xB 1 =
B
x2 xC 1
C
= x2A xB + xA x2C + x2B xC x2A xC xA x2B
xB x2C + (xA xB xC xA xB xC ) =

= (xA xC )xA xB (xA xC )xA xC (xA xC )x2B +


+(xA xC )xB xC =

= (xA xB xA xC x2B + xB xC )(xA xC ) =


= (xB xA )(xC xB )(xA xC ).
Questa espressione vale 0 se e solo se xA = xB , oppure se xB = xC , oppure xC = xA , ma questo `e
escluso dallipotesi che le ascisse siano due a due distinte. Daltra parte, se fosse yA = yB = yC , sostituendo questi valori nella colonna delle x o delle x2
otterremmo 0, perche tale colonna sarebbe multipla
dellultima, e quindi avremmo a = 0 e b = 0, contro
lipotesi che debba essere a 6= 0.

7.4

Circonferenza,
iperbole

ellisse

Come dimostra il caso della parabola, la definizione di una curva come luogo geometrico aiuta molto nella ricerca dellequazione che definisce la stessa
curva nella Geometria Analitica. La cosa `e particolarmente vera nel caso della circonferenza che, come ricordiamo, `e il luogo dei punti equidistanti dal
centro. Sia allora O (x0 , y0 ) il centro di una circonferenza e sia r il suo raggio; un punto generico
P
p (x, y) della circonferenza deve esser tale che:
Teorema 7.13 Siano A (xA , yA ), B (xB , yB ),
(x x0 )2 + (y y0 )2 = r e quindi, elevando al
C (xC , yC ) tre punti del piano tali che xA , xB , xC quadrato, x2 2x0 x + x20 + y 2 2y0 y + y02 = r2 .
siano a due a due distinti e fra yA , yB , yC vi siano Ordinando i termini di questo polinomio di secondo
al pi`
u due valori uguali; allora esiste una e una sola grado in x e y si ha lequazione: x2 + y 2 2x0 x
parabola y = ax2 +bx+c (a 6= 0) passante per A, B, C. 2y0 y + x20 + y02 r2 = 0. Si ha allora il seguente:

Prova: Intanto, assegnata la parabola le condizioni


su A, B, C sono verificate perche ad ogni valore di x
corrisponde un unico valore di y e ad ogni valore di
y corrispondono al pi`
u due valori di x. Viceversa,

Teorema 7.14 Unequazione di 2 grado in x e y


rappresenta lequazione di una circonferenza se e solo
se ha la forma x2 + y 2 + ax + by + c = 0, con c >
(a2 + b2 )/4.

209

7.4. CIRCONFERENZA, ELLISSE E IPERBOLE


Prova: Se partiamo da una circonferenza, otteniamo
unequazione del tipo desiderato ponendo a = 2x0 ,
b = 2y0 , c = x20 + y02 r2 , ove (x0 , y0 ) sono le
coordinate del centro ed r `e il raggio; questo d`a
c = (a2 + b2 )/4 r2 e quindi la condizione su c `e senzaltro verificata. Viceversa, partiamo da unequazione del tipo descritto nellenunciato del teorema; definiamo x0 = a/2, y0 = b/2 e consideriamo la quantit`a
r2 = c(a2 +b2 )/4; per ipotesi, questa quantit`a `e positiva e quindi la possiamo assumere come quadrato
del raggio. Ma ora, se consideriamo lequazione della
circonferenza di raggio O (x0 , y0 ) e raggio r come
appena trovati, per la prima parte del teorema arriviamo proprio allequazione x2 + y 2 + ax + by + c = 0,
e quindi lasserto `e provato.
Come osservato, moltiplicando unequazione del tipo della circonferenza per una quantit`a s 6= 0, lequazione non cambia e non cambia perci`o la curva. Quindi, possiamo dire che unequazione di secondo grado
in x e y rappresenta una circonferenza se e solo se: i) i
coefficienti di x2 e y 2 sono uguali; ii) manca il termine
in xy; iii) si ha c > (a2 + b2 )/4. Se queste condizioni
sono verificate, dividendo tutto per il coefficiente di
x2 e y 2 ci si riporta alla forma del teorema precedente e si `e quindi in grado di determinare le coordinate
del centro e la misura del raggio. Si noti che `e particolarmente semplice lequazione di una circonferenza
di centro lorigine e raggio r: x2 + y 2 = r2 ; invece,
una circonferenza che passi per lorigine ha equazione
x2 + y 2 + ax + by = 0, cio`e ha c = 0.
Come sappiamo dal Teorema 6.36, dati tre punti
non allineati A, B, C, esiste una e una sola circonferenza che passi per tutti e tre. Lo stesso teorema
fornisce un metodo per trovare centro e raggio della circonferenza, metodo che potremmo seguire, dato
che nella sezione precedente abbiamo imparato a trovare le equazioni degli assi dei segment AB e BC, a
calcolare la loro intersezione O e infine a trovare la distanza di O da A (o da B o da C). Tuttavia, possiamo
enormemente semplificare tutta questa procedura applicando direttamente un po dAlgebra: imponiamo
che la circonferenza generica x2 + y 2 + ax + by + c = 0
passi per A (xA , yA ), B (xB , yB ) e C (xC , yC ).
Si ottiene il sistema di tre equazioni:
2
2
+ axA + byA + c = 0
xA + yA
2
2
xB + yB
+ axB + byB + c = 0
2
2
+ axC + byC + c = 0
xC + yC
nelle tre incognite a, b, c. Risolvendo questo sistema, si trovano i parametri a, b, c e quindi lequazione
della circonferenza cercata, dalla quale si hanno le
coordinate del centro e la lunghezza del raggio.
Nota 7.2

Consideriamo ora il precedente sistema


dal punto di vista dei determinanti, come abbiamo

imparato nella Nota 5.7.


del sistema `e:

xA

xB

xC

Il determinante della matrice

yA 1
yB 1 ,
yC 1

una nostra vecchia conoscenza, incontrata nella Nota


7.3. Il sistema ha una e una sola soluzione se e solo se
questo determinante `e diverso da zero, ma nella nota
abbiamo visto che questo determinante `e diverso da
zero se e solo se i tre non sono allineati. Poiche `e
proprio questa lipotesi che abbiamo fatto, il sistema
ha sempre una soluzione e tale soluzione determina la
circonferenza cercata. Il lettore `e invitato a trovare
la circonferenza che passa per i punti A (0, 0),
B (10, 0) e C (8, 4), dopo aver cercato di stabilire
ad occhio i valori di a, b, c. Le terne Pitagoriche, viste
nel Teorema 6.28 possono tornare utili a tale scopo.

Determinare lequazione di unellisse comunque disposta sul piano cartesiano non `e del tutto banale;
ci accontenteremo pertanto di trovare lequazione di
unellisse disposta come in figura, cio`e col centro nellorigine degli assi e simmetrica sia rispetto allasse
delle x sia a quello delle y. Se lellisse `e allungata
come nella Figura 6.33, i due fuochi si troveranno
sullasse delle x. Siano (a, 0) e (a, 0) le coordinate
dei punti estremi dellasse dellellisse disposto sullasse x, e siano (0, b) e (0, b) gli estremi dellaltro asse
(nella figura `e a > b, ma potremmo avere a < b senza problemi, solo che la posizione dei fuochi cambia).
Con queste condizioni la posizione dei fuochi `e determinata. Infatti, per il punto (a, 0) la somma delle
distanze dai fuochi F = (f, 0) ed F = (f, 0) `e
a f + a + f = 2a, e quindi 2a `e la costante dellellisse. Daltra parte, per il
ppunto (0, b) la somma delle
distanze dai fuochi `e: 2 b2 + f 2 , e questa quantit`a
deve essere uguale a 2a. Dividendo per 2 ed elevando
al quadrato si ottiene b2 + f 2 = a2 , e questo
ci d`a il
valore delle ascisse dei due fuochi: f = a2 b2 .
Con queste premesse, consideriamo un generico
punto (x, y) dellellisse e calcoliamo la somme delle
distanze dai fuochi, che deve essere uguale a 2a:
p
p
(x f )2 + y 2 + (x + f )2 + y 2 = 2a
p
p
x2 + y 2 + f 2 2xf + x2 + y 2 + f 2 + 2xf = 2a.

Eleviamo al quadrato sfruttando le nostre conoscenze


dei prodotti notevoli e semplificando:
p
2x2 + 2y 2 + 2f 2 + 2 (x2 + y 2 + f 2 )2 4x2 f 2 = 4a2
p

(x2 + y 2 + f 2 )2 4x2 f 2 = 2a2 x2 y 2 f 2 .

Elevando ancora al quadrato si elimina (x2 +y 2 +f 2 )2 :


4x2 f 2 = 4a4 4a2 (x2 + y 2 + f 2 ).

210
Ora occorre semplificare e scrivere a2 b2 al posto di
f 2 , come abbiamo osservato; si arriva cos` allespressione x2 b2 = a2 y 2 + a2 b2 , e infine si divide tutto per
a2 b2 dopo aver trasportato a sinistra il monomio con
y:
x2
y2
+ 2 =1
(7.4)
2
a
b
Questa formula determina lellisse come curva, cio`e
`e la formula analitica dellellisse; p
se il valore di x, diciamo x0 `e noto, si ricava y = 1 x20 /a2 , cio`e si
hanno due valori opposti per la y, come `e chiaro dalla
figura. Molte altre propriet`a possono essere ricavate
da questa espressione, ma qui ci limiteremo ad alcune osservazioni. La circonferenza di centro lorigine
e raggio a ha equazione x2 + y 2 = a2 , come gi`a sappiamo. Se fissiamo un punto x0 (a x0 a) e
calcoliamo lordinata positiva del puntopsulla circonferenza e sullellisse, troviamo:
yC = a2p x20 per
p
la circonferenza, e yE = b 1 x20 /a2 = ab a2 x20 .
Quindi tra i due punti c`e un rapporto b/a costante.
Questa osservazione permise a Keplero di calcolare
larea di unellisse.
Teorema 7.15 Sia data unellisse di equazione
(7.4), nella quale a e b sono le misure dei semiassi;
allora larea dellellisse `e A = ab.
Prova: Possiamo suddividere lasse maggiore in piccoli segmenti di lunghezza h e, su tali segmenti, costruire dei rettangoli che permettano di approssimare
larea del cerchio e quella dellellisse. Se x0 `e lestremo di uno dei segmenti,p
il rettangolo che approssima
il cerchio avr`a area 2h a2 x20 ; quindi la somma
delle aree di tutti questi rettangoli
approssimer`a laP p
rea totale del cerchio: AC =
2h a2 x20 a2 .
Operando in modo analogopper lellisse, larea di ciascun rettangolo sar`a 2h ab a2 x20 , e quindi larea
P bp 2
P p 2
totale `e: AE =
2h a a x20 = ab
2h a x20 ,
in quanto per la propriet`a distributiva la costante
b/a si pu`o mettere in evidenza. Ma allora abbiamo
AE = ab AC , questo qualunque sia il numero e la dimensione dei segmenti usati; la relazione vale perci`o
anche per le aree calcolate precisamente e pertanto:
AE = ab a2 = ab, come si voleva.

CAPITOLO 7. LE ALTRE GEOMETRIE


6.34, che ha i due fuochi sullasse delle x, equidistanti dallorigine. Come per lellisse si potrebbe considerare liperbole con i fuochi sullasse delle y, ma
i risultati sarebbero analoghi. Chiamiamo allora a
la distanza del vertice delliperbole dallorigine degli
assi ed f la distanza dei due fuochi, ancora dallorigine. La costante delliperbole `e data dalla differenza
AF2 AF1 = a + f (f a) = 2a. Per un misterioso motivo che sar`a chiaro alla fine dei conti e
che giustificheremo nella prossima nota, introducia2
2
2
mo una costante
b > 0 tale che b = f a ; si
ha allora f = a2 + b2 e preso un generico punto
P (x, y) sulliperbole, impostiamo lequazione relativa imponendo la condizione sulla differenza delle
distanze:
p
p
P F2 P F1 = (x + f )2 + y 2 (x f )2 + y 2 = 2a.

A questo punto, i conti sono abbastanza analoghi a


quelli svolti per lellisse e quindi lasciamo al lettore
tutta la gioia di portarli fino in fondo. Ad un certo
punto (che in realt`a pu`o essere del tutto
arbitrario) si
dovr`a sostituire f con lespressione a2 + b2 e questo
permette di arrivare alla forma finale:
x2
y2

=1
a2
b2

(7.5)

che fa il paio con quella dellellisse. Invitiamo il lettore a disegnare liperbole con a = 3, b = 4 e quindi
f = 5.
Liperbole per cui a = b si dice equilatera; ruotando uniperbole equilatera di 45 in senso antiorario, si
trova liperbole y = 1/x, cio`e xy = 1. Un utile allenamento consiste nel cercar di risolvere i soliti esercizi,
trovando le tangenti (ad uniperbole data dallequazione (7.5)) da un punto assegnato fuori delliperbole
stessa, ad esempio dallorigine (ma questo `e un caso
cattivo) oppure dal punto A (a/2, 0).
Nota 7.3

Mentre nellellisse la costante b ha un


significato ben preciso, cio`e di lunghezza del semiasse
minore, nelliperbole la b sembra un arbitrio il cui
unico scopo `e di semplificare la formula finale (7.5).
In realt`
a non `e proprio cos`. Geometricamente, la
nostra iperbole (Figura 6.34) non interseca lasse
delle y, e quindi sembra venir meno laggancio
che legava la costante b allellisse. Tuttavia, se
algebricamente portiamo avanti il sistema tra lequazione (7.5) e lasse y di equazione x = 0, si ottiene
lequazione in y: y 2 = b2 , che chiaramente non ha
soluzioni reali. Essa ha per`
o le soluzioni complesse
y = ib, e quindi possiamo affermare (con un po
di facciatosta matematica) che liperbole incontra
lasse delle y nei due punti immaginari ib. Ecco allora che abbiamo trovato un significato per la nostra b.

Il problema della lunghezza dellellisse (cio`e del


suo perimetro) `e piuttosto pi`
u complicato e richiede luso del calcolo integrale; pertanto noi non lo
affronteremo e rimandiamo la sua soluzione ai corsi
di Analisi Matematica, che lo studente potr`a seguire
allUniversit`a.
La pi`
u complicata delle coniche `e senzaltro liperbole; pertanto, se `e gi`a complesso trovare lequazione della generica ellisse, a maggior ragione `e laborioso cercare quella della generica iperbole. LimitiaLe due rette y = ab x, cio`e ay bx = 0, passanti
mo quindi la nostra ricerca alliperbole della Figura per lorigine, hanno un significato particolare. Con-

7.5. GEOMETRIE NON-EUCLIDEE


sideriamo la retta y = bx/a quando x cresce indefinitamente, e confrontiamola con liperbole, o meglio
col suo ramo positivo. Questo ramo ha equazione:
r
b2 2
y=
x b2 .
a2
La distanza verticale fra le due curve `e, per defiizione,
la differenza fra le ordinate delle due curve per uno
stesso valore dellascissa. La distanza verticale non
`e la stessa cosa della distanza che, in un punto della
curva, `e la minima distanza dai punti dellaltra curva.
Proprio perche la distanza (tout-court) `e definita come minimo, essa `e pi`
u breve della distanza verticale.
Se questa, al crescere di x, si avvicina a 0, a maggior
ragione si avviciner`a a 0 la distanza. Nel nostro caso
la distanza verticale `e:
r
b2 2
b
x b2 .
v (x) = x
a
a2

211
mondo stesso, considerato come una semplice immagine riflessa del mondo delle idee. Tutti ricordiamo il
mito della caverna, ed `e difficile dire se Platone fosse
stato influenzato dalla geometria nelle sue concezioni
filosofiche, o se ammirasse la geometria perche rifletteva cos` bene la sua filosofia. Euclide, ottantanni
dopo Platone, non fece che sistematizzare e concretizzare in una teoria ci`o che Platone aveva intuito e
creduto. Di conseguenza, fino al 1800 tutti hanno
fermamente creduto che la Geometria Euclidea fosse indubitabile e nessuno ha mai pensato di mettere
in dubbio che gli sviluppi della Geometria Euclidea
fossero gli unici a descrivere il mondo reale.

Questa petizione di principio ha condizionato lattitudine dei matematici a cogliere aspetti importanti,
non solo della geometria, ma anche dellaritmetica e
dellalgebra, discipline che fino al 1600 sono rimaste a
quella subordinate, e che, comunque, hanno con essa
condiviso lidea di rappresentare, nel loro complesso,
la vera descrizione dei fenomeni naturali legati alle
Questa quantit`a `e senzaltro positiva in quanto il mi- forme e ai conteggi. Come vedremo, questa credenza
nuendo `e maggiore del sottraendo a causa del b2 . Si fece s` che spiriti brillanti non si accorgessero di strade ampie e interessanti che pure avevano imboccato,
pu`o allora scrivere nel modo seguente:
ma che ritennero false e fuorvianti.
r
r
a2
b2 2 b2 2
b
b
b
Naturalmente, lerrore era nel manico, e questo lo
v (x) = x
x 2a = x x 1 2.
a
a2
a
a
a
x
rendeva pi`
u subdolo, cos` come oggi probabilmente
non vediamo, o siamo portati a trascurare, sviluppi
Osserviamo che a `e fisso e quindi, quando x cresce
che non si accordano con la nostra mentalit`a, condiindefinitamente, a2 /x2 si avvicina sempre pi`
u a 0.
zionata da altri pregiudizi che non ci appaiono tali.
Quindi v (x) si riduce a 0, come differenza di quanCome abbiamo ricordato e come tramanda Platarco,
tit`a praticamente uguali. Perci`o la retta ay bx = 0
la geometria era nata con scopi molto pratici: misurimane sempre al di sopra del ramo delliperbole, ma
rare i terreni, dando modo di ripristinare situazioni di
le due curve si avvicinano sempre pi`
u. Si dice che
fatto cancellate dalle piene del Nilo. I Greci fecero un
la retta `e un asintoto della curva. In pratica, lesipasso fondamentale, che per`o alcuni di loro (risultati
stenza di un asintoto indica che una curva cresce in
poi i pi`
u influenti) portarono troppo lontano. Il pasmodo pressoche lineare quando x va verso linfinito.
so consistette in quel processo di astrazione che port`o
Non tutte le curve hanno un asintoto: ad esempio,
appunto alla formulazione assiomatica di Euclide, che
la parabola cresce come x2 e non linearmente; quein forma meno precisa, ma sostanzialmente identica,
sto esclude, per definizione, che la parabola abbia un
era noto ai tempi di Platone. Questa forma sembraasintoto. Ritorneremo su questo argomento quando
va tanto perfetta che si stabil` dovesse costituire la
studieremo il comportamento delle funzioni nella Serealt`a stessa, cio`e lessenza riposta dietro lapparenza
zione 8.7; infatti, un asintoto pu`o caratterizzare la
dei fenomeni, del reale come ci si presenta. Pertanto,
crescita di una funzione e quindi essere utilissimo per
` la realt`a, e
filosoficamente, la Geometria Euclidea e
capire landamento della funzione stessa.
nulla ci pu`o essere di vero al di fuori di ci`o che si pu`o
dedurre con tale scienza.

7.5

Geometrie non-Euclidee

La Geometria di Euclide `e stata considerata, per circa


2000 anni, lunica geometria possibile e immaginabile, per il semplice motivo che la si riteneva un modello (veritiero) della realt`a. Con considerazioni pi`
u
filosofiche che matematiche, si riteneva che la Geometria Euclidea descrivesse esattamente il mondo in
cui viviamo; anzi, da un punto di vista platonico, la
Geometria era lidea del mondo, quindi pi`
u reale del

Questa fede aveva soltanto un piccolo neo. Dei dieci punti che abbiamo visto nella sezione [6.1], nessuno
trovava niente da ridire sui cinque assiomi di Aristotele e sui primi quattro postulati di Euclide. Il quinto,
per`o, con la sua formulazione abbastanza complicata,
di certo pi`
u complessa di quella di tutti gli altri, era
guardato con sospetto. Nessuno che dubitasse della
sua validit`a, ma esso veniva meno al concetto di semplicit`a e immediata evidenza che si pensava dovessero
avere gli assiomi. Si pens`o allora che si potesse intro-

212
durre un altro assioma, pi`
u elementare, e dal quale
il quinto postulato potesse essere dedotto. Addirittura, molti ritennero che esso potesse essere dedotto
dai primi quattro, e perci`o potesse essere eliminato
dalla formulazione di Euclide.
In effetti, possiamo distinguerne tre filoni:
cercare di dimostrare il quinto postulato mediante tutti gli altri; questo avrebbe permesso di
eliminarlo, addirittura semplificando la teoria;

CAPITOLO 7. LE ALTRE GEOMETRIE


C

cercare di sostituire il quinto postulato con altri


Figura 7.9: Il quadrilatero di Saccheri
pi`
u semplici, anche se equivalenti; questo avrebbe soddisfatto il senso estetico dei matematici,
AD = CD per costruzione, e possiamo applicare il
senza cambiare nulla della teoria;
terzo principio di congruenza. La conclusione `e apb = DCA.
b
Si hanno perci`o tre possibilit`a
negare il quinto postulato per arrivare a qualche punto B DC
b e DCA:
b
conclusione assurda; questo, almeno, avrebbe di- relative agli angoli B DC
mostrato che il postulato era necessario, avrebbe
1. sono entrambi retti;
respinto il primo dei due precedenti modi di ragionare e avrebbe incanalato le ricerche lungo il
2. sono entrambi acuti;
secondo.
3. sono entrambi ottusi.
Intorno allanno 1000, i matematici arabi affrontarono seriamente il problema delle parallele, laltro no- La Geometria Euclidea assume che sia vera la prima
me con cui `e nota la questione del quinto postulato di ipotesi. Come s`e visto, la retta CD risulta parallela
Euclide. Prima il fisico e matematico Ibn al-Haithan ad r e quindi BD ed AC sono perpendicolari alla stes(latinizzato in Alhazen, poi il poeta e matematico sa CD; questo implica che gli angoli in D e in C sono
Omar Khayyam e infine lastronomo e matematico retti. Se si riuscissero ad escludere le altre due posNasir Eddin al-Tusi studiarono a lungo la faccenda, sibilit`a, il gioco sarebbe fatto e avremmo dimostrato
senza approdare a nulla di definitivo. Certamente, il il postulato delle parallele.
pi`
u famoso dei tre `e Omar Khayyam, la cui opera poeLa cosa non si rivel`o affatto semplice e molti cretica `e nota in occidente dalle traduzioni ottocentesche dettero di aver dimostrato lassurdit`a di 2. e di 3.
in inglese e in francese, e lalone esotico, decadente ed laddove, invece, o serano sbagliati oppure avevano
epicureo che lha circondato, lo ha fatto approdare utilizzato involontariamente qualche teorema equivaanche ai fasti del cinematografo. Come matematico, lente al quinto postulato. Il caso pi`
u sconcertante fu
`e stato forse il primo ad interessarsi in modo sistema- certo quello dellabate gesuita Girolamo Saccheri. Altico delle equazioni di terzo grado, anche se riteneva linizio del 1700 egli riprese il quadrilatero che porta il
che non potessero essere risolte per via algebrica, ma suo nome e cerc`o di ragionare per assurdo. Supponiab e DCA
b
solo geometricamente come intersezione di coniche.
mo, disse, che ad esempio i due angoli B DC
Questi matematici arabi introdussero il cosiddet- siano entrambi acuti; vediamo quali conseguenze si
to quadrilatero di Saccheri. Questo nome, che natu- possono dedurre da questa ipotesi e se ne troviamo
ralmente gli arabi non usavano, sar`a giustificato pi`
u qualcuna assurda avremo dimostrato che lipotesi di
tardi; la sua costruzione `e mostrata nella figura 7.9. acutezza non pu`o andar bene. Operiamo poi in modo
b e DCA
b siano entrambi
Si prendono due punti distinti A e B su una retta analogo supponendo che B DC
r e si tracciano i segmenti AC e BD, perpendicolari ottusi e cos` alla fine avremo la dimostrazione complead r e della medesima lunghezza. Si considera infine ta che lunica condizione ammissibile la 1., proprio
la retta passante per C e D e quindi il quadrilatero quella equivalente al quinto postulato di Euclide.
ABDC.
Con questo bel programma in mente, Saccheri si
E facile dimostrare, senza far uso del quinto po- mise al lavoro, e poiche era un buon matematico scob e C DB
b sono uguali. pr` una serie di teoremi dedotti dallipotesi che i due
stulato, che i due angoli ACD
b e DCA
b fossero acuti. Questo era molto
Infatti, si comincino a considerare i triangoli ABD angoli B DC
e BCA, che sono uguali perche AB `e in comune, bello e interessante, ma Saccheri aveva come obiettiAC = BD per costruzione e, ancora per costruzio- vo quello di trovare una conseguenza assurda, e cos`
b e C AB
b sono uguali in quanto tanto sarrabatt`o e tanto scrisse che a un certo punne, gli angoli ABD
retti. Pertanto, BC = AD e quindi sono uguali i to si convinse di aver trovato il baco che cercava. A
triangoli BDC e ADC; ancora, CD `e in comune e quel punto, tutto contento, decise che la Geometria

213

7.5. GEOMETRIE NON-EUCLIDEE


Euclidea era proprio quella vera. Purtroppo per lui,
limpostazione ideologica con la quale era partito gli
aveva fatto prendere lucciole per lanterne; i teoremi
che aveva dimostrato erano tutti validi, ma erano validi in una geometria che supponesse acuti gli angoli
b e DCA,
b e in ci`o che aveva trovato non cera nulB DC
la di assurdo. Come conclude malinconicamente C.
B. Boyer: [Saccheri] . . . perdette il diritto di rivendicare a se quella che sarebbe stata la pi`
u significativa
scoperta del XVIII secolo: la geometria non-euclidea.
Il suo nome rimase oscuro per un altro secolo, poiche
limportanza della sua opera fu trascurata da coloro
che vennero dopo di lui.
Lanno cruciale per le geometrie non-Euclidee fu
il 1829, con la pubblicazione del saggio Sui principi
della Geometria di Nicolaj Lobacevskij e il Tantamen, il trattato nel quale Farkas Bolyai riportava
in appendice le idee del figlio Janos sulla questione
del quinto postulato di Euclide. Lobacevskij era un
giovane matematico russo che gi`a da qualche anno
si occupava dei fondamenti della geometria e, dopo
vari tentativi e vari tentennamenti, aveva, come si
suol dire, saltato il fosso operando una vera e prob
pria rivoluzione: ipotizzare che i due angoli B DC
b
e DCA del quadrilatero di Saccheri siano entrambi
acuti non `e andare contro la realt`a, ma `e semplicemente un modo diverso di fondare la geometria rispetto allimpostazione di Euclide. I risultati che si
ottengono sono assolutamente validi, anche se in un
mondo diverso da quello che aveva in mente Euclide. In particolare, nel mondo di Lobacevskij, per
un punto esterno a una retta r passano infinite rette
parallele ad r, cio`e che non incontrano mai r, pur
prolungate indefinitamente. Unaltra particolarit`a `e
che la somma dei tre angoli interni di un triangolo
`e minore di due angoli retti, invece di essere perfettamente uguale. Naturalmente, le propriet`a diverse
sono infinite, ma non sono contraddittorie le une con
le altre, e i teoremi continuano ad essere veri, anche se assai diversi da quelli usuali. Sessantanni dopo Lobacevskij, Felix Klein chiam`o iperbolica questa
geometria, contrapponendola a quella Euclidea, che
egli defin` parabolica.
Bolyai aveva in mente una geometria del tutto analoga a quella di Lobacevskij, ma il Tentamen fu reso pubblico soltanto nel 1832. Inoltre, mentre Lobacevskij continu`o a sviluppare la sua geometria negli
anni successivi e fino alla morte, Bolyai si disinteress`o
della sua, cos` che il riconoscimento per la scoperta
della Geometria non-Euclidea va a tutti gli effetti al
matematico russo. Bolyai rimase male dello scarso
successo delle sue idee; soprattutto, sembra che rimanesse male dellindifferenza con cui le accolse il
pi`
u grande dei matematici, Gauss, che era amico del
padre. Daltra parte, Gauss fu sempre restio a rico-

noscere pubblicamente i meriti degli altri matematici,


e mostr`o la stessa indifferenza anche per il lavoro di
Lobacevskij.
Bisogna dire che, in generale, la scoperta delle Geometrie non-Euclidee non fu considerata, a quei tempi,
cos` importante come che la rappresentiamo oggi. La
rilevanza della geometria in Matematica era allora
molto calata, anche solo rispetto a centanni prima,
e se le si dava credito da un punto di vista didattico,
quasi pi`
u nessuno se ne interessava sul versante della ricerca. Questa era presa soprattutto dallAnalisi,
che vedeva lAlgebra classica come un proprio strumento, mentre lAlgebra moderna muoveva appena
i primi timidi passi. In quanto alla geometria come
tale, aspetti speciali quali la Geometria Analitica, la
Geometria Proiettiva e Descrittiva avevano attratto
lattenzione dei matematici. Di fatto, le Geometrie
non-Euclidee sembrarono pi`
u una curiosit`a che una
rivoluzione scientifica.
Nel giro di una ottantina di anni, per`o, si verificarono tre fatti che hanno cambiato radicalmente il
nostro atteggiamento nei confronti delle Geometrie
non-Euclidee. Il primo fatto `e specifico della Matematica e si tratta della prolusione che Riemann lesse
quando divenne professore allUniversit`a di Gottinga
nel 1854 (aveva 28 anni!). Per rendersi conto dellimportanza di questa prolusione, baster`a ricordare
che Gauss espresse il suo apprezzamento per il lavoro
di Riemann, cosa unica ed eccezionale. La prolusione
trattava dei fondamenti della geometria, anche se della geometria considerata dal punto di vista analitico.
Riemann generalizzava il concetto di distanza tra due
punti che, come sappiamo `e espressa dalla formula:
d2 (A, B) = (xA xB )2 + (yA yb )2 + (zA zB )2 =
= dx2 + dy 2 + dz 2
nello spazio a tre dimensioni. Passando a una
combinazione quadratica qualunque:
d2 (A, B) = a1,1 (xA xB )2 +a1,2 (xA xB )(yA yB )+
+a1,3 (xA xB )(zA zB )+a2,1 (yA yB )(xA xB )+ =
= a1,1 dx2 + a1,2 dx dy + a1,3 dx dz + a2.1 dy dx +

si ottiene un concetto di distanza (in termini matematici, una metrica) che conforma lo spazio in infiniti modi possibili. Scegliendo opportunamente i
coefficienti a1,1 , a1,2 , a1,3 , . . . si hanno pertanto geometrie diverse, fra le quali la Geometria Euclidea
`e quella in cui tutti i parametri valgono 0, eccetto
a1,1 = a2,2 = a3,3 = 1. Riemann, poi, non legava
la distanza alla differenza di coordinate (xA xB )
o (yA yB ), ma le lasciava come libere funzioni dei
punti A e B coinvolti, purche soddisfacessero certe
regole generali: ad esempio, la distanza tra due punti

214
`e nulla se e solo se i due punti coincidono; la distanza
tra A e B `e uguale alla distanza di B da A; e cos via.
In questa maniera si pu`o far rientrare la geometria
di Lobacevskij in una teoria pi`
u generale di geometrie Euclidee e non-Euclidee da studiare con gli stessi
strumenti teorici. Il nome di Riemann `e rimasto legato a un caso speciale di geometria non-Euclidea, e
b
cio`e quello corrispondente al caso che gli angoli B DC
b
e DCA del quadrilatero di Saccheri siano entrambi ottusi. In tale geometria, per un punto posto al di fuori
di una retta r non passa alcuna retta parallela ad r;
inoltre, la somma dei tre angoli di un triangolo `e sempre maggiore di due angoli retti. Nella terminologia
di Klein, questa `e la Geometria Ellittica.
Lopera di Riemann (che mor` di tisi a soli quarantanni) ricondusse nellalveo della Matematica importante le Geometrie non-Euclidee, anche se le relegava a un ruolo molto subalterno, ad esempi, interessanti fino a un certo punto, di una teoria ben
pi`
u generale. Rientrate comunque in ballo, il secondo fatto che gioc`o a loro favore (e fu probabilmente
il fatto pi`
u importante) riguarda il rinnovato interesse per la Logica e per i fondamenti della Matematica che prese piede e si svilupp`o alla fine del 1800
e allinizio del 1900. Questo merita la nostra attenzione e cercheremo perci`o di raccontarlo con qualche
dettaglio.
La Geometria Euclidea costituisce sicuramente il
primo esempio di sistema assiomatizzato; quando i
matematici ripresero ad interessarsi dei fondamenti,
la geometria costitu` un banco di prova immediato
per discutere le idee relative ai processi di assiomatizzazione. Limpianto Euclideo fu analizzato da tutti
i possibili punti di vista e, come abbiamo detto, ne
furono rilevate inesattezze e carenze, fino ad arrivare
alla formulazione di Hilbert, che abbiamo schematizzato nella Sezione 6.1. La possibilit`a di sviluppare
teorie alternative come le Geometrie Euclidee e nonEuclidee fa capire che non esiste un apparato certo
di assiomi che tutto comprende, e, cosa ancora pi`
u
importante, non esiste un insieme vero di assiomi,
e quindi non esiste una teoria vera, cio`e conforme
alla realt`a o tale che la realt`a le si conformi. Questa `e lidea diametralmente opposta alla concezione
antica della Geometria Euclidea, che, come abbiamo
osservato allinizio, era tradizionalmente pensata come vera descrizione della realt`a, anzi di realt`
a vera
nellaccezione estrema di Platone.
Ogni teoria ha un suo ambito di validit`a, cio`e `e vera
per quella serie di fenomeni che vanno daccordo con
gli assiomi. In questambito, i teoremi costituiscono
risultati veri, ed `e ci`o che d`a senso alla nostra visione
matematica del mondo, secondo lo spirito di Galileo.
Se usciamo dallambito di validit`a degli assiomi, non
possiamo pi`
u parlate di adeguatezza tra realt`a e teo-

CAPITOLO 7. LE ALTRE GEOMETRIE


ria, e siamo costretti a cambiare la teoria esplicativa.
Tutto ci`o `e abbastanza evidente, ma c`e un problema molto grave dietro questo modo di vedere le cose.
Se impostiamo una teoria dichiarando quali sono gli
assiomi e le regole di inferenza (v. Sezione 1.6), fin
dove possiamo spingerci con larbitrariet`a degli assiomi scelti? In altre parole, non possiamo mettere tra
gli assiomi che 2+2 = 4 e allo stesso tempo 2+2 = 5,
ne possiamo tollerare che uno dei due si deduca dallaltro. E questo il problema della consistenza di
una teoria, e requisito fondamentale per un sistema
assiomatico sensato `e che esso determini una teoria
consistente, cio`e priva di contraddizioni.
Un metodo per stabilire la consistenza di un sistema `e quello di trovarne un modello nella realt`a (si
veda anche la Sezione 1.6) o almeno in unaltra teoria che riteniamo consistente. Ad esempio, la Geometria Euclidea si considera consistente perche ha come
modello la Geometria Analitica, e questa si basa su
concetti matematici che consideriamo consistenti, o
non contraddittori. Sarebbe allora interessante trovare dei modelli anche per le Geometrie non-Euclidee,
poiche questo ci assicurerebbe che esse non contengono contraddizioni, cio`e sono teorie valide alla pari
della Geometria Euclidea. Vorrei osservare che questo aspetto non era stato considerato ne la Lobaceskij
ne da Bolyai che, a rigore, avrebbero potuto creare
delle belle teorie, ma inconsistenti, perche inficiate da
qualche contraddizione interna che avrebbero potuto
non rilevare. Come si ricorda, questa era la non segreta speranza di Saccheri, che desiderava proprio dimostrare linconsistenza delle sue ipotesi assurde relative
al quadrilatero della Figura 7.9.
Un primo e quasi banale modello fu trovato per
la Geometria Ellittica di Riemann. Accontentiamoci
di una realt`a bidimensionale e consideriamo quanto
succede sulla superficie della Terra. I punti sono i
punti della superficie di una sfera e le rette sono le
circonferenze massime sulla stessa superficie: pensiamo ai meridiani e allequatore, mentre non sono rette
gli altri paralleli. Questa scelta non `e casuale, ma
`e dovuta al fatto che presi due qualsiasi punti (ad
esempio, due citt`a) esiste una e una sola circonferenza massima che passa per essi, mentre di altri tipi
di circonferenze ne passano infiniti. Questo `e proprio
quello che ci aspettiamo da oggetti che vogliamo chiamare rette, oggetti determinati da due punti e due
soltanto. Se ora pensiamo a un meridiano m (cio`e,
una retta) e ad un punto P fuori di esso, vediamo subito che ogni retta che passa per P incontra sempre
e comunque il meridiano m. Infatti, due circonferenze massime non possono non incontrarsi (altrimenti,
una almeno non sarebbe massima) e anzi si incontra
in due punti, come ogni coppia di meridiani si incontrano al Polo Nord e al Polo Sud. Come abbiamo

215

7.6. GEOMETRIA DESCRITTIVA E PROIETTIVA


accennato, in questa geometria la somma degli angoli interni di un triangolo `e sempre maggiore di due
retti. Prendiamo ad esempio due punti sullequatore, di modo che la loro distanza sia un quarto della
lunghezza dellequatore stesso; uniamoli tra loro e al
Polo Nord. Otteniamo cos` un triangolo, detto sferico
perche disegnato sulla superficie di una sfera. Basta
un momento di riflessione per capire che i tre angoli
del triangolo sono tutti retti, e quindi la loro somma
di 270 `e ben maggiore di 180 !
C

B A

Figura 7.10: Triangoli di Beltrami e di Riemann


Pi`
u laborioso fu trovare un modello per la Geometria Iperbolica di Lobacevskij. Ci riusc`, nella seconda met`a del 1800, il matematico italiano Eugenio
Beltrami. Anche lui propose un modello bidimensionale, costituito da una superficie. Questa per`o `e assai complicata e si ottiene per rotazione da una curva
speciale, detta trattrice, definita nel modo seguente:
per ogni punto P sulla trattrice , la tangente a
in P incontra lasse delle x in Q e il segmento P Q
ha lunghezza unitaria. Facendo ruotare questa curva
intorno allasse delle ascisse si ottiene una superficie
detta pseudosfera ed `e la superficie considerata da
Beltrami. Questa superficie ha una propriet`a importante, ma un po difficile da capire: la curvatura in
ogni punto `e costante ed uguale a 1; questo `e il giusto il contrario di ci`o che succede nella sfera, che ha
anchessa curvatura costante, ma uguale a +1. Nella
sfera, infatti, la curvatura `e sempre risolta allinterno,
mentre nella pseudosfera `e sempre rivolta allesterno.
Questa analogia al contrario fa s` che, definite opportunamente le rette, succeda proprio ci`o che si
vuole nella Geometria Iperbolica: per un punto P
fuori della retta r passano infinite rette parallele
ad r (cio`e, che non incontrano mai r). Anche se
la cosa `e difficile a vedersi, Beltrami dimostr`o che
in ogni triangolo sulla superficie della pseudosfera la
somma degli angoli interni `e sempre minore di due
retti. Non tentiamo nemmeno di abbozzare le dimostrazioni, fidando nella fiducia del lettore e sulla credibilit`a di Beltrami che, ai suoi tempi, fu presidente
dellAccademia dei Lincei e Senatore del Regno.
I modelli non hanno solo la funzione logica di ras-

sicurarci sulla consistenza di una teoria assiomatica;


essi hanno anche un valore psicologico non indifferente, poiche ci mostrano una situazione reale (anche
se in senso molto matematico e astratto) nella quale
gli assiomi, i teoremi, le definizioni e tutto ci`o che
deriva dalla nostra teoria hanno un riscontro pratico
ben chiaro. Si pu`o dire, esagerando forse un po, che
il modello sostanzializza la teoria, rendendola plausibile anche agli scettici. Spesso, come nel caso della
Geometria Ellittica, il modello ci mostra come unidea che pareva assurda (quella delle geometrie nonEuclidee) rientri invece nei canoni della Matematica
conosciuta, anzi non sia altro che una situazione ben
nota, solo vista da un punto di osservazione diverso.
I triangoli sferici, infatti, fanno parte della trigonometria sferica, una disciplina che era stata studiata
fin dallantichit`a, e in modo assai profondo dopo le
grandi scoperte geografiche, essendo legata ai nostri
movimenti sulla superficie terrestre, in primo luogo
quelli delle navi.
A questo punto non ci rimane altro che ricordare il terzo fatto (ultimo, ma non meno importante) che ha portato allaffermazione delle geometrie
non-Euclidee: la geometria di Riemann `e la Geometria adottata da Einstein nella teoria della relativit`a.
Questa non avrebbe neppure avuto inizio, se le Geometrie non Euclidee non avessero fornito gli strumenti
matematici per il suo sviluppo.

7.6

Geometria
proiettiva

descrittiva

7.7

Topologia

7.8

Gli spazi vettoriali

216

CAPITOLO 7. LE ALTRE GEOMETRIE

Capitolo 8

Trigonometria e Calcolo
C. [canticchiando da ubriaco] Che ne dite della
mia voce?
H. Non vi vedo debuttare allOpera.
C. He, he! Mi chiamo Collins, per mia sfortuna, non Caruso. Sono professore. Insegno
allUniversit`
a di Chicago e ho fatto una conferenza a New York sugli integrali. Nel Calcolo
Differenziale si d`
a una funzione e si ottiene il
differenziale. Avete afferrato?
H. Alla perfezione!
C. Davvero?!
A. Hitchcock Laltro uomo

In questo capitolo conclusivo trattiamo di due argomenti un po pi`


u avanzati e specialistici, almeno dal
punto di vista della Matematica che si insegna nelle
Scuole Medie. La Trigonometria `e propriamente lo
studio dei triangoli, ma le funzioni trigonometriche,
seno, coseno, tangente e le loro inverse, hanno una
stretta connessione con la funzione esponenziale, come scopr` Eulero, e ci`o imparenta Trigonometria e
Calcolo Differenziale. Non potremo perci`o non prendere in considerazione tali funzioni che sono periodiche e quindi qualitativamente diverse dai polinomi,
dalle funzioni razionali fratte, dallesponenziale e dal
logaritmo.
La Trigonometria `e nata nellantichit`a, applicata
soprattutto allastronomia; si `e poi affermata nel Medio Evo come ausilio indispensabile alla navigazione,
crescendo vieppi`
u di importanza con le scoperte geografiche del 1400 1500 e la conseguente globalizzazione dei viaggi per mare. Le prime tavole trigonometriche prendevano in considerazione la corda sottesa da un arco di circonferenza, e quindi in pratica
erano relative al seno. Oltre a seno, coseno, tangente e cotangente, ebbero fortuna altre funzioni, come
1 cos x, ma oggi non le si considerano molto importanti; la stessa cotangente, essendo semplicemente linverso della tangente, tende ad essere relegata in
secondo piano. Rimangono importanti tutte le applicazioni della Trigonometria alle misurazioni (triangolazioni), allo studio dei fenomeni oscillatori e pe-

riodici, allanalisi armonica (suoni, immagini, colori,


compressione, etc.).
Il Calcolo Differenziale e Integrale `e un po alla base
di tutta la Matematica moderna. Esso fu inventato (o
scoperto) da Newton e da Leibniz nella seconda met`a
del 1600. Newton accus`o Leibniz di avergli rubato lidea, sfruttando alcune informazioni che gli aveva dato
in una lettera. Leibniz neg`o, rivendicando loriginalit`a delle proprie idee. Cos` i due rimasero nemici fino
alla morte. Gli storici oggi sono pressoche daccordo
che i due pensarono e svilupparono il calcolo differenziale in modo indipendente, con concetti e notazioni
equivalenti, ma abbastanza lontane. A parte questa
diatriba, nel giro di pochi anni il calcolo differenziale
divenne la regina della Matematica e uno stuolo di
matematici geniali lo svilupp`o tanto da renderlo indispensabile sia alla Matematica sia alla Fisica, come
mostr`o per primo lo stesso Newton.
La crescita del calcolo differenziale durante il 1700
ha qualcosa di prodigioso, e uno dei maggiori scienziati che contribu` a questo exploit fu certamente Eulero. Nella prima met`a del 1800 i matematici, e primo
fra tutti Cauchy, diedero una sistemazione ai risultati
precedenti, arrivando a unimpostazione che `e praticamente quella che oggi conosciamo. Tuttavia, il concetto di funzione e quello di integrale si rivelarono
particolarmente delicati, e occorre arrivare alla fine
del 1800 e allinizio del 1900 per trovarne una caratterizzazione soddisfacente (Peano, Lebesgue). Noi,
bisogna dire, saremo costretti a seguire unimpostazione abbastanza intuitiva, ma speriamo che sia sufficiente a far capire i concetti principali e a permettere
di utilizzarli a livello elementare.

8.1

Le funzioni trigonometriche

Scopo della trigonometria `e la misurazione dei triangoli, cio`e il calcolo dei valori delle varie misure di un
triangolo: lati, angoli, altezze, mediane e cos` via, a
partire da dati noti, di solito i tre lati, due lati e langolo tra essi compreso, o un lato e i due angoli ad
esso adiacenti. Come sappiamo, questi dati determi-

217

218

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

nano tutti gli altri in modo univoco, ma la geometria


euclidea non d`a molto aiuto per valutare le quantit`a
non note. Proprio a questa mancanza vuol rimediare
la trigonometria che, inizialmente, aveva soprattutto
scopi pratici e veniva usata nella navigazione, nella
topografia, nella balistica e nellastronomia. Le prime
tavole trigonometriche, costruite dagli Arabi, servivano proprio per questi scopi: il citato al-Khuwarizmi,
nell800 D.C. contribu` alla realizzazione delle prime
tavole dei seni e nel XIII secolo il re Alfonso di Castiglia fece preparare le prime tavole nautiche dellOccidente: con grande scandalo in tutta Europa,
affid`o tale compito a un gruppo di matematici arabi ed ebrei, che a quel tempo erano i migliori. Gran
parte del lavoro dei matematici applicati del 1700 e
del 1800 fu la compilazione di carte nautiche di tutto
il mondo e di tabelle di puntamento per le artiglierie.
Comunque, dal 1700 con Eulero, fu riconosciuta la
stretta connessione tra la funzione esponenziale e le
funzioni trigonometriche, che cos` entrarono a far parte della matematica teorica e successivamente, come
`e noto, divennero parte preponderante nello studio
dellelettricit`a, del magnetismo e di tutti i fenomeni
oscillatori.

misura dellarco, si ha pertanto la proporzione:

Figura 8.1: Il cerchio goniometrico

Il cerchio di raggio 1 `e detto cerchio goniometrico;


di solito lo si rappresenta col centro nellorigine di un
sistema di assi cartesiani ortogonali. Gli angoli sono
rappresentati come angoli al centro e, di regola, una
delle due semirette che definiscono langolo `e fatta
coincidere con la semiretta positiva dellasse delle x,
mentre laltra semiretta determina langolo secondo
una rotazione in senso antiorario (si veda la Figura
8.1). Ora si pu`o osservare che larco U A `e direttamente proporzionale allangolo . Questo permette
di sostituire la misura in gradi di con la misura di
U A. Detta G() la misura in gradi di ed R() la

G() : 360 = R() : 2,


essendo 2 la misura dellintera circonferenza, corrispondente allangolo di 360 . La quantit`a R() si
chiama la misura in radianti di e quindi si hanno
le semplici formule di conversione:
R() =

G()
180

G() =

180R()
.

Questo significa che, per definizione, un radiante `e la


misura dellangolo che sottende un arco di lunghezza
1 nel cerchio goniometrico. La sua misura in gradi `e:
G() =

180
57 17 44 81/100.

Altre misure importanti sono:


18 =

rad
10

30 =

rad
6

45 =

rad
4

rad
90 = rad.
3
2
La misura in radianti `e, in un certo senso, la misura
naturale degli angoli. Essa infatti non dipende da
suddivisioni arbitrarie, quali la misurazione del grado
come 360a parte dellangolo giro; dipende solo dalla
misura degli archi, e quindi del raggio del cerchio,
che abbiamo fissato ad 1 per semplicit`a. Per questo,
la misurazione in radianti `e la pi`
u usata nella letteratura scientifica ed `e indispensabile nel trattamento
analitico delle funzioni trigonometriche.
Sia ancora un angolo, sia A lintersezione con il
cerchio goniometrico e sia P la proiezione di A sullasse OU ; infine, sia B lintersezione con la retta OA
della perpendicolare ad OU in U . Si hanno le seguenti
definizioni:
60 =

Definizione 8.1 Si dice seno dellangolo , e si indica con sin() (dal latino sinus), la misura (con
segno) del segmento AP . Si dice coseno dellangolo , e si indica con cos(), la misura (con segno)
del segmento OP . Infine, si dice tangente dellangolo , e si indica con tan(), la misura (con segno)
del segmento U B.
Al variare di tra 0 e 360 (cio`e tra 0 rad e 2
rad) il seno e il coseno possono assumere solo valori
compresi tra 1 e 1. La tangente, invece, assume valori sempre pi`
u alti man mano che da 0 si va verso i

90 ; per = 90 il valore della tangente non risulta


definito e lo si considera uguale a infinito. Quando
si superano i 90 , la tangente viene ad assumere valori negativi, prima molto alti in valore assoluto, poi
sempre pi`
u vicini a 0. I valori della tangente ritornano ad essere positivi quando si superano i 180 , ma

219

8.1. LE FUNZIONI TRIGONOMETRICHE

a 270 la tangente `e di nuovo non definita. Si hanno sono espresse nel sistema decimale anziche in quello
pertanto i seguenti valori:
sessagesimale.
Alla base del calcolo delle funzioni trigonometriche
sin(0 ) = 0 sin(90 ) = 1 sin(180 ) = 0
vi sono i due seguenti teoremi, che permettono di riportare i conteggi a quelli relativi a una sola funzione,
sin(270 ) = 1 sin(360 ) = 0
ad esempio il seno.
cos(0 ) = 1

cos(90 ) = 0

cos(270 ) = 0

tan(0 ) = 0

cos(180 ) = 1

cos(360 ) = 1.

tan(90 ) =

tan(180 ) = 0

Teorema 8.1 Per ogni angolo vale la seguente


identit`
a:
sin2 () + cos2 () = 1.

Prova: Se langolo `e compreso tra 0 e 90 , applicando il teorema di Pitagora al triangolo OP A della


Aumentando ulteriormente langolo, i valori del seno Figura 8.1, si ha AP 2 + OP 2 = OA2 , cio`e proprio la
e del coseno tornano a ripetersi ogni 360 o 2 ra- relazione cercata. Lasciamo al lettore la verifica di
dianti. Le due funzioni, pertanto, sono periodiche di questa identit`a in tutti gli altri casi.
periodo 360 o 2 radianti. Si scrive (k Z):
Questa relazione, valida per ogni valore di , si dice

a trigonometrica fondamentale; da essa derisin() = sin( + k360 ) cos() = cos( + k360 ); lidentit`
vano gran parte delle propriet`a della trigonometria.
Per quello che riguarda la tangente, si ha:
sin() = sin( + 2k) cos() = cos( + 2k).
tan(270 ) =

tan(360 ) = 0

La tangente, invece, torna a ripetersi ogni 180 o


rad; `e pertanto periodica di periodo 180 o rad:
tan() = tan( + k180 )
tan() = tan( + k).
La seguente tabella riassume il segno delle funzioni
trigonometriche di quadrante in quadrante:
sin
cos
tan

I
+
+
+

II
+

III

IV

Teorema 8.2 Qualunque sia langolo :


tan() =

sin()
.
cos()

Prova: Anche in questo caso possiamo limitarci agli


angoli compresi tra 0 e 90 . Sempre con riferimento
alla Figura 8.1, osserviamo che i due triangoli OP A e
OU B sono simili; pertanto vale la proporzione AP :
OP = BU : OU . Ricordando che, per definizione,
OU = 1, questa `e esattamente la relazione cercata.

Nella Figura 8.1, langolo in A del triangolo OAP


`e chiaramente il complementare di ; da questo
si deducono immediatamente le formule dellangolo
Per trovare il valore del seno e del coseno di un complementare:
angolo, `e conveniente riportare langolo a uno equisin(90 ) = cos()
cos(90 ) = sin()
valente compreso tra 0 e 360 o tra 0 rad e 2 rad.
Analogamente, per la tangente si riporta langolo a
1
uno equivalente compreso tra 0 e 180 o tra 0rad e
tan(90 ) =
= cot(),
tan()
rad. Per questo, le tavole contengono solo i valori
di seno, coseno e tangente per tali angoli, spesso ad- dove cot() indica la funzione cotangente che `e dedirittura limitatamente ai valori tra 0 e 45 (ovvero finita come linverso della tangente; useremo questa
tra 0 rad e /4 rad), per i motivi che vedremo un po funzione solo il minimo indispensabile. Queste forpi`
u avanti (Tabella 8.1). Il calcolatore d`a i valori per mule, in realt`a, valgono per tutti i valori di , anche
qualsiasi , ma al suo interno riporta tutto allinter- quando > 90 ; ad esempio, se 90 < < 180 , si
vallo fra 0 e 360 (180 ) o tra 0 rad e 2 (o ) rad ha sin(90 ) = sin() dove < 0, ovvero 270 <
effettuando la riduzione:
< 360 . I due triangoli OAP e OCQ sono uguali e questo dimostra che | sin(90 )| = | cos()|;
mod 360
ovvero
mod 2
daltra parte, i segni sono entrambi negativi e questo
conclude il ragionamento. In modo analogo si pu`o
( mod 180
ovvero
mod ).
procedere negli altri casi, cio`e quando langolo `e
Di solito, un tasto permette di scegliere se fare i conti compreso negli altri quadranti e/o quando si parte
in gradi o in radianti, e talvolta `e presente una ter- dal coseno.
za modalit`a, quella dei gradi decimali, nei quali lanUn aspetto importante di queste formule `e il fatto
golo retto corrisponde a 100 e le frazioni di grado che esse permettono di ridurre il calcolo delle funzioni

220

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

trigonometriche (e quindi le tavole relative) al solo


ottante (0 ..45 ). Se infatti > 45 , si ha sin() =
cos(90 ), riportandosi cos` a un angolo del primo
ottante.
Dalla circonferenza goniometrica `e possibile ricavare anche le formule dellangolo supplementare:

conoscendo un cateto e langolo opposto a tale cateto. Infine, si calcola anche un cateto in funzione dellaltro, risolvendo le precedenti uguaglianze rispetto
allipotenusa:

sin(180 ) = sin()

cos(180 ) = cos()

tan(180 ) = tan().
E buona norma, per non rischiare di commettere errori grossolani, disegnare il cerchio goniometrico e su
di esso langolo di interesse: le relazioni precedenti si
vedono immediatamente.
C
C

BC =

sin()
AB
cos()

AB =

cos()
BC;
sin()

queste relazioni giustificano lintroduzione della


tangente, in quanto esse sono equivalenti a:
BC = tan()AB

e AB =

BC
.
tan()

In qualche caso, queste formule permettono di ottenere il valore del seno e del coseno di certi angoli
particolari. Se = 45 ovvero = /4, il triangolo
rettangolo `e met`
a di un quadrato, cio`e se AB = ,
allora AC = 2, quindi:

sin(45 ) = cos(45 ) = AB/AC = 2/2

tan(45 ) =

sin(45 )
= 1.
cos(45 )

Figura 8.2: Calcolo dei lati

Se = 30 , il triangolo `e met`a di un triangolo


equilatero e quindi se AC = risulta AB = 3/2 e
Il teorema di Pitagora permette di calcolare i tre BC = /2; di conseguenza:
lati di un triangolo rettangolo quando ne siano noti
sin(30 ) = BC/AC = 1/2
solo due; non ci dice niente, per`o, sugli angoli, ne ci
permette di calcolare i lati quando se ne conosca uno

cos(30 ) = AB/AC = 3/2


solo e si conosca invece un angolo diverso da quello

retto. La trigonometria risolve immediatamente que1 2


3
sin(30 )

sti problemi. Si abbia, come in Figura 8.2, il trian= =


.
tan(30 ) =

cos(30 )
2 3
3
golo rettangolo ABC e se ne conosca langolo . Se
prendiamo il punto C in modo che AC = 1, si ha Dalla formula per langolo complementare si ha
per definizione C B = sin() e AB = cos(). Dalla allora:
similitudine dei triangoli ABC e AB C si hanno le

seguenti proporzioni:
sin(60 ) = 3/2
cos(60 ) = 1/2
AC : AC = B C : BC e AC : AC = AB : AB
1 : AC = sin() : BC

e 1 : AC = cos() : AB.

3
sin(60 )
=2
= 3.
tan(60 ) =

cos(60 )
2

Un altro angolo per il quale `e facile calcolare i vaQueste permettono di calcolare due lati qualsiasi lori del seno e del coseno `e 18 . Si consideri il trianquando se ne conosca il terzo. In particolare, quando golo armonico definito nella Sezione 6.4; se tracciasi conosca lipotenusa si ha:
mo laltezza CH e consideriamo il lato AC = 1, si
ha AH = sin(18 ) e CH = cos(18 ). Questo d`a
BC = AC sin()
e
AB = AC cos()
immediatamente:

che si enunciano cos`: la misura di un cateto `e data


51

sin(18 ) = cos(72 ) =
0.30901699 . . . .
dal prodotto dellipotenusa per il coseno dellangolo
4
adiacente o per il seno dellangolo opposto. Naturalmente, invertendo queste formule si pu`o calcola- Dallidentit`a trigonometrica fondamentale si ricava
re lipotenusa di un triangolo rettangolo conoscen- allora:
s
do uno qualsiasi dei cateti e langolo compreso tra

lo stesso cateto e lipotenusa. Applicando le formule


5+ 5

cos(18
)
=
sin(72
)
=
0.95105655 . . .
dellangolo complementare, lipotenusa si trova anche
8

221

8.2. LE FORMULE DI SOMMA E SOTTRAZIONE


e infine:

Oggi, con i nostri calcolatori a disposizione, il problema sembra non pi`


u porsi, ma, ci dobbiamo chiedere,

2( 5 1)

come
riescono
gli
elaboratori
a fare i calcoli necessari?
tan(18 ) = p

In
realt`
a
esistono
vari
metodi
sviluppati dallanalisi
2 5+ 5
matematica, ma le basi sono fornite da alcune forPer completezza ricordiamo che accanto alle tre mule di importanza veramente fondamentale e che
funzioni fondamentali della Trigonometria molte al- sono conosciute gi`a da alcuni secoli. Cominciamo col
tre sono state introdotte per risolvere specifici pro- dimostrare il seguente risultato:
blemi. Oggi sono piuttosto cadute in disuso, ma talvolta capita ancora di incontrarle. Accanto alla gi`a
citata cotangente, inversa della tangente, meritano
B
di essere ricordate la secante e la cosecante, inverse
rispettivamente del coseno e del seno:
p

2 5+ 5

.
tan(72 ) =
2( 5 1)

csc =

1
sin

sec =

1
.
cos

Sono invece importanti le inverse composizionali di


seno, coseno e tangente:

A
C

arcsin(x) si legge: larco del seno di x e indica


langolo il cui seno vale x (nella Figura 8.1, `e
larco U A nei confronti del segmento x = AP );
arccos(x) si legge: larco del coseno di x e indica langolo il cui coseno vale x (nella Figura 8.1,
`e larco U A nei confronti del segmento x = OP );
arctan(x) si legge: larco della tangente di x e
indica langolo la cui tangente vale x (nella Figura 8.1, `e larco U A nei confronti del segmento
x = U B).
Pertanto si ha:

X
R
Q

Figura 8.3: Somma dei seni

Teorema 8.3 Siano e due angoli tali che +


90 ; allora:
sin( + ) = sin() cos() + cos() sin().

sin(arcsin x) = arcsin(sin x) = x

b
Prova: Si consideri la Figura 8.3 in cui = U OA
b
e = AOB, per cui sin( + ) = BQ. Se BX `e
cos(arccos x) = arccos(cos x) = x
perpendicolare ad OA, si ha OX = cos() e BX =
tan(arctan x) = arctan(tan x) = x.
sin(). Per le formule sui triangoli rettangoli si ha
Nella nostra trattazione elementare non ci occupere- XP = OX sin() = sin() cos() = CQ. Ora, i due
triangoli rettangoli OQR e RXB sono simili, poiche
mo molto di queste funzioni, se non in contesti
ovb
b
vi come: qual `e langolo che ha per
seno 2/2?, ORQ = X RB come angoli opposti al vertice, quindi
b
domanda che ha per risposta: arcsin( 2/2) = 60 . RBX = . Nel triangolo rettangolo BXC si ha ora
Lunica eccezione `e la funzione arcotangente, che ha BC = BX cos() = cos() sin() e, in conclusione:
un ruolo molto importante nel calcolo differenziale
sin( + ) = BQ = CQ + BC =
e, soprattutto, nel calcolo integrale; lincontreremo
pertanto in tale contesto.
= sin() cos() + cos() sin()

8.2

Le formule di somma e
sottrazione

come si voleva.

Lavorando per casi, `e possibile far vedere che la


condizione + 90 pu`o essere fatta cadere e che
Il calcolo delle funzioni trigonometriche non `e per quindi la formula `e valida per ogni valore di e di .
niente banale; a parte i pochi valori particolari che Seguendo un cammino analogo, si possono dimostrare
abbiamo visto nella precedente sezione, sappiamo ve- formule simili relative al coseno e alla differenza
ramente poco, e questo ci fa capire quanto benemeriti ; qui riteniamo che la dimostrazione precedente sia
per i naviganti siano stati coloro che hanno calcolato i sufficiente a dare lidea generale di come procedere
valori di seno e coseno, costruendo le apposite tavole. e ci limitiamo quindi a riportare le quattro formule,

222

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

dette di somma e sottrazione:

Per dimostrare questa relazione basta partire dalla


definizione di tangente e applicare le regole della somma e della sottrazione relative a seno e coseno; ad
esempio:

sin( + )
sin( )
cos( + )
cos( )

= sin() cos() + cos() sin()


= sin() cos() cos() sin()
= cos() cos() sin() sin()
= cos() cos() + sin() sin().

tan( + ) =

sin( + )
sin cos + cos sin
=
;
cos( + )
cos cos sin sin

E opportuno ricordare a memoria queste identit`a


che, insieme allidentit`a fondamentale, costituiscono
a questo punto `e sufficiente dividere numeratore e dela base di tutta la trigonometria. Esiste una formula
nominatore per cos cos e si trova immediatamente
mnemonica che pu`o aiutare a ricordare le due espresla formula cercata. La duplicazione `e allora:
sioni per la somma, dalle quali `e poi facile ricavare
quelle della sottrazione. La frase `e:
2 tan
(8.1)
tan(2) =
1

tan2
CENTO ROSE MOLTO MENO BELLE.
Qui le E corrispondono al seno e le O al coseno;
le prime due parole si riferiscono alla formula per il
seno, dove si ha la somma del prodotto sin() cos()
con il prodotto cos() sin(). Le ultime tre parole si
riferiscono invece alla formula per il coseno, data dalla sottrazione (meno) fra i prodotti cos() cos()
e sin() sin(). Ad esempio, per langolo di 15 si
trova:
sin(15 ) = sin(45 30 ) =
= sin(45 ) cos(30 ) cos(45 ) sin(30 ) =


2 3
21
6 2

=
0.258819.
=
2 2
2 2
4
Analogamente:

6+ 2
cos(15 ) =
0.965926.
4

e da questa si ricava la formula di bisezione


cambiando in /2:

1 1 + tan2

.
tan =
2
tan
Per completezza, citiamo la formula di triplicazione
per il coseno, che il lettore potr`a ricavare sviluppando
cos(3) = cos(2 + ):
cos(3) = 4 cos3 () 3 cos().
Sapendo risolvere le equazioni di terzo grado (in modo esatto o approssimato), questa formula permette,
ad esempio, di calcolare cos(5 ) a partire da cos(15 )
che abbiamo trovato in precedenza. La formula
analoga di triplicazione del seno `e:

sin(3) = 3 sin() 4 sin3 ().


Particolarmente importante `e il caso = , per
cui si ha:
Ad ogni modo, nella Tavola 8.1 riportiamo il valosin(2) = 2 sin() cos()
re del seno e del coseno di grado in grado; i seni si
leggono direttamente, mentre per leggere i coseni occos(2) = cos2 () sin2 () =
corre considerare langolo complementare, che si tro2
2
= 2 cos () 1 = 1 2 sin ().
va dal lato opposto della tabella. Perci`o sin(12 ) =
che si dicono formule di duplicazione. Se poniamo 0.20791169 = cos(78 ).
/2 al posto di , si ottiene:
Nota 8.1
Come si costruisce una tavola come

quella della Tabella 8.1? Oggi la cosa `e molto semplice


1, cos() = 1 2 sin2
;
cos() = 2 cos2
2
2
e basta un programma di poche righe per ottenere una
e quindi si hanno le formule di bisezione:
r
r

1 + cos()
1 cos()

, sin =
.
cos =
2
2
2
2

Queste formule permettono di ottenere seno e coseno di angoli sempre pi`


u piccoli e, quindi, di angoli che differiscono tra di loro tanto poco quanto si
vuole, cio`e danno la possibilit`a di costruire le tavole
trigonometriche.
Per quanto riguarda la tangente, le formule di
somma e sottrazione sono le seguenti:
tan( ) =

tan tan
.
1 tan tan

tabella anche pi`


u accurata, con pi`
u cifre decimali e, ad
esempio, di primo in primo o anche di secondo in secondo. Noi abbiamo utilizzato Maple, un programma
di valutazione simbolica, che ci ha permesso di ottenere unuscita utilizzabile direttamente per queste note.
In realt`
a, le tavole come questa non sono pi`
u utilizzate, poiche `e pi`
u semplice avere a disposizione una
piccola calcolatrice portatile, che ci pu`
o fornire, con
estrema precisione, il valore di qualsiasi funzione trigonometrica per un valore qualunque dellargomento.
Una volta, diciamo fino agli anni 70 del 1900, le tavole
erano indispensabili in qualsiasi lavoro tecnico e per
lorientamento; notevoli sforzi si sono spesi per rendere tali tavole prive di errori e semplici da usare. Si
narra che, proprio allo scopo di eliminare i numerosi

223

8.2. LE FORMULE DI SOMMA E SOTTRAZIONE

sin / cos
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45

valore
0
0.01745241
0.03489950
0.05233596
0.06975647
0.08715575
0.10452847
0.12186935
0.13917310
0.15643447
0.17364818
0.19080900
0.20791169
0.22495106
0.24192190
0.25881905
0.27563736
0.29237171
0.30901700
0.32556818
0.34202014
0.35836797
0.37460659
0.39073114
0.40673664
0.42261827
0.43837114
0.45399051
0.46947158
0.48480963
0.50000000
0.51503808
0.52991928
0.54463903
0.55919292
0.57357643
0.58778525
0.60181504
0.61566148
0.62932041
0.64278761
0.65605904
0.66913061
0.68199837
0.69465837
0.70710680

valore
1.
0.99984770
0.99939083
0.99862953
0.99756405
0.99619470
0.99452189
0.99254615
0.99026807
0.98768834
0.98480775
0.98162718
0.97814760
0.97437006
0.97029573
0.96592583
0.96126170
0.95630475
0.95105655
0.94551857
0.93969262
0.93358042
0.92718386
0.92050485
0.91354546
0.90630778
0.89879405
0.89100652
0.88294758
0.87461970
0.86602540
0.85716730
0.84804809
0.83867057
0.82903756
0.81915205
0.80901700
0.79863549
0.78801075
0.77714595
0.76604444
0.75470957
0.74314482
0.73135369
0.71933980
0.70710680

cos / sin
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50
49
48
47
46
45

Tabella 8.1: Tavola dei seni e dei coseni

errori di calcolo delle tavole nautiche, Babbage fosse spinto a progettare e a tentare di realizzare la sua
Macchina Analitica, il prototipo di tutti i calcolatori
programmabili (1835 circa).
Volendo immaginare come venivano costruite queste
tavole, possiamo cominciare osservando che `e possibile, con le nostre conoscenze, trovare seno e coseno di
un angolo di 3 . Infatti, si ha immediatamente:
sin(3 ) = sin(18 15 ) =
= sin(18 ) cos(15 ) cos(18 ) sin(15 ) =
s

51 6+ 2
5+ 5 6 2

=
4
4
8
4
0.052335956 . . . .

Non `e difficile, almeno numericamente, trovare ora seno e coseno dellangolo di 1 . Infatti, la formula di
triplicazione ci dice:
sin(3 ) = 3 sin(1 ) 4 sin3 (1 )
dove il valore di sin(1 ) `e ignoto, ma si conosce
sin(3 ). Questa espressione equivale allequazione di
terzo grado in x = sin(1 ):
4x3 3x + sin(3 ) = 0.
Teoricamente, qui si potrebbe applicare la formula risolutiva delle equazioni di terzo grado. Come abbiamo
osservato a suo tempo, tale applicazione non `e banale per i conti che richiede e che devono essere svolti
utilizzando i numeri complessi. Pi`
u conveniente `e un
celebre metodo, dovuto a Newton, che permette di
trovare il valore di x con la precisione che si desidera,
applicando iterativamente la seguente formula:
xi+1 = xi

4x3i 3xi + sin(3 )


12x2i 3

e partendo dal valore x0 = 0. Questo d`


a x1 =
sin(3 )/3 0.017445318 . . ., che `e gi`
a preciso fino alla
quarta cifra decimale. Applicando ancora la formula
precedente, si trova x2 = 0, 0174524064338 . . . contro un valore vero di 0.0174524064373 . . . (errore nella
12-esima cifra decimale!). Se ci si accontenta, come
abbiamo fatto nella nostra tavola, di 8 cifre decimali,
questa approssimazione va senzaltro bene, e il valore ottenuto si pu`
o prendere come base per costruire
lintera tabella. Onde evitare laccumularsi di errori
di arrotondamento, `e bene sfruttare i valori che si conoscono con precisione. Cos` per calcolare sin(12 ) si
useranno i valori relativi a 30 e a 18 . Per calcolare
sin(13 ) si dovranno invece sfruttare i valori relativi a
12 e ad un grado.
Per quanto riguarda primi e secondi, si pu`
o partire
considerando il caso di 22 30 come met`
a dellangolo
di 45 :
s

2 2

0.38268343.
sin(22 30 ) =
4

224

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

in quanto si supponeva che (p + q)/2 e (p q)/2 si


facessero a mente, e sulle tavole si trovavano diretQuello trovato `e il valore di sin(22 30 ) con 8 decimali. tamente i logaritmi delle funzioni trigonometriche.
Dalla Tabella 8.1 possiamo ricavare unapprossima- Stranamente, questo uso delle formule di prostafezione usando il metodo dellinterpolazione lineare, resi (che cercava di sfruttare al meglio le tavole dei
cio`e immaginando che la funzione cresca linearmente logaritmi) `
e esattamente il contrario di quello che esfra i valori relativi a sin(22 ) e a sin(23 ). Questo se avevano allorigine, prima dellinvenzione dei loga`e vero solo in via approssimativa, ma permette di ritmi. Furono infatti le formule di prostaferesi, letcalcolare sin(22 30 ), o di qualsiasi altro valore del
te da destra verso sinistra, a suggerire che potessero
seno, compreso tra due valori noti, impostando
esistere delle funzioni che trasformassero prodotti e
una semplice proporzione.
Poiche la differenza

sin(23 ) sin(22 ) = 0.01612455 corrisponde a divisioni in somme e sottrazioni, e quindi potessero


60 , la parte corrispondente a 30 si ricava da: semplificare lesecuzione delle operazioni. Esse furono
60 : 0.01612455 = 30 : x, quindi x = 0.00806227. utilizzate, in congiunzione con le tavole dei seni e dei
Aggiungendo infine questo valore a sin(22 ) si trova coseni, proprio a questo scopo, anche se ovviamente
u complicato di quello dei losin(22 30 ) 0.38266886 con un errore di 15 unit`
a il loro uso era molto pi`
su un milione, il che pu`
o essere soddisfacente per la garitmi, che, una volta inventati, le soppiantarono in
maggior parte delle applicazioni.
questo compito.
Con lo stesso spirito e con la stessa tecnica di sommare
e sottrarre le formule di somma e sottrazione,
Le seguenti formule sono oggi poco pi`
u che una
si
ottengono
le formule di Werner:
curiosit`a anche se in passato sono state molto
importanti da un punto di vista computazionale:
1
sin sin = (cos( ) cos( + ))
2
Teorema 8.4 Valgono le seguenti formule, dette di
1
prostaferesi:
cos cos = (cos( + ) + cos( ))
2
pq
p+q
cos
sin p + sin q = 2 sin
1
2
2
sin cos = (sin( + ) + sin( )).
2
p+q
pq
sin p sin q = 2 cos
sin
Dalle
ultime
due
identit`a, ponendo = (n 1) e
2
2

=
,
si
hanno
le
formule
di Simpson:
pq
p+q
cos
cos p + cos q = 2 cos
2
2
sin n = 2 cos sin(n 1) sin(n 2)
p+q
pq
cos p cos q = 2 sin
sin
.
cos n = 2 cos sin(n 1) cos(n 2).
2
2
Molto probabilmente, le formule pi`
u utili nella praProva: Si considerino le due prime formule di somma e sottrazione, relative al seno, e si ponga p = +, tica sono quelle che permettono di esprimere sin(),
q = , di modo che risulti = (p + q)/2 e cos() e tan() per mezzo della tangente di /2. Per
la tangente, abbiamo gi`a trovato la formula (8.1);
= (p q)/2. Si ha allora:
per il seno e il coseno possiamo dare la seguente
p+q
pq
p+q
pq
sin p = sin
cos
+ cos
sin
dimostrazione geometrica:
2
2
2
2
Teorema 8.5 Per ogni valore di si ha:
pq
p+q
pq
p+q
cos
cos
sin
.
sin q = sin
2
2
2
2

sin
1 cos
tan =
=
.
Sommando membro a membro queste due uguaglian2
1 + cos
sin
ze si ha la prima formula; sottraendo membro a memb ; lanProva: Come nella Figura 8.4, sia = AOP
bro si ha la seconda. Analogamente si ottengono le
b
b ,
altre due, usando le due ultime formule di somma e golo OQP , come angolo alla circonferenza di AOP
vale /2 e quindi sono simili i tre triangoli AQP ,
sottrazione.
OU B e AU P . Si ottengono pertanto le proporzioni:
Quando andavo al Liceo, ci insegnavano queste forBU : OU = P A : QA = AU : P A,
mule perche semplificavano il calcolo della somma e
della differenza di due seni o di due coseni, specie
e scrivendo al posto di ogni segmento il suo valore,
quando si trovavano entro espressioni pi`
u complicacio`e BU = tan(/2), OU = 1, P A = sin , QA =
te, come (sin p + sin q)3 . Lelevamento a potenza ri1 + cos , AU = 1 cos , si hanno le due identit`a.
chiedeva luso dei logaritmi e quindi poteva essere pi`
u
Questa dimostrazione che riguarda il caso 0
complicato fare 3 log10 (sin p+sin q) piuttosto che fare:
90 , si pu`o ora estendere a tutti gli altri angoli.
pq
p+q
+ log10 sin
)
3(log10 2 + log10 sin
Si ha allora il seguente corollario:
2
2
Si scende poi a livello pi`
u fine usando le formule di
bisezione e trisezione.

225

8.3. RISOLUZIONE DEI TRIANGOLI

8.3
P
B

/2

/2

Figura 8.4: Calcolo della tan(/2)


Corollario 8.6 Per ogni angolo valgono le
seguenti identit`
a:
sin =

2 tan(/2)
1 + tan2 (/2)

cos =

1 tan2 (/2)
.
1 + tan2 (/2)

Prova: Dal teorema precedente abbiamo:


tan2

1 cos
=
,
2
1 + cos

che `e una semplice equazione lineare in cos e, risolta, d`a il valore annunciato. Per quanto riguarda sin ,
basta osservare che sin = tan cos e utilizzare le
espressioni gi`a trovate per tali quantit`a.
Uno degli usi pi`
u frequenti di queste formule `e la risoluzione delle equazioni trigonometriche, cio`e equazioni nelle quali compaiono le funzioni trigonometriche di una quantit`a incognita. Ad esempio, consideriamo lequazione 2 sin x+cos x = 1. Tutte le equazioni lineari in sin x, cos x e tan x possono essere affrontate sostituendo a queste quantit`a le loro espressioni
in t = tan(x/2):
sin =

2t
1 + t2

cos =

1 t2
1 + t2

tan =

2t
.
1 t2

Nel nostro caso si ha:


4t
1 t2
+
= 1 ossia
2
1+t
1 + t2

4t + 1 t2 = 1 + t2 .

Questa `e lequazione di secondo grado t2 2t = 0,


che ha le due soluzioni t = 0 e t = 2. Ricordando
(cosa che non si deve mai dimenticare) che seno e
coseno sono funzioni periodiche di periodo 360 o 2,
mentre la tangente `e periodica di periodo 180 o ,
la soluzione t = 0 corrisponde a x/2 = 0 + k, ovvero
x = 0 + 2k. Infatti, per tutti questi valori si ha
sin x = 0 e cos x = 1. La soluzione t = 2 corrisponde
a x/2 = arctan 2 = 63 26 05 816/1000; il seno di
x vale esattamente 0.8 e il coseno 0.6; quindi la
soluzione generale `e x = 126 52 11 63/100 + k360 .

Risoluzione dei triangoli

Come abbiamo ricordato, la Geometria Euclidea stabilisce, attraverso i cosiddetti criteri di uguaglianza
o di congruenza, quali sono i requisiti minimi perche un triangolo sia perfettamente determinato, ma
quasi nulla ci dice di come calcolare le quantit`a ignote (lati, angoli, altezze, mediane, etc.), basandosi sui
valori dei lati e degli angoli che si conoscono. Per
questo la Trigonometria ha avuto tanto successo pratico e si `e rivelata indispensabile ogniqualvolta dalla
determinazione teorica degli elementi di un triangolo,
si debba passare alla loro valutazione numerica. Per
risoluzione di un triangolo si intende la valutazione
numerica degli elementi del triangolo (lati, angoli, altezze, bisettrici, etc.) a partire dagli elementi noti, se
questi determinano il triangolo stesso.
I triangoli sono alla base di ogni metodo di misurazione delle figure poligonali, cio`e delle figure determinate da segmenti di retta, caso al quale ci si pu`o
ricondurre in pratica quasi il 100% delle volte. Se
abbiamo una stanza un po sbilenca o un campo di
forma irregolare, si procede alla cosiddetta triangolazione, cio`e a scomporre la figura in tanti triangoli, le
cui misure saranno poi calcolate mediante la Trigonometria. In pi`
u larga scala, un procedimento del tutto
analogo si usa in topografia e certi punti del territorio sono marcati per essere usati come punti di riferimento. Cime di monti e colline, edifici pubblici particolari, monumenti, tralicci costruiti appositamente,
costituiscono i vertici di triangoli ideali che permettono di misurare con precisione distanze e angolazioni.
Oggi, anche i satelliti artificiali, situati in posizioni
fisse rispetto alla Terra, permettono triangolazioni di
precisione, sfruttate prima nella navigazione marina
ed aerea, ed ora anche nel trasporto terrestre con il
sistema GPS. Senza la Trigonometria, tutte queste
applicazioni non sarebbero possibili.
Da un punto di vista matematico, la Trigonometria
offre una serie di teoremi che agevolano i calcoli; una
volta questi calcoli si eseguivano con luso delle tavole; oggi si utilizza una calcolatrice da tasca (se i conti
sono pochi) o un elaboratore pi`
u grande, ottenendo
risultati pi`
u accurati e in modo pi`
u veloce. Daltra
parte, bisogna dire, le formule della Trigonometria
sono spesso assai eleganti e tuttaltro che difficili da
dimostrare. Pertanto, una volta che ci si sia impadroniti dei concetti di base, la Trigonometria appare
una disciplina abbastanza elementare, nella quale la
tecnica tende a prevalere sulla scienza. Rimane la bellezza di molti risultati, ai quali ora vogliamo dedicare
la nostra attenzione.
La Trigonometria adotta, per un generico triangolo, una notazione standard, che occorre conoscere per
capire e tenere agevolmente a mente le varie formule.
Con riferimento alla Figura 8.5, ricordiamo che i ver-

226

CAPITOLO 8. TRIGONOMETRIA E CALCOLO


C

a
mc

hc

Figura 8.5: La notazione trigonometrica dei triangoli


B
a
C

A
Figura 8.6: Il teorema dei seni

il cerchio circoscritto al triangolo e tracciato il diab = in quanto questo anmetro CD, si ha: C DB
b
golo insiste sullo stesso arco CB dellangolo C AB.
b `e retto, in quanto insiDaltra parte, langolo C BD
ste su una semicirconferenza, e quindi: a = 2R sin .
Se langolo fosse ottuso, la stessa costruzione porb = 180 C AB,
b
ta ad avere C DB
ma come sappiamo sin() = sin(180 ), e quindi la relazione
a = 2R sin continua a sussistere. La stessa dimostrazione ci d`a b = 2R sin e c = 2R sin , da cui
segue il teorema.
Conseguenza immediata del Teorema dei seni `e il
seguente risultato, che permette di trovare facilmente
il punto di incontro tra la bisettrice di un angolo e
il lato opposto, quando si conoscano le misure dei
tre lati. Formuliamo il teorema per langolo , ma
ovviamente esso vale per tutti gli angoli, per i quali
`e sufficiente ruotare opportunamente le lettere; come
vedremo, questa `e una bella caratteristica dei risultati
della Trigonometria.
Teorema 8.8 (delle bisettrici) In un qualsiasi
triangolo, la bisettrice di un angolo divide il lato
opposto in due segmenti proporzionali ai due lati
adiacenti.
C

tici di un triangolo si indicano con le lettere A, B, C;


/2 /2
la lunghezza di ciascun lato `e indicata dalla lettera
minuscola corrispondente alla lettera del vertice opa
b
posto: pertanto BC = a, AC = b, AB = c. Gli angoli si denotano con le lettere greche corrispondenti
b = ABC,
b
b
al loro vertice, cio`e = B AC,
= B CA.
180

Le altezze si indicano con ha , hb , hc , dove lindice rapyc


xc
A
P
B
presenta il lato su cui cade laltezza; analogamente,
le mediane sono ma , mb , mc . Un ruolo importante
Figura 8.7: Teorema delle bisettrici
hanno le due circonferenze, quella inscritta e quella
circoscritta al triangolo; il centro della circonferenza
Prova: Nella Figura 8.7 il teorema afferma:
inscritta si indica con I e il suo raggio con r; il centro della circonferenza circoscritta si indica con O e
AP : AC = P B : BC;
il suo raggio con R. Infine, con S si indica larea del
dal Teorema dei seni, applicato ad AP C, si ha:
triangolo, mentre il perimetro si denota con 2p, cio`e
AC
AP
sin /2
AP
2p = a + b + c; con questo, p indica il semiperimetro
=
ovvero
=
,
del triangolo.
sin /2
sin
AC
sin
Con tali notazioni, cominciamo a dimostrare il primentre applicato a P BC, si ha:
mo teorema, che `e un po la base per la misurazione
BC
PB
dei triangoli.
=
.
sin /2
sin(180 )
Teorema 8.7 (dei seni o di Eulero) In un qualPoiche sin = sin(180 ), la conclusione segue
siasi triangolo si ha:
immediatamente.
b
c
a
Se indichiamo con xc il segmento P B e con yc il
=
=
= 2R.
sin
sin
sin
segmento AP , si ottiene il semplice sistema lineare:

Prova: Supponiamo prima di tutto, come nella


xc + yc = c
Figura 8.6, che sia un angolo acuto; considerato
xc /a = yc /b

227

8.3. RISOLUZIONE DEI TRIANGOLI


A
c

A
c

C B

Figura 8.8: Teorema delle proiezioni

Naturalmente, la scelta di chiamare, in un certo


ordine, a, b, c i tre lati e , , i tre angoli, `e del
tutto arbitraria, eccetto per il fatto che a deve essere
il lato opposto ad , b a e c a . Pertanto devono
valere (e si dimostrano, se fosse necessario, allo stesso
modo) anche le due relazioni ruotate:
b2
c2

= a2 + c2 2ac cos
= a2 + b2 2ab cos .

Pi`
u avanti ci torner`a utile il seguente:
e risolto d`a:

Corollario 8.11 In ogni triangolo si ha:


xc =

ac
a+b

yc =

bc
.
a+b

Il successivo teorema lega ciascun lato ai due angoli adiacenti; anche in questo caso, si noti la simmetria delle formule, che possono essere ottenute per
rotazione luna dallaltra.
Teorema 8.9 (delle proiezioni o di Cotes) In
ogni triangolo valgono le relazioni:
a = c cos + b cos
b = a cos + c cos
c = a cos + b cos
Prova: Se il triangolo `e acuto in si ha la situazione della Figura 8.8 a sinistra: BH = c cos e
HC = b cos , da cui segue la prima relazione, essendo: a = BC = BH + CH. Se il triangolo `e ottuso in , H cade fuori del segmento BC; tuttavia si
ha: BH = c cos e CH = |b cos |, dove il valore
assoluto `e necessario in quanto cos < 0; ma allora
BC = BH CH = c cos + b cos . In modo analogo
si provano le altre due relazioni.
Veniamo allora al pi`
u importante dei teoremi utili
alla risoluzione dei triangoli; questo risultato `e noto
come Teorema di Carnot (o del coseno) e costituisce
la generalizzazione del Teorema di Pitagora. Questo
infatti si ritrova non appena poniamo = 90 , cio`e
cos = 0.
Teorema 8.10 (del coseno o di Carnot) In ogni
triangolo si ha:
a2 = b2 + c2 2bc cos .
Prova:
Consideriamo le tre relazioni del teorema precedente e moltiplichiamo la prima per a, la
seconda per b e la terza per c:
a2
b2
c2

= ac cos + ab cos
= ab cos bc cos
= ac cos bc cos

Sommando membro a membro e semplificando si trova a2 b2 c2 = 2bc cos , che `e la relazione che
stavamo cercando.

cos =

b2 + c2 a2
.
2bc

Di nuovo, valgono le relazioni che si ottengono ruotando tra di loro i lati e gli angoli; si osservi che il
teorema di Carnot ci d`a modo di risolvere un triangolo quando se ne conoscano due lati (b e c) e langolo
tra essi compreso (1 criterio di uguaglianza). Il
corollario risolve invece il caso del 3 criterio, quando
si conoscano i tre lati a, b, c. Se sono noti un lato a e
i due angoli ad esso adiacenti (2 criterio), in realt`a
sono conosciuti tutti e tre gli angoli; considerando
due delle tre identit`a di Cotes, si ottiene un sistema
di due equazioni nelle due incognite b e c. In particolare, se si usano le due ultime identit`a, si ottiene il
sistema:

b
c cos = a cos
b cos +
c
= a cos
Il determinante di questo sistema vale:

1
cos
2

= 1 cos .
cos
1

Questa quantit`a `e zero se e soltanto se cos2 = 1,


cio`e = 0 oppure = 180 . Queste sono situazioni
che possiamo scoprire a priori, in quanto il triangolo
degenera in un segmento. Si conclude pertanto che
questo metodo risolve sempre il triangolo.
Il calcolo dei lati e degli angoli di un triangolo permette di trovare anche il valore delle altezze e delle mediane che, di fatto, scompongono il triangolo
in altri triangoli, addirittura rettangoli nel caso delle altezze. Tuttavia, esistono ancora alcune formule
interessanti che permettono di semplificare qualche
calcolo ulteriore. Ad esempio, Nepero, oltre a darsi
da fare per calcolare i logaritmi, scopr` anche queste
formule, che ci saranno di aiuto.
Teorema 8.12 (delle tangenti o di Nepero) In
ogni triangolo vale la relazione:
tan +
a+b
2
,
=
ab
tan
2
assieme alle altre due che si ottengono per rotazione.

228

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

Prova:
Cerchiamo di vedere le formule dei se- e formule analoghe. Sostituendo:
ni (Teorema 8.7) come proporzioni; componendo e
r
r

2bc b2 c2 + a2
(p b)(p c)
scomponendo si ha:
sin =
=
2
4bc
bc
(a + b) : a = (sin + sin ) : sin
r
r

2bc + b2 + c2 a2
p(p a)
(a b) : a = (sin sin ) : sin .
cos =
=
2
4bc
bc
Queste proporzioni equivalgono a:
e la formula per la tangente discende da queste,
quando si esegua la divisione.
(a + b) : (a b) = (sin + sin ) : (sin sin ).

Questo teorema, gi`a interessante di per se, ci d`a


Le prime due formule di prostaferesi implicano allora: modo di dimostrare il Teorema di Erone, nella mia
modesta opinione uno dei pi`
u bei teoremi della Geo
sin +
a+b
2 cos 2
metria e forse di tutta la Matematica. Erone di Ales=

ab
cos +
sandria era interessato piuttosto alle applicazioni del2 sin 2
la Matematica e della Fisica che ai risultati teorici.
e questa non `e altro che la formula di Nepero.
Fu inventore di macchine ingegnose, come leliopila e
Briggs, a cui evidentemente piaceva seguire Nepe- lodometro, e si interess`o soprattutto della soluzione
ro, sia per i logaritmi, sia per la Trigonometria, scopr` approssimata dei problemi geometrici. Sembra, in efalcune formule che permettono di esprimere le fun- fetti, che il teorema fosse gi`a noto ad Archimede, ma
zioni trigonometriche dei tre angoli di un triangolo non abbiamo documenti in proposito; la dimostrazioin funzione dei soli lati a, b, c, e queste formule sono ne di Erone (geometrica e non trigonometrica) `e cos`
u antica che conosciamo.
particolarmente carine quando si faccia intervenire il la pi`
semiperimetro p = (a + b + c)/2, che pertanto fa il
Teorema 8.14 (di Erone) In ogni triangolo si ha:
suo trionfale ingresso operativo:
p
S = p(p a)(p b)(p c).
Teorema 8.13 (di Briggs) In ogni triangolo si ha:
r
r
Prova: Laltezza relativa al lato c si trova facen
(p b)(p c)
p(p a)

do:
hc = b sin e quindi abbiamo: S = (bc sin )/2.
sin =
cos =
2
bc
2
bc
Usando ora la formula di bisezione, si trova:
s

(p b)(p c)

S = bc sin cos
.
tan =
2
2
2
p(p a)
e possiamo ricorrere alle formule di Briggs del
Valgono inoltre le analoghe formule ruotate per gli
teorema precedente, ricavando:
angoli , .
r
r
(p b)(p c) p(p a)
Prova: Si cominci con losservare che langolo /2 `e
.
S = bc
bc
bc
senzaltro compreso tra 0 e 90 , per cui seno, coseno
e tangente sono quantit`a positive. Pertanto, dalle Questa `e proprio la formula desiderata.
formule di bisezione e dal Corollario 8.11 si ha:
Concludiamo queste nostre note sulla Trigonos
r

2
2
2
metria
con un risultato che permette di calcolare

1 cos
1
b +c a
sin =
1
=
il
raggio
del cerchio inscritto e quello del cerchio
2
2
2
2bc
circoscritto:
s
r

Teorema 8.15 In ogni triangolo si ha:


b2 + c2 a2
1 + cos
1

1+
.
=
cos =
2
2
2
2bc
S
abc
r=
R=
.
Ci sono ora due osservazioni importanti da fare.
p
4S
Primo:
Prova: Con riferimento alla Figura 8.9, larea del
triangolo ABC `e equivalente alla somma dei triangoli
2bc b2 c2 + a2 = (a + b c)(a b + c)
ABI, BCI, CAI le cui aree sono cr/2, ar/2, br/2, cio`e
2bc + b2 + c2 a2 = (a + b + c)(a + b + c)
S = pr. Riprendiamo ora, dal teorema precedente, la
come si vede eseguendo i conti sulle espressioni di formula S = (bc sin )/2; dal Teorema dei seni abbiadestra e semplificando; secondo:
mo: sin = a/(2R), che ci d`a S = abc/(4R). Questa
formula `e equivalente a quella cercata.
a + b c = a + b + c 2c = 2(p c)

229

8.4. IL CONCETTO DI LIMITE

P
B
I

Q
O
R

A
Figura 8.9: Cerchio inscritto e circoscritto

8.4

Il concetto di limite

Fin dallinizio di queste note, abbiamo osservato come


sia impossibile considerare in modo effettivo e diretto ci`o che fa riferimento alla nostra idea di infinito.
Ripensando a ci`o che abbiamo detto, ci possiamo rendere conto che siamo ricorsi a due tecniche diverse.
Una `e stata quella della scommessa, introdotta per
formalizzare il fatto che linsieme N dei numeri naturali non `e finito. La seconda tecnica `e stata quella
di Cantor, il quale definisce un insieme infinito come
un insieme che possa essere messo in corrispondenza biunivoca con un suo sottoinsieme proprio. Lidea
di Cantor `e davvero geniale e va bene nel conteggio degli insiemi, ma non si presta quando si cerca
di ragionare sullinfinitamente vicino o sullinfinitamente lontano. In altre parole, Cantor funziona finche si vogliono distinguere gli infiniti elementi dellinsieme, non funziona pi`
u quando questi diventano
indistinguibili perche troppo vicini o troppo lontani.
Il criterio della scommessa `e lo stesso che serv` a
Lucrezio a provare che lo spazio `e infinito: recati alla
fine dellUniverso e scaglia la tua freccia; se essa va,
allora quella non `e la vera fine; se non va, c`e qualcosa oltre quella fine. Questo stesso criterio `e quello
che abbiamo usato per definire i numeri reali, quel
qualcosa che possiamo concepire, ma che non esiste
in atto, al termine di una sequenza infinita di numeri
che, globalmente, stanno sempre pi`
u vicini tra di loro.
In barba a Zenone abbiamo detto: prendiamo tutte
le sequenze i cui elementi siano definitivamente vicini
tra di loro e chiamiamo numero reale quella cosa
indefinita che esse hanno in comune, la nostra sensazione che possiamo idealmente afferrare quel qualcosa
che non c`e, ma che, con le nostre scommesse, possiamo portare pi`
u in l`a di qualsiasi limitazione un nostro
avversario ci voglia imporre.
Sicuramente, quello di limite `e uno dei concetti fondamentali della Matematica, legato com`e a tutti i
ragionamenti che riguardano la vicinanza (o la lonta-

nanza) dei numeri di un insieme, quando questi tendono a diventare sempre pi`
u vicini (o pi`
u lontani).
Questa tendenza coinvolge sempre ragionamenti che
riguardano insiemi infiniti di numeri.
Preliminari per`o a quello di limite, vi sono alcuni
concetti pi`
u semplici, ma di fondamentale importanza
per chiarire i discorsi che dovremo fare. In modo
alquanto schematico, diamo le seguenti definizioni,
che il lettore vorr`a assimilare in modo accurato.
1. Si consideri un insieme A R, finito o infinito; si dice massimo degli elementi di A, e si scrive
max(A), quellelemento a A, se esiste, tale che per
ogni altro elemento b A, si abbia a > b. La clausola sullesistenza `e importante, poiche non `e detto che
tutti gli insiemi A R abbiano un elemento massimo. Ad esempio, N R, ma N non ha alcun elemento
massimo. Non importa nemmeno che A contenga elementi che crescono indefinitamente perche sia privo
di massimo. Se consideriamo A = {1 1/n}nN0 ,
una successione, `e chiaro che al crescere di n gli elementi di A sono sempre pi`
u grandi (anche se di pochino), ma nessun elemento di A `e il pi`
u grande di
tutti. Infatti, il numero 1, che saremmo forse tentati
di considerare alla stregua di massimo, di fatto non
sta in A, e quindi non conta. Un insieme finito ha
sempre un massimo, ma gli insiemi con un numero
infinito di elementi possono averlo o non averlo. Naturalmente, il concetto di minimo `e del tutto analogo
a quello di massimo, e lasciamo al lettore la soddisfazione di definirlo e di portare avanti considerazioni
ed esempi, sulla falsariga dei precedenti. Comunque,
A = {1/n}nN0 ha 1 come elemento massimo, ma
non ammette alcun elemento minimo.
2. Sia A R come sopra; un elemento R si
dice limite superiore per A se a, per ogni elemento
a A. In generale, non `e detto che sia un elemento
di A, anzi, di solito non lo `e. E facile vedere che se
`e un limite superiore per A ed A, allora `e anche
il massimo di A. Di limiti superiori per A ne esistono
molti e, in effetti, basta che ne esista uno, diciamo
pure , e ne esistono infiniti, tutti gli > . Linsieme
A si dice superiormente limitato se ammette un limite
superiore. Ancora una volta, il lettore `e chiamato
in causa per definire cosa sia un limite inferiore e
che significhi, per un insieme, essere inferiormente
limitato. Infine, possiamo dire che A `e limitato se
`e tanto superiormente quanto inferiormente limitato,
cio`e, in altre parole, ammette un limite superiore e
un limite inferiore, come si intuisce facilmente.
3. Come s`e visto al primo punto, un insieme
A R pu`o non avere elemento massimo; ha per`o
sempre un elemento speciale, detto estremo superiore e indicato con sup(A). Per comprendere questo
concetto, si consideri un insieme A privo di massimo. Se A non `e superiormente limitato, si definisce

230

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

sup(A) = +, dove il simbolo si legge infinito e


risale al 1500. Altrimenti, si considera linsieme A
dei limiti superiori di A, che non `e vuoto per lipotesi che A sia superiormente limitato. Si osserva ora
che A ha sempre un elemento minimo . Infatti, det
to A il complementare di A in R, la coppia (A , A)
costituisce una sezione di R, secondo quanto detto
nella Sezione 3.5. Per lassioma di continuit`a, A ha
massimo oppure A ha minimo. Sia tale elemento e
vediamo che non pu`o essere il massimo di A . Se
infatti appartenesse ad A , non sarebbe un limite
Esiste allora un
superiore di A (che sono tutti in A).
elemento a A tale che a > , e (a + )/2 `e compreso tra a ed , cio`e non `e un limite superiore per A
ed `e maggiore di contro lipotesi che questo fosse il
massimo di A . Questo prova che sup(A) esiste sempre: se A ha un massimo allora sup(A) = max(A),
altrimenti `e comunque il minimo dei limiti superiori,
e quindi non sta in A. In modo analogo si definisce
lestremo inferiore di A come il massimo dei limiti
inferiori di A. Esiste sempre e si indica con inf(A); se
A non `e limitato inferiormente si pone inf(A) = .
Come esempio si consideri:

ha senso per`o che sia piccolo, poiche per grande


tutto diviene ovvio. Cos` ha senso che M sia grande,
perche se `e piccolo tutto diviene troppo facile.
Le successioni di Cauchy, che abbiamo introdotto nella Sezione 3.5 per i numeri razionali, possono
essere estese ai numeri reali, cambiando opportunamente la Definizione 3.4. La loro importanza `e data
dal seguente:

inf {1/n}nN0 = 0
inf {1 1/n2 }nN0 = 0

sup {1/n}nN0 = 1

Teorema 8.16 Una successione `e convergente se e


solo se `e una successione di Cauchy.
Prova: Supponiamo che la successione tenda al limite ; questo significa che fissato > 0 esiste un
indice m con la propriet`a che per ogni n > m si ha
| an | < /2; in particolare `e: | am+1 | < /2 e
quindi:
|am+1 an | = |am+1 + an |

+ +
2 2
e questo dimostra che vale il criterio di Cauchy con
m = m + 1. Viceversa, procediamo in modo formale, seguendo quanto detto nella Sezione 1.8 per
la negazione dei predicati. Il criterio di Cauchy si
formula:
|am+1 | + | an | <

sup {1 1/n2 }nN0 = 1.

( > 0)(m N) | (n > m) : |am an | < .


Ora `e il momento di introdurre, in modo sistematico, il criterio della scommessa, nella forma che abbia- Pertanto, come abbiamo imparato nella Sezione 1.8,
mo cominciato a vedere con le successioni di Cauchy la negazione `e:
(si veda la Sezione 3.5).
( > 0) | (m N)(n > m) | |am an | .
Definizione 8.2 Sia {ak }kN una successione assegnata; si dice che la successione converge al numero Analogamente, il fatto che la successione tenda ad
reale se, fissato un numero reale positivo [piccolo] si esprime scrivendo:
a piacere, esiste un indice m della successione tale
( R) | ( > 0)(p N) | (n > p) : | an | < .
che per ogni indice n > m si ha |an | < . Il
numero si dice limite della successione e si scrive: La negazione `e allora:
= lim an .
n

( R)( > 0) | (p N)(n > p) | | an | .

Si dice invece che la successione diverge a + () Poiche questa relazione vale per ogni , vale in
se, fissato un numero M [grande] a piacere, esiste particolare quando = ap , cio`e:
un indice m della successione tale che per ogni in( > 0) | (p N)(n > p) | |ap an |
dice n > m si ha an > M (an < M ). Si scrive
rispettivamente:
e questa, come abbiamo visto, altro non `e che la
negazione della condizione di Cauchy.
lim an = + e
lim an = .
n
n
Particolarmente importanti sono le successioni moone, cio`e le successioni che non decrescono o
La successione {1/n}nN0 converge a 0; la suc- not`
cessione {n}nN diverge a + e la successione non crescono mai. Formalmente, una successione
{(1)n }nN non converge, ne diverge, in quanto {ak }kN `e monotona non decrescente se n N si ha:
oscilla tra +1 e 1. Osserviamo esplicitamente che an+1 an . Analoga `e la definizione di successione
nella precedente definizione abbiamo posto fra paren- monotona non crescente. Osserviamo esplicitamente
tesi quadra gli aggettivi piccolo e grande. Essi che, in Matematica, il termine tecnico monotono
sono infatti logicamente inutili perche le relazioni de- va pronunciato piano, cio`e con laccento tonico sulla
vono valere per o per M arbitrari; psicologicamente, penultima sillaba.

231

8.4. IL CONCETTO DI LIMITE

Teorema 8.17 Una successione monotona ha sem- i suoi elementi possono essere invertiti; questo perpre un limite; se `e limitata, il limite `e finito, mette di eseguire anche la divisione. In questi casi,
altrimenti il limite `e infinito.
`e opportuno vedere come si comporta il limite (per
n ), cio`e vedere se il limite della somma, della
Prova: Consideriamo una successione {ak }kN mo- differenza, del prodotto e della divisione di due senotona non decrescente; se non `e limitata essa tende quenze `e deducibile dai limiti delle due successioni.
ovviamente a +. Supponiamo allora che sia limi- Nel caso che tali limiti siano finiti (e, nel caso del detata e consideriamo linsieme M dei numeri reali che nominatore in una divisione, diversi da 0), ci`o `e gi`a
sono maggiori di tutti i suoi elementi an . Se M ha un stato visto nella citata sezione, almeno relativamenelemento pi`
u piccolo, lo si chiami ; altrimenti, sia te alle successioni su Q, ma nulla cambia quando si
il pi`
u grande dei numeri che non stanno in M . Vedia- passi ad R. Possiamo ridurre a uno specchietto ci`o
mo che limn an = . Sia infatti > 0 un numero che succede per la somma, supponendo che {ak }kN
qualsiasi e osserviamo che deve esistere un elemento e {bk }kN siano le due successioni e A e B siano i
della successione compreso nellintervallo ( , ); se loro limiti:
cos` infatti non fosse, /2 dovrebbe stare in M ,
B = 0 B 6= 0 B = + B =
contro lipotesi che M contenga tutti e soli i numeri
A
=
0
0
B
+

maggiori di (ed eventualmente lo stesso ). Se am `e


A
A
+
B
+

A
=
6
0
tale elemento, ogni altro elemento an con n > m deve
+
+
?
A = + +
stare in ( , ) per la monotonicit`a della successioA
=

ne, e quindi si ha an < . Me questo altro non `e


che la definizione di come limite della successione.
A parte le due strane somme + + () e +
Naturalmenet, se la successione `e non crescente, essa
(+)
che vedremo tra poco, tutte le altre relazioni
tende a oppure ad un limite minore o uguale a
sono
di
facile dimostrazione. Ad esempio, consideriatutti gli elementi della successione.
mo il caso in cui A = + e B abbia un valore finito.
Le successioni monotone sono particolarmente im- Sia Z lestremo superiore degli elementi di {bk }kN
portanti proprio perche hanno sempre un limite, e e per ogni M R sia m N lindice per il quale
dimostrare la loro limitatezza equivale a dimostrare per ogni n > m si abbia an > M Z. Si ha allora
che il limite `e finito. Si pensi al caso ben noto del- an + bn > (M Z) + Z = M , e questo dimostra che
le approssimazioni per difetto e per eccesso di una la successione {an + bn }nN diverge a +. Le altre
quantit`a incognita; come si ricorder`a, `e proprio sfrut- dimostrazioni sono analoghe e le lasciamo al lettore
tando questa idea che abbiamo impostato la nostra come puro divertimento.
costruzione dei numeri reali, anche se abbiamo di fatI due casi indicati dal punto interrogativo corrito considerato il concetto pi`
u ampio di successione di spondono invece a situazioni variabili a seconda dei
Cauchy.
casi. Si ha infatti:
Un altro criterio per la convergenza delle
successioni `e dato dal seguente:
lim (k 2 ) + lim (k) = +
k

Teorema 8.18 (dei carabinieri) Se si hanno tre


successioni {ak }kN , {bk }kN , {ck }kN tali che k
N si abbia: ak bk ck e per le quali si sappia che:
lim ak = lim ck =

allora si ha anche: limk bk = .


Prova: La condizione sul limite degli ak e dei ck si
scrive come:
< ak < + e

< ck < + .

Poiche bk `e compreso tra ak e ck , si deve avere <


bk < + e questo prova che `e il limite dei bk .
Come abbiamo visto nella Sezione 3.4, le successioni si possono sommare, sottrarre e moltiplicare elemento per elemento, ottenendo nuove successioni, e
se una successione ha tutti gli elementi diversi da 0,

lim (k 2 ) + lim (k) =

lim (k 2 + 1) + lim (k 2 + 1) = 2,

tre risultati completamente differenti e che dipendono solo dalle successioni considerate. Analogamente, se limk ak = e non esiste limk bk , si
hanno situazioni diverse a seconda che la successione
{bk }kN sia limitata o meno. Nel primo caso si ha:
lim (ak + bk ) = ,

mentre nellaltro caso occorre vedere se {ak }kN domina {bk }kN (e allora il limite della somma `e ancora ), o viceversa, e allora tale limite non esiste.
Come esempio si consideri:
lim (k 2 + (1)k k) = +

232

CAPITOLO 8. TRIGONOMETRIA E CALCOLO


lim ((1)k k 2 + k) non esiste.

I due casi ( ) e ( + ) non sono le uniche


situazioni anomale che si trovano calcolando i limiti;
se il lettore, come dovrebbe fare, prova a disegnare
le tabelline analoghe alla precedente, ma relative alla moltiplicazione e alla divisione, si accorger`a che
si presentano altri casi di incertezza, che vanno perci`o risolti di volta in volta. Queste situazioni sono
note come forme indeterminate dei limiti ed `e opportuno che siano ricordate per poter dare un segnale
dallarme ogni volta che se ne incontra una:
0
0

Un punto importante di questa definizione `e laver


escluso x0 dai punti dellintervallo (x0 , x0 + ) per
i quali la condizione va verificata. Questo permette
di considerare il limite per x x0 (x che tende ad
x0 ) anche quando f (x0 ) non esiste, non `e definita.
E proprio in casi del genere che il concetto di limite
rivela la sua potenza, come ora vedremo.

sono i casi pi`


u comuni, ma `e bene tener presenti anche
0 e 0 . Vedremo a suo tempo come il Teorema
di de LHopital risolva spesso i casi 0/0 e /, e
quindi, indirettamente, anche 0 = 0 (1/0) = 0/0.
Ci`o che mi pare suggestivo nel concetto di limite
di una successione `e il fatto che mi posso facilmente
immaginare la successione stessa come una sequenza temporale di punti, che si vanno disponendo sulla
retta reale. Quando la successione converge, io vedo
i punti accumularsi intorno al punto di convergenza; se invece la successione diverge, vedo i suoi punti
scomparire verso linfinito, positivo o negativo, non
importa. Questa immagine mi ha sempre aiutato a
capire il concetto di limite e ad assimilare la definizione, che, come s`e visto, non `e del tutto elementare.
E come ha aiutato me, penso che sia stata daiuto a
molti altri, anche se ciascuno, naturalmente, tende a
formarsi le proprie immagini di aiuto psicologico.
Il passaggio dal limite di una successione a quello
di una funzione, quando il suo argomento tende a un
valore specifico x0 , si fa riprendendo proprio questa
immagine, sia idealmente sia praticamente. Si dice
che una funzione f (x) tende a un valore nel punto
x0 (appartenente o meno al dominio di f ), e si scrive: limxx0 f (x) = , se e solo se ogni successione
{b
xk }kN tale che limk x
bk = x0 abbia come limite delle sue immagini, cio`e: limk f (b
xk ) = . Purtroppo, le successioni che tendono ad x0 sono infinite,
anzi sono addirittura 2 ; da un punto di vista formale, pertanto, si preferisce la seguente definizione,
anche se il nostro intuito rimane piuttosto ancorato
alla precedente:
Definizione 8.3 Data una funzione f : R R, si
dice che f tende ad per x che tende ad x0 , se e solo
se: > 0, R | x (x0 , x0 + ) \ {x0 } si
ha |f (x) | < . La funzione f si dice continua nel
punto x0 del suo dominio, se e solo se si ha:
lim f (x) = f (x0 ).

xx0

Infine, la f `e continua nellintervallo (a, b) se `e continua in tutti i punti dellintervallo. Un punto x0 nel
quale la funzione f non sia continua, si dice punto di
discontinuit`a della funzione.

Figura 8.10: Funzione a scalini


Originariamente, nel 1600 e in parte del 1700,
quando si parlava di funzioni, si intendeva riferirsi
alle funzioni continue, cio`e alle funzioni il cui grafico poteva essere tracciato in modo continuo, senza
mai dover ritirare la matita dal foglio. I matematici
avevano in mente le funzioni pi`
u comuni: i polinomi
(soprattutto parabole e cubiche), le coniche, le funzioni trigonometriche, e altre figure, ottenute spesso
fisicamente dal moto di un corpo e dalla traiettoria
di un punto fissato su di esso. Ad esempio, la famosa
cicloide si ottiene fissando un punto su una circonferenza e facendo ruotare questa lungo una retta. Ci
si accorse presto, per`o, che erano interessanti anche
funzioni pi`
u strane. Ad esempio, la funzione y = x
ha una stupenda forma a scalini, e da essa `e derivata
la famosa delta di Dirac che vale 1 per x = 0 e vale 0
in tutti gli altri punti. La funzione caratteristica del
numeri razionali (si veda Sezione 1.3) vale 1 per ogni
x razionale e vale 0 per ogni argomento irrazionale:
essa non `e continua in alcuno dei suoi punti, ma se
per x0 razionale consideriamo solo le successioni di
numeri razionali, il limite della successione tende al
valore della funzione!
Daltra parte, una caso molto semplice e comune
di discontinuit`a `e costituito dalle funzioni razionali
fratte: nei punti in cui il denominatore si annulla, la
funzione non `e definita e quindi non pu`o essere continua. Si consideri il semplice esempio y = 1/x, che
come sappiamo rappresenta uniperbole. Nel punto
x = 0 la funzione non `e definita. In questi casi ha
senso considerare il limite quando x 0 per valori

233

8.4. IL CONCETTO DI LIMITE


negativi, cio`e crescendo, e il limite quando x 0 per
valori positivi, e quindi decrescendo. Questi due limiti si dicono, rispettivamente, sinistro e destro. E
facile vedere che:
lim
x0

1
= e
x

lim
x0

1
= +,
x

tipo, disegnando la funzione ci si rende conto che x =


1 `e una discontinuit`a fittizia e la funzione pu`o essere
definita ponendo f (1) = 1. Col senno di poi, ci si
accorge che lespressione pu`o essere semplificata:
y=

x2

x1
x1
1
=
=
3x + 2
(x 1)(x 2)
x2

dove le notazioni x 0 ed x 0+ sono di facile e questo rivela larcano. Naturalmente, `e bene


interpretazione e rappresentano i due tipi di limite. imparare ad accorgersi prima di situazioni del genere.
Analogamente, per la funzione S a scalini si ha:
Altri casi di discontinuit`a fittizia sono pi`
u interessanti, poiche non sono risolubili in modo formale colim S(x) = 0 e lim S(x) = 1.
me il precedente. Tali esempi costituiscono perci`o i
x1
x1
cosiddetti limiti notevoli e i principali vanno capiti e
Ci`o ha portato a distinguere i punti di discontinuit`a mandati a memoria. Il caso pi`
u tipico `e il limite della
in quattro specie:
funzione y = sin(x)/x quando x tende a zero. Qui la
frazione non `e definita a causa dellx a denominatore;
1. si dice discontinuit`
a di 1a specie un punto x0
ma vediamo cosa succede quando x si avvicina a 0,
in cui il limite sinistro `e diverso dal limite derimanendo per`o distinto da 0. Si disegni il cerchio gostro, ma entrambi sono finiti. In tal caso, x0
niometrico e immaginiamo di misurare la variabile x
determina un salto della funzione, e lentit`a del
in radianti, come si deve sempre fare nellanalisi delle
salto `e data dalla differenza dei due limiti. La
funzioni trigonometriche:
funzione a scalini ha un salto di ampiezza 1 in
Dalla Figura 8.1 si ha la disuguaglianza AP
corrispondenza di tutti i numeri interi;
AU U B, che da un punto di vista trigonometri2. si dice discontinuit`
a di 2a specie un punto x0 in co significa: sin(x) x tan(x). Dividendo tutto
cui esistono limite destro e limite sinistro, ma per sin(x):
x
almeno uno dei due `e infinito. Questo `e il caso
1
cos(x).
sin(x)
delliperbole nel punto x0 = 0, ma anche della
Quando x 0 (rimanendo diverso da 0) il Teorema dei
funzione y = 1/(1 x) nel punto x0 = 1;
Carabinieri
ci dice che x/ sin(x) rimane schiacciato
3. si dice discontinuit`
a di 3a specie un punto x0 in fra 1 e cos(x) 1, per cui il suo valore deve essere 1:
cui uno almeno dei due limiti sinistro e destro
non esiste. Ad esempio, la funzione y = sin(1/x)
sin(x)
x
= lim
= 1.
lim
nel punto x0 = 0 non ha nessuno dei due limiti;
x0
x0 sin(x)
x
essa infatti oscilla tra +1 e 1 senza convergere
In modo analogo si procede per il limite quando x 0,
ad alcun valore;
e ci`o prova il nostro primo limite notevole.
4. si dice discontinuit`
a fittizia un punto x0 per il
Il secondo limite che consideriamo sfrutta questo
quale la funzione non `e definita, ma i limiti sini- primo risultato: vogliamo dimostrare che:
stro e destro hanno lo stesso valore . In questo
1 cos(x)
1
caso, si pu`o artificialmente definire f (x0 ) = e,
lim
= ,
2
x0
chiaramente, la funzione diviene continua in x0 ;
x
2
da qui lappellativo di fittizia.
nel senso che limite sinistro e destro assumono enI punti x0 di discontinuit`a fittizia hanno un aspet- trambi questo valore. Per x > 0 dalla formula di
to interessante, in quanto dalla forma analitica della bisezione si ha:
funzione ci si aspetterebbe un comportamento strano
1 cos(x)
2 sin2 (x/2)
1 sin2 (x/2)
in x0 , mentre poi ci si accorge che, nella realt`a, que=
=

.
x2
x2
2
(x/2)2
sto punto non ha niente di speciale. Lesempio pi`
u
semplice `e costituito dalle funzioni del tipo:
Questultimo valore ci riporta al caso precedente e
per x 0 si ha ovviamente sin(x/2)/(x/2) 1.
Pertanto, il limite sinistro della nostra funzione vale
1/2. Lasciamo il lettore a giocare con i valori assoluti
cercando di capire dove il denominatore si annulla, per far vedere che anche il limite destro `e 1/2.
Altri limiti notevoli, come limx0 tan(x)/x = 1 si
si trovano due valori x = 1 ed x = 2, che pertanto
rappresentano punti di discontinuit`a. Ma mentre x = riconducono al limite di sin(x)/x, che perci`o `e consi2 si vede essere un punto di discontinuit`a del secondo derato di fondamentale importanza. Nella prossima
y=

x2

x1
;
3x + 2

234

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

sezione, dopo aver introdotto la funzione esponenziale e quella logaritmica, vedremo come anche queste nuove funzioni diano origine a importanti limiti
notevoli.
Indubbiamente, anche quando sono limitate a certi
intervalli, le funzioni continue sono le pi`
u simpatiche,
proprio perche corrispondono meglio alla nostra intuizione. Alcune loro propriet`a sono tanto evidenti
che potremmo considerarle senzaltro vere, ma le dimostreremo ora formalmente perche in Matematica,
si sa, `e bene non fidarsi delle cose ovvie.

Teorema 8.21 Sia f (x) una funzione continua nellintervallo chiuso [a, b] e siano m ed M i valori minimo e massimo che la funzione assume in tale intervallo. Allora, per ogni y [m, M ] esiste almeno
un valore di x tale che f (x) = y.
Prova:
Basta considerare la funzione continua
g(x) = f (x) y e applicare il teorema precedente.

Talvolta pu`o essere conveniente una generalizzazione


di questo teorema. Se f (x) `e continua nellintervallo
aperto (a, b), pu`o essere che in uno o in entrambi gli
Teorema 8.19 (della permanenza del segno)
estremi la funzione vada a . Il teorema continua
Se f (x) `e una funzione continua nellintervallo (a, b)
a valere purche a minimo e a massimo si sostituiscano
ed `e definita in x0 (a, b), allora esiste un intervallo
i concetti di estremo inferiore e superiore.
(x0 , x0 + ) in ogni punto x del quale f (x) ha lo
steso segno di f (x0 ).
Prova: Supponiamo che sia f (x0 ) > 0 e fissiamo
< f (x0 ). Lipotesi di continuit`a ci dice che esiste
un intervallo (x0 , x0 + ) nel quale si ha |f (x)
f (x0 )| < , cio`e f (x0 ) < f (x) < f (x0 ) + e, data
la scelta di , questo significa f (x) > 0 per ogni x
dellintervallo. Analogo `e il caso in cui sia f (x0 ) < 0.

8.5

Logaritmo ed esponenziale

Il concetto di logaritmo `e stato introdotto nella Sezione 2.8 come una delle operazioni inverse dellelevamento a potenza (laltra operazione inversa `e lestrazione di radice). Pertanto, poiche 23 = 8, il logaritmo in base 2 di 8 `e proprio 3; e poiche 34 = 81,
si ha log3 81 = 4. Lestensione dei logaritmi a tutti i
Lintuizione ci dice che se percorriamo con la penna numeri reali si `e operata nella Sezione 3.6, dalla quale
una traiettoria continua e a un certo punto passiamo riportiamo le principali propriet`a dei logaritmi:
da valori positivi a valori negativi (o viceversa), dobbiamo per forza transitare dal valore 0. Formalmente
loga (rv) = loga r + loga v
abbiamo:
loga (r/v) = loga r loga v
loga (rs ) = s loga r
Teorema 8.20 (zeri di una funzione continua)
loga s r = 1s loga r
Se la funzione f (x) `e continua nellintervallo chiuso
loga a = 1
[a, b] ed esistono due punti x1 , x2 [a, b] tali che
loga 1 = 0
f (x1 ) ed f (x2 ) hanno segno discorde, allora la
loga b = 1/ logb a.
funzione si annulla in un punto compreso fra x1 ed
x2 .
Sono queste propriet`a quelle che portarono Napier
prima e Briggs poi a introdurre il concetto di logaProva:
Per fissare le idee, supponiamo che sia
ritmo e a creare le tavole corrispondenti come aiuto
f (x1 ) < 0, e quindi f (x2 ) > 0. Consideriamo linal calcolo. Daltra parte ci si accorse, circa un secosieme A dei punti x dellintervallo [x1 , x2 ] per i quali
lo dopo, che i logaritmi potevano servire a descrivere
f (x) sia negativo; poiche x1 A, questo insieme non
molti fenomeni naturali o artificiali.
`e vuoto ed ha quindi un estremo superiore xi. VeConsideriamo un fenomeno che nel 1600 o 1700 era
diamo che f () = 0. Se infatti f () fosse positivo
sconosciuto, ma che oggi tutti hanno presente: il deper il Teorema della permanenza del segno avrebbe
cadimento delle sostanze radioattive. Gli atomi di taun intorno fatto tutto di elementi non di A, e quindi
li sostanze emettono tre tipi di radiazioni: radiazione
non potrebbe esserne lestremo superiore. Se invece
, cio`e nuclei di elio composti da due protoni e due
f () fosse negativo, non sarebbe un limite superiore
neutroni, radiazione , cio`e elettroni o positroni, e raper A. Quindi f () = 0.
diazione , radiazioni elettromagnetiche ad altissima
Quando affronteremo lo studio sistematico delle energia. Come conseguenza di tale emissione, parte
funzioni, questo teorema servir`a a capire landamen- degli atomi della sostanza si mutano in altri atomi
to di una funzione nei confronti dellasse delle ascisse; pi`
u leggeri, talvolta non pi`
u radioattivi. Comunque,
nel Calcolo Numerico esso serve ad isolare le radici il decadimento cambia la natura della sostanza e, ad
di unequazione e quindi a trovarne una approssima- esempio, luranio si trasforma lentamente in piomzione. Non ci rimane ora che concludere con un altro bo. Si chiama emivita di una sostanza radioattiva
risultato implicito nel nostro concetto di continuit`a. il tempo necessario affinche una certa quantit`a della

235

8.5. LOGARITMO ED ESPONENZIALE


sostanza si riduca alla met`a a causa del decadimento. LUranio ha unemivita di 4.5 milioni di anni,
il Radio di 1620 anni, il Radon di 3.823 giorni e il
Laurenzio di 35 secondi. Per semplicit`a, supponiamo
di avere una sostanza con unemivita di un giorno e,
avendo una quantit`a q di tale sostanza (ad esempio
espressa in grammi) siamo interessati a sapere dopo
quanto tempo il decadimento rende innocua la sostanza stessa perche ne riduce gli atomi a, diciamo,
un grammo. Se abbiamo 8 grammi della sostanza,
dopo un giorno la quantit`a degli atomi radioattivi si
`e ridotta a 4 grammi, dopo due giorni `e calata a 2
grammi, e finalmente il terzo giorno `e arrivata alla
quantit`a di sicurezza di un unico grammo. Il ragionamento si estende facilmente e quindi, se t esprime
il tempo in giorni, abbiamo la formula t = log2 (q).
Possiamo disegnare su un piano cartesiano la curva
che ci rappresenta i tempi di decadimento in funzione della quantit`a; un chilogrammo di sostanza ci d`a
un tempo t 10 poiche, come abbiamo gi`a osservato, 1000 1024 = 210 , cos` come una tonnellata di
prodotto richieder`a 20 giorni per disattivarsi. Nella
Figura ?? abbiamo riportato il grafico e lo abbiamo
esteso anche a quantit`a minori di 1 grammo. Che
senso ha questo? Si osservi che mezzo grammo corrisponde a 1 giorno, e questo significa semplicemente
che un giorno prima il nostro mezzo grammo era un
grammo intero di sostanza attiva.
Nota 8.2
Ricordiamo che il decadimento radioattivo serve a datare, con ottima precisione, i reperti organici nelle ricerche archeologiche. Il principio `e
semplice, mentre la tecnica che c`e dietro `e molto sofisticata. Come `e noto, il Carbonio ha peso atomico
12, ma in natura esiste anche un isotopo radioattivo di peso atomico 14, il 14 C. Esso costituisce una
percentuale (ridotta, ma misurabile) del Carbonio
che mangiamo e respiriamo, per cui lorganismo delle
piante e degli animali, per il continuo ricambio, contiene costantemente la percentuale di 14 C, rispetto
a tutto il Carbonio presente nei tessuti. Questo `e vero fino a che lanimale o la pianta mangia e respira,
cio`e finche `e in vita. Come arriva la morte, il ricambio non c`e pi`
u e il Carbonio rimane quello che era,
se particolari condizioni arrestano la decomposizione.
Questo significa che il Carbonio 14 comincia a diminuire, decadendo nel normale 12 C. Lemivita del 14 C
`e di 5730 anni e quindi vediamo cosa fa un archeologo che abbia rinvenuto un reperto organico (il legno
di una nave o di uno strumento, tessuti o escrementi
fossilizzati, etc.). Egli ne preleva una certa quantit`
a
(di solito molto piccola) e con strumenti opportuni determina il rapporto esistente fra Carbonio 14 e 12;
naturalmente tale rapporto `e minore di , quello al
momento della morte dellalbero o del tessuto o della deposizione di altro materiale. Se tale rapporto `e,
ad esempio, un quarto di , per quello che abbiamo
visto, essendo log2 4 = 2, sono passati due periodi di

5730 anni, cio`e il reperto `e vecchio di 11. 460 anni. La


formula generale `e allora la seguente:
t = 5730 log2

= 5730(log2 log2 )

dove t indica il tempo trascorso, cio`e la vetust`


a del
reperto. La tecnica moderna permette di valutare
con estrema accuratezza, e quindi ottenere datazioni
molto attendibili. In certi casi fortunati, si `e potuta
confrontare la datazione al Carbonio con date certe
o con altri tipi di datazione, come ad esempio le
circonferenze di accrescimento di alberi molto antichi
(che, fra laltro, ci danno anche informazioni sulle
variazioni climatiche).
In tal modo si `e potuta
verificare lattendibilit`
a dei calcoli e si sono messe
a punto certe tarature, per migliorare la tecnica stessa.

Come abbiamo detto, linvenzione dei logaritmi `e


dovuta a John Napier. Anche se in Matematica `e difficile parlare di invenzione visto che molti pensano
che la Matematica ci sia data e quindi ogni novit`a `e una scoperta, a proposito dei logaritmi pare
giusto parlare proprio di invenzione. Per Napier i logaritmi non avevano nessun risvolto teorico e i suoi
sforzi (ventanni di calcoli indefessi) furono dettati
dal desiderio di arrivare ad uno strumento efficiente
di calcolo. Come tali i logaritmi vennero accolti e diventarono immediatamente popolari. In realt`a, la popolarit`a maggiore la ottennero i logaritmi di Briggs,
il quale, dopo un lungo colloquio con Napier, ormai
vecchio e stanco, calcol`o e pubblic`o le tavole dei logaritmi decimali, cio`e quelli relativi alla base 10. Napier
aveva inventato una sorta di logaritmi che, nella sua
intenzione, non dovevano avere alcuna base, ma che,
col senno di poi, sono i logaritmi in base 1/e; questa
sarebbe una ben strana base se, 150 anni dopo Napier, Eulero non avesse dimostrato come essa fosse
invece una specie di base naturale. La vera base
naturale `e il numero e = 2.718281828 . . ., e il simbolo e per indicarla `e stato scelto in onore di Eulero.
Questa naturalezza giustifica lopinione di Napier
che i suoi logaritmi fossero senza base, e cerchiamo
pertanto di capire il perche di questa opinione.
Seguire il ragionamento di Napier sarebbe piuttosto capzioso, basato com`e su considerazioni fisiche:
due punti si muovono su due rette, uno con velocit`a
costante e laltro con velocit`a pari alla distanza dal
punto di arrivo (quindi, una velocit`a che va calando).
Procediamo allora cos`. Fissiamo un numero N molto grande (Napier scelse N = 107 ) e poniamo, per x
piccolo rispetto ad N (diciamo, qualche migliaio al
pi`
u):

x N
E(x) = 1 +
= y.
N
Data questa formula, conoscendo y si pu`o calcolare il
valore di x; con semplici passaggi algebrici si ottiene

236
infatti:

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

x = N ( N y 1) = L(y).

Se moltiplichiamo fra di loro due quantit`a del tipo


E(x), si trova:

x2 N
x1 N
=
1+
E(x1 )E(x2 ) = 1 +
N
N

N
N
x1 + x2
x1 x2
x1 + x2
= 1+
+

1
+
=
N
N2
N
= E(x1 + x2 ).

71908, per cui si conclude log10 (52.37) = 1.71908.


Per questo motivo, fino allavvento dei calcolatori
elettronici tascabili, i logaritmi sono stati lo strumento di base per il calcolo pratico. Oggi non si usano
pi`
u, ma la loro rilevanza teorica non `e affatto diminuita e i logaritmi rimangono una delle funzioni di
base di tutta la Matematica (si veda anche la Nota
8.2). Scopriamo allora perche la base e si considera
cos` naturale.
Cominciamo col porre x = 1 nellespressione di Napier e immaginiamo che N non sia pi`
u fisso, ma variabile; lespressione dipende da N e noi scriveremo
n per mettere in rilievo la sua variabilit`a:

n
1
En = 1 +
.
n

Qui losservazione importante `e che la quantit`a


x1 x2 /N 2 `e trascurabile per la nostra ipotesi, secondo la quale N debba essere molto grande rispetto
a x1 e x2 . Se ora chiamiamo y1 e y2 i due numeri
E(x1 ) e E(x2 ) e leggiamo le espressioni precedenti
Questi numeri formano una successione i cui primi
dallinterno verso lesterno, si ottiene:
elementi sono:
L(y1 ) + L(y2 ) = x1 + x2 = L(y1 y2 ).
Quindi, la trasformazione inversa L cambia un prodotto in una somma, la propriet`a caratteristica dei
logaritmi, quella che permette di semplificare i calcoli.
Si consideri ad esempio il prodotto 25 32, che si
fa bene anche con la tradizionale moltiplicazione e d`a
come risultato 800. Si ha:

7
L(25) = 107 ( 10 25 1) 3.218876

7
L(32) = 107 ( 10 32 1) 3.465737
La somma di queste due quantit`a `e 6.684613 e se
si calcola L(800) si trova proprio 6.684614. Naturalmente, ci siamo aiutati con una calcolatrice elettronica tascabile, cosa che Napier non poteva fare.
Tuttavia, una volta costruite le tavole dei logaritmi,
L(25) ed L(32) si leggono direttamente sulle tavole;
si calcola la loro somma 6.684613 e, usando le tavole
allincontrario, si risale immediatamente al risultato
finale.
Per usare i logaritmi di Napier occorre avere tavole
molto estese poiche non esiste alcuna regola evidente
che leghi, ad esempio, il logaritmo di 2, di 20 o di
200. Si ha infatti L(2) = 0.693147, L(20) = 2.995732
e L(200) = 5.298317. Lidea di Briggs di introdurre
una base esplicita, e proprio la base 10, port`o un
enorme vantaggio; dalla regola generale:
log10 (10k r) = k + log10 (r)
discende che se (come `e) log10 (2) = 0.301030, allora
log10 (20) = 1.301030 e log10 (200) = 2.301030. Questo permette di scrivere una tabella dei logaritmi decimali dei numeri interi da 1000 a 9999 e di usare tale
tabella in maniera universale. Ad esempio, volendo
conoscere il logaritmo di 52.37, si cerca nella tabella il
numero 5237 e si trova la parte decimale, o mantissa,

E1 = 2,

E2 = 2.25,

E4 = 2.44140625,

E3 = 2.37037037,

E5 = 2.48832000,

...

Come si vede, questi valori vanno crescendo, e questo


`e un fatto che si pu`o dimostrare:
Teorema 8.22 La successione E1 , E2 , E3 , . . . `e crescente, cio`e En+1 > En , n N.
Prova: Espandiamo la potenza usando il binomio
di Newton:
n


n 1
1
1
n 1
+
+ + n =
1+
=1+
n
n
2 n2
1 n
n 1 (n 1)(n 2)
1
+
+ + n =
2
2!n
3!n
n

1
2 1
1 1
+ 1
1
+
=1+1+ 1
n 2!
n
n 3!

1
2
n1 1
+ + 1
1
1
.
n
n
n
n!
=1+1+

Quando passiamo da n ad n + 1, il valore di questa


espressione aumenta per ben due motivi. Primo, il
numero dei termini cresce di uno; secondo, ovunque
sia il fattore (1 k/n), esso diviene (1 k/(n + 1)) e
quindi cresce, facendo s` che ogni termine divenga un
po pi`
u grande. Tutto questo, naturalmente, succede
per ogni valore di n
Per il principio delle successioni crescenti monotone, questa sequenza cresce indefinitamente oppure
`e limitata, e quindi esiste un numero reale specifico
al quale si avvicina sempre pi`
u. Vediamo che vale
questa seconda ipotesi:
Teorema 8.23 La successione E1 , E2 , E3 , . . . `e limitata superiormente dal numero 3.

237

8.5. LOGARITMO ED ESPONENZIALE


Prova: Se, nellespressione trovata per En sostituiamo 1 a ciascun fattore (1 k/n) < 1, otteniamo la
disuguaglianza:
En < 1 + 1 +

1
1
1
+ + + .
2! 3!
n!

Ora osserviamo che, qualunque sia n > 2, abbiamo


n! < 2n1 , in quanto n! = 2 3 n `e il prodotto
di n 1 fattori tutti maggiori o uguali a 2, mentre
2n1 `e il prodotto di n 1 fattori tutti uguali a 2.
Abbiamo quindi unulteriore maggiorazione:
En < 1 + 1 +

1
1 1
+ + + n1 < 3,
2 4
2

in quanto questa espressione (a parte il primo addendo 1) `e la somma della progressione geometrica di
ragione 1/2 e, come sappiamo, si avvicina, crescendo,
al valore 2.
Quindi la sequenza E1 , E2 , E3 , . . . definisce un numero reale; in onore di Eulero, che studi`o queste cose
150 anni dopo Nepero, tale numero si indica con la
lettera e e si dice numero di Eulero o base dei logaritmi naturali. Il suo valore, come ora vedremo,
`e:
e = 2.718281827459 . . .

decimali, i conti si possono disporre in questo modo:


1.000000
1.000000
0.500000
0.166667
0.041667
0.008333
0.001389
0.000198
0.000025
0.000003
2.718282

:
:
:
:
:
:
:
:
:

1
2
3
4
5
6
7
8
9

Nepero, naturalmente, non sospettava nemmeno


lesistenza e limportanza del numero e, e quindi
non poteva nemmeno immaginare che la sua funzione
E(y) equivale alla potenza ey (a parte il fatto che una
vera uguaglianza non c`e, essendo fissato il numero
N ). Eulero pote dimostrare:
Teorema 8.25 Il valore dellespressione (1 + x/n)n
si avvicina ad ex quando n cresce indefinitamente.

Prova: Sia x un valore fissato; per le propriet`a delle


potenze abbiamo:

n/x !x

n
x
1
Personalmente, non sono mai riuscito a ricordare a
1+
1+
=
.
n
n/x
memoria nemmeno le prime cifre di questo numero,
che uso assai di frequente. La seguente filastrocca:
Al variare di n, il valore di n/x cresce anchesso, esai modesti o vanitosi,
sendo x un numero fisso. Quindi lespressione dentro
ai violenti o timorosi,
la parentesi pi`
u esterne si avvicina quanto si vuole ad
do cantando gaio ritmo,
e, e tutta lespressione si avvicina ad ex .
logaritmo!
Quindi Nepero aveva seguito una strada un po in`e composta di parole la cui lunghezza d`a proprio le voluta per arrivare ad una potenza specifica, cio`e ex .
cifre di e. Naturalmente, non mi `e mai riuscito ricor- Daltra parte, egli voleva affrancarsi da una base pardarmi nemmeno la filastrocca e preferisco valutare ticolare, e fu proprio questo desiderio (che fece la forEXP(1) col mio calcolatorino tascabile. Si sa che il tuna di Briggs) a portarlo su una strada che qualcuno
numero e `e irrazionale e trascendente, cio`e non `e so- dopo di lui mostr`o essere cos` feconda.
luzione di alcuna equazione polinomiale a coefficienti
+
x
interi. Tuttavia, esso pu`o essere calcolato facilmente: Definizione 8.4 La funzione y = e di R R0 si
dice, per antonomasia, la funzione esponenziale; la
Teorema 8.24 Il numero e `e il valore della somma sua inversa composizionale, da R+
0 R, si dice la
funzione logaritmo naturale e si scrive x = ln(y);
infinita:
essa indica lesponente x a cui elevare e per ottenere
1
1
1
1
y.
+ .
e = 1 + + + + +
1! 2! 3!
n!
Ragionando come abbiamo fatto per trovare e:
Prova: Riprendiamo lespressione trovata per En
nel Teorema 8.22 e facciamo crescere indefinitamente Teorema 8.26 La funzione esponenziale si calcola
n. Ogni fattore (1k/n) pu`o essere assimilato ad 1 ed mediante la somma infinita:
il numero dei termini diviene infinito, lasciando cos`
x
x2
x3
xn
che ognuno si riduca a 1/k!. Questo d`a lespressione
ex = 1 + +
+
+ +
+ .
1!
2!
3!
n!
cercata per e.
Poiche (n + 1)! = n!(n + 1), il calcolo di e si esegue
facilmente anche a mano; ad esempio, usando sei cifre

Prova: Si parte dal risultato del precedente teorema


che ci d`a per ex il valore di (1+x/n)n , quando n cresce

238

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

u conveniente procedere nel


indefinitamente. Si espande questa espressione con la logaritmo naturale, `e pi`
regola del binomio di Newton e si identificano i fattori modo seguente:
(1 k/n) con 1, facendo nel contempo aumentare

1
1
indefinitamente il loro numero.
ln(2) = ln = ln 1
=
2
2
Poiche x si deve supporre fisso, i termini di questa
somma, da un certo momento in poi, tendono rapi1 1
1
1
damente a diventare trascurabili; pertanto, la formu= + +
+
+ .
2 8 24 64
la del teorema `e un modo effettivo di calcolare ex ,
Purtroppo, al crescere di x, la convergenza diviene
qualunque sia x.
u lenta e nella pratica si usano altri metodi,
Conseguenza immediata di questo metodo per sempre pi`
sviluppati dal Calcolo Numerico, per ottenere ottime
calcolare ex `e il seguente limite notevole:
approssimazioni.
Teorema 8.27 Si ha:
Di nuovo, lespressione per ln(1 + x) ci permette di
trovare un altro limite notevole:
ex 1
= 1.
lim
x0
x
ln(1 + x)
=1
lim
Prova: Dal teorema precedente si ha: ex 1 =
x0
x
2
x/1! + x /2! + e quindi:
per la cui dimostrazione si procede come nel caso
x
x2
ex 1
precedente.
=1+ +
+ .
x
2!
3!
Quando x tende a 0, tutti i termini del secondo membro, eccetto il primo, vanno a 0, e quindi il limite ha
il valore considerato.
Il calcolo dei logaritmi, invece, `e piuttosto pi`
u complicato, almeno dal punto di vista della quantit`a di
conti da effettuare. Lequivalente per il logaritmo
naturale della formula dellesponenziale del Teorema
8.26 `e:
ln(1 + x) =

x3
x4
x5
x x2

+

1
2
3
4
5

che si ottiene con metodi che non abbiamo affrontato ce che non affronteremo: le serie di potenze. Si
tratta di un argomento bellissimo, ma che va al di l`a
dei limiti che ci siamo posti; il lettore curioso potr`a
consultare un qualsiasi testo universitario di Analisi
Matematica. Che la formula sia corretta pu`o essere
verificato calcolando exp(ln(1 + x)) che deve risultare
in 1 + x. La composizione delle due funzioni si effettua sostituendo lespressione per ln(1 + x) alla x nella
formula per ex data nel Teorema [8.22]. Limitando i
calcoli ad x4 , la difficolt`a `e molto ridotta e invitiamo
il lettore a portarli in fondo; vedr`a cos` che tutto funziona alla meraviglia e avr`a fatto un buon esercizio
di calcolo formale.
La formula per il logaritmo naturale vale solo per
1 < x 1; per x = 1 si ottiene la serie armonica che, come abbiamo dimostrato nel Capitolo 4,
diverge; per x = 1 si ha:
ln(2) = 1

1 1 1 1
+ +
2 3 4 5

che converge, anche se molto lentamente. Per calcolare ln(2), cos` come per calcolare altri valori del

8.6

Il calcolo differenziale

Uno dei problemi pi`


u sentiti nella nascente industria
del 1600 era quello di massimizzare i profitti o, in
modo equivalente, di minimizzare i costi, ad esempio
utilizzando nel modo migliore le materie prime. Un
esempio classico `e quello della costruzione delle pentole; una pentola, con relativo coperchio, pu`o essere
assimilata a un cilindro di altezza h e con raggio di
base r. Il suo volume `e V = r2 h, mentre il materiale usato per la sua costruzione `e dato dalla superficie
totale S = 2r2 + 2rh. Si supponga di voler costruire una pentola da 3 litri; il volume V risulta allora
fissato e ci possiamo chiedere qual `e la forma che la
pentola deve avere (cio`e quale deve essere il rapporto
tra il raggio r e laltezza h) affinche sia minima la
quantit`a di materiale usato. Se la pentola `e troppo
schiacciata, occorre molto materiale per il fondo e il
coperchio; viceversa, se la facciamo troppo slanciata, perdiamo materiale per le pareti. Ci deve essere
perci`o una via di mezzo ottimale. Per lazienda produttrice questo `e importante, perche usando le misure pi`
u convenienti potr`a soddisfare i propri clienti,
interessati al volume del recipiente, risparmiando sul
materiale.
Le pentole sono gi`a un esempio significativo, ma di
problemi del genere ne sorgono ad ogni pie sospinto,
e non solo nella produzione dei beni, ma anche nella
loro distribuzione, nella suddivisione e nella condivisione di risorse. Per questo motivo, i matematici del
1600 (come, daltra parte, i loro successori) si dedicarono spesso e volentieri a risolvere problemi di minimo e di massimo, e in questo furono stimolati anche
dai problemi di Astronomia e di Fisica, che a quel

239

8.6. IL CALCOLO DIFFERENZIALE


tempo assillavano scienziati e filosofi. Fu infatti allora che si cominciarono a cercare soluzioni quantitative
dei problemi, e non solo qualitative.
Diversi problemi di minimo e massimo possono essere risolti con metodi abbastanza elementari. Ad
esempio, Fergus McNab `e un pittore dilettante e si
serve di un artigiano per incorniciare i propri quadri.
Purtroppo, si `e accorto che sta spendendo pi`
u di cornici che di colori. Di conseguenza si `e chiesto quale sia
la dimensione da dare alle proprie tele affiche, a parit`a
di superficie dipinta, il costo della cornice sia la pi`
u
contenuta possibile. In termini matematici, se b ed
h sono la base e laltezza di un dipinto, come devono
essere scelte perche, pur mantenendo larea A = bh,
il perimetro 2(b + h) sia minimo, visto che il costo
della cornice `e ad esso proporzionale? Per risolvere
questo problema, si pu`o usare il seguente teorema,
noto come principio del massimo e del minimo:
Teorema 8.28 Se due quantit`
a variabili a, b hanno
somma costante, allora il loro prodotto assume valore
massimo quando a = b. Analogamente, se a, b hanno
prodotto costante, allora la loro somma assume valore
minimo quando a = b.
Prova: Sia 2x = a + b, cos` che si possa scrivere
a = x + e b = x , con 0, nellipotesi che sia
a b. Per il prodotto si ha: ab = (x + )(x ) =
x2 2 , e poiche 2 0 il massimo si ottiene quando
= 0, cio`e a = b = x. Nellaltro caso, se ab = x2 ,
possiamo porre a = x(1 + ) e b = x/(1 + ), cos` che
per quanto sappiamo della progressione geometrica si
ha b = x(1+2 3 + ). Per la somma si ottiene:
a + b = 2x + x(2 3 + ) = 2x +

x2
,
1+

che `e sempre maggiore di 2x se > 0; quindi questa


somma assume il valore minimo quando = 0, cio`e
a = b.
Questo principio mostra immediatamente che Fergus McNab pu`o ottenere il massimo risparmio quando b = h, ovvero quando i suoi dipinti assumono la
forma quadrata, cio`e sono dei veri e propri quadri.
Questo spiega perche ormai da qualche anno i dipinti
di Fergus abbiamo assunto questa forma particolare!
In genere, purtroppo, i problemi di minimo e di
massimo non sono cos` semplici e occorre perci`o un
metodo generale per affrontarli. Molti problemi di
Fisica vengono modellati da una funzione y = f (x),
ed `e facile rendersi conto che i punti di massimo e
di minimo di tale funzione possono essere studiati
andando a vedere dov`e che la funzione cresce e dov`e,
invece, che decresce. Questi punti sono caratterizzati
dal cambio crescita/decrescita: se infatti in un punto
x0 la funzione ha un massimo, per i punti x vicini
ad x0 si deve avere f (x) < f (x0 ), sia che x preceda

sia che segua x0 . In altre parole, la funzione deve


crescere prima di x0 e deve decrescere dopo. I punti
x0 con questa caratteristica si dicono propriamente
punti di massimo relativo della funzione. La specifica
di relativo si riferisce al fatto che possono esistere
pi`
u punti con la propriet`a detta, e alcuni possono
essere pi`
u massimi di altri, cio`e la funzione pu`o
assumere valori pi`
u grandi. Analogamente, un punto
di minimo relativo `e un punto nel quale la funzione
prima decresce e poi cresce.

Figura 8.11: Punti di minimo e massimo


C`e un altro motivo per definire relativi i punti di
questo tipo. Se la funzione y = f (x) `e definita in un
intervallo [a, b], o semplicemente dobbiamo solo trattarla in questo intervallo, pu`o succedere che il valore
pi`
u alto (e/o quello pi`
u basso) si abbiamo proprio allinizio o alla fine dellintervallo, quando la funzione
cresce (o decresce), ma non sappiamo cosa fa prima
o dopo. Si pensi alla funzione che descrive la velocit`a
dellEurostar 9543 da Firenze a Roma; si potranno
avere diverse punte di velocit`a massima e ognuna rappresenta un massimo relativo: la pi`
u alta di tutte sar`a
il massimo assoluto. Per quanto riguarda i punti di
minimo, se il treno non si ferma mai, questi saranno la partenza e larrivo, quando la velocit`a `e nulla;
a questi minimi assoluti si contrappone una serie di
minimi relativi, dovuti ai rallentamenti del treno nel
passaggio attraverso una qualche stazione importante
o tratti impegnativi della ferrovia.
I matematici del 1600, specie Newton e Leibniz,
studiarono attentamente il concetto di cambiamento di una funzione, per arrivare a definire cosa si intende per cambiamento istantaneo. Ci ricordiamo
che Zenone, nel paradosso della freccia, aveva obiettato proprio sullesistenza del cambiamento istantaneo: se consideriamo una freccia in movimento, ma
riduciamo a un istante la nostra osservazione, la freccia stessa `e in quel momento ferma e quindi non
vi `e in realt`a alcun movimento o cambiamento. Naturalmente, lidea di Zenone `e sbagliata e Newton e
Leibniz, in modo diverso luno dallaltro, fecero vedere che si pu`o definire rigorosamente (e sensatamente)

240

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

il cambiamento istante per istante. Soprattutto Newton aveva in mente un esempio comune: la velocit`a
vista come cambiamento della posizione di un oggetto
(di un corpo, come dicono i fisici). E chiaro che possiamo considerare la velocit`a media in un certo intervallo, ma il cambiamento avviene istante per istante
e quindi deve essere possibile (checche ne pensi Zenone) definire una velocit`a istantanea, quella che oggi
`e segnalata dal tachimetro di una macchina. Ragionarono allora cos`: sia x0 il punto nel quale vogliamo
definire il cambiamento istantaneo della funzione
y = f (x). Consideriamo un punto x1 = x0 + h distinto da x0 (quindi, h pu`o essere positivo o negativo,
ma non nullo). Il cambiamento della funzione da x0
ad x1 = x0 + h `e dato da f (x0 + h) f (x0 ), che
per`o va considerato relativamente allo spostamento
del punto da x0 ad x1 , cio`e a x1 x0 = h. Per tener
conto di questo, definiamo il rapporto incrementale di
y = f (x) in x0 come:

y = f (x) nel punto x0 e, per le considerazioni fatte in


precedenza, il rapporto incrementale si approssima a
diventare la misura del cambiamento istantaneo della
curva, sempre nel punto x0 . Possiamo allora dare la
seguente:

f (x0 )
f (x1 ) f (x0 )
f (x0 + h) f (x0 )
=
=
.
x0
x1 x0
h

Definizione 8.5 Data la curva y = f (x) e un punto


x0 in cui la curva `e definita, cio`e esiste y0 = f (x0 ), si
dice derivata di f (x) nel punto x0 il limite (se esiste)
del rapporto incrementale:
f (x0 + h) f (x0 )
.
h0
h
lim

Tale derivata rappresenta il cambiamento istantaneo


(allistante, o punto, x0 ) della curva, ovvero la pendenza della retta tangente alla curva nel punto x0 .
Si dice derivata della funzione y = f (x) la funzione
y = f (x), definita in tutti i punti x0 nei quali esiste
la derivata di f (x0 ) ed `e uguale, in questi punti, alla
derivata stessa. Per abuso di notazione, talvolta la
funzione derivata si indica con la scrittura y . Una
funzione f (x) `e derivabile nel punto x0 , se esiste la
derivata di f (x) in x0 ; f (x) `e derivabile nellintervallo aperto (a, b) se `e derivabile in ogni punto interno
a tale intervallo.

Il rapporto incrementale `e il cambiamento medio avvenuto nellintervallo [x0 , x1 ] di lunghezza h. Osserviamo, cosa molto importante, che, come sappiamo
dalla Geometria Analitica, questo rapporto incremenE opportuno fare almeno un esempio. Si consideri
tale altro non `e che la pendenza della retta passante la parabola y = x2 3x+2 e il punto x = 3 nel quale
0
per i due punti (x0 , f (x0 )) e (x1 , f (x1 )), cio`e della la parabola assume il valore 2. In quanto al rapporto
retta secante la curva y = f (x) in questi due punti.
incrementale abbiamo:
f (3 + h) f (3)
(3 + h)2 3(3 + h) + 2 2
=
=
h
h
x0

f (x0 )

x0 x0 + h

Figura 8.12: Secante/tangente alla curva


Lequazione della retta `e data dalla formula 7.1:
f (x1 ) f (x0 )
f (x) f (x0 )
=
x1 x0
x x0

h2 + 3h
= h + 3.
h
Quando h 0, questa quantit`a tende a 3, e quindi
la derivata della nostra parabola nel punto x0 = 3 `e
proprio 3. La retta tangente alla parabola in questo
punto `e y 2 = 3(x 3) ovvero y = 3x 7, e questo
pu`o essere controllato col metodo del calcolo della
tangente a una parabola, visto nella Sezione 7.3. Se
poi, invece di limitarci al punto x0 = 3, consideriamo
la situazione globale, cio`e relativa al punto generico
x, il rapporto incrementale diventa:
=

(x + h)2 3(x + h) + 2 x2 + 3x 2
=
h

h2 + 2xh 3h
= 2x 3 + h.
h
f (x0 )
f (x) f (x0 ) =
(x x0 ).
Quando h 0, otteniamo la derivata della funzione
x0
y = x2 3x + 2, e il risultato `e: f (x) = 2x 3.
Secondo limpostazione di Leibniz, il limite della
Quando facciamo avvicinare x1 ad x0 , cio`e, in termini pi`
u matematici, facciamo tendere x1 ad x0 (il che differenza f (x0 + h) f (x0 ), al tendere di h a 0, si
equivale a dire: facciamo tendere h a 0) questa se- dice il differenziale della funzione f (x) nel punto x0
cante si approssima a diventare la tangente alla curva e si indica con df (x); analogamente, il limite della
ovvero:

8.6. IL CALCOLO DIFFERENZIALE

241

differenza x1 x0 , quando x1 x0 (in pratica, h) di importante accade, ma `e bene stare attenti e stusi dice il differenziale di x e si indica con dx. Si ha diare la situazione intorno al punto per stabilire qual
pertanto:
`e la vera natura dellevento che si sta verificando.
Data una funzione f (x), il calcolo della funzione
df
(x
)
df
(x)
0
derivata
f (x) non `e pi`
u difficile del calcolo della def (x0 ) =
e in generale f (x) =
.
dx
dx
rivata di f (x) in un punto specifico x0 . Per questo,
di regola, si preferisce senzaltro calcolare la funzioSi ricordi che, per la convenzione adottata per i line derivata e poi, se del caso, cercarne il valore in
miti, x1 x0 = h non assume mai il valore 0, che
un punto preciso. Nellesempio precedente della parenderebbe privo di senso il rapporto incrementale, e
rabola, calcolando f (x) = 2x 3 nel punto x = 3
quindi il rapporto dei differenziali, facendoci ricadere
si ritrova naturalmente il valore f (3) = 3. Occorre
nel paradosso di Zenone.
tuttavia osservare che, mentre la derivata di f (x) in
Ritornando al nostro problema di partenza sui un punto x esiste o non esiste, per la funzione de0
massimi e sui minimi, si vede ora il ruolo che pu`o rivata f (x) si possono avere varie situazioni. Anche

svolgere la funzione derivata f (x):


limitandoci a un intervallo (a, b), che potrebbe essere
tutta la retta reale, f (x) pu`o esistere in ogni punTeorema 8.29 Se la funzione f (x) `e derivabile in
to dellintervallo, pu`o non esistere in nessuno di tali
(a, b) allora essa `e crescente in ogni punto x0 in cui
punti, pu`o esistere in alcuni e non in altri. Per semf (x0 ) > 0, `e decrescente in ogni punto x0 in cui
plicit`a, visto che questo non `e un trattato di Analisi
f (x0 ) < 0. I punti di massimo e di minimo relativo
Matematica, supporremo che f (x) esista in tutti i
corrispondono a punti x0 in cui f (x0 ) = 0.
punti considerati, avvertendo esplicitamente tutte le

Prova: Immediato dalla definizione della derivata volte che f (x) non esiste o non si considera.
Unosservazione importante `e relativa al fatto che
f (x):
se una funzione f (x) `e derivabile in un punto x0 , alloNellesempio precedente, f (x) = 2x 3 si annulla ra essa `e sicuramente continua in tale punto. Infatti,
per x = 3/2 ed `e del tutto ovvio che per x < 3/2 dovendo essere:
`e f (x) < 0, mentre per x > 3/2 si ha f (x) > 0,
f (x0 + h) f (x0 )
di modo che il punto considerato `e un minimo re= f (x0 ),
lim
h0
h
lativo. Questo, naturalmente, `e ovvio, perch`e conosciamo bene la parabola, e avremmo potuto studiare occorre che sia limh0 (f (x0 +h)f (x0 )) = 0 e questo
queste cose con i metodi della Geometria Analitica implica limh0 f (x0 + h) = f (x0 ), che `e la condizione
(come abbiamo fatto a suo tempo), ma `e importante di continuit`a. Il viceversa non `e vero in generale: si
notare come il ragionamento legato alla derivata sia consideri la funzione continua f (x) = |x| nel punto
semplice ed efficace e, soprattutto, sia estendibile a x0 = 0; si ha:
ogni tipo di curva.
lim |x| = 1 e lim |x| = +1,
x0
x0
Ci`o che abbiamo appena detto sui punti nei quali la
derivata si annulla `e corretto, ma pu`o trarre in ingane quindi la funzione non ha derivata in questo punto.
no. Il fatto che i punti di massimo e minimo relativo
Il metodo del rapporto incrementale `e il metodo
corrispondano a valori di x per i quali f (x) = 0
generale per affrontare il problema della derivazionon significa che, viceversa, se per x = x0 si ha
ne, ma `e anche il pi`
u laborioso e, se si vuole, il pi`
u
f (x0 ) = 0, allora x0 sia necessariamente un punto
capzioso. Quando `e possibile, si preferisce applicare
di massimo o di minimo. Se prendiamo la funzione
una serie di risultati generali, che aiutano molto, agey = x3 , come presto vedremo la funzione derivata
volando i calcoli. Ecco pertanto una prima serie di
vale f (x) = 3x2 , e il lettore pu`o gi`a dimostrare da
risultati:
se questo fatto, usando la tecnica del rapporto incrementale. Qui ci basta notare che la funzione derivata Teorema 8.30 Siano f (x), g(x) due funzioni derisi annulla per x = 0, ma essendo 3x2 0 per ogni vabili in un intervallo (a, b); allora:
valore di x, la funzione `e sempre crescente, prima e
(f (x) + g(x)) = f (x) + g (x)
dopo x = 0. Perci`o, f (x) = 0 indica in questo caso
(f (x)g(x))
= f (x)g(x) + f (x)g (x)
un punto di stasi della funzione, un punto cio`e in cui

(1/f (x))
= f (x)/f (x)2
la funzione cessa per un attimo di crescere (o decre

2
(f (x)/g(x))
= (f (x)g(x)
f (x)g
(x))/g(x)
scere), ma non cambia il senso della crescita stessa.

(f (g(x)))
= f (y) y = g(x) g (x)
Punti di questo tipo si dicono flessi della funzione, e
sono caratterizzati dal fatto che la funzione cresce (o Questultima formula si dice regola della catena e sidecresce) sia prima che dopo il punto incriminato. In gnifica: per trovare la derivata di una funzione comconclusione: attenzione! quando f (x) = 0 qualcosa posta, si fa la derivata della prima funzione usando

242

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

una variabile di comodo y; nel risultato si sostitui- Teorema 8.31 Si hanno le seguenti funzioni derivasce y con la funzione interna g(x); la funzione cos` te:
ottenuta si moltiplica per la derivata della funzione
1. (c)
= 0
(c costante)
g(x).
2. (cf (x)) = cf (x)
Prova: Per la somma si ha:
3. (xn )
= nxn1

4. (ln(x)) = 1/x
(f (x) + g(x)) =
5. (ex )
= ex

f (x + h) + g(x + h) f (x) g(x)


6. (sin x)
= cos x
=
= lim
7. (cos x) = sin x
h0
h
8. (tan x) = 1/ cos2 x
f (x + h) f (x)
g(x + h) g(x)
= lim
+ lim
=
h0
h0
h
h
Prova:

= f (x) + g (x).
Il prodotto merita un po dattenzione in pi`
u:
f (x + h)g(x + h) f (x)g(x)
;
h0
h

(f (x)g(x)) = lim

ora aggiungiamo e togliamo al numeratore la quantit`a


f (x + h)g(x):
g(x + h) g(x)
+
h0
h

f (x + h) f (x)
g(x) =
+ lim
h0
h
= lim f (x + h)

= f (x)g (x) + f (x)g(x).

Per linverso si ha:

1
1
1
1

= lim
=
h0 h
f (x)
f (x + h) f (x)
f (x)
f (x) f (x + h)
=
.
h0 hf (x)f (x + h)
f (x)2
Per la divisione, si scrive:
= lim

f (x)
1
= f (x)
g(x)
g(x)
e si applicano le due regole precedenti. Infine, la
regola della catena `e delicata quanto importante:
(f (g(x))) = lim

h0

= lim

h0

f (g(x + h)) f (g(x))


=
h

f (g(x + h) f (g(x)) g(x + h) g(x)


.
g(x + h) g(x)
h

Occorre ora osservare che g(x), essendo derivabile, `e


anche continua e quindi, posto y = g(x), si ha g(x +
h) = y + h e quando h tende a 0 anche h tende a 0.
Quindi lespressione precedente si pu`o scrivere:
g(x + h) g(x)
f (y + h ) f (y)
lim
,
h0
h 0
h
h

= lim

ma questa `e proprio lespressione desiderata.


Lutilit`a di queste regole si rivela pienamente al
momento in cui si passano a considerare le derivate
delle principali funzioni:

1. Se c `e una costante, il suo rapporto incrementale


`e sempre 0.
2. Applicando la regola del prodotto del precedente
teorema e la 1) si ha immediatamente il valore
della derivata.
3. Il rapporto incrementale di xn vale:
(x + h)n xn
=
h

n n n n1
h + + nn hn xn
x + 1 x
= 0
=
h

n n2
n1
= nx
+
x
h + .
2
Tutti i termini, eccetto il primo hanno un fattore
h, cos` che facendo il limite per h 0 solo il
primo termine rimane.
4. Il rapporto incrementale del logaritmo naturale
`e:
ln(x + h) ln(x)
=
h

1/h
M
h
1
= ln 1 +
= ln 1 +
;
x
Mx
dove abbiamo sostituito M ad 1/h. Chiaramente, quando h 0 si ha M e, passando al limite, come argomento del logaritmo
riconosciamo e1/x . Pertanto si ha:

M
1
1
lim ln 1 +
= ln(e1/x ) = .
h0
Mx
x
5. Il rapporto incrementale vale:
eh 1
ex+h eh
= ex
ex
h
h
secondo il limite notevole del Teorema 8.27.

243

8.6. IL CALCOLO DIFFERENZIALE

6. Per il seno si usano i due limiti notevoli trovati Prova: Ecco le varie computazioni:
a suo tempo:
1. La regola della catena ci dice:
sin(x + h) sin(x)

=
ef (x) = [ey y = f (x)]f (x) = f (x)ef (x) .
h
sin x cos h + cos x sin h sin x
=
h
cos h 1
sin h
= sin x
+ cos x
;
h
h
passando al limite per h 0, la prima frazione
tende a 0 e la seconda ad 1, per cui segue il
risultato desiderato.
=

7. Per il coseno vale una dimostrazione analoga.


8. Per la tangente, si scrive tan x = sin x/ cos x
e si applica la regola della divisione vista nel
precedente Teorema 8.30.

Le prime tre regole di questo teorema ci


permettono di calcolare la derivata di qualsiasi
polinomio:

a0 xn + a1 xn1 + + an2 x2 + an1 x + an

2. Per il logaritmo si segue la stessa strada.


3. Partiamo da ln f (x) e deriviamo:
(ln f (x) ) = ( ln f (x)) =

f (x)
.
f (x)

Daltra parte, ancora per la regola precedente:


(ln f (x) ) =

(f (x) )
.
f (x)

Uguagliando i due risultati e ricavando (f (x) )


si ha la formula desiderata.
4. In modo analogo, (ln bf (x) ) = (f (x) ln b) =
(ln b)f (x) e per la regola 2):
(ln bf (x) ) =

(bf (x) )
;
bf (x)

uguagliando i due risultati si ricava la formula


per (bf (x) ) .

= na0 xn1 + (n 1)a1 xn2 + + 2an2 x + an1 .

5. Si consideri lidentit`a:
Con questa formula si verifica immediatamente che la
blogb (f (x)) = f (x)
derivata della funzione y = x2 3x+1 `e effettivamente
y = 2x 3, come si era calcolato in modo diretto in
e si derivino i due membri. Per la formula 4. si
precedenza. Daltra parte, non ci saremmo aspettati
ha:
un risultato diverso.
(ln b)(logb (f (x))) f (x) = f (x)
La dimostrazione del punto 5) pu`o essere portae da questo si ricava la formula desiderata,
ta avanti usando la regola della catena. Si considericordando che 1/ ln b = logb e.
ri lidentit`a ln(ex ) = x e si derivino i due membri
applicando a sinistra la regola:

1
x
Unapplicazione molto importante della regola
y = e (ex ) = 1;
y
della catena si ha nel seguente:
Sostituendo ad y il valore ex si ricava:
1 x
(e ) = 1
ex
e questo equivale a (ex ) = ex . E bene perci`o avere
padronanza con la regola della catena, come mostra
ancor pi`
u chiaramente il seguente teorema.
Teorema 8.32 Valgono le seguenti regole:
1.
2.
3.
4.
5.

ef (x)
(ln(f (x))
(f (x) )
(bf (x) )
(logb (f (x)))

= f (x)ef (x)
= f (x)/f (x)
= f (x)f (x)1 R
= (ln b)f (x)bf (x) b R+
= (logb e)f (x)/f (x)

Teorema 8.33 Vale la formula:


(arctan x) =

1
(1 + x2 )

Prova:
La funzione y = arctan x `e linversa composizionale della tangente, e pertanto si ha
lidentit`a:
arctan(tan x) = tan(arctan x) = x.
Applicando la regola della catena si ottiene:
(arctan(tan x)) = [(arctan y) | y = tan x](tan x) = 1.
Sappiamo che (tan x) = 1/ cos2 x e ci serve ricavare
(arctan y) . Per questo cerchiamo di esprimere x in

244

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

funzione di y, cio`e operiamo dallinterno della formula


verso lesterno. Abbiamo:

1 cos2 x
sin x
=
y = tan x =
cos x
cos x
e tutta la nostra espressione dipende da cos x. Elevando al quadrato la precedente eguaglianza, si
ottiene:
y2 =

1 cos x
cos2 x

ovvero

cos2 x =

Abbiamo di fatto snobbato larcotangente come


funzione trigonometrica; qui essa prende la sua rivincita. Il fatto che, come il logaritmo, la derivata
sia pi`
u semplice della funzione avr`a un ruolo importante nellintegrazione. La stessa cosa capita ad
arcoseno ed arcocoseno, per le quali funzioni il lettore
dimostrer`a le seguenti formule, sempre sfruttando il
metodo della catena:
arccos (x) =

1
.
1 x2

Come dimostrano questi risultati, la regola della


catena `e una specie di panacea per la soluzione di molti problemi di derivazione. Ne abbiamo visto un uso
piuttosto sofisticato, basato sul fatto che conosciamo
il risultato della composizione di certe funzioni. In
particolare, quando due funzioni sono una linversa
composizionale dellaltra, cio`e f (g(x)) = x, derivando si ottiene unespressione che contiene sia la derivata di f (x) sia quella di g(x); se ponendo y = g(x) si
riesce a ricavare x in funzione di y, sostituendo questo nella g (x) si ha unespressione che dipende solo
da y e vale 1: si pu`o ricavare allora f (y), se `e questo
che si cercava.
La regola della catena si pu`o anche applicare
per trovare la derivata di funzioni complicate; ad
esempio:

p
(1 sin(x2 ))
1 sin(x2 ) = p
=
2 1 sin(x2 )

8.7

sin x
x
0

/2

3/2

cos x

1
.
1 + y2

Riportando questo valore nellespressione della derivata, si ha la relazione (arctan y) (1 + y 2 ) = 1 che


equivale a quella desiderata.

1
arcsin (x) =
1 x2

x cos(x2 )
cos(x2 )(x2 )
= p
.
= p
2 1 sin(x2 )
1 sin(x2 )

Lo studio delle funzioni

Limpostazione, che abbiamo cercato di dare alla Trigonometria e al Calcolo esposti fin qui, `e stata essenzialmente numerica: sappiamo che sin(30 ) = 0.5 e
che e2 7.389056; sappiamo risolvere un triangolo e

Figura 8.13: Le funzioni sin x e cos x


calcolare la retta tangente alla parabole y = x2 x+2
nel punto (3, 8). Questo `e interessante perche ci permette di risolvere quantitativamente un bel po di
problemi, non solo di Matematica, ma anche di Fisica, di Economia e di Statistica. Tuttavia, spingere
troppo avanti la ricerca quantitativa di soluzioni ai
problemi pu`o voler dire perderne la visione generale,
col rischio evangelico di vedere il fuscello numerico
nellocchio locale di un problema e non scorgere la
trave che ci impedisce di vedere il senso globale del
problema stesso. Ad esempio, abbiamo dimostrato
che le funzioni trigonometriche seno e coseno sono
periodiche di periodo 2, nel senso che il loro valore si ripete se incrementiamo largomento di 2. Ma
siamo sicuri di aver capito cosa vuol dire un risultato
del genere?
E senzaltro utile in questo, come in molti altri casi, cercare di avere una visione complessiva del comportamento di una funzione, una visione che lasci da
parte i dettagli, ma ci dica come `e fatta la funzione
nelle sue linee essenziali. Un metodo, che si rivela sempre molto buono, `e quello di rappresentare la
funzione mediante un grafico, cio`e una figura che ci
permetta di vedere landamento della funzione senza
evidenziare troppo i singoli valori che essa assume.
Certo, se sappiamo calcolare la funzione, possiamo
cercare di costruirci per punti un grafico abbastanza accurato, che ci fornisca sia una visione generale
della funzione, sia una rappresentazione abbastanza
accurata dei suoi valori. Ad esempio, usando la Tabella 8.1 possiamo disegnare noi stessi (o far disegnare allelaboratore) i grafici delle funzioni sin x e
cos x (vedere Figura 8.13), e osservare che la periodicit`a corrisponde al replicarsi infinite volte della forma
della funzione, che cos` risulta descritta da un unico
tratto, nel nostro esempio [0, 2].
Con la stessa tecnica, abbiamo ottenuto il grafico
di y = x2 + x 1 (vedere Figura 5.4) e possiamo
ottenere quelli di y = ex e y = ln x: essi sono simmetrici rispetto alla retta y = x, come accade sempre

245

8.7. LO STUDIO DELLE FUNZIONI


y
ex

ln x

1
0

Figura 8.14: Le funzioni ex e ln x


quando due funzioni sono una linversa composizionale dellaltra (vedere Figura 8.14). Fatto a mano,
questo lavoro di disegno `e davvero improbo e, usando
lelaboratore, si possono perdere aspetti importanti,
legati al fatto che anche lelaboratore ha i suoi limiti, e quando la funzione diverge oppure ha un campo
di definizione infinito, occorre operare oculatamente
per ottenere molte caratteristiche che ci interessano.
Ecco allora che lAnalisi Matematica ci viene in aiuto, fornendo alcuni teoremi (che vedremo tra poco)
e diverse tecniche (essenzialmente limiti e derivate)
che permettono di capire come una funzione si comporta, senza la necessit`a di calcoli accurati e troppo
numerosi.
Parlando di derivate, abbiamo gi`a osservato che se
una funzione y = f (x) ha in un punto x0 derivata
positiva, allora in tale punto `e crescente, mentre `e
decrescente se la derivata `e negativa. Il segno della
derivata, pertanto, ha una notevole importanza nello studio qualitativo delle funzioni, ma naturalmente
esistono altri aspetti importanti, e perci`o `e opportuno
affrontare largomento in modo sistematico. Vediamo
allora ordinatamente quali punti vanno considerati e
approfonditi.
1. Il dominio di definizione della funzione:
Preliminare a tutte le altre considerazioni, `e la ricerca dellinsieme dei punti nei quali la funzione `e
definita, cio`e del suo dominio. E chiaro che se la
funzione y = f (x) non `e definita in un certo intervallo (a, b), `e inutile studiarla in tale insieme; se per`o
`e definita fuori di tale intervallo, cio`e per x < a e
per x > b, `e interessante sapere come si comporta
quando x a e quando x b, calcolando i rispettivi limiti; questi ci fanno capire cosa succede vicino
agli estremi di definizione. Ad esempio, y = ln x `e
definita solo nellintervallo (0, +) e quindi `e inutile studiare la funzione per x 0. Tuttavia, sapere

che limx0 ln x = ci dice che, a partire da 0, la


funzione viene su da , una caratteristica molto importante del logaritmo (vedere
la Figura 8.14).
x non `e definita
Analogamente, la funzione
y
=

per x < 0, ma limx0 x = 0, e questo ci fa rendere


conto dellandamento completamente diverso di
x nei confronti di ln
x. Ancora differente `e la situazione per y = 1/ x, anche
lei non definita per
x 0, ma dove si ha limx0 1/ x = +. Un altro caso interessante `e dato dalla funzione y = xx ;
scrivendo xx = ex ln x , possiamo ricordare dalla precedente sezione che limx0 x ln x = 0 e ci`o implica
limx0 xx = e0 = 1, un risultato sorprendente che
ci consiglia di definire 00 = 1, una posizione controintuitiva, che per`o `e in accordo col limite appena
calcolato. Pu`o allora essere interessante studiare la
funzione y = xx , cosa che infatti faremo sviluppando
i punti successivi.
Un caso un po diverso `e fornito dai punti isolati
x0 in cui la funzione non `e definita, come x0 = 0 per
y = 1/x. Qui ha senso studiare i limiti per x x0
della funzione, sia per valori crescenti che decrescenti
di x: infatti, tali limiti possono essere diversi, ma
sono comunque fortemente indicativi dellandamento
della funzione. Nellesempio, si ha limx0 1/x = +
mentre limx0 1/x = , e infatti il grafico della
funzione `e quello ben noto delliperbole. Diverso `e il
caso della funzione y = 1/x2 , che ancora risulta non
definita per x0 = 0; questa volta, per`o, i due limiti,
per x 0 da destra e da sinistra, sono entrambi +
e la forma della funzione `e assai diversa.
Tutti questi casi ci fanno capire quanto sia importante saper calcolare i limiti, che rappresentano la
parte pi`
u delicata dello studio delle funzioni. Oltre
alle tecniche viste nella Sezione 8.4, esiste un metodo
molto amato dagli studenti, perche di facile applicazione: chiama infatti in ballo il calcolo delle derivate,
ben pi`
u meccanico del calcolo dei limiti eseguito secondo la definizione. Ci riferiamo al celebre Teorema
di de LHopital, che vedremo fra poco, quando avremo introdotto gli strumenti necessari per la sua dimostrazione, e che, purtroppo, data la sua popolarit`a, `e
talvolta applicato a sproposito.
Di solito, legato alla ricerca del dominio di definizione di una funzione, `e il problema di stabilire la
continuit`a della funzione stessa. La maggior parte
delle funzioni espresse mediante formule coinvolgenti
le funzioni elementari (o, come si dice, in forma analitica) sono continue negli intervalli in cui risultano
definite. Possono per`o presentare punti di discontinuit`a, che spesso risultano essere fittizi o, al pi`
u, di
prima specie, per cui la funzione presenta un salto.
Le discontinuit`a di seconda e terza specie corrispondono di solito a punti in cui la funzione non `e nemmeno definita. Si consideri y = e1/(x1) nel punto

246

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

x0 = 1, e ci`o ci dice che `e sempre bene non aggrapparsi a facili generalizzazioni, se non sono convalidate
da dimostrazioni formali.
Dove sappiamo che una funzione `e continua, possiamo utilmente applicare i teoremi visti a suo tempo
per tali funzioni (Teorema della permanenza del segno, degli zeri di una funzione continua, etc.). Spesso, dove `e continua una funzione `e anche derivabile,
anche se questa affermazione non `e vera in generale:
ad esempio, y = |x| `e ovunque continua, ma non `e
derivabile in x = 0, come il lettore avr`a modo di verificare. La derivabilit`a `e una propriet`a forte e alcuni
teoremi possono essere di aiuto nello studio delle funzioni. Cominciamo con un risultato che sembra ovvio,
ma che si riveler`a molto fruttifero:

Prova: Questa volta basta applicare il Teorema di


Rolle alla funzione:

Teorema 8.34 (di Rolle) Sia f (x) una funzione


continua nellintervallo [a, b] e derivabile in (a, b);
se f (a) = f (b), esiste un punto (a, b) tale che
f () = 0.
Prova: Come osservato nella Sezione 8.6, la funzione
ha in [a, b] un punto di massimo e uno di minimo; se
coincidono con i due estremi, il massimo `e uguale
al minimo e quindi la funzione risulta costante; in
tal caso la funzione ha derivata nulla in ogni punto
dellintervallo. Altrimenti, la funzione ha un massimo
o un minimo relativo in un punto (a, b), ma in
tale punto `e f () = 0, come stabilito dal Teorema
8.29.
Una conseguenza immediata del Teorema di Rolle
`e:

h(x) = f (x)(g(b) g(a)) g(x)(f (b) f (a)).


E veniamo infine allannunciato Teorema di de
LHopital, che ora dimostreremo relativamente alla
forma indeterminata 0/0; esso pu`o essere dimostrato anche per la forma /, ma lasciamo la prova
formale al lettore volenteroso.
Teorema 8.37 (di de LH
opital) Siano f (x) e
g(x) due funzioni continue e derivabili nellintervallo
[a, b], eccetto al pi`
u in un punto x0 nel quale entrambe
si annullano. Se g(x) e g (x) sono diverse da 0 nellintervallo (escluso ovviamente x0 ) ed esiste, finito
o infinito, il limite del rapporto delle due derivate,
allora:
f (x)
f (x)
= lim
.
lim
xx0 g (x)
xx0 g(x)
Prova:
Si consideri una qualunque successione
{x}nN che tenda ad x0 . Poiche per ipotesi f (x0 ) =
g(x0 ) = 0, si ha:
f (xn )
f (xn ) f (x0
f (n
=
=
g(xn )
g(xn ) g(x0 )
g (n )
dove n `e compreso fra xn e x0 per il precedente Teorema di Cauchy. Si ha pertanto n x0 e quindi
si `e dimostrato lasserto del teorema dato che, per
ipotesi, lultimo limite esiste (finito o infinito).

Poiche la derivata `e di solito pi`


u semplice della funTeorema 8.35 (di Lagrange o del valor medio)
zione
di
partenza,
il
Teorema
di
de LHopital tende
Sia f (x) una funzione continua nellintervallo [a, b] e
a
rendere
pi`
u
facile
il
calcolo
del
limite. Un facile
derivabile in (a, b). Esiste sempre un punto (a, b)

esempio
`
e
il
seguente:
tale che f (b) f (a) = f ()(b a).
ex
ex 1
Prova: Si consideri la funzione h(x) = f (x) (x
= lim
= e0 = 1
lim
x0 1
x0
x
a)(f (b)f (a))/(ba). Il Teorema di Rolle ci assicura
che esiste un punto (a, b) per cui h () = 0. Ma: come sappiamo dal Teorema 8.27. Questa sembra

una dimostrazione diretta e assai carina. Purtroppo, il suo punto debole `e di sfruttare il Teorema 8.31,
punto 5. (ex ) = ex , il quale, ohim`e, `e stato dimostracio`e, per x = , proprio la relazione desiderata.
to proprio utilizzando questo limite notevole. Siamo
Il nome del teorema deriva dal fatto che (f (b) entrati in un circolo vizioso e la dimostrazione non `e
f (a))/(b a) `e una specie di media dei valori del- valida. Queste chicche fanno la delizia dei matematila funzione, e tale valore `e assunto dalla derivata in ci, e uno studente `e bollato a fuoco se cade in tranelli
un qualche punto.
del genere. Unapplicazione lecita `e invece:
Unaltra importante conseguenza del Teorema di
1 1
1
1 cos x
x sin x
Rolle `e:
= lim
= =
lim
x0
x0
x3
3x2
3 2
6
Teorema 8.36 (di Cauchy) Siano f (x) e g(x) due
funzioni continue nellintervallo [a, b] e derivabili in dove abbiamo sfruttato il limite notevole dimostrato
(a, b) con g (x) 6= 0. Esiste un punto (a, b) tale nella Sezione 8.4. Importante `e il calcolo del seguente
limite del tipo /:
che:

f ()
f (b) f (a)
ex
ex
ex
= .
= lim
=
lim n = lim
g(b) g(a)
g ()
n1
x nx
x n(n 1)xn2
x x
h (x) = f (x)

f (b) f (a)
ba

8.7. LO STUDIO DELLE FUNZIONI


ex
=
x n!
che ci dice come la funzione esponenziale cresca,
quando x , pi`
u rapidamente di qualsiasi polinomio, una propriet`a notevole e molto importante.
Analogamente, sempre del tipo /:

247

orizzontale, come nel caso dellesponenziale, ma pu`o


essere anche verticale, come la retta x = 0 per il
logaritmo, o addirittura obliquo, caso che tratteremo
nella prossima Nota.
Gli asintoti orizzontali danno una forte caratterizzazione del comportamento allinfinito della funzione,
poiche fanno vedere come questa si adagi sulla ret1/x
ln x
ta, senza mai toccarla. Il termine adagiarsi va qui
=
lim = lim
x (1/n)x(1/n)1
x n x
preso con attenzione; la funzione si pu`o avvicinare
alla curva rimanendole al di sopra, oppure restandon
ne al di sotto, e queste due situazioni vanno studiate
= lim 1/n = 0
x x
se si vuole avere un grafico corretto della funzione.
che dimostra come, al contrario, il logaritmo cresca In qualche caso, come per y = sin(x)/x , la funzione
meno di qualsiasi radice!
addirittura oscilla intorno al suo asintoto.
Una volta determinato il dominio della funzione,
Si consideri la funzione y = (2x + 1)/(x 2) per la
e quindi dove `e continua e come si comporta al quale si ha:
finito, `e opportuno vedere come si comporta man
2 + 1/x
2x + 1
mano che la variabile indipendente cresce o decresce
= lim
= 2.
lim
x 1 2/x
x x 2
indefinitamente.
2. Comportamento della funzione allinfini- Questo significa che la funziona ha come asintoto orizto: Quasi tutte le funzioni di interesse hanno domini zontale la retta y = 2. Possiamo essere pi`
u precisi e
non limitati, che cio`e comprendono valori positivi del- osservare che, quando x +, il rapporto tra 2x+1
la x sempre pi`
u grandi e/o valori negativi sempre pi`
u e x 2 `e sempre un po pi`
u grande di 2, e quindi la
piccoli. Queste sono situazioni che non si possono stu- funzione rimane al di sopra dellasintoto. Quando
diare bene con limpostazione ingenua di calcolare e x , il rapporto `e invece minore di 2 (se non
disegnare la funzione per punti: non `e possibile infat- lo si vede subito, si provi ponendo x = 1000), e
ti essere sicuri che, un po pi`
u in l`a di dove arriviamo perci`o la funzione rimane sempre un po al di sotto
con i nostri conti, il comportamento della funzione dellasintoto. Osserviamo anche che la retta x = 2
cambi rispetto a quello che siamo riusciti a determi- costituisce un asintoto verticale; infatti, per tale vanare. E qui che si rivela la potenza del concetto di li- lore, la funzione non `e definita (il denominatore vale
mite e dellanalisi infinitesimale nel suo complesso: si 0) e si ha una discontinuit`a di seconda specie. Poiche
ottengono infatti informazioni precise proprio in quel- il numeratore risulta positivo quando x `e vicino a 2,
le zone che non possiamo rappresentare graficamente diciamo 2 < x < 2 + , si ha:
e che, perci`o, tendono a sfuggirci.
2x + 1
2x + 1
Per la funzione y = x2 , si ha limx+ x2 =
lim
=
lim
= +.
2
x2
x2+
x

2
x2
limx x = +, e ci`o rende conto, in modo qualitativo, ma molto appropriato, del fatto che una pa- Queste informazioni ci permettono di disegnare il grarabola come y = x2 cresce man mano che ci allonta- fico della funzione, almeno in una prima approssimaniamo dal suo vertice. Propriamente parlando, e su zione. Come si `e visto: i) verso la funzione rimaquesto torneremo pi`
u avanti in modo sistematico, la ne al di sotto dellasintoto y = 2; ii) avvicinandosi da
parabola y = x2 decresce quando da si passi a sinistra a x = 2 la funzione va a ; iii) ripartendo
valori (negativi) sempre pi`
u grandi, e cresce quando da x = 2 la funzione scende da +; iv) proseguendo
ci si incammini su valori positivi via via maggiori.
verso + la funzione si avvicina allasintoto y = 2,
Completamente diverso `e il comportamento di y = ma ne rimane al di sopra. Per il momento non posx3 , poiche si ha: limx x3 = e limx+ x3 = siamo dire molto di pi`
u, ma abbiamo gi`a una buona
+. La funzione cresce venendo da e continua idea dellandamento della funzione, e tale andamento
a crescere andando verso +. Per lesponenziale si pu`o essere reso pi`
u realistico calcolando la funzione
ha: limx+ ex = + e limx ex = 0. Questo in qualche punto, ad esempio, per x intero da 4 a
`e un caso interessante e significa che lesponenziale si +8 (vedere Figura 8.15).
appiattisce verso la retta y = 0: tale retta si dice un
Nota 8.3
La nostra definizione di asintoto `e tropasintoto orizzontale per la funzione y = ex quando
po approssimativa per essere presa sul serio, anche se
x . In generale, data la funzione y = f (x),
a noi interessano solo i casi degli asintoti orizzontali e
si dice che essa ha come asintoto la retta r, se la
verticali. In generale, la retta non verticale y = ax + b
funzione si avvicina sempre di pi`
u alla retta, senza
`e un asintoto della funzione y = f (x) per x + se:
per`o mai raggiungerla; in altre parole, la distanza tra
lim (f (x) ax b) = 0
funzione e retta tende a zero. Lasintoto pu`o essere
x+
= = lim

248

CAPITOLO 8. TRIGONOMETRIA E CALCOLO


Vediamo subito come esempio la funzione y = (x2 +
2x 1)/(2x 1), che ha un asintoto verticale per x =
1/2. Poiche:

lim

la funzione ha un asintoto obliquo, sia per x +,


sia per x . Si ha inoltre:

lim

Figura 8.15: La funzione y = (2x + 1)/(x 2)

3
2

1
1

1
Figura 8.16: y = (x2 + 2x 1)/(2x 1)
cio`e quando la distanza verticale tra la funzione e la
retta tende a 0 (questo ci fa capire perche escludiamo
il caso degli asintoti verticali). Gli asintoti obliqui,
quelli corrispondenti ad a 6= 0, hanno un significato importante; infatti, lesistenza dellasintoto corrisponde a una crescita lineare (cio`e, secondo una retta)
della funzione quando x vada verso linfinito. La crescita lineare, a sua volta, corrisponde a una crescita
che potremmo definire media, o, se si preferisce, a
una crescita proporzionale alla crescita della variabile indipendente. Se la funzione cresce di meno (come

y = x oppure y = ln x) la curva, pur crescendo, tende ad abbassarsi (vedere la Figura 8.14), mentre se la
funzione cresce di pi`
u (come y = x2 oppure y = ex ), la
sua curva tende ad impennarsi. Queste considerazioni sono molto importanti nellanalisi degli algoritmi e
nello studio della loro complessit`
a.
Dalla formula precedente si ottengono le regole per
determinare il valore di a e b, quando esistano:
a = lim

x+

f (x)
x

b = lim (f (x) ax) .


x+

x
5
5x 2
x2 + 2x 1
= lim
= .
x 4x 2
x(2x 1)
2
4

Lasintoto `e pertanto y = 12 x + 45 ; se poi si calcolano i limiti relativi allasintoto verticale, si ha


landamento approssimativo della funzione (vedere
Figura 8.16). Il grafico `e stato disegnato tenendo conto anche di altre informazioni, come fra poco vedremo.

x2 + 2x 1
1
= ,
x(2x 1)
2

3. Crescenza, decrescenza, massimi e minimi. Una volta trovato il dominio di definizione della
funzione che si vuole studiare e stabilito qual `e il suo
comportamento allinfinito, occorre trovare gli intervalli in cui la funzione cresce o decresce e, di conseguenza, stabilire quali sono i punti di massimo e di
minimo. Queste informazioni, integrate con le precedenti, ci danno la visione generale del grafico della
funzione.
Sappiamo gi`a che dove la derivata `e positiva la funzione `e crescente e dove la derivata `e negativa la funzione `e decrescente. I massimi e i minimi sono i punti
di passaggio dalla crescita alla decrescita, e viceversa.
Trovare i punti in cui la derivata si annulla non ci d`a
meccanicamente i massimi e i minimi relativi; come
abbiamo detto, bisogna controllare il comportamento
della funzione in prossimit`a di tali punti. Lesempio
di y = x3 , funzione che cresce prima e dopo il punto
x = 0 in cui la derivata si annulla, `e significativo e
va sempre tenuto presente. Consideriamo lesempio
precedente della funzione y = (2x + 1)/(x 2):
y =

5
2(x 2) (2x + 1)
=
.
(x 2)2
(x 2)2

Poiche sappiamo gi`a che la funzione non `e definita per


x = 2, il denominatore non ci d`a fastidio; inoltre, per
x 6= 2 esso `e sempre positivo, essendo un quadrato.
In conclusione, la derivata `e sempre negativa e ci`o
significa che la funzione `e ovunque decrescente, una
situazione non frequentissima, ma che si accorda bene
con le informazioni gi`a trovate. Se infatti guardiamo
la Figura 8.15 ci accorgiamo che cos` stanno le cose.
Nellesempio della funzione y = (x2 +2x1)/(2x
1) (vedere Figura 8.16), anche se svolto in una nota,
possiamo supporre di conoscere solo lasintoto verticale (dove 2x 1 si annulla) e che va allinfinito con
lo stesso segno della x. La derivata vale:
y =

2x(x 1)
(2x + 2)(2x 1) (x2 + 2x 1)2
=
(2x 1)2
(2x 1)2

249

8.8. IL CALCOLO INTEGRALE


e ancora una volta possiamo permetterci di ignorare
il denominatore, sempre positivo, eccetto nel punto
singolare x = 1/2. Possiamo applicare al numeratore
le nostre conoscenze sulle disequazioni:

x=0
2

x=1

1. La derivata `e positiva per x < 0 e quindi la


funzione `e crescente da a 0;
2. la derivata `e negativa per 0 < x < 1 e quindi la
funzione `e decrescente;

5. per x = 1 abbiamo perci`o un punto di minimo.


Si osservi che quanto detto in 2. va legato al fatto
che per x = 1/2 la funzione ha un asintoto verticale.
Calcoliamo quindi f (0) = 1 ed f (1) = 2 e possiamo
concludere che:
a. la funzione decresce fra 0 ed 1/2 andando da 1 a
;
b. la funzione decresce fra 1/2 ed 1 andando da +
a 2.
Questo ci permette di rappresentare adeguatamente
la funzione anche senza conoscere lasintoto obliquo;
esso, naturalmente, ci d`a linformazione aggiuntiva
di come la funzione va allinfinito. Possiamo infine
utilizzare il fatto che la funzione si annulla quando e
soltanto quando il numeratore si annulla; risolvendo
lequazionex2 + 2x 1 = 0 si trovano le due radici
x = 1 2, che corrispondono alle intersezioni del
grafico con lasse delle x.
Concludiamo con lo studio della funzione y = xx ,
definita solo per x > 0 ed estendibile a x = 0 ponendo
00 = 1. La derivata si calcola nel modo seguente:

x x ln x
(xx ) = (ex ln x ) = ln x +
e
= (ln x + 1)xx .
x

Poiche xx `e sempre positiva, il segno della derivata `e


legato a ln x+1, che si annulla quando ln x = 1, cio`e
quando x = e1 0.367879. Prima di questo valore
la derivata `e negativa e quindi la funzione decresce
1
da 1 fino a (e1 )e 0.692201, punto di minimo;
dopo la funzione cresce, tendendo allinfinito molto
rapidamente. La Figura 8.17 evidenzia il grafico di
questa funzione.

Figura 8.17: Grafico della funzione y = xx

3. per x = 0 abbiamo perci`o un punto di massimo;


4. La derivata `e positiva per x > 1 e quindi la
funzione `e crescente;

1/e

8.8

Il calcolo integrale

Il concetto di integrale `e probabilmente pi`


u intuitivo
di quello di derivata. Questultimo deve far riferimento al concetto di variazione che noi possediamo in
modo naturale, ma che ci crea problemi non indifferenti di rappresentazione e di valutazione. Basta
pensare allesempio forse pi`
u comune, la velocit`a, per
renderci conto che siamo di fronte a una grandezza di
non facile approccio. Gi`a presenta qualche difficolt`a
calcolare la velocit`a media in un tratto di percorso,
come di regola facevano e fanno le imbarcazioni col
solcometro (inventato comunque nel 1500): ma come
fare a valutare la velocit`a istante per istante? Che
tipo di tachimetro avrebbe dovuto e/o potuto usare un auriga per conoscere la forza dei suoi cavalli?
Qui, a rigore, sto dicendo uninesattezza. Nel linguaggio comune diciamo che la velocit`a della biga `e
legata alla forza dei cavalli. In realt`a, la faccenda `e
pi`
u complessa e la Fisica ci insegna che la forza `e legata allaccelerazione, cio`e alla variazione di velocit`a.
Siamo pertanto di fronte a una variazione della variazione, e tutto sembra complicarsi in modo drammatico. Newton fu veramente un genio a dipanare
la matassa ed `e merito suo se oggi abbiamo le idee
pi`
u chiare in questo guazzabuglio, ma lo sforzo per
capire `e stato grande e ognuno di noi, ancora oggi,
lo deve affrontare, anche se aiutato dai libri e dagli
insegnanti.
Apparentemente, invece, il calcolo integrale `e un
concetto abbastanza evidente. Il problema centrale `e il calcolo dellarea delle figure, problema che la
Geometria aveva affrontato, e in parte risolto, fino
dallantichit`a. Come abbiamo visto, lequiscomponibilit`a permette di calcolare la misura di molte superfici, ma si deve arrendere quando dai poligoni si passa
alle figure rotonde. In particolare, la quadratura del

250
cerchio `e stata uno scoglio sul quale sono naufragate molte barche e molte navi. In effetti, come ora
sappiamo, `e impossibile scomporre un cerchio e costruire, con la riga e il compasso, un poligono (se non
proprio un quadrato) ad esso equivalente. Lidea di
Archimede di passare da procedimenti finiti a processi infiniti si `e rivelata vincente, anche se richiede
accorgimenti piuttosto particolari. Noi abbiamo affrontato il calcolo di (vedi Sezione 6.7) seguendo,
s` lidea di Archimede, ma avendo alle spalle diverse
discussioni sui numeri reali, sulle sequenze infinite e
sulle successioni di Cauchy. In altre parole, benche
non avessimo parlato ancora del concetto di limite,
eravamo armati di (quasi) tutti quegli strumenti che
fanno, di un processo infinito, un qualcosa di logicamente rigoroso e accettabile nel mondo esigente della
Matematica.
Noi seguiremo una strada abbastanza ingenua, anche se `e la stessa che diede origine al calcolo integrale
e che `e stata seguita dai matematici fino alla fine del
secolo XIX. Infatti, in quegli anni, ci si accorse che
esistevano situazioni alquanto anomale che richiedevano unimpostazione pi`
u sofisticata, e fu Lebesgue,
nel 1902, a introdurre un nuovo concetto di integrale
che comprendeva il vecchio e dava ragione di quei casi
speciali che si erano trovati. Per noi andr`a benissimo la strada pi`
u semplice, che comunque ci portar`a
a dimostrare quello che `e laspetto pi`
u eccezionale, e
curioso, del calcolo integrale, e cio`e la sua insospettata (a priori) strettissima connessione con il calcolo
differenziale. In altre parole, scopriremo come la misura delle aree sia la faccia nascosta del calcolo delle
variazioni, cio`e della ricerca della retta tangente ai
vari punti di una curva: i due problemi sono esattamente uno linverso dellaltro. Data una curva, se
consideriamo le variazioni istantanee dellarea sottesa
dalla curva man mano che procediamo lungo la curva
stessa, ritroviamo proprio la medesima curva, quella
da cui siamo partiti. E se, viceversa, consideriamo
le aree successive sottese dalla funzione che descrive
le variazioni della curva data, ritroviamo proprio tale
curva. Questo, in modo del tutto fortunato, permette uno sviluppo unitario dei due calcoli che, visti a
priori, avrebbero potuto comportare metodologie del
tutto diverse.
Si consideri allora (v. Figura 8.18) una curva limitata A A1 , A2 , . . . , An1 , An B, M ; per il momento `e essenziale la condizione sulla limitatezza, cio`e
che la figura non si sperda nel piano, andando a rasentare linfinito. E chiaro che larea di tale figura si
pu`o ottenere per differenza: basta togliere dallarea
che la parte superiore A A1 , A2 , . . . , An1 , An B
sottende fino allasse delle ascisse, larea sottesa dalla
parte inferiore A, M, B. Possiamo perci`o limitare le
nostre considerazioni alle curve definite da unequa-

CAPITOLO 8. TRIGONOMETRIA E CALCOLO


A3
A2

An1
A4
An

A1

M
O
Figura 8.18: Area di una curva

zione y = f (x) e allarea da esse sottesa fino allasse


delle ascisse. Per il momento, possiamo supporre che
la funzione y = f (x) sia continua, ma vedremo come
questa ipotesi possa essere un po rilassata.
Fissiamo pertanto la nostra attenzione su una funzione continua y = f (x) e su un intervallo [a, b] in cui
essa sia definita. Suddividiamo [a, b] in tanti intervallini mediante i punti x0 = a, x1 , x2 , . . . , xn1 , xn = b;
i vari intervalli [xi1 , xi ] possono essere tutti uguali
o tutti diversi, non ha grande importanza; comunque, indicheremo con la loro massima lunghezza.
Da un punto di vista pratico, come vedremo con un
esempio pi`
u avanti, considerare intervalli uguali pu`o
essere pi`
u conveniente; nella teoria, intervalli diversi
danno pi`
u flessibilit`a. In ogni intervallo [xi1 , xi ] poniamo xi = xi xi1 e indichiamo con i , i i due
punti dellintervallo in cui la funzione f (x) assume il
suo minimo e il suo massimo (si veda la Figura 8.18).
Questo significa che se Ii indica larea sottesa dalla
curva y = f (x) nellintervallo [xi1 , xi ], si ha:
f (i )xi Ii f (i )xi .
A questo punto, possiamo sommare rispetto a tutti
gli intervalli ottenendo:
n
X
i=1

f (i )xi

n
X
i=1

Ii = I

n
X

f (i )xi

i=1

dove I `e larea che stiamo cercando. Se ora facciamo


tendere a zero lampiezza massima dei nostri intervalli, i punti i e i tendono a confondersi e, per la
supposta continuit`a della f (x), i valori f (i ) e f (i )
tenderanno, per il Teorema dei Carabinieri, a diventare uguali (si osservi che 0 implica n ).
Questo per`o vuol dire che la prima e lultima somma
tendono a diventare uguali e questo definisce univocamente il valore di I, cio`e dellarea sottesa dalla nostra

251

8.8. IL CALCOLO INTEGRALE


curva. Si scrive:
lim

n
X

f (i )xi = lim

i=1

n
X

f (i )xi =

i=1

f (x)dx

che si dice lintegrale definito della


R funzione y = f (x)
nellintervallo [a, b]. Il simbolo fu coniato da Leibniz stilizzando la S iniziale di Summa; a e b si dicono gli
estremi di integrazione e il simbolo dx indica il differenziale di x, come nel caso della derivazione, poiche
in realt`a ha lo stesso significato di differenza infinitesima di valori delle ascisse. Unosservazione, banale
Rb
ma importante, `e che a f (x)dx = 0 se a = b.
Un esempio classico riguarda la quadratura della
parabola, cio`e la determinazione dellarea sottesa da
un arco di parabola. Si tratta di un antico problema e il termine quadratura `e usato in analogia alla
quadratura del cerchio, cio`e al fatto che, una volta trovata larea desiderata, `e anche possibile trovare numericamente il lato di un quadrato con quella
stessa area (basta fare la radice quadrata). Consideriamo la parabola y = x2 e lintervallo [0, X],
che dividiamo in n parti uguali; ogni intervallo ha
pertanto lunghezza = X/n e i vari estremi sono
x0 = 0, xi = i (i = 1, 2, . . . , n), con n = X. Poich`e
la funzione `e crescente, si ha i = (i 1) e i = i,
cos` che:
n
X
i=1

((i 1))2 I
3

n1
X
i=0

i2 I 3

n
X
(i)2
i=1

n
X

i2 .

i=1

Ricordiamo che la somma dei quadrati dei primi n


naturali vale n(n + 1)(2n + 1)/6 (vedere Teorema ??)
e quindi:
X 3 (n 1)n(2n 1)
X 3 n(n + 1)(2n + 1)
I 3
3
n
6
n
6

3
3
1
1
X
1
1
X
1
2
I
1+
2+
.
6
n
n
6
n
n
Come abbiamo osservato, quando 0 deve essere
n e quindi 1/n 0; le due espressioni agli estremi tendono allora allo stesso valore e per il Teorema
dei Carabinieri si ha:
Z X
X3
x2 dx =
I=
.
(8.2)
3
0
Consideriamo allora una funzione y = f (x) (che
supporremo continua) definita nellintervallo [a, b] e
sia x un punto qualsiasi di tale intervallo. Possiamo restringere la nostra attenzione al sotto-intervalli
[a, x]: si dice funzione integrale della f (x) la funzione:
Z x
F (x) =
f (t)dt.
a

Si noti luso della variabile t per evitare confusione


con la variabile x, usata come variabile indipendente
nella funzione integrale. La variabile t `e, come si dice
legata nel senso che, pur apparendo scritta come variabile, il suo ruolo `e perso nelloperazione di integrazione, cio`e nel calcolo dellaria, che ovviamente non
dipende dalla variabile della funzione y = f (x), ma
solo dal punto x [a, b], che perci`o diviene la vera variabile indipendente. Luso del differenziale dx serve
proprio a ricordare questa legatura, evidenziando
la variabile che non c`e pi`
u.
Larea sottesa dalla curva y = f (x) `e crescente,
se la funzione si mantiene al di sopra dellasse delle
ascisse. Ha senso considerare negative le aree comprese tra lasse delle x e la curva, se questa scende al
di sotto dellasse stesso. Ad esempio, larea sottesa
dalla curva y = sin x nellintervallo [0, 2] `e zero, poiche larea positiva dellintervallo [0, ] `e bilanciata da
quella negativa di [, 2], di pari estensione. Di regola le considerazioni sulla funzione integrale si basano
su curve che rimangono al di sopra delasse delle x,
ma si possono estendere facilmente a situazioni generali. Anche noi ci atterremo a questa regola, intuitivamente pi`
u semplice, in quanto rispetta la nostra
idea di area di una superficie, una quantit`a sempre
considerata positiva, a partire dai matematici greci.
Dalla definizione di integrale, discende il seguente:
Lemma 8.38 Se f (x) `e una funzione integrabile nellintervallo [a, c] e b `e un punto di tale intervallo, cio`e
a b c, allora:
Z c
Z b
Z c
f (x)dx =
f (x)dx +
f (x)dx
a

f (x)dx =
Z

f (x)dx

f (x)dx =

f (x)dx

f (x)dx.
c

Con questo in mente, se y = f (x) `e una funzione continua in [a, b] e si considerano due punti
a x1 x2 b, indichiamo con m ed M lestremo inferiore e superiore dei valori che la f (x) assume nellintervallo [x1 , x2 ]; `e immediato osservare che
del rettangolo x1 m1 m2 x2 `e minore o uguale a
Rlarea
x2
f
(x)dx,
che a sua volta `e minore o uguale allarea
x1
del rettangolo x1 M1 M2 x2 . Questo si scrive:
Z x2
1
dx M.
m
x2 x1 x1
Poiche sappiamo che una funzione continua in un intervallo chiuso assume tutti i valori compresi tra m
ed M , deve esistere un punto [x1 , x2 ] in cui la
funzione ha proprio il valore centrale. Abbiamo cos`
dimostrato:

252

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

Teorema 8.39 (della media integrale) Se y =


f (x) `e continua in (a, b) e a x1 x2 b, esiste un
punto [x1 , x2 ] tale che:

Corollario 8.42 Sia y = f (x) continua nellintervallo (a, b): ogni primitiva di f (x) differisce al pi`
u
per
una
costante
dalla
funzione
integrale
F
(x)
=
Rx
f (t)dt.
a

1
f () =
x2 x1

x2

dx.

x1

Questo risultato serve a dimostrare il seguente


teorema fondamentale del calcolo integrale:
Teorema 8.40 (fondamentale) Sia f (x) una funzione continua
in (a, b); la sua funzione integrale
Rx
F (x) = a f (t)dt `e derivabile e per ogni x [a, b]
si ha F (x) = f (x).
Prova: Calcoliamo il rapporto incrementale della
F (x) in un punto qualsiasi x0 :
Z

1
F (x) F (x0 )
=
x x0
x x0
1
=
x x0

f (t)dt

x0

f (t)dt

x0

f (t)dt = f ().

Per il precedente teorema della media integrale, deve


esistere un punto (a, b) tale che f () sia proprio
uguale allultima espressione. Quando facciamo tendere x x0 , anche x0 e quindi F (x) `e derivabile
in x0 e si ha proprio: F (x0 ) = f (x0 ).
Si dice primitiva della funzione (continua) y = f (x)
ogni funzione G(x) tale che G (x) = f (x). Il teorema
precedente ci dice che la funzione integrale della f (x)
`e una primitiva della stessa f (x), cio`e integrazione e
differenziazione sono due operazioni una inversa dellaltra. Da questo deriva il nome del teorema. Per
maggiore fortuna, possiamo anche dimostrare che le
primitive di una funzione non sono poi molto diverse
luna dallaltra:
Teorema 8.41 Due funzioni G1 (x) e G2 (x) hanno
la stessa derivata, cio`e G1 (x) = G2 (x), se e solo se differiscono per una costante, ovvero G2 (x) =
G1 (x) + c.
Prova: Se G2 (x) = G1 (x) + c, dalle regole di derivazione si ha: G1 (x) = G2 (x). Viceversa, si consideri la funzione g(x) = G2 (x) G1 (x); derivando
si deve avere: g (x) = G2 (x) G1 (x) = 0. Vediamo allora che g(x) `e costante. Se prendiamo due
punti qualsiasi x1 , x2 [a, b], per il Teorema di Lagrange deve esistere un punto (x1 , x2 ) tale che
g(x1 ) g(x2 ) = g ()(x1 x2 ) = 0, per la propriet`a di g(x) appena vista. Ma questo significa
g(x1 ) = g(x2 ), qualunque siano i punti x1 , x2 (a, b),
cio`e, la funzione g(x) `e costante.
Ne consegue limportante corollario:

In questi pochi risultati `e racchiusa tutta (o quasi


tutta) la teoria elementare del calcolo integrale, quella da noi adottata. Il Teorema Fondamentale ci dice
che lintegrazione `e loperazione inversa della derivazione, e il Corollario rafforza questa constatazione avvertendoci che non ci sono altre strade per calcolare la
funzione integrale se non quella di procedere a ritroso
rispetto alla derivazione. Cos` tutto `e lasciato sulle
spalle di questa operazione che, fortunatamente, gi`a
conosciamo e che ha regole assai precise. Questa `e la
teoria. Come vedremo poco pi`
u avanti, la pratica non
`e cos` rosea, per il semplice fatto che non `e sempre
facile immaginare quale funzione abbia prodotto per
derivazione quella assegnata. Per il momento, accontentiamoci dei lati positivi, osservando e precisando
alcuni aspetti essenziali da un punto di vista pratico.
Se y = f (x) `e continua nellintervallo (a, Rb), si dice integrale indefinito della f (x), w si scrive f (t)dt,
una qualsiasi primitiva della f (x); secondo il precedente corollario, se F (x)
R `e una qualsiasi primitiva di
f (x), si suol scrivere f (t)dt = F (x) + c, lasciando
indicata la costante c. La relazione tra integrale definito (larea) e lintegrale indefinito (funzione) `e dato
semplicemente dal seguente:
Teorema 8.43 Sia y = f (x) una funzione continua
definita nellintervallo (a, b) e sia G(x) una qualunque sua primitiva. Allora, lintegrale definito fra a e
b di f (x) si calcola nel modo seguente:
Z

f (t)dt = [G(x)]a = G(b) G(a).

Rx
Prova: Sia F (x) = a f (t)dt la funzione integrale
di f (x), di modo che si ha: F (x) G(x) = c, una
qualche costante. In particolare, per x = a si trova F (a) G(a) = c, ed essendo F (a) = 0, si ricava
G(a) = c. Questo d`a F (x) = G(x) G(a) e per
Rb
x = b si conclude: a f (t)dt = G(b) G(a). La notab
zione [G(x)]a `e quella comunemente usate e significa
proprio calcolare la G(x) in x = b e sottrarle il valore
di G(x) valutato in x = a.
Come semplice esempio, si voglia trovare larea sottesa dalla parabola y = x2 nelintervallo [0, 2], problema che abbiamo gi`a risolto con la formula (8.2).
Si comincia osservando che una primitiva di x2 `e
x3 /3, come si verifica facilmente calcolando la derivata: Dx3 /3 = 3x2 /3 = x2 . A questo punto si
ha:
3 2
Z 2
8
8
x
= 0= .
x2 dx =
3
3
3
0
0

253

8.8. IL CALCOLO INTEGRALE

Funzione
xn
1/(x + a)
eax
ax
sin ax
cos ax
1/(cos ax)2
1/(1 + a2 x2 )

Primitiva
xn+1 /n
ln |x + a|
eax /a
ax / ln a
( cos ax)/a
(sin ax)/a
(tan ax)/a
(arctan ax)/a

Tabella 8.2: Alcune primitive

per sostituzione. Sia F (x) la primitiva della funzione continua f (x) e si consideri una funzione derivabile
g(x). Posto G(x) = F (g(x)), derivando con la regola
della catena si ha:

G (x) = F (u) u = g(x) g (x) = f (g(x))g (x),

e questo prova che G(x) `e la primitiva di f (g(x))g (x).


Quindi:
Z
f (g(z))g (z)dz = G(t) = F (g(t)) =
=

In realt`a, immaginare quale possa essere la primitiva della funzione da integrare `e il modo pi`
u semplice
per calcolare gli integrali (definiti o indefiniti). Basandosi sui risultati ottenuti nella Sezione 8.6 sulla
derivazione, `e bene tenere a mente le principali e pi`
u
semplici primitive, che riportiamo nella Tabella 8.2.
Usando tale tabella, il lettore calcoler`a i seguenti integrali indefiniti, eseguendo poi la riprova mediante
opportuna derivazione:
Z
Z
1
1
dt =
et dt = et
ln
1t
1t
Z

(sin t 2 cos 2t)dt = cos t

1
sin 2t.
2

Anche se la tabella 8.2 costituisce la base dellintegrazione, non sempre un integrale `e riconducibile
a forme cos` semplici. Esistono pertanto alcune tecniche generali che possono essere utilmente adottate
in molte occasioni. Lintegrazione indefinita `e sempre stata considerata unarte, proprio perche `e difficile dare metodi generali di risoluzione ed esistono,
come vedremo, funzioni di cui non si conosce la primitiva. Propriamente, la primitiva esiste, ma non `e
esprimibile mediante le funzioni elementari: polinomi, logaritmi, esponenziali e funzioni trigonometriche
(almeno per noi). Tuttavia, si sono sempre ricercati
algoritmi generali di calcolo, con risultati anche notevoli. Allinizio degli anni 1970, il desiderio di far
eseguire gli integrali agli elaboratori elettronici acceler`o le ricerche in questo settore e si sono messi a
punto algoritmi tali, per cui oggi un elaboratore `e
mediamente pi`
u bravo di un matematico ad eseguire
lintegrazione. Infatti. gli algoritmi sono cos` complessi che la loro esecuzione manuale richiede troppa
attenzione e troppo allenamento.
Classicamente, vi sono quattro metodi che vengono insegnati (non sono certo gli unici!) e qui li
richiamiamo, anche se a un livello molto elementare.
1. Integrazione per sostituzione. Il metodo
pi`
u generale di integrazione `e senzaltro quello detto

f (x)dx x = g(t) .

Come ricordiamo dal calcolo differenziale, g (t)dt


equivale al differenziale dg(t) della funzione g(t) e di
solito la formula precedente si scrive:

Z
Z

f (x)dx x = g(t) .
f (g(t))dg(t) =

Linterpretazione di questa formula si fa meglio seguendo un esempio significativo. Si voglia trovare


lintegrale indefinito della funzione y = 2x/(1 + x2 ),
funzione che assomiglia alla y = 1/(1 + x2 ), il cui integrale indefinito `e arctan x. Come ora vedremo, il
risultato finale `e per`o del tutto diverso.
Si comincia osservando che 2x `e il differenziale della
funzione 1 + x2 , che si trova al denominatore; infatti,
d(1 + x2 )/dx = 2x e quindi d(1 + x2 ) = 2xdx. Si
trova allora:
Z

Z
Z
2xdx
dy
d(1 + x2 )
2
y =1+x .
=
=
1 + x2
1 + x2
y
R
Ma lintegrale indefinito dy/y si trova nella Tabella
8.2 (cio`e, lo dobbiamo sapere a memoria) ed `e semplicemente ln |y|. Sostituendo ora ad y il suo valore
1 + x2 , si ha il risultato definitivo:
Z
2xdx
= ln |1 + x2 | = ln(1 + x2 )
1 + x2
in quanto 1 + x2 `e una quantit`a sempre positiva. Come detto, questo risultato ha poco a che vedere (almeno sembrerebbe) con arctan x, il che prova che funzioni leggermente differenti possono avere primitive del
tutto non correlate (in questo caso tale affermazione
non `e vera in assoluto: nel campo complesso, arctan
e ln sono in effetti correlate tra di loro).
Vista limportanza del metodo, un altro esempio
pu`o essere adeguato. Si voglia trovare una primitiva di y = 1/ cos x; il trucco, non del tutto banale,
consiste nello scrivere:
cos x
cos x
1
=
=
.
cos x
cos2 x
1 sin2 x

254

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

Ora si ricorda che cos x `e la derivata di sin x, cio`e


cos xdx = d sin x, per cui:
Z

Z
Z

du
dx
d sin x

=
=
u
=
sin
x
,

cos x
1 u2
1 sin2 x
e per calcolare questo nuovo integrale `e opportuno
introdurre il secondo dei quattro metodi annunciati.
2. Espansione in frazioni parziali: se si deve
integrare una funzione razionale fratta, il cui denominatore `e fattorizzabile in fattori lineari, si pu`o utilizzare lespansione in frazioni parziali (vedere Sezione
5.4) per riportare il calcolo a frazioni pi`
u semplici. Si
ha infatti nellesempio:
Z

Z
Z
dt
1
dt
dt
=
=
+
1 t2
2
1+t
1t
Z

Z
d(1 + t)
d(1 t)
1

=
=
2
1+t
1t
s

1 + t
1

= (ln |1 + t| ln |1 t|) = ln
2
1 t

E pertanto lintegrale cercato si ottiene sostituendo a


t lespressione sin x:
r
Z
dx
1 + sin x
= ln
cos x
1 sin x
dove `e sparito il valore assoluto (perche?).
Invitiamo il lettore a verificare il seguente risultato:
Z 5
x 4x3 x2 4x + 3
dx =
x3 3x 2

potr`
a essere tenuto a modello per casi analoghi. Si
voglia integrare la funzione f (x) = 1/(x2 x + 1), il
cui denominatore `e irriducibile avendo = 3. Ci`
o
che vogliamo fare `e quello di riportare il polinomio di
secondo grado x2 x + 1 alla forma t2 + 1, per un opportuno valore di t, considerato come funzione di x.
Questo `e sempre possibile, con un metodo che `e, in un
certo senso, linverso del completamento del quadrato,
la tecnica usata nella dimostrazione del Teorema 5.10.
Ci`
o che `e fuori luogo in x2 x + 1 `e il termine in x;
possiamo eliminarlo inglobandolo in un quadrato, qui
(x 1/2)2 = x2 x + 1/4. Per differenza si ricava:

!

2
2
1
3 4
1
3
2
x x+1= x
x
+ =
+1
2
4
4 3
2
e il gioco `e fatto quando si ponga t2 = 4(x 1/2)2 /3.
Questa `e la nostra sostituzione per applicare
proprio

quel metodo; poiche t = 2(x 1/2)/ 3, possiamo


scrivere:

Z
(2/ 3)dt
1
2

f (x)dx =
=
t
=
3(t2 + 1)/4
2
3

2
1
dt
2 3

t=
x
=
=
3
t2 + 1
2
3

1
2
2 3
x
arctan
=
3
2
3
che `e il risultato cercato, anche se lespressione non
`e molto bella. Comunque, ed `e questo che importa,
lintegrale `e espresso per mezzo di funzioni elementari
(e larcotangente `e tale, anche se usata un po pi`
u
raramente di altre funzioni)

3. Integrazione di funzioni razionali in seno


e coseno: Per funzione razionale in seno e coseno
si intende ogni espressione trigonometrica esprimibix3
3
(x + 1)2
=
x+
+ ln
,
le come rapporto di due polinomi in sin x e cos x; ad
3
x+1
|x 2|
esempio: (sin2 x 3 cos x)/(1 + sin x). Come abbiadove pu`o essere sfruttata lespansione in frazioni
mo visto dopo il Corollario 8.6, si pone t = tan(x/2)
parziali vista come esempio nella Sezione 5.4.
e lespressione diviene razionale in t. Inoltre, poie si ha x = 2 arctan t, differenziando si ottiene
Nota 8.4
La scomposizione del denominatore ch
pu`
o contenere anche fattori irriducibili di secondo gra- dx = 2dt/(1 + t2 ), e lespressione risulta globalmente
do. Un caso semplice `e fornito dallaltro esempio della razionale in t, e quindi integrabile. Un semplice esemNota 5.8. Si ha infatti:
pio dovrebbe essere sufficiente; si voglia integrare
Z
Z
2
f (x) = 1/(1 + sin x); si ha allora:
(2x + x 5)dx
=
f (x)dx =
"Z
#
3
2
Z
x 2x + x 2

x
1
2dt
dx

Z
Z
Z
=
1
2xdx
dx
dx
2t 1 + t2 t = tan 2 =
1 + sin x
1 + 1+t
2
=
+
3
+
.
2
1 + x2
1 + x2
x2
Z

Di nuovo, il metodo di sostituzione ci d`


a il risultato:
dt
x
2

=
2
.
t
=
tan
=

Z
2
(1
+
t)
2
1
+
tan(x/2)
1
2
f (x)dx =

ln(1 + x ) + 3 arctan x + ln |x 2|

dove larcotangente risolve, almeno in questo caso, il


problema di avere un fattore irriducibile di secondo
grado a denominatore.
In realt`
a, larcotangente risolve tale problema in generale; ci accontentiamo di sviluppare un esempio, che

4. Integrazione per parti: Nel Teorema 8.30


abbiamo visto come si deriva il prodotto di due funzioni. Tenendo allora presente che lintegrale della
derivata di una funzione `e la funzione stessa, si ha:
Z
Z

f (x)g(x) = f (x)g(x)dx + f (x)g (x)dx.

255

8.8. IL CALCOLO INTEGRALE


Pu`o succedere che uno dei due integrali del membro destro sia facile da eseguire; se ci`o accade per il
primo (ma la cosa `e indifferente, essendo laddizione
commutativa), possiamo allora trovare laltro:
Z
Z
f (x)g (x)dx = f (x)g(x) f (x)g(x)dx.
Questa formula `e nota come regola di integrazione
per parti e in diverse occasioni si rivela molto utile.
Poiche g (x)dx `e il differenziale della funzione g(x),
nella regola g (x) si dice il fattore differenziale, mentre
f (x) `e detto fattore finito. Lintegrazione per parti,
quindi, si pu`o applicare quando sia nota la funzione
integrale del fattore differenziale, in quanto del fattore finito occorre solo eseguire la derivata. Naturalmente, occorre anche che si riesca ad eseguire lultimo
integrale, e questo di solito succede se f (x) `e semplice o pu`o essere semplificata con g(x). Al solito, un
esempio vale pi`
u di tante parole. Si voglia trovare la
primitiva di ln x; immaginiamo che sia: ln x = 1 ln x.
Poiche la derivata di ln x `e una funzione semplice e
conosciamo lintegrale della funzione costante 1, scegliamo questa come fattore differenziale. In termini
pi`
u formali: f (x) = ln x e g (x) = 1, onde g(x) = x
ed f (x) = 1/x. La regola di integrazione per parti
d`a allora:
Z
Z
x
ln xdx = x ln x
dx = x ln x x.
x
Un altro classico esempio `e fornito dallintegrale di
x cos x. In queto caso, cos x non diviene una funzione
pi`
u semplice ne derivando, ne integrando. Viceversa,
la derivata di x `e 1. Scegliamo pertanto cos x come
fattore differenziale e otteniamo:
Z
Z
x cos xdx = x sin x sin xdx = x sin x + cos x.
Il lettore si far`a ora carico di sperimentare lintegrazione per parti e provare questi due importanti
risultati:
Z
1
arctan xdx = x arctan x ln(1 + x2 )
2
Z
1
sin2 xdx = (x sin x cos x)
2

che sono, a posteriori (cio`e conoscendo il risultato) di


facile verifica per derivazione.
Purtroppo, nonostante i quattro metodi esposti e
altri che non possiamo discutere qui, non tutte le funzioni elementari hanno una primitiva che sia esprimibile ancora mediante funzioni elementari. Alcuni
esempi classici sono le funzioni:
2

y = ex , y =

ln x
sin x
, y=
, y = cos x2 .
x
1+x

y
1

x
3

Figura 8.19: Integrare la funzione y = 2x


Unaltra funzione famosa di cui non si conosce
la primitiva `e 1/ ln(x), di modo che si d`a come
definizione:
Z x
1
dt,
li(x) =
ln(t)
2

e la funzione li si dice logaritmo integrale. Questa


funzione `e importante perche `e la funzione che approssima meglio la densit`a dei numeri primi minori o
uguali ad x, cio`e (x) li(x) asintoticamente (v. Sezione 2.4). Non `e difficile intuire che li(x) x/ ln(x)
e ci`o giustifica la formula data a suo tempo. In effetti,
i conteggi danno:
x = 100. 000
x = 1. 000. 000

(x) = 9592
(x) = 78498

li(x) = 9630
li(x) = 78628

e lapprossimazione `e molto migliore di quella con


n/ ln(n).
Nota 8.5

Con questo abbiamo esaurito la nostra


veloce presentazione del concetto di integrale. Sono
pi`
u numerose le cose rimaste fuori di quelle cui abbiamo accennato, ma largomento verr`
a ripreso nei corsi
universitari di Analisi Matematica, e quindi qui ci possiamo accontentare se il lettore avr`
a capito il concetto
e sar`
a in grado di calcolare i pi`
u semplici integrali,
definiti o indefiniti che siano. In pratica, abbiamo
trattato solo gli aspetti pi`
u superficiali ed ingenui dellintegrazione, cio`e lintegrazione di funzioni continue
in un intervallo in cui sono ovunque definite. E facile
per`
o osservare che se una funzione presenta un numero
finito di discontinuit`
a di prima specie (cio`e, dei salti)
nulla o quasi cambia di ci`
o che abbiamo detto. Infatti, se la funzione y = f (x) definita nellintervallo [a, b]
ha un salto in c (a, b), basta scegliere le divisioni di
[a, b] in modo che c risulti sempre un punto di separazione; ci`
o equivale a vedere lintegrale fra a e b come
la somma degli integrali fra a e c, e fra c e b. Alternativamente, si osserva che larea intorno al punto c
varia in effetti con continuit`
a, cio`e il salto della funzione scompare nella funzione integrale. Questo, anche
teoricamente, `e un punto importante, poiche mostra
come la funzione integrale sia pi`
u regolare, cio`e pi`
u
continua della funzione di partenza.
Un aspetto pi`
u complicato `e fornito dalle discontinuit`
a
di tipo 2, oppure quando da intervalli finiti si passi ad

256

CAPITOLO 8. TRIGONOMETRIA E CALCOLO

intervalli infiniti. Entrambi i casi possono dare origine


a situazioni trattabili, anche se la teoria va rivista e
ampliata, proprio per tener conto di questi integrali
impropri. E facile vedere che larea sottesa dalla curva, in questi casi, non necessariamante diviene infinita. Vediamo un facile esempio; si consideri la funzione
y = 2x , rappresentato
R dalla curva nella Figura 8.19;
lintegrale definito 0 2x dx `e, per definizione, larea
sottesa dalla curva nellintervallo [0, +). Tale area
`e minore di quella costituita dai rettangoli disegnati
nella stessa figura, che `e:
A=1+

1
1
1
+ + + = 2
2
4
8

per ci`
o che sappiamo sulle progressioni e le somme infinite (vedere Sezione 3.3). Quindi, larea `e finita, nonostante lintervallo sia infinito. Con finta ingenuit`
a,
possiamo ignorare la non finitezza dellintervallo e procedere come se fosse finito. Nella Tabella 8.2 troviamo
la primitiva di y = ax che adattiamo al caso a = 1/2:

Z
1
1
1
+ 0
=
=
2x dx = x
2
ln(1/2)
2
ln
2
2
ln 2
0
0
1
= log2 e = 1.442695041.
ln 2
Pu`
o sorprendere (o forse sorprende solo i matematici), ma questo procedimento, di chiamare cos`
candidamente in campo linfinito, `e sostanzialmente
corretto e il risultato ottenuto `e giusto. Tuttavia, la
teoria dellintegrazione che sta dietro tutto ci`
o va al
di l`
a dei nostri limiti e la lasciamo ai corsi universitari
di cui s`e detto.
=

Indice analitico
angoli interni, 169
angoli supplementari, 168
angolo, 165
angolo acuto, 168
angolo al centro, 184
angolo alla circonferenza, 184
angolo concavo, 168
angolo convesso, 168
angolo diedro, 191
angolo giro, 168
angolo ottuso, 168
angolo piatto, 168
angolo retto, 168
angoloide, 195
anno civile, 96
anno commerciale, 96
antecedenti della proporzione, 92
antiperiodo, 76
antisimmetrica, 17
apertura del compasso, 165
apotema, 187
apotema del cono, 196
appartenere, 202
appartiene, 12
approssimazione per difetto, 79
approssimazione per eccesso, 79
Archimede (c. 287 212 a.C.), 197
arco, 113
arco circolare esplementare, 184
arco circolare esterno, 184
arco circolare interno, 184
arco orientato, 113
area, 177
Argand, J.R. (1768 1822), 153
argomento, 19
ariet`a, 19
Aristotele (384 322 a. C.), 22, 28
aritmetica modulare, 51
aritmetizzazione, 63
ascissa, 200
ascissa di un punto, 200
asintoto, 211, 247
aspetto strutturale, 117
asse del cono, 182
asse della parabola, 207
asse delle ascisse, 200

addendo, 41
addizione, 41
adicit`a, 19
affermazione singolare, 30
aggregazione, 11
al-Banna (1256 1321), 59
al-Fars, 59
Al-Haithan, I. (c. 965 - 1039), 212
al-Khuwarizmi (c. 780 850), 24, 133
al-Tusi N. E. (1201 - 1274), 212
alberi binari di ricerca, 112
albero, 114
albero con radice, 114
albero di ricoprimento, 114
albero minimo di ricoprimento, 114
albero orientato, 114
Alef, 22
alfabeto, 37
algebra astratta, 37, 159
algebra Booleana, 13, 61
algebra moderna, 37
algebra retorica, 133
algebra sincopata, 133
Algol60, 117
algorismo, 24
algoritmo del simplesso, 148
algoritmo di Euclide, 59
algoritmo ricorsivo, 43
Alhazen (v. al-Haithan), 212
altezza, 173
altezza del ciclindro, 196
altezza del cono, 196
altezza del prisma, 193
altezza della piramide, 194
amicabili, 59
analisi combinatoria, 99
anello, 160
anello Booleano, 161
angoli alterni, 169
angoli complementari, 168
angoli coniugati, 169
angoli corrispondenti, 169, 184
angoli corrispondenti esplementari, 184
angoli del triangolo, 170
angoli esplementari, 168
angoli esterni, 169
257

258
asse delle ordinate, 200
asse di simmetria, 207
asse di un segmento, 180
asse immaginario, 153
asse reale, 153
assi, 200
assi di riferimento, 200
assioma, 28, 30
assioma indipendente, 29
assorbimento, 20
auxologia, 129
Bolyai, F. ( ), 213
Bolyai, J. (1802 - 1860), 213
Babbage, C. (1792 1871), 13, 223
Backus Normal Form, 117
Backus, J. (1920 ), 117
baricentro, 181
base, 61, 173
base composta, 27
base dei logaritmi naturali, 237
base del prisma, 193
base della piramide, 194
base di dati, 15
Beltrami, E. (1835 1900), 170, 215
binomio, 134
bisettrice, 180
bisettrice di un angolo, 181
bit, 26
biunivoca, 18
Bolyai, J. (1802 1860), 170
Boole, G., 31
Boole, G. (1815 1864), 13
Bourbaki, Nicolas, 99
Briggs, H. (1561 - 1639), 90, 228
Byron, Ada (1815 1852), 13
calcolo combinatorio, 99
calcolo dei predicati, 35, 121
calcolo delle probabilit`a, 122
calcolo delle proposizioni, 31, 118
calcolo proposizionale, 31
cammino, 113
campo, 161
campo dei numeri complessi, 152
Cantor, G. (1845 1918), 13, 21, 78
capitale, 95
Cardano, G. (1501 1576), 155
cardinalit`a, 21
cardinalit`a del continuo, 23
cardinalit`a del numerabile, 22
cardinalit`a transfinita, 22
Carnot, L. (1753 1823), 227
Cartesio, 59
Cartesio (1596 1750), 199, 202
Catalan, E. (1814 1894), 116

INDICE ANALITICO
catena di rapporti, 92
Cauchy, A. L. (1789 1857), 217
Cavalieri, B. (1598 1647), 194
centesimi, 72
centro, 182
centro del fascio, 174
centro del poligono, 187
centro della sfera, 197
cerchio, 182
cerchio goniometrico, 218
certezza, 123
Chomski, N. (1928 ), 116, 117
Chuquet, N. (1445 1488), 133
ciclo, 104, 113
cicloide, 232
cifra, 25
cifra binaria, 26
cifre arabiche, 24, 25
cilindro, 196
cilindro indefinito, 196
cilindro retto, 196
circocentro, 181
circonferenza, 182
circonferenza circoscritta, 182
circonferenza inscritta, 182
circonferenze concentriche, 187
circumcentro, 181
classe di equivalenza, 16
classe di grandezze, 93
classi di resti, 51
codominio, 18
coefficiente, 134
coefficiente binomiale, 101
coefficiente binomiale centrale, 103
coerenza, 28
Cohen, Paul (1934 ), 23
combinatoria, 99
combinazioni, 100
commensurabile, 77, 166
commesso viaggiatore, 106
compasso di Galileo, 90
complementare, 168
complemento, 13
complemento a 10, 45
complemento a 9, 45
complessit`a NP, 35
completamento del quadrato, 141
completezza, 29
componendo, 92
componente connessa, 113
composizione, 18, 104, 159
composto, 53
concatenazione, 37
concetto primitivo, 28
condizione necessaria, 30

259

INDICE ANALITICO
condizione sufficiente, 30
condizioni iniziali, 107
confronto, 42
confronto fra grandezze, 93
confronto fra segmenti, 166
congettura, 30
congettura di Goldbach, 57
congiunzione, 31, 118
congruenza, 51
congruo, 50
conica, 182
connesso, 113
connettivi logici, 32, 118
cono, 182, 196
cono indefinito, 196
cono retto, 196
conseguenti della proporzione, 92
conseguenza logica, 29
contadini russi, 48, 55, 62
contare, 20
contenuto, 12
contesto, 117
contiene propriamente, 12
continuit`a, 86
continuo, 23
contraddizione, 32, 119
controesempio, 37
contropositiva, 33
convergenza, 230
coordinata, 200
coordinate, 200
coordinate ortogonali, 200
coppie equivalenti, 67
coprimi, 53
corda, 184
corollario, 30
corona circolare, 187
corpo, 161
corrispondenza, 15
corrispondenza biunivoca, 18
corrispondenza inversa, 18
cosecante, 221
coseno, 218
costante, 134
costruzione geometrica, 165
cotangente, 219
Cotes, R. (1682 1716), 227
criteri di similitudine, 175
criterio della scommessa, 82
criterio di allineamento, 206
criterio di divisibilit`a, 52
crivello di Eratostene, 55
cubo, 62, 194, 195
cubo perfetto, 62
curva, 202

de la Vallee Poussin, C. J. (1866 1962), 58


De Morgan, A. (1806 1871), 13, 36, 121
decile, 129
decimale finito, 73
decimale periodico, 73
decimi, 72
Dedekind, R. (1831 1916), 81, 86
definitivamente, 82
del Ferro, S. (1465 1526), 155
delta di Dirac, 232
denominatore, 69
densit`a dei primi, 58
densit`a, 72
derivata, 240
derivazione, 117
derivazione sinistra, 118
Desargues, 199
Descartes, 199
Descartes, R. (1596 1650), 133
determinante, 145
determinante del sistema, 145
deviazione standard, 126
diadica, 19
diagonale, 172
diagonalizzazione di Cantor, 78
diagramma di Hasse, 17, 113
diagramma di Venn, 12
diametro, 182
diedro, 191
Dieudonne, J. (1906 1992), 99
differenza, 12, 44
differenza simmetrica, 12
differenziale, 240
dimostrare, 29
dimostrazione per assurdo, 33
Diofanto (III sec. d. C.), 147
Dirac, P. (1902 1984, 232
direttrice della parabola, 183
direzione del fascio, 174
discontinuit`a di 1a specie, 233
discontinuit`a di 2a specie, 233
discontinuit`a di 3a specie, 233
discontinuit`a fittizia, 233
discriminante, 141
disequazione, 148
disgiunti, 12
disgiunzione, 32, 118
dispari, 52
dispersione, 126
disposizioni, 100
distanza, 186, 202, 213
distanza di sue rette parallele, 175
distanza di un punto da una retta, 170
distanza tra due rette, 192
distanza verticale, 211

260
distribuzione, 123, 127
distribuzione di Poisson, 129
distribuzione normale, 128
distribuzione pseudocasuale, 127
distribuzione uniforme continua, 127
disuguaglianza triangolare, 202
divergere, 230
diverso, 42
dividendo, 49
divisibile, 49
divisibilit`a, 49
divisione, 49
divisione decimale, 72
divisione esatta, 49, 137
divisione intera, 49, 72
divisioni successive, 26
divisore, 49
divisore dello zero, 161
dodecaedro, 195
dominio, 18
dominio di integrit`a, 161
doppia implicazione, 30, 32
Dostoevskij, F. (1821 1881), 124
Einstein, A. (1879 1955), 215
elemento, 11
elevamento a potenza, 61
ellisse, 182
ellissi, 11
emivita, 234
Enrico IV di Francia (1553 1610), 122
equazione, 137
equazione reciproca, 155
equazione algebrica, 138
equazione biquadratica, 155
equazione completa, 206
equazione impossibile, 140
equazione indeterminata, 140
equazione irrazionale, 142
equazione parametrica, 150
equazione reciproca, 155
equazione ridotta, 156
equazione trigonometrica, 225
equazione trinomia, 155
equazioni equivalenti, 138
equipotenza, 21
equiprobabile, 126
equiscomponibilit`a, 194
equivalenza, 118
equivalenza tra solidi, 194
Eratostene (276 194 a. C.), 55
Erone (II - I sec. a.C.), 228
errore assoluto, 95
errore relativo, 95
esaedro, 195
esagono, 171

INDICE ANALITICO
esclusione, 32
esplementare, 168
esponente, 61, 81
espressione aritmetica, 90
espressione parentesizzata, 116
estensione, 12, 14, 66, 84, 176
estensione algebrica, 152
estremi della proporzione, 92
estremi della somma, 64
estremi di integrazione, 251
estremi di un segmento, 165
estremo inferiore, 230
estremo superiore, 229
Euclide, 59
Euclide (325 265 a. C.), 29, 39, 211, 213
Euler, L. (1707 1783), 57, 111, 128, 217
eventi favorevoli, 122
eventi indipendenti, 123
eventi possibili, 122
faccia, 114
faccia laterale, 193, 194
falsicabilit`a, 37
fascio di rette, 174
fattore, 46, 49, 137
fattore differenziale, 255
fattore finito, 255
fattoriale, 63
Fermat, 199
Fermat P. de, 59
Fermat, P. de (1601 1665), 199
Ferrari, L. (1522 1565), 155
Fibonacci, L. (1170 1250), 24, 25, 60, 73, 88
figlio, 112
figura limitata, 182
figure cosmiche, 196
figure equiscomponibili, 177
figure equivalenti, 177
flesso, 241
fluttuazione statistica, 125
forma canonica, 31, 138, 148
forma canonica congiuntiva, 121
forma canonica di una retta, 203
forma canonica disgiuntiva, 121
forma normale, 31, 144
forme enunciative, 35
forme indeterminate dei limiti, 232
forme proposizionali, 35
formula analitica, 18
formula asintotica, 58
formula di Cramer, 145
formula di triplicazione, 222
formula ridotta, 141
formule dellangolo complementare, 219
formule dellangolo supplementare, 220
formule di bisezione, 222

261

INDICE ANALITICO
formule di duplicazione, 222
formule di prostaferesi, 224
formule di Simpson, 224
formule di somma e sottrazione, 222
formule di Werner, 224
Fourier, J. B. (1768 1830), 49
Fraenkel, A. (1891 1965), 14
frazione, 68, 69
frazione apparente, 70
frazione impropria, 70
frazione propria, 70
frazione unitaria, 68
frazioni equivalenti, 69
frazioni parziali, 136
Frege, G. (1848 1925), 13
frequenza, 123
frequenze attese, 130
funzione, 17
funzione biunivoca, 18
funzione caratteristica, 19, 100
funzione continua in un intervallo, 232
funzione continua in un punto, 232
funzione derivabile, 240
funzione derivata, 240
funzione esponenziale, 237
funzione identica, 18
funzione iniettiva, 18
funzione integrale, 251
funzione invertibile, 18
funzione moltiplicativa, 54
funzione primitiva, 252
funzione razionale in seno e coseno, 254
funzione surgettiva, 18
funzioni elementari, 253
funzioni periodiche, 219
funzioni razionali fratte, 136, 162
fuoco dellellisse, 182
fuoco delliperbole, 183
fuoco della parabola, 183
K. (1906 1978), 29
Gdel,
Galilei, G. (1564 1642), 22, 24, 200, 214
Galileo, 90
Galois, E. (1811 1832), 155
Gauss, 74
Gauss, F. (1777 - 1855), 213
Gauss, F. (1777 1855), 58, 128
genera, 118
genera immediatamente, 117
generatrice, 196
generatrice del cono, 182
genitore, 112
geometria ellittica, 214
geometria iperbolica, 213
geometria parabolica, 213
gettone, 108

Gherardo da Cremona (1114 1187), 24


gioco equo, 124
Goldbach, C. (1690 1764), 57
GPS, 225
gradi decimali, 219
gradi di libert`a, 130
grado, 113, 138, 148, 167
grado duscita, 113
grado di ingresso, 113
grado di un monomio, 134
grado di un polinomio, 134
grado di un sistema, 144
grafico, 157
grafico di una funzione, 244
grafo, 113
grafo bipartito, 113
grafo connesso, 113
grafo orientato, 113
grafo pesato, 113
grafo planare, 114
grammatica context-free, 117
grammatica di tipo 0, 116
grammatica di tipo 2, 116
grammatica formale, 116
grammatica libera dal contesto, 117
grammatica non ambigua, 118
grandezza, 93
grandezza analogica, 93
grandezza continua, 93
grandezza digitale, 93
grandezza discreta, 93
grandezza fisica, 93
grandezza matematica, 93
grandezze direttamente proporzionali, 93
grandezze inversamente proporzionali, 93
grandezze proporzionali, 93
gruppo, 38
gruppo abeliano, 159
gruppo ciclico, 160
gruppo commutativo, 159
Hadamard, J. (1865 1963), 58
Hasse, 113
Hasse, H. (1898 1979), 17
Hausdorf, 199
Hilbert, D. (1862 1943), 164, 214
icosaedro, 195
identit`a, 20, 35, 104, 138
identit`a destra, 20
identit`a trigonometrica fondamentale, 219
immagine, 18
immagine inversa, 18
implicazione, 30, 32
impossibilit`a, 123
incentro, 181

262
incognita, 133
incommensurabile, 77
indeterminata, 133
indice, 64
indipendenza, 29
indistinguibile, 108
induzione matematica, 34
inferiormente limitato, 229
infinito, 230
insieme, 11
insieme delle parti, 13
insieme di arrivo, 18
insieme di partenza, 18
insieme discreto, 72
insieme finito, 18
insieme infinito, 22
insieme limitato, 229
insieme quoziente, 16
insieme universale di connettivi, 121
insieme universo, 13, 122
insieme vuoto, 12
insiemi equipotenti, 21
insiemi finiti, 99
insiemi uguali, 12
integrale definito, 251
integrale improprio, 256
integrale indefinito, 252
integrazione per parti, 255
integrazione per sostituzione, 253
intensione, 12, 14
intercetta, 31, 204
interesse, 95
interesse composto, 96
interesse semplice, 95
intero negativo, 65
intero positivo, 65
interpolazione lineare, 224
intersezione, 12
intervalli di separazione, 157
intervallo, 86
intervallo aperto, 86
intervallo chiuso, 86
intorno, 199
inversa composizionale, 18
inverso, 38
invertendo, 92
invertibile, 18
involuzione, 106
iperbole, 183
iperbole equilatera, 210
ipotesi, 30
Ippaso di Metaponto, 77
isomorfismo, 66
isomorfo, 81, 154
istogramma, 123

INDICE ANALITICO
Kepler, J. (1571 1630), 210
Keplero, J. (1571 1630), 197
Khayyam O. (c. 1050 1122, 212
kilogrammo, 93
Klein, F. (1849 - 1925), 213
LHopital, G.-F.-A. de (1661 1704), 245
laccio, 113
Lagrange, G. L. di (1736 1813), 246
Lagrange, J. L. (1736 1813), 160
lati del triangolo, 170
lato obliquo, 173
Le Corbusier (1887 1965), 180
Lebesgue, H. L. (1875 1941), 250
Lebesgue, H.-L. (1875 1941), 217
legge dei grandi numeri, 129
legge dell80/20, 130
legge di Pareto-Zipf, 130
Leibniz, 90
Leibniz, G. (1646 - 1716), 217
lemma, 30
lessicografico, 17
lettera, 37
limite, 199, 230
limite destro, 233
limite inferiore, 229
limite notevole, 233
limite sinistro, 233
limite superiore, 229
linearizzazione, 115
linguaggio formale, 116
linguaggio generato, 118
Lobacevsky, N. (1792 1856), 170
Lobacevskij, N. (1793 - 1856), 213
logaritmi per difetto, 63
logaritmi per eccesso, 63
logaritmo, 62, 86, 89
logaritmo integrale, 255
logaritmo naturale, 90, 237
Logica, 31
logica delle proposizioni, 31
logistica, 24
Lucrezio (c. 98 c. 55 a.C.), 229
lunghezza, 167
luogo di punti, 180
luogo geometrico, 180
macchina analitica, 13
maggiore, 42
maggiore o uguale, 42
mantissa, 81, 236
massimo, 61, 229
massimo assoluto, 239
massimo comun divisore, 59, 140
massimo comune multiplo, 140
massimo relativo, 239

263

INDICE ANALITICO
matematica finanziaria, 95
matrice, 145
matrice del sistema, 145
medi della proporzione, 92
media, 125
media aritmetica, 126
media aritmetico/geometrica, 191
media armonica, 126
media geometrica, 126
mediana, 126, 173
medio proporzionale, 93
membro destro, 91, 137
membro sinistro, 91, 137
metodo congruenziale, 127
metodo del chi quadro, 130
metodo delle sezioni, 81
metodo di Newton, 88
metodo egizio, 168
metrica, 213
metro, 167
millesimi, 72
minimo, 61, 229
minimo assoluto, 239
minimo comune multiplo, 60
minimo relativo, 239
minore, 42
minore o uguale, 42
minuendo, 44
minuto, 27
minuto primo, 27
minuto secondo, 27
misura, 11, 93, 166, 200
misura in radianti, 218
moda, 126
modello, 28, 30
modello combinatorio, 108
modello delle urne, 108
modello relazionale, 15
modulo, 49
modulor, 180
modus ponens, 32
modus tollens, 32
molteplicit`a, 56
moltiplicando, 46
moltiplicatore, 46
moltiplicazione, 45
monadica, 19
Monge, 199
monoide, 37, 159
monomi simili, 134
monomio, 134
montante, 97
multiplo, 49, 137
multiplo di un segmento, 166
n-upla, 15, 103

nand, 121
Napier, J. (1560 1617), 90, 227
Nasir Eddin (v. Al-Tusi N. E.), 212
negazione, 31, 118
Nepero, v. Napier, J., 90
Newton I. (1643 1727), 223
Newton, I. (1642 1727), 217
Newton, I. (1643 1727), 25
nodo, 113
nor, 120
notazione a cicli, 104
notazione a stecchini, 25
notazione ad aste, 25
notazione arabica, 25
notazione funzionale, 19, 20, 104
notazione infissa, 20
notazione posizionale, 25
notazione postfissa, 20
notazione prefissa, 20
notazione vettoriale, 103
numerabile, 22
numeratore, 69
numerazione primitiva, 25
numerazione romana, 24
numeri amicabili, 59
numeri armonici, 82
numeri coniugati, 154
numeri di Catalan, 116
numeri di Fibonacci, 60
numeri discordi, 65
numeri figurati, 109
numeri immaginari, 153
numeri negativi, 65
numeri pentagonali, 110
numeri poligonali, 109
numeri primi tra loro, 53
numeri quadrati, 109
numeri reali computabili, 79
numero, 11, 20
numero algebrico, 78
numero cardinale, 14, 21
numero composto, 53
numero di Eulero, 237
numero frazionario, 68
numero intero, 65, 67
numero irrazionale, 78
numero naturale, 21
numero normalizzato, 81
numero ordinale, 14
numero perfetto, 58
numero primo, 53
numero pseudoreale, 79
numero razionale, 72
numero reale, 84
numero trascendente, 79

264
numero triangolare, 109
oggetti combinatori, 108
Omar Khayyam (v. Khayyam O.), 212
operazione, 19
operazione associativa, 20
operazione binaria, 19
operazione chiusa, 20
operazione commutativa, 20
operazione diadica, 19
operazione idempotente, 20
operazione monadica, 19
operazione ternaria, 19
operazione triadica, 19
opposti al vertice, 168
opposto, 66, 159
ordinamento, 16
ordinamento lessicografico, 17
ordinamento parziale, 17
ordinamento totale, 17
ordinata di un punto, 200
ordine stretto, 16
orientamento della retta, 200
origine, 165, 200
origine delle coordinate, 200
ortocentro, 181
osservazione, 30
ottaedro, 195
pallina, 108
parabola, 183
paradosso di Russell, 13
parallela, 192
parallelogramma, 172
parametro, 133, 150
parentesi graffe, 91
parentesi quadre, 91
parentesi tonde, 91
Pareto, V. (1848 1923), 129
pari, 52
parola, 37
parola vuota, 37
parte letterale, 134
parte numerica, 134
partizione, 16
partizioni di un intero, 128
Pascal, 90
pavimento, 63
Peano G., 21
Peano G. (1858 1932), 63
Peano, G. (1858 1932), 217
Peirce, C. (1839 1914), 121
pendenza, 31, 204
pentagono, 171
percentile, 129
percentuale, 94

INDICE ANALITICO
periodo, 160
permanenza, 142
permutando, 92
permutazione dispari, 106
permutazione pari, 106
permutazioni, 100
peso, 113
peso di un cammino, 113
piani paralleli, 191
piani perpendicolari, 193
piano cartesiano, 15
piano dArgand, 153
piede, 192, 193
piede della perpendicolare, 170
piramide, 194
piramide indefinita, 194
piramide regolare, 194
piramide retta, 194
Pitagora, 68, 69, 77
Pitagorici, 58
pitagorici, 39
Platone (427 347 a. C.), 39, 211, 214
Poisson, S. D. (1781 1840), 129
poliedro, 195
poliedro archiemdeo, 196
poliedro regolare, 195
poligonale, 170
poligoni simili, 175
poligono, 170
poligono concavo, 171
poligono convesso, 170
poligono intrecciato, 171
poligono regolare, 171
polinomio, 134
polinomio irriducibile, 139
polinomio primo, 140
Popper, Karl (1902 1994), 37
postulato, 28
potenza, 21
potenza di un binomio, 134
potenza di un punto, 186
potenza perfetta, 62
precedere, 17
precisione, 79
predicato, 18, 31
prestito, 44
primi gemelli, 58
primitiva, 252
primo, 53, 167
principio del massimo e del minimo, 239
principio del terzo escluso, 32
principio di inclusione ed esclusione, 54
principio di induzione, 34
principio di non contraddizione, 32
prisma, 193

265

INDICE ANALITICO
prisma indefinito, 193
prisma retto, 193
probabilit`a, 122
probabilit`a a-posteriori, 125
probabilit`a a-priori, 125
probabilit`a statistica, 125
problema del trasporto, 148
problema dellordinamento, 106, 112
problema della ricerca, 111
problema delle parallele, 212
problema indecidibile, 147
problema intrattabile, 106
problema NP, 106
problema NP completo, 35
prodotto, 37, 46, 104
prodotto cartesiano, 15
prodotto notevole, 135
prodotto scalare, 93
produzione, 116, 117
programmazione lineare, 148
progressione, 73
progressione aritmetica, 73
progressione geometrica, 74
proporzione, 92
proposizione, 30, 31
propriet`a controsimmetrica, 17
propriet`a di aggiunzione, 43, 46
propriet`a di antimonotonia, 44
propriet`a di assorbimento, 20
propriet`a di eliminazione, 41, 43, 46
propriet`a di monotonia, 43, 46
propriet`a dissociativa, 41, 46
propriet`a distributiva, 13, 20, 46
propriet`a riflessiva, 15
propriet`a simmetrica, 16
propriet`a transitiva, 16
proprit`a antiriflessiva, 16
prostaferesi, 224
prova del nove, 52
punti allineati, 165
punto allinfinito, 199
punto decimale, 79
punto di discontinuit`a, 232
punto fisso, 104
quadrante, 201
quadrato, 62, 172
quadrato perfetto, 62
quadratura del cerchio, 186
quadrica, 199
quadrilatero, 171
quadrilatero di Saccheri, 212
quantificatore esistenziale, 36
quantificatore universale, 35
quartile, 129
quarto proporzionale, 93

quoziente, 49
radiante, 167, 218
radicale doppio, 89
radice, 35, 86
radice cubica, 62
radice di un albero, 112, 114
radice di un polinomio, 138
radice perfetta, 62
radice quadrata, 62, 87
radici per difetto, 63
radici per eccesso, 63
raggio, 182
raggio del ciclindro, 196
raggio della sfera, 197
ragione, 73, 74
Ramanujan, S. A. (1887 1920), 89
ramo, 114
rango, 18, 126
rapporto, 93
rapporto armonico, 179
rapporto aureo, 179
rapporto incrementale, 240
rapporto tra segmenti, 166
rappresentazione decimale, 25
razionalizzazione, 88, 136
Recorde, R. (1510 1558), 133
regola dei segni, 66
regola del prodotto, 138
regola della catena, 241
regola della somma, 138
regola delle diagonali, 146
regola di inferenza, 30
regola di Ruffini, 139
regola di Sarrus, 146
regolo calcolatore, 90
relazione, 15
relazione binaria, 14
relazione dordine, 17
relazione dordine parziale, 17
relazione di equivalenza, 15
relazione di Eulero, 115
resto, 49
rettangolo, 172
rette parallele, 169
rette perpendicolari, 168
rette sghembe, 192
ricerca binaria, 111
ricoprire, 16
ricorsione, 63
riduzione ai minimi termini, 70
riduzione modulo, 50
Riemann, G. F. B. (1826 - 1866), 213
Riemann, G. F. B. (1826 1866), 170
riporto, 40, 47
risoluzione dei triangoli, 225

266
risolvente, 157
Rivest, 54
Rolle, M. (1652 1719), 246
rombo, 172
rovescione, 52
Russell, B., 32
Russell, B. (1872 1970), 13
Saccheri, G. (1667 - 1733), 212
salto, 233
Sarrus, P.-F. (1798 1861), 146
scala, 201
scala esponenziale, 201
scala logaritmica, 201
scala naturale, 68
scala pitagorica, 68
scala quadratica, 201
scala temperata, 68
scalatura, 48
scodella, 197
scomponendo, 92
scomposizione in fattori primi, 56
scomposizione in frazioni parziali, 146
sconto, 95
secante, 221
secondo, 27, 167
segmenti incommensurabili, 166
segmenti uguali, 165
segmento, 165
segni opposti, 65
semiperimetro, 226, 228
semipiano, 165
semiretta, 165
semispazio, 191
seno, 218
senso antiorario, 206
senso geometrico, 164
senso orario, 206
senso spaziale, 164
separazione, 11
sequenza, 81
sequenza di Fibonacci, 60
sequenza per rango, 126
sequenza vuota, 100
serie di potenze, 238
settore circolare, 184
sezione, 81, 85
sezione aurea, 179
sezione normale del diedro, 193
sfera, 197
simbolo, 37
simbolo di appartenenza, 12
simbolo di somma, 64
simbolo iniziale, 117
simbolo non terminale, 117
simbolo terminale, 117

INDICE ANALITICO
similitudine, 175
simulare, 38
simulazione, 124
sistema di coordinate cartesiane, 200
sistema di disequazioni, 148
sistema di equazioni, 144
sistema impossibile, 145
sistema indeterminato, 145
sistema lineare, 144
sistemi diofantei, 147
soddisfacibilit`a, 35
soffitto, 63
solido platonico, 195
soluzione, 35, 137, 148
soluzione del sistema, 144
soluzione estranea, 143
somma, 41, 65, 93
somma di due angoli, 166
somma di grandezze, 93
somma di segmenti, 165
somma e sottrazione, 144
soprainsieme, 12
sostegno, 159
sostituzione, 144
sottoalbero, 112
sottografo, 113
sottogruppo, 159
sottogruppo ciclico, 160
sottoinsieme, 12
sottoinsieme proprio, 12
sottomultiplo di un segmento, 166
sottraendo, 44
sottrazione, 44
spazio di Hausdorf, 199
spazio Euclideo, 199
spazio metrico, 199, 202
spigolo, 113, 191
spirale armonica, 179
statistica, 122
stenaritmia, 53, 87
Stevin, 65
Stirling, J. (1692 1770), 103
stringa, 37
struttura algebrica, 37, 159
struttura dati, 111
successione, 81
successione di Cauchy, 82, 230
successione di Fibonacci, 73
successione monotona, 230
successione numerica, 73
successioni equivalenti, 83
superficie laterale, 194
superficie totale, 194
superiormente limitato, 229
supplementare, 168

267

INDICE ANALITICO
sviluppo piano, 195
tabella della somma, 40
tabella di verit`a, 31, 118
tale che, 12
tangente, 182, 218
Tartaglia, N. (1499 1557), 155
tasso di interesse, 95
tautologia, 119
tavola Pitagorica, 48
teorema, 30
teorema dei seni, 226
teorema del coseno, 227
teorema delle proiezioni, 227
teorema delle tangenti, 227
teorema di Briggs, 228
teorema di Cantor, 23
teorema di Carnot, 227
teorema di Coates, 227
teorema di Erone, 228
teorema di Euclide, 57
teorema di Lagrange, 160
teorema di Nepero, 227
teorema fondamentale del calcolo integrale, 252
teorema fondamentale dellAlgebra, 153
teoria, 28
teoria completa, 29
teoria della computabilit`a, 116
Teoria della misura, 124
teoria della relativit`a, 215
termine, 41
termini della proporzione, 92
terna Pitagorica, 178
terna Pitagorica primitiva, 178
tertium non datur, 32
terzo proporzionale, 93
tesi, 30
test, 127
test del chi quadro, 125, 130
tetraedro, 195
totale, 41
toziente, 53
transfinito, 22
trapezio, 172
trasformata veloce di Fourier, 49
trasformazioni lineari, 155
traslare, 165
trasposizione, 105
trattrice, 215
triadica, 19
triangolazione, 225
triangolo, 170
triangolo aritmetico, 101
triangolo armonico, 179
triangolo di Pascal, 101
triangolo di Tartaglia, 101

triangolo
triangolo
triangolo
triangolo

equilatero, 173
isoscele, 173
scaleno, 173
sferico, 215

uguaglianza, 15, 91, 165


uguale, 42
unione, 12
unione disgiunta, 12
unit`a, 161
unit`a di misura, 93, 166, 200
unit`a di misura di superficie, 167, 176
unit`a di misura di volume, 167
unit`a immaginaria, 152
urna, 108
valor medio, 125
valore assoluto, 65
valore atteso, 125
valore attuale, 97
valore del decile, 129
valore mediano, 126
valore per difetto, 82
valore per eccesso, 82
valori discordi, 65
variabile, 35, 133
variabile di somma, 64
variabile dipendente, 17
variabile indipendente, 17
variabile legata, 251
varianza, 126
variazione, 142
Venn, J. (1834 1923), 12
verit`a esistenziale, 36
verit`a esistenziale forte, 36
verso di una retta, 200
vertice, 113
vertice del cono, 182, 196
vertice dellangolo, 165
vertice delliperbole, 210
vertice della parabola, 207
vertici del triangolo, 170
vettore, 64, 103
Vi`ete, F. (1540 1603), 133, 159
Villani, G. (c. 1275 1348), 25
vincoli, 148
volume, 194
Whitehead, A. N. (1861 1947), 14
Zenone di Elea (490 430 a.C.), 229
Zermelo, E. (1871 1956), 14
zero, 20, 25
zero di un polinomio, 138
Zipf, (), 130

You might also like