Mate Matic A

Introduzione alla Matematica
La Matematica della Scuola Media

Renzo Sprugnoli
Dipartimento di Sistemi e Informatica
Viale Morgagni, 65 - Firenze (Italia)
27 settembre 2005
Indice
Introduzione
1 Il linguaggio della Matematica

1.1 Gli insiemi . . . . . . . . . . . . . . . .
1.2 Le relazioni . . . . . . . . . . . . . . .
1.3 Funzioni e operazioni . . . . . . . . . .
1.4 Il contare . . . . . . . . . . . . . . . .
1.5 Rappresentazione dei numeri naturali .
1.6 La nomenclatura della Matematica . .
1.7 Matematica e Logica . . . . . . . . . .
1.8 Predicati . . . . . . . . . . . . . . . . .
2 Aritmetica
2.1 Laddizione . . . . . . .
2.2 Confronto e sottrazione
2.3 Moltiplicazione . . . . .
2.4 Divisione . . . . . . . .
2.5 Divisibilità . . . . . . .
2.6 Numeri primi . . . . . .
2.7 Massimo comun divisore
2.8 Le altre operazioni . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Numeri
3.1 I numeri interi . . . . . . . . .
3.2 I numeri razionali . . . . . . . .
3.3 I numeri decimali . . . . . . . .
3.4 I numeri reali . . . . . . . . . .
3.5 La costruzione dei numeri reali
3.6 Potenze, radici, logaritmi . . .
3.7 Espressioni e proporzioni . . . .
3.8 Matematica finanziaria . . . . .
4 Matematiche finite
4.1 Calcolo combinatorio . . . .
4.2 Permutazioni . . . . . . . .
4.3 Problemi combinatori . . .
4.4 Strutture dati . . . . . . . .
4.5 Il modello delle parole . . .
4.6 Il calcolo delle proposizioni
4.7 Calcolo delle probabilità . .
4.8 Distribuzioni . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
14
17
20
24
28
31
35
.
.
.
.
.
.
.
.
39
39
42
45
49
51
55
58
61
.
.
.
.
.
.
.
.
65
65
68
72
77
81
86
90
95
.
.
.
.
.
.
.
.
99
99
103
106
111
115
118
122
126
4
5 Algebra
5.1 Calcolo letterale . . . . . . .
5.2 I polinomi . . . . . . . . . . .
5.3 Risoluzione delle equazioni . .
5.4 Sistemi di equazioni . . . . .
5.5 Disequazioni . . . . . . . . . .
5.6 Numeri complessi . . . . . . .
5.7 Equazioni di grado superiore
5.8 Algebra astratta . . . . . . .
INDICE
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
133
133
136
140
143
147
151
155
158
6 Geometria Euclidea
6.1 Le basi della Geometria . . . . .
6.2 Perpendicolarità e parallelismo .
6.3 Congruenza e similitudine . . . .
6.4 La misura delle superfici . . . . .
6.5 Luoghi geometrici . . . . . . . . .
6.6 La geometria della circonferenza
6.7 Poligoni regolari e cerchio . . . .
6.8 Geometria dello spazio . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
163
163
168
172
176
180
183
187
191
7 Le altre Geometrie
7.1 Coordinate Cartesiane . . . . . .
7.2 Lequazione della retta . . . . . .
7.3 La parabola . . . . . . . . . . . .
7.4 Circonferenza, ellisse e iperbole .
7.5 Geometrie non-Euclidee . . . . .
7.6 Geometria descrittiva e proiettiva
7.7 Topologia . . . . . . . . . . . . .
7.8 Gli spazi vettoriali . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
199
199
202
206
208
211
215
215
215
8 Trigonometria e Calcolo
8.1 Le funzioni trigonometriche . . . .
8.2 Le formule di somma e sottrazione
8.3 Risoluzione dei triangoli . . . . . .
8.4 Il concetto di limite . . . . . . . . .
8.5 Logaritmo ed esponenziale . . . . .
8.6 Il calcolo differenziale . . . . . . .
8.7 Lo studio delle funzioni . . . . . .
8.8 Il calcolo integrale . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
217
217
221
225
229
234
238
244
249
.
.
.
.
.
.
.
.
Introduzione
noscenze umanistiche, quali la storia, la filosofia e la
stessa letteratura.
Si pensi, per fare qualche esempio, alla determinazione delletà dei reperti archeologici con il metodo del carbonio, allo studio statistico dellevoluzione
di una lingua, ai modelli matematici dellequilibrio
biologico di un determinato ambiente, alle strutture spaziali delle molecole, alle grammatiche formali
per comprendere la struttura di un linguaggio. Oggi,
poi, la diffusione pervasiva degli elaboratori elettronici richiede unimpostazione mentale e un bagaglio di
conoscenze di natura tecnologica e astratta, se non
si vuole rimanere utenti puramente passivi di macchine che inglobano in se, nei loro programmi, conoscenze logiche e matematiche molto profonde. E
se queste macchine ci risparmiano lavoro di routine
e la necessità di dover eseguire calcoli tanto numerosi quanto banali, non ci esimono dal conoscere i
loro principi operativi (algoritmi e programmi) pena
una sudditanza, psicologica ed economica, da chi è in
grado di controllare queste macchine e quindi la parte di mondo, sempre pi`
u grande, che queste macchine
controllano.
Queste ed altre considerazioni ci spingono a tentare
di riunire in un unico testo, di dimensioni abbastanza
ridotte, le conoscenze di cui uno studente dovrebbe
essere padrone alla fine dei suoi studi elementari e
medi, e che quindi costituiscono il bagaglio di nozioni
con cui affrontare gli studi universitari. Da un punto di vista puramente pratico, perciò, è qui raccolta
tutta la Matematica che serve per laccesso a un Corso di Laurea di tipo scientifico o tecnologico di una
nostra Università, sia per poter seguire utilmente gli
insegnamenti del primo anno, sia per superare i test
per laccertamento dei debiti formativi in Matematica, attualmente previsti. Questo testo ha lambizione
di poter colmare le eventuali lacune degli studenti che
intendono iscriversi al primo anno di Università.
AVVERTENZA
Queste note devono ancora essere messe a
punto. Lautore è consapevole del fatto che
esse contengono errori di forma e di sostanza.
I lettori sono invitati a segnalare tutto ciò che
ritengono scorretto o comunque da modificare, togliere e aggiungere. Di tali segnalazioni
lautore ringrazia anticipatamente.
c R. Sprugnoli, 2002.
1. La conoscenza della Matematica è diventata

unesigenza fondamentale del mondo moderno, dove
la scienza e la tecnica costituiscono una parte importante della cultura di ciascuna persona, che incontra, ad ogni passo, riferimenti precisi ai concetti
matematici. Intorno al 1600, Galileo aveva puntualizzato linizio del pensiero moderno affermando che
la natura è un libro scritto in termini matematici, e
pertanto la Matematica è lo strumento fondamentale
per la conoscenza della natura. Con questo spirito si
è sviluppata la scienza moderna, che ha fatto della
Matematica un punto di riferimento e un ideale da
perseguire. Ma mentre nel 1700 e nel 1800 la scienza
e la tecnica erano appannaggio di una stretta minoranza di persone, con il 1900 la base si è enormemente
allargata ed ora, allinizio del terzo millennio, le persone che hanno la necessità di usare la Matematica
per il proprio lavoro sono diventate la maggioranza.
Spesso la conoscenza della parte tecnica della Matematica è limitata alle nozioni che si apprendono alle
scuole elementari e medie, sia inferiori che superiori;
comunque, queste conoscenze formano la base indispensabile per acquisire le tecniche pi`
u evolute che si
insegnano nelle Università. Il sapere matematico è
un sapere unitario, che non permette frammentazioni, e una lacuna in un qualsiasi settore, laritmetica,
lalgebra o la geometria, costituisce di fatto una mancanza in tutte le altre parti della Matematica. Per
questo la cosiddetta Matematica elementare è una
base di conoscenza dalla quale è difficile prescindere
se si vuole avere accesso alle conoscenze del mondo
scientifico e tecnologico, mondo che sempre pi`
u invade anche i campi tradizionalmente riservati alle co-
2. La Matematica non è solo una serie di nozioni

tecniche che permettono di risolvere problemi pratici, ma è anche, e soprattutto, un modo di pensare e
un atteggiamento culturale. Per i Greci, che queste
cose le avevano inventate, non cera distinzione tra la
Matematica (la Geometria) e la Filosofia. Talete e
5
6
Pitagora prima, Platone e Aristotele poi videro nella
Matematica la forma perfetta del sapere; solo Socrate
sembra non conformarsi a questa idea, ma sulla porta dingresso dellAccademia platonica stava scritto
Nessuno entri che non conosca la Geometria. Il ragionamento, nella vita di tutti i giorni come nella filosofia pi`
u astratta, segue un modello che è quello della
Matematica, quello che la Matematica ha portato a
un rigore assoluto.
La necessità, il gusto della dimostrazione rigorosa
si apprendono pienamente con la Matematica; questa
dà anche i limiti di applicabilità del metodo deduttivo, che, ad esempio, non può entrare in un regressus ad infinitum, ma deve fondarsi su qualcosa che
diamo per buono e per certo: ed è proprio la Matematica che ci fa capire come questo qualcosa di fondante abbia un senso o lo acquisti in un sistema di
assiomi che si autosostengono. E anche senza arrivare a queste finezze che confinano con la filosofia,
la Matematica ci dà la forma mentis necessaria ad
affrontare, in modo rigoroso, tanto lo studio della natura quanto quello delluomo. Per questo motivo ho
voluto inserire in queste pagine la dimostrazione di
tutti i teoremi enunciati: le eccezioni credo si contino
sulle dita di una mano; e ho cercato di essere semplice e chiaro e allo stesso tempo rigoroso. Questo
è pi`
u di quanto si faccia normalmente nella scuola,
che spesso (secondo me sbagliando) si accontenta di
enunciare risultati da usare per risolvere gli esercizi
ed essere promossi alla classe successiva. Il senso e
lamore del ragionamento vanno cos` a sperdersi e la
Matematica diviene una sequenza di nozioni, da applicare quando necessario, invece di un fatto culturale
che forma la mentalità delle persone e fa da riferimento nellaffrontare la realtà che ci circonda (anche se
mia moglie sostiene che è meglio cos`!) Analogamente, va coltivato il gusto delle definizioni precise, che
puntualizzano idee e concetti, spesso piuttosto vaghi
nel loro uso quotidiano, e quindi a rischio di diventare ambigui quando si cerchi di portarli alle estreme
conseguenze, procedimento utile tutte le volte che si
voglia criticare un atteggiamento o unimpostazione,
facendo vedere le estreme conseguenze (negative) a
cui potrebbe condurre. E, nello stesso spirito, ho cercato anche di introdurre vari concetti dei fondamenti
della Matematica, attraverso i quali spero di chiarire
cosa si intende per teoria, sia nella Matematica, sia
in qualsiasi altro settore del sapere umano.
INDICE
parte e di Apollonio dallaltra. Indubbiamente, questo fu favorito da una inadeguata rappresentazione
dei numeri e dalla mancanza di unAlgebra formalizzata. Quando però, dopo Viète, Fermat e Cartesio,
lAlgebra (nel senso lato che oggi vi farebbe comprendere anche lAnalisi) prese il sopravvento, un tradimento fu perpetrato nei confronti di tutta la Matematica. La Geometria contemplava due metodologie
distinte, anche se utilizzate indifferentemente: la dimostrazione astratta e la costruzione geometrica. Ad
esempio, la prova che gli angoli alla base di un triangolo isoscele sono uguali (Teorema 6.12) è puramente
astratta e fa riferimento solo a costatazioni di fatto
e a risultati già noti. Il teorema di Pitagora, invece,
nella prova per mezzo del primo teorema di Euclide
(osservazione dopo il Teorema 6.27) fa uso di una costruzione, senza la quale la dimostrazione fallirebbe.
Allorche lAlgebra si impose alla Geometria, questultima tipologia di dimostrazione fu relegata in secondo
piano e, quando possibile, evitata.
La dimostrazione astratta è, idealmente, atemporale. Si svolge nel tempo, come tutte le faccende umane, ma questo sembra e vuol essere pi`
u un accidente
che una parte intrinseca della prova. Si fanno certe valutazioni che valgono indipendentemente dal
momento in cui le facciamo; usiamo assiomi o teoremi già dimostrati, che vengono prima logicamente,
ma che ci rifiutiamo di considerare veri temporalmente prima del teorema che stiamo dimostrando e che
ne fa uso. In altre parole, un teorema deve valere indipendentemente dal tempo, sia del momento in cui
è stato dimostrato (il che sembra ovvio), ma anche
a prescindere da azioni che debbono essere eseguite
per dimostrarlo, e questo è un po meno ovvio. La costruzione geometrica, invece, non può prescindere dal
tempo: prima si fanno certe cose e poi se ne fanno altre, che non si sarebbero potute fare se non avessimo
completato quelle precedenti.
Lidea di una Matematica statica, del pensare che

la Matematica è quella che è risulta, proprio nel suo
essere vagamente blasfema, un qualcosa di attraente,
e pi`
u volte è stata riecheggiata da vari matematici, come il Dio creò i numeri e il resto fu fatto dalluomo
di Frege e di Platone. E anche, però, una concezione vecchia che fa della Matematica uno strumento di
studio, cioè di indagine di una natura scritta in caratteri matematici, piuttosto che di una Matematica
volta a operare nel mondo e quindi a provare interessi per i procedimenti e non solo pei teoremi. Daltra
parte, gli antichi avevano già chiara questa differenza

3. Fino al 1600 la Matematica è stata essenzial- ed è nota laffermazione di Proclo sulla Geometria,
mente Geometria. Se si escludono Pitagora e i suoi nella quale si distinguono problemi e teoremi; i priseguaci di tutti i tempi, che ritenevano il numero co- mi contengono la generazione delle figure, i secondi
stituire lessenza dellUniverso, tutta la Matematica dimostrano le proprietà delle figure.
ruotava intorno alla Geometria, di Euclide da una
In effetti, i procedimenti o, come è pi`
u adeguato
INDICE
oggi dire, gli algoritmi sono da 300 anni relegati al
ruolo secondario di Matematica applicata, considerata spesso uno o pi`
u gradini inferiore alla Matematica Pura. Ad esempio, il metodo di Gauss per
la risoluzione dei sistemi lineari, di natura puramente algoritmica, è pressoche ignorato nei testi di Matematica e relegato in quelli di Calcolo Numerico.
Ognuno ricorda come lunico algoritmo menzionato
dai programmi della scuola è quello di Euclide per il
calcolo del massimo comun divisore, ma nessuno lo
impara, perchè docenti e studenti preferiscono altri
metodi.
Oggi, però, laffermarsi dellInformatica ha riportato linteresse per le soluzioni costruttive dei problemi, cioè per gli algoritmi, che costituiscono proprio la base teorica della programmazione. Gli algoritmi, tuttavia, non sono semplicemente un modo
astratto per arrivare a programmare un elaboratore; essi sono una metodologia per affrontare problemi
di qualsiasi natura e, quindi, per farne uno studio e
darne una soluzione rigorosa, analoga ad un teorema, anche se concettualmente diversa. Gli algoritmi
hanno influenzato anche parte della logica e stanno
prendendo piede in molte parti della Matematica (si
pensi al classico caso delle basi di Groebner). Cos`
le due metodologie antiche della Geometria classica,
quella deduttivo-astratta e quella costruttiva, stanno
avvicinandosi di nuovo. In questo testo ho cercato di
seguire tale linea, anche se il risultato è a mio parere
ancora molto parziale poiche, con mentalità tuttora
vecchia, non riesco ad amalgamarle, e continuo a vedere il teorema come la fase di controllo della verità
di un risultato e lalgoritmo come il metodo di risoluzione pratica di un problema, che basa la propria
validità su un opportuno teorema.
4. Cè, credo, una differenza fondamentale tra lo

studio delle materie umanistiche e quello delle discipline scientifiche. Lo studio delle prime si svolge,
idealmente, dal particolare al generale, mentre lapprendimento delle seconde passa dal generale al particolare. Se, ad esempio, voglio capire che cosè lo
Sturm und Drang, è essenziale che io legga almeno
le opere principali degli autori che si rifanno a quel
movimento letterario. Solo prendendo atto delle somiglianze e delle differenze che esistono tra i vari autori, delle idee e delle emozioni che ciascuno di loro
esprime o cerca di esprimere, mi posso fare unidea
generale di cosa sia lo Sturm und Drang. Spesso è utile leggere quello che è stato scritto sullo Sturm und
Drang: un esperto professionista è capace di mettere in evidenza aspetti che abbiamo appena intuito o
che non abbiamo afferrato nella loro importanza; un
critico geniale può esprimere un punto di vista illuminante o originale. Tutto questo ci aiuta a formarci
unidea personale precisa, cioè a capire che cosa sia lo

Sturm und Drang. Naturalmente, se leggiamo i commenti al posto delle opere originali, abbreviamo il
percorso, ma invece di idee personali avremo acquisito le idee dei commentatori; questo è negativo, anche
se talvolta fa parte del gioco.
Al contrario, lo studio delle discipline scientifiche
(che voglio nettamente distinguere dalla scoperta
scientifica, di cui dirò pi`
u avanti) parte da considerazioni e soluzioni generali di classi di problemi.
Infatti, sarebbe una perdita di tempo enorme cominciare ad esaminare soluzioni particolari di problemi
specifici per poter poi indurre un metodo globale di
soluzione di tutti i problemi della classe considerata. Se si può dimostrare che tutti i problemi di
una certa classe hanno una determinata soluzione, si
studia tale soluzione e poi si verifica se si è capito
andando ad utilizzare quella soluzione nei problemi
specifici. Questa impostazione vale non solo nel prosaico campo della soluzione pratica dei problemi (la
tecnica), ma anche per lapprendimento dei concetti,
che si cerca di dare sempre nella forma pi`
u generale possibile, discutendo poi come si specializzino in
idee particolari e casi speciali. Di nuovo, diventa un
esercizio utile alla comprensione quello di passare dal
generale allo specifico.
Questo dà a molti limpressione che la scienza sia
dogmatica e che invece di favorire la formazione delle
idee, inquadri la mente a seguire certe strade preordinate senza sviluppare un apparato critico appropriato. Ciò, ammettiamolo, può esser vero a un livello
molto basso, ma non credo sia diverso dallo studiare
la letteratura in un manuale di critica, che presenta
le idee dellautore come verità apodittiche da imparare pi`
u o meno a memoria. In realtà, la Matematica,
anche negli aspetti pi`
u tecnici, fornisce sempre metodi alternativi di soluzione, stimola a cercare strade
diverse, invoglia a dimostrare che una soluzione è migliore di altre, almeno nella situazione considerata.
Di volta in volta, sta allintuito, alla bravura e alle
conoscenze del solutore trovare la strada pi`
u conveniente per affrontare il problema. Proviamo ad esempio a trovare le soluzioni dellequazione x2 x2 = 0:
avete cinque minuti di tempo a disposizione. . . .. Sono passati i cinque minuti; vediamo qual è stata la
vostra soluzione:
1. avete applicato la formula classica, calcolando il
discriminante = 1 + 8 = 9 e ottenendo x =
2 e x = 1. Bene, conoscete ed apprezzate la
tecnica della Matematica, ma la vostra tendenza
è quella di prendere le formule come verità da
non discutere;
2. visto che i coefficienti sono semplici, avete visto
ad occhio, o dopo un po di riflessione, che x2
INDICE
x 2 = (x + 1)(x 2) e quindi le soluzioni sono
2 e 1. Avete un buon intuito matematico e
fra pi`
u strade possibili sapete scegliere quella pi`
u
appropriata al problema;
ovvio o banale o chiaro è una conseguenza diretta di

regole o proprietà che sono state appena citate o che
fanno parte delle basi pi`
u semplici della Matematica,
quelle cioè che il lettore non deve ignorare. Quindi, se
costui non riesce a capire, è perche non sta ponendo
3. avete ragionato cos`: x2 x2 = x2 +x2x2 =
attenzione a ciò che legge oppure ha qualche lacuna,
x(x + 1) 2(x + 1) = (x 2)(x + 1). Altre
che è opportuno venga rimossa. Purtroppo, cè anstrade analoghe sono possibili, ma una soluzione
che un uso scorretto dellovvietà, quando lautore
di questo tipo rivela una notevole predisposizione
vuole nascondere qualche zona dombra del suo lavoper la Matematica;
ro (e questo ha a che fare con letica professionale),
4. non avete nemmeno tentato di risolvere lequa- oppure quando lautore ha preso un abbaglio. Spero,
zione e siete passati a leggere queste conside- in queste note, di non essere caduto in simili scorrazioni: avete un atteggiamento troppo pigro e rettezze, cercando di avvertire quando un punto può
se non lo correggete le materie scientifiche non presentare qualche problema.
fanno per voi.
Ma, ci si può chiedere, non è forse vero che tutta
E impossibile studiare la Matematica semplicemente leggendo un testo. I libri di divulgazione matematica agiscono contro lapprendimento della Matematica. Possono fornire una serie di concetti, ma
questi rimarranno solo in superficie e, dopo la lettura,
ci si trova spesso al punto di prima. Per studiare la
Matematica occorre leggere, munirsi di carta e penna
(qualcuno preferisce la matita, ma va bene lo stesso)
e svolgere per proprio conto i calcoli e gli esercizi. Se
non si fa cos`, si perde tempo e basta. Lo sforzo personale non può essere sostituito da alcun testo, per
chiaro che possa essere. Studiare seriamente cento
pagine di Matematica equivale a studiare un intero
scaffale di libri di una materia letteraria. Chi cerca
strade pi`
u brevi va incontro a un sicuro fallimento, a
meno che non sia un genio: non si sa mai.
Oggi esistono programmi sullelaboratore, quali
Mathematica e Maple, che riescono a svolgere quasi
tutta la Matematica conosciuta: se avete perso tempo a cercare la soluzione della precedente equazione,
a suo tempo questi programmi vi saranno di enorme utilità, ma prima dovrete esservi formate solide
basi. Se non avete nemmeno tentato di risolvere lequazione (caso 4) è inutile che tentiate di utilizzarli:
nessuna macchina si può sostituire a voi nel capire
e nello svolgere i concetti. O meglio, forse può, ma
allora è lei che pensa, e non voi. Non è la stessa cosa.
5. I testi e gli articoli di Matematica sembrano

abbondare di avverbi come ovviamente, chiaramente e di espressioni quali è banale dimostrare
che, si vede subito che, e cos` via. Poiche anche
in queste note non potremo evitare tali modi di dire,
è bene si capisca il loro senso, che parrebbe introdurre un aspetto troppo personale (per taluni una cosa
può essere chiara, per altri molto meno) nel mondo
oggettivo della Matematica. In realtà tali espressioni
hanno un significato abbastanza preciso, e cioè vogliono significare questo: ciò che è dichiarato essere
la Matematica è conseguenza di una serie ristretta di

assiomi, ai quali vengono applicate regole di deduzione che man mano ci dimostrano tutti i teoremi ai
quali siamo interessati? Nella Sezione ?? parleremo
esplicitamente di questo aspetto, detto metodo assiomatico, e la risposta s` a questa domanda ci dice allora
che tutto nella Matematica dovrebbe essere ovvio e
banale, visto che assiomi e regole di deduzione non
possono [ovviamente] essere ignorati e tutto il resto
è conseguenza diretta di quelli. Anche se cè qualcosa di vero in tutto questo, e si può pensare ad una
macchina che, da sola, sviluppasse tutta la Matematica, [s]fortunatamente le cose non stanno proprio cos`.
Vogliamo dare alcune motivazioni di questo fatto:
1) La derivazione meccanica di tutti i settori della
Matematica (a parte le difficoltà intrinseche, di tempo e di spazio, che comporterebbe) ci darebbe una visione piatta della Matematica stessa. Con questo voglio dire che ogni teorema avrebbe la stessa rilevanza
di tutti gli altri e in effetti non sapremmo quali risultati, fra gli infiniti risultati che avremmo ottenuto, ci
può servire pi`
u degli altri per risolvere un certo problema; anzi, addirittura, non sapremmo come e dove
andare a cercarlo. Questa argomentazione ci mostra
un punto importante della Matematica umana: noi
procediamo per problemi, non per catene deduttive;
per noi certi problemi sono importanti, altri meno.
Noi costruiamo modelli della realtà e siamo interessati a sviluppare le teorie matematiche che stanno
dietro a tali modelli; procediamo, cioè, in modo utilitaristico, non nel senso materialista del termine, ma
nel senso che cerchiamo risultati utili alla nostra conoscenza. Quindi operiamo delle scelte e tali scelte
dipendono da noi, non dalla consequenzialità della
Matematica. Da questo punto di vista, pi`
u utile sarebbe una macchina alla quale potesse essere dato
lenunciato di un possibile teorema e quella ci dicesse se è vero oppure no. Questo si riesce a fare in
molti settori ben delineati, ma rimane al momento il
problema di una macchina dimostratrice universale.
INDICE
Forse un giorno verrà realizzata, ma per ora si stanno risultato e cerca vari mezzi per convencersi che esso
solo sviluppando teorie matematiche su macchine del è valido. Tali mezzi vanno dal proprio intuito alla
sperimentazione in casi particolari, dalla discussione
genere.
2) Se il precedente è un criterio di opportunità, con i colleghi alla simulazione sul calcolatore, e tanesiste anche un criterio logico per preferire o repu- ti altri marchingegni fra i quali ci può ben stare la
tare necessario un approccio umano alla Matemati- dimostrazione formale. Qualcuno, a questo propoca. Godel ha dimostrato che le nostre formalizzazioni sito, ha sostenuto e sostiene che la formalizzazione
u, e quando una cosa è vedella Matematica non possono essere complete, inten- matematica è un sovrappi`
ra
tutti
si
possono
convincere
(a loro modo) che tale
dendo con questo che non ci possono permettere di
essa
`
e
.
Questo
per`
o
`
e
del
tutto
irrazionale e, cosa
dimostrare tutti i risultati veri. In altre parole, la
pi`
u
importante,
io
non
ci
credo.
Riconosco
che ogni
macchina che pur potesse derivare tutta la Matematimatematico
si
possa
convincere
della
validit`
a di un
ca a partire dagli assiomi, non riuscirebbe comunque
teorema
nel
modo
che
crede
pi`
u
opportuno;
il fatto,
ad arrivare a dimostrare tutte le verità della Mateper`
o
,
`
e
che
non
deve
crederci
lui
solo,
specie
se è un
matica stessa. Alcune di esse (in realtà, infinite) ririsultato
al
quale
`
e
arrivato
per
primo,
ma
deve
conmarrebbero fuori. Non sappiamo se luomo sarebbe
vincere
anche
gli
altri
che
le
cose
stanno
come
lui
crecapace di fare di meglio, ne sappiamo se sia già riude.
Ecco
allora
che
la
dimostrazione
diviene
il
mezzo
scito a fare qualcosa di pi`
u, ma naturalmente vale la
pena di tentare, anzi sarebbe eticamente scorretto se comunicativo per eccellenza, nella Matematica come
in tutta la scienza, poiche è in grado di darci ragioni
non lo tentassimo.
obiettive, o anche semplicemente intersoggettive (per
3) Esiste, infine, anche un criterio estetico. Ogni chi non crede alluniversalità della scienza) per essere
teorema ha pi`
u dimostrazioni; la macchina che ab- convinti che una certa affermazione è vera. Questo è
biamo ipotizzato genererebbe tutte le prove possibili, il ruolo semantico fondamentale della dimostrazione
rendendo ancora pi`
u difficile il nostro eventuale lavoro matematica e la giustificazione dellesistenza dei libri
di ricerca dei teoremi interessanti, che apparirebbero, di Matematica nella forma che essi hanno. E questa
con tutti gli altri, innumerevoli volte. In effetti, ogni credenza, assieme al citato aspetto estetico delle didimostrazione umana ha un proprio carattere (se si mostrazioni, che creano ciò che abbiamo chiamato il
preferisce, non ho obiezioni ad affermare che siamo gusto della dimostrazione, non acquisendo il quale
noi a darglielo), e alcune ci appaiono ovvie e scon- penso che si perda molto del fascino della Matematate nel senso detto, altre sono interessanti o geniali tica. Essa allora diviene semplice strumento tecnico,
per limpostazione adottata o il metodo utilizzato, al- semmai difficile da usare, e/o fonte di curiosità, meno
tre ancora rivelano connessioni inusitate con aspetti vicine alla scienza che allenigmistica (disciplina che
diversi, che semmai nulla hanno a che fare con largo- personalmente non disprezzo affatto).
mento trattato. Queste due ultime categorie sono le
dimostrazioni che preferiamo, sono quelle che danno
soddisfazione e meritano alla Matematica lappellativo di Arte. Il Mathematical Intelligencer, una rivista
6. Concludo questa non breve introduzione con alscientifica, nel 1998 ha indetto una specie di votazione cune osservazioni su come è stata scritta questa serie
per le pi`
u belle dimostrazioni della storia della Mate- di appunti di Matematica, che naturalmente risenmatica. Ha vinto la prova di Eulero per ei = 1 (un tono del mio modo di vedere la materia, le mie varie
risultato che purtroppo trascende lambito di queste idiosincrasie e i pallini che ho acquisito con la frequennote). Questo mostra come laspetto estetico (une- tazione della materia del mio lavoro, e cioè lInformastetica un po sui generis, se si vuole) abbia un ruolo tica. Va da se che non mi permetterei mai di scrivere
non indifferente nellarido mondo della Matematica. un libro sulla Matematica seria, dove i colleghi maQueste considerazioni si legano a un altro aspetto
che amo mettere in rilievo, e cioè la differenza tra
un libro di Matematica e la soluzione matematica dei
problemi. Qui intendo per problema una qualsiasi
questione di Matematica, dallesercizio didattico ai
grandi temi della ricerca matematica (daltra parte,
per chi affronta per la prima volta un esercizio, esso
è un tema di ricerca, lunica differenza essendo che
esso è già stato risolto da qualcuno). La scoperta
matematica non avviene mai (o quasi mai) nel modo
razionale in cui si espongono i risultati; piuttosto, il
matematico intuisce, o immagina, o si figura un certo
tematici sono ben pi`

u esperti e bravi di me: io mi
posso limitare a scrivere delle semplici note su quelle
parti della Matematica che tutti (e quindi, anche io)
dovrebbero sapere.
Note: Ho inserito nel testo un bel po di note che,
spero, non siano del tutto peregrine. La loro natura è
piuttosto varia: alcune sono note di approfondimento
del materiale esposto nella sezione; altre sono considerazioni di carattere storico; alcune sono curiosità o
divagazioni sul tema; altre infine sono anticipazioni
o rimandi che non potevano essere inserite nel testo
vero e proprio. Questo dovrebbe essere intelligibile
10
INDICE
anche senza le note; in altre parole, se un lettore tra- per verificare i risultati dei programmi realizzati.
lascia (ad esempio ad una prima lettura, ammesso che
voglia leggere queste cose due volte) le note, dovrebbe riuscire a seguire tutti gli argomenti senza perdere
nulla di essenziale alla comprensione. Spero che le
note (questo è almeno il compito che io intendo loro
affidare) soddisfino qualche curiosità e, soprattutto,
ne sollevino molte altre, invogliando cos` il lettore a
proseguire questi studi, per i quali potrà utilmente
ricorrere a testi universitari specifici, che incontrerà
andando avanti negli studi.
Punto decimale: La virgola che separa la parte
intera di un numero dalla sua parte decimale costituisce una mia piccola idiosincrasia. Di fronte alla
scrittura (5, 32) è spesso difficile rendersi conto (specie nello stampato, quando gli spazi sono ridotti al
minimo indispensabile) se siamo di fronte al numero decimale cinque virgola trentadue o alla coppia di
numeri interi 5 e 32. Per questo, preferisco alla virgola il punto decimale della notazione anglosassone,
della quale ovviamente rifiuto luso della virgola per
indicare i raggruppamenti in migliaia, milioni, etc.:
a questo scopo userò un punto situato in alto. Pertanto, senza ambiguità, scrivere (51, 328) indicherà
la coppia di numeri 51 e 328; scrivere (51.328) vorrà
significare il numero decimale 51 punto 328; scrivere
infine (51. 328) denoterà il numero intero cinquantuno
mila trecentoventotto.
Esercizi: Come ho avuto modo di affermare, lo
studio della Matematica si deve fare con carte e penna
o matita, e soprattutto si devono risolvere problemi,
poiche solo la pratica ci rende familiari con i metodi
di risoluzione che la Matematica ci fornisce. Questo
testo è privo di esercizi, e ciò è una grave lacuna. E
mia intenzione rimediare con un testo di esercizi, in
parte anche svolti. Però, siccome ho le mie idee su
come impostare un tale testo, per il momento la cosa
è ancora in fieri e non so immaginare quando potrà
essere realizzato. In queste note, spesso suggerisco di
scrivere programmi sullelaboratore che realizzano o
simulano certi risultati: poiche naturalmente penso
ai futuri studenti di Informatica, questi sono esercizi
pressoche indispensabili. Visto che oggi lInformatica
ha pervaso un po tutte le materie, gli stessi esercizi
penso possano essere utili anche agli altri, che avranno cos` occasione per imparare un po di programmazione. Il linguaggio da usare è indifferente: il Pascal
va tanto bene quanto il C; oggi il C++ e il Java sono pi`
ua
` la page ed introducono alla programmazione
ad oggetti. Chi mai avesse a disposizione il Maple o
Mathematica, può utilizzarli come linguaggi di programmazione a tutti gli effetti, anche se tanti degli
esercizi sono già funzioni predefinite in tali linguaggi;
il trucco sta nel programmare ignorando (o facendo
finta di ignorare) tali funzioni e, semmai, utilizzarle
Capitolo 1
Il linguaggio della Matematica

fra di essi senza averne una coscienza esplicita. Cos`
diciamo che tutti gli uomini hanno un naso, aggregando in ununica classe tutte le persone (passate, presenti e future), e allo stesso tempo separando
quella che è una semplice parte di una persona, cioè
il naso.
Se lipotiposi del sentimento personale prostergando i prolegomeni della subcoscienza fosse capace di reintegrare il proprio soggettivismo alla
genesi delle concomitanze, allora io rappresenterei lautoprasi della sintomatica contemporanea che non sarebbe altro che la trasmificazione
esopolomaniaca. Che bel talento, eh? Ma io
non ci tengo ne ci tesi mai . . .
E. Petrolini Gastone
1.1
Gli insiemi
La Matematica costituisce un vero e proprio linguaggio. Esso serve per esprimere proposizioni che riguardano quantità o relazioni. La forma pi`
u elementare
di quantità è il numero e la forma pi`
u elementare di
relazione è il confronto tra numeri. I numeri hanno
avuto origine con il contare e al contare è collegato
anche il confronto, per cui il numero cinque è inferiore
al sette perche contando si arriva prima al cinque che
al sette. Altre quantità, come la lunghezza o il peso,
sono state acquisite dalluomo molto presto e con esse
è nato il concetto di misura. Il confronto fra numeri
è stato poi generalizzato al concetto di relazione tra
quanttà diverse: in questo modo sono state definite
relazioni come quella che lega laltezza del sole al passare del tempo, o quella che vogliamo instaurare tra
il peso o la lunghezza di un oggetto e il suo costo.
Prima di parlare di numero, occorre che ci intendiamo su cosa vogliamo e possiamo contare. La nostra
mente concepisce la realtà secondo due metodi apparentemente contrapposti. Il primo tende a comporre
vari oggetti in una entità unica, come quando pensiamo al salotto come allaggregazione tra una stanza,
mobili quali divano, poltrone e tavoli, e suppellettili quali quadri, soprammobili, ecc. Il secondo tende
a scomporre un individuo in varie parti, ad esempio
quando pensiamo a una persona come composta di
una testa, un tronco, due braccia e due gambe. Questi due modi di vedere la realtà, detti rispettivamente
aggregazione e separazione, non sono nettamente distinti luno dallaltro e noi ci muoviamo mentalmente
11
Per intenderci, ogni volta che saremo di fronte a

processi di aggregazione o di separazione, distingueremo tra un individuo, considerato come un tutto
unico e che chiameremo insieme, dalle parti in cui lo
immaginiamo separato, che diremo elementi. In tal
modo, vedremo il salotto come un insieme composto
dagli elementi stanza, divano, ecc., e gli elementi testa, tronco e via di seguito come costituenti
linsieme persona. Gli insiemi e gli elementi sono
i primi concetti che si incontrano nella Matematica.
Volendo astrarre dalla loro natura specifica, useremo una notazione neutra, accettata ormai in tutte
le parti della Matematica. Gli elementi si denotano
con le prime lettere minuscole dellalfabeto latino e
gli insiemi con le lettere maiuscole. Per dire che un
insieme A è composto dagli elementi a, b, c, d, si scrive
A = {a, b, c, d}, dove le parentesi graffe corrispondono
a ciò che abbiamo chiamato aggregazione e le virgole
alla separazione. Lellissi . . . serve a denotare elementi che non si vogliono o non si possono specificare,
come quando scriveremo A = {a, b, c, . . . , z}.
Naturalmente, le convenzioni notazionali appena

date hanno senso per insiemi generici; per insiemi
specifici potremo adottare notazioni specifiche, disturbando lettere speciali, in grassetto o in gotico
o dallalfabeto greco, e simboli con significato particolare. Ad esempio, linsieme dei numeri naturali,
quelli con i quali contiamo (lo zero compreso), sarà
indicato con N = {0, 1, 2, 3, . . .}, dove lellissi, questa volta, indica che non vogliamo scrivere i restanti
elementi (perche li conosciamo) e che non possiamo
riportarli tutti, in quanto non sono in numero finito.
I simboli 0, 1, 2, 3, etc. hanno un significato convenzionale, accettato quasi universalmente: nei testi
scritti in cirillico, arabo, cinese o giapponese, i numeri sono ormai scritti con le nostre dieci cifre arabiche,
12
CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA
da sinistra verso destra.
Per indicare il fatto che un certo elemento a appartiene ad un insieme A, si scrive a A e si dice
simbolo di appartenenza; la sua negazione è a 6 A.
Se P è linsieme dei numeri pari, 10 P e 15 6 P.
AB
AB
Siano A e B due insiemi tali che ogni elemento di B
sia anche elemento di A: si dice che B è un sottoinsieA
B
A
B
me di A e si scrive B A; se poi A contiene almeno
un elemento che non sta in B, allora B è un sottoinsieme proprio di A e si scrive B A. Ad esempio,
P N, dato che ogni numero pari è un numero, ma
esistono numeri che non sono pari. Due insiemi A e
A\B
AB
B sono uguali, e si scrive A = B, se ogni elemento
di A è anche elemento di B e, viceversa, ogni elemento di B è anche elemento di A. In altre parole,
Figura 1.1: Diagramma di Venn
A = B significa che A B e, contemporaneamente,
B A. Spesse volte, per dimostrare che due insiemi
sono uguali, si applica questa osservazione, provando
che ogni elemento del primo appartiene al secondo, e legge tale che. Le seguenti tre operazioni tra insiemi ricorrono con estrema frequenza in tutte le parti
viceversa.
della Matematica:
E bene rendersi conto perfettamente della differenza fra il concetto di appartenenza e quello di conte Unione: lunione di due insiemi A e B si scrive
nuto: il primo mette in relazione un elemento con
A B ed è linsieme composto dagli elementi che
un insieme, il secondo mette in relazione due insiemi.
stanno in A, stanno in B oppure stanno in tutti
Si sia certi di capire il seguente esempio: dato line due gli insiemi;
sieme A = {a, b, c, d}, si consideri lelemento b A e
si definisca B = {b}. In altre parole, B è linsieme
Intersezione: lintersezione di due insiemi A e B
composto dal solo elemento b. Come insieme, si ha
si scrive A B ed è linsieme degli elementi che
B A, ma non hanno senso nessuna delle scritture
stanno contemporaneamente in A e in B;
b A e B A. Infine, ricordiamo che se B A
(B A), si può scrivere in modo equivalente A B
Differenza: la differenza tra due insiemi A e B
(A B), che si legge A contiene (propriamente) B
si scrive A\B ed è linsieme degli elementi che
e si dice che A è un soprainsieme di B.
stanno in A, ma non appartengono a B.
Un insieme privo di elementi, come linsieme degli unicorni si dice un insieme vuoto. Se pensiamo
allinsieme dei triangoli con quattro lati, ci rendiamo conto che di insiemi vuoti ne esiste uno solo, quello privo di qualsiasi elemento. Linsieme vuoto si indica con . Si considera che linsieme vuoto sia contenuto in (sia un sottoinsieme di) ogni altro insieme, e
quindi sia un sottoinsieme improprio di se stesso. Per
completezza, ricordiamo che un insieme può essere
definito elencando tutti i suoi elementi, come quando
poniamo A = {1, 2, 3, 4, 6, 12}, e si dice che linsieme
è definito per estensione. Alternativamente, possiamo definire un insieme come composto di tutti e soli
gli elementi che soddisfano una certa proprietà; ad
esempio, possiamo porre B = {divisori di 12}, dove
le parentesi graffe si leggono ancora linsieme dei;
in questo caso A = B, ma si dice che B è definito per
intensione (attenzione, questa parola si scrive con la
lettera s!). In modo pi`
u formale, si dovrebbe scrivere B = {x | x divide 12} e si legge linsieme degli
elementi x tali che x divide 12. Si osservi che x è
una variabile di comodo e che la barra verticale si
Due insiemi A e B si dicono disgiunti se la loro intersezione è linsieme vuoto, cioè AB = . Lunione
disgiunta degli insiemi A, B si denota A B, e corrisponde allunione di A e di B quando questi siano
disgiunti, o siano stati resi tali marcando in modo
diverso i loro elementi cos` da renderli distinguibili.
Infine, la differenza simmetrica fra i due insiemi A, B
è definita dalla relazione: AB = (A \ B) (B \ A).
Le operazioni tra insiemi si intuiscono facilmente
se ci aiutiamo graficamente con i ben noti diagrammi di Venn: in tali diagrammi un insieme è rappresentato dai punti di un cerchio e quindi, disponendo
opportunamente due o pi`
u cerchi, si può visualizzare
leffetto di una qualsiasi operazione tra insiemi. Nella Figura 1.1 abbiamo evidenziato in grigio le quattro
operazioni introdotte.
I diagrammi di Venn permettono anche di dare
una prova grafica alle proprietà delle operazioni; ad
esempio, si vede immediatamente che:
AB = (A B) \ (A B),
1.1. GLI INSIEMI
13
come daltra parte si scopre facilmente la proprietà lintersezione. Le proprietà di idempotenza, ugualdistributiva dellunione rispetto allintersezione:
mente, non hanno corrispondenza nei numeri, ma ci
dicono che, al contrario di questi, operando con un
A (B C) = (A B) (A C).
solo insieme non possiamo ottenere molto di pi`
u. Le
regole che coinvolgono il complemento ci informano
A
B
A
B
che questo ha qualcosa delle proprietà dellopposto o
dellinverso nei numeri, cioè loperazione che da 4 ci
porta a 4 (opposto) oppure a 1/4 (inverso). Prima di tutto, lopposto dellopposto ci dà il numero
di partenza, come ce lo dà linverso dellinverso: cos`
agisce anche il complemento. Lanalogia esiste anche
C
C
con le regole a + (a) = 0 e a (1/a) = 1, ma qui,
anche identificando 0 con e 1 con U , le regole sono
A (B C)
(A B) (A C)
pi`
u stringenti, ed è come avessimo a (a) = 1 e
a + (1/a) = 0, il che ben sappiamo non essere vero.
Infine, in P(U ) valgono le celebri regole di De MorIn modo analogo il lettore è invitato a dimostra- gan); costui era un matematico inglese della prima
re la proprietà distributiva dellintersezione rispetto metà del 1800, che anticipò alcune idee di Boole sulla
allunione, cioè:
logica formale; insegnò ad Ada Byron, la figlia del
poeta, che fu cos` brava da aiutare Charles BabbaA (B C) = (A B) (A C).
ge nelluso della Macchina Analitica, tanto da essere
considerata la prima programmatrice della storia (cirSpesso, si fissa un particolare insieme U , detto inca 1840). Le regole di De Morgan legano tra di loro
sieme universo, e si considerano tutti i suoi sottoinsietutte e tre le operazioni definite su P(U ); possono esmi, che costituiscono il cosiddetto insieme delle parti
sere facilmente verificate con luso dei diagrammi di
di U e si denota con P(U ). Chiaramente, U P(U )
Venn, ma invitiamo il lettore a riflettere un po sul
e P(U ), e per ogni A U si definisce il comloro significato per cercare di capirlo senza laiuto di
plemento di A (in U ) come la differenza A = U \ A;
un disegno. Le regole non sono banali e può essere
ovviamente, U = e = U : in generale A = A. Le un esercizio utile quello di raffigurarci mentalmente
tre operazioni di unione, intersezione e complemento, il loro senso.
definite in P(U ), godono di una serie di proprietà,
che elenchiamo nella Tabella 1.1: esse si dicono proNota 1.1
Quella che abbiamo considerato è
priet`
a dellAlgebra Booleana e le ritroveremo anche
unimpostazione intuitiva della teoria degli insiemi.
pi`
u avanti. Il lettore è invitato a dimostrare queste
Dopo la sua introduzione da parte di Boole, Frege e
proprietà con il metodo dei diagrammi di Venn.
Cantor, il concetto di insieme venne variamente criticato e ci si accorse presto che tutta la teoria non poPossiamo dire due parole su questo elenco di regole.
teva essere lasciata allintuizione, ma doveva rientrare
Esse assomigliano, ma non coincidono, con le regole
nei canoni di un formalismo che, proprio in quelledelle operazioni numeriche, che tutti conosciamo. Ad
poca, si stava affermando e che, in un qualche moesempio, la proprietà commutativa è la stessa, mendo abbastanza miserevole, cercheremo di esporre nelle
tre la proprietà distributiva sembra pi`
u ampia e vaprossime sezioni. Uno dei colpi di maglio che furono
le tanto per lunione rispetto allintersezione, quanto
sferrati contro limpostazione intuitiva della teoria denel caso opposto; per i numeri, possiamo distribuigli insiemi è certamente il paradosso di Russell, che il
re il prodotto rispetto alla somma, ma non vicevermatematico e logico inglese propose nel 1902. Ecco cosa. Questa analogia ha portato, specie allinizio della
me ragion`
o Russell. Il concetto di insieme sembra postoria della teoria degli insiemi, a parlare dellunione
ter schematizzare quella capacit`
a di aggregazione che
la mente umana possiede e sulla quale si basa parte
come della somma tra insiemi e dellintersezione
della nostra conoscenza. Quindi possiamo aggregacome del prodotto. In effetti, se A e B sono due
re oggetti in insiemi, ma anche insiemi in insiemi di
insiemi disgiunti, rispettivamente con m ed n elemeninsiemi, e cos` via, allinfinito. Possiamo addirittura
ti, la loro unione A B = A B contiene esattamente
pensare allinsieme G di tutti gli insiemi. Questo inm + n elementi. Tuttavia, lanalogia finisce qui, dato
sieme globale gode di una strana propriet`
a: esso deve
che A B = e, in generale, A B ha meno elementi
contenere se stesso come elemento, in quanto contiedel solo A o del solo B.
ne tutti gli insiemi. Generalmente, un insieme non
Caratteristica degli insiemi è la proprietà di assorcontiene se stesso come elemento, ma G non è certo
bimento: A B è contenuto in A, per cui, se poi aglunico insieme con tale propriet`
a. Ad esempio, Lingiungiamo tutto A, quello che otteniamo è proprio A;
sieme di tutti gli insiemi che possono essere definiti
con meno di venti parole italiane, è un insieme deficos` A B contiene A, e quindi ritorniamo ad A dopo
14

commutativa
associativa
distributiva
assorbimento
idempotenza
complemento
identità
zero
doppia negazione
de Morgan
AB =BA
AB =BA
A (B C) = (A B) C
A (B C) = (A B) C
A (B C) = (A B) (A C) A (B C) = (A B) (A C)
A (B A) = A
A (B A) = A
AA=A
AA=A
AA=
AA=U
A=A
AU =A
AU =U
A=
A=A
AB =AB
AB =AB
Tabella 1.1: Le regole dellAlgebra Booleana
nito per intensione che contiene se stesso, proprio per

come labbiamo definito. Allora, gli insiemi si suddividono in due grandi classi: linsieme P degli insiemi che
contengono se stessi, e linsieme N di tutti gli altri. Ci
chiediamo (cioè, si chiese Russell): linsieme N dove si
trova, in P o in N ? Se N stesse in N , sarebbe allora
un elemento di se stesso, ma ci`
o contraddice la sua
definizione. Supponiamo allora che N stia in P ; ma
per definizione di P , N dovrebbe contenere se stesso,
e siamo di nuovo in contraddizione. Non ci sono per`
o
altre possibilit`
a, e siamo giunto a un paradosso.
Lo stesso Russell, con Whitehead, sviluppo`
o una
teoria assiomatica degli insiemi che permettesse di
evitare questo ed altri paradossi. Unaltra importante
assiomatizzazione è dovuta a Fraenkel e Zermelo.
Ma noi, detto questo, ci dobbiamo arrestare. Avvertiamo solo che queste teorie rendono conto del
concetto di numero cardinale (che vedremo) e di
numero ordinale, che invece non vedremo. Questi
ultimi numeri vogliono generalizzare allinfinito
la categoria grammaticale di primo, secondo, terzo,
etc.; naturalmente, le cose si complicano e ce ne
possiamo rendere facilmente conto pensando di
scrivere linsieme (ordinato) dei numeri naturali,
seguito da unaltra serie di numeri naturali. In questo
insieme, qual è il numero dordine del secondo 1?
1.2
Le relazioni
Gli insiemi, anche con la distinzione tra il tutto e i

singoli elementi, non esauriscono il nostro modo di
concepire il mondo; un altro aspetto essenziale è dato dalle relazioni reciproche tra gli insiemi e tra gli
elementi. A ben guardare, tra questi oggetti abbiamo già introdotto almeno due relazioni: quella di appartenenza, che associa elementi ed insiemi, e quella
di contenuto, che invece mette in relazione insiemi con insiemi. Se poi allarghiamo il nostro campo
visuale a tutta la Matematica, vediamo che fra i numeri esistono le relazioni di uguaglianza, di minoranza, di maggioranza, di divisibilità e tante altre. Nella
Geometria abbiamo la congruenza, la similitudine e
lequivalenza tra figure. E se passiamo al mondo che

ci circonda, ci rendiamo conto che di fatto viviamo in
un universo di relazioni tra persone, fra gruppi, fra
nazioni, fra oggetti, e cos` via. La parentela e lamicizia tra persone, lalleanza e il confinamento tra
stati, lesser sopra, sotto, dentro o fuori tra oggetti,
sono relazioni con le quali abbiamo a che fare in ogni
istante.
Volendo formalizzare, almeno un po, la nostra idea
di relazione, possiamo cominciare restringendo il
nostro interesse alle cosiddette relazioni binarie, quelle che cioè coinvolgono solo due insiemi di elementi o,
se si vuole, mettono in connessione due soli elementi, che possono far parte o meno dello stesso insieme.
Ad esempio, spesso si parla di gruppi di amici, intendendo che la relazione coinvolga pi`
u persone contemporaneamente; tuttavia, in questo caso, è facile
immaginare che lamicizia di gruppo sia il risultato
di una serie di amicizie tra coppie di persone, e di tre
amici A, B, C si possa dire che formano un gruppo di
amici se A è amico di B, B di C e C di A. Talvolta
questa riduzione è pi`
u difficile, ma immaginiamo che
la si possa fare, oppure immaginiamo di non interessarci ad altri tipi di relazione. Una relazione binaria
può essere data in due maniere diverse:
1. elencando puntigliosamente tutte le coppie di
elementi che sono in relazione, cioè dando una
definizione per estensione. La relazione di amicizia tra persone o di alleanza tra stati non può
essere data che in questo modo;
2. dando una regola che permetta di stabilire, senza
ambiguità, quando due elementi sono in relazione. Due stati sono confinanti se hanno un tratto
di confine in comune, a prescindere da qualsiasi
elencazione. Siamo di fronte a una definizione
per intensione.
Lelencazione, con un po di buona volontà, può essere assimilata a una regola, o legge, e quindi spesso
si dice che una relazione è data da una legge che permette di associare gli elementi in relazione tra di loro,
15
1.2. LE RELAZIONI
e quindi ci fornisce anche un criterio per dire quando
due elementi non sono in relazione. Intuitivamente,
avere un criterio per definire una relazione sembra
essere il modo pi`
u naturale di impostare il problema, e sarà questo metodo intensionale che seguiremo
nella presente sezione per esporre i principali tipi di
relazione che si trovano nella Matematica. Tuttavia,
prima di far questo, vogliamo ricordare la definizione
matematica di relazione, che invece fa riferimento allidea di estensione. Se A e B sono due insiemi (fra i
quali vogliamo definire una relazione), si chiama prodotto cartesiano di A e B, e si indica con A B,
linsieme di tutte le coppie ordinate (a, b) dove a A
e b B. Ad esempio, se A è linsieme di due elementi
A = {maglia, camicia} e B è linsieme di tre elementi
B = {bianca, azzurra, fantasia}, il prodotto A B è
costituito dalle sei coppie:
(maglia, bianca)
(camicia, bianca)
(maglia, azzurra) (camicia, azzurra)
(maglia, fantasia) (camicia, fantasia).
E bene distinguere chiaramente il concetto di coppia
(ordinata) da quello di insieme di due elementi: la
coppia (a, b) è diversa dalla coppia (b, a), anche se a
e b appartengono allo stesso insieme; infatti, lordine
degli elementi è essenziale. Viceversa, i due insiemi
{a, b} e {b, a} sono lo stesso insieme, composto dai
due elementi a e b, indipendentemente dallordine con
cui essi sono scritti.
Il nome di prodotto cartesiano deriva dalla Geometria Analitica, dove il piano cartesiano è costituito
da tutte le possibili coppie di numeri reali, e quindi è
proprio R R. E facile vedere che se A e B sono due
insiemi che contengono, rispettivamente, m ed n elementi, il loro prodotto cartesiano AB contiene proprio mn coppie distinte, il che, se si vuole, giustifica
il nome di prodotto per questa operazione.
Accettato questo concetto, che associa gli elementi
di A con quelli di B in tutti i modi possibili, la definizione di relazione è semplice: si dice relazione o
corrispondenza tra A e B un qualsiasi sottoinsieme
del prodotto cartesiano A B. Il sottoinsieme determina le coppie di elementi in relazione tra di loro; le
coppie che non appartengono al sottoinsieme, quindi,
sono formate da elementi che non sono in relazione
tra di loro. Lesempio precedente può essere illuminante: il mio guardaroba di maglie e camicie è una
relazione che lega questi oggetti a possibili colorazioni: la relazione è data dal fatto che tali oggetti sono
miei e non di qualcun altro (il guardaroba di unaltra persona costituirà unaltra relazione). Se ho due
maglie, una bianca e una azzurra, e due camicie, una
bianca e una fantasia tipo hawaiano, si vede immediatamente come il mio guardaroba sia un sottoinsieme
di A B.
Nota 1.2
Aver insistito sulle relazioni binarie, è

solo una semplificazione espositiva. Il prodotto cartesiano pu`
o essere esteso a un numero qualsiasi di insiemi: A1 A2 An è linsieme delle n-uple
ordinate (a1 , a2 , . . . , an ) composte con a1 A1 , a2
A2 , . . . , an An . Come per le coppie, anche per le terne, le quadruple, . . ., le n-uple lordine degli elementi
è essenziale, e ci`
o distingue queste entit`
a dagli insiemi
di 3, 4, . . . , n elementi. Quando i vari insiemi sono di
fatto lo stesso insieme A, si scrive A3 per A A A, e
via di seguito. Una relazione o corrispondenza n-aria
fra gli insiemi A1 , A2 , . . . , An è un sottoinsieme D del
prodotto cartesiano A1 A2 An e gli elementi
a1 , a2 , . . . , an si dicono in relazione o in corrispondenza tra di loro se la n-upla ordinata da loro composta
appartiene a D.
Le relazioni cos` definite sono un concetto veramente
basilare del nostro modo di concepire il mondo che
ci circonda, tanto è vero che oggi costituiscono le
strutture di riferimento per la modellazione della
realt`
a operata, in Informatica, dalle Basi di Dati.
Quando si vogliono gestire le informazioni di unAzienda, si costruisce la base di dati che rappresenta
il Sistema Informativo Aziendale. Tale base di dati
non è altro che linsieme delle relazioni che legano
tra di loro le informazioni di tutta lazienda (Modello
Relazionale). Ad esempio, semplificando al massimo,
una delle relazioni pu`
o essere un sottoinsieme R del
prodotto N C D Q S, dove N è linsieme
dei nomi propri, C quello dei cognomi, D quello delle
date di nascita, Q quello delle qualifiche e S quello
degli stipendi annuali. La quintupla (Luigi, Rossi,
04/12/1975, D8, 32000), se appartiene ad R significa
che il Sig. Luigi Rossi, nato il 4 Dicembre del 1975, ha
la qualifica D8 (qualunque cosa ci`
o voglia significare)
e guadagna 32 mila e allanno. E interessante
osservare come le relazioni, che costituiscono la base
dei dati, e le associazioni fra le relazioni (cioè, le
relazioni tra relazioni) permettano una modellazione operazionale di realt`
a complesse come quelle di
aziende private e enti pubblici di qualsiasi dimensione.
Alcune relazioni hanno un ruolo molto importante nella Matematica; citiamo le relazioni di equivalenza e di ordine tra elementi dello stesso insieme,
e le funzioni tra elementi di insiemi (spesso) diversi.
Su queste relazioni vogliamo ora entrare in maggiori
dettagli. Luguaglianza (tra numeri, tra figure o tra
oggetti qualsiasi, non ha importanza) è una relazione
che tutti conosciamo; essa fa parte di un gruppo di relazioni caratterizzate da alcune proprietà e che è noto
col nome di relazioni di equivalenza. Formalmente,
una relazione di equivalenza è una relazione tra gli
elementi dello stesso insieme A (e, quindi, è un sottoinsieme di coppie appartenenti ad A A = A2 ) che
gode delle seguenti proprietà:
1. propriet`
a riflessiva: ogni elemento a A è in
relazione con se stesso;
16
2. propriet`
a simmetrica: se un elemento a A è in
relazione con un elemento b A, allora anche b
è in relazione con a;
3. propriet`
a transitiva: se un elemento a A è in
relazione con b A e questo, a sua volta, è in
relazione con c A, allora anche a è in relazione
con c.
La prima proprietà sembra ovvia, ma non lo è poi
tanto, visto che molte relazioni come a è diverso
da b non ne godono affatto. Luguaglianza, la congruenza, la similitudine e lequiscomponibilità tra figure sono relazioni di equivalenza. Un esempio meno
ovvio lo si ha considerando le espressioni aritmetiche
(ad esempio, formate da numeri e le operazioni di
somma e sottrazione, come si studiano in IV elementare) e dire che sono equivalenti se e solo se hanno
lo stesso valore. Ogni espressione è equivalente a se
stessa; se 2 + 3 = 1 + 4 allora 1 + 4 = 2 + 3 e, infine,
se è anche 1 + 4 = 7 2, allora 2 + 3 = 7 2.
Nota 1.3
Sia definita su A una relazione che goda delle propriet`

a simmetrica e transitiva. Se a, b A
sono due elementi in relazione tra di loro, cioè a è in
relazione con b, per la propriet`
a simmetrica è anche
b in relazione con a. Per la propriet`
a transitiva,
applicata a questi due casi, si ha che a è in relazione
con se stesso. Deve allora valere la propriet`
a riflessiva.
Ci possiamo chiedere: se, come sembra da questo
ragionamento, la propriet`
a riflessiva consegue dalle
altre due, perche labbiamo inserita esplicitamente
nella definizione? In realt`
a il ragionamento vale solo
se a è in relazione con almeno un altro elemento,
diverso da lui o no. Ma se nellinsieme esiste un
elemento che non è in relazione con nessun altro
elemento (nemmeno se stesso) largomento viene a
cadere e la proprietè riflessiva non vale pi`
u nella
globalit`
a dellinsieme.
Avere una relazione di equivalenza R su un insieme

A è la stessa cosa che avere una suddivisione di A in
tanti sottoinsiemi che sono a due a due disgiunti tra di
loro; è cioè come se linsieme A fosse tagliato a fette.
Infatti, se a A, indichiamo con Ea la classe di tutti
gli elementi di A che sono in relazione con a; spesso,
in modo suggestivo, si usa la notazione [a] per Ea , che
mette bene in evidenza il ruolo di a. Comunque, se Eb
è la classe di equivalenza di un altro elemento b A,
abbiamo Ea = Eb oppure Ea Eb = . Infatti, se a
è in relazione con b, ogni elemento c equivalente ad
a è anche equivalente a b per la proprietà transitiva,
e viceversa, per cui Ea = Eb . Se invece b non è
in relazione con a, nessun elemento c può essere in
relazione tanto con a quanto con b, perche altrimenti
a e b sarebbero in relazione tra loro: quindi Ea
Eb = . Daltra parte, ogni elemento di A sta in
una classe di equivalenza, la sua, per la proprietà

riflessiva, cos` che le classi di equivalenza ricoprono
tutto A. Linsieme delle classi di equivalenza degli
elementi di A rispetto alla relazione dequivalenza R
si dice linsieme quoziente di A modulo R e si indica
con la notazione A/R.
Si noti che è vera anche la proprietà inversa. Supponiamo che A sia diviso in tanti sottoinsiemi che:
i) sono tra loro a due a due disgiunti; ii) ricoprono
tutto A. Si dice che gli insiemi formano una partizione di A e se definiamo che due elementi a, b A
sono in relazione se e solo se appartengono allo stesso
sottoinsieme, vediamo che tale relazione è di equivalenza. Per questo basta dimostrare che valgono le tre
proprietà caratteristiche:
1. la relazione è riflessiva perche ogni elemento
si trova in un sottoinsieme (proprietà di ricoprimento ii)) e quindi è in relazione con se
stesso;
2. se a è nello stesso sottoinsieme di b, vale anche
il viceversa e quindi la proprietà simmetrica è
verificata;
3. se a è nello stesso sottoinsieme di b, e questi di
c, essendo i sottoinsiemi disgiunti o coincidenti, a deve essere nello stesso sottoinsieme di c
(proprietà transitiva).
Questo fatto è spesso utile per ragionare in termini
di classi di equivalenza piuttosto che in termini dei
singoli elementi. Vedremo pi`
u casi di questo genere, ma qui, per fare un esempio preso dalla vita di
tutti i giorni, pensiamo al modo diverso con cui un
cliente e unazienda vedono i prodotti da acquistare o
vendere, rispettivamente. Il cliente è interessato, per
esempio, a unautovettura ben determinata, lazienda
lavora invece per classi e, in fase di produzione, essa
produce un certo numero di vetture di un dato tipo,
indipendentemente dai desideri del singolo cliente, se
non per ciò che riguarda eventuali analisi di mercato.
Solo recentemente, almeno nel settore degli autoveicoli, si è passati a una produzione pi`
u personalizzata.
Naturalmente, la tipologia delle macchine prodotte è
una partizione di tale insieme e la corrispondente relazione di equivalenza è: la macchina a è dello stesso
tipo della macchina b. Se non fosse per il numero del
motore, le due macchine sarebbero indistinguibili.
Unaltra importante relazione è costituita dallordinamento. Sia A il solito insieme; si dice che gli
elementi di A sono ordinati in senso stretto secondo
una certa relazione, o che tale relazione è una relazione dordine stretto per A, se valgono le seguenti tre
proprietà:
1. propriet`
a antiriflessiva: nessun elemento è in
relazione con se stesso;
17
1.3. FUNZIONI E OPERAZIONI

2. propriet`
a controsimmetrica: se un elemento a
A è in relazione on b A, allora b non deve essere
in relazione con a;
3. propriet`
con c.
S = {a, b, c}
{a, b}
{a, c}
{b, c}
{a}
{b}
{c}
Un esempio significativo è dato dalla relazione tra

numeri a < b. Pi`
u spesso, tuttavia, si usa la relazione
dordine non stretto, detta semplicemente relazione
dordine o relazione dordine parziale per le cose che
vedremo. Essa è caratterizzata dalle tre proprietà:
1. propriet`
a riflessiva: ogni elemento è in relazione
con se stesso;
2. propriet`
a antisimmetrica: se un elemento a A
è in relazione con b A, e b è in relazione con a,
allora a e b coincidono;
3. propriet`
con c.
Figura 1.2: Diagramma di Hasse
Per avere un riferimento concreto, si pensi alla relazione tra numeri a b. Tuttavia, è facile vedere che
anche tutti i sottoinsiemi di un insieme dato S, se
considerati con la relazione contenuto, godono di
queste stesse proprietà: 1) ogni insieme si può considerare come sottoinsieme di se stesso; 2) se A B e
B A, allora A = B; 3) A B e B C implicano
A C, come risulta immediatamente dalla definizione. Ad esempio, se S = {a, b, c}, è facile disporre gli
8 sottoinsiemi di S in un diagramma (come nella Figura 1.2), detto diagramma di Hasse, che evidenzia
le reciproche relazioni di contenuto.
Se facciamo una cosa analoga per la relazione
fra i numeri {1, 2, 3, 4} troviamo un diagramma di
Hasse molto pi`
u semplice. In realtà questultima relazione ha una caratteristica particolare: per fra
numeri vale la proprietà aggiuntiva:
4. dati due elementi qualsiasi, il primo è in relazione
col secondo oppure il secondo è in relazione col
primo.
Chiaramente, questa proprietà non è valida per gli
insiemi {a} e {b, c}, che non hanno nessuna relazione di contenuto fra di loro. Quando questi due tipi
di ordinamento si vogliono distinguere, si dice che
quello fra gli insiemi è un ordinamento parziale, mentre quello tra numeri è un ordinamento totale. Un
esempio ulteriore di ordinamento totale è costituito
dallordinamento lessicografico, cioè quello delle parole nel dizionario: date due parole, si confrontano
le prime lettere e se liniziale della prima è maggiore
(minore) delliniziale della seconda, la prima parola

segue (precede) la seconda. Se le prime due lettere
sono uguali, si confrontano le seconde due, e si va
avanti nello stesso modo finche non si trova la disuguaglianza che decide. Se una parola finisce prima
che si sia arrivati a distinguere i due termini, questa
precede laltra. Cos` mani < piedi, mani < manto,
mani < manica.
Un esempio, invece, di ordinamento parziale è il
seguente. Si consideri un numero, diciamo 30, e linsieme di tutti i suoi divisori: {1, 2, 3, 5, 6, 12, 15, 30};
diciamo che il divisore d1 precede il divisore d2 se e
solo se d1 divide d2 . Cos` 5 precede 10, 3 precede 15,
ma nulla possiamo dire di 2 e 15. Il lettore è invitato
a verificare che questo è un ordinamento parziale, sia
nellesempio del 30 sia in generale, per ogni numero
naturale n. E anche invitato a disegnare il diagramma di Hasse per n = 30 e a confrontarlo con quello
della Figura 1.2.
1.3
Funzioni e operazioni
Il tipo pi`
u importante di relazione o corrispondenza è
certamente costituito dalle funzioni. Una corrispondenza tra due insiemi A e B, cioè un sottoinsieme
F A B, si dice una funzione se e solo se ad ogni
elemento di A corrisponde uno e un solo elemento di
B. Come si sa, espressioni come y = 3x + 2 oppure
y = x2 4x + 1 rappresentano due funzioni perche,
assegnato un valore ad x (la variabile indipendente),
il valore di y (la variabile dipendente) è univocamente
determinato. In generale si scrive y = F (x), anche
18
se propriamente si dovrebbe scrivere (x, y) F . La

corrispondenza tra A e B può essere di natura qualsiasi e non necessariamente numerica. Unazienda che
produce scarpe è interessata alla produzione mensile: si tratta di una funzione nella quale, come corrispondente di ogni mese, si ha un numero, ma questo
numero non soddisfa necessariamente ad alcuna formula analitica analoga a quelle viste in precedenza.
Cos`, la data di nascita e lindirizzo di residenza sono
funzione della singola persona, come lo sono il nome e
il cognome. Invece, la data di nascita non è funzione
del nome e del cognome, in quanto possono esistere due Giovanni Russo nati uno il 14 Aprile 1957 e
laltro il 21 Settembre 1961.
su questo ritorneremo pi`

u avanti.
La terminologia relativa alle funzioni è alquanto
complicata, ma è essenziale in tutta la Matematica.
Intanto, una generica funzione f dellinsieme A nellinsieme B si indica con la notazione: f : A B,
f
oppure A B; nel caso che f sia biunivoca, ciò si
mette in evidenza scrivendo: f : A B o anche
f
A B. Linsieme A si dice dominio oppure insieme
di partenza della funzione e B si dice il rango o codominio o insieme di arrivo; linsieme degli elementi di
B che sono corrispondenti di almeno un elemento di
A si dice limmagine di A in B e si indica con f (A);
in generale, come sè visto, f (A) B, e se f (A) = B
si dice che la funzione è surgettiva. Se b B è il
corrispondente di a A secondo f , cioè (a, b) f ,
si dice che b è limmagine di a secondo f e si scrive:
b = f (a).
Se abbiamo una corrispondenza D A B, cioè
un insieme di coppie (a, b) D con a A e b
B, è sempre possibile invertire tale corrispondenza
cambiando lordine degli elementi, cioè considerando
le coppie (b, a) tali che (a, b) D. Quella che cos` si
ottiene è una corrispondenza tra B ed A che si dice
linversa di D e pertanto si indica con D1 B A.
Formalmente:
Una funzione che faccia corrispondere ad elementi

diversi di A elementi diversi di B si dice iniettiva.
Le funzioni iniettive sono particolarmente simpatiche
perche sono invertibili, cioè possiamo partire dagli
elementi di B e stabilire, per ciascuno, se esiste e
qual è lelemento di A che lo ha come corrispondente;
infatti, o lelemento b B non è determinato da alcun
elemento di A oppure è determinato da uno solo. Ad
esempio, y = 2x è una funzione iniettiva perchè ad x
diversi corrispondono valori di y diversi; gli y, però,
non possono essere negativi. Pertanto, se partiamo
da un y 0, sappiamo che esso non è determinato
D1 = {(b, a) B A | (a, b) D A B}.
da alcun valore di x; se però y > 0, esiste senzaltro
un valore di x tale che y = 2x ; tale valore è dato da
Quando la corrispondenza è una funzione, non è detx = log2 y, cioè il logaritmo in base 2 di y (si veda al
to che la sua inversa sia ancora una funzione; questo
Capitolo 3).
accade solo se a elementi distinti di A corrispondono
Ancora pi`
u simpatiche sono le funzioni iniettive che elementi distinti di B, di modo che nella corrisponper ogni b B hanno il corrispondente in A, cioè le denza inversa esista ununica coppia che abbia come
funzioni che sono anche surgettive: queste funzioni primo elemento b B. In altre parole, la corrisponsi dicono biunivoche (o corrispondenze biunivoche) ed denza inversa di una funzione è anchessa una funziohanno un ruolo fondamentale in tutta la Matematica. ne se e solo se f è iniettiva. Se b = f (a), si scrive
Esse si possono definire come quelle corrispondenze anche a = f 1 (b) ed a si dice limmagine inversa di
che ad ogni elemento di A associano uno e un solo b.
elemento di B e, viceversa, ad ogni elemento di B
Se f : A B e g : B C si può considerare la
associano uno e un solo elemento di A. Si osservi funzione h : A C definita nel modo seguente: si
che se due insiemi A e B sono finiti, hanno cioè un parte da un qualsiasi elemento a A e si trova il corrinumero finito di elementi, e fra di essi esiste una corrispondente di a in B secondo f , cioè si trova b = f (a).
spondenza biunivoca, allora essi devono contenere lo Da questo elemento b si passa, tramite la g, allelestesso numero di elementi: infatti, per la definizione, mento c = g(b) e si definisce questo come immagine di
è possibile associare ad ogni elemento a A un unico a secondo h. Questa corrispondenza h si dice la comb B, e nessuno degli elementi di B rimane fuori. posizione delle due funzioni f e g e si scrive di solito
Questo, come vedremo nella prossima sezione, sta a h = f g, di modo che h(a) = (f g)(a) = g(f (a)),
fondamento dei numeri naturali, i numeri con i quali qualunque sia a A. Una osservazione importansi conta. E bene comunque avvertire che limportante è che se f è una funzione biunivoca ed f 1 è la
za delle corrispondenze biunivoche non è limitata agli sua funzione inversa, allora f 1 (f (a)) = a per ogni
insiemi finiti. Ad esempio, la corrispondenza p = 2n a A, cioè f f 1 è la funzione identica su A, cioè
tra i numeri naturali N e i numeri pari P è chiara- la funzione che ad ogni elemento fa corrispondere se
mente biunivoca e la sua inversa è n = p/2, che ha stesso. Spesso, tale funzione si indica con I ed f 1 si
senso perche p è pari. Questo ci dice che i numeri pari dice linversa composizionale di f .
sono tanti quanti sono tutti i numeri, il che appare
Un insieme interessante di funzioni è costituito dai
assurdo poiche P è propriamente contenuto in N. Ma predicati. Un predicato su un insieme A è una fun-
1.3. FUNZIONI E OPERAZIONI

zione p : A {0, 1}. Ad esempio, la funzione
p : N {0, 1} definita da:
p(n) = 1
se n è pari
p(n) = 0
se n è dispari
è un predicato. Limportanza dei predicati (su A)
sta nel fatto che essi costituiscono un meccanismo
matematico per parlare delle proprietà degli elementi
di A; nellesempio, la proprietà è: il numero n è
pari. Di regola, si interpreta 1 come vero e 0 come
falso, cos` che p(10) = 1 significa il numero 10 è
pari, mentre p(51) = 0 vuol dire il numero 51 non
è pari.
Dato un insieme S e linsieme P(S) delle sue parti,
i predicati su S corrispondono ai sottoinsiemi di S.
Se infatti A S, il predicato A : S {0, 1} definito
da:
A (x) = 1
se x A
A (x) = 0
se x 6 A
19
in particolare, per i predicati su A si scrive 2A , dove il 2 sta a significare linsieme di due elementi
B = {0, 1}. Vista la corrispondenza tra i predicati su A e i sottoinsiemi di A, spesso si indica con la
stessa notazione 2A linsieme delle parti di A, cioè
P(A). Ritorneremo in diverse occasioni sulle cose
appena dette, quando parleremo di cardinalità (si veda la Sezione 1.4), di calcolo combinatorio (vedere la
Sezione 4.1), di calcolo delle proposizioni (nella Sezione 4.6); ma questi concetti sono pervasivi di tutta
la Matematica.
Un caso particolarmente importante di funzione è
dato dalle operazioni; si consideri ad esempio la somma tra numeri naturali; essa associa ai numeri 3 e 5 il
numero 8; si scrive 3+5 = 8 e pertanto siamo di fronte a una funzione che chiameremo S e che ha come
dominio il prodotto cartesiano N N, cioè le coppie
di numeri naturali, e per codominio lo stesso N. Si
scrive pertanto: S : N N N, ed m + n al posto
di S(m, n). La stessa cosa si può dire del prodotto
P : N N N, ove P (n, m) = n m. Si osservi
invece che la differenza e la divisione non sono funzioni nel senso detto: infatti, alla coppia (3, 5) non
corrisponde alcun numero naturale 3 5, ne alcun
numero naturale 3/5. In effetti, i numeri interi, cioè
i numeri con il segno, sono stati introdotti per rendere la sottrazione una funzione, cioè unoperazione
sempre eseguibile, e i numeri razionali per rendere la
divisione una funzione. Purtroppo, in questultima
operazione, come si sa, cè un caso che non si risolve,
e cioè la divisione per zero; a parte questo, nei numeri
razionali è sempre possible fare a/b.
Le operazioni non hanno sempre necessariamente
due argomenti come le quattro operazioni di base,
cioè addizione, sottrazione, moltiplicazione e divisione. Esistono operazioni con un solo argomento, come
la radice quadrata, il cambiamento di segno o il valore assoluto. Si possono inventare operazioni con tre
argomenti come logb (x + y), o anche a quattro come:
ax /by , e cos` via. Allora:
identifica univocamente il sottoinsieme A: il sottoinsieme definisce il predicato e dal predicato si ricava

linsieme senza alcuna ambiguità. Il predicato A si
dice la funzione caratteristica di A (in S) e per la precedente osservazione possiamo dire che esistono tanti
sottoinsiemi di S quante sono le possibili funzioni caratteristiche su S. Linsieme vuoto corrisponde alla
funzione caratteristica fatta tutta di 0 (la funzione
costante 0); S, come sottoinsieme di se stesso, ha come funzione caratteristica quella fatta tutta di 1 (la
funzione costante 1).
Supponiamo che gli insiemi A e B contengano,
rispettivamente, n ed m elementi; poniamo allora
A = {a1 , a2 , . . . , an } e B = {b1 , b2 , . . . , bm }. Una
funzione f : A B è definita quando assegniamo a
ciascun elemento di A il corrispondente elemento di
B. Cos`, ad a1 possiamo assegnare uno qualsiasi degli
m elementi di B; si hanno perciò m possibilità. Ad
a2 possiamo associare ancora uno qualunque degli m
elementi di B, e quindi abbiamo m2 possibili associazioni. Continuando nello stesso modo, vediamo che
anche ad an si possono associare m immagini distinte
le operazioni con un solo argomento, come |x|, si
e in tutto si hanno m m m = mn distinte
dicono monadiche;
funzioni di A in B. Ad esempio, se A = {a, b, c} e
B = {0, 1}, le funzioni di A in B, cioè in questo caso
le operazioni con due argomenti, come x + y, si
i predicati su A, sono 23 = 8 e possono essere elendicono binarie o diadiche;
cati usando la notazione funzionale, che riporta nella
le operazioni con tre argomenti, come logb (x+y)
riga superiore gli elementi di A e in quella inferiore
si dicono ternarie o triadiche;
le rispettive immagini:
a b c
a b c
a b c
a b c
e cos` via. Il numero di argomenti di una operazione
0 0 0
0 0 1
0 1 0
0 1 1
si dice la sua ariet`
a o adicit`
a.
La notazione delle operazioni si è sviluppata dal

a b c
a b c
a b c
a b c
1500 ad oggi in modo abbastanza caotico; essa con1 0 0
1 0 1
1 1 0
1 1 1
tinua ad evolversi perche alcune parti della MatemaDa queste osservazioni discende la notazione B A tica usano ancora notazioni ad hoc, scelte in manieper indicare linsieme di tutte le funzioni di A in B; ra piuttosto casuale, dettate spesso da considerazioni
20
estetiche piuttosto che razionali. Per le operazioni

monadiche due sembrano essere i tipi di notazione
pi`
u ragionevoli; di gran lunga da preferire è la notazione prefissa o funzionale, nella quale il segno di
operazione precede largomento; cos` la negazione è
x, la negazione logica p e si scrive cos(x) per il
coseno di x e ln(x) per il logaritmo naturale. Meno
usata è la notazione postfissa, come n! per il fattoriale, e la fantasia dei matematici si è sbizzarrita
a
cercare segni e disposizioni pi`

u originali: x indica
la radice quadrata, |x| il valore assoluto, ex lesponenziale, Ai lindiciamento, A il complemento, e chi
pi`
u ne ha, pi`
u ne metta. Per le operazioni diadiche
la forma pi`
u usata è quella infissa: a + b, a/b, A B
e via di seguito; molto usata è anche in questo caso la notazione prefissa o funzionale, adottata come
standard nei linguaggi di programmazione, fatta eccezione per le operazioni di base: MCD(m, n). Ma
anche per le
operazioni binarie
lo sfoggio di fantasia
è notevole: n x, logb (x), an , nk , e tante altre. Fortunatamente, infine, per le operazioni con pi`
u di due
argomenti, la notazione funzionale è canonica, anche
perche è difficile trovare una notazione pi`
u compatta.
Le operazioni possono godere (o non godere) di
particolari proprietà e possono possedere (o non possedere) particolari elementi che le caratterizzano.
Diamo qui un elenco delle principali proprietà e dei
pi`
u importanti elementi speciali, supponendo che le
operazioni siano definite su un insieme A:
dono di questa proprietà nei confronti dellaltra

operazione;
5. unoperazione binaria x y è distributiva rispetto a unaltra operazione binaria x y se
per ogni terna di elementi x, y, z A si ha:
x(yz) = (xy)(xz); come si sa, il prodotto
è distributivo rispetto alla somma e alla sottrazione; lunione e lintersezione sono distributive
una rispetto allaltra;
6. unoperazione binaria x y è idempotente se per
ogni elemento x A si ha x x = x. Loperazione di Massimo Comun Divisore è idempotente perche MCD(n, n) = n; nessuna delle quattro
operazioni di base è tale.
7. data unoperazione binaria x y, si dice che un
elemento e A è una identit`
a per loperazione se
e x = x e = x, per ogni elemento x A. Lo 0
è lidentità per la somma e l1 lo è per il prodotto.
Poiche si ha x 0 = x, ma 0 x = x, lo 0 non è
identità per la sottrazione; talvolta, per mettere
in evidenza la prima uguaglianza, si dice che 0 è
unidentit`
a destra per la sottrazione;
8. data unoperazione binaria x y, si dice che un
elemento z A è uno zero per loperazione se si
ha z x = x z = z, per ogni elemento x A.
Lo 0 è uno zero per la moltiplicazione e uno zero
sinistro per la divisione;
1. unoperazione binaria x y è chiusa se, qualunque siano gli elementi x, y A, il risultato dello- 1.4
Il contare
perazione è ancora un elemento di A. La somma
e il prodotto in N sono operazioni chiuse, mentre Una delle attività di base delluomo è il contare. Connon lo sono la sottrazione e la differenza; come tare significa associare agli elementi di un insieme una
sè detto, ne 3 5, ne 3/5 sono numeri naturali; successione di parole convenzionali: uno, due, tre,
quattro, . . .. Il numero degli elementi di un insieme
2. unoperazione binaria xy è commutativa se per
è il nome al quale si arriva quando tutti gli elemenogni coppia di elementi x, y A si ha xy = y
ti sono stati esauriti. Idealmente, e talvolta anche
x. Addizione e moltiplicazione sono operazioni
praticamente, man mano che contiamo spostiamo gli
commutative; sottrazione e divisione non lo sono;
elementi dellinsieme in un altro insieme, in modo da
3. unoperazione binaria x y è associativa se distinguere quelli già considerati da quelli che ancora
per ogni terna di elementi x, y, z A si ha devono essere contati. In tal modo non si fanno con(x y) z = x (y z), cioè lordine di ese- fusioni e si determina facilmente quando il conteggio
cuzione delloperazione non è essenziale (si noti è terminato.
In questa maniera, noi instauriamo una corrisponche la proprietà commutativa si riferisce allordine degli elementi; la proprietà associativa al- denza biunivoca tra gli elementi da contare e i numelordine delle operazioni). Di nuovo, addizione e ri: come abbiamo osservato nella sezione precedente,
moltiplicazione sono esempi positivi, sottrazione è proprio lesistenza di una corrispondenza biunivoca
che ci permette di dire che gli oggetti di un insieme
e divisione negativi;
sono tanti quanti gli elementi di un altro insieme. Ora
u: se due insiemi
4. unoperazione binaria x y gode della proprietà possiamo dire anche qualcosa di pi`
di assorbimento rispetto alloperazione x y se si hanno lo stesso numero di elementi, allora è possibiha: x (y x) = x qualunque siano i due ele- le trovare tra di essi una corrispondenza biunivoca.
menti x, y A. Come abbiamo visto, le due ope- Infatti, dire che hanno lo stesso numero di elemenrazioni di unione ed intersezione tra insiemi go- ti significa che esiste una corrispondenza biunivoca
21
1.4. IL CONTARE
tra ciascun insieme e linsieme dei numeri che hanno
permesso di contarli; se facciamo corrispondere gli
elementi contati dallo stesso numero, abbiamo la corrispondenza biunivoca cercata. Non è detto che essa
sia la sola, ma ci basta di essere convinti che: due insiemi (finiti) hanno lo stesso numero di elementi se e
solo se esiste tra di essi una corrispondenza biunivoca.
I numeri che servono per contare si dicono numeri
naturali: zero, uno, due, tre, quattro, . . .. Osserviamo esplicitamente che lo zero conta gli elementi
dellinsieme vuoto (quante caramelle ci sono in un
sacchetto vuoto?) e pertanto va considerato come
uno dei numeri naturali. Linsieme dei numeri naturali si indica con N. Essi costituiscono uno dei mattoni fondamentali della Matematica, anzi, come ha
dimostrato Peano (1858 1932) tutta la Matematica
che conosciamo può essere fondata su una assiomatizzazione dei numeri naturali. Vedremo pi`
u avanti
qualcosa a questo proposito, anche se tali argomenti vanno un po oltre limpostazione elementare che
vogliono avere queste note.
Nota 1.4
Il resto della sezione è costituito da

questa lunga nota, nella quale vogliamo riportare limpostazione moderna del contare, che ha permesso di
superare, in modo costruttivo e rigoroso, la barriera
del finito nel ragionamento matematico. Le idee di
base di tale impostazione sono dovute al matematico
George Cantor (1845 1918), nato a San Pietroburgo da una famiglia danese, ma vissuto in Germania
dallet`
a di undici anni; la sua opera fu inizialmente
osteggiata, tanto da acuire la sua innata debolezza
psicologica e da costringerlo a passare buona parte
della vita in manicomio, dove mor`.
Cantor part` dal concetto intuitivo di insieme, come
anche noi labbiamo visto, e dal concetto di corrispondenza biunivoca, che permette di associare gli elementi di due insiemi diversi: egli chiam`
o equipotenti due
insiemi A e B tra i quali è possibile istituire una corrispondenza biunivoca; si scrive allora A
= B. Abbiamo
gi`
a osservato che, per gli insiemi finiti, questo significa proprio che gli insiemi hanno lo stesso numero di
elementi. Tuttavia, ci`
o che ha di interessante limpostazione di Cantor è questo: il concetto di equipotenza
non si basa su unindefinita idea di numero data a priori, ma solo sui concetti di insieme e di corrispondenza
che sono sicuramente a un livello pi`
u basso di quello di
numero. Infatti, tali concetti fanno riferimento, anche
se in modo completamente astratto, a idee singolari,
come a singoli oggetti (elementi) o a loro raggruppamenti in insiemi singolari o ad associazioni specifiche
tra insiemi. Viceversa, lidea di numero ha a che vedere con unastrazione a livello superiore: il numero 4
si riferisce a tutti gli insiemi che hanno 4 elementi, e
sarebbe assurdo che ci riferissimo a certi insiemi di 4
elementi (quelli ad esempio di cui abbiamo esperienza
diretta) e non ad altri. Quello che vogliamo è proprio
questo: che il numero 4 conti anche insiemi che non
conosciamo o con i quali mai avremo a che fare, come
i 4 cavalieri dellApocalisse o i 4 angoli dellUniverso

al di l`
a di tutte le galassie conosciute. La definizione
di numero cardinale proposta da Cantor, e che ora vedremo, cerca di cogliere proprio questo ulteriore livello
di astrazione
E facile vedere che la relazione di equipotenza è in
effetti una relazione di equivalenza. La propriet`
a riflessiva vale in quanto la funzione identica, cioè la funzione I : A A definita da I(a) = a qualunque
sia a A, è certamente biunivoca; ci`
o significa che
A
= A. Se f : A B è una corrispondenza biunivoca
tra A e B, abbiamo gi`
a osservato come la sua inversa
f 1 : B A sia anchessa biunivoca; vale pertanto la
propriet`
a simmetrica: A
= B implica B
= A. Infine,
se A
=B eB
= C, esistono due corrispondenze biunivoche f : A B e g : B C; la loro composizione
è una funzione biunivoca fra A e C, il che significa
A
o dimostra la propriet`
a transitiva. Come
= C, e ci`
ormai sappiamo, dato un insieme A, la sua classe di
equivalenza [A] è costituita da tutti gli insiemi equipotenti ad A. Definiamo allora la cardinalit`
a o potenza
di un insieme A la classe [A] di tutti gli insiemi ad
esso equipotenti. Tale classe si indica con card(A).
Leggendo o ascoltando questa definizione si ha spesso
la sensazione del gioco di parole; ma non è cos` e anzi
è bene capirne il senso veramente profondo. Riunire in un unico insieme (o classe) tutti gli insiemi con
4 elementi (cioè equipotenti a un qualsiasi insieme di
4 elementi) è unoperazione concettuale che possiamo
fare agevolmente (anzi, troppo agevolmente, tanto da
arrivare facilmente a qualche paradosso, come osserv`
o
Russell alcuni anni dopo la formulazione di Cantor)
e che d`
a un senso a quello che prima dicevamo sul
concetto di numero. Questa classe contiene insiemi i
pi`
u disparati e che, per la stessa definizione, possiamo anche non conoscere o non immaginare; ci`
o che li
caratterizza è solo il numero dei loro elementi, quella
corrispondenza biunivoca che ci dice: s`, questo insieme è equipotente a quello assegnato o considerato.
Ecco allora che la classe è identificata e (in realt`
a, dal
punto di vista in cui ci siamo messi) identifica il numero di elementi dei suoi insiemi. Ora, la propriet`
a
che abbiamo osservato, e cioè che esiste una corrispondenza biunivoca tra due insiemi se e solo se essi hanno lo stesso numero di elementi, non è pi`
u qualcosa
da intuire o da dimostrare: è giusto la definizione di
cardinalit`
a e quindi di numero.
Possiamo ora definire alcune operazioni sulle cardinalit`
a. Prima di tutto, date due cardinalit`
a card(A) e
card(B), la loro somma è definita come la cardinalit`
a
dellunione disgiunta A B, cioè:
card(A) + card(B) = card(A B).
Ci`
o è fatto generalizzando quello che avviene tra gli
insiemi finiti; il numero degli elementi di A B non
coincide con la somma degli elementi di A con quelli
di B, basta che A e B abbiano qualche elemento in
comune, cioè non siano disgiunti. Lunione disgiunta,
invece, funziona bene e corrisponde al nostro concetto
22

intuitivo di somma: mettere assieme gli elementi dei
due insiemi senza confondere gli uni con gli altri.
Anche la moltiplicazione è definita generalizzando il
caso degli insiemi finiti. Quando abbiamo introdotto
il prodotto cartesiano A B, abbiamo osservato che il
numero delle coppie che si formano è dato da m n,
se m ed n sono il numero degli elementi di A e di B.
Si definisce allora:
card(A) card(B) = card(A B),
cioè, il prodotto di due cardinalit`
a è dato dalla cardinalit`
a del prodotto cartesiano di due insiemi, uno
appartenente a card(A) e laltro a card(B) (in concreto, possiamo prendere gli stessi insiemi A e B).
E bene osservare che le definizioni che stiamo dando,
non dipendono dagli insiemi A e B usati; sfruttando la corrispondenza biunivoca che è implicita nella
definizione di cardinalit`
a, si dimostra che, cambiando
insiemi, non si cambia il risultato. Il lettore, al solito,
è invitato a provare formalmente queste affermazioni.
Lultima operazione è lelevamento a potenza. Abbiamo visto che il numero delle possibili funzioni da un
insieme A (finito e con n elementi) a un insieme B
(finito e con m elementi) è dato da mn . Definiamo
allora:
card(B)card(A) = card(B A ),
cioè come la cardinalit`
a dellinsieme delle funzioni da
A in B.
Il termine cardinalit`
a, pur riferendosi allespressione classica di numero cardinale che designa i numeri
naturali, ha lambizione di inglobare un concetto pi`
u
generale che comprenda anche gli insiemi infiniti. Una
definizione precisa di insieme infinito non è banale; intuitivamente, possiamo dire che se da un insieme togliamo man mano un elemento, allora, nel caso di un
insieme finito, prima o poi rimarremo senza elementi
(cioè, linsieme si riduce a ); viceversa, se linsieme è
infinito potremo andare avanti in tale processo senza
mai ridurci a .
Queste idee portarono Cantor a proporre questa costruzione; sia A un insieme infinito secondo la precedente intuizione; prendiamo un elemento a0 A e togliamolo da A ottenendo A \ {a0 }; poiche A è infinito,
A\{a0 } non è vuoto, e quindi possiamo scegliere un altro elemento a1 A \ {a0 } e considerare A \ {a0 , a1 }.
Anche questo insieme non è vuoto, e quindi possiamo scegliere un nuovo elemento a2 A \ {a0 , a1 }.
Cos` procedendo, si ottiene una successione infinita
{a0 , a1 , a2 , . . .} contenuta in A e composta da elementi tutti distinti. Tale sequenza è equipotente ad N
poiche la banale corrispondenza biunivoca è ai i,
per ogni i N. Allora, possiamo dire che un insieme
è infinito se e solo se contiene un sottoinsieme equipotente ad N, linsieme dei numeri naturali. Questa
pu`
o essere assunta come definizione di insieme infinito,
poiche (sempre da un punto di vista intuitivo) è chiaro
che da un insieme finito non si potr`
a mai estrarre una
successione infinita di elementi distinti.
Questa definizione è, quindi, ragionevole e osserviamo

subito che essa ci suggerisce due considerazioni notevoli: primo, linsieme N viene ad assumere il ruolo
molto importante di pietra di paragone, in quanto ogni altro insieme verr`
a classificato finito o infinito
solo per confronto con N; questo consacra N come insieme infinito per eccellenza, quello di cui si pu`
o dire:
ecco un insieme infinito di cui siam certi di quello che
è. Vorrei ricordare che lessere N infinito si basa su un
criterio di scommessa: vuoi scommettere che se tu
dici un numero, io son capace a dirne uno pi`
u grande? E sappiamo bene che se lavversario dice un n
qualsiasi, noi possiamo dire n + 1.
Il secondo fatto notevole è che, dalla definizione, discende che N è, in un certo senso, il pi`
u piccolo degli
insiemi infiniti, in quanto ogni altro insieme infinito
A viene a contenere un sottoinsieme che è limmagine di N, quella successione {a0 , a1 , a2 , . . .} che siamo
riusciti a cavarne fuori. Certo, pu`
o succedere che la
successione esaurisca tutto A, ma la cosa non cambia,
perche allora A sar`
a equipotente ad N.
Data questa minimalit`
a di N, Cantor propose di assegnare un simbolo speciale alla sua cardinalit`
a, che
è la pi`
u piccola delle cardinalit`
a degli insiemi infiniti.
A questo punto non sappiamo se esistono altre cardinalit`
a di insiemi infiniti, ma ci proponiamo in seguito
di dimostrare che questo è proprio il caso. Allora, per
il momento, chiamiamo 0 (Alef con zero, dove Alef
è la prima lettera dellalfabeto ebraico) la cardinalit`
a
di N e diciamo transfinite le cardinalit`
a degli insiemi
infiniti: per ribadire quanto detto, ci`
o che sappiamo
al momento attuale della nostra esposizione è che 0
è lunica o la pi`
u piccola della cardinalit`
a transfinite. Un insieme si dice numerabile se è equipotente ad
N, cioè ha cardinalit`
a 0 , che pertanto si dice anche
cardinalit`
a del numerabile.
Viene qui naturale fare un esempio: consideriamo P,
linsieme dei numeri pari; chiaramente P N e P è
infinito: come si conciliano le due cose? In realt`
a il
problema ha una semplice soluzione: ad ogni numero
naturale k associamo il numero pari 2k; otteniamo cos`
la successione {a0 , a1 , a2 , . . .} dove ak = 2k e quindi:
P è infinito e P è in corrispondenza biunivoca con N,
anche se è propriamente contenuto in tale insieme. Ma
non aveva detto Aristotele che una parte è minore del
tutto? Qui, una parte propria, P, è equipotente al tutto. Duecentocinquanta anni prima di Cantor, Galileo
aveva osservato che esiste una corrispondenza biunivoca tra i numeri naturali e i quadrati perfetti, che si
rarefanno sempre di pi`
u al crescere di n. Da questo,
per`
o, non era riuscito a dedurre altro che non solamente non si possa dire di un infinito esser maggiore
di un altro infinito, ma ne anco che e sia maggiore di
un infinito. Cantor fece vedere che le cose non stanno nemmeno cos` e che, in questo campo, Aristotele si
sbagliava.
Egli dimostr`
o addirittura che un insieme è infinito se e
solo se è equipotente a una sua parte propria. La prova
è quasi banale: se linsieme A è infinito, estraiamone
23
1.4. IL CONTARE
la successione S = {a0 , a1 , a2 , . . .} e sia B linsieme
(eventualmente vuoto) degli elementi che rimangono,
cioè sia A = S B. Consideriamo ora A = A \ {a0 }
e vediamo che A e A sono equipotenti. Lovvia corrispondenza biunivoca è la seguente: ad ogni elemento
di B (in A) facciamo corrispondere se stesso in A e ad
ogni elemento ak della successione facciamo corrispondere ak+1 . Ma A A (propriamente) e la prima parte
della prova è fatta. Viceversa, se A è finito e A A,
sappiamo che A ha meno elementi di A e i due insiemi
non possono essere messi in corrispondenza biunivoca
tra di loro.
Abbiamo cos` una seconda caratterizzazione degli insiemi infiniti, che ci rende conto di varie anomalie che
essi hanno nei confronti dei pi`
u usuali insiemi finiti.
Una tale propriet`
a, tuttavia, potrebbe indurci a pensare che sia possibile mettere in corrispondenza biunivoca due insiemi infiniti qualsiasi: se un insieme è
equipotente a un suo sottoinsieme, possiamo immaginare linsieme pi`
u piccolo come sottoinsieme di
quello pi`
u grande e cercare una corrispondenza biunivoca (analoga a quella appena vista) per dimostrare questo fatto. Una serie di risultati sembrerebbe
confermare tale ipotesi:
1. se ad un insieme infinito A si aggiunge un insieme finito B = {b1 , b2 , . . . , bk }, quello che si
ottiene è un insieme equipotente ad A. Sia
S = {a0 , a1 , a2 , . . .} la solita successione tratta da A e sia D = A \ S. La corrispondenza
biunivoca che ad ogni elemento di D fa corrispondere se stesso e per la quale: a0 b1 , a1
b2 , . . . , ak1 bk , ak a0 , . . . , ak+h ah , . . .,
prova la nostra affermazione. Se linsieme A
è numerabile, in termini di cardinalit`
a, questo
risultato si esprime con la formula: 0 + k = 0 ;
2. se A e B sono due insiemi numerabili, allora
A B è equipotente ad A. Dire che A è numerabile significa che gli elementi di A sono ordinabili in una successione A = {a0 , a1 , a2 , . . .} per
la quale k ak , per ogni k N. Analogamente B = {b0 , b1 , b2 , . . .}. Allora la corrispondenza
biunivoca tra A B ed N è (per ogni k N): se
k = 2h è pari k ah , e se k = 2h + 1 è dispari
k bh . Questo fatto si esprime con la formula:
0 + 0 = 0 ;
3. se A e B sono due insiemi numerabili, allora il
loro prodotto cartesiano AB è anchesso numerabile. Siano A e B come prima e disponiamo gli
elementi di A B in una matrice infinita come
nella Figura 1.3. Il cammino segnato è la corrispondenza biunivoca tra A B ed N. Questo
fatto si esprime con la formula: 0 0 = 0 .
Ma allora, ci chiediamo, esistono davvero cardinalit`
a
transfinite pi`
u grandi di 0 ? Apparentemente, dai tre
casi precedenti, sembra che con le normali operazioni
non si esca fuori del campo del numerabile. Ma Cantor dimostr`
o che di cardinalit`
a transfinite ne esistono
quante se ne vuole.
(a0 , b0 )
(a0 , b1 )
(a0 , b2 )
(a0 , b3 )
(a1 , b0 )
(a1 , b1 )
(a1 , b2 )
(a1 , b3 )
(a2 , b0 )
(a2 , b1 )
(a2 , b2 )
(a2 , b3 )
(a3 , b0 )
(a3 , b1 )
(a3 , b2 )
(a3 , b3 )
Figura 1.3: Scorrimento di una matrice infinita

Teorema 1.1 (di Cantor) Sia A un insieme qualsiasi e sia P(A) linsieme di tutti i sottoinsiemi
(le parti) di A; allora, la cardinalit`
a di P(A) è
strettamente maggiore della cardinalit`
a di A.
Prova: La dimostrazione è un classico della Matematica e consiste nel far vedere che: 1) A è equipotente ad un sottoinsieme di P(A), cioè che card(A)
card(P(A)); 2) che P(A) non è equipotente ad A,
e quindi card(A) 6= card(P(A)), cioè card(A) <
card(P(A)). La prima parte della dimostrazione è ovvia, poiche ogni elemento a A si fa corrispondere
al sottoinsieme {a} P(A). Per la seconda parte,
supponiamo che esista una corrispondenza biunivoca
tra A e P(A), cioè (a) A, per ogni a A.
Dato a A, (a) potr`
a contenere a oppure no; ad
esempio, se (a ) = allora a 6 (a ); se invece
(a ) = A, allora certamente a (a ). Possiamo
quindi dividere gli elementi di A in due sottoinsiemi:
P = {x A | x (x)}, gli elementi positivi,
ed N = {x A | x 6 (x)}, gli elementinegativi.
Poiche si suppone che sia biunivoca, deve esistere
un elemento b A tale che (b) = N , e quindi dovr`
a essere b N oppure b 6 N . Ma se b N , per
definizione di N deve essere b 6 (b) = N , il che è
chiaramente assurdo. Daltra parte, se fosse b 6 N ,
cioè b 6 (b), per la definizione di N dovremmo avere
b N , il che è di nuovo assurdo. Ma questi sono gli
unici casi possibili, e quindi non pu`
o esistere.
Il lettore avr`
a notato lanalogia di questo ragionamento con il paradosso di Russell, ma questa volta
largomentazione è corretta e la conclusione del teorema è vera. Questo risultato permette di costruire
insiemi di cardinalit`
a grande quanto si vuole. Si parte
con N che ha cardinalit`
a 0 e si considera linsieme
delle parti di N, cioè N1 = P(N). La cardinalit`
a di N1
è strettamente maggiore di quella di N e si indica con
1 (questo spiega finalmente la presenza dello strano
indice). Si prende poi N2 = P(N1 ) la cui cardinalit`
a
è 2 > 1 , e cos` si pu`
o continuare quanto si vuole.
Vedremo, quando avremo introdotto i numeri reali,
che la loro cardinalit`
a è strettamente maggiore di 0 .
Tale cardinalit`
a si indica con c e si dice la cardinalit`
a
del continuo. Si dimostra che c = 1 > 0 e ci si pu`
o
porre la domanda se esistono insiemi di cardinalit`
a
compresa tra 0 e 1 (o, in generale, tra n e n+1 ).
Abbastanza stranamente, nel 1963, Paul Cohen ha
24

dimostrato che non si pu`
o dimostrare ne che una tale
cardinalit`
a intermedia esista, ne che non esista.
1.5
Rappresentazione dei numeri naturali
Il concetto di contare, come sè visto, si esprime nel

linguaggio naturale mediante una serie di nomi convenzionali: uno, due, tre, quattro, . . . . Le regole per
la formazione dei nomi dei numeri sono abbastanza
semplici e permettono di esprimere una grande quantità di numeri come cento miliardi o settanta miliardi
di miliardi. Tuttavia, diventa estremamente difficile
dare nomi a numeri molto grandi come ad esempio al
prodotto dei primi cento numeri 1 2 3 100
che vale esattamente:
9332621544394415268169923885626670049071
5968264381621468592963895217599993229915
6089414639761565182862536979208272237582
51185210916864000000000000000000000000.
Inoltre, i nomi usuali tendono a diventare presto molto lunghi e per esprimere 7. 546. 732. 449 bisogna dire:
sette miliardi, cinquecento quarantasei milioni, settecento trentadue mila, quattrocento quarantanove,
un nome lungo 85 lettere, pi`
u del triplo del celebre
precipitevolissimevolmente. Queste considerazioni
hanno fatto s` che molto presto si siano sviluppati
metodi formali per la rappresentazione dei numeri,
attraverso simboli opportuni o ricorrendo alle lettere
dellalfabeto. A tutti è nota la numerazione romana,
che aveva linconveniente di essere inadeguata per i
numeri molto alti e nessuno si sognerebbe mai di tentare di scrivere il risultato del precedente prodotto in
quella notazione; già per esprimere 12. 000 si doveva
scrivere XIIM e a scrivere milioni non ci si pensava
nemmeno. Inoltre, la numerazione romana aveva il
difetto di usare ogni simbolo con un significato univoco: X indica il 10 sia nellespressione LXXI quanto
in MCCCXXIV, quanto infine in XCIV (questa notazione in sottrazione fu introdotta solo nel Rinascimento; i Romani scrivevano LXXXXIIII). Questo
limita molto lespressività della notazione, se si confronta con la nostra, dove la cifra 6 indica sei unità se
sta da sola, ma indica sessanta in 63, seicento in 1647
e sei milioni nel numero che prima abbiamo espresso in italiano. Nellantichità, apparentemente, solo i
Babilonesi avevano sviluppato una notazione analoga
alla nostra, anche se, misteriosamente, avevano scelto
come base di riferimento il 60 invece del 10, che a noi
sembra cos` naturale.
In effetti, la scelta della base 10 non è cos` universale come ci può apparire. Essa è legata, quasi
sicuramente, al fatto che abbiamo dieci dita, ma per
la stessa ragione si conoscono numerazioni in base 5

(si considera una sola mano; la V dei romani rappresentava la mano aperta) e in base 20 (mani e piedi),
come è ben noto dal modo francese di esprimere 80:
quatre-vingt, e 90: quatre-vingt dix. La nostra
notazione viene dal mondo arabo occidentale, e perciò
le 10 cifre che usiamo si dicono cifre arabiche. A loro
volta, gli arabi avevano importato la loro notazione
dallIndia verso l800 d.C., e dal mondo arabo prima
Gherardo da Cremona e poi Leonardo Fibonacci lavevano diffusa in Europa verso il 1200. Tuttavia, fino
al 1600 la notazione arabica rimase limitata al mondo del commercio e della finanza, mentre nel mondo accademico e scientifico continuò a dominare la
notazione romana.
La possibilità di esprimere in modo (abbastanza)
sintetico anche numeri molto grandi non è però lunico merito, o il principale, della notazione arabica:
quello che la rende insostituibile è il fatto che essa
permette di eseguire le operazioni di base (addizione, sottrazione, moltiplicazione, divisione e confronto) direttamente sulla rappresentazione dei numeri.
Nellantichità, contare e fare di conto erano operazioni avulse luna dallaltra, almeno dal punto di vista
tecnico. Contare consisteva nellassegnare un nome
convenzionale (o un simbolo) a una quantità di interesse; tale nome o simbolo non era però utilizzato
per fare le somme, per le quali si ricorreva a strumenti come labaco o, in mancanza di meglio, a pietruzze o sassolini disposti su varie righe. Ricordiamo, a
questo proposito, che la nostra parola calcolo deriva appunto dal termine latino calculus che significa sassolino. Leonardo Fibonacci nella sua opera
Liber Abaci non solo introduce la notazione arabica, ma mostra come con essa sia possibile effettuare le quattro operazioni fondamentali, grosso modo
con le regole che ancor oggi impariamo nelle prime
classi delle scuole elementari e che costituiscono il
nostro saper far di conto. Fibonacci chiamò algorismi (dal nome del matematico arabo al-Khuwarizmi,
morto verso l850 d.C.) queste regole e per secoli lespressione apprendere gli algorismi ha significato
imparare a far di conto.
Nota 1.5
Come abbiamo accennato, la notazione

arabica fu snobbata dal mondo accademico e scientifico fino al 1600, in quanto il calcolo (detto logistica
e contrapposto allAritmetica) era considerato una
disciplina pratica e non liberale, cioè facente parte
del Trivio (Grammatica, Dialettica, Retorica) o del
Quadrivio (Aritmetica, Geometria, Musica, Astronomia). Questo rallent`
o indubbiamente lo sviluppo
della scienza legata agli aspetti algebrico-formali.
Cos` non era raro trovare notevoli scienziati che,
letteralmente, non sapevano fare i conti. Lo stesso
Galileo non aveva molta dimestichezza con il calcolo,
anche se aveva inventato uno speciale compasso per
1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI

lesecuzione di conti approssimati. Le sue opere fanno
scarsi riferimenti ai numeri, e in questo differiscono
in modo straordinario dai lavori di Newton, che
è di poco posteriore, essendo nato lanno stesso
della morte di Galileo (a sua volta questi, guarda
caso, era nato lanno in cui mor` Michelangelo).
Galileo non si sogn`
o mai di dire che la Natura fosse
un libro scritto in caratteri numerici (a lui poco
familiari), ma dichiar`
o anzi che tale libro era scritto
in forma di triangoli, quadrati, cerchi e altre figure
geometriche. Allopposto, commercianti e banchieri
del 1200 capirono subito limportanza dellopera di
Fibonacci, e la supremazia in Europa della Toscana in
questi settori fu in parte dovuta alla superiorit`
a degli
algorismi sugli altri metodi di calcolo. Quando,
nella prima met`
a del 1300 aveva in Firenze circa
XXV M duomini da portare armi da XV in LXX
anni, riferisce Giovanni Villani nella Nuova Cronica, I garzoni che stavano ad apprendere labaco
e lalgorismi in VI scole [erano] da M in MCC. E
quelli che stavano ad apprendere gramatica e loica in
IIII grandi scuole da DL in DC. Quindi, i ragazzi
avviati a diventare contabili (come diremmo oggi)
erano il doppio di quelli avviati alle lettere o alle leggi.
La notazione arabica è una notazione posizionale

basata sul numero 10. Le dieci cifre arabiche 0, 1, 2,
3, 4, 5, 6, 7, 8, 9 assumono un valore diverso a seconda
della posizione che hanno nel numero. A partire da
destra, la prima è la cifra delle unità, poi cè quella
delle decine, delle centinaia, delle migliaia e cos` via.
Per essere esatti, se il numero n è rappresentato dalla
sequenza di cifre dr dr1 . . . d1 d0 , allora il suo valore
è:
n = 10r dr + 10r1 dr1 + + 10 d1 + d0 .
Ad esempio, 3223 = 3 103 + 2 102 + 2 10 + 3.
La notazione decimale dei numeri ci è ormai diventata tanto familiare che non ne avvertiamo pi`
u laspetto di artificio, legato al fatto che abbiamo 10 dita.
Probabilmente, se come Paperino avessimo quattro
dita per mano, la base pi`
u naturale sarebbe stata 8.
Ma allora, ci possiamo chiedere, esiste una notazione
veramente naturale per i numeri? Lunica che può
rivendicare una qualifica del genere è la notazione
ad aste o a stecchini, cioè la notazione che rappresenta il numero n con n aste (o stecchini o qualsiasi
altro simbolo) disposte una dietro laltra: il numero 7 sarebbe |||||||. In questa notazione, detta anche
numerazione primitiva, abbiamo veramente un accordo, cioè una corrispondenza biunivoca evidente, fra
ciò che vogliamo contare (seggiole, teste o stelle) e il
modo di rappresentare tale conteggio: ogni oggetto
unasta, e viceversa.
Gli inconvenienti di questa notazione sono la lunghezza e lilleggibilità. Provate a scrivere anche solo
25
157 e fatelo leggere a qualcuno che non sappia quale numero avete scritto, e vi accorgerete dellutilità
della nostra rappresentazione decimale. Qual è allora il processo che sta dietro a tale notazione? Anche
questo lo abbiamo imparato alle scuole elementari.
Cominciamo col ricordare che esiste una notazione
convenzionale per i numeri piccoli: ad una sola asta
| associamo la cifra 1, a due aste || la cifra 2, e cos`
via fino a nove aste |||||||||, cui associamo la cifra 9.
Quando di aste non ve ne sono, indichiamo questo
fatto con la cifra 0.
Nota 1.6
Come abbiamo accennato, i Babilonesi

svilupparono una notazione posizionale, ancorche
basata sul numero 60. Purtroppo, la cifra 0 non
veniva considerata, di modo che 23 poteva indicare
tanto il numero 23 quanto il 203 o il 2003, e si doveva
capire dal contesto quale fosse linterpretazione
corretta. Ci`
o rendeva questa notazione inutilizzabile
per eseguire i calcoli, e fu proprio su questo punto
che i Babilonesi fallirono. Quando fu riscoperto, lo
zero venne rappresentato da un tondino; si pass`
o poi
a un semplice punto, e solo in seguito si è arrivati
allattuale simbolo. Gli arabi usavano per lo zero
il nome sifr, che significa vuoto. Il termine fu
tradotto in latino con il termine zephyrum e da
questo sono derivate le parole zero e cifra.
Ecco allora che presentiamo il nostro primo

algoritmo:
Algoritmo 1.1 (Rappresentazione decimale)
Ingresso: Un numero n scritto nella notazione ad
aste;
Uscita: La rappresentazione decimale di n.
1. sia S linsieme contenente le aste che rappresentano n;
2. se S è vuoto, rappresentiamo n con la cifra 0 e
usciamo;
3. altrimenti sia L una lista vuota;
4. se linsieme S contiene meno di 10 aste, poniamo in testa ad L la cifra corrispondente al numero di aste di S; si esce e la sequenza ordinata delle cifre che si trovano in L è la rappresentazione
decimale del numero n;
5. altrimenti, raggruppiamo in sottoinsiemi di 10
aste tutte le aste di S;
6. se, arrivati alla fine delloperazione di raggruppamento, è rimasto un gruppetto di k aste (k <
10) mettiamo in testa alla lista L la cifra corrispondente al numero k; se invece non è rimasto
nessun gruppetto, mettiamo la cifra 0 in testa ad
L;
26
7. eliminiamo leventuale gruppetto di k aste rimasto; estraiamo da ciascuno dei gruppi di 10 aste
ununica asta e, con queste, formiamo un nuovo
insieme che chiamiamo ancora S;
8. si torna al punto 4.
Per il numero 34, il raggruppamento produce:
||||||||||
| {z }
||||||||||
| {z }
||||||||||
| {z }
||||,
La sequenza dei resti, letta da destra verso sinistra,

3245, dà la rappresentazione del numero in base 7.
Per le basi maggiori di 10, le cifre ulteriori si indicano
con le lettere dellalfabeto: A = 10, B = 11, C = 12,
etc. Ad esempio, se si vuole esprimere 148710 in base
12 si ha:
1
4 8
2 8
4
1
7 1
1
7
1
2
2 3 1
0 3 1
3 1
2
0 1
0 0
per cui la prima cifra da porre in L è 4. Lestrazione

delle aste dai gruppi dà ||| e quindi la cifra 3 viene Questa volta la sequenza dei resti è 10, 3, 11, e quindi
posta in testa ad L che diviene (3, 4). A questo pun- 1487 = A3B .
10
12
to si è finito e in L si legge il numero 34, come cera
da aspettarsi. Il lettore è invitato a immaginare quale
Nota 1.7
Nel caso che la base sia 2, le divisioni
semplificazione apporterebbe al precedente algoritmo
si fanno ad occhio e il resto è ovviamente 0 oppure 1
a seconda che il numero sia pari o dispari. Limpostalidea di generalizzare il concetto di raggruppare in
zione è allora la seguente e il numero in base 2 si legge
sottoinsiemi di 10 aste per intendere che tale ragdal basso verso lalto: 17810 = 101100102 :
gruppamento possa essere fatto (virtualmente) anche
quando le aste sono meno di 10.
178 0
Il metodo realizzato dallalgoritmo è del tutto ge89 1
nerale e chiaramente univoco; permette perciò di
44 0
formulare un risultato molto importante:
22 0
11
5
2
1
0
Teorema 1.2 Se dr dr1 . . . d1 d0 è la rappresentazione decimale di un numero naturale n, allora tale

rappresentazione è unica.
Lalgoritmo 1.1 ha unimportanza molto superiore alla sua apparente banalità, come cercheremo di
mettere ora in evidenza. La base 10, come sè detto,
è in larga parte arbitraria; potremmo usare la base
7 e avere una diversa rappresentazione dei numeri.
In questo caso, ad esempio, dovremmo utilizzare 7
cifre, diciamo 0, 1, 2, 3, 4, 5, 6, e un numero come 3245 avrebbe per significato: 3 73 + 2 72 +
4 7 + 5 = 1029 + 98 + 28 + 5 = 1160. Si scrive anche 32457 = 116010 , se si vogliono mettere in
evidenza le basi ed evitare possibili confusioni. Analogamente, in base 2 si usano le sole cifre 0,1, dette
bit (in inglese: BInary digIT, cifre binarie), e un
numero come 10110112 ha come valore in base 10:
1 26 + 0 25 + 1 24 + 1 23 + 0 22 + 1 2 + 1 =
64 + 16 + 8 + 2 + 1 = 91. Queste osservazioni permettono di capire il significato di un numero scritto
in una base qualsiasi.
Viceversa, se vogliamo scrivere un numero come
1160 in base 7, basta procedere come stabilito dallAlgoritmo 1.1, utilizzando il 7 al posto del 10. In
pratica, il metodo si dice delle divisioni successive e
si imposta, appunto, come una serie di divisioni:
1 1
4
6 0 7
6
1
4 0
5
6 5
2 5
4
7
2 3
2
7
3 7
3 0
1
1
0
1
Anche la conversione inversa pu`

o essere resa pi`
u veloce
impostandola nel modo seguente: a partire da destra,
si scrivono, sotto ogni cifra del numero binario di partenza, le potenze di due a partire da 20 = 1. Questo
si fa raddoppiando ad occhio ogni volta il numero precedente (cioè, quello sulla destra). Alla fine, si sommano, sempre a mente, i numeri che stanno sotto i bit
uguali ad 1.
1
128
0
64
1
32
1
16
0
8
0
4
1
2
0
1
In questo caso si ha 128 + 32 + 16 + 2 = 178, come si

sapeva.
Una domanda abbastanza naturale a questo punto
è: quantè lunga la rappresentazione di un numero
n?
Pi`
u precisamente, quante cifre servono per
rappresentare il numero n nella base b? Per la regola
posizionale, servono k + 1 cifre se il numero è compreso tra bk e bk+1 , cioè se abbiamo: bk n < bk+1 .
Passando ai logaritmi in base b (siamo in una nota!)
si ottiene: k logb (n) < k + 1; poiche k è un
numero intero, si ha k = logb (n), dove questa
notazione significa: Prendi la parte intera di . . ..
Aggiungendo 1, si ottiene il risultato generale: il
numero di cifre necessarie a scrivere il numero n nella
base b è logb (n) + 1. Spesso e volentieri, quando
si usa un elaboratore, occorre passare rapidamente
dalla base 2 alla base 10, o viceversa. Se non si
deve essere molto precisi, e ci si accontenta del solo
1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI

ordine di grandezza, siano k2 e k10 il numero di
cifre necessario a scrivere il numero n in base 2 e in
base 10. Dallapprossimazione classica 210 103 si
ha la semplice proporzione: k2 : k10 = 10 : 3, che
permette il calcolo veloce di k2 conoscendo k10 , e
viceversa. Ad esempio, nella rappresentazione interna
dellelaboratore, di solito si riescono a rappresentare
i numeri fino a 2128 ; dalla precedente proporzione si
ricava che tale numero corrisponde, grosso modo, a
1038 .
La numerazione posizionale con base fissa, sia che

questa venga scelta come 10, sia che si preferisca 2,
8 o 12, è in effetti il metodo pi`
u semplice di rappresentare i numeri e permette di eseguire direttamente
le operazioni elementari. Tuttavia, si possono concepire numerazioni posizionali con una base composta,
e nella realtà esistono ancora oggi (e pi`
u ne esistevano nel passato) numerazioni di questo tipo. La pi`
u
utilizzata nella pratica è la numerazione dei giorni,
per la quale un anno si compone di 12 mesi, un mese di (circa) 30 giorni, un giorno di 24 ore, unora
di 60 minuti e un minuto di 60 secondi. Limitandoci ai giorni, la scrittura 5d 14h 35 18 si legge: cinque
giorni, quattordici ore, trentacinque minuti e diciotto secondi. Cos` come nella base 10 ogni cifra deve
essere compresa nel rango 0 9, qui ogni indicazione
di ora deve essere compresa tra 0 e 23, ogni indicazione di minuto e di secondo deve rientrare nel rango
059; la base composta si scrive pertanto (24, 60, 60),
quando ci si limiti ai giorni, e (12, 31, 24, 60, 60) oppure (365, 24, 60, 60) quando la si voglia estendere a
tutto lanno.
In questa ottica, 4d 36h 154 78 è apparentemente
una scrittura priva di senso, analoga al numero 2013
in base 2. Tuttavia, conviene dare un senso a tale
notazione, interpretando le varie quantità in funzione
del corrispondente valore della base. Ciò, come vedremo, è molto conveniente per eseguire le operazioni
e avviene nel modo seguente, procedendo da destra
verso sinistra:
27
1.1 permette, conoscendo i numeri che definiscono la

base composta, di trovare la rappresentazione di una
quantità data come numero di secondi (o di minuti o
di ore) interpretati come stecchini od aste. Naturalmente, le suddivisioni in gruppi non avvengono pi`
u
tutte nella stessa maniera, ma in funzione delle componenti della base: cos` i secondi vengono riuniti in
gruppi di 60, i minuti ancora in gruppi di 60, ma le
ore in gruppi di 24.
In questo caso, le abbreviazioni d, h per giorno ed
ora non vengono dallinglese day e hour, ma dal latino
dies ed hora, il che potrà tranquillizzare pi`
u di una
persona. I minuti primi e i minuti secondi sono unespressione antica, nella quale minuto sta appunto
per piccolo, cioè suddivisione piccola dellora; luso
ha poi portato a chiamare i primi semplicemente minuti e i secondi secondi (spero si voglia apprezzare il
bisticcio). La notazione con gli esponenti è tipograficamente un po ostica; cos` dal quotidiano apprendo
che Gilberto Simoni ha vinto la tappa di ieri del Giro dItalia in 4h46 43 ; negli orari, ferroviari e non,
la partenza è annunciata alle 15:46, evitando giustamente il punto o la virgola decimale, visto che questi
numeri decimali non sono. Anche gli orologi digitali
e i calcolatori elettronici hanno adottato questa notazione con i due punti, riferendola costantemente alle
ore del giorno. Mi capita anche di vedere 18:37:58
per 18h 37 58 e, costretti dagli orari, perfino gli anglosassoni oggi accettano di scrivere 15:46 invece di
3:46 p.m., arrivando a pronunciare fifteen hundred
forty six. Dove si andrà a finire?
Analoghe considerazioni valgono per la notazione relativa agli angoli, dove la base composta è
(360, 60, 60), con lulteriore precisazione che non si
possono superare i 360 , corrispondenti a un angolo giro completo. Un angolo è dato in gradi compresi tra 0 e 359 (si ripetono poi ciclicamente); un
grado è composto di 60 primi e un primo di 60 secondi. Cos` 1000 324 97 è una brutta rappresentazione di un angolo di 285 25 37 , come il lettore
avrà la compiacenza di verificare con quattro calcoli
elementari.
78 si interpreta come 1 minuto e 18 , visto

che un minuto corrisponde a 60 secondi; queIl sistema metrico decimale, prodotto dallIllumisto minuto va a incrementare i 154 portandoli a nismo del 1700 e messo in atto dalla Rivoluzione
155 ;
Francese, ha in pratica lasciato alle basi composte
soltanto il computo del tempo e la misurazione de
155 si interpreta come 2 ore (cioè, 120 ) e 35 ; le gli angoli. Nel mondo anglosassone, pi`
u restio ad
h
due ore vanno ad incrementare le 36 portandole accettare le novità venute dalla Francia, fino al 14
h
a 38 ;
Gennaio del 1971 la sterlina si divideva in 20 scellini
38h si interpreta come 1 giorno (cioè, 24h ) pi`
u (ma la ghinea valeva 21 scellini), e lo scellino in 12
14h ; questo giorno incrementa di 1 il numero pence (plurale, questo, di penny, anche se tre monete da un penny erano three pennies); la base era
complessivo dei giorni.
quindi (, 20, 12) o anche (20, 12) e lo straniero era
In definitiva, abbiamo 4d 36h 154 78 = 5d 14h 35 18 e guardato in modo supercilioso se si imbrogliava anquesta è la rappresentazione standard. LAlgoritmo che un po. Ancora oggi, le unità di misura lineare,
28
e di conseguenza le misure di superficie e di volume,

non si rifanno alla base 10: il pollice (2.54 cm) ha come multipli il piede, composto di 12 pollici, la yarda,
formata da 3 piedi, e il miglio, che di yarde ne conta
esattamente 1760. Come sottomultipli del pollice si
usano il mezzo pollice, il quarto, lottavo e anche il
sedicesimo di pollice, il che porta in ballo, del tutto
inaspettatamente, la base 2. Facco grazia al lettore
delle misure di peso (oncia, libbra, etc.) e di quelle
di volume (quarto, pinta e gallone).
1.6
La nomenclatura della Matematica
Gli insiemi e i numeri, di cui abbiamo parlato, sono

sicuramente concetti che appartengono alla Matematica, anche se non è chiaro perche il concetto di mandorla non ne debba far parte. Si pensa, in genere,
che concetti troppo specifici, come appunto quello di
mandorla, non possano portare a conclusioni generali: o la mandorla è vista come elemento di un insieme,
e allora il concetto di insieme viene a inglobare quello
di mandorla, oppure vogliamo contare le mandorle, e
allora dobbiamo proprio astrarre dal fatto di contare mandorle, e di nuovo linteresse per tale concetto
viene a cadere. Ma allora, ci chiediamo, quanto deve
essere generale un concetto per poter appartenere alla Matematica? Questo è difficile a dirsi e se si pensa
che per secoli la rappresentazione arabica dei numeri
non è stata presa in considerazione dalla Matematica
accademica, ci si rende conto come la demarcazione
sia estremamente labile. Diciamo che un concetto o,
meglio, una serie di concetti fanno parte della Matematica quando si riesce a creare una teoria che li
comprende. Che cosè allora una teoria?
La misurazione dei campi potrebbe, oggi come oggi, difficilmente essere considerata una parte, perfino
importante, della Matematica: il suo grado di generalità sembra alquanto basso se confrontato, ad esempio, con la Fisica nucleare, lastronomia o la ricerca
operativa. In effetti la Geometria (cioè la misurazione
dei terreni) è uno dei pi`
u classici esempi di teoria matematica. Partendo dalla considerazione delle figure
dei campi, i geometri dellantichità hanno individuato
alcuni concetti che costituiscono la base di ogni altro
concetto geometrico. Per far questo hanno cercato di
dare una definizione di triangolo e di rettangolo, ma
queste implicano una definizione di angolo e di lato, e
quindi la definizione di segmento e di semiretta, e cos`
via. Questo processo che ci porta a concetti sempre
pi`
u generali non può continuare allinfinito, ma dobbiamo interromperlo da qualche parte. Fu deciso di
interromperlo ai concetti di punto, retta, piano, spazio e alle loro reciproche disposizioni. Ciò significa
che non possiamo (e non vogliamo) definire che cosa

è un punto, che cosa è una retta o che cosa vuol dire
che un punto si trova su una retta. Ma allora, come
possiamo sapere che cosa sono questi oggetti e queste
relazioni?
Gli antichi (ad esempio Euclide) avevano dato una
risposta a livello di intuizione: i concetti primitivi,
cioè non definiti e non definibili, sono astrazioni estreme di concetti evidenti e, come tali, noi li accettiamo
per buoni. La realtà, di cui sono astrazione, ci assicura della loro esistenza e della validità delle loro
proprietà. In questa ottica, una retta può essere infinitamente lunga e infinitamente smilza, anche se nella realtà non è cos`: le proprietà sono intuite quando
operiamo latto di pensare di restringere sempre pi`
u
una retta reale e di farla continuare oltre ogni limite
fisico. In ogni modo, ai concetti di base della teoria
rimane legata una realtà che permette di applicare
al mondo che ci circonda i risultati della teoria stessa.
Cos`, nella visione antica, la Geometria, oltre ad essere una teoria, è uno strumento pratico, ed è proprio
questo aggancio al mondo reale che rende una teoria vera: se scoprissimo qualche divario tra teoria e
pratica, la teoria non andrebbe pi`
u bene e dovrebbe
essere abbandonata.
Questa dipendenza della teoria dalla pratica ha fatto molto pensare i matematici, che non erano soddisfatti proprio per niente. Cos`, durante il 1800 hanno
cambiato le carte in tavola, invertendo completamente il vecchio punto di vista: non è la realtà che determina o convalida una teoria, ma questa è unentità
autonoma che, semmai, trova un suo modello nella
realtà, o almeno in quella parte della realtà che ha
il buon gusto di adeguarsi alla teoria. Cosa significa
questo per la Geometria? Significa che punto, retta,
piano e spazio non sono astrazioni della realtà, ma
sono dei puri nomi o simboli, le cui reciproche relazioni sono definite negli assiomi della teoria. Gli assiomi,
cioè le verità che nella concezione antica erano stabiliti dalla realtà e accettate come tali, ora sono concepiti come proprietà che regolano le relazioni reciproche
fra i simboli della teoria. In questo senso, gli assiomi potrebbero essere del tutto arbitrari; esiste però
unovvia limitazione: essi non si possono contraddire
tra di loro, ne portare a contraddizioni interne alla
teoria. Cos`, in altre parole, non deve mai succedere che si dimostri una certa affermazione insieme alla
sua contraria. La mancanza di contraddizioni si dice
coerenza della teoria.
Nota 1.8
Aristotele dava significati distinti alle

parole assioma e postulato (si veda al Capitolo
6 sulla Geometria Euclidea). Gli assiomi, o nozioni
comuni, sono affermazioni evidenti di per se e comuni
a tutte le scienze (ad esempio: se due oggetti sono
uguali ad un terzo, allora sono anche uguali tra di
loro). I postulati sono invece verit`
a specifiche della
1.6. LA NOMENCLATURA DELLA MATEMATICA
29
direttamente. La coerenza della teoria di Peano ci

dice che tutte le affermazioni che possiamo dimostrare sono vere nel senso detto: vorremmo anche che,
viceversa, tutte le affermazioni vere potessero essere
dimostrate. Qui entra in ballo la completezza e ci
farebbe piacere dimostrare che la teoria di Peano è
completa, cosa che potrebbe essere ragionevolmente
vera, visto che i Matematici sono riusciti a costruire
(quasi) tutta la Matematica conosciuta partendo da
quegli assiomi. Qui, però, viene il difficile, poiche si
tratta di dimostrare qualcosa di generale sulla teoria agendo dallinterno della teoria stessa. Nel 1928,
il logico e Matematico austriaco Kurt Godel riusc` a
dimostrare (proprio dallinterno della teoria) che gli
assiomi di Peano non sono completi, cioè che esistono
affermazioni vere, ma indimostrabili. Non solo, ma
egli fece vedere che qualunque teoria che comprenda
gli assiomi di Peano (e quindi voglia assiomatizzare
lAritmetica e la Matematica) è di per se non comIn un certo senso, la coerenza di una teoria si rife- pleta. In altre parole, la nostra speranza di poter
risce al nostro desiderio che, allinterno della teoria, dimostrare tutto ciò che è vero nella Matematica è
non si riescano a dimostrare troppe affermazioni, un sogno destinato comunque a fallire.
cos` tante da includere anche la negazione di un teoreUn aspetto, infine, forse meno importante ma cerma già dimostrato vero. Allopposto, desidereremmo
to
interessante, è costituito dallindipendenza dei vari
anche che la teoria non fosse troppo ristretta da non
assiomi
di una teoria. Un assioma si dice indipenpermetterci di dimostrare affermazioni che sappiamo
dente
dagli
altri considerati, se, togliendolo dalla foressere vere e che vorremmo fossero incluse nellambito
mulazione
della
teoria, questa perde una parte dei
della teoria. Se i nostri assiomi sono troppo specifici o
le regole con cui effettuiamo i nostri ragionamenti non suoi teoremi. Questa affermazione può essere messa
sono abbastanza potenti, rischiamo di non arrivare a in positivo dicendo che un assioma dipende dagli altri
dimostrare fatti che, invece, per la nostra esperien- assiomi della teoria, se esso può essere dimostrato a
za o anche solo per la nostra volontà, dovrebbero far partire da quelli (e pertanto non è un vero assioma).
parte della teoria che stiamo sviluppando. Una teo- Fondare una teoria su assiomi indipendenti vuol dire
ria (coerente) nella quale si possono dimostrare tutti riuscira a svilupparla con un numero minimo di coni teoremi che sono veri si dice completa. Quindi, cetti dati per buoni; questo rientra in quel gusto
in altre parole, una teoria ideale o perfetta è una estetico che i matematici hanno per la loro scienza e
teoria coerente e completa, nel senso preciso che in del quale parlavamo già nella Premessa.
disciplina che stiamo studiando; la loro evidenza è
subordinata al fatto che si abbia idea della disciplina
in questione. Ad esempio, un postulato della Geometria Euclidea è: Tutti gli angoli retti sono uguali,
il che è s` apparentemente vero, ma occorre che si
sappia che cosè un angolo retto. Il famoso postulato
Per un punto P esterno a una retta r passa una
e una sola retta parallela ad r (dato da Euclide
in tuttaltra forma; si veda ancora il capitolo sulla
Geometria Euclidea) non è stato mai considerato
troppo evidente e, come è noto, ha dato origine alle
Geometrie non Euclidee, teorie che sono coerenti (se
ne danno semplici modelli nella nostra realt`
a forse
Euclidea), ma nelle quali è evidente che per P
possono passare infinite rette parallele ad r, o anche
nessuna. Oggi la distinzione tra assioma e postulato
è caduta e si usano indifferentemente i due termini
per indicare gli elementi di base di una teoria.
una tale teoria si riescono a dimostrare tutte e sole le

affermazioni vere.
Possiamo forse essere pi`
u precisi facendo un esempio importante. Nella Nota 2.8 vedremo lassiomatizzazione dellAritmetica proposta da Peano; in realtà,
essa è molto di pi`
u, poiche può essere presa come
base dellassiomatizzazione di tutta la Matematica.
Che essa sia coerente, è ragionevole pensarlo, dato
che gli assiomi sembrano adattarsi bene alle proprietà
dei numeri naturali che essi vogliono descrivere; ci
aspettiamo pertanto che tutti i teoremi che in essa
riusciamo a dimostrare siano veri. Dire che unaffermazione è vera significa qui che essa è verificata
nel mondo della Matematica, reale o ideale che esso
sia. Ma come possiamo dire che unaffermazione è vera in questo senso? Le affermazioni della Matematica
(ma basta considerare quelle dellAritmetica) coinvolgono in generale un numero infinito di oggetti (cioè,
di numeri) e quindi è impensabile poterli verificare
Ma cosa significa dimostrare? Il senso comune ci

fornisce alcune regole che ci permettono di stabilire se
una frase è conseguenza logica di unaltra frase, come
Se non ti metti le scarpe, andrai scalzo. Lesperienza ce ne fornisce altre di tipo pi`
u specifico, come: Se
non ti metti la maglia, prenderai un raffreddore. Come si vede, le prime regole prescindono dal contenuto
particolare della frase e si basano su una riformulazione dello stesso concetto: non mettersi le scarpe o
andare scalzi significano la stessa cosa. Queste regole
possono sembrare ovvietà, ma spesso si rivelano pi`
u
utili di quanto non ci si aspetterebbe: esse sono le comuni regole della logica e tutti i ragionamenti, sia in
Matematica sia nella vita di tutti i giorni, ne fanno
largo uso. Il secondo tipo di regole è specifico dellargomento che si sta trattando, cioè della teoria che
stiamo elaborando: la frase precedente sul raffreddore fa parte (con un po di fantasia) della Medicina
e non della Matematica, ma si possono fare esempi
30
come Se A, B, C sono tre punti su una retta ed A

è compreso tra B e C, allora la distanza di A da B
è minore della distanza di B da C. Le regole di
deduzione specifiche di una teoria si dicono regole di
inferenza della teoria e, assieme agli assiomi, costituiscono la base della teoria stessa. Sviluppare una
teoria significa dedurre le conseguenze possibili degli
assiomi usando le regole della logica e le regole di inferenza. Nella prossima sezione vedremo le tecniche
pi`
u importanti che ricorrono nelle dimostrazioni della
Matematica.
Che gli assiomi siano coerenti tra di loro è, di solito,
facile a vedersi; pi`
u difficile è capire se, procedendo
nello sviluppo della teoria, non si arriverà mai a qualche contraddizione. Un metodo consiste nel cercare
nella realtà un modello della teoria, cioè una parte
della realtà che soddisfi gli assiomi della teoria. Se
abbiamo fiducia nella coerenza della realtà (che cioè
questa non cada in contraddizione con se stessa), questo adeguarsi del modello alla teoria ci può rassicurare sulla coerenza di questultima. Riassumendo, una
teoria è costituita:
parola teorema è oggi un termine generico che indica tutte le conseguenze possibili degli assiomi. Nella
pratica, si lascia il nome di teorema ai risultati veramente importanti, e si preferisce usare i seguenti
termini in situazioni pi`
u specifiche:
osservazione e proposizione: allargando un
po il concetto di affermazione singolare questi
nomi indicano risultati di semplice verifica, cioè
dimostrabili senza sforzi, in maniera elementare
e di solito non interessante;
lemma: indica un teorema che non è un risultato importante di per se, ma che serve a semplificare la dimostrazione di uno o pi`
u risultati
interessanti (che probabilmente saranno definiti
teoremi);
corollario: si riferisce a un teorema che è una
immediata conseguenza di un altro teorema appena dimostrato. La dimostrazione di un corollario si riduce spesso a una o due righe e, talvolta,
si può omettere addirittura.
da un insieme di assiomi, che consideriamo veNon tutte le affermazioni che riteniamo vere possori per definizione e che legano tra di loro i vari no essere dimostrate; come abbiamo osservato, questo
concetti di base della teoria stessa, definendoli fatto è intrinseco alle teorie formali e non possiamo
implicitamente;
che prenderne atto. Tuttavia, di fronte a unaffermazione che ha resistito allattacco di generazioni di
da un insieme di regole di inferenza, cioè di mematematici, i quali hanno miseramente fallito, ma che
todi di ragionamento specifici della teoria che
ci sembra vera per varie ragioni (la sensatezza, lespeci permettono di passare dagli assiomi ad alrienza, le prove effettuate, la ricerche mediante luso
tre affermazioni vere, sempre pi`
u profonde e che
di calcolatori elettronici), non possiamo sapere se: 1)
costituiscono il corpo della teoria.
stiamo sbagliando e laffermazione è in realtà falsa;
2) siamo imbranati e nono siamo riusciti a trovare la
Partendo dagli assiomi e lavorando con le regole di
strada giusta per la dimostrazione, che perciò verrà
inferenza e le regole comuni della logica si ottengofuori fra qualche annetto; 3) siamo davvero sfortunati
no nuove affermazioni vere che si dicono teoremi. La
e ci siamo imbattuti in una proposizione pevista dal
forma generale di un teorema è: Se è vero un certo
teorema di incompletezza di Godel. Si usa per questa
insieme di affermazioni A1 , A2 , . . . , Ar , allora è vera
situazione il termine:
laffermazione B; si dice che A1 , A2 , . . . , Ar costituiscono le ipotesi del teorema e che B è la tesi. Se il
congettura: si riferisce ad affermazioni che
teorema risulta vero, si dice anche che A1 , A2 , . . . , Ar
pensiamo essere vere, ma per le quali non
sono condizioni sufficienti per B, o che B è condizione
conosciamo (ancora) alcuna dimostrazione.
necessaria per A1 , A2 , . . . , Ar . Talvolta un teorema si
esprime nella forma pi`
u sintetica dellimplicazione A
Come esempio della terminologia introdotta, conimplica B. Alcuni teoremi assumono la forma A è sideriamo la seguente sequenza di dimostrazioni. Covero se e solo se tale è B; questo equivale ai due minciamo con losservare che se sommiamo i primi
teoremi A implica B e B implica A, e cioè A è due numeri dispari 1 e 3 otteniamo 4 = 22 . Sommancondizione necessaria e sufficiente per B. In questo do i primi tre dispari si ha 1 + 3 + 5 = 9 = 32 , e se
caso la forma sintetica è A se e solo se B, e si dice sommiamo i primi quattro otteniamo proprio 42 . E
una doppia implicazione.
possibile dimostrare che la somma dei primi n numeri
I teoremi sono sempre affermazioni di carattere ge- dispari è proprio n2 ? Prima di tutto dimostriamo il
nerale; ad esempio, 52 + 19 = 71 è unaffermazione seguente:
deducibile dagli assiomi dellaritmetica. Tuttavia, essa non verrà mai considerata un teorema, ma sempli- Lemma 1.3 I primi n numeri dispari sono
cemente una affermazione singolare della teoria. La 1, 3, . . . , 2n 1.
1.7. MATEMATICA E LOGICA

Prova: Se escludiamo lo 0, i primi n numeri sono 1, 2, . . . , n e quindi i primi n numeri pari sono
2, 4, . . . , 2n. I primi n numeri dispari sono quelli che
precedono i primi n numeri pari e quindi sono proprio
1, 3, . . . , 2n 1.
Questo risultato ci serve ora a dimostrare:
Teorema 1.4 La somma dei primi n numeri dispari
vale:
1 + 3 + + (2n 1) = n2 .
Prova: Posto S = 1 + 3 + + (2n 1), si ha anche
S = (2n 1) + + 3 + 1. Sommando le coppie
di elementi corrispondenti si ha: 2S = 2n + 2n +
+ 2n + 2n = 2n2 , essendo la somma composta di
n termini tutti uguali a 2n. Dividendo per 2 si ha il
risultato desiderato.
Questo è il nostro teorema importante che ha come
conseguenza immediata:
Corollario 1.5 La media dei primi n numeri dispari
è uguale ad n.
Prova: Essendo n i numeri, la media è S/n =
n2 /n = n.
Ricordiamo infine che la forma canonica o normale
di un oggetto matematico è unespressione che denota quelloggetto in una maniera standard, secondo
opportune convenzioni, ed è adatta a semplificare le
elaborazioni relative a quelloggetto. Ad esempio, la
forma canonica di unequazione di secondo grado è
ax2 + bx + c = 0, e da questa forma si deducono le
eventuali soluzioni. La forma normale di una retta
(non perpendicolare allasse delle x) è y = mx + b,
dove m è la pendenza e b è lintercetta, cioè il valore dellintersezione con lasse delle y. Tuttavia, in
particolari contesti, si considera come forma canonica
della retta ax + by + c = 0 e quando si voglia trovare
lintersezione di due rette si preferisce una terza forma canonica, e cioè ax + by = c, che vale anche per
le rette perpendicolari allasse delle x.
1.7
Matematica e Logica
Il ragionamento matematico è un caso particolare del

ragionamento logico e, pi`
u in generale, le teorie matematiche sono parte delle teorie logiche. Spesso, oggi, si tende ad identificare Matematica e Logica, perche questultima può essere formalizzata in una teoria
matematica. Dal nostro punto di vista, volutamente
elementare, questa identità interessa come curiosità,
piuttosto che come situazione effettiva. Tuttavia, non
possiamo ignorare le grandi e importanti connessioni che legano Matematica e Logica. In particolare,
è bene mettere in evidenza quelle parti, o almeno
31
quei concetti della Logica che hanno un immediato
riscontro nella Matematica.
La teoria logica pi`
u elementare è senza dubbio il
Calcolo proposizionale o Logica delle proposizioni. Inventata da Boole (1815 1864) alla metà del 1800,
e sviluppata dai matematici inglesi di quel periodo,
questa teoria tratta in modo del tutto generale delle
proposizioni, ove informalmente con questo termine
si intende ogni affermazione che possa essere vera o
falsa. Questo esclude dalla teoria le domande e le
esclamazioni, ma comprende quasi tutto il discorso
comune. Per questo la sua connessione con la Matematica è forte e deve essere conosciuta. Gli esempi
che faremo sono presi dalla lingua parlata, ma cercheremo di dare anche significativi agganci alle proposizioni della matematica, in particolare ai teoremi.
Nel Capitolo 4 dedicheremo la Sezione 4.6 al calcolo
delle proposizioni; per il momento ci accontentiamo
di introdurre i concetti e le tecniche principali.
Le proposizioni che si prendono in considerazione
devono sempre essere ben determinate; cos` la frase
domani è domenica suppone che si stia ragionando in un preciso giorno e che quindi la frase sia vera
(siamo di sabato) o falsa (siamo in qualche altro giorno della settimana); va cioè esclusa lidea che la frase
possa dipendere dal giorno in cui è stata pronunciata.
Le frasi con questultimo intendimento, che prevedono una variabilità del discorso in funzione di quale
giorno della settimana è oggi, non sono proposizioni,
ma nella terminologia della Logica si dicono predicati
e hanno una propria teoria, alla quale accenneremo
nella Sezione 1.8. Analogamente, la frase Carlo è
andato a Roma presuppone che sia perfettamente
individuato il Carlo di cui si parla, e questo è un
coltello faccia riferimento a un oggetto ben definito,
che può essere o non essere un coltello.
La negazione di una proposizione è unaltra proposizione, che risulta vera o falsa a seconda che quella
originaria fosse falsa o vera. Ovviamente, se il Carlo di cui parliamo è andato a Roma, la proposizione
Carlo non è andato a Roma è una proposizione falsa. Ciò può essere espresso sinteticamente per mezzo
della tabella di verit`
a che esprime, in funzione dei
possibili valori di verità di p, il valore di verità della
negazione p; assumendo come convenzione che 1 indichi il valore vero e 0 il valore falso, la tabella
è:
p p
0 1
1 0
La congiunzione di due proposizioni è la proposizione che si ottiene interponendo la congiunzione e
fra le due proposizioni; ad esempio Carlo è andato
a Roma e si è iscritto allUniversità. La congiunzione è vera se e solo se risultano vere entrambe le
32
con p q. Questa è la forma dei teoremi della Matematica, ma naturalmente la lingua comune è piena
di implicazioni: Se vai da Carlo [allora] riportagli il
suo libro. La doppia implicazione si esprime . . . se e
solo se . . . , è assai comune in Matematica, molto meno nei discorsi di tutti i giorni, dove, creando sovente
pi`
u di qualche ambiguità, si preferisce esprimersi con
semplici implicazioni: Pagherò se mi conviene di
solito significa Pagherò se e solo se mi conviene,
anche se, letteralmente, chi ha pronunciato la frase
non ha detto se pagherò allora mi conviene, ma si
è limitato a dire: se mi conviene allora pagherò. La
notazione per la doppia implicazione è p q.
La verità o falsità di una implicazione è un problema non del tutto banale. Normalmente, come si
è detto, se p q è unimplicazione, p si dice lipotesi e q la tesi. Se lipotesi è vera e ragioniamo in
modo corretto, vogliamo che sia vera anche la tesi,
anzi non possa essere falsa. Se la tesi risulta falsa,
significa semplicemente che abbiamo sbagliato la deTale formalismo, che qui è appena accennato, ma
duzione, cioè siamo di fronte a una non-implicazione.
che svilupperemo nel Capitolo 4, serve almeno a dare
Secondo la tradizione, questa regola si dice modus pounespressione semplice ad antichi principi:
nens e si enuncia: se p è vera e p implica q è vera,
allora
è vera q:
principio del terzo escluso (tertium non datur): la proposizione p è vera o falsa, cioè p = 1
((p (p q)) q.
oppure p = 0. Questo principio, per noi, fa parte
della stessa definizione di proposizione;
Daltra parte, se una deduzione è corretta, ma la te-
proposizioni che la compongono. La disgiunzione di

due proposizioni si ottiene interponendo tra di esse
la congiunzione oppure con significato disgiuntivo,
cioè che la verità di una proposizione non esclude la
verità dellaltra. Un esempio significativo è mangerò
il dolce oppure [mangerò] la frutta, volendo intendere che comincerò a mangiare uno dei due e poi, se
avrò ancora fame, mangerò anche laltro (conoscendomi, avrei potuto dire mangerò il dolce e la frutta,
ma un po di ritegno non guasta mai). La disgiunzione è vera quando almeno una delle due proposizioni
di partenza è vera, o sono vere tutte due, come illustrato nellesempio. Le rispettive tabelle di verità
sono:
p q pq
p q pq
0 0
0
0 0
0
0
1
0 1
0 1
0
1
1 0
1 0
1 1
1 1
1
1
principio di non contraddizione: la verità si è manifestamente falsa, dobbiamo concludere che

di p esclude la verità di p, e viceversa, cioè lipotesi era falsa. Nella logica aristotelica questo si
p p = 0. La congiunzione di p e della sua dice modus tollens e si formalizza:
negazione è sempre una proposizione falsa, cioè
((p q) q) p.
è una contraddizione.
Questo è ragionevole, ma quando lipotesi è falCome avremo modo di ribadire pi`
u volte, nella Logica
sa, cosa ci possiamo aspettare? Se lipotesi è falsa,
e nella Matematica moderne, questi principi non si
supporla vera è un controsenso o una contraddizione,
reputano pi`
u validi in senso assoluto.
e da una contraddizione possiamo ricavare tutto ciò
Boole dimostrò che i tre modi di connettere le proche vogliamo, cioè possiamo ricavare tanto tesi false
posizioni (e il loro nome tecnico è appunto connettivi
quanto tesi vere. Quindi, in conclusione, limplicalogici) sono sufficienti a generare tutti i possibili lezione sarà vera qualunque sia la verità o falsità della
gami tra proposizioni, e noi lo vedremo nella sezione
tesi.
dedicata al calcolo delle proposizioni. Esistono tuttavia altri connettivi logici importanti. Lesclusione
Nota 1.9
Questo punto non è intuitivo poiche
fra due proposizioni si ottiene, come la disgiunzione,
tendiamo a rifiutare lidea che se partiamo da
mettendole insieme con la congiunzione oppure, ma
unipotesi falsa ragionando bene possiamo arrivare
tanto a conclusioni vere che false. Ma limplicazione
il significato di questa deve essere esclusivo, cioè lun
p q indica la correttezza della deduzione, e quindi
caso deve escludere laltro; cos` possiamo dire: Non
dal
vero non possiamo dedurre il falso, ma dal falso
abbiamo molto tempo: passiamo dal supermercato o
possiamo
dedurre tutto ci`
o che vogliamo. Si narra
andiamo dal commercialista intendendo che se facche ad una conferenza Bertrand Russell (1872 1970)
ciamo una cosa non potremo fare laltra. Lesclusiocercasse di spiegare questo punto. Uno dei presenti,
ne, pertanto, è vera se e solo se una sola tra le due
allora, lo sfid`
o a dimostrare dallipotesi falsa 1 = 2
proposizioni è vera; essa si indica con la notazione
che lui, Russell, e la Regina di Inghilterra erano la
p q.
stessa persona. Russell non ci stette a pensar molto
Limplicazione si esprime di solito con se . . . , ale propose il seguente ragionamento: Io sono una
lora . . . , dove le ellissi stanno ad indicare le due
persona; La Regina dInghilterra è una persona;
quindi io e la Regina di Inghilterra siamo due
proposizioni da collegare; simbolicamente, si denota
1.7. MATEMATICA E LOGICA

persone, Ma se 1 = 2, allora queste due persone
sono una persona sola; In conclusione, io e la
Regina dInghilterra siamo la stessa persona. Laneddoto è probabilmente inventato, ma illustra bene
come lipotesi falsa serva a cambiare le carte in tavola pur rimanendo nellambito della corretta deduzione.
Possiamo mettere le cose in modo un po diverso.

Quando diciamo se piove apro lombrello, possiamo
dire, con lo stesso significato, Non piove oppure apro
lombrello. Analogamente, Se ti affretti arriverai in
tempo alla stazione si può dire: Non ti affretti oppure arriverai in tempo alla stazione. Questo significa che p implica q è equivalente alla disgiunzione
fra la negazione dellipotesi da una parte, e la tesi
dallaltra. Il proverbio Chi non risica non rosica
significa se non rischi non ottieni niente, il che si
può anche dire o rischi oppure non ottieni nulla. E
chi dorme non piglia pesci vale come o sei sveglio
oppure non pigli pesci, e si potrebbe continuare con
uninteressante carrellata sui pi`
u noti proverbi. La
conclusione è che limplicazione p q equivale alla
disgiunzione p q.
Un aspetto importante di questa constatazione riguarda il fatto che la disgiunzione è vera anche quando tutte e due le proposizioni coinvolte sono vere.
Pertanto, nellesempio di chi dorme non piglia pesci
si può verificare, come tutti sappiamo per esperienza,
che uno sia sveglio, ma non riesca a prendere pesci.
In effetti, quello che il proverbio assicura è che per
poter prendere pesci bisogna essere svegli, ma questo
fatto, di per se, non assicura che i pesci li prenderemo
davvero. Questo significa che la proposizione inversa
chi non piglia pesci, dorme non è necessariamente vera, cioè non è deducibile dal proverbio. Il mio
esempio favorito è un altro proverbio: Fortunato in
amor non giochi a carte che significa Se sei fortunato in amore, sarai sfortunato alle carte. Talvolta
il proverbio si usa per consolare chi perde al gioco,
suggerendo che questo fatto voglia dire che la persona è fortunata in amore. Ma il proverbio non afferma
questo, come si capisce con un attimo di riflessione; se
poi lo parafrasiamo come O sei sfortunato in amore
oppure sei sfortunato al gioco, si intende bene che
una persona, ahimè, può essere sfortunata tanto in
amore quanto al gioco.
Il seguente schema fa il punto su una terminologia
che va conosciuta:
p
q
implicazione diretta
p q implicazione inversa
Se
q
p
implicazione contraria
q p implicazione contropositiva
la verità di una implicazione non comporta la verità
della sua contraria, comporta però la verità della cosiddetta contropositiva, cioè la proposizione che dalla
negazione della tesi fa discendere la negazione del-
33
lipotesi. Esemplificando, possiamo osservare che è
la stessa cosa dire Se sei fortunato in amore, sarai
sfortunato al gioco oppure Se sei fortunato al gioco, allora sarai sfortunato in amore. O anche Se
dormi non pigli pesci o Se pigli pesci allora non
dormi. In altre parole, una implicazione e la sua
contropositiva sono proposizioni equivalenti e una è
vera se e solo se è vera laltra, cioè p q risulta vera se e solo se tale risulta q p. Questo viene
sfruttato ampiamente in Matematica dove, spesso, si
usa dimostrare la proposizione contropositiva invece
di dimostrare direttamente un teorema. Questo tipo
di prova viene di solito introdotto cos`: Supponiamo
per assurdo che la tesi sia falsa e prosegue tentando di dimostrare che è vera la negazione dellipotesi.
Talvolta, del tutto impropriamente, questa tecnica è
detta dimostrazione per assurdo, che in realtà è
tutta unaltra cosa e la vedremo un po pi`
u avanti.
Facciamo un semplice esempio di dimostrazione
nella quale, invece di provare lasserto del teorema,
dimostriamo la proposizione contropositiva:
Teorema 1.6 Se il numero intero positivo n non è
un quadrato perfetto ed n = p q, allora il quadrato
di uno dei fattori è minore di n e il quadrato dellaltro
fattore è maggiore di n.
Prova: Intanto, non può essere p2 = n o q 2 = n, altrimenti n sarebbe un quadrato perfetto. Allora deve
essere p 6= q. Se supponiamo falsa la conclusione del
teorema, allora i due quadrati p2 e q 2 devono essere
tutti e due minori o maggiori di n. Nel primo caso però abbiamo p2 q 2 < n2 , cioè p q < n e in
modo analogo nel secondo p q > n, contro lipotesi
p q = n.
Spesso, come sè ricordato, questo tipo di dimostrazione è detto per assurdo, ma le vere dimostrazioni
per assurdo hanno uno schema un po pi`
u complicato. Per dimostrare limplicazione p q si suppone
che valga p e che q sia falsa, cioè sia vera la sua negazione. In altre parole, si parte immaginando vera
la proposizione p q e da essa si cerca di ottenere
una contraddizione o assurdità, che è quello che dà il
nome al modello di dimostrazione. Una contraddizione è semplicemente una proposizione senzaltro falsa,
cioè la negazione di un assioma A o di un teorema
T che abbiamo già dimostrato essere vero. Cos` facendo sappiamo che p q deve essere falsa, perche
altrimenti avremmo la dimostrazione che lassioma A
o il teorema T sono tanto veri che falsi, cioè la nostra
teoria (la Matematica) non è coerente, il che sarebbe
un tantino grave. Ma se p q è falsa, allora o p è
falsa oppure, se p è vera, q è falsa, cioè q è vera. Ma
questo, per la discussione fatta in precedenza, vuol
dire proprio che p implica q, cioè che p q è vera.
Una celebre e antichissima dimostrazione per assur-
34
do è la prova che 2 non è un numero razionale; si 3n(n + 1) = 6h; si ha allora m3 m = 6k + 6h =

veda, per questo, il Teorema 3.18. Se indichiamo con 6(k+h), cioè m3 m è divisibile per 6. Ecco lassurdo:
quindi m non può esistere e V deve essere vuoto.
r lassioma A o il teorema T , lo schema è:
Conclusione, la proprietà vale per ogni n N.
(r ((p q) r)) (p q).
Infine, un ultimo schema di dimostrazione che vogliamo ricordare è il seguente. Cominciamo con losservare che ogni sottoinsieme di N possiede un elemento minimo, cioè pi`
u piccolo di tutti gli altri. Spesso e volentieri non ha un massimo, come linsieme dei
numeri pari o quello delle potenze del 3, ma un minimo ce lha sempre. Supponiamo allora di voler dimostrare che una certa proprietà vale per tutti i numeri
naturali; questo, in altre parole, significa che linsieme V dei numeri naturali che non godono di quella
proprietà è vuoto. Immaginiamo allora che V non
sia vuoto e che quindi contenga un elemento minimo
m. Cerchiamo ora di dimostrare due cose: primo, che
per 0 la proprietà è valida. Questo prova che m > 0 e
quindi che se poniamo m = n + 1, per n la proprietà
deve essere valida. Come seconda cosa cerchiamo di
dimostrare che se la proprietà è vera per il numero n,
allora deve essere vera anche per n + 1, cioè per m.
Se ci riusciamo siamo giunti ad un assurdo, e quindi
lipotesi che V non sia vuoto è errata. Ma V = vuol
dire che la proprietà è valida per tutti i valori di N,
che è proprio quello che volevamo.
Un esempio potrà essere illuminante. Dimostriamo
la proposizione: per ogni valore di n N, n3 n è
divisibile per 6. Il lettore può divertirsi a calcolare
n3 n per 0, 1, 2, 3, 4 e verificare che la proprietà vale; ma, ci chiediamo, è davvero valida per ogni n N?
Certo, se tentiamo per uno specifico valore, diciamo
n = 364, troviamo che davvero 3643 364 = 48228180
è divisibile per 6, ma chi ci dice che non esista un numero (semmai grandissimo) per cui la verifica fallisce?
Procediamo allora come sè visto:
Teorema 1.7 Qualunque sia il numero naturale n
N, la quantit`
a n3 n è divisibile per 6.
Prova: Supponiamo che esista qualche numero n
per cui n3 n non è divisibile per 6 e chiamiamo V
linsieme di questi numeri. Per le prove effettuate, i
numeri da 0 a 4 non stanno in V , e quindi sia m 6= 0
il pi`
u piccolo elemento di V . Se n è il numero che
precede m, n 6 V e dobbiamo avere n3 n = 6k, per
qualche k N. Consideriamo m = n+1 e calcoliamo:
m3 m = (n+1)3 (n+1) = n3 +3n2 +3n+1n1 =
= n3 n + 3(n2 + n) = 6k + 3n(n + 1).
Osserviamo ora che 3n(n + 1) è un numero senzaltro
divisibile per 6, poiche il fattore 3 è presente in modo
esplicito e, sicuramente, uno dei numeri n o n + 1 è
pari (se non è pari n, deve esserlo n + 1). Poniamo
Nota 1.10
Questo tipo di dimostrazione è molto

importante, anche se noi ne limiteremo luso al minimo
indispensabile. La tecnica viene detta dimostrazione
per induzione matematica e spesso si formula nella seguente maniera. Sia P (n) una propriet`
a che dipende
dal numero naturale n. Se P (0) è vera e possiamo
dimostrare che dalla verit`
a di P (n), con n un generico numero naturale, discende la verit`
a di P (n + 1),
allora P (n) è vera per ogni n N. Il procedimento
che abbiamo visto sopra è la dimostrazione di questo
principio di induzione matematica. Infatti, abbiamo
verificato che il minimo numero m che non verifica
la propriet`
a non pu`
o esistere. Intuitivamente, il senso
del principio è il seguente: se verifichiamo direttamente che P (0) è vera, dal fatto che P (n) implica P (n+1)
possiamo dedurre che anche P (1) è vera. In modo analogo, da P (1) discende la verit`
a di P (2), e cos` via per
ogni valore di n.
Il principio di induzione è molto usato in tante parti
della Matematica, dove si rivela un potente metodo di
dimostrazione. Tuttavia, esso ha una serie di inconvenienti, il primo dei quale è che per poterlo applicare
occorre gi`
a conoscere la soluzione del problema che
vogliamo affrontare. Ad esempio, di fronte alla quantit`
a n3 n, occorre gi`
a sapere che essa è divisibile per
6, se vogliamo dimostrare tale fatto per induzione. In
altre parole, il principio funziona da verifica, ma non
è un metodo costruttivo, cioè un metodo che ci faccia
capire come si è arrivati alla soluzione del problema.
Da questo punto di vista, il principio di induzione è
antieducativo e proprio per questo ne limiteremo luso, anche se si tratta di un metodo validissimo di dimostrazione. Ci si deve rendere conto che, di regola,
è molto pi`
u facile verificare una certa propriet`
a che
scoprirla; il principio di induzione ci d`
a una prova di
quella propriet`
a, ma nulla ci dice su come affrontare
la ricerca di propriet`
a analoghe. Noi lo considereremo
una specie di ultima spiaggia a cui ricorrere quando
proprio non cè altro da fare.
Per chiudere questa nota in modo poco serio, vediamo
come lapplicazione del principio di induzione richieda
qualche cautela. Chi ha mai contato il numero delle
foglie di un albero? Ebbene, ora dimostreremo che
(qualunque sia tale numero) tutti gli alberi hanno la
stessa quantit`
a di foglie! Il nostro ragionamento parte
con una base P (1), cioè con un insieme costituito
da un unico albero: tale albero ha un certo numero
di foglie, che ovviamente è lo stesso per tutti gli
alberi dellinsieme, cioè lui. Supponiamo allora di
aver dimostrato che tutti gli insiemi di n alberi sono
costituiti da alberi con la stessa quantit`
a di foglie e
prendiamo un insieme A composto di n + 1 alberi. Se
da A togliamo un albero a, rimaniamo con un insieme
di n alberi che, per lipotesi di induzione, hanno
35
1.8. PREDICATI
tutti lo stesso numero di foglie. Rimettiamo a in A e
togliamo ora un albero b diverso da a. Abbiamo un
altro insieme di n alberi e, di nuovo, tutti debbono
avere lo stesso numero di foglie. Quindi, anche a ha
lo stesso numero di foglie di tutti gli altri, e quindi
gli n + 1 alberi di A hanno tutti la stessa quantit`
a
di foglie. La conclusione, ora, è la straordinaria
affermazione fatta in precedenza. Dove abbiamo
sbagliato?
1.8
Predicati
Una teoria ben pi`

u vasta del calcolo proposizionale è il cosiddetto calcolo dei predicati. A suo tempo abbiamo definito un predicato come una funzione
p : A {0, 1}, dove A è un insieme qualsiasi. Abbiamo fatto anche esempi significativi, ma veniamo
ora a spiegare qual è laggancio fra predicati e proposizioni. Un esempio semplice di predicato su N è
n 5; se indichiamo con p(n) tale predicato, si ha
p(10) = 1 e p(2) = 0, poiche p(10) è la proposizione vera 10 5, mentre p(2) è la proposizione falsa
2 5. Questo ci fa intendere che un predicato si
trasforma in una proposizione ogni volta che specifichiamo lelemento di A che funge da argomento del
predicato stesso. Linsieme A può anche essere il prodotto cartesiano di vari insiemi; se A = B C, un
predicato p : B C {0, 1} è un predicato binario
p(x, y) che diviene una proposizione (e quindi assume
uno dei due valori 0 = falso oppure 1 = vero) quando
assegniamo ad x uno specifico elemento b B e ad y
uno specifico elemento c C. Secondo la terminologia classica, x ed y si dicono le variabili, nel senso che
il loro valore può variare nel dominio del predicato
(B e C nel caso presente, A in precedenza). Quindi,
p(b, c) è una proposizione, ma p(b, y) e p(x, c) sono
predicati monadici, il primo su C e il secondo su B.
In modo analogo, si parla di predicati ternari o triadici, quaternari, e cos` via. A causa di questa relazione
tra proposizioni e predicati, questi ultimi si dicono
forme proposizionali o anche forme enunciative; noi
preferiremo sempre il termine predicato.
Nota 1.11
Il problema della soddisfacibilit`
a di un predicato k-ario p(x1 , x2 , . . . , xk ) su
A1 A2 Ak è quello di scoprire (se esistono)
k valori a1 A1 , a2 A2 , . . . , ak Ak che rendono
vero il predicato, tali cioè che p(a1 , a2 , . . . , ak ) = 1.
Anche se gli insiemi A1 , A2 , . . . , Ak sono finiti, e
quindi il problema è senzaltro risolubile, la sua
complessit`
a è esponenziale, cioè cresce in modo tale,
al crescere di k, che nessun calcolatore, per veloce
che sia, è in grado di arrivare alla soluzione in tempi
ragionevoli. Tecnicamente, un problema del genere
è detto di complessit`
a NP (si veda anche la Nota
4.4). In particolare, la soddisfacibilit`
a è un problema
NP completo, tale cioè che se potesse essere risolto

in modo veloce (cioè in tempo polinomiale nel
numero dei suoi argomenti k) dimostrerebbe che tutta
una classe di problemi di complessit`
a NP avrebbero
anchessi una soluzione veloce. Questo sarebbe molto
importante per linformatica che trova nei problemi
NP una classe di problemi ostica, particolarmente
difficile ad essere risolta in tempi di calcolo ragionevoli, diciamo in qualche giorno, se questo vi pare poco.
La natura dei predicati può essere la pi`

u varia. E
un predicato la frase p(x) = Il signor x è nato a
Scandicci. Il mio amico Carlo è nato a Lastra a
Signa, per cui p(Carlo) = 0, mentre mio cugino Luigi
è nato proprio a Scandicci, per cui p(Luigi) = 1. In
Matematica, siamo di solito interessati a predicati di
tipo numerico, tipo p(n) =Il numero n3 n, per
n N, è divisibile per 6 oppure q(x) = Il numero
reale x è tale ch x2 + 1 = 0. Ogni equazione è in
effetti un predicato, come x2 + x 2 = 0; ogni valore
che rende vero questo predicato si dice una soluzione
o radice dellequazione (si veda la Sezione 5.2); in
questo specifico esempio, le soluzioni sono x = 1 ed
x = 2, come si verifica facilmente facendo i calcoli
o risolvendo lequazione. Se una equazione è vera
qualunque sia il valore assunto dalla sue variabili, essa
si dice pi`
u propriamente una identit`
a. Un classico
esempio di identità è dato dalla regola della differenza
dei quadrati, ovvero del prodotto di una somma per
la differenza, a secondo del punto di vista da cui si
legge:
x2 y 2 = (x + y)(x y).
Quello di assegnare un valore specifico ad ognuna
delle variabili non è il solo modo per trasformare un
predicato in una proposizione. A proposito del precedente predicato su n N, abbiamo già visto che è
vera la proposizione: per ogni valore di n N, il numero n3 n è divisibile per 6. Naturalmente, proprio
il fatto che sia vera ci assicura che questa è una proposizione; se osserviamo bene, ci rendiamo conto che
il predicato originale si è trasformato in una proposizione perche vogliamo considerare che cosa succede
per ogni valore di n N. In modo analogo, se consideriamo la frase: Per ogni numero reale x si ha
x2 + 1 > 0 basata sul predicato: x2 + 1 > 0. La
frase è vera perche x2 0, qualunque sia x R, e
quindi aggiungendo 1 si ha la disuguaglianza asserita. Lespressione: per ogni n N oppure per ogni
x R si dice quantificazione universale e lespressione stessa si scrive in modo compatto: n N
e x R. Il simbolo si dice quantificatore
universale e si legge sempre per ogni o qualunque
sia. Le proposizioni vere di questo tipo si dicono
verità generali; abbiamo visto come il principio di
36
induzione matematica sia un metodo per dimostrare

verità generali sui numeri naturali.
Talvolta è impossibile dimostrare verità generali,
anche semplicemente perche non sono vere; ad esempio, non è vero che (x R) x2 + x 2 = 0, visto
che per x = 0 si avrebbe 2 = 0, il che è ovviamente
falso. In queste situazioni, può già essere utile dimostrare una verit`
a esistenziale, cioè che esiste almeno
un numero reale x tale che x2 + x 2 = 0. Come
si sa (e come vedremo col Teorema 5.10), ciò è assicurato dal fatto che il determinante dellequazione,
= 1 + 8 = 9, è non negativo, per cui possiamo
concludere che: esiste almeno un numero x R per
cui x2 + x 2 = 0. Lespressione: esiste almeno un x R si dice quantificazione esistenziale e
si abbrevia scrivendo: x R; il simbolo si
dice quantificatore esistenziale e si legge esiste almeno uno; talvolta, in modo familiare, si legge semplicemente esiste. Naturalmente, per ogni predicato
p(x), se è vero (x A) p(x) ed A non si riduce allinsieme vuoto, allora in particolare è vero che
(x A) | p(x), dove il simbolo si legge tale
che e può essere spesso sottinteso.
Ci possono essere occasioni in cui siamo interessati
a una verit`
a esistenziale forte, cioè un predicato che
risulti vero per un unico valore della variabile. Ad
esempio, alcuni giovani dallanimo poetico, si sforzano di dimostrare che la ragazza del momento è lunica
donna che amano; alcuni matematici sono interessati al fatto che una certa equazione abbia ununica
radice compresa tra 0 ed 1 (ognuno ha i suoi problemi). Il quantificatore esiste uno ed un solo elemento x A si abbrevia talvolta con lespressione:
!x A. Tuttavia, si è restii ad assegnargli un nome specifico, poiche può essere parafrasato in vario
modo, come ad esempio: esiste almeno un elemento
x A tale che p(x) = 1, e se x1 , x2 A sono tali
che p(x1 ) = p(x2 ) = 1, allora è x1 = x2 . Questo dimostra che non è necessario introdurre esplicitamente
questo ulteriore quantificatore.
I due quantificatori e sono, in un certo
senso che ora vedremo, uno linverso dellaltro. E
chiaro che non esiste alcun numero reale x che sia
contemporaneamente minore di 5 e maggiore di 10.
Se allora p(x) =x R è minore di 5 e q(x) =x R
è maggiore di 10, laffermazione appena enunciata si
può formalizzare scrivendo:
La precedente proposizione diviene pertanto:

(x R) (p(x) q(x))
che si legge: qualunque sia il numero reale x, non può
essere vero che x < 5 e, allo stesso tempo, x > 10
(naturalmente, la negazione di a < b è a b!). Questo passaggio ci convince, ed ora possiamo procedere
applicando la regola di De Morgan. Si ha cos`:
(x R) (p(x) q(x))
che si legge: per ogni numero reale x si ha x 5
oppure x 10. Anche questo passaggio suona bene
e ci permette di renderci conto della validità della
regola enunciata. Essa va di pari passo con la duale:
La negazione del quantificatore universale applicato a un predicato equivale al quantificatore
esistenziale della negazione del predicato stesso.
Continuando lesempio precedente, possiamo osservare che: Non è vero che per ogni numero reale x,
si ha che x è minore di 5 oppure che x è maggiore di
10; infatti, i numeri 7 ed 8 (insieme agli infiniti altri
compresi tra 5 e 10) non sono ne minori di 5, ne maggiori di 10. La formulazione di questa proposizione
è:
(x R) (p(x) q(x)).
Da questa si passa a:
(x R) | (p(x) q(x))
cioè: esiste almeno un numero reale x per il quale non
è vero che x < 5 oppure x > 10 (naturalmente, vanno
ancora bene gli esempi di prima). Infine si passa a:
(x R) | (p(x) q(x));
questo significa: esiste almeno un numero reale x per

il quale x 5 e, allo stesso tempo, x 10. Questo,
ovviamente, è proprio vero!
I matematici, spesso, sembrano insistere un po
troppo sulla esistenza di certi oggetti matematici, come ad esempio soluzioni di equazioni, elementi
particolari, etc.. In realtà, questo atteggiamento è
giustificato dal fatto che, se qualcosa non esiste, si
arriva a evidenti paradossi quando si ragioni come se
invece esistesse. Lesempio classico è il seguente: sia
N il pi`
u grande dei numeri naturali; se consideriamo
(x R) | (p(x) q(x)).
N 2 si deve avere N 2 N , dato che N non è superaTrasformiamo questa proposizione usando la seguente to da nessun altro naturale. Semplificando, abbiamo
N 1, cioè N = 0 oppure N = 1. Poiche 1 > 0,
regola:
abbiamo dimostrato che 1 è il pi`
u grande dei numeri
La negazione del quantificatore esistenziale ap- naturali!
plicato a un predicato equivale al quantificatore
Esiste unevidente asimmetria tra le verità geneuniversale della negazione del predicato stesso.
rali e quelle esistenziali. Per dimostrare infatti che
37
1.8. PREDICATI
unaffermazione di questultimo tipo non è vera occorre far vedere che essa non è verificata da alcun
elemento dellinsieme S considerato, il che potrebbe
richiedere anche un tempo infinito, se infiniti sono
gli elementi di S. Viceversa, per dimostrare la non
validità di unaffermazione generale basta fornire un
esempio in cui essa non vale. Tale esempio costituisce
un controesempio dellaffermazione e assume il ruolo
di una vera e propria dimostrazione, ancorche negativa. Ricordiamo che da questa osservazione deriva il
concetto di falsicabilit`
a, su cui Popper costruisce la
sua filosofia della scienza.
Per dare unidea pi`
u matematica dei predicati, vorrei cercare di esporre un semplice ma importante
esempio di struttura algebrica. Con questo termine
si intende un insieme S sul quale sono definite una
o pi`
u operazioni, secondo quanto visto nella Sezione
1.3. Rispetto a tali operazioni linsieme può godere
di alcune proprietà che permettono di caratterizzare
il significato della struttura. I numeri, con le quattro
operazioni elementari sono un esempio di struttura
algebrica e tale concetto serve a generalizzare le proprietà degli insiemi numerici rendendole indipendenti
dal concetto stesso di numero. In effetti, le strutture algebriche costituiscono largomento fondamentale
dellAlgebra Astratta, detta anche Algebra Moderna, perche si è sviluppata negli ultimi centocinquanta anni. Ritorneremo sopra a questo argomento nel
Capitolo 5 sullAlgebra; per il momento limitiamoci
ad introdurre alcuni concetti sia validi di per se, sia
a mo di esempio dellidea di predicato che stiamo
discutendo.
Lesempio pi`
u semplice di struttura algebrica è costituito certamente dal monoide, un insieme S con
unoperazione diadica indicata con un puntino (o la
semplice giustapposizione), detta prodotto, rispetto
alla quale S è chiuso, gode della proprietà associativa
e dellesistenza di una identità. Formalmente, il monoide si indica con la coppia (S, ) e le sue proprietà
si riassumono cos`:
1. x, y S, il prodotto x y sta in S;
2. x, y, z S, si ha (x y) z = x (y z);
3. e S tale che x S si ha e x = x e = x.
E abbastanza naturale sentirsi sconfortati quando
ci si trovi davanti per la prima volta a una definizione del genere. Ma bisogna abituarsi poiche le strutture algebriche sono sempre definite in questo modo;
e bisogna andare oltre laspetto formale e cercare di
costruirsi unidea pi`
u concreta cercando esempi significativi. A loro volta, tali esempi permettono di
indurre proprietà della struttura algebrica che ce la
fanno conoscere in modo pi`
u approfondito. La cosa a cui bisogna stare attenti è di non confondere le
proprietà specifiche dellesempio con proprietà generali della struttura: per questo è sempre opportuna
dare dimostrazioni formali ed astratte delle proprietà
interessanti.
Lesempio pi`
u semplice di monoide è costituito
dai numeri naturali con loperazione di somma, cioè
(N, +); le sue proprietà sono quelle stesse della somma e lidentità è il numero 0. In effetti, questo è un
monoide un po particolare, poiche per la somma vale
anche la proprietà commutativa, cioè:
x, y S si ha x y = y x.
Non è però difficile trovare esempi nei quali la proprietà commutativa non vale. Se A = {a1 , a2 , . . . , ak }
è un insieme di simboli (o lettere, per cui A si dice anche alfabeto), chiamiamo A linsieme delle parole (o
stringhe) su A, cioè le sequenze finite di simboli di A;
fra le parole mettiamo anche la parola vuota, cioè la
sequenza priva di simboli. La concatenazione di due
parole w1 , w2 A è la sequenza formata dai simboli
di w1 seguiti da quelli di w2 . Linsieme A con questa
operazione è un monoide (non commutativo). Infatti,
la concatenazione di due parole è ancora una parola
(chiusura) e la concatenazione di tre parole, comunque la si esegua w1 (w2 w3 ) oppure (w1 w2 ) w3
dà sempre la parola formata dai simboli di w1 , seguiti da quelli di w2 , seguiti da quelli di w3 . Infine,
concatenando la parola vuota a unaltra parola, sia
che la si metta a sinistra, sia che la si metta a destra,
questultima parola non cambia.
Un terzo esempio di monoide è costituito da
(N0 , ), cioè linsieme dei numeri naturali (senza
lo zero) con loperazione di moltiplicazione. Questi
esempi cos` diversi ci fanno capire (o almeno intuire)
limportanza delle strutture algebriche: ragionando
in astratto sulla struttura si ottengono proprietà che
valgono per tutti i monoidi, indipendentemente dalla
loro natura specifica. Questo, speriamo, sarà ancora pi`
u chiaro quando, nella Sezione 5.8, faremo vari
esempi di tali dimostrazioni.
Nota 1.12
Se si pensa alla notazione a stecchini

e ai numeri naturali come a sequenze di aste, ci si accorge che i due monoidi (N, +) e (A , ) non hanno poi
natura tanto diversa, ed N altro non è che A quando A = {|}. La commutativit`
a in N è semplicemente
dovuta al fatto che lalfabeto si riduce a un solo elemento. Daltra parte, è spesso importante considerare
sequenze di simboli che formalizzano espressioni e formule. Ad esempio, lAritmetica tratta sequenze del
tipo 3+(12/4), lAlgebra ha a che fare con sequenze
come 3x2 5x 8 = 0 e la logica formale considera sequenze come (p q) r, ognuna costruita su
un dato insieme di simboli. La manipolazione di tali sequenze è un lavoro effettuato usando loperazione
di concatenazione e la sua inversa, cioè lestrazione di
38

una sottosequenza da una sequenza data. Se si vuole, lAlgebra e la Logica formale sono semplicemente
lelaborazione di simboli mediante regole di trasformazione. Questo punto di vista si è rivelato fondamentale
per la Logica ed è limpostazione che usano gli elaboratori elettronici per ogni applicazione non numerica.
Proprio grazie agli elaboratori attuali si ritiene ovvia la corrispondenza tra numeri e simboli (si pensi
alla codifica ASCII per i caratteri), ma tale corrispondenza, cambiando sequenze di simboli in sequenze di
numeri, non sempre è appropriata agli scopi che soprattutto la Logica si prefigge. Pi`
u interessante sarebbe trovare una corrispondenza tra parole e numeri
tale che ad ogni parola corrispondesse un numero ben
preciso. Se lalfabeto A contiene k simboli, possiamo
pensare a w A come a un numero scritto in base
k + 1 (spiegare perche non si pu`
o pensare ai numeri in
base k). Purtroppo, in Logica si deve poter disporre
di un alfabeto (potenzialmente) infinito, per rappresentare le proposizioni e le variabili. In questo caso, il
trucco precedente non funziona pi`
u. Verso la fine degli
anni 1920, G
odel pens`
o a questa corrispondenza. Sia
A = {a1 , a2 , . . .} linsieme infinito dei possibili simboli
e sia w = ai1 ai2 . . . ain una parola non vuota su A. Se
pi indica li-esimo numero primo a partire da 2 (cioè
p1 = 2, p2 = 3, p3 = 5, p4 = 7, p5 = 11, etc.), allora il
numero naturale corrispondente a w è dato da:
G(w) = pi11 pi22 . . . pinn .
Ad esempio, se A = {a, b, c, d, . . .}, la parola bacca è
rappresentata da:
22 31 53 73 111 = 5. 659. 500.
Il numero è piuttosto alto, ma quello che interessa
non è la manipolazione effettiva di questi numeri,
quanto piuttosto la possibilit`
a di trovare funzioni numeriche che, in principio, agiscano come le operazioni
sulle parole; questo, infatti, permette di simulare le
operazioni sulle parole o sulle espressioni per mezzo
di operazioni aritmetiche, le cui propriet`
a noi meglio
conosciamo. Il lettore volenteroso si pu`
o impegnare
a trovare funzioni che calcolano la lunghezza di una
parola (vista come numero), la concatenazione di due
parole (viste come numeri), il fatto che una parola
(numero) sia contenuta in unaltra (un altro numero),
e cos via. Naturalmente, la prima cosa da fare è di
definire due funzioni per trasformare una parola in
un numero, e viceversa.
Una struttura algebrica un po pi`

u complessa del
monoide, ma anche molto pi`
u importante, è il gruppo. Anche in questo caso, abbiamo un insieme G e
unoperazione , ma oltre alle proprietà di chiusura,
associatività ed esistenza dellidentità, si richiede che
ogni elemento abbia un inverso, cioè:
4. x G, esiste y G tale che x y = y x = e.
Un elemento y che goda di tale proprietà si scrive

x1 e si dimostra che è unico. Supponiamo infatti
che anche z sia un inverso di x; si ha allora:
z = z e = z (x y) = (z x) y = e y = y,
dove si sono applicate varie regole dei gruppi, in particolare la proprietà associativa e quella dellidentità.
Questo, osserviamo, è un teorema generale dei gruppi, valido, cioè, per ogni gruppo, indipendentemente
dalla natura particolare dei suoi elementi.
A questo punto, però, ci arrestiamo e rimandiamo
il lettore a ciò che diremo nella Sezione 5.8 o, meglio
ancora, ai testi universitari sullAlgebra Astratta.
Capitolo 2
Aritmetica
Legati ai numeri primi ci sono fondamentali concetti
come quello di divisibilità e di massimo comun divisore che, definiti dai Greci, si sono andati sempre pi`
u
sviluppando, e le loro problematiche si incontrano e
si scontrano, oggi, con quelle dei moderni elaboratori. Ad esempio, il problema della scomposizione di
un numero in fattori primi si è rivelato essere uno dei
problemi intrattabili per eccellenza, cioè uno dei
problemi per i quali non si conosce (e probabilmente
non è nemmeno possibile conoscere) una soluzione in
G. Rodari Filastrocche in cielo e in terra
tempi ragionevoli (ovviamente, quando il numero è
u poLAritmetica è la scienza dei numeri, pi`
u propria- abbastanza grande) perfino con i calcolatori pi`
mente dei numeri naturali N = {0, 1, 2, 3, . . .}, ed è tenti che esistono oggi o potranno esistere nel prosperciò strettamente connessa al concetto di conta- simo futuro. Questo, per il momento, ha permesso
re, visto nel capitolo precedente. Oggi, lAritmetica di utilizzare la scomposizione dei numeri nei moderè indissolubilmente associata alle operazioni elemen- ni metodi di cifratura per la trasmissione sicura di
tari, ed è con queste che si affronta lo studio dellArit- informazioni riservate nelle reti di calcolatori.
metica, non appena ci siamo impadroniti dei numeri
attraverso il contare. Non sempre è stato cos`, anzi,
fino al 1600 il saper fare di conto (detto anche logi- 2.1
Laddizione
stica) era considerata unattività volgare, riservata
u semplice e naturale è
a commercianti e banchieri piuttosto che a scienziati Certamente loperazione pi`
e filosofi. Questi, invece, erano dotti nellAritmeti- quella di sommare due numeri. Lantico pastore col
ca, inclusa come sè detto nel Quadrivio, intesa come suo gregge di 57 pecore, alla fine dellinverno, quanscienza che studia le proprietà dei numeri naturali. do trovava che erano nati 14 agnellini, era interessato
In questo senso, lAritmetica è nata in Grecia, e i a sapere di essere diventato proprietario di ben 71
Pitagorici consideravano i numeri come lessenza del animali. Con numeri cos` piccoli, la somma si può rimondo. Con Platone e Euclide la Geometria prese condurre al contare: il pastore poteva prima contare
il sopravvento, ma negli Elementi Euclide dedica le vecchie pecore (o ricordare quante fossero, incidentre libri allAritmetica. In particolare, i numeri pri- do delle tacche su un osso o un tronco), arrivare cos`
mi hanno sempre attratto matematici professionisti e a 57, e poi continuare a contare gli agnelli appena nadilettanti per le loro proprietà, spesso tra il meravi- ti: cinquantotto, cinquantanove, e via di seguito fino
glioso e lincredibile, sempre comunque imprevedibili. a 71. Non sono rari reperti archeologici, risalenti anCi sono state persone che hanno dedicato la propria che a trentamila anni fa, costituiti da ossa di animali,
vita allo studio dei numeri primi, alla loro elencazio- sulle quali sono incise tacche con levidente scopo di
ne, nella vana ricerca di regolarità, di leggi e di regole registrare conteggi: queste tacche sono la prima rappresentazione pratica di ciò che abbiamo chiamato la
specifiche.
Bisogna dire che la curiosità per i numeri primi notazione ad aste.
è comune a tutta lumanità e non è solo appannagQuando i numeri cominciano a superare il centinagio della cultura occidentale, derivata da quella gre- io, la conta diretta e la notazione ad aste diventano
ca. Oltre ai grandi matematici arabi, il celeberrimo inadeguate, ed è per questo che si sono cercati metoteorema cinese dei resti ci dice come anche nella di pi`
u veloci per eseguire la somma, come labaco o
lontana Cina (si parla del 1200) linteresse fosse vivo. luso sapiente dei ciottoli. Questi, come le biglie delMa cosa era successo?
Che lUno e lo Zero
seduti vicini,
uno qua laltro l`
a
formavano un gran Dieci:
nientemeno, unautorit`
a!
Da quel giorno lo Zero
fu molto rispettato,
anzi da tutti i numeri
ricercato e corteggiato.
39
40
labaco, sono disposti su pi`
u linee, ognuna preposta a
rappresentare le unità, le decine, le centinaia e cos` di
seguito. Tale modo di disporre ciottoli o biglie prefigura la nostra notazione, ma, come sè visto, non ci si
è resi conto, fino a tempi relativamente recenti, come
la scrittura potesse essere direttamente utilizzata per
fare i conti.
Nella notazione posizionale, lidea fondamentale è
che le unità si sommano alle unità, le decine alle decine, le centinaia alle centinaia, e cos` via. Questo
funziona bene se facciamo 125 + 342, e il risultato è
proprio 467. Quando però tentiamo lo stesso metodo
su 347 + 158, ci troviamo subito di fronte alla difficoltà che 7 + 8, la somma delle unità, ci dà un valore
maggiore di 9 che quindi non è rappresentabile con
ununica cifra. Tuttavia, si osserva, se prendiamo la
cifra delle unità di 7 + 8 = 15, cioè 5, la decina in
pi`
u può andare a incrementare il numero totale delle
decine della somma, cioè 4 + 5, che diventa 4 + 5 + 1.
Questo è il concetto di riporto, che ci è ormai familiare e che spiega come comportarci ogni volta che
una somma di unità, di decine, di centinaia, etc., ci
porta fuori del proprio ambito. Il riporto è la parte
che va al di là del gruppo di appartenenza delle cifre considerate, e quindi va ad aggiungersi alla cifra
della successiva potenza del 10: da unità a decine,
da queste a centinaia, e cos` via. Nel nostro esempio,
4 + 5 + 1 = 10, e di nuovo dobbiamo considerare lo
0 come cifra della somma (delle decine, questa volta)
e l1 come il riporto verso le centinaia. Qui, infine,
abbiamo 3 + 1 + 1 = 5, e quindi 505 è il risultato
corretto. Naturalmente, il gioco del riporto spiega
perche, nel caso che avessimo avuto riporto con la cifra di valore pi`
u alto (in questo caso, delle centinaia)
avremmo dovuto scrivere il riporto stesso come cifra
della successiva potenza del 10, delle migliaia nellesempio. Cos`, 735 + 517 dà : 5 + 7 = 12, 2 come cifra
delle unità e 1 come riporto; 3 + 1 + 1 = 5, che è la
cifra delle decine; 7 + 5 = 12, cos` che 2 è la cifra delle
centinaia e il riporto 1 diviene la cifra delle migliaia, anche se nei due numeri di partenza la cifra delle
migliaia era assente.
Limpostazione pratica della somma prevede di
scrivere i due numeri da sommare uno sotto laltro, allineati a destra. Questo fa s` che cifre omologhe, cioè
che si riferiscono alla stessa potenza del 10, si trovino
una sotto laltra. E cos` pi`
u agevole eseguire le somme parziali procedendo da destra verso sinistra. Per
rendere spedito il calcolo, è bene sapere a memoria
il risultato della somma di tutte le coppie possibili di cifre decimali, che riportiamo nella Tabella 2.1.
Luso della tabella è ben noto: quando il risultato è
ununica cifra, questa è la cifra da trascrivere nella
somma e non si ha alcun riporto (o, se si preferisce,
il riporto è 0); quando il risultato è costituito da due
CAPITOLO 2. ARITMETICA
9
8
7
6
5
4
3
2
1
0
9 10
8 9
7 8
6 7
5 6
4 5
3 4
2 3
1 2
0 1
0 1
11
10
9
8
7
6
5
4
3
2
2
12
11
10
9
8
7
6
5
4
3
3
13
12
11
10
9
8
7
6
5
4
4
14
13
12
11
10
9
8
7
6
5
5
15
14
13
12
11
10
9
8
7
6
6
16
15
14
13
12
11
10
9
8
7
7
17
16
15
14
13
12
11
10
9
8
8
18
17
16
15
14
13
12
11
10
9
9
Tabella 2.1: La tavola della somma

cifre, quella delle unità va trascritta nella somma, e
quella delle decine rappresenta il riporto da sommare
alle due cifre successive pi`
u a sinistra. In termini pi`
u
formali abbiamo il seguente algoritmo per eseguire
laddizione:
Algoritmo 2.1 (Addizione di numeri decimali)
Ingresso: due numeri n = dr dr1 . . . d1 d0 ed
m = cs cs1 . . . c1 c0 scritti in notazione decimale;
Uscita: la somma n + m = bt bt1 . . . b1 b0 .
1. se r < s scambiamo tra di loro i due numeri n
ed m;
2. se s < r, aggiungiamo alla sinistra di m esattamente r s cifre 0. Questo non cambia il valore di m avendo aggiunto 0 10r + 0 10r1 +
+ 0 10rs+1 = 0. Questa operazione corrisponde allallineamento a destra dei due numeri,
ma in questo modo possiamo assumere che i due
numeri abbiano la stessa lunghezza;
3. si pone p := 0, dove p indica il riporto;
4. Procedendo da destra verso sinistra,
ponendo successivamente j := 0, 1, . . . , r:
cioè
(a) poniamo v := dj + cj secondo quanto

riportato nella Tabella 2.1;
(b) poniamo v := v + p. Poiche il riporto p
pu`
o valere solo 0 oppure 1, questa somma
richiede, al pi`
u, di conoscere il successivo
dei numeri da 0 a 18;
(c) si pone bj uguale alla cifra delle unit`
a di v
e si assegna al riporto p la cifra delle decine
di v (che sar`
a 0 oppure 1);
(d) si incrementa j e se risulta j r si cicla
tornando al punto 4a.;
41
2.1. LADDIZIONE
5. se il riporto p è zero, si pone t := r e la somma
è finita; altrimenti (p = 1) si pone br+1 := 1,
t := r + 1 e la somma è finita.
4
3
2
1
0
4
3
2
1
0
0
10
4
3
2
1
1
11
10
4
3
2
2
12
11
10
4
3
3
13
12
11
10
4
4
Il lettore si può divertire a riformulare questo algoritmo in modo da prevedere tutte le azioni svolte da
un operatore umano, come lallineamento a destra e
le operazioni da fare quando si siano esaurite le cifre
del numero pi`
u corto. Abbiamo evitato questi passi
Tabella 2.2: La somma in base 5
estendendo le cifre del numero corto con una serie opportuna di zeri, un trucco che si usa sui calcolatori,
la stessa quantità di aste, gli insiemi rimangono
ma che non viene insegnato agli scolari.
uguali.
Si osservi che, di proposito, abbiamo utilizzato una
nomenclatura esatta, ma un po vaga; ora è bene Queste proprietà formali della somma sono molto
utili anche nella pratica; ad esempio, per sommare
ricordare la terminologia ufficiale.
68 + 14 + 32, ci si rende conto che 68 + 32 = 100,
Definizione 2.1 Loperazione definita dal preceden- e quindi il risultato è 114. Formalmente, occorrono i
te algoritmo si dice propriamente addizione e il suo seguenti passaggi, ma noi li eseguiamo ormai in modo
risultato è detto somma o totale. I numeri che si meccanico:
sommano si dicono addendi o termini.
(68 + 14) + 32 = 68 + (14 + 32) = 68 + (32 + 14) =
Questultimo nome è un po ambiguo, poiche si parla
= (68 + 32) + 14 = 100 + 14 = 114.
anche di termini di unespressione, di termini di
una successione, e cos` via, però è del tutto approIl richiamo alla notazione ad aste ci vuol far capire
priato. La parola addendo si usa soprattutto per che queste proprietà non dipendono in alcun modo
enfatizzare il fatto che loperazione che si sta conside- dalla notazione adottata, sia essa decimale od altra,
rando è proprio unaddizione. Di solito è tollerato la- ma sono intrinseche ai numeri come tali. Le ritrobuso di termine operazione di somma, ma è meglio veremo pertanto in vari capitoli, tra i quali quello
evitarlo, quando sia possibile (cioè quasi sempre).
dellAlgebra, dove si trattano le proprietà formali dei
La notazione ad aste, molto pi`
u di quella decimale, numeri, ignorando la loro rappresentazione, nascosta
è utile per dimostrare:
di proposito con luso delle lettere.
Naturalmente, lAlgoritmo 2.1 non è limitato, al la proprietà commutativa delladdizione: a + b =
meno nello spirito, ai soli numeri decimali; esso vale
b + a. Mettere in fila a aste e poi aggiungerne
per una qualsiasi base, purche si cambi opportunaaltre b è lo stesso che mettere b aste e aggiungerne
mente la Tabella 2.1. Ad esempio, per la base 5 si
a. In altri termini, a + b aste possono essere
usa la Tabella 2.2, dove tutti i numeri sono scritti in
immaginate anche come b + a aste;
quella base, per cui 125 = 710 , come ognuno saspetta
la proprietà associativa: a + (b + c) = (a + b) + c. quando si sommi 3 con 4. I numeri di due cifre, come
Con le aste, comunque si proceda, si arriva alla appunto 12, stanno ad indicare un risultato (la cifra
delle unità) e un riporto (la cifra delle decine, che qui
fine con a + b + c aste;
sarebbe meglio dire delle cinquine).
lelemento neutro, o identità, per laddizione è
Può essere un buon esercizio partire con due nu0: 0 + a = a + 0 = a. Aggiungere 0 aste vuol meri decimali, ad esempio 732 e 473, convertirli in
dire non cambiare proprio niente in un insieme base 5 mediante il metodo delle divisioni successive
di aste già predisposto, sia pur esso vuoto (cioè, (v. Sezione 1.5) ed eseguire la loro somma usando la
0 + 0 = 0).
Tabella 2.2. Si trova 73210 = 104125 e 47310 = 33435 ;
i due numeri vanno allineati a destra, e la somma si
la propriet`
a dissociativa: se a = b + c allora
imposta in questo modo:
a + d = b + c + d; nella notazione ad aste, questo
significa che un gruppo di aste può essere dis1 1 1
sociato in due (o pi`
u) gruppi senza cambiare
1 0 4 1 2 +
il risultato finale; formalmente, questa proprietà
3 3 4 3 =
si può far discendere da quella associativa, ma
1 4 3 1 0
nella pratica è comodo distinguerla;
Abbiamo evidenziato i riporti, come si fa quando
la propriet`
a di eliminazione: se a + c = b + c si impara a fare la somma e a questo punto basta riallora a = b; questo vuol dire che se abbiamo convertire il risultato 143105 = 120510 per controllare
due insiemi uguali di aste e da entrambi togliamo che loperazione è ben fatta.
42
Il caso pi`
u semplice si ha quando la base è 2; non
serve nemmeno scrivere esplicitamente la tabella, visto che 0 + 0 = 0, 0 + 1 = 1 + 0 = 1 e 1 + 1 = 0
con riporto di 1. Quando il riporto 1 si aggiunge a
una somma parziale 1 + 1 si ha come risultato 1 e un
nuovo riporto unitario. Con queste cinque regole si
provi ad eseguire 90 + 57 = 147; procedendo come
sopra si ha:
1
1 0
1
0 0
1 1
1 1
1 0
0 1 0
0 0 1
0 1 1
+
=
e di nuovo lasciamo che il lettore si eserciti nella conversione tra basi diverse per controllare che il risultato è corretto e non lo stiamo ingannando con un
gioco di cifre.
Ma lAlgoritmo 2.1 funziona bene, con pochi accorgimenti in pi`
u, anche quando abbiamo di fronte
una base composta. Un esempio sarà sufficiente a
capire come si opera. Si considerino due angoli di
32 47 54 e 18 23 8 ; la somma si imposta allineando a destra sia le quantità, sia le loro parti omogenee
ed eseguendo poi le singole somme:
32
18
50
47
23
70
54
8
62
+
=
Ora teniamo conto di quanto detto nella Sezione 1.5

per i numeri scritti fuori dei limiti della base composta; partendo da destra, 62 corrispondono ad 1 2 ,
cos` che 1 va a sommarsi agli altri 70 . Ora, 71 corrispondono a 1 11 , e il grado si somma agli altri 50 .
Il risultato finale è pertanto 51 11 2 . Come si vede,
il riporto avviene ora passando dai secondi ai primi e
da questi ai gradi; infatti, secondi, primi e gradi sono le vere cifre della notazione e son loro che devono
rientrare nei limiti della base composta (360, 60, 60).
Allinterno dei secondi, dei primi e dei gradi la somma avviene regolarmente, poiche in essi rispettiamo
la notazione decimale. Nessuno ci vieterebbe di usare
per le tre parti una base diversa da 10, ed eseguire
le somme di conseguenza; lelaboratore elettronico,
ad esempio, rappresenta tutto in binario. Ma questultima, ulteriore complicazione lasciamola perdere
e accontentiamoci di aver capito come si opera quando la notazione allinterno delle varie cifre è quella
decimale.
2.2
Confronto e sottrazione
Unaltra operazione elementare è il confronto tra numeri; il risultato non è questa volta un numero, come
per laddizione, ma un valore di verità, cioè vero o
falso. Ad esempio, 5 = 3 è falso, mentre 3 < 5 è

vero. Di regola si considerano sei tipi di confronto
che si spiegano bene in termini di conteggio o nella
notazione ad aste:
n = m (n è uguale ad m): i due numeri n ed m
sono uguali se sono indicati con lo stesso nome
ovvero se le loro rappresentazioni ad aste sono
lunghe uguali, quindi se cè una corrispondenza biunivoca tra le aste che rappresentano i due
numeri;
n 6= m (n è diverso da m): i due numeri non sono
uguali, cioè sono indicati da nomi diversi ovvero
la lunghezza delle loro rappresentazioni ad aste
sono differenti;
n < m (n è minore di m): il nome di n precede il nome di m nel conteggio, ovvero cè una
corrispondenza biunivoca tra le aste di n e un
sottoinsieme proprio delle aste di m (questo significa che la rappresentazione ad aste di n è pi`
u
corta di quella di m);
n m (n è minore o uguale ad m): i due numeri
sono uguali (n = m) oppure n è minore di m,
secondo le precedenti specifiche;
n > m (n è maggiore di m): il nome di n segue il nome di m nel conteggio, ovvero cè una
corrispondenza biunivoca tra le aste di m e un
sottoinsieme proprio delle aste di n (questo significa che la rappresentazione ad aste di n è pi`
u
corta di quella di m);
n m (n è maggiore o uguale ad m): i due
numeri sono uguali (n = m) oppure n è maggiore
di m, secondo le precedenti specifiche.
Nota 2.1
I concetti di uguale e diverso sono

tanto elementari che una loro definizione appare
assurda o fuorviante, perche cerca di spiegare cose
semplici con argomenti complessi. A ben guardare,
la nostra definizione di uguaglianza tra numeri è
riportata alluguaglianza verbale (il che pu`
o avere
abbastanza senso) o ad una corrispondenza biunivoca.
Questultima impostazione, come sè visto, ha un
senso molto profondo e permette di ragionare di
uguaglianza anche per quantit`
a non finite. Per tali
quantit`
a, una impostazione puramente nominalista
non d`
a alcun risultato.
Dovrebbe essere chiaro dalla precedente elencazione che, in realtà, i confronti si riducono a due soli:
n = m ed n < m. Per gli altri si ha:
n 6= m: non è vero che n = m;
n > m: m < n;
2.2. CONFRONTO E SOTTRAZIONE

n m: non è vero che n > m;
n m: non è vero che n < m.
Come abbiamo visto per la somma, la notazione ad
aste è utile per dimostrare certe proprietà dei numeri relativamente ai confronti; formuliamo le seguenti
proprietà per la relazione , ma esse valgono anche per <, , > e =. Per la relazione 6=
valgono le prime due, ma non vale la terza, come il
lettore dimostrerà con un controesempio, cioè fornendo quattro numeri a, b, c, d per i quali si ha a 6= b e
c 6= d, ma risulta a + c = b + d:
propriet`
a di eliminazione: se a + c b + c allora
a b; se abbiamo due gruppi di aste, il primo
con un numero di aste non superiore al secondo,
ed eliminiamo dai due gruppi lo stesso numero
di aste, il primo rimane con un numero di aste
non superiore al secondo;
propriet`
a di aggiunzione: se a b allora a + c
b+c; questa è la proprietà inversa della precedente e si dimostra allo stesso modo rifacendosi
alla notazione ad aste;
43
1. se r < s, cioè le cifre di n sono in numero minore
delle cifre di m, si esce con il risultato vero;
2. altrimenti, se r > s, cioè se m ha pi`
u cifre di n,
si esce col risultato falso;
3. altrimenti (in questo caso r = s, i due numeri
hanno lo stesso numero di cifre), si pone j := r
e si procede da sinistra verso destra:
(a) se dj < cj si esce col risultato vero, poiche la cifra di 10j in n è minore di quella
in m e le cifre delle potenze superiori sono
uguali (se ce ne sono);
(b) altrimenti, se dj > cj si esce col risultato
falso;
(c) altrimenti (dj = cj ) si decrementa j di uno
e se è ancora maggiore o uguale a 0 si cicla
tornando al punto 3a.
4. se si arriva a questo punto (uscendo dal ciclo 3.)
significa che tutte le cifre di n sono ordinatamente uguali alle cifre di m, cioè n = m, e quindi si
esce col risultato falso.
Il lettore che abbia provato a scrivere lalgoritmo

propriet`
a di monotonia: se a b e c d allora
per
m = n o che abbia seguito lalgoritmo precedente,
a + c b + d; se mettiamo insieme gruppi piccosi
sar`
a certamente accorto che, cos` come stanno, queli di aste otteniamo gruppi piccoli; se mettiamo
sti
algoritmi
sono errati. Infatti, ad esempio, già nel
insieme gruppi grandi, otteniamo gruppi grandi.
passo 1. ci si chiede se r < s: ma questo è proprio lo
Per portare questi confronti nel campo della rap- scopo dellalgoritmo! Lo stesso succede quando, per
presentazione decimale possiamo procedere con un controllare la condizione A), ci chiediamo se r = s,
teorema e con un algoritmo. Il teorema riguarda il laddove lalgoritmo vuol proprio servire a controllare
caso delluguaglianza e dal teorema discende unov- luguaglianza di due numeri. Come si risolve questo
via procedura, la cui formulazione lasciamo al piacere problema? La soluzione è semplice se trasformiamo
del lettore. Lalgoritmo che diamo si riferisce invece questi algoritmi in algoritmi ricorsivi, cioè in procedure che, giunte a dover stabilire se r < s, o r = s,
al confronto n < m.
richiamano se stesse per effettuare tale controllo.
Teorema 2.1 Siano n, m N; allora n = m se
Ha senso una cosa del genere, oppure ci trascina in
e solo se le rappresentazioni decimali di m ed n un circolo vizioso in cui lalgoritmo richiama se stesso
coincidono.
infinite volte senza riuscire a trovare alcun risultato
definitivo? In realtà tutto procede in modo molto
Prova: Come abbiamo visto nella Sezione 1.5, la semplice, poiche la lunghezza di un numero è di regorappresentazione decimale di un numero è unica, e la molto inferiore al suo valore: bisogna escludere da
quindi le rappresentazioni coincidono se e solo se i questa regola i numeri 0 ed 1, ma per essi vedremo
numeri sono lo stesso.
tra un momento. Ad esempio, supponiamo di doNaturalmente, per controllare che le rappresentazio- ver confrontare un numero di 1274 cifre con uno di
ni di n ed m sono uguali occorre: A) stabilire se 853, cioè due numeri piuttosto grandi. Per effettuare
le lunghezze delle due rappresentazioni coincidono; tale confronto dobbiamo pertanto confrontare queste
B) se ciò è vero, stabilire se le cifre decimali sono lunghezze (r = 1273 ed s = 852, visto che gli indici
partono da 0). Luso ricorsivo dellalgoritmo implica
ordinatamente uguali.
di dover valutare le lunghezze di questi due numeri,
che sono 4 e 3 rispettivamente (in effetti, il nuovo r è
Algoritmo 2.2 (Stabilire se n `
e minore di m)
Ingresso: Due numeri n, m N con la loro rap- 3 e il nuovo s è 2, ancora per la storia degli indici).
A questo punto, però, possiamo osservare che il
presentazione decimale n = dr dr1 . . . d1 d0 ed m =
confronto fra cifre può essere codificato in una tabelcs cs1 . . . c1 c0 ; dr 6= 0, cs 6= 0.
Uscita: vero se n < m, falso altrimenti.
la, analoga a quella delladdizione, ma che per ogni
44
9
8
7
6
5
4
3
2
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
1
2
0
0
0
0
0
0
0
1
1
1
3
0
0
0
0
0
0
1
1
1
1
4
0
0
0
0
0
1
1
1
1
1
5
0
0
0
0
1
1
1
1
1
1
6
0
0
0
1
1
1
1
1
1
1
7
0
0
1
1
1
1
1
1
1
1
8
0
1
1
1
1
1
1
1
1
1
9
leffettuabilità della sottrazione; fatto questo, la

giustificazione della proprietà è del tutto analoga
alla .precedente.
Lesecuzione della sottrazione avviene con un ben

noto algoritmo, nel quale il punto pi`
u complesso è
costituito dal prestito, cioè lanalogo del riporto nelladdizione. Purtroppo, il concetto di prestito è un
po pi`
u complicato: infatti il riporto agisce sulla cifra immediatamente a sinistra del punto in cui si è
verificato. Invece, il prestito può coinvolgere una cifra pi`
u lontana, quando nel mezzo ci siano degli 0.
Daltra parte, come si sa, da chi non ha niente come
lo 0 non si possono ottenere prestiti. Nel seguente
Tabella 2.3: La tavola del confronto per minore
algoritmo si usa la Tabella 2.1 che già conosciamo
dalladdizione. In realtà, il suo uso avviene allinconcoppia di cifre (d, d ) ci dà 1 per vero se d < d , trario secondo quanto stabilito dalla Definizione 2.2:
e 0 per falso in caso contrario; si veda la Tabella per vedere quanto vale a b occorre cercare nella riga
2.3. Questa tabella, molto meno interessante di quel- di b il valore a e quindi leggere il risultato nella base
la della somma, si ricorda però molto pi`
u facilmente e, della colonna corrispondente.
di solito, non viene data esplicitamente, come invece
abbiamo fatto noi ora, presi da un raptus di amore Algoritmo 2.3 (Sottrazione)
Ingresso: Due numeri n, m N con m n e la
di completezza.
Legata al concetto di confronto, cè la seconda loro rappresentazione decimale n = dr dr1 . . . d1 d0
ed m = cs cs1 . . . c1 c0 ;
operazione di base dellaritmetica: la sottrazione:
Uscita: la rappresentazione della differenza p = n
Definizione 2.2 Dati due numeri n ed m tali che m = b b
r r1 . . . b1 b0
m n, si dice differenza di m da n, e si indica con
n m, il numero p tale che n = m + p. Il numero n
1. si procede da destra verso sinistra ponendo
si dice il minuendo mentre il numero m si chiama il
successivamente j := 0, 1, . . . , r;
sottraendo. Loperazione che permette di calcolare la
(a) se dj cj si pone bj = dj cj secondo
differenza si dice sottrazione.
quanto riportato nella Tabella 2.1 e si va al
Da questa definizione discende che la sottrazione
passo 1f.;
è loperazione inversa delladdizione. Per questo mo(b) altrimenti (dj < cj ) sia k il primo indice
tivo, le proprietà di eliminazione e di aggiunzione,
maggiore di j tale che dk 6= 0 (per lipotesi
viste per la somma in relazione ai confronti, valgono,
che sia n m tale indice esiste senzaltro);
allinverso, per la sottrazione, e invitiamo il lettore a
(c) si pone dk := dk 1 (si effettua il prestito);
formularle in modo esplicito. La proprietà di monotonia, invece, non vale pi`
u e, anche in questo caso,
(d) per ogni indice h compreso tra k + 1 e j (se
il lettore è invitato a fornire qualche controesempio.
ce ne sono) si pone dh := 9 (era dh = 0);
Due nuove proprietà, che possono essere chiamate di
(e) si pone bj := (10 + dj ) cj , secondo la
antimonotonia, risultano importanti; la prima è limiTabella 2.1;
tata a e <, la seconda è limitata a e a
(f ) si incrementa j e se è ancora j r si
>, :
riprende il ciclo al punto 1a.;
se a b, c d e d a, allora a d b c; si os2. se, come pu`
o succedere, cr = 0 si eliminano le
servi che le condizioni date implicano c b, per
cifre iniziali br , br1 , . . . , bh che siano 0 (e sia
cui le due sottrazioni sono entrambe valide; la
invece bh1 6= 0).
giustificazione è abbastanza ovvia: se abbiamo
due insiemi di aste, il primo con un numero di
Dal significato della rappresentazione posizionale
aste non superiore al secondo, e dal primo togliadiscende
la giustificazione del prestito, che si spiemo tante o pi`
u aste di quante non ne togliamo
ga
meglio
con un esempio: se dobbiamo eseguire
al secondo, questo rimane con un numero di aste
10038,
la
prima azione da compiere è eseguire 38,
non inferiore al primo;
che non si può fare. Daltra parte, il prestito non
se a b, c d, a d e b c, allora a d b c; può essere ottenuto ne dalle decine ne dalle centinaqui dobbiamo avere condizioni che ci assicurino ia; ottenerlo dalle migliaia vuol dire in effetti eseguire
45
2.3. MOLTIPLICAZIONE
proprio 1003 8. Ci si rende conto, allora, che un
prestito da 1000 può esser visto come un prestito da
990 + 10: il 10 si porta alle unità e il 990 rappresenta
le 9 decine e le 9 centinaia che abbiamo sostituito agli
0 preesistenti. Limpostazione tradizionale è:
0
10
0 0
9 9
3
8
5
e lo 0 iniziale si toglie per ottenere la rappresentazione

consueta.
Anche per il confronto e la sottrazione, pensare ad
una base diversa da 10 non crea grossi problemi. Il
confronto rimane inalterato, ed equivarrebbe ad un
insulto per il lettore riscrivere la Tabella 2.3 nel caso della base 5. La sottrazione, invece, prevede di
utilizzare la tabella della somma allinverso e quindi,
se vogliamo sottrarre due numeri scritti in base 5, è
bene avere sottocchio la Tabella 2.2. La parte interessante è fornita dal gioco del prestito che va seguito
attentamente. Utilizzando ancora i numero 732 e 473
(liberando il lettore dal tedio di altre conversioni) la
sottrazione si imposta cos`:
10
0
3
2
4
3
0
10
10
1
4
1
2
3
4
Partendo da destra ci accorgiamo che da 14 non

possono essere sottratti 26 ; si prende allora 1 in
prestito dai 12 del minuendo; questi sono ridotti ad
11 , ma i secondi crescono a 74 , in quanto 1 = 60 .
Abbiamo allora 74 26 = 48 come risultato per i secondi. Passando ai primi, non possiamo togliere 32
dagli 11 rimasti; si chiede un grado in prestito dai
28 del minuendo e si passa a 71 , cioè 60 + 11. La
differenza 71 32 = 39 ci aggiusta il risultato per i
primi e quindi non rimane che sottrarre dai 27 rimasti gli 8 del sottraendo. Si ha cos` il risultato finale
19 39 48 . Il lettore può utilmente provare con altri
angoli o passare ad ore, minuti e secondi, per un pi`
u
diretto aggancio con la realtà di tutti i giorni. Quando si passa ai mesi e agli anni i calcoli si complicano
assai a causa della variabilità della lunghezza dei mesi e dellintercalarsi degli anni bisestili. Il lettore può
provare a calcolare la propria età in numero di giorni
vissuti, basandosi sul giorno corrente e sulla data di
nascita e non trascurando i 29 di Febbraio che gli è
capitato di incontrare lungo la vita.
Concludiamo ricordando un altro metodo per eseguire la sottrazione. Fissiamo ad m + 1 il numero
delle cifre decimali con cui rappresentare i numeri,
cos` che n = dm dm1 . . . d1 d0 con le cifre pi`
u a sinistra eventualmente 0. Si dice complemento a 9 di n il
numero n
= cm cm1 . . . c1 c0 definito da cj = 9 dj ,
per ogni indice 0 j m. Si dice invece complemento a 10 di n il numero n
b =n
+ 1. Lasciamo al
lettore la dimostrazione di questo fatto, dove p è un
numero naturale qualsiasi:
Ogni cifra che effettua un prestito va considerata come diminuita di 1; cos` la cifra 1, seconda da destra,
diviene 0 e, dopo il prestito da 4, dà 104 = 1. Ora il
p+n
b 10m+1 = p n.
4 diviene 3 e 3 3 = 0. Anche in questo caso il lettoQuesto ci dà il metodo alternativo per eseguire la
re verificherà la correttezza del risultato mostrando
che 20145 = 25910 e 259 = 732 473 nella nostra sottrazione. Sia m = 5 cos` che 1003 = 001003 e 8 =
000008, di modo che il complemento a 9 sia 999992 e
tradizionale base 10.
Non possiamo tralasciare un esempio in base 2, al- il complemento a 10: 999993. Eseguendo la somma:
meno come omaggio a sua maestà lElaboratore Elet0 0 1 0 0 3 +
tronico, campione di stenaritmia. La differenza tra
9 9 9 9 9 8 =
49 e 42 si calcola cos`:
(1) 0 0 0 9 9 5
1
1 1
1 0
0 0
10
0 0
1 0
0 1
0
1
1
1
0
1
dove il gioco del prestito è ben messo in evidenza.

Il risultato ignora i primi 0 e corrisponde al nostro
numero 7, come deve essere.
Aver capito il meccanismo del prestito significa
aver capito la sottrazione, anche nel caso dei numeri
scritti in una base composta. Facciamo un esempio
utilizzando ancora gli angoli e la notazione in gradi.
Si debba eseguire:
28
7
12
32
14
26
si trova il risultato che ci aspettavamo. Lelaboratore preferisce questo metodo, anche se naturalmente
trasposto alla base 2.
2.3
Moltiplicazione
La moltiplicazione altro non è che una sequenza di

somme; ad esempio, 5 4, che si può leggere 5 per
4 volte, rappresenta la somma del numero 5 per 4
volte, cioè 5 4 = 5 + 5 + 5 + 5. Analogamente,
7 5 = 7 + 7 + 7 + 7 + 7 e scopo delloperazione
di moltiplicazione è quello di abbreviare il calcolo di
queste somme ripetute. Ricordiamo che, tecnicamente, il termine moltiplicazione indica loperazione,
46
mentre con prodotto ci si riferisce al risultato ottenuto; spesso si tende a usare queste due parole come
sinonimi, ma è bene che si impari a fare la distinzione per intendersi senza ambiguità. Il primo dei due
numeri da moltiplicare si dice moltiplicando, mentre
il secondo si chiama moltiplicatore; quando non sia
necessario distinguere tra i due, si usa il termine pi`
u
generico, ma perfettamente appropriato, di fattore.
Quindi, riassumendo, il prodotto è il risultato delloperazione di moltiplicazione svolta tra due (o pi`
u)
fattori.
La proprietà associativa della somma permette di
eseguire il prodotto raggruppando in modo qualsiasi
i vari addendi; cos` 7 5 = (7 + 7 + 7) + (7 + 7) =
7 3 + 7 2, cioè si ha: a b = a b1 + a b2 purche
sia b = b1 + b2 . Questo si può scrivere:
a b1 + a b2 = a (b1 + b2 ),
e questa si chiama la propriet`
a distributiva del prodotto rispetto alla somma. Un po meno ovvia è la
propriet`
a commutativa, che cioè sia a b = b a;
infatti, non è affatto evidente che a sommato a se
stesso per b volte sia la stessa cosa che b sommato a
se stesso per a volte. Tuttavia, se rappresentiamo il
numero 7 come una colonna di 7 palline, 7 5 vuol
dire mettere di seguito 5 colonne, ognuna formata di
7 palline. Otteniamo cos` un rettangolo di palline e se
lo leggiamo in ordine di riga, ci accorgiamo che esso
è composto di 7 righe di 5 palline ognuna. Invertendo il ruolo tra righe e colonne, questo significa che
le stesse palline possono essere contate da 5 7, cioè
5 7 = 7 5.
e e e e e e e
e e e e e e e
e e e e e e e
e e e e e e e
e e e e e e e
Lo stesso tipo di difficoltà rilevato per la proprietà

commutativa, si trova quando vogliamo renderci conto della propriet`
a associativa, cioè la proprietà secondo la quale lordine di esecuzione di pi`
u moltiplicazioni consecutive non cambia il prodotto finale. Formalmente, questo si esprime con lidentità
a (b c) = (a b) c. In questo caso può aiutare la visione spaziale del risultato. Prendiamo una
colonna di a palline; come sè visto, a b corrisponde
a un rettangolo di palline; ora, (a b) c vuol dire ripetere questo rettangolo per c volte; questo si fa bene
sovrapponendo i c rettangoli su c strati; si ha cos` un
parallelepipedo contenente a b c palline. Quando
si considera a (b c), dobbiamo prima eseguire il
prodotto bc: partendo da una fila con c palline e replicandola b volte, otteniamo un rettangolo con b c
palline; immaginiamo di disporlo verticalmente nello
spazio e replichiamolo a volte; otteniamo ancora un
parallelepipedo composto da abc palline, e quindi
con lo stesso numero di palline di quello ottenuto in
precedenza. Luguaglianza è cos` provata. Naturalmente, vale anche una proprietà dissociativa, per la
quale al prodotto a b possiamo sostituire a c d
se b = c d.
Per quanto riguarda moltiplicazione e confronti, si
hanno proprietà analoghe a quelle della somma e che
si possono dimostrare proprio a partire da quelle:
per tutte e sei le relazioni vale la proprietà di
aggiunzione: se a R b e c 6= 0, allora ac R bc;
per tutte e sei le relazioni vale la proprietà di
eliminazione: se ac R bc e c 6= 0, allora a R b;
per le cinque relazioni , <, , > e =
vale la proprietà di monotonia: se a R b e c R d,
allora ac R bd (con a, b, c, d 6= 0).
Partendo da queste proprietà possiamo cercare un

metodo per eseguire la moltiplicazione a partire dalla notazione posizionale dei numeri. Procediamo
Da questo modo di concepire il prodotto (che è per gradi, formulando via via alcune osservazioni.
poi del tutto naturale) seguono alcune proprietà re- La prima osservazione costituisce un vero e proprio
lative a fattori particolari quali lo 0 e l1. Intanto, lemma:
1 a = a deriva dal fatto che ripetere 1 per a volte ci fa chiaramente ottenere a. Si noti che questo è Lemma 2.2 Per moltiplicare un numero per 10 è
diverso da a 1 che significa ripetere a per una sola sufficiente aggiungere uno 0 in fondo a destra alla
volta, e ottenere comunque a. Quello che sorprende sua rappresentazione decimale.
nella moltiplicazione è proprio il fatto che valga la
proprietà commutativa a b = b a, quando linter- Prova: Se n è il numero considerato, sia:
pretazione che diamo dei due fattori è completamente
n = dr dr1 . . . d1 d0 =
diversa: di numero puro il moltiplicando e di ripetitore il moltiplicatore. Anche nel caso di un fattore
= dr 10r + dr1 10r1 + + d1 10 + d0 ;
0 questa diversità è evidente: 0 a significa ripetere
0 per a volte, laddove a 0 vuol dire ripetere a per per le proprietà associativa e distribuita si ha allora:
0 volte. Comunque, il risultato è sempre zero, cioè
10n = dr 10r+1 +dr1 10r + +d1 100+d0 10
a 0 = 0 a = 0.
47
2.3. MOLTIPLICAZIONE
e quindi la rappresentazione di 10 n è proprio
dr dr1 . . . d1 d0 0 come si voleva.
Naturalmente, questo lemma si può estendere al
caso di moltiplicazione per 100, 1000 e cos` via: basta aggiungere alla rappresentazione decimale di n
lappropriato numero di 0, cioè quanti ne compaiono nellaltro fattore. La seconda osservazione è tanto
semplice che la possiamo fare in modo discorsivo: se
i due fattori di una moltiplicazione sono semplici cifre decimali, allora il prodotto è minore di 100, cioè
contiene al pi`
u due cifre decimali. Daltra parte, come ben si sa, il valore massimo è 9 9 = 81. Pi`
u
complessa è la terza osservazione:
Lemma 2.3 Se n è un numero qualsiasi ed m è rappresentato da ununica cifra m = c, allora ogni cifra
di n c è unicamente determinata dalla corrispondente cifra di n e dalleventuale riporto del prodotto
di c con la precedente cifra di n.
Prova: Sia al solito dr dr1 . . . d1 d0 la rappresentazione decimale di n; abbiamo allora:
9
8
7
6
5
4
3
2
1
1
18
16
14
12
10
8
6
4
2
2
27
24
21
18
15
12
9
6
3
3
36
32
28
24
20
16
12
8
4
4
45
40
35
30
25
20
15
10
5
5
54
48
42
36
30
24
18
12
6
6
63
56
49
42
35
28
21
14
7
7
72
64
56
48
40
32
24
6
8
8
81
72
63
54
45
36
27
18
9
9
Tabella 2.4: La Tavola Pitagorica

(b) sia sj la cifra delle unit`
a di v; questa è la
j-esima cifra del risultato;
(c) sia k la cifra delle decine di v; questo è il
nuovo riporto;
(d) si riprende dallinizio del ciclo;
3. Se k 6= 0 si pone sr+1 := k, mentre se k = 0 il
valore di sr+1 è nullo.
nc=
dr c10r +dr1 c10r1 + +d1 c10+d0 c.
La precedente osservazione ci assicura che d0 c 81,
e quindi tale prodotto determina la cifra delle unità
e può avere un riporto che influenzerà la cifra delle
decine; sia k tale riporto. La cifra delle decine si
calcola facendo d1 c + k; questo valore non supera
81 + 8 = 89 e quindi genera al pi`
u un riporto verso
la cifra delle centinaia, ma non oltre. Si noti che
anche questa volta il riporto può essere al massimo 8.
Procedendo in modo analogo per le cifre successive,
si dimostra quanto affermato dal lemma.
Questo lemma porta a un algoritmo che stabilisce operativamente cosa dobbiamo fare per eseguire
la moltiplicazione fra un moltiplicando generico e un
moltiplicatore costituito da una sola cifra decimale.
Algoritmo 2.4 (Moltiplicazione per una cifra)
Ingresso: Un moltiplicando n = dr dr1 . . . d1 d0
e un moltiplicatore m costituito da ununica cifra c.
Uscita: La rappresentazione decimale del prodotto
n m = sr+1 sr sr1 . . . s1 s0 .
1. Si pone k := 0 come riporto iniziale;
2. Procedendo da destra verso sinistra,
ponendo j := 0, 1, . . . , r:
9
8
7
6
5
4
3
2
1
cioè
(a) sia v := dj c + k, dove il valore di dj c

risulta dalla Tabella 2.4, la ben nota Tavola
Pitagorica;
Sapendo moltiplicare n per un numero composto

da una sola cifra, il Lemma 2.3 ci permette ora di
moltiplicare due numeri qualsiasi. Infatti, sia m =
dr dr1 . . . d1 d0 e si consideri n m = n dr 10r +
n dr1 10r1 + + n d1 10 + n d0 . Qui,
n d0 è il prodotto di n per la cifra delle unità d0 , e
questo può essere eseguito con lalgoritmo precedente;
n d1 10 è il prodotto di n per la cifra delle decine
(e anche questo lo sappiamo fare) con uno zero in
fondo, e cos` via fino a n dr , che deve essere seguito
da r zeri. A questo punto, basta fare le somme di
tutti questi prodotti parziali. Questo è il principio
che tutti conosciamo, come conosciamo lalgoritmo e
la costruzione che servono ad eseguire comodamente
il prodotto nel suo complesso:
Algoritmo 2.5 (Moltiplicazione)
Ingresso: il moltiplicando n e il moltiplicatore m =
dr dr1 . . . d1 d0 ;
Uscita: La rappresentazione decimale di n m.
1. si scrive il moltiplicando n, il simbolo del prodotto e, accanto o sotto, il moltiplicatore
m. Si scrive una linea di divisione dei fattori
dai risultati parziali e dal prodotto;
2. procedendo da destra verso sinistra, si considerano le varie cifre (j := 0, 1, . . . , r) del
moltiplicatore;
(a) si moltiplica n per dj e si aggiungono j zeri
alla fine;
48
(b) si aggiunge il prodotto cos` ottenuto ai risultati parziali, allineandolo a destra con quelli
gi`
a presenti (se ce ne sono);
(c) si incrementa j e se non si è superato r si
cicla tornando al passo 2a.;
3. si scrive una linea di separazione che chiude i

risultati parziali cos` ottenuti;
4. si esegue la somma dei risultati parziali,
ottenendo il prodotto finale.
Ad esempio, per moltiplicare 732 per 263 si procede
nel modo seguente:
263
732
2196
43920
146400
192516
Spesso, al posto degli zeri finali si preferisce operare

una scalatura dei prodotti n dj , ma ovviamente il
significato e il risultato sono gli stessi.
Nota 2.2
La Tavola Pitagorica è stata la croce

di tanti scolari. Daltra parte, essa costituisce il perno
dellesecuzione della moltiplicazione e, come tale, va
saputa a memoria, anche oggi che cos` spesso demandiamo a calcolatori elettronici la maggior parte dei
nostri conti. La tavola serve per eseguire il prodotto
anche secondo unimpostazione che nei tempi passati ha avuto molto successo; se, ad esempio, vogliamo
calcolare 27 184, loperazione si imposta cos`:
1
7
2
8
7
4
6
2
0
6
1
8
8
0
8
6
Si noti che ogni quadrato contiene il prodotto di due

cifre, cioè proprio il risultato dato dalla Tavola Pitagorica. Procedendo da destra verso sinistra, si eseguono le somme per diagonale alto/sinistra verso basso/destra e il risultato 4968 si legge facilmente. Questo metodo evita luso dellalgoritmo classico di moltiplicazione e riduce tutto alla Tavola Pitagorica. Ci`
o
lo rende abbastanza simpatico, lunica difficolt`
a essendo lesecuzione delle somme per diagonale, almeno
ai primi tentativi. Il lettore è invitato a formulare
lalgoritmo per realizzare questo metodo.
Quasi non fa uso della Tavola Pitagorica la tecnica
detta dei contadini russi. Scritti uno accanto allaltro moltiplicatore e moltiplicando, al di sotto si
scrivono rispettivamente la met`

a del primo (ignorando punto decimale e resto) e il doppio del secondo. Si
va avanti cos` fino a che il moltiplicatore non è ridotto
ad 1, e si sommano infine i vari doppi del moltiplicando che corrispondono a valori dispari delle met`
a
del moltiplicatore. Ecco come si sviluppa il calcolo di
25 347:
25
12
6
3
1
347
(694)
(1388)
2776
5552
8675
12 è pari
6 è pari
Conviene prendere sempre come moltiplicatore il fattore pi`

u piccolo. Si d`
a per scontato che si sappia calcolare senza difficolt`
a il doppio di un numero, senza
usare la Tavola Pitagorica. La somma finale è inevitabile ed è opportuno aver cancellato bene i termini
da ignorare per non incorrere in facili errori. Perche
questo metodo funziona? Se convertiamo il moltiplicatore 25 in binario, si ottiene 11001, dove gli 1 corrispondono alle potenze di 2 da considerare per formare il 25 = 24 + 23 + 20 (si veda la Sezione 1.5).
Allora, 25 347 = 24 347 + 23 347 + 347 e questo è proprio ci`
o che si è fatto applicando il metodo
dei contadini russi. Costoro, cè da scommeterci, non
immaginavano nemmeno che la loro tecnica di moltiplicazione sarebbe stata adottata dagli odierni elaboratori. Nel sistema binario la moltiplicazione per 2
(cioè il raddoppio) e la divisione per 2 (cioè il dimezzamento) sono operazioni particolarmente facili. Poiche
210 = 102 , raddoppiare un numero binario significa
aggiungergli uno 0 in fondo: il doppio di 510 = 1012
è 10102 = 1010 . Analogamente, dimezzare un numero vuol dire togliergli lultima cifra. Fra laltro,
questa rappresenta il resto ella divisione: la met`
a di
2110 = 101012 è 10102 = 1010 con il resto di 1; la met`
a
di 2810 = 111002 è 11102 = 1410 con resto 0. Ecco allora come si imposta il prodotto di 2510 = 110012 per
2710 = 110112 :
11001
1100
110
11
1
11011
(110110)
(1101100)
11011000
110110000
resto 0
resto 0
A questo punto, dobbiamo sommare i doppi corrispondenti al resto 1; sappiamo fare la somma di due
addendi alla volta e quindi il risultato è dato da:
11011
11011000
11110011
110110000
1010100011
+
=
+
=
La conversione finale mostra che questo numero binario significa 675, il risultato corretto. A onor del
49
2.4. DIVISIONE
vero, se eseguiamo la moltiplicazione tra numeri binari secondo la tecnica consueta esposta per la base 10,
otteniamo gli stessi risultati parziali del metodo dei
contadini russi: basta osservare che, usando 25 come
moltiplicatore, ogni 0 non d`
a niente da sommare, e
ogni 1 d`
a lo stesso moltiplicando, scalato del numero opportuno di posizioni, cioè con la coda di 0 che
gli compete. La somma dei risultati parziali, infine, è
proprio quella appena eseguita. Volendo filosofeggiare, si vede cos` come, qualche volta, strade diverse si
riuniscano per formare un unico, grande viale.
Questi metodi per eseguire la moltiplicazione, comunque, vanno bene solamente per numeri relativamente
piccoli, diciamo qualche decina di cifre binarie. Oggi,
per`
o, come vedremo nel prossimo capitolo, la tecnica
richiede il prodotto di numeri espressi da qualche
centinaio di cifre binarie. Fortunatamente, esiste
almeno un metodo che permette di effettuare le
moltiplicazioni in modo molto pi`
u veloce, basato
sulla tecnica detta della trasformata veloce di Fourier
(FFT = Fast Fourier Transform), della cui esistenza
informiamo il lettore, ma il cui trattamento lasciamo
ai testi universitari.
Concludiamo accennando alla moltiplicazione dei

numeri scritti in una base composta. In effetti, non
moltiplicheremo due numeri del genere, ma ci limiteremo a moltiplicare un angolo per un numero
scritto in base 10. Ad esempio, cerchiamo il triplo
di 28 32 54 ; moltiplicando separatamente per 3 le
tre componenti, si ha 84 96 162 e a questo punto
scriviamo correttamente questa quantità: 162 sono 2 42 , e quindi i 2 si aggiungono ai 96 presenti.
Ora, 98 sono 1 38 e il grado si aggiunge agli 84 già
trovati. In conclusione, il prodotto vale 85 38 42 .
2.4
Divisione
Come la moltiplicazione è unoperazione che abbrevia

lesecuzione di somme successive della stessa quantità, cos` la divisione abbrevia la sottrazione da un
quantità data di un certo valore, tante volte quanto ciò risulti fattibile. Con un semplice esempio, la
divisione di 19 per 5 corrisponde a sottrarre da 19
il numero 5 tante volte quanto sia possibile. Cos`,
19 5 = 14, 14 5 = 9, 9 5 = 4 e a questo punto
non è lecito sottrarre ulteriormente 5 dalla differenza ottenuta, cioè 4. Poiche abbiamo potuto sottrarre
per tre volte il 5 dal 19, il numero 3 costituisce il risultato della divisione. Talvolta si dice che il 5 sta 3
volte nel 19.
La terminologia legata alla divisione è la seguente:
risultato si dice quoziente della divisione e il numero

che rimane dopo aver effettuato tutte le sottrazioni
(cioè il 4) vien detto resto o modulo. Se il resto di
una divisione è zero, si dice che la divisione è esatta,
o anche che il divisore sta nel dividendo. Infine, dati
due numeri n, m N si dice che n è divisibile per m,
o che n è multiplo di m, o che m divide n, o anche
che m è un divisore o un fattore di n, se esiste un
numero q N tale che n = m q.
Da questa definizione consegue che il resto della

divisione è sempre strettamente minore del divisore, altrimenti si potrebbe eseguire almeno unaltra
sottrazione. Il concetto di divisione esatta innesca
un importante capitolo della Matematica: quello della divisibilit`
a. Esso merita una speciale attenzione e
verrà compiutamente trattato pi`
u avanti. Il fatto che
n sia un multiplo di m (o che m sia un divisore di n) si
può esprimere affermando che il resto della divisione
di n per m è zero, cioè n = m q + 0. Talvolta, per
indicare questo concetto, si scrive m|n ovvero m[n.
Lo 0 si considera divisibile per ogni numero naturale
m, in quanto soddisfa la definizione precedente con
q = 0.
Quella che abbiamo definito è talvolta detta divisione intera per mettere in evidenza che sono coinvolti solo numeri interi e mai numeri con il punto decimale, che, fra laltro, finora non abbiamo nemmeno
introdotto. Il quoziente tra 19 e 5 è, come sè visto,
3 e non 3.8, un numero che ancora non conosciamo
ufficialmente. Se n, m N, il quoziente si indica con
n/m, anche se talvolta si trovano le notazioni n//m
oppure n div m, per distinguere la divisione intera
dalla divisione decimale. Se q è il quoziente della divisione di n per m, ed r ne è il resto, si ha chiaramente
n = m q + r, con 0 r < m. Infatti, m q ha leffetto opposto delle differenze successive e ristabilisce,
a parte il resto r, il dividendo; questo lo si ottiene poi
in modo esatto aggiungendo r.
Naturalmente, loperazione di divisione non si esegue effettuando una dopo laltra le sottrazioni necessarie: se il risultato fosse anche solo dellordine
delle migliaia, occorrerebbero ore ed ore per portare a termine unoperazione. Anche in questo caso si
può sfruttare la rappresentazione decimale dei numeri. Bisogna tuttavia essere coscienti del fatto che la
divisione è loperazione pi`
u difficoltosa fra le quattro
operazioni di base. Daremo ora il ben noto algoritmo
per eseguire la divisione, ma vedremo come almeno
un passo rimane abbastanza oscuro e arbitrario, ancorche del tutto corretto. Questo parzialmente giustifica coloro che si trovano in difficoltà nel fare le
divisioni, specie quelle a pi`
u cifre.
Definizione 2.3 Il numero sul quale si effettua la Algoritmo 2.6 (La divisione)
divisione (il 19 nellesempio) si dice il dividendo; il Ingresso: il dividendo n e il divisore m;
numero da sottrarre (cioè il 5) si chiama divisore. Il Uscita: il quoziente q e il resto r della divisione.
50
1. se n < m si pone q := 0, r := n e loperazione è trovare come scoprirlo, senza perdere troppo tempo.
terminata;
Questo fatto rende la divisione a due cifre uno scoglio fra i pi`
u complessi della matematica applicata,
2. altrimenti, siano n = nt nt1 . . . n1 n0 ed m = oggi superato grazie alluso massiccio dei calcolatori
ms ms1 . . . m1 m0 le rappresentazioni decimali da tasca.
dei due numeri; deve essere t s dato che è
Un esempio di come si imposta la divisione può torn m;
nare utile; per maggiore chiarezza, abbiamo riportato
3. si considerano le prime s + 1 cifre di n, cioè esplicitamente le sottrazioni, anche se di regola viene
nt nt1 . . . nts+1 nts = n e si confrontano con insegnato come evitare tale passaggio:
m; se n m si prosegue al passo successivo,
1 7 4 4 8 2 8
altrimenti si aggiunge ad n la cifra successiva di
1 6 8
6 2 3
n, ponendo ora n := nt nt1 . . . nts nts1 . Si
6 4
osservi che in questo caso è certamente n > m,
5 6
visto che n ha una cifra in pi`
u rispetto ad m;
8 8
4. sia k il massimo numero intero tale che m k
8 4
n . Tale numero è 9: infatti, per come si è
4
proceduto al punto precedente abbiamo n < 10
Per le divisioni molto complesse, come per esempio
m e quindi k = n /m < 10. Quindi k è una cifra
.
.
.
e rappresenta la cifra decimale pi`
u a sinistra del 347 586 344 812 diviso per 1758, può essere conveniente scriversi, da una parte, la tabella dei multipli
quoziente q;
del divisore, cos` da averla sempre sottocchio e sco5. si esegue la sottrazione n k m = prire immediatamente quante volte il 1758 sta nella
pv pv1 . . . p1 p0 , come rappresentazione decimale; parte considerata del dividendo.
La divisione per 2 si dovrebbe saper eseguire a men6. per ognuna delle cifre nj del dividendo non consite
o, almeno, senza dover impostare loperazione coderate al passo 3. e procedendo da sinistra verso
me
nel caso generale. Le divisioni per 10, 100, 1000,
destra:
. . . , si fanno togliendo lultima cifra, le ultime due
(a) si aggiunge tale cifra nj a destra di cifre, le ultime tre, e cos` via; le cifre tolte costituipv pv1 . . . p1 p0 e questo numero lo si asse- scono il resto della divisione. Le divisioni per 4 si
gna ad n (si dice che si abbassa la cifra fanno bene dividendo due volte per 2; cos`, 147/4 si
nj );
esegue dimezzando 147 in 73 e poi questo in 36. Ana(b) si trova il massimo numero k per cui k logamente, le divisioni per 8 richiedono di dimezzare
m < n (qui possiamo anche avere k = 0 se per tre volte. Le divisioni per 5 si fanno raddoppiann < m, eventualit`
a da escludere al punto do il dividendo e poi dividendo per 10, cioè togliendo
4.; anche questa volta, k è ununica cifra e lultima cifra. Infine, ricordarsi sempre che la divicostituisce la cifra successiva del quoziente); sione per 0 non ha senso (loperazione è impossibile),
mentre la divisione per 1 dà sempre come quoziente
(c) si esegue la sottrazione n k m = il dividendo stesso.
pv pv1 . . . p1 p0 , e, se ci sono altre cifre nel
Per quanto concerne divisione e confronti, possiadividendo n si cicla tornando al passo 6a.;
mo limitarci a riprendere dalla moltiplicazione la pro7. la sequenza delle cifre k ottenute ai passi 4. e prietà di eliminazione: se c è un numero diverso da
6b. costituisce il quoziente q; lultima differenza 0 e si ha ac R bc, allora possiamo dividere per c ed
ottenere a R b. La relazione R è una qualsiasi delle
pv pv1 . . . p1 p0 è il resto r della divisione.
sei relazioni di base , <, , >, = e 6=.
Come si vede, questo è lalgoritmo pi`
u complicato
Il resto della divisione intera ha un ruolo fondamenper ora incontrato; inoltre, come si diceva, cè un pun- tale in Aritmetica e, di fatto, in tutta la Matematica.
to difficile costituito dai passi 4. e 6b. (che sono del Pertanto, e importante la seguente:
tutto analoghi): dati n ed m, come si trova k? cioè,
come si stabilisce quante volte m sta in n ? Quando Definizione 2.4 Il resto o modulo della divisione si
m è costituito da ununica cifra, la Tavola Pitagorica, indica con la notazione n mod m, e se due numeri n1
usata allinverso di come la si usa nella moltiplicazio- ed n2 hanno lo stesso resto nella divisione per m, si
ne, fa al nostro scopo, ma quando m è fatto di pi`
u scrive n1 n2 (mod m), che si legge: n1 è concifre, è solo lintuito matematico, lesperienza o la for- gruo ad n2 , modulo m. Loperazione che ci fa pasza bruta del provare che ci possono aiutare. E chiaro sare da un numero n N al resto n mod m si dice
che il valore di k è ben determinato, ma il difficile è riduzione modulo m.
`
2.5. DIVISIBILITA
Ad esempio, abbiamo 19 14 (mod 5).
Dati due qualsiasi numeri n1 , n2 N, e fissato un
numero m N, possiamo sempre dire se n1 è congruo,
o non è congruo, ad n2 , modulo m: basta eseguire la
divisione e calcolare i due resti, cos` che n1 n2
(mod m) se e soltanto se n1 mod m = n2 mod m.
Questo significa che abbiamo definito una relazione
su N, cioè una regola per correlare (o non correlare)
due qualsiasi numeri naturali. La cosa curiosa è che
questa relazione, detta di congruenza, gode delle stesse proprietà formali delluguaglianza: 1) la proprietà
riflessiva: ogni numero è congruente con se stesso (infatti, il resto della divisione per m non può cambiare);
2) la proprietà simmetrica: se un numero n1 è congruo ad n2 , anche n2 è congruo ad n1 (infatti, si tratta
ancora delluguaglianza dei due resti); 3) la proprietà
transitiva: se n1 è congruo ad n2 , e questo è congruo
ad n3 , allora il numero n1 è congruo ad n3 (infatti,
i tre numeri hanno lo stesso resto nella divisione per
m). Si tratta quindi di una relazione di equivalenza
e, per quanto detto a suo tempo, possiamo mettere
assieme tutti i numeri che hanno lo stesso resto nella divisione per il numero fissato m. Ad esempio, se
m = 3 si hanno tre classi di equivalenza:
numeri con resto 0: [0] = {0, 3, 6, 9, . . .};
numeri con resto 1: [1] = {1, 4, 7, 10, . . .};
numeri con resto 2: [2] = {2, 5, 8, 11, . . .}.
Non vi possono essere altri casi e gli insiemi cos` ottenuti si dicono classi di resti. Ogni classe, infatti, è
individuata dal resto r che i suoi elementi hanno nella divisione per m. Fissato m, esistono esattamente
m classi, ciascuna corrispondente a uno dei possibili
resti 0, 1, . . . , m 1. Per m = 2 le due classi sono
costituite, rispettivamente, dai numeri pari e dispari.
Linsieme delle classe di resti modulo m si indica con
la notazione Zm .
Di solito, per semplificare le notazioni, si scrive
semplicemente r invece di [r] e Zm = {0, 1, . . . , m1}.
Le operazioni di addizione e di moltiplicazione su N
inducono operazioni analoghe su Zm :
51
Lasciando perdere, per ragioni di semplicità, la divisione, si chiama Aritmetica modulare di base m
linsieme Zm con le operazioni dette. Il calcolatore elettronico rappresenta i numeri naturali con una
quantità fissa di bit, cioè di cifre binarie; di solito sono 16 o 32, cos` che laritmetica del calcolatore è in
realtà unaritmetica modulare, in cui m = 216 oppure m = 232 . Poiche 216 = 65536, questo significa che
27438 + 49512 = 11414 e 1000 100 = 34464; il programmatore ben conosce queste limitazioni e adotta
i necessari accorgimenti se un programma richiede
luso di numeri che possono superare m.
La somma, a causa dei riporti che si propagano
da destra verso sinistra, va eseguita sequenzialmente in questa direzione, di modo che, pi`
u sono i bit
usati nella rappresentazione dei numeri, pi`
u tempo
loperazione richiede. Allinizio della storia degli elaboratori, pertanto, furono proposte tecniche di rappresentazione che, sfruttando comunque laritmetica modulare, potessero accelerare le operazioni, rendendole eseguibili in modo pi`
u parallelo, cioè senza un uso massiccio dei riporti. Se fissiamo k numeri (m1 , m2 , . . . , mk ), a due a due primi tra loro, possiamo rappresentare univocamente un numero
naturale a < M = m1 m2 mk mediante
una k-upla (a1 , a2 , . . . , ak ), dove ai a (mod mi ),
per i = 1, 2, . . . , k. Per le proprietà del modulo, se
b = (b1 , b2 , . . . , bk ) si ha:
a+b
ab
= (a1 + b1 , a2 + b2 , . . . , ak + bk )
= (a1 b1 , a2 b2 , . . . , ak bk )
dove ogni operazione è eseguita modulo mi ; il vantaggio è che le k operazioni sono indipendenti luna
dallaltra e quindi possono essere eseguite in parallelo, accelerando cos` il calcolo. Prendiamo ad esempio
m1 = 32 e m2 = 27, di modo che M = 32 27 = 864,
il numero 100 è rappresentato dalla coppia (4, 19) e
il numero 8 da (8, 8). Per esempio, si ha:
(20, 23) + (24, 20)
(14, 14) (8, 13)
=
=
(12, 14)
(16, 20)
Il problema, a questo punto, è risalire da una coppia (o, in generale, da una k-upla) al numero che
a + b = a + b (mod m)
a b = a b (mod m). essa rappresenta; il lettore è invitato (per non dire
sfidato) a trovare i numeri naturali che hanno daQueste operazioni godono (pi`
u o meno) delle stesse to origine ai due esempi precedenti. Su questo punto
proprietà formali delladdizione e delle moltiplicazio- (anche se non solo su questo) sono falliti questi strani
ne in N: chiusura, commutatività, associatività, dicalcolatori.
stributività. Inoltre, per ogni elemento r Zm , la
classe m r agisce da opposto, poiche r + (m r) =
Divisibilit`
a
m = 0 (mod m), e quindi possiamo definire la 2.5
sottrazione in Zm :
Alcune proprietà dei numeri relative alla divisibilità
sono tanto importanti che è opportuno partire proa b = a + (m b),
prio da esse per parlare pi`
u diffusamente di questo
e questo è qualcosa di nuovo rispetto ad N.
concetto.
52
Teorema 2.4 Siano a, b due numeri naturali; allora: Prova: Consideriamo il caso del 9 e dimostriamo
qualcosa di pi`
u forte, e cioè che: la somma delle cifre
se a e b sono divisibili per m, allora anche a + b decimali di un numero n ha lo stesso resto di n nella
e a b (se a b) sono divisibili per m;
divisione per 9. Sia infatti n = ds ds1 . . . d1 d0 la rappresentazione decimale di n. Per la regola posizionale
se a è divisibile per m, allora a b è divisibile
abbiamo:
per m; se poi anche b è divisibile per m, allora
a b è divisibile per m2 ;
n = 10s d + 10s1 d
+ + 10 d + d .
s
s1
se a è divisibile per m e b è divisibile per n, allora La somma delle cifre di n è = d +d + +d +d

s
s1
1
0
a b è divisibile per m n.
e quindi:
n =
Prova: Dire che a è divisibile per m significa che
esiste un numero naturale q tale che a = m q; ana- (10s 1)d +(10s1 1)d
s
s1 + +99d2 +9d1 .
logamente, esiste r N tale che b = mr. Per la proprietà distributiva del prodotto rispetto alla somma Gli addendi di questa somma sono tutti divisibili per
9 e quindi n = 9 k per qualche k. Questo ci dice
si ha:
che n e hanno lo stesso resto nella divisione per 9.
a + b = (m q) + (m r) = m (q + r)
Da ciò segue che n è divisibile per 9 se e solo se tale è
. Il risultato si estende ora immediatamente al caso
e questo significa che a + b è divisibile per m. Nello del numero 3.
stesso modo si dimostrano le altre proprietà.
Osserviamo esplicitamente che se > 9, si può calLesecuzione della divisione è il metodo generale colare la somma delle cifre di , che deve ancora
per determinare se un numero m divide o meno un godere della stessa proprietà. Applicando eventualaltro numero n (con n > m). Tuttavia, nella pratica, mente pi`
u volte questo procedimento, si arriva sempre
si possono dare alcuni criteri per stabilire ad occhio se a un valore compreso tra 0 e nove. Su questa proun numero n N è divisibile per un numero piccolo prietà, e sullaritmetica modulare in base 9, si fonda
assegnato. Sono facili i criteri di divisibilità per 2, la famosa prova del nove. Sia ad esempio m p = n e
3, 4, 5, 6, 8, 9, 10, 11, 12; pi`
u difficili e perciò non si voglia controllare che il risultato n della moltiplicapraticati sono i criteri per il 7 e per i numeri pi`
u zione sia esatto. Dividendo per 9 si ha: n = 9a+rn ,
grandi, eccetto qualche caso particolare come 16, 25, m = 9b+rm , p = 9c+rp . Eseguendo il prodotto si
50, 100 e cos` via.
trova mp = 81bc+9brp +9crm +rm rp .
I primi tre addendi sono divisibili per 9 e quindi il reTeorema 2.5 Un numero n N è divisibile per 2 se sto della divisione di m p per 9 deve essere uguale
e solo se la sua ultima cifra è tale; n è divisibile per al resto r della divisione di rm rp per 9, e questo
4 se e solo se le sue due ultime cifre sono tali; n è r deve coincidere con rn . La prova del nove della
divisibile per 8 se e solo se le sue tre ultime cifre sono moltiplicazione consiste nel valutare r ed rn : se sotali.
no diversi, sicuramente la moltiplicazione è errata; se
sono uguali cè una buona probabilità (non la certezProva: Se d è lultima cifra decimale di n, si ha za) che sia stata eseguita correttamente. Ad esemn = 10k+d; poichè 10k è certamente divisibile per pio, 25 37 = 925 e si ha rm = 7, rp = 1, quindi
2, n sarà tale se e solo se tale è d. Lo stesso argomento r = 7 che coincide con rn = 7. Si osservi però che
è valido per 4, quando si scriva n = 100 k + h ed se avessimo ottenuto come risultato 952 (effettuando
h rappresenta il numero dato dalle due ultime cifre per errore il classico rovescione) la prova del nove
di n. Infine, per 8 si procede in modo analogo dopo avrebbe comunque dato un risultato positivo!
aver scritto n = 1000 k + h, essendo questa volta h
il numero costituito dalle ultime tre cifre decimali di Teorema 2.7 Un numero n N è divisibile per 5 se
n.
e solo se tale è la sua ultima cifra decimale (cioè, se
e solo se termina per 0 o per 5); è divisibile per 10
Un numero si dice pari se e solo se è divisibile per 2;
se e solo se termina per 0.
dispari altrimenti. Lo 0 è pertanto un numero pari.
Il criterio dato dal teorema precedente ci permette
Prova: Analoga al caso del criterio di divisibilità
di stabilire se un numero è pari o dispari guardando
per 2.
semplicemente la sua cifra finale.
Naturalmente, da questo criterio discendono i
Teorema 2.6 Un numero è divisibile per 3 o per 9 se criteri di divisibilità per 25, 50, 100 e cos` via.
e solo se tale risulta la somma delle sue cifre decimali. Analogamente, si ha il seguente risultato:
`
2.5. DIVISIBILITA
53
Corollario 2.8 Un numero n N è divisibile per 6 primo se è divisibile soltanto per se stesso e per lua. Un numero che non sia primo si dice composto.
se e solo se è divisibile sia per 2 che per 3; è divisibile nit`
Il numero 1 è convenzionalmente considerato primo.
per 12 se e solo se è divisibile sia per 3 che per 4.
Diamo infine, senza dimostrazione che ormai dovrebbe essere alla portata del lettore, il seguente
criterio:
Teorema 2.9 Un numero n N è divisibile per 11
se e solo se: detta d la somma delle sue cifre di posto
dispari e p la somma delle sue cifre di posto pari, si
ha che la differenza:
|d p| = (d p) se d p, (p d) altrimenti
è divisibile per 11.
Se indichiamo con Dm linsieme dei divisori del numero m, dire che m ed n sono primi tra loro significa
che Dm Dn = {1}. Ad esempio, 24 e 35 sono primi tra loro, in quanto D24 = {1, 2, 3, 4, 6, 8, 12, 24}
e D35 = {1, 5, 7, 35}. Poiche lo 0 è divisibile per
qualsiasi altro numero, non lo si considera affatto
nel concetto di coprimalità. Si osservi infine che
Z12 = {1, 5, 7, 11} e Z15 = {1, 2, 4, 7, 8, 11, 13, 14};
quindi (12) = 4 e (15) = 8. Se due numeri sono
primi tra loro, non è detto che siano primi; lesempio
pi`
u semplice è dato dai numeri 4 e 9. Viceversa, come
vedremo, se due numeri sono primi, essi sono anche
primi tra di loro. I numeri primi verranno trattati
pi`
u compiutamente nella prossima sezione.
La funzione toziente è molto importante nella teoria dei numeri e merita qualche considerazione, anche
se del tutto elementare. Dimostriamo il seguente:
Ad esempio, con questo criterio si vede subito che

83413 e 3465 sono entrambi divisibili per 11.
I criteri che abbiamo presentato dipendono dalla
base con cui i numeri sono scritti; pertanto, non ci
possiamo aspettare che essi siano ancora validi per
i numeri scritti in base 7 o in base 2. Ad esempio,
Teorema 2.10 Siano p, q due numeri primi; si ha
poiche in base 2 si ha 210 = 102 , un numero scritto in
allora:
base 2 è pari se e solo se termina per 0. Analogamen1. (p)
= p1
te, sarà divisibile per 4 se termina per 00, divisibile
2. (pq)
= (p 1)(q 1)
per 8 se termina con 000, e cos` via. Come esercizio,
3. (pk )
= pk pk1
il lettore è invitato a dimostrare che un numero bik h
4. (p q ) = (pk pk1 )(q h q h1 )
nario è divisibile per 3 se e solo se vale il criterio del
Teorema 2.9. Trasposto al caso corrente, esso signifi- Prova: 1. e 3. sono casi particolari di 2. e 4.
ca: siano d e p le somme delle cifre di posto dispari e
1. Si considerino i p numeri da 0 a p 1; quando p
di posto pari; il numero è divisibile per 3 se e solo se
è primo, tutti questi numeri, eccetto lo 0, sono
|d p| è divisibile per 3. Si provi con 1365.
primi con p.
I criteri di divisibilità fanno parte della stenaritmia, cioè quellinsieme di regole che permettono di
2. Si considerino i pq numeri da 0 a pq 1; ci sono
accelerare i conteggi. A parte il matematico profesq multipli di p: 0, p, 2p, . . . , (q 1)p, e p multipli
sionista (che però per principio preferisce non fare i
di q: 0, q, 2q, . . . , (p 1)q. Questi numeri sono
conti) sapere se un numero è divisibile per 2, 3, 4,
gli unici a non essere primi con pq e sono tutti
5 e cos` via risulta utile quando si paga alla romana
distinti tra di loro, eccetto lo 0, che si trova in
o si debbono suddividere certe risorse tra un numero
entrambe le sequenze. Pertanto si ha:
di persone. Oggi si fanno i conti con i calcolatori,
(pq) = pq p q + 1 = (p 1)(q 1).
sia quelli grandi, sia quelli da tasca, ma saper destreggiarsi mentalmente tra i numeri è utile (anche i
3. Fra i pk numeri da 0 a pk 1, solo quelli dicalcolatori, se impostati male, sbagliano) e salutare
visibili per p non sono primi con pk ; essi sono:
(un po di ginnastica al cervello non fa mai male).
0, p, 2p, . . . , pk p = p(pk1 1), cioè sono pk1
Comunque pi`
u importanti sono altri concetti legati
in tutto. Da questo segue la formula.
alla divisibilità, come i numeri primi tra loro (che vedremo tra un istante), i numeri primi e il massimo
4. Il ragionamento è analogo a quello del punto 2.
comun divisore, che invece saranno introdotti nelle
Fra i pk q h numeri compresi tra 0 e pk q h 1, non
sezioni successive.
sono primi con pk q h tutti e soli i multipli di p
e i multipli di q; ma i primi sono pk1 q h e i seDefinizione 2.5 Due numeri si dicono primi tra locondi pk q h1 , che vanno perciò esclusi dal totale
ro o coprimi se non hanno divisori comuni, eccetto
di pk q h numeri. In questo modo, però, abbiamo
l1. Se m N è un numero diverso da 0, si inditolto due volte i multipli di pq, che sono in tutca con Zm linsieme dei numeri minori di m e primi
to pk1 q h1 e devono essere di nuovo inclusi nel
con m; la cardinalit`
a di Zm si indica con (m) e la
totale:
funzione : N N cos` definita si dice la funzione
(pk q h ) = pk q h pk1 q h pk q h1 + pk1 q h1
toziente di Eulero. Infine, un numero p N si dice
54
e questa è la formula desiderata.
Queste formule permettono di calcolare la funzione (n) senza dover cercare esplicitamente i numeri
primi con n, come abbiamo dovuto fare dopo la Definizione 2.5; il lettore può ora verificare che i valori là
trovati son quelli che si calcolano col precedente teorema e non avrà difficoltà a valutare (72) e (100),
o anche (1. 000. 000). Nei primi due casi, lo invitiamo a scrivere esplicitamente gli elementi di D72 e di
D100 .
Ma quanto vale (30)? Poiche 30 = 2 3 5, il
teorema non si può utilizzare; la sua dimostrazione,
però, fornisce il metodo per risolvere il problema generale. Si consideri il numero n = pqr, dove p, q, r
sono numeri primi; il metodo usato nella dimostrazione del teorema si dice principio di inclusione ed
esclusione e possiamo ora applicarlo in questo modo:
i numeri minori di n sono in tutto pqr e da questa
quantità partiamo;
dal numero precedente dobbiamo escludere i
multipli di p (che sono qr), i multipli di q (che
sono pr) e i multipli di r (che sono pq), e si ha
pertanto pqr pq qr rp;
in questo modo, però, abbiamo escluso due volte
i multipli di pq (che sono r), i multipli di qr (che
sono p) e i multipli di rp (che sono q); essi devono
essere inclusi di nuovo, ottenendo cos` pqr pq
qr rp + p + q + r;
ci accorgiamo ora che lo 0 (che deve essere escluso e che è lunico multiplo di pqr), è stato prima
incluso, poi escluso 3 volte e quindi incluso 3
volte ancora; quindi va escluso di nuovo.
In conclusione, si ha:
(pqr) = pqr pq qr rp + p + q + r 1 =
= (p 1)(q 1)(r 1),
e il lettore verificherà direttamente che (30) =

1 2 4 = 8, trovando esplicitamente D30 =
{1, 7, 11, 13, 17, 19, 23, 29}.
Nota 2.3
Questa tecnica fa vedere che il toziente

è una funzione moltiplicativa; con tale termine si indica una funzione f : N N per la quale vale la seguente
propriet`
a. Sia n = pk1 1 pk2 2 pkuu la decomposizione in
fattori primi (si veda la sezione successiva); allora:
f (n) = f (pk1 1 pk2 2 pkuu ) = f (pk1 1 )f (pk2 2 ) f (pkuu ).
Naturalmente, dobbiamo sapere quanto vale la f sulle
potenze di un numero primo, ma per il toziente sappiamo che (pk ) = pk pk1 , qualunque sia k, e quindi
la funzione risulta completamente definita.
Unosservazione interessante è la seguente: siano

x, y Zm e consideriamo il loro prodotto xy; poiche ne
x ne y hanno un divisore comune con m, nemmeno xy
pu`
o averne. Ad essere rigorosi, questo fatto discende
dal Corollario 2.12 che ancora dobbiamo dimostrare;
tuttavia, siamo in una nota e possiamo permetterci
qualche libert`
a. Prendiamo ora il resto r della divisione di xy per m, cioè sia xy = km + r. Se r avesse
un fattore comune con m, tale fattore potrebbe essere
messo in evidenza nel membro destro e, ancora per
il futuro Corollario 2.12, xy dovrebbe essere divisibile
per tale fattore, cosa che abbiamo gi`
a escluso. Con
ci`
o abbiamo dimostrato che loperazione x y = xy
(mod m) è chiusa. Ad esempio, in Z15 si ha 47 = 13,
7 8 = 11, 11 13 = 8, 8 8 = 82 = 4 e cos` via. Valgono ovviamente le propriet`
a associativa e commutativa,
in quanto tali propriet`
a valgono per la moltiplicazione
usuale, sulla quale x y si basa. L1 agisce da identit`
a
e ogni elemento ha il suo inverso: 2 8 = 1, 4 4 = 1,
7 13 = 1, 11 11 = 1, 14 14 = 1, di modo che 2
e 8, 7 e 13 sono linverso luno dellaltro, mentre 4,
11, 14 hanno come inverso se stessi. Siamo quindi di
fronte a un gruppo (v. Sezione [1.8]). I matematici
si sono dati da fare per studiare questi strani gruppi
, ) e ne hanno trovato tante propriet`

a. Inaspet(Zm
tatamente, alla met`
a degli anni 1970, Rivest mostr`
o
come questi gruppi potessero essere utili per assicurare la privatezza dei messaggi, ad esempio durante la
loro trasmissione in una rete pubblica come Internet.
Essi infatti permettono di cifrare i messaggi in modo
particolarmente efficace.
Il metodo si basa su questa propriet`
a, gi`
a dimostrata
da Eulero 200 anni prima: per ogni elemento x Zm
si ha x(m) = 1, cioè in Z: x(m) 1 (mod m).
Il lettore è invitato a verificare questa propriet`
a su
Z15 , ma la dimostrazione (che vedremo parlando di
Algebra Astrattanella Sezione 5.8) ci assicura che la
regola vale in generale. Quello che interessa è questo:
moltiplicando i due membri delluguaglianza per x si
ha: x(m)+1 = x. Se abbiamo due numeri p ed s,
tali che ps = k(m) + 1, possiamo procedere a cifrare e decifrare un messaggio con la seguente tecnica.
Sia x il messaggio, interpretato come numero; questo è sempre possibile poiche possiamo, ad esempio,
interpretare ogni lettera come cifra in un sistema di
numerazione in base 21 (vedere la Sezione 1.5). Prendiamo xp Zm come codifica cifrata del messaggio e
usiamo laltro numero s per decifrarlo; in effetti si ha:
(xp )s = xps = xk(m)+1 = x(x(m) )k = x1k = x
(tutte le operazioni sono fatte modulo m) e quindi abbiamo ottenuto il messaggio di partenza, decifrando il messaggio cifrato. Naturalmente, affinche
il marchingegno funzioni si devono verificare certe
condizioni:
1. il numero s sia segreto, conosciuto solo da chi
deve ricevere il messaggio, altrimenti addio privatezza. Viceversa, il numero p deve essere pubblico, noto a tutti, in modo da poter essere usato
55
2.6. NUMERI PRIMI

da chiunque voglia mandare un messaggio a chi
conosce s;
3. Si cancellano dalla lista L tutti i multipli di p, p

escluso;
2. dalla conoscenza di p e di m non si possa risalire

a (m), altrimenti dal fatto che ps = k(m) + 1
si potrebbe conoscere s e rompere il codice;
4. Si considera il primo numero della lista

successivo a p che non sia stato cancellato;
3. sia facile (almeno per un calcolatore) eseguire le

potenze xp ed (xp )s modulo m.
5. Se tale numero esiste, lo si assegna a p e si torna

al punto 3.
La prima condizione è una questione personale di

chi conosce s: poiche lo conosce solo lui, star`
a a lui
non rivelarlo a nessun altro. La seconda condizione
sembra assurda, perche m deve essere noto a tutti
per poter fare le operazioni modulo m, e da m si deve
poter risalire a (m). In realt`
a, questo è il punto
interessante del metodo, ma ci ritorneremo sopra un
po pi`
u avanti, non appena avremo approfondito il
concetto di numero primo, per il momento, diamola
per buona. La terza condizione, invece, è semplice:
per calcolare xp (mod m) non si deve calcolare xp
e poi ridurre modulo m, il che comporterebbe la
manipolazione di numeri enormi. Conviene piuttosto
ridurre modulo m ad ogni operazione. E questo uno
dei casi in cui la tecnica dei contadini russi risulta
particolarmente utile, come mostra un semplice
esempio. Si voglia calcolare 513 (mod 7); valutiamo
le potenze raddoppiando ogni volta lesponente:
52 = 4, 54 = (52 )2 = 42 = 2, 58 = (54 )2 = 22 = 4,
tutto modulo 7. A questo punto sarebbe inutile
calcolare 516 , ma usiamo piuttosto le potenze trovate
per calcolare 513 : 512 = 58 54 = 4 2 = 1, e infine
513 = 512 5 = 1 5 = 5. Si noti che (7) = 6,
e quindi questa è anche una verifica del precedente
risultato di Eulero. Nella realt`
a, come vedremo, sono
coinvolti numeri con oltre 200 cifre decimali, ma,
fortunatamente, i conti non devono essere fatti a
mano e i bravi calcolatori pensano loro a tutto.
6. Altrimenti, avendo esaurito la scansione della lista L, si è finito ed L contiene i numeri primi
desiderati.
2.6
Numeri primi
Ad esempio, per i numeri da 1 a 25, si comincia

con la lista:
(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,
18, 19, 20, 21, 22, 23, 24, 25)
dove abbiamo marcato il valore di p. Cancelliamo i
multipli di 2:
(1, 2, 3, 4 , 5, 6 , 7, 8 , 9, 10 , 11, 12 , 13, 14 , 15,
16 , 17, 18 , 19, 20 , 21, 22 , 23, 24 , 25).
Il nuovo valore di p è 3 e se ne cancellano i multipli
rimasti:
(1, 2, 3, 5, 7, 9 , 11, 13, 15 , 17, 19, 21 , 23, 25).
A questo punto il successivo valore di p è 5, e il suo
unico multiplo nella lista L è 25. Tolto anche lui,
abbiamo:
L = (1, 2, 3, 5, 7, 11, 13, 17, 19, 23);
i numeri rimasti non hanno multipli in L, e quindi
questo è linsieme dei numeri primi minori o uguali a
25.
La determinazione del fatto che un numero sia primo o composto può essere fatta senza costruire in
modo esplicito una tabella di numeri primi. Si osservi che se un numero p è composto, cioè p = nm con
n ed m diversi da 1, allora uno dei due fattori deve
essere minore o uguale a p. Infatti, se avessimo
m > p e n > p, sarebbe anche m n > p (si

veda il Teorema 1.6). Si ha allora il seguente metodo:
I numeri primi rappresentano sicuramente uno dei pi`

u
antichi e misteriosi concetti della Matematica. Sono
primi i numeri 2, 3, 5, 7, 11, 13, 17. Sono composti
tutti i numeri pari, eccetto il 2, nonche 9, 15, 21, etc.
Se si esclude il 2, tutti i numeri primi sono dispari.
Un elenco di tutti i numeri primi minori o uguali a
un assegnato numero n si può ottenere con il seguente algoritmo, noto fin dallantichità come crivello di Algoritmo 2.8 (Numero primo o composto?)
Eratostene:
Ingresso: Un numero n N.
Uscita:
Primo se n è un numero primo,
Algoritmo 2.7 (Crivello di Eratostene)
Composto altrimenti.
Ingresso: un numero n N maggiore di 2;
Uscita: lelenco dei numeri primi minori o uguali ad
1. Si pone p := 2;
n.
2. Se n è divisibile per p, allora il numero n non è
1. Si dispongono in una lista L tutti i numeri da 2
primo e si esce dopo aver scritto Composto;
fino ad n.
3. Altrimenti (p non divide n) si considera il
2. Si pone p := 2;
numero primo successivo a p;
56
4. Detto ancora p tale numero primo, se p2 > n il la scomposizione in fattori primi è da seguire con
numero n non ha divisori e quindi si esce dopo attenzione:
aver scritto Primo;
Algoritmo 2.9 (Scomposiz. in fattori primi)
5. Altrimenti (p2 n) si torna la punto 2.
Ingresso: Un numero n N;
Uscita: La sua scomposizione in fattori primi.
Come esempio, si consideri n = 317. I numeri primi
con cui provare la divisibilità sono 2, 3, 5, 7, 11, 13,
1. si pone m := n, p := 2 e si inizializza L come
17, in quanto 192 = 361 > 317. Nessuno di questi
lista vuota;
numeri primi divide 317, e quindi si può concludere
che 317 è un numero primo.
2. se m è divisibile per p allora:
Per un numero composto n ha senso trovare la sua
scomposizione in fattori primi, cioè linsieme dei nu(a) si aggiunge p alla lista L;
meri primi p1 , p2 , . . . , pk tali che n = p1 p2 pk .
(b) si divide m per p e il quoziente diviene il
Naturalmente, anche un numero primo p ha una
nuovo valore di m;
scomposizione che si riduce al solo fattore p. Convenzionalmente, la scomposizione di un numero si
(c) se m = 1 allora lalgoritmo è terminato; L
scrive n = pk11 pk22 . . . pkuu dove p1 , p2 , . . . pu sono nucontiene la lista ordinata dei fattori primi
meri primi distinti; ki si dice la molteplicit`
a di pi .
di n;
Unosservazione importante è il seguente:
(d) altrimenti (m 6= 1) si riprende il ciclo dal
punto 2.
Teorema 2.11 Se n N è un numero naturale qualsiasi, allora la sua scomposizione in fattori primi è
3. altrimenti, cioè se m non è divisibile per p:
unica, a parte lordine con cui i vari fattori sono
considerati.
(a) si considera il numero primo successivo a
Prova: Supponiamo che n abbia due scomposizioni
p;
pk11 pk22 . . . pkuu e q1h1 q2h2 . . . qshs . Alcuni fattori possono
(b) si chiama ancora p tale numero primo;
essere uguali, per cui dividiamo entrambe le scompo(c) se p2 > n allora lalgoritmo è finito: si agsizioni per tali fattori. Si ottengono cos` due scompo
giunge m alla lista L che viene a contenere
sizioni di un numero n che non hanno fattori comuni.
lelenco ordinato dei fattori primi di n;
Vogliamo dimostrare che n = 1. Se cos` non è, sia
p un fattore della prima scomposizione, per cui si ha
(d) altrimenti (p2 n) si riprende dal punto 2.
n = p t. Daltra parte p non può dividere nessuno
dei q dellaltra scomposizione, che sono tutti primi,
Il passo 3a non è particolarmente semplice, poiper cui si deve avere n = p t + r, con 0 < r < p. che richiede di sapere già quali sono i numeri primi;
Uguagliando le due espressioni si ha p t = p t + r, per questo si sostituisce in pratica con listruzione:
cioè p (t t ) = r. Ora, se t = t si ricava r = 0
(a) si pone p := p + 2; cioè si considerano tutti i
contro lipotesi su r; se viceversa t > t (in quanto numeri dispari; ciò rallenta un po lesecuzione, ma
non ha senso che sia t < t ), allora abbiamo che p è non lede la correttezza dellalgoritmo. Si osservi inolun fattore di r, contro lipotesi che r sia minore di p. tre che il punto 3c. prende in considerazione anche
Quindi lipotesi delle due scomposizioni è assurda, a leventualità che n possa essere un numero primo.
meno che non sia n = 1, ma questo, di fatto, significa
Nella lista L il numero primo p compare k volte, se
che le due scomposizioni di n erano uguali.
k è la molteplicità di p in n. Ad esempio, il numero
Vale la pena di scrivere esplicitamente il seguente
fatto:
Corollario 2.12 Se p è un numero primo che divide
il prodotto m n, allora p deve dividere m o n.
Prova: Se p divide m n, deve comparire nella sua
scomposizione in fattori primi. Se non compare ne
in quella di n, nè in quella di m, per lunicità della
scomposizione, non può comparire nemmeno nel loro
prodotto.
792 dà luogo alla seguente computazione:

792
396
198
99
33
11
1
2
2
2
3
3
11
Si scrive 792 = 23 32 11; il fattore 2 ha molteplicità

Poiche un certo numero primo p può divide- 3, il fattore 3 ha molteplicità 2 e il fattore 11 ha
re n pi`
u di una volta, lalgoritmo di ricerca del- molteplicità 1.
57
2.6. NUMERI PRIMI

Nota 2.4
Se n persone si volessero scambiare tra

loro messaggi mantenendone la privatezza, è facile vedere che occorrerebbero n(n1)/2 chiavi di ciframento
diverse, una per ogni coppia di utenti. Cos`, un milione di persone richiederebbero 500 miliardi di chiavi
distinte. Pi`
u ragionevole è il metodo seguente: ogni
persona ha una chiave pubblica di ciframento P , nota
a tutti, e una chiave di deciframento segreta S, nota
a lui solo. Se qualcuno gli deve spedire un messaggio M , lo codifica con la chiave pubblica ottenendo
un messaggio cifrato P (M ), ed è questo che spedisce.
Chiunque lo intercetti, non conoscendo la chiave di deciframento S non lo potr`
a leggere in chiaro; solo chi lo
deve ricevere, applicando a P (M ) la chiave S otterr`
a
S(P (M )) = M . Questo metodo richiede solamente
due milioni di chiavi (un milione di P e un milione di
S) per il nostro milione di persone, e questo è un bel
risparmio.
Per trovare praticamente le chiavi, si fissano due numeri primi x ed y piuttosto grandi, diciamo con 100
cifre decimali; fortunatamente, esistono metodi abbastanza veloci per determinare se un numero è primo o
composto senza dover fare tutte le prove di divisibilit`
a.
Si pone poi m = xy di modo che (m) = (x1)(y1);
si osservi che m è un numero di 200 cifre decimali. I
due fattori x ed y sono tenuti segreti, mentre m è
reso pubblico. I metodi conosciuti per trovare la decomposizione in fattori primi di m sono riconducibili
tutti al metodo esaustivo di cercare sistematicamente
i divisori mediante il precedente algoritmo; questo metodo, applicato a un numero grande come m richiede
qualche centinaio di anni di lavoro del pi`
u potente calcolatore attuale. Ci`
o d`
a la sicurezza che, in pratica, la
scomposizione m = xy non verr`
a mai trovata, poiche
non cè alcuna certezza nel cercarla. A questo punto si
procede cos`: se un utente U chiede di poter usufruire
del servizio (ad esempio su Internet), il sistema o lente
preposto a queste cose estrae a caso un numero primo
p, diverso da x ed y e dai numeri gi`
a assegnati. Anche
p è un numero di circa 100 cifre decimali, cos` che se ne
possano trovare in abbondanza. Viene poi determinato un numero s (non necessariamente primo) tale che
ps 1 (mod (m)), cioè ps = k(m) + 1 per qualche numero intero k. Il numero p viene reso pubblico
e inserito nellelenco delle chiavi pubbliche associato
al nome dellutente U ; il numero s viene comunicato
ad U e costituisce la sua chiave segreta.
Quando un utente V vuole spedire ad U un messaggio
M , cerca nellelenco (una specie di elenco telefonico elettronico delle chiavi pubbliche) il numero
p corrispondente ad U . Trasforma il messaggio M
in una sequenza di numeri di 200 cifre ciascuno
M1 , M2 , . . . , Mr ; applica ad ogni numero la chiave
pubblica ottenendo M1p , M2p , . . . , Mrp e spedisce il
messaggio cos` codificato (ogni numero Mi deve
essere un numero minore di m e viene trasformato in
un altro numero minore di m). Il ricevente U applica
la chiave s a ciascuno dei numeri ricevuti, ottenendo
(M1p )s = M1 , (M2p )s = M2 , . . . , (Mrp )s = Mr , per
quanto detto. Ma questa è la sequenza di partenza
che, letta in lettere invece che in cifre, è il messaggio

in chiaro che doveva ricevere. Questo è quanto e, se U
non rivela il suo numero s, il metodo è praticamente al
sicuro da ogni tentativo di rottura. Naturalmente,
i conti da eseguire richiedono luso di un calcolatore, ma tutto questo è, in realt`
a, fatto per il calcolatore!
I numeri primi sono molti allinizio, ma vanno poi

diradandosi poiche cresce la probabilità di trovare divisori. Tuttavia, è facile vedere che esistono numeri
primi grandi quanto si vuole. Si ha infatti il seguente
risultato:
Teorema 2.13 (di Euclide) Esistono infiniti numeri primi.
Prova: Supponiamo per assurdo che il numero dei
numeri primi sia finito e che quindi esistano solo k
numeri primi p1 , p2 , . . . , pk . Si consideri il numero
n = p1 p2 pk + 1. Questo numero n non
può essere divisibile ne per p1 , ne per p2 , . . . , ne per
pk , poiche la corrispondente divisione darà sempre
1 come resto. Allora n è un numero primo, contro
lipotesi che p1 , p2 , . . . , pk fossero tutti e soli i numeri
primi.
Nota 2.5
La precedente dimostrazione, che i numeri primi sono infiniti, è considerata una delle pi`
u
belle della Matematica (figuriamoci le altre, si potrebbe dire!), classificandosi al terzo posto nel sondaggio promosso dal Mathematical Intelligencer nel
1988. In generale i numeri primi sono uno degli argomenti pi`
u interessanti (e misteriosi) della Matematica,
tanto da affascinare moltitudini di ricercatori professionisti e dilettanti. Sono state compilate tavole di
numeri primi e, con i moderni calcolatori, ci si è divertiti a scoprire numeri primi sempre pi`
u grandi; attualmente, a quanto mi risulta, il record è costituito
.
.
da 213 466 917 1, un numero composto da 4. 053. 946
cifre decimali, ma le cose cambiano da un momento allaltro. Non esistono formule che permettano di
trovare tutti e soli i numeri primi; curiosamente, gi`
a
Eulero aveva scoperto espressioni che producono molti
numeri primi; ad esempio, n2 + n + 41 genera numeri
primi per n = 0, 1, 2, . . . , 39, come il lettore curioso e
interessato pu`
o verificare, ad esempio utilizzando un
semplice programma su un elaboratore.
I numeri primi sono una fonte inesauribile di misteri
matematici, cioè di proposizioni che, per quanto ne
sappiamo, sono vere, ma che nessuno è mai stato in
grado di dimostrare. La congettura pi`
u famosa è quasi
certamente quella di Goldbach: ogni numero pari è la
somma di due primi. Ad esempio, 100 = 11+89, e con
il calcolatore si è riusciti a verificare questa congettura fino a numeri grandissimi; non esistono tuttavia
dimostrazioni che essa sia vera in generale. Goldbach era un matematico russo che verso il 1750 scrisse
ad Eulero proponendogli la sua congettura e invitandolo a darne una dimostrazione; ma questa fu una
58
delle poche cose che Eulero non riusc` a fare. Oggi,
la congettura di Goldbach è diventata nota al grande pubblico grazie al libro di Apostolos Doxiadis Lo
zio Petros e la Congettura di Goldbach, un libro interessante sia per gli agganci alla Matematica, sia, e
soprattutto, per la ricerca psicologica sui personaggi
dello zio e del nipote.
Unaltra famosa congettura è legata ai cosiddetti primi gemelli: esistono coppie di numeri primi separati
soltanto da due unit`
a, o, se si preferisce, costituite da
due dispari contigui. Esempi semplici sono 3 e 5, 5 e
7, 11 e 13, 17 e 19, e cos` via. I numeri di ciascuna
coppia si dicono appunto gemelli e, pur rarefacendosi,
se ne continuano a trovare man mano che si considerano numeri sempre pi`
u grandi. Prima del miliardo ne
esistono 3. 424. 506, cos` che è stata proposta la congettura che di primi gemelli ne esistano infiniti. Anche questa congettura è rimasta tale,perche nessuno
ne ha mai dato una dimostrazione, nonostante che i
matematici si siano accaniti a cercarne una prova.
Come sè detto, man mano che si va avanti con numeri sempre pi`
u grandi, i numeri primi diminuiscono
di frequenza. Ad esempio, il numero di numeri primi
compresi tra 1 ed un milione, calcolati di centomila in
centomila è:
0
9592
1
8392
2
8013
3
7863
4
7678
5
7560
6
7445
7
7408
8
7323
9
7224
Una domanda che viene abbastanza naturale (almeno ai matematici) è quella relativa alla frequenza dei
numeri primi. La precedente tabella è abbastanza significativa, ma possiamo dire qualcosa di pi`
u quantitativo? Tecnicamente, si parla della densit`
a dei numeri
primi e, per essere pi`
u precisi, consideriamo un numero n N qualsiasi e chiediamoci: quanti sono i numeri
primi che precedono n? Questa quantit`
a si indica con
la notazione (n), cioè : N N è la funzione che ad
ogni n N associa il numero di numeri primi minori
o uguali ad n. Per n piccolo, il calcolo è facile e si
vede subito che (10) = 4 e (20) = 8; gi`
a trovare che
(100) vale 25 richiede un bel po di lavoro, a meno
di non avere a disposizione un elenco di numeri primi.
Dalla tabellina precedente si ha (100. 000) = 9592 e,
facendo le somme, (1. 000. 000) = 78. 498. Purtroppo,
come abbiamo detto, i numeri primi non sembrano godere di alcun senso della regolarit`
a e il calcolo di (n)
si basa sul banale conteggio di un primo dopo laltro.
Nonostante questo, i matematici non si sono arresi e
gi`
a alla fine del 1700 Gauss (sembra allet`
a di 14 anni)
ipotizz`
o la formula:
(n)
n
.
ln n
Ci volle un secolo prima che, nel 1896, due altri matematici, de la Vallee Poussin e Hadamard riuscissero a
dimostrare questa formula, indipendentemente luno
dallaltro.
Si tratta di una formula asintotica, cioè di una

formula che, quando n è piccolo, pu`
o non essere
molto buona, ma lerrore relativo (v. Sezione 3.7)
fra il valore vero e quello approssimato va calando
al crescere di n. Ad esempio, la formula precedente
d`
a per n = 100. 000 il valore 8686, con un errore di
oltre il 10% sul valore vero. Ma per n = 1. 000. 000
si ottiene 72. 382 e lerrore si è gi`
a ridotto all8.4%.
E questi, naturalmente, di fronte allinfinito, sono
numeri ancora molto piccini! Si veda la Sezione 8.8
per qualche specifica ulteriore.
2.7
Massimo comun divisore
Per definizione, un numero primo p ha due soli divisori: 1 e p stesso. In generale, è facile calcolare il
numero di divisori di un numero n N quando se ne
conosca la scomposizione in fattori primi:
Teorema 2.14 Se n N ha scomposizione in fattori
primi n = pr11 pr22 prkk , con p1 , p2 , . . . , pk
numeri primi distinti, allora il numero dei divisori di
n è:
(r1 + 1)(r2 + 1) (rk + 1).
Prova: Un divisore m di n deve avere gli stessi
divisori primi di n; quindi, relativamente al fattore
primo p1 , dovrà avere un fattore p01 (cioè, in effetti,
m non sarà divisibile per p1 ), oppure un fattore p11 ,
oppure p21 , . . . , oppure pr11 , per un totale di r1 + 1
possibilità. La stessa cosa vale per p2 , . . . , pk , e da
questo segue la formula data.
Ad esempio, il numero 792 = 23 32 11 avrà
(3 + 1)(2 + 1)(1 + 1) = 24 divisori. Esplicitamente,
essi sono:
{1, 2, 3, 4, 6, 8, 9, 11, 12, 18, 22, 24, 33, 36, 44,
66, 72, 88, 99, 132, 198, 264, 396, 792}.
Il teorema può essere seguito meglio con un caso pi`
u
semplice come n = 12 = 22 3, che deve avere (2 +
1)(1 + 1) = 6 divisori. I fattori con 2 e con 3 sono:
{1 = 20 , 2 = 21 , 4 = 22 } e {1 = 30 , 3 = 31 } e danno
le sei possibilità:
11=1 13=3 21=2
2 3 = 6 4 1 = 4 4 3 = 12.
Nota 2.6
I Pitagorici furono molto interessati

al concetto di divisibilit`
a. Definirono perfetto un
numero che fosse la somma di tutti i suoi divisori, eccetto ovviamente se stesso. Lesempio pi`
u semplice è
6 = 1+2+3, ma perfetto è anche 28 = 1+2+4+7+14
e quindi seguono 496 = 24 31, 8128 = 26 127 e
33550336 = 212 8191; non si sa se i numeri perfetti
siano infiniti. Un concetto analogamente sviluppato
59
2.7. MASSIMO COMUN DIVISORE

dai Pitagorici fu quello di numeri amicabili. Consideriamo tutti i divisori di 220 = 22 5 11; come
sè visto essi sono 12 e cioè 1, 2, 4, 5, 10, 11, 20, 22,
44, 55, 110, 220. Se sommiamo tutti questi numeri
eccetto il 220, troviamo 284. Procedendo nello stesso
modo per questo numero 284 = 22 71, troviamo
5 divisori propri: 1, 2, 4, 71, 142 e la loro somma
è 220. Abbiamo ritrovato il numero di partenza e
per questo 220 e 284 si dicono amicabili, ognuno
essendo la somma dei divisori propri dellaltro. I
Pitagorici probabilmente conoscevano questa sola
coppia, che è la pi`
u piccola possibile. I matematici
arabi al-Fars e al-Banna scoprirono le coppie 17296
18416 e 9. 363. 584 9. 437. 056, che pi`
u tardi furono
riscoperte da Cartesio e da Fermat. Nel 1700, Eulero
scopr` una trentina di nuove coppie, me nel 1866 un
ragazzo italiano di 16 anni, un certo B. N. I. Paganini
(nessuna parentela col violinista) trov`
o la coppia
(1184, 1210), la pi`
u piccola dopo (220, 284), ma che
era sfuggita a tutti, perfino a Eulero. Oggi, con
laiuto dei calcolatori elettronici, se ne conoscono una
quantit`
a enorme, tutte formate da due numeri pari o
da due numeri dispari. Nessuno sa se esistono coppie
di numeri amicabili formate da un numero pari e uno
dispari.
Prendiamo ora due numeri n, m

consideriamo i loro divisori:
N e
Questo metodo dà MCD(12, 30) = MCD(22 3, 2

35) = 23 = 6 e MCD(792, 220) = MCD(23 32
11, 22 5 11) = 22 11 = 44. Sicuramente questo
metodo è molto pi`
u efficiente dellapplicazione diretta
della definizione, che richiede la costruzione delle liste
di tutti i divisori di m ed n. Tuttavia, la necessità
di eseguire la scomposizione in fattori primi, rende il
teorema di non facile applicazione quando i numeri
coinvolti sono piuttosto grandi. Allora, fin dallantichità, è stato proposto un algoritmo che rende estremamente facile il calcolo del massimo comun divisore
anche di numeri grandi. Cominciamo con losservare
una semplice conseguenza del teorema precedente:
Corollario 2.16 Dati due numeri m, n N, se n è
un divisore di m (in particolare, se n = m), allora
MCD(m, n) = n.
Lalgoritmo si basa sul fatto che MCD(m, n) =
MCD(m n, n) se m > n. Infatti, se s è il massimo
comun divisore cercato, si ha m = s k e n = s h;
quindi m n = s (k h), cioè s divide m n.
Se m n è ancora maggiore di n, continuando si ha
MCD(m, n) = MCD(m 2 n, n), e cos` via fino a
MCD(m d n, n) quando sia m d n < n. Ma
questo significa che d è il quoziente della divisione di
m per n e m d n è semplicemente il resto della
stessa divisione. Ecco allora il celebre:
Definizione 2.6 Si dice Massimo Comun Divisore

di m ed n, e si indica con MCD(m, n), o anche Algoritmo 2.10 (Algoritmo di Euclide)
semplicemente con (m, n), il pi`
u grande dei divisori Ingresso: due numeri m, n N;
comuni ad m ed n.
Uscita: il MCD(m, n).
Si osservi che, nel peggiore dei casi, m ed n hanno
almeno il fattore comune 1. Ad esempio, abbiamo
MCD(12, 30) = 6; infatti, 30 = 2 3 5 ha 8 divisori
che sono (1, 2, 3, 5, 6, 10, 15, 30); confrontandoli con i
divisori di 12 dati sopra, si trova che il divisore comune pi`
u grande è proprio 6. Il seguente teorema dà
un modo abbastanza pratico per calcolare il massimo
comun divisore di due numeri:
1. Se m = n lalgoritmo termina e il massimo

comun divisore è n;
2. Se m < n, si scambiano tra di loro m ed n (cos`
dora in avanti possiamo supporre che sia m >
n);
Teorema 2.15 Dati due numeri m, n N, il

MCD(m, n) si trova considerando il prodotto dei divisori primi comuni ad m ed n, presi col minimo esponente che compare nelle due scomposizioni in fattori
primi.
3. Sia r il resto della divisione di m per n;
Prova: Sia s = MCD(m, n); i fattori primi di s devono ovviamente essere a comune tra m ed n. Inoltre, se
p è un fattore primo comune, e k è lesponente minore
con cui p compare nella scomposizione di m ed n, pk
deve dividere s. Infatti, un esponente pi`
u piccolo di
k non darebbe il valore massimo di s e un esponente
pi`
u grande di k farebbe s` che s non dividerebbe pi`
u
quello fra m ed n corrispondente allesponente pi`
u
piccolo per p.
5. Altrimenti (0 < r < n), si cambiano i nomi:

n diviene il nuovo m, r diviene il nuovo n e si
torna al punto 3.
4. Se r = 0, allora n è un divisore di m e per il corollario precedente lalgoritmo termina col valore

del MCD in n;
Si noti che lalgoritmo termina sempre: siccome m

ed n vanno continuamente a diminuire pur rimanendo
positivi, nel peggiore dei casi arriveremo ad avere n =
1; al passaggio successivo il resto della divisione di m
per 1 sarà senzaltro 0 e lalgoritmo finirà. La ricerca
60
di MCD(792, 220) si imposta cos`:

792
220
132
88
= 3 220
= 1 132
= 1 88
= 2 44.
+
+
+
132
88
44
Nota 2.7
Il pi`
u delle volte, lalgoritmo di Euclide
è ignorato dalla Scuola Media, e per trovare il MCD
gli si preferisce il Teorema 2.15. Per i numeri piccoli,
quando la scomposizione in fattori primi si pu`
o fare
pi`
u o meno ad occhio, tale metodo è pi`
u semplice,
anche perche la maggior parte dei nostri studenti ha
difficolt`
a a fare le divisioni con pi`
u di una cifra, richieste dallalgoritmo di Euclide. Purtroppo, quando
i numeri crescono, la scomposizione in fattori primi
diviene unoperazione molto complessa, e non si conoscono modi per accelerare la ricerca esaustiva di un
fattore dopo laltro, ricerca che richiede un numero di
prove molto elevato (e tali prove, ohimè, sono divisioni
a pi`
u cifre!). In effetti, dato il numero n, la ricerca del
primo fattore, se non è piccolo, richiede n/2 divisioni (Algoritmo 2.9), che per n nellordine di 10 miliardi
è gi`
a circa 50. 000.
Per vedere cosa succede con lalgoritmo di Euclide,
e fare un confronto, possiamo chiederci quali numeri innescano il processo pi`
u laborioso per trovare il
MCD. Nellesempio di MCD(792, 220), la prima divisione, che ha dato quoziente 3, ha ridotto drasticamente le dimensioni dei numeri coi quali continuare
lalgoritmo, che sono diventati 220 e 132. Pi`
u alto è
il quoziente, pi`
u netta è la riduzione; quindi, il quoziente 1 d`
a la minima riduzione dei numeri. Ma avere
quoziente 1 per due numeri m, n (m > n) significa
m = 1 n + r, cioè m = n + r. In altre parole, il pi`
u
grande dei due numeri è la somma dellaltro (che lo
sostituer`
a al passo successivo) e del resto, che sostituer`
a n. Questa stessa propriet`
a dovr`
a verificarsi al
passo successivo, cioè dovremo avere n = r + s, e cos`
via, fino a che non ci saremo ridotti ad 1.
Si definisce sequenza di Fibonacci una sequenza di numeri F0 , F1 , F2 , F3 , . . . tale che F0 = 0, F1 = 1 e ogni
altro numero è dato dalla somma dei due precedenti,
cioè Fn = Fn1 + Fn2 . Gli Fk si dicono numeri di
Fibonacci e i primi dieci sono:
n
Fn
0
0
1
1
2
1
3
2
4
3
5
5
6
8
7
13
8
21
9
34
Il lettore pu`
o calcolare i valori successivi, cominciando
con F10 = 55. Per verificare quanto detto, basta ora
prendere due numeri consecutivi di questa sequenza e
cercare il loro MCD; ad esempio, per 55 e 34 si ha:
55
34
21
13
8
5
3
2
=
=
=
=
=
=
=
=
1 34
1 21
1 13
18
15
13
12
2 1.
+
+
+
+
+
+
+
21
13
8
5
3
2
1
Si osservi che sullultimo quoziente non si pu`

o migliorare e che, per costruzione, due numeri di Fibonacci
consecutivi sono primi tra loro. Per rendersi conto che
queste 8 divisioni costituiscono davvero un massimo,
si provi a calcolare MCD(55, 33) e MCD(55, 35) con
lo stesso algoritmo. Ad ogni modo, questo prova che
dati due numeri m, n (m > n) e trovato quellFk tale
che Fk > m, la ricerca del MCD(m, n) col metodo di
Euclide richieder`
a meno di k divisioni (in effetti, meno
di k 1).
I numeri di Fibonacci sembrano crescere in modo abbastanza contenuto; ma questa è solo lapparenza dei
primi termini della sequenza. In realt`
a essi crescono
molto rapidamente ed F50 = 12. 586. 269. 025, come si
pu`
o trovare facilmente con un calcolatore o applicando
la formula (che dimostreremo pi`
u avanti nella Sezione
4.3):
k !
k
1
1 5
1+ 5
Fk =
;
2
2
5
per quanto incredibile, questa formula produce
numeri interi! In conclusione, tutto questo significa
che, per trovare il MCD di due numeri dellordine
di 10 miliardi, lalgoritmo di Euclide richiede al pi`
u
50 divisioni, gi`
a un bel po di meno della semplice
ricerca del primo divisore di uno dei due numeri!
Una importante definizione è la seguente:

Teorema 2.17 Due numeri n, m N hanno
MCD(m, n) = 1 se e solo se sono primi tra loro.
Prova: Per definizione di Massimo Comun Divisore,
MCD(m, n) = 1 significa che i due numeri non hanno
divisori comuni diversi dallunità, cioè sono primi tra
loro.
Le proprietà formali del massimo comun divisore,
visto come operazione tra numeri naturali, sono le
seguenti:
commutativa
associativa
idempotenza
identità
zero
MCD(m, n) = MCD(n, m)
MCD(m, MCD(n, p)) =
= MCD(MCD(m, n), p)
MCD(n, n) = n
MCD(n, 0) = n
MCD(n, 1) = 1
Assieme al massimo comun divisore, si è soliti considerare anche il minimo comune multiplo di due numeri m, n N, definito come il pi`
u piccolo dei multipli comuni ad m ed n, e si indica con la notazione
mcm(m, n). In analogia a quanto fatto per il massimo
comun divisore, si dimostra che:
Teorema 2.18 Il minimo comune multiplo di due
numeri m, n N si trova considerando, nella scomposizione di m ed n in fattori primi, il prodotto
61
2.8. LE ALTRE OPERAZIONI
dei fattori primi comuni e non comuni, presi con questa notazione si scrive: max{x N | P (x)} per inil maggiore degli esponenti che compaiono nelle due dicare il massimo numero naturale per cui vale la proscomposizioni.
prietà P (x). Analoga notazione si usa per il minimo,
ed à facile vedere come esempio che 15 = min{x
La dimostrazione è analoga a quella vista per il N | x2 > 200}.
massimo comun divisore e la lasciamo perciò al letQueste operazioni ci permettono di osservare che,
tore. Dal teorema segue la seguente proprietà, an- da un punto di vista logico, le uniche operazioni che
chessa usata spesso per il calcolo del minimo comune sarebbe necessario introdurre sono il confronto e ladmultiplo:
dizione, tutte le altre essendo definibili in termini di
queste. Abbiamo appena visto come min e max siano
mn
mcm(m, n) =
.
dipendenti dal solo confronto; per le altre operazioni
MCD(m, n)
abbiamo:
Anche le proprietà formali del minimo comune multinm
= max{x N | m + x n}
plo sono simili a quelle del massimo comun divisore:
nm
= min{x N | m + x n}
proprietà commutativa, associativa e di idempotenza.
nm
= m + m + + m (n volte)
Si ha invece:
n/m
= max{x N | m x n}
mcm(n, 0) = 0
mcm(n, 1) = n.
Infine, vogliamo osservare che per le operazioni di

MCD e mcm valgono le proprietà distributiva e di assorbimento, che lasciamo alla delizia del lettore, sia
per la formulazione, sia per una eventuale dimostrazione. Confrontando queste proprietà con quelle viste per gli insiemi (Sezione 1.1) e quelle che vedremo
(Sezione 4.6) per il calcolo delle proposizioni, non si
può non essere colpiti dalla fortissima analogia. Siamo infatti di fronte ad esempi diversi di una struttura algebrica particolare, nota come Algebra Booleana. Ritorneremo su questi fatti pi`
u avanti, quando
parleremo un po di Algebra Astratta (Sezione 5.8.
2.8
Le altre operazioni
Le quattro operazioni fondamentali sono la base del

calcolo e, come vedremo, non solo del calcolo dei numeri naturali, ma di tutti gli insiemi numerici che
man mano introdurremo. Tuttavia, esse non costituiscono, assieme al confronto, la totalità delle operazioni e, anzi, molte altre possono essere definite a partire
da quelle; in questa sezione introdurremo le principali
operazioni che si incontrano nella pratica. Prima di
tutto, basate sul confronto, ci sono le operazioni di
minimo e di massimo:
a se a b
min(a, b) =
b altrimenti
max(a, b) =
a se a b
b altrimenti.
n mod m
= n (n/m) m.
Si osservi che con queste definizioni 3 5 non è definito mentre 35 = 0. Questultima operazione si usa
quando è necessario far s` che la sottrazione sia unoperazione su N, nel senso della Sezione 1.3, e quindi
sia definita per ogni possibile valore di m ed n.
Unaltra operazione che si basa sul principio di abbreviare literazione di unoperazione elementare è
lelevamento a potenza. Con la notazione nm si indica il prodotto di n per se stesso per m volte, cioè:
nm = nn n per m volte. Con questo si suppone m 2, ma, come per la moltiplicazione, possiamo
estendere la definizione ad m = 0 ed m = 1. Ricordando che nellespressione nm il numero n si dice la
base e il numero m si dice lesponente, si ha:
0
n
= 1
nm+1 = n nm m 0.
Ad esempio, per n = 5 si ha: 50 = 1, 51 = 50 5 =
1 5 = 5, 52 = 51 5 = 5 5 = 25, e via di seguito. Questo fa vedere la convenienza di avere n0 = 1.
Questa regola vale anche per n = 0, cioè si ha: 00 = 1,
01 = 0 00 = 0 1 = 0, e cos` di seguito. Il fatto che
sia 00 = 1 è alquanto controintuitivo, ma è in accordo con altre definizioni e con argomenti dellAnalisi
Matematica, in cui si dimostra che limx0 xx = 1,
come lo studente vedrà nei corsi universitari. Per il
resto, dalla definizione discendono alcune importanti
(e ben note) proprietà delle potenze:
Teorema 2.19 Se n, m, p N, si hanno le seguenti
identit`
a:
a) nm+p = nm np
c) (nm )p = nmp
b) nmp = nm /np (m p)
d) np mp = (n m)p .
E ovvio osservare, ed è altrettanto semplice dimostrare, che valgono le proprietà della Tabella 2.5. La
proprietà associativa permette di scrivere min(a, b, c) Prova: Si consideri nm np = (n n n)
e max(a, b, c) al posto di una delle pi`
u complicate (n n n), dove il fattore n è ripetuto m volte
espressioni date nella tabella. Come estensione di entro le prime parentesi e p volte entro le seconde.
62
commutativa
associativa
distributiva
assorbimento
idempotenza
identità
zero
min(a, b) = min(b, a)
min(min(a, b), c) = min(a, min(b, c))
min(a, max(b, c)) = max(min(a, b), min(a, c))
min(a, max(a, b)) = a
min(a, a) = a
max(a, b) = max(b, a)
max(max(a, b), c) = max(a, max(b, c))
max(a, min(b, c)) = min(max(a, b), max(a, c))
max(a, min(a, b)) = a
max(a, a) = a
max(a, 0) = a
min(a, 0) = 0
Tabella 2.5: Proprietà del minimo e del massimo
Per la proprietà associativa del prodotto le parentesi

possono esser tolte e quindi il fattore n è ripetuto
m + p volte. La dimostrazione delle altre proprietà si
effettua in modo del tutto analogo e, per lultima, si
fa uso anche della proprietà commutativa per riunire
(o separare) i fattori n ed m.
famoso laneddoto che si racconta sul mitico inventore del gioco degli scacchi. Al re che gli chiedeva
cosa volesse come ricompensa per la sua invenzione,
chiese tanto grano quanto se ne poteva ottenere associando un chicco alla prima casella della scacchiera,
due chicchi alla seconda, quattro alla terza, otto alla
quarta, e cos` via, raddoppiando ogni volta il numeE un utile esercizio quello di provare ad esprimere,
ro di chicchi. Lingenuo sovrano acconsent`, senza
con proprie parole per evitare la citazione di formule,
rendersi conto che il numero totale di chicchi sareble quattro proprietà di questo teorema.
be stato 1 + 2 + + 262 + 263 1.84 1019 ben
Nonostante il fatto che, per definizione, una potendi pi`
u di quanto grano sia mai stato prodotto sulza sia labbreviazione di una sequenza di moltiplicala terra. Probabilmente, linventore degli scacchi fu
zioni, non esiste un algoritmo specifico per il calcodecapitato per aver voluto fare troppo il furbo.
lo delle potenze, come invece abbiamo visto per la
E bene dare la seguente:
moltiplicazione, che ha un proprio algoritmo, pressoche indipendente da quello delladdizione, di cui Definizione 2.7 Un numero naturale p N si dice
è pure unabbreviazione. Per potenze con esponen- una potenza m-esima perfetta se esiste un numero
te piccolo, diciamo 2 o 3, il metodo di calcolo pi`
u naturale n tale che p = nm . In tal caso, si dice anche
conveniente è lesecuzione delle relative moltiplica- che n è la radice m-esima perfetta di p e che m è il
zioni; cos` 53 = 5 5 5 = 25 5 = 125. Per logaritmo in base n di p, e si scrive rispettivamente
esponenti pi`
u grandi si può adottare il metodo dei n = m
p ed m = logn p.
contadini russi, analogo a quello visto per la moltiplicazione (vedere anche la Nota 2.3). Ad esempio, In generale, le potenze con esponente 2 si dicono meper calcolare 54 conviene calcolare 52 = 25 e quindi glio quadrati e le potenze con esponente 3 si dicono
54 = (52 )2 = 252 = 625; e cos` si procede per espo- cubi; ad esempio, 0, 1, 4, 9, 16, 25 sono quadrati pernenti che siano potenze di 2. Pi`
u in generale, per cal- fetti, mentre 0, 1, 8, 27, 64 sono cubi perfetti. Ana13
colare 5 si osserva che 13 può essere espresso come logamente, le radici seconde si dicono radici quadrate
radici terze radici cubiche. Essendo 64 = 43 , si
somma di potenze di 2: 13 = 8 + 4 + 1 e quindi 513 = e le
3
ha 64 = 4 e log4 64 = 3; cos`, da 81 = 34 si deduce
58+4+1 = 58 54 51 . Procedendo come visto prima,
4
81 = 3 e log3 81 = 4. Le radici e i logaritmi sono le
abbiamo 52 = 25, 54 = 625, 58 = 6252 = 390. 625.
13
.
.
.
.
operazioni
inverse delle potenze; per definizione, se n
Quindi 5 = 390 625 625 5 = 1 220 703 125. In
`
e
una
potenza
p-esima perfetta, cioè n = mp ; allora
altri termini, come per la moltiplicazione, disposti ac
p
log n
p
canto base ed esponente, si eseguono successivamen- si ha ( n) = n e m m = n.
Le principali proprietà delle radici e dei logaritte i quadrati a partire dalla prima, e si calcolano le
mi
derivano da quelle delle potenze e descritte nel
metà a partire dal secondo. Si fa poi il prodotto dei
Teorema
2.19. Per le radici p-esime abbiamo:
quadrati corrispondenti alle metà di valore dispari:
Teorema 2.20 Se m ed n sono potenze perfette

5 13
opportune, si ha:
25
6
q
625
3
p
p
p
p
q
.
m
n
=
m
n
n = pq n.
390 625
1
Come ci si accorge facilmente, le potenze crescono ra- Prova: La prima proprietà deriva dalla d) del Teopidamente al crescere dellesponente. Già con la base rema 2.19, se m ed n sono potenze p-esime perfette;
2, 220 supera il milione e 230 supera il miliardo. E elevando alla potenza p-esima, il membro sinistro dà
63
2.8. LE ALTRE OPERAZIONI
mn e il membro destro dà ( p m)p ( p n)p = mn.

La seconda proprietà, in modo analogo, si deduce
dalla c) dello stesso Teorema 2.19.
Per i logaritmi si ottiene:
Teorema 2.21 Se i numeri naturali a, b sono potenze perfette della stessa base n, diciamo a = nm e
b = np , allora logn a b = logn a + logn b.
Prova: Per la proprietà a) del Teorema 2.19, si ha:
logn (a b) = logn (nm np ) =
= logn nm+p = m + p = logn a + logn b
come si desiderava.
Anche se hanno senso solo per le potenze perfette,
si possono dare definizioni opportune di radici e di
logaritmi per tutti i numeri naturali. Dato un numero
naturale p N, si dicono radici m-esime di p per
difetto e per eccesso le quantità:
m p = max{x N | xm p}
m p = min{x N | xm p}
Analogamente, si dicono logaritmi in base n di p per
difetto e per eccesso:
logn p =
logn p =
max{x N | nx p}
min{x N | nx p}
Se p è una potenza m-esima perfetta, le due approssimazioni coincidono con la radice m-esima e col logaritmo in base n. Anticipando cose che dovremmo dire
pi`
u avanti, dato un numero reale r qualsiasi, con la
notazione r si indica il massimo numero intero che
sia minore o uguale ad r, e con la notazione r si indica il minimo numero intero maggiore o uguale ad r.
Queste operazioni hanno, in inglese, nomi fantasiosi
che, tradotti in italiano, suonano a dir poco inusitati;
la prima si dice pavimento di r (in inglese, floor of
r) e la seconda soffitto di r (in inglese, ceiling of
r).
Unultima operazione di abbreviazione è il fattoriale: si dice fattoriale del numero n N il prodotto di tutti i naturali da 1 fino ad n. Ad esempio,
4! = 1 2 3 4 = 24. Una definizione ricorsiva
permette di introdurre anche il valore di 0!:
0!
= 1
(n + 1)! = (n + 1) n!
Cos`, 4! = 4 3! = 4 3 2! = 4 3 2 1! =
4 3 2 1 0! = 4 3 2 1 = 24. Come
nel caso di 00 , definire 0! = 1 sembra controintuitivo,
ma in realtà è consistente col resto della definizione
e con altre impostazioni dello stesso concetto, come
ad esempio la funzione Gamma (x). Come vedremo,
loperazione di fattoriale si incontra comunemente nel
calcolo combinatorio e nel calcolo delle probabilità.
Nota 2.8
LAritmetica, cioè la teoria dei numeri

naturali, è la base di tutta la Matematica, che pu`
o
essere costruita a partire dalle propriet`
a dei naturali. Come vedremo concretamente, i numeri interi e
quelli razionali, i numeri reali e quelli complessi sono costruzioni che si fondano sui numeri naturali e le
loro operazioni sono estensione delle analoghe operazioni fra naturali, delle quali mantengono le propriet`
a
principali. Daltra parte, le propriet`
a dei naturali si
basano sulle quattro operazioni elementari e il confronto; la definizione delle altre operazioni parte da
quelle e si basa su due semplici principi: i) sia priva di
ambiguit`
a, e 2) permetta di arrivare al risultato in un
tempo finito. Questo modo di porre le cose pu`
o essere
formalizzato in una teoria, secondo quanto visto nel
primo capitolo.
Questo modo di concepire la Matematica si dice aritmetizzazione e sembra che lidea risalga a Ohm, che
la introdusse in un suo libro del 1832. Verso il 1860
si cominciarono ad avere le prime definizioni formali dei numeri reali (noi ne vedremo una nel prossimo
capitolo) e questo dette un enorme impulso al processo di aritmetizzazione, che si propose di dare una
teoria completa dellAritmetica, dalla quele si potesse partire per aritmetizzare tutta la Matematica. La
pi`
u famosa formulazione della teoria dellAritmetica
è senzaltro quella del matematico torinese Giuseppe
Peano (1858 1932), uno dei grandi logici vissuti a
cavallo tra 800 e 900. Egli introduce tre enti fondamentali: numero, zero e successore che, secondo il concetto moderno di teoria assiomatica, non
sono definiti, ma che sono completamente determinati
dalle propriet`
a specificate negli assiomi. Naturalmente, noi possiamo immaginare che questi tre termini si
riferiscano a ci`
o che comunemente intendiamo per numero, per zero e per successore (di un numero), ma
questo pu`
o aiutare la nostra comprensione, non certo
la costruzione logica che intendiamo affrontare, cioè
lo sviluppo dellAritmetica e di tutta la Matematica.
Ecco comunque i cinque assiomi:
1. zero è un numero;
2. ogni numero ha un successore;
3. zero non è successore di alcun numero;
4. se i successori di due numeri sono uguali, allora
anche i numeri sono uguali;
5. se unaffermazione è vera per zero, e supposta
vera per un numero risulta vera anche per il suo
successore, allora essa è vera per ogni numero.
Questultimo assioma altro non è se non il principio di
induzione, il quale, secondo Peano, è il modo naturale
per dimostrare le propriet`
a dei numeri naturali.
Normalmente, i tre enti si denotano con i simboli
N, 0, , e si introducono le abbreviazioni: 0 = 1, 0 =
1 = 2, 0 = 1 = 2 = 3, e cos` via. La somma si
definisce allora mediante la ricorsione:
n+0
= n
n + m = (n + m)
64
Questo significa che se il secondo argomento è zero, la
somma si riduce al primo argomento; se non è zero,
allora è il successore di qualche numero m, e la somma
è il successore della somma di n ed m. Occorre capire
bene questo punto che sembra definire la somma in
termini di se stessa, cioè mordendosi illegalmente la
coda. In realt`
a, come gi`
a cè capitato di osservare, m è
minore del suo successore e la riduzione del secondo
argomento porta inevitabilmente a ridursi al caso m =
0, che finalmente è trattabile con la prima regola. In
altre parole, il ripiegarsi su se stessa è solo apparente
o provvisorio e la ricorsione a un certo punto termina,
rendendo buona la definizione. Supponiamo di voler
eseguire 3 + 2; poiche 2 non è zero, esso è il successore
di un numero; per definizione è 2 = 1 e quindi si ha:
3 + 2 = 3 + 1 = (3 + 1) . Ancora, 1 non è zero e
perci`
o è il successore di un numero; per definizione
sappiamo 1 = 0 e quindi (3 + 1) = (3 + 0 ) = (3 +
0) . Finalmente, il secondo argomento è zero e di
conseguenza: 3 + 2 = (3 + 0) = 3 = 4 = 5.
Se dovessimo fare cos` per eseguire ogni somma, la
Matematica non avrebbe proceduto oltre questa definizione. Il senso di questa è di farci capire come,
concettualmente, loperazione di successore sia sufficiente per introdurre la somma. Quello che importa è
comprendere la semplificazione logica di questo modo
di procedere.
Il processo non termina con la definizione delloperazione; occorre ora dimostrare che la somma, cos` definita, gode delle propriet`
a commutativa e associativa,
e ammette 0 come identit`
a. Per fare ci`
o risulta essenziale il principio di induzione, che pertanto a buon
diritto è stato inserito tra gli assiomi. Naturalmente,
si va avanti con lo stesso spirito, e la moltiplicazione
è definita ricorsivamente cos`:
n0
= 0
n m = n m + n
dove si sfrutta la somma, ormai acquisita. Non
possiamo sviluppare qui, partendo dagli assiomi di
Peano, tutta lAritmetica, e men che mai tutta la
Matematica; il lettore interessato potr`
a utilmente
approfondire largomento dando altre definizioni
per le varie operazioni conosciute e tentando la
dimostrazione delle loro propriet`
a.
Concludiamo introducendo una speciale notazione

(pi`
u che una nuova operazione). Capita spesso di dover eseguire somme con molti addendi: quando facciamo la spesa al supermercato o quando tiriamo le
somme del bilancio personale alla fine del mese. Se indichiamo con c1 , c2 , . . . , cn il costo dei singoli prodotti
acquistati o con v1 , v2 , . . . , vm le spese effettuate, interessa calcolare le somme c1 + c2 + + cn ovvero
v1 + v2 + + vm . Una comoda notazione è:
n
X
i=1
ci = c1 + c2 + + cn
m
X
i=1
vi = v1 + v2 + + vm .
P
Qui, il simbolo , che è una sigma maiuscola stilizzata, si dice simbolo di somma. La prima somma, ad
esempio, si legge: somma per i che va da 1 ad n dei
ci . In generale avremo:
n
X
i=k
ci = ck + ck+1 + + cn
dove k ed n sono gli estremi della somma ed i è la

variabile di somma che assume i propri valori da k
fino ad n. Si suppone che n k e se k = n la somma
si riduce al solo elemento ck ; si conviene inoltre che
quando k n la somma sia 0. Gli elementi che si
sommano costituiscono un vettore, cioè un insieme di
valori presi in un certo ordine e ciascuno distinto da
un proprio indice. Cos`P
, se v1 = 8, v2 = 7, v3 = 8,
5
v4 = 6, v5 = 7, si ha:
i=1 vi = 36. Si osservi che,
per le proprietà della somma, abbiamo:
n
X
i=m
ci =
p
X
ci +
i=m
n
X
i=m
n
X
ci
se
i=p+1
rci = r
n
X
mp<n
ci ;
i=m
infatti, la prima è la proprietà associativa e la seconda

è la proprietà distributiva. La proprietà commutativa
scambia la posizione dei vari addendi, cioè scombussola il vettore, e pertanto si usa solo in situazioni
particolari.
Capitolo 3
Numeri
. . . chi è abituato a sbrigare le proprie faccende
col regolo calcolatore non pu`
o ormai prendere
sul serio una buona met`
a delle asserzioni umane. Il regolo calcolatore consta di due sistemi di
numeri e di lineette combinati con straordinaria
accortezza: due tavolette scorrevoli verniciate di
bianco, a sezione trapezoidale piatta, mediante il quale si risolvono i pi`
u intricati problemi,
senza sciupare inutilmente un solo pensiero. . .
Quando si possiede un regolo calcolatore, e arriva qualcuno con grandi affermazioni e grandi
sentimenti, si dice: Un attimo, prego, prima
calcoliamo il limite derrore e il valore probabile
di tutto ci`
o!
R. Musil Luomo senza qualit`
a
3.1
I numeri interi
I numeri naturali, nonostante le difficoltà presentate

dalla loro definizione, hanno un aggancio immediato
con la realtà, in quanto servono a contare. Le frazioni, che vedremo pi`
u avanti in questo capitolo, hanno
anchesse un rapporto preciso con la realtà e fin dallantichità è stato chiaro cosa significasse mezza mela
o tre quarti di focaccia. Invece, i numeri negativi hanno rappresentato per lungo tempo un concetto strano,
poco comprensibile e, quindi, spesso bandito dalle acque limpide della Matematica. Oggi, lesempio delle
temperature o della contabilità, con i soldi a credito (numeri positivi) o a debito (numeri negativi), ci
è tanto familiare che stentiamo a credere che fino a
300 anni fa il segno non fosse accettato come qualcosa di ovviamente utile, ma fosse ricacciato come
ambiguo o, addirittura, come un attributo diabolico.
Comunque, in molte persone perdura ancora lidea
che qualcosa di satanico sia intrinseco nella regola
dei segni, per la quale meno per meno fa pi`
u.
La necessità di introdurre i numeri negativi sorge
dal desiderio di poter eseguire una differenza come
3 5, che con i numeri naturali non ha senso: come è infatti possibile prendere cinque caramelle da
un insieme di tre? Linterpretazione insiemistica dei
numeri esclude questa possibilità ed è proprio questo
65
che gli antichi avevano in mente, pur senza aver dato una definizione formalizzata di cardinalità. Alla
metà del 1500, il matematico olandese Stevin (1487
1567) chiamava numeri absurdi i numeri negativi, che pure si era visto essere utili nella risoluzione
delle equazioni. Per i Greci i numeri erano legati alla
misura delle grandezze (specie dei segmenti) e anche
per loro pensare a misure negative era praticamente
assurdo. Tuttavia, a posteriori, si è visto come avere
3 e e spenderne 5 significa avere un debito di 2 e;
e se la temperatura è a 3 sopra lo 0 e scende di 5 ,
allora si troverà a 2 sotto zero. Ma tutto questo è
venuto dopo laccettazione dei numeri negativi.
Formalmente, un numero intero è 0 oppure un numero naturale preceduto da uno dei segni + o ; i
numeri preceduti da + si dicono interi positivi; quelli preceduti dal segno si dicono interi negativi. Il
numero privato del segno si dice valore assoluto dellintero, ed è pertanto un numero naturale; il valore
assoluto si indica ponendo il numero intero tra barre;
cos` | + 6| = 6, | 5| = 5 e |0| = 0. I due segni +,
si dicono opposti tra di loro; convenzionalmente, il
segno positivo si tende a sottintendere, cosa che cercheremo di non fare in questa sezione per distinguere
chiaramente i numeri interi positivi dai numeri naturali, anche se la regola è che i loro insiemi vengano
identificati, regola che naturalmente adotteremo anche noi. Si osservi la seguente definizione che talvolta
torna utile:
+1 se a è positivo
0 se a è zero
sgn(a) =
1 se a è negativo.
Il significato dei segni +, è definito dal loro
comportamento nelle usuali operazioni:
Definizione 3.1 Siano a, b due numeri interi; si definisce somma di a e b e si indica con a + b, il numero
intero cos` ottenuto: a) se a, b sono entrambi positivi, la loro somma è il numero positivo che si ottiene
sommando i valori assoluti dei due numeri; b) se a, b
sono entrambi negativi, la loro somma è il numero
negativo che ha per valore assoluto la somma dei valori assoluti di a e di b; c) se a, b sono discordi (cioè,
66
CAPITOLO 3. NUMERI
esatta) ed n 1. Prima di tutto, la divisione opera sempre con un divisore positivo, quindi se questo
risulta negativo, gli si cambia il segno, cambiandolo contemporaneamente anche al dividendo. Se ora
a Z e b > 0 sono i due numeri da dividere, il quoziente è dato dal numero q tale che a = b q + r, con
0 r < b. Pertanto (14) : (+5) = 3 con resto 1,
Lopposto di un numero a si indica con a ed è il che è la stessa cosa di (+14) : (5).
numero intero che ha lo stesso valore assoluto di a,
Questo modo di concepire i numeri interi è quello
ma segno opposto a quello di a. Quindi (+7) = 7 e classico usato nelle Scuole Medie e quello che si ritro(5) = +5. La sottrazione ab è, per definizione, la va nella struttura logica degli elaboratori elettronici,
somma di a con lopposto di b. Linsieme dei numeri dove il segno è costituito da un bit, 0 per positivo e
interi si indica con Z, dal tedesco Zahl = numero.
1 per negativo. Tuttavia, limpostazione matematica
Il prodotto di due numeri interi a, b è il numero pi`
u rigorosa ed elegante è completamente diversa e,
intero a b (o semplicemente a b, oppure ab) che ha come vedremo, spiega automaticamente la regola dei
come valore assoluto il prodotto dei valori assoluti di segni.
a e di b, e come segno quello stabilito dalla cosiddetta
Il problema generale che ci poniamo è quello di
regola dei segni:
estendere linsieme numerico di partenza S (in questo
caso, i numeri naturali N) in modo da ottenere un
a\b +
nuovo insieme T che:
+ +
1. permetta di definire le quattro operazioni ele +
mentari e i confronti, mantenendo le stesse proprietà di S ed eventualmente acquisendone di
Perche questa regola dei segni? Perche, soprattutnuove;
to, meno per meno fa pi`
u, come di solito si esprihanno uno segno positivo e laltro negativo) la loro
somma ha come segno lo stesso segno del numero che
ha valore assoluto pi`
u alto e come valore assoluto la
differenza tra il pi`
u grande e il pi`
u piccolo dei due valori assoluti (se a, b hanno segno opposto ma uguale
valore assoluto si ha a + b = 0).
me la regola pi`
u misteriosa? Il fatto fondamentale è questo, che vogliamo conservare ai numeri interi le principali proprietà formali, già viste per i numeri naturali e le relative operazioni. Cos`, è facile vedere che per laddizione valgono ancora le proprietà commutativa ed associativa, e lo 0 fa da identità. Per la moltiplicazione, vogliamo che proprietà
commutativa, associativa e distributiva siano valide. Consideriamo allora, come esempio, il prodotto
(+3) ((+2) + (2)); se prima eseguiamo la somma abbiamo (+3) 0 = 0, poiche 0 deve operare
da zero, cioè annullare il prodotto. Daltra parte, se
vale la proprietà distributiva, lespressione diviene:
(+3) (+2) + (+3) (2) e deve essere 0 per quanto
appena detto. Poiche abbiamo identificato gli interi
positivi con i naturali, si ha (+3) (+2) = 3 2 = 6.
Si ha pertanto 6 + (+3) (2) = 0, e sommando
6 ai due membri: (+3) (2) = 6; questo spiega la regola pi`
u per meno uguale meno, e in modo
analogo si trova che meno per pi`
u uguale meno.
A questo punto abbiamo: (3) ((+2) + (2)) =
(3) 0 = 0 ancora per la proprietà distributiva,
e quindi (3) (+2) + (3) (2) deve dare 0.
Ma ora sappiamo che (3) (+2) = 6 e quindi
(3) (2) = (6) = 6, cioè è giocoforza accettare
la regola che meno per meno fa pi`
u.
Infine, per la divisione, abbiamo una regola molto complicata (certo pi`
u complicata di quella della
divisione fra naturali) per rispettare la regola fondamentale del resto, cioè che nella divisione per n il resto deve essere un numero compreso tra 0 (divisione
2. contenga propriamente S, nel senso che si possa

definire un sottoinsieme T T identificabile
con S, tale cioè che esista una corrispondenza
biunivoca tra T ed S per cui se s, s S danno come risultato s rispetto a una qualsiasi delle
quattro operazioni o ad un confronto (nel qual
caso s = 0/1) allora i corrispondenti elementi
(s), (s ) T diano come risultato della stessa operazione o dello stesso confronto proprio il
corrispondente (s ).
Questultima proprietà si dice tecnicamente di isomorfismo e si dice anche che S e T sono isomorfi.
Nel caso in questione, i numeri interi che vogliamo
costruire, devono godere di tutte le proprietà dei nu` il fatto che la sottrazione sia sempre
meri naturali piu
definita. Come si sa (ma che qui, prima della costruzione, dobbiamo far finta di non sapere) sono gli interi
positivi, compreso lo 0, che si identificano con i numeri naturali. Formalmente, cè da dimostrare che
Z+ ed N sono isomorfi.
Il metodo seguito per estendere un insieme numerico è in sostanza sempre lo stesso. Tanto la costruzione
di Z da N, quanto la costruzione dei numeri razionali
da Z, quanto ancora la costruzione dei numeri reali
dai razionali, seguono uno schema ben preciso. Vediamolo allora in generale. Sia, come sopra, S linsieme
numerico di partenza e si voglia costruire linsieme
esteso T :
1. si definisce un insieme U basandoci sugli
elementi di S;
3.1. I NUMERI INTERI
67
2. si definisce su U una relazione di equivalenza e (c, d) (e, f ) cioè c + f = d + e, sommando mem;

bro a membro si ha a + d + c + f = b + c + d + e,
ovvero a + f = b + e che vuol dire (a, b) (e, f ). Pos3. si definiscono su U le quattro operazioni e i siamo allora dividere N N in classi di equivalenza,
confronti;
e si dice numero intero ciascuna delle classi ottenu4. si dimostra che sono compatibili con la relazio- te. Nellinterpretazione vista, (a, b) e la sua classe di
ne , cioè elementi equivalenti danno risultati equivalenza identificano il numero a b poiche tutte
le coppie hanno la stessa differenza. Se a > b questa
equivalenti;
dà un numero positivo, se a = b si ha lo 0 e se a < b
5. si definisce T come linsieme quoziente di U si ha un numero negativo.
modulo ;
Definiamo ora la somma (a, b) + (c, d) = (a +
c,
b
+ d): affinche questa definizione abbia senso non
6. si definisce un opportuno sottoinsieme T T e
deve
dipendere dalle particolari coppie scelte. Ma
si dimostra che T è isomorfo ad S.
se (a, b) (a , b ) e (c, d) (c , d ) e si esegue
Linsieme U è un insieme di comodo, che ingloba la (a , b ) + (c , d ) = (a + c , b + d ), vediamo che
nostra idea di estensione, ad esempio che sia sempre (a +c , b +d ) (a+c, b+d). Infatti abbiamo per ipodefinita la sottrazione. La costruzione di U è di regola tesi a+b = a +b e c+d = c +d e sommando membro
pleonastica e si ottiene un insieme troppo grande; per a membro: a + b + c + d = a + b + c + d che definisce
questo si definisce la relazione di equivalenza che per- proprio lequivalenza tra le due somme. Può essemette di ridurre gli elementi a quelli essenziali. Gli re divertente dimostrare ora tutte le proprietà della
elementi sono in effetti classi di equivalenza: questa somma (commutatività, associatività e identità dello
è una delle difficoltà concettuali maggiori, poiche le 0), ma ci limitiamo a far vedere che se (a, b) è positivo,
prime volte ci risulta ostico accettare che un numero (c, d) è negativo e il valore assoluto di (a, b) è maggio` una classe di equivalenza. Daltra parte, questo è re di quello di (c, d), allora il risultato della somma è
e
proprio ciò che si fa con le frazioni (anche se non lo si |(a, b)| |(c, d)|. Infatti, abbiamo (a, b) (a b, 0)
dice in questi termini) dove 3/5, 6/10 e 33/55 sono se a > b, e (c, d) (0, d c) se c < d. Quindi
lo stesso numero razionale.
(a, b) + (c, d) = (a b, 0) + (0, d c) = (a b, d c),
Il fatto che un numero sia una classe di equivalenza ma questo numero rappresenta proprio la differenza
impone di dimostrare che le operazioni e i confronti dei due valori assoluti. Si noti infine che lopposto di
sono indipendenti dai particolari elementi di U usati (a, b) è (b, a), per cui la differenza si definisce molto
per la loro esecuzione. Questo dà piena validità al- semplicemente:
la costruzione di T . Infine, bisogna far vedere che T
(a, b) (c, d) = (a, b) + (d, c).
estende S e quindi, fra le classi di U , dobbiamo iden
tificare quelle che costituiscono limmagine T di S e
Il confronto fra due coppie si fa definendo:
dobbiamo far vedere che le operazioni e i confronti in
S e in T danno proprio gli stessi risultati.
(a, b) (c, d) se e solo se a + d b + c,
Per la costruzione di Z si comincia col considerare le coppie di numeri naturali (a, b) N N, che il cioè estendendo la relazione di equivalenza; a destra
lettore è bene immagini di interpretare come a b, abbiamo un confronto tra numeri naturali, e quindi
anche (e soprattutto) quando a < b. Naturalmen- sappiamo come funziona. Anche questa definizione
te, questo è logicamente scorretto perche non si sa ha un senso abbastanza ovvio se guardiamo alla noancora ufficialmente cosa sia a b proprio quando stra interpretazione; infatti, a b c d significa
a < b, ma lidea ci permette di entrare nello spirito proprio a + d b + c. Facciamo ora vedere che la
di questa impostazione. Si dice che due coppie so- relazione cos` definita è una relazione dordine che
no equivalenti, e si scrive (a, b) (c, d) se e solo se estende la relazione fra i numeri naturali. La proa + d = b + c; questa è unuguaglianza tra numeri prietà riflessiva è ovvia, poiche (a, b) (a, b) significa
naturali, e quindi sappiamo cosa significa. Nellinter- a + b a + b. Per lantisimmetria, se (a, b) (c, d) si
pretazione suggerita, due coppie sono equivalenti se ha a + d b + c, e se (c, d) (a, b) si ha b + c a + d;
e solo se hanno la stessa differenza: a b = c d, da queste sono relazioni su N, insieme in cui la procui a + d = b + c, ma osserviamo di nuovo che questo prietà antisimmetrica vale, per cui a + d = b + c,
avrà senso solo a posteriori. E facile vedere che la cioè (a, b) = (c, d). Infine, per la proprietà transitiva,
relazione definita è proprio di equivalenza: proprietà se (a, b) (c, d) si ha a + d b + c e se (c, d) (e, f )
riflessiva (a, b) (a, b) ovvia perche a+b = a+b; pro- si ha c + f d + e; sommando membro a membro
prietà simmetrica: se (a, b) (c, d), cioè a+d = b+c, si ha a + c + d + f b + c + d + e e semplificando
allora c + b = a + d che significa (c, d) (a, b); pro- a+f b+e, cioè (a, b) (e, f ). Lasciamo al lettore il
prietà transitiva: se (a, b) (c, d) cioè a + d = b + c compito di far vedere che se restringiamo il confronto
68
CAPITOLO 3. NUMERI
a elementi positivi (quelli che corrispondono con N)

il confronto dà gli stessi risultati che dà in N.
Il prodotto è definito da:
che produce un Do, si ha ancora un Do, ma unottava

pi`
u bassa. Gli altri rapporti sono: 9/8 per il Re, 5/4
per il Mi, 4/3 per il Fa, 3/2 per il Sol, 5/3 per il La
e 15/8 per il Si:
(a, b) (c, d) = (ac + bd, ad + bc).

Questa regola non è poi tanto misteriosa; se (a, b)
rappresenta a b e (c, d) rappresenta c d, allora
il loro prodotto deve rappresentare (a b)(c d) =
ac ad bc + bd, e quindi basta separare gli addendi
positivi da quelli negativi per ottenere la formula del
prodotto. Anche per questa operazione, le proprietà
formali valgono integralmente, ma lasciamo la loro
verifica alla pazienza del lettore volenteroso. Veniamo invece alla regola dei segni, che pi`
u ci interessa.
Cominciamo con losservare che ogni numero positivo ha, fra le coppie che lo definiscono, una del tipo
(n, 0), mentre ogni numero negativo ne ha una del
tipo (0, n). Se consideriamo i quattro casi possibili,
abbiamo:
(n, 0) (m, 0)
(n, 0) (0, m)
(0, n) (m, 0)
(0, n) (0, m)
= (nm, 0)
= (0, nm)
= (0, nm)
= (nm, 0)
positivo
negativo
negativo
positivo.
Purtroppo, la divisione è unoperazione piuttosto

complicata, e qui la lasciamo perdere.
3.2
I numeri razionali
Lidea di numero frazionario è molto antica e, bisogna dire, anche molto naturale, al contrario del concetto di numeri negativo che si è affermato soltanto
nel 1600 e non senza notevoli difficoltà. Le frazioni
scaturiscono direttamente dalla realtà: come ci sono
2 mele o 10 arance, cos` cè mezza mela, un quarto di
pollo o un ottavo di torta. Storicamente, le frazioni
con numeratore unitario, come 1/2, 1/3 o 1/12, hanno avuto un ruolo privilegiato fino al 1600, quando si
impose la notazione decimale con il punto o la virgola di separazione. Gli Egizi usavano solo tali frazioni,
con leccezione di 2/3, per cui per esprimere 3/5 dovevano scrivere 1/2 + 1/10, e per esprimere 4/5 si
rifacevano a 1/2 + 1/5 + 1/10. Questo uso, come sè
detto, si protrasse per tutto il Medio Evo, e anche in
seguito. Invitiamo il lettore a scrivere un algoritmo
che trasformi una frazione nella somma di frazioni
con il numeratore unitario.
Nella Matematica Greca le frazioni avevano un ruolo molto importante e su di esse era in pratica basata
la teoria delle proporzioni, che a lungo dominò la Geometria e lAritmetica, fin da quando Pitagora aveva
scoperto i rapporti armonici, cioè i rapporti che regolano la lunghezza delle corde per produrre, vibrando,
le varie note: raddoppiando la lunghezza della corda
Do Re
Mi Fa
Sol
La
Si
Do
Nota 3.1
Questi rapporti corrispondono alla cosiddetta scala naturale, che è un po diversa dalla scala
pitagorica nella quale il Mi ha rapporto 81/64, il La
27/16 e il Si 243/128. Queste differenze dipendono dal
fatto che, verosimilmente, il nostro orecchio percepisce
una certa nota se la frequenza del suono è compresa in
un dato intervallo e non solo quando tale frequenza ha
un valore preciso. Entrambe le scale sono approssimazioni che, comunque, appartengono a questi supposti
intervalli. Quale è allora il loro valore centrale? Per
determinarlo possiamo fare tre ipotesi:
le note si ripetono di ottava in ottava; si passa da
unottava allaltra raddoppiando la frequenza;
per motivi fisiologici, educativi e convenzionali
riusciamo a distinguere 12 note in ciascuna ottava, cos` come riusciamo a distinguere un numero finito di colori dallinsieme infinito delle
lunghezze donda luminose;
il rapporto r tra due note consecutive è costante (natura non facit saltus), contrariamente a quanto si suppone nelle scale naturale e
pitagorica.
Se poniamo uguale ad 1 la frequenza del Do in una
qualsiasi ottava, la nota successiva (che propriamente
è il Do diesis o il Re bemolle) avr`
a frequenza 1 r = r,
la nota successiva, cioè il Re, avr`
a frequenza r2 , e cos`
via, fino al Do dellottava successiva, che avr`
a frequenza r12 . Ma questa frequenza, per la prima ipotesi for12
mulata,
è uguale a due e quindi si ha r = 2, cioè
12
2 1.059463. Questi nuovi rapporti, costituiti
r=
in effetti da numeri irrazionali (si veda pi`
u avanti in
questo capitolo), formano la cosiddetta scala temperata. Trascurando le note intermedie, date dai diesis
e dai bemolle delle note corrispondenti agli intervalli
maggiori, si ha la seguente tabellina:
nota
Do
Re
Mi
Fa
Sol
La
Si
Do
scala
pitagorica
1
1.125
1.266
1.333
1.500
1.688
1.898
2
scala
naturale
1
1.125
1.250
1.333
1.500
1.667
1.875
2
scala
temperata
1
1.122
1.260
1.334
1.498
1.682
1.888
2
69
3.2. I NUMERI RAZIONALI

Da questa tabella si vede come le approssimazioni
pitagoriche siano migliori di quelle naturali.
Inizialmente, i Greci credevano che presi comunque

due segmenti (o due grandezze omogenee) fosse sempre possibile trovare un loro sottomultiplo comune: se
questo era 1/n del primo segmento e 1/m del secondo, il secondo risulta m/n del primo (e il primo n/m
del secondo). I filosofi rimasero sconcertati quando
Pitagora dimostrò che questo non è sempre vero. Vedremo pi`
u avanti come stanno le cose, ma, nonostante questo risultato negativo, le frazioni rimasero al
centro del concetto di misura delle grandezze.
Nota 3.2
La costruzione formale dei numeri

razionali segue fedelmente la loro introduzione pratica
tradizionale. Questo è lunico caso in cui ci
o avviene,
e aiuter`
a la fantasia del lettore a capire bene anche
le altre costruzioni in cui, come nel caso dei numeri
interi, la costruzione matematica e limpostazione
pratica differiscono. In effetti, la costruzione matematica dei razionali introduce coppie appartenenti
allinsieme Z N0 , fra le quali è definita la relazione
di equivalenza (a, b) (c, d) se e solo se ad = bc. Ma
allora, nella coppia (a, b) ri riconosce sotto mentite
spoglie la frazione a/b e il trucco è subito svelato. Con
queste definizioni, si applicano tutte le considerazioni
viste nella Sezione 3.1 e relative allestensione degli
insiemi numerici.
cioè, semplificando, mn = m n. Questa è una uguaglianza tra numeri interi, e quindi sappiamo come gestirla. Purtroppo il ragionamento che ci ha portato a
questa uguaglianza è basato sul nulla, in quanto sono
proprio le regole di comportamento delle frazioni che
ci mancano. Il trucco (se di trucco si puo parlare)
è allora proprio quello di assumere i nostri desideri
come punto di partenza:
Definizione 3.2 Date due frazioni m/n ed m /n , si
dice che esse sono equivalenti se e solo se mn = m n,
e in tal caso scriveremo m/n m /n .
Il nome è giustificato dal seguente teorema:
Teorema 3.1 La relazione m/n m /n è una
relazione di equivalenza.
Prova: La proprietà riflessiva afferma che ogni frazione deve essere equivalente a se stessa; qui dovremmo avere m/n m/n, ma in effetti questo significa
mn = mn, il che è senzaltro vero. La proprietà simmetrica parte supponendo che sia m/n m /n , cioè
mn = m n; da questo dovremmo dedurre m /n
m/n, cioè m n = mn , che però è valido grazie alla proprietà simmetrica delluguaglianza. Infine, se
supponiamo m/n m /n ed m /n m /n , cioè
mn = m n e m n = m n , possiamo moltiplicare
queste due uguaglianze membro a membro e ottenere
mn m n = m nm n . Semplificando, per la proprietà di eliminazione del prodotto (v. Sezione 2.3),
si ha mn = m n, il che vuol dire m/n m /n , e
Formalmente, una frazione è il rapporto di due nuquesta è proprio la proprietà transitiva.
meri interi, il primo detto numeratore e il secondo
denominatore, con questultimo diverso da zero. Ad
Useremo il seguente risultato:
esempio, sono frazioni 3/5, 7/6, 5/(8), 3/(1).
Convenzionalmente, non si considerano le frazioni che Teorema 3.2 Due frazioni m/n e m /n sono equi
siano il rapporto di due numeri negativi, che, per la valenti se e solo se esistono due numeri interi k, k

regola dei segni, è uguale a un opportuno rappor- tali che mk = m k e nk = n k .
to tra numeri positivi. In modo analogo, le frazioni
Se le due frazioni sono equivalenti si ha
con numeratore positivo e denominatore negativo si Prova:
mn
=
m
n,
ma è anche nn = n n e quindi possiamo
considerano uguali a quelle analoghe con numerato
re negativo e denominatore positivo. In altre parole, porre k = n e k = n. Viceversa, supponiamo che

in
mentre il numeratore è un numero intero qualunque, esistano k, k con la proprietà detta; moltiplicando
croce le due uguaglianze si ha: mkn k = m k nk;
il denominatore è un intero strettamente positivo.
non nullo kk può essere eliminaIl problema che nasce in modo naturale con le fra- il fattore comune
zioni è quello della loro uguaglianza. Sappiamo tutti to e quindi mn = m n, e questo significa che le due
frazioni
sono
equivalenti.
per esperienza che mezza mela è la stessa quantità di
due quarti di mela, cioè 1/2 = 2/4, e quindi la rappresentazione delle frazioni non è unica. A livello intuitivo, vorremmo che per le frazioni valesse la stessa
regola che conosciamo per i numeri interi, cioè che due
frazioni uguali rimangono tali se le moltiplichiamo o
le dividiamo per la stessa quantità diversa da zero.
Ad esempio, se m/n = m /n , vorremmo che questa rimanesse unuguaglianza quando moltiplichiamo
tutto per nn ; questo ci darebbe mnn /n = m nn /n,
Se abbiamo due frazioni equivalenti e facciamo la

scomposizione in fattori primi di numeratori e denominatori, possiamo semplificare i fattori comuni;
si ottengono cos` frazioni identiche, nel senso che
coincidono tanto i numeratori che i denominatori.
Teorema 3.3 Siano m/n ed m /n due frazioni equivalenti; esiste allora ununica frazione r/s equivalente
alle due frazioni date e tale che MCD(r, s) = 1.
70
Prova: Consideriamo m/n ed eliminiamo eventuali
fattori primi comuni a numeratore e denominatore
ottenendo cos` la frazione r/s tale che MCD(r, s) = 1.
La semplificazione ci assicura che m/n ed r/s sono
frazioni equivalenti e quindi esistono due interi h, h
tali che mh = rh ed nh = sh . Daltra parte, per
lequivalenza delle frazioni assegnate, devono esiste
k, k tali che mk = m k ed nk = n k . Poiche, dalla
divisione fra naturali, si ha m = rh /h ed n = sh /h,
sostituendo si ottiene: rh k/h = m k , cioè rh k =
m hk , e analogamente sh k/h = n k , cioè sh k =
n hk . Ma questo significa che r/s è equivalente anche
ad m /n . Quindi frazioni equivalenti si riducono alla
stessa frazione r/s, con MCD(r, s) = 1. Vediamo
ora che tale frazione è unica. Se ne esistesse unaltra
r /s , essa dovrebbe comunque essere equivalente ad
r/s e quindi avremo rs = r s. Poiche r non divide
s, r dovrà dividere r , cioè r = kr; questo porta
a rs = rks, cioè s = ks; in altre parole, r /s è
la frazione kr/ks; ma dallipotesi MCD(r , s ) = 1
deriva k = 1 e quindi r/s = r /s .
Le frazioni r/s tali che MCD(r, s) = 1 si dicono ridotte ai minimi termini; poiche rappresentano
il modo pi`
u semplice di scrivere una frazione della
propria classe di equivalenza, costituiscono un punto
di riferimento preciso e spesso è conveniente rifarsi
direttamente a loro.
Secondo una vecchia classificazione, le frazioni si
dividono in proprie, improprie ed apparenti. Le frazioni proprie sono quelle in cui il numeratore è inferiore al denominatore; queste sono le vere frazioni,
nel senso che corrispondono a una parte propria del
tutto, come 1/3, 2/5 o 7/10. Frazioni come 7/5 o
9/2 indicano quantità maggiori del tutto, e pertanto si dicono improprie; esse possono essere espresse come un numero intero pi`
u una frazione propria:
7/5 = 1 + 2/5 e 9/2 = 4 + 1/2; queste espressioni si
ottengono eseguendo la divisione intera fra numeratore e denominatore e poi considerando il resto come
frazione propria. Infine, una frazione come 6/3 è solo
tale in apparenza ed eseguendo la riduzione ai minimi termini si trova come sia equivalente al numero
intero 2. Da questo punto di vista, linsieme delle frazioni è pi`
u esteso dellinsieme dei numeri interi, che
corrispondono solamente alle frazioni apparenti. Vedremo fra poco come si estende e si formalizza tale
osservazione.
Quel che ora ci preoccupa è: come si eseguono le
operazioni fra frazioni e come si confrontano due frazioni? Abbiamo visto come il confronto e le operazioni siano aspetti essenziali dei numeri naturali e dei
numeri interi; vogliamo che sia cos` anche per le frazioni. Consideriamo come emblematici il confronto e
loperazione di addizione. Se dobbiamo sommare 1/4
e 2/5 ci troviamo in imbarazzo perche sembra di voler
CAPITOLO 3. NUMERI
sommare una mela con due pere: infatti, 1/4 di torta
è una certa quantità che possiamo immaginare come una bella fetta; 2/5 di torta li vediamo come due
fette, ma ciascuna un po pi`
u piccola della fetta corrispondente a 1/4. Allora, limbarazzo è quello di dover
sommare fette grosse con fette piccole. Per vedere le
cose da un altro punto di vista, se dovessimo sommare 1/4 e 2/4, loperazione non risulterebbe difficile,
perche le fette sono della stessa grandezza e il risultato sarebbe 3/4 senza dubbio. Allora è importante
il seguente procedimento:
Algoritmo 3.1 (Stesso denominatore)
Ingresso: due frazioni m/n ed m /n ;
Uscita: due frazioni r/s ed r /s, equivalenti a quelle
date, ma con lo stesso denominatore s;
1. si pone s := mcm(n, n );
2. si pone r := m s/n;
3. si pone r := m s/n;
4. si esce con le due frazioni r/s ed r /s.
La dimostrazione che r/s m/n è immediata; infatti, per costruzione, abbiamo r/s = ms/ns e questa
frazione è chiaramente equivalente ad m/n. Lo stesso
vale per r /s m /n .
Sapendo riportare due frazioni a un denominatore
comune, scatta losservazione fatta in precedenza:
Algoritmo 3.2 (Confronto tra frazioni)
Uscita: Maggiore, Uguale o Minore a seconda
che tale sia m/n nei confronti m /n ;
1. si pone s := mcm(n, n ) e si considerano le due
frazioni r/s ed r /s equivalenti ad m/n ed m /n ,
secondo il precedente algoritmo;
2. se r < r allora si esce con Minore;
3. altrimenti, se r
Maggiore;
>
r allora si esce con
4. altrimenti (r = r ) si esce con Uguale.

Essendo i denominatori uguali, cioè avendo ridotto le
fette della torta a fettine delle stesse dimensioni, il
numeratore regola il confronto, secondo lovvio criterio che la frazione con il maggior numero di fettine è
quella pi`
u grande. In modo analogo si procede per la
somma:
Algoritmo 3.3 (Somma di due frazioni)
Uscita: la somma m/n + m /n ;
1. si pone s := mcm(n, n ) e si considerano le due
frazioni r/s ed r /s equivalenti ad m/n ed m /n ;
3.2. I NUMERI RAZIONALI

2. si esce col risultato (r + r )/s.
71
Teorema 3.4 Siano m/n ed m /n due frazioni tali
che m/n < m /n . Allora, per ogni altra frazione
/ m/n e / m /n , si ha / < / .
La differenza si esegue come laddizione, per cui non

diamo lalgoritmo in modo esplicito. Il prodotto
segue la logica delle parti, propria del concetto di Prova: Siano r/s ed r /s le due frazioni di partenza
frazione. Ad esempio, (2/3) (3/5) significa:
ridotte ai minimi termini. Questo significa m = rk,
n = sk, m = r h ed n = s h. Supponiamo anche
dividere un oggetto in 5 parti e prenderne 3;
che le frazioni siano positive (negli altri casi la proavanti nello stesso modo); la
di quello che si ottiene, dividere in 3 parti e va è banale o si porta
condizione
m/n
<
m
/n
equivale a mn < m n. Per
prenderne 2.
le uguaglianze viste si ha allora: rks h < skr h, cioè
Ma dividere prima in 5 parti e poi in 3 è come divi- rs < sr il che significa r/s < r /s . Poiche il ragiodere loggetto in 15 parti; fatto questo, si prendono 2 namento si può invertire, vediamo che m/n < m /n
parti per ognuna delle 3 parti considerate nella prima equivale ad r/s < r /s . Ma questo si può ripetere ansuddivisione: in definitiva, si prendono 6 parti delle che per / e / , che si riducono alle stesse frazioni
r/s ed r /s . Quindi la disuguaglianza si trasferisce a
15 della divisione. In generale, abbiamo:
tutte le frazioni equivalenti ad m/n ed m /n , come
m m
mm
si voleva.
=
.
n
n
nn
Questo teorema ha una dimostrazione noiosa, ma è
Se anche le due frazioni sono ridotte ai minimi ter- importante perche ci permette di capire come la defimini, può accadere che il prodotto non lo sia: questo nizione di confronto data in precedenza non dipenda
perche ci possono essere fattori a comune tra m ed n dalla particolare frazione con cui stiamo lavorando,
oppure tra n ed m . Può essere allora conveniente ese- ma valga per tutte le frazioni ad essa equivalenti. La
guire una semplificazione prima della moltiplicazione, stessa proprietà vale per la somma:
come ad esempio in:
Teorema 3.5 Siano m/n ed m /n due frazioni; se
8
4 8
32
20
r/s m/n e r /s m /n , allora m/n + m /n
= =
.
7
15
7 3
21
r/s + r /s .
Concludiamo con la divisione; loperazione, come Prova:
Se r/s m/n, si ha rn = ms e se
si sa, è linversa della moltiplicazione, e quindi si ha: r /s m /n è anche r n = m s . Moltiplicando
la prima uguaglianza per n s e la seconda per ns,
m m
m
n
mn
: =
=
.
si ottiene rnn s = msn s e nsr n = nsm s . Somn n
n
m
nm
mando membro a membro si ha rnn s + nsr n =
Se le due frazioni di partenza sono equivalenti, cioè msn s +nsm s , cioè (rs +r s)nn = (mn +m n)ss .
mn = m n, il loro rapporto è 1, come ci si può Ma questo significa:
aspettare.
rs + r s
mn + m n
r r
m m
La relazione di equivalenza m/n m /n ci per
o
+
+
ss
nn
s s
n
n
mette di raggruppare insieme frazioni equivalenti,
cioè frazioni che hanno lo stesso significato, come 1/2
che è giusto quello che si voleva.
e 2/4. Abbiamo anche visto come si fanno i confronti
Questo tipo di dimostrazione può essere esteso al
e come si eseguono le operazioni fra frazioni. Formalmente, potremmo considerarci a posto, ma in realtà prodotto, alla differenza e alla divisione. I dettagli
il lettore si sarà sentito a disagio per un motivo mol- interessano abbastanza poco, ma quello che vogliamo
to profondo: quando ad esempio confrontiamo 2/3 e sottolineare è come, in tutti i casi, frazioni equivalenti
3/5 e, portandoli allo stesso denominatore, confron- si comportino nello stesso modo. Cè quindi qualcosa
tiamo di fatto 10/15 e 9/15, ci chiediamo: se fossimo in pi`
u della semplice somiglianza formale fra frazioni
partiti da due frazioni equivalenti a 2/3 e 3/5, ad equivalenti: cè addirittura lo stesso significato, nel
esempio 20/30 e 27/45, saremmo comunque arrivati senso di comportamento nei confronti delle operazioalla stessa conclusione, e cioè che la prima è maggiore ni. Questo è il vero motivo (e non certo la sola nostra
della seconda? Propriamente, per confrontare 20/30 intuizione) che ci porta ad identificare in un concete 27/45 dobbiamo riportare tutto allo stesso deno- to unico tutte le frazioni equivalenti. Pertanto, da
minatore 90, e cioè a 60/90 e 54/90: vediamo che questo momento in avanti, come si fa di regola, non
il primo è ancora maggiore, ma come assicurarci che diremo pi`
u che due frazioni sono equivalenti, ma adquesto vale per tutte le infinite frazioni equivalenti a dirittura uguali, e useremo il segno = invece del segno
2/3 e 3/5? Vale il seguente:
.
72
CAPITOLO 3. NUMERI
Definizione 3.3 Un numero razionale è la classe di oggi. Fino al 1600 non si ebbe idea della rappretutte le frazioni fra loro equivalenti. Linsieme dei sentazione decimale delle frazioni, se si eccettuano i
numeri razionali si indica con Q.
Babilonesi, che anche in questo furono precursori di
concezioni moderne. Come le cifre prima del punto
Anche se ormai ci dovremmo essere abituati, questa decimale indicano multipli di potenze del 10, cos` le
è una definizione ben strana, visto che afferma cos` cifre dopo il punto decimale denotano multipli di pocategoricamente che una classe (cioè un insieme) è tenze di 1/10. Pertanto 154.327 sta a rappresentare
un numero. Ma ormai sappiamo che la Matematica il numero:
è ricca di queste apparenti incongruenze e le consi2
7
3
derazioni e le prove precedenti ci assicurano che il
+ 2 + 3;
1 102 + 5 10 + 4 +
10
10
10
confronto e le quattro operazioni sono ben definite
in Q, perche non dipendono dal particolare elemen- come si sa, la prima cifra dopo il punto indica i decito scelto per eseguire il confronto o loperazione. Di mi, la seconda i centesimi, la terza i millesimi, e cos`
fatto, il senso della definizione è proprio questo: è in- via allinfinito, anche quando mancano nomi specifici
differente considerare una qualsiasi delle frazioni che di riferimento; tuttavia, tutti sappiamo cosa signifistanno in una certa classe; il risultato di un confronto ca 3/1035 e quale posto la cifra 3 occuperebbe in un
o di unoperazione sarà sempre lo stesso, cioè sarà in- numero di cui tale frazione facesse parte.
dipendente da quel particolare valore che scegliamo,
Partendo da una frazione specifica, ad esempio
o siamo costretti a scegliere, allinterno della classe. 24/7, il numero decimale ad esso corrispondente si
Spesso, come si sa, si preferisce avere a che fare con trova eseguendo la divisione decimale, o, secondo lule frazioni ridotte ai minimi termini, ma si tratta solo so, la divisione tout-court, quando si chiami, come
di una questione di convenienza, data dal fatto che già detto, divisione intera la divisione che produce un
una frazione ridotta ai minimi termini ha il numera- quoziente intero e un resto. Lesecuzione della divitore e il denominatore pi`
u piccoli fra le frazioni equi- sione avviene in modo analogo a quanto visto nellalvalenti, cioè nella stessa classe. Cos` preferiamo 2/3 goritmo della divisione intera, solo che quando sono
a 52/78 o a 4354/6531, ma se confrontiamo questul- esaurite le cifre della parte intera del dividendo, si
tima frazione con 1/2, troviamo che essa è maggiore, mette il punto decimale al quoziente e si continua,
esattamente come lo è 2/3.
abbassando o calando le cifre decimali del dividendo
Concludiamo dimostrando una delle proprietà im- (se ce ne sono) o la cifra 0, quando quelle manchino o
portanti dei numeri razionali. I numeri interi costi- siano esaurite. Qui riportiamo la divisione di 24 per
tuiscono un insieme numerico discreto, tale cioè che 7:
tra due interi consecutivi, diciamo 5 e 6, esiste un
7
2 4
vuoto, ovvero un intervallo nel quale non esistono
3
0
3.
4 2 6 5 7 1
numeri interi. Per i razionali questo non è vero, e vale
2
0
invece:
6 0
Teorema 3.6 (di densit`
a) Se q1 < q2 sono due
4 0
numeri razionali qualsiasi, esiste sempre un numero
5 0
q Q tale che q1 < q < q2 .
1 0
3
Prova:
Basta considerare la semisomma q =
(q1 + q2 )/2, che gode chiaramente della proprietà Teorema 3.7 Se due frazioni m/n ed m /n sodesiderata.
no equivalenti, allora esse corrispondono allo stesso
numero decimale.
Come vedremo nella Sezione 3.5, i numeri reali hanno una propriet ancora pi`
u forte, detta continuit`
a. Prova: Come osservato a suo tempo, un rapporto
La proprietà dei razionali appena dimostrata si dice non cambia se moltiplichiamo o dividiamo dividendo
invece densit`
a e si esprime con la frase: i numeri e divisore per una stessa quantità diversa da 0. Ma se
razionali sono densi.
r/s è la frazione ridotta ai minimi termini equivalente
3.3
I numeri decimali
ad m/n, tale sarà anche per m /n . Quindi m/n,

m /n e r/s devono dare lo stesso risultato quando si
divide numeratore per denominatore onde ottenere il
corrispondente numero decimale.
Come sè detto, le frazioni hanno unorigine antichisLa divisione potrebbe continuare, determinando
sima, dovuta alla loro natura intuitiva e fondamentalmente pratica. Curiosamente, gli Egizi rappresenta- spesso (come nel caso dellesempio precedente) uno
vano le frazioni in modo analogo a quanto facciamo sviluppo infinito del numero decimale:
3.3. I NUMERI DECIMALI

Teorema 3.8 Sia m/n una frazione e sia r/s
m/n la stessa frazione ridotta ai minimi termini. Se
il denominatore s contiene solo i fattori 2 e 5, allora
la frazione corrisponde a un numero decimale finito.
73
insieme; e vale anche per linsieme C dei numeri complessi che noi tratteremo solo superficialmente, e che
verrà approfondito nei corsi universitari. Fissiamo
allora uno di questi insiemi e chiamiamo successione numerica una regola che ad ogni elemento di N
Prova: Sia s = 2i 5j , con i e j eventualmente 0,
associa uno ed uno solo degli elementi dellinsieme
ma non entrambi. Sia k il massimo tra i e j, e
numerico fissato. Ad esempio, se la regola associa a 0
moltiplichiamo r ed s per 2ki 5kj . Allora si ha:
lo stesso numero 0, ad 1 il numero 2, a 2 il numero 4,
ki
kj
ki
kj
a 3 il 6, e cos` via, ciò che otteniamo è la successione
r2
5
r2
5
r
=
=
dei numeri pari.
s
2k 5k
10k
Formalmente , una successione è una funzione f :
e questo, come sappiamo, è un numero decimale con N K, dove K è un opportuno insieme numerik cifre dopo il punto decimale.
co. Convenzionalmente, limmagine f (k) si scrive fk
3
e
lintera successione si denota come {fk }kN . La
Come esempio consideriamo 77/250 = 77/(2 5 ) =
2
3
3
successione:
77 2 /(2 5 ) = 308/1000 = 0.308.
Limportante caso alternativo è il seguente:
x0 = 0, x1 = 1, x2 = 4, x3 = 9, x4 = 16, x5 = 25, . . .
Teorema 3.9 Sia m/n una frazione e sia r/s
m/n la stessa frazione ridotta ai minimi termini. rappresenta chiaramente la successione dei quadrati,
Se s contiene fattori diversi da 2 e da 5, allora la il cui elemento generico sarà scritto xk = k 2 e la
frazione corrisponde a un numero decimale periodico. successione nel suo insieme {xk }kN = {n2k }kN . Un
altro esempio è dato dalla successione:
Prova: Si immagini di effettuare la divisione decimale fra r ed s; come visto, ad ogni passaggio dob1
2
3
4
x0 = 0, x1 = , x2 = , x3 = , x4 = , . . .
biamo stabilire quante volte s sta in un numero che
2
3
4
5
termina per 0; questo è divisibile per s soltanto se s
contiene fattori 2, 5 e nessun altro. Quindi, s non il cui elemento generico è xk = k/(k + 1), cioè, glosarà mai un divisore dei numeri con i quali viene con- balmente, {xk }kN = {k/(k + 1)k }kN . Una succesfrontato, ma ciò significa che il numero decimale che sione molto famosa, e che abbiamo già incontrato, è
man mano si ottiene non può essere finito. Daltra quella di Fibonacci (vedere Nota 2.7):
parte, i possibili resti che si hanno nella divisione soF0 = 0, F1 = 1, F2 = 1, F3 = 2, F4 = 3, F5 = 5,
no solo 1, 2, . . . , s1, quindi dopo al pi`
u s1 passaggi
si avrà la ripetizione di un resto; da quel momento in
F6 = 8, F7 = 13, . . .
poi i resti si ripeteranno nello stesso ordine e quindi
il numero sarà periodico.
nella quale ogni elemento (a partire da F2 ) è dato dalLesempio precedente della frazione 24/7 è signifi- la somma dei due che lo precedono. Possiamo definire
cativo; quando si ottiene il resto 3, che già si era avu- anche successioni arbitrarie, scegliendo casualmente i
to, la divisione continuerà con i resti 2, 6, 4, . . . corri- vari elementi; in questo caso, però, non possiamo daspondenti alle cifre del quoziente 4, 2, 8, . . .. Quindi, re una formula esplicita per calcolare il generico eleil periodo è costituito dalle cifre 428571, che si ripe- mento xk . Generalmente, si incontrano successioni
teranno un numero infinito di volte. Secondo luso, il definite con regole abbastanza semplici e chi ha espeperiodo si denota soprallineando le cifre che lo com- rienza di Excel, un programma di foglio elettronico,
pongono, e pertanto scriveremo 24/7 = 3.428571, cos` sa che dando allelaboratore i primi elementi di una
come 1/3 = 0.3, 7/11 = 0.63 e 39/22 = 1.772. Il let- successione, quello cercherà di indurre gli elementi
tore curioso può divertirsi a trovare (e a confrontare) successivi ipotizzando una regola di formazione che
il periodo delle frazioni 1/7, 2/7, 3/7, 4/7, 5/7 e 6/7. sia abbastanza semplice.
Il concetto che ora vogliamo introdurre è molto imQuando siamo interessati soltanto ai primi elemenportante e riguarda le cosiddette successioni numeri- ti di una successione (x1 , x2 , . . . , xr ), tale sequenza
che. Intuitivamente, una successione è una sequenza finita è detta pi`
u propriamente progressione. Qui ci
ordinata di numeri nella quale si distinguono un pri- occuperemo di due tipi particolari di progressione. Si
mo elemento, un secondo elemento, e cos` via. Questo dice progressione aritmetica di ragione q una progresnon spiega granche, per cui cerchiamo di essere pi`
u sione il cui primo elemento è un numero qualsiasi x0 e
precisi. Consideriamo un insieme numerico; abbiamo ogni altro elemento è ottenuto aggiungendo q a quelgià introdotto N, Z e Q, e su di questi ci baseremo. lo precedente. Pertanto, x1 = x0 + q, x2 = x0 + 2q,
Tuttavia, in seguito, introdurremo linsieme dei nu- x3 = x0 + 3q e cos` via fino ad xr = x0 + rq. La promeri reali R e ciò che diremo ora vale anche per tale gressione aritmetica pi`
u semplice è (0, 1, . . . , r), nella
74
CAPITOLO 3. NUMERI
S
S
2S
=
x0
= x0 + rq
= 2x0 + rq
+
x0 + q
+ x0 + (r 1)q
+
2x0 + rq
+
+
+
+ x0 + (r 1)q
+
x0 + q
+
2x0 + rq
+
+
+
x0 + rq
x0
2x0 + rq
Tabella 3.1: Somma di una progressione aritmetica

quale x0 = 0 e q = 1. Una progressione aritmetica di ragione 3 è (5, 8, 11, . . . , 44) e si può considerare aritmetica anche una progressione costante come
(5, 5, . . . , 5), dove x0 = 5 e q = 0.
Il risultato pi`
u importante relativo alle progressioni
aritmetiche riguarda la somma di tutti i suoi elementi:
metodo ingenuo di far la somma di tutti gli elementi,

laltro sfruttando la formula del corollario. Discuta
poi quale dei due algoritmi è da preferire.
Il secondo tipo di progressione che vogliamo considerare è quello delle progressioni geometriche: queste
Teorema 3.10 Sia (x0 , x0 + q, x0 + 2q, . . . , x0 + rq) sono definite dalle regole: x0 = 1 e xj+1 = qxj , cioè,
una progressione aritmetica; detta S la somma dei a parte x0 , ogni altro elemento della progressione è il
prodotto dellelemento precedente per una quantità q,
suoi elementi, si ha:
detta la ragione della progressione. Questo significa:
x0 + xr
r(r + 1)q
=
(r + 1).
S = x0 (r + 1) +
x0 = 1, x1 = q, x2 = q 2 , . . . , xr = q r .
2
2
Nel seguito considereremo valori di q > 0; osserviamo esplicitamente che se q > 1 allora gli elementi
della progressione vanno crescendo e diventano sempre pi`
u grandi al crescere di r. Viceversa, se q < 1 la
progressione va decrescendo e i suoi elementi si avvicinano sempre di p`
u a 0. Invitiamo fin dora il lettore a modificare (dimostrandole) le formule successive
nellipotesi che sia x0 = a 6= 0, e quindi xj = aq j .
La quantità pi`
u interessante è ancora la somma di
Un caso particolarmente importante corrisponde tutti gli elementi della progressione; il risultato è il
alla progressione (0, 1, 2, . . . , r):
seguente:
Prova:
Scriviamo gli elementi della progressione da sinistra a destra e poi, al di sotto, da destra a sinistra. Si ha allora la situazione della Tabella 3.1. Sommando termine a termine, nellultima riga abbiamo la somma di r + 1 termini tutti uguali a 2x0 + rq = x0 + xr , per cui si trova:
2S = (r + 1)(2x0 + rq) = (x0 + xr )(r + 1). Ricavando
S, si ha la formula desiderata.
Corollario 3.11 La somma dei primi r numeri Teorema 3.12 Sia (1, q, q 2 , . . . , q r ) una progressiointeri positivi vale:
ne geometrica di ragione q 6= 1; allora:
1 + 2 + + r =
r(r + 1)
.
2
Prova: Basta porre x0 = 0, xr = r e q = 1 nelle

formule del teorema precedente.
Nota 3.3
Gauss (1777 1855) è considerato uno

dei pi`
u grandi matematici mai esistiti, essendosi interessato di tutti i rami della Matematica e ottenendo
ovunque fondamentali risultati. Si dice che quando
frequentava la scuola elementare, un giorno il maestro
desse alla classe il compito di trovare la somma dei
primi cento numeri. Sperava cos` di avere un po di
tranquillit`
a per potersi dedicare a qualche propria
occupazione. Ma dopo appena due minuti Gauss si
alz`
o affermando di aver gi`
a risolto il problema. Il
maestro, incredulo, gli chiese il risultato, che era naturalmente quello esatto: 5050. Gauss aveva intuito
la formula data nel corollario e aveva semplicemente
calcolato il prodotto 100 101/2 = 50 101 = 5050.
Il lettore è invitato a scrivere due algoritmi per la
somma dei primi r numeri interi: uno applicando il
S = 1 + q + q2 + + qr =
q r+1 1
.
q1
Prova: Consideriamo il prodotto qS = q + q 2 + q 3 +

+ q r+1 e la differenza qS S; in questa i termini
q, q 2 , . . . , q r si eliminano lun laltro e, in conclusione, non rimane che qS S = q r+1 1. Ricavando
S da questa equazione si ottiene proprio lidentità
desiderata.
Si osservi che abbiamo escluso il caso q = 1; la
somma sarebbe banale, ma la formula del teorema
porterebbe alla forma indeterminata 0/0. Nel caso
q = 2, la somma 1 + 2 + 4 + + 128, cioè da 1 a 27 ,
dà 28 1 = 255. Si osservi anche il caso in cui q < 1;
ad esempio, ponendo q = 1/2 si ha per r = 10:
1+
1
1/2048 1
1 1
+ + +
=
=
2 4
1024
1/2 1
=
1 1/2048
1
=2
.
1 1/2
1024
75
3.3. I NUMERI DECIMALI

Questo numero differisce per meno di un millesimo da
2. Che succede se passiamo ora ad r = 20, o addirittura ad r = 100? La differenza da 2 diventa sempre
pi`
u piccola. Questa osservazione ci verrà molto utile
nelle considerazioni successive.
Come abbiamo osservato, ogni frazione corrisponde a un numero decimale, necessariamente finito (se
il denominatore contiene solo potenze del 2 e del 5)
o periodico. Vogliamo ora affrontare il problema opposto: dato un numero decimale finito o periodico, è
vero che questo corrisponde a una frazione, cioè a un
numero razionale? La risposta sarà s`, e vedremo anche qual è lalgoritmo che, dato il numero decimale,
permette di trovare la frazione equivalente.
Intanto, la cosa è semplice per i numeri decimali
finiti. Cominciamo col dimostrare il seguente teorema
sulla divisione per 10:
Teorema 3.13 Se la rappresentazione decimale del
numero a è dr dr1 . . . d1 d0 .c1 c2 . . ., allora la rappresentazione di a/10 è dr dr1 . . . d1 .d0 c1 c2 . . ., cioè
a/10 si ottiene spostando il punto decimale di una
posizione a sinistra.
1
=
10
=
1
1
1+
+ . . . + r1
10
10
1 1 1/10r
1
1
=
.
10 1 1/10
9 9 10r
Possiamo osservare che quando r è 10 o 20, questa

quantità è molto vicina a 1/9 e, anzi, man mano che
r cresce, la vicinanza a 1/9 è sempre pi`
u marcata,
nel senso che la differenza 1/(9 10r ) è praticamente nulla. Se allora consideriamo il numero periodico
1
+ 1012 + 1013 + e lo vediamo come la som0.1 = 10
ma di infiniti termini, possiamo immaginare che esso
divenga 1/9 in quanto la r è infinitamente grande: la
differenza 1/(9 10r ) deve diventare 0. Questo ragionamento è plausibile e ha solo linconveniente di
tirare in ballo quantità infinite: un numero infinito
di termini del tipo 1/10r , un r che diviene infinito,
un errore che tende ad essere infinitamente piccolo.
Ha senso tutto questo? In effetti s`, e la riprova sta
nel semplice fatto che se partiamo da 1/9 ed eseguiamo la divisione, troviamo appunto 0.111 . . . = 0.1.
La conclusione è quindi 0.1 = 1/9, nel senso preciso
che luguaglianza si può leggere tanto da sinistra verso destra, quanto da destra verso sinistra. Possiamo
allora generalizzare questo ragionamento:
Prova: Per le proprietà della notazione posizionale,

a/10 vale:
1
c1
dr 10r + + d1 10 + d0 +
+ =
Lemma 3.15 Sia (1, q, q 2 , q 3 , q 4 , . . .) una successio10
10
ne di infiniti termini in cui ognuno è ottenuto moltic1
d0
plicando per q < 1 il precedente. La somma S di tutti
r1
+
+
= dr 10
+ + d1 +
10 102
gli elementi della successione è allora S = 1/(1 q).
e questo, riportato alla notazione decimale, ci dà il
Prova: Naturalmente, non sappiamo eseguire una
risultato cercato.
somma con infiniti termini; arrestiamo allora la sucNaturalmente, la stessa proprietà vale per le divi- cessione al termine q r , ottenendo cos` una progressiosioni per 100, 1000 e cos` via; pertanto un corollario ne geometrica di ragione q.Il Teorema [3.11] ci dice
del teorema è:
che la somma Sr (lindice r serve a ricordarci che ci
siamo
fermati al termine q r ) è:
Corollario 3.14 Se un numero decimale finito ha
k cifre dopo il punto decimale, diciamo a =
1 q r+1
1
q r+1
dr dr1 . . . d1 d0 .c1 . . . ck , allora a è equivalente alla
Sr =
=
.
1q
1q 1q
frazione:
dr dr1 . . . d1 d0 c1 . . . ck
.
10k
Essendo q < 1, la quantità q r+1 diviene sempre

pi`
u piccola al crescere di r e tale, perciò, è anche
r+1
q
/(1 q). Man mano quindi che consideriamo
Quindi, la semplice regola per trasformare a in una
pi`
u
termini
della successione, la differenza di Sr da
frazione è: togliere il punto decimale e dividere per
1/(1
q)
si
avvicina a 0 e, in conclusione, possiamo
k
10 , se k è il numero delle cifre di a dopo il punto
assumere
che,
per la successione completa, si abbia
decimale. Pertanto 5.7 = 57/10 e ci possono essere
S
=
1/(1
q).
semplificazioni come in 8.375 = 8375/1000 = 67/8.
Per affrontare il caso dei numeri decimali non fiSe q = 1/2 come nella sezione precedente, e pensianiti, e quindi periodici, è opportuno partire conside- mo a sommare 1+1/2+1/4+ , intuitivamente comrando progressioni geometriche con ragione q minore prendiamo che la somma totale deve essere 2; questo
di 1. Prendiamo il caso q = 1/10 che è quello che ci è in accordo con la formula S = 1/(1 1/2) = 2. Nel
interessa e cerchiamo la somma della progressione:
caso q = 1/10 abbiamo 1+1/10+1/100+ = 10/9 =
u ci interessa è il seguente
1, 1. Ma quello che pi`
1
1
1
1
+ 2 + 3 + + r =
risultato:
10 10
10
10
a=
76
CAPITOLO 3. NUMERI
Corollario 3.16 Sia r N, r 1; allora vale Nellesempio abbiamo:

luguaglianza:
1
1
0.57999 . . . = 0.57 +
+
+ =
1
1
1
1
1000 10000
+
+
+
=
,
10r
102r
103r
10r 1
1
= 0.57 + 0.01 = 0.58.
= 0.57 +
100
cioè la somma è uguale a una frazione il cui numeratore è 1 e il cui denominatore è costituito da r cifre Questa proprietà ci dice che i numeri con periodo 9 sotutte uguali a 9.
no dei doppioni, e quindi possono essere (anzi, devono
essere) ignorati. Da questo momento in avanti, quanProva: Basta applicare il lemma precedente:
do parleremo di rappresentazione decimale dei numeri, escluderemo, esplicitamente o implicitamente,
1
1
1
+ 2r + 3r + =
quelle che presentano il periodo 9.
r
10
10
10
Un altro passo può ora essere fatto considerando
1
1
1
un numero con una parte intera diversa da 0. Sia
= r 1 + r + 2r + =
a = dh dh1 . . . d1 d0 .c1 c2 . . . cr il numero decimale pe10
10
10
riodico che vogliamo considerare; per quanto visto,
r
1
1
1
10
= r
=
;
abbiamo:
10 1 1/10r
10r 10r 1
c1 c2 . . . cr
=
a = dh dh1 . . . d1 d0 +
questa espressione si semplifica dando quella deside10r 1
rata.
dh . . . d1 d0 10r + c1 c2 . . . cr dh . . . d1 d0
Questo corollario ci dice che il numero periodi=
.
10r 1
co 0.01 equivale alla frazione 1/99 essendo 0.01 =
1/100 + 1/10000 + . Lestensione a un numero del La quantità dh dh1 . . . d1 d0 10r + c1 c2 . . . cr è semplicemente la sequenza delle cifre che compongono a,
tipo 0.c1 c2 . . . cr è immediata:
senza il punto decimale e senza la soprallineatura del
0.c1 c2 . . . cr =
periodo; pertanto possiamo dire che a equivale a una
frazione cos` composta:
c1 c2 . . . cr
c1 c2 . . . cr
c1 c2 . . . cr
=
+
+
+ =
r
2r
3r
10
10
10
il numeratore si ottiene sottraendo le cifre della
c1 c2 . . . cr
parte intera dal numero composto di tutte le cifre
=
10r 1
di a senza punto decimale e soprallineatura;
cioè, il numero periodico 0.c1 c2 . . . cr equivale a una
il denominatore è il numero composta da tante
frazione il cui numeratore è costituito dalle cifre
cifre 9 quante sono le cifre del periodo.
c1 , c2 , . . . , cr e il cui denominatore è il numero composto di r cifre 9. Quindi, 0.324 = 324/999 = 12/37,
Lultimo passo è ora quello di considerare un nucome si può verificare direttamente eseguendo la di- mero periodico nella sua forma pi`
u generale, con una
visione. Unaltra conseguenza del precedente corol- parte intera dh dh1 . . . d1 d0 , un antiperiodo (cioè la
lario riguarda unanomalia della notazione decima- parte che segue il punto decimale, ma precede il pele, e cioè i numeri che presentano il periodo 9, come riodo) p1 p2 . . . ps , e un periodo c1 c2 . . . cr . Ma se s
0.579999. . .. Precisamente si ha:
sono le cifre dellantiperiodo, abbiamo:
Corollario 3.17 Un numero decimale che abbia come periodo 9 è equivalente a un numero decimale
finito.
Prova:
Se il periodo inizia dalla r-esima cifra
decimale, esso vale:
9
10r1
9
9
9
+ r+1 + r+2 + =
10r
10
10
1
1
9
1
1
+
+ = r1 = r1
10 102
10
9
10
a=
dh dh1 . . . d1 d0 p1 p2 . . . ps
+
10s
c1 c2 . . . cr
1 c1 c2 . . . cr
+
+
=
10s
10r
102r
c1 c2 . . . cr
dh dh1 . . . d1 d0 p1 p2 . . . ps
+ s r
=
=
10s
10 (10 1)
+
= (dh . . . d1 d0 p1 p2 . . . ps 10r + c1 c2 . . . cr
dh . . . d1 d0 p1 p2 . . . ps )/(10s (10r 1)).
Di nuovo, dh dh1 . . . d1 d0 p1 p2 . . . ps 10r + c1 c2 . . . cr

dove abbiamo applicato il corollario precedente. Que- è il numero composto da tutte le cifre di a senza il
sta quantità, sommata alla parte non periodica, dà un punto decimale e la soprallineatura. Possiamo perciò
chiudere questa sezione con il classico:
numero decimale finito.
77
3.4. I NUMERI REALI

Algoritmo 3.4 (Conversione in frazione)
Ingresso: a = dh dh1 . . . d1 d0 .p1 p2 . . . ps c1 c2 . . . cr ,
dove s pu`
o anche essere 0;
Uscita: La frazione equivalente ad a, ridotta ai
minimi termini.
1. si assegna a t il numero naturale costituito da
tutte le cifre di a, senza punto decimale e senza
soprallineatura, cioè:
t := dh dh1 . . . d1 d0 p1 p2 . . . ps c1 c2 . . . cr ;
2. si assegna ad f il numero naturale costituito dalle cifre della parte intera e delleventuale
antiperiodo di a, cioè:
f := dh dh1 . . . d1 d0 p1 p2 . . . ps ;
3. := t f ;
4. si assegna a il numero costituito da r cifre 9
(tante quante sono le cifre del periodo), seguite
da s cifre 0 (tanta quante sono le cifre dellantiperiodo; se s = 0 lantiperiodo manca e le cifre
0 non vengono generate);
5. := MCD(, );
6. se 6= 1, poniamo := / e := /;
7. i numeri e costituiscono il numeratore e il
denominatore della frazione corrispondente ad a
e ridotta ai minimi termini.
3.4
I numeri reali
Il teorema e lalgoritmo che hanno concluso la precedente sezione sono di fondamentale importanza per
approfondire il nostro concetto di numero. Poiche le
frazioni corrispondono ai numeri decimali finiti o periodici, i numeri razionali (cioè le stesse frazioni) non
possono esaurire tutti i numeri pensabili. E del tutto ovvio che esistono numeri decimali infiniti che non
sono periodici, come:
= 2.131133111333111133331 . . .
e infiniti altri se ne possono concepire sullo stesso
schema o su schemi analoghi. Per i Greci, che non
avevano una notazione decimale analoga alla nostra,
le cose non erano cos` semplici. Essi rappresentavano
i numeri come segmenti: fissato un segmento come
unità di misura, un numero era semplicemente il rapporto tra un segmento e lunità di misura, cioè la
sua lunghezza. A lungo essi credettero che fosse sempre possibile trovare un sottomultiplo comune tra il
segmento e lunità di misura. Questo equivale a dire che se questo sottomultiplo è la n-esima parte del
segmento e la m-esima parte dellunità di misura, la

misura del segmento è il numero razionale n/m. Lesistenza di un sottomutiplo comune era cos` intuitiva
che fino ai tempi di Pitagora si pensò che le cose non
potessero stare che in questo modo: si diceva che tutte le lunghezze sono commensurabili. Fu dunque uno
shock intellettuale notevole quando qualcuno (un discepolo di Pitagora, se non Pitagora stesso) dimostrò
che esistono lunghezze incommensurabili, cioè per le
quali non esiste alcun sottomultiplo comune con il
segmento fissato come unità di misura, per quanto
piccolo possiamo immaginare tale sottomultiplo. Le
grandezze che provocarono questa rivoluzione furono
il lato e la diagonale del quadrato
e questo, nei nostri
termini, vuol dire che il numero 2 non è un numero
razionale. I Pitagorici erano riuniti in una setta dalle
regole molto rigide e non divulgavano i loro segreti.
Si racconta che a rivelare la scoperta delle grandezze incommensurabili fu Ippaso di Metaponto, che poi
abbandonò la setta. I suoi ex compagni, comera luso
in questi casi, gli eressero una stele funeraria per dire
che per loro Ippaso era morto. Qui diamo la classica
dimostrazione per assurdo, notando che essa vale per
la radice quadrata di un qualsiasi numero che non sia
un quadrato perfetto:
2 non è un numero
Teorema 3.18 Il numero
razionale.
Prova: Supponiamo per assurdo che 2 sia un numero

razionale, e cioè esista una frazione m/n =
2, che possiamo supporre ridotta ai minimi termini. Elevando al quadrato si ha: m2 /n2 = 2, cioè
m2 = 2n2 . Il fattore 2, presente a destra, deve essere
presente anche a sinistra, cioè m deve essere divisibile
per 2, diciamo m = 2k. Lidentità diventa 4k 2 = 2n2 ,
ovvero 2k 2 = n2 . Questo significa, però, che 2 deve
essere anche un fattore di n, il che contraddice lipotesi che m/n fosse ridotta ai minimi termini, cioè che
m
ed n fossero primi tra di loro. Lipotesi che fosse 2 = m/n è quindi assurda e 2 non può essere
razionale.
Nota 3.4
I numeri reali sono pi`

u numerosi dei numeri naturali. Questa affermazione pu`
o essere considerata banale se si osserva, come sè fatto, che N R;
è meno banale se si ritorna alla teoria di Cantor e al
fatto che la frase significa: non esiste alcuna corrispondenza biunivoca tra N ed R. Questo è vero, come
fra poco vedremo, ma la dimostrazione non è affatto
banale.
Intanto, abbiamo introdotto, dopo N, gli insiemi numerici Z e Q, ma è facile vedere che essi sono numerabili. La dimostrazione è in pratica gi`
a stata effettuata
nel primo capitolo, ma pu`
o tornare utile rivederla nel
caso specifico. Se consideriamo Z come lunione di numeri positivi e negativi, cioè lunione disgiunta di due
78
CAPITOLO 3. NUMERI
insiemi numerabili, possiamo scrivere esplicitamente
la corrispondenza biunivoca con N:
0 0,
4 2,
1 1,
5 3,
2 1,
6 3,
3 2,
.
...
Anche Q pu`
o essere visto come il prodotto cartesiano
Z N0 , cioè di due insiemi numerabili; la corrispondenza biunivoca, limitata a Q+ è la seguente, derivata
da quella schematizzata nella Figura 1.3:
1/1
1/2
1/3
1/4
2/1
2/2
2/3
2/4
3/1
3/2
3/3
3/4
4/1
4/2
4/3
4/4
E facile vedere che la corrispondenza funziona, a maggior ragione per il fatto che le frazioni sono di pi`
u
dei numeri razionali.
Quando si arriva ai numeri reali le cose si complicano,
ma Cantor riusc` a dimostrare che la cardinalit`
a di R
è maggiore di 0 con una prova che costituisce unaltra pietra miliare nella tecnica matematica. Essa è
nota come diagonalizzazione di Cantor ed è stata pi`
u
volte utilizzata per dimostrare risultati importanti in
vari settori della Matematica e della Logica formale.
Vediamo in che cosa consiste e come si dimostra che
c > 0 .
Intanto, una semplice dimostrazione geometrica permette di stabilire che un qualsiasi segmento è equipotente a tutta la retta, cioè, in termini numerici, che un
intervallo aperto (a, b) è in corrispondenza biunivoca
con R.
X
C
r
X
Sia r la retta e, spezzato il segmento AB di modo

che A, B, C siano equidistanti dal punto P ed A, B
giacciano sulla parallela ad r passante per P , è facile vedere che la proiezione da P (che ad X, Y fa
corrispondere X , Y ) è una corrispondenza biunivoca. Allora, è sufficiente dimostrare che linsieme dei
numeri reali nellintervallo [0, 1) (immaginiamo che lo
0 sia presente; questo semplifica il ragionamento e non
cambia sostanzialmente la corrispondenza che abbiamo visto) ha cardinalit`
a maggiore di N0 perche la tesi
c > 0 sia provata. Supponiamo che tale corrispondenza esista e scriviamola, esprimendo i numeri reali
in forma decimale:
1
2
3
4
0.d1,1 d1,2 d1,3 d1,4 . . .

0.d2,1 d2,2 d2,3 d2,4 . . .
0.d3,1 d3,2 d3,3 d3,4 . . .
0.d4,1 d4,2 d4,3 d4,4 . . .
Nellintervallo [0, 1) i numeri hanno tutti la forma

0.d1 d2 d3 . . . e quindi di,j indica la j-esima cifra del
numero reale corrispondente al numero naturale i. In
questo elenco devono essere compresi tutti i numeri
dellintervallo, altrimenti la corrispondenza non sarebbe biunivoca. Costruiamo ora un numero reale
x = 0.x1 x2 x3 . . . con la seguente regola: xi deve essere
diverso da di,i e da 9. Il numero x sta nellintervallo
[0, 1) ed è un numero decimale legale visto che, per costruzione, non pu`
o avere periodo 9. Quindi deve essere
uno dei numeri dellelenco. Tuttavia, non pu`
o essere
il corrispondente di 1 perche x1 6= d1,1 ; non pu`
o essere
il corrispondente di 2 perche x2 6= d2,2 , e cos` via, non
pu`
o essere il corrispondente di n perche xn 6= dn,n .
Quindi x non si trova nellelenco, il che è assurdo e
prova che la corrispondenza biunivoca ipotizzata non
pu`
o esistere. Conclusione: c > 0 .
Come detto nella Sezione 1.4, si sa che c = 1 , cioè i

numeri reali sono tanti quanti i sottoinsiemi di N. Il
fatto che i numeri reali siano cos` numerosi ha molte interessanti applicazioni. Ad esempio, gli elementi
dellinsieme R\Q si dicono numeri irrazionali, e poiche
Q è numerabile, ne consegue che i numeri irrazionali
hanno cardinalit`
a c, cioè sono pi`
u numerosi dei razionali. Unaltra categoria di numeri che è facile contare
è costituita dai numeri algebrici: questi sono definiti
come le soluzioni reali delle equazioni algebriche, cioè
delle equazioni polinomiali a coefficienti razionali, ovvero a coefficienti interi, poiche a queste ci si riduce
sempre dalle prime moltiplicando per il denominatore comune (v. Sezione 5.2 per varie affermazioni che
stiamo facendo in questa Nota). Tutti i numeri razionali m/n sono algebrici, in quanto soluzione del
lequazione nx m = 0. Anche tutte le radici k m
sono numeri algebrici se k, m N; sono infatti soluzione dellequazione di grado k: xk m = 0. Sono
numeri algebrici anche le espressioni pi`
u complicate
che comprendono radicali
di
numeri
razionali,
come
p
p
3
(3 + 5/2 4 7)/ 2 5 2 e anche numeri che non
sappiamo esprimere come radicali. E noto infatti che
le equazioni di grado superiore al quarto non sono in
generale risolubili per radicali. Quindi, i numeri algebrici sono tantissimi; tuttavia, ogni equazione di grado
k ha al pi`
u k soluzioni reali e possiamo procedere in
questa maniera per dimostrare che i numeri algebrici
sono una quantit`
a numerabile.
Cominciamo con losservare che le equazioni algebriche di primo grado sono numerabili: esse hanno la
forma ax + b = 0 e quindi sono tante quante le possibili coppie ordinate (a, b) di numeri interi, che per`
o gi`
a
sappiamo essere numerabili. Perci`
o, i numeri algebrici
79
3.4. I NUMERI REALI

di primo grado (cioè le soluzioni delle corrispondenti
equazioni algebriche) sono numerabili. Passando alle
equazioni di secondo grado, come ax2 +bx+c = 0 possiamo immaginarle come coppie (a, bx + c) di numeri
e di equazioni algebriche di primo grado. Quindi anchesse sono numerabili e poiche i numeri algebrici di
secondo grado sono al pi`
u il doppio delle corrispondenti equazioni, anchessi costituiscono un insieme numerabile. Aggiunto al precedente, come sappiamo fin dal
primo capitolo, ci d`
a ancora un insieme numerabile.
Possiamo allora ripetere il ragionamento per le equazioni algebriche di terzo grado ax3 + bx2 + cx + d = 0,
viste come coppie (a, bx2 + cx + d), e provare che i
numeri algebrici di primo, secondo e terzo grado sono
una quantit`
a numerabile. Procedendo nella stessa maniera si arriva alla conclusione preannunciata, e cioè
che tutti i numeri algebrici costituiscono un insieme
numerabile.
I numeri non algebrici si dicono trascendenti e
possiamo ora affermare che essi costituiscono un
insieme di cardinalit`
a c. E stato dimostrato che
= 3.14159 . . ., il rapporto tra la circonferenza e il
diametro di un cerchio, ed e = 2.71828 . . ., la base dei
logaritmi naturali, sono numeri trascendenti. Anche
tante altre propriet`
a di questi numeri sono ben note,
ma noi, naturalmente, qui ci dobbiamo fermare.
Se tentiamo di forzare la nostra logica finita per

indulgere, come spesso si fa, a considerazioni che
coinvolgono linfinito, possiamo dare la seguente:
Pseudodefinizione: si intende per numero pseudoreale un numero intero D, seguito da un punto,
detto punto decimale, seguito da infinite cifre decimali che non siano definitivamente tutte uguali a
9.
Per luso del punto decimale si veda il punto 6 dellIntroduzione. Come abbiamo appena detto, definitivamente significa da un certo momento in poi,
senza ulteriore specificazione del punto del quale si
parla. Abbiamo già visto che senso ha la condizione
sul 9; notiamo invece esplicitamente che non si vieta che le cifre possano essere definitivamente tutte
uguali a 0: questa situazione corrisponde ai numeri
decimali finiti. Il punto debole di questa definizione,
ciò che la rende una semplice pseudodefinizione, è il
tentativo di voler attualizzare il concetto di infinito,
parlando di infinite cifre dopo il punto decimale.
Questo non ha molto senso e dobbiamo preferire una
definizione che faccia uso solo dellaspetto potenziale dellinfinito. Ad esempio, si potrebbe modificare
la pseudodefinizione e parlare di una corrispondenza
(nel senso del primo Capitolo) che associa ad ogni
posizione decimale (cioè dopo il punto) una cifra ben
definita. Cos`, associando ad ogni posizione la cifra 5, e definendo la parte intera come 3, si ha il
numero 3.555 . . ., corrispondente al numero razionale
3.5 = 32/9. Associando invece alle cifre di posto p
(p numero primo) la cifra 2 e a quelle di posto p non

primo la cifra 3 (la parte intera sia 1) , si ottiene il numero 1.22232323332 . . ., irrazionale perche i numeri
primi non presentano alcun tipo di periodicità.
Questa impostazione, però, presenta diversi inconvenienti. Ad esempio, lega la definizione a una specifica base, il 10, il che è chiaramente limitativo, se non
addirittura scorretto. Ci obbliga a cercare associazioni che funzionano cifra per cifra: questo può essere
molto complicato come nel caso del numero visto
in precedenza (provare per credere), o molto limitativo, come per il numero 0.12345678910111213 . . .. Ad
onor del vero, se non ci leghiamo a regole che funzionano cifra per cifra, questo metodo permette di
definire i numeri reali computabili, come sono trattati nella teoria della Computabilità. Purtroppo, questi
numeri hanno la cardinalità del numerabile e quindi
non comprendono tutti i numeri reali.
Nota 3.5
La notazione decimale dei numeri reali

estende quella dei numeri razionali, vista nella sezione
precedente. Ma mentre tutti i numeri razionali hanno
anche una rappresentazione finita, data dalla frazione
corrispondente, ci`
o non succede per i numeri irrazionali. Come abbiamo visto, possono esistere regole (o
leggi) di carattere finito che determinano la successione delle cifre decimali; altre volte esistono regole (o
leggi o algoritmi) che determinano tante cifre
decimali quante se ne vogliono, come succede per 2 e per
(si vedano le Sezioni 3.6 e 6.7). Si pone allora il problema di dare la migliore rappresentazione finita di un
numero reale. Di solito, sulla carta o nella memoria
di un elaboratore, si lavora con un certo numero di
cifre (la precisione); per semplicita desempio, supponiamo di fare i nostri conti con quattro cifre decimali.
Questo significa che dobbiamo ignorare la quinta cifra
e le cifre successive, creando unapprossimazione della
quantit`
a considerata. Se semplicemente troncassimo il
numero alla quarta cifra, avremmo dei problemi man
mano che si procede con i conti. Tali approssimazioni per difetto, infatti, tenderebbero ad accumularsi,
creando errori sempre pi`
u consistenti. Si operano allora approssimazioni per difetto e per eccesso secondo
una regola precisa:
1. se la quinta cifra decimale è 0, 1, 2, 3, 4, il
numero viene troncato alla quarta cifra;
2. se la quinta cifra decimale è 5, 6, 7, 8, 9, la quarta
cifra viene incrementata di 1 (ci`
o si pu`
o riflettere
anche sulle cifre precedenti).
In questo modo, avremo il 50% di approssimazioni per
difetto, secondo il caso 1, e il 50% per eccesso, secondo
il caso 2. Ad esempio:
3.14159 . . .
3.14153 . . .
3.14197 . . .
3.1416
3.1415
3.1420
In questo modo, gli 0 finali diventano significativi;

continuando lesempio, il numero 3.142 indica il
80
CAPITOLO 3. NUMERI
numero razionale finito 3.142, mentre 3.1420 indica
lapprossimazione di un numero (razionale o reale)
con almeno quattro cifre decimali. Queste regole si
ritrovano in Fisica; se una costante è specificata come
4.2, vuol dire che di essa si conosce una sola cifra
decimale: Se è specificata come 4.2000, significa che si
conoscono quattro cifre decimali e si sa che le ultime
tre sono 000 (o anche 1999, e la cifra successiva è
alta, 8 o 9 pur non essendo ancora nota).
Vedremo nella prossima sezione una costruzione

sensata dei numeri reali e giustificheremo il fatto che
tale costruzione è consistente con la pseudodefinizione
appena data. Qui, analogamente a quanto abbiamo
fatto per i numeri naturali, dedichiamo un po di tempo alla rappresentazione dei numeri reali e alla loro
conversione da una base allaltra. Dato un numero
decimale dk dk1 . . . d1 d0 .c1 c2 c3 . . ., rappresentazione
e conversione della parte intera dk dk1 . . . d1 d0 sono
già state considerate e quindi possiamo limitarci alla
parte decimale 0.c1 c2 c3 . . .. Come per la parte intera,
il caso pi`
u semplice si ha partendo con un numero
0.c1 c2 c3 . . . scritto in base b e cercandone la conversione in base 10. Anche questa volta basta applicare la regola posizionale, cioè il fatto che il numero
considerato è, per definizione:
A sinistra abbiamo ottenuto un numero (in base

b) la cui parte intera è c1 e la cui parte decimale è 0.c2 c3 . . .. Questo deve corrispondere al valore di destra, e in particolare la parte intera di
b 0.c1 c2 c3 . . . deve coincidere con c1 . In altre parole, la cifra b-aria c1 è data dalla parte intera del
prodotto b 0.c1 c2 c3 . . .. Iterando questo processo, si
ottengono via via le altre cifre c2 , c3 , . . .. Tutto ciò è
descritto dal seguente:
Algoritmo 3.5 (Conversione in base b)
Ingresso: un numero decimale C = 0.c1 c2 c3 . . . e due
numeri naturali b, n > 0;
Uscita: le prime n cifre del numero equivalente C =
0.c1 c2 c3 . . . in base b;
1. si pone i := 1;;
2. si pone ci uguale alla parte intera di b C;
3. si ridefinisce C come la parte decimale dello
stesso prodotto b C;
4. si incrementa i di 1;
5. se i n si torna al passo 2., altrimenti si è
finito.
Questo algoritmo, naturalmente, funziona qualunque sia il numero n, determinando n cifre del risultato; occorre stare attenti al numero delle cifre di C
+
+
+ .
0.c1 c2 c3 . . . =
b
per non correre il rischio di perdere precisione a causa
E quindi sufficiente eseguire i vari conti; ad esempio, delle varie moltiplicazioni. In effetti, se C è razionale, si può utilizzare la frazione equivalente, invece del
per 0.6427 si ha:
valore decimale. Consideriamo, come primo esempio,
6
4
2
la trasformazione di 0.944 in base 7; si procede cos`:
0.642 = + 2 + 3 = 0.944606413.
7 7
7
0.944 7 = 6.608
Può essere questo il momento di osservare che la
0.608 7 = 4.256
proprietà dei numeri razionali di corrispondere ai nu0.256 7 = 1.792
meri decimali finiti o periodici, non è limitata alla
0.792 7 = 5.544
base 10, ma vale in generale, come si capisce dalle di0.554 7 = 3.808
mostrazioni delle sezioni precedenti: basta sostituire
la base b alla base 10. La finitezza può essere interpretata come la presenza di un periodo 0, e questo Si ha pertanto 0.94410 = 0.64153 . . .7 , e dallo svilupci fa capire che un numero finito in una base b può po ottenuto si capisce facilmente che si otterrà un
essere un numero periodico in unaltra base b , e vi- numero periodico. La frazione 1/3 in base 5 si scrive:
ceversa. Qui abbiamo visto che 0.642, finito in base
1/3 5 = 5/3 = 1 + 2/3
7, diviene periodico in base 10. Nessuna meraviglia.
2/3 5 = 10/3 = 2 + 1/3
Per la conversione inversa, osserviamo quanto se1/3 5 = 5/3 = 1 + 2/3
gue; sia 0.c1 c2 c3 . . . un numero decimale (in base
10) e sia 0.c1 c2 c3 . . . il suo equivalente in una base

b qualsiasi. Avremo pertanto:
La prima frazione propria che si ripete, innesca il
calcolo di un periodo, e quindi si ha:
c1
c2
c3
+ 2 + 3 + = 0.c1 c2 c3 . . . .
b
b
b
1
= 0.310 = 0.135 .
3
Moltiplicando ora i due membri per b:
c1
c1 +
c2
b2
c3
b3
c2
c
+ 23 + = b 0.c1 c2 c3 . . . .
b
b
Il lettore è invitato a fare altri esempi e, in particolare, ad usare la base 2, per capire bene cosa fa
3.5. LA COSTRUZIONE DEI NUMERI REALI
81
proporre costruzioni di R che fossero concettualmente semplici, ma rigorose da un punto di vista formale. Tutte queste proposte, per ciò che si è detto,
coinvolgono oggetti matematici infiniti, cioè strutture contenenti un numero infinito di numeri razionali. Emblematico, a questo proposito, è il metodo delle
` linsezioni di Dedekind, nel quale un numero reale e
sieme di tutti i numeri razionali che gli sono minori
(o uguali); questo, automaticamente, definisce anche
linsieme dei numeri razionali che gli sono maggiori,
e questi due insiemi costituiscono
una sezione di Q.
dalla mantissa 1100010011001 . . ., con un nu- Ad esempio, il numero irrazionale 2 è dato da:
mero di bit legato allhardware e alle istruzioni
+
2
dellelaboratore (spesso 32, 64 o pi`
u);
Q
0 {q Q | q < 2};
un elaboratore elettronico. Allinterno di questo, un

numero come 12.3 è rappresentato nel modo seguente. Prima di tutto, lelaboratore converte il numero
in binario secondo il precedente algoritmo, ottenendo
1100.01001. In secondo luogo, divide questo numero
per unopportuna potenza di 2, in modo da portare l1 pi`
u a sinistra come prima cifra dopo il punto decimale. Nellesempio corrente, dividendo per 24
si ha 0.1100010011001. Il numero è univocamente
rappresentato:
dallesponente 4 cui occorre elevare il 2 per naturalmente, luguaglianza può essere considerata
riportare la mantissa alleffettivo valore del soltanto se il numero reale da definire è, di fatto, un
numero.
numero razionale.
Il metodo delle sezioni è abbastanza intuitivo; se,
Si osservi che tanto la mantissa quanto lesponente come facevano i Greci e facciamo anche noi nella Geopossono essere negativi; il numero scritto come coppia metria Analitica, pensiamo ad R come ad una retta,
(mantissa, esponente) si dice normalizzato.
un numero reale r è individuato dalle due semirette in
cui il punto corrispondente ad r divide la retta stessa. Questo implica la scelta sulla retta di un punto di
3.5 La costruzione dei numeri origine, di un verso (positivo) e di una unità di misura, seconda la quale r risulta la misura del segmento
reali
determinato dal punto e dallorigine fissata. In effetNelle sezioni precedenti abbiamo visto come i numeri ti, i Greci identificavano il concetto di numero reale
interi possano essere costruiti a partire dai nume- con quello della misura (in particolare, la misura delri naturali, e come i numeri razionali si costruiscano le lunghezze), e da ciò derivava la loro idiosincrasia
dai numeri interi. Le due costruzioni si assomiglia- per i numeri negativi. Nel metodo delle sezioni, dono abbastanza: 1) si considerano coppie di elementi vremmo immaginare la retta come costituita solo dai
dellinsieme numerico di partenza; 2) su tali coppie si punti razionali, sui quali fondare poi i numeri reali.
definisce una relazione di equivalenza; 3) si definisco- Per questo, limpostazione geometrica lascia perplesno le quattro operazioni di base e il confronto in modo si ed è meglio affrontare il problema da un punto di
da essere compatibili con la relazione di equivalenza; vista puramente numerico, come di fatto fa il metodo
4) si osserva infine che un sottoinsieme dellinsieme delle sezioni.
cos` costruito è identificabile con (è isomorfo a) linDaltra parte, il metodo delle sezioni non sembra
sieme di partenza. Questultima affermazione signi- avere un aggancio pratico consistente. Se vogliamo
fica che, effettuata lidentificazione, il risultato delle usare un numero reale (per sommarlo, confrontarlo,
operazioni e dei confronti è lo stesso, sia nellinsieme etc.) la sua sezione è ben poco utile, anzi ci impaccia
di partenza, sia nel sottoinsieme dellinsieme definito. perche introduce troppi numeri razionali, la maggioQueste costruzioni avvengono in termini finiti, cioè ranza dei quali nulla hanno a che vedere col numero
tutte le definizioni coinvolte operano su espressioni stesso. Ad esempio, i numeri 3,1/2 e 127/343 apfinite, ovvero le coppie che sono gli oggetti costituti- partengono tutti alla sezione di 2, ma
questo non
vi dellinsieme costruito. Questo, in modo intuitivo, ci è molto utile quando lavoriamo con 2. Preferiagiustifica il fatto che tanto Z quanto Q non vanno al mo pertanto un altro metodo che ci pare pi`
u consono
di là del numerabile.
ad un uso effettivo e che, comunque, mantiene quelPur ribadendo un procedimento già visto nella Se- la dote di intuibilità che caratterizza il metodo delle
zione 3.1, la costruzione dei numeri reali non può es- sezioni. Alla fine di questa sezione, comunque, risere altrettanto semplice. Come abbiamo osservato torneremo a considerare il metodo delle sezioni (ci si
nella Nota 3.4, la loro cardinalità è maggiore del nu- perdoni il bisticcio).
merabile, e questo significa che una costruzione fiRiprendiamo il concetto di sequenza o successione
nita, fatta di coppie o di terne di numeri razionali, già introdotta nella Sezione 3.3. Formalmente, posnon è ragionevolmente possibile. A partire dalla se- siamo specificare che in questa sezione considerereconda metà del 1800, i matematici hanno cercato di mo solo successioni di numeri razionali, cioè funzioni
82
CAPITOLO 3. NUMERI
a : N Q, per le quali si usa scrivere ak invece di

a(k), come per le altre funzioni. Spesso, una successione si indica con la notazione {ak }kN e possiamo
dare la seguente:
infatti il nostro avversario virtuale fissa = 1/1000,

ci basta considerare lelemento 2.131 (m = 3) e osservare che ogni altro elemento è minore di 2.132,
per essere sicuri che le differenze |an a3 | sono tutte
minori
di . Se poi costui fissasse come un miDefinizione 3.4 Una successione (di numeri raziolionesimo,
è sufficiente prendere lelemento 2.131133
nali) {ak }kN si dice di Cauchy se assegnato un nu(m
=
6),
per
assicurarsi che tutti i successivi elementi
mero razionale positivo (piccolo quanto si vuole),
sono
a
distanza
minore di da questo am . Quindi, la
è possibile determinare un indice m N tale che,
successione
`
e
di
Cauchy.
qualunque sia n > m, si abbia |an am | < .
Questa definizione è, riconosciamolo, abbastanza
astrusa e non è banale capirla di primo acchito. Cerchiamo allora di spiegare informalmente il suo significato per arrivare ad afferrarne, infine, il senso logico.
Una successione di Cauchy è, nelle nostre intenzioni,
una sequenza di numeri razionali i cui valori si vanno
concentrando sempre di pi`
u. Questo significa due cose: primo, che questi numeri razionali si avvicinano
tra di loro man mano che lindice della successione
cresce, e secondo che tutti (almeno da un certo punto
in poi) rimangono tra di loro a una distanza limitata.
Purtroppo, queste due condizioni coinvolgono un numero infinito di elementi della successione: quelli che
vanno da un certo punto in poi, e questo è difficile
da tenere sotto controllo con i nostri mezzi disgraziatamente finiti. Abbiamo già trovato questa difficoltà
quando abbiamo voluto esprimere il concetto che i
numeri naturali sono infiniti (v. Nota nella Sezione
1.4); abbiamo allora introdotto il criterio della scommessa, un metodo per parlare di infinito potenziale
che ci evita lintroduzione, surrettizia o meno, dellinfinito in atto. Intuitivamente, il restringersi e il
limitarsi dei valori della successione significa che la
distanza fra due elementi qualsiasi (purche abbastanza avanti nella sequenza) diviene sempre pi`
u piccola. Facciamo perciò la seguente scommessa contro un
ipotetico avversario: la successione è data e siamo
sicuri che essa è di Cauchy; se il nostro avversario
sceglie un numero (chiamiamolo ), piccolo quanto
vuole, un millesimo, un milionesimo o anche un miliardesimo, noi siamo capaci di trovare una posizione
nella nostra successione (diciamo, m), tale che tutti
gli elementi successivi differiscono da am per meno di
. E chiaro che se ci riusciamo per valori piccoli di ,
a maggior ragione ci riusciamo per valori grandi. Pertanto, la specifica piccolo quanto si vuole non ha
funzione logica, ma solo psicologica e potrebbe essere
cancellata (labbiamo messa, almeno, tra parentesi!).
Facciamo un semplice esempio; si consideri la
successione:
2 2.1
2.131133
2.13
2.131
2.1311331
2.1311
2.13113
2.13113311
...
la cui legge di formazione dovrebbe essere chiara. Essa è formata da numeri decimali finiti, cioè da elementi di Q, e il criterio della scommessa funziona bene. Se
Nota 3.6
I primi elementi della successione possono essere scelti anche a caso e presentare ampie variazioni. Ci`
o vuol dire, semplicemente, che dobbiamo
spostare in avanti il nostro indice m che ci assicura
la vincita della scommessa. Limportante è che, da
un certo momento in poi (cioè dopo m), si verifichi e
si possa accertare la vicinanza di tutti gli an ad am .
Come si dice, vogliamo che la differenza |am an | sia
minore dell avversario definitivamente, cioè per tutti
gli infiniti valori di n maggiori di m.
Vogliamo anche osservare che gli elementi della successione possono andare crescendo, come nellesempio
precedente, ma possono anche decrescere o oscillare:
lunica condizione essenziale è che non si allontanino
pi`
u di da am . Naturalmente, il criterio della scommessa ha senso se possiamo dimostrare che esso vale
realmente. Per questo è essenziale conoscere la regola
(o legge) di formazione della successione. In situazioni come quella dellesempio, ci si accorge, o si sa,
che la prima parte del numero rimane invariata e ad
ogni passo si aggiunge un decimale ulteriore. Questa è la ben nota regola del valori per difetto di una
certa quantit`
a, e analoga è la regola del valori per
eccesso. Pi`
u avanti vedremo di generalizzare queste
regole, ma il loro significato è ben noto, e son proprio esse a permetterci di valutare un numero reale
(che per ora, ricordiamo, non abbiamo ancora definito
propriamente).
Un punto delicato è il seguente. Si potrebbe pensare che se gli elementi di una successione si avvicinano sempre di pi`
u luno allaltro, allora la successione
sia sicuramente di Cauchy. In altre parole, pi`
u formalmente, si potrebbe sostituire al criterio di Cauchy la condizione che per ogni n > m si debba avere
|an+1 an | < , una condizione che potrebbe essere
pi`
u semplice da verificare. Purtroppo, questo non è
vero, come si prova col semplice esempio che stiamo
per fare, e la condizione di Cauchy va espressa come labbiamo definita, senza ulteriori semplificazioni.
Lesempio concerne i numeri armonici, cioè i numeri
definiti dalla relazione:
Hn = 1 +
1
1
1
+ + ... + ;
2
3
n
i primi elementi sono H1 = 1, H2 = 3/2, H3 = 11/6,

H4 = 25/12, e cos` via.; convenzionalmente, si pone
H0 = 0. Gli elementi della successione {Hk }kN si
avvicinano sempre di pi`
u, dal momento che Hn+1
Hn = 1/(n + 1), ma dimostriamo che essa cresce oltre
ogni limite:

Teorema 3.19 Se H2k è il 2k -esimo numero armonico, allora H2k > 1 + k/2 e quindi la successione dei
numeri armonici non è limitata.
83
ad r, cos` che possiamo affermare che la successione definisce r; sfrutteremo tra poco questa proprietà intuitiva. Prima di tutto, facciamo vedere che
esiste almeno un numero pseudoreale r con la proProva: Consideriamo ad esempio:
prietà desiderata. Si consideri = 10(k+1) e sia am
lelemento della successione di Cauchy per il quale
1 1
1
1
1
1
1
+ + + + + +
H8 = H 23 = 1 +
|am an | < 10(k+1) , qualunque sia n > m. Que2
6 {z 7
8}
|{z}
|3 {z 4} |5
sto significa che an coincide con am per tutte le cifre
decimali (oltre ovviamente alla parte intera) fino ale sommiamo i 2k1 elementi compresi tra 1/(2k1 +1) la k-esima compresa. Definiamo, in questo modo, la
e 1/2k . Si tratta ovviamente di 2k1 termini, ognuno
parte intera e le prime k cifre di r. A questo punto si
dei quali è maggiore di 1/2k . La loro somma è pertanha |an r| < 10k e quindi il criterio della scommesto maggiore di 1/2, e quindi, oltre all1 iniziale, H2k
o applicare ogni volta che il nostro avversario
è composto di k gruppi, ognuno dei quali vale almeno sa si pu`
abbia
posto
= 10k . Che poi tale r sia unico, di1/2. Da questo discende laffermazione del teorema.
scende dallosservazione che se r 6= r godesse delle
stesse proprietà, dovrebbe esistere un indice k per il
I numeri armonici costituiscono una successione quale la k-esima cifra dopo il punto decimale relativa
importante e perci`
o avremo modo di incontrarli di ad r `
e diversa dalla k-esima cifra di r . Si ha allora
nuovo in queste note.
|r r | > 10(k+1) . Daltra parte, per definizione,
posto = 10(k+1) , esistono due indici m ed m per
i quali si ha |r an | < e |r an | < , qualunque
A questo punto, possiamo cercare di aiutare la no- sia n maggiore del pi`
u grande fra m ed m . Poiche
stra intuizione portando avanti, e distinguendo accu- il valore assoluto di una somma è sempre minore o
ratamente, sia un discorso rigoroso sulla natura dei uguale alla somma dei valori assoluti, segue:
numeri reali, sia un discorso meno rigoroso, ma pi`
u
suggestivo, su come possiamo pensare a tali nume|r r | = |r an (r an )|
ri. Riprendiamo il concetto di numero pseudoreale
|r an | + |r an | < + < 10k .
introdotto nella precedente sezione. Come osservato
per = 2.131133 . . ., aggiungere una cifra decima- Questa disuguaglianza contraddice quanto avevamo
le alla volta ci permette di ottenere una successione trovato in precedenze, rivelando che lesistenza di due
di Cauchy che definisce il numero per difetto. Pos- valori distinti r ed r non è possibile.
siamo immaginare altre successioni di Cauchy, come
A questo punto, possiamo essere ragionevolmente
la sequenza delle approssimazioni (decimali) per eccesso, e vedremo pi`
u avanti il caso del calcolo della convinti che ogni successione di Cauchy determina
radice quadrata col metodo di Newton e il calcolo un numero (pseudo)reale; come osservato, il viceverdi col metodo della media aritmetico/geometrica. sa è ovvio e quindi lidentificazione dei due concetti
Comunque, i metodi di questo genere portano a par- si presenta del tutto naturale (almeno per un mateticolari successioni di Cauchy, quelle appunto in cui matico). Dobbiamo però superare un ultimo ostacoè esplicitamente suggerito essere della forma 10m e lo: ogni successione di Cauchy determina un unico
u
gli elementi della successione aumentano di una o pi`
u pseudoreale, ma a questo possono corrispondere pi`
cifre decimali alla volta. Tanto vale, allora, definire successioni; ad esempio, una successione di valori per
le successioni di Cauchy in termini generali e rigorosi difetto e una per eccesso. Definiamo allora:
e usarle poi per la definizione dei numeri reali come
Definizione 3.5 Due
successioni
di
Cauchy
la vedremo tra breve.
{ak }kN e {bk }kN si dicono equivalenti se per ogni
Per sottolineare meglio il rapporto tra le succes razionale positivo, esiste un indice m tale che per
sioni di Cauchy e la pseudodefinizione precedente,
ogni n > m si abbia: |an bn | < .
insistiamo dimostrando il seguente:
Pseudoteorema: Per ogni successione di Cauchy
Si osservi prima di tutto che, a differenza di quanto
{ak }kN esiste uno ed un solo numero pseudoreale r abbiamo fatto nella prova del precedente pseudoteotale che, fissato un qualsiasi numero razionale po- rema, la differenza an bn è fatta tra numeri razionali,
sitivo, esiste almeno un indice m tale che, qualunque e quindi ha perfettamente senso. La definizione è insia lindice n > m, si ha che an differisce da r per tuitivamente chiara: due successioni sono equivalenti
meno di .
se si avvicinano sempre di pi`
u quando le confrontiamo
Prova: Si osservi che lo pseudoteorema è un mo- termine a termine. Anche qui applichiamo strategido complicato di dire che gli elementi della successio- camente il criterio della scommessa: le due successione si accumulano definitivamente sempre pi`
u vicino ni si avvicinano se, fissato piccolo ad arbitrio dal
84
CAPITOLO 3. NUMERI
nostro avversario, riusciamo a stabilire che ogni differenza |an bn | è definitivamente minore di tale .
Questo è evidente, ad esempio, quando si considerano le approssimazioni per difetto e per eccesso di un
numero reale. Il punto importante è, comunque, che
siamo di fronte a una relazione di equivalenza, come
il nome suggerisce:
poiche operazioni e confronto sono parte essenziale

della nostra idea intuitiva di numero. Cominciamo
con la somma: dati due numeri reali r ed s come
classi di equivalenza [{ak }kN ] e [{bk }kN ], la loro
somma è definita come r + s = [{ak + bk }kN ]. Affinche questa definizione abbia senso, occorre dimostrare
tre cose:
la proprietà riflessiva si riduce a |an an | = 0 <

, il che è banale;
1. che la sequenza {ak + bk }kN è una successione

di Cauchy, altrimenti saremmo fuori dellambito
dei numeri reali come li abbiamo appena definiti;
la propietà simmetrica è anchessa ovvia poiche

|an bn | = |bn an | e se luno è minore di , tale
è anche laltro;
la proprietà transitiva è un po pi`
u complessa;
siano {ak }kN , {bk }kN e {ck }kN tre successioni tali che la prima sia equivalente alla seconda e
questa alla terza. Fissato , cerchiamo un indice
m per cui |an bn | < /2 (per ogni n > m) e
un indice m per cui |bn cn | < /2 (per ogni
n > m ). Se ora M è il pi`
u grande fra m ed m ,
per ogni n > M si ha:
|an cn | = |an bn + bn cn |
2. che la definizione di somma è indipendente dalle successioni scelte a rappresentare la classe,

altrimenti la somma non sarebbe compatibile
con la relazione dequivalenza e loperazione non
sarebbe pi`
u sotto controllo;
3. che se r ed s corrispondono a due numeri razionali r ed s allora la somma r + s come classe dequivalenza di successioni di Cauchy coincide con il numero razionale r + s ; questo permette di concludere che i numeri reali sono davvero unestensione dei numeri razionali che già
conosciamo.
+ = ,
2 2
Fissato > 0 dal nostro avversario, siano m e p i
valori
per cui, rispettivamente, si ha |am an | < /2
e questo ci dà lequivalenza tra la prima e la terza
per
ogni
n > m, e |bp bn | < /2 per ogni n > p.
successione.
Poniamo M al valore del pi`
u alto fra m e p, cos` che
Possiamo finalmente dare la vera definizione:
si ha:
|(aM + bM ) (an + bn )|
Definizione 3.6 Si dicono numeri reali le classi di
equivalenza delle successioni di Cauchy secondo la
|aM an | + |bM bn | < + = .

precedente relazione.
2 2
|an bn | + |bn cn | <
Intuitivamente, supponiamo che una successione

di Cauchy determini un numero pseudoreale r e che
unaltra successione, equivalente alla prima, determini un altro numero pseudoreale r . Per lequivalenza
delle successioni deve essere r = r e quindi tutte le
successioni di una classe determinano lo stesso numero pseudoreale. Astraendo, possiamo finalmente lasciar perdere i numeri psudoreali, che essendo pseudo ci sono ora di impaccio e basta, e consideriamo,
secondo la definizione, un numero reale come la classe di tutte le sequenze di Cauchy equivalenti tra di
loro. Se una persona riesce a superare lo shock de` una classe di
rivato dal fatto che un numero reale e
successioni di Cauchy, si rende conto che la definizione è perfettamente corretta, formalmente accettabile
e semanticamente utile e ineccepibile.
Come abbiamo osservato fin dal principio, la definizione di numero reale non conclude il nostro lavoro:
occorre ora far vedere che anche le quattro operazioni
di base e il confronto sono compatibili con tale definizione ed estendono le analoghe operazioni sui razionali. In mancanza di questo, tutto verrebbe a cadere,
Per dimostrare che la somma è indipendente dalle

particolari successioni {ak }kN e {bk }kN che abbiamo considerato, sia {ak }kN equivalente a {ak }kN ,
e {bk }kN equivalente a {bk }kN . Fissato un > 0
arbitrario, siano m ed m tali che |an an | < /2 per
ogni n > m, e |bn bn | < /2 per ogni n > m ; per
ogni n pi`
u grande del maggiore tra m ed m si ha
allora:
|an +bn (an +bn )| |an an |+|bn bn | <

+ =
2 2
che prova lequivalenza della somma delle diverse successioni. Infine, se r ed s sono razionali, esiste fra le
successioni della classe di equivalenza di r la successione costante i cui elementi sono tutti uguali ad r ,
il razionale che identifichiamo con il numero reale r.
La stessa cosa vale per s se anchesso è razionale. Si
vede allora facilmente che la somma di r ed s come
numeri reali, data dalla successione costante r + s
viene ad essere identificata proprio con il numero razionale r + s . (Consigliamo di seguire almeno due
volte questo ragionamento).
85

Esattamente nello stesso modo si procede per la
differenza. Per quanto riguarda il confronto, un ovvio risultato è che dati due numeri reali r ed s per
mezzo di due successioni di Cauchy {ak }kN per r e
{bk }kN per s, essi sono uguali se e solo se definiscono la (o appartengono alla) stessa classe di equivalenza. Analogamente semplice è osservare che r > s
oppure r < s se e solo se la successione delle differenze [{ak bk }kN ] è definitivamente composta di
elementi positivi oppure è definitivamente composta
di elementi negativi.
La moltiplicazione richiede un ragionamento pi`
u
delicato. Siano r ed s due numeri reali definiti come sopra e si consideri il prodotto definito da rs =
[{ak bk }kN ]. Per la limitatezza delle due successioni
di Cauchy prese a rappresentare r ed s, esistono due
numeri razionali, chiamiamoli a e b, che sono maggiori (in valore assoluto) rispettivamente di tutti gli elementi di {ak }kN e di tutti gli elementi di {bk }kN .
Fissato positivo (ma comunque piccolo) sia m lindice corrispondente alla relazione |am an | < /(2b)
(per ogni n > m) e p lindice per cui |bp bn | < /(2a)
(per ogni n > p). Sia ora M il pi`
u grande fra m e p;
per ogni n > M si ha allora:
|aM bM an bn | = |aM bM an bM + an bM an bn | =
= |(aM an )bM + an (bM bn )|
|aM an | |bM | + |an | |bM bn | <
b+a
= .
2b
2a
Questo dimostra che la successione che definisce il

prodotto di r per s è una successione di Cauchy, quindi non rimane che provare come la definizione sia indipendente dalle due successioni scelte. A questo punto il lettore dovrebbe aver capito come si procede in
modo formale e quindi ci rifiutiamo di procedere oltre
con sviluppi in buona parte scontati. Lo stesso lettore, invece, è vivamente consigliato di riprendere foglio
e matita (se per caso li avesse riposti: male, male!) e
impegnarsi a portare avanti tutti i passaggi necessari. Se poi r ed s sono razionali, la compatibilità dei
risultati è di nuovo ovvia.
Per quanto riguarda la divisione, conviene prima
definire loperazione per il calcolo dellinverso, cioè
s1 = 1/s, e quindi osservare che r/s = rs1 . Anche
per linverso dobbiamo dimostrare tutti e tre le condizioni viste per la somma. Se il numero reale s 6= 0
è definito dalla classe [{ak }kN ], dobbiamo supporre (senza per questo venir meno alla generalità dei
nostri ragionamenti) che tutti gli elementi della successione siano diversi da 0; ha allora senso definire la
successione {1/ak }kN e assumerne la classe di equivalenza come il numero reale s1 . Ci limiteremo ora
a dimostrare la prima condizione, e cioè che la nuova
successione non esce dallambito delle successioni di
Cauchy; lasciamo poi che il lettore si cimenti a dimostrare che la definizione è indipendente dalla successione scelta e che essa è compatibile con loperazione
di inverso nei numeri razionali.
Sia a 6= 0 un numero razionale maggiore, in valore
assoluto, a tutti i numeri della successione {ak }kN ;
tale numero esiste per la limitatezza della successione.
Fissato > 0 a piacere, determiniamo un indice m
per il quale |am an | < a2 per tutti gli n > m; si ha
allora:

1
1 am an |am an |
a2
<
=
am
an am an
a2
a2
e questo conclude il nostro lavoro.

Le successioni di Cauchy, come abbiamo appena
visto, costituiscono un metodo, astratto ma effettivo, di definire i numeri reali. Il nostro insistere sulle
approssimazioni per difetto e per eccesso non riveste
un aspetto casuale: spesso, la determinazione di un
numero reale eseguita valutando un numero sempre
maggiore di cifre decimali (anche una alla volta) può
essere una procedura effettiva ed anche efficiente. Altre volte, il numero è isolato valutando un intervallo di numeri razionali che lo contiene, e ad ogni passo lintervallo viene dimezzato: si hanno cos` ancora
approssimazioni per difetto e per eccesso, ma invece
di determinare una cifra decimale, si determina una
cifra binaria dopo laltra; in definitiva, non cè poi
una grande differenza. Come abbiamo detto, accanto
a questi metodi ne esistono altri che permettono di
valutare pi`
u cifre alla volta: capito il procedimento,
in linea di principio tutti i metodi vanno bene, ma si
possono avere comportamenti molto diversi dal punto
di vista dellefficienza del calcolo.
Lidea di poter identificare linsieme dei numeri reali R con la retta della Geometria, ha portato alleseguenti considerazioni. Si torni per un attimo a 2,
che non è razionale per il Teorema 3.18. Possiamo
allora dividere linsieme Q in due parti disgiunte:
+
2
Q< = Q
0 {q Q | q < 2}
Q> = {q Q+ | q 2 > 2}.

Chiaramente, Q< Q> = Q e Q< Q> = ; daltra
parte, per il citato teorema, Q< non ha alcun elemento massimo e Q> non ha alcun elemento minimo.
Questo ricorda un po la proprietà degli interi di essere discreti, anche se il buco fra Q< e Q> è per
cos dire infinitesimo, e non vasto come quello tra 5
e 6. Nella retta R della Geometria tali buchi proprio
non esistono e quindi, se vogliamo che R possa essere
identificato con R, dobbiamo escludere che si verifichi
un fenomeno come quello dei razionali.
Per essere pi`
u specifici, definiamo sezione di Q ogni
coppia (Q1 , Q2 ) tale che: i. (q1 Q1 ) e (q2 Q2 )
86
CAPITOLO 3. NUMERI
si abbia q1 < q2 ; ii. Q1 Q2 = Q; iii. Q1 Q2 = .

Come abbiamo accennato allinizio di questa sezione,
il metodo di Dedekind definisce i numeri reali come
sezioni dellinsieme dei numeri razionali; in particolare, una sezione (Q1 , Q2 ) di Q corrisponde a un numero razionale se Q1 ha elemento massimo (oppure se
Q2 ha elemento minimo, ma convenzionalmente questo caso non si considera). Di conseguenza, i numeri
irrazionali corrispondono alle sezioni di Q in cui Q1
non ha massimo e Q2 non ha minimo. Se ora, in modo analogo a quanto fatto per Q, definiamo le sezioni
in R, questultimo caso non si deve verificare, per non
creare quella sorta di buco che si diceva, e ciò si pone
come assioma:
Assioma (di continuit`
a) Sia (R1 , R2 ) una sezione di R. Allora R1 ha un elemento massimo oppure
R2 ha un elemento
minimo.
2
Nel caso di 2, definendo
R1 = R {x R | x
2}, allora R1 possiede 2 come elemento massimo,
mentre definendo R1 = R {x R | x2 < 2} si
fa s` che R2 venga a contenere lelemento massimo
2. Lassioma afferma che non vi possono essere altri
modi per dividere R nel punto corrispondente a 2.

Questo concetto di continuità ha un ruolo molto
importante nel concetto di limite, e lo ritroveremo
appunto quando affronteremo tale argomento nella
Sezione 8.4. Ad esso è legato il concetto di intervallo:
Definizione 3.7 Si dice intervallo di estremi a, b
R linsieme di tutti i numeri reali x tali che a x
b. Propriamente, questo si dice un intervallo chiuso,
in quanto comprende i suoi estremi, e si indica con
la notazione [a, b]. Si dice invece intervallo aperto
linsieme dei numeri reali x tali che a < x < b, che
non comprende perci`
o gli estremi a e b; tale intervallo
si indica con (a, b). Si usano anche intervalli misti
come [a, b), chiuso a sinistra e aperto a destra, e (a, b]
aperto a sinistra e chiuso a destra.
3.6
Potenze, radici, logaritmi
I numeri reali sono lambiente ideale per parlare di

potenze e, quindi, delle loro operazioni inverse, le radici e i logaritmi. Abbiamo già introdotto queste operazioni per i numeri naturali, e come questi si sono
estesi agli interi, ai razionali e ai reali, cos` lo stesso
tipo di estensione deve essere fatta per le potenze. Intanto, la base di partenza rimane la stessa e se r R,
n N, si definisce:
0
r =1
rn+1 = r rn .
se q è un numero razionale, q = n/m, cosa vuol dire

rq = rn/m ? E se infine s è un numero reale, ha senso
una potenza come rs , e, se ha senso, qual è il suo
valore?
Cominciamo con i numeri interi, dei quali ci interessano i negativi, visto che i positivi coincidono
con i naturali e le potenze con tali esponenti sono
state definite un attimo fa. Per i numeri reali vale
la stessa regola vista per i naturali: rm+n = rm rn ;
la dimostrazione è esattamente la stessa. Naturalmente, se estendiamo le potenze agli esponenti negativi, vogliamo che questa regola continui a valere, altrimenti dovremmo considerare proprietà diverse per due operazioni che, invece, vorremmo vedere
come una sola. Pertanto vogliamo che sia: rm rm =
rm+(m) = r0 = 1; ma questo significa che rm è
linverso di rm , cioè, in termini di numeri reali, deve
essere rm = 1/rm . Questa è una buona definizione
e conferma cose che già ci sono note: abbiamo visto
che per i numeri naturali abbiamo k mn = k m /k n se
m n; interpretando k come numero reale, questo
significa k mn = k m (1/k n ), proprio la regola appena
vista, anche se limitata a k N ed m n. Questo è
molto confortante.
Visto il successo con i numeri negativi, poniamoci
il problema di definire cosa significa rm/n , cominciando col supporre m, n > 0. Anche qui ricordiamo che
per i numeri naturali vale la regola (k m )n = k mn ,
che naturalmente vogliamo conservare. Dovrà essere allora (rm/n )n = rnm/n = rm , e in particolare
(r1/n )n = r1 = r. Questa condizione ci fa venire in
mente come, per definizione, il numero che elevato
alla potenza n-esima ci dà r è ciò che si chiama laradice n-esima di r: ma allora deve essere r1/n = n r.
Per i numeri naturali eravamo condizionati dal fatto che r doveva essere una potenza n-esima perfetta.
Qui, tra i numeri reali, questa condizione non è pi`
u
necessaria e ogni numero reale positivo può essere visto come potenza n-esima perfetta, come vedremo ora
con un esempio. E bene osservare esplicitamente che
la cosa non è vera per i numeri reali negativi; 4 non
può essere un quadrato perfetto, poiche il quadrato
di un numero reale è sempre una quantità positiva.
Allora vediamo che 2, come numero reale, è un cubo
perfetto, cioè è il cubo di un qualche numero reale.
Applichiamo quanto detto nella sezione precedente:

si comincia
con losservare che 13 < 2 < 23 e quindi
3
1 < 2 < 2, il che ci dà una prima
approssimazione
per difetto e per eccesso di 3 2. Possiamo migliorare lapprossimazione provando successivamente per
1.1, 1.2, 1.3, . . . ; si trova facilmente anche a mano
1.13 = 1.331, 1.23 = 1.728, 1.33 = 2.197. Qui
ci posMa se lesponente non è un numero naturale, ci chie- siamo arrestare e abbiamo trovato 1.2 < 3 2 < 1.3.
diamo, possiamo dare un significato alla potenza? Ad Cerchiamo di migliorare ancora trovando lapprossiesempio, se k < 0 è un intero, cosa significa rk ? E mazione a meno di un centesimo; osservando dai de-
87
3.6. POTENZE, RADICI, LOGARITMI
u vicina a 1.3 che a 1.2, proviamo

cimali che 3 2 è pi`
a partire da 1.25, 1.26, . . . . Anche questa volta si
3
3
ha subito
1.25 = 1.953125, 1.26 = 2.000376, per cui
1.25 < 3 2 < 1.26. Come si vede dal cubo, 1.26 è
unapprossimazione già molto
buona e infatti con un
qualsiasi calcolatore si trova 3 2 1.2599210498, cioè
lerrore che si commette ponendo 3 2 = 1.26 è minore
di un decimillesimo.
A questo punto possiamo definire ogni potenza che
ha come esponente un numero razionale
n/m; si ha
n
n/m
1/m n
m
infatti:
r
=
(r
)
=
(
r)
=
(rn )1/m =
m
rn . Poiche m è un intero positivo ed n è un intero qualsiasi, entrambe le operazioni di elevamento a potenza e di radice sono ben definite. Osserviamopesplicitamente che se n è negativo, si ha:
rn/m = m 1/r|n| .
Lultimo passo consiste nel definire rs quando s sia
un numero reale qualsiasi, cioè, in pratica, sia un numero irrazionale. Intanto, se s è negativo, per essere
coerenti con quanto affermato fin ora, dobbiamo porre: rs = 1/r|s| . Supponiamo allora che s sia positivo e consideriamo due successioni {si }iN e {si }iN
di numeri razionali (la prima crescente e la seconda decrescente) che determinano s, cioè lo approssimano per difetto e per eccesso. Sappiamo calcolare
rsi e rsi e quindi possiamo ottenere approssimazioni per difetto e per eccesso di rs , la cui differenza
rsi rsi = rsi (1 rsi si ) diviene piccola quanto si

vuole al crescere di i: infatti, per ipotesi, la differen
za si si tende a diventare 0 e quindi rsi si tende

a diventare 1. In questa maniera, rs risulta definito
come numero reale.
Calcoliamo, come esempio, ; come prima approssimazione abbiamo 3 < < 4 e questi numeri li
sappiamo calcolare. Poi abbiamo 3.1 < < 3.2 e
possiamo calcolare anche queste limitazioni in quanto
3.1 e 3.2 sono numeri razionali: qui non ci dobbiamo
preoccupare della difficoltà di tali calcoli; quello che
ci interessa è laspetto teorico dellapprossimazione e
non il tempo impiegato ad ottenerla; questo fa parte
della complessità degli algoritmi e, tradizionalmente,
si chiama stenaritmia. Come già detto, andando
avanti calcoleremo 3.14 < < 3.15 , e cos` via,
restringendo sempre di pi`
u lintervallo che comprende . Nella Tabella 3.2 riportiamo i primi passi,
ricordando che si ha 36.4621596072.
Le proprietà formali delle potenze, pur cos` estese, rimangono quelle già viste per i numeri naturali,
senza pi`
u il vincolo delle potenze perfette:
rs rt
(rs )t
r0
r1
0s
=
=
=
=
=
rs+t
rst
1
r
0
ma
rs /rt
rs v s
1s
1
r
00
=
=
=
=
=
rst
(rv)s
1
1/r
1
Qui, ricordiamo, le basi r e v sono numeri reali po-
sitivi, mentre gli esponenti s e t sono numeri reali

qualsiasi, anche negativi. Abbiamo
avuto modo di
osservare come (3)1/2 = 3 non ha significato

dal momento che nessun numero elevato al quadrato può dare un numero negativo come 3. Quindi,
in generale, non possiamo prendere in considerazione potenze reali di numeri negativi. Questo naturalmente non vuol dire che, in casi particolari, non
abbiano senso anche tali potenze. Infatti, mentre r2k
(k N) è sempre positivo, r2k+1 ha lo stesso segno di r e quindi sono definite
le radici dispari di
numeri negativi. Ad esempio, 3
8 = 2, in quanto
= 3; ma, in
(2)3 = (2)(2)(2) = 8, e 5 243
4
16
(attenzione!
modo altrettanto
ovvio,
non
esiste
scrivere 4 16 = 4 è uno strafalcione che è opportuno evitare per scansare sacrosante rappresaglie da
parte del docente).
Dalla precedente definizione r1/m = m r, siha

unovvia estensione a tutti i numeri reali: r1/s = s r,
che definisce completamente il concetto di radice
come operazione inversa dellelevamento a potenza,
quando questa regola si legga da destra verso sinistra. Si hanno allora le seguenti proprietà, conseguenza diretta della definizione e delle proprietà delle
potenze:
st
s
r t r = r1/s r1/t = r(s+t)/st =
rs+t
p
t s
s
s
s
ts
r
r v =
rv
r =
s
s
1 = 1
0 = 0 (s 6= 0).
La radice che si trova pi`
u di frequente è naturalmente la radice quadrata e per questo si sono
sviluppati algoritmi che permettono il calcolo di r in modo diretto e senza incorrere nelle lungaggini di trovare
per tentativi un
decimale dopo laltro, come si è fatto
per calcolare 3 2. Lalgoritmo che viene insegnato è
laborioso, ma effettivo:
Algoritmo 3.6 (La radice quadrata)
Ingresso: un numero reale s = dr dr1 . . . d1 d0 .c1 c2 . . .
e un numero naturale k;
Uscita: la rappresentazione decimale di s con k

cifre decimali;
1. a partire dal punto decimale, si divide la parte
intera di s in blocchi di due cifre; la parte decimale è anchessa divisa in k blocchi, utilizzando 2k cifre decimali, aggiungendo eventualmente
alcuni 0 per raggiungere tale numero;
2. sia a il valore del primo blocco a sinistra, cioè
a = dr oppure a = dr dr1 ; si pone come prima
cifra del risultato, fr/2 , la massima cifra f tale
che f 2 a;
3. sia la differenza a f 2 ;
4. per ogni ulteriore blocco in cui sia stato suddiviso
s:
88
CAPITOLO 3. NUMERI
3
3.1
3.14
3.141
3.1415
3.14159
31.00628
34.76679
36.39574
36.43743
36.45829
36.46204
<
<
<
<
<
<
<
<
<
<
<
<
97.40909
38.98339
36.81477
36.47916
36.46246
36.46246
4
3.2
3.15
3.142
3.1416
3.14160
Tabella 3.2: Calcolo di

(a) si considerano le cifre della radice x0 = 1:
fr/2 fr/21 . . . fj finora ottenute e si

2
3
1
chiama a il doppio del numero da esse
1+
= = 1.5
x1 =
2
1
2
rappresentato;
1 3
17
2
x
=
=
+
= 1.41666
2
(b) si abbassa il blocco corrente, nel senso che
2 2 3/2
12
a si aggiungono le due cifre del blocco
2
577
1 17
+
=
= 1.4142156
x3 =
considerato: := 100 + 10 d + d1 ;
2 12 17/12
408
(c) si cerca la massima cifra f tale che (10 Come si vede, già dopo 3 iterazioni il valore ottenuto
a + f ) f ; tale cifra si aggiunge come è abbastanza buono; la quarta iterazione dà 12 cifre
cifra ulteriore del risultato;
decimali esatte, e cos` via. Naturalmente, ci accor(d) se ci sono altri blocchi da elaborare, si cicla giamo che il valore ottenuto è buono quando la differenza dal valore ottenuto alliterazione precedente è
tornando al punto 4a);
trascurabile.
5. si mette il punto decimale dopo la r/2-esima cifra
Il lettore è fortemente invitato a formulare lalgoritdel risultato, e si esce.
mo che realizza questo metodo e a scrivere e provare
un programma sullelaboratore. Il metodo può essere
Limpostazione delloperazione
è quella della Figu- adottato anche al calcolo delle altre radici, ma per
ra 3.1, dove si cerca 200 con 3 cifre decimali. Lal- questo rimandiamo allesposizione generale del megoritmo risale a Fibonacci, ma il metodo pi`
u semplice todo di Newton come si trova nei testi di Calcolo
3
ed interessante per trovare la radice quadrata di un Numerico. Invitiamo però il lettore a calcolare
2
numero risale ai Babilonesi, anche se oggi è di soli- mediante la formula iterativa:
to citato come metodo diNewton. Sia r un numero
1
r
reale e si voglia calcolare r; se x0 è unapprossimaxn+1 =
2xn + 2
3
xn
zione di tale radice, è immediato dimostrare questa
proprietà:
dove r = 2 e x0 = 1.
Naturalmente, una espressione aritmetica può conTeorema 3.20 Sia r un numero
reale positivo
e sia tenere una o pi`

u radici; se queste si trovano a denox0 unapprossimazione
di r. Se x0 < r allora
minatore
di
una
frazione, è preferibile eliminarle con
r/x0 > r, mentre se x0 > r allora r/x0 < r.
una tecnica che è detta
di razionalizzazione. Si consi
Prova: Si consideri il caso x0 < r; se fosse anche deri ad esempio 1/ 3, che risulta di difficile calcolo;
se moltiplichiamo numeratore e denominatore per 3

r/x0 < r, moltiplicando
membro a membro, avremmo: x0 r/x0 < r r, cioè r < r, il che è assurdo. si ottiene:
Analogamente si procede nellaltro caso.

3
1.732
1 3
1
= =
0.577,
Stando
3
3
3
3 3
cos` le cose, qualunque sia lapprossimazione
x0 di r, se eseguiamo la media: x1 = (x0 + r/x
0 )/2, una forma molto pi`
u ragionevole. Se a denominatore
questa sarà unapprossimazione migliore a r di
cè una somma o una differenza di radicali quadratici
quanto non lo fosse x0 . Possiamo ora applicare iteraconviene procedere in questo modo:
tivamente il metodo ad x1 e ottenere unapprossima
zione ancora migliore, e cos` di seguito. Il merito di

2
2( 6 + 2)
=

=
Newton è stato quello di dimostrare che questo algo6 2
( 6 + 2)( 6 2)
ritmo trova
velocemente approssimazioni molto accu
rate
6+ 2
2( 6 + 2)
di r. Vediamo infatti come si possa determina=
.
=
re 2 1.414213562 partendo dallapprossimazione
62
2
89
3.6. POTENZE, RADICI, LOGARITMI
2
1
1
0 0.
0
9
0
6
4
2
1
1
0 0
0
8
1
1
0
1
9
2
6
5
0 0
0
9
0
6
3
0
6
4
5
8
0 0
1
2
2
2
2
4
4
8
8
8
. 1 4 2
4 = 9 6
1 1 = 2 8
2 4 4 = 1
2 8 2 2 =
1
1
5
2 9 6
6 5 6
0 0
6 4
3 6
Figura 3.1: La radice quadrata

Lasciamo al lettore, come esercizio, la razionalizzazione di:
1
,
3+ 2
1
1
,
,
3
5 3+ 2
5
3
25 + 3 10 + 3 4
1
=
.
3
3
5 32
Ma questa espressione è proprio il quadrato del membro sinistro. Poiche le due quantità sono entrambe
positive, luguaglianza è verificata.
Questa formula è particolarmente interessante

quando a2 b è un quadrato perfetto; in tal caso,
infatti, le radici quadrate interne scompaiono e il radicale doppio di sinistra si trasforma nella somma (o
nella differenza) di due radicali semplici. Lesempio
Non è raro incontrare espressioni che richiedono il
precedente è significativo:p
poiche 62 20 = 16 = 42 ,
p
calcolo di radici p
di altre espressioni composte da radi
la formula del teorema dà 6 20 = (6 + 4)/2
ci; ad esempio, 6 20 = 1.2360679777 . . .. Se si p

(6 4)/2 = 5 1, il che dimostra che la coinconsidera la quantità 5 1, molto pi`
u semplice (sia
cidenza
dei decimali non è limitata alle sole prime
da portarsi dietro sia da calcolare), si può osservacifre.
re che anchessa vale 1.2360679777 . . . e ci chiediamo
se le due espressioni sono davvero uguali o se sono
Nota 3.7
Verificare che due numeri reali hanno
soltanto molto simili, ma, proseguendo col calcolo di
alcune
cifre
iniziali
uguali, non significa e non prova
altri decimali, si trovi poi una discrepanza. E questo
che
i
due
numeri
siano
uguali. Per far ci`
o occorre una
il problema dei cosiddetti radicali doppi, argomento
vera dimostrazione, come quella derivante dal teoremolto bello e molto amato dal mitico matematico inma precedente. Un semplice esempio
contrario è dato
diano Srinavasa Ramanujan. Per i radicali quadratici

dalla falsa uguaglianza = 2 + 3; se ci si limita
vale il seguente risultato:
alle prime due cifre decimali si ha: 1.41 + 1.73 = 3.14,
p
ma gi`
a la terza cifra è diversa. La frazione 355/113
Teorema 3.21 Sia data lespressione a b con
vale 3.14159292 e le prime sette cifre coincidonocon
2
a, b > 0; se a > b allora vale lidentit`
a:
quelle di . Ancora pi`
u eclatante è il caso di 2 e
della frazione 665857/470832, frazione che il lettore
s
s
q
industrioso avr`
a gi`
a + a2 b
a a2 b
a incontrato applicando il Teorema
a b=
.
a per entrambi il
3.20 al calcolo di 2. Il calcolatore d`
2
2
Prova:
Si osservi prima di tutto che a >
a2 b. Se eleviamo al quadrato il secondo membro

delluguaglianza nellenunciato, si ottiene:
a + a2 b a a2 b
+
2
2
s
a + a2 b a a2 b
=
2
2
2
r
a2 (a2 b)
= a b.
=a2
4
valore 1.41421356237, ma naturalmente, nonostante

questa identit`
a, i due numeri
non possono coincidere,
poiche come sappiamo 2 non è un numero razionale.
Come abbiamo avuto già modo di osservare, lelevamento a potenza ab = c ha due operazioni inverse:
se si conoscono c e b, per ricavare a si esegue lestrazione di radice, che abbiamo visto essere una semplice estensione dellelevamento a potenza. Possiamo però anche conoscere a e c e cercare lesponente
b: questa operazione si chiama calcolo del logaritmo. Quindi, per definizione, il logaritmo in base a
90
CAPITOLO 3. NUMERI
di c è lesponente b al quale occorre elevare a per ottenere c; questa quantità si scrive: b = loga c. Se
sappiamo fare le potenze, possiamo trovare qualsiasi logaritmo applicando il metodo delle approssimazioni successive. Ad esempio, calcoliamo il log2 10;
poiche 23 < 10 < 24 , si ha 3 < log2 10 < 4. Dal
momento che 23 è pi`
u vicino a 10 di quanto non
lo sia 24 , partiamo da 3.1 e calcoliamo le varie potenze: 23.1 = 8.574, 23.2 = 9.189, 23.3 = 9.849,
23.4 = 10.556, e quindi 3.3 < log2 10 < 3.4. Ancora, 23.3 è pi`
u vicino a 10 di 23.4 , e cos` abbiamo:
3.31
2
= 9.917, 23.32 = 9.986, 23.33 = 10.056, per cui
3.32 < log2 10 < 3.33. Cos` procedendo si può trovare
il valore approssimato log2 10 3.32192809.
Le regole fondamentali dei logaritmi sono le
seguenti:
loga (rv)
loga (r/v)
loga (rs )
loga s r
loga a
loga 1
=
=
=
=
=
=
loga r + loga v
loga r loga v
s loga r
1
s loga r
1
0
Inoltre, è importante la seguente proprietà che permette di cambiare la base di un logaritmo, operazione
abbastanza frequente:
Teorema 3.22 Vale la seguente identit`
a:
loga b = 1/ logb a.
Prova: Sia x = loga b; per definizione è b = ax e se
si prende il logaritmo in base b dei due membri si ha:
logb b = logb ax = x logb a. Ma logb b = 1 e se diamo
ad x il suo valore si ha: 1 = (loga b)(logb a), da cui
deriva immediatamente la formula desiderata.
Ad esempio, si calcola: log10 2 = 1/ log2 10 =
1/3.32192809 . . . = 0.301029995 . . ..
Lutilità dei logaritmi è legata alle loro proprietà:
le moltiplicazioni sono ridotte ad addizioni, le divisioni a sottrazioni, le potenze a moltiplicazioni e le
radici a divisioni. Oggi, con luso intensivo dei calcolatori elettronici di ogni dimensione, non ci rendiamo
conto delle difficoltà pratiche dei calcoli. Molti studenti, oggi, non conoscono neppure le tabelline (cioè
la Tavola Pitagorica) e non sanno eseguire le divisioni. Se vogliamo estrarre la radice quinta di 1639,
il calcolatore ci dà immediatamente 4.39456397, ma
nel 1600 o nel 1800, applicando i metodi che abbiamo visto, sarebbe occorsa una giornata di duro lavoro
per arrivare ad ottenere cinque o sei decimali. I logaritmi permettono di risolvere il problema in pochi
minuti. Su una
tavola si trova log10 1639 = 3.21458
e quindi log10 5 1639 = 3.21458/5 = 0.64292 e, ancora dalla tavola, si ricava: 100.64292 = 4.3946, il che è
sufficiente per la maggior parte delle applicazioni. In
questo esempio abbiamo immaginato di usare tavole

dei logaritmi in base 10 con 5 cifre decimali; in effetti
queste erano le tavole di uso pi`
u comune, ma ne sono
esistite anche con 15 o 20 decimali.
I logaritmi furono inventati dal matematico scozzese John Napier (Giovanni Nepero era il suo nome latinizzato) verso la fine del 1500 e le sue tabelle a 14 decimali, con relativo manuale duso, furono pubblicate nel 1614, dopo 20 anni di laboriosi
calcoli (si veda anche il Capitolo 8). I logaritmi di
Napier erano, grosso modo, ciò che oggi chiamiamo
logaritmi naturali, cioè i logaritmi nella particolare
base e = 2.7182818284 . . ., sul cui significato avremo
molto da dire pi`
u avanti. Immediatamente, lopera di
Napier venne apprezzata, utilizzata e imitata. Henry
Briggs, dopo aver discusso con Napier nel 1615, introdusse i logaritmi decimali (cioè in base 10), che da
allora divennero quelli pi`
u popolari ed utilizzati nella
pratica. Fino allintroduzione dei calcolatori elettronici da tasca verso il 1970, i logaritmi decimali sono
rimasti lo strumento pi`
u largamente usato nei calcoli
di precisione, battuto per i calcoli approssimati solo
dal regolo calcolatore, uno strumento meccanico derivato proprio dai logaritmi. In effetti, una tavola di
logaritmi era maneggevole e alla portata economica
di tutti; già il regolo calcolatore, come strumento di
calcolo, era pi`
u costoso e, come sè detto, meno preciso, per cui era usato solo per calcoli veloci, come
il puntamento delle armi o la misurazione dei terreni
sul posto. Meno maneggevoli e molto pi`
u care erano
le macchine calcolatrici meccaniche: inventate da Pascal verso il 1640, estese alla moltiplicazione da Leibniz, erano pesanti e ingombranti, e quindi adatte solo
ai conti che potevano esser fatti in un ufficio o in uno
studio. Per questo, molti altri strumenti di calcolo
furono proposti, come il già citato celebre compasso, inventato e commercializzato da Galileo intorno
al 1600.
3.7
Espressioni e proporzioni
La rappresentazione di un conto, come 3 + 5 oppure

14 (424 35/5), si suol chiamare una espressione
aritmetica. Lordine di esecuzione delle operazioni è
regolato da alcune norme convenzionali:
1. le operazioni si eseguono da sinistra verso destra,
ma moltiplicazione e divisione hanno la precedenza su somma e sottrazione. Quindi 5 2 + 1
vale 4, ma 522 vale 1 poiche il prodotto 22
si esegue prima della sottrazione;
2. le parentesi possono essere usate per modificare
questo ordine. Pertanto (52)2 dà come valore
6, poiche la sottrazione viene eseguita prima del
prodotto.
3.7. ESPRESSIONI E PROPORZIONI

Operando in questa maniera, il risultato di unespressione aritmetica è determinato univocamente e due
persone (o anche una persona e un elaboratore elettronico) devono ottenere lo stesso valore se partono
con la medesima espressione. Alla Scuola Media si
insegna ad usare vari tipi di parentesi: le parentesi
tonde sono quelle a pi`
u basso livello; per raggruppare espressioni che già contengono parentesi tonde si
usano le parentesi quadre; e infine, a livello pi`
u alto
si usano le parentesi graffe. In realtà, nella pratica,
si tende ad usare solamente le parentesi tonde, eventualmente di dimensione crescente man mano che si
sale di livello. E molto raro lutilizzo di parentesi
quadre e graffe allinterno delle espressioni aritmetiche: a queste parentesi viene di solito dato un significato diverso e che non ha niente a che fare con
il raggruppamento dei termini in unespressione aritmetica. Abbiamo già incontrato le notazioni {a, b, c}
e {x N | x2 < 200}, che usano le parentesi graffe
per denotare un insieme, sia che lo si voglia definire per estensione o per intensione. Cè stata anche
loccasione di introdurre le parentesi quadre nella notazione delle liste, ed esistono altri usi pi`
u specifici di
queste parentesi. Pertanto, eviteremo di mescolare
le parentesi dando loro lo stesso significato e, per le
espressioni aritmetiche, useremo soltanto le parentesi
tonde.
A voler essere precisi (e in Matematica questo è
proprio il caso) non tutte le espressioni aritmetiche
danno un risultato numerico; ad esempio 4/(5 5)
diviene 4/0 e questa è unoperazione che non ha risultato. Infatti, 4/0 starebbe a indicare quel numero
che moltiplicato per 0 dà 4, ma nessun numero gode
di questa proprietà. Poiche nei vari insiemi numerici
che abbiamo visto la divisione per 0 è sempre vietata
per gli stessi motivi, dobbiamo vietarla in generale
nelle espressioni aritmetiche e considerare valide solo
quelle che, al termine della computazione, ci danno
un valore numerico. Definiamo allora una relazione di
equivalenza tra espressioni: due espressioni aritmetiche A e B sono equivalenti se e solo se sono entrambe
valide e danno lo stesso valore numerico come risultato. Il termine equivalente è giustificato dal fatto
che tale relazione risulta veramente essere una relazione di equivalenza, e al lettore basterà un momento
di riflessione per rendersi conto della validità delle tre
proprietà riflessiva, simmetrica e transitiva. Può, al
solito, essere un buon esercizio verificare formalmente queste proprietà, ma lasciamo la cosa alla buona
volontà e allinteresse del lettore. Per indicare che
due espressioni aritmetiche A e B sono equivalenti si
scrive A = B che si legge A uguale a B; la relazione
di equivalenza si dice propriamente uguaglianza e ci
si riferisce ad A e a B come al membro sinistro e al
membro destro delluguaglianza.
91
Questa relazione di equivalenza può essere arricchita da altre proprietà che risulteranno molto
importanti:
Teorema 3.23 Siano A e B due espressioni aritmetiche valide ed equivalenti fra di loro, e sia C
una terza espressione aritmetica valida; si ha allora A + C = B + C, A C = B C e A C = B C.
Infine, se il valore dellespressione C è diverso da 0,
si ha anche A/C = B/C.
Prova: Se A e B hanno lo stesso valore numerico,
diciamo n, e C ha valore numerico m, allora A + B
ha valore numerico n + m come lo ha B + C. La
stessa osservazione vale anche negli altri casi; per la
divisione, se C ha valore 0, dividendo A o B per C si
hanno espressioni non valide.
Una semplice osservazione notazionale è la seguente: se le espressioni contengono pi`
u di un numero, è
bene scrivere A (C), (A) (C) e (A)/(C), usando opportunamente le parentesi per assicurarsi che le
operazioni vengano eseguite nellordine giusto. E bene anche osservare che somma e sottrazione agiscono
in modo simmetrico: nel caso che A e B siano espressioni equivalenti, se prima si somma e poi si sottrae C
(o viceversa), si torna a due espressioni equivalenti.
Lo stesso succede per moltiplicazione e divisione, se
C non vale 0. Se invece C vale 0, non solo è vero che
da A = B si ricava A C = B C, ma questa uguaglianza si ottiene anche quando fosse A 6= B, cioè A
e B non fossero equivalente: infatti, il valore comune
delle due espressioni ottenute sarebbe comunque 0.
Naturalmente, a questo punto non si può pi`
u tornare
indietro dividendo per C. Questo, se si vuole, è un
altro argomento per spiegare la necessità di evitare
moltiplicazione e divisioni per 0.
Il teorema precedente può essere esteso nel modo
seguente:
Teorema 3.24 Siano A, B, C, D quattro espressioni
aritmetiche valide tali che A = B e C = D; se se
sommano o si sottraggono tali uguaglianze membro a
membro si hanno ancora espressioni equivalenti, cioè
A + C = B + D e A C = B D. Inoltre, se il valore
comune di C e D non è 0, si ha anche AC = B D
e A/C = B/D.
Prova: Per il teorema precedente, da A = B si ricava A + C = B + C e da C = D si ha C + B = D + B,
ovvero B + C = B + D per la proprietà commutativa
della somma; si ha allora A + C = B + D. Per la
sottrazione non vale la proprietà commutativa ed occorre perciò unosservazione in pi`
u: se C = D allora
C = D, come si vede immediatamente pensando
al valore comune di C e di D. Allora, da A = B
si ha A C = B C e da C = D si ricava
92
C + B = D + B, cioè B C = B D, questa volta per la proprietà commutativa della somma. Per la
moltiplicazione e la divisione si procede in modo analogo, osservando che da C = D discende 1/C = 1/D
purche il valore comune di C e D sia diverso da 0.
CAPITOLO 3. NUMERI
se: 1) ogni antecedente si inverte col proprio conseguente (propriet`
a dellinvertendo); 2) si permutano
gli estremi e/o i medi (propriet`
a delle permutando).
Prova: La proporzione originale è equivalente a

ad = bc; è facile osservare che ciascuna delle altre proUnosservazione importante è la seguente: se A = porzioni è equivalente alla stessa identità. Ad esemB e il valore delle espressioni è diverso da 0, molti- pio, permutando gli estremi si ha: d : b = c : a, il che
plicando questa uguaglianza membro a membro per significa ancora ad = bc.
se stessa, si ha A2 = B 2 . Tuttavia, da A2 = B 2 non
Due altre proprietà sono utili per risolvere molti
si può dedurre A = B, come prova il controesempio
problemi:
2
2
(2) = 2 . Il teorema precedente, infatti, afferma
2
2
solo che se A = B e A = B allora (dividendo mem- Teorema 3.27 Si abbiano quattro numeri in proporbro a membro) si ricava A = B; ma questo non è zione a : b = c : d. Allora, la somma (o la differenza)
particolarmente interessante.
degli antecedenti sta alla somma (o alla differenza)
Queste proprietà delle espressioni aritmetiche si ge- dei conseguenti, come ciascun antecedente sta al proneralizzeranno pi`
u avanti alle espressioni algebriche; prio conseguente (propriet`
a del componendo e dello
per il momento ci interessa la loro applicazione alla scomponendo). Equivalentemente, la somma (o la
teoria delle proporzioni.
differenza) del primo e del secondo sta al primo (o al
secondo) come la somma (o la differenza) del terzo e
Definizione 3.8 Una proporzione è luguaglianza di del quarto sta al terzo (o al quarto).
due rapporti: a/b = c/d. Quattro numeri a, b, c, d si
Formalmente, il componendo corrispondicono in proporzione se il rapporto dei primi due è Prova:
uguale al rapporto degli ultimi due. Si scrive a : b = de alla proporzione: (a + c) : (b + d) = a : b o
c : d e si legge a sta a b come c sta a d. I quattro (a + c) : (b + d) = c : d, mentre la seconda formulanumeri si dicono termini della proporzione; a e d si zione corrisponde a (a + b) : a = (c + d) : c o anche
dicono gli estremi e b e c i medi; a e c si dicono gli (a + b) : b = (c + d) : d. Permutando i medi nella
proporzione di partenza, si ha a : c = b : d e quindi la
antecedenti e b e d i conseguenti.
prima formulazione ci dà (a+b) : (c+d) = b : d e perLa proprietà fondamentale delle proporzioni è data mutando di nuovo i medi: (a + b) : b = (c + d) : d, che
dal seguente:
è la seconda formulazione. Visto che le due formulazioni sono equivalenti, basta dimostrare la validità di
Teorema 3.25 Quattro numeri sono in proporzione
questultima proporzione. Ma essa equivale a:
se e solo se il prodotto dei medi è uguale al prodotto
degli estremi.
a+b
c+d
a
c
=
o
+ 1 = + 1;
b
d
b
d
Prova: Supponiamo che a : b = c : d, cioè a/b =
c/d; ovviamente dobbiamo avere b 6= 0 e d 6= 0, e sottraendo 1 ad entrambi i membri, si ottiene proprio
per il Teorema 3.23 possiamo moltiplicare entrambi i la proporzione di partenza. Una prova analoga vale
membri diquesta uguaglianza per bd e semplificando ovviamente per lo scomponendo.
si ha ad = bc come si voleva. Viceversa, se ad = bc
Una applicazione del componendo si ha nella rie i quattro numeri sono diversi da 0, sempre per il soluzione di questo tipo di problemi: di due numeri
teorema 3.23 possiamo dividere entrambi i membri si sa che il loro rapporto è 3/5 e che la loro somma
per bd 6= 0; si ottiene a/b = c/d, cioè proprio a : b = è 32; quali sono i due numeri? Se chiamiamo i due
c : d.
numeri x ed y, la prima condizione ci dà la propor-
zione x : y = 3 : 5 e quindi la seconda formulazione

del componendo ci dice: (x + y) : x = (3 + 5) : 3,
cioè 32 : x = 8 : 3. Per la proprietà fondamentale,
questo ci permette di scrivere luguaglianza 8x = 96;
dividendo i due membri per 8 si ha allora x = 12. La
proporzione di partenza diviene ora 12 : y = 3 : 5 e di
nuovo la proprietà fondamentale ci dà 3y = 60, cioè
y = 20.
La proprietà del componendo si può utilmente
estendere alle catene di rapporti: si dice catena di
Teorema 3.26 Si abbiano quattro numeri in propor- rapporti luguaglianza di due o pi`
u rapporti. Ad
zione a : b = c : d. Si ottengono nuove proporzioni esempio, costituisce una catena di rapporti la serie
I Greci svilupparono la teoria delle proporzioni basandola su questo teorema, che rimane il fulcro dellapplicazione pratica delle proprietà delle proporzioni. Ad esempio, poiche 2 12 = 3 8, si ha subito:
2 : 3 = 8 : 12. E chiaro che dalla uguaglianza si possono ottenere altre proporzioni, quali 12 : 3 = 8 : 2
oppure 2 : 8 = 3 : 12, e cos` via. Queste variazioni rientrano fra alcune proprietà caratteristiche,
contemplate dalla teoria:
93
3.7. ESPRESSIONI E PROPORZIONI

di tre uguaglianze: 8 : 2 = 12 : 3 = 20 : 5. In
questo caso il componendo assume la forma: in una
catena di rapporti la somma degli antecedenti sta alla
somma dei conseguenti, come ogni antecedente sta al
proprio conseguente. Nellesempio precedente si ha:
(8 + 12 + 20) : (2 + 3 + 5) = 8 : 2, cioè 40 : 10 = 8 : 2,
che è ovviamente una proporzione, come si verifica
con il teorema fondamentale: 40 2 = 10 8.
Nella risoluzione dei problemi legati alle proporzioni, come nellesempio dei due numeri visto in precedenza, si cerca di determinare un termine della proporzione quando se ne conoscano gli altri. La regola
fondamentale delle proporzioni è la panacea universale per tali problemi e la sua applicazione porta facilmente a un risultato positivo. Esiste tuttavia una
nomenclatura precisa, che è opportuno conoscere:
Definizione 3.9 Dati tre numeri a, b, c si dice quarto proporzionale (dopo a, b, c) il numero x tale che:
a : b = c : x. Dati due numeri a, b si dice terzo proporzionale (dopo a, b) il numero x tale che:
a : b = b : x. Infine, dati due numeri a, c si dice
medio proporzionale tra a e c il numero x tale che:
a : x = x : c.
I Greci, come sè detto, svilupparono la teoria delle
proporzioni, introdussero questi concetti a proposito
della similitudine delle figure (si veda al Capitolo sulla
Geometria Euclidea) e trovarono costruzioni geometriche per calcolare il quarto, il terzo e il medio proporzionale di segmenti assegnati; essi, infatti, erano
pi`
u bravi con la geometria che col calcolo e si trovavano pi`
u a loro agio con i segmenti che con i numeri.
Per noi le cose sono diametralmente opposte, anche
se, a suo tempo, vedremo le costruzioni proposte dai
Greci.
un confronto: se cioè, dati due oggetti A, B G,

si possa dire se il primo A è uguale, maggiore o
minore del secondo B;
una somma: se cioè A, B G sono due oggetti,
si può trovare in G un oggetto che sia la somma A + B dei due oggetti; naturalmente, tale somma deve godere delle proprietà consuete
della somma tra numeri;
un prodotto scalare: se cioè A G ed r è un
numero reale qualsiasi, si può trovare in G un
oggetto che sia r volte loggetto A; tale oggetto si
indica con rA. Si deve avere: r(A+B) = rA+rB
e (r + s)A = rA + sA.
Se gli oggetti sono di natura fisica, si parla di grandezza fisica; se sono di natura matematica, si parla
di grandezza matematica. Fra queste, viene naturale pensare ai segmenti e agli angoli, e in effetti studieremo queste grandezze (e altre) nel capitolo sulla
Geometria Euclidea. Fra le classi di grandezze fisiche, ricordiamo gli oggetti pesanti o i conduttori di
elettricità. Ogni classe di grandezze G può essere associata a una misura: si definisce arbitrariamente un
oggetto U G della classe come unit`
a di misura e si
dice che un oggetto A G ha misura r = (A) se
r è il numero reale tale che A = rU . Nel caso degli
oggetti pesanti, lunità di misura è il peso di un litro
dacqua distillata alla temperatura di 4 centigradi.
Tale quantità si dice convenzionalmente kilogrammo
o chilogrammo (kg) e il peso di un oggetto pesante è
il rapporto delloggetto con tale unità di misura. La
misura deve godere delle due proprietà formali:
(rA)
= r(A)
(A + B) = (A) + (B).
Teorema 3.28 1) Il quarto proporzionale dopo i numeri a, b, c, è il numero x = bc/a; 2) il terzo proporIl conteggio costituisce una specie di misura per alzionale dopo a, b è il numero: x = b2 /a; 3) il medio
cuni
oggetti, sia del mondo fisico, sia di quello mate
proporzionale fra i numeri a e c è il numero x = ab. matico (si veda il Capitolo 4); tuttavia, in questo caProva: Come accennato, basta applicare la regola so, il prodotto scalare ha senso solo per r N. Questo
fondamentale; ad esempio, da a : b = c : x si ha porta a distinguere le grandezze in due categorie:
ax = bc e dividendo i due membri per a (supposto
diverso da 0) per il Teorema 3.23 si trova x = bc/a.
La dimostrazione degli altri punti è simile.
Lambito naturale di applicazione della teoria delle
proporzioni è costituito dalle grandezze proporzionali. Vediamo allora di ricordare brevemente cosa si
intende per grandezza, un concetto legato al mondo
fisico, anche se trova molti riscontri nella Matematica
tradizionale, specie nella Geometria che, come abbiamo ricordato, è il settore in cui si è originariamente
sviluppata la teoria delle proporzioni.
Una classe di grandezze è un insieme G di oggetti
(di natura fisica o matematica) per i quali è possibile
definire:
le grandezze continue o analogiche per le quali il

prodotto scalare è definito per ogni r R;
le grandezze discrete o digitali per le quali il
prodotto scalare è definito solo per r N.
La teoria delle proporzioni tratta solamente grandezze continue; tradizionalmente, si dice che due
(classi di) grandezze sono direttamente proporzionali (si pensi al peso di una merce e al suo costo) se
raddoppiando, triplicando, etc. la prima anche la seconda raddoppia, triplica, etc. Analogamente, si dice
che due grandezze sono inversamente proporzionali
se raddoppiando, triplicando, etc. la prima, la seconda diviene la metà, un terzo, etc. Queste espressioni
94
CAPITOLO 3. NUMERI
danno bene lidea intuitiva di proporzionalità diretta

e inversa, ma formalmente non sono granche; infatti,
se gli etc. ci stimolano ad afferrare un concetto di
variabilità che riusciamo intuitivamente a cogliere, in
sostanza non ci dicono niente. Migliore è allora la
seguente:
Definizione 3.10 Due grandezze si dicono direttamente proporzionali quando il rapporto fra ogni valore della prima e il corrispondente valore della seconda
è costante. Si dicono invece inversamente proporzionali se il prodotto di ogni valore della prima per il
corrispondente valore della seconda è costante.
Nel caso del prezzo e del peso, se K è il costo di
una merce al chilogrammo, e al peso W corrisponde
il prezzo P , si avrà: P/W = K, qualunque siano P
e W . Invece, se v è la velocità oraria di unautovettura che impiega il tempo t a percorrere la distanza
d, si scrive: vt = d. Viceversa, si osservi che, fissata
la velocità v di percorrenza, la distanza percorsa e il
tempo per percorrerla sono grandezze direttamente
proporzionali, e questa osservazione, che si generalizza facilmente, ci fa capire come i due concetti siano
strettamente collegati, e non solo per il nome. Daltra
parte, la precedente definizione rende perfettamente
conto della relazione tra grandezze proporzionali e
proporzioni. Ad esempio, una volta stabilito (o dato per definizione) che il costo di una merce è direttamente proporzionale al suo peso, e supposto che
questa costi 3.5 e al Kg, chiederci quanto vengono a
costare 2.7 Kg della stessa merce vuol dire risolvere
la proporzione: 3.5 : 1 = x : 2.7. Invertendo si ha:
1 : 3.5 = 2.7 : x, e quindi, come abbiamo visto, si
trova: x = 3.5 2.7 = 9.45 e. La regola esplicita è:
costo1 : peso1 = costo2 : peso2 .
Quando le grandezze sono inversamente proporzionali, il secondo rapporto va invertito; cos` se una macchina che va a 75 km/h impiega 45 minuti a percorrere una certa distanza, per sapere quanto impiegherebbe se andasse a 90 km/h, la proporzione da impostare
è: 75 45 = x 90, cioè 75 : 90 = x : 45, secondo lo
schema:
velocit`
a1 : tempo1 = tempo2 : velocit`
a2
ovvero:
velocit`
a1 : velocit`
a2 = tempo2 : tempo1
dove si deve notare linversione degli indici. In questo
caso troviamo x = 37.5, cioè x = 37 30 .
Una celebre classe di problemi legati alle grandezze
inversamente proporzionali è costituito dai problemi
relativi al riempimento di una vasca. Ad esempio,
una vasca di capacità ignota ha due rubinetti e uno
scarico; se il primo rubinetto fosse aperto da solo (con

lo scarico chiuso) impiegherebbe 24 minuti per riempire la vasca; il secondo rubinetto, sempre da solo,
riempirebbe la vasca in 30 minuti. Invece lo scarico, se agisse da solo, vuoterebbe la vasca piena in 20
minuti. La domanda è: se si aprono contemporaneamente i due rubinetti e lo scarico, in quanto tempo si
riempie la vasca? Solo i matematici possono inventare
problemi tanto assurdi, ma, una volta posto, il quesito va risolto. Il fatto è che i tempi di riempimento
sono una grandezza inversamente proporzionale alla quantità di acqua immessa nella (o estratta dalla)
vasca, mentre è questa grandezza che si somma o si
sottrae per stabilire quando la vasca si è riempita o
si è svuotata.
Questa inversione di solito imbarazza il solutore,
ed è opportuno ragionare in questo modo: in un minuto il primo rubinetto riempie 1/24 della vasca e il
secondo ne riempie 1/30; lo scarico ne vuota 1/20 e
sono queste le grandezze che si possono sommare e
sottrarre. In un minuto la vasca si riempie per:
1
1
1
5+46
1
+
=
=
24 30 20
120
40
e quindi occorrono in tutto 40 minuti per il riempimento. Tutto qui. Il lettore può ora risolvere il
problema dei due automobilisti Carlo e Dario: Carlo è in grado di percorrere lautostrada da A a B in
60 minuti; Dario la percorre in 40 minuti. Se Carlo parte da A e Dario da B, dopo quanto tempo si
incontreranno?
Importante è il seguente concetto:
Definizione 3.11 La percentuale di una quantit`
aq
rispetto a una quantit`
a Q è il rapporto q/Q riportato
a 100.
In altre parole, la percentuale x di q a Q è il quarto
proporzionale: q : Q = x : 100, e quindi per il Teorema 3.28 è: x = 100q/Q. Ad esempio, se un oggetto
costa 60 e e viene scontato di 12 e, in percentuale
lo sconto è dato dalla proporzione: 12 : 60 = x : 100,
cioè x = 1200/60 = 20 per cento (o, come si scrive,
20%). Viceversa, se su un oggetto che costa 70 e
viene operato lo sconto del 15%, tale sconto si calcola risolvendo la proporzione. x : 70 = 15 : 100,
cioè x = 70 15/100 = 10.5 e. Naturalmente, una
proporzione risolve anche il caso della percentuale di
pagamento (e non dello sconto); ad esempio, per sapere quanto dobbiamo pagare per acquistare un abito
all80% del suo costo di 370 e, basta impostare la proporzione: x : 370 = 80 : 100 e scoprire che x = 296
e.
Infine, le percentuali sono spesso usate per valutare
lerrore commesso in una misurazione, in una valutazione o in un conteggio approssimato. Ad esempio, se
95
3.8. MATEMATICA FINANZIARIA

di una persona alta 172 cm diciamo che è alta 170 cm,
quale errore commettiamo? Intanto, si distingue tra
errore assoluto ed errore relativo: lerrore assoluto è
il valore assoluto della differenza fra il valore reale e
quello considerato. Pertanto: Ea = |172 170| = 2
cm. Naturalmente, un tale errore su 172 cm è abbastanza sensibile ma non troppo; un errore di 2 cm
su 1 km è trascurabile; un errore di 2 cm su 10 cm è
enorme. Questo ci fa capire che lerrore assoluto, pur
essendo significativo, non ci dà unidea della rilevanza
dellerrore stesso, cioè non ci dice se il valore approssimato è vicino o lontano dal valore vero. Per questo si
introduce il concetto di errore relativo, definito come
il rapporto tra lerrore assoluto e il valore vero della
quantità considerata. In altre parole: Er = Ea /qv , se
qv è il valore vero della nostra quantità. Nel caso dellaltezza abbiamo Er = 2/172 0.0116, e questo ci
fa capire immediatamente che lerrore è abbastanza
modesto. Lerrore relativo si esprime spesso in percentuale; questa è semplicemente 100Er , e la si può
ottenere in modo diretto impostando e risolvendo la
proporzione: Ea : qv = x : 100. Se qa è il valore
approssimato di qv , abbiamo |qv qa | : qv = x : 100
e a formula si scrive:
100|qv qa |
= Er %.
qv
Nel caso dellaltezza, lerrore è stato dell1.16%.
3.8
Matematica finanziaria
Unapplicazione importante delle cose dette è la Matematica finanziaria, largamente usata nel commercio, nelle banche e nella finanza. In effetti, la Matematica finanziaria è un argomento che presenta diversi caratteri interessanti. Intanto, almeno nelle parti
iniziali, è abbastanza elementare da consentire un facile approccio da parte di tutti: le operazioni coinvolte sono le quattro operazioni elementari, le potenze,
le radici e, per alcuni problemi meno comuni, i logaritmi. Questi, guarda caso, non vengono trattati
proprio in quelle scuole nelle quali la Matematica finanziaria costituisce uno dei principali argomenti di
insegnamento. In secondo luogo, la materia ha un
aggancio immediato con il mondo reale e ognuno ha
costantemente a che fare con gli interessi bancari sui
conti correnti, gli investimenti, gli sconti e gli scoperti, con le polizze o le rate dellassicurazione e del
mutuo, e via discorrendo. In terzo luogo, specie per
quello che ci riguarda, si presta a darci labitudine a
fare un po di conti e di esercizi su vari argomenti che
abbiamo toccato, quali le conversioni di base, le proporzioni e le percentuali, le potenze e i logaritmi. A
questo proposito, è bene che, leggendo questa sezione,
ci si munisca di un calcolatore da tasca, possibilmente

in grado di eseguire potenze, radici e logaritmi.
Sicuramente, il problema pi`
u elementare è quello dellinteresse semplice. Supponiamo di avere una
certa somma, che indicheremo con C; questo ci introduce nella terminologia, piuttosto specifica, della
Matematica finanziaria. Infatti C sta per capitale, ed
è la quantità di denaro di riferimento: quanto possediamo, quanto vogliamo investire o spendere, quanto
possiamo mettere in campo. Se impieghiamo il nostro capitale C, ad esempio depositandolo in banca
sul nostro conto corrente, ci aspettiamo che, nel giro di un anno, esso aumenti. Pensiamo infatti che
la banca ottenga un guadagno finanziando imprese
con i soldi che ha raccolto da noi e da altri cittadini e che pertanto ne darà in parte anche a noi, che
abbiamo partecipato, indirettamente, al loro finanziamento. Per questo concordiamo con la banca (o,
meglio, la banca concorda con noi) un certo tasso di
interesse, indicato di regola con i o con r, cioè la frazione di capitale che costituirà il nostro guadagno.
Tale tasso di interesse è di norma considerato su base
annua e quindi, dopo un anno, noi ritroveremo il nostro capitale C pi`
u la quantità rC che è appunto ciò
che il nostro capitale ha fruttato. Di conseguenza, il
nostro capitale sarà:
C = C + rC = C(1 + r).
Il tasso di interesse è dato tradizionalmente in percentuale; pertanto, un tasso del 3% significa r = 0.03.
Ad esempio, se impieghiamo 2000.00 e al 3%, dopo
un anno avremo guadagnato 2000 0.03 = 60.00 e e
il nostro capitale sarà 2000 1.03 = 2060.00 e. Naturalmente, il vantaggio che ci offre la formula precedente è quello di permetterci una facile soluzione
di problemi inversi. Ad esempio, quale somma devo
impiegare al 4.5% per avere, dopo un anno, 2000.00
e? Questa volta, il capitale C è la nostra incognita
e quindi dalla formula ricaviamo:
C = C /(1 + r)
che ci dà C = 2000/1.045 = 1913.88 e. Analogamente, se vogliamo sapere a quale tasso occorre impiegare
1900.00 e per averne, dopo un anno, 2000.00, dalla
formula otteniamo:
1+r =
C
C
ovvero
r=
C
C C
1=
.
C
C
Nellesempio, abbiamo r = 100/1900 = 0.0526, e cioè

il tasso deve essere del 5.26%. Questi problemi, nel
gergo commerciale e finanziario, sono noti come problemi di sconto. Supponiamo infatti di dover pagare
2000.00 e fra un anno a un nostro fornitore; trattiamo con lui e quello è disposto, se paghiamo subito, a
farci uno sconto del 4.5%; col ragionamento di sopra
96
CAPITOLO 3. NUMERI
vediamo che ce la possiamo cavare pagando (subito)

1933.88 e, e ciò ci può essere conveniente, se non abbiamo problemi finanziari. Similmente, supponiamo
che, ancora trattando con il fornitore, quello ci dica
che si accontenta di incassare 1900.00 e, se paghiamo subito (forse ha problemi di liquidità). Qual è lo
sconto che è disposto a farci? Come abbiamo visto si
tratta del 5.26%, una bella roba!
Tornando al nostro investimento, se, alla fine dellanno, ritiriamo il nostro guadagno rC e lasciamo
il capitale C alla banca ancora per un anno, alla
fine del secondo anno avremo un nuovo guadagno
rC e quindi (se ancora non abbiamo speso niente) possiamo considerarci possessori di un capitale
C = C + rC + rC = (1 + 2r)C. Se si va avanti cos`
per n anni, si avrà in tutto il capitale (1+nr)C. Tanti
anni fa, quando ero ragazzo, linteresse semplice era
presentato proprio cos`. Nella realtà, specie al giorno
doggi, le cose sono un po pi`
u complicate. Se mettete
un po di denaro in banca allinteresse r, la banca vi
richiede di partecipare alle spese (costo del personale,
delle attrezzature, e cos` via) con una cifra fissa S oppure proporzionale al vostro capitale, diciamo sC. In
questultimo caso, in effetti, il vero tasso di interesse
è per voi r s; infatti, in fondo allanno, il vostro
capitale sarà C = C(1 + r) sC = C(1 + (r s)),
per cui dovete stare attenti che s sia abbastanza minore di r, se non volete andare a rimetterci. Occorre
ricordare, inoltre, che sul vostro guadagno dovete pagare le tasse, che oggi, inizio del terzo millennio, in
Italia, sono del 12.5%. Questo significa che il vero
tasso di interesse è r 0, 125r = 0.875r, cos` che, fatti tutti i conti, alla fine dellanno il vostro capitale
sarà C = C(1 + 0.875r s), con un tasso di interesse
reale dato da 0.875r s. E bene rendersi conto che
se la banca vi offre un tasso di interesse del 2% e le
spese assommano allo 0.5% del capitale investito, il
tasso reale è:
0.875 0.02 0.005 = 0.0125 = 1.25%.
Quindi, se dai vostri 2000.00 e pensate di ricavare
un guadagno di 2000 0.02 = 40.00 e, scordatevelo
e cominciate a rassegnarvi allidea di ottenere invece
2000 0.0125 = 25.00 e.
Un discorso diverso va fatto se la banca vi trattiene
una cifra fissa S; ve la può trattenere allinizio o alla
fine del periodo, cioè dellanno. Se ve la trattiene
allinizio (in modo anticipato) il vostro capitale finale
sarà C = (C S)(1 + r) in quanto, di fatto, voi
state impiegando un capitale decurtato delle spese
sostenute. Se invece S vi viene trattenuto alla fine del
periodo (posticipato), avrete C = C(1 + r) S. A
parità di S, ovviamente, questa seconda soluzione vi
sarà pi`
u favorevole; altrettanto ovviamente, la banca
si trattiene sempre le spese S allinizio dellanno. Può
essere un utile ed interessante esercizio vedere, anche

in questo caso, cosa succede introducendo la tassa
governativa del 12.5%.
Il fatto che, convenzionalmente, il tasso di interesse sia considerato su base annua (almeno nel 90% dei
casi) fa s` che occorra ritornare a ciò che abbiamo
detto sulle basi composte, quando si voglia impiegare
un capitale per alcuni mesi o per un certo numero di
giorni. Supponiamo di impiegare 2000.00 e per 9 mesi al tasso del 3% annuo. La cosa migliore è riportare
i mesi o i giorni alla frazione di anno corrispondente,
e quindi ragionare su questo numero, che è diventato un numero decimale. Nellesempio, 9 mesi sono
9/12 di anno, cioè, eseguendo la divisione, 0.75 parti
di anno. Linteresse r viene ridotto in proporzione:
3 : 1 = x : 0.75, cioè x = 2.25, e il nostro guadagno (sempre al lordo delle spese e delle tasse) sarà
2000 0.0225 = 45.00 e. Quando il periodo si conta in giorni, la Matematica finanziaria introduce un
altro livello di complessità: si considera infatti un anno civile, composto convenzionalmente di 365 giorni
(anche se lanno considerato è bisestile) e un anno
commerciale, ridotto a 360 giorni. Di fatto, le cose
cambiano di poco, ma bisogna essere coscienti di cosa
si sta facendo. Impieghiamo i nostri 2000.00 e per
215 giorni; se si usa lanno civile, la proporzione è:
3 : 365 = x : 215, e quindi x = 1.7671233, che ci dà
un guadagno di 35.34 e. Se si usa lanno commerciale, si ha: 3 : 360 = x : 215, cioè x = 1.7916667 con
un guadagno di 35.83 e. Per una qualche misteriosa
ragione, la banche adottano ormai sistematicamente lanno civile nel trattamento dei conti correnti in
attivo per il cliente.
Quando dagli investimenti di un anno passiamo a
investimenti pluriennali, linteresse semplice va bene
solo se, alla fine di ogni anno, ritiriamo gli interessi
maturati (le cedole) e, quindi, il capitale investito
C rimane costante nel tempo. Spesso però succede
che il capitale venga lasciato a fruttare per diversi
anni senza ritirare alcuna cifra. In questo caso, gli
interessi si accumulano al capitale o, come si dice,
reinvestiamo gli interessi stessi. Questo significa che
in fondo al primo anno, reinvestiamo per intero il
nostro capitale, che è diventato C(1 + r); se il tasso di interesse rimane r, alla fine del secondo anno
abbiamo:
C(1 + r)(1 + r) = C(1 + r)2 .
Continuando cos`, dopo n anni il nostro capitale sarà
diventato:
C = C(1 + r)n ;
è questo il concetto, e la formula relativa,
dellinteresse composto, per il quale gli interessi si accumulano mano mano e vanno quindi ad incrementare gli interessi successivi. Quando facevo le Scuole
3.8. MATEMATICA FINANZIARIA

Elementari, allinizio degli anni 1950, il sussidiario
non mancava di tentare il nostro stupore con questo
problema: sapete, ragazzi, quanto sarebbe diventata oggi una Lira se, al tempo di Giulio Cesare, fosse
stata messa in banca allinteresse composto dell1%?
A quellepoca, giravano le lire, ma ora possiamo senzaltro passare allEuro. La risposta, che ci veniva
fornita senza spiegarci come era stata ottenuta, era:
quasi mezzo miliardo di Lire (o di Euro), una somma
davvero stratosferica. La formula precedente ci dà la
soluzione che allora ci mancava:
1 (1.01)2000 = 431. 286. 205.72.
97
Pi`
u complicato è il caso che siano fissati il capitale
C e il montante M , e si voglia determinare il tasso
di interesse necessario a raggiungere lo scopo in un
numero di anni n assegnato. Ancora dalla formula,
si ha:
p
M = C(1 + r)n ovvero 1 + r = n M/C.
Se C = 10. 000, 00, M = 15. 000, 00 e ed n = 10 anni,

si ha:
r
10
10 15000
1.5 = 1.04138,
1+r =
=
10000
Oggi potremmo osservare che, a cinquantanni di corrispondente a un tasso del 4.138%. E addirittura
distanza, saremmo già a:
necessario introdurre ed utilizzare i logaritmi quando
2050
.
.
siano assegnati capitale, montante e tasso dinteresse,
1.01
= 722 464 071.72,
e si voglia determinare il numero n di anni necessari
che mette bene in evidenza la crescita esponenziale a raggiungere il montante M impiegando al tasso r il
(n, il numero di anni, si trova allesponente) del no- capitale iniziale C. La formula M = C(1 + r)n ci dà:
stro capitale, impiegato allinteresse composto. Viceversa, se avessimo impiegato la Lira o lEuro iniziale
n = log1+r M/C = log1+r M log1+r C.
allinteresse semplice, oggi avremmo:
Purtroppo, il calcolatore non dà direttamente il lo1 (1 + 2050 0.01) = 21.50
garitmo in base 1 + r; di solito fornisce il logaritmo
Lire (o Euro), una cifra del tutto insignificante, do- naturale, che però vedremo nel Capitolo 8, e il logavuta alla crescita lineare del capitale: in questo ca- ritmo decimale. Come sappiamo, si ha: log1+r x =
so, il numero degli anni n sta a moltiplicare il tasso log10 x/ log10 (1 + r), e questo riporta tutto al calcolo
.
dinteresse. Proprio per questo modo di crescere, il dei logaritmi decimali. Se abbiamo M = 15 000, 00,
.
C
=
10
000,
00
e
ed
r
=
2.50%,
si
ha
M/C
= 1.5,
capitale risultante C dallinteresse composto si dice
log
1.5
=
0.17609126
e
log
1.025
=
0,
01072387,
montante, cioè che monta, che cresce.
10
10
Problemi pi`
u concreti riguardano investimenti plu- per cui n = 16.42. Occorrono pertanto 16 anni e
riennali. Anche in questo caso, se astraiamo dalle spe- 42/100 di anno; per riportare questa frazione a giorse e dalle tasse, un capitale di 2000.00 e, impiegato ni secondo lanno civile, si imposta la proporzione:
42 : 100 = x : 365, e da questa si ricava x 153.
al 3% annuo per 7 anni, ammonterà a:
Il tempo richiesto è perciò di 16 anni e 153 giorni,
2000 1.037 = 2459.75e.
ovvero, se preferiamo, 16 anni e 5 mesi. Tutto arriva
La formula, come nel caso dellinteresse semplice, per- per chi sa aspettare.
Linteresse composto richiede un pizzico dattenmette di risolvere anche i problemi inversi. Ad esemzione
quando, dalla base annua, lo si voglia portare a
pio, ci possiamo chiedere qual è il capitale C che
una
base
frazionaria, come il semestre, il trimestre, il
dobbiamo impiegare al 2.50% per avere, dopo 10 an.
mese
o
addirittura
il giorno. Ad esempio, un interesse
ni, 20 000, 00 e; la formula ci dice che deve essere
10
annuo
del
4%
non
è un interesse composto semestra20000 = C1.025 , cioè C = 20000/1.28 = 15623.97
le
del
2%,
come
si
potrebbe pensare e come talvolta
e. Come nel caso dellinteresse semplice, questo può
si
assume
per
semplicit`
a. Secondo la regola generale,
essere visto come un problema di sconto; nella realtà,
poich
e
un
semestre
`
e
la
met`
a di un anno, il capitale
tuttavia, è raro avere pagamenti dilazionati per pi`
u di
al
1/2
1+r
la
fine
del
semestre
sar`
a
:
C
=
C(1+r)
=
C
un anno. Ha senso invece porsi come obiettivo quello
1
+
r.
Facendo
i
calcoli
nel
caso
e
il
tasso
sar`
a
1
di arrivare ad avere un montante M nel giro di n an

di
r
=
4%,
si
ha
1
1.04
=
0.0198,
cio`
e
1.98%,
che
ni, impiegando una certa somma a un interesse noto.
`
e
un
po
pi`
u
basso
del
2%
ipotizzato.
Si
osservi
che,
Allora, la cifra C di partenza si dice il valore attuale
del montante M . Ad esempio, qual è il valore attuale sempre considerando un tasso del 4% su base annua,
di un montante di 10. 000, 00 e scadente fra 5 anni e si ha:
78 giorni, al 3%? Usando lanno civile, 78 giorni cor3

1.04 = 1.316%
base quadrimestrale 1
rispondono a 78/365 = 0.2137 parti di anno, e quindi
4
base trimestrale
1 1.04 = 0.985%
dalla formula ricaviamo:
6
base bimestrale
1
1.04 = 0.656%
5.2137
12
10000 = C 1.03
ovvero C = 8571.77e.
base mensile
1 1.04 = 0.327%
98
CAPITOLO 3. NUMERI
Chiaramente, il tasso cos` calcolato è sempre inferiore

al tasso ingenuo ottenuto dividendo r per la periodicità: infatti gli interessi si accumulano col passare
del tempo. Ad esempio, se comprate dei BOT a tre
mesi, il tasso viene calcolato cos`, poiche si suppone
che, finito il periodo, reinvestiate il ricavato.
Affrontiamo, come conclusione di queste note sulla
Matematica Finanziaria, un problema classico e non
del tutto banale. Se volete comprar casa, molto probabilmente avrete necessità di fare un mutuo, cioè di
chiedere soldi in prestito a una Banca per pagare lattuale proprietario, il notaio, le tasse e quanto altro sia
necessario. Se C è la cifra che desiderate, la Banca
sarà disposta a prestarvelo mettendo unipoteca sulla casa e chiedendovi un ragionevole interesse. La
Banca vi fornisce la somma C comprensiva delle spese delloperazione fra voi e la Banca stessa, e voi vi
impegnate a restituire a rate, in un certo periodo di
anni, la somma e gli interessi. Questo significa, prima
di tutto, che la Banca vi fornirà una cifra C < C,
essendo C C il costo delloperazione; daltra parte,
poiche C è comunque la somma che dovete restituire,
cè il problema del calcolo degli interessi. Poiche restituite la cifra a rate, di solito semestrali, alla prima
rata avrete già accumulato gli interessi dei primi sei
mesi. Alla fine dei secondi sei mesi avrete accumulato
altri interessi da restituire, ma solo sulla cifra precedente diminuita della rata pagata alla fine dei primi
sei mesi. Chiamiamo allora Ck la quantità di danaro
da restituire alla fine del k-esimo periodo di sei mesi;
in particolare, sarà C0 = C il capitale (si fa per dire)
iniziale.
Le modalità di restituzione possono essere varie,
ma di solito si riducono a due: a rate fisse e a rate
variabili. Questultima modalità prevede come regola
un adeguamento del tasso di interesse a quello praticato dalla Banca al momento della rata; ciò implica
un ricalcolo semestrale della rata da pagare, che sarà
pi`
u alta se il tasso corrente cresce e sarà pi`
u bassa se
il tasso decresce. Pi`
u interessante, almeno dal punto
di vista matematico, è laltro caso; la Banca fissa per
gli anni di restituzione un tasso annuo r (di regola
pi`
u alto di quello corrente) e calcola le rate, di importo costante x, secondo tale tasso. Vediamo come
si esegue il calcolo.
Alla fine del primo periodo (che per fissare le idee
e seguendo luso stabiliamo essere un semestre), il
capitale iniziale C0 sarà cresciuto secondo il tasso di
interesse a C0 (1 + r/2), ma pagando la rate x ci si
riporta a un nuovo capitale:
r
C1 = C0 1 +
x.
2
Si riparte cos` per il secondo periodo di sei mesi con
C1 e un ragionamento analogo ci porta a un capitale
da restituire dopo il secondo pagamento pari a:
r
r
r 2
C2 = C1 1 +
x 1 +
x = C0 1 +
x.
2
2
2
Alla fine dei successivi sei mesi il capitale da restituire

sarà:
r
C3 = C2 1 +
x=
2
r 2
r
r 3
x 1+
x 1+
x.
= C0 1 +
2
2
2
Cos` continuando, alla fine dei 2n periodi semestrali
corrispondenti alla durata del prestito, si arriva a:
r
C2n = C2n1 1 +
x=
2
r 2n
r 2n1
r
= C0 1 +
x.
x 1 +
x 1 +
2
2
2
Poiche a questo punto il prestito deve risultare restituito completamente, occorre che sia C2n = 0, e
questo ci permette di calcolare il valore di x. La
precedente equazione si scrive infatti:
r 2n
=
C0 1 +
2
r 2n2
r 2n1
+ 1+
+ + 1 .
=x 1+
2
2
Lespressione compresa nelle ultime due parentesi è

una progressione geometrica di ragione 1 + r/2 e
quindi sappiamo come calcolarla:
(1 + r/2)2n 1
r 2n
=x
C0 1 +
2
1 + r/2 1
e da questo si ricava il valore della rata:
x=
C0 (1 + r/2)2n r/2
.
(1 + r/2)2n 1
Facciamo un esempio, per renderci conto di ciò che

può dare questa formula. Se avete bisogno di 50. 000
e (la Banca, per quanto detto, vi darà un po di
meno, trattenendo le sue spese) e riuscite ad avere
un tasso fisso del 6% per restituire il tutto in 15 anni,
la rata sarà:
x=
0.03 50000 1.0330

2550.96.
1.0330 1
Dovete quindi prepararvi a dare alla banca questa

cifra ogni sei mesi (pi`
u di 400 e al mese da risparmiare). Alla fine dei 15 anni avrete restituito pi`
u di
76. 528 e, cioè avrete pagato per interessi ben 26. 528
e, ma questo, si sa, fa parte del gioco, anche se ne è
la parte meno piacevole.
Capitolo 4
Matematiche finite
Mi pareva che il calcolo in se stesso servisse
molto poco e non avesse affatto quellimportanza che molti giocatori gli attribuiscono. Essi
se ne stanno seduti davanti a foglietti di carta rigata, segnano i colpi, contano, deducono
le probabilit`
a, fanno calcoli e infine puntano e
perdono come noi, semplici mortali, che giochiamo senza calcoli. In compenso ho tratto
una conclusione che mi pare giusta: realmente,
nel susseguirsi delle probabilit`
a favorevoli cè, se
non un sistema, un certo quale ordine, il che è,
naturalmente, molto strano.
F. Dostoevskij Il giocatore
Il calcolo combinatorio è la parte della Matematica

che conosco un po meglio, poiche è in questo settore, applicato allInformatica, che lavoro e pubblico i
miei articoli. Per questo motivo, voglio rifarmi alle
parole di un vero matematico per presentare largomento. Jean Dieudonne è uno, se non il primo, dei
matematici reali che costituiscono il matematico virtuale Nicolas Bourbaki, la cui opera, a partire dal
1935, è riuscita a sistematizzare grande parte della
Matematica attuale, attraverso il concetto di struttura e mediante un formalismo molto spinto. Alla
metà degli anni 1980, Dieudonne ha scritto un libro
di divulgazione matematica che intitolò Pour lhonneur de lesprit humaine; nella presentazione di uno
schema dei vari settori della Matematica moderna,
dedica alla Combinatoria le seguenti parole, che cito
dalla traduzione italiana Larte dei numeri a pagina
143:
Inizialmente si può dire che ciò che si indica con
questo nome [la Combinatoria] costituiva una parte
della teoria degli insiemi, cioè la teoria degli insiemi
finiti, e i problemi relativi alla valutazione del numero di elementi di insiemi di questo tipo costruiti
mediante procedimenti diversi; alcuni di questi problemi risalgono allantichità, per esempio il numero
delle coppie di elementi di un insieme di n elementi,
uguale ad n(n 1)/2; [. . .] un altro esempio [è] il calcolo del numero n! delle permutazioni di un insieme
di n elementi.
I metodi collegati a questi problemi sono stati a
99
lungo considerati di scarso interesse da molti matematici, che li collocavano volentieri nel settore che
prende il nome di giochi matematici, a cui sono
appassionati molti lettori di divulgazione scientifica.
Ma nel volgere di poche dozzine danni la situazione è
notevolmente cambiata: ci si è accorti che certi metodi combinatori potevano avere importanti applicazioni in settori della Matematica del tutto rispettabili, come la teoria dei gruppi, la teoria delle algebre
di Lie, la geometria algebrica e la topologia algebrica; sono stati utilizzati con successo perfino in varie
applicazioni della Matematica, tra cui lInformatica.
La Combinatoria o Analisi Combinatoria, o anche
Calcolo Combinatorio, è, come dice Dieudonne, lo
studio delle proprietà degli insiemi finiti. Pertanto,
problemi combinatori vengono fuori ogni volta che
consideriamo insiemi e strutture finite, per le quali
essere composte da un numero finito di oggetti è essenziale; vedremo, come esempi, la schedina del totocalcio o il gioco del lotto. Se le partite della schedina
fossero infinite o fossero infiniti i numeri del lotto, tali
giochi non esisterebbero nemmeno oppure nessuno li
prenderebbe in considerazione. Ma, come dice ancora
Dieudonne, lambito dellAnalisi Combinatoria è ben
pi`
u ampio di quello dei giochi; unapplicazione molto
importante è legata al Calcolo delle Probabilità, almeno nelle impostazioni insiemistica e frequentistica.
Per questo, dedicheremo parte del Capitolo alle nozioni di base del Calcolo delle Probabilità, lasciando
al lettore il problema di approfondire (quando sarà il
momento) quegli aspetti legati alla Teoria della Misura e che possono essere affrontati solo dopo aver
studiato il Calcolo Integrale.
4.1
Calcolo combinatorio
Il problema pi`
u semplice dellanalisi combinatoria è
certamente quello di contare gli elementi di un insieme, e su questo abbiamo discusso in abbondanza
al momento opportuno. Vediamo pertanto problemi un po pi`
u complessi. Sia A = {a1 , a2 , . . . , an }
un insieme di n elementi e consideriamo le possibi-
100
li sequenze di elementi di A, cioè le parole su A,
come abbiamo visto nella Sezione 1.8. Ad esempio, se A = {a, b, c} le sequenze di lunghezza 2 sono [a, a], [a, b], [a, c], [b, a], [b, b], [b, c], [c, a], [c, b], [c, c],
cioè 9 in tutto. E facile vedere che le sequenze
di lunghezza 3 sono 27 e quelle di lunghezza 4, 81.
Possiamo anche osservare che le sequenze di elementi di A di lunghezza 1 sono esattamente n, essendo
in corrispondenza biunivoca con gli elementi di A:
[a1 ], [a2 ], . . . , [an ]. Lunica sequenza di lunghezza 0 è
la sequenza vuota [ ] e quindi in generale abbiamo:
CAPITOLO 4. MATEMATICHE FINITE

stinti di A; di nuovo, se A = {a, b, c}, tali sequenze di lunghezza k, dette disposizioni a k a k, per
k = 2 sono: [a, b], [a, c], [b, a], [b, c], [c, a], [c, b], poiche
nessun elemento può essere ripetuto. Dette Dn,k le
disposizioni a k a k, è facile dimostrare:
Teorema 4.2 Se A è un insieme di n elementi, le
disposizioni a k a k di tali elementi sono: Dn,k =
n(n 1) (n k + 1).
Prova: Il primo elemento della sequenza può essere

uno qualsiasi degli n elementi dellinsieme. Il secondo elemento può essere uno degli n elementi, escluso
Teorema 4.1 Il numero delle sequenze di lunghezza quello che ha occupato la prima posizione: quindi vi
m degli elementi di un insieme A di cardinalit`
a n è sono n(n 1) possibili sequenze di 2 elementi, o diesattamente nm .
sposizioni a 2 a 2. Analogamente, il terzo elemento
Prova: I due casi m = 0 ed m = 1 sono stati vi- può essere uno qualsiasi degli n elementi di A eccetsti in precedenza; se m > 1, nella prima posizione to i due che hanno occupato i primi due posti: si
della sequenza possiamo mettere uno qualsiasi degli hanno quindi n(n 1)(n 2) disposizioni a 3 a 3.
n elementi; indipendentemente da questa, nella se- Continuando, si ottiene la formula desiderata.
conda posizione possiamo ancora inserire uno degli
E chiaro che disposizioni con pi`
u di n elementi
n elementi ottenendo cos` n2 sequenze di 2 elementi. non sono possibili; le disposizioni ad n ad n hanno
Come terzo elemento possiamo inserire uno degli n un interesse particolare e si dicono permutazioni. Ad
elementi ottenendo n3 sequenze di 3 elementi, e cos` esempio, le permutazioni di un insieme con 3 elementi
via fino ad m. Naturalmente, questa dimostrazione sono: [a, b, c], [a, c, b], [b, a, c], [b, c, a], [c, a, b], [c, b, a] e
potrebbe espremersi in modo pi`
u formale usando il dalla formula si ha D3,3 = 321 = 6. Linsieme delprincipio di induzione, ma accontentiamoci di quanto le permutazioni di un insieme di n elementi si indica
detto.
con Pn e il numero dei suoi elementi è n(n1) 21;
per
la sua importanza, questo numero che abbiamo
Questo teorema permette di risolvere qualche progi`
a
introdotto
ha una speciale notazione: esso si inblema pratico di tipo elementare. Ad esempio, quante
dica
con
il
simbolo
n! che si legge n fattoriale. Un
sono le possibili schedine del Totocalcio? Una schesemplice
esempio
`
e
costituito dai possibili anagramdina può essere vista come una sequenza di lunghezmi
della
parola
spero;
come sequenza di 5 lettere, si
za 13 dellinsieme {1, X, 2} e quindi il teorema ci dà
hanno
5!
=
120
permutazioni;
di queste, alcune come
13
.
.
come numero complessivo 3 = 1 594 323. Questo
spore,
preso,
perso
hanno
un
senso compiuto; alsignifica che se avessimo a disposizione tanto denatre,
come
eoprs
e
reops
sono
semplici
accostamenti
ro da poter giocare tutto questo milione e mezzo di
di
lettere.
schedine saremmo sicuri di fare un 13 e tredici 12.
Per definizione si ha 1! = 1 e per convenzione si
Naturalmente, il numero 13 è stato scelto in modo da
pone
0! = 1. I fattoriali crescono molto rapidamente,
non rendere conveniente una strategia del genere.
come
si vede dalla seguente tabella:
Questo è un caso molto semplice; talvolta il ragionamento può essere pi`
u complesso. Ad esempio, ci
possiamo chiedere quanti sono i possibili sottoinsiemi
di un insieme di n elementi. Usiamo per questo il
concetto di funzione caratteristica, già introdotto nel
Capitolo 1. Ad ogni sottoinsieme possiamo associare
una sequenza di lunghezza n composta da 0 ed 1 con
questa proprietà: se A = {a1 , a2 , . . . , an } e B A, il
j-esimo elemento della sequenza corrispondente a B
è 1 se e solo se aj B (altrimenti, questo elemento
è 0). Ad esempio, se A = {a, b, c, d} e B = {a, c},
abbiamo la sequenza B = [1, 0, 1, 0], e se B =
abbiamo B = [0, 0, 0, 0]. Si vede allora che i sottoinsiemi sono tanti quanti queste sequenze, che per
il teorema precedente sono esattamente 2n .
Un problema diverso, anche se analogo, è quello di contare le sequenze ottenute con elementi di-
1!
2!
3!
4!
5!
1
2
6
24
120
6!
7!
8!
9!
10!
720
5040
40320
362880
3628800
Si veda la Sezione 1.5 per il valore esatto di 100!; si

veda anche la nota alla fine di questa sezione per il
valore approssimato di n!.
Il concetto pi`
u importante dellanalisi combinatoria
è tuttavia quello di combinazione. Sia A un insieme
di n elementi; si dicono combinazioni a k a k degli elementi di A i sottoinsiemi di A contenenti esattamente
k elementi. Ad esempio, se A = {a, b, c}, le combinazioni a 2 a 2 sono i sottoinsiemi {a, b}, {a, c}, {b, c}.
Le combinazioni differiscono dalle disposizioni per il
101
4.1. CALCOLO COMBINATORIO

semplice fatto che le prime non tengono conto dellordine; cos` abbiamo le disposizioni [a, b] e [b, a], ma
solo la combinazione {a, b}. Questo ci dà un semplice
metodo per contare quante sono le combinazioni a k
a k di un insieme di n elementi:
Teorema 4.3 Se A è un insieme di n elementi, i
sottoinsiemi di A contenenti esattamente k elementi
sono:
n(n 1) (n k + 1)
.
Cn,k =
k!
Prova: Se Cn,k sono le combinazioni che dobbiamo contare, si osservi, come sè fatto, che ad ogni
combinazione corrispondono pi`
u disposizioni; in effetti, da una combinazione si ottengono disposizioni
permutando in tutti i modi possibili gli elementi del
sottoinsieme. Ma se il sottoinsieme ha k elementi,
le sue possibili permutazioni sono k! e quindi si ha:
k!Cn,k = Dn,k . Da questa si ha la formula desiderata,
quando si sostituisca a Dn,k il valore precedentemente
trovato.
I numeri Cn,k si dicono coefficienti binomiali perche legati alle potenze di un binomio, come vedremo nella Sezione 5.1. Esiste una notazione accettata
universalmente:

n
n(n 1) (n k + 1)
=
Cn,k =
k!
k
che si legge n su k. Un semplice problema consiste
nel contare quanti ambi e quanti terni esistono nel
gioco del lotto; gli ambi sono i sottoinsiemi di due
elementi dellinsieme dei primi 90 numeri; i terni sono
i sottoinsiemi di tre elementi. Quindi gli ambi sono:

90 89
90
=
= 4005
2
21
e i terni:
0
1
2
3
4
5
6
0
1
1
1
1
1
1
1
5 6
1
2
3
4
5
6
1
3
6
10
15
1
4
10
20
1
5
15
1
6 1
Tabella 4.1: Il triangolo aritmetico

Europa e nel mondo arabo. Sicuramente, i coefficienti binomiali sono le quantità pi`
u utilizzate in tutta
la Matematica, in quanto legati alla numerazione dei
sottoinsiemi di un insieme.
Come si costruisce il triangolo aritmetico? Intanto osserviamo che la prima colonna e la diagonale
principale sono composte unicamente da 1:

n
n
=1
n N.
=1
n
0
Infatti, il primo di questi coefficienti binomiali conta
i sottoinsiemi di 0 elementi di un insieme di n elementi, ma tale è solo linsieme vuoto (anche quando
n = 0). Per il secondo, si osserva invece che lunico
sottoinsieme di n elementi di un insieme di n elementi
è linsieme stesso. Detto questo, ogni altro elemento del triangolo è la somma dei due elementi che lo
sovrastano: quello nella riga precedente una posizione a sinistra e quello, ancora nella riga precedente,
ma proprio sopra di lui. Questo fatto si può dimostrare facilmente; qui ne diamo una prova combinatoria, cioè che fa uso della definizione dei coefficienti
binomiali come sottoinsiemi. Pi`
u avanti ne vedremo una dimostrazione algebrica, che cioè fa uso delle
proprietà numeriche dei coefficienti binomiali.
Teorema 4.4 Se n e k sono due interi positivi, si

ha:

n
n1
n1
=
+
.
k
k
k1
Poiche su una ruota (ad esempio, Napoli) vengono
estratti 5 numeri, questi corrispondono a:
Prova: Prima di cominciare la dimostrazione, si sia

certi di aver capito che questa identità corrisponde
5
5
= 10 ambi e a
= 10 terni diversi.
alla proprietà del triangolo aritmetico enunciata pi`
u
2
3
sopra. Si consideri allora un insieme A di n elemenI coefficienti binomiali si possono disporre in un ti e se ne isoli un elemento particolare, diciamo a.
triangolo numerico infinito, noto come Triangolo di I sottoinsiemi di A composti di k elementi (che per
Tartaglia o triangolo di Pascal, o, per antonomasia, definizione sono nk ) si dividono in due classi: quelcome triangolo aritmetico (si veda la Tabella 4.1). li che contengono a e quelli che non lo contengono.
Tartaglia lo aveva scoperto nella prima metà del 1500; Sono due classi chiaramente disgiunte e che esauriPascal laveva riscoperto intorno al 1650, quando si scono tutti i sottoinsiemi considerati; basta allora diinteressava alle prime ricerche sul calcolo delle pro- mostrare che le loro cardinalità sono proprio quelle
babilità. In realtà, esso era già noto ai cinesi del che formano il membro destro della formula delle1200 e se ne possono trovare anticipazioni anche in nunciato. Consideriamo la classe A1 dei sottoinsiemi
90
3
90 89 88
= 117. 480.
321
102
che contengono a e immaginiamo di togliere a da A e denominatore per (n k)!, si ha:

e da questi sottoinsiemi: ciò che si ottiene sono i sot
n
n(n 1) (n k + 1)
toinsiemi di k 1 elementi dellinsieme A \ {a}, un
=
=
k
k!
insieme di n1 elementi (è facile vedere che sono proprio tutti:
basta
aggiungere di nuovo a); quindi A1
n(n 1) (n k + 1) (n k) 2 1
=
=
contiene n1
k1 elementi. Per la classe A2 dei sottoink!
(n k) 2 1
siemi che non contengono a, eliminare a da A vuol
n!
dire ottenere i sottoinsiemi di k elementi dellinsieme
(4.1)
=
A \ {a} di n 1 elementi; questi sono in tutto n1
,
k!(n
k)!
k
e il teorema è dimostrato.
e questo permette di esprimere i coefficienti binomiali
in termini del solo fattoriale. Da questo discende la
a di simmetria:
Nota 4.1
Un problema che avevamo lasciato vo- propriet`
lutamente in sospeso è il seguente: se si ha una parola
formata da n lettere diverse, i suoi anagrammi sono
n!, ma se la parola contiene alcune lettere uguali? Ad
esempio, con non si possono comporre solamente onn
e nno, cioè vi sono in tutto tre possibilit`
a contro le sei
di ahi e di mio. E se volessimo sapere quanti sono gli
anagrammi di abracadabra?. Vale il seguente:
Teorema 4.5 Sia A = {a1 , a2 , . . . , an } un insieme di
n elementi e si considerino k1 repliche di a1 , k2 repliche di a2 , . . . , kn repliche di an . Il numero delle
sequenze distinte che si possono formare utilizzando
tutte queste repliche degli elementi di A è:
(k1 + k2 + + kn )!
.
k1 ! k2 ! kn !
Prova: Cominciamo col distinguere le varie repliche
degli elementi di A, di modo che ci appaiano come elementi distinti. In questo caso le sequenze distinte che
si ottengono sono le permutazioni di tutti gli elementi
(con le loro repliche), cioè sono (k1 + k2 + + kn )!.
Eliminiamo ora la distinzione tra le varie repliche di
a1 ; questo significa che tutte le sequenza distinte perche avevano repliche distinte di a1 nelle stesse posizioni, collassano nella medesima sequenza; ma tali sequenze si distinguono solo per lordine assunto dalle
k1 repliche di a1 e quindi sono k1 !. Questo vuol dire che, togliendo la distinzione tra le repliche di a1 ,
si hanno (k1 + k2 + + kn )!/k1 ! sequenze. Procedendo nello stesso modo per le repliche di a2 si passa
a (k1 + k2 + + kn )!/(k1 ! k2 !) sequenze. Alla fine,
naturalmente, si ottiene la formula desiderata.
Nel caso di abracadabra si hanno 5 repliche di a, 2
repliche di b e di r, 1 replica di c e di d; naturalmente,
k1 + k2 + + kn è la lunghezza della parola e quindi
i possibili anagrammi sono:
Teorema 4.6 Per ogni valore di n e k n si ha:

n
n
.
=
k
nk
Prova: Passando alla espressione con i fattoriali, si
ha:
n!
n
=
=
nk
(n k)!(n (n k))!

n
n!
=
=
(n k)!k!
k
come si voleva.
Questa propriet`
a è interessante perche, ad esempio,
per calcolare 20
17 dalla definizione occorre eseguire 32
prodotti, o addirittura 40 se applichiamo la formula
(4.1). Ma per la simmetria si ha:

20
20 19 18
20
=
=
= 1140.
3
17
6
Si osservino i seguenti casi particolari:

n
n
=n
=n
1
n1

n
n(n 1)
n
.
=
=
n2
2
2
La dimostrazione algebrica del Teorema 4.4 è ora

semplice, anche se richiede un po di attenzione poiche si tratta di aggiungere e togliere fattori da certe
frazioni:
n1
n1
(n 1) (n k + 1)
+
+
=
(k 1)!
k1
k
(n 1) (n k + 1)(n k)
;
k!
moltiplichiamo e dividiamo la prima frazione per k,
la maggior parte dei quali non ha nessun senso ottenendo k! a denominatore. Le due espressioni sono
compiuto.
ora uguali eccetto per un fattore k nella prima e un
fattore (n k) nella seconda; ma la somma è proprio
n, per cui:
Alcune proprietà dei coefficienti binomiali sono den1

n1
=
+
gne dattenzione. Intanto, moltiplicando numeratore
k
k1
11!
= 83160,
5! 2! 1! 1! 2!
103
4.2. PERMUTAZIONI
(k + n k)(n 1) (n k + 1)
=
=
k!
Unaltra proprietà è:

n
.
k
Teorema 4.7 Per ogni valore di n e k n si ha:

n
n n1
=
k k1
k
Prova: Applicando la definizione:

n
n(n 1) (n k + 1)
=
=
k
k!
=
n (n 1) (n k + 1)
k
(k 1)!
come desiderato.
Questa formula fornisce un metodo efficiente per calcolare i coefficienti binomiali mediante il calcolatore.
Si ha infatti:
Algoritmo 4.1 (Coefficienti binomiali)
Ingresso: due numeri naturali n,k con n k;
Uscita: il coefficiente binomiale nk .
1. se k > n/2 si pone k := n k [si applica la

propriet`
a di simmetria];
2. se k = 0 si esce col risultato 1;

3. altrimenti, si pone m := n, h := k ed r := 1 e
quindi:
(a) si calcola r := r m/h;
(b) si diminuiscono m ed h di 1;
(c) se h 6= 0 si cicla tornando al punto 3a;

4. si esce col valore r = Cn,k .
Questa formula si prova in modo quasi immediato,

una volta accettata lapprossimazione di Stirling e
pertanto lasciamo la dimostrazione alla buona volont`
a
del lettore.
4.2
Permutazioni
Le permutazioni, che abbiamo introdotto nella precedente sezione, meritano unattenzione speciale, e ad
esse dedicheremo ora un po di spazio. Permutare
gli elementi dellinsieme {a, b, c} o quelli dellinsieme {1, 2, 3} è la stessa cosa, una volta che abbiamo
identificato, ad esempio, a con 1, b con 2 e c con 3.
Pertanto, dora in avanti, salvo avviso contrario, considereremo linsieme di n elementi Nn = {1, 2, , n}
e le permutazioni su di esso. La classe di tutte le
permutazioni di tale insieme si indica con Pn ; le permutazioni stesse hanno varie notazioni, delle quali è
bene conoscere le tre principali.
Osserviamo prima di tutto che laver definito le permutazioni per mezzo delle disposizioni dà immediatamente un ovvio modo di scriverle: in testa il primo
elemento scelto, poi il secondo e cos` via. Si ottiene cos` una lista, nella quale lordine degli elementi
è essenziale, perche indica lordine di scelta. Pertanto, (3, 2, 1) è una permutazione diversa da (2, 1, 3) e
da (1, 3, 2); come si vede, gli elementi si raggruppano tra parentesi tonde, ed in effetti una permutazione cos` scritta è una n-upla o un vettore, e il modo
di rappresentarla si dice notazione vettoriale. Le sei
permutazioni di P3 si denotano:
(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1).
Si osservi che per scrivere sistematicamente tutte

le
permutazioni di Pn si può fissare il primo elemenI coefficienti binomiali che richiedono pi`
u temto,
facendolo variare da 1 ad n, e scrivendogli accanto
po per il calcolo
2nsono i cosiddetti coefficienti bino- tutte le permutazioni degli altri n 1 elementi, che
miali centrali n ; infatti, per essi la proprietà di
(tenendo presente lelemento messo in prima posiziosimmetria non fornisce alcun aiuto.
ne) si ottengono esattamente nella stessa maniera. In
Nota 4.2
Verso il 1730 il matematico inglese Ja- questo modo abbiamo scritto le permutazioni di P3 e
mes Stirling trov`
o una formula approssimata per invitiamo il lettore a fare lo stesso per le 24 permutan!:
n n
zioni di P4 . La notazione vettoriale è particolarmente
n! 2n
utile quando si trattano le permutazioni con lelaboe
dove e = 2.7182818284 . . . è la base dei logaritmi na- ratore, dove i vettori sono una struttura dati molto
turali. Ad esempio, per n = 10 il valore vero è quello semplice da definire ed utilizzare. Essa, tuttavia, non
visibile nella precedente tabella sui fattoriali, mentre `
e la notazione preferita dai matematici.
la formula di Stirling d`
a: 3. 598. 695.62, con un erroUn attimo di riflessione ci fa capire che una permure dello 0.84%. Purtroppo, la dimostrazione di questa tazione `
e una funzione di Nn con se stesso: scegliere
formula famosissima va al di l`
a della struttura elemen- un primo elemento vuol dire associare al numero 1
tare di questo testo. La formula di Stirling ci permet- proprio quellelemento; scegliere un secondo elemente di trovare un valore approssimato per i coefficienti
to significa associare tale elemento al numero 2, e
binomiali centrali:
cos` di seguito. Abbiamo visto che tutte le funzioni
!
(2n)!
4n
2n
Nn Nn sono nn , mentre le permutazioni non sono
.
=
n!2
n
proprio tutte le funzioni, poiche le immagini devono
n
104
essere tutte differenti; questo ci dice che n! nn (in
effetti, per n > 2 si ha n! < nn ). Ma a quali funzioni
corrispondono le permutazioni? Il fatto che le immagini debbano essere tutte diverse ci dice che siamo
di fronte a funzioni iniettive; poiche poi, per costruzione, una permutazione prende tutti gli elementi del
suo codominio Nn , le funzioni sono anche surgettive.
Concludendo, le permutazioni di Nn sono tutte e sole
le corrispondenze biunivoche di Nn .
Questa è la definizione preferita dai matematici ed
essa ci porta immediatamente a un altro tipo di notazione: la notazione funzionale. Si scrivono i numeri
da 1 ad n su una riga e, sotto ad ognuno di essi, si
scrive lelemento corrispondente nella permutazione,
cioè limmagine nella corrispondenza biunivoca. Le 6
permutazioni di P3 sono:
1 2 3
1 2 3
1 2 3
1 2 3
1 3 2
2 1 3
1 2 3
1 2 3
1 2 3
.
2 3 1
3 1 2
3 2 1
Per scrivere le permutazioni, cè ancora un altro
modo che fa furore in Matematica. Prendiamo lultima delle sei permutazioni e partiamo dal numero 1; la
sua immagine è il 3, e limmagine di questo è ancora
1. Con un modo di dire caratteristico, ciò si esprime
cos`: l1 va nel 3 e il 3 va nell1. Se prendiamo una
permutazione di P8 :
1 2 3 4 5 6 7 8
5 4 8 6 3 2 1 7
abbiamo una catena pi`

u lunga: l1 va nel 5, il 5 va
nel 3, il 3 va nell8, l8 va nel 7, e infine il 7 va (o
torna) nell1. Una catena siffatta si dice tecnicamente un ciclo, e in questa permutazione ne troviamo un
secondo, composto da 2, 4 e 6. Un ciclo si può ridurre
a un elemento solo, come il 2 nellultima permutazione di P3 ; in questo caso lelemento si dice un punto
fisso della permutazione. Dovrebbe essere chiaro che
una permutazione è composta sempre da un numero
finito di cicli, e due cicli, o contengono gli stessi elementi o sono disgiunti tra di loro. Questo permette
di definire una notazione a cicli per le permutazioni:
ogni ciclo si scrive tra parentesi tonde, a partire dallelemento pi`
u piccolo. La precedente permutazione
di P8 viene denotata come (1 5 3 8 7) (2 4 6) e le
solite permutazioni di P3 sono:

questo infatti permette di distinguere la permutazione (1 3 2), formata da un unico ciclo, dalla notazione
vettoriale (1, 3, 2) che rappresenta una permutazione
completamente diversa. Con le convenzioni adottate,
scrivere un ciclo con in testa lelemento pi`
u piccolo
e ordinare i cicli secondo il primo elemento, fa s` che
la rappresentazione a cicli di una permutazione sia
unica. E bene avvertire, tuttavia, che non sempre
si adotta tale convenzione e capiterà anche a noi di
considerare cicli non disgiunti e/o non ordinati.
Questa lunga premessa notazionale è indispensabile, perche occorre avere ben presenti le tre notazioni
e saper passare agilmente dalluna allaltra. Infatti,
a seconda di come si vuol trattare una permutazione (o un insieme di permutazioni) conviene ricorrere
a una notazione specifica. Veniamo ora ad effettive
proprietà delle permutazioni. In ogni insieme Pn cè
sempre una permutazione nella quale ogni elemento
ha se stesso come immagine; questo significa che ogni
elemento è un punto fisso o, nella definizione con le
disposizioni, alla scelta k-esima si prende proprio il
numero k. Questa speciale permutazione si chiama
identit`
a e, come ora vedremo, ha un ruolo particolare. La preferenza dei matematici per laspetto funzionale delle permutazioni non è ovviamente dovuta a
qualche ghiribizzo; queste serissime persone agiscono
a ragion veduta e sanno bene che per le funzioni in
generale (e quindi per le permutazioni in particolare) è possibile considerare unoperazione speciale: la
composizione (v. Sezione 1.3).
Si considerino le seguenti permutazioni di P5 :
1 2 3 4 5
1 2 3 4 5
=
=
.
3 5 2 1 4
4 2 5 1 3
Ricordiamo che la composizione di due funzioni e

avviene cos`: si prende un qualsiasi elemento x nel
dominio di e se ne considera limmagine (x); se
questa appartiene al dominio di , le si applica la
stessa ottenendo ((x)), che, per definizione, è
limmagine di x secondo la composizione , cioè:
( )(x) = ((x)). Si dice allora composizione o
prodotto di due permutazioni la loro composizione come funzioni. Per le permutazioni in Pn dominio e codominio coincidono, e quindi la composizione è sempre possibile e applicabile a tutti gli elementi. Si ha
pertanto:
1 2 3 4 5
1 2 3 4 5
=
=
3 5 2 1 4
4 2 5 1 3
(1)(2)(3), (1)(2 3), (1 2)(3), (1 2 3), (1 3 2), (1 3)(2).

1 2 3 4 5
=
.
5 3 2 4 1
I punti fissi spesso non si scrivono; lunica eccezione è
la permutazione composta di tutti punti fissi; essa si Infatti, limmagine di 1 secondo è 3, e limmagine
scrive semplicemente (1), ignorando gli altri elemen- di 3 secondo è 5, di modo che ((1)) = 5. Per
ti. Si osservi che, per convenzione, la separazione fra gli altri elementi si procede in modo analogo. Queldue elementi di un ciclo è data da uno spazio bianco; la che si ottiene è ancora una permutazione di P5 ,
4.2. PERMUTAZIONI
in quanto, come sappiamo, la composizione di due
corrispondenze biunivoche è ancora biunivoca. Loperazione di composizione è allora chiusa in Pn , e
ci possiamo chiedere di quali altre proprietà essa goda. E facile vedere che la composizione è associativa,
cioè che date tre permutazioni di Pn , diciamo , , ,
si ha ( ) = ( ) : in effetti, considerato un
qualsiasi elemento k Nn , comunque si costruisca la
composizione, il risultato finale è sempre (((k))).
Non vale invece la proprietà commutativa; un unico
esempio, cioe un controesempio, è sufficiente a farci
vedere che in generale è 6= . Prendendo le
due permutazioni di P5 già considerate si ha:
1 2 3 4 5
1 2 3 4 5
=
=
4 2 5 1 3
3 5 2 1 4
105
infiniti; ad esempio, sono tali Z, linsieme dei numeri
interi con loperazione di somma; i numeri razionali
positivi Q+ con loperazione di prodotto; i numeri
reali positivi R+ con la stessa operazione, e cos` via.
Una permutazione che si riduca allo scambio di due

elementi si dice una trasposizione; ad esempio, in P5
una trasposizione è:
1 2 3 4 5
;
1 5 3 4 2
nella notazione a cicli essa si scrive semplicemente

(2 5), in quanto i due elementi che si scambiano formano un ciclo, tutti gli altri sono punti fissi. E interessante osservare che un ciclo può sempre essere
immaginato come il risultato (cioè, la composizione)
1 2 3 4 5
di un certo numero di trasposizioni. Ad esempio,
=
6= .
1 5 4 3 2
(2 5 3), per cui 2 va in 5 e questi va in 3, può esLa permutazione con tutti punti fissi, che abbia- sere visto come la trasposizione (2 3) composta con
mo chiamato identità, si comporta come tale nella laltra trasposizione (3 5). Infatti abbiamo:
composizione; infatti, essa manda ogni elemento in
1. il 2 va in 3 e questo va in 5, cioè, nella
se stesso e quindi lascia invariata la destinazione che
composizione, il 2 va nel 5;
ogni altra permutazione ha assegnato a ciascun ele2. il 3 va nel 2 e poi questo rimane fisso nella
mento, cioè: (1) = (1) = . Questo giustifica
seconda trasposizione;
il nome che le abbiamo dato. Ciò che però è pi`
u interessante è il fatto che ogni permutazione abbia un
3. il 5 rimane fisso nella prima trasposizione e poi
inverso, cioè una permutazione, indicata da 1 , tale
va nel 3.
che 1 = 1 = (1). Si scambino infatti le
due linee che definiscono nella notazione funzionale Tutti gli altri elementi rimangono fissi, ma losservae si riordinino gli elementi in modo da far appari- zione vale in generale, anche se gli altri elementi core in sequenza quelli della linea divenuta superiore, stituiscono cicli per proprio conto (purche non intere cambiando di posizione anche i corrispondenti ele- feriscano con quello considerato). Esiste una regola
menti della linea inferiore. Per la permutazione già generale per capire da quali trasposizioni è composto
considerata, si ha ad esempio:
un ciclo (a b c . . . m n): basta considerare il prodotto

(a n)(n m) (d c)(c b). A parte la prima trasposi3 5 2 1 4
1 2 3 4 5
1 =
=
. zione, nella quale il primo elemento va nellultimo,
1 2 3 4 5
4 3 1 5 2
le altre mandano ogni elemento nel precedente. Eseguendo la composizione, a va in n, che va in m, che
Questa nuova permutazione gode della seguente
va . . ., che va in d, che va in c, che va in b: in conproprietà derivata proprio dalla sua costruzione: se
clusione, a va in b. A questo punto b va in c, il che
manda k in h, allora 1 manda h in k. Quando si va
è definitivo poiche c non è presente in trasposizioni
a fare la composizione, pertanto, k va in h e e questo
successive. Cos` c va in d, non pi`
u coinvolto nelle tratorna in k, cioè è un punto fisso. Ciò accade per ogni
sposizioni
successive,
e
via
di
seguito.
Infine, n va in
k Nn , e perciò 1 = (1). Analogamente si
a,
chiudendo
il
ciclo,
come
si
voleva.
trova 1 = (1).
Riprendendo come esempio la permutazione di P8
vista
sopra, possiamo scrivere:
Nota 4.3
Queste, come vedremo nella Sezione
5.8, sono le propriet`
a di gruppo (non commutativo).
I gruppi sono la pi`
u importante struttura algebrica
e, storicamente, i gruppi di permutazioni, cioè i
nostri Pn , sono stati i primi considerati allinizio
del 1800.
Essi costituiscono un importantissimo
esempio di gruppi finiti, cioè contenenti un numero
finito di elementi. Si pu`
o addirittura dimostrare che
ogni gruppo finito è un sottogruppo di un gruppo
di permutazioni. Si scoprirono poi anche gruppi
(1 5 3 8 7)(2 4 6) = (1 7)(7 8)(8 3)(3 5)(2 6)(6 4)

e il lettore è invitato caldamente ad eseguire il prodotto delle trasposizioni per verificare che la permutazione ottenuta è proprio quella di partenza. Quando abbiamo un punto fisso, osserviamo che anchesso
è esprimibile come prodotto di due trasposizioni; ad
esempio, (1) = (1 2)(1 2). Anche 2 rimane fisso in
106
questo prodotto, il che è corretto: se 2 è un punto
fisso di tutta la permutazione, rimane ancora fisso;
se non lo è, queste due trasposizioni non cambiano
nulla e nulla viene modificato in ciò che segue e in
ciò che precede nellespressione della permutazione.
Abbiamo cos` dimostrato:
Teorema 4.8 Ogni permutazione pu`
o essere espressa come prodotto di trasposizioni.
Un altro esempio, che coinvolge anche punti fissi,
è:
(1 4 6 7)(2)(5 9 8) = (1 7)(7 6)(6 4)(2 5)(2 5)(5 8)(8 9).
In realtà, il teorema precedente può essere rafforzato
nel modo seguente. Se a un prodotto di trasposizioni ne aggiungiamo 2 come (a b)(a b) il risultato non
cambia; questo significa che una permutazione può
essere scritta in vario modo come prodotto di trasposizioni; si può però dimostrare (anche se noi non lo
facciamo) il seguente:
Teorema 4.9 Se una permutazione è esprimibile
come numero pari (dispari) di trasposizione, ogni altra rappresentazione di contiene un numero pari
(dispari) di trasposizioni.
Una permutazione si dice allora pari o dispari a seconda del numero di trasposizioni con cui può essere
scritta. Poiche il prodotto si ottiene semplicemente scrivendo le trasposizioni di seguite da quelle
di , si ha immediatamente:
Teorema 4.10 Il prodotto di due permutazioni entrambi pari o entrambi dispari è sempre pari; il prodotto di una permutazione pari e una dispari (o
viceversa) è sempre dispari.
Una rappresentazione mediante trasposizioni della
permutazione contiene, per costruzione, cicli non
disgiunti, cioè cicli nei quali un elemento può comparire pi`
u volte. Questo non è vero, come si è osservato,
per la rappresentazione standard. Questa, per certe
permutazioni, può essere composta da soli punti fissi
e trasposizioni; detta una tale permutazione, se si
esegue il prodotto = 2 si trova che: i) i punti fissi rimangono tali; ii) gli elementi di una trasposizione
(a b), moltiplicando questa per se stessa, divengono
due punti fissi (a)(b). In conclusione, 2 contiene solo punti fissi, cioè 2 = (1). Una permutazione che
gode di questa proprietà si dice una involuzione; risulta facile vedere che tutte e sole le involuzioni sono
composte di cicli disgiunti di un solo elemento (punti fissi) e/o di due elementi (trasposizioni). Si provi
ad esempio ad eseguire il quadrato di P8 con
= (1 4)(2 5)(6 8).

Nota 4.4
Le permutazioni hanno un ruolo fondamentale in molte parti dellInformatica. Il problema

dellordinamento consiste nel partire da una permutazione qualsiasi Pn e trovare un algoritmo (pi`
u
veloce possibile) che permetta di rimettere in ordine
gli elementi di . Il caso in cui il dominio di sia Nn
non è molto interessante, in quanto la soluzione è lo
stesso Nn . Se invece il dominio di è, ad esempio,
un insieme di nomi, di numeri qualsiasi o di codici,
il problema ha un interesse pratico effettivo e soluzioni non banali. Si pensi allanagrafe di un comune,
ai dipendenti di unazienda, ai codici fiscali dei contribuenti, ai codici dei prodotti di un supermercato.
In questi casi, elenchi disordinati non servono a nulla,
come sono inutili dizionari non ordinati o elenchi telefonici con i nomi messi a caso. Per questo, ordinare un
elenco è considerata unoperazione fondamentale, che
oggi facciamo compiere agli elaboratori. Questi usano
algoritmi molto veloci, e lo studio e la realizzazione di
tali algoritmi costituiscono un problema di base dellInformatica. Su di essi si sono cimentati scienziati di
primo piano, che hanno proposto algoritmi oggi usati
universalmente, anche se le ricerche in questo settore
continuano senza tregua.
Un altro importante problema in cui intervengono
le permutazioni è quello cosiddetto del commesso
viaggiatore. Un commesso viaggiatore, partendo da
una citt`
a X (diciamo, la citt`
a in cui abita) deve
visitare le citt`
a A1 , A2 , , An , in un ordine che egli
pu`
o scegliere, ma che, ovviamente, sia quello che gli
procura meno spese. Il nostro commesso conosce i
costi che gli si presenteranno in ogni tratta Ai Aj e
quindi, teoricamente, potrebbe considerare tutte le
n! possibili permutazioni, far eseguire allelaboratore
i relativi conteggi, e scegliere infine la permutazione
per lui pi`
u conveniente. Purtroppo, il numero di
permutazioni cresce, come sè visto, in modo troppo
veloce e gi`
a per un numero di citt`
a piuttosto limitato,
come potrebbe essere 20, il numero di strade da
tentare è dellordine di 1019 , un numero enorme
anche per il pi`
u veloce dei nostri elaboratori. A
tuttoggi non si conoscono metodi migliori di quello
(abbastanza ovvio) di tentare tutte le permutazioni
per essere sicuri di trovare il percorso ottimo. Per
questo il problema del commesso viaggiatore costituisce uno dei problemi difficili; tecnicamente, si dice un
problema intrattabile o che fa parte dei problemi NP.
Insieme al problema della scomposizione in fattori
primi, a quello della soddisfacibilit`
a dei predicati
visto nella Nota 1.11 (e a tanti altri) è una delle
bestie nere dellInformatica.
4.3
Problemi combinatori
I problemi dellAnalisi Combinatoria sono, in generale, problemi di conteggio e, come tali, possono sorgere
in qualsiasi contesto; come sè detto, si può affermare
che lAnalisi Combinatoria si interessa degli insiemi
107
4.3. PROBLEMI COMBINATORI

finiti, dei quali vuole contare i sottoinsiemi che posseggono una qualche proprietà caratteristica. Le disposizioni e le combinazioni sono esempi elementari,
ma significativi; spesso si ha a che fare con situazioni
particolari, come quando si desidera contare le possibili posizioni delle regine su una scacchiera, disponendole in modo che non si possano reciprocamente
mangiare. In questi casi, il problema specifico viene
generalizzato, e si cerca una formula che dia il numero
di posizioni quando si hanno n regine e una scacchiera di n n caselle. Quello, che è forse il pi`
u antico
dei problemi combinatori, si trova citato in testi egizi
e babilonesi; ha resistito ai secoli ed oggi si ritrova
in forma di filastrocca in tanti paesi. In Italia suona
cos`:
Per una strada che mena a Camogli
passava un uomo con sette mogli.
E ogni moglie aveva sette sacche,
e ogni sacca aveva sette gatte,
e ogni gatta sette gattini.
Fra gatti e gatte e sacchi e mogli,
in quanti andavano, dite, a Camogli?
Il lettore può usare i teoremi che abbiamo visto
nella Sezione 3.2, relativamente alle progressioni
geometriche, per risolvere la questione.
Un problema combinatorio molto pi`
u interessante
risale a Fibonacci, il quale inventò il seguente quesito:
un contadino possiede una coppia di conigli appena
nati; i conigli diventano fertili dopo un mese, e un
mese è anche il loro periodo di gestazione. Ogni coppia di conigli genera ogni mese (eccetto il primo dopo
la nascita, durante il quale giunge alla maturità sessuale) unaltra coppia di conigli. Pertanto, il contadino, allinizio del secondo mese, avrà ancora ununica
coppia, ma allinizio del terzo mese avrà due coppie.
Allinizio del quarto mese, la prima coppia avrà generato una seconda coppia, e siamo cos` a tre coppie.
Al quinto mese, sia la coppia primigenia, sia la prima coppia generata avranno dei figli; in tal modo,
le coppie saranno diventate cinque. Si chiede quante
coppie di conigli possiederà il nostro contadino dopo
n mesi, nellipotesi (abbastanza teorica) che nessun
coniglio muoia, per cause naturali o alimentari?
Sia Fn il numero di coppie di conigli in possesso
del contadino allinizio delln-esimo mese; allinizio
del successivo egli avrà queste n coppie, pi`
u le coppie nate quel mese; ma queste sono esattamente tante
quante le coppie fertili alln-esimo mese, cioè le coppie
presenti il mese precedente, ovvero Fn1 . Abbiamo
quindi la relazione Fn+1 = Fn + Fn1 , che possiamo
considerare assieme alle condizioni iniziali F1 = 1
ed F2 = 1, le coppie di conigli possedute allinizio
del primo e del secondo mese. Abbiamo già incontrato questa sequenza di numeri e possiamo supporre F0 = 0 mantenendo tutte le caratteristiche viste.
Questa storia giustifica il nome di numeri di Fibonacci dato agli elementi della sequenza. La soluzione
del problema di Fibonacci è dato dal seguente:
Teorema 4.11 Ln-esimo numero di Fibonacci vale:
!n !
!n
1
1 5
1+ 5
Fn =
.
2
2
5
Prova: Procedendo per induzione, osserviamo che,
dalla formula, discende subito F0 = 0 e:
1
1+ 51+ 5
F1 =
= 1.
2
5
Il lettore può continuare e verificare altri valori, ma
questi due sono sufficienti come base del ragionamento. Supponiamo che ci siano valori di n per i quali la
formula del teorema non sia valida; chiamiamo m il
loro valore pi`
u piccolo, che deve esistere e deve essere
maggiore di 1 per le verifiche fatte. Per m1 ed m2
la formula deve perciò essere valida e proviamo a calcolare Fm1 + Fm2 che per la proprietà dei numeri
di Fibonacci deve essere uguale proprio ad Fm :
Fm = Fm1 + Fm2 =
!m1
!m1
1 5
1 1+ 5
+
=
2
2
5
!m2
!m2
1+ 5
1 5
=
+
2
2
!m2
!
1+ 5
1 1+ 5
1+
+
=
2
2
5
!
!m2
1 5
1 5
.
1+
2
2
Ora osserviamo che:
!2
1+ 5
1+2 5+5
1+ 5
=
=
1+
2
4
2
e unanaloga identità vale per 1+(1 5)/2. Pertanto

si ha:
Fm1 + Fm2 =
!m
!m !
1+ 5
1
1 5
=
= Fm
2
2
5
contro lipotesi che per Fm non valesse questa formula. Questo dimostra che non esiste un valore di m,
per cui la formula non valga, cioè, in altre parole, la
formula è valida per ogni numero naturale n.
108
Questa dimostrazione, che abbiamo voluto portare avanti secondo la formulazione delle prove per induzione vista nel primo capitolo, mette in evidenza
lutilità e i limiti dellinduzione. I conti che abbiamo
fatto sono elementari, e quindi ci convincono che la
formula per Fn è proprio quella data dal teorema. Ma
come ha fatto lo scopritore di questa formula a immaginare unespressione del genere che, allapparenza, è
notevolmente complessa? In realtà si è arrivati alla
scoperta della formula per tuttaltra via e, come abbiamo già avuto modo di dire, linduzione non ci aiuta
affatto a scoprire le formule. Si provi, ad esempio, ad
immaginare una formula per Gn , definito dalla relazione Gn = Gn1 + 2Gn2 , apparentemente simile a
quella dei numeri di Fibonacci. Anche se imponiamo
le condizioni iniziali G0 = 0 e G1 = 1, la soluzione è
completamente diversa. Essa è riportata in fondo a
questa sezione ed è molto pi`
u semplice di quella dei
numeri di Fibonacci. Se il lettore è comunque riuscito a scoprirla dopo aver osservato alcuni elementi
della sequenza, merita i nostri complimenti. Va detto, tuttavia, che esistono metodi del tutto generali
per trovare la soluzione di tutte le sequenze, i cui
elementi sono definiti da ricorrenze del tipo visto.
I conigli di Fibonacci o le mogli che vanno a Camogli ci mostrano che i problemi combinatori possono nascere in qualsiasi contesto. Per semplificarne
lanalisi, e quindi la risoluzione, i matematici hanno
proposto e studiato alcune classi standard di oggetti,
ai quali tentare di ricondurre problemi nati in situazioni diverse. Queste classi, o i loro elementi, sono
detti genericamente oggetti combinatori e su di essi
si concentra lAnalisi Combinatoria; è chiaro che se
un problema qualsiasi può essere ricondotto a uno
equivalente ma che si riferisce a qualche tipo di oggetto combinatorio noto, allora o se ne ha già una
soluzione o si è sulla strada per trovarla, poiche è pi`
u
facile trattare oggetti con proprietà ben conosciute,
piuttosto che gli strani insiemi, nei quali era stato
formulato il problema originale. Vedremo pi`
u avanti
una serie di oggetti combinatori utilizzati dai matematici; come sempre accade, alcuni sono stati studiati maggiormente, altri un po meno; alcuni sono
pi`
u ricchi di proprietà, altri pi`
u poveri; alcuni hanno maggiormente stimolato la fantasia, altri non sono
stati altrettanto fortunati. Non potremo certo essere
esaurienti in un campo per molti versi assai ricco di
proposte, di alternative e di mode.
Alcune classi di oggetti combinatori si sono affermate in modo speciale, costituendo punti di attrazione tanto da diventare veri e propri paradigmi a cui
ricondurre la dimostrazione di proprietà combinatorie
molto disparate. Per questo motivo, tali classi hanno
assunto il ruolo di modelli combinatori, strutture di
riferimento a cui ricondursi quasi costantemente. La

varietà e limprevedibilità dei problemi combinatori
fanno s` che anche questi modelli non esauriscano le
possibilità di soluzione da prendere in considerazione, ma di sicuro sono i primi oggetti a cui cercare di
riportare un problema nuovo.
Il modello delle urne. Uno dei modelli combinatori pi`
u vecchi e pi`
u usati è quello detto delle urne.
Si supponga di avere un certo numero di contenitori, detti convenzionalmente urne, e degli oggetti che,
a seconda dei gusti di chi usa il modello, sono detti
gettoni o palline. Le urne possono essere tutte uguali
(cioè, come si dice, indistinguibili) o possono essere
una distinta dallaltra, ad esempio per mezzo di un
numero di identificazione; analogamente, le palline
possono essere indistinguibili o di diverso colore. Ad
esempio, se le urne sono n e tutte uguali, e le palline
dello stesso colore, possiamo immaginare di mettere
o non mettere una pallina in ciascuna delle urne. Se
ci chiediamo in quanti modi diversi possiamo inserire
una pallina in ciascuna delle urne, otteniamo lo stesso problema del lancio delle monete. Allopposto, se
le urne sono numerate 1, 2, . . . , n e in ciascuna di esse
inseriamo una pallina fra n palline distinte da n colori diversi, otteniamo esattamente le n! permutazioni
che ben conosciamo. Come si vede da questi esempi,
le urne e le palline simulano gli insiemi e gli elementi,
e numerazione e colorazione possono simulare le funzioni. Oggi, quando ormai il linguaggio degli insiemi
è insegnato (quando lo è) fin dalla scuola elementare
ed è diventato abbastanza comune, è spesso pi`
u facile ragionare in termini di insiemi, elementi e funzioni
piuttosto che di urne, palline e colori. Per questo motivo il modello delle urne non si usa pi`
u molto spesso
e, personalmente, devo dire che non mi è mai stato
particolarmente simpatico.
Ad onor del vero, il modello delle urne serve bene
a introdurre un principio che risulta utile in diversi ragionamenti. In inglese si chiama pigeon hole
principle, un nome che, come ora vedremo, è perfettamente appropriato. Il termine principio vuole
mettere in evidenza che si tratta di una verità piuttosto ovvia, anche se di ampia applicazione. Noi lo
possiamo enunciare come un vero e proprio teorema:
Teorema 4.12 (pigeon hole principle) Se supponiamo di avere n urne ed almeno n + 1 palline
da distribuire nelle urne, esiste almeno unurna che
verr`
a a contenere pi`
u di una pallina.
Prova: Se nessuna urna contenesse pi`
u di una pallina, queste potrebbero essere al pi`
u n, contro lipotesi
fatta.
Naturalmente, il nome inglese del principio fa riferimento al fatto che n + 1 piccioni non possono tutti
avere un proprio buco sotto il tetto, se i buchi a disposizione sono solo n. Alcuni problemi, che sembrano
109
4.3. PROBLEMI COMBINATORI

formidabili, si risolvono facilmente applicando il principio. Ci si può chiedere, ad esempio, se in una città
di 200. 000 abitanti ci sono due donne che hanno lo
stesso numero di capelli (parliamo di donne, poiche
due uomini completamente calvi hanno, in modo banale, lo stesso numero di capelli: zero). Di fronte a
questo problema ci si sente un po sconcertati, ma
basta pensare a questo: il numero dei capelli di una
donna può variare da 40 a 50 mila; possiamo allora
immaginare di avere, diciamo, 60 mila urne numerate da 1 a 60. 000, dove il numero k rappresenta k
capelli; ogni donna inserisce una pallina nellurna designata col numero dei propri capelli. La procedura
è solo ideale, ma ci fa capire che due almeno delle
100. 000 palline, per il principio dei piccioni, devono
finire nella stessa urna. In modo analogo, visto che
in città viaggio spesso in autobus, mi è capitato di
chiedermi se mi è mai successo di viaggiare due volte
sullo stesso mezzo. Ormai ho preso lautobus per pi`
u
di mille volte e lAzienda dei trasporti pubblici ha al
massimo a disposizione un paio di centinaia di mezzi:
il principio dei piccioni permette di dare una risposta immediata. Ignoro invece se ho preso almeno una
volta ciascuno degli autobus dellAzienda; su questo
quesito, purtroppo, il principio non ci aiuta.
Numeri figurati. Probabilmente, i pi`
u antichi
oggetti combinatori sono i cosiddetti numeri figurati. Tutti sappiamo che 25 è il quadrato di 5 perche
occorrono 25 gettoni per disporli su un quadrato che
abbia per lato 5 gettoni. I numeri quadrati si ottengono appunto in questo modo e, partendo da un
unico gettone, si ottengono gli altri numeri quadrati
procedendo come nella Figura 4.1. Si può osservare che ogni volta si aggiunge un numero dispari di
gettoni: prima 3, poi 5, poi 7 e cos` via. Come ricordiamo, abbiamo dimostrato fin dal primo capitolo che
la somma dei primi n numeri dispari è uguale ad n2 ,
ed ora, se si vuole, abbiamo una prova combinatoria
di tale fatto.
Figura 4.1: Numeri quadrati e numeri triangolari

I Pitagorici, accanto ai numeri quadrati, considerarono i numeri triangolari, pentagonali, esagonali e,
in generale, i numeri poligonali. Ln-esimo numero
triangolare Tn ha una base composta da n gettoni;
sopra ad essa sono disposti n 1 gettoni, e sopra ancora n 2, fino a ridursi a un solo gettone. Pertanto
si ha:
n(n + 1)
Tn = 1 + 2 + + n =
2
come abbiamo dimostrato nel Corollario 3.11. Gli
stessi Pitagorici si divertirono a trovare molte proprietà dei numeri triangolari che, bisogna dire, sono
piuttosto curiose. Limitiamoci qui a qualche considerazione elementare. Intanto, è immediato dimostrare
che Tn + Tn1 = n2 ; una dimostrazione algebrica si
ottiene sostituendo a Tn e Tn1 il loro valore appena
trovato. Pi`
u interessante è dare di questa relazione
una dimostrazione combinatoria, cioè basata sugli oggetti combinatori considerati. Nel nostro caso, basta
dividere un numero quadrato mediante una retta, ad
esempio al di sotto della diagonale che va da sinistra
in alto a destra in basso, e osservare che al di sopra
della retta si hanno Tn gettoni e al di sotto Tn1 .
Meno immediato è il seguente:
Teorema 4.13 Per ogni numero naturale n si ha:
2
Tn2 Tn1
= n3 .
Prova: Questa relazione lega i numeri triangolari ai
numeri cubi, che possiamo considerare numeri figurati in tre dimensioni. La dimostrazione algebrica è
abbastanza immediata:
2
Tn2 Tn1
=
n2 (n + 1)2 (n 1)2 n2
n2
=
((n+1)2 (n1)2 ) =
4
4
4
n2
n2
(n + 1 + n 1)(n + 1 n + 1) =
2n 2 = n3
4
4
dove abbiamo applicato il prodotto notevole della

differenza di due quadrati.
Unosservazione importante che conviene fare a
questo punto è la seguente: ogni volta che sappiamo
qualcosa sulla differenza di due elementi consecutivi
di una sequenza, sappiamo automaticamente qualcosa sulle somme della sequenza di tali differenze. Per
essere pi`
u precisi, dimostriamo il seguente risultato;
esso è un po ridotto rispetto a quello che potremmo
fare, ma è sufficiente ai nostri scopi:
Teorema 4.14 Si abbiano due sequenze {An }nN e
{Bn }nN con A0 = B0 = 0; allora An An1 = Bn
se e solo se An = B1 + B2 + + Bn .
Prova: Supponiamo dapprima che An sia la somma
dei primi n elementi della sequenza {Bn }nN ; allora
sarà anche: An1 = B1 +B2 + +Bn1 , e sottraendo
membro a membro questa relazione dalla precedente,
si ha An An1 = Bn , cancellandosi tutti gli altri
110
elementi. Se, viceversa, An An1 = Bn ,, avremo

anche:
An An2 = An An1 +An1 An2 = Bn +Bn1 .
Si può andare avanti con An An3 = Bn + Bn1 +
Bn2 , e cos` via fino ad ottenere:
An A0 = Bn + Bn1 + + B1 ,
da cui deriva la conclusione, essendo per ipotesi A0 =
0.
Da questo teorema otteniamo, come immediato corollario, che ogni numero triangolare Tn è dato dalla
Figura 4.2: Numeri pentagonali
radice quadrata della somma di tutti i cubi da 1 fino
ad n. Ad esempio, T5 = 15 ed infatti abbiamo:
Teorema 4.16 Ln-esimo numero pentagonale vale:
p
13 + 23 + 33 + 43 + 53 = 225 = 15.
n(3n 1)
Pn =
.
2
Per quanto riguarda i numeri quadrati, ci limitiamo
a dimostrare il seguente risultato che ha moltissime Prova: Per la scomposizione appena vista, si ha:
applicazioni (si veda ad esempio la Sezione 8.8):
Pn = Tn + 2Tn1 =
Teorema 4.15 Il valore della somma dei primi n
numeri quadrati è dato da:
n
n(n + 1)
+ n(n 1) = (2n 2 + n + 1)
=
2
2
n
X
n(n + 1)(2n + 1) che dà esattamente la formula desiderata.
2
2
2
2
k =
Sn = 1 + 2 + + n =
.
6
k=0
Prova: Procediamo per induzione, verificando che

S0 = 0, S1 = 1 e S2 = 5 sono dati effettivamente
dalla formula proposta. Se questa però non fosse vera
per ogni n N, esisterebbe un numero m > 2 per il
quale la formula è falsa. Allora, se n = m 1, per n
la formula deve essere vera e quindi:
Sn+1 = Sn +(n+1)2 =
n(n + 1)(2n + 1)
+(n+1)2 =
6
Nota 4.5
Ragionare sui numeri triangolari, quadrati e pentagonali permette di generalizzare abbastanza agevolmente alcuni risultati e ottenere pro[k]
priet`
a di questi numeri. Chiamiamo n ln-esimo
[3]
[4]
numero k-gonale, di modo che n = Tn , n = n2
[5]
[k]
e n = Pn ; per costruzione, se disegniamo n , per
[k]
disegnare n+1 occorre aggiungere k 2 lati (si veda
la Figura 4.2 relativa ai Pn ); ogni lato ha n + 1 gettoni, ma uno è in comune con il lato successivo, eccetto
lultimo. Si ha pertanto la ricorrenza:
[k]
n+1
(n + 1)(n + 2)(2n + 3)
=
(2n2 + 7n + 6) =
.
6
6
Ma questa è la stessa espressione data dal teorema,
quando si consideri n + 1 al posto di n, e ciò dimostra
che anche per n + 1 = m la formula è valida, contro
lipotesi fatta.
Dopo i numeri triangolari e quadrati, vengono i
numeri pentagonali, la cui sequenza comincia con
P1 = 1, P2 = 5, P3 = 12, P4 = 22, P5 = 35, come si vede dalla Figura 4.2. Per trovare una formula
che ci dia ln-esimo numero pentagonale, si osservi
che le due rette tratteggiate dividono i pentagoni in
tre zone: in quella centrale, che comprende gli estremi dei lati opposti al vertice centrale, riconosciamo i
numeri triangolari Tn , mentre nelle due zone laterali
riconosciamo i numeri triangolari Tn1 .
Si ha pertanto:
n+1 = [k]
n + n(k 2) + 1,
[k]
da mettere insieme alla condizione iniziale 1 = 1.

Ci si accorge ora del ruolo fondamentale dei numeri
triangolari: con una decomposizione analoga a quella
dei numeri quadrati e pentagonali, si vede che:
[k]
n = Tn + (k 3)Tn1
[k]
che permette di calcolare una formula per ogni n :

Teorema 4.17 Il valore delln-esimo numero kgonale è dato da:
[k]
n =
kn(n 1) 2n(n 2)
.
2
Prova:
Applichiamo la formula dei numeri
triangolari alla precedente relazione:
Tn + (k 3)Tn1 =
n(n 1)
n(n + 1)
+ (k 3)
=
2
2
4.4. STRUTTURE DATI

kn(n 1) 2n2 + 4n
2
da cui discende la formula desiderata.
=
Esistono altri approcci ai numeri k-gonali, ma noi

possiamo accontentarci di quanto detto fin qui, non
senza aver citato un risultato ottenuto dal solito
Eulero: ogni numero naturale è la somma di al pi`
uk
numeri k-gonali, cioè di al pi`
u tre numeri triangolari,
di al pi`
u quattro numeri quadrati, e cos` via.
111
i dati che potrebbero servire per accertare, al di là di
ogni dubbio, se la persona, non solo è un cliente, ma
è veramente lindividuo che pretende di essere. Questo, però, grazie allInformatica. Una volta, non poi
tanti anni fa, le cose non andavano cos`. Tutto era
semplice se il cliente era conosciuto dal cassiere o da
qualche altro impiegato; ma, in caso contrario, era
necessario far partire una procedura di ricerca che,
attraverso la consultazione di elenchi, la presentazione di documenti, la firma di moduli e ammennicoli
vari permetteva, alla fine, di dire: s`, costui è uno
dei clienti della banca, oppure no, si tratta di un millantatore e nulla gli può essere concesso. Lo stesso
problema si presenta in mille occasioni: lutente di
una biblioteca ha diritto al prestito? un certo farmaco è prodotto o meno dalla casa farmaceutica XYZ?
esiste in Italia un comune che si chiama Cogoleto?
Oggi, poi, il problema si è allargato a dismisura. Un
biologo si chiede se una certa sequenza di aminoacidi
è presente fra i miliardi di aminoacidi che formano
lelica del DNA di un crostaceo. Un navigatore di Internet cerca informazioni su Teofilo Folengo, sperando di trovar qualcosa tra i miliardi di dati presenti
nel Web, la tela che tutti ci avvolge.
I numeri poligonali sono i numeri figurati pi`

u semplici, ma ne esistono, e se ne possono inventare, molti
altri, fra i quali i numeri stellati hanno ricevuto molta attenzione. Si può anche passare dal piano allo
spazio e immaginare di avere delle palline al posto
dei gettoni; esse possono essere disposte in forma di
piramide con base triangolare, quadrata o esagonale.
Si possono pensare altre costruzioni e si può addirittura immaginare di passare a 4, 5 o m dimensioni; per
queste note, tuttavia, pensiamo di poterci fermare a
questo punto.
Il modello delle urne e i numeri figurati si riferiscono ai pi`
u antichi problemi combinatori; oggi si sono
sviluppati altri modelli e altri oggetti, alcuni dei quali sono legati alle strutture dati dellInformatica. A
In tutti questi casi, il calcolatore è stato fornito, o
questi aspetti dellAnalisi Combinatoria dedicheremo
ha creato lui stesso, un elenco delle informazioni che
le prossime sezioni, naturalmente dopo aver dato la
gli servono: gli utenti della biblioteca, i farmaci della
formula a suo tempo promessa:
ditta XYZ, e cos` via. Questi elenchi possono essere
2n (1)n
lunghissimi, contenere anche miliardi di dati diversi,
.
Gn =
e certo lelaboratore non può consultarli uno dietro
3
laltro: cos` facendo, anche il calcolatore pi`
u veloce
impiegherebbe minuti ed ore a trovare una particola4.4 Strutture dati
re informazione, e nessun utente di queste macchine
LInformatica ha portato alla ribalta alcuni proble- potenti accetterebbe di aspettare cos` a lungo. Un
mi che la Matematica aveva ignorato o sottovalutato metodo usato dallelaboratore è derivato da un trucperche sembravano non presentare risvolti teorici ap- co che adoperiamo quando cerchiamo una parola nel
prezzabili. Lesempio pi`
u eclatante è costituito dal dizionario o un cognome sullelenco telefonico: invece
problema della ricerca: dato un insieme S e un ele- di partire dallinizio, scegliamo ad occhio una pagina
mento x, si vuole sapere se x S oppure x 6 S. Per ragionevolmente vicina a ciò che cerchiamo. Il trucco
un matematico, questo non è neppure un problema; è reso sistematico nel modo seguente. Supponiamo
come abbiamo osservato fin dallinizio, elementi e in- che le informazioni nellelenco dellelaboratore siano
siemi sono entità che non si definiscono nemmeno e ordinate, cos` come lo sono quelle del dizionario o della loro esistenza è legata al fatto di poter istituire lelenco telefonico. Si comincia allora la ricerca dalletra di esse alcune relazioni che le caratterizzano; una lemento mediano, cioè linformazione che sta proprio
di queste è proprio lappartenenza, per cui, dato S e nella posizione di mezzo. Si potrebbe essere fortunadato x, è immediato sapere se x S, o meno. Tutti ti e trovare al primo colpo ciò che si cerca, ma non
i nostri ragionamenti su elementi e insiemi si basano siamo cos` ottimisti: se linformazione cercata è misul fatto (anche se non solo su quello) che si possa nore (cioè, viene prima) di quella individuata, allora
dire senza problemi quando x sta o non sta in S.
possiamo escludere dalla ricerca successiva tutta le
Nella pratica, le cose non stanno proprio cos`. Se seconda metà dellelenco; se linformazione cercata è
una persona si presenta alla cassa di una banca e vuol maggiore (cioè, viene dopo) si escluderà la prima parritirare del denaro, il problema che si presenta al cas- te. In ogni caso, il tentativo successivo sarà limitato
siere è: questa persona è o non è cliente della banca? a una sola metà dellelenco, e questo fa una bella difOggi, basta digitare sul terminale il nome della perso- ferenza. Tale metodo si dice ricerca binaria e per essa
na e il calcolatore fornisce la risposta, insieme a tutti vale il seguente risultato:
112
Teorema 4.18 Sia S un insieme di n elementi, dato combinatori detti alberi binari di ricerca, che qui cacome elenco ordinato; il numero massimo di confronti dono giusto a proposito. Per brevità, spesso diremo
necessari a determinare se un elemento x appartiene albero binario per albero binario di ricerca.
o non appartiene ad S è log2 (n + 1).
Definizione 4.1 Un albero binario di ricerca è una
Prova: Onde semplificare i conti necessari, limitia- struttura finita cos` fatta: è vuota oppure è costituita
moci a considerare i valori per cui n è 1 meno di una da un nodo etichettato dal quale partono due rami,
potenza di 2, cioè vale 0, 1, 3, 7, 15, 31, . . .. Questi nu- allestremit`
a dei quali si trovano due alberi binari di
meri hanno la caratteristica che, quando procediamo ricerca, detti rispettivamente il sottoalbero di sinistra
nella ricerca e riduciamo a metà lelenco, il numero e di destra dellalbero binario.
degli elementi rimasti è ancora dello stesso tipo. Indichiamo allora con Cn il massimo numero di confronti Un nodo etichettato è semplicemente un nodo che
necessari alla ricerca in un elenco di n elementi e po- contiene unetichetta, cioè un nome o un numero, in
niamo ck = Cn = C2k 1 . Per losservazione fatta, ogni caso lidentificazione di un elemento dellinsieme
abbiamo C2k 1 = 1 + C2k1 1 , la qual formula si- S. Il primo nodo dellalbero si dice la radice, e le radignifica che il numero totale dei confronti è uguale ad ci dei due sottoalberi di sinistra e di destra si dicono
1 (il confronto effettuato) pi`
u il numero di confronti i figli sinistro e destro della radice, alla quale ci si
per la metà rimasta dellelenco. Questa relazione si riferisce come nodo genitore. Per capire bene il conscrive: ck = 1 + ck1 e quindi, iterando, si ha:
cetto di albero binario, la cosa migliore è utilizzarlo
e pertanto vedremo ora come si costruisce e come si
ck = 1 + ck1 = 2 + ck2 = = k + c0 .
usa. Alluopo, useremo linsieme S delle parole contenute nella Divina Commedia; si dà per scontato che
Ma c0 = C20 1 = C0 = 0, poiche se un elenco non ha lincipit sia conosciuto da tutti. La prima parola nel
elementi (cioè, S = ) non cè bisogno di confronti per viene a costituire letichetta della radice:
stabilire che x 6 S. In conclusione, abbiamo Cn = k,
dove n = 2k 1. Ricavando k si ha k = log2 (n + 1),
nel
come si voleva.
@
q
@q
Se n è un milione, Cn 20 e se n vale un miliardo
si ha Cn 30. Per un potente elaboratore, fare 20 o I due rami che si dipartono da questa radice punta30 confronti è pressoche immediato, e questo spiega no, per il momento, a due alberi vuoti che, però, preperche la nostra domanda su Teofilo Folengo ottenga sto, si riempiranno. Per inserire nellalbero la seconda
parola mezzo, si procede cos`: si confronta la nuova
una risposta in una frazione di secondo.
La ricerca binaria funziona se lelenco è ordinato. parola con letichetta della radice; poiche mezzo è alPurtroppo, i dati grezzi ben raramente sono ordinati, fabeticamente inferiore, si procede lungo il ramo di
basti pensare alle informazioni su Internet. Il cal- sinistra. Lalbero che si trova è vuoto e perciò lo si
colatore, perciò, ha anche il problema di ordinare i sostituisce con un nodo avente mezzo come etichetta:
dati dellelenco, e questa è unaltra operazione che la
nel
Matematica classica ha sottovalutato. In pratica, n
@
elementi diversi possono assumere una qualsiasi delle
@q
mezzo
n! permutazioni possibili, e ciò rende conto della variabilità del problema. Abbiamo a suo tempo visto
@
q
@q
quanto vale 100!, e pensare a 1. 000. 000! è semplicemente assurdo. Questo pone il problema generale del- Per la terza parola del si procede in modo analogo:
lordinamento, che è considerato, assieme alla ricerca, confrontata con la radice, essa è minore e quindi si
uno dei problemi di base dellInformatica.
segue il ramo di sinistra. Qui si trova il nodo con etiSi rifletta un attimo come un elenco non ordina- chetta mezzo, di cui del è minore. Continuando a sito sia praticamente illeggibile, cos` come ogni uscita nistra, si trova lalbero vuoto, che perciò sostituiamo
prodotta dallelaboratore deve essere ordinata, se vo- con un nodo nuovo etichettato del:
gliamo che serva a qualcosa. Gli informatici hanno
nel
inventato metodi ingegnosi per ordinare velocemente
@
gli insiemi di dati, metodi che non fanno propriamen
@q
te parte dellAnalisi Combinatoria; ma questo argomezzo
mento va al di là degli scopi di queste note. Acconten
@
@q
tiamoci allora di introdurre un metodo che permette
del
di ottenere ordinamento e ricerca in tempi decisa
@
q
@q
mente buoni. Questo metodo è legato a certi oggetti
113
4.4. STRUTTURE DATI

Linserimento di cammin e di di è semplice e basta osservare che di è maggiore di del e quindi verrà posto
alla sua destra. Analogo caso avviene per nostra,
che si colloca alla destra della radice. Nella Figura 4.3 mostriamo il nostro albero dopo linserimento
delle prime 15 parole. Ora, la ricerca di un termine avviene con lo stesso criterio dellinserimento. Si
supponga di voler cercare oscura. Si confronta con
la radice nel e poiche è maggiore si procede col ramo
di destra. Qui troviamo nostra, di cui oscura è ancora maggiore, per cui continuaiamo verso destra. La
parola oscura è invece minore di vita e noi procediamo verso sinistra. Cos` andiamo avanti finche non
recuperiamo oscura. Lo stesso procedimento avrebbe avuto luogo per ricercare oscuro, una parola per il
momento non ancora presente nel nostro albero; naturalmente, però, lultimo confronto ci avrebbe portato in un sottoalbero vuoto, il che denota le ricerche
con insuccesso.
La proprietà fondamentale degli alberi binari di ricerca è che, preso un qualsiasi nodo N , il suo sottoalbero di sinistra contiene solo etichette minori di
quella in N , e il suo sottoalbero di destra contiene solo
etichette maggiori. Questo è vero per costruzione e ci
suggerisce che le etichette sono virtualmente ordinate. Il seguente algoritmo ricorsivo produce un elenco
ordinato di tutte le etichette di un albero binario:
Algoritmo 4.2 (Ordinamento)
Ingresso: un albero binario di ricerca;
Uscita: lelenco ordinato delle etichette dellalbero.
1. se il sottoalbero di sinistra non è vuoto, chiamare
ricorsivamente questo programma per ordinarlo;
2. scrivere nellelenco letichetta della radice di
questo albero;
3. se il sottoalbero di destra non è vuoto, chiamare
ricorsivamente questo programma per ordinarlo.
fr
Q
Q
Q e
d
r
Qr
Q
D Q

D
Q
Q c
Q
Qr
D
J
D
J
D
J
D
J
a D
r
Jr b
Figura 4.4: Un grafo connesso
(x, y) ed (y, x) si scrive una doppia freccia. Un grafo
pesato è un grafo nel quale ad ogni arco è associato
un numero reale non negativo, detto il peso dellarco.
Nei grafi orientati e pesati, il peso dellarco (x, y) pu
o
essere diverso dal peso dellarco (y, x). Un sottografo
di G è un grafo G = (V , A ) dove V V e A A.
Se x è un vertice, il grado di x è il numero di archi
che hanno x come vertice. Se il grafo è orientato, si
distingue il grado di ingresso, cioè il numero di archi
che arrivano ad x, dal grado duscita, cioè il numero
di archi che partono da x.
La figura riporta il grafo definito da V =
{a, b, c, d, e, f } e composto di 8 archi. Abbiamo già
avuto modo di incontrare grafi; è chiaro che un grafo
è un modo di rappresentare una qualsiasi relazione
simmetrica su un insieme finito V ; in generale, una
relazione su V corrisponde a un grafo orientato. Per
le relazioni di ordine, possiamo limitare gli archi a
quelle coppie (x, y) per le quali x y e non esiste
alcun altro elemento z tale che x z y; in questo caso, prendendo come convenzione che un arco è
sempre diretto dal basso verso lalto, ritroviamo i diagrammi di Hasse, introdotti nella Sezione 1.2. Una
corrispondenza tra due insiemi A e B può essere rappresentata da un grafo i cui vertici sono gli elementi
di A B e i cui archi collegano elementi di A e di B
in corrispondenza tra loro; si tratta di un grafo un
po particolare e lo si dice bipartito. La terminologia
relativa ai grafi riflette la loro generalità.
Il concetto di albero binario di ricerca fa parte

di una serie di oggetti combinatori importanti, che
possiamo classificare addirittura come modello.
Il modello dei grafi. La seguente definizione introduce il concetto di grafo e di alcune sue
Definizione 4.3 Sia dato un grafo G = (V, A); si
varianti.
dice cammino di G una sequenza finita di vertici di
Definizione 4.2 Un grafo è una coppia G = (V, A), V , diciamo (v0 , v1 , . . . , vh ), per i quali {vi , vi+1 } è un
dove V è un insieme finito di elementi detti vertici o arco di A per i = 0, 1, . . . , h 1. Un cammino per il
nodi, di solito rappresentati graficamente da punti; se quale v0 = vh si dice un ciclo. Nei grafi orientati pu`
o
D è linsieme dei sottoinsiemi di due elementi di V , si esistere il ciclo formato dal solo arco (v, v), il quale
ha A D; ogni {x, y} A si dice un arco o spigolo, e pi`
u propriamente viene detto laccio. Se G è un grafo
si rappresenta con una linea che unisce i due vertici pesato, il peso di un cammino è la somma dei pesi
interessati. Un grafo orientato è una coppia Go = degli archi che lo compongono. Il grafo G si dice con(V, A), dove V è come prima, ed A V 2 , di modo nesso se, presi comunque due suoi vertici v, v , esiste
che ogni arco orientato (x, y) A è rappresentato da almeno un cammino che va da v a v . Dato un vertiuna freccia da x ad y; se sono presenti i due archi ce v, si dice componente connessa di v linsieme dei
114

nel
mezzo
mi
@
@
di
@
@
che
nostra
q
@
@
del
cammin
HH
H
@
@q
@
@q
@
@q
vita
ritrovai
HH
H
@
@q
per
oscura
q
@
@
@
@q
@
@q
una
selva
@
@q
@
@q
Figura 4.3: La parte iniziale dellalbero binario di ricerca della Divina Commedia
vertici v del grafo per i quali esiste un cammino da v
a v ; un grafo connesso ha ununica componente connessa. Un albero è un grafo connesso e privo di cicli.
Se G è un grafo connesso, un albero di ricoprimento
di G è un sottografo di G che sia un albero contenente tutti i vertici di G. Se G è pesato, un albero
minimo di ricoprimento è un albero di ricoprimento
che abbia peso minimo rispetto a tutti gli altri alberi
di ricoprimento.
che i sottoalberi di sinistra e di destra non possono

essere scambiati tra di loro, cioè, in altre parole, i rami che partono da un nodo hanno un ordine che non
può essere ignorato.
La teoria dei grafi è vastissima e qui non possiamo
dare che una vaga idea di alcune parti molto limitate.
Un problema classico è il seguente: riprendiamo il
grafo connesso della Figura 4.4 e chiediamoci se è
possibile partire da uno dei suoi vertici e disegnarlo
in un unico tratto, senza staccare la matita dal foglio,
Lalbero minimo di ricoprimento ha grande impor- e senza ripassare due volte per lo stesso arco. Già
tanza in molte applicazioni dei grafi, poiche rappre- Eulero aveva dimostrato:
senta il modo di raggiungere tutti i vertici del grafo
con un costo, o peso, globalmente minimo. Il con- Teorema 4.19 Sia G = (A, V ) un grafo; è possibile
cetto di albero, presentato in questa maniera, può partire da un vertice v V e disegnare il grafo con
lasciare abbastanza sconcertati, almeno in un primo un sol tratto di matita (senza staccare la matita dal
momento, e sarebbe forse meglio parlare di struttu- foglio) e senza ripassare due volte per lo stesso arco
ra arborescente, ma tantè. Se fra i nodi di un albe- se e solo se il numero dei vertici di grado dispari è al
u 2 (cioè, è 0 oppure 2).
ro scegliamo un nodo particolare, questo viene detto pi`
la radice dellalbero e lalbero, pi`
u propriamente, si
Prova: Per poter entrare e uscire da un vertice senza
chiama albero con radice; da un albero con n nodi si
usare lo stesso arco occorre che il grado del vertice
possono derivare n alberi con radice. Come abbiamo
sia 2, o comunque sia pari. Se il grado è dispari, vi
già fatto con gli alberi binari di ricerca, si preferisce
si può entrare ma non uscire, o viceversa. Quindi,
mettere la radice in alto e far crescere lalbero verso
se i vertici di grado dispari sono pi`
u di 2, uno di
il basso; è una semplice convenzione, che torna bene
questi nodi bloccherà il disegno (lasciamo al lettore
per il nostro modo di scrivere da sinistra a destra e
la dimostrazione, abbastanza ovvia, che non possono
dallalto in basso. Nella Figura 4.5 abbiamo riportaesistere grafi con un numero dispari di nodi di grado
to un albero con radice e la sua rappresentazione pi`
u
dispari!).
usuale.
Il grafo della Figura 4.4 ha due vertici di grado
La presenza della radice fa s` che, praticamente, gli
archi (detti anche rami) di un albero con radice sia- tre: uno si può usare come vertice di partenza, laltro
no orientati, esattamente dallalto verso il basso. Da darrivo; con questa considerazione il disegno riesce
questo fatto deriva lusanza di parlare del grado di un facilmente. Lo stesso Eulero aveva osservato la senodo come del suo grado duscita; cos` nellesempio guente proprietà fondamentale. Un grafo si dice plaprecedente, il grado di a è 4, quello di c è 2 e quello di nare se si può disegnare sul piano senza che i suoi
e è 0. In questo senso, gli alberi binari di ricerca sono archi si incrocino; si chiama faccia di un grafo plaalberi con radice i cui nodi hanno grado 0 oppure 2. nare ogni parte del piano delimitata dagli archi del
Si aggiunge che sono orientati per sottolineare il fatto grafo, cioè da alcuni dei suoi cicli; si considera che la
115
4.5. IL MODELLO DELLE PAROLE
rd
A
A
A
rb
A
Acr
r e
rf
f
r
i
r
HH
jr
kr
HHr
h
r
g
ar
f
PP
@
@ PP P
PPi r
@r
r
r
b
c
S
A
S
A
A
S
S
A
Ar
Sr
r
r
r
d
e
g
h
j
rk
Figura 4.5: Albero con radice e sua rappresentazione convenzionale

cioè la loro rappresentazione lineare, come stringa di
caratteri, invece che quella grafica. Per costruire un
albero binario, noi partiamo da una delle n! permutazioni di un insieme S di n elementi; è facile tuttavia
rendersi conto che non esistono n! alberi binari diverTeorema 4.20 Sia G = (V, A) un grafo connesso e si. Ad esempio, con n = 3 si hanno 6 permutazioni,
indichiamo con v, a, f il numero dei suoi vertici, dei ma solo 5 alberi binari:
suoi archi e delle sue facce. Si ha allora la relazione
s
s
s
s
s
di Eulero: f + v = a + 2.
@
@
@
@
@
Prova: Usiamo il principio di induzione matematica

@s @ s
s
s
s
@s
sul numero dei vertici che compongono il grafo. Se

@
il grafo si compone di un unico vertice, si hanno due

@
@s
s
s
@s
possibili situazioni:
parte esterna al grafo costituisca una delle sue facce.
Nel caso della Figura 4.4, si hanno in tutto 6 facce.
Un albero ha ununica faccia, essendo per definizione
privo di cicli. Si ha allora:
Infatti, lalbero centrale viene generato tanto dalla

permutazione (2, 1, 3) quanto da (2, 3, 1). Si pone alv
s
lora il problema: quanti alberi binari distinti corrispondono alle permutazioni di n elementi? Ragioniamo in questa maniera: consideriamo un albero con
n + 1 nodi; esso sarà composto dalla radice, da un
La prima situazione corrisponde a (v = 1, f = 1, a = sottoalbero di sinistra con k nodi (con k variabile tra
0) e la seconda a (v = 1, f = 2, a = 1) e per entrambe 0 ed n) e un sottoalbero di destra che, di conseguenza,
vale la relazione di Eulero. Si supponga allora che tale conterrà n k nodi. Sia Ck il numero totale di alberi
relazione valga per v vertici e aggiungiamo un vertice distinti con k nodi; poiche ogni sottoalbero di siniulteriore x. Poiche il grafo deve rimanere connesso, si stra con k nodi può essere associato un sottoalbero
devono aggiungere anche 1 o pi`
u archi che partono da di destra con n k nodi, si hanno in tutto:
o arrivano ad x, mantenendo la planarità del grafo.
n
X
Se se ne aggiunge uno solo, il numero della facce non
C
=
Ck Cnk
n+1
cambia e si ha (v = v +1, f = f, a = a+1), e quindi
k=0
la relazione di Eulero vale ancora. Se si aggiungono
k archi, questi devono dividere la stessa faccia, quella
alberi binari con n+1 nodi. Questa formula permette
in cui abbiamo inserito x; ma questo genera k 1
di calcolare uno dietro laltro il valore dei Cn , partenfacce, che si aggiungono alla precedente e quindi si
do dalla condizione iniziale C0 = 1; infatti, esiste
ha (v = v + 1, f = f + k 1, a = a + k), e la
un unico albero con 0 nodi, ed esattamente lalbero
relazione di Eulero vale ancora.
vuoto. Si ha allora:
m
s
v
4.5
Il modello delle parole
Il modello delle parole: Il secondo problema posto

dagli alberi binari di ricerca è la loro linearizzazione,
C1
C2
C3
C4
=
=
=
=
=
C0 C0 = 1 1 = 1
C0 C1 + C1 C0 = 1 1 + 1 1 = 2
C0 C2 + C1 C1 + C2 C0 = 2 + 1 + 2 = 5
C0 C3 + C1 C2 + C2 C1 + C3 C0 =
5 + 2 + 2 + 5 = 14.
116
Dopo aver capito bene il gioco degli indici di questa somma di prodotti, il lettore è caldamente invitato a calcolare il valore di C4 ed, eventualmente, di
C5 . E possibile dimostrare (ma noi non ci proveremo
nemmeno) che vale la formula generale:

1
2n
Cn =
n+1 n
che però il lettore verificherà con i valori appena calcolati. I numeri Cn si dicono numeri di Catalan, dal
nome del matematico belga che li studiò per primo
alla metà del 1800.
Unespressione parentesizzata è una sequenza di
parentesi [ e ] che si conformi alle usuali regole di
apertura e chiusura. Esiste ununica espressione con
una sola coppia di parentesi: [ ]; ne esistono due con
due coppie: [[ ]], [ ][ ], e ne esistono 5 con tre coppie:
[[[ ]]], [[ ][ ]], [[ ]][ ], [ ][[ ]], [ ][ ][ ].
Si considera la sequenza vuota come lunica
espressione con 0 coppie di parentesi. Si ha:
Teorema 4.21 Esistono tanti alberi binari di ricerca
con n nodi quante espressioni parentesizzate con n
coppie di parentesi.
Prova: Consideriamo un albero binario e indichiamo con una coppia di parentesi la sua radice; quindi
inseriamo tra queste due parentesi la rappresentazione del suo sottoalbero di sinistra e alla loro destra
la rappresentazione del suo sottoalbero di destra. La
rappresentazione dellalbero vuoto è la stringa vuota.
Di conseguenza, ad ogni albero binario con n nodi
corrisponde unespressione parentesizzata con n coppie di parentesi (una per nodo). Ad alberi diversi
corrispondono ovviamente espressioni diverse (la corrispondenza è iniettiva) ed ogni espressione parentesizzata proviene da un albero, in quanto la costruzione si può invertire (la corrispondenza è surgettiva).
In conclusione, la corrispondenza è biunivoca, come
si voleva.
Nella prima metà degli anni 1950, il linguista Noam
Chomski introdusse il concetto di linguaggio formale
nel tentativo di creare uno strumento adatto a modellare il linguaggio naturale. Il suo concetto di grammatica formale (o semplicemente grammatica) è stato
effettivamente usato a tale scopo, ma il maggior successo lha avuto in Informatica. Qui, esso è stato
usato per almeno tre scopi fondamentali:
1. come strumento teorico per formulare la teoria
della computabilit`
a, cioè la teoria che cerca di
stabilire quali problemi sono risolubili da un punto di vista computazionale. Le grammatiche di
Chomski di tipo 0 sono una formulazione alternativa alle macchine di Turing, alle funzioni parzialmente ricorsive, al -calcolo, agli algoritmi
normali di Markov e alle altre impostazioni della

teoria;
2. come metodo pratico per definire con precisione quelle lingue artificiali che sono i linguaggi di
programmazione. Le grammatiche di tipo 2 sono
correntemente usate sia per dare una formulazione esatta di linguaggi come Pascal, C o Java, sia
per dirigere la loro traduzione nel linguaggio
macchina del particolare elaboratore utilizzato
dal programmatore;
3. come strumento per la definizione formale delle
strutture dati usate nei programmi, per lo studio del loro comportamento e, quindi, per la valutazione della loro efficienza nella risoluzione di
determinati problemi.
Questo ultimo è largomento che qui particolarmente ci interessa, anche se dovremo limitare
drasticamente le nostre considerazioni.
Prima di addentrarci negli aspetti pi`
u formali; cerchiamo di capire, con un semplice esempio non del
tutto banale, qual era lidea di Chomski. Nella Tabella 4.2 riportiamo una piccola grammatica formale che vorrebbe dare una vaga idea di come si possa
definire una frase nominale, qui indicata dal simbolo
hfrasei; le parentesi a punta h e i sono utilizzate
per delimitare un simbolo che si vuole considerare come unico, anche se composto da lettere e altri segni,
che danno un aiuto mnemonico per capire e ricordare
il significato del simbolo stesso, in questo caso una
frase nominale.
Il simbolo ::= significa si può pensare come, e
quindi una frase nominale si può pensare come: un
soggetto, seguito da uno spazio (il simbolo ), seguito da una copula, seguito da uno spazio, seguito
infine da una sequenza di aggettivi. Questo, semplificando molto, è ciò che ci aspettiamo da una frase
nominale. Il soggetto si può pensare come un nome
proprio hnomei oppure (tale è il significato della barra verticale |) un articolo seguito da un sostantivo.
I nomi propri che consideriamo sono solo quattro, ma
potrebbero essere tutti quelli che riusciamo ad immaginare, purche in numero finito. La barra verticale si
usa per creare tante alternative quante si desiderano.
Si noti che una lista di aggettivi è costituita da un
unico aggettivo, oppure da vari aggettivi separati da
virgole (cioè, una sequenza di aggettivi), ma lultimo
è separato dagli altri dalla congiunzione E.
Ogni alternativa è detta una produzione, nel senso che il simbolo di sinistra produce i vari simboli
di destra. Partendo da hfrasei, lapplicazione delle
produzioni, da sinistra verso destra, cambia hfrasei
in altre sequenze, generando alla fine una sequenza di
lettere (senza pi`
u simboli tra parentesi a punta) che
4.5. IL MODELLO DELLE PAROLE
hfrasei
hsoggettoi
hnomei
harticoloi
hsostantivoi
hfinalei
hcopulai
hseq. agg.i
hlista agg.i
haggettivoi
::=
::=
::=
::=
::=
::=
::=
::=
::=
::=
117
hsoggettoi hcopulai hseq. agg.i

hnomei | harticoloi hsostantivoi
PAOLO | CHIARA | SARA | ANTONIO
IL | LO | LA | I | GLI | LE
RAGAZZhfinalei | SARThfinalei | CAVALLhfinalei
A|E|I|O
E | SONO | ERA | ERANO
haggettivoi | hlista agg.i E haggettivoi
haggettivoi | hlista agg.i, haggettivoi
BELLhfinalei | BIONDhfinalei | PICCOLhfinalei | ALThfinalei
Tabella 4.2: Una grammatica formale
costituisce un esempio valido di frase nominale. Ecco

un semplice esempio di generazione:
che è davvero sgrammaticata. In realtà, la grammatica formale non tiene conto del contesto, cioè di cosa
sta vicino a ciascun elemento della frase: larticolo
hfrasei
deve concordare in numero e genere con il sostantivo;
questo determina il numero della copula, e cos` via.
hsoggettoi hcopulai hseq. agg.i
Per questo, una grammatica del genere si dice libera
dal
contesto. Chomski introdusse anche grammatiharticoloihsostantivoihcopulaihseq. agg.i
che contestuali pi`
u realistiche, ma dal nostro punto
LA hsostantivoi hcopulai hseq. agg.i
di vista sono troppo complesse e meno interessanti.
La notazione adottata nella Tabella 4.2 si dice BacLA SARThfinalei hcopulai hseq. agg.i
kus Normal Form (BNF) perche inventata da Backus
per adattare le grammatiche di Chomski alla definiLA SARTA hcopulai hseq. agg.i
zione dei linguaggi di programmazione, in particolare
LA SARTA ERA hseq. agg.i
dellAlgol60. Essa fa capire in modo immediato il
LA SARTA ERA hlista agg. E haggettivoi significato dei vari simboli, il che è molto utile quando si ha a che fare con decine o centinaia di simboli
LA SARTA ERA haggettivoi E haggettivoi diversi, come accade in linguaggi abbastanza vasti
LASARTAERAPICCOLhfinaleiEhaggettivoi (anche se relativamente semplici), quali sono quelli
usati nella programmazione. Normalmente, tali simLA SARTA ERA PICCOLA E haggettivoi
boli si dicono non terminali e si indicano con lettere dellalfabeto greco. Formalmente, una grammatica
LA SARTA ERA PICCOLA E BIONDhfinalei
libera dal contesto, o anche, con terminologia inglese
abbastanza accettata, context-free è una quadrupla
LA SARTA ERA PICCOLA E BIONDA
G = (T, N, , P) dove:
Questo è laspetto generativo della grammatica,
cioè delle produzioni che costituiscono la gramma1. T è linsieme dei simboli terminali;
tica formale. Tante altre frasi di senso compiuto si
2. N è linsieme dei simboli non terminali; T N =
possono generare, come:
;
PAOLO E ALTO
3. N è il simbolo iniziale;
I RAGAZZI SONO BIONDI, ALTI E BELLI
4. P è un insieme di produzioni: una produzione è
Se leggiamo la derivazione dal basso verso lalto, abuna coppia (, x) dove N e x (T N ) , cioè
biamo la divisione strutturale della frase, che metx è una parola di T N , eventualmente vuota.
te in chiaro quale sia il soggetto, quale la copula e
quale o quali gli aggettivi (aspetto strutturale della Supponiamo che w = w1 w2 sia una parola su T N ,
che N e w1 non contenga il simbolo , cioè l
grammatica).
u a sinistra di tale simbolo.
Purtroppo, la grammatica genera anche frasi del indicata sia loccorrenza pi`
Se w = w1 yw2 e (, y) è la i-esima produzione di P,
tipo:
allora si dice che w genera immediatamente w e si
scrive w i w o semplicemente w w , se non si
GLI CAVALLE ERA PICCOLA E ALTI
118
vuol mettere laccento sulla produzione considerata. è ambigua; 2) le parole di L(G) sono le sequenze di
Si dice poi che w0 genera wn se esistono n 1 parole 0/1 nelle quali lo 0 è isolato e non si trova ne in cima
ne in fondo; 3) le parole di L(G) di lunghezza n sono
w1 , w2 , . . . , wn1 tali che risulti:
contate dalln-esimo numero di Fibonacci Fn .
w0 w1 w2 wn1 wn ;
Accenniamo alla dimostrazione di questultima
proprietà. Sia L(G) il linguaggio generato dalla
questa catena di generazioni si dice la derivazione sigrammatica; la produzione (, 1) ci dice che 1 L(G)
nistra di wn da w0 e si scrive w0 wn . Si dice
e che quindi 6 L(G), se è la sequenza vuota; quininfine linguaggio generato dalla grammatica G lindi L(G) non contiene sequenze di lunghezza 0, e ne
sieme delle parole su T generate dal simbolo iniziale
contiene una sola di lunghezza 1. Ciò corrisponde alle
, cioè formalmente:
condizioni iniziali F0 = 0 e F1 = 1 dei numeri di Fibo
nacci.
Per quanto riguarda la ricorrenza, osserviamo
L(G) = {w T | w}.
che la produzione (, 1) ci dice che una sequenza di
La grammatica G si dice non ambigua se ogni parola lunghezza n che termina con 1 proviene da ununica
di L(G) può essere generata in uno e un solo modo sequenza di lunghezza n 1. La produzione (, 01)
da attraverso una derivazione sinistra.
ci dice che una sequenza che termina con 01 provieA questo punto un esempio è fortemente richiesto. ne da ununica sequenza di lunghezza n 2. Poiche
Sia T = {[, ]}, di modo che i simboli terminali del queste sono le uniche produzioni, tali considerazionostro linguaggio siano le due parentesi; sia poi N = ni corrispondono alla ricorrenza Fn = Fn1 + Fn2 ,
{} e, di conseguenza, = ; infine, linsieme delle e ciò è sufficiente a dimostrare il nostro asserto, che
produzioni sia:
le parole di Fibonacci di lunghezza n sono proprio
contate delln-esimo numero di Fibonacci.
P = {(, [ ])1 , (, [])2 , (, [ ])3 , (, [])4 },
dove lindice sta ad indicare il numero dordine del4.6 Il calcolo delle proposizioni
la produzione per semplificare la comprensione del
seguente esempio. Vediamo infatti la derivazione
Il calcolo delle proposizioni è una teoria che tratta del
sinistra della parola [[ ]][ ]:
modo in cui si possono elaborare le espressioni proposizionali per calcolarne il valore di verità e/o per
4 [] 1 [[ ]] 1 [[ ]][ ].
trasformare proposizioni in altre equivalenti. Questo
Si osservi che, quando sono presenti pi`
u simboli non calcolo si basa sul concetto di equivalenza tra proterminali uguali, la produzione si deve applicare al posizioni: due proposizioni sono equivalenti quando,
simbolo pi`
u a sinistra e da questa regola è nato il ter- scelti comunque i valori di verità delle proposizioni
mine di derivazione sinistra. Questa grammatica elementari che le compongono, i valori di verità delnon è ambigua; lasciamo al lettore il non facilissimo le due proposizioni coincidono. Il lettore verificherà
compito di provare questo fatto; suggeriamo di di- che si tratta proprio di una relazione di equivalenza.
mostrare che ogni parola di L(G) ha una e una sola Le proposizioni sono costruite a partire da un certo
decomposizione secondo le produzioni di P. E invece numero (non meglio specificato) di proposizioni elefacile osservare che L(G) è composto di tutte e sole mentari p, q, r, . . . e dai tre connettivi logici negazione
le espressioni parentesizzate (eccetto quella vuota), e , congiunzione , disgiunzione , e le parentesi per
quindi G è un metodo formale per definire gli albe- regolare la precedenza delle operazioni.
ri binari di ricerca, nella loro forma linearizzata. Da
La tabella di verit`
a di una proposizione è una taquesta definizione, in effetti, è possibile derivare una bella che, in funzione dei diversi e possibili valori di
serie di proprietà degli alberi binari di ricerca, delle verità delle funzioni elementari, dà il valore di verità
quali, tuttavia, facciamo grazia al lettore. Notiamo della proposizione. Una tabella di verità si costruisolo che questa è una delle tante vie per dimostrare sce a partire dalle tabelle di verità dei tre connetla validità della formula di Catalan.
tivi logici, viste nel Capitolo 1. Possiamo dire che
Concludiamo con due ulteriori grammatiche. La due proposizioni sono equivalenti se e solo se hanno
prima è abbastanza ovvia e fa uso della parola stessa tabella di verità. Si consideri ad esempio
la vuota : T = {a, b, c}, N = {} e P = la proposizione: (p q) r, e si osservi la Tabella
{(, ), (, a), (, b), (, c)}. Lasciamo al lettore 4.3. Sulla sinistra abbiamo riportato tutte le possibili
la dimostrazione, questa volta semplice, del fatto combinazioni dei valori di verità delle tre proposizioche L(G) = {w T }. La seconda grammati- ni elementari p, q, r. Nella colonna q si è riportato
ca è meno ovvia: T = {0, 1}, N = {}, = , il valore della negazione di q e, analogamente, nelP = {(, 1), (, 1), (, 01)}. In questo caso il let- la colonna p q abbiamo valutato il risultato della
tore dovrebbe dimostrare che: 1) la grammatica non disgiunzione tra p e la negazione di q. Infine, con
119
4.6. IL CALCOLO DELLE PROPOSIZIONI

p
0
0
0
0
1
1
1
1
q
0
0
1
1
0
0
1
1
r q
0 1
1 1
0 0
1 0
0 1
1 1
0 0
1 0
p q
1
1
0
0
1
1
1
1
(p q) r
0
1
0
0
0
1
0
1
Tabella 4.3: Calcolo di una tabella di verità
vuol dire (p q) (q p) = (p q) (p p)
(q q)(pq) = (pq)(pq) = (pq) (pq):
il lettore è invitato a costruire le varie tabelle di verità. La proposizione p q indica lesclusione fra p e
q e la sua tabella di verità è giusto la negazione della
doppia implicazione:
p
0
0
1
1
q pq
0
0
1
1
0
1
0
1
la tabella di verità della congiunzione, si è calcolata E bene osservare che essa si calcola facendo la somma
lultima colonna, che rappresenta proprio la tabella (modulo 2) dei valori di verità di p e q: nel caso che
sia p = q = 1, si ha p + q = 2, ma: 2 mod 2 = 0
di verità della proposizione (p q) r.
(vedere Definizione 2.4).
Nota 4.6
Il calcolo combinatorio ci dice che vi
Ciò che è interessante nella Tabella 4.4 è il fatsono 8 possibili combinazioni dei valori 0/1 da asso- to che le regole esposte non solo trasformano una
ciare alle tre proposizioni p, q, r. Esistono vari metodi, proposizione in unaltra proposizione ad essa equiestendibili a 4 o pi`
u proposizioni, per scriverle in modo valente, ma date due espressioni equivalenti, cio`
e con
sistematico.
la stessa tabella di verità, esse permettono di tra1. la colonna di p è costituita da quattro 0 e da sformare luna nellaltra. Per il momento, limitiaquattro 1; la colonna di q da due 0 e da due moci ad un esempio. Si consideri la proposizione:
1, seguiti da altri due 0 e due 1; la colonna di (p q r) (p q r) (p q r) e se ne
r è fatta da 0 e 1 in sequenza. Lasciamo per costruisca la tabella di verit`
a: si osserva allora che
esercizio estendere questa regola a quattro o pi`
u tale tabella coincide con quella di (p q) r. Come
proposizioni;
possiamo trasformare questa in quella? Se riusciamo
2. partendo dalla combinazione composta di tutti in tale impresa, applicando le regole allinverso (esse
0, si procede cambiando da 0 in 1 lultimo 0 pre- sono tutte simmetriche) si ottiene una trasformaziosente nella combinazione. Contemporaneamen- ne di quella in questa: `
e quindi sufficiente trovare
te, si cambiano in 0 tutti gli 1 che lo seguono una qualsiasi della due trasformazioni. Partiamo da
(se ce ne sono). La validit`
a di questo modo di (p q) r e applichiamo la propriet`
a distributiva;
procedere è pi`
u nascosta, ma il metodo funziona! si ha:
3. se leggiamo le combinazioni come numeri in base
(p q) r (p r) (q r).
2 (v. alla fine della Sezione 1.5) vediamo apparire tutti i numeri da 0 a 7. In generale, si hanno i
numeri da 0 a 2n 1 e un po di esercizio insegna
come scriverli facilmente uno dopo laltro.
Qualche prova è sufficiente a capire come procedere.
Per mezzo delle tabelle di verità è possibile dimostrare una serie di proprietà formali del calcolo delle
proposizioni; lasciando al lettore la cura delle verifiche, abbiamo elencato nella Tabella 4.4 le principali
proprietà. Una proposizione che come p p risulta sempre vera si dice una tautologia; una che come
p p è sempre falsa, si dice una contraddizione.
Per quanto abbiamo visto nella Sezione 1.7, limplicazione p q è equivalente a p q. Questo
ci dice subito che p q non è la stessa cosa della sua contraria q p, che equivale a p q. Invece, la contropositiva di p q è q p, cioè
q p = q p = p q, quindi coincide proprio
con p q. La doppia implicazione (p q) (q p)
Questo è un passo notevole, poiche ci ha portato a

una disgiunzione di congiunzioni, proprio come la
proposizione darrivo. Linconveniente è che nella prima disgiunzione manca la q e nella seconda manca la
p. La regola di identità p 1 = p ci dice che possiamo
inserire degli 1 in ogni congiunzione:
(p r) (q r) (p 1 r) (1 q r)
La regola del complemento p p = 1 ci permette
ora di inserire q e p nei posti giusti:
(p (q q) r) ((p p) q r)
Di nuovo, la legge distributiva ci permette di tornare
ad una disgiunzione di congiunzioni:
(pq r)(pq r)(pq r)(pq r)
Naturalmente, le varie applicazioni delle proprietà associativa e commutativa nemmeno si citano: però ci
120

commutativa
associativa
distributiva
assorbimento
idempotenza
complemento
identità
zero
doppia negazione
de Morgan
pq =qp
pq =qp
p (q r) = (p q) r
p (q r) = (p q) r
p (q r) = (p q) (p r) p (q r) = (p q) (p r)
p (q p) = p
p (q p) = p
pp=p
pp=p
p p = 1
p p = 0
p0=p
p1=p
p1=1
p0=0
p = p
(p q) = p q
(p q) = p q
Tabella 4.4: Le regole del calcolo proposizionale

sono. Ora osserviamo che la due congiunzioni cen- sono falsi (la sua tabella di verità è la negazione della
trali sono la stessa, e la proprietà di idempotenza ci disgiunzione, detta or in inglese, da cui il nome nor).
Per il lemma precedente: p nor q = p q. Tale
permette di concludere:
lemma sembra molto particolare, ma si può estendere
(p q r) (p q r) (p q r),
immediatamente, coinvolgendo anche la disgiunzione:
che è quanto volevamo dimostrare.
Questo successo potrebbe essere solo un caso, come potrebbe essere casuale il fatto che in precedenza
siamo riusciti ad esprimere i connettivi dellimplicazione, della doppia implicazione e dellesclusione mediante i connettivi booleani. Ci poniamo pertanto le
seguenti, fondamentali questioni:
Lemma 4.23 Si consideri un connettivo che abbia

una tabella di verit`
a composta da almeno un 1; allora
tale connettivo è esprimibile mediante i tre connettivi
booleani.
Prova: Si considerino, nella tabella di verità del connettivo, le linee corrispondenti al valore 1; il lemma
precedente ci dà modo di esprimere (mediante nega1. E vero che i connettivi booleani permettono zione e congiunzione) il connettivo che avesse quel sodi esprimere tutti i possibili connettivi fra lo 1. La disgiunzione di tutti questi connettivi vale 1
proposizioni?
solo in corrispondenza delle linee per cui il connettivo
è vero, cioè, in altre parole, il connettivo di partenza
2. E vero che due proposizioni sono equivalenti
e tale disgiunzione di congiunzioni sono equivalenti.
(hanno la stessa tabella di verità) se e solo se
è possibile trasformare luna nellaltra mediante
Si riprenda la tabella di verità dellesclusione; il
le regole della Tabella 4.4?
lemma ci dice:
La risposta ad entrambe le domande è positiva ed ora
cercheremo di darne la dimostrazione. Cominciamo
p q = (p q) (p q)
con il seguente
il che vuol dire: (non andremo al supermercato ma
Lemma 4.22 Si consideri un connettivo che abbia andremo dal commercialista) oppure (andremo al suuna tabella di verit`
a composta da un unico 1, men- permercato ma non andremo dal commercialista), il
tre tutti gli altri valori sono 0; allora, tale connettivo che è proprio quello che ci aspettiamo. La conclusione
si pu`
o esprimere tramite i due connettivi booleani di è allora:
negazione e di congiunzione.
Teorema 4.24 Un qualsiasi connettivo è esprimibile
Prova: Siano p, q, r, . . . le proposizioni elementari mediante i tre connettivi booleani.
su cui è costruito il connettivo. Si osservi che una
congiunzione è vera se e soltanto se risultano vere le Prova: Se la tabella di verità del connettivo consingole proposizioni elementari che la compongono. tiene almeno un 1, vale il lemma precedente. Se non
Se allora si considera la congiunzione delle proposi- contiene alcun 1, il connettivo è una contraddizione.
zioni elementari per cui il connettivo risulta vero e Se ne consideri la negazione; essa ha una tabella tutta
della negazione delle proposizioni per cui risulta fal- composta di 1, per la quale vale ancora il lemma preso, tale congiunzione è vera se e solo se risulta vero il cedente; la negazione di ciò che si ottiene è pertanto
equivalente al connettivo dato.
connettivo, cioè è ad esso equivalente.
Un connettivo molto importante è il cosiddetto
Secondo questo teorema, ogni connettivo è esprinor, definito come vero se e solo se i suoi argomenti mibile in una forma standard, come disgiunzione di
121
4.6. IL CALCOLO DELLE PROPOSIZIONI

tante congiunzioni, ognuna contenente tutte le proposizioni elementari coinvolte (o la loro negazione).
Tale forma si dice la forma canonica disgiuntive della proposizione. Esiste anche una forma canonica
congiuntiva, composta dalla congiunzione di tante disgiunzioni. Non insistiamo oltre su questo punto, ma
vediamo piuttosto come la forma canonica disgiuntiva ci permetta di rispondere alla seconda domanda
che ci eravamo posti.
Teorema 4.25 Data una qualsiasi proposizione
espressa mediante i connettivi booleani, essa pu`
o essere trasformata nella sua forma canonica disgiuntiva
mediante le regole della Tabella 4.4.
Prova: Le due proprietà distributive e le leggi di
de Morgan permettono di ridurre ogni proposizione
composta ad una serie di disgiunzioni di congiunzioni. Nelle congiunzioni possono non essere presenti
tutte le proposizioni elementari: mediante laggiunta
di 1 = pp si introducono le proposizioni elementari
mancanti. Si usano di nuovo le proprietà distributive
per riportarci a una disgiunzione di congiunzioni, che
questa volta contengono tutte le proposizioni elementari. Infine, la proprietà di idempotenza permette di
togliere le congiunzioni uguali.
Lesempio precedente illustra in modo semplice
questo teorema, dal quale discende la risposta alla
nostra domanda:
Teorema 4.26 Due proposizioni sono equivalenti se
e solo se possono essere trasformate luna nellaltra
mediante le regole della Tabella 4.4.
Prova: Siano P e Q le due proposizioni; se si può
trasformare P in Q, allora P e Q sono equivalenti,
poiche ogni regola della Tabella 4.4 conserva lequivalenza. Viceversa, supponiamo che P e Q siano equivalenti. Per il lemma precedente possiamo trasformare
P e Q nelle loro forme canoniche disgiuntive P1 e Q1 ;
avendo P e Q la stessa tabella di verità, deve essere P1 = Q1 . La trasformazione che da P porta a P1
pi`
u la trasformazione inversa da Q1 a Q costituiscono
una trasformazione di P in Q, come si voleva.
I due teoremi meriterebbero diversi commenti; ci
limitiamo ai seguenti due:
1. Per la proprietà espressa dal Teorema 4.24, i tre
connettivi booleani si dicono costituire un insieme universale di connettivi. In realtà i tre connettivi sono sovrabbondanti perche, per le leggi
di de Morgan, si ha: (p q) = p q =
p q e quindi la disgiunzione può essere sostituita da congiunzione e negazione (è vero anche
che la congiunzione può essere sostituita da disgiunzione e negazione; non è vero invece che la
negazione possa essere sostituita dagli atri due
connettivi: provare a dimostrare!). Naturalmente, esistono altri insiemi universali di connettivi:

uno famoso e importante è costituito da negazione e implicazione. Per vederlo, basta dimostrare
che la disgiunzione è esprimibile tramite questi
due connettivi; ma poiche p q = p q, abbiamo p q = (p) q. Ma la cosa pi`
u straordinaria è che, nella seconda metà del 1800, il
famoso logico (e geologo e astronomo e mille altre cose) Charles Peirce dimostrò lesistenza di
connettivi che, da soli, costituiscono un insieme
universale. Uno di questi è p nor q = (p q),
il nor che abbiamo già introdotto. Un altro è
p nand q = (p q), il cui nome è coniato dallinglese and che indica la congiunzione. Si noti
che p nor p = p nand p = p, ma lasciamo al
lettore il piacere di esprimere congiunzione o disgiunzione o implicazione mediante nor e nand.
Forse qui è bene ricordare che Peirce è anche
linventore delle tabelle di verità.
2. Il calcolo delle proposizioni, con i suoi teoremi
conclusivi, è un esempio di teoria troppo semplice: praticamente, sappiamo tutto ciò che cè
da sapere su ogni proposizione. Questo, purtroppo, non succede nella realtà, che è molto pi`
u
complicata. Ciò è dovuto alla rigidità del concetto di proposizione; come osservato a suo tempo,
le frasi vere o false in assoluto sono poche e, soprattutto, poco interessanti, in quanto riguardano fatti specifici o convenzioni verbali. Di solito
siamo interessati (specie in Matematica) ad affermazioni molto generali. Ad esempio, asserire
che un certo triangolo rettangolo ha i lati lunghi
3, 4 e 5 m, è asserire un fatto apparentemente accidentale; molto pi`
u interessante è il teorema di Pitagora, che ci dice qualcosa su tutti
i triangoli rettangoli. Come abbiamo visto, per
questo esiste una teoria pi`
u vasta del calcolo delle proposizioni, cioè il calcolo dei predicati. Nel
calcolo dei predicati, teoremi conclusivi analoghi
ai precedenti proprio non esistono.
Nota 4.7
Il calcolo delle proposizioni si è rivelato

di fondamentale importanza in Informatica. Prima
di tutto, le tabelle di verit`
a permettono di progettare
i calcolatori elettronici. Il principio è il seguente: si
consideri la somma di due bit, che indicheremo con p
e q. La loro somma è data da p q e il riporto da
p q; se si possono realizzare fisicamente i connettivi
booleani (o un qualsiasi altro insieme universale di
connettivi) si possono realizzare anche questi connettivi e quindi ottenere marchingegni che eseguono
la somma (o qualsiasi altra operazione). Un metodo
per realizzare elettricamente i connettivi booleani è
quello di mettere due circuiti in serie (congiunzione)
e in parallelo (disgiunzione), oppure di comandare un
circuito mediante un rele (negazione). Cos` furono
122
costruiti i primi calcolatori elettrici; si pass`

o poi a
quelli elettronici, ma i principi rimasero gli stessi,
e sono gli stessi anche oggi quando le operazioni
vengono eseguite tramite circuiti integrati. Il contributo del calcolo delle proposizioni allInformatica
non si limita a questo: esso governa le condizioni
di esecuzione di un programma, intervenendo nelle
istruzioni condizionali (tipo if e case) e in quelle
iterative (tipo for, while e repeat).
4.7
Calcolo delle probabilit`

a
Il 1600 è stato un secolo interessante da molti punti

di vista. In concomitanza con il nascere della scienza
moderna, si vide, con il consolidarsi dei grandi stati
nazionali, il sorgere di un interesse nuovo dei governi
nei confronti dei cittadini, visti fino ad allora come
semplici oggetti del potere. Già alla fine del 1500 il
sovrano francese Enrico IV (1553 1610, re dal 1594
dopo aver giudicato che Parigi valeva bene una messa) aveva affermato Voglio che ogni paesano abbia il
suo pollo in pentola. Ma questo atteggiamento paternalistico dei sovrani era motivato da tre esigenze
di razionalizzazione:
1. come far rimpinguare le casse dello stato attraverso le tasse e altri mezzi per spillare soldi ai
cittadini;
2. come gestire i nuovi, grandi eserciti nazionali, al
tramonto delle milizie mercenarie;
le due facce come testa (T ) e croce (C). Se le lanciamo e registriamo le facce che si presentano, possiamo ad esempio avere a = T, b = T, c = C, d = T .
Possiamo gettare unaltra volta le monete e ottenere ora a = C, b = T, c = C, d = C. Se ci chiediamo quante possibili configurazioni diverse si possono
ottenere, un ragionamento che abbiamo già visto e
tipico dellanalisi combinatoria, ci dice che esse sono
24 = 16. Come si sa, e come vedremo, la connessione
tra calcolo delle probabilità e analisi combinatoria è
fortissima. Infatti, se ora vogliamo sapere quante volte possiamo ottenere due teste e due croci, lanalisi
combinatoria ci viene ancora in aiuto. Pensiamo alle quattro monete come a un insieme A = {a, b, c, d}
e a un singolo lancio come a un sottoinsieme di A,
esattamente composto dalle monete che hanno dato
testa: le altre sono determinate di conseguenza. Ad
esempio, il primo dei lanci precedenti è equivalente al
sottoinsieme {a, b, d} e il secondo a {b, d}. E chiaro
che, viceversa, il sottoinsieme vuoto corrisponde a un
lancio con tutte croci e il sottoinsieme A a un lancio
con tutte teste. Allora, i lanci con due teste e due
croci corrispondono ai sottoinsiemi di A formati di
due elementi, cioè sono le combinazioni di
4 elementi
a 2 a 2, che, come ora sappiamo, sono 42 = 6. In
altre parole, sulle 16 configurazioni possibili, che si
ottengono lanciando quattro monete, 6 corrispondono a 2 teste e 2 croci. In generale, possiamo dire che,
se abbiamo n monete, le possibili configurazioni otte
nute in un lancio sono 2n ; di queste, ve ne sono nk
che presentano k teste e, di conseguenza, n k croci.
3. come interagire con la borghesia, sempre pi`

u
Di solito, questi problemi si formulano come quesiti
economicamente rilevante, sia nelle attività
sulle
probabilità: quante sono le probabilità che lantradizionali sia nella nascente industria.
ciando quattro monete si ottengano esattamente due
Fu allora inventata una nuova scienza che, trattan- teste e due croci? Il ragionamento di prima ci dice
do della conduzione razionale dello Stato, fu detta che tali probabilità sono 6 su 16. Cerchiamo di formaStatistica.
lizzare un po meglio questi concetti: si supponga di
Da quel tempo la Statistica si è evoluta, sia nei voler considerare un certo insieme di eventi, ad esemmetodi di ricerca sia nei campi applicativi; di fatto pio il lancio di monete. Si dicono eventi possibili gli
essa è diventata una metodologia di studio di tut- elementi dellinsieme, talvolta detto insieme univerti i fenomeni, naturali e artificiali, indispensabile alla so. Si noti che il concetto di evento non è definibile;
Fisica, alla Chimica, alla Biologia, alla Medicina e al- con un tipico gioco verbale abbiamo appena cambiato
lInformatica. La Statistica è una scienza tipicamente lidea di evento in quella di elemento di un insieme,
sperimentale, che rileva ed elabora dati, e, come tutte concetto che a questo punto ci dovrebbe essere pi`
u fale scienze sperimentali, si avvale di una serie di meto- miliare, ancorche esso pure sia stato lasciato, ai suoi
di e di tecniche matematiche, che nel loro insieme e tempi, indefinito. Si isoli ora una classe particolare
nella loro formulazione costituiscono una vera e pro- di eventi nellinsieme considerato, come ad esempio
pria teoria, il cosiddetto calcolo delle probabilit`
a. Ci i lanci che danno 2 teste e 2 croci; gli elementi di
proponiamo pertanto di introdurre i primissimi rudi- questa classe si dicono eventi favorevoli. La probabimenti di questa branca della Matematica, e di cercare lit`
a che si verifichi un evento della classe particolare
di capire i rapporti che essa ha con la sua controparte si definisce come il rapporto tra il numero degli evensperimentale, cioè la statistica.
ti favorevoli e il numero degli eventi possibili. Nel
Supponiamo di avere quattro monete, che distin- nostro esempio, la probabilità di avere 2 teste e 2
gueremo con le lettere a, b, c, d; distinguiamo anche croci o, se si preferisce, esattamente due teste sulle 4
`
4.7. CALCOLO DELLE PROBABILITA
monete del lancio, è:
4,2 =
6
= 0.375.
16
Da questa definizione discende che la probabilità

è sempre un numero compreso tra 0 ed 1: 0 1.
Se la classe degli eventi favorevoli coincide con linsieme degli eventi possibili, allora la probabilità è 1;
considerato che un qualsiasi evento possibile è certamente anche un evento favorevole, la probabilità
= 1 si dice anche certezza. Viceversa, se la classe
degli eventi favorevoli è vuota, il rapporto che ci dà
la probabilità è = 0; in questo caso, è impossibile che un qualsiasi evento sia favorevole, e quindi la
probabilità = 0 si dice anche impossibilit`
a.
Fissato linsieme di tutti gli eventi da considerare,
la divisione in classi dei singoli eventi dipende ovviamente dal problema che stiamo trattando. Se, ad
esempio, gli eventi sono gli alunni di una scuola,
possiamo pensare a diverse divisioni: in maschi e femmine, in base al mese di nascita, in base al colore dei
capelli o degli occhi, e cos` via. Gli eventi che appartengono a classi disgiunte si dicono indipendenti tra
di loro; è questo un concetto molto importante, sul
quale ritorneremo tra breve. Il numero di eventi che
appartengono a una certa classe si dice la frequenza
di quella classe. Nellesempio del lancio delle monete,
la divisione degli eventi (o lanci) in base al numero di
monete che presentano testa, è una divisione in classi
disgiunte. In tal caso si può dare una rappresentazione grafica della distribuzione dei vari eventi nelle diverse classi, disegnando un diagramma nel quale ogni
classe è raffigurata da una colonna, la cui altezza è
proporzionale alla frequenza degli eventi nella classe.
Poiche, come sè visto, la probabilità è data dal rapporto fra la frequenza e il totale degli eventi possibili,
tali colonne risultano automaticamente proporzionali anche alla probabilità che si verifichi un evento di
quella classe. Se consideriamo il lancio di 8 monete,
la probabilità che in un lancio si ottengano k teste è
data dalla formula:

1 8
1 8
=
.
8,k = 8
2 k
256 k
Basta prolungare il triangolo aritmetico fino alla riga
n = 8 per ottenere le frequenze di ciascuna classe.
Nella Figura 4.6 abbiamo dato questa rappresentazione, che è detta istogramma. Un istogramma evidenzia visivamente la distribuzione degli eventi nelle
classi che ci interessano, purche queste siano a due
a due disgiunte, cioè corrispondano a classi di eventi tra loro indipendenti. Il concetto di indipendenza
è molto importante e le seguenti regole, che abbiamo già avuto occasione di adoperare, vanno tenute
sempre presenti:
123
1. la probabilità che si verifichi almeno uno di due
o pi`
u classi di eventi indipendenti è dato dalla
somma delle probabilità di ciascuna delle classi;
2. la probabilità che si verifichi una data sequenza di classi di eventi indipendenti è data dal
prodotto delle probabilità delle singole classi.
Figura 4.6: Distribuzione binomiale

Nota 4.8
Il nostro insistere sul fatto che gli eventi non sono altro che elementi di un insieme non è
ovviamente casuale. Riprendendo cose che abbiamo
introdotto proprio allinizio, linsieme degli eventi possibili pu`
o essere identificato con linsieme universo U ;
se questo è finito, saranno finiti anche i suoi sottoinsiemi. Una partizione di U (Sezione 1.1) è un modo
per definire una distribuzione degli elementi di U . Se
A U , la frequenza di A coincide con card(A), e
quindi si ha:
card(A)
(A) =
card(U )
come definizione di probabilit`
a. Ad ogni operazione
sullinsieme delle parti di U , cioè P(U ), corrisponde un
assegnamento di probabilit`
a al risultato. Ad esempio,
(A) = 1 (A); se A e B sono disgiunti, si ha (A
B) = (A)+(B) e (AB) = 0, in quanto (U ) = 1
e () = 0: qui si ritrovano i concetti di certezza e impossibilit`
a. Purtroppo, se A e B non sono disgiunti,
card(AB) pu`
o assumere diversi valori, ed esattamente 0 card(A B) min(card(A), card(B)); questo
implica che per le probabilit`
a si abbia:
0 (A B) min((A), (B)).
Se ne deduce subito, guardando i diagrammi di Venn
della Figura 1.1:
(A B) = (A) + (B) (A B).
(A B) = (A) + (B) (A B).
Unaltra propriet`
a importante è la seguente: sia
P1 , P2 , . . . , Pn , una partizione di U e sia A U ; allora
si ha:
(A) = (A P1 ) + (A P2 ) + + (A Pn ).
124
Naturalmente, esistono infinite altre propriet`

a, ma su
di esse qui non possiamo insistere.
Si voglia risolvere il seguente problema: in una classe
vi sono 12 maschi e 14 femmine; di questi allievi, 16
abitano nel centro della citt`
a e 10 vengono dalla periferia. Sapendo che il totale delle femmine e di coloro
che abitano in periferia è di 20 allievi, qual è la probabilit`
a che un maschio abiti in citt`
a? Dette M, F e
C, P le due partizioni di U , possiamo indifferentemente ragionare sulle cardinalit`
a o sulle probabilit`
a. Lultima condizione significa (F P ) = 20/26 e quindi
la probabilit`
a che una femmina abiti in periferia è:
(F P ) = (F ) + (P ) (F P ) =
10
20
4
14
+
=
.
26
26
26
26
Da questo segue che (M P ), cioè la probabilit`
a che
un maschio abiti in periferia, è:
=
(M P ) = (P ) (F P ) =
10
4
6
=
.
26
26
26
Infine, quello che ci interessa è:

(M C) = (M ) (M P ) =
=
6
6
12
=
23.1%.
26
26
26
Questa impostazione dei concetti della probabilit`

a va
bene per gli insiemi finiti, ma non funziona pi`
u per
quelli infiniti, quando card(U ) non è un numero naturale. Si consideri ad esempio un quadrato di lato
nel quale è contenuto un triangolo equilatero con la
base coincidente con uno dei lati del quadrato; si vuol
sapere qual è la probabilit`
a che, preso a caso un punto del quadrato, esso appartenga al triangolo. Il ruolo
della cardinalit`
a è qui preso dallarea che, in qualche
modo, conta il numero di punti contenuti in una figura. Larea del quadrato
è Aq = 2 , mentre larea
u avanti, il
del triangolo è At = 32 /4 (si veda, pi`
Teorema 6.29); la probabilit`
a cercata è pertanto:
3 2 1
3
At
2 =
0.433 = 43.3%.
=
Aq
4
4
Questa osservazione, per quanto banale, è alla base
della teoria moderna del calcolo delle probabilit`
a,
che fa parte della pi`
u vasta Teoria della Misura, quel
settore della Matematica che si interessa del calcolo
integrale.
Pascal iniziò a interessarsi del triangolo aritmetico

per studiare i giochi che allora si stavano affermando,
sia per divertire i ricchi, sia per cavare soldi alla povera gente per mezzo delle varie lotterie, a carattere
locale e nazionale. Un gioco si dice equo se una puntata x su un evento E viene ricompensata, in caso di
vittoria, con una cifra y inversamente proporzionale
alla probabilità di verificarsi dellevento E. Ad esempio, sulla roulette la probabilità che la pallina si fermi
su un dato numero n è 1/37 a causa della presenza

dello 0. Il gioco sarebbe equo se, in caso di vittoria, il banco pagasse 37 volte la puntata, cioè la cifra
giocata. Ciò assicurerebbe un equilibrio statistico fra
vincite e perdite, cos` che a lungo andare ci sarebbe
un sostanziale pareggio tra banco e giocatori (almeno
nella loro globabilità, non certo per ogni singolo giocatore). Come è noto la roulette paga solo 36 volte la
posta, congelando le puntate nel caso che la pallina si
fermi sullo 0. Questo rende il gioco non equo; statisticamente, ad ogni giro il banco guadagna, in media,
quasi 1/37 di tutte le giocate; alla fine della giornata
(o della nottata) il vantaggio è enorme e questo costituisce il guadagno del gestore (a parte le tasse di
concessione che deve dare allo Stato). Analogamente,
come abbiamo visto, giocando un ambo su una ruota,
la probabilità di vincere è:
.
5
90
10
=
=
.
2
2
4005
Quindi, alla giocata di 1 e, in caso di vincita dovrebbe essere pagati 400.50 e; in effetti, lo Stato paga
242.50 e e il resto va a favore dellerario. In pratica,
se 10 mila giocatori giocano un ambo puntando 1 e
ciascuno, lo Stato incassa 10. 000 e e paga 6062.50 e
ai 25 vincitori (in media, uno ogni 400). Il guadagno
medio dello stato è pertanto di 3937.50 e.
Occorre ora chiarire qual è il rapporto tra il calcolo delle probabilità e la statistica. Fino a questo
punto abbiamo parlato soprattutto di insiemi, e la
realtà concreta è stata appena accennata, citando il
lancio delle monete, il gioco del lotto e la roulette.
In effetti, abbiamo guardato a questi giochi come a
giochi astratti, senza effettuare dei veri lanci o delle
vere estrazioni. Prendiamo allora 4 monete e, muniti
di santa pazienza, facciamo una serie di lanci, registrando ogni volta su un foglio il numero delle teste
che otteniamo. Fare anche solo 100 lanci è alquanto noioso, e servirebbe meglio ai nostri scopi farne
1000 o 10. 000. Oggi queste cose si fanno col calcolatore, simulando con opportuni programmi il lancio
delle monete, e allora è un attimo simulare centomila o un milione di lanci. Nel 1600 sera costretti a
procedere a mano e cera gente che passava la vita
a fare esperimenti del genere; nel 1800 le cose non
erano diverse, come ci informa Dostoevskij. Tutti sono invitati a provare, manualmente e/o al calcolatore,
perche lesercizio è veramente utile per rendersi conto
delle cose.
Quando diciamo che la probabilità di ottenere testa
nel lancio di una moneta è il 50%, in realtà non abbiamo misurato proprio niente, ne tanto meno abbiamo
contato una qualche quantità legata alla moneta o
ai suoi lanci. Ciò che intendiamo, è affermare che
non esiste alcuna ragione plausibile perche testa debba uscire invece di croce. La stessa cosa si può dire
`
4.7. CALCOLO DELLE PROBABILITA
125
quando affermiamo che ogni faccia di un dado uscirà

con probabilità 1/6. Tali probabilità, che assegniamo con un qualche vago criterio di equità, si dicono
probabilit`
a a-priori, e riflettono le nostre aspettative
sul verificarsi (o meno) di certi eventi. Al contrario, quando si effettuano dei lanci, reali o simulati
sullelaboratore, possiamo contare gli eventi che mano mano si verificano, ottenendo cos` vere frequenze. E da queste frequenze che ricaviamo le probabilità, che pertanto si dicono prababilit`
a statistiche o
a-posteriori.
Non è filosoficamente banale tradurre uno nellaltro
i due concetti di probabilità a-priori e a-posteriori.
Nel caso della moneta, se su mille lanci otteniamo
ft = 504 teste ed fc = 496 croci, non ci sentiamo
affatto di rivedere la nostra intuizione che vorrebbe
si verificassero 500 teste e altrettante croci. Ottenere un risultato cos` equo, andrebbe contro il nostro
concetto di casualità, ricordandoci alla larga una sequenza 0, 1, 0, 1, 0, . . ., tuttaltro che casuale. La distribuzione 504/496 ci porta a dire che la probabilità
a-posteriori conferma la probabilità a-priori. Lidea che coltiviamo è proprio questa: al crescere del
numero n dei nostri lanci, i rapporti ft /n e fc /n tendano entrambi ad avvicinarsi ad 1/2, e affibbiamo
limaginifico nome di fluttuazioni statistiche alle differenze, che speriamo piccole, fra frequenza statistica
ft o fc e frequenza teorica n/2. Vedremo nella prossima sezione di dare criteri pi`
u oggettivi per stabile
se e quando una distribuzione empirica (fatta di probabilità a-posteriori) si conforma a una distribuzione
teorica (composta di probabilità a-priori).
Facciamo un esempio un po pi`
u articolato. Con
laiuto dellelaboratore, simulando 160. 000 lanci di
quattro monete, ho ottenuto questi risultati:
n. teste
simulaz.
teoria
0
10063
10000
1
39951
40000
2
60060
60000
3
39891
40000
4
10035
10000
è già convincente, ma in Matematica non si possono

fare le cose ad occhio. Esistono dei test (ad esempio,
il cosiddetto test del chi quadro) che ci permettono
di dire quandè che, ragionevolmente, laccordo cè e
quando, invece, possiamo con buona sicurezza asserire che tale accordo non ci sia. Vedremo queste cose
nella prossima sezione, anche se in modo piuttosto
veloce e senza troppi approfondimenti.
Una domanda abbastanza naturale è la seguente:
lanciamo s` le nostre quattro monete, ma qual è il
numero medio di teste che ci aspettiamo di ottenere
in un gran numero di lanci? Cominciamo col considerare una sequenza di dati che indicheremo con
{x1 , x2 , . . . , xn }; si dice media o valor medio o valore
atteso di questi dati il rapporto tra la loro somma e
il loro numero, cioè:
n
1
1X
x = (x1 + x2 + + xn ) =
xj
n
n j=1
P
dove il simbolo
indica la somma di termini omogenei, individuati da un indice, variabile dallestremo
indicato in pedice fino allestremo indicato in apice
(vedere la fine della Sezione 2.8). Ad esempio, se in
una stanza vi sono cinque persone di altezza, rispettivamente: 1.72, 1.63, 1.84, 1.80, 1.71, la loro altezza
media è (1.72+1.63+1.84+1.80+1.71)/5 = 8.70/5 =
1.74. Si noti che, nonostante il nome di valore atteso, la media non è il valore che ci aspettiamo possa
avere un elemento del nostro insieme, preso a caso;
infatti, nessuna delle persone nella stanza è alta 1.74.
Piuttosto, la media indica il valore che ci permette di
prevedere, col minor errore possibile, il valore di un
elemento qualsiasi della serie considerata.
Talvolta, come nel caso dei nostri lanci, abbiamo
una divisione degli elementi in classi e di ogni classe
abbiamo la frequenza: 0 teste si ottengono con una
sola configurazione, 1 testa con 4 configurazioni, e
cos` via. In altre parole, se si hanno h classi, il valore
x1 è assunto con frequenza f1 , il valore x2 con frequenza f2 , e via di seguito fino al valore xh assunto
con frequenza fh . In tal caso il numero totale di dati
è f1 + f2 + + fh = n e quindi la media è data dalla
formula:
Ph
x1 f1 + x2 f2 + + xh fh
j=1 xj fj
.
x=
= Ph
f1 + f2 + + fh
j=1 fj
Lultima riga contiene il numero di lanci teorico, cioè

quanti avrebbero dovuto essere i lanci di ciascun tipo se la prova pratica, la simulazione, si conformasse perfettamente alla teoria. Tali valori si ottengono
moltiplicando 160.000, il numero di prove, per la probabilità di ottenere quel certo numero di teste, ovvero
4,k = k4 /16. In pratica è impossibile che i dati relativi a una simulazione coincidano pari pari con ciò
che prevede la teoria: anzi, quando in un esperimento Nel caso dei lanci si ha:
di statistica ci dà valori troppo vicini a quelli previ10+41+62+43+14
sti dalla teoria, si può addirittura pensare a qualche
= 2.
x=
1+4+6+4+1
imbroglio, messo in atto per far tornare le cose.
Daltra parte, quanto al pi`
u si possono discostare i
Nota 4.9
La media non corrisponde nemmeno al
dati sperimentali da quelli teorici affinchè si possa
valore con la massima frequenza, anche se lesempio
affermare che i primi confermano i secondi (o viceprecedente ci potrebbe far pensare una cosa del geneversa)? Nel nostro caso, un confronto ad occhio
re. Ad esempio, allultimo appello 13 studenti hanno
126
superato il mio esame: due hanno preso 21, sei hanno
avuto 24, uno solo ha preso 25 e ci sono poi stati tre
28 e un 30. La media (2 21 + 6 24 + 1 25 +
3 28 + 1 30)/13 = 325/13 = 25, e uno solo degli
studenti ha avuto 25. Il valore della sequenza che ha
la frequenza maggiore, cioè il pi`
u gettonato, si dice
la moda; nellesempio, la moda è costituita dal valore
24. Pi`
u importante è per`
o il concetto di mediana. Si
consideri la nostra sequenza di dati (riprendiamo ad
esempio quella dellaltezza delle cinque persone) e la
si ordini in modo tale da mettere i dati stessi con valori mai decrescenti; tale ordinamento si dice sequenza
per rango e la posizione assunta da ogni elemento si
dice il rango di quellelemento. Per le altezze si ha
(1.63, 1.71, 1.72, 1.80, 1.84). Il valore mediano o mediana della distribuzione è lelemento centrale di tale
sequenza ordinata. Nellesempio delle altezze, la mediana vale 1.72; nel caso dei voti è 24, corrispondente
al settimo voto nella disposizione per rango. Se i dati
sono in numero pari, ci sono due elementi centrali; in
tal caso, la mediana è data dalla semisomma di tali
due elementi.
La media considerata si chiama anche aritmetica, per
distinguerla da altri tipi di media che si considerano
talvolta, anche se pi`
u raramente. La media geometrica
sostituisce il prodotto alla somma e, di conseguenza,
la radice n-esima alla divisione per n. Formalmente,
se i dati sono a1 , a2 , . . . , an , la loro media geometrica
è definita da:
G = n a1 a2 . . . a n ;

dei quadrati degli scostamenti dei singoli dati dalla
loro media. Lo scostamento di xj dalla media x è la
differenza (xj x) e quindi si ha:
2 =
(x1 x)2 + (x2 x) + + (xn x)2

=
n
n
1X
(xj x)2 .
n j=1
Il simbolo 2 è universalmente usato per indicare la

varianza di una distribuzione; , la radice quadrata
della varianza, indica la cosiddetta deviazione standard. Nel caso delle persone nella stanza, le altezza
uguali danno varianza 0, le altezze che crescono uniformemente danno varianza 0.0002 e la distribuzione
di partenza dà 0.0086. In generale, la varianza è zero
se e solo se tutti i dati coincidono col valore medio, e
va crescendo mano mano che i dati se ne discostano.
In altre parole, la varianza è tanto pi`
u grande quanto
pi`
u i dati tendono ad essere lontani dalla media, cioè
la varianza è un indicatore della dispersione dei dati
intorno al loro valore medio.
4.8
Distribuzioni
Un po di buon senso, o lesperienza, ci fanno intuire

che, lanciando le nostre otto monete, è pi`
u probabile
se tutti i dati sono uguali ad a, abbiamo G = a, come ottenere una distribuzione bilanciata, come 4 teste
ci si deve aspettare. La media armonica è un po pi`
u e 4 croci, piuttosto che una molto sbilanciata, come
8 teste oppure 8 croci. Invece, giocando a carte, alla
complessa e si definisce come:
roulette o al lotto, ci aspettiamo che ogni carta o ogni
1
1
1
H = ((a1
,
1 + a2 + + an )/n)
numero sia equiprobabile, e anche se qualcuno insiste
cioè come linverso della media aritmetica degli nel voler giocare al lotto i numeri che non escono
u tempo, sa razionalmente che tale metodo non
inversi delle quantit`
a considerate. Si pu`
o dimostrare da pi`
a pi`
u favorevole del giocare del tutto a caso,
che la media armonica è sempre minore o uguale alla gli sar`
media geometrica che, a sua volta, è sempre minore essendo impossibile che le giocate passate possano in
o uguale della media aritmetica A, cioè H G A; qualche modo influenzare la prossima estrazione.
luguaglianza si ha se e solo se tutti i dati sono uguali.
Si dice che, durante la seconda guerra mondiale,
Il lettore pu`
o controllare che con due soli dati a1 = 5 quando ormai la Statistica era una disciplina ben noe a2 = 7 si ha A = 6, G = 5.916 e H = 5.833.
ta, lesercito americano ordinasse a una ditta di conCome vedremo con lAlgoritmo 6.8, la media geofezioni bel 35. 000 divise in sette misure diverse; e la
metrica fornisce un metodo assai interessante per
o 7. 000 divise di ciascuna misura. Fu
il calcolo di , il rapporto tra circonferenza e diametro. ditta consegn`
cos` che le misure medie non bastarono e quelle piccole e grandi avanzarono in grande quantità. Non so
Se nella nostra stanza avessimo cinque persone come fin` la storia, ma oggi qualsiasi negozio di scarpe
tutte alte 1.74, la loro altezza media sarebbe an- ordina molte misure medie (37 38 per la donna, 41
cora 1.74; e cos` sarebbe se le persone fossero alte 42 per luomo) e poche misure estreme come un 35
(1.72, 1.73, 1.74, 1.75, 1.76). La vecchia distribuzione o un 41 femminili, un 39 o un 45 maschili. Chi, come
è la meno omogenea, mentre la pi`
u omogenea è quella me, calza il 39, sa quante difficoltà si incontrano per
delle persone con la stessa altezza. Questa osserva- trovare un modello di nostro gradimento, proprio per
zione ci dice che la media di una distribuzione non la scarsità delle scarpe di tale numero.
Comè che ci aspettiamo uniformità da una parte
mette in evidenza come i vari elementi si discostano
dal loro valore medio. Per questo esiste il concetto di (roulette, lotto) e variabilità dallaltra (altezza, nuvarianza : la varianza di una distribuzione è la media mero di scarpe, taglia)? Come dimostra il caso della
127
4.8. DISTRIBUZIONI
ditta americana, le nostre previsioni sono legate allintuito, allesperienza o alla mancanza delluno e/o
dellaltra. Per questo, la Statistica e il Calcolo delle Probabilità cercano di dare unimpostazione pi`
u
scientifica e razionale al nostro modo di affrontare
quella parte della realtà che appare governata dalla
casualità.
Fortunatamente, la natura sembra adeguarsi ad alcuni schemi (non molti, per la verità) che possono essere studiati in modo sistematico: come conclude Dostoevskij, nel susseguirsi delle probabilità favorevoli
cè, se non un sistema, un certo qual ordine. In tal
modo, pur rimanendo impossibile prevedere il singolo
caso (come cerca di fare il giocatore), è abbastanza
facile prevedere in modo accurato landamente di un
gran numero di eventi: è questo che aiuta le aziende
di scarpe e di confezioni, che hanno dalla Statistica
indicazioni precise sulle percentuali da produrre per
ciascuna taglia. Se consideriamo il numero di persone che calzano una certa misura di scarpe, otteniamo
la distribuzione dei numeri di scarpa; se misuriamo
laltezza degli abitanti di Milano e raggruppiamo tali
altezze di centimetro in centimetro, abbiamo la distribuzione dellaltezza dei milanesi; se, come facevano i
giocatori di Dostoevskij, contiamo le volte che viene
estratto ciascun numero della roulette, abbiamo la
distribuzione di tali numeri. Queste sono distribuzioni empiriche, legate alla frequenza dei singoli eventi,
ma è possibile studiare teoricamente tali distribuzioni chiamando in campo il Calcolo delle Probabilità.
Come si diceva, le distribuzioni teoriche alle quali si
conformano la gran parte delle distribuzioni empiriche, sono stranamente poche. Noi, poi, ne introdurremo solo quattro, per semplificarci ancor di pi`
u la
vita.
1. Distribuzione uniforme. Lanciando una moneta o un dado, giocando al lotto o alla roulette, ci
aspettiamo che ogni evento (testa o croce, una faccia
da 1 a 6, un numero tra 0 e 36, o un numero tra 1
e 90) abbia la stessa probabilità di verificarsi di ciascun altro evento. La corrispondente distribuzione di
frequenze è perciò costituita da un istogramma con
tutte le colonne della stessa altezza. I giocatori di Dostoevskij avrebbero dovuto trovare che ognuno dei 37
numeri della roulette ha una frequenza duscita vicina
a tutti gli altri. Le oscillazioni che si possono riscontrare sono irrisorie di fronte alla frequenza registrata
e possono essere compensate continuando a registrare le uscite successive. Semmai, si pone il problema
di avere un criterio (o test, come si dice tecnicamente) per stabilire se, effettivamente, queste oscillazioni
sono casuali o siano dovute a una possibile truccatura dellapparecchio della roulette. Vedremo pi`
u
avanti un possibile test.
Nota 4.10
La distribuzione uniforme ha assunto
un ruolo fondamentale con lavvento degli elaboratori elettronici. Infatti, per mezzo di essa è possibile
simulare anche le altre distribuzioni. E quindi importante avere un metodo efficace per produrre elementi
distribuiti in modo uniforme. In realt`
a, lelaboratore
non è assolutamente in grado di produrre eventi casuali, in quanto esso è, per definizione, una macchina
deterministica, cioè prevedibile in tutto quello che fa.
Fortunatamente, la Matematica mette a disposizione
alcune tecniche che permettono di produrre distribuzioni che, pur non essendo casuali, hanno tutti i crismi
della casualit`
a. Vengono pertanto dette distribuzioni pseudocasuali, e possono essere usate benissimo in
luogo della distribuzione uniforme. Si consideri un numero primo p e il gruppo Zp composta da (p) = p 1
elementi. Tale gruppo è ciclico, e quindi esistono numeri a, con 0 < a < p che generano tutto il gruppo, cioè {a, a2 , a3 , . . . , ap1 } sono tutti gli elementi di
Zp . Questi elementi, nellordine appena detto, anche
se tale ordine è del tutto determinato, posseggono le
caratteristiche delle sequenza casuali, e costituiscono
pertanto una sequenza pseudocasuale. Ad esempio, se
p = 11, le potenze di 7 sono:
7 5 2 3 10 4 6 9 8 1
che, ad occhio, forniscono una permutazione ragionevolmente casuale dei numeri da 1 a 10, cioè gli elementi
di Z11 . Se poniamo a = 7 ed s = 1, il calcolo della sequenza pu`
o essere impostato semplicemente ponendo,
iterativamente:
s = as mod p
di modo che il calcolo di ogni potenza successiva di
a richiede solo un prodotto e una divisione; da questa formula, questo metodo di generazione viene detto
congruenziale. Se volessimo utilizzare la sequenza per
generare una serie di lanci di una moneta o di un dado, basterebbe ridurre i numeri modulo 2 e modulo
6. Nel caso del dado, bisogna poi aggiungere 1, ma
questo è banale. Le sequenze sono:
moneta
dado
1101000101
2634551432
e ad occhio ci appaiono anchesse ragionevolmente

casuali.
Naturalmente, p = 11 è solo un esempio, e dopo
10 numeri la sequenza si ripete, di modo che non
possiamo proprio pensare di utilizzarla in applicazioni
che coinvolgono migliaia, o anche milioni, di scelte casuali. Un numero pi`
u adeguato è p = 999999999989,
assai vicino a 1012 . In questo modo, il numero
s/1012 è un numero reale compreso tra 0 ed 1, e ci`
o
serve ad avere una distribuzione uniforme continua;
essa permette di ottenere ciascun numero reale
nellintervallo [0, 1) (con 12 cifre decimali) con la
stessa probabilit`
a. Questi numeri possono essere
interpretati come probabilit`
a e quindi costituiscono
una buona distribuzione per tutti i problemi pratici
che li debbano utilizzare.
128
2. Distribuzione binomiale. Se lanciamo due o

pi`
u monete e contiamo il numero di teste e di croci
ottenute, abbiamo visto come non si ottenga pi`
u una
distribuzione uniforme, ma entrino in gioco i coefficiente binomiali. La probabilità che gettando n monete si abbiano k teste, e quindi n k croci, è data
dalla formula:
.
n
2n .
n,k =
k

Infatti, nk corrisponde agli eventi favorevoli, mentre 2n sono gli eventi possibili. La stessa cosa capita
nel lancio di due o pi`
u dadi, anche se in questo caso
la faccenda è pi`
u complicata a causa delle sei facce. Prendiamo n dadi, lanciamoli e chiediamoci qual
è la probabilità che escano esattamente k facce col
numero 1. Ognuna delle k facce ha probabilità 1/6
di apparire e poiche i dadi hanno un destino indipendente luno dallaltro, la probabilità che appaiano esattamente k facce è (1/6)k . Ricordiamo infatti,
dalla sezione precedente, che le probabilità si moltiplicano quando corrispondono al verificarsi successivo
di eventi indipendenti. Analogamente, la probabilità
che una faccia non presenti il numero 1 è 5/6, e quindi
la probabilità che n k facce non presentino il nujmero 1 è (5/6)nk . Infine, occorre valutare in quanti
modi diversi vi siano esattamente k facce 1 fra le n
facce
n dei nostri dadi. Ma questo è facile e i modi sono
che la probabilità cercata è:
k , cos`
n,k
due dadi è dato dalle combinazioni: 1 + 4, 2 + 3,

3 + 2 e 4 + 1. Poiche due dadi danno luogo a 36
diverse configurazioni, la probabilità di ottenere 5 è
4/36 = 1/9 0.1111 . . ., cioè un po pi`
u dell11%. Se
il numero dei dadi cresce, è un interessante problema
combinatorio trovare tutte le possibili configurazioni
che danno un certo numero N . Il problema è uno
dei classici di questa disciplina, studiato fin dai tempi di Eulero e detto il problema delle partizioni di un
intero. Originariamente, il problema consisteva nel
trovare in quanti modi è possibile formare un numero
intero; ad esempio:
4=1+3=2+2=3+1=1+1+2=1+2+1=
= 2 + 1 + 1 = 1 + 1 + 1 + 1.
La configurazione 1 + 3 può essere considerata uguale
alla 3 + 1 e allora il modello cambia. Nel nostro caso,
è richiesto che gli addendi siano un numero fissato
n e il loro valore non ecceda un limite superiore (6
nel caso dei dadi). Non ci possiamo addentrare in
questa materia, ma usando quattro dadi si ottiene
listogramma della Figura 4.7, che ci introduce alla
terza delle nostre distribuzioni.
k nk
n
1
5
=
=
k
6
6

n
n 1
5
1 n nk
5
=
= n
6 k
6
k 5k
dove entrano, appunto, i coefficienti binomiali che
danno il nome a questa distribuzione.
In generale, se un evento ha probabilità p di verificarsi, la probabilità che esso non si verifichi è
q = 1 p. Nelle monete abbiamo p = q = 1/2,
poiche testa e croce sono alternative. Nel caso del
dado, se levento è il comparire di una faccia determinata, la sua probabilità è 1/6; che perciò compaia
uno degli altri numeri è 5/6. Pertanto, la probabilità
che si verifichino k fra gli eventi considerati in una
sequenza di n eventi, è dato dalla formula:

n k nk
p q
.
n,k =
k
Figura 4.7: Distribuzione quasi normale
3. Distribuzione normale. La forma a campana della distribuzione in Figura 4.7 è caratteristica di

molti fenomeni naturali. Se misuriamo laltezza delle
persone o la lunghezza del loro piede; la circonferenza
del tronco degli alberi in una foresta o la velocità delle molecole in un corpo a una certa temperatura; osserveremo sempre la caratteristica forma a campana.
Questa formula generalizza tanto il lancio delle Gauss, il principe dei matematici, studiò teoricamenmonete, quanto quello dei dadi.
te questa distribuzione e la chiamò normale proprio
Quando si gioca a dadi, si può puntare sul nume- perche sembra essere la normale distribuzione dei fero totale che costituisce la somma di tutte le facce nomeni naturali. Egli trovò una formula che descrive
dei dadi tirati. Cos` il verificarsi di 5 nel lancio di la curva e che dipende da due parametri: la media
129
4.8. DISTRIBUZIONI
e la deviazione standard della distribuzione. In altre
parole, la forma della campana cambia a seconda del
valore dei due parametri, alzandosi o ingrossandosi,
pur rimanendo sostanzialmente la stessa. Per curiosità diamo qui la formula, ma per il momento rimane,
appunto, una mera curiosità:
2 !
1
1 x
N, (x) = exp
.
2
2
La media corrisponde al punto pi`
u alto della curva,
che è simmetrica rispetto alla retta x = . Un fatto caratteristico è costituito dalla percentuale degli
eventi che si verificano in certi intervalli:
il 68.27%
il 95.45%
il 99.75%
si pone tra
si pone tra
si pone tra
e +
2 e + 2
3 e + 3;
questo significa che ben 2/3 degli eventi si addensano nella zona che ha distanza pari alla deviazione
standard dalla media e praticamente tutti si trovano a distanza della media per meno di tre volte la
deviazione. Ciò giustifica limportanza di .
pu`
o non essere del tutto agevole. Per questo, si
usano molto le tavole numeriche e alcune regole
empiriche divenute standard. Le tavole contengono
i valori di probabilit`
a della distribuzione N0,1 (x),
cioè della distribuzione normale di media 0 e di
deviazione standard 1. Vi sono poi semplici formule
di conversione a qualsiasi N, (x). Uno degli approcci
empirici pi`
u utilizzati è il seguente. Abbiamo visto,
definendo il concetto di mediana, cosa sia lordinamento per rango di una certa distribuzione empirica,
riferita ad n eventi. Sia allora x1 x2 xn
tale ordinamento e poniamo k = n/10. Si dice
che gli elementi x1 x2 xk costituiscono
il primo decile della distribuzione; gli elementi
xk+1 xk+2 x2k il secondo decile, e cos` via.
In altre parole, il primo decile contiene il primo 10%
dei dati nellordinamento per rango, e via di seguito
fino al decimo decile, che contiene lultimo 10%. Il
valore estremo di un certo decile si dice il valore
del decile. I valori del primo e del nono decile sono
molto usati per indicare convenzionalmente i valori
di norma di una distribuzione. Ad esempio, in
auxologia, si riportano in un grafico, per le varie et`
a,
il valore mediano dellaltezza e i valori del primo e
del nono decile. Di norma la crescita deve avvenire
costantemente nellintervallo fra questi due decili,
che rappresenta laltezza dell80% della popolazione
a quellet`
a. Valori al di fuori della norma, relativi
perci`
o al solo 20% della popolazione, possono indicare
qualche disfunzione nel processo di crescita e vanno
considerati con la debita attenzione. Concetti analoghi al decile sono quelli di percentile e di quartile,
che per`
o lasciamo alla buona volont`
a del lettore,
dato che non presentano alcuna differenza concettuale.
4. Distribuzione di Poisson. Una distribuzione non simmetrica è quella di Poisson, definita in

funzione di un parametro , che ne indica la media:
pk = e
Figura 4.8: La campana della distribuzione normale
Il carattere generale della distribuzione normale si
suole giustificare con la cosiddetta legge dei grandi
numeri, che vede la distribuzione normale come una
specie di limite al quale tendono tutte le distribuzioni, quando vengano iterate, come abbiamo fatto per il
lancio delle monete. La legge (grosso modo) afferma
che dato un fenomeno, il quale segua una qualsiasi
distribuzione di probabilità, se lo si itera un numero sufficientemente grande di volte e si considera la
distribuzione di probabilità del fenomeno cos` iterato, allora tale distribuzione si può identificare con la
distribuzione normale.
Nota 4.11
Come si pu`
o intuire dalla formula di
Gauss, lavorare con la matematica della distribuzione
k
k!
dove e è la funzione esponenziale che introdurremo

ufficialmente nella Sezione 8.5. Questa distribuzione
è discreta, ma assume valori per infiniti k; ben presto,
tuttavia, i pk si riducono praticamente a 0 e le possibilità possono essere considerate in numero finito. La
distribuzione di Poisson è molto frequente e ad essa
si adeguano, ad esempio, le lunghezze degli intervalli
con cui le persone arrivano ad uno sportello (banca,
uffici pubblici, etc.).
Come abbiamo già osservato, quelle viste non sono le uniche distribuzioni degne di nota. A cavallo
dellanno 1900, leconomista Pareto osservò che molti fenomeni economici seguono una distribuzione caratteristica. Ad esempio, se si mettono in ordine i
contribuenti dal pi`
u ricco al pi`
u povero e chiamiamo
R il reddito del pi`
u ricco, allora il reddito del secondo è (allincirca) R/2, il reddito del terzo è R/3, e
130
cos` via. Allo stesso modo sembra funzionare la produzione delle industrie e la popolazione delle città.
Qualche anno dopo, il linguista Zipf fece notare che
anche molti fenomeni linguistici, come la frequenza
delle parole in un testo, hanno pi`
u o meno la stessa
distribuzione. Essa viene perciò detta di Pareto-Zipf
e si formula nel modo seguente: se r è il rango (cioè
la posizione) che un evento viene ad assumere nellordinamento rispetto ad un parametro assegnato ed Rr
è il valore di tale parametro, allora il prodotto rRr è
costante.
Nei fatti, abbastanza analoga alla legge di ParetoZipf è quella cos` detta dell80/20. Nel caso del reddito, essa afferma che il 20% dei contribuenti si suddividono l80% del totale dei redditi. Nel caso delle
città, il 20% delle città di un paese riuniscono l80%
di tutti gli abitanti. E cos` via, dando spesso una valutazione numerica alle ingiustizie di questo mondo.
Noi ci possiamo accontentare di aver ricordato tutto
ciò.
Concludiamo queste note dando una breve spiegazione del metodo del chi quadro. Nella sezione precedente, abbiamo visto una distribuzione empirica relativa al lancio di quattro monete ed essa si dovrebbe
accordare con la distribuzione teorica binomiale. I
dati empirici difficilmente coincidono con i dati teorici, anzi, se coincidessero, si potrebbe avere qualche
sospetto proprio sulla rilevazione dei dati empirici. Al
di là di generiche differenze, comè possibile dire (ammesso che lo sia) se una certa distribuzione empirica
si conforma a una distribuzione teorica?
Una possibile risposta è data dal test del chi quadro (2 ), che vogliamo ora descrivere. Si supponga di
avere una distribuzione empirica discreta, data dalle frequenze f1 , f2 , . . . , fn se n sono le classi in cui il
fenomeno è suddiviso. Sia N = f1 + f2 + + fn il
numero totale dei dati rilevati e supponiamo che ogni
fk sia non inferiore a 5: altrimenti possiamo accorpare pi`
u classi in una sola, fino a che questa condizione
non sia soddisfatta. La distribuzione teorica prevederà certe probabilità p1 , p2 , , pn in corrispondenza di ciascuna classe, e quindi possiamo parlare di
frequenze attese se moltiplichiamo ciascuna di queste
probabilità per N , il numero totale di osservazioni.
Tali frequenze attese saranno perciò:
e1 = N p1 ,
e2 = N p2 ,
en = N pn .
Con queste frequenze attese e quelle osservate

calcoliamo la quantità:
2 =
n
X
(fk ek )2
k=1
ek
Questa quantità è detta appunto chi quadro e osserviamo subito che se le frequenze osservate coincidessero con le frequenze attese avremmo 2 = 0.
Questo ci dice che pi`

u alto è il valore del 2 , pi`
u
lontana dalla distribuzione teorica risulta essere la
distribuzione empirica. Il valore del 2 ottenuto va
confrontato con i valori di una tabella predisposta,
secondo regole che vedremo fra un istante. Se il 2 è
compreso tra due opportuni valori della tabella potremo dire che distribuzione empirica è in accordo con
la distribuzione teorica. Non si ha accordo, invece, se
il 2 è maggiore del pi`
u grande dei valori indicati.
Nellesempio precedente abbiamo già calcolato le
frequenze attese della distribuzione teorica, per cui
calcoliamo:
2 =
(10063 10000)2
(39951 40000)2
+
+
10000
40000
(60060 60000)2
(39891 40000)2
+
+
60000
40000
+
(10035 10000)2
= 0.9364.
10000
Ottenuto questo valore, vediamo come ci si deve comportare con la tabella del 2 . Prima di tutto, occorre
stabilire quanti sono i gradi di libert`
a della nostra distribuzione empirica. Grosso modo, i gradi di libertà
di una distribuzione sono i dati (o i gruppi di dati) che possiamo scegliere in modo arbitrario (libero)
senza cambiare la natura della distribuzione. Questo
è piuttosto vago, ma concretamente, nel nostro caso, abbiamo considerato cinque classi e le frequernze
di tali classi sono libere, eccetto per il fatto che in
tutto abbiamo effettuato 160. 000 prove. Ciò significa che se possiamo scegliere liberamente il valore di
quattro classi, quello della quinta è determinato dalla differenza fra 160. 000 e la somma delle frequenze
delle prime quattro classi. Abbiamo perciò 4 gradi di
libertà.
Nella Tabella 4.5 del 2 , dobbiamo considerare la
riga corrispondente a 4 gradi di libertà. Cosa significano i valori presenti in tale linea? Nella testata
della tabella troviamo delle probabilità: ad esempio,
nella quarta riga cè il valore 9.488 in corrispondenza
della probabilità 0.95; questo significa che sperimentando con una distribuzione empirica che si adegua
alla distribuzione teorica considerata, nel 95% dei casi si ottiene un 2 con valore minore o uguale a 9.488.
Cos` nel 5% dei casi troviamo 2 0.711. Si noti che
non ha rilevanza quale tipo di distribuzione teorica si
consideri.
E chiaro che qualunque sia il valore del 2 ottenuto, esso rientra nel 100% degli esperimenti; ciò si
può vedere dalla tabella, i cui valori crescono man
mano che si procede verso la parte destra. Nel caso
di conformità, bisogna essere molto sfortunati per ottenere valori altissimi e, di fronte a un 2 molto elevato saremmo propensi a pensare che qualcosa non
131
4.8. DISTRIBUZIONI
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
25
30
35
40
50
75
100
2.5%
0.001
0.051
0.216
0.207
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
9.591
13.12
16.79
20.57
24.43
32.36
52.94
74.22
5%
0.004
0.103
0.352
0.484
1.146
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.892
6.571
7.261
10.85
14.61
18.49
22.47
26.51
34.76
56.05
77.93
95%
3.842
5.992
7.815
9.488
11.07
12.59
14.07
15.51
16.92
18.31
19.68
21.03
22.36
23.69
25.00
31.41
37.65
43.77
49.80
55.76
67.51
96.22
124.3
97.5%
5.024
7.378
9.348
11.14
12.83
14.45
16.01
17.54
19.02
20.48
21.92
23.34
24.74
26.12
27.49
34.17
40.65
46.98
53.20
59.34
71.42
100.8
129.6
Tabella 4.5: La tabella del 2

va, piuttosto che ad accettare supinamente il risultato dellesperimento. Daltra parte è sospetto anche
un valore del 2 molto vicino a 0 che, come si vede dalla tabella, corrisponde a una piccolissima parte
degli esperimenti.
Vedendo invece la cosa dal punto di vista di chi
non sa se la distribuzione empirica si conforma o meno a quella teorica, possiamo procedere cos`: scegliamo due probabilità, una bassa e laltra abbastanza
alta: spesso si prendono il 5% e il 95%; nella Tabella 4.5 abbiamo considerato anche il 2.5% e il 97.5%.
Se il 2 ottenuto sperimentalmente è compreso fra
questi valori, allora possiamo ragionevolmente accettare lipotesi che la distribuzione empirica si conformi davvero a quella teorica. Se il 2 supera il valore corrispondente alla probabilità del 95%, saremo
piuttosto dellopinione di rigettare lipotesi, e saremo
tanto pi`
u convinti di ciò quanto pi`
u alto è il valore
del 2 . Infine, se il 2 è minore del valore corrispondente al 5%, dobbiamo sospettare che qualcosa nel
nostro esperimento non va, e cè qualche vizio logico
o di rilevazione dei dati.
Il nostro 0.9364 è giusto compreso tra 0.711 e 9.488;
quindi la nostra distribuzione empirica si trova nellintervallo di probabilità corretto per una distribuzione che si adegui a quella binomiale considerata.
Ciò ci fa inclinare ad accettare lipotesi che la distribuzione binomiale sia effettivamente la distribuzione
teorica che descrive quella dei nostri lanci.
132
Capitolo 5
Algebra
Rischiai di dare lo spettacolo di un prigioniero messo a forza fuori di prigione. Erano le
cinque. Uno dei convitati mi accompagn`
o fino
alla porta, mi abbracci`
o, e promise di venirmi
a trovare uscendo di prigione. Doveva fare ancora due o tre mesi. Era linfelice Galois che
non rividi mai pi`
u, perche lindomani della sua
liberazione venne ucciso in duello.
G. de Nerval Le mie prigioni
5.1
Calcolo letterale
Lassociazione tra Algebra e calcolo letterale è piuttosto recente e risale alla fine del 1500, nonostante
che fino dallantichità si siano cercate regole e metodi per la risoluzione di equazioni. Già nel papiro di
Rhind (ca. 1650 a.C.) e su tavolette babilonesi (ancora pi`
u vecchie) si trovano problemi di Algebra; ma
furono gli Arabi, dopo l800 d.C., che dettero i maggiori contributi a questa disciplina. Al-Khuwarizmi
sapeva risolvere le equazioni di secondo grado, e dal
suo libro Al-jabr wal muqabalah è stato tratto il
termine Algebra. Cosa significhino le parole al-jabr
e al-muqabalah è oscuro; si ritiene che al-jabr indichi
il trasferimento di un termine da un membro allaltro di unequazione, e al-muqabalah si riferisca alla
cancellazione di termini uguali nei due membri, ma
questa interpretazione non è sicura. Dalla traduzione latina Liber Algebrae et Almucabala (che toglie
tutti i dubbi sul significato delle due parole!) fino
al 1600 ci si rifer` alla risoluzione delle equazioni come alla scienza dellAlgebra e dellAlmucabala, poi
lAlmucabala venne a cadere e lAlgebra è rimasta.
Fino al 1500 la formulazione delle equazioni era
puramente discorsiva e ci si riferisce a quellAlgebra
come allAlgebra retorica. Prima del 1500 il francese Chuquet cominciò a introdurre forme abbreviate
e le equazioni si iniziarono a formulare in modo pi`
u
convenzionale: la variabile (che oggi diremmo x) era
detta la cosa, il suo quadrato x2 era il censo e il
suo cubo x3 era il cubo. Si usarono anche espressio
ni simili a formule: 5p : Rm : 15 stava per 5 + 15,
dove p e m era la notazione, detta italiana, per

i simboli + e . Questi ultimi furono introdotti in
Germania verso il 1550 e il segno = fu inventato dallinglese Recorde pi`
u o meno negli stessi anni. Questo
nuovo tipo di notazione fu detto Algebra sincopata.
Ma il vero e proprio calcolo letterale è nato, verso la
fine del 1500, col francese Viète e mezzo secolo dopo Cartesio usava già una notazione molto simile a
quella moderna.
Sino al 1600 lAlgebra era concepita come un metodo per la risoluzione di problemi numerici specifici,
o poco pi`
u. Poiche non si volevano considerare numeri negativi (che non si capivano) le due equazioni
di secondo grado x2 + ax = b (il censo pi`
u la cosa
uguale a numero) e x2 = ax + b (il censo uguale
alla cosa pi`
u un numero) erano considerate diverse
e trattate pertanto con regole risolutive differenti. Le
lettere si imposero prima come incognite e solo successivamente per le costanti (cioè i parametri). Oggi,
il calcolo letterale è alla base di tutta lAlgebra e tutti
gli studenti ne hanno familiarità.
Le lettere (dellalfabeto latino o greco) hanno in
realtà significati ed accezioni di natura assai diversa,
ma, fortunatamente, la loro trattazione e manipolazione avviene in modo omogeneo. Ricordiamo che
una lettera:
133
1. se indica un simbolo astratto, da non confondere

con indicazioni di numeri o altre entità, si dice
una indeterminata;
2. se indica valori che possono essere assunti da
un insieme prestabilito (ad esempio, un insieme
o un campo numerico) è detta variabile; nella
notazione funzionale y = f (x), x è la variabile
indipendente, y quella dipendente;
3. se indica, in unequazione, un valore non noto e
che vogliamo determinare, è detta incognita;
4. se indica, in unequazione, un valore che si suppone noto (e quindi non deve essere determinato,
ma anzi è da usare per trovare il valore della o
delle incognite) si dice un parametro.
134
CAPITOLO 5. ALGEBRA
polinomi si tratti. Quando le indeterminate sono pi`

u
In ogni caso, per le lettere valgono sempre le regole
di una, esse si indicano tra parentesi: Z[x, y] oppure
di calcolo che estendono le regole di calcolo dei nuZ[x][y]. Questultima notazione mette in evidenza
meri. Come è ben noto, in Algebra il segno della
che possiamo prima considerare i polinomi nella
moltiplicazione si sottintende o, al pi`
u, si denota con
indeterminata x, e quindi quelli nella indeterminata y
un puntino, cioè invece di a b si preferisce scrivere
aventi come coefficienti i polinomi di Z[x]. Eseguendo
ab o a b. Le proprietà commutativa ed associativa
i prodotti si ha ovviamente luguaglianza dei due
permettono di scrivere ab(ax(ba)xy) come aaabbxxy,
insiemi.
seguendo la regola generale di disporre le varie lettere in ordine alfabetico. Il prodotto di una lettera
per se stessa si può abbreviare con la notazione delle
Sui polinomi è possibile definire le operazioni di
potenze e, anche per le lettere, si definisce:
somma e prodotto in modo da estendere la somma
e il prodotto tra numeri; prima di tutto diamo la

a0 = 1
seguente:
n+1
n
a
= aa
Definizione 5.3 La somma di due monomi simili è
Si scriverà pertanto: aaabbxxy = a3 b2 x2 y.
un monomio la cui parte letterale è uguale a quella dei
Definizione 5.1 Si dice monomio il prodotto di un due addendi e il cui coefficiente è la somma algebrinumero per un prodotto di lettere; il numero si dice ca dei coefficienti dei due monomi. Il prodotto di due
coefficiente o parte numerica del monomio, mentre le monomi è un monomio il cui coefficiente è il prodotto
lettere ne costituiscono la parte letterale. Due mono- dei due coefficienti e la cui parte letterale è costituimi si dicono simili se hanno la stessa parte lettera- ta dalle lettere comuni e non comuni dei due monole; se questa non è presente, il monomio si dice una mi, quelle non comuni col proprio esponente e quelle
comuni con esponente uguale alla somma degli espocostante.
nenti. La somma e il prodotto di polinomi estendono
a
Sono monomi 3a2 b, 5ax2 y, 7, 2.7xyz, ax2 y e il secon- queste regole in modo tale che sia valida la propriet`
do è simile al quarto; un coefficiente 1 è di norma distributiva del prodotto rispetto alla somma.
sottinteso. I monomi costituiscono la base per la
moltiplichiamo i due polinomi x2
costruzione delle espressioni letterali, le pi`
u semplici Come esempio,
2
delle quali sono i polinomi: si dice polinomio la som- 2x + 1 e x + x 1; la proprietà distributiva impone
ma di uno o pi`
u monomi. Ricordando che si scrive di moltiplicare ogni monomio del primo polinomio per
2
2
3ax 2a x invece di 3ax2 + (2a2 x), sono polinomi ogni monomio del secondo; pertanto si ottiene:
a2 + 2ab + b2 , x2 3x + 1 e y 5 4.
(x2 2x + 1)(x2 + x 1) =
Come abbiamo visto, si scrive a2 per aa; quindi a1
sta per a e a0 per il monomio costante 1. Come si sa,
= x4 + x3 x2 2x3 2x2 + 2x + x2 + x 1.
1
0
a e a non si scrivono mai, e questo ci permette di
A questo punto possiamo sommare i monomi simili
introdurre la seguente:
ed ottenere:
Definizione 5.2 Si dice grado di un monomio la
somma degli esponenti della sua parte letterale; il gra- (x2 2x + 1)(x2 + x 1) = x4 x3 2x2 + 3x 1.
do di un polinomio è il massimo dei gradi dei suoi
Si osservi (a + b)(a + b) = a2 + ab + ab + b2 = a2 +
monomi.
2ab + b2 . Questo è il pi`
u semplice esempio di potenza
Il grado dei monomi nellesempio precedente è, ri- di un binomio; un binomio è un polinomio con due soli
spettivamente, 3, 4, 0, 3, 4. Il grado di un monomio termini, come x2 y+3wyz, ma possiamo indicarlo concostante è sempre 0 eccetto, convenzionalmente, il venzionalmente come a + b. Dalla regola precedente
grado di 0 che si pone (meno infinito), cosa che abbiamo: (x2 y+3wyz)2 = x4 y 2 +6wx2 y 2 z+9w2 y 2 z 2 .
tornerà utile in varie occasioni.
Sviluppando i prodotti si ha:
Nota 5.1
Esplicitamente, abbiamo considerato

polinomi i cui coefficienti appartengono ai numeri
reali. Pu`
o essere utile trattare anche polinomi a
coefficienti in altri insiemi numerici. Se fissiamo una
lettera x (che in questo caso ha il ruolo di indeterminata) linsieme dei polinomi in x a coefficienti in un
insieme numerico K si indica con K[x]; ad esempio,
x2 3x + 1 Z[x] e 12 x3 41 x + 5 Q[x]. In generale,
considereremo R[x], a meno che non si dichiari esplicitamente il contrario, specificando di quale insieme di
(a + b)0
(a + b)1
(a + b)2
(a + b)3
(a + b)4
=
=
=
=
=
1
a+b
a2 + 2ab + b2
a3 + 3a2 b + 3ab2 + b3
a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
Come si vede, nellespressione (a + b)n le potenze di

a vanno decrescendo e quelle di b vanno crescendo in
modo tale che in ai bj si abbia i + j = n. I coefficienti
135
5.1. CALCOLO LETTERALE

sono dati dal triangolo di Tartaglia o triangolo di Pascal, nel quale, come sappiamo, ogni elemento è ottenuto sommando il numero che gli sta immediatamente sopra e quello che gli sta sopra, ma alla sinistra: il
lettore è caldamente invitato a dare una dimostrazione per induzione di questa regola, basandosi sul fatto
che (a + b)n+1 = (a + b)(a + b)n , supponendo di conoscere lespressione per (a + b)n e sviluppando quindi
il prodotto. In generale, si ha il seguente risultato:
Teorema 5.1 Vale la formula:
G
ab
ab
a2
H
b
ab
F b E
b
A
ab
b
J
Figura 5.1: Prodotti notevoli per via geometrica
(a + b)n =
Nota 5.2
I Greci, pur con la loro preferenza per

n n 0
n n1 1
n
n 0 n la Geometria e lignoranza per il calcolo letterale, co1 n1
a b +
a
b + +
a b
+
a b .
noscevano alcune di queste regole e ne davano una
0
1
n1
n
Prova: Si consideri lespansione (a + b)n = (a +

b)(a + b) (a + b) per n volte. Applicando la proprietà distributiva si ottengono tanti termini, ognuno
composto di n fattori a oppure b, cioè del tipo ak bnk .
Quanti sono i termini di questo tipo? Sono quelli corrispondenti alla scelta di a da k dei fattori (a + b), e
quindi la scelta di b dagli altri n k fattori. Ma la
scelta dei k fattori a è come la scelta di k elementi
dallinsieme degli n fattori (a + b), e quindi si hanno
Cn,k termini ak bnk .
Naturalmente, si ha:
(a b)2
(a b)3
= a2 2ab + b2
= a3 3a2 b + 3ab2 b3
e cos` via, dove si osserva che i segni + e procedono

in modo alternato.
Le potenze di un binomio sono, a loro volta, un
esempio di prodotto notevole; con questo termine si
indicano identità che è bene ricordare a mente perche permettono di semplificare molti conti. Un caso
molto famoso è fornito dal prodotto di una somma
per una differenza:
(a + b)(a b) = a2 b2
che si dimostra ancora eseguendo i conti. Letto da
destra verso sinistra, questo prodotto notevole si dice
anche differenza di due quadrati e fa parte di una
casistica pi`
u generale, di cui diamo i primi esempi:
a2 b2
a3 b3
a4 b4
a5 b5
=
=
=
=
=
(a b)(a + b)
(a b)(a2 + ab + b2 )
(a b)(a + b)(a2 + b2 )
(a b)(a3 + a2 b + ab2 + b3 )
(a b)(a4 + a3 b + a2 b2 + ab3 + b4 )
Per le somme di due potenze si ottengono prodotti

solo per esponenti dispari:
a3 + b3
a5 + b5
=
=
(a + b)(a2 ab + b2 )
(a + b)(a4 a3 b + a2 b2 ab3 + b4 )
dimostrazione geometrica (vedere la Figura 5.1). Lidentit`

a (a + b)2 = a2 + 2ab + b2 è ovvia, come appare a
sinistra della figura. Il lettore pu`
o utilmente costruire
un cubo di lato a + b mettendo assieme un cubo di
lato a, uno di lato b, tre parallelepipedi di dimensioni
a a b e tre parallelepipedi di dimensioni a b b.
In quanto alla a2 b2 = (a + b)(a b) si osservi che,
nella Figura 5.1, togliendo al quadrato ABF G di area
a2 il quadrato BCIJ di area b2 , si ottiene la stessa
scomposizione del rettangolo DEGH, che ha dimensioni (a b)(a + b). I restanti prodotti notevoli, naturalmente, sono pi`
u difficilmente dimostrabili per via
geometrica.
I prodotti notevoli si prestano a introdurre qualche
curiosit`
a, utile a ricordare che certe manipolazioni
sono errate, come abbiamo avvertito parlando delle
espressioni aritmetiche. Tali manipolazioni possono
portare a errori gravissimi nella risoluzione delle
equazioni, come vedremo tra poco. Ecco allora due
dimostrazioni esemplari: la prima ci informa che tutti
i numeri sono uguali; la seconda, pi`
u modestamente,
ci fa vedere come 1 sia uguale a 2. Siano a, b R
due numeri reali diversi tra loro e si chiami c la loro
differenza, cioè a b = c. Moltiplicando entrambi
i membri per a b e osservando che (a b)2 è un
prodotto notevole, si ha a2 + b2 2ab = ca cb.
Questa si scrive anche a2 ab ac = ab b2 bc
ovvero a(a b c) = b(a b c) e semplificando
a = b pur avendo supposto i due numeri differenti. La
seconda dimostrazione parte invece da due numeri
uguali a = b e li moltiplica per a: a2 = ab. Sottraendo
b2 si ha a2 b2 = ab b2 , cioè (a b)(a + b) = b(a b).
Ora si pu`
o semplificare e ottenere a + b = b, e
poiche sè supposto a = b si conclude 2b = b ovvero
2 = 1. Il lettore ha subito individuato dove è
stato commesso lerrore, consistente in una indebita divisione per 0. Ci si pu`
o sbizzarrire e trovare
analoghe perle; ma, per il momento, qui ci arrestiamo.
Indubbiamente, i polinomi sono le espressioni letterali pi`

u semplici, e li studieremo in modo abbastanza approfondito. Altre espressioni importanti e duso assai frequente sono i rapporti tra polinomi, detti
136
CAPITOLO 5. ALGEBRA
funzioni razionali fratte:

x4 3x3 + x2 3x + 5
.
x3 + 2x2 x + 6
Nota 5.3
Come vedremo nella prossima sezione,

eseguendo la divisione fra numeratore e denominatore, possiamo trasformare ogni funzione razionale
fratta nella somma di un polinomio (il quoziente,
eventualmente 0) e una funzione razionale fratta nella
quale il grado del numeratore è inferiore a quello del
denominatore. Nella Sezione 5.4 vedremo unulteriore
semplificazione delle funzioni razionali fratte detta
riduzione a frazioni parziali, che ha un notevole
numero di applicazioni, le pi`
u importanti delle quali
riguardano il calcolo integrale (vedere Sezione ??) e
la risoluzione delle ricorrenze (vedere Sezione ??),
argomento, questo, trattato purtroppo qui con pochi
dettagli.
Espressioniletterali pi`
u complesse coinvolgono le
radici, come x2 + 1, che possono apparire tanto al
numeratore che al denominatore di espressioni frazionarie. Come abbiamo osservato nella Sezione ??,
avere un radicale a denominatore di una frazione è
particolarmente noioso e quindi è bene liberarsi di situazioni del genere mediante unopportuna razionalizzazione. Ci sono problemi connessi allequivalenza delle espressioni, che vedremo nella Sezione 5.3,
ma le tecniche da adottare sono semplici e legate
ai prodotti notevoli che abbiamo appena visto. Se
il denominatore si riduce a un semplice radicale, la
razionalizzazione è ovvia:
1
3x + 1
=
3x + 1
3x + 1
avendo moltiplicato sopra e sotto per 3x + 1.

Se invece abbiamo la somma o la differenza di due
o pi`
u radicali quadratici, la razionalizzazione è legata
alla differenza di due quadrati. In questo
esempio,
dobbiamo
moltiplicare
sopra
e
sotto
per
3x + 1 +
2x 3:
1
3x + 1 + 2x 3
=
=
3x 1 2x + 3
3x + 1 2x 3
3x + 1 2x 3
=
.
x+2
I radicali cubici si affrontano nello stesso modo con
la regola per a3 b3 :
1
=
3
3x + 1 3 2x 3
p
p
p
3
(3x + 1)2 + 3 (3x + 1)(2x 3) + 3 (2x 3)2
.
=
x+2
5.2
I polinomi
Fra le espressioni letterali hanno un ruolo molto importante i polinomi, che abbiamo introdotto nella sezione precedente. Abbiamo anche visto come si eseguono tre delle operazioni di base: addizione, sottrazione e prodotto. Se K[x] è linsieme dei polinomi
a coefficienti in un insieme numerico K e nellindeterminata x, le tre operazioni sono chiuse in K[x],
cioè la somma, la differenza e il prodotto di due polinomi in K[x] sono ancora polinomi in K[x] e valgono
le consuete proprietà, elencate nella Tabella 5.1.
Anche il grado di un polinomio è stato introdotto
nella sezione sul calcolo letterale; è bene aver presenti
i seguenti risultati:
Lemma 5.2 Sia gr(p(x)) il grado del polinomio
p(x); allora si ha:
gr(p(x) + q(x))
gr(p(x)q(x))
max(gr(p(x), gr(q(x))
= gr(p(x) + gr(q(x)
Prova: Per definizione i monomi che compaiono in

p(x) + q(x) sono simili ai monomi che compaiono in
p(x) e/o q(x), a meno che, nella somma, due monomi simili, ma con coefficienti uno lopposto dellaltro, non si eliminino a vicenda. In ogni caso
gr(p(x) + q(x)) non può superare il massimo dei gradi dei due polinomi addendi. Per il prodotto, sia axn
con a 6= 0 il monomio di grado massimo in p(x) e sia
bxm con b 6= 0 il monomio di grado massimo in q(x).
Allora, p(x)q(x) conterrà il monomio abxn+m , essendo ab 6= 0. Tutti gli altri monomi che compongono il
prodotto hanno pertanto grado inferiore ad n + m, e
questo dimostra lasserto.
Il lettore attento avrà osservato, a questo punto,
limportanza di aver definito gr(0) = ; quello un
po meno attento è invitato a calcolare il grado della
somma e del prodotto dei tre polinomi 0, 5, 7x2 +
4x 1, presi due a due. Si osservi anche la seguente
conseguenza del lemma precedente:
Corollario 5.3 Se due polinomi p(x) e q(x) hanno
grado diverso, allora p(x)+q(x) ha grado esattamente
uguale al pi`
u grande dei gradi di p(x) e q(x).
Ma la conseguenza veramente importante del lemma precedente è la seguente proprietà analoga a
quella dei numeri interi:
Teorema 5.4 Se il prodotto di due polinomi
p(x), q(x) è zero, allora almeno uno di essi è il
polinomio 0.
Prova: Se m è il grado di p(x) ed n è quello di q(x),
il grado del prodotto p(x)q(x) è m + n, ma affinche
sia m + n = , uno almeno tra m ed n deve essere
, cioè il corrispondente polinomio deve essere 0.
137
5.2. I POLINOMI
commutativa
associativa
distributiva
identità
zero
p(x) + q(x) = q(x) + p(x)

p(x)q(x) = q(x)p(x)
p(x) + (q(x) + r(x)) = (p(x) + q(x)) + r(x) p(x)(q(x)r(x)) = (p(x)q(x))r(x)
p(x)(q(x) + r(x)) = p(x)q(x) + p(x)r(x)
0 + p(x) = p(x) + 0 = p(x)
1p(x) = p(x)1 = p(x)
0p(x) = p(x)0 = 0
Tabella 5.1: Somma e prodotto di polinomi
Nota 5.4
Invitiamo naturalmente il lettore a
formulare gli algoritmi per laddizione e la moltiplicazione di due polinomi; quello per la sottrazione è
un banale adattamento dellalgoritmo delladdizione. Per coloro che hanno un po di esperienza di
programmazione, consigliamo lesercizio di scrivere
esplicitamente, nel linguaggio di programmazione conosciuto, i programmi per le tre operazioni. Si usano,
di solito, due rappresentazioni di un polinomio: la
prima è una coppia costituita da un numero naturale
(un integer) e un vettore di numeri reali (cioè
real); il numero rappresenta il grado e il vettore i
coefficienti dei vari monomi (ricordarsi di non saltare
eventuali coefficienti 0, altrimenti la posizione nel
vettore non corrisponde pi`
u al grado del monomio, ed
è impossibile lavorare). La seconda rappresentazione
è a lista, ogni elemento della lista costituito da una
coppia (grado, coefficiente). Se si procede in senso
decrescente, il grado del primo monomio è anche il
grado del polinomio e si possono saltare i monomi con
parte numerica 0; questa volta non ci sono problemi
di interpretazione dei vari monomi, visto che il grado
è scritto in modo esplicito.
Molto pi`
u complicata delle altre operazioni è la divisione tra polinomi; questa si può eseguire solo se il
grado del dividendo è maggiore o uguale al grado del
divisore, e alla fine si ottengono un quoziente e un resto, che sono ancora due polinomi. Il resto ha grado
minore del divisore e, se si riduce a 0, la divisione si
dice esatta. La terminologia è analoga a quella per la
divisione tra numeri e se la divisione è esatta si dice
che il divisore sta nel dividendo, o che il divisore divide o è un fattore del dividendo; questo, a sua volta,
è un multiplo del divisore. La procedura per eseguire
la divisione è la seguente:
Algoritmo 5.1 (Divisione tra polinomi)
Ingresso: due polinomi: p(x) il dividendo e d(x) 6= 0
il divisore;
Uscita: quoziente e resto della divisione.
1. se gr(d(x)) > gr(p(x)) si esce con 0 come
quoziente e p(x) come resto;
2. altrimenti, si assegna p(x) ad r(x) e chiamiamo
A il monomio di grado pi`
u elevato in d(x);
(a) poniamo in B il monomio di grado pi`

u alto in r(x) [per la condizione sui gradi dei
polinomi, gr(B) gr(A)];
(b) si assegna a C il rapporto fra i due monomi B ed A; inseriamo tale monomio nel
quoziente q(x) e poniamo m(x) = C d(x)
[m(x) ha pertanto lo stesso grado di r(x) e
i monomi di grado massimo hanno lo stesso
coefficiente];
(c) si pone r(x) := r(x) m(x) [per le osservazioni precedenti, il grado di r(x) è diminuito
di almeno una unit`
a];
(d) se gr(r(x)) gr(d(x)) si cicla tornando al

punto 2.;
(e) altrimenti si esce con q(x) come quoziente
ed r(x) come resto della divisione.
Un esempio di divisione con resto chiarirà eventuali dubbi; supponiamo di voler dividere 2x5 + 4x4
3x2 + 2x 1 per x2 x + 1. Limpostazione è analoga a quella della divisione tra interi ed è bene non
dimenticare i monomi con coefficiente 0 che possono
non comparire esplicitamente nellespressione dei polinomi. Nella Figura 5.2 è riportata lintera divisione;
il quoziente vale 2x3 + 6x2 + 4x 5 e il resto 7x + 4.
Un semplice esercizio è verificare questo risultato eseguendo d(x)q(x) + r(x). Il polinomio che si ottiene
deve essere p(x), il dividendo.
Come la nomenclatura relativa alla divisione tra
polinomi ricalca quella della divisione tra interi, cos`
i concetti derivati sono simili e si può introdurre una
nozione di divisibilità tra polinomi con tutti gli annessi e connessi che conosciamo: modulo, polinomio
primo, scomposizione in fattori primi, massimo comun divisore e minimo comune multiplo. Tuttavia,
linquadramento di tutti questi concetti richiede una
certa attenzione e lintroduzione di una serie di nuove
definizioni.
Definizione 5.4 Si dice equazione luguaglianza fra
due espressioni letterali; se A = B è la rappresentazione di tale uguaglianza, lespressione letterale A
si dice il membro sinistro dellequazione, e B si dice il membro destro. Se x, y, . . . , z sono le incognite
che compaiono in unequazione, una sua soluzione è
138
CAPITOLO 5. ALGEBRA
2x5
2x5
+4x4
2x4
+6x4
+6x4
2x
2x3
6x3
+4x3
+4x3
3x2
+2x 1
3x2
+6x2
9x2
4x2
5x2
5x2
+2x 1
+2x
+4x
2x
+5x
7x
x2
2x3
x
+6x2
+1
+4x 5
1
1
5
+4
Figura 5.2: Divisione tra polinomi

un assegnamento a tali lettere di valori specifici che
rendono vera luguaglianza. Se unequazione ha come
soluzione ogni possibile assegnamento alle incognite
dei valori di un insieme numerico K, allora si dice
pi`
u propriamente una identità in K. Unequazione si
dice algebrica se è costituita dalluguaglianza di due
polinomi. Due equazioni si dicono equivalenti se e solo se hanno le stesse soluzioni. La forma canonica di
unequazione è unequazione equivalente a quella data,
ma della forma: espressione algebrica uguale a zero.
Il grado di unequazione algebrica è il massimo grado
dei monomi che compaiono nella sua forma canonica. Si dice zero o radice di un polinomio una qualsiasi
soluzione dellequazione che si ottiene uguagliando a
zero quel polinomio.
A(x, y, . . . , z) + C(x, y, . . . , z) = B(x, y, . . . , z) +

C(x, y, . . . , z); sostituendo alle incognite i valori della soluzione si ottiene una uguaglianza
tra due somme di espressioni numeriche uguali,
che sappiamo essere uguali. La stessa cosa vale per il prodotto A(x, y, . . . , z)C(x, y, . . . , z) =
B(x, y, . . . , z)C(x, y, . . . , z),
il quale,
quando
C(x0 , y0 , . . . , z0 ) 6= 0, dà luguaglianza di due
prodotti di numeri uguali. Tuttavia, è bene osservare
esplicitamente, che se C(x0 , y0 , . . . , z0 ) = 0, si ottiene
luguaglianza 0 = 0 anche se
A(x0 , y0 , . . . , z0 ) 6= B(x0 , y0 , . . . , z0 ),
per cui lequazione derivata non è equivalente a quella
data.
E facile vedere e dimostrare che il concetto di

equazioni equivalenti è effettivamente una relazione
di equivalenza; lasciamo al lettore il compito di sviluppare i dettagli di questa affermazione e osserviamo
invece che lequivalenza si mantiene con le operazioni
di al-jabr e di al-muqabalah:
Teorema 5.5 Data una qualsiasi equazione,
ottiene unequazione equivalente se:
Usando la prima delle due regole, ogni equazione

può essere portata in forma normale: basta aggiungere ai due membri lespressione letterale opposta a
quella che costituisce il membro destro. Una identità
ha come forma normale lequazione 0 = 0.
Nel caso delle equazioni algebriche, si ha unultesi riore specializzazione:
Teorema 5.6 (di Ruffini) Sia p(x) un polinomio;

regola della somma: si aggiunge o si sottrae ad allora un numero a è radice del polinomio se e solo
entrambi i membri dellequazione la stessa se p(x) è divisibile per (x a).
espressione letterale;
Prova: Se p(x) = q(x)(x a), è chiaro che andando
regola del prodotto: si moltiplicano o si dividono a sostituire x con a si trova p(a) = q(a) 0 = 0. Viceentrambi i membri dellequazione per la stessa versa, eseguiamo la divisione di p(x) per (x a); sia
espressione letterale, purche questa sia sempre q(x) il quoziente, mentre il resto, dovendo avere gradiversa da zero.
do inferiore ad (x a), sarà una costante b. Abbiamo
Prova: Sia K linsieme numerico sul quale consi- quindi p(x) = q(x)(x a) + b. Sostituendo a ad x
deriamo lequazione; siano x, y, . . . , z le incognite che e sfruttando lipotesi che a sia una radice di p(x), si
compaiono nei due membri, di modo che lequazione ha: 0 = q(a) 0 + b, e questo implica b = 0.
si scriva A(x, y, . . . , z) = B(x, y, . . . , z). Una soluzioConseguenza di questo teorema è che, se conosciane sia x = x0 , y = y0 , . . . , z = z0 , cos` che sia vera la mo le radici di un polinomio, diciamo a , a , . . . , a ,
1 2
k
proposizione
allora possiamo scrivere tale polinomio come (x
A(x0 , y0 , . . . , z0 ) = B(x0 , y0 , . . . , z0 ).
Se C(x, y, . . . , z) è la quantità che aggiungiamo ai due membri, si ha la nuova equazione
a1 )(x a2 ) (x ak ). In realtà, possiamo anche

moltiplicarlo per una costante (diversa da zero) senza
cambiare la validità del risultato. Naturalmente, basta eseguire i prodotti per avere la forma tradizionale.
139
5.2. I POLINOMI
Ad esempio, se le radici sono 1, 2 e 3, il polinomio è
(x 1)(x 2)(x 3) = x3 6x2 + 11x 6.
Il matematico italiano Paolo Ruffini (1765 1822)
anticipò Abel nella dimostrazione della irrisolubilità
delle equazioni di 5 grado, anche se in modo non del
tutto soddisfacente. Inventò anche una tecnica, detto regola di Ruffini, per dividere un polinomio per il
binomio (x a) senza eseguire direttamente la divisione secondo il metodo visto. Se ad esempio si vuole
eseguire (x4 2x2 +x+1)/(x1), il calcolo si imposta
cos`:
1 0 2 1 1
1 1 1 0
1
1 1 1 0 1
La prima riga contiene i coefficienti del dividendo,
dove occorre non dimenticare quelli nulli; il primo
elemento della seconda riga è lopposto del termine
costante del divisore (x a). Si abbassa poi nella
terza riga il primo coefficiente e si pone il suo prodotto
per a nella colonna successiva della seconda riga. Si
esegue poi la somma 0 + 1, ottenendo l1 della terza
riga, e si procede in modo analogo fino alla fine. Nella
terza riga si leggono il quoziente x3 +x2 x ed il resto,
che in questo caso è 1.
Per quanto riguarda i polinomi e le equazioni algebriche, teoricamente possiamo considerare tre insiemi
distinti: Z[x], Q[x] e R[x]; tuttavia, i primi due sono
associati dal seguente risultato:
Teorema 5.7 Un numero razionale r è radice di un
polinomio in Q[x] se e solo se è radice di un polinomio
in Z[x].
Prova: Poiche Z[x] Q[x], se un polinomio in Z[x]
ha come soluzione r, lo stesso polinomio, visto come
appartenente a Q[x], ha ancora r come radice. Viceversa, sia r una radice di p(x) Q[x] e sia m il
minimo comune multiplo dei denominatori dei coefficienti di p(x); se consideriamo lequazione p(x) = 0,
abbiamo p(r) = 0 e se moltiplichiamo i due membri
per m 6= 0 si ha mp(r) = 0, cioè r è una radice del
polinomio mp(x) Z[x].
Si considerano allora due soli insiemi di polinomi:
i polinomi a coefficienti interi (che coincidono, nel
senso visto, con i polinomi a coefficienti razionali) e
i polinomi a coefficienti reali, che sono linsieme pi`
u
ampio. Le proprietà di questi due insiemi sono un po
diverse e, quindi, quando necessario, li distingueremo
chiaramente per evitare confusioni ed ambiguità.
Definizione 5.5 Un polinomio di K[x] si dice irriducibile su K se non ha alcuna soluzione in
K.
Pertanto, un polinomio di Z[x] è irriducibile se non
ha soluzioni razionali; un polinomio di R[x] è irriducibile se non ha soluzioni reali. Per i polinomi di Z[x]
vale il seguente teorema che permette di verificare

facilmente se esso è o non è irriducibile:
Teorema 5.8 (di Eisenstein) Le soluzioni razionali di un polinomio p(x) Z[x], p(x) = a0 xn +
a1 xn1 + + an1 x + an , se esistono, sono da ricercare tra i numeri razionali il cui denominatore è
un divisore di a0 e il cui numeratore è un divisore di
an .
Prova: Sia m/d leventuale soluzione, ridotta ai minimi termini; sostituendo tale valore nellequazione si
ottiene:
m n
m n1
m
a0
+ a1
+ + an1 + an = 0
d
d
d
e quindi, moltiplicando tutto per dn 6= 0 si ha:
a0 mn + a1 mn1 d + + an1 mdn1 + an dn = 0.

Portando tutti i termini, eccetto il primo, a destra
dellequazione, si trova che a0 mn deve avere un fattore d, e poiche d ed m sono per ipotesi primi tra di
loro, d deve essere un divisore di a0 . Analogamente, portando tutti i termini a destra eccetto lultimo,
si vede che m deve essere un divisore di an , come si
voleva.
Ad esempio, se il polinomio 27x3 +6x12 Z[x] ha
soluzioni razionali, basta cercarle fra le frazioni m/d
dove m {1, 3, 9, 27} e d {1, 2, 3, 4, 6, 12}
(come notato a suo tempo, nelle frazioni il segno può
essere lasciato al solo numeratore). Si tratta di 24
valori diversi e quindi il procedimento può essere alquanto noioso; tuttavia, la soluzione (quando esista)
si trova con un po di buona volontà, aiutandosi eventualmente con un calcolatore. Nel caso attuale si trova la soluzione 2/3 e applicando la regola di Ruffini si
ricava 27x3 + 6x 12 = 9(3x2 + 2x + 2)(x 2/3), e vedremo nelle prossime sezioni come 3x2 +2x+2 non abbia addirittura soluzioni reali. Comunque, una nuova
applicazione del teorema di Eisenstein con le possibili radici razionali 1, 2, 1/2, 2/3 mostra subito
che il polinomio non ha altri fattori lineari x a, con
a Q.
Per i polinomi di R[x] le cose stanno in modo
alquanto diverso. Nella prima metà del 1800 fu
dimostrato il seguente:
Teorema 5.9 I polinomi irriducibili di R[x] sono:
1. le costanti;
2. i polinomi di primo grado ax + b;
3. i polinomi di secondo grado ax2 + bx + c per i
quali si abbia b2 4ac < 0.
140
CAPITOLO 5. ALGEBRA
La prova di questo teorema va, per il momento, al

di là delle nozioni che abbiamo e anche degli scopi
di questi appunti. Comunque, vedremo in una nota
successiva le linee generali della dimostrazione. Sono
quindi irriducibili i polinomi x 3 e 3x2 + 2x + 2 in
quanto b2 4ac = 4432 = 20. Si può osservare
che il polinomio x2 + 1 è anchesso irriducibile per
lo stesso criterio; tuttavia, la dimostrazione della sua
irriducibilità è diretta ed immediata. Le sue eventuali
radici sono le soluzioni dellequazione x2 + 1 = 0, cioè
x2 = 1; ma non esiste alcun numero reale il cui
quadrato valga 1, un numero negativo. A questo
punto possiamo dare la seguente:
Definizione 5.6 I polinomi irriducibili di K[x] si
dicono anche polinomi primi.
Dato un polinomio p(x) K[x], una sua scomposizione in
fattori irriducibili (primi) è il prodotto p(x) =
aq1 (x)q2 (x) . . . qk (x), dove a K e i polinomi
q1 (x), q2 (x), . . . , qk (x) sono irriducibili su K. Si dice
massimo comun divisore di due polinomi p(x), q(x)
K[x] un polinomio di grado massimo che divida tanto p(x) quanto q(x). Si dice minimo comune multiplo
un polinomio di grado minimo che sia divisibile tanto
per p(x) che per q(x).
Il lettore avrà notato che nella definizione non si afferma mai che la scomposizione, il massimo comun
divisore e il minimo comune multiplo siano unici: infatti, moltiplicare o dividere per una costante (non
nulla) non cambia le proprietà di un polinomio. Si
dimostra tuttavia (anche se noi non lo faremo) che
questa è lunica eccezione; in altre parole, scomposizione, MCD e mcm di polinomi sono unici a meno
di costanti moltiplicative. Per il MCD e il mcm valgono le stesse proprietà di calcolo viste per i numeri
naturali: ad esempio, il massimo comun divisore può
essere trovato prendendo i fattori (irriducibili) comuni a p(x) e a q(x) col minimo esponente. Qui si richiede molta attenzione perche la non unicità della
scomposizione può trarre in inganno il principiante e
chi voglia fare le cose con troppa fretta.
5.3
Risoluzione delle equazioni
Secondo le definizioni della sezione precedente, unequazione algebrica di primo grado ha come forma canonica ax + b = 0. In questo caso (e solo in questo
caso) si preferisce considerare come canonica la forma
ax = b, con a 6= 0. Tale equazione ammette almeno
la soluzione x = b/a, che si verifica sostituendo ad x
tale valore e notando che essa si riduce alluguaglianza b = b, senzaltro vera. A questo punto è chiaro che
questa è lunica soluzione. Detta infatti r una soluzione diversa, scriviamola nella forma b /a, con b = ra.
Deve essere b 6= b, altrimenti r coinciderebbe con la
prima soluzione; sostituendo b /a nellequazione, si

ha b = b, il che è falso.
Se a = 0, lequazione ax = 0 perde di significato, ma per completezza introduciamo la seguente
terminologia:
1. se a = b = 0, ogni numero reale rende vera luguaglianza; questa è pertanto ridotta allidentità
0 = 0 e si dice che lequazione è indeterminata o
che ammette infinite soluzioni;
2. se a = 0, ma b 6= 0, luguaglianza non può
mai essere verificata; si dice allora che lequazione è impossibile ovvero che non ammette alcuna
soluzione.
Ciò torna utile quando si voglia scrivere un algoritmo
che, partendo da unequazione che si suppone essere
di primo grado, ne trovi la soluzione:
Algoritmo 5.2 (Equazioni di 1 grado)
Ingresso: Unequazione di primo grado in x;
Uscita: La soluzione x0 , oppure uno dei termini
Impossibile o Indeterminata.
1. Usando ripetutamente la regola della somma, si
portano a membro sinistro tutti i termini che
contengono x e a membro destro tutti i termini
che non lo contengono;
2. usando la regola della somma di monomi omogenei, si riduce il membro sinistro a unespressione
del tipo ax; eventualmente, questa espressione si
riduce a zero e si pone allora a := 0;
3. usando le regole della somma, si riduce il
membro destro alla costante b;
4. se a = b = 0, si esce dallalgoritmo dopo aver
scritto Indeterminata;
5. altrimenti, se a = 0 ma b 6= 0, si esce
dallalgoritmo dopo aver scritto Impossibile;
6. altrimenti, lequazione ha lunica soluzione b/a,
determinata dallapplicazione della regola del
prodotto.
Come semplice esempio si consideri lequazione
3x + 2 x = 1 + 5x 2; per il punto 1. dellalgoritmo
abbiamo 3x + 2 x 2 5x = 1 + 5x 2 5x 2,
cioè 3x x 5x = 1 2 2. Ora si applica il punto 2.
e si ottiene 3x = 3; questa è lequazione in forma
canonica e possiamo applicare il passo 6. che dà la
soluzione x0 = 3/(3) = 1. Naturalmente, andando a sostituire il valore 1 cos` ottenuto nellequazione
originale si ha: 3 + 2 1 = 1 + 5 2, cioè 4 = 4, il che
è vero e verifica la validità della soluzione trovata.
Pi`
u interessante è la risoluzione delle equazioni di
secondo grado, che supponiamo essere già scritte in
forma canonica:
141
5.3. RISOLUZIONE DELLE EQUAZIONI
Ad esempio, data lequazione 2x2 + x 6 = 0, si

Teorema 5.10 Sia ax2 + bx + c = 0 unequazione di
ha = 1 + 48 = 49 = 72 ; lequazione quindi ha
secondo grado in forma canonica; essa ammette:
due soluzioni che sono x1 = (1 + 7)/4 = 3/2 e x2 =
a. due soluzioni se il discriminante = b2 4ac è (17)/4 = 2. Nella pratica, è talvolta conveniente
maggiore di 0; in tal caso le soluzioni sono date la seguente formula ridotta, che si applica quando il
dallespressione:
coefficiente b è un intero pari, diciamo b = 2b . Si ha
allora:
x=
;
2b 4b2 4ac
b b2 ac
2a
x=
=
.
2a
a
b. una soluzione se il discriminante è uguale a 0;
I tre coefficienti a, b, c contengono tutte le informatale soluzione è x = b/(2a);
zioni relative allequazione considerata; la formula di
c. nessuna soluzione se < 0.
Prova: Si consideri il seguente procedimento detto metodo del completamento del quadrato e derivato dalle regole di somma e prodotto della sezione
precedente:
risoluzione ne è un esempio convincente, ma vi sono

altri aspetti che possono essere rivelati da tali parametri. Cominciamo con una proprietà abbastanza
ovvia:
Teorema 5.11 Se lequazione ax2 + bx + c = 0 ha

due soluzioni reali, allora la somma di tali soluzioni
`
e
b/a e il loro prodotto vale c/a.
1. si moltiplica per 4a 6= 0: 4a2 x2 + 4abx + 4ac = 0;
2. si somma b2 4ac ai due membri: 4a2 x2 +4abx+
b2 = b2 4ac;
Prova: Dalla formula risolutiva si ha:
b b +
b
+
=
2a
2a
a
3. il membro sinistro è un quadrato: (2ax + b)2 =

e ancora:
b2 4ac.
!
!
b
b +
b2 (b2 4ac)
c
Si osservi che un quadrato è sempre non negativo e
=
=
2
2
2a
2a
4a
a
quindi se b 4ac = < 0, lequazione non può avere
alcuna soluzione (caso c.). Se b2 4ac = 0, lequazione si riduce a 2ax + b = 0; questa è unequazione di dato che il prodotto dei numeratori è il prodotto di
primo grado che, come si è visto, ha come soluzione una somma per una differenza.
x = b/(2a) (caso b.). Infine, se > 0, estraendo la
radice quadrata algebrica si
hanno le due equazioni
Nota 5.5
Come vedremo nelle prossime sezioni,
la distinzione dei tre casi di soluzione di unequazione

di primo grado 2ax + b = + e 2ax + b = ,
di 2 grado è dovuta semplicemente allambito troppo
dalle quali si ricavano i valori delle due soluzioni.
Dal teorema discende un semplice algoritmo:
Algoritmo 5.3 (Soluzione equazioni 2 grado)
Ingresso:
I coefficienti a, b, c del polinomio
ax2 + bx + c;
Uscita: Le eventuali soluzioni dellequazione.
ristretto in cui ci stiamo movendo, cioè i numeri reali.

Quando si passi ai numeri complessi, ogni equazione
di secondo grado ha sempre due soluzioni: nel caso
b) esse coincidono, nel caso c) sono costituite da due
numeri complessi coniugati. La propriet`
a espressa
dal teorema precedente risulta vera in generale, e la
si dimostra nello stesso modo. Infatti nel caso b) si
ha = 0 e nel caso c) pur essendo < 0 i conti fatti
sono ancora validi.
1. si calcola il discriminante = b2 4ac;

2. se < 0 si scrive Lequazione non ammette
soluzioni;
3. altrimenti, se = 0, si scrive Lunica
soluzione è: e si calcola x = b/(2a);
4. altrimenti ( > 0) si calcolano le due soluzioni:
b
x1 =
2a
b +
x2 =
.
2a
Unaltra proprietà che i coefficienti a, b, c permettono di prevedere facilmente è il segno delle radici. Siano e le due radici reali dellequazione
ax2 +bx+c = 0 che si può anche scrivere x2 + ab x+ ac =
0. Per il Teorema di Ruffini 5.6 questa si può anche
scrivere (x )(x ) = 0; sviluppando il prodotto
si ha: x2 ( + )x + = 0. Abbiamo cos` ottenuto, se si vuole, unaltra dimostrazione del teorema precedente, ma vediamo di interpretarla nel modo
seguente:
142
1. se le due soluzioni , sono entrambe positive,
allora ( + ) = b/a è un numero negativo
mentre = c/a è positivo. Si osservi che il
coefficiente di x2 , che dopo la divisione per a è
diventato 1, è sempre positivo;
2. se le due soluzioni , sono entrambe negative,
allora ( + ) = b/a è positivo, come lo è =
c/a; quindi i tre coefficienti 1, b/a, c/a sono tutti
positivi;
3. se le due soluzioni , sono discordi, diciamo
> 0 e < 0, allora ( + ) = b/a sarà positivo o negativo a seconda che || > || oppure
|| < ||. Il prodotto = c/a è invece sempre
negativo. Pertanto, se || > || i tre coefficienti
sono nellordine: positivo, negativo, negativo. Se
invece || < ||, i tre coefficienti sono: positivo,
positivo, negativo.
CAPITOLO 5. ALGEBRA
= 10 e = 7; oppure, = 7 e = 10. La sciamo
al lettore la risoluzione nel caso si conosca la differenza dei numeri e il loro prodotto. Unosservazione
banale ma importante è la seguente: ogni equazione
di secondo grado è simmetrica rispetto alle sue due
soluzioni, nel senso che esse possono essere scambiate, ma lequazione rimane la stessa. Nel nostro caso,
trovati e , anche scambiando con si ottiene
ancora una soluzione. Conclusione: ogni problema
del tipo visto ha due soluzioni.
Unequazione può essere originata dalluguaglianza
di due espressioni razionali fratte, o comunque riconducibili a una forma del genere. Applicando le regole
al-jabr e al-muqabalah ci si riduce sempre alluguaglianza a 0 di ununica espressione razionale fratta.
Ad esempio:
9x + 13
9
=
+6
x+1
x2
Naturalmente, se a era inizialmente positivo, i se- dopo facili passaggi dà:

gni dei tre coefficienti nellequazione di partenza era3(x2 x 6)
no proprio gli stessi; se a era negativo, vanno cam= 0.
x2 x 2
biati scambiando positivo con negativo. Possiamo
riassumere tutto in una tabellina:
Una frazione si annulla solo quando il numeratore è
zero e, allo stesso tempo, il denominatore è diver, > 0
++ +
so da 0. Quindi, intanto, le soluzioni sono comprese
, < 0
+++
fra quelle dellequazione ottenuto uguagliando a 0 il
> 0, < 0
numeratore. Nel nostro caso sono comprese tra le
|| > ||
+ ++
soluzioni di x2 x 6 = 0, cioè x = 3 e x = 2.
|| < ||
++ +
A questo punto, però, il problema non è concluso,
Se, come si fa di solito, chiamiamo permanenza il fat- poiche occorre verificare che le soluzioni trovate non
to che, passando da un coefficiente al successivo, il annullino il denominatore. Se succede una cosa del
segno non cambia (cioè si ha ++ oppure ), e va- genere, la soluzione o le soluzioni incriminate vanno
riazione il fatto che il segno cambia (cioè si ha + tolte dal novero di quelle accettabili. Nel nostro caoppure +), la precedente discussione e la relativa so, fortunatamente, il denominatore si annulla solo
tabella dimostrano:
per x = 1 e per x = 2, e quindi quelle trovate sono
soluzioni legali.
2
Teorema 5.12 (dei segni di Cartesio) Sia ax +
Non è strano il caso in cui unequazione presenbx + c = 0 unequazione di secondo grado con due
ti lincognita sotto un segno di radice; ad esempio,
soluzioni distinte. Ad ogni variazione corrisponde a
lequazione x + 2 = 3 ha lovvia soluzione x = 7,
una soluzione positiva e ogni permanenza a una socome si verifica direttamente. Queste equazioni venluzione negativa. Quando si ha una variazione e una
gono dette irrazionali e il metodo di risoluzione che
permanenza, la prima precede la seconda se la solusubito si presenta alla nostra mente è quello di elezione positiva è maggiore del valore assoluto di quella
vare al quadrato entrambi i membri. Si ha infatti
negativa, mentre la seconda precede la prima in caso
x + 2 = 9, unequazione lineare la cui facile soluziocontrario.
ne ci dà appunto x = 7, a conferma della validità
I teoremi precedenti permettono di risolvere in mo- della nostra
intuizione. Tuttavia, se consideriamo
do elementare problemi del tipo: di due numeri e lesempio x + 2 = x 4, elevando al quadrato si
si conosce la somma (o la differenza) A e il prodotto ha: x + 2 = x2 8x + 16, cioè in forma normale:
B; quali sono i due numeri? Immaginando che e x2 9x + 14 = 0. Le due soluzioni x = 7 ed x = 2,
siano le due soluzioni di unequazione di secondo però, hanno un comportamento strano: la x = 7 sogrado, tale equazione deve essere x2 Ax + B = 0, stituita nellequazione di partenza ci dà il risultato
se A è la somma + . Facciamo un esempio: se la atteso 0 = 0 (e perciò va bene), ma la x = 2 ci dà
somma di due numeri è 17 e il loro prodotto è 70, si 2 = 2, e questo proprio non va. Delle due soluzioni
deve risolvere lequazione x2 17x + 70 = 0, il cui di- trovate, solo una è accettabile. Questo, tuttavia, fa
scriminante è = 172 +470 = 9 = 32 , per cui si ha parte di una situazione generale:
143
5.4. SISTEMI DI EQUAZIONI
x = 12. A questo punto basta verificare che tale

soluzione non è estranea. D) Lasciamo al lettore il
compito di cavarsela quando i radicali sono tre o pi`
u,
ma tali casi, per fortuna, si trovano quasi soltanto
negli esercizi dei testi di Matematica.
Prova: Lequazione A(x)k = B(x)k si può scrivere
2. Se uno o pi`
u radicali sono a denominatore, bisoanche A(x)k B(x)k = 0, e per quanto visto sui
gna ricordarsi di escludere, dalle eventuali soluzioni,
prodotti notevoli equivale a:
quelle che annullano il denominatore, secondo la regola generale che ben conosciamo: la divisione per 0
(A(x) B(x))
non è unoperazione lecita. Ad esempio, consideriamo
(A(x)k1 + A(x)k2 B(x) + . . . + B(x)k1 ) = 0.
lequazione irrazionale:
Un prodotto vale 0 quando uno dei suoi fattori è 0;
1
questo implica che deve essere A(x) B(x) = 0,
+ 1 = x.
1
+x
che dà le stesse soluzioni di A(x) = B(x), oppure
A(x)k1 + . . . + B(x)k1 = 0, ma le soluzioni di La regola ci dice che uneventuale soluzione x = 1
questa equazione (se non coincidono con quelle di dovrà essere rifiutata. Portato il termine 1 a destra,
A(x) = B(x)) sono del tutto estranee allequazione si ha: 1 = (x 1)1 + x, e a questa uguaglianza
di partenza.
applichiamo lelevamento a potenza. Si ottiene 1 =
Teorema 5.13 Sia A(x) = B(x) unequazione nella
variabile x; lequazione A(x)k = B(x)k ha le stesse soluzioni dellequazione di partenza, pi`
u eventuali
altre soluzioni, dette estranee.
Questo giustifica la scoperta della soluzione x = 2

nellesempio precedente e ci avverte che le soluzioni
estranee devono essere scartate. Il solutore di equazioni irrazionali è avvertito di stare bene attento a
ciò che ottiene applicando meccanicamente la tecnica dellelevamento a potenza. Tale tecnica, daltra
parte, è il metodo standard per affrontare le equazioni irrazionali, e non ci rimane che suggerire (o ricordare) alcuni accorgimenti per portare a buon fine
la soluzione di specifiche forme che lequazione può
assumere.
1. Consideriamo quattro casi interessanti: A) Se
lequazione presenta un unico radicale, è bene che
esso venga isolato, cos` da costituire un membro dellequazione, mentre laltro membro contiene
i termini
razionali. Ad esempio, per risolvere x + 2 + 4 = x,

si porta il termine 4 a destra,
il che ci riconduce allequazione già considerata x + 2 = x 4. B) Se i
radicali (quadratici) sono due e non ci sono termini
razionali, se ne porta uno a membro sinistro e laltro almembro
destro, prima di elevare a potenza.
Cos`, x 6 2 x = 0 ci porta a x 6 = 2 x,
cioè x = 4. Purtroppo, andando
nel
a sostituire
lequazione di partenza, si trova 2 2 = 0,
che non ha senso nel campo dei numeri reali. C)
Se invece, oltre ai due radicali, sono presenti termini razionali, questi si portano tutti a membro destro,
mentre i radicali si spostano tutti a sinistra. Lelevamento a potenza, questa volta, non elimina i radicali, ma, nel caso dei radicali quadratici, ne cala
il numero a uno solo, in modo che si può iterare
quanto già detto in precedenza.
Se ad esempio ab
x
+
4
1
=
x
3,
ci
si
porta alla forma
biamo
x + 4 x 3p= 1, e si eleva al quadrato. Si ottiene:

x + 4 2 (x + 4)(x 3) + x 3 = 1, cioè
p
(x + 4)(x 3) = x. Dobbiamo di nuovo elevare al
quadrato, ottenendo infine: x2 + x 12 = x2 , cioè
x3 x2 x + 1, cioè x(x2 x 1) = 0. Le soluzioni

b dove , come
sono allora x = 0, x = e x = ,
sappiamo, indica il rapporto armonico ( 5 + 1)/2 e

b = 1/. Nessuna di queste tre soluzioni è 1
e non rimane che provarle nellequazione originale.
Solo x = dà risultato positivo e quindi rappresenta
lunica soluzione dellequazione di partenza.
3. Per convenzione, i radicali pari, come le radici quadrate, si considerano in senso aritmetico, cioè
con valore non negativo. Viceversa, i radicali dispari
si considerano in senso algebrico, cioè con lo stesso
segno delradicando. Ci limitiamo
qui al semplice
esempio 3 x3 26 x = 2, cioè 3 x3 26 = x + 2,
dopo aver separato la parte razionale da quella irrazionale. Elevando al cubo e semplificando, si ottiene
lequazione di secondo grado x2 + 2x 3 = 0, cioè
x = 3 e x = 1. Ora sitratta di effettuare la verifica;
per x = 3 si ha 3 27 + 26 = 3 + 2, cioè
3
1 = 1, il che è corretto quando si considerino
le radici algebriche, come sè convenuto. Per x = 1
la verifica è immediata, e quindi i due valori trovati
sono entrambi radici legali dellequazione.
5.4
Sistemi di equazioni
E abbastanza intuitivo che un problema possa essere

risolto mediante ununica equazione se cè ununica
quantità da determinare. Se le quantità sono due,
una sola equazione, cioè una sola condizione, può non
essere sufficiente a darci le informazioni necessarie a
risolvere il problema. Ad esempio, un amico burlone
può farci una domanda di questo genere: di un numero di due cifre sappiamo che la somma di queste è sei
e se invertiamo la loro posizione il numero aumenta
di 18 unità. Qual è il numero? Pur essendo una domanda tipicamente accademica, o forse proprio per
144
questo, ci sentiamo sfidati a trovare la soluzione. Numeri che soddisfano la prima condizione ce ne sono
diversi, come 15, 24, 33 o 60; e anche 6 se lo vediamo
scritto come 06. Parimenti, di numeri che soddisfano la seconda condizione ce ne sono pi`
u duno, come
13, 24 o 35. Possiamo allora ricorrere a un metodo
esaustivo: scriviamo separatamente tutti i numeri che
soddisfano ciascuna condizione e osserviamo quali sono (se ce ne sono) quelli che compaiono in tutti e due
gli elenchi. Quando, come in questo caso, i due elenchi sono finiti e siamo sicuri di riuscire a trovare tutti
i numeri che soddisfano ciascuna condizione, questo
può essere un metodo effettivo. Ma, ci chiediamo, cè
un metodo un po pi`
u generale e meno sensibile ad
eventuali errori di elencazione?
Lalgebra fornisce un metodo di risoluzione che, oggi, ci appare molto naturale, ma che ha richiesto secoli per essere scoperto, e la cui scoperta ha richiesto
linvenzione di un formalismo che non è per niente
banale, almeno fino a quando non lo si conosca e non
lo si sia capito. Chiamiamo x ed y le due cifre del
numero che stiamo cercando, cioè sia 10x + y tale numero, secondo la consueta notazione posizionale. La
prima condizione si scrive facilmente x+y = 6. Per la
seconda, cominciamo ad osservare che, invertendo le
due cifre, si ha il numero 10y +x, e quindi la condizione si scrive: 10y + x = 10x + y + 18. Se A è linsieme
delle coppie (x, y) che soddisfano la prima condizione, cos` che, ad esempio, (1, 5) A e (6, 0) A, e B
è linsieme delle coppie (x, y) che soddisfano la seconda condizione, di modo che (1, 3) B e (2, 4) B,
le soluzioni che cerchiamo sono A B. Si dice allora sistema di equazioni in k incognite un insieme di
equazioni nelle quali compaiono esattamente k incognite x, y, . . . , z e che devono diventare proposizioni
vere per i medesimi valori di tali incognite. Una soluzione del sistema è appunto una k-upla di valori
(x = x0 , y = y0 , . . . , z = z0 ) che sostituiti nelle varie equazioni le rendono tutte vere; in altre parole, le
soluzioni del sistema sono gli elementi dellintersezione delle possibili soluzioni delle varie equazioni che
compongono il sistema. Le equazioni si scrivono una
sotto laltra, riunite da una parentesi graffa: questa
ha lo scopo di mettere in rilievo il fatto che uneventuale soluzione deve soddisfare tutte le equazioni; è
pertanto parte essenziale della notazione e non può
essere sottintesa. Nel nostro esempio abbiamo:
x+y =6
10y + x = 10x + y + 18.
CAPITOLO 5. ALGEBRA
che lo compongono (nel nostro esempio: 1 1 = 1).
Nella sezione presente ci occuperemo soltanto della
soluzione dei sistemi lineari in due e tre incognite.
Un sistema lineare di due equazioni in due
incognite è sempre riducibile alla forma normale:
ax + by = c
(5.1)
a x + b y = c
mediante le usuali regole di semplificazione. Ad esempio, la seconda delle nostre equazioni dà 9y9x = 18,
cioè, per il Teorema 5.5, y x = 2, e quindi il sistema
ha come forma normale:
x+y =6
x y = 2.
Esistono almeno due metodi diretti per risolvere un
sistema ridotto a forma normale:
per sostituzione: si ricava una delle due incognite da una delle due equazioni (come se laltra
incognita fosse un semplice numero) e la si sostituisce nellaltra equazione. Questa diviene unequazione lineare in una sola incognita, e quindi
sappiamo come risolverla. Trovato il valore di
questa incognita, la si sostituisce in una qualsiasi delle due equazioni, ricavando cos` il valore
della prima incognita;
per somma e sottrazione: moltiplicando le due
equazioni per opportune costanti, si rendono
uguali (od opposti) i coefficienti della x; sottraendo (risp. sommando) membro a membro
le due equazioni, la variabile x scompare e si ottiene unequazione lineare in y, che si sa risolvere. Agendo in modo analogo sulla y, si ricava il
valore della x.
Applicando il primo metodo, dalla prima equazione

si ottiene y = 6 x; sostituendo questo valore nella
seconda si ha: x 6 + x = 2, cioè 2x = 4 che ci
dà x = 2. Sostituendo questo valore in y = 6 x si
ottiene y = 4, e perciò il numero da indovinare era
24. Applicando il metodo di somma e sottrazione (in
questo caso è il metodo da preferire), sommando si
ottiene 2x = 4, cioè x = 2, e sottraendo 2y = 8, cioè
y = 4, e di nuovo si trova la soluzione 24. Come cera
da aspettarsi.
In questo esempio, la soluzione esiste ed è unica;
ma, ci chiediamo, è questo sempre il caso o, come per
le equazioni ad una incognita, vi sono anche altre posPoiche, in questo caso, le equazioni che compongono sibilità? Per rispondere a questo quesito, ripartiamo
il sistema sono tutte lineari, il sistema si dice lineare; dalla forma canonica generale e vediamo di trovare
propriamente, si tratta di un sistema lineare di due unespressione per la (o le) possibili soluzioni, quanequazioni in due incognite. In generale il grado di un do almeno una soluzione esista. Usando il metodo di
sistema è il prodotto dei gradi delle singole equazioni somma e sottrazione, si moltiplicano opportunamente
145
5.4. SISTEMI DI EQUAZIONI

le due equazioni:
aa x + ba y = ca
aa x + ab y = ac
Nota 5.6
ab x + bb y = cb
ba x + bb y = bc
Si sottraggono le due coppie di equazioni e si ottiene

(a b ab )y = a c ac dalla prima e (ab a b)x =
b c cb dalla seconda. Quindi la soluzione generale
è:
ac a c
b c bc
y=
.
x=
ab a b
ab a b
La discussione relativa alle possibili soluzioni è ora

piuttosto semplice. Tutto dipende dallespressione
ab a b che si trova al denominatore; se essa è diversa
da zero la soluzione è unica e perfettamente determinata dalle formule precedenti. Se invece ab a b = 0,
la soluzione non è pi`
u determinata; questa condizione
equivale a a/a = b/b , cioè il rapporto dei coefficienti
della x e della y è lo stesso. Può allora succedere che
il rapporto c/c ha ancora lo stesso valore, oppure ha
un valore diverso. Nel primo caso le due equazioni
ax + by = c e a x + b y = c sono in effetti la stessa
equazione; quindi ogni soluzione della prima equazione è anche soluzione della seconda, e viceversa. Ma
la prima equazione ha infinite soluzioni perche, assegnato un valore alla x, la y resta determinata di
conseguenza. Il sistema si dice allora indeterminato.
Se invece c/c 6= a/a , le due equazioni sono incompatibili, in quanto se ax + by è uguale a c non si può
anche avere a x + b y = c ; quindi il sistema è impossibile. Queste considerazioni portano a scrivere il
seguente algoritmo:
Algoritmo 5.4 (Soluzione di un sistema 2 2)
Una matrice 2 2 è costituita da 4

numeri disposti su 2 righe e 2 colonne:
a b
M=
;
a b
si dice determinante di M e si scrive det(M ) la quantit`

a ab a b, ottenuta sottraendo il prodotto degli
elementi della diagonale secondaria da quello degli elementi della diagonale principale. Da un punto di vista
notazionale, una matrice viene delimitata da una coppia di parentesi quadre (o tonde); un determinante è
delimitato da linee verticali analoghe a quelle del valore assoluto. Nel caso del sistema 5.1, la precedente
matrice (ottenuta disponendo in ordine i coefficienti
della variabili nelle due espressioni) si dice la matrice
del sistema e il suo determinante si dice determinante
del sistema. Se, nella matrice del sistema, al posto
della prima colonna sostituiamo i termini noti, si ha
come determinante:

c b
c b
= cb bc .
det
=
c b
c b
Se poi sostituiamo i termini
colonna:

a c
a c
=
det
a c
a c
noti nella seconda
= ac a c.
Si hanno allora le seguenti formule di Cramer per la

risoluzione del nostro sistema:
c b
a c
c b
a c
y=
.
x=
det(M )
det(M )
Queste formule, che sembrano complicare, invece che

semplificare, la soluzione del nostro problema, sono
in realt`
a estendibili a sistemi lineari di n equazioni
in n incognite, e quindi rendono pi`
u agevole la
formulazione della soluzione, anche se, spesso, non ne
semplificano la soluzione numerica.
Ingresso: i coefficienti a, b, c e a , b , c delle due

equazioni del sistema;
Uscita: la soluzione del sistema, oppure la parola
Il metodo di somma e sottrazione risulta di solito
Indeterminato con la formula delle soluzioni, pi`
u simpatico del metodo di sostituzione; questo però
oppure il termine Impossibile;
è del tutto generale e può essere esteso a sistemi di
n equazioni in n incognite. Nel caso n = 3 spesso si
1. si calcola il valore := ab a b;
applica un metodo intermedio: si ricava da unequazione unincognita in funzione delle altre due e la si
2. Se 6= 0 allora:
sostituisce nella rimanenti due equazioni, che perciò
(a) si calcola x := (b c bc )/ e y := (ac vengono a formare un sistema di due equazioni in due
incognite. Questo si risolve per somma e sottrazione e
a c)/;
(b) si esce scrivendo il valore ottenuto per x e i valori trovati si sostituiscono nella prima equazione
per ricavare il valore dellultima incognita. Ad esemper y;
pio, di un numero di tre cifre sappiamo: 1) la somma
3. altrimenti ( = 0) si calcola il rapporto r := delle tre cifre è 12; 2) la somma delle prime due cifre
è uguale alla terza; 3) il numero formato dalle prime
a/a ;
due cifre è quattro volte la terza cifra. Dette allora
(a) se r 6= c/c si esce scrivendo Impossibile; x, y, z le tre cifre, si ha il sistema:
(b) altrimenti (r = c/c ) si scrive Indeter x + y + z = 12

minato e si esce con lespressione y =
x+y =z
(c ax)/b.
10x + y = 4z.
146
CAPITOLO 5. ALGEBRA
La seconda equazione ci dà già una determinazione che 6x2 7x 3 = (3x + 1)(2x 3), e a questo punto
di z in termini di x ed y; sostituendo tale valore di vediamo che la frazione si può scrivere come:
z nelle altre due equazioni si trova un sistema di 2
A
B
x7
equazioni in 2 incognite:
=
+
,
(3x + 1)(2x 3)
3x + 1 2x 3
x+y =6
2x + 2y = 12
dove A e B sono due numeri reali opportuni. In effet2x y = 0.
6x 3y = 0
ti, dimostreremo ora che questa scomposizione, detta
Sommando, si trova 3x = 6, cioè x = 2 e quindi in frazioni parziali, è possibile proprio determinando
y = 4. A questo punto, usando z = x+y è immediato il valore di A e di B. Portando le due frazioni allo
dedurre z = 6, cioè il numero cercato è 246. In questo stesso denominatore si ottiene:
caso la forma normale è:
2Ax 3A + 3Bx + B
x7
=
.
(3x + 1)(2x 3)
(3x + 1)(2x 3)
x + y + z = 12
x+yz =0
Affinche queste due espressioni siano uguali (come

10x + y 4z = 0.
deve essere) occorre che i due numeratori coincidano,
cioè sia x 7 = (2A + 3B)x 3A + B. Essendo x
Nota 5.7
Nellesempio, la matrice del sistema è:
una
indeterminata, le due espressioni sono uguali se
1 1
1
e solo se coincidono i coefficienti della x e i termini
M = 1 1 1
noti. Deve cioè essere:
10 1 4
2A + 3B = 1
e il determinante di una matrice 3 3 si trova con la
3A + B = 7
regola di Sarrus, o
delle diagonali:
a
b
c

a
b
c =
a b c
= ab c + bc a + ca b cb a ba c ac b .
Nel nostro caso il determinante vale: 4 10 + 1

10 + 4 + 1 = 18. Esso costituisce il denominatore per
applicare le formule di Cramer. Sostituendo la colonna dei termini noti alla prima colonna della matrice
del sistema si trova:
12 1
1
0 1 1 = 48 + 0 + 0 0 0 + 12 = 36,
0 1 4
e quindi x = 36/(18) = 2. Analogamente si

trovano i valori di y e di z, lelaborazione dei quali
lasciamo al lettore (che sia arrivato fin qui) come
semplice, ma assai utile esercizio.
Unimportante applicazione della risoluzione dei sistemi lineari è costituita dalla semplificazione delle
funzioni razionali fratte. Abbiamo già accennato nella Sezione 5.1 che esse possono sempre essere ridotte
a frazioni il cui numeratore abbia grado inferiore al
denominatore. Se poi questo può essere scomposto
in fattori del tipo ax + b, la frazione si semplifica ulteriormente in somme di funzioni razionali fratte col
denominatore semplice del tipo (ax + b)k . Il metodo
si spiega bene con un esempio, che può essere generalizzato. Si consideri la funzione razionale fratta
(x 7)/(6x2 7x 3). E un semplice esercizio sulla
risoluzione delle equazioni di secondo grado scoprire
e questo è un sistema lineare di due equazioni nelle

due incognite A e B. Possiamo risolverlo per sostituzione, osservando che B = 3A 7 dalla seconda
equazione. Questo dà 11A = 22 dalla prima equazione, cioè A = 2, e di conseguenza B = 1. Si ha
pertanto:
2
1
x7
=
.
(3x + 1)(2x 3)
3x + 1 2x 3
Nota 5.8
In generale, avremo situazioni come:
ux + v
A
B
=
+
(ax + b)(a x + b )
ax + b
a x + b
dove ax + b e a x + b non sono equivalenti, cioè non
esiste alcun numero reale k per cui a = ak e b = bk.
Procedendo come nellesempio, si arriva al sistema:
Aa + Ba = u
Ab + Bb = v.
Il determinante di questo sistema vale a b ab , che è
0 se e solo se a/a = b/b , cioè proprio solo nel caso
che abbiamo escluso. Questo ci assicura che il metodo ha sempre successo, purche i binomi a denominatore non siano, di fatto, lo stesso binomio. Il caso
delle funzioni razionali fratte (ux + v)/(ax + b)2 non
pu`
o essere risolto ne con questo metodo, ne con altri.
Analogamente, non possono essere risolte le situazioni
in cui a denominatore ci sia un polinomio di secondo
grado irriducibile, cioè con discriminante minore di
0. Senza entrare in dettagli e dimostrazioni, lasciamo
al lettore la verifica delle due seguenti scomposizioni,
che esemplificano il metodo nei due casi noiosi appena
detti.
147
5.5. DISEQUAZIONI
Quando è presente una potenza k 2, occorre far
intervenire tutte le potenze minori o uguali a k:
A
B
C
x2 7x + 1
=
+
+
.
(x + 1)2 (x 2)
(x + 1)2
x+1
x2
Questo porta al sistema:
B+C
A B + 2C
2A 2B + C
=
=
=
1
7
1
e quindi si ottiene:
3
2
1
x2 7x + 1
=
+
.
(x + 1)2 (x 2)
(x + 1)2
x+1
x2
Per i polinomi irriducibili occorre un numeratore pi`
u
complesso, cioè un binomio di primo grado:
2x2 + x 5
Ax + B
C
= 2
+
,
(x2 + 1)(x 2)
x +1
x2
che porta alla scomposizione:
x+3
1
2x2 + x 5
= 2
+
,
(x2 + 1)(x 2)
x +1
x2
attraverso la soluzione di un sistema di tre equazioni
in tre incognite, che lasciamo alle amorevoli attenzioni
del lettore.
Come sappiamo, il grado di unequazione algebrica

è il pi`
u alto dei gradi dei monomi che lo compongono,
dopo aver effettuato tutte le semplificazioni possibili.
Il grado di un sistema è il prodotto dei gradi delle
equazioni che lo compongono. Come abbiamo visto,
se tutte le equazioni sono lineari, allora il grado del
sistema è 1; se si considerano invece:
2
x+y =
x + y2 =
oppure
xy =
xy =
si hanno, rispettivamente, un sistema di secondo e un
sistema di quarto grado. In via del tutto teorica, la
soluzione di uno di questi sistemi può avvenire operando per sostituzione; ad esempio, da x + y = si
ricava y = x e quindi, sostituendo nella seconda,
x2 x+ = 0 (vedere anche la Sezione 5.3). In questo modo, si capisce come ogni volta si arrivi ad avere
unequazione con lo stesso grado di tutto il sistema,
giustificando cos` la definizione stessa di grado.
Talvolta, il metodo di sostituzione è lunico o il
pi`
u appropriato metodo di procedere. In realtà, esiste una bellissima teoria sulla risoluzione dei sistemi
polinomiali, ma non possiamo parlarne qui. Ciò che
invece è importante fare è spingere il solutore ad utilizzare la propria intelligenza e le proprie conoscenze
per cercare metodi indiretti di risoluzione. Ad esempio, per il secondo sistema si può procedere osservando che x2 +2xy +y 2 = +2 e x2 2xy +y 2 = 2.
Questo dà il nuovo sistema lineare:
x + y = + 2
x y = 2
che si può risolvere per somma e sottrazione. La scelta dei segni permette di trovare le quattro soluzioni
previste, purche sia +2 > 0 e 2 > 0; altrimenti,
il numero delle radici reali potrà essere minore.
I sistemi di equazioni che abbiamo considerato prevedono una soluzione in termini di numeri reali o, se i
coefficienti sono interi, in termini di numeri razionali.
Spesso però accade che certi problemi richiedono una
soluzione in numeri interi, come nel celebre caso del
vecchio cammelliere arabo. Costui possiede 17 cammelli e li lascia in eredità ai tre figlioli, specificando
che il primo debba averne la metà, il secondo un terzo
e il terzo (che è un po birichino) solamente un nono.
Ma come fare la divisione se, come sembra, i cammelli non possono essere divisi a fette? La soluzione del
Visir, chiamato a risolvere la questione, è pi`
u astuta
che matematicamente corretta. In realtà, le equazioni e i sistemi di equazioni per i quali si ricercano solo
soluzioni intere sono stati studiati fin dallantichità e
vengono detti diofantei, in onore di Diofanto, il matematico greco - alessandrino che li affrontò in modo
sistematico nel III secolo d.C.. Oggi si sa che questi
problemi sono di difficile soluzione e, addirittura, è
impossibile trovarne un metodo generale di risoluzione. Se sono coinvolte n variabili, le possibili soluzioni
sono contenute in Zn , un insieme numerabile, e quindi si potrebbe pensare di provarle sistematicamente
tutte, fino a che una soluzione non salti finalmente
fuori. Questo, però, succede se almeno una soluzione
esiste; purtroppo, si dimostra che è impossibile dimostrare che, per un dato sistema diofanteo, almeno
una soluzione esista. Pertanto, procedendo per tentativi, potremmo andare avanti, andare avanti e non
arrivare mai al termine della verifica. Tecnicamente,
si dice che il problema della soluzione delle equazioni diofantee è indecidibile. Questo è uno dei casi in
cui il principio del terzo escluso e il principio di non
contraddizione non sono pi`
u applicabili.
5.5
Disequazioni
Non vi è dubbio che molti problemi si risolvono con

luso delle equazioni, specie quando si ricerchino valori precisi o caratteristici. Tuttavia, nella pratica sono molto frequenti i problemi nei quali si cerca un rango di valori che ci permettano una certa
flessibilità, o che comunque abbiano a che fare con
quantità che devono essere maggiori (o minori) di un
148
valore assegnato. Ad esempio, vorremmo sapere a
che ora (al pi`
u tardi) dobbiamo partire per arrivare a Roma entro mezzogiorno, sapendo che il traffico non ci permetterà di superare gli 80 km/h. Nel
classico problema del trasporto, unazienda ha, diciamo, tre stabilimenti di produzione S1 , S2 , S3 , ciascuno dei quali, in un mese, può produrre una quantità
q1 , q2 , q3 di un certo prodotto, compresa tra un minimo e un massimo: mi qi Mi , i = 1, 2, 3, legato
agli impianti e al personale. Ha poi n punti vendita V1 , V2 , . . . , Vn che possono smaltire certe quantità
ri , anchesse comprese tra un minimo e un massimo: ti ri Ti , i = 1, 2, . . . , n. Si conosce poi il
costo del trasporto della merce (per unità di prodotto) da ciascuno stabilimento a ciascun punto vendita.
Il problema è quello di determinare le quantità Qi,j
da trasportare dallo stabilimento Si al punto vendita
Vj in modo da soddisfare i vincoli, cioè le condizioni
sulle quantità della produzione e delle vendite, e da
minimizzare i costi di trasporto.
Una disequazione è unespressione del tipo
A(x, y, . . . , z) B(x, y, . . . , z) dove A(x, y, . . . , z) e
B(x, y, . . . , z) sono due espressioni letterali nelle incognite x, y, . . . , z ed è uno dei quattro relatori:
<, , >, . Una soluzione della disequazione è un
qualsiasi assegnamento di valori reali alle variabili:
x = x0 , y = y0 , . . . , z = z0 tale che la proposizione A(x0 , y0 , . . . , z0 ) B(x0 , y0 , . . . , z0 ) risulti vera. Il
grado di una disequazione è definito in modo analogo al grado di una equazione: ridotta la disequazione alla forma canonica C(x, y, . . . , z) 0, il grado
della disequazione è il grado dellespressione letterale C(x, y, . . . , z). Per arrivare alla forma canonica di
una disequazione, si applicano le regole di al-jabra e
di al-muqabalah, ma con qualche attenzione:
1. se si aggiunge o si toglie ad entrambi i membri di una disequazione la stessa quantità, la
disequazione non cambia;
2. se si moltiplicano o si dividono entrambi i membri di una disequazione per la stessa quantità
maggiore di 0, la disequazione non cambia;
CAPITOLO 5. ALGEBRA
dobbiamo moltiplicare i due membri per lespressione C(x), dobbiamo dividere il nostro problema in due
sottoproblemi: C(x)A(x) C(x)B(x) e C(x) 0 il
primo, e C(x)B(x) C(x)A(x) e C(x) 0 il secondo. Si tratta, propriamente, di due sistemi di disequazioni, ma come ora vedremo, questo fa parte della
regola generale, secondo la quale ogni disequazione si
risolve mediante lo studio di un opportuno sistema di
disequazioni.
Oggi, problemi analoghi a quello del trasporto nascono in molte modellazioni della realtà, spesso legati alla produzione di beni, alla progettazione ingegneristica ed economica; se le disequazioni sono tutte lineari, si dice che siamo di fronte a un sistema
di programmazione lineare; esistono algoritmi, come
quello famoso del simplesso che permettono di risolvere, con laiuto dellelaboratore, sistemi con migliaia
di incognite e decine di migliaia di disequazioni. Qui,
naturalmente, ci occuperemo di problemi molto pi`
u
semplici, ma che sono alla base di questo settore dellAlgebra, talvolta molto interessante e spesso assai
complicato.
Una disequazione lineare nella sola incognita x è di
facile soluzione; la sua forma pi`
u generale, una volta
applicate le regole viste sopra, è ax b e, applicando
ancora la regola 3, se a > 0 si ha x b/a, mentre
se a < 0 si trova b/a x. Cos`, se la distanza da
Roma a cui ci troviamo è 180 km, il tempo minimo di
percorrenza sarà: 180/80 = 9/4 = 2h 15 ; se vogliamo
arrivare entro mezzogiorno, dobbiamo partire prima
che manchi un quarto alle dieci. Le soluzioni di una
disequazione si rappresentano in modo convenzionale,
ma suggestivo, disegnando la retta reale e dividendola
secondo i punti di transizione dalle zone di soluzione a
quelle di non-soluzione; queste ultime si denotano con
una linea tratteggiata, mentre le prime si indicano
con una linea continua. Nel nostro esempio abbiamo:
9/4
La risoluzione delle disequazioni di primo grado è

un
passo importante. In pratica ci limiteremo a consi3. se si moltiplicano o si dividono entrambi i memderare
disequazioni di tipo polinomiale o determinate
bri di una disequazione per la stessa quantità
da
espressioni
razionali fratte (con una sola incogniminore di 0, la disequazione cambia senso (cioè,
ta), accennando appena alle disequazioni irrazionali,
se A(x) B(x), allora cB(x) cA(x)).
comunque riconducibili ai tipi precedenti. Dovendo
La quantità a sommare o a moltiplicare può an- implicitamente considerare anche i sistemi di diseche dipendere da una o pi`
u delle variabili x, y, . . . , z, quazioni, ad essi non dedicheremo una trattazione
ma nel caso della moltiplicazione questo introduce particolare.
una nuova disequazione che ci permetta di manteCome vedremo nella prossima sezione sui numeri
nere (o di invertire) il senso della disequazione mo- complessi, un polinomio p(x) R[x] è sempre scomdificata. Ad esempio, se A(x) B(x) e sappiamo ponibile in polinomi di primo e di secondo grado con
che x > 0, allora possiamo cambiare la disequazione discriminante minore di 0 (polinomi irriducibili). In
in xA(x) xB(x), se ciò ci conviene. Viceversa, se generale, queste scomposizione non si può ottenere
149
5.5. DISEQUAZIONI
facilmente e richiede la ricerca delle radici del polinomio. Se questo è di secondo grado, sappiamo come
procedere; se è di terzo o di quarto grado, si conoscono tecniche di scomposizione (si veda la Sezione 5.7),
che spesso sono però assai complesse. In generale,
per i polinomi di grado superiore al secondo si usano
metodi numerici per determinare buone approssimazioni delle radici, e anche a questo accenneremo nella
stessa Sezione 5.7, pur essendo la faccenda non del
tutto banale. Pertanto, lo strumento pi`
u disponibile
e simpatico (anche se talvolta piuttosto noioso) è dato dal Teorema di Eisenstein, che però funziona solo
se i coefficienti del polinomio sono numeri interi (o
razionali) e almeno una delle radici è razionale. Trovata questa, la regola di Ruffini permette di effettuare
la prima scomposizione e ridurre il polinomio di un
grado, semplificando cos` (si spera) i passi successivi.
Immaginando (con un po di buona volontà) di esser riusciti a scomporre in fattori irriducibili il nostro
polinomio, la tecnica da utilizzare è standard e cercheremo ora di esporla; essa si basa su considerazioni
relative a ciascun fattore e per quelli di primo grado losservazione precedente sul grafico con la retta
reale è tutto ciò che serve. Per quanto riguarda i polinomi irriducibili di secondo grado, si ha il seguente
risultato:
risulta positiva per valori di x < e di x > , mentre

risulta negativa per < x < .
Prova: Il prodotto di due fattori risulta positivo se
e solo se i due fattori hanno lo stesso segno; ma x
è positivo per x > e x per x > . Quindi, solo
per < x < i due fattori hanno segno discorde.
Utilizzando ancora la retta reale, la seguente figura
rappresenta molto bene la situazione (e può essere
facilmente generalizzata):
(x )
(x )
(x )(x )
dove la terza linea (x )(x ) deriva dalla diretta applicazione della regola dei segni alle due linee
precedenti, quando si ricordi che la linea tratteggiata corrisponde a valori negativi e quella continua a
valori positivi.
La generalizzazione ad espressioni di grado superiore è allora immediata. Supponiamo di avere leLemma 5.14 Sia ax2 + bx + c (con a 6= 0) unespressione, già fattorizzata, (x + 1)(x 1)(x 2) =
3
2
spressione di 2 grado con il discriminante negativo; x 2x x + 2; le tre linee corrispondenti ai tre
allora tale espressione, al variare di x, risulta sempre fattori ci dicono subito il risultato:
negativa se a < 0 e sempre positiva se a > 0.
1
1
2
(x + 1)
Prova: Usiamo qui unargomentazione che risulterà pienamente giustificata solo quando parleremo
(x 1)
di continuità (vedere la Sezione 8.4); per il momento
ci dobbiamo basare solo sulla nostra intuizione. Se
(x 2)
il risultato esposto nellenunciato non fosse vero, si
avrebbe un valore x0 di x per cui ax20 + bx0 + c < 0
e un valore x1 di x per cui ax21 + bx1 + c > 0. Poiche
a piccole variazioni di x corrispondono piccole variazioni dellespressione, deve esistere un valore x
di x, Lespressione è positiva per 1 < x < 1 poiche risulcompreso tra x0 ed x1 , tale che a
x2 + b
x + c = 0, cioè tano positivi due fattori su tre; è di nuovo positiva
un valore che risulta radice dellespressione, contro per x > 2 poiche tutti e tre i fattori sono positivi.
lipotesi che il discriminante fosse negativo, e quindi Lespressione è invece negativa per x < 1 poiche è
lespressione senza radici reali.
composta da tre fattori negativi, e per 1 < x < 2 poich
e solo il fattore (x 3) risulta negativo. La regola
Lasciamo al lettore il compito di estendere que`
e
:
i) lespressione è positiva se i fattori negativi sono
sto risultato al caso del discriminante nullo, mentre
in
numero
pari; ii) è negativa se i fattori negativi soci interessa vedere cosa succede se il discriminante è
no
in
numero
dispari. Anche se tutti lo dovrebbero
positivo e quindi esistono due soluzioni e delle2
sapere,
il
numero
0 è pari!
quazione ax + bx + c = 0. Possiamo allora scrivere
2
Ogni espressione polinomiale dà origine ad una diax +bx+c = a(x)(x) e supporre che sia a > 0;
il caso a < 0 si tratta in modo del tutto analogo. Si sequazione risolubile con il metodo descritto, purche
sia scomponibile in fattori irriducibili. Ci basterà osha allora:
servare il seguente esempio, che ci permette di deTeorema 5.15 Data lespressione ax2 + bx + c = scrivere il metodo generale. Il lettore è invitato (cala(x )(x ) con a > 0 e < , tale espressione damente) a formalizzare il procedimento in un vero
150
CAPITOLO 5. ALGEBRA
e proprio algoritmo, il che gli permetterà di chiari- dei suoi coefficienti contiene uno o pi`
u parametri, cioè
re e di chiarirsi i vari passi necessari. Sia data la quantità non definite da un preciso valore, ma che, a
disequazione:
seconda dei casi, possono assumere valori precisi. Ad
esempio, consideriamo lequazione di secondo grado:
x4 + 2x3 x 2 > 0
x2 (m + 2)x (4m + 8) = 0,
e si cerchi di fattorizzare il polinomio di quarto grado.
Il Teorema di Eisenstein ci dice che, se esistono radici per la quale siamo interessati a scoprire per quali
razionali, esse sono comprese tra 1 e 2. Provando, valori di m (il parametro), lequazione ha due sosi vede che x = 1 è proprio una radice, e applicando luzioni reali (come sottoprodotto, scopriremo anche
quando essa ha ununica soluzione). Naturalmente,
la regola di Ruffini ci si riduce allespressione:
lesistenza delle soluzioni è legata al discriminante:
(x 1)(x3 + 3x2 + 3x + 2) > 0.
= (m + 2)2 + 4(4m + 8) = m2 + 20m + 36.
Confidando ancora nella fortuna e in Eisenstein, si
trova la radice x = 2 e di nuovo si usa Ruffini per Perche si abbiano due soluzioni, deve essere2 > 0 e
quindi dobbiamo risolvere la disequazione m +20m+
ottenere lespressione:
36 > 0. La scomposizione in fattori dà: m2 + 20m +
36 = (m+2)(m+18) e, in accordo a quanto detto, due
(x 1)(x + 2)(x2 + x + 1) > 0.
soluzioni si hanno per m < 18 e m > 2, e il lettore
Lultima espressione di secondo grado ha discrimi- verificherà che per m = 20 e per m = 0 si hanno
nante negativo e quindi, per il lemma precedente, ha davvero due soluzioni. A questo punto, per m = 18
sempre valore positivo. Basta allora disegnare il gra- e per m = 2 lequazione di partenza ha ununica
fico per i fattori (x 1) e (x + 2) e vedere che la soluzione, e infatti si ha: x2 + 16x + 64 = (x + 8)2 = 0
disequazione di partenza è vera per x < 2 e per e x2 = 0.
Spesso, questa doppia soluzione di equazioni di sex > 1.
Se invece che da un polinomio, abbiamo una dise- condo grado risulta ostica e lo studente, specie le priquazione costituita da unespressione razionale fratta, me volte, tende a perdere il filo del ragionamento (io
il metodo di risoluzione non cambia, visto che anche lo perdo ancora). Il ragionamento, in realtà, non è
un rapporto è positivo se e solo se numeratore e de- poi troppo complicato e richiede solo un po di attennominatore sono concordi. Un esempio deve essere zione. Perciò il consiglio è quello di rileggere tutta
questa tiritera e provare ancora una volta, ad esempio
sufficiente:
con lequazione x2 (m + 1)x (2m + 5) = 0.
x2 + x 2
(x + 2)(x 1)
Le disequazioni sono utili anche per la risoluzio=
>0
x2 2x
x(x 2)
ne delle equazioni irrazionali, vista nella Sezione 5.3.
Riprendiamo
lesempio
considerato in quella occasio
che si risolve col solito diagramma:

x + 4 x 3 = 1. Affinche una soluzione
ne:
x0 sia accettabile, deve permettere lestrazione di en2
0
1
2
(x + 2)
trambe le radici, cioè deve essere x0 > 4 e x0 > 3,
cioè, in definitiva, x0 > 3. Questa osservazione evita
(x 1)
di dover controllare la soluzione ottenute eseguendo
i calcoli nellequazione di partenza; quindi è proprio
x
un metodo da seguire. Osserviamo che, risolvendo
la precedente equazione,
p eravamo arrivati a unaltra
(x 2)
equazione irrazionale: (x + 4)(x 3) = x. Se fosse
stata questa la nostra equazione di partenza, il metodo dei grafici ci avrebbe mostrato che le soluzioni accettabili devono stare negli intervalli x < 4 e x > 3.
di modo che la soluzione è data dai tre intervalli x < Questa non è la stessa condizione vista in precedenza
2, 0 < x < 1 e x > 2. Naturalmente, il lettore e relativa alla vera equazione di partenza. Lo stuè invitato a controllare questi risultati provando con dente prenda questa osservazione come un ulteriore
qualche valore significativo.
avvertimento a non considerare lequazione, ottenuta
Un problema che si incontra abbastanza spesso, elevando a potenza i due membri, equivalente senzalspecie nella Geometria Analitica, è quello di deter- tro allequazione di partenza. Il Teorema 5.13 è un
minare quando unequazione di secondo grado para- punto troppo importante e non va mai trascurato.
metrica ammette due radici o ne ammette una sola.
In modo analogo, le disequazioni ci permettono di
Unequazione si dice parametrica quando almeno uno trattare in modo sistematico le equazioni (e le dise-
151
5.6. NUMERI COMPLESSI

quazioni) contenenti qualche valore assoluto. Il valore assoluto di una espressione è uguale allespressione stessa, se essa è positiva, ed è uguale allopposto
(cioè allespressione cambiata di segno) se lespressione è negativa. Tutto allora si accomoda e diviene
semplice, se operiamo una separazione delle soluzioni, andando a sostituire al valore assoluto lespressione stessa o il suo opposto. Come spesso succede,
è pi`
u complicato esprimere il procedimento che attuarlo nella pratica. Si consideri pertanto lequazione
|x 2| = x2 ; quando x > 2 si ha |x 2| = x 2 e
quindi lequazione è equivalente a x 2 = x2 . Quando, viceversa, x < 2, si ha |x 2| = (x 2) e quindi
lequazione è equivalente a 2 x = x2 . In questo modo, la soluzione della nostra equazione è ricondotta
alla soluzione dei due sistemi:
x 2 = x2
2 x = x2
e
x > 2
x < 2.
In modo esplicito osserviamo che il caso x = 2 può,
indifferentemente, essere considerato in proprio, essere inserito in uno dei due sistemi (ad esempio, il primo, ponendo x 2) o addirittura in tutti e due. La
cosa pi`
u semplice è quello di vederlo come terzo caso
e notare che non porta ad alcuna soluzione. Il lettore ora verificherà che il primo sistema non presenta
soluzioni, mentre il secondo dà x = 2 e x = 1.
Questo esposto è un caso molto semplice, ma le cose
non cambiano molto quando si debbano affrontare
equazioni, disequazioni o sistemi pi`
u complicati. Una
volta riportato tutto a diversi sistemi (giusto come sè
visto) la difficoltà è scaricata sulle singole equazioni
e/o sulle singole disequazioni. Ci si riconduce cos` a
cose discusse in questa e nelle precedenti sezioni.
Questa visione ottimistica relativa alla soluzione
di equazioni e di disequazioni può andare incontro
a qualche delusione, specie se un problema richiede
soluzioni in numeri interi. Abbiamo già visto le difficoltà relative ai sistemi diofantei, e qui mi piace dare
come esempio uno dei problemi pi`
u belli che io conosca. Fortunatamente, la soluzione non è difficile se la
si imposta in modo razionale.
Due amici matematici, Alberto e Biagio, si incontrano dopo tantissimi anni e si scopre che B. si è
sposato e ha avuto tre figli.
A.: Quanti anni hanno?
B.: Il prodotto delle loro età è 36.
A.: Non mi basta per risolvere il problema,
visto che è un problema quello che mi proponi!
B.: Be, la somma delle loro età è il numero
civico su questo portone.
A.: Mi spiace, ma non è ancora sufficiente.
B.: Hai ragione, ma devi sapere che il pi`
u
grande ha gli occhi azzurri.

A.: Ora s` che mi hai detto tutto!
e gli spiattella le età dei tre figlioli. La domanda ora
si impone: è il lettore in grado di trovare anche lui
queste benedette età?
La soluzione coinvolge soltanto numeri interi e
quindi è facile trovare tutte le terne di numeri
che hanno come prodotto 36; scriviamo, accanto a
ciascuna terna, la somma dei tre numeri:
1
1
1
1
1
2
2
3
+
+
+
+
+
+
+
+
1
2
3
4
6
2
3
3
+
+
+
+
+
+
+
+
36
18
12
9
6
9
6
4
=
=
=
=
=
=
=
=
38
21
16
14
13
13
11
10
Il lettore deve essere convinto che quelle elencate sono tutte e sole le terne possibili; mettendole in modo
che sia a b c si ha un metodo sistematico per generarle. Ora osserviamo che se il numero civico (che
noi non conosciamo, ma che Alberto vede) fosse stato 16, la soluzione avrebbe dovuto essere (1, 3, 12).
Il fatto che Alberto avesse qualche dubbio vuol dire
che la somma corrisponde a pi`
u soluzioni; ma ciò ci
dice che tale somma è 13, il numero civico misterioso. A questo punto, lultima informazione (che esiste
un figlio pi`
u grande) ci permette di escludere la soluzione (1, 6, 6), nella quale ci sono due gemelli pi`
u
grandi, e quindi rispondere (2, 2, 9). Formalmente, il
sistema si scrive:
xyz = 36
x+y+z = k
x > max(y, z)
ma bisogna dire, con buona pace dei matematici formalisti, che questo è di ben poco aiuto alla
soluzione.
5.6
Numeri complessi
Come abbiamo detto, i numeri reali si dividono in

due grandi categorie: i numeri algebrici, che sono i
numeri soluzione delle equazioni algebriche a coefficienti razionali, e i numeri trascendenti, cioè tutti gli
altri. Abbiamo anche visto che i numeri algebrici sono una infinità numerabile, cioè la loro cardinalità è
0 , mentre i numeri trascendenti hanno la cardinalità
del continuo.Consideriamo ora un numero algebrico,
ad esempio 2, e denotiamolo con un simbolo particolare, diciamo . Lequazione algebrica di cui è
soluzione sarà x2 2 = 0, e quindi è caratterizzato
dal fatto che 2 = 2. Prendiamo allora tutti i numeri
152
CAPITOLO 5. ALGEBRA
reali del tipo a

+ b, dove a, b Q. Questo insieme
si denota con Q[ 2] = Q[] e si dice una estensione
algebrica di Q. Il punto interessante è che la somma
(a + b) + (a + b ) = (a + a ) + (b + b ) rimane
nellambito dellinsieme, cioè, come si dice, è chiusa e naturalmente, essendo eseguita su numeri reali,
gode delle varie proprietà di associatività e commutatività. Inoltre, se consideriamo 0 = 0 + 0 uno dei
nostri numeri, esso si comporta da identità e si ha
(a + b) + (a b) = 0, cioè a b è lopposto di
a + b.
Ancora pi`
u notevole è il prodotto:
(a + b) (a + b ) = aa + ab + a b + bb =
= (ab + a b + aa ) + (aa + bb ).
Se poi intervengono radici di equazioni di grado superiore al secondo, occorre considerare anche
le po
tenze intermedie. Ad esempio, se = 4 2, allora
è la soluzione di x4 2 = 0 e quindi le espressioni
da considerare sono del tipo a3 + b2 + c + d. Il
prodotto richiede unelaborazione pi`
u complicata:
(a3 + b2 + c + d)(a 3 + b 2 + c + d ) =
= aa 6 + (ab + a b)5 + (ac + bb + a c)4 +
+(ad + bc + cb + da )3 +
+(bd + cc + db )2 + (cd + dc ) + dd .
= (ab + a b) + (2aa + bb )
Ora occorre osservare che da 4 = 2 discende 5 = 2

e
6 = 22 , per cui, continuando i calcoli, il prodotto
dato che 2 = 2. Quindi, anche il prodotto è unopeviene
a valere:
razione chiusa e, di nuovo, essendo eseguito tra numeri reali, è senzaltro associativo, commutativo e (ad + bc + cb + da )3 + (2aa + bd + cc + db )2 +
distributivo rispetto alla somma. Inoltre, scrivendo
1 = 0+1, si ha (a+b)1 = a+b, cioè 1 fa da iden- +(2ab + 2ba + cd + dc ) + (2ac + 2bb + 2ca + dd ).
tità rispetto al prodotto. Ci possiamo allora chiedere
Questa espressione è alquanto complessa, ma non poi
se esiste un inverso di a+b: la risposta è affermativa.
pi`
u di tanto, e permette anche di calcolare linverSia a + b leventuale inverso di a + b; si deve avere
so
di a3 + b2 + c + d come soluzione di un si(a+b)(a +b ) = (ab +a b)+(2aa +bb ) = 0+1,
stema lineare di quattro equazioni nelle quattro incioè ab + a b = 0 e 2aa + bb = 1. Questo è un sistecognite a , b , c , d : basta uguagliare la precedente
ma lineare di due equazioni nelle due incognite a , b
espressione allidentità 1 = 03 + 02 + 0 + 1.
e, come sappiamo, ha una e una sola soluzione se il
Di conseguenza, da un punto di vista formale, quedeterminante del sistema è diverso da 0; ma:
sti
insiemi di numeri hanno le stesse proprietà di Q
b a
e
di
R, cioè sono dei campi, pi`
u vasti di Q, ma pi`
u
2
2
2a b = b 2a
smilzi di R. Anche R, come sappiamo, non è completo rispetto alla soluzione delle equazioni: non è detto
e questa espressione non può mai essere0, altrimenti che unequazione a coefficienti in R debba per forza
2
avremmo b2 = 2a2 , cioè 2 = b
/a2 o 2 = b/a, ed avere una soluzione reale. Ad esempio, x2 +1 = 0 non
essendo a, b Q sarebbe anche 2 Q. La soluzione ha soluzioni reali perche ogni numero reale elevato al
del sistema dà:
quadrato dà un numero non negativo, e aggiungendogli 1 si ha sempre un numero maggiore di 0. Come
a
b
a = 2
b = 2
,
2
2
prima era la soluzione ipotetica di una equazione
b 2a
b 2a
irriducibile su Q, chiamiamo ora i limmaginaria soe questo permette di trovare linverso di ogni numero luzione della precedente equazione; deve pertanto esdel tipo a + b. Ad esempio, linverso di 2 + 3 si sere i2 + 1 = 0, ovvero i2 = 1. Proprio per questa
trova calcolando:
asserzione, i viene detta lunit`
a immaginaria e su di
2
essa possiamo costruire un nuovo campo R[i], che si
= 2
b = 3;
a =
chiama il campo dei numeri complessi e si indica diso98
lito con C. In analogia a quanto si diceva per Q[ 2],
in effetti, eseguendo il prodotto (2 + 3)(2 + 3) =
gli elementi di C hanno la forma bi + a, che tradizio42 + 6 6 + 9 = 4 2 + 9 = 1.
nalmente si scrive a + bi, e la somma è ovviamente
Questo stesso
procedimento può esser fatto, ad definita da:
esempio, per 5, ma la regola del prodotto diviene:
(a + b)(a + b ) = (ab + a b) + (5aa + bb ).
(a + bi) + (a + b i) = (a + a ) + (b + b )i.
Un po pi`
u complicato può essere considerare la radice Questa volta non conosciamo alcun campo che con dellequazione x2 x 1 = 0; in questo caso è tenga C, e quindi dovremmo verificare che le proprietà associativa e commutativa valgono effettiva2 = + 1 e quindi il prodotto è definito da:
mente. Per la proprietà commutativa, ad esempio,
si ha: (a + bi) + (a + b i) = (a + a ) + (b + b )i =
(a + b)(a + b ) = (ab + a b) + aa 2 + bb =
153
5.6. NUMERI COMPLESSI
(a +a)+(b +b)i = (a +b i)+(a+bi), e questo prova termine immaginario è, a questo proposito, molto
che anche in C possiamo contare su questa proprietà significativo).
della somma. Naturalmente, 0 + 0i è lidentità e si
scrive semplicemente 0; a bi è lopposto di a + bi
3 + 2i
poiche (a + bi) + (a bi) = (a a) + (b b)i = 0.
Per il prodotto abbiamo:
2 + i
2
(a + bi) (a + b i) = aa + ab i + ba i + bb i =
= (aa bb ) + (ab + ba )i
essendo per definizione i2 = 1. Anche qui dovremmo verificare le proprietà commutativa, associativa e
distributiva rispetto alla somma. Per la commutatività abbiamo: (a + bi) (a + b i) = (aa bb ) +
(ab + ba )i = (a + b i) (a + bi), dato che per i numeri reali la proprietà vale. Lasciamo alla pazienza e alla buona volontà del lettore la dimostrazione noiosa (ma che almeno una volta nella vita è bene fare) delle altre due proprietà. Piuttosto, chi è
lidentità rispetto al prodotto? Se (a + b i) indica
questa presunta identità ed a + bi 6= 0, deve essere
(a + bi) (a + b i) = (aa bb ) + (ab + ba )i = a + bi,
cioè aa bb = a e ab +a b = b. Abbiamo qui un sistema lineare di due equazioni nelle due incognite a , b ;
moltiplicando la prima equazione per b e la seconda
per a si ottiene: aba b2 b = ab e aba + a2 b = ab;
sottraendo membro a membro si ha: (a2 + b2 )b = 0.
Ma qui osserviamo che lipotesi a+bi 6= 0 implica che
sia a2 + b2 > 0, poiche a2 + b2 è 0 se e solo se sia a
che b valgono 0. Un prodotto in R, daltra parte, è
0 solo se un fattore è 0 e quindi possiamo concludere
b = 0. Sostituendo questo valore in aa bb = a (se
a 6= 0) e in ab +a b = b (se a = 0 e quindi b 6= 0) si ha
a = 1. Quindi, come ci si poteva aspettare, lidentità
è 1 + 0i, che di regola si scrive semplicemente 1.
In generale, tutti i numeri complessi della forma
a + 0i si scrivono a e si identificano con i numeri reali: il numero complesso 5 + 0i è da intendersi come
il numero reale 5. I numeri della forma 0 + bi si dicono immaginari e si scrivono nella forma abbreviata
bi. I numeri complessi, nel loro insieme, si possono
rappresentare come i punti del piano con le seguenti
convenzioni: assimiliamo il numero complesso a + bi
alla coppia ordinata (a, b) e quindi facciamo corrispondere il numero complesso a un punto del piano
cartesiano. Propriamente, lasse delle x diviene lasse
contenente tutti e soli i numeri reali, e pertanto viene detto lasse reale. Lasse y invece contiene i punti
corrispondenti ai numeri immaginari e si dice perciò
lasse immaginario. Nella Figura 5.3 sono riportati
alcuni punti con i corrispondenti numeri complessi;
il piano cartesiano, cos` modificato e interpretato, si
dice piano dArgand, dal nome del matematico dilettante francese che lha introdotto alla fine del 1700 e
che ha permesso di dare una rappresentazione concreta a un concetto ritenuto completamente astratto (il
1i
1 2i
Figura 5.3: Il piano di Argand
Abbiamo di proposito tralasciato lultimo problema sulla struttura algebrica dei numeri complessi:
dato un numero a + bi 6= 0, qual è il suo inverso? Se,
al solito, a + b i è tale ipotetico inverso, si deve avere
(a + bi) (a + b i) = (aa bb ) + (ab + ba )i = 1 + 0i,
il che equivale al sistema:
aa bb = 1
ba + ab = 0
nelle due incognite a , b . Il determinante di questo
sistema è:
a b
2
2
b a =a +b
che è sempre diverso da 0, nellipotesi che sia a +

bi 6= 0. Allora il sistema ha sempre una e una sola
soluzione:
a =
a
a2 + b2
b =
b
.
a2 + b2
Ad esempio, dato il numero complesso 2 3i, lin2

3
verso è 13
+ 13
i, come è facile verificare eseguendo il
prodotto:

3
4
9
6
6
2
+ i =
+
+
i = 1.
(23i)
13 13
13 13
13 13
Gauss, intorno allanno 1800, riusc` a dimostrare che
ogni equazione algebrica a coefficienti in C ha in C
almeno una soluzione, risultato noto come Teorema
fondamentale dellAlgebra. Tale proprietà che, come
sappiamo, non vale ne in Q ne in R, ci dice che il
campo dei numeri complessi è il campo numerico pi`
u
adeguato nel quale si possano trattare le equazioni
algebriche. Abbiamo esplicitamente visto che da Q
si può passare a campi pi`
u ampi, se si aggiungono
le radici di equazioni che non hanno soluzioni in Q;
la stessa cosa si può fare in R, e proprio con tale
metodo siamo arrivati a C. Qui la cosa non procede
154
CAPITOLO 5. ALGEBRA
oltre, poiche ogni equazione algebrica ha soluzioni in

C stesso.
Se invece di partire dallequazione x2 + 1 = 0 fossimo partiti da unaltra equazione irriducibile, ad esempio x2 + 2x + 3 = 0, avremmo ottenuto un campo leggermente diverso, ma isomorfo a C, cioè con le stesse
proprietà di C. Se j è una radice di x2 + 2x + 3, il
prodotto (a + bj) (a + b j) sarebbe stato:
aa + (ab + a b)j + bb j 2 =
= aa + (ab + a b)j + bb (2j 3) =

= (aa 3bb ) + (ab + ba 2bb )j,
e questi numeri complessi avrebbero comunque
avuto una rappresentazione su un piano analogo a
quello di Argand. Da un altro punto di vista, se applichiamo la formula per la risoluzione delle equazioni
di
p abbiamo = 412
secondo
= 8
e quindi:
grado,
= 8 = (1) 8 = 1 8 = i2 2, e quine j è esprimibile in
di: x = 1 i 2, cio`
C come uno
dei due valori: 1 + i 2 oppure 1 i 2. Scelto ad

esempio il primo valore e posto j = 1 + i 2, si ha:
2
2
i = (j + 1)/ 2 =
+
j,
2
2
il che fa vedere come j ed i siano esprimibili uno in
funzione
Questo naturalmente non succede
dellaltro.
per Q[ 2] e Q[ 3], anche se questi due campi hanno
proprietà formali del tutto simili luno allaltro.
Partendo da un polinomio di grado n, se questo ha
una radice C, dividendo per x si ottiene un
polinomio di grado n 1. Questo, a sua volta, avrà
una radice che permette di ridurre il grado di 1, e
cos` via. Corollario del Teorema di Gauss è che ogni
equazione algebrica di grado n ha in C esattamente n
soluzioni (alcune delle quali, in particolare, possono
essere uguali tra loro).
I due numeri complessi a + bi e a bi si dicono
coniugati; nel piano di Argand sono rappresentati da
punti simmetrici rispetto allasse reale. Elevando al
quadrato si ha:
(a + bi)2 = (a + bi) (a + bi) = (a2 b2 ) + 2abi
2
(a bi) = (a b ) 2abi,
cioè si ottengono ancora due numeri complessi coniugati. Iterando, si ha che coniugate rimangono tutte le
loro potenze. Se z C, il suo coniugato si indica con
z, e quindi possiamo scrivere: z k = (z k ), qualunque
sia k N. Si noti poi che un numero complesso z è
uguale al suo coniugato, z = z, se e solo se z R: infatti, se z = a + 0b, il suo coniugato è a 0b = a = z,
e se a + bi = a bi allora è 2bi = 0, cioè b = 0. Si ha
allora il seguente:
Teorema 5.16 Sia p(x) un polinomio a coefficienti reali; allora, se z C è una radice di p(x), cioè
p(z) = 0, allora anche p(z) = 0.
Prova: Sia p(x) = a0 xn + a1 xn1 + + an1 x + an ,
dove a0 , a1 , . . . , an R. Abbiamo allora a0 z n +
a1 z n1 + + an1 z + an = 0 e prendendo il
coniugato:
a0 z n + a1 z n1 + + an1 z + an = 0 = 0.
Si applicano ora le regole del coniugato viste sopra e
si ha:
a0 z n + a1 z n1 + + an1 z + an = 0.
Ma i coefficienti sono numeri reali e quindi:
a0 z n + a1 z n1 + + an1 z + an = 0
il che prova che z è una soluzione dellequazione
p(x) = 0.
Se p(x) ha come soluzione il numero complesso a +
bi, ha come soluzione anche abi, e quindi è divisibile
per x a bi e per x a + bi; di conseguenza è
divisibile per il loro prodotto: (xabi)(xa+bi) =
(x a)2 (ib)2 = x2 2ax + a2 + b2 . Ma questo è
un polinomio di secondo grado a coefficienti reali, per
cui abbiamo dimostrato il seguente:
Teorema 5.17 Sia p(x) un polinomio a coefficienti
reali; allora esso è scomponibile in fattori di primo e
di secondo grado in R[x].
In altre parole, questo dimostra che i polinomi irriducibili di R[x] sono soltanto i polinomi di primo e
di secondo grado; naturalmente, per ciò che si è visto
sulla risoluzione delle equazioni di secondo grado:
Corollario 5.18 I polinomi irriducibili di R[x] sono
(oltre alle costanti) tutti i polinomi di primo grado e
i polinomi di secondo grado ax2 + bx + c per i quali
si ha: = b2 4ac < 0. Non vi sono in R[x] altri
polinomi irriducibili.
Unaltra conseguenza del teorema è:
Corollario 5.19 Un polinomio p(x) R[x] di grado
dispari ha almeno una soluzione reale.
Questo risultato può essere molto utile nella risoluzione delle equazioni a coefficienti reali, specialmente
quelle di terzo grado. Queste, infatti, trovata la radice reale possono essere ridotte di grado usando
la regola di Ruffini, e tale riduzione porta a unequazione di secondo grado, le cui soluzioni possono
essere reali (se il discriminante 0) o complesse
coniugate per il Teorema 5.16: potranno comunque
essere trovate col Teorema 5.10 oppure col Teorema
5.21 che vedremo nella prossima sezione. Il punto,
allora, è: come si determina la radice reale? Due casi
interessanti sono i seguenti:
5.7. EQUAZIONI DI GRADO SUPERIORE

lequazione è reciproca, cioè della forma ax3 +
bx2 +bx+a = 0 oppure ax3 +bx2 bxa = 0. Nel
primo caso ha la soluzione x = 1, nel secondo
la soluzione x = 1, come si verifica direttamente;
se lequazione ha coefficienti interi e ammette
una radice razionale, questa può essere trovata
col metodo di Eisenstein (Teorema 5.8). Abbiamo proprio visto lesempio 27x3 + 6x 12 =
0.
Considerazioni analoghe valgono per le equazioni
di quinto grado.
5.7
Equazioni di grado superiore
Affrontiamo in questa sezione il problema della risoluzione delle equazioni di grado superiore al secondo.
Alcune situazioni particolari possono essere trattate
agevolmente con metodi ad-hoc:
si dicono biquadratiche le equazioni del tipo ax4 +
bx2 + c = 0. Ponendo y = x2 esse si riducono ad
equazioni di secondo grado che sappiamo
risolvere. Se è una soluzione, si ha x = e quindi
dobbiamo avere 0 se vogliamo soluzioni reali. Ad esempio, lequazione x4 x2 12 = 0 si
trasforma in y 2 y 12 = 0, con le soluzioni
y = 4 ed y = 3; questivalori danno luogo alle
due soluzioni reali x = 4 = 2
e alle soluzioni
complesse immaginarie x = i 3;
155
il giunto cardanico) non scopr` proprio niente e si divertiva pi`
u a fare il medico e il mago che non a fare il
matematico. Il metodo di risoluzione delle equazioni
di terzo grado sembra sia dovuto a Scipione del Ferro,
che in punto di morte lo rivelò a un suo allievo. Le
formule furono pi`
u tardi riscoperte da Niccolò Tartaglia che le rivelò a Cardano. Il metodo di risoluzione
delle equazioni di quarto grado fu scoperto da Ludovico Ferrari, segretario di Cardano, al quale le passò.
Nessuno, invece, nonostante ripetuti e approfonditi
studi, riusc` a trovare formule risolutive per le equazioni di grado superiore. Si cominciò allora a pensare che soluzioni generali per tali equazioni potessero
non esistere. Che questo fosse il caso, fu dimostrato
finalmente da Evariste Galois nel 1832, in una nota
scritta la sera prima di morire in duello, alletà di 21
anni. La forma esatta del risultato di Galois è: per
le equazioni algebriche di grado superiore al quarto
non esistono formule risolutive nelle quali compaiano
solamente le quattro operazioni di base e lestrazione
di radici. Di solito, si abbrevia questa affermazione
dicendo che le equazioni di grado superiore al quarto
non sono risolubili per radicali. Naturalmente, esistono metodi numerici per trovare anche le soluzioni
di queste equazioni, con approssimazioni spinte quanto si vuole: tali metodi verranno accennati in questa
sezione e saranno studiati durante i corsi universitari.
Consideriamo una semplice equazione di secondo
grado, ad esempio x2 + x 6 = 0; sfruttando il fatto che, per il Teorema 5.11, il prodotto delle radici
deve essere 6 e la loro somma 1, vediamo subito che le soluzioni sono x1 = 3 e x2 = 2. Se ora
operiamo una trasformazione della nostra incognita,
ponendo ad esempio x = X + 1, otteniamo una nuova
equazione:
si dicono trinomie le equazioni del tipo ax2k +

bxk +c = 0. Analogamente a quanto fatto prima,
si pone y = xk riportandosi a unequazione di
(X + 1)2 + (X + 1) 6 =
secondo grado; questa volta abbiamo x = k y
se k è pari, e x = k y se k è dispari. Ad esempio,

6
3
= X 2 + 2X + 1 + X + 1 6 = X 2 + 3X 4.
x 7x 8 = 0 si risolve ponendo y = x3 e
trovando
y = 1 e y = 8, quindi Questa nuova equazione ha come radici X = 4
le due soluzioni
x = 3 1 = 1 e x = 3 8 = 2;
e X = 1. Potevamo prevedere facilmente questo
si dicono reciproche le equazioni del tipo axn + risultato, poiche la trasformazione si scrive anche:
bxn1 + cxn2 + + cx2 + bx + a = 0 (I specie) X = x 1 e deve valere anche per la radici, che non
oppure axn +bxn1 +cxn2 + cx2 bxa = 0 sono altro che particolari valori, quelli che rendono
(II specie). Si verifica immediatamente che se vera lequazione. Ma allora si deve avere X1 = x1 1
è una radice, allora anche 1/ è tale. Abbiamo e X2 = x2 1, come infatti si è verificato. Ocvisto il caso n = 3 e per x4 2x3 + 34 x2 2x+1 = corre stare attenti a come opera la trasformazione
0, sostituendo, si vede subito che sia 2, sia 1/2 x = X + : se conosciamo una soluzione x1 dellequazione di partenza, la soluzione dellequazione trasono soluzioni.
sformata è X1 = x1 ; ma se conosciamo X1 , si ha
ovviamente:
x1 = X + .
Durante il 1500, alcuni matematici italiani scoprirono formule e algoritmi per la risoluzione delle equaLe trasformazioni di questo tipo, dette trasformazioni algebriche di terzo e di quarto grado. Il tutto zioni lineari sono necessarie in Geometria Analitica
è riportato nel libro Ars Magna di Gerolamo Car- quando si voglia cambiare sistema di riferimento. In
dano del 1545. Tuttavia, Cardano (al quale si deve Algebra sono utili se semplificano la risoluzione di
156
una equazione. Ad esempio, se riuscissimo ad eseguire una trasformazione che annulla il termine noto,
almeno una soluzione sarebbe X0 = 0, e quindi, se abbiamo operato la trasformazione x = X + , sapremmo immediatamente che una soluzione dellequazione
di partenza era x0 = X0 + = . Per la regola di
Ruffini, ciò consentirebbe di abbassare di grado lequazione di partenza, e quindi semplificare il nostro
problema. Purtroppo la cosa non è banale, ma esiste una semplice trasformazione che ci permetterà di
dare una seconda prova della formula risolutiva delle
equazioni di secondo grado e, soprattutto, ci consentirà di risolvere le equazioni di terzo e di quarto grado.
Formuliamo e dimostriamo allora:
CAPITOLO 5. ALGEBRA
Operiamo ora la trasformazione del lemma 5.20 con
n = 2 e ponendo x = X b/(2a):
b
X
2a
b
+
a
b
c
b2 4ac
X
+ = X2
= 0.
2a
a
4a2
Questo significa:
X2 =
b2 4ac
.
4a2
Il denominatore 4a2 è sempre positivo, per cui se b2

4ac > 0 si hanno le due soluzioni:
b2 4ac
X=
2a
Lemma 5.20 Data lequazione xn +bxn1 +cxn2 +

+ d = 0, la trasformazione x = X b/n annulla il da cui discende la formula operando la trasformazione
coefficiente del termine di grado n 1 e lequazione x = X b/(2a). In modo analogo si procede quando
diviene X n + c X n2 + + d = 0.
= 0, mentre se < 0 le soluzioni per X sono
due valori immaginari opposti; la trasformazione li
Prova: Supporre che il coefficiente di xn sia 1 non
cambia allora in due numeri complessi coniugati:
è restrittivo, perche se fosse a 6= 0 e a 6= 1 potremp
mo dividere tutta lequazione per a. Eseguendo la
|b2 4ac|
b
x= i
trasformazione e applicando la regola del binomio di
2a
2a
Newton, il membro sinistro diviene:
come si voleva.
n
n1
n2
b
b
b
X
+b X
+c X
++d =
Vediamo allora come si risolvono le equazioni di
n
n
n
terzo grado. Usando il teorema sulle trasformazioni,
facciamo scomparire il termine in x2 , per cui possiab n1 n(n 1) b2 n2
n1
n
+
X
+ + bX
+ mo senzaltro considerare unequazione della forma
= X n X
n
2
n2
x3 = px + q; questa si dice lequazione ridotta delb n2
n2
lequazione originale. Cerchiamo ora le soluzioni del
+b(n 1) X
+ + cX
+ + d =
n
tipo x = u + v, dove u e v sono due quantità incon2
n2
n n 1 2 n2 n 1
gnite.
Questo sembra complicare le cose, ma facendo
b X
+
bX
+cX
+ +d.
=X +
2n
n
i conti e applicando la regola del binomio di Newton
Questa espressione ci dà anche il valore di c , e ci per la terza potenza, abbiamo:
potrebbe dare il valore di tutti gli altri coefficienti,
u3 + 3u2 v + 3uv 2 + v 3 = p(u + v) + q
ma questo non è importante come il fatto che sia
n1
sparito il termine in X
.
u3 + v 3 + (3uv p)(u + v) = q.
Vediamo allora come questo lemma ci permetta di
dare una dimostrazione alternativa della formula per Qui ora possiamo sfruttare il fatto che u e v sono numeri qualsiasi e li possiamo scegliere con una qualche
la risoluzione delle equazioni di secondo grado:
libertà; ad esempio, possiamo far s` che il termine con
Teorema 5.21 Sia ax2 + bx + c = 0 una qualunque (u + v) scompaia, e per far ciò basta che sia 3uv = p.
equazione di secondo grado in forma canonica. Le Allora (u + v) è una soluzione della nostra equazione
sue soluzioni sono:
se abbiamo contemporaneamente:
2
2
b + b 4ac
b b 4ac
uv = p/3
x1 =
x2 =
.
2a
2a
u3 + v 3 = q.
se > 0 sono distinte. Se = 0 si ha la soluzione
Ricavando u dalla prima equazione e sostituendolo
x0 = b/(2a) con molteplicit`
a 2, mentre se < 0
nella seconda si trova:
lequazione ha due soluzioni complesse coniugate.
p3
Prova: Dividendo lequazione per a, essa diventa:
=q
u3 +
27u3
c
b
x2 + x + = 0.
27u6 27qu3 + p3 = 0.
a
a
5.7. EQUAZIONI DI GRADO SUPERIORE

Sostituiamo ora U ad u3 ; si ha una semplice
equazione di secondo grado:
157
distanti, y1 e y2 , possiamo immaginare, almeno in linea teorica, di trovare due valori di x, diciamo x1 e
x
2 , tali che y1 = p(x1 ) e y2 = p(x2 ), e questi valori
27U 2 27qU + p3 = 0
di x saranno vicini tra di loro. Possiamo disegnare il
grafico della funzione y = p(x) su un foglio di carta
che sappiamo risolvere. Questa equazione si dice la
millimetrata, considerando diversi valori di x, diciarisolvente dellequazione di terzo grado, e ci dà:
mo x1 , x2 , . . . , xn , e calcolando i corrispondenti valori
r
p
della y, cioè y1 = p(x1 ), y2 = p(x2 ), . . . , yn = p(xn ).
q
p3
q2
27q 729q 2 108p3
=
.
U=
Lavorando con valori discreti x1 , x2 , . . . , xn , il grafico
54
2
4
27
sarà costituito da punti, ma losservazione precedenNaturalmente, se avessimo ricavato u dalla 3uv = te ci fa intuire che possiamo unire i punti ottenuti
p, avremmo ottenuto esattamente la stessa soluzio- cos` da rappresentare, in modo continuo, tutti i valori
ne, per cui possiamo arbitrariamente associare ad u3 di y corrispondenti ai valori di x, almeno nellinterla soluzione con il segno positivo e a v 3 quella con vallo finito che la carta millimetrata ci permette di
il segno negativo. Dalla x = u + v abbiamo infine tabulare.
la sospirata soluzione dellequazione ridotta di terzo
Le radici dellequazione corrispondono ai valori delgrado:
la x per cui si ha p(x) = 0, cioè ai punti in cui la curva
s
s
attraversa la base delle nostre computazioni, cioè la
r
r
3
2
3 q
3 q
p
p3
q
q2
linea y = 0; nella figura questi punti sono compresi in
+
.
x=
2
4
27
2
4
27
due intervalli, il primo che va da 2 a 1, il secondo
che va da 0 ad 1. Questo significa che se a sinistra
Ora, facendo allindietro la trasformazione che ci ha di una radice il valore di p(x) è positivo, a destra deportato alla forma ridotta, si trova la soluzione del- ve essere negativo, e viceversa. Tale osservazione ci
lequazione originale, cioè dellequazione generale di permette di fare unasserzione fondamentale: se per
terzo grado, da cui siamo partiti.
due valori x1 e x2 con x1 < x2 si ha che p(x1 ) e p(x2 )
Come abbiamo detto, esistono formule risolutive hanno segni opposti, allora deve esistere almeno una
anche per le equazioni di quarto grado, ma non in- radice compresa tra x ed x . Naturalmente, fra x e
1
2
1
tendiamo addentrarci ulteriormente in questa giungla x ce ne potrebbero essere anche 3 o 5 o pi`
u, ma que2
di formule. In effetti, il problema della ricerca delle sto non muta il senso dellosservazione. Si badi bene
soluzioni di unequazione algebrica, se affrontato op- che dallosservazione NON discende che se p(x ) e
1
portunamente, non è poi complicato come sembra, p(x ) hanno lo stesso segno, allora non esiste alcu2
purche si abbandoni lidea di trovare una formula na radice compresa tra x e x : basta ricordarsi del
1
2
che esprima tali soluzioni. Può anche essere diverten- valore della contropositiva e della contraria di una
te programmare su un elaboratore il metodo che ora proposizione. Nellesempio, p(2) = p(1) = 1, ma
andiamo a descrivere; esso non è certamente il meto- fra 2 e 1 vi sono ben due radici (comunque, in quedo migliore che si conosca, ma certo è il pi`
u elemen- sta situazione, le radici possono solo essere in numero
tare e diretto. Per chi non sa usare la programmazio- pari: 0, 2, 4, etc.).
ne, sarà utile fare un po di conti a mano, aiutati da
Una volta, il primo passo per trovare le radici conun calcolatore tascabile; anzi, anche chi vuol tentare
sisteva
proprio nel disegnare il grafico di p(x) e deterdi automatizzare il metodo, è bene che cominci con
minare
gli intervalli di separazione delle varie radici,
qualche elaborazione manuale, per cercare di capire
cio`
e
gli
intervalli [x1 ..x2 ] che isolano ciascuna radice.
fino in fondo cosa si sta facendo.
Questo
procedimento non può essere portato avanti
Prima di tutto, prendiamo il polinomio che deterdallelaboratore,
ma lo si può simulare in vari modi.
mina lequazione e usiamolo come formula, cioè come
Ad
esempio,
si
pu`
o valutare p(x) per valori interi di
espressione che, dato un valore specifico della variabix
o
per
valori
che
siano potenze di 2, restringendo
le x, permette di calcolare il valore y del polinomio nel
2
poi
tali
intervalli
se
nulla si è riusciti a trovare. Nel
punto x. Ad esempio, dallequazione x + x 1 = 0,
2
caso
che
il
polinomio
p(x) abbia grado dispari, un inconsideriamo lespressione y = x + x 2 che, posto
2
tervallo
di
separazione
si trova sempre; infatti, per
x = 1, ci dà il valore y = 1 + 1 1 = 1, e posto
2
valori
molto
grandi
in
valore
assoluto, ma positivi e
invece x = 2 ci dà y = 2 + 2 1 = 5. E questa la
negativi,
p(x)
deve
assumere
per forza valori di senotazione funzionale y = p(x); x si dice la variabile
gno
diverso.
Il
caso
del
grado
pari è pi`
u complesso e
indipendente ed y la variabile dipendente. E bene
una
tale
equazione
potrebbe
anche
non
avere alcuna
osservare che se prendiamo due valori vicini tra di
2
radice
reale,
come
succede
a
x
+
1
=
0.
loro, ad esempio x1 = 1 e x2 = 1.01, i corrisponSupponiamo allora di essere riusciti a trovare un
denti valori della y sono ancora vicini tra di loro. E
viceversa, se partiamo da due valori di y non molto intervallo [x1 ..x2 ] che separi (almeno) una radice; per
158
CAPITOLO 5. ALGEBRA
4
3
2
1
-3
-2
-1 0
Figura 5.4: La parabola y = x2 + x 1

fissare le idee, immaginiamo che sia p(x1 ) < 0 e
p(x2 ) > 0. Consideriamo ora il punto di mezzo di
tale intervallo, x3 = (x1 + x2 )/2 e calcoliamo p(x3 );
se esso è positivo, allora losservazione di partenza ci
dice che una radice deve essere compresa nellintervallo [x1 ..x3 ], se invece è negativo, la radice sarà in
[x3 ..x2 ]. Qualunque sia lintervallo, possiamo iterare
il procedimento e restringerci ad intervalli sempre pi`
u
piccoli. Se siamo partiti con [x1 ..x2 ] ed x2 = x1 + 1
(come spesso accade), allora x1 è unapprossimazione
per difetto della soluzione, e x2 ne è unapprossimazione per eccesso. Dimezzando lintervallo ad ogni
iterazione, occorrono dieci iterazioni per avere un intervallo di circa 1/1000, cioè per aver trovato tre cifre
decimali della soluzione. Naturalmente il calcolatore
può eseguire tante iterazioni quante se ne vogliono in
tempi del tutto trascurabili. Ad esempio, cinquanta
iterazioni corrispondono ad un intervallo di lunghezza 250 1015 , il che vuol dire avere circa quindici
cifre decimali esatte.
tradizionale, si trova essere ( 5 1)/2 0.618034.

Facendo i conti a mano, può essere preferibile (pi`
u
per ragioni psicologiche che altro) determinare una
cifra decimale dopo laltra. Riprendendo lesempio
precedente, scoperto lintervallo di separazione [0..1],
sappiamo che la soluzione avrà la forma 0.d1 d2 d3 . . .
e possiamo scoprire d1 calcolando il polinomio nei
punti 0.1, 0.2, 0.3, . . . , 0.9. In particolare, si trova
p(0.6) = 0.04 e p(0.7) = 0.19, il che restringe lintervallo a [0.6..0.7]. Si continua, calcolando
p(x) nei punti 0.61, 0.62, . . . , 0.69, per i quali si ha
p(0.61) = 0.0179 e p(0.62) = 0.0044. Si è cos` ottenuto lintervallo [0.61..0.62] che già ci fa intravedere
il risultato finale.
Questa tecnica decimale è probabilmente un po
pi`
u intuitiva, ma richiede un numero maggiore di operazioni per arrivare alla stessa precisione della precedente. Si osservi infatti che per avere la precisione
di un centesimo abbiamo calcolato p(x) in nove punti
diversi, cioè da 0.1 a 0.7 e poi 0.61 e 0.62. Col metodo
binario, 9 operazioni permettono di ridurre lintervallo a 1/512, cioè a un intervallo pi`
u piccolo di oltre 5
volte. Con un po di esperienza, si può ottimizzare il metodo; ad esempio, poiche p(0.61) = 0.0179
e p(0.62) = 0.0044, cos` che lapprossimazione a 0 è
migliore per 0.62, è probabile che il decimale successivo sia superiore a 5. Allora, invece di cominciare i
calcoli da 0.611 si può cominciare direttamente con
0.615, e questo porta un bel risparmio. A ben guardare, però, questo accorgimento è un modo diverso
per introdurre dalla finestra il criterio binario che
avevamo appena scacciato dalla porta.
Il lettore si sarà accorto che abbiamo già utilizzato questa tecnica in varie occasioni, in particolare nella Sezione 3.6 Potenze, radici, logaritmi; in
realtà, esso rappresenta un metodo molto generale.
In situazioni particolari può essere migliorato, come
mostra, nella stessa sezione, il metodo iterativo per
calcolare la radice quadrata. Ciò, tuttavia, non fa
perdere di interesse al metodo. Nei corsi di Calcolo Numerico, allUniversità, si studierà il metodo di
Newton, o di Newton-Raphson, che funziona assai
meglio. Qualche volta anche noi, un po surrettiziamente, abbiamo avuto modo (e ne avremo ancora) di
citare e di applicare tale metodo. Tornando alla tecnica esposta sopra, il lettore può inventarsi le proprie
equazioni e cercare di trovarne le soluzioni reali; questo sarà un buon esercizio per capire i passi descritti,
scrivere poi un opportuno algoritmo e portarlo infine
sullelaboratore.
Come esempio (v. Figura 5.4), riprendiamo la precedente equazione e supponiamo di essere riusciti a
determinare lintervallo [0..1], cioè x1 = 0 e x2 = 1;
corrispondentemente, si ha p(x1 ) = 1 e p(x2 ) = 2.
Calcolando il valore del polinomio per x3 = 1/2, si
trova p(x3 ) = 1/4, e perciò la radice si deve trovare tra 1/2 ed 1. La divisione successiva ci porta
a x4 = 3/4 e si calcola p(3/4) = 0.3125; il nuovo intervallo è [1/2..3/4]. Il passo ulteriore ci dà
x5 = 5/8 e p(5/8) = 0.015; lintervallo si riduce
a [1/2..5/8]. Il nuovo passo permette di calcolare
x6 = 9/16 e p(9/16) = 0.12, cos` che lintervallo
è [9/16..5/8] = [0.5625..0.625]. A questo punto il lettore può andare avanti per conto proprio, considerando gli intervalli che man mano ottiene e i cui estremi 5.8
Algebra astratta
costituiscono unapprossimazione per difetto e per eccesso della soluzione. Per controllo, tali estremi van- Abbiamo visto come la parola algebra derivi dalno confrontati con la soluzione esatta che, col metodo larabo, nel quale sembra indicasse il trasferimento di
5.8. ALGEBRA ASTRATTA

un termine da un membro allaltro di una equazione. Pur cos` specifico, il termine era consono ad una
disciplina incentrata sulla soluzione dei problemi per
mezzo della manipolazione delle espressioni, in questo caso delle equazioni. Con Viète, lAlgebra venne
ad inglobare tutte le manipolazioni formali di simboli, e quindi si contrappose alla Geometria, dominata
dal concetto di figura, e successivamente allAnalisi,
cioè allo studio analitico delle funzioni. Lo studio delle equazioni impose, nella prima metà dellOttocento
e, in modo pi`
u marcato, nella seconda, lintroduzione di strutture formali atte a comprendere il comportamento delle soluzioni di una data equazione o
di unintera classe di equazioni. Lesempio pi`
u eclatante è costituito dalla permutazioni e dal loro uso,
come struttura di gruppo, nella dimostrazione della
non risolubilità per radicali delle equazioni algebriche di grado superiore al quarto. Ad un certo punto,
queste strutture hanno, per cos` dire, preso la mano agli algebristi, e le loro proprietà si sono rivelate
importanti di per se e nei confronti di altri settori
della Matematica. Cos` si cominciarono a studiare le
strutture algebriche (cioè insiemi muniti di operazioni) in modo indipendente da qualsiasi connessione numerica, come era invece implicito nellidea di
risoluzione delle equazioni. Questo studio è stato
pertanto detto Algebra astratta ed oggi è diventato uno dei settori fondamentali della Matematica,
dal quale nessun matematico può prescindere. Daltra parte, i successi ottenuti dallAlgebra astratta in
tanti campi applicativi, dalla cristallografia alla fisica atomica e subatomica, alla biologia, hanno fatto
s` che alcuni suoi concetti siano diventati patrimonio
comune di tutta la scienza.
Alla base dellAlgebra astratta, sta, come abbiamo detto, il concetto di struttura algebrica; si intende
con questa espressione un insieme S, detto il sostegno della struttura, munito di una o pi`
u operazioni
(si veda il primo Capitolo), caratterizzate da alcune
proprietà formali, come la chiusura, lassociatività o
la commutatività.
Come abbiamo visto nella Sezione ??, la struttura
algebrica pi`
u semplice è il monoide, ma certamente quella pi`
u importante è il gruppo. Abbiamo già
incontrato vari esempi di gruppo, ma rivediamo qui
le situazioni pi`
u caratteristiche. I numeri interi con
loperazione di somma, cioè (Z, +), è un gruppo nel
quale e = 0 e linverso di x è x; in questo caso si
preferisce parlare di opposto, piuttosto che di inverso,
ma il concetto è quello. Linsieme dei numeri razionali positivi con loperazione di moltiplicazione, cioè
(Q+ , ), nel quale lidentità è 1 e linverso di x è x1 ,
cioè proprio linverso in senso tradizionale. Questi sono due esempi di gruppi commutativi o abeliani, visto
che vale anche la proprietà commutativa. Questa non
159
vale invece per le permutazioni Pn su {1, 2, . . . , n} con
loperazione di composizione, cioè (Pn , ), come si è
visto nel Capitolo 4. Storicamente, questo è stato il
primo esempio di gruppo finito e non commutativo, e
fu introdotto da Ruffini e da Abel nei loro studi sulla
non risolubilità per radicali delle equazioni di grado
superiore al quarto. Le rotazioni intorno a un punto e le traslazioni del piano costituiscono un gruppo
quando si consideri loperazione di composizione, cioè
loperazione che esegue una trasformazione dopo laltra. E interessante prendere una figura e un punto
sul piano della figura, e considerare poi le rotazioni
che trasformano a figura in se stessa: si provi con un
quadrato, un rettangolo o un poligono regolare e il
relativo centro. Questo ci fa capire perche il centro
si chiama in questo modo.
Nel Capitolo 2 sullAritmetica abbiamo trovato altri esempi di gruppo finito: linsieme Zm dei numeri {0, 1, . . . , m 1} con loperazione x y = x + y
(mod m), e linsieme Zm , dei numeri minori di m e
primi con m con loperazione xy = xy (mod m).
Le proprietà là messe in evidenza non servivano ad
altro se non a dimostrare le proprietà di gruppo di tali strutture. Ritorneremo tra breve su questi esempi,
quando parleremo di gruppi finiti.
Noi non possiamo addentrarci nella meravigliosa
teoria dei gruppi, ma val la pena di dimostrare un
risultato astratto di notevole interesse. Un sottoinsieme H di un gruppo G si dice un sottogruppo di
G se è esso stesso un gruppo con loperazione definita in G. Questo modo di esprimersi è formalmente
scorretto e dovremmo dire: se H è un sottoinsieme
del sostegno di un gruppo (G, ) e . . .; naturalmente,
si preferisce la forma pi`
u snella. Un semplice esempio di sottogruppo di (Z, +) è dato dai numeri pari,
cioè {. . . , 4, 2, 0, 2, 4, . . .}, che costituisce un sottogruppo di (Z, +). I numeri pari sono i multipli di
2; si vede facilmente che linsieme dei multipli di k
(k fissato, multipli positivi e negativi) sono un sottogruppo di (Z, +). Se prendiamo una permutazione
Pn e tutte le permutazioni che da essa si ottengono eseguendo i prodotti 2 = , 3 = 2 ,
etc., vediamo subito che esse sono un sottogruppo di
(Pn , ). Sia infatti P = {, 2 , 3 , . . .} e osserviamo
prima di tutto che esso è finito; infatti P Pn per la
chiusura della composizione, e quindi card(P ) n!.
Sia ora r la prima potenza che si ripete; necessariamente, deve essere r = , poiche se cos` non fosse
avremmo r = s , con s 1. Ma se 1 è linverso
di avremmo 1 r = 1 s , cioè r1 = s1 ,
contro lipotesi che r fosse la prima potenza a ripetersi. Se allora r = , componendo ancora con
1 si ha r1 = I, lidentità, che pertanto appartiene a P . Finalmente, se i , j P , anche il loro prodotto i j = i+j sta in P ; in particola-
160
CAPITOLO 5. ALGEBRA
re, dato i , la potenza ri1 è tale che il prodotto

i ri1 = r1 = I, cioè i e ri1 sono linverso luna dellaltra. Ciò significa che (P , ) è un
sottogruppo di (Pn , ). Esso si dice il (sotto)gruppo
ciclico generato da e si indica con hgi. In P4 il sottogruppo ciclico generato da = (1234) è costituito
dalle permutazioni:
g2 H, diciamo g2 h e mostriamo che esso sta anche in

g1 H. Usando la precedente espressione per g2 si ha:
hki = { , 2k, k, 0, k, 2k, }.
x(m) = xkr = (xr )k = 1k = 1,
g2 h = g1 h1 h1
2 h g1 H
in quanto h1 h1
a di chiusura
2 h H per la propriet`
in H. Naturalmente, in modo del tutto analogo, si
dimostra che ogni elemento di g1 H sta anche in g2 H
e quindi g1 H = g2 H come si voleva. Di conseguenza,
2
3
4
= (1234), = (13)(24), = (1432), = I.
gli insiemi gH determinano, al variare di g, una partiConvenzionalmente, si pone 0 = I e quindi r1 = zione di G (a g diversi, si noti, possono corrispondere
0 = I. In generale, il minimo numero k per il qua- gH uguali), ogni parte composta dallo stesso numero
le un elemento g G dia g k = e, si dice periodo di elementi, cioè proprio m. Se le parti sono k, di
deve perciò avere n = mk.
dellelemento g. Il periodo di è pertanto r 1.
Se il gruppo G è infinito, può contenere sottogruppi
Il caso precedente di P , che ha 4 elementi, è un
finiti o infiniti; ad esempio, (Q+
0 , ) contiene il sotto- esempio di questo risultato. In generale, possiamo
gruppo finito {1, 1} e il sottogruppo infinito com- enunciare il seguente:
posto da tutte le potenze (positive e negative) del
numero 5: {. . . , 52 , 51 , 50 = 1, 5, 52 , . . .}. Questo Corollario 5.23 Se (G, ) è un gruppo finito e g
è, in effetti, il sottogruppo ciclico h5i; nel caso in- G, il periodo di g è un divisore di card(G).
finito, il sottogruppo ciclico deve contenere tanto le Prova: Il periodo di g coincide, per quanto detto,
potenze positive quanto quelle negative del suo gene- con il numero di elementi del sottogruppo generato
ratore. Un gruppo (G, ) si dice ciclico se esiste un da g, e questo è un divisore di card(G).
elemento g G che genera tutto il gruppo. Ad esemUn esempio importante di questo corollario è dato
pio, (Z, +) è generato dal numero 1; si osservi che in
dai
gruppi (Zm , ), la moltiplicazione intesa modulo
questo caso, essendo la somma loperazione del grup(m) elementi e quindi
po, le potenze sono in realtà i multipli. Il lettore è m. Tali gruppi contengono
invitato a dimostrare che i sottogruppi di un gruppo ogni elemento x Zm ha come periodo un numero
ciclico sono anchessi ciclici. Nellesempio di (Z, +) si che divide (m) (diciamo r); si ha pertanto kr =
(m), per qualche intero k. Ma allora:
ha:
Una delle pi`
u interessanti proprietà dei gruppi finiti
un risultato che abbiamo sfruttato parlando dei
è data dal seguente:
metodi di ciframento a chiave pubblica.
I gruppi sono probabilmente la struttura algebrica
Teorema 5.22 (di Lagrange) Se (G, ) è un gruppi`
u
importante, e sono stati studiati in modo molto
po finito ed H è un sottogruppo di G, allora il numeapprofondito.
Inoltre, sul concetto di gruppo si basaro degli elementi di H è un divisore del numero degli
no
altre
strutture
algebriche che si avvicinano magelementi di G.
giormente alle strutture numeriche pi`
u familiari. PriProva: Sia n = card(G) ed m = card(H); sia g G ma di tutto, definiamo cosa si intende per anello;
e consideriamo linsieme gH composto da tutti i pro- si parte da un insieme A e si suppone che in A siano
dotti di g per gli elementi di H; esiste allora una definite due operazioni, indicate convenzionalmente
corrispondenza biunivoca tra H e gH data dalla fun- con + (laddizione) e con (la moltiplicazione),
zione h gh, h H. In effetti, essa è surget- questultima scritta spesso con la semplice giustappotiva per definizione e se non fosse iniettiva dovrem- sizione. La struttura algebrica (A, +, ) si dice anello
mo avere due elementi distinti h1 , h2 H tali che se (A, +) è un gruppo commutativo, (A, ) è un mogh1 = gh2 ; se cos` fosse, moltiplichiamo per g 1 ot- noide commutativo e vale la proprietà distributiva del
tenendo g 1 gh1 = g 1 gh2 , cioè eh1 = eh2 e h1 = h2 , prodotto rispetto alla somma, cioè: x, y A si ha
u importante
contro lipotesi. Daltra parte, se g1 , g2 sono due ele- x (y + z) = x y + x z. Lesempio pi`
menti di G, gli insiemi g1 H e g2 H o coincidono op- di anello è sicuramente (Z, +, ), con le usuali operapure sono disgiunti. Supponiamo infatti che g1 H e zioni di somma e prodotto, ma sono anelli anche gli
g2 H non siano disgiunti; hanno allora almeno un ele- altri insiemi numerici (Q, +, ), (R, +, ), (C, +, ). Si
mento in comune, diciamo g1 h1 = g2 h2 (notare che tratta però di casi un po particolari, e per questo ne
u avanti. Altri anelli importanti sono
h1 e h2 possono benissimo essere distinti). Ma questo riparleremo pi`
significa g2 = g1 h1 h1
2 , ottenuto moltiplicando i due costituiti dai polinomi, con le operazioni che conomembri per h1
2 . Prendiamo ora un altro elemento di sciamo; essi si indicano con (Z[x], +, ), (Q[x], +, ),
161
5.8. ALGEBRA ASTRATTA

+
0
1
2
3
4
5
0
0
1
2
3
4
5
1
1
2
3
4
5
0
2
2
3
4
5
0
1
3
3
4
5
0
1
2
4
4
5
0
1
2
3
5
5
0
1
2
3
4
0
1
2
3
4
5
0
0
0
0
0
0
0
1
0
1
2
3
4
5
2
0
2
4
0
2
4
3
0
3
0
3
0
3
4
0
4
2
0
4
2
5
0
5
4
3
2
1
Tabella 5.2: Somma e prodotto in Z6

e cos` via. Unaltra classe importante di anelli e data dagli (Zm , +, ), dove, questa volta, la somma e il
prodotto vanno intesi modulo m; poiche questi anelli sono finiti, le operazioni possono essere riassunte
in due tabelline; riportiamo nella Tabella 5.2 il caso
di (Z6 , +, ) e il lettore è invitato a scrivere almeno
quelle relative ad m = 5.
Un caso particolare di anello è il seguente; sia U un
insieme e sia P = P(U ) linsieme delle sue parti, cioè
dei suoi sottoinsiemi. In P si consideri loperazione
di differenza simmetrica AB = (A B) \ (A B) =
(A \ B) (B \ A) (v. Capitolo 1); tale operazione è chiusa e associativa, come il lettore vorrà verificare con i diagrammi di Venn. Si ha inoltre:
A = A = A, qualunque sia A P, e questo
ci dice che è lidentità rispetto a . Si ha anche
AA = ed AB = BA, per cui (P, ) è un
gruppo commutativo. Consideriamo ora loperazione
di intersezione in P; rispetto a tale operazione P è
un monoide e si ha:
A (BC) = (A B)(A C),
(qualunque esso sia), si ottiene 0 = x 0. In modo

analogo si prova 0 = 0 x. Un elemento di A può avere o può non avere un inverso rispetto al prodotto; in
(Z6 , +, ) gli elementi 1 e 5 hanno un inverso, come
si vede dalla Tabella 5.2, mentre non lo hanno 2, 3
e 4. Gli elementi muniti di inverso si dicono unit`
a
dellanello; lo 0 non può essere ununità poiche, come abbiamo appena visto, 0 x dà sempre 0, mentre
se x fosse linverso di 0 si dovrebbe avere 0 x = 1.
Daltra parte, 1 è per definizione una unità, e questo
ci fa capire che, in un anello, lo 0 e l1 non possono mai coincidere (eccetto nellanello banale, quello
composto dal solo elemento 0: riflettere un attimo).
Un elemento che, come 2, 3, 4 in Z6 , dà come prodotto 0 anche quando sia moltiplicato per un numero
diverso da 0, si dice un divisore dello zero: poiche lo
0 non può avere un inverso rispetto alla moltiplicazione, cos` non lo possono avere nemmeno i divisori
dello zero; pertanto, la presenze in un anello di divisori dello zero fa s` che certe semplificazioni, legate a
moltiplicare per linverso di un elemento (come siamo
abituati), non si possano fare. Ha allora importanza
il concetto di dominio di integrit`
a, col quale termine
si indica un anello privo di divisori dello zero. Ancora (Z, +, ), (Z[x], +, ), (R[x], +, ) sono domini di
integrità nei quali non tutti gli elementi diversi da 0
sono unità. Ad esempio, in Z solo 1 e 1 sono unità,
mentre in R[x] sono unità tutte le costanti diverse da
0, cioè, in pratica, R \ {0}. Vediamo allora dove si
manifesta limportanza dei domini di integrità.
Si dice campo o corpo ogni anello nel quale tutti gli
elementi, tranne lo 0, sono unità, cioè ogni elemento
diverso da 0 possiede un inverso (rispetto alla moltiplicazione). Sono campi infiniti (Q, +, ), (R, +, ),
(C, +, ), ma esistono anche molti campi finiti; tutti
gli (Zp , +, ) (somma e prodotto modulo p), con p numero primo sono campi. Infatti, Zp \ {0} = Zp , che
come sappiamo è un gruppo rispetto alla moltiplicazione, il che vuol proprio dire che ogni elemento non
nullo ha un inverso. Il pi`
u importante di questi campi è Z2 = {0, 1} (toh! chi si incontra di nuovo!), che
oltre ad essere un campo è anche un anello Booleano.
Col significato 1 =vero e 0 =falso lo abbiamo già
visto in azione nel calcolo delle proposizioni e dei predicati. I campi sono la struttura algebrica che compendia le proprietà degli insiemi numerici pi`
u ampi, e
cioè Q, R, C; da qui la loro fondamentale importanza.
Certi campi si costruiscono a partire dai domini di
integrità, che perciò costituiscono dei quasi-campi:
ancora da verificare con i diagrammi di Venn. La

conclusione è che (P, , ) è un anello, detto anello
Booleano. Il lettore è invitato a consultare le Tabelle 1.1, 1.3, 2.5 e la fine della Sezione 2.7 sul Massimo Comun Divisore per trovare altri esempi di anelli
Booleani.
Quando si parla di anelli, lidentità rispetto alla
somma si indica con 0 e quella relativa al prodotto
con 1. Formalmente, si ha x 0 = 0 x = 0, qualunque
Teorema 5.24 Sia D un dominio di integrit`
a e sia
sia lelemento x A; infatti:
D linsieme delle coppie di elementi di D il cui secondo elemento non sia 0. La relazione (x, y) (x , y )
x 0 = x (0 + 0) = x 0 + x 0,
valida se e solo se xy = x y, è una relazione di equidove si sono sfruttate le proprietà dellanello; som- valenza su D. Sia allora [x, y] la classe di equivalenza
mando ora ai due membri estremi lopposto di x 0 di (x, y) ed F linsieme di tali classi di equivalenza;
162
CAPITOLO 5. ALGEBRA
se definiamo su F le operazioni:
[x, y] + [x , y ]
[x, y] [x , y ]
=
=
[xy + x y, yy ]
[xx , yy ]
allora tali operazioni sono indipendenti dagli elementi presi a rappresentare le classi ed (F, +, ) è un
campo.
Prova: La prova di questo teorema, in realtà, è
già stata fatta quando abbiamo costruito il campo
(Q, +, ) a partire dal dominio di integrità (Z, +, ) e
il lettore potrà ripetere i passi là effettuati astraendo dal caso numerico e concentrandosi sulle sole
proprietà formali definite in D, D ed F.
Partendo da (Z[x], +, ) e da (R[x], +, ) si costruiscono i due campi delle funzioni razionali fratte su Z e
su R, che si indicano rispettivamente con (Z(x), +, )
e (R(x), +, ). Nella sezione sui numeri complessi abbiamo visto un altro metodo per costruire un tipo
diverso di campi, il pi`
u importante dei quali è certamente il campo dei numeri complessi. Esso consiste nellaggiungere uno (o pi`
u) elementi algebrici al
campo, in modo da rispettarne la definizione.
Capitolo 6
Geometria Euclidea
pubblicati testi che rivedevano limpostazione di Euclide secondo i nuovi criteri, anche se è limpianto
Euclideo quello che si studia a tuttoggi.
Mandai il triangolo equilatero a Treviranus. Sapevo che lei avrebbe aggiunto il punto che mancava: il punto che determinava il rombo perfetto, il punto che prefissava il luogo dove unesatta
morte lattendeva.
6.1
J. L. Borges Finzioni
Secondo Aristotele la Geometria (cioè la misurazione dei terreni) nacque in Egitto, dove ogni anno,
dopo le inondazioni del Nilo, era necessario ristabilire i confini dei campi, assegnare un nuovo terreno
a chi, eventualmente, avesse perduto il proprio, invaso in modo permanente dalle acque. Anche i Babilonesi coltivarono la Geometria, un po per ragioni
analoghe, ma assai di pi`
u per il loro interesse allAstronomia. Tuttavia, nessuno di questi popoli andò
pi`
u in là delle considerazioni pratiche ed elementari,
necessarie ai loro intendimenti. Ad esempio, nessuno sent` mai il bisogno di dimostrare alcunche o di
speculare in forma astratta. Lo studio teorico della
Geometria cominciò in Grecia e uno dei precursori fu
Talete (624 545 a.C.), il primo dei Sette Savi. Con
i Pitagorici si affermò anche il concetto di dimostrazione e al tempo di Platone (427 347 a.C.), che fu
un buon cultore di Geometria, le conoscenze teoriche
erano abbastanza ampie da costituire un corpus di
notevole rispetto. Fu però circa un secolo dopo che
la Geometria trovò la sua sistemazione, in un certo
senso definitiva, con lopera di Euclide (sec. III a.C.)
Elementi. Certo, gli Elementi non costituiscono
la fine dello sviluppo della Geometria, che troverà in
Archimede (287 212 a.C.) e Apollonio (262 180
a.C.) due altri grandi. Le scoperte si sono protratte fino ai nostri giorni, ma quel libro mostrò come si
costruisce una teoria matematica, partendo dagli assiomi e edificando man mano un insieme organico di
conoscenze (teoremi e problemi) logicamente fondati
e perciò incontrovertibili. Gli Elementi di Euclide
sono stati forse il libro pi`
u letto e pi`
u amato dopo la
Bibbia e hanno costituito la base dello studio della
Geometria fino al 1800. Con la revisione della Logica
operata in quel periodo (che portò alla formulazione
delle Geometrie non Euclidee), cominciarono a venir
Le basi della Geometria
Euclide fonda la Geometria su 10 verità, che egli reputa evidenti di per se, e che quindi non richiedono
alcuna dimostrazione. Egli le divide in 5 assiomi (che,
ricordiamo, secondo Aristotele sono verità generali,
indipendenti dal sapere geometrico) e in 5 postulati (cioè verità specifiche della materia in oggetto, la
Geometria):
Assiomi o nozioni comuni:
163
1. oggetti uguali a uno stesso oggetto sono uguali

tra loro;
2. se oggetti uguali vengono aggiunti ad oggetti
uguali, gli oggetti risultanti sono uguali tra loro;
3. se oggetti uguali vengono sottratti da oggetti
uguali, gli oggetti risultanti sono uguali tra loro;
4. oggetti che si possono sovrapporre e far
coincidere sono uguali tra loro;
5. lintero è maggiore di ciascuna delle sue parti
proprie.
Postulati:
1. per due punti qualsiasi si può tracciare una retta;
2. ogni segmento si può prolungare indefinitamente;
3. su un piano si può tracciare una circonferenza di
centro e raggio arbitrari;
4. tutti gli angoli retti sono uguali;
5. se due rette formano, con una retta che le interseca, da una stessa parte di questa, due angoli
la cui somma è minore di due angoli retti, allora
le due rette, prolungate allinfinito, si incontrano
proprio da tale parte.
164
CAPITOLO 6. GEOMETRIA EUCLIDEA
Quando Euclide parla di punti, rette e piani, egli

ha in mente precise astrazioni degli analoghi concetti
concreti e crede che tali astrazioni siano non un semplice modello della realtà, ma siano davvero la realtà,
la sostanza rivelata del fenomeno concreto. Quindi,
gli assiomi servono solo ad evitare il regressum ad infinitum che si creerebbe se tentassimo di definire tutti
i concetti, il che richiederebbe di introdurne altri, e
poi ancora altri, e cos` via. Ma, a parte questo, gli
assiomi sono veri in senso semantico, cioè sono veri
nella realtà. Con laffermarsi della Logica moderna
questa idea è venuta a cadere e gli assiomi della Geometria sono stati rivisitati, per far loro inglobare la
definizione implicita degli enti geometrici (punto, retta, piano) e delle loro reciproche relazioni. Volendo
vedere le cose da un punto di vista un po diverso,
mentre nella Geometria di Euclide le figure e le costruzioni geometriche hanno un ruolo fondamentale
nello sviluppo della teoria, nelle formulazioni moderne deve essere possibile derivare tutti i teoremi in modo puramente formale, cioè utilizzando solo i simboli
(e i modi di metterli insieme) definiti dagli assiomi o
che man mano si introducono partendo da quelli.
Lassiomatizzazione pi`
u famosa della nuova Geometria è quella di Hilbert, che elenca ben ventitre
postulati. Diamo qui una versione semplificata con
gli assiomi divisi in gruppi:
Assiomi di incidenza
1. due punti distinti, presi a piacere, appartengono a una retta e a una soltanto;
2. ad ogni retta appartengono almeno due
punti;
3. esistono due punti che non appartengono
alla stessa retta;
8. dati un segmento AB e una semiretta r di

origine C, esiste un unico punto D della
semiretta r tale che AB sia congruente a
CD (e si scrive AB = CD);
9. Se AB = CD ed AB = EF allora CD =
EF ; ogni segmento è congruente a se stesso;
10. siano dati tre punti A, B, C su una retta,
tali che B giaccia tra A e C, e altri tre punti
D, E, F su unaltra retta, tali che E giaccia
tra D ed F . Se AB = DE e BC = EF ,
allora AC = DF ;
Assiomi di congruenza tra angoli
b e una semiretta DF ,
11. dato un angolo B AC
esiste ununica semiretta DE, da una parte
b è congruente
fissata di DF , tale che B AC
b (e si scrive B AC
b = E DF
b ).
a E DF
12. dati tre angoli , , , se = e = ,

allora = ; ogni angolo è congruente a se
stesso;
13. dati due triangoli ABC e DEF , si supponga che sia AB = DE, AC = DF e
b = E DF
b . Allora i due triangoli sono
B AC
b = DEF
b
congruenti, cioè BC = EF , ABC
b
b
e ACB = DF E.
Assioma della parallela
14. data una retta r e un punto P fuori di essa,

per P passa una e una sola parallela ad r.
Assioma di continuità o di Archimede
15. dati due segmenti AB e CD, esiste sempre
un multiplo di AB che sia maggiore di CD.
Proprio per la sua astrattezza, la formulazione di

Hilbert va bene da un punto di vista sistematico, ma
non certo didattico e fa parte di quella che si chiama
4. se il punto B giace tra A e C, allora A, B, C la Matematica elementare considerata da un punto
sono tre punti distinti di una retta, e B di vista superiore. Essa non sviluppa il cosiddetto
senso geometrico e si preferisce insegnare seguendo
giace tra C ed A;
limpostazione euclidea, anche se rivista e aggiorna5. dati due qualsiasi punti A e B, si può trovata. Anche noi ci atterremo a questa regola, e vedremo
re un terzo punto C tale che B giaccia tra
soprattutto la Geometria del piano; lasciamo allultiA e C;
ma sezione del capitolo quelle nozioni di Geometria
6. dati tre punti su una retta, ne esiste uno e dello spazio che riteniamo possano essere utili: ciò, lo
uno solo che giace tra i restanti due;
riconosciamo, è un difetto, poiche è con questo tipo
7. siano A, B, C tre punti non allineati e sia r di Geometria che si può coltivare il nostro senso spauna retta che non contiene nessuno di que- ziale, tanto utile anche quando si affrontano problemi
u di due dimensioni.
sti tre punti. Se r contiene un punto D che di Geometria analitica a pi`
La costruzione della Geometria richiede lintrodugiace tra A e B, allora r deve anche contenere un punto che giaccia tra A e C o tra zione di un certo numero di concetti, derivati dagli
enti primitivi di punto, retta e piano, ma indispensaB e C;
bili per poter progredire fissando la nostra mente sulle
Assiomi di congruenza tra segmenti
cose importanti e, di conseguenza, lasciando perdere
Assiomi dordine
165
6.1. LE BASI DELLA GEOMETRIA
costruzione di opportune figure; la validità di tali costruzioni è garantita dai teoremi, ma non è raro che
la verità di un teorema sia dimostrata per mezzo di
unopportuna costruzione. Per questo, la Geometria
euclidea mescola in modo indissolubile le dimostrazioni formali e le costruzioni geometriche; queste ultime sarebbero formalmente proibite nellimpostazione
moderna di Hilbert.
Le costruzioni geometriche vengono effettuate con
due strumenti: la riga non graduata e il compasso. La
riga serve per tracciare la retta che unisce due punti
A
B O
(o, almeno, parte di tale retta); il compasso serve a
tracciare le circonferenze, gli archi di circonferenza e a
Si noti che molti assiomi fanno uso del concetto riportare gli estremi di un segmento. Per questo, si fa
di segmento; questo significa semplicemente che gli centro su uno dei due estremi e si regola il compasso
assiomi non si danno prima dello sviluppo della teo- in modo che laltra delle sue punte coincida col seconria, ma le due cose procedono in parallelo, con lunica do estremo. In questa maniera è possibile traslare il
avvertenza che luso di un concetto non ne preceda segmento, poiche lampiezza o apertura del compasso
la definizione. Questa stessa osservazione vale per il può essere riportata ovunque si voglia, a partire da
concetto di semiretta; data una retta r e un punto un punto prestabilito e/o su una retta assegnata (si
O su di essa, si dice semiretta ciascuno dei due trat- veda il terzo postulato di Euclide). Ciò permette di
ti infiniti che si dipartono da O, detto origine della dare un definizione precisa: due segmenti sono uguasemiretta. In modo analogo, dato un piano e una li se e solo se, riportando il primo sul secondo (cioè
retta r su di esso, si dice semipiano ciascuna delle puntando su uno dei due estremi) laltra punta del
parti di piano in cui r divide . Si dice angolo (v. compasso si può far coincidere col secondo estremo.
Figura 6.1 ciascuna delle parti di piano compresa fra
s
s
due semirette che hanno lorigine O in comune; tale
C
C
origine si dice il vertice dellangolo. Infine, tre punti
si dicono allineati se giacciono su una stessa retta.
le cose meno rilevanti: sono proprio le definizioni che,
operando una scelta, danno uno specifico indirizzo alla strada che vogliamo percorrere. Prima di tutto, si
dice segmento il tratto di retta compreso tra due punti A e B e che appartengono alla retta stessa; i due
punti A e B si dicono estremi del segmento. Il primo postulato di Euclide e il primo assioma di Hilbert
ci dicono che, dati due punti qualsiasi A e B, esiste
sempre il segmento AB.
r
A
r
B
Figura 6.2: Traslazione di un angolo

B
s
Figura 6.1: Definizione dellangolo

Di fondamentale importanza in tutta la Geometria
è il concetto di uguaglianza; qui siamo interessati alluguaglianza tra segmenti e tra angoli; vedremo pi`
u
avanti luguaglianza tra poligoni, specie tra triangoli,
concetto estremamente importante in tutta la Geometria euclidea. Come afferma il quarto assioma di
Euclide, i Greci ritenevano uguali due figure che, sovrapposte, vengono a coincidere. In termini moderni,
noi diciamo che luguaglianza si conserva per traslazioni e rotazioni. Tuttavia, questa idea intuitiva deve essere specificata meglio e rigorosamente, e ciò ci
permette di introdurre le costruzioni geometriche. I
problemi di Geometria hanno soluzione in termini di
Solo un po pi`
u complessa è la traslazione di un angolo, che mostriamo nella Figura 6.2. Si supponga di
b e lo si voglia traslare a partire dalavere langolo rAs
la retta r con vertice in A . Con centro in A e raggio

arbitrario si traccia larco BC e, con la stessa apertura e centro in A , si disegna una circonferenza che
taglia r in B . Ora, si apre il compasso con ampiezza BC e facendo centro in B si traccia un arco che
intersechi la precedente circonferenza in C . Unendo,
mediante la retta s , i punti A e C si ha, per costruc s è la traslazione dellangolo
zione, che langolo r A
di partenza. Osserviamo esplicitamente che langolo
potrebbe essere riportato anche dalla parte di sotto,
ottenendo un angolo speculare, ma comunque uguale
a quello di partenza (sarebbe semplicemente ruotato
di un angolo pari allangolo stesso, a meno che non si
vogliano identificare le due rette r ed r .
Dati due segmenti AB e CD, si definisce la loro
somma in questo modo: si prolunga il segmento AB
166
dalla parte di B e si riporta CD su tale semiretta a

partire da B e in modo che D non cada tra A e B:
il segmento AD è la somma richiesta. Il confronto
tra AB e CD si fa riportando CD sulla retta AB a
partire da A e nel verso in cui si trova B: se D cade
tra A e B allora AB è maggiore di CD, altrimenti
(se i due segmenti non sono uguali) AB è minore di
CD. Infine, se CD è minore di AB, la differenza tra
AB e CD si trova procedendo come per il confronto
e considerando infine il segmento DB.
BC
A
AC
D
B
secondo m di CD. La frazione n/m si dice il rapporto fra AB e CD. Allinizio, i Greci pensarono che
due segmenti qualsiasi fossero comunque commensurabili tra di loro, ma poi Pitagora scopr` che il lato
e la diagonale del quadrato non possono essere tali.
Dovettero perciò introdurre il concetto di segmenti
incommensurabili e si disse rapporto fra i segmenti
AB e CD il numero (che oggi diciamo reale) che si
ottiene eseguendo il seguente procedimento:
Algoritmo 6.1 (Rapporto fra due segmnti)
Ingresso: due segmenti AB e CD.
Uscita: il rapporto r fra AB e CD.
1. si determina il massimo multiplo r di CD che
sia minore o uguale ad AB;
2. se AB = rCD si esce con r come risultato;
A A0 A1
A2
A3
A4 B A5
3. altrimenti, si pone U V = CD, P Q = AB rCD

e j = 1;
4. si divide U V in dieci parti uguali e sia U V una
di tali parti;
U1
U2
U3
5. si trova il massimo multiplo dj di U V che non

superi P Q;
U4
U5
6. si pone r := r + dj /10j ;
7. se P Q = dj U V si esce con r come risultato;
Figura 6.3: Divisione di un segmento in parti uguali

Nota 6.1
Un segmento AB pu`
o essere facilmente
diviso in n parti uguali mediante la costruzione che
mostriamo nella Figura 6.3. Da A disegniamo una
semiretta AP e su di essa riportiamo n repliche consecutive di un segmento arbitrario; siano U1 , U2 , . . . , Un
i secondi vertici di tali segmenti; si unisca Un con
B e si traccino le parallele ad Un B che passano
per ciascuno degli Ui e incontrano il segmento AB
nel punto Ai (i = 1, 2, . . . , n 1). Posto A0 A e
An B, per il Teorema 6.16 di Talete, i vari segmenti
A0 A1 , A1 A2 , . . . , An1 An sono tutti uguali.
Il segmento AB si dice multiplo secondo m del segmento CD se e solo se AB può essere suddiviso in
m parti tutte uguali a CD; in tal caso, si dice anche che CD è un sottomultiplo secondo m di AB. Si
scrive AB = mCD o anche CD = AB/m. Due segmenti AB e CD si dicono commensurabili se esistono
due numeri interi m ed n tali che AB risulta essere il
multiplo secondo n del sottomultiplo secondo m del
segmento CD. Si scrive:
n
AB = CD;
m
si osservi che in tal caso il multiplo secondo m di AB
è uguale al multiplo secondo n di CD, ovvero il sottomultiplo secondo n di AB è uguale al sottomultiplo
8. altrimenti, si pone U V := U V , P Q := P Q
dj U V , j := j + 1 e si torna al passo 4.
In modo analogo si definiscono la somma, il confronto e la differenza tra due angoli (v. Figura 6.4).
b e A O
c B , si trasla questultimo
Dati due angoli AOB
in modo che la semiretta O A venga a coincidere con
la semiretta OB cos` che O B sia dalla parte opposta
b cos` otdi OA rispetto a OB O A ; langolo AOB
b +A O
c B . Per il confronto e
tenuto è la somma AOB
c B in modo da far
la differenza, invece, si trasla A O

coincidere O A con OA e laltra semiretta O B sia
dalla stessa parte di OB; naturalmente, se ruotando da OA in senso antiorario si trova O B prima di
c B è minore di AOB,
b mentre
OB, allora langolo A O
è maggiore in caso contrario (naturalmente, se i due
angoli non sono uguali, e cioè non si sovrappongono
b è
esattamente). La differenza è definita quando AOB
c
maggiore di A O B , e il risultato è costituito dallanb
golo B OB.
Naturalmente, i multipli di un angolo si
definiscono di conseguenza.
Definita cos` come sovrapponibilità luguaglianza
tra segmenti e tra angoli, nonche le operazioni tra tali enti, possiamo passare al concetto di misura, strettamente legato a quello di uguaglianza. Si consideri,
una volta per tutte, un segmento U V , che indicheremo genericamente con u e che si dice lunit`
a di misura; si definisce allora come misura del segmento AB
167
6.1. LE BASI DELLA GEOMETRIA
B
B
A
O
B
B
A
Figura 6.4: Operazioni sugli angoli
analogamente, il primo multiplo è 100 volte lunità di

misura. Il primo sottomultiplo dellunità di volume
è 1/1000 dellunità stessa, e il primo multiplo è 1000
volte pi`
u grande. Per ragioni pratiche si considerano anche gli altri multipli e sottomultipli rispetto a
10, ma essi creano abbastanza confusione. Ad esempio, il multiplo secondo 10 dellunit`
a di superficie è
un quadrato che ha il lato pari a 10u, cioè circa

3.16227766 volte lunità di lunghezza u. Ho visto
persone di buona cultura tentennare di fronte a un
fatto del genere!
Anche per gli angoli devono valere le consuete proprietà delle misure. Per essi sembra esistere una misura naturale, cioè che non dipende dalla scelta dellunità di misura. Infatti, langolo giro ha una rilevanza
tutta propria, essendo langolo pi`
u grande che si possa considerare in modo naturale. Certo, possiamo
girare e rigirare intorno al vertice di un angolo quante volte vogliamo, ma si torna sempre a un angolo
compreso tra langolo nullo e quello giro. Arbitraria
è invece la suddivisione dellangolo giro in sottomultipli; seguendo una tradizione risalente ai Babilonesi, langolo giro si suddivide in 360 parti, assumendo
una di queste parti come unità di misura standard:
il grado; esso si indica con un circoletto ad esponente
del valore. Quindi, la misura di un angolo giro è di
360 , e 180 è quella dellangolo piatto. Essendo 360
il massimo valore della misura di un angolo, multipli
del grado non si prendono in considerazione. Vi sono
invece i sottomultipli che, sempre per tradizione, non
si conformano alla base 10:
(rispetto allunità di misura u) il rapporto tra AB ed

U V ; la misura del segmento AB si dice anche la sua
lunghezza e spesso si denota con AB, sottintendendo
lunità di misura, che si suppone fissata.
E bene ribadire che il segmento U V è arbitrario e
non esiste ununità di lunghezza preferibile ad unaltra. Nella pratica si usa il metro definito come la
lunghezza di una certa barra di platino-iridio conservata al Bureau International de Poids et Mesures
di Sèvres. Originariamente, nel 1791, il metro doveva essere la quarantamilionesima parte del meridiano
terrestre, ma la misurazione di questo si è rivelata alquanto aleatoria; oggi si preferisce una definizione pi`
u
operativa, che non obblighi a recarsi a Sèvres ogni volta che si debba controllare la precisione di uno strumento di misura. Si definisce allora il metro come la
distanza percorsa dalla luce nel vuoto in un intervallo
1. si dice primo la sessantesima parte del grado e si
di tempo pari a 1/299. 792. 458 secondi. Ricordiamo
indica con un apice dopo il valore;
infatti che, secondo la Fisica, la velocità della luce è
una costante universale; il problema, semmai, è di definire lunità di tempo, cioè il secondo. Naturalmente,
una volta definita lunità di misura, sono automati2. si dice secondo la sessantesima parte del primo e
camente determinati i suoi multipli e sottomultipli,
si indica con un doppio apice dopo il valore.
sui quali pertanto non stiamo a insistere.
Stabilita lunità di lunghezza, le unità di superficie e di volume risultano conseguenza di quella; Un angolo di 22 gradi, 12 primi e mezzo si indica:
anticipando la definizione di quadrato e di cubo:
22 12 30 . Dopo i secondi, si torna alla suddivisione
decimale, con decimi, centesimi, millesimi, etc. del
1. si dice unit`
a di misura di superficie il quadrato
secondo. Come vedremo quando tratteremo la tri2
di lato u; lunità stessa si denota come u ;
gonometria, cè una misura degli angoli meno artifi2. si dice unit`
a di misura di volume il cubo di lato ciosa di questa; essa assume come unità di misura il
radiante, definito come langolo che sottende un arco
u; lunità di misura stessa si denota con u3 .
di circonferenza uguale al raggio della circonferenza
I multipli e sottomultipli si ottengono moltiplican- stessa. Il radiante, quindi, risulta indipendente daldo o dividendo opportunamente le varie dimensioni lunità di lunghezza usata per la circonferenza, come
del quadrato e del cubo; pertanto il primo sottomul- ci aspettiamo che debba essere. Per il momento, tuttiplo (secondo 10) dellunità di superficie si ottiene tavia, in questa parte che riguarda la Geometria Eudividendo due lati consecutivi in 10 parti ciascuna, e clidea, limiteremo le nostre considerazioni alla misura
perciò tale sottomultiplo è 1/100 dellunità di misura; tradizionale in gradi, primi e secondi.
168
6.2
Perpendicolarit`
a e parallelismo
Due concetti molto importanti sono quelli di rette perpendicolari e di rette parallele; su di essi
si basano moltissimi sviluppi della Geometria Euclidea, che dedica loro due postulati, il quarto e il quinto. Cominciamo col quarto postulato, che può essere
enunciato nel modo seguente: tutti gli angoli retti
sono uguali. Naturalmente, affinche questa affermazione abbia senso, occorre aver definito langolo retto;
allora, la seguente definizione ha il duplice scopo di
farci intendere cosa è un angolo retto e quandè che
due rette sono perpendicolari tra loro:
Definizione 6.1 Se due rette, incontrandosi, formano quattro angoli uguali, si dicono perpendicolari;
ciascuno dei quattro angoli si dice un angolo retto.
Il quarto postulato ci assicura che, qualunque coppia di rette perpendicolari si consideri, gli angoli ottenuti sono non solo uguali tra di loro, ma uguali
a quelli di ogni altra coppia di rette perpendicolari. Questo ci permette di affermare che un angolo
piatto è la somma di due angoli retti e un angolo
giro è la somma di quattro angoli retti. Secondo le
convenzioni introdotte nella precedente sezione sulla
misurazione degli angoli, possiamo dire che un angolo
retto misura 90 , come quarta parte dellangolo giro.
La terminologia relativa agli angoli è ben nota; sia
b langolo considerato:
AOB
piatto: le due semirette OA ed OB sono
allineate, cioè sono luna il prolungamento
dellaltra;
giro: le due semirette OA ed OB coincidono;

convesso: un angolo minore di un angolo piatto;
Nota 6.2
Esistono vari metodi per costruire un

angolo retto; qui diamo per esteso un algoritmo che
sfrutta poco spazio, come mostrato nella parte sinistra
della Figura 6.5:
Algoritmo 6.2 (Angolo retto)

Ingresso: una semiretta di origine A;
Uscita: la semiretta per A perpendicolare alla
semiretta data;
1. se r è la semiretta assegnata, con centro in A
e con raggio arbitrario si disegna un arco di
circonferenza che taglia r in B;
2. con centro in B e con lo stesso raggio di prima
si disegna un arco che taglia il precedente in C;
3. con centro in C e con lo stesso raggio di prima
si disegna un arco che taglia il primo in D;
4. con centro in D e ancora lo stesso raggio si
traccia un arco che taglia il precedente in E;
5. la semiretta per A passante per E è perpendicolare ad r.
La dimostrazione che questa costruzione è corretta è
facile ed è lasciata allo studente dopo che avr`
a appreso
(se non li conosce gi`
a) i teoremi delle prossime sezioni
di questo capitolo. Come talvolta accade, le costruzioni geometriche richiedono conoscenze che non vanno in parallelo con lesposizione sistematica dei vari
concetti. Unaltra costruzione è mostrata nella parte
destra della Figura 6.5, e il lettore la potr`
a schematizzare sotto forma di algoritmo come semplice esercizio:
si prolunga la semiretta r oltre A, e con centro in A
e raggio arbitrario si disegna una semicirconferenza
che taglia r e il suo prolungamento in B e in C; con
centro in B e C e raggio superiore al precedente, si
disegnano due archi che si incontrano in D; la retta
che congiunge A con D è perpendicolare ad r.
E
D
concavo: un angolo maggiore di un angolo piatto;

acuto: un angolo minore di un angolo retto;
ottuso: un angolo maggiore di un angolo retto
(ma minore di un angolo giro).
Inoltre, dati due angoli, essi si dicono:
opposti al vertice se ciascuno di essi è determinato dal prolungamento delle semirette dellaltro;
due angoli opposti al vertice sono uguali;
complementari: due angoli la cui somma sia
uguale ad un angolo retto;
supplementari: due angoli la cui somma sia
uguale ad un angolo piatto;
esplementari: due angoli la cui differenza sia un
angolo piatto.
C
r
A
r
C
Figura 6.5: Costruzioni dellangolo retto

Vale la pena di ricordare, infine, il metodo egizio,
cos` detto perche adottato dagli antichi Egizi (e
non solo da loro) (v. Figura 6.6. A partire da A
si riporta quattro volte un segmento arbitrario P Q,
determinando cos` il punto B. Con centro in A si
traccia un arco di raggio tre volte P Q e con centro
in B un arco di raggio cinque volte P Q. Se C è il
punto di intersezione dei due archi, la retta AC è
perpendicolare ad AB per il Teorema di Pitagora,
che d`
a: 32 + 42 = 52 .
` E PARALLELISMO
6.2. PERPENDICOLARITA
Figura 6.6: Il metodo Egizio

Il concetto di parallelismo è legato al quinto postulato di Euclide e richiede di aver già introdotto la
perpendicolarità e langolo retto. Il postulato fa uso,
quando parla di angoli interni, di una terminologia
specifica che bisogna conoscere:
169
Dal quinto postulato si deduce che se r ed s formano con t coppie di angoli la cui somma è uguale a due
retti, esse, anche se prolungate indefinitamente, non
si incontrano mai. Da questa osservazione intuitiva, discende la pseudo-definizione che comunemente
si dà di rette parallele: due rette si dicono parallele se, prolungate indefinitamente, non si incontrano
mai. Questa non può essere una vera definizione, perche prolungando due rette possiamo s` determinare se
esse si incontrano, ma è impossibile stabilire che esse
non si incontrano; infatti, una cosa del genere richiederebbe uno spazio e un tempo infiniti che, di solito, non abbiamo a disposizione. Il senso del quinto
postulato di Euclide, quindi, è di fornire un criterio
finito per stabilire se due rette sono o non sono
parallele: si tagliano con una trasversale e si misurano gli angoli; se la somma di due angoli interni è
uguale a due retti, le rette assegnate sono parallele,
altrimenti non lo sono e, in tal caso, dalla somma dei
due angoli sappiamo da quale parte si incontreranno.
Quindi la definizione corretta è: due rette sono parallele se, tagliate con una trasversale, formano angoli
coniugati interni la cui somma è uguale a due angoli
retti. A questo punto possiamo enunciare il famoso e
importante risultato:
Definizione 6.2 Siano r, s una coppia di rette e sia

t una trasversale che le taglia. Gli angoli per i quali
la semiretta della trasversale non incontra laltra retta della coppia, si dicono esterni; gli altri si dicono
interni. Le coppie di angoli che stanno dalla stessa
parte rispetto a t e dalla stessa parte rispetto ad r ed
s si dicono corrispondenti; essi sono sempre uno interno e uno esterno. Le coppie di angoli che stanno Teorema 6.1 Due rette r ed s sono parallele se e
da parti opposte rispetto a t e da parti opposte rispet- solo se, tagliandole con una trasversale, si verifica
to ad r ed s si dicono alterni; quindi una coppia pu`
o una delle seguenti condizioni:
essere costituita da angoli alterni esterni o da angoli
1. angoli alterni (interni o esterni) sono uguali;
alterni interni. Infine, le coppie di angoli che stanno
2. angoli corrispondenti sono uguali;
dalla stessa parte rispetto a t, ma da parti opposte
rispetto ad r ed s si dicono coniugati; anche in que3. angoli coniugati (interni o esterni) sono supplesto caso una coppia pu`
o essere costituita da angoli
mentari.
coniugati interni o angoli coniugati esterni.
Prova: Se r ed s sono parallele, per definizione vale la proprietà 3) relativamente agli angoli coniugati
t
interni; i corrispondenti angoli coniugati esterni sono

r
supplementari agli angoli coniugati interni e quindi
devono essere supplementari tra di loro. Dei due an
goli corrispondenti, uno è uguale e laltro è supplementare ad uno di due angoli coniugati, e quindi i
s

due angoli sono uguali tra loro. La stessa osserva
zione vale per gli angoli alterni, che perciò devono
anchessi essere uguali tra di loro.
Figura 6.7: Rette parallele tagliate da una trasversale
Le tre condizioni costituiscono altrettanti criteri di

parallelismo e come tali verranno usate ogni volta che
Schematicamente, la situazione può essere rappre- dovremo ragionare su rette parallele. Ad esempio, disentata dalla Figura 6.7, nella quale , , , sono mostriamo questa celeberrima conseguenza del quinto
angoli interni e , , , sono angoli esterni. Il qua- postulato:
dro completo è dato dalla Tabella 6.1, nella quale
Teorema 6.2 Data una retta r ed un punto P fuori
alt, cor e conj stanno per alterni, corrispondendi essa, per P passa una ed una sola parallela ad r.
ti e coniugati; per gli angoli che non sono in alcuna di queste relazioni abbiamo usato il simbolo = Prova: Si consideri la Figura 6.8, a sinistra. Da P
quando sono uguali e il simbolo quando risultano si costruisca la perpendicolare t ad r e quindi si cosupplementari (vedere il successivo Teorema 6.1).
struisca la retta s perpendicolare a t e passante per P .
170
=
conj
alt
=
cor
conj
=
alt
=
cor
alt
=
conj
cor
=
alt
conj
=
cor
cor
=
conj
alt
=
cor
conj
=
alt
cor
=
alt
=
conj
cor
=
alt
conj
=
Tabella 6.1: Corrispondenza tra angoli
S
P
s
t
Figura 6.8: Rette parallele

Per il teorema precedente, le rette r ed s sono parallele. Supponiamo allora che esista unaltra parallela
s ad r passante per P . Le due rette s, s formano un
angolo non nullo (altrimenti coinciderebbero) e quinb è minore di
di la somma degli angoli S PbQ e RQP
due retti. Per definizione, allora, s non può essere
parallela ad r.
La costruzione della retta s si può semplificare molto rispetto al metodo suggerito dalla dimostrazione
del teorema. Al solito, questo richiede la conoscenza
di proprietà che ancora non abbiamo ne visto ne tanto meno dimostrato, anche se lo faremo pi`
u avanti.
La dimostrazione del teorema, invece, correttamente
usa solo nozioni che già sono state introdotte e provate. Facendo riferimento alla Figura 6.8, a destra,
si ha:
Algoritmo 6.3 (Parallela ad r passante per P )
Ingresso: la retta r e il punto P fuori di essa;
Uscita: la retta s passante per P e parallela ad r;
1. si considera un punto A qualsiasi sulla retta r;
2. con centro in A e raggio AP si traccia un arco
di circonferenza che interseca r in B;
3. con centro in B e in P e stesso raggio si
tracciano due archi che si incontrano in C;
4. la retta P C è parallela ad r.
Come è noto, le possibili alternative al precedente

teorema hanno dato origine alle Geometrie non Euclidee. Se supponiamo che per P passino infinite rette
parallele ad r si ottiene la Geometria Iperbolica di
Lobacevsky e Bolyai ; se invece si suppone che per
P non passi alcuna retta parallela ad r si ottiene la
Geometria Ellittica di Beltrami e Riemann.
Lasciamo al lettore il compito di provare che anche la perpendicolare alla retta r passante per P è
unica. Se tale perpendicolare interseca r nel punto
Q, si definisce distanza di P da r la lunghezza del
segmento P Q; Q si dice il piede della perpendicolare.
Invitiamo inoltre il lettore a scrivere lalgoritmo per
la costruzione della perpendicolare ad r passante per
P , quando P non sta sulla retta; il caso in cui P A
sta su r è stato visto nella Nota 6.2. La Figura ??
suggerisce il metodo classico: con centro in P si traccia un arco di circonferenza che incontra r in X ed
Y . Il punto di mezzo Q del segmento XY è il piede
della perpendicolare cercata.
Dati tre punti non allineati A, B, C, la parte di
piano comune ai tre semipiani determinati dalle rette
AB, BC, CA che contengono il terzo punto, si dice
triangolo. I tre punti A, B, C si dicono i vertici, i
tre segmenti AB, BC, CA si dicono i lati del triangolo e i tre angoli che contengono il triangolo si dicono gli angoli del triangolo. Il triangolo è la pi`
u
semplice di una serie di figure geometriche di notevole importanza. Sia A0 , A1 , . . . , An una sequenza
di n punti distinti del piano; la sequenza di segmenti A0 A1 , A1 A2 , . . . , An1 An si dice poligonale; se An
coincide con A0 la poligonale si dice pi`
u propriamente poligono di n lati. Per estensione, si dice poligono
anche la parte di piano racchiusa dalla poligonale. La
definizione di vertice, lato ed angolo della poligonale e del poligono sono analoghe alle stesse definizione
date per il triangolo, che risulta semplicemente essere
un poligono di tre lati.
Se ogni lato Ai Ai+1 del poligono è tale che la retta Ai Ai+1 lascia da una stessa parte tutti gli altri
vertici del poligono, allora questo si dice convesso.
Si dimostra che la seguente definizione è equivalente:
un poligono è convesso se, presi comunque due pun-
` E PARALLELISMO
6.2. PERPENDICOLARITA
ti che gli appartengono, il segmento che li unisce è
formato tutto di punti appartenenti al poligono stesso. Per definizione, infatti, P e Q appartengono a
tutti i semipiani determinati dai lati e contenenti gli
altri vertici del poligono; vi appartengono pertanto
anche tutti i punti del segmento P Q. Un poligono
che non sia convesso si dice concavo. In questultimo caso, può succedere che due lati si intersechino,
cioè abbiano un punto in comune diverso da ciascuno
dei vertici; il poligono si dice allora intrecciato. Al
variare del numero dei lati (e degli angoli) i poligoni
prendono il nome di triangoli, quadrilateri, pentagoni, esagoni, e cos` via. Un poligono che abbia tutti i
lati e tutti gli angoli uguali si dice regolare; per questi
poligoni si veda la Sezione 6.8.
A5
A1
A4
A1
A3
A0
A6
A2
A0 A5
A2
A7
A4
A3
Figura 6.9: Poligonale e poligono

I triangoli sono i poligoni pi`
u semplici e tutti
i triangoli sono poligoni convessi; per essi vale il
seguente risultato:
Teorema 6.3 In ogni triangolo ciascun lato è minore della somma degli altri due e maggiore della loro
differenza.
171
A
Figura 6.10: Gli angoli di un triangolo

Questa costanza della somma dei tre angoli di un
triangolo risulterà importante in molte applicazioni; ad esempio, se chiamiamo angolo esterno langolo che il prolungamento di un lato forma con il lato
successivo, si ha il seguente:
Teorema 6.5 In un triangolo ogni angolo esterno è
uguale alla somma dei due angoli non adiacenti.
Prova: Se nel triangolo ABC della Figura 6.10 prob è il supplemenlunghiamo il lato AB, langolo C BD
b
tare di ABC. Ma per il teorema precedente, anche
b + ACB
b è supplementare di ABC
b per
la somma B AC
b
b
b
cui abbiamo: C BD = B AC + ACB.
D
E
C
Prova: Siano AB, CD, EF i tre lati di un triangolo;

se AB > CD + EF e facciamo coincidere A con C
A
B
e B con E, i punti D ed F non possono incontrarsi
e quindi non può esistere nessun triangolo con tali
Figura 6.11: Somma degli angoli interni
tre lati. Si osservi che se AB = CD + EF , allora D
ed F verrebbero a coincidere in un punto di AB, e
Tutti i poligoni hanno costante la somma dei loro
quindi il triangolo degenera in un semplice segmento.
Se daltra parte fosse AB < CD EF si avrebbe angoli interni:
CD > AB + EF , e questo è proibito dalla prima
Teorema 6.6 Sia dato un poligono di n lati; allora
parte del teorema.
la somma dei suoi angoli interni è uguale ad n 2
E interessante osservare il seguente invariante angoli piatti.
dei triangoli:
Teorema 6.4 La somma dei tre angoli di un Prova: Si consideri la Figura 6.11 e fissato un vertice A del poligono, lo si unisca a tutti gli altri vertici,
triangolo è uguale a due angoli retti.
escluso i due vertici adiacenti ai quali è già unito da
Prova: Sia ABC un qualsiasi triangolo (si veda la due lati. Si ottiene cos` una divisione del poligono in
Figura 6.10) e costruiamo per C la parallela ad AB. n 2 triangoli, ognuno dei quali ha un angolo piatto
b e B AC
b sono uguali perche alterni come somma dei suoi angoli interni. Poiche la somma
Gli angoli A CA
b e ABC.
b
Quindi, la degli angoli interni del poligono è uguale alla sominterni, e lo stesso vale per B CB
b
somma dei tre angoli del triangolo è uguale a A CA+
ma degli angoli interni di questi triangoli, il teorema
b
b
ACB + B CB, che è un angolo piatto.
risulta dimostrato.
172
Per i quadrilateri, cioè per i poligoni a quattro mo visto tanto per i segmenti quanto per gli angoli.
lati, esiste una nomenclatura nota fin dalle scuole Quello che si fa, è di traslare una figura sullaltra, in
modo da far coincidere certi punti, e osservare che anelementari:
che tutti gli altri coincidono; se questo non avviene,
Definizione 6.3 Un quadrilatero che abbia due lati
la due figure non sono congruenti. Talvolta, oltre alla
opposti paralleli si dice un trapezio. Un quadrilatero
traslazione, occorre operare un ribaltamento delle fiche abbia le due coppie di lati opposti paralleli si dice
gure; questo deve avvenire nello spazio, ma di regola
un parallelogramma. Un quadrilatero che abbia tutti
questa invasione della terza dimensione non è consigli angoli uguali si dice un rettangolo. Un quadriderata fuori legge. Con il criterio di sovrapponibilità
latero che abbia tutti i lati uguali si dice un rombo.
in mente, possiamo dare un teorema che potrebbe
Un quadrilatero che abbia tutti i lati e tutti gli angoli
anche essere preso come definizione:
uguali si dice un quadrato. I segmenti che uniscono vertici opposti di un quadrilatero si dicono le sue Lemma 6.9 Due triangoli sono uguali se e solo se
diagonali.
hanno i tre lati e i tre angoli ordinatamente uguali.
Vale il seguente, importante risultato:
Prova: I due triangoli possono essere sovrapposti,

Teorema 6.7 Un quadrilatero è un parallelogramma o direttamente o tramite una rotazione nello spazio,
se e solo e le due coppie di angoli opposti sono uguali. come richiesto ad esempio dai triangoli della Figura
6.13. Il viceversa è del tutto ovvio.
D
B B
Figura 6.13: Triangoli congruenti

Figura 6.12: Un parallelogramma
Prova: Se ABCD è un parallelogramma, gli angoli
b e in D
b sono corrispondenti e quindi supplementain A
b eC
b sono supplementari e quindi
ri; anche gli angoli D
b
b
b = B.
b ViceverA = C. Analogamente si dimostra D
sa, per il teorema precedente la somma degli angoli
interni di un quadrilatero è uguale a quattro angoli
b=C
b eB
b = D,
b si ha che A
b+D
b e
retti; quindi se A
b
b
B + C sono uguali a due angoli retti. Questo significa
che AB è parallelo a DC. In modo analogo, si trova
che AD è parallelo a BC e quindi il quadrilatero è un
parallelogramma.
Come semplice conseguenza si ha:
Corollario 6.8 Il rettangolo e il quadrato sono
parallelogrammi.
Vedremo pi`
u avanti che un quadrilatero è un parallelogramma se e solo se i lati opposti sono uguali.
Questo ci dirà che anche un rombo è un parallelogramma e ci darà altre proprietà dei rettangoli e dei
quadrati.
6.3
Congruenza e similitudine
Normalmente, la verifica di queste sei uguaglianze

è troppo pesante; come ora vedremo, bastano tre opportune uguaglianze per assicurare la congruenza di
due triangoli. I tre teoremi seguenti sono noti pertanto come criteri di congruenza dei triangoli, e
costituiscono la base di gran parte della geometria
dei triangoli.
Teorema 6.10 (I criterio di congruenza) Due
triangoli che abbiano uguali due lati e langolo tra
essi compreso sono congruenti.
Prova: Con riferimento alla Figura 6.13, si abbia
b = BA
c C . Se
AB = A B , AC = A C e B AC
portiamo A a coincidere con A e B con B , per le

precedenti uguaglianze anche C deve coincidere con
C , eventualmente dopo aver fatto ruotare il triangolo
nello spazio. Ma se B e C coincidono con B e C , il
segmento BC coincide con B C e anche gli angoli in
B e in C devono essere uguali agli angoli in B e C .
Questo assicura che i due triangoli sono congruenti.
Analogamente si dimostra il secondo criterio:
Teorema 6.11 (II criterio di congruenza) Due

Il concetto di congruenza per le figure geometriche triangoli che abbiano uguali un lato e i due angoli ad
coincide con quello di sovrapponibilità, come abbia- esso adiacenti sono congruenti.
173
6.3. CONGRUENZA E SIMILITUDINE

Prova: Sempre con riferimento alla Figura 6.13, sia
AB = A B e portiamo i due lati a sovrapporsi. Poiche langolo in A è uguale allangolo in A , il lato AC
viene a sovrapporsi (anche se non necessariamente
a coincidere) con A C . Allo stesso modo, essendo
b = B
c , i segmenti BC e B C si sovrappongono,
B
anche se non coincidono. Ma i due lati AC e BC si
incontrano in C, che per la costruzione effettuata si
deve trovare anche sulle rette A B e A C . Poiche
due rette non parallele si incontrano in un solo punto, allora C e C devono coincidere. Questo implica
la congruenza dei due triangoli.
Figura 6.14: Triangolo isoscele
Per arrivare a dimostrare il terzo criterio di conla mediana. Merita un po pi`

u di enfasi il seguente
gruenza, occorre introdurre alcuni concetti, nuovi ma
risultato:
importanti:
Definizione 6.4 Un triangolo con tutti e tre i lati Corollario 6.13 Un triangolo è equilatero se e solo
uguali si dice equilatero. Un triangolo con i tre lati se i suoi tre angoli sono uguali (e, di conseguenza,
tutti diversi si dice scaleno. Un triangolo che abbia misurano 60 ciascuno).
due lati uguali (e il terzo eventualmente diverso) si
dice isoscele; in tal caso, i due lati uguali si dicono
lati obliqui, mentre il terzo lato si dice la base. I
segmenti che uniscono ciascun vertice al punto medio
del lato opposto si dicono le mediane del triangolo.
Se dal vertice A costruiamo la perpendicolare al lato
opposto BC e H è il piede di tale perpendicolare, il
segmento AH si dice laltezza del triangolo relativa
al lato BC. In modo analogo si definiscono le altezze
relative ai lati AB e AC.
Si ha allora il seguente:
Prova: Sia ABC un triangolo equilatero; se consideriamo AB come base di un triangolo isoscele, langolo
in A risulta uguale allangolo in B; se consideriamo
BC come base, langolo in B risulta uguale allangolo in C. Per la proprietà transitiva delluguaglianza i
tre angoli sono tutti uguali e la loro misura discende
dal Teorema 6.4. In viceversa si dimostra in modo
del tutto analogo.
Siamo ora in grado di dimostrare:
Teorema 6.14 (III criterio di congruenza)

Due triangoli che abbiano tutti e tre i lati uguali
Teorema 6.12 Un triangolo è isoscele se e solo se i
sono congruenti.
due angoli adiacenti alla base sono uguali.
Prova: Con riferimento alla Figura 6.14, sia CM Prova: Facciamo ora riferimento alla Figura 6.15.

il segmento che si ottiene dividendo a metà langolo Portiamo AB a coincidere con A B e supponiamo
b
b
in C, di modo che ACM
= M CB.
I due triangoli che, cos` facendo, C non venga a coincidere con C.
ACM e M CB sono congruenti per il primo criterio: I due triangoli ACC e BCC sono isosceli per co

AC = CB perche il triangolo è isoscele, CM è a struzione e per ipotesi (AC = A C e BC = B C ) e
b = M CB
b per costruzione. Quindi quindi hanno gli angoli alla base uguali. Tuttavia, se
comune ed ACM
c
c
in particolare langolo in A è uguale allangolo in B. la disposizione è quella della figura: AC C > B C C e
b
b
c
Viceversa, supponiamo che gli angoli adiacenti al lato ACC < B CC = B C C, il che è assurdo. Ci possono
AB siano uguali. Questo vuol dire che sono acuti e essere altre disposizioni dei punti C e C , ma in modo
quindi, se da C tracciamo laltezza relativa ad AB, del tutto analogo si arriva sempre a una conclusione
questa cade in un punto M compreso tra A e B. Si assurda. Quindi, deve essere C C .

considerino allora i triangoli AM C e M BC; i due
be
angoli in M sono retti e quindi uguali, gli angoli A
C C
b sono uguali per ipotesi e questo implica che langolo
B
b è uguale ad M CB.
b
ACM
I due triangoli sono allora
congruenti per il secondo criterio (CM è in comune)
e, in particolare, CA = CB; quindi il triangolo è
isoscele.
A A
B B
Come conseguenza di questa dimostrazione, si può
cC =
osservare che, in un triangolo isoscele, AM
c
Figura 6.15: Terzo criterio di congruenza
B M C, che quindi risultano retti; perciò CM è laltezza del triangolo. Inoltre, AM = M B, e CM è anche
174
Teorema 6.15 Un quadrilatero è un parallelogramma se e soltanto se le due coppie di lati opposti sono
formate da segmenti uguali.
B H
C K
Prova: Se ABCD è un parallelogramma, considerando le rette parallele AB e CD tagliate dalla trab = B DC

b perche angoli altersversale DB, si ha ABD
ni interni. In modo analogo, partendo dalle parallele
b = DBC.
b
AD e BC si ha ADB
Allora i due triangoli
ABD e BCD sono congruenti per il primo criterio
e perciò si ha AB = DC e AD = BC. Viceversa,
supponiamo che sia AB = DC e AD = BC; i due
triangoli ABD e BCD sono ora uguali per il terzo crib = B DC
b
terio di congruenza e quindi abbiamo ABD
b
b
e ADB = DBC; questo implica che AB e DC sono
paralleli, come lo sono AD e BC.
Un immediato corollario di questo teorema è che

ogni rombo è un parallelogramma. Nella dimostrazione del teorema abbiamo usato la diagonale DB; potevamo usare anche laltra diagonale AC e arrivare allo
stesso risultato. Pertanto, una seconda conseguenza
è:
Corollario 6.16 Ogni diagonale divide un parallelogramma in due triangoli uguali.

Uno dei primi risultati astratti ottenuti nella
Geometria è stato, quasi sicuramente, il teorema di
Talete, che ora vedremo. Talete si interessava alle proporzioni e indubbiamente osservò la proprietà
enunciata dal suo teorema, ma, altrettanto indubbiamente, non ne dette alcuna dimostrazione come ora si
intende e come, un paio di secoli dopo di lui, intendevano i Greci. A quellepoca, la necessità di una prova
rigorosa in Matematica non era avvertita e una verifica sperimentale era pi`
u che sufficiente. Ciò non toglie
che lintuizione di Talete non fosse giusta e, a quel che
si dice, egli stesso la adoperò, quando gli capitò di recarsi in Egitto, per calcolare con esattezza laltezza
delle piramidi, operazione ritenuta impossibile prima
di lui.
Definizione 6.5 Si dice fascio di rette linsieme di
tutte le rette che passano per un punto, detto il centro
del fascio, oppure linsieme di tutte le rette parallele
a una retta assegnata, detta la direzione del fascio.
Teorema 6.17 (di Talete) Sia dato un fascio di
rette parallele e si considerino due trasversali r ed
s a tale fascio (v. Figura 6.16); queste trasversali sono pertanto tagliate in segmenti dalle rette parallele;
allora, a segmenti proporzionali tagliati su r corrispondono segmenti nella stessa proporzione tagliati
su s, e viceversa.
Prova: A onor di Talete, la dimostrazione di questo teorema non è affatto ovvia e richiede unimpo-
BB
B A
B
B
H BB
B
K B C
B
B
B D
B
B E
B
B
sB
Figura 6.16: Teorema di Talete
stazione che tenga conto della definizione di numero reale, concetto che, al tempo di Talete, nemmeno esisteva! Si comincia osservando che a segmenti
uguali su r corrispondono segmenti uguali su s. Sia
AB = BC; se si tirano le perpendicolari al fascio
AH e BK, i due triangoli ABH e CBK sono uguab = H BA
b e
li, essendo AB = BC per ipotesi, K CB
b = C BK
b come angoli corrispondenti. PortiaB AH
mo ora le perpendicolari A H e B K : questo implica che AA H H e BB K K sono parallelogrammi e quindi A H = AH = BK = B K . Da
questo deriva che i triangoli A H B e B K C sono congruenti, ancora per il primo criterio di conc B = K B
c C perche corrispondenti,
gruenza (H A
c = K
c perche retti). Finalmente, questo ci dice
H

A B = B C . Supponiamo ora (seconda parte della
dimostrazione) che due segmenti, ad esempio AB e
CD, stiano tra di loro in un rapporto razionale m/n.
Questo significa che dividendo AB in n parti uguali e CD in m parti uguali, queste parti hanno tutte
la stessa lunghezza. Possiamo applicare allora la prima parte della dimostrazione immaginando che ogni
parte sia individuata dal taglio di r ed s con rette
parallele del fascio. Questo implica che A B e C D
stanno ancora nel rapporto m/n, essendo le parti tagliate in s tutte uguali tra di loro. La terza parte
della dimostrazione riguarda il caso in cui i due segmenti, diciamo ancora AB e CD non siano tra loro in
un rapporto razionale. Se z è tale rapporto, possiamo
pensare a due successioni (di Cauchy) di numeri razionali che approssimano z per difetto e per eccesso.
Considerando segmenti che approssimano CD secondo i rapporti di tali sequenze con AB, per la seconda
parte della dimostrazione si ottengono segmenti che
approssimano C D secondo gli stessi rapporti con il
segmento A B . Questo ci dice che anche il rapporto
tra A B e C D deve essere z.
175
6.3. CONGRUENZA E SIMILITUDINE

A Talete bastò sfruttare la prima parte del teorema
per misurare laltezza della piramide. Secondo Plutarco, aspettò che la propria ombra avesse una lunghezza pari alla sua altezza e segnò il punto in cui arrivava lombra della punta della piramide. Sfruttando
poi il fatto che la base della piramide era quadrata
e le sue misure potevano essere prese direttamente,
non gli fu difficile calcolare laltezza esatta. Questo
metodo è noto in generale come principio dei triangoli simili, e in effetti il teorema di Talete costituisce
la base della teoria geometrica della similitudine, che
fra poco vedremo. Prima, però, osserviamo che esiste
anche un teorema inverso a quello di Talete:
Teorema 6.18 Sia dato un fascio di rette, delle quali non si sappia se sono parallele. Se, prese comunque
due trasversali r ed s si ha che a segmenti proporzionali staccati su r corrispondono segmenti nella stessa proporzione staccati su s, allora le rette del fascio
sono parallele tra di loro.
Prova: Se nel fascio esistesse una retta non parallela alle altre, chiamiamo A la sua intersezione con la
retta r. Per A facciamo passare la parallela al fascio
che incontrerà s nel punto A diverso da A . Per il
teorema di Talete, i segmenti con vertice in A hanno
le stesse proporzioni con gli altri segmenti determinate dai corrispondenti segmenti con vertice in A. Ma
questa è la stessa proprietà di cui devono godere i
segmenti con vertice in A e quindi A e A devono
coincidere. Questo vuol dire che la retta originale per
A deve coincidere con quella costruita, cioè risulta in
effetti parallela alle altre rette del fascio.
Come per la congruenza, la verifica della loro similitudine può essere semplificata rispetto a ciò che comporterebbe la definizione. Queste semplificazioni sono stabilite dai tre criteri di similitudine dei triangoli,
abbastanza analoghi ai tre criteri di congruenza.
C
@
@
C
@D
C
@
@
@
@
@
@
@
@
@
@
@
@
@
@
@
@
@
A
B
B A
B
Figura 6.17: Triangoli simili

Teorema 6.20 (I criterio di similitudine) Due
triangoli che abbiano due coppie di lati in proporzione e langolo fra essi compreso uguale, sono simili
tra di loro.
Prova: Con riferimento alla Figurs 6.17, siano ABC

e A B C due triangoli per i quali AB : A B =
b = A
c . Prendiamo sul segmento
AC : A C e A
AB un punto B (che potrebbe anche seguire B)

tale che AB = A B e da B costruiamo la parallela B C a BC. Il teorema di Talete ci dice che
AB : AB = AC : AC , e quindi, per lunicità del
quarto proporzionale deve essere AC = A C . I due
E importante unaltra conseguenza del Teorema di triangoli AB C e A B C sono quindi uguali per il
Talete:
b=B
c = B
c
primo criterio di congruenza e perciò B
b
c
c
e C = C = C . Infine, portando la parallela C D
Corollario 6.19 Se r ed s sono due rette parallele,
ad AB si ha C D = B B, essendo B BDC un
allora tutti i punti di r hanno la medesima distanza
parallelogramma, e dal teorema di Talete si deduce
da retta s.
AC : AC = BC : BC . Questa equivale alla pro

Ha senso allora definire la distanza di due rette paral- porzione AC : A C = BC : B C , il che prova che
lele r ed s come la distanza di un qualsiasi punto p anche il terzo lato è nella stessa proporzione degli
altri due.
di una delle due rette dallaltra retta.
Finalmente, diamo la seguente:
Anche il secondo criterio di similitudine è analogo

al secondo criterio di congruenza:
Definizione 6.6 Due poligoni con k lati si dicono simili se i lati sono ordinatamente nella stessa Teorema 6.21 (II criterio di similitudine) Due
proporzione e se gli angoli che essi formano sono triangoli che abbiano due coppie di angoli uguali
ordinatamente uguali.
sono simili (a meno di una eventuale rotazione
intorno a un lato).
Osserviamo esplicitamente che le due condizioni non
possono, in generale, essere ridotte; questo è dimo- Prova: Naturalmente, se due coppie di angoli sostrato dallesempio del quadrato e del rombo (che no uguali, anche la terza coppia è tale; inoltre, non
hanno i lati in proporzione, ma gli angoli diversi) e ha senso parlare di proporzionalità di due soli ladallesempio del rettangolo e del quadrato (che hanno ti. Con riferimento alla Figura 6.17, siano ABC e
b=A
c , B
b=B
c e, di congli stessi angoli, ma non i lati in proporzione). Il caso A B C due triangoli con A
b
c
pi`
u importante e interessante è quello dei triangoli. seguenza, C = C . Riportiamo su AB il punto B
176
di modo che sia AB = A B e costruiamo la parallela B C a BC. I due triangoli AB C e A B C

sono uguali per il secondo criterio di congruenza e
quindi AC = A C e B C = B C . Per il teorema di Talete abbiamo AB : AB = AC : AC , cioè
AB : A B = AC : A C . In modo analogo, oppure
costruendo la parallela C D ad AB, si provano le altre proporzioni, che si riducono a AB : A B = AC :
A C = BC : B C per la proprietà transitiva.
C Q
QQ
Q
Q
Q
Q
Q
A
H
B
Figura 6.18: Triangolo rettangolo
Infine, in analogia al terzo criterio di congruenza:

Teorema 6.22 (III criterio di similitudine) Se
Prova: Facendo riferimento alla Figura 6.18, i
due triangoli hanno i tre lati in proporzione, allora due triangoli ABC e ACH sono simili per il seconsono simili (a meno di una rotazione intorno a uno do criterio di similitudine in quanto langolo in A è
dei lati).
comune e gli angoli in C e in H sono retti. Quindi
AH : AC = AC : AB, il che prova il primo punto.
Prova: Con riferimento alla Figura 6.17, siano ABC Anche i due triangoli AHC e CHB sono simili in
e A B C due triangoli tali che AB : A B = AC : quanto entrambi simili ad ABC, e quindi vale la proA C = BC : B C . Si consideri su AB il punto B porzione AH : CH = CH : HB, e questo dimostra il
tale che AB = A B e su AC il punto C tale che secondo punto.
AC = A C . Per linverso del teorema di Talete,
Come vedremo, il celeberrimo teorema di Pitagora
B C deve essere parallelo a BC, e costruendo C D
parallelo ad AB si trova, come in precedenza, che è una conseguenza, pressoche immediata, del primo
deve essere B C = B C . I due triangoli AB C e teorema di Euclide.
A B C sono pertanto congruenti per il terzo criterio.
b=A
c
Ma ora è immediato osservare che deve essere A
La misura delle superfici
b
c
b
c
ABC = AB C = A B C e ACB = AC B = 6.4
c
A C B , il che prova che i due triangoli sono simili.
Ciò che intuitivamente chiamiamo lestensione di
Sfruttando questi criteri, Talete non avrebbe avuto una superficie può essere misurata se fissiamo unopla necessità di aspettare che la sua ombra fosse lunga portuna unità di misura. Se u è il segmento che abtanto quanto lui era alto, ma in qualsiasi momento biamo assunto come unità di misura di lunghezza,
a di
avrebbe potuto usare il fattore di proporzionalità da- convenzionalmente stabiliamo di usare come unit`
misura
di
superficie
lestensione
di
un
quadrato
di
lato dal rapporto della sua altezza e la lunghezza della
to
u.
Naturalmente,
non
possiamo
pensare
che,
data
sua ombra. Anzi, avrebbe potuto approfittare del
momento in cui i raggi del sole erano perpendicolari una superficie qualsiasi, si riesca a trovare il modo
a un lato della piramide, perche in quel momento i di sovrapporle tanti quadrati u u da ricoprirla perconti sarebbero stati pi`
u semplici. Se capisco bene la fettamente. Come per le lunghezze e gli angoli, è
descrizione che fu data del calcolo di Talete, sembra opportuno definire multipli e sottomultipli, in modo
che questi aspettasse il giorno e lora in cui la sua da poter associare ad una superficie qualsiasi un cerombra misurava quanto la sua altezza e il sole risul- to numero di quadrati unità di misura, ma, se ne è
tava perpendicolare a un lato della piramide. Santa il caso, anche una certa quantità di sottomultipli. Se
la superficie è grande, potrà essere inoltre convenienPazienza!
La pi`
u famosa applicazione del teoria della te usare qualche multiplo dellunità di misura (vedi
similitudine è costituita dai due teoremi di Euclide: Sezione 6.1). Con questo in mente, dimostriamo il
seguente teorema che è alla base della teoria della
Teorema 6.23 (Teoremi di Euclide) Sia ABC misura:
un triangolo rettangolo e sia CH laltezza relativa
Teorema 6.24 Se un rettangolo ha i lati di dimenallipotenusa; allora:
sioni a, b R+ rispetto allunit`
a di lunghezza u, alprimo teorema di Euclide: ciascun cateto è me- lora la superficie del rettangolo misura ab rispetto aldio proporzionale tra la proiezione di quel cateto lunit`
a di misura delle superfici, cioè il quadrato di
sullipotenusa e lipotenusa stessa;
dimensioni u2 = u u.
secondo teorema di Euclide: laltezza relativa al- Prova: La prova, come di regola succede per le prolipotenusa è medio proporzionale fra le due prietà che chiamano in causa i numeri reali, si divide
proiezioni dei cateti sullipotenusa.
in pi`
u parti, quattro nel caso attuale. Primo caso:
177
6.4. LA MISURA DELLE SUPERFICI

siano a, b N; allora, dividiamo il lato di misura a in
a parti, ciascuna di lunghezza u, e il lato che misura b
in b parti, e tiriamo le parallele allaltro lato passanti
per tali punti di divisione: si ottengono cos` esattamente ab quadrati unitari, e questo prova lasserto.
Secondo caso: siano a, b Q e supponiamo a = m/n
e b = p/q (le due frazioni possono essere ridotte ai
minimi termini, ma la cosa non è strettamente necessaria). Dividiamo u in nq parti uguali, di modo che
il quadrato unitario viene a contenere n2 q 2 quadretti. Tirando al solito le parallele ai lati dai punti di
divisione, si ottengono mq parti dal primo lato e pn
parti dal secondo. Gli mqnp quadratini cos` ottenuti
vanno divisi per gli n2 q 2 quadretti dellunità di misura; si ottiene quindi mqnp/n2 q 2 = mp/nq = ab. La
terza parte riguarda il caso a Q e b R: non si può
pi`
u agire come prima, ma si prendono due sequenze
di Cauchy di numeri razionali {si }iN e {ti }iN che
approssimano, per difetto e per eccesso, il numero b.
Per a e gli si , come per a e i ti , si può procedere
analogamente a quanto fatto nel secondo caso e si ottengono misure {asi }iN e {ati }iN che determinano
la misura ab. Infine, se entrambe le misure a, b sono
numeri reali, si procede in modo simile prendendo
successioni di Cauchy che approssimano, per eccesso
e per difetto, le due quantità a, b R.
za tra gli altri due lati paralleli, allora larea del

parallelogramma vale ah.
Prova: Nella Figura 6.19, sia E il punto di incontro
di AB con la perpendicolare da C al lato DC; sia poi
DF perpendicolare ad AB. I due triangoli AF D e
BEC sono congruenti per il secondo criterio e quindi
ABCD è equivalente al rettangolo F ECD, la cui area
è proprio bh.
C
A
B
B
D
C
H
Figura 6.20: Area del triangolo

Naturalmente, larea del triangolo è di importanza
non trascurabile:
Teorema 6.26 Sia dato un triangolo ABC, sia
AB = b un suo lato e CH = h laltezza relativa a
tale lato; allora larea del triangolo è bh/2.
Di solito, la misura della superficie di una figura si Prova: Si consideri la Figura 6.20. Sia D il punto
mediano dellaltezza e da D tiriamo la parallela al ladice area e si dà la seguente definizione:
to AB fino ad incontrare i lati AC e BC nei punti A e
Definizione 6.7 Due figure si dicono equivalenti se
B , rispettivamente. Su tale retta si consideri il punhanno la stessa area. Si dicono invece equiscompoto C tale che B C = A B . Per il teorema di Talete
nibili se sono scomponibili nello stesso numero finito
è anche CB = BB e A C = AA = BC . Quindi
di parti congruenti.
i due triangoli A B C e BC B sono congruenti per
Chiaramente, due figure equiscomponibili hanno la il primo criterio. In particolare, BC risulta parallestessa area. Lequiscomponibilità è un metodo for- lo ad AC; quindi il triangolo ABC è equivalente al
te per trovare la misura della superficie delle figu- parallelogramma ABC A la cui area è bh/2.
re, e non sempre risulta sufficiente, come capita nel
La Figura 6.21 mostra come larea del trapezio sia
ben noto problema della quadratura del cerchio, e data dalla formula (a + b)h/2 e quella del rombo da
cioè trovare un quadrato equivalente a un cerchio ab/2; il lettore è invitato a specificare i dettagli deldato: questo problema richiede unaltra impostazio- le dimostrazioni, che costituiscono un buon esercizio,
ne che vedremo pi`
u avanti. Per i poligoni, lequi- anche se molto semplice, di ragionamento geometrico.
scomponibilità è il concetto adeguato al calcolo delle
aree.
a
b
b
a
D
C
a
Figura 6.21: Area del trapezio e del rombo

A
Figura 6.19: Area del parallelogramma

Teorema 6.25 Sia ABCD un parallelogramma e
sia a = AB = CD un lato. Se h è la distan-
Vogliamo osservare che i due teoremi di Euclide si

possono formulare in termini di figure equivalenti:
1. il quadrato costruito su un cateto è equivalente al rettangolo che ha per lati lipotenusa e la
proiezioni del cateto sullipotenusa;
178
2. il quadrato costruito sullaltezza relativa allipo- centrale ha lato b a, la differenza dei due cateti;
tenusa è equivalente al rettangolo che ha per lati pertanto, larea del quadrato grande è:
le proiezioni dei cateti sullipotenusa.
ab
c2 = 4 + (b a)2
2
b
a
a
b
a
c
b
Figura 6.22: Teorema di Pitagora

Sulla stessa linea di questi teoremi cè il
fondamentale:
Teorema 6.27 (di Pitagora) Un triangolo è rettangolo se e solo se il quadrato costruito sullipotenusa è equivalente alla somma dei quadrati costruiti
sui cateti.
e semplificando si trova c2 = a2 + b2 . Una semplice applicazione del primo teorema di Euclide dà una
terza dimostrazione del teorema di Pitagora. Come si vede dalla Figura 6.24, il quadrato costruito
sul cateto AC è equivalente al rettangolo ADKH e
il quadrato costruito sul cateto BC è equivalente al
rettangolo HKEB. Già nel 1928 il matematica inglese Loomis ha pubblicato un libro nel quale raccoglie oltre centocinquanta dimostrazioni del Teorema
di Pitagora.
C
Prova: Esistono moltissime dimostrazioni di questo
teorema. Una delle pi`
u belle fa diretto riferimento allequiscomponibilità. I due quadrati della figura sono
cos` formati: il primo da quattro triangoli rettangoli
A
H
B
congruenti e dai quadrati dei due cateti; il secondo
dagli stessi quattro triangoli e dal quadrato dellipotenusa. Per differenza, si ha immediatamente il teorema. Viceversa, supponiamo che i tre lati a, b, c di
un triangolo siano tali che a2 + b2 = c2 ; costruiamo il
quadrato di lato a + b come nel primo disegno della
D
K
E
figura: i quattro triangoli sono congruenti per il primo criterio e quindi sia c la lunghezza di ciascuno dei
due segmenti obliqui. Costruiamo ora il secondo quaFigura 6.24: Pitagora ed Euclide
drato della figura, nella quale il lato obliquo risulta
essere di lunghezza c per la prima parte del teorema;
Il teorema di Pitagora era noto agli Egizi, almeno
questo però implica a2 + b2 = c2 , cioè c2 = c2 . Es- nel caso delle misure (3, 4, 5) dei lati, come sè visto
sendo c, c positivi questo significa c = c e perciò il nella costruzione delle rette perpendicolari. Le tertriangolo originale era rettangolo.
ne di numeri naturali (a, b, c) tali che a2 + b2 = c2
si dicono terne Pitagoriche e il lettore può direttamente verificare che tali sono (5, 12, 13) e (8, 15, 17),
oltre naturalmente alla citata (3, 4, 5). Se abbiamo
una terna Pitagorica e moltiplichiamo i tre numeri
per uno stesso valore, otteniamo ancora una terna
Pitagorica, come (6, 8, 10). In realtà, si vede immeba
diatamente che i tre numeri a, b, c sono a due a due
primi tra loro, oppure hanno tutti e tre un fattore comune. Infatti, se ad esempio a, b avessero un fattore
a
a
comune k, allora sarebbe a = kr e b = ks e quindi
c
c2 = k 2 r2 + k 2 s2 = k 2 (r2 + s2 ), cos` che k risulterebbe anche un divisore di c. Le terne Pitagoriche per
Figura 6.23: Pitagora per differenza
le quali a, b, c non hanno fattori comuni si dicono primitive. E possibile trovare tante terne Pitagoriche
Unaltra bella dimostrazione richiede luso di un quante si vogliono:
po di Algebra; si consideri la Figura 6.23. Il quadrato
179
6.4. LA MISURA DELLE SUPERFICI
Teorema 6.28 Dati due qualsiasi numeri interi ABC. Si ha pertanto la proporzione AC : AF =
m, n con m > n, la terna costituita dei numeri AB : BF . Vale allora il seguente:
a = m2 n2 , b = 2mn, c = m2 + n2 è Pitagorica.
Teorema 6.30 Se è la misura del lato obliquo nel
Prova: Basta eseguire semplici calcoli:
triangolo
armonico, allora la misura della base è
( 5 1)/2.
a2 + b2 = (m2 n2 )2 + 4m2 n2 =
Prova: Se poniamo AF = AB = x e BF = CB
= m4 + 2m2 n2 + n4 = (m2 + n2 )2
CF = x nella precedente proporzione, otteniamo
: x = x : ( x). Questo equivale allequazione
che danno il risultato desiderato.

x2 +x2 = 0 che ha come soluzioni (1 5)/2; la
Lasciamo al lettore la dimostrazione del fatto che soluzione col segno è negativa e quindi deve essere
se m ed n sono primi tra loro, allora la terna Pitago- scartata (una lunghezza non può essere negativa) e
rica che si ottiene è primitiva. Questo dimostra che le quindi segue lasserto del teorema.
terne Pitagoriche diverse sono infinite. Meno semIl numero (

5 1)/2 0.6180339887, o meglio,
plice è dimostrare che quelle cos` ottenute sono tutte
5 + 1)/2 1.6180339887, è detto
il
suo
inverso
(
le terne Pitagoriche possibili e questo noi qui non lo
rapporto
armonico
o rapporto aureo e si indica con
vedremo.
la
lettera
greca
.
Abbiamo già incontrato questa
Dal teorema di Pitagora discendono infinite conquantit`
a
a
proposito
dei numeri di Fibonacci, nella
seguenze importanti. Qui ci limitiamo a ricordare
Sezione
4.3;
esiste
infatti
una stretta connessione tra
quelle che interessano direttamente alcuni particolari
questi
due
concetti.
Dato
un segmento AB è facile
triangoli.
costruire un segmento CD che sia in rapporto con
Teorema 6.29 Se è la misura del latodi un qua- AB e che si dice costituirne la sezione aurea.
drato, allora la sua diagonale misure 2. Se è
la misura del lato
la sua Algoritmo 6.4 (Sezione aurea)
di un triangolo equilatero,
Ingresso: un segmento AB di lunghezza .

altezza misura 3/2 e la sua area 2 3/4.
Uscita: un segmento CD di lunghezza /.
Prova: Due lati consecutivi del quadrato e la diago1. si riporti due volte consecutive il segmento AB su
nale d costituiscono
un
triangolo rettangolo, per cui
una retta r; siano A B e B B i due segmenti;

si ha d = 2 + 2 = 2. Analogamente, se ABC
è un triangolo equilatero, esso risulta anche un trian2. da B si costruisca la perpendicolare ad r e su di
golo isoscele.
Dalla
Figura
6.14,
posto
h
=
CM
,
si
questa, a partire da B , si riporti un segmento
p
ha h = 2 + 2 /4 = 3/2. La formula per larea

B C di lunghezza ;
si ha eseguendo h/2.
3. siunisca A con C (il segmento A C ha lunghezza
Un caso interessante è il seguente. Si consideri un
5);
triangolo isoscele che abbia langolo opposto alla base di 36 , come nella Figura 6.25. Questo significa
4. a partire da A , si riporti un segmento A D =
che ogni angolo alla base vale (180 36 )/2 = 72 .
AB
su AC (il segmento DC ha come lunghezza
Tale triangolo viene detto triangolo armonico per la
( 5 1));
proprietà che vedremo.
5. si divida a met`
a, nel punto M , il segmento CD;
uno qualsiasi
C
dei due segmenti DM e CM ha
lunghezza ( 5 1)/2 = /.
36
Nota 6.3
F
A
Figura 6.25: Il triangolo armonico

Da A portiamo la bisettrice AF allangolo in A;
b = F AC
b = 36 e AFbB = 72 . I triangoli
quindi B AF
AF C e ABF sono isosceli e questultimo è simile ad
I Greci consideravano particolarmente

armonioso il rapporto aureo; se si costruisce un rettangolo di dimensioni AB = e BC = /, e si riporta
laltezza AD sulla base AB, il rettangolo EBCF è di
nuovo tale che EB = BC/. La costruzione si pu`
o
ripetere allinfinito, come mostrato nella Figura 6.26.
Si osservi infatti che, per costruzione, è AE = AB/
e quindi vale la proporzione AB : AD = AD : EB
in quanto EB = AB AE, e questo significa
AD : EB = AB : AE = . E interessante la curva
che si ottiene dai quarti di circonferenza che uniscono
vertici opposti e detta spirale armonica. Si dice che i
180

F
A
A
templi greci fossero costruiti in modo da conformarsi

alla sezione aurea e il rapporto armonico fu (sembra)
molto utilizzato da colui che è considerato il maggiore
artista greco, e cioè Fidia; la lettera è presa infatti
dalliniziale del suo nome. Curiosamente, il rapporto
tra due numeri consecutivi della successione di
Fibonacci tende a diventare uguale a ; ad esempio,
55/34 = 1.618, e ln-esimo
numero si pu`
o scrivere
come (n (1/)n )/ 5: provare per credere, ma

il risultato è esatto (v. Teorema 4.11). Il numero
ha colpito anche la fantasia dei moderni, ed è famoso
il Modulor, il canone inventato da Le Corbusier e
basato sul rapporto aureo; il famoso architetto lo
propose per costruire edifici e oggetti a misura
duomo. Per ulteriori informazioni si legga il libro
di Mario Livio La sezione aurea edito in Italia da
Rizzoli (2003).
Luoghi geometrici
@
B
Figura 6.26: La spirale armonica
6.5
P
@
@
Figura 6.27: Asse di un segmento

AM P e M BP sono congruenti per il primo criterio.
Infatti, AM = BM per costruzione, P M è in comune e gli angoli in M sono uguali perche retti. Quindi
AP = P B e il punto P appartiene allasse. Viceversa, prendiamo un punto P tale che P A = P B (cioè
stia sullasse) e uniamolo ad M , punto medio di AB.
Questa volta i due triangoli AM P e M P B sono congruenti per il terzo criterio, essendo AP = P B per
ipotesi, AM = BM per costruzione e P M in comune.
cP = B M
cP , che pertanto risultano retti.
Quindi AM
In conclusione, P si trova sulla retta r perpendicolare
ad AB.
Duale del concetto di asse di un segmento è il
concetto di bisettrice di due rette:
Definizione 6.9 Date due rette [che si intersecano],
si dice bisettrice delle due rette il luogo dei punti da
esse equidistanti.
Abbiamo messo tra parentesi quadre il fatto che le
rette si intersechino; se non lo fanno, se cioè sono parallele, il concetto di bisettrice ancora sussiste, ma
in tal caso la bisettrice si riduce alla retta, parallela alle rette date e passante a metà distanza tra le
due. Il lettore troverà utile lesercizio di dimostrare
rigorosamente questo fatto. Se invece le due rette si
incontrano:
Una figura è costituita da un insieme di punti; ad

esempio, un triangolo è la parte finita del piano delimitata da tre rette, a due a due non parallele. Talvolta, la proprietà che definisce i punti di una figura
è particolarmente semplice e suggestiva: si parla allora di tali figure come di luoghi geometrici o luoghi
di punti. Lesempio pi`
u semplice è senzaltro lasse di
un segmento:
Teorema 6.32 La bisettrice di una coppia di rette
incidenti in O è costituita da due rette passanti per
Definizione 6.8 Dato un segmento AB, si dice as- O, perpendicolari tra loro, che tagliano a met`
a gli
se di tale segmento linsieme (il luogo) dei punti che angoli formati dalle rette date.
hanno la stessa distanza da A e da B.
Prova:
Sia P un punto della retta tale che
Chiaramente, il punto di mezzo M del segmen- AOP
b = B OP
b ed uniamo P alle due rette r ed s
to appartiene allasse, ed è facile vedere che lasse con le perpendicolari P A e P B. I due triangoli BOP
è semplicemente una retta:
e OAP sono congruenti per il secondo criterio: il lato
b
b
b
Teorema 6.31 Lasse del segmento AB è la retta OP è in comune, AOP = B OP per costruzione e A
b
b
b
perpendicolare ad AB che passa per il suo punto di e B retti. Quindi abbiamo anche AP O = B P O e
P A = P B, cioè P appartiene alla bisettrice. Per il
mezzo M .
viceversa, se P è tale che P A = P B, P O è in comub e in B
b sono retti, per il teorema
Prova: Si consideri la Figura 6.27. Sia r la perpen- ne e gli angoli in A
dicolare per M ad AB; se il punto P sta su r e lo di Pitagora è anche AO = BO, onde i due triangouniamo con A e con B, vediamo che i due triangoli li P OA e P OB sono congruenti per il terzo criterio.
181
6.5. LUOGHI GEOMETRICI

H
HH
s
HHA
HH
b
HH
H
PA
H
O
HH
A
HH
AA
HH
r
B
W
X
M
Y
B
Figura 6.31: Baricentro
Figura 6.28: Bisettrici di due rette incidenti

b = B OP
b e quindi P appartiene
In particolare, AOP
b
alla retta che divide in due langolo AOB.
Lo stesso
ragionamento vale per la retta b . Infine, i quattro

angoli formati da b e b sono uguali tra loro come
b + AOb
b ) e
somma di angoli uguali (ad esempio, P OA
quindi sono angoli retti.
Dato un angolo, per bisettrice dellangolo si intende
la semiretta compresa nellangolo, e si ignorano le
altre tre semirette.
1. gli assi dei tre lati si incontrano in un punto,

detto il circumcentro o circocentro del triangolo;
2. le bisettrici dei tre angoli si incontrano in un
punto, detto lincentro del triangolo;
3. le altezze relative ai tre lati si incontrano in un
punto detto ortocentro del triangolo;
4. le mediane dei tre lati si incontrano in un punto
detto il baricentro del triangolo.
Prova: (1) Nella Figura 6.29, gli assi dei lati AB

e BC si incontrano in un punto D che, per costruzione, è equidistante da tutti e tre i vertici; quindi, tale punto deve appartenere anche allasse di CA.
(2) Analogamente, nella stessa figura, le bisettrici deb e C
b si incontrano in un punto E che,
N
gli angoli A
per costruzione, è equidistante da tutti e tre i laE
ti, e quindi deve appartenere anche alla bisettrice
D
b (3) Con riferimento alla Figura 6.30, si codi B.
struiscano le rette per A, B, C parallele, rispettivamente, ai lati BC, AC, AB del triangolo. Esse deA
M
B
terminano il triangolo P QR e considerati i paralleFigura 6.29: Incentro e circocentro
logrammi ABP C, BCQA, ARBC, si trova che i lati
P Q, QR, P R sono il doppio di AB, BC, CA. Pertanto, le altezze AHA , BHB , CHC sono gli assi dei lati
Q
C
P
QR, RP, P Q, che si incontrano in un punto H per
H
A
il
primo asserto. (4) Infine, facendo riferimento alla
HB
Figura 6.31, siano M, N, P i punti di mezzo dei lati
del triangolo ABC. Sia W il punto di incontro delle
due mediane BN ed AM e si considerino i segmenti
M
N ed XY , dove X ed Y sono i punti mediani di
A
B
HC
AW e BW . Per il Teorema di Talete, M N = XY ed
entrambi sono metà di AB. I due triangoli W M N e
W XY sono uguali, avendo uguali i tre angoli ed i lati
M N ed XY . Questo significa che W divide sia BN
che AM in due parti, di cui una è doppia dellaltra.
R
Si esegua la stessa costruzione relativa alle mediane
Figura 6.30: Ortocentro
AM e CP : si trova che il punto di intersezione W
le divide in due parti, di cui una è doppia dellalAssi e bisettrici sono importanti nei triangoli, dove tra. Questo però significa che M W = M W , essendo
abbiamo il seguente risultato:
entrambi un terzo di AM , e quindi W = W .
C
Teorema 6.33 Sia ABC un triangolo; allora:
E allora immediato il seguente:
182
Corollario 6.34 Il baricentro di un triangolo divide la circonferenza, che rimane tutta dalla stessa parte
ciascuna delle tre mediane in due parti, di cui una è rispetto ad r. Viceversa, sia s una retta per P non
perpendicolare ad OP . Tiriamo da O la perpendidoppia dellaltra.
colare ad s, che incontrerà s in un punto M ; per il
Eulero osservò che lortocentro, il baricentro e il cir- teorema di Pitagora OM < OP e quindi M è intercumcentro sono allineati; lasciamo però da parte la no alla circonferenza. Se P è il punto su s tale che
dimostrazione di questa curiosa proprietà.
P M = M P (ma dalla parte opposta di P rispetto ad
Sicuramente, il luogo geometrico pi`
u importante è M ), abbiamo P O = P O e quindi P sta sulla circoncostituito dalla circonferenza:
ferenza. Quindi la retta s incontra la circonferenza in
Definizione 6.10 Si dice circonferenza di raggio r il almeno due punti P e P e non la lascia tutta dalla
luogo dei punti che hanno distanza r da un punto fis- stessa parte. Quindi r è unica.
sato O, detto centro della circonferenza. Si dice cerchio di raggio r il luogo dei punti che hanno distanza
minore o uguale ad r da un punto O detto centro del
cerchio. Ogni segmento (di lunghezza r) che unisce
il centro del cerchio o della circonferenza al bordo del
cerchio o alla circonferenze si dice raggio. Due raggi
distinti che giacciono sulla stessa retta costituiscono
un diametro, la cui lunghezza è pertanto 2r.
Naturalmente, una circonferenza determina un cerchio, costituito da tutti i punti interni alla circonferenza, e viceversa un cerchio determina una circonferenza, data dai punti del suo bordo o contorno. E
bene tuttavia usare la terminologia appropriata per
non creare confusione o ambiguità; ad esempio, la misura della circonferenza è una misura lineare, mentre
la misura del cerchio è una misura di superficie.
P
Q
O
r
Figura 6.32: Tangente a una circonferenza

Teorema 6.35 Sia data una circonferenza di centro
O e raggio r, e sia P un punto su di essa. Esiste
una e una sola retta r che passa per P e lascia tutta
la circonferenza dalla stessa parte. Tale retta risulta
perpendicolare al raggio OP e si dice la tangente in
P alla circonferenza.
Tornando un attimo ai triangoli, si osservi che il circumcentro D è equidistante dai tre vertici del triangolo e quindi se si disegna una circonferenza di centro
D e passante per uno dei vertici, essa toccherà anche gli altri due, lasciando il triangolo al suo interno.
Questa circonferenza risulta circoscritta al triangolo,
ed è per questo che il circumcentro ha tale nome. In
modo simile, lincentro E è equidistante dai tre lati,
pertanto se disegniamo una circonferenza di centro
E e raggio dato dalla distanza di E da uno qualsiasi
dei tre lati del triangolo, questa circonferenza risulta
tangente ai tre lati ed è tutta contenuta allinterno
del triangolo; si dice che questa è la circonferenza inscritta nel triangolo, ed è per questo che E si dice
lincentro.
Altri luoghi geometrici importanti sono le cosiddette coniche: lellisse, la parabola e liperbole; come
si sa, queste curve hanno il nome di coniche perche
possono essere ottenute intersecando un cono con un
piano. Per cono si intende la figura solida originata
da una retta che ruota nello spazio intorno ad unaltra retta ad essa incidente: la retta ruotante si dice
la generatrice del cono, mentre la retta fissa è detta
lasse del cono, e il loro punto dincontro si dice il
vertice del cono (si veda anche la Sezione 6.8). Se si
considera un piano incidente con lasse del cono, lintersezione risulta unellisse; nel caso particolare in cui
il piano sia perpendicolare allasse si ottiene una circonferenza, che pertanto deve essere considerata una
conica, caso particolare di ellisse. Se il piano è parallelo alla generatrice, la figura che si ottiene è una
parabola. Infine, se il piano è parallelo allasse, si ha
uniperbole.
Queste definizioni classiche sono, comunque, meno
utili nella pratica delle definizioni di queste curve come luoghi geometrici; come vedremo, le definizioni saranno utilizzate in Geometria Analitica per ottenere
lequazione delle curve.
Definizione 6.11 Dati due punti F1 ed F2 , detti

Prova: Nella Figura 6.32 si consideri la retta r pas- fuochi, si dice ellisse il luogo geometrico dei punti la
sante per P e perpendicolare ad OP . Se prendiamo su cui somma delle distanze da F ed F è costante.
1
2
r un punto Q diverso da P , il triangolo OP Q è retto
Come conseguenza di questa definizione, lellisse
in P e quindi, per il teorema di Pitagora, OQ > OP ;
quindi r non ha altri punti in comune, se non P , con (vedi Figura 6.33) risulta essere una figura limitata,
183
6.6. LA GEOMETRIA DELLA CIRCONFERENZA
P
b
b
b
b
b
F1
F2
b
b
bF
d
Figura 6.33: Costruzione dellellisse
Figura 6.35: Costruzione della parabola
cioè racchiusa in una porzione finita del piano, come

la circonferenza; in effetti, se i due fuochi coincidono lellisse diventa proprio una circonferenza avente
F1 = F2 come centro, e per raggio la metà della costante, somma delle distanze dai fuochi. In modo
analogo:
è la costruzione dellellisse, che generalizza il metodo

empirico per disegnare una circonferenza, cioè piantare uno spillo nel centro della circonferenza e tenere
una matita a distanza fisse collegandola allo spillo con
una cordicella. Per lellisse, come si vede nella Figurs
Definizione 6.12 Dati due punti F1 ed F2 , detti 6.33, fissati due spilli nei fuochi e unitoli con una corfuochi, si dice iperbole il luogo geometrico dei punti dicella di lunghezza uguale alla somma delle distanze,
la cui differenza delle distanze da F1 ed F2 è costante. la figura si ottiene facendo scorrere la matita lungo la
corda, cos` che questa rimanga sempre distesa. Ancora oggi i giardinieri tracciano i confini delle aiole
a forma di cerchio e di ellisse con questi metodi; al
posto degli spilli usano paletti e invece di filo utilizzano una corda. Pi`
u complessa è la costruzione pratica
delliperbole e della parabola, che si possono comunque disegnare per punti seguendo le corrispondenti
definizioni. Comunque, liperbole della Figura 6.34 è
Fb1
Fb2
stata costruita per punti in modo analitico, come si
imparerà nel prossimo capitolo.
6.6
Figura 6.34: Liperbole

In questo caso (v. Figura 6.34), i punti delliperbole possono essere distanti dai fuochi quanto si vuole,
purche la differenza rimanga fissata; pertanto, liperbole è una figura non limitata. Analogamente non
limitata è la parabola:
Definizione 6.13 Dato un punto F detto fuoco e
una retta d detta direttrice, si dice parabola il luogo
dei punti equidistanti da F e da d.
Le definizioni possono essere utilizzate per costruire effettivamente le curve. Particolarmente semplice
La geometria della circonferenza
Le proprietà della circonferenza sono interessanti

quanto quelle dei triangoli, e, come questi sono i poligoni che pi`
u spesso si incontrano nella pratica, cos` la
circonferenza è la curva non poligonale pi`
u frequente.
Il fatto che possa essere disegnata in modo elementare
con il compasso, la rende di facile uso e, daltra parte, sembra che la Natura si sia ispirata pi`
u alle forma
rotonde che a quelle poligonali. Una caratteristica
importante è costituita dal fatto che la circonferenza è determinata univocamente da tre dei suoi punti.
Ciò è stabilito da un teorema e dalla corrispondente
costruzione:
Teorema 6.36 Dati tre punti non allineati A, B, C
esiste una e una sola circonferenza che passi per tali
tre punti
184

C
Figura 6.36: Circonferenza per tre punti

Prova: Si consideri la Figura 6.36. Sia r lasse
del segmento AB e sia s lasse del segmento BC. Se
A, B, C non sono allineati, r ed s non sono paralleli
e si incontrano nel punto O. Questo punto ha la
stessa distanza da A e da B (trovandosi sullasse r del
relativo segmento) e da B e da C (trovandosi sullasse
s del relativo segmento). Quindi, la circonferenza di
centro O e raggio OA = OB = OC passa per i tre
punti, ed è unica, avendo centro e raggio determinati.
C e D, langolo determinato dalle due semirette si

dice angolo alla circonferenza. Se un angolo al centro
e un angolo alla circonferenza determinano lo stesso arco AB, si dicono corrispondenti; se invece uno
determina larco AB e laltro larco esplementare, si
dicono corrispondenti esplementari.
Si osservi che raddoppiando langolo al centro anche
larco circolare corrispondente raddoppia; ciò ci dice che angoli ed archi sono grandezze direttamente
proporzionali, e questo fatto, importante di per se,
verrà usato in Trigonometria per definire la misura
in radianti degli angoli.
P
Ob
Ob
Figura 6.38: Angoli al centro e alla circonferenza - 1

Le proprietà principali della circonferenza sono leQuesta lunga definizione introduce una serie di congate alla seguente definizione, per la quale si faccia
cetti importanti, che vanno ritenuti esattamente, inriferimento alla Figura 6.37.
sieme alla definizione di retta tangente. Si ha allora
il fondamentale risultato:
P
Teorema 6.37 Sia data una circonferenza di centro

b è
O e sia P un punto qualsiasi su di essa; se AOB
un angolo al centro ed APbB un suo corrispondente
angolo alla circonferenza, allora il primo è il doppio
del secondo.
Prova: Sono da considerare tre casi, a seconda delle

posizioni reciproche dei punti. Nel primo caso (Figura 6.37) si osservi che i triangoli AOP e BOP sono
AC
BD
b =
isosceli; per il teorema dellangolo esterno: QOA
b + APbO = 2APbO e QOB
b = OBP
b + B PbO =
OAP
Q
2B PbO; sommando membro a membro queste due
b = 2APbB. Nel secondo caso
uguaglianze si ha: AOB
Figura 6.37: Proprietà della circonferenza
(Figura 6.38, a sinistra) AOP e BOP sono ancora
isosceli; il teorema dellangolo esterno questa volta
dà:
Definizione 6.14 Data una circonferenza, si dice
b = OPbA + AOP
b = 2OPbA
AOQ
angolo al centro ogni angolo che abbia come vertice il
b = OPbB + P BO
b = 2OPbB;
B OQ
centro O della circonferenza. Se le due semirette che
formano langolo incontrano la circonferenza nei pun- facendo la differenza si ha AOB
b = 2APbB. Infine, nel
ti A e B, la parte di circonferenza interna allangolo caso di transizione (Figura 6.38, a destra), il teorema
si dice arco circolare interno; laltra parte si dice arco
b = OPbB +P BO
b =
dellangolo esterno dà subito AOB
circolare esterno o esplementare. La parte di cerchio
b
2AP B, essendo isoscele il triangolo BOP .
compresa nellangolo si dice settore circolare e il segCome si capisce dalla dimostrazione, la posizione
mento che unisce i due punti A e b è detto corda. Se
P è un punto della circonferenza e da esso partono del punto P sulla circonferenza è inessenziale. Cosa
due semirette che tagliano la circonferenza nei punti succede allora quando P si avvicina ad A o a B, tanto
185
6.6. LA GEOMETRIA DELLA CIRCONFERENZA

da confondersi con tali punti? Quando P tende ad
A, la semiretta P B rimane ben identificata, ma cosa
accade alla semiretta P A? Si può intuire che essa si
trasformi nella tangente passante per A P e quindi
ci possiamo aspettare che il teorema valga anche in
questo caso limite. Possiamo comunque stabilire questo fatto con un teorema che consideri la situazione
come un problema a se stante, e non un problema al
limite (vedere Figura 6.39 a sinistra):
Ob
O
A
B
r
B
P
Corollario 6.41 Un triangolo inscritto in una semicirconferenza è retto e, viceversa, ogni triangolo rettangolo pu`
o essere inscritto in mezza
circonferenza.
Prova: Se un triangolo è inscritto in mezza circonferenza, allora lipotenusa coincide con un diametro;
esso determina un angolo al centro di 180 , e quindi
langolo opposto, come corrispondente alla circonferenza, vale 90 . Per il viceversa, basta osservare che il
circumcentro del triangolo è giusto il punto di mezzo
dellipotenusa.
Questo corollario è alla base di molte considerazioni
sui triangoli rettangoli ed è quasi importante come il
Teorema di Pitagora. Vediamo, a mo di esempio, come questo corollario, abbinato ai teoremi di Euclide,
ci permetta di trovare il medio proporzionale tra due
segmenti (vedere Figura 6.40):
Figura 6.39: Angoli al centro e alla circonferenza - 2

b un angolo al centro e sia
Teorema 6.38 Sia B OA
b
B Ar langolo formato dalla retta AB e dalla retta
b =
tangente alla circonferenza r in A; allora B OA
b
2B Ar, che pertanto pu`
o essere considerato un angolo
alla circonferenza di tipo degenere.
M BCH D
Figura 6.40: Costruzione del medio proporzionale

b è retto, si ha: B Ar
b =
Prova: Poiche langolo OAr
b
90 OAB;
il triangolo BAO è isoscele e quindi
b
b cioè B OA
b = 180 2(90 Algoritmo 6.5 (Medio proporzionale)
B OA = 180 2OAB,
Ingresso: Due segmenti AB e CD;
b
b
B Ar) = 2B Ar, che è ciò che volevamo dimostrare.
Uscita: Il segmento P H tale che AB : P H = P H :
Ci possiamo ora chiedere cosa succede se consi- CD.
deriamo langolo esplementare (vedere Figura 6.39 a
1. si riportano su una retta i due segmenti in modo
destra):
che B C; si ottiene cos` il segmento AD;
b
b
Teorema 6.39 Sia AOB un angolo al centro e AP B
2. dal punto di mezzo M di AD si traccia una
un angolo alla circonferenza che insiste sullarco
semicirconferenza di raggio AM ;
b
b è doppio del
esplementare di AOB.
Allora AOB
3. dal punto B C H si traccia la perpendicolasupplementare di APbB.
re ad AD fino ad incontrare la semicirconferenza
b langolo esplementare di
Prova: Sia 360 AOB
nel punto P (si osservi che ADP è un triangolo
b che insiste sullarco esplementare AB; per il
AOB
rettangolo, di cui AB e CD sono le proiezioni
b = 2APbB, cioè
Teorema 6.37 si ha allora: 360 AOB
dei cateti sullipotenusa);
b
b
AOB = 2(180 AP B) che è proprio la proprietà che
4. il segmento P H è il medio proporzionale cercato
volevamo dimostrare.
(P H è laltezza relativa allipotenusa).
Ricco di applicazioni è anche il seguente:
Corollario 6.40 Se un quadrilatero è inscritto in
una circonferenza, allora gli angoli opposti sono
Teorema 6.42 Sia data una circonferenza e sia P
supplementari.
un punto fuori di essa. Sia P T una tangente da P
alla circonferenza e sia P AB una retta secante la cirProva: Infatti sono angoli alla circonferenza che
conferenza che la taglia nei punti A e B. Vale allora
insistono su un arco e sul suo esplementare.
la proporzione: P A : P T = P T : P B, cioè il segmenUna conseguenza molto importante dei teoremi to di tangente è medio proporzionale tra i segmenti
visti è il seguente:
staccati su una secante della circonferenza.
186

leggermente semplificare e si ottiene una formula interessante quando come secante alla circonferenza si
considera la retta OP :
d
A
A
B
Figura 6.41: Tangente e secanti dallo stesso punto
Prova: Si congiungano (v. Figura 6.41) A e B con
T e si considerino i triangoli P AT e P T B; essi sono
simili perche hanno langolo Pb in comune e gli angoli
b e ATbP uguali, poiche entrambi insistono sulABT
larco AT (quindi anche i terzi angoli sono congruenti). Da questa similitudine discende la proporzione
cercata.
Questo significa che il prodotto P A P T è costante
e quindi se, come in figura, P A B è unaltra secante
alla circonferenza, si ha P A?P B = P AP B = P T 2 .
Poiche il medio proporzionale si sa costruire, questo
teorema permette di trovare il punto T di tangenza
alla circonferenza di una retta passante per P :
Algoritmo 6.6 (Tangenti da un punto esterno)
Ingresso: Una circonferenza e un punto P ad
essa esterno;
Uscita: I punti di tangenza sulla circonferenza delle
rette passanti per P ;
1. Si traccia una secante P AB qualsiasi;
2. Si costruisce, come visto in precedenza, il medio
proporzionale tra i segmenti P A e P B; sia CH
tale segmento;
3. con il compasso, facendo centro in P , si traccia
una circonferenza di raggio CH;
4. i punti in cui questa circonferenza taglia quella
data sono i punti di tangenza cercati;
5. si uniscono, se si vuole, al punto P .
Sia data una circonferenza di centro O. Se P è
un punto del piano che non sia il centro della circonferenza, si dice distanza di P dalla circonferenza
la lunghezza del segmento P A, dove A è il punto di
intersezione della circonferenza con la retta P O. E
chiaro che se P O, la distanza è il raggio della
circonferenza e che se P si trova sulla circonferenza
la distanza è zero. I risultati precedenti si possono
Corollario 6.43 Se P è un punto esterno a una

circonferenza di raggio r e d è la distanza di P
dalla circonferenza, allora la misura t del segmento Pp
T che unisce P a uno dei punti di tangenza è:
t = d(d + 2r).
Prova: Come detto, basta considerare come secante

la retta P O.
La quantità t2 si dice la potenza del punto P rispetto

alla circonferenza. Dalla Figura 6.41, si ha t2 = P A
P B = P A P B .
Il problema di determinare la misura della circonferenza e il calcolo dellarea del cerchio assillarono (se
cos` si può dire) i matematici antichi, e anche quelli
pi`
u moderni, diciamo fino al XIX secolo. Il problema
consiste nel determinare il valore esatto del numero
, il rapporto tra circonferenza e diametro. Gli Egizi
e i Babilonesi si erano accorti che questo rapporto è
fisso, cioè indipendente dalla particolare circonferenza o dal particolare cerchio considerato. Essi usavano
stime pi`
u o meno approssimate: stime grossolane come 3 o molto pi`
u accurate come il valore razionale
22/7 = 3.142857 . . .. Immaginando appunto che
fosse un numero razionale, si tentò di trovare un metodo di scomposizione del cerchio che ne dimostrasse
lequivalenza con una figura, della quale si potesse
trovare direttamente larea (problema della quadratura del cerchio). In effetti, la
cosa avrebbe potuto
funzionare anche se , come 2, fosse stato un numero irrazionale, ma esprimibile per mezzo di radicali. Nonostante infiniti tentativi, nessuno fu capace
di quadrare il cerchio, finche, nel 1882, Lindemann
riusc` a dimostrare che è un numero trascendente,
cioè non può essere soluzione di unequazione algebrica (polinomiale) a coefficienti interi. Ciò implica
che la quadratura del cerchio (o la rettificazione della
circonferenza) è impossibile se si usano solo la riga
e il compasso. Infatti, come vedremo studiando la
Geometria Analitica, la retta corrisponde ad unequazione algebrica di primo grado e la circonferenza
a una di secondo grado; quindi, ogni problema risolubile con la riga e il compasso corrisponde a un
sistema di equazioni algebriche, equivalente a ununica equazione algebrica, come si può intuire pensando
al metodo di sostituzione.
La determinazione di è il problema di base della
misurazione di circonferenze e cerchi; infatti, vale il
seguente:
Teorema 6.44 Sia il rapporto tra la misura di una
circonferenza e il suo diametro; dato un cerchio di
raggio r, la sua area misura r2 , e la circonferenza
che lo delimita ha lunghezza 2r.
187
6.7. POLIGONI REGOLARI E CERCHIO

Prova: La misura della circonferenza è ovvia, per
la definizione di . Per larea, possiamo immaginare
di suddividere il cerchio in tanti triangoli isosceli congruenti con il vertice opposto alla base nel centro e gli
altri vertici in punti molto vicini della circonferenza,
diciamo a distanza a luno dallaltro. Se n è il numero
di tali triangoli, la lunghezza del perimetro sarà na
e questa quantità è assimilabile alla lunghezza della
circonferenza 2r quando n è molto grande. Daltra
parte, quando n è molto grande, a è molto piccolo
e quindi lapotema (cioè laltezza dei vari triangoli)
è assimilabile al raggio. Questo vuol dire che larea
di ciascun triangolo è ar/2 e larea del cerchio sarà
assimilabile a:
nar/2 = 2rr/2 = r2
un suo valore approssimato per difetto e per eccesso. In quanto allarea, è chiaro che lapotema dei vari
poligoni, al crescere di n, si avvicina sempre di pi`
u
al raggio, e ciò rende conto di quanto affermato nel
teorema precedente.
Concludiamo questa sezione con la seguente
definizione:
Definizione 6.15 Si dicono concentriche due o pi`
u
circonferenze che hanno lo stesso centro. Larea
compresa tra due circonferenze concentriche si dice
corona circolare.
Per differenza, è immediato osservare che larea di
una corona circolare determinata da due circonferenze di raggio R ed r (con R > r) è: A = (R2
r2 ).
come desiderato.
6.7
Figura 6.42: Area del cerchio

Questa dimostrazione, anche se intuitivamente valida, non è certamente molto rigorosa, almeno nella
forma in cui labbiamo messa. Per cercare di renderla pi`
u precisa, si immagini di costruire dei poligoni
inscritti e circoscritti alla circonferenza che si vuole
misurare (v. Figura 6.42); se questi poligoni hanno
lo stesso numero di lati n e facciamo crescere n tanto quanto vogliamo, il perimetro e larea dei poligoni
si avvicineranno alla lunghezza della circonferenza e
allarea del cerchio, e differiranno tra di loro sempre
meno, fino a che questa differenza non divenga praticamente nulla. Se Pn è il perimetro del poligono
circoscritto, pn di quello inscritto e c è la misura della circonferenza, si ha Pn c pn e Pn pn tanto
piccolo da essere pressoche 0; nella terminologia delle successioni di Cauchy, esse determinano lo stesso
numero reale. Ma Pn e pn possono essere calcolati e
questo ci darà una forte caratterizzazione di , cioè
Poligoni regolari e cerchio
Riprendiamo ora la definizione di poligono regolare data nella Sezione 6.2. Se dai vertici disegniamo
le bisettrici agli angoli, queste si intersecano in un
punto detto centro del poligono: infatti, tutti i triangoli determinati dai lati e da queste bisettrici devono
essere uguali per il secondo criterio di congruenza.
Quindi il centro del poligono è equidistante da tutti
i vertici, e questo significa che il poligono può essere
circoscritto da una circonferenza che ha per raggio la
distanza dal centro di ciascun vertice. Daltra parte, i triangoli considerati sono tutti isosceli, avendo
gli angoli alla base uguali. Quindi la circonferenza
di centro il centro del poligono e raggio la distanza di tale centro dai lati (cioè laltezza dei triangoli
isosceli), è inscritta nel poligono. In altri termini, il
poligono è delimitato da una circonferenza inscritta
e da una circoscritta; il raggio del cerchio inscritto
si dice apotema del poligono ed ha un ruolo molto
importante.
Teorema 6.45 Il perimetro di un poligono regolare
è dato dal prodotto della misura di ciascuno dei suoi
lati per il numero dei lati stessi. Larea è data dal
perimetro moltiplicato per lapotema e diviso per 2.
Prova: La relazione per il perimetro è ovvia. Per
larea, si divida come visto il poligono in tanti triangoli congruenti; larea di ciascun triangolo si ottiene
moltiplicando il lato per lapotema e dividendo per 2.
Moltiplicando ora questo per il numero dei lati, si ha
la formula richiesta.
Da questa formula discende limportanza del concetto
di apotema, la cui misura sarà indicata con a. Quando frequentavo le Scuole Elementari, ci insegnavano
a trovare larea di un poligono regolare calcolando
lapotema; questo si trovava moltiplicando il lato
188
per un numero fisso, variabile però da poligono a poE

D
ligono. Tali numeri erano la mia ossessione, perche
non riuscivo a figurarmi come venissero fuori. Solo
alla Scuola Media il mistero si cominciò a sciogliere e
quella fu per me una bella conquista. La TrigonomeO
tria risolve il problema, ma nei casi pi`
u semplici sono
F
C
sufficienti considerazioni elementari. Ci proponiamo
pertanto di determinare il valore dellapotema di molti poligoni regolari, esprimendolo in funzione del lato
(la cui lunghezza sarà indicata con ) e in funzione
A
M
B
del raggio del cerchio circoscritto (la cui lunghezza
sarà indicata con r); un minimo di algebra ci perFigura 6.44: Esagono regolare
metterà pertanto di calcolare una qualsiasi delle tre
quantità a, , r da ciascuna delle altre. In questa ricerca escluderemo quei poligoni, come lettagono (il Teorema 6.48 Per il poligono
regolare consei lati,
poligono regolare con sette lati) che richiedono no- lesagono, abbiamo: a = 3/2 ed a = r 3/2
zioni che saranno viste solo nel capitolo relativo alla 0.866 r.
Trigonometria. Cominciamo col caso pi`
u semplice:
b vale 360 /6 = 60 e quindi il
Prova: Langolo AOB
triangolo
ABO
`
e
equilatero.
Di conseguenza AB =
Teorema 6.46 Per il pi`
u semplice dei poligoni
regoOB,
cio`
e
=
r
e
questo
conclude
la dimostrazione,
lari, il triangolo equilatero, si ha: a = 3/6
poich
e
lapotema
OM
`
e
laltezza
di
tale triangolo.
0.289 ed a = r/2 = r 0.5.
C
C
D
O
O
A
B
A
N
B
O
Figura 6.43: Triangolo e quadrato
A
Prova: Facendo riferimento alla Figura 6.43, il
centro O è anche il punto di incontro delle mediane
Figura 6.45: Pentagono e decagono
e quindi lapotema è OM = OC/2 e questo dà la seconda formula. Inoltre, come
Il caso del pentagono si affronta meglio se risolvia sappiamo, CM è anche
laltezza, per cui CM = 3/2; applicando ancora mo il problema per il decagono, il poligono regolare
laregola della mediana abbiamo: OM = CM /3 = con dieci lati:
3/6.
Teorema 6.49 Per il poligono regolare con dieci
Anche per il quadrato la valutazione è semplice:
lati, il decagono, si ha:
s
Teorema 6.47 Per il poligono regolare conquattro

5+1
5+ 5
1.539
a=
lati, il quadrato, si ha: a = /2 ed a = r 2/2
2
8
0.707 r.
s
5+ 5
Prova: Facendo riferimento alla Figura 6.43, laa=r
0.951 r
potema OM è chiaramentemetà del lato CB.Inol8
tre, come si sa, OB = OM 2 da cui OM = r 2/2.
Prova: Con riferimento alla Figura 6.45 dove AB è il
b vale 360 /10 = 36
lato del decagono, langolo AOB
Saltiamo per il momento il pentagono e passia- e quindi ABO è il triangolo armonico che conosciamo ad occuparci dellesagono, un altro caso molto mo. Per quanto
visto nel Teorema 6.30 abbiamo:
semplice:
= r ( 5 1)/2; questo permette di calcolare
189
6.7. POLIGONI REGOLARI E CERCHIO
Prova: Facciamo ancora riferimento alla Figura

6.45, immaginando che AC sia il lato del quadrato
e AB = sia quello dellottagono. Poiche ON
è lapotema del quadrato, abbiamo N B = r r 2/2 =
2
2
2
r(2 2)/2 e di conseguenza AB
= AN + N B =
p
. Quindi AB = = r 2 2 e, vicever(2 2)r2p
2
2
sa, r = / 2 2. Ora, da OM = r2 AM si
2
2
trova OM = (2 + 2)r /4 = a2 , da cui si ricava la
Siamo ora in grado di risolvere il caso del seconda formula. Poi, essendo a2 = r2 (/2)2 , si ha:
pentagono:
2
2
3+2 2 2

a2 =
=
,
Teorema 6.50 Per il poligono regolare con cinque
4
4
2 2
lati, il pentagono, si ha:
espressione equivalente alla prima formula.
s
1+ 5 5+ 5
Per lennagono e lundecagono le cose si fanno pi`
u
0.688
a=
4
10
difficili, ma il lettore potrà affrontare lutile esercizio
di trovare le espressioni per lapotema del dodecagono

1+ 5
(il poligono regolare con 12 lati) partendo dallesagoa=r
0.809 r.
4
no e procedendo in modo analogo a quanto si è fatto
Prova: Facendo ancora riferimento alla Figura 6.45, per lottagono.
il segmento AC rappresenta il lato del pentagono e
Abbiamo già osservato che ogni poligono regolare,
ON lapotema. Si prenda B simmetrico di B rispetto oltre ad essere inscritto nella circonferenza di ragb = CB
c B = 72 , si ha B CB
b = gio OA, la distanza del centro del poligono da uno
ad AC, e poiche C BB
18 , per cui CBB è simile a BOA. Quindi BB : qualsiasi dei suoi vertici, è anche circoscritto alla cirAB = BC : OB, e poiche BC = AB si ricava:
conferenza che ha per centro O e raggio OM , lapo
!2
tema dello stesso poligono. Vogliamo ora affrontare
51
3 5
1
il calcolo approssimato di seguendo limpostazione
r=
r.
BN =
2
2
4
appena accennata. Ci saranno utili due risultati, il
primo dei quali già lo conosciamo, almeno in un paio
Sottraendo questa quantità da OB = r si ha per la- di casi particolari.
potema lespressione desiderata. Per il segmento CN
Teorema 6.52 Sia la misura del lato di un poligosi ottiene allora:
no regolare con n lati inscritto in una circonferenza
s
!2
di raggio unitario; allora la misura del lato del po1+ 5

5 5
2
CN = r2
r2 ; CN = r
.
ligono di 2n lati inscritto nella stessa circonferenza
4
8
è:
q
p
Facendo infine il rapporto tra lapotema già trovato
= 2 4 2 .
e il lato AC = 2 CN si trova:
Prova: Sia, come nella Figura 6.45, AC = il la s
s
to del poligono di n lati inscritto nella circonferenza
1+ 5
a
2
1+ 5 5+ 5
=
=
unitaria di centro O; sarà quindi AB = il lato del
4
4
10
5 5
b
poligono di 2n lati, essendo OB la bisettrice di AOC.
Poiche OAC è un
AN = /2
come desiderato.
ptriangolo isoscele, si hap
e quindi ON = 1 2 /4 e BN = 1 1 2 /4.
Lottagono, il poligono regolare con 8 lati, ha ri- Poiche langolo in M è retto, si ha il valore di BA:
spetto al quadrato la stessa relazione che il decagov
s
!2
u
r
r
no ha con il pentagono; questa volta, però, proceu
2
2
diamo allinverso, sfruttando le nostre conoscenze sul

+
= 22 1
=
1 1
4
4
4
quadrato.
lapotema OM applicando il teorema di Pitagora ad
2
AM O: OM = r2 r2 ( 51)2 /4 = r2 (10+2 5)/16,
cioè:
s
5+ 5
r.
OM =
8
Sostituendo ora ad r il valore 2/( 5 1) = ( 5 +

1)/2, si ha subito anche la prima espressione.
Teorema 6.51 Per lottagono si ha:

p
3+2 2
1.207
a=
2
p
2+ 2
a=r
0.924 r
2
e questo dà =
2 4 2 .
Questo teorema si trasforma facilmente in un algoritmo per calcolare il perimetro di un poligono di

2n lati; come sappiamo il quadrato inscritto nella circonferenza
di raggio unitario ha come semiperimetro
2 2 2.828, per cui:
190
Algoritmo 6.7 (Valori per difetto di )

Ingresso: Un numero naturale n > 2;
Uscita: Il perimetro del poligono regolare con 2n lati;
1. si pone := 2 e j := 2;
2. fino a che risulta j n si calcola:
(a) j := j + 1;
p
(b) := 2 4 2 ;
lati
4
8
16
32
64
128
256
512
1024
per difetto
2.8284271247
3.0614674589
3.1214451523
3.1365484905
3.1403311570
3.1412772509
3.1415138011
3.1415729404
3.1415877253
per eccesso
4.0
3.3137084990
3.1825978781
3.1517249074
3.1441183852
3.1422236299
3.1417503692
3.1416320807
3.1416025103
3. si esce con p := 2n .
Per i poligoni circoscritti si ha il seguente:
Tabella 6.2: Valori di per difetto e per eccesso
Teorema 6.53 Sia la misura del lato del poligono

regolare di n lati circoscritto alla circonferenza uni- cioè:
!
r
taria; allora la misura del lato del poligono con 2n
.
2
2
lati circoscritto alla stessa circonferenza vale:

1+
=
AS = 1 +
2
4
4
2
p
= 4( 1 + 2 /4 1)/
r
!
.
2
.
=
1+
1
,
4
2
e questa è la metà del lato del poligono con 2n lati.
B
Figura 6.46: Poligono circoscritto

Prova: Nella Figura 6.46, sia AT = /2 metà
del lato del poligono di n lati. Sia OS la bisettrib ; i due triangoli BAT e OST sono simili
ce di AOT
b è langoperche langolo Tb è comune e langolo B AT
lo alla circonferenza corrispondente allangolo al cenb del quale, pertanto, vale la metà. Si ha
tro AOB
allora la proporzione: OT : AT = T S : BT , cioè
OT : AT = (AT AS) : (OT OB). Daltra parte,
abbiamo AT = /2 e quindi:
OT =
OA + AT =
1 + 2 /4.
La proporzione diviene:
p
p
1 + 2 /4 : /2 = (/2 AS) : ( 1 + 2 /4 1).
Pertanto:
AS =
2
!r
2
2 .
1+
1+
1
,
4
4
2
Un algoritmo analogo al precedente ci dà allora i

valori di approssimati per eccesso. Nella Tabella
6.2 riportiamo i valori ottenuti fino al poligono con
1024 lati. Si osservi che la media degli ultimi due
valori è 3.1415951178 contro un valore effettivo =
3.1415926536 . . ..
Nota 6.4
Il valore di , come rapporto tra la circonferenza e il diametro, è stato oggetto di curiosit`

ae
di ricerca fino dalla pi`
u remota antichit`
a. Nella Bibbia
si trova il valore 3 e nel papiro di Rhind viene utilizzata una quantit`
a che vale 3.1605. Lapprossimazione razionale che ha avuto pi`
u successo è stata
22/7 3.142857 . . ., anche se i cinesi e gli occidentali
conoscevano 355/113, che ha ben sette cifre decimali
esatte. In effetti, queste approssimazioni hanno spesso carattere empirico, senza essere sostenute da una
teoria che permetta di migliorarle o almeno valutare
il loro grado di precisione. Il metodo dei poligoni inscritti e circoscritti è stato il primo metodo veramente scientifico e fu inventato da Archimede, che riusc` a
portare avanti i conti fino al poligono di 96 lati; la precisione da lui trovata rimase imbattuta fino ai tempi
moderni.
Verso il 1600, quando nacque la Matematica moderna,
i metodi per calcolare si affinarono con la trigonometria e le serie di potenze. Si verific`
o allora una specie di corsa per determinare con sempre maggiore
precisione. Leibniz scopr` che:
1
1
1
1
= 1 + + ,
4
3
5
7
9
191
6.8. GEOMETRIA DELLO SPAZIO

ma computazionalmente questa formula non vale molto. Pi`
u successo ebbe John Machin che trov`
o un metodo per calcolare le prime cento cifre decimali (si veda
al capitolo sulla Trigonometria) e i suoi epigoni migliorarono man mano questo record finche, nel 1853, William Shanks arriv`
o a 707 cifre. Purtroppo, nel 1947 ci
si accorse che tali cifre erano sbagliate a partire dalla
528-esima. Con lavvento dei calcolatori elettronici, la
gara ebbe unaltra impennata e nel 1983 si riuscirono
a calcolare oltre 16 milioni di cifre decimali.
Occorre dire che questo calcolo ha dello straordinario
perche non usa la forza bruta, ma utilizza un nuovo
metodo, anche se basato su alcune idee di Gauss vecchie di oltre 150 anni. Al calcolatore fu dato questo
semplice algoritmo:
Algoritmo 6.8 (Media aritmetico/geometrica)
Ingresso: Un numero naturale n > 2;
Uscita: il numero con oltre 2n cifre decimali esatte;
1. si pone a := 1, x := 1, b := 2/2, c := 1/4;

2. fino a che risulta j n + 1 si calcola:
(a) y := a, a := (a + b)/2, b := b y;
(b) c := c x (a y)2 , x := 2 x;
(c) si scrive in uscita il valore di (a+b)2 /(4c);
tridimensionale; secondo, per il lettore, interpretare correttamente ciò che è stato disegnato. Ancora
pi`
u difficile è possedere e/o sviluppare unappropriata intuizione spaziale per poter affrontare e risolvere problemi tridimensionali; scultori e architetti sono
in questo molto bravi, ma spesso la gente ha difficoltà a raffigurarsi mentalmente cosa succede nello
spazio. Naturalmente, esercitarsi con la geometria
può giovare ad accrescere il nostro senso spaziale.
In accordo con gli assiomi generali, due punti nello
spazio determinano una retta, proprio come sul piano. Per avere un piano , occorre che siano assegnati
tre punti non allineati, il che equivale ad avere una
retta e un punto fuori di essa, oppure due rette incidenti in un punto. Ad esempio (v. Figura 6.47), se
i tre punti non allineati sono A, B, C, si possono anche avere il punto A e la retta BC, oppure la coppia
di rette AB, BC. Una domanda che può imbarazzare, se fatta fuori di questo contesto, è la seguente:
abbiamo visto che tre punti non allineati determinano nel piano una e una sola circonferenza; allora, tre
punti non allineati nello spazio, quante circonferenze
determinano?
Si osservi che, ad ogni iterazione, a rappresenta la

media aritmetica e c la media geometrica di a e b;
per questo il metodo è detto della media aritmetico/geometrica. Il programma ha lincredibile propriet`
a di raddoppiare, ad ogni iterazione, il numero
delle cifre esatte del risultato:
3.140579250522168248311331268975823311773
3.141592646213542282149344431982695774314
3.141592653589793238279512774801863974381
3.141592653589793238462643383279502884197
3.141592653589793238462643383279502884197
Questa tabella contiene le prime cinque iterazioni
(lultima è data per controllo) e per arrivare al
risultato desiderato furono sufficienti 25 iterazioni.
Naturalmente, la parte pesante del programma è
data dalle routine per eseguire le operazioni con la
necessaria precisione; escluso questo, il risultato è
pi`
u un problema di gestione della memoria che daltro.
6.8
Geometria dello spazio
Il problema della geometria dello spazio è costituito

dalla difficoltà che tutti abbiamo a rappresentare sia
mentalmente, sia figurativamente gli oggetti a tre dimensioni. Ciò che possiamo disegnare su un foglio è
solamente una proiezione della realtà spaziale e ciò
pone un doppio problema: primo, per il disegnatore, trovare una proiezione che non nasconda, ma anzi
metta in evidenza i punti nevralgici di una situazione
b
b
Figura 6.47: Piani e angolo diedro

Quando abbiamo un piano, esso definisce due semispazi, cos` come una retta sul piano definisce due
semipiani e un punto su una retta due semirette. Due
piani che si intersecano, si intersecano lungo una retta, e quindi dividono lo spazio in quattro parti, ognuna delle quali è detta un diedro o angolo diedro, per
analogia con gli angoli del piano (v. Figura 6.47).
Normalmente, per assegnare un diedro, si assegnano i due semipiani che lo definiscono e che hanno
origine nella retta di intersezione, detta spigolo del
diedro. Come gli angoli, i diedri formano una classe
di grandezze e su tale aspetto torneremo pi`
u avanti.
Ovviamente, due piani che non si intersecano si dicono paralleli; purtroppo, come per le rette nel piano,
questa non può essere una definizione valida, poiche
implica una procedura infinita per accorgersi che i
due piani non si incontrano mai. Occorre allora trovare un metodo finito e questo, come ora vedremo,
non è del tutto banale.
192

Q
s
r
Figura 6.48: Posizione di due rette

Cominciamo col definire la posizione reciproca di
due rette nello spazio (vedere Figura ??). Questo
può esser fatto costruttivamente e in termini finiti
mediante il seguente:
Algoritmo 6.9 (Posizione di due rette)
Ingresso: due rette r, s nello spazio.
Uscita: La posizione reciproca di r ed s.
e di una retta r. Questa volta procediamo discorsivamente, lasciando al lettore il compito di riportare
ad un algoritmo quanto ora diremo. Prima di tutto
è facile vedere se r giace su prendendo due punti
distinti P, Q della retta e verificando se si trovano su
. Se r non giace su , si prende P su (e non su
r) e si determina il piano passante per r e per P .
Ora, sia s la retta di intersezione tra e ; si hanno due possibilità verificabili direttamente, in quanto
r, s sono complanari:
(caso della retta r1 nella Figura 6.49) r ed s sono
parallele: allora r è parallela al piano ; infatti,
se r incontrasse in Q, le due rette r e P Q determinerebbero un piano e questo dovrebbe coincidere con quello considerato (determinato da r
e P );
(caso della retta r2 nella Figura 6.49) r ed s sono
incidenti in Q: allora r ed si incontrano nel
punto Q, che si dice il piede di r su .
1. si prende un punto P su s;
2. se P giace su r, allora r ed s sono incidenti in P
e quindi sono coincidenti o complanari; si esce;
3. altrimenti, si considera il piano determinato

da r e da P ;
4. si prende un punto Q su s diverso da P ;
6. se Q non si trova su , allora le due rette non

hanno punti in comune e si dicono sghembe;
r2
b
u
s
Figura 6.50: Posizione reciproca di due piani
r1
5. se Q giace su , allora le rette sono complanari.

Il Teorema condparallel permette di stabilire se
sono coincidenti, incidenti o parallele; si esce;
Figura 6.49: Rette incidenti

Nella Figura 6.48 sono schematizzati i due casi
principali: r ed s sono sghembe, mentre r ed s sono
parallele. Può essere utile ricordare che la distanza
tra due rette è la minima distanza tra i punti di una
retta e i punti dellaltra. Ora, il secondo passo consiste nel determinare le posizioni reciproche di un piano
Questo ci fa capire che se la retta r è parallela al

piano , e consideriamo un qualsiasi piano contenente r, allora se , si intersecano nella retta s,
questa risulta parallela ad r. Il lettore è invitato a
dare una dimostrazione formale di questo fatto, che
ci serve per il terzo passo, cioè per definire la posizione reciproca di due piani. Siano dati due piani
, e si consideri un terzo piano le cui intersezioni
con , siano le due rette r, s. Se r, s si intersecano in un punto P , allora P appartiene tanto ad
che a e quindi i due piani si intersecano. Se invece
r, s sono parallele (il che può essere verificato, dato
che sono complanari in ), esse potrebbero essere tali
semplicemente perche abbiamo preso parallela allintersezione di e . Consideriamo allora un piano
che abbia intersezione con , , , e consideriamo
193
Torniamo ora ai diedri. Se r è lo spigolo dei due

semipiani , che determinano il diedro, si consideri uno qualsiasi dei piani perpendicolari ad r e siano
s, t le rette di intersezione con , ; langolo formato
dalle semirette s, t che giacciono sui semipiani si dice
la sezione normale del diedro e si prende come misura del diedro stesso. Naturalmente, a questo punto,
i diedri possono essere considerati grandezze, esattamente come gli angoli. La definizione della somma,
dei multipli e dei sottomultipli è ovvia e si parla di
diedri acuti, ottusi, convessi, complementari e supplementari proprio come si fa per gli angoli. E naturale allora, come sul piano, definire due piani come
Teorema 6.54 Sia data una retta p insieme ad un perpendicolari quando formano quattro diedri uguali.
punto P su di essa; il luogo delle perpendicolari a p
Si prendano ora n rette parallele nello spain P è un piano passante per P .
zio; siano r1 , r2 , . . . , rn in questordine e consideriamo gli n piani determinati dalle coppie
r1 r2 , r2 r3 , . . . , rn1 rn , rn r1 . Se ciascuno di questi piap
ni lascia tutte le altre rette da una stessa parte dello
Q
spazio, la zona a comune tra tutti gli n semispazi, si
dice prisma indefinito (convesso). Se tagliamo questa
figura con due piani paralleli , , la zona del prisma

indefinito compresa tra questi piani si dice prisma
S
(convesso). Le rette di intersezione tra e e i piani
P
s
del prisma indefinito determinano due poligoni uguaT
li, che si dicono le basi del prisma. I parallelogrammi
R
t
determinati da due rette parallele consecutive e dalle
r
basi si dicono le facce laterali del prisma. La distanza tra i due piani e si dice laltezza. A seconda
che la base sia un triangolo, un quadrilatero, un pentagono, etc., il prisma si dice triangolare, quadranFigura 6.51: Piano perpendicolare a una retta
golare, pentagonale, etc.. Se i due piani e sono
perpendicolari
alle rette r1 , . . . , rn , il prisma si dice
Prova: Le perpendicolari a p passanti per P sono
retto.
determinate sui piani passanti per p; ad ogni piano
corrisponde una retta perpendicolare a p per P , come
sappiamo dalla Geometria del piano. Due di queste
rette, r, s, essendo incidenti in P , determinano un

piano che vogliamo dimostrare essere il luogo cercato. Siano Q, Q due punti di p equidistanti da P , ed
R, S due punti su r, s rispettivamente. Dalle ipotesi
b = Q RS,
b
si ha QR = Q R, QS = Q S e quindi QRS
essendo uguali i due triangoli QRS e Q RS. Sia T
lintersezione della retta RS con t, una generica retta
r1
r2
r3
passante per P e giacente sul piano . Dalluguaglianza dei triangoli QRT, Q RT si ha QT = Q T e
quindi P T è lasse di QQ nel piano QQ T , cioè t è

perpendicolare ad r. Daltra parte, se una retta passa
per P ma non si trova su , è facile vedere che essa
non può essere perpendicolare ad r, e ciò conclude la
prova.
le rette t, u di intersezione di con , . Nella Figura 6.50 non abbiamo di proposito indicato il piano ,
la cui disposizione è però del tutto chiara tramite le
rette t ed u. Se t, u si incontrano in Q, di nuovo tale
punto sta sia in sia in , che pertanto si intersecano. Ma se t, u sono parallele, allora e devono
essere paralleli. Se infatti si intersecassero nella retta
v, questa dovrebbe essere parallela tanto ad r che a t
(o, se si preferisce, tanto ad s che ad u) che però, per
costruzione, non sono parallele tra di loro.
Stabiliti i criteri di parallelismo, si può passare alla
perpendicolarità.
Questo teorema permette di parlare del piano

perpendicolare alla retta r in un punto P di questa;
viceversa, dato un piano e un suo punto P , è definita la retta perpendicolare ad passante per P , detto
piede della perpendicolare.
Figura 6.52: Prisma indefinito e definito

I prismi sono le figure tridimensionali pi`
u semplici. Per essi si definiscono tre misure, che risultano
importanti nelle applicazioni:
194
la superficie laterale: è la somma delle aree delle
facce laterali del prisma; se p è il perimetro della
base ed h è laltezza del prisma, si ha: S = ph;
la superficie totale: e la somma della superficie
laterale e dellarea delle due basi; se ciascuna di
queste vale S, si ha: St = S + 2S;
il volume: è la misura dello spazio occupato dalla
figura e vale: V = Sh.
Mentre le misure di superficie si rifanno a concetti
già introdotti per la Geometria piana, il volume è un
concetto nuovo. Il volume di un solido è una grandezza, e pertanto ci si aspetta che il volume dellunione
di due figure sia la somma dei singoli volumi, e cos`
via per tutte le altre proprietà delle grandezze. Lunità di misura è definita come il cubo che ha per lato
lunità di misura delle lunghezze. Si noti che un cubo è un prisma retto a base quadrata, la cui altezza
è uguale a ciascuno dei lati di base. Occorrerebbero
qui dimostrazioni analoghe a quelle fatte a suo tempo
per la misura delle aree, ma ne risparmiamo il lettore
(e noi stessi!). Naturalmente, la relazione tra figure solide avere lo stesso volume è una relazione di
equivalenza, e si dice appunto equivalenza tra solidi.
Si danno diverse regole per determinare quando due
figure sono equivalenti; la pi`
u semplice, che discende
da quanto appena detto, è che due figure solide sono equivalenti se sono equiscomponibili. Tuttavia, la
regola pi`
u importante è costituita dal seguente principio, che Archimede già conosceva, ma che Cavalieri
teorizzò e usò in modo sistematico:
Principio 6.16 (di Cavalieri) Due figure solide
che, tagliate con piani paralleli a un piano fisso,
generano figure piane equivalenti, sono equivalenti.
Questo principio è stato antesignano del calcolo integrale; esso diviene intuitivamente accettabile se pensiamo a una pila di fogli di carta: comunque li spostiamo, lasciandoli paralleli a se stessi, determinano lo
stesso volume, anche se la forma complessiva cambia
radicalmente.
Applicando il principio di Cavalieri a un prisma,
si dimostra immediatamente che esso è equivalente a
un prisma retto che abbia la stessa base e la stessa
altezza; da questo si passa ad un prisma retto con
la stessa altezza e con la base quadrata, equivalente
al poligono originale. A questo punto il volume è
proprio V = Sh, come si voleva. In particolare, un
cubo di lato (ed altezza) a ha volume V = a3 ; inoltre,
S = 4a2 e St = 6a2 .
Consideriamo ora un punto O ed n semirette che
partano da O, nellordine r1 , r2 , . . . , rn . Se gli n piani r1 r2 , r2 r3 , . . . , rn1 rn , rn r1 sono tali che ognuno di
essi lascia da una stessa parte dello spazio le altre

n2 semirette, la parte di spazio comune a tutti questi semispazi si dice piramide indefinita (convessa) di
vertice O. Se la tagliamo con un piano , la parte
di piramide indefinita compresa tra ed O si dice
piramide. La distanza di O da si dice laltezza della
piramide. Ognuno dei triangoli di vertice O si dice
una faccia laterale, e il poligono determinato da si
dice la base della piramide. In funzione di n si hanno piramidi triangolari, quadrangolari, pentagonali,
etc.. Se il poligono di base è un poligono regolare, la
piramide si dice regolare; se la base può essere circoscritta a una circonferenza di centro K e la retta OK
risulta perpendicolare ad , la piramide si dice retta.
r1
r3
r2
Figura 6.53: Angoloide e piramide

Le misure relative alle piramidi sono:
la superficie laterale: è la somma delle aree delle facce laterali; se la piramide è retta ed r è
il raggio della circonferenzainscritta nel poligono di base, si ha: S = p r2 + h2 /2, se p è il
perimetro della base;
la superficie totale: è la somma della superficie
laterale e dellarea della base: St = S + S;
il volume: è dato dalla formula V = Sh/3.
Anche in questo caso, la misura delle superfici è un
esercizio, risolubile di volta in volta con le regole viste
per la geometria piana. Il volume, invece, presenta
qualche difficoltà, ma fin dallantichità si sa che:
Teorema 6.55 Il volume di una piramide è un terzo
del volume di un prisma che abbia la stessa base e la
stessa altezza.
Prova: Consideriamo una piramide triangolare
(Figura 6.54), in quanto lestensione ad una base
qualsiasi è banale. Data la piramide OABC, si costruiscano i segmenti BB e CC paralleli e della stessa lunghezza di OA. La figura solida ABCOB C è
C
OX
X
Q
C@QXXX
C
XXX B
C @Q
C
X
X
C @ QQ
C
C
@ Q
C
C
C
@ QQ
C
C
C
@
C
Q C
C
Q
@
C
C
Q
C
@
C
Q
C QC
@
CX
QC
C
XX X
C
A
XXX@ C
X@
X
@C
X
B
Figura 6.54: Il volume della piramide
un prisma triangolare di volume Sh, se S è larea del
triangolo ABC. Se uniamo B con C , la figura solida
BOB C è una piramide di vertice B, base OB C
uguale ad ABC e altezza h; essa è perciò equivalente ad OABC. Daltra parte, le piramidi OBB C e
OBCC sono uguali avendo la stessa altezza e uguale
superficie di base. Il prisma, di conseguenza, risulta
diviso in tre piramidi equivalenti.
195
no poligoni regolari uguali, e sono uguali anche tutti
i diedri e tutti gli angoloidi che lo compongono. Già
Platone nel Timeo mostra che di tali poliedri ne esistono solo 5, e per questo i poliedri regolari sono detti
anche solidi platonici. Il ragionamento è semplice: se
gli angoloidi devono essere tutti uguali, basta prenderne in considerazione uno solo. Le sue facce sono
formate da almeno tre poligoni, che possono essere
triangoli equilateri, quadrati, pentagoni regolari, etc..
Se le facce sono triangoli equilateri, ogni loro angolo è
di 60 , e quindi langoloide può essere formato da 3, 4
o 5 facce. Infatti, 6 triangoli equilateri darebbero un
angolo giro e langoloide degenererebbe in un piano,
come si era visto con losservazione precedente. Se le
facce sono quadrati, langolo è di 90 e langoloide ne
può contenere solo 3, poiche già 4 arrivano a 360 .
Se le facce sono pentagoni, ogni angolo è 108 e di
nuovo langoloide ne può contenere solo 3. Con altri
poligoni regolari (a partire dagli esagoni che hanno
langolo di 120 ) tre facce superano i 360 , e quindi
è impossibile formare un angoloide.
Fin qui si è solo dimostrata la possibilità di esistenza di 5 poliedri regolari; per dimostrarne leffettiva
realtà basta ora costruirli:
per il triangolo e langoloide a tre facce, il poliedro regolare è il tetraedro, o piramide triangolaLa parte di spazio compresa nella zona convessa
re; il tetraedro ha in tutto 4 facce, 6 spigoli e 4
della piramide indefinita si dice propriamente un anvertici (o angoloidi);
goloide; la misura degli angoloidi è troppo complessa
perche la si possa prendere seriamente in considera per il triangolo e langoloide a 4 facce, si
zione. Due facce consecutive dellangoloide formano
ha lottaedro, o doppia piramide quadrata;
un diedro, e quindi un angoloide con k facce determilottaedro ha 8 facce, 12 spigoli e 6 vertici;
na k diedri. Anche questi possono non presentare una
struttura omogenea, dato che le loro sezioni normali
per il triangolo e langoloide a 5 facce, si ha
corrispondono a piani che sono disposti irregolarmenlicosaedro; esso ha 20 facce (e da questo deriva
te uno rispetto allaltro. Unosservazione importante
il suo nome), 32 spigoli e 12 vertici;
riguarda invece gli angoli che ogni coppia di semirette, partenti dal vertice O, forma sul piano della faccia
per il quadrato e langoloide a tre facce, si ha
corrispondente. Prendiamo un piano passante per
lesaedro o cubo; esso ha 6 facce, 12 spigoli e 8
O e che non interseca langoloide (se non in O stesso);
vertici;
consideriamo uno degli spigoli dellangoloide e imma per il pentagono e langoloide a tre facce, si ha
giniamo di tagliarlo lungo tale spigolo. Ruotiamo ora
il dodecaedro, una specie di pallone da calcio
tutte le facce dellangoloide intorno ad O in modo
spigoloso; esso ha 12 facce, 30 spigoli e 20 vertici.
da portarle (consecutivamente) sul piano ; in corrispondenza dello spigolo tagliato, avremo un angolo
Se con f, s, v indichiamo il numero delle facce, degli
vuoto, che è la differenza fra un angolo giro e la
spigoli e dei vertici di un poliedro, vale sempre la
somma dei vari angoli dellangoloide. In questo moformula di Cartesio-Eulero: f + v = s + 2.
do vediamo che la somma degli angoli di un angoloide
è minore di 360 .
Nota 6.5
I poliedri regolari sono facilmente coQuesta osservazione ha notevole importanza quanstruibili a partire dal loro sviluppo piano, che qui diado si studiano i poliedri regolari. In generale, un pomo schematicamente per il tetraedro (Figura 6.55) e
il cubo (Figura 6.56.
liedro è una figura solida delimitata da un numero
finito di facce costituite da poligoni piani. Rientrano
Conservo ancora il quaderno di bella della terza mein questa definizione sia i prismi, sia le piramidi, ma
dia nel quale sono riportate le costruzioni di geomefin dallantichità ci si è chiesti se esistono, e quanti
tria dello spazio che la Prof. Del Francia ci faceva
sono, i poliedri regolari, cioè i poliedri le cui facce sopreparare a latere dei compiti a casa. Con aghi, fili,
196

A3
A2
Tali poliedri sono noti come poliedri archimedei, ma

qui noi terminiamo la nostra nota.
A1
Figura 6.55: Tetraedro e suo sviluppo
D
A
Figura 6.57: Cilindro e cono
C
B
Figura 6.56: Esaedro (cubo) e suo sviluppo

stecchini e cartoncino Bristol ci sono ancora costruzioni non del tutto banali. Il lettore, da parte sua, è
invitato a costruire almeno i cinque poliedri regolari a
partire dal loro sviluppo piano. Queste poliedri furono anche detti figure cosmiche per una presunta corrispondenza con gli elementi costitutivi delluniverso.
Pu`
o essere curioso leggere la seguente dimostrazione
mistica del fatto che i poliedri regolari devono essere cinque, non di pi`
u ne di meno. Il brano si trova nel
libro del celebre matematico Luca Pacioli De Divina
Proportione (1496 98) e precede la dimostrazione
matematica vista; i disegni dei poliedri riportati dal
Pacioli sono di Leonardo da Vinci: Onde li decti sono
chiamati regulari perche sono de lati e angoli e basi
equali, e luno dallaltro apunto se contiene como se
mostrer`
a e conrespondono a li 5 corpi semplici in natura, cioè terra, aqua, aire, fuoco e quinta essentia
cioè virt`
u celeste che tutti gli altri sustenta in suo essere. E s` como questi corpi semplici sono bastanti
e sufficienti in natura, altramente serà arguire Idio
superfluo overo diminuto al bisogno naturale, la qual
cosa è absurda, como afferma il filosofo che Idio e la
natura non opera invano cioè non manca al bisogno e
non excede quello.
I solidi platonici sono i pi`
u regolari dei poliedri, ma
ve ne sono altri, ancora altamente simmetrici, ma
con le facce formate da poligoni regolari di vario tipo.
Dalle figure poliedriche è facile passare alle figure

rotonde. Il cilindro indefinito è il luogo dei punti che
hanno distanza minore o uguale a un certo valore r
(detto il raggio del cilindro) da una retta assegnata
c. Tagliando questa figura con due piani paralleli
(vedere Figura 6.57), si ottiene un cilindro, che si
dice retto se i due piani sono perpendicolari alla retta
c. La distanza h fra questi due piani è laltezza del
cilindro. Come è noto, si ha:
S = 2rh,
St = 2r2 + 2rh,
V = r2 h.
Il cilindro può essere immaginato come generato da

una retta g (detta appunto generatrice) che ruota intorno alla retta c a distanza r da questa. Ciò permette di cogliere lanalogia con la figura successiva,
il cono. Data una retta c e una retta g incidente con
c in un punto O, il cono indefinito è la figura che si
ottiene ruotando g intorno a c in modo che il punto
O rimanga fisso. Se tagliamo il cono indefinito con
un piano incidente con c (v. Figura 6.57), lo spazio
interno compreso tra O e il piano si dice cono, che
è in particolare retto se è perpendicolare a c. In
generale, la base di un cono cos` definito è unellisse,
ma la base di un cono retto è un cerchio; si dice apotema la distanza a del vertice O da uno qualsiasi dei
punti della circonferenza di base, mentre laltezza è la
distanza h di O dalla base stessa. Per il cono retto,
si ha chiaramente:
p
p
a = r 2 + h2
h = a2 r2
S = ra,
St = ra + r2 ,
V = r2 h/3.
197

La formula del volume è certo la pi`
u interessante, e
si dimostra approssimando il cono con una piramide
la cui base è un poligono iscritto o circoscritto alla
circonferenza di base del cono. Poiche, analogamente,
un cilindro può essere approssimato con prismi, la
formula deriva dal Teorema 6.55.
Il solido rotondo per eccellenza è la sfera; essa può
essere definita come il luogo dei punti dello spazio che
hanno distanza minore o uguale ad r (il raggio della
sfera) da un punto assegnato O, detto il centro. La
sfera, però, si può vedere anche come il solido ottenuto dalla rotazione di una semicirconferenza intorno
alla retta determinata dai suoi estremi.
Nota 6.6
E bene insistere sul fatto che molti

solidi rotondi possono essere ottenuti per rotazione,
poiche, come il lettore vedr`
a studiando Analisi
Matematica allUniversit`
a, esistono semplici metodi
del calcolo integrale per valutare superficie e volume
di solidi di rotazione. Anche storicamente, è opportuno ricordare, un antesignano del calcolo integrale
fu Keplero: nel 1615 scrisse il libro Stereometria
Doliorum, dove, studiando come calcolare superficie e
volume delle botti, in qualche modo e con vari errori,
anticipa considerazioni proprie del calcolo integrale.
Naturalmente, sia Keplero, sia Cavalieri, furono a
loro volta anticipati di circa 18 secoli da Archimede,
come ora vedremo.
Prova: Si faccia riferimento alla Figura 6.58 nella

quale cilindro, semisfera e cono sono stati tagliati con
un piano parallelo alla base del cilindro e del cono.
Se riusciamo a dimostrare che la corona circolare di
raggio AB (relativa alla scodella) è equivalente al cerchio di raggio CD (relativo al cono), per il Principio
di Cavalieri avremo dimostrato il nostro asserto. Se
poniamo OC = CD = c e BC = s, per il Teorema
di Pitagora si ha: s2 = r2 c2 , e quindi larea della
corona circolare è:
r2 s2 = r2 (r2 c2 ) = c2 .
Ma questa è larea del cerchio di raggio CD.
La conseguenza è pressoche immediata:
Teorema 6.57 Il volume V di una sfera di raggio r
è: V = 4r3 /3.
Prova: Sempre con riferimento alla Figura 6.58, il
volume del cilindro è Vc = r2 r = r3 , e quello della
scodella, essendo uguale a quello del cono, è un terzo
di questo: Vs = r3 /3. Il volume della semisfera si
ottiene per differenza: V /2 = Vc Vs = 2r3 /3, e
questo è il risultato desiderato.
Concludiamo con la formula per il calcolo della superficie della sfera; anche questa fu dimostrata per la
prima volta da Archimede con un ragionamento che
anticipa i metodi del calcolo differenziale e integrale:
Teorema 6.58 La superficie di una sfera di raggio r è quattro volte la superficie di un suo cerchio
massimo, cioè S = 4r2 .
B
D
O
Figura 6.58: Volume della sfera
Il calcolo del volume di una sfera si basa sul seguente lemma; si dice che Archimede volle che sulla sua
tomba fosse incisa la Figura 6.58, sulla quale si basa
la sua dimostrazione. Per fissare la terminologia, se
abbiamo un cilindro retto di raggio r ed altezza ancora r, in esso possiamo inserire una semisfera di raggio
r; la figura solida che si ottiene scavando la semisfera
dal cono si dice scodella.
Prova: Suddividiamo la superficie della sfera in

tanti piccoli poligoni (arrotondati) di dimensione arbitraria Si , non necessariamente uguale per tutti, e
uniamo i punti di questi poligoni con il centro O della sfera. Otteniamo cos` delle piramidi di base Si e
altezza r, cioè di volume Vi = Si r/3. Il volume V
della sfera è dato dalla somma di tutte queste piramidi, cioè dalla somma dei Vi . Mettendo in evidenza
r/3 in tale somma e osservando che la somma di tutti gli Si dà proprio S, si ha la relazione: V = Sr/3,
ovvero, per il teorema precedente: 4r3 /3 = Sr/3, e
da questa si ricava subito S.
Il lettore è stato avvertito che le piramidi hanno la

base arrotondata, in quanto la superficie segue quella
della sfera; cos` come sta, pertanto, il ragionamento
è solo approssimativo. Lo si può rendere esatto considerando poligoni che tagliano e poligoni che sono
tangenti alla sfera, mantenendo i lati delle varie basi.
Al diminuire di Si , queste basi sono sempre pi`
u vicine
tra
di
loro.
Lasciamo
al
lettore
il
godimento
di comLemma 6.56 Il volume della scodella di raggio r è
pletare
il
ragionamento
che,
daltra
parte,
abbiamo
uguale al volume di un cono che ha r sia come altezza,
già impostato altre volte.
sia come raggio della circonferenza di base.
198
Capitolo 7
Le altre Geometrie
Il titolo di questo capitolo vuol fare riferimento
esplicito al fatto che nella Matematica moderna non
esiste soltanto la Geometria Euclidea, lunica ad essere considerata nellantichità e fino al 1600, ma vanno
considerate altre geometrie, che si sono sviluppate e
hanno assunto una propria identità e una propria rilevanza, contribuendo in vario modo allampliamento
delle nostre conoscenze e al miglioramento della nostra capacità ad affrontare e a risolvere i problemi.
Oggi possiamo dire che i primi passi verso le altre
geometrie furono fatti nel Rinascimento, quando pittori praticanti e speculatori teorici studiarono la prospettiva, dando inizio alla Geometria Proiettiva e alla
Geometria Descrittiva. Tuttavia, le proiezioni erano
note fin dai tempi antichi, almeno nel caso classico
delle coniche, per cui la prospettiva fu fatta rientrare
nelle Geometria Euclidea.
Fu nella prima metà del 1600 che Fermat, Cartesio
e Desargues posero le basi per lo sviluppo di geometrie alternative. I primi due fondarono la Geometria
Analitica; questa voleva essere un modo diverso di
vedere la Geometria Euclidea, ma i suoi metodi, algebrici anziche sintetici, di fatto cambiarono lidea
stessa di geometria. Desargues, poi, con la nuova
idea dei punti allinfinito, praticamente introduceva
enti diversi da quelli delle Geometria di Euclide.
Tradizionalmente, la geometria aveva sempre usato
metodi sintetici, cioè basati sulla costruzione di figure, riconducendo addirittura a questo metodo la risoluzione dei problemi algebrici, come il calcolo delle
radici di unequazione. Fermat e Cartesio rivoltarono
questo modo di procedere, riportando i problemi geometrici a problemi algebrici. Da allora si sono sempre avuti due modi di vedere la geometria, talvolta in
contrapposizione, talaltra in simbiosi. Cos` la Geometria Proiettiva ha una versione sintetica, che studia
geometricamente le proiettività, e una versione analitica, dedicata alla caratterizzazione algebrica delle
coniche e delle quadriche (lequivalente delle coniche
in tre dimensioni).
A cavallo del 1800, Monge sistematizzò la Geometria Descrittiva e pochi anni dopo si svilupparono le
Geometrie non Euclide, dovute a Lobaceskij e Bolyai.
La formalizzazione di tutte queste nuove geometria fu

allinizio di tipo sintetico, ma le generalizzazioni di
Riemann erano di natura analitica. Le curve furono
di fatto sostituite da equazioni, e le proprietà delle
prime si studiarono attraverso le proprietà analitiche
delle seconde, dando cos` origine alla Geometria Algebrica. Analogamente, la Topologia nacque alla metà
del 1800 come studio geometrico-sintetico delle proprietà dei corpi che si mantengono per trasformazioni
continue: un palloncino si può trasformare in un cubo o in un cilindro, se lo premiamo, ma non in una
ciambella, a meno che non lo rompiamo. Ma la continuità richiede uno studio locale, cioè di cosa succede
intorno a un punto. Se cè del materiale intorno a
un punto, non possiamo toglierlo se non facendo uno
strappo, e questa non è pi`
u una trasformazione continua, anche nel senso intuitivo del termine. Ciò portò
ad una impostazione analitica della Topologia, che si
trasformò nello studio degli spazi di Hausdorf e degli
spazi metrici. Questi si basano sui concetti di intorno e di limite, che noi vedremo pi`
u avanti in modo
accurato nel caso importantissimo del calcolo differenziale e integrale. Infatti, gli insiemi R, R2 , R3 che
tratteremo sono casi particolari di spazi di Hausdorf
e di spazi metrici, e si dicono di solito spazi Euclidei.
Ovviamente, non potremo vedere tutte queste diverse geometrie. Ci dilungheremo un po di pi`
u sulla Geometria Analitica, daremo una rapida occhiata storica alle Geometrie non Euclidee e cercheremo di dare unidea, vaga ma sperabilmente non peregrina, della Geometria Proiettiva, della Geometria
Descrittiva e della Topologia.
7.1
Coordinate Cartesiane
Ufficialmente, la Geometria Analitica è stata introdotta da Cartesio nel 1637 con la pubblicazione di La
Geometrie, una delle tre appendici al Discours de
la methode. Oggi sappiamo che Cartesio era stato
anticipato da Fermat, che però non aveva pubblicato
i propri studi, come era solito fare. Da un punto di vista storico, questa invenzione è stata di fondamentale
199
200
CAPITOLO 7. LE ALTRE GEOMETRIE
importanza. Fino ad allora la regina della Matematica era sempre stata la Geometria, tanto che lAlgebra
era appena agli inizi con la sua notazione sincopata
e, di fatto, le dimostrazioni che oggi eseguiamo per via
algebrica erano regolarmente riportate alla Geometria. Cos`, la soluzione delle equazioni era effettuata
per via geometrica e Galileo, quando volle dire che lo
studio della natura deve essere affrontato con metodi
matematici, affermò che la Natura è scritta in caratteri di triangoli, quadrati, cerchi, . . . , ignorando
di fatto i numeri. La stessa notazione arabica o posizionale, portata in Europa allinizio del 1200, aveva
avuto rilevanza solo nel mondo commerciale e finanziario, mentre nellambito scientifico ed accademico
si era conservata la numerazione romana. Cartesio e
Fermat, con lintroduzione della Geometria Analitica,
dimostrarono che tutto ciò che si fa con la Geometria
si può fare anche con lAlgebra e con il calcolo, cos`
che queste discipline non hanno pi`
u un ruolo subordinato, ma possono vantare pari dignità della Geometria. E in effetti, pochi anni dopo, esplose, con
Newton e Leibniz, il nuovo grande filone del calcolo
differenziale, che difficilmente sarebbe potuto nascere e svilupparsi senza il cambiamento di mentalità
portato dalla Geometria Analitica di Cartesio.
A
1 u.m.
Figura 7.1: Rappresentazione Cartesiana dei punti:
A è positivo, A è negativo
Losservazione di base consiste nel considerare la
corrispondenza biunivoca che lega i punti di una retta
con i numeri reali. Può essere curioso e interessante
ricordare che ne Cartesio ne Fermat considerarono la
parte negativa della retta, secondo luso del tempo
che non riconosceva validità alle quantità negative
(v. Sezione 3.1). Se su una retta r fissiamo un punto
O, detto origine, e scegliamo, una volta per tutte,
un verso o orientamento sulla retta e una unit`
a di
misura, cioè un segmento la cui lunghezza diciamo
unitaria per definizione, allora:
1. ad ogni punto A della retta facciamo corrispondere il numero che è la misura (secondo lunità
scelta) del segmento OA, con la convenzione che
il numero è positivo se A si trova dopo O seguendo il verso stabilito, ed è invece negativo se
A si trova prima di O; tale misura è detta la
coordinata o ascissa di A;
2. ad ogni numero reale a facciamo corrispondere
un punto A sulla retta di modo che OA = |a|
ed A sia collocato prima o dopo lorigine O (in

accordo al verso prefissato) a seconda che a sia
negativo o positivo.
Lesistenza di una corrispondenza biunivoca tra
punti della retta e numeri reali era nota fin dallantichità e, come sè visto, i Greci (probabilmente Pitagora) erano stati costretti a introdurre i numeri irrazionali quando si erano accorti che esistono grandezze tra loro incommensurabili. Merito di Cartesio
fu quello di estendere la corrispondenza al piano e allo spazio e di far vedere come si potessero esprimere
i concetti della geometria in questo ambiente in cui
ogni punto ha una sua individuazione numerica.
Unosservazione di primaria importanza è la seguente. Se abbiamo due punti A e B sulla retta ed a e
b sono, rispettivamente, i numeri reali corrispondenti
ai due punti, allora la distanza AB è data dal valore
assoluto della differenza fra a e b, cioè AB = |a b|.
Questa formula vale sia che a e b siano entrambi positivi, entrambi negativi o siano di segno opposto. La
distanza tra A e B è la lunghezza del segmento AB; il
lettore osserverà anche che il punto medio del segmento AB ha come ordinata (a+b)/2, cioè la semisomma
delle ordinate di A e B. Occorre anche considerare il
fatto che la differenza ba è positiva se B segue A nel
verso prefissato, mentre è negativa in caso contrario;
quindi b a ci dà uninformazione in pi`
u rispetto alla
semplice distanza.
Un sistema di coordinate cartesiane nel piano è costituito da due rette incidenti in un punto O, detto
origine, sulle quali è stato fissato un verso di orientamento e una unità di misura, non necessariamente
la stessa per le due rette. Queste sono dette assi di
riferimento o semplicemente assi. Si consideri quella
delle due rette che si sovrapponga allaltra (coincidendo anche per lorientamento) con una rotazione
in senso antiorario inferiore a 180 ; tale retta si dice
asse delle ascisse o asse delle x. Laltra si dice asse
delle ordinate o asse delle y. Normalmente, si considerano assi fra loro perpendicolari, con lasse delle
x disegnato orizzontalmente e col verso da sinistra
verso destra. Lasse delle y, allora, è una retta verticale orientata dal basso verso lalto. Questo si dice
propriamente un sistema di coordinate cartesiane ortogonali, ed è quello riportato nella Figura 7.2 e che
considereremo costantemente nel seguito.
Un punto A del piano è individuato dalle sue coordinate: si tracciano per A le parallele ai due assi; la
parallela allasse y incontra lasse x in un punto A ,
e la parallela allasse x incontra lasse y in un punto
A . La coordinata xA di A rispetto allunità di misura fissata sullasse delle x si dice lascissa del punto
A; la coordinata yA di A rispetto allunità di misura
fissata sullasse y si dice lordinata di A. La coppia di numeri reali (xA , yA ) identifica univocamente
201
7.1. COORDINATE CARTESIANE

100
II
I
B
80
60
40
20
x
O
III
-3
-2
-1
O 1
-20
IV
-40
Figura 7.3: Curve molto allungate
Figura 7.2: Riferimento Cartesiano
il punto A e si scrive A (xA , yA ); i due numeri si

chiamano le coordinate di A. I punti che hanno tutte
e due le coordinate positive si dicono appartenere al
I quadrante; il II quadrante è costituito dai punti con
ascissa negativa e ordinata positiva; il III quadrante
comprende i punti con entrambe le coordinate negative e, infine, i punti con ascissa positiva e ordinata
negativa appartengono al IV quadrante.
Lidea delle coordinate cartesiane ortogonali, con la
stessa unità di misura tanto sullasse delle x quanto
su quello delle y, è arbitraria e può essere abbandonata non appena altre convenzioni possano rivelarsi
pi`
u convenienti. Prima fra tutte, può cadere la convenzione di usare ununica unità di misura; spesso è
molto pi
u opportuno utilizzare una certa unità sullasse x e unaltra, pi`
u grande o pi`
u piccola, sullasse y. Anticipando cose che vedremo pi`
u avanti, ma
che sono del tutto ovvie, se dobbiamo rappresentare
una retta dandamento molto ripido, o una parabola
molto stretta, conviene adoprare ununità di misura sullasse delle y molto pi`
u piccola dellaltra, cos`
che su unarea abbastanza ristretta si possano vedere porzioni non trascurabili delle curve; nella Figura
7.3 vediamo la retta y = 40x e la parabola y = 10x2
che sono ragionevolmente rappresentate, avendo scelto lunità di misura sulle y venti volte minore di quella
sulle x. Naturalmente, la scelta deve essere del tipo
opposto se la curva è molto piatta. Queste variazioni
sulle unità di misura sono molto comuni e di solito non creano problemi di comprensione, anzi aiutano a capire meglio la natura della curva (basta fare
attenzione!).
Molto meno utilizzati sono i riferimenti non ortogonali. Nella Figura 7.4 abbiamo un caso del genere,
nel quale il punto P ha coordinate (1, 3) e il punto
Q ha coordinate (3, 2). Come si vede, le coordinate
vengono prese tracciando, da un punto, le parallele
y
P
3
Q
b
2
1
O
-1
x
1
Figura 7.4: Assi non ortogonali

ai due assi e considerando poi il punto di intersezione
con laltro asse. In questa figura abbiamo supposto,
di nuovo, che lunità di misura sia la stessa per i due
assi, ma nulla osta a che le due unità siano diverse.
La misurazione delle coordinate sui due assi avviene, in tutti i casi considerati finora, in modo lineare;
questo significa che un punto P è a distanza 1, 2, 3,
. . . dallorigine O se la misura del segmento OP è 1,
2, 3, . . . volte quella dellunità di misura. Nella pratica, si sogliono talvolta usare sistemi di coordinate
in scale diverse da quella lineare. Ad esempio, sullasse delle y si può usare una scala quadratica, il che
significa che la misura valutata sullasse y deve essere considerata come il quadrato delleffettivo valore
della seconda coordinata. Nella Figura 7.5 abbiamo
rappresentato la parabola y = x2 in scala quadratica
per le y: come si vede, la curva si riduce a una coppia
di semirette che escono dallorigine.
In effetti, luso delle scale non lineari è proprio questo: se la curva non è una retta, scegliendo in modo
opportuno la scala dellasse delle y la curva si trasforma in una retta, semplificandone la rappresentazione
e lo studio pratico. Cos` una scala esponenziale riduce a una retta la funzione esponenziale e una scala
logaritmica riduce a una retta la funzione logaritmica
202

16
della somma degli altri due, o uguale, se i tre punti sono allineati. Questa proprietà si dice disuguaglianza
9
triangolare.
Queste tre proprietà sono caratteristiche della di4
stanza e possono essere prese come assiomi di una
teoria: si consideri un insieme M sul quale sia defini1
ta una funzione d : M M R per la quale valgano le tre proprietà; allora d può essere assunta come
-4 -3 -2 -1
2
3
4
O 1
distanza tra due elementi di M (che, convenzionalmente, vengono detti punti), e la coppia (M, d) si
dice uno spazio metrico. I teoremi che si deducono in
Figura 7.5: Una parabola in scala quadratica
questa teoria valgono, in particolare, in R, R2 , R3 e in
generale in Rn . La teoria degli spazi metrici fa parte
(si veda la Sezione 8.5). Difficilmente si trovano rap- della Topologia, alla quale accenneremo brevemente
u avanti.
presentazioni di curve su scale entrambi non lineari, un po pi`
ma il loro utilizzo non è vietato, se questo può portare
a qualche semplificazione.
Lequazione della retta
Di fondamentale importanza è saper trovare la di- 7.2
stanza tra due punti. Sia A (xA , yA ) e B
(xB , yB ) (si veda la Figura 7.2). Se si tracciano le Un punto, come sè visto, è individuato da una coppia
parallele agli assi passanti per A e per B, si deterdi numeri reali. Una curva è un insieme di punti sul
mina AB considerando il triangolo rettangolo ACB. piano, di solito un insieme composto di infiniti eleLa distanza AC è semplicemente la distanza tra A e menti, come si può immaginare pensando a una retta
B che, come sappiamo, è |xB xA |; analogamente, o a una circonferenza. Lidea di Cartesio fu di defiCB = A B = |yB yA |. Quando si eleva al qua- nire una curva per mezzo di una equazione nelle vadrato un valore assoluto, esso può essere ignorato, e riabili x ed y: un punto appartiene alla curva quando
sostituendo a x ed y le sue coordinate si ottiene unuquindi si ha:
guaglianza, mentre non appartiene alla curva in caso
2
contrario. Ad esempio, data lequazione 3x 2y = 0,
AB = (xB xA )2 + (yB yA )2
secondo questo criterio il punto (2, 3) appartiene alla
p
curva (qualunque essa possa essere), mentre il punto
AB = (xB xA )2 + (yB yA )2
(1, 1) non vi appartiene.
dove la radice quadrata è presa in senso aritmetico
per salvaguardare il fatto che la lunghezza di un segmento è sempre una quantità positiva. Si invita il
B
lettore a scrivere il semplicissimo algoritmo che, date
B
le coordinate dei punti A e B, trova la loro distanza.
La distanza tra due punti A e B si può indicare con
C
C
la notazione d(A, B) e si osserva che essa gode delle
tre seguenti proprietà:
B0
A
1. d(A, B) 0, e si ha d(A, B) = 0 se e solo se
C0
A
A = B;
2. d(A, B) = d(B, A);
3. d(A, B) d(A, C) + d(C, B).

la prima proprietà discende dalla definizione stessa:
la radice quadrata è zero se e solo se il suo argomento è zero; questo è la somma di due quantità non
negative e pertanto è zero se e soltanto se entrambe
sono 0; ma questo succede se e solo se xA = xB e
yA = yB , cioè i due punti coincidono. La seconda
proprietà è veramente ovvia, mentre la terza si rifà a
una proprietà vista nella Geometria Euclidea. I tre
punti A, B, C determinano un triangolo, e la disuguaglianza dice semplicemente che un lato è minore
Figura 7.6: Tre punti allineati

Sicuramente, la curva pi`
u semplice è la retta. Secondo la Geometria, fissati due punti distinti A e B
esiste una e una sola retta che passa per tutti e due;
in altre parole, la retta è determinata dai due punti.
Siano allora A (xA , yA ) e B (xB , yB ) due punti
distinti e vediamo sotto quali condizioni un generico
punto C (x, y) appartiene alla retta AB, cioè è collineare con A e con B. Come si vede nella Figura 7.6,
203
7.2. LEQUAZIONE DELLA RETTA

C è collineare con A e con B se e solo se i due triangoli AC0 C e AB0 B sono simili, in quanto langolo in
A deve essere lo stesso per i segmenti AC e AB. Si
ha allora la seguente proporzione tra i cateti dei due
triangoli:
AC0 : AB0 = CC0 : BB0
2. allora, se yA = yB
(a) allora (punti coincidenti) si avverte che i
due punti coincidono e pertanto la retta è
indeterminata;
(b) altrimenti, (retta verticale) si pone a :=
1, b := 0, c := xA e si esce;
ovvero (senza valori assoluti!):

y yA
x xA
=
.
xB xA
yB yA
(7.1)
3. altrimenti, se yA 6= yB
(a) allora (retta orizzontale) si pone a :=
0, b := 1, c := yB e si esce;
Questa è lequazione della retta passante per i due

(b) altrimenti (caso generale) si pone a := yA
punti assegnati e non coincidenti; si osservi che se
yB , b := xB xA , c := xA yB xB yA e si è
fosse A B, cioè xA = xB e yA = yB , la proporzione
finito.
non avrebbe senso. Tuttavia, il rapporto perde senso
anche quando xA = xB oppure yA = yB . Il primo
Un aspetto molto interessante, e curioso, della Geocaso corrisponde a una retta parallela allasse y, e il
metria Analitica è che spesso, per non dire sempre,
secondo a una retta parallela allasse x. In questi casi
le formule generali valgono anche nei casi particolalequazione della retta è:
ri. Qui, ad esempio, se xA = xB e yA 6= yB , il
x = xA e y = yA ;
(7.2) calcolo del punto 3b. ci dà a = yA yB , b = 0,
c = xB yA xA yB = xA (yB yA ); se dividiamo questi
queste equazioni sono soddisfatte da ogni valore di tre valori per yA yB (il che non cambia lequazione
y la prima, e da ogni valore di x la seconda, il che della retta, come si è osservato) troviamo a = 1, b = 0
conferma la nostra intuizione su come devono essere e c = xA , come abbiamo posto nel caso particolare.
fatte queste rette.
Lo stesso succede per yA = yB e xA 6= xB , mentre se
Eseguendo qualche calcolo sullequazione (7.1), si anche xA = xB si trova a = b = c = 0. Questo sugtrova facilmente:
gerisce un algoritmo, equivalente al precedente, ma
alquanto pi`
u semplice:
(yA yB )x + (xB xA )y xB yA + xA yB = 0
Algoritmo 7.2
che ha la forma ax + by + c = 0. Questa si dice la for- Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti
ma canonica della retta ed è la forma generale che può A e B;
assumere tale equazione, come si vede considerando Uscita: i tre coefficienti a, b, c della retta.
anche le due formule (7.2). Essendo ax + by + c = 0
1. Si pone a := yA yB , b := xB xA , c := xA yB
unequazione, la si può moltiplicare o dividere per una
xB yA ;
quantità diversa da zero senza cambiare linsieme dei
punti che ne sono soluzione. Questo fatto lo si sfrutta
2. se (a = 0)(b = 0)(c = 0) allora si avverte che
spesso per semplificare i valori di a, b, c o evidenziare
i due punti coincidono, altrimenti si esce con i
casi particolari, come quando abbiamo a = 1 o b = 1.
valori di a, b, c.
Per completare il ragionamento, se consideriamo una
qualsiasi equazione lineare nelle due incognite x ed y,
Supponiamo che nellequazione di una retta ax +
essa sicuramente rappresenta una retta: facendo al- by + c = 0 sia b 6= 0, cioè supponiamo che la retta
linverso i ragionamenti di prima, si vede come, presi non sia parallela allasse delle y. Lequazione si può
comunque tre punti che verificano lequazione, essi riscrivere allora y = ax/b c/b e ponendo m = a/b
sultano collineari. Infatti, i triangoli che si ottengono e q = c/b si ha la forma canonica:
hanno lati in proporzione, quindi sono simili e sono
y = mx + q.
uguali gli angoli in A dei triangoli AC0 C e AB0 B.
Tutte queste considerazioni portano a scrivere il
seguente algoritmo per determinare lequazione della Se arriviamo a questa stessa forma partendo
dallequazione (7.1), troviamo:
retta che passa per due punti assegnati:
Algoritmo 7.1 (Retta per due punti)
Ingresso: le coordinate (xA , yA ), (xB , yB ) di due punti
A e B;
cioè:
Uscita: i tre coefficienti a, b, c della retta.
1. se xA = xB (probabilmente retta verticale)
y=
m=
xB yA xA yB
yB yA
x+
xB xA
xB xA
yB yA
xB xA
q=
xB yA xA yB
.
xB xA
204
Il significato di q è semplice: ponendo x = 0 si ha

A
y = q, cioè q è lordinata del punto di intersezione
della retta con lasse y; per questo q si dice lintercetta
della retta. In quanto ad m, come si vede dalla Figura 7.6, è il rapporto tra il cateto opposto e il cateto
r
adiacente allangolo in A del triangolo ACB; come
si sa dalla trigonometria (e quindi qui stiamo un po
C
anticipando cose che vedremo pi`
u avanti), questa è la
P
B
tangente dellangolo che la retta forma con lasse delle ascisse, ed m si dice la pendenza della retta: essa
x0 x0 x0 +
O
misura linclinazione della retta rispetto allasse delle
ascisse, crescendo man mano che cresce linclinazione.
Nel caso che abbiamo escluso, di una retta parallela
Figura 7.7: Rette perpendicolari
allasse delle ordinate, si dice che la pendenza è infinita. Lintercetta è 0 se e solo se la retta passa per
lorigine. Si ha quindi il seguente risultato:
a x + b y + c = 0, cioè dalla soluzione del sistema:
Teorema 7.1 Una retta passa per lorigine se e solo

ax + by + c = 0
se ha unequazione della forma ax + by = 0.
a x + b y + c = 0.
Abbiamo cos` introdotto due forme canoniche per
la
la retta. La forma ax + by + c = 0 è lespressione Come sè visto nel capitolo dedicato allAlgebra,
soluzione
esiste
ed
`
e
unica
se
e
solo
se
ab
a
b
=
6
0,
pi`
u generale dellequazione della retta e comprende
ab = a b, cioè vale la proanche le rette parallele ad uno degli assi cartesiani. cioè ab 6= a b. Se invece
due possibilità: i)
Laltra forma, y = mx + q non permette di rappre- porzione: a : a = b : b , si hanno
lo
stesso
rapporto
vale
per
c,
c
,
e
allora
lequazione è
sentare le rette parallele allasse delle y, ma ha due
indeterminata
(ha
infinite
soluzioni),
o
ii)
il rapporto
vantaggi: esplicita il valore della y in funzione della
tra
c
e
c
`
e
diverso
e
allora
lequazione
`
e
impossibile
x e mette bene in evidenza le caratteristiche fisiche
della retta, cioè la sua pendenza rispetto allasse x (non ha alcuna soluzione). Geometricamente, questa
e lintersezione con lasse y. Per questo, nella prati- è la condizione di parallelismo, mentre il primo caca si tende ad usare di pi`
u la seconda forma, anche so riguarda la coincidenza delle due rette, che hanno
se meno generale, ragionando poi in modo specifico infiniti punti a comune.
La corrispondenza tra intersezioni di curve e soper le rette parallele allasse y. Pertanto, è bene esluzione
di sistemi di equazioni è lidea fondamentale
sere pronti a passare da una forma canonica allaltra
della
Geometria
Analitica e, come abbiamo fatto per
quando sia necessario o conveniente.
le
rette,
la
ritroveremo
molto spesso, sia nella teoria
I risultati precedenti permettono di affrontare il
che
nella
pratica.
Come
ora vedremo, faremo ricorso
problema del parallelismo tra rette. Date due retallo
stesso
concetto
nello
studio della perpendicola
te ax + by + c = 0 e a x + b y + c = 0, esse sorit`
a
tra
rette,
un
problema
un po pi`
u complesso del
no parallele se e solo se le loro pendenze coincidono,
parallelismo.
Cominciamo
col
considerare
una retta r

cioè se e solo se a/b = a /b , ovvero se vale la
qualsiasi
e
un
punto
P
su
di
essa,
e
cerchiamo
di tro
proporzione a : a = b : b . Se si ha addirittura
vare
lequazione
della
perpendicolare
ad
r
passante
a : a = b : b = c : c , allora esiste un coefficiente di

proporzionalità k per cui a = ka, b = kb, c = kc; di- per P . Nel caso che r sia parallela allasse x o allasvidendo tutto per k si trova che le due rette in effetti se y, la soluzione è banale: se P (x0 , y0 ) sta sulla
sono la stessa (coincidono) e non solo sono parallele. retta e questa è parallela allasse x, la sua equazione
Ad esempio, data la retta x + 2y 3 = 0, la retta è y = y0 e la sua perpendicolare è x = x0 , dovendo
2x + 4y = 0 risulta ad essa parallela (passante per essere parallela allasse y. Ovviamente le cose si inlorigine), mentre la retta 2x + 4y 6 = 0 è proprio vertono, ma le rette restano le stesse, se si parte da
una retta parallela allasse y. Consideriamo allora il
coincidente.
Un altro modo per affrontare il problema del pa- caso in cui r ha equazione y = mx + q, con m 6= 0; si
rallelismo è riferirsi alla definizione di rette parallele ha allora:
come di rette che non hanno punti in comune. Poiche Teorema 7.2 La retta perpendicolare alla retta r di
un punto (x0 , y0 ) appartiene alla retta ax+by +c = 0 equazione y = mx + q (m 6= 0) passante per il punto
se e solo se è una soluzione di questa equazione, cioè P (x , y ) di r ha equazione: yy = (xx )/m.
0 0
0
0
se ax0 + by0 + c = 0 è una proposizione vera, il punto
Prova: Con riferimento alla Figura 7.7, sulla retta
di intersezione di due rette è costituito dalla soluzione comune alle due equazioni ax + by + c = 0 e r consideriamo due punti B, C di ascissa x0 e
205
7.2. LEQUAZIONE DELLA RETTA

x0 + ; si ha pertanto: B (x0 , mx0 m +
q) = (x0 , y0 m) e C (x0 + , mx0 + m +
q) = (x0 + , y0 + m); per il teorema di Pitagora essi
hanno la stessa distanza da P . Come sappiamo, la
perpendicolare ad r in P è lasse del segmento BC
e quindi un generico punto A (x, y) sta su tale
perpendicolare se e solo se le sue distanze da B e da
C sono uguali. Abbiamo infatti:
2
AB = (x x0 + )2 + (y y0 + m)2 = (x x0 )2 +
+2(x x0 ) + 2 + (y y0 )2 + 2m(y y0 ) + m2 2
2
AC = (x x0 )2 + (y y0 m)2 = (x x0 )2
Teoricamente, a questo punto, potremmo trovare

la formula della distanza di un punto P qualsiasi da
una retta di cui sia nota lequazione ax + by + c = 0.
Infatti, il teorema precedente dà modo di trovare lequazione della perpendicolare da P alla retta e quindi, facendo il sistema delle due equazioni, il punto di
intersezione H, che è la proiezione di P sulla retta. La
lunghezza del segmento P H è poi la distanza cercata. Un metodo un po pi`
u indiretto, ma che richiede
meno conti, può essere il seguente:
Teorema 7.5 Sia r la retta di equazione ax+by+c =
0 e sia P (x0 , y0 ) un punto qualsiasi; allora la
distanza di P da r è dato dalla formula:
2(x x0 ) + 2 + (y y0 )2 2m(y y0 ) + m2 2 .
d=
Uguagliando e semplificando si ottiene 4m(y y0 ) =

4(x x0 ) e quindi:
y=
x0 + my0
1
x+
.
m
m
Si osservi che, come deve essere, questa espressione

non dipende da , cioè dai punti B e C considerati.
|ax0 + bx0 + c|
.
a2 + b2
y
r
P
B
Al variare del punto P sulla retta r cambia lintercetta della perpendicolare (poiche dipende da x0 ), ma
non cambia il coefficiente angolare, che rimane fisso,
uguale a 1/m; si ha quindi questo importantissimo
corollario:
H
A
O
Corollario 7.3 Se una retta r ha equazione y =
mx + q, (m 6= 0), ogni retta perpendicolare ad r ha
Figura 7.8: Distanza di un punto da una retta
1
equazione y = m
x + q . Pi`
u in generale, se la retta
r ha equazione ax+by+c = 0, ogni sua perpendicolare
Prova: Se la retta r è perpendicolare ad uno degli
ha equazione bx ay + c = 0.
assi, il risultato è banale. Altrimenti abbiamo a 6= 0
Prova: Per le rette r che non siano perpendicolari e b 6= 0. Il punto A, proiezione verticale del punto P
ad uno degli assi, sappiamo che m = a/b e quindi sulla retta r, ha coordinate (x0 , (ax0 +c)/b) e quindi
1/m = b/a. Altrimenti abbiamo a = 0 oppure b = 0 il segmento P A ha lunghezza |y0 (ax0 + c)/b| =
(ma non entrambi) e questo si riflette sui coefficienti |(ax0 + by0 + c)/b|. Analogamente, si trova P B =
delle rette perpendicolari secondo la discussione fatta |(ax0 + by0 + c)/a|. Ora si osservi che P A P B =
P H AB, doppia area del triangolo rettangolo ABP .
prima del teorema precedente.
Applicando il teorema di Pitagora si ha:
Questa caratterizzazione delle rette perpendicolari
q
permette di risolvere il problema di scrivere lequazio- AB = P A2 + P B 2 = pa2 + b2 |(ax +by +c)|/|ab|
0
0
ne della retta perpendicolare ad r che passa per un
punto assegnato, sia esso sulla retta o fuori di essa:
e quindi P H = P A P B/AB, cioè:
Teorema 7.4 Sia ax + by + c = 0 lequazione di una
(ax0 + bx0 + c)2
|ab|
PH =
retta r e sia P (x0 , y0 ) un punto qualsiasi; lequa|ab|
a2 + b2 |(ax0 + by0 + c)|
zione della retta per P perpendicolare ad r è allora
a(y y0 ) = b(x x0 ).
e questo ci dà immediatamente il risultato cercato.
Prova: Una generica retta perpendicolare ad r ha
equazione bx ay + c = 0; affinche passi per P dobbiamo avere bx0 ay0 + c = 0, cioè c = ay0 bx0 .
Sostituendo questo valore nellequazione della retta
si ha la formula desiderata.
Dati tre punti, essi determinano univocamente un

triangolo; il perimetro si trova semplicemente calcolando le reciproche distanze dei tre punti. Per larea,
la situazione è abbastanza pi`
u complicata, ma esiste
una formula molto semplice:
206
Teorema 7.6 Siano A (xA , yA ), B (xB , yB ),

C (xC , yC ) tre punti non allineati del piano; larea
del triangolo ABC è data da:
A=
Corollario 7.7 Tre punti A, B, C sono allineati se e

solo se il determinante (7.3) vale 0.
1
|xA yB +yA xC +xB yC xA yC yA xB yB xC |.
2
Prova: In modo arbitrario possiamo scegliere AB

come base del triangolo; la retta per A e per B è,
come sappiamo:
7.3
La parabola
Come abbiamo osservato, il concetto fondamentale

della Geometria Analitica è trovare la corrispondenza tra curve ed equazioni, il che giustifica lo studio
della Geometria (le curve) per mezzo dellAlgebra (le
e quindi laltezza del triangolo è data dalla distanza equazioni). Abbiamo discusso come le equazioni di
di C da questa retta, cioè:
primo grado in x ed y identifichino le rette e vicever
sa,
per cui ha interesse studiare cosa succede quando
xC xA
C yA
xB xA yyB
si abbandoni lipotesi di linearità in x e/o in y. StrayA
=
h= q
namente, le curve pi`
u semplici dopo le rette risultano
1
1
(xB xA )2 + (yB yA )2
essere le parabole, che abbiamo introdotto fra i luoghi geometrici. Dimostreremo che le parabole con la
x x
(xB xA )(yB yA )
yC yA
C
A
. direttrice parallela allasse x sono tutte e sole le curve
=
p
xB xA yB yA
(xB xA )2 + (yB yA )2 definite da unequazione del tipo y = ax2 + bx + c,
Il denominatore è chiaramente la base del triangolo, dove a, b, c sono tre numeri reali qualsiasi (a 6= 0, altrimenti si ritorna al caso della retta). Naturalmente,
cioè la lunghezza di AB. Pertanto:
possiamo scambiare la x con la y e concludere che
1
le
parabole con la direttrice parallela allasse y sono
A = |(xC xA )(yB yA ) (yC yA )(xB xA )|
2
tutte e sole le curve di equazione x = ay 2 + by + c
(a 6= 0). Si può anche dimostrare (ma qui non lo fareche sviluppato dà la formula cercata.
mo) che una parabola di direttrice una retta qualsiasi
soddisfa unequazione completa di secondo grado in
Nota 7.1
Chi ci ha seguito nella Nota 5.7 relativa
x e in y: ax2 + bxy + cy 2 + dx + ey + f = 0. La
ai determinanti delle matrici 3 3, osserver`
a che la
parabole non è però lunica curva a soddisfare uneformula dellarea si pu`
o ottenere prendendo il valore
quazione del genere; un importante risultato afferma
assoluto del determinante:
che tutte le coniche sono definite da una tale equa
xA yA 1
zione: parabola, ellisse, iperbole e i casi particolari
1
xB yB 1 .
(7.3) circonferenza e coppia di rette. Ci`
o che distingue i
2
xC yC 1
vari tipi di conica è una specifica condizione sui coefa visto nei corsi
Il valore assoluto si giustifica ricordando che larea de- ficienti dellequazione. Ma questo verr`
ve essere un numero positivo o, al pi`
u, nullo, per le universitari.
figure che degenerano in un segmento. Tuttavia, ci
Secondo la definizione, una parabola è il luogo dei
possiamo chiedere se il puro e semplice determinante punti equidistanti da una retta (la direttrice) e da
ha un significato preciso. Ebbene, è proprio cos`: se i un punto (il fuoco); dimostriamo allora il seguente
tre punti non sono allineati e li consideriamo in senso risultato:
x xA
y yA
=
xB xA
yB yA
orario, cioè partendo da A incontriamo prima B e poi

C quando si ruoti come lorologio (in senso orario),
allora il valore del determinante è negativo. Se, viceversa, si passa da A a B e poi a C nel verso contrario
alle lancette dellorologio (in senso antiorario), il determinante è positivo. Si sviluppi un esempio ponendo
A (0, 0), B (4, 0) e C (2, 3): il determinante
vale 12, proprio il doppio dellarea del triangolo. Se
si scambia B con C, il determinante risulta negativo. Questo fatto curioso è legato al concetto stesso
di determinante, e quindi non lo possiamo affrontare
qui. Unultima osservazione, del tutto ovvia, ci dice che larea del triangolo è zero se e solo se i tre
punti A, B, C sono allineati; pertanto vale il seguente
criterio di allineamento:
Teorema 7.8 Sia y = d una retta parallela allasse

x che assumiamo come direttrice, e sia F (x0 , y0 )
un punto, non appartenente alla direttrice, che assumiamo come fuoco. La parabola che essi determinano
ha equazione:
y=
1
x0
x2 + y02 + d2
x2
x+ 0
2(y0 d)
(y0 d)
2(y0 d)
Prova: Sia (x, y) un punto generico della parabola;

la sua distanza
p dalla direttrice è yd e la distanza dal
fuoco vale (x x0 )2 + (y y0 )2 . Uguagliando ed
elevando al quadrato si ha: y 2 2yd+d2 = x2 2x0 x+
207
7.3. LA PARABOLA
x20 + y 2 2y0 y + y02 . Semplificando ed esplicitando la Teorema 7.10 Sia y = ax2 + bx + c (a 6= 0)

una parabola; allora il vertice ha coordinate V
y si ottiene la formula desiderata.
(b/2a, (4ac b2 )/4a) e lasse ha equazione x =
Questo teorema dimostra che ogni parabola del tib/2a.
po detto ha unequazione y = ax2 + bx + c, con a 6= 0
perche y0 6= d dal momento che il fuoco non sta sulla Prova: Poiche lasse passa per il fuoco ed è perpendirettrice. Vediamo ora il viceversa:
dicolare allasse delle x, per il precedente teorema la
sue equazione è x = b/2a. Lo stesso vale per la2
Teorema 7.9 Sia y = ax + bx + c, con a 6= 0.
scissa del vertice, la cui ordinata è data (come punto
Tale equazione rappresenta una parabola di fuoco e
di mezzo di F D) da:
direttrice:
1 4ac b2 + 1 4ac b2 1
4ac b2
b 4ac b2 1
4ac b2 1
+
=
.
F =
,
y=
.
2
2a
2a
4a
2a
4a
4a
Prova: Vediamo algebricamente che i tre parametri a, b, c determinano univocamente le coordinate del
fuoco e lequazione della direttrice. Uguagliando tali
parametri ai valori ottenuti nel teorema precedente si
ha il sistema:
a = 1/(2(y0 d))
b = x0 /(y0 d)
c = (x20 + y02 d2 )/(2(y0 d))
nelle tre incognite x0 , y0 , d. Pertanto, il teorema risulta vero se e solo se questo sistema ammette ununica
soluzione. Dalla prima equazione si ha: y0 d = 1/2a
e quindi dalla seconda si ricava: x0 = b(y0 d),
cioè: x0 = b/2a. Nella terza equazione scriviamo
y02 d2 = (y0 d)(y0 + d) e sostituiamo i valori noti.
Con la prima equazione, si ha il sistema:
y0 d = 1/2a
y0 + d = 2c b2 /2a
che si può risolvere per somma e sottrazione. La
soluzione dà i valori desiderati.
La pi`
u semplice delle parabole è y = x2 e il lettore è invitato a disegnarla, insieme al fuoco e alla direttrice. Possono essere importanti i seguenti
concetti:
Definizione 7.1 Si dice asse di una parabola la retta

passante per il fuoco e perpendicolare alla direttrice.
Si dice vertice della parabola lintersezione dellasse
con la parabola stessa.
Lasse è, in effetti, un ase di simmetria, cioè se P è un
punto della parabola, il simmetrico Q di P rispetto
allasse è anchesso un punto della parabola. Infatti,
Q ha la stessa ordinata di P e quindi la stessa distanza dalla direttrice; inoltre, per definizione di punto
simmetrico, lasse della parabola risulta essere anche
lasse del segmento P Q, e quindi F ha la stessa distanza da P e da Q. Il vertice V è il punto estremo
della parabola, nel senso che esso è il punto della parabola pi`
u vicino alla direttrice e si trova a metà del
segmento F D, se D è il punto di intersezione dellasse
con la direttrice. Si ha allora:
A seconda che il fuoco abbia ordinata maggiore o

minore della direttrice, la parabola risulta avere la
concavità rivolta verso lalto o verso il basso; questo
purche la curva non può tagliare la direttrice, taglio
in cui avrebbe distanza zero da questa e distanza positiva dal fuoco. Si ha allora un modo semplice per
determinare come è disposta la concavità:
Teorema 7.11 La concavit`
a della parabola y =
ax2 + bx + c (a 6= 0) è rivolta verso lalto se e solo se
è a > 0.
Prova: Secondo il Teorema 7.9 abbiamo: a =
1/2(y0 d) e quindi a ha lo stesso segno di y0 d; ma
questo è positivo se e solo se y0 > d, cioè se il fuoco è
posto al di sopra della direttrice e quindi la concavità
è rivolta verso lalto.
Capire da che parte è rivolta la concavità della parabola può aiutare a risolvere vari problemi. Si consideri, ad esempio, il fatto di voler determinare se
il punto (x0 , y0 ) è interno o esterno alla parabola
y = ax2 + bx + c (a 6= 0), dove per interno intendiamo contenuto nella concavità della parabola. Se
la concavità è rivolta verso lalto e y = ax20 + bx0 + c
è il valore che la parabola assume in x0 , chiaramente il punto è interno se e solo se y0 > y, cioè
y0 > ax20 + bx0 + c. Questo è importante quando
si vogliano condurre le tangenti alla parabola da un
punto P (x0 , y0 ) assegnato; la cosa è possibile se e
solo se il punto è esterno alla parabola o si trova su di
essa. Daltra parte, trovare lequazione delle tangenti
alla parabola passanti per P non è difficile:
Teorema 7.12 Sia y = ax2 + bx + c (a 6= 0) una
parabola e sia P (x0 , y0 ) un punto ad essa non
interno; allora i coefficienti angolari m delle tangenti alla parabola passanti per P sono le soluzioni
dellequazione:
m2 2m(2ax0 + b) + b2 + 4ay0 4ac = 0.
Prova: Una retta generica di coefficiente angolare
m passante per P ha equazione y y0 = m(x x0 )
208
e quindi si può far sistema tra questa equazione e
quella della parabola: le soluzioni del sistema saranno
i punti di intersezione della retta con la parabola. Le
tangenti sono caratterizzate dal fatto che i due punti
di intersezione in effetti coincidono. Eliminando la y,
dal sistema si ottiene lequazione di secondo grado in
x: mx mx0 + y0 = ax2 + bx + c, cioè: ax2 (m
b)x + mx0 y0 + c = 0, che dà le ascisse dei punti di
intersezione. Affinche questi coincidano è necessario
e sufficiente che il discriminante dellequazione sia 0,
cioè sia: (m b)2 4a(mx0 y0 + c) = 0. Eseguiti i
pochi calcoli necessari, si trova che questa è proprio
lequazione desiderata.
Il fatto che siamo partiti da un punto esterno alla parabola ci assicura che le soluzioni dellequazione
esistono senzaltro. Affrontiamo allora il problema da
un altro punto di vista e proviamo ad immaginare che
questo possa non essere il caso, cioè immaginiamo di
non conoscere la posizione di P rispetto alla parabola.
Il ragionamento per trovare le tangenti rimane invariato, solo che alla fine non sappiamo se lequazione
del teorema precedente ha soluzioni o meno. Possiamo allora osservare che tale equazione deve avere
due soluzioni se il punto P è esterno, una sola soluzione se P si trova sulla parabola (si può tracciare
solo la tangente in quel punto), e nessuna soluzione
se P è interno. Ma tutto ciò è dato dal discriminante
dellequazione, che vale:
(b + 2ax0 )2 b2 4ay0 + 4ac = 4a(ax20 + bx0 + c y0 ),
e si ritrovano esattamente le condizioni già viste. Infatti, perche non vi siano soluzioni (punto interno) a
e ax20 + bx0 + c y0 devono essere discordi, e quindi
se a > 0 deve essere ax20 + bx0 + c < y0 , e se a < 0
deve essere ax20 + bx0 + c > y0 .
Lultimo problema che vogliamo risolvere è la determinazione della parabola che passi per certi punti
assegnati. Poiche ax2 + bx + c è un polinomio di
secondo grado, algebricamente bastano tre valori distinti della x per determinarlo completamente; daltra parte, geometricamente, la y non può assumere
pi`
u di due valori uguali, e anche questo si deve riflettere sulle condizioni di esistenza della parabola. In
effetti si ha:

sostituendo nellequazione della parabola i valori dei
tre punti si ottiene il sistema:
yA = ax2A + bxA + c
yB = ax2B + bxB + c
yC = ax2C + bxC + c
nelle tre incognite a, b, c. Affinche il sistema abbia soluzione, la matrice del sistema deve avere il
determinante diverso da 0; ma:
x
2A xA 1
x
xB 1 =
B
x2 xC 1
C
= x2A xB + xA x2C + x2B xC x2A xC xA x2B
xB x2C + (xA xB xC xA xB xC ) =
= (xA xC )xA xB (xA xC )xA xC (xA xC )x2B +

+(xA xC )xB xC =
= (xA xB xA xC x2B + xB xC )(xA xC ) =

= (xB xA )(xC xB )(xA xC ).
Questa espressione vale 0 se e solo se xA = xB , oppure se xB = xC , oppure xC = xA , ma questo è
escluso dallipotesi che le ascisse siano due a due distinte. Daltra parte, se fosse yA = yB = yC , sostituendo questi valori nella colonna delle x o delle x2
otterremmo 0, perche tale colonna sarebbe multipla
dellultima, e quindi avremmo a = 0 e b = 0, contro
lipotesi che debba essere a 6= 0.
7.4
Circonferenza,
iperbole
ellisse
Come dimostra il caso della parabola, la definizione di una curva come luogo geometrico aiuta molto nella ricerca dellequazione che definisce la stessa
curva nella Geometria Analitica. La cosa è particolarmente vera nel caso della circonferenza che, come ricordiamo, è il luogo dei punti equidistanti dal
centro. Sia allora O (x0 , y0 ) il centro di una circonferenza e sia r il suo raggio; un punto generico
P
p (x, y) della circonferenza deve esser tale che:
Teorema 7.13 Siano A (xA , yA ), B (xB , yB ),
(x x0 )2 + (y y0 )2 = r e quindi, elevando al
C (xC , yC ) tre punti del piano tali che xA , xB , xC quadrato, x2 2x0 x + x20 + y 2 2y0 y + y02 = r2 .
siano a due a due distinti e fra yA , yB , yC vi siano Ordinando i termini di questo polinomio di secondo
al pi`
u due valori uguali; allora esiste una e una sola grado in x e y si ha lequazione: x2 + y 2 2x0 x
parabola y = ax2 +bx+c (a 6= 0) passante per A, B, C. 2y0 y + x20 + y02 r2 = 0. Si ha allora il seguente:
Prova: Intanto, assegnata la parabola le condizioni

su A, B, C sono verificate perche ad ogni valore di x
corrisponde un unico valore di y e ad ogni valore di
y corrispondono al pi`
u due valori di x. Viceversa,
Teorema 7.14 Unequazione di 2 grado in x e y

rappresenta lequazione di una circonferenza se e solo
se ha la forma x2 + y 2 + ax + by + c = 0, con c >
(a2 + b2 )/4.
209
7.4. CIRCONFERENZA, ELLISSE E IPERBOLE

Prova: Se partiamo da una circonferenza, otteniamo
unequazione del tipo desiderato ponendo a = 2x0 ,
b = 2y0 , c = x20 + y02 r2 , ove (x0 , y0 ) sono le
coordinate del centro ed r è il raggio; questo dà
c = (a2 + b2 )/4 r2 e quindi la condizione su c è senzaltro verificata. Viceversa, partiamo da unequazione del tipo descritto nellenunciato del teorema; definiamo x0 = a/2, y0 = b/2 e consideriamo la quantità
r2 = c(a2 +b2 )/4; per ipotesi, questa quantità è positiva e quindi la possiamo assumere come quadrato
del raggio. Ma ora, se consideriamo lequazione della
circonferenza di raggio O (x0 , y0 ) e raggio r come
appena trovati, per la prima parte del teorema arriviamo proprio allequazione x2 + y 2 + ax + by + c = 0,
e quindi lasserto è provato.
Come osservato, moltiplicando unequazione del tipo della circonferenza per una quantità s 6= 0, lequazione non cambia e non cambia perciò la curva. Quindi, possiamo dire che unequazione di secondo grado
in x e y rappresenta una circonferenza se e solo se: i) i
coefficienti di x2 e y 2 sono uguali; ii) manca il termine
in xy; iii) si ha c > (a2 + b2 )/4. Se queste condizioni
sono verificate, dividendo tutto per il coefficiente di
x2 e y 2 ci si riporta alla forma del teorema precedente e si è quindi in grado di determinare le coordinate
del centro e la misura del raggio. Si noti che è particolarmente semplice lequazione di una circonferenza
di centro lorigine e raggio r: x2 + y 2 = r2 ; invece,
una circonferenza che passi per lorigine ha equazione
x2 + y 2 + ax + by = 0, cioè ha c = 0.
Come sappiamo dal Teorema 6.36, dati tre punti
non allineati A, B, C, esiste una e una sola circonferenza che passi per tutti e tre. Lo stesso teorema
fornisce un metodo per trovare centro e raggio della circonferenza, metodo che potremmo seguire, dato
che nella sezione precedente abbiamo imparato a trovare le equazioni degli assi dei segment AB e BC, a
calcolare la loro intersezione O e infine a trovare la distanza di O da A (o da B o da C). Tuttavia, possiamo
enormemente semplificare tutta questa procedura applicando direttamente un po dAlgebra: imponiamo
che la circonferenza generica x2 + y 2 + ax + by + c = 0
passi per A (xA , yA ), B (xB , yB ) e C (xC , yC ).
Si ottiene il sistema di tre equazioni:
2
2
+ axA + byA + c = 0
xA + yA
2
2
xB + yB
+ axB + byB + c = 0
2
2
+ axC + byC + c = 0
xC + yC
nelle tre incognite a, b, c. Risolvendo questo sistema, si trovano i parametri a, b, c e quindi lequazione
della circonferenza cercata, dalla quale si hanno le
coordinate del centro e la lunghezza del raggio.
Nota 7.2
Consideriamo ora il precedente sistema

dal punto di vista dei determinanti, come abbiamo
imparato nella Nota 5.7.

del sistema è:
xA
xB
xC
Il determinante della matrice
yA 1
yB 1 ,
yC 1
una nostra vecchia conoscenza, incontrata nella Nota

7.3. Il sistema ha una e una sola soluzione se e solo se
questo determinante è diverso da zero, ma nella nota
abbiamo visto che questo determinante è diverso da
zero se e solo se i tre non sono allineati. Poiche è
proprio questa lipotesi che abbiamo fatto, il sistema
ha sempre una soluzione e tale soluzione determina la
circonferenza cercata. Il lettore è invitato a trovare
la circonferenza che passa per i punti A (0, 0),
B (10, 0) e C (8, 4), dopo aver cercato di stabilire
ad occhio i valori di a, b, c. Le terne Pitagoriche, viste
nel Teorema 6.28 possono tornare utili a tale scopo.
Determinare lequazione di unellisse comunque disposta sul piano cartesiano non è del tutto banale;
ci accontenteremo pertanto di trovare lequazione di
unellisse disposta come in figura, cioè col centro nellorigine degli assi e simmetrica sia rispetto allasse
delle x sia a quello delle y. Se lellisse è allungata
come nella Figura 6.33, i due fuochi si troveranno
sullasse delle x. Siano (a, 0) e (a, 0) le coordinate
dei punti estremi dellasse dellellisse disposto sullasse x, e siano (0, b) e (0, b) gli estremi dellaltro asse
(nella figura è a > b, ma potremmo avere a < b senza problemi, solo che la posizione dei fuochi cambia).
Con queste condizioni la posizione dei fuochi è determinata. Infatti, per il punto (a, 0) la somma delle
distanze dai fuochi F = (f, 0) ed F = (f, 0) è
a f + a + f = 2a, e quindi 2a è la costante dellellisse. Daltra parte, per il
ppunto (0, b) la somma delle
distanze dai fuochi è: 2 b2 + f 2 , e questa quantità
deve essere uguale a 2a. Dividendo per 2 ed elevando
al quadrato si ottiene b2 + f 2 = a2 , e questo
ci dà il
valore delle ascisse dei due fuochi: f = a2 b2 .
Con queste premesse, consideriamo un generico
punto (x, y) dellellisse e calcoliamo la somme delle
distanze dai fuochi, che deve essere uguale a 2a:
p
p
(x f )2 + y 2 + (x + f )2 + y 2 = 2a
p
p
x2 + y 2 + f 2 2xf + x2 + y 2 + f 2 + 2xf = 2a.
Eleviamo al quadrato sfruttando le nostre conoscenze

dei prodotti notevoli e semplificando:
p
2x2 + 2y 2 + 2f 2 + 2 (x2 + y 2 + f 2 )2 4x2 f 2 = 4a2
p
(x2 + y 2 + f 2 )2 4x2 f 2 = 2a2 x2 y 2 f 2 .
Elevando ancora al quadrato si elimina (x2 +y 2 +f 2 )2 :

4x2 f 2 = 4a4 4a2 (x2 + y 2 + f 2 ).
210
Ora occorre semplificare e scrivere a2 b2 al posto di
f 2 , come abbiamo osservato; si arriva cos` allespressione x2 b2 = a2 y 2 + a2 b2 , e infine si divide tutto per
a2 b2 dopo aver trasportato a sinistra il monomio con
y:
x2
y2
+ 2 =1
(7.4)
2
a
b
Questa formula determina lellisse come curva, cioè
è la formula analitica dellellisse; p
se il valore di x, diciamo x0 è noto, si ricava y = 1 x20 /a2 , cioè si
hanno due valori opposti per la y, come è chiaro dalla
figura. Molte altre proprietà possono essere ricavate
da questa espressione, ma qui ci limiteremo ad alcune osservazioni. La circonferenza di centro lorigine
e raggio a ha equazione x2 + y 2 = a2 , come già sappiamo. Se fissiamo un punto x0 (a x0 a) e
calcoliamo lordinata positiva del puntopsulla circonferenza e sullellisse, troviamo:
yC = a2p x20 per
p
la circonferenza, e yE = b 1 x20 /a2 = ab a2 x20 .
Quindi tra i due punti cè un rapporto b/a costante.
Questa osservazione permise a Keplero di calcolare
larea di unellisse.
Teorema 7.15 Sia data unellisse di equazione
(7.4), nella quale a e b sono le misure dei semiassi;
allora larea dellellisse è A = ab.
Prova: Possiamo suddividere lasse maggiore in piccoli segmenti di lunghezza h e, su tali segmenti, costruire dei rettangoli che permettano di approssimare
larea del cerchio e quella dellellisse. Se x0 è lestremo di uno dei segmenti,p
il rettangolo che approssima
il cerchio avrà area 2h a2 x20 ; quindi la somma
delle aree di tutti questi rettangoli
approssimerà laP p
rea totale del cerchio: AC =
2h a2 x20 a2 .
Operando in modo analogopper lellisse, larea di ciascun rettangolo sarà 2h ab a2 x20 , e quindi larea
P bp 2
P p 2
totale è: AE =
2h a a x20 = ab
2h a x20 ,
in quanto per la proprietà distributiva la costante
b/a si può mettere in evidenza. Ma allora abbiamo
AE = ab AC , questo qualunque sia il numero e la dimensione dei segmenti usati; la relazione vale perciò
anche per le aree calcolate precisamente e pertanto:
AE = ab a2 = ab, come si voleva.

6.34, che ha i due fuochi sullasse delle x, equidistanti dallorigine. Come per lellisse si potrebbe considerare liperbole con i fuochi sullasse delle y, ma
i risultati sarebbero analoghi. Chiamiamo allora a
la distanza del vertice delliperbole dallorigine degli
assi ed f la distanza dei due fuochi, ancora dallorigine. La costante delliperbole è data dalla differenza
AF2 AF1 = a + f (f a) = 2a. Per un misterioso motivo che sarà chiaro alla fine dei conti e
che giustificheremo nella prossima nota, introducia2
2
2
mo una costante
b > 0 tale che b = f a ; si
ha allora f = a2 + b2 e preso un generico punto
P (x, y) sulliperbole, impostiamo lequazione relativa imponendo la condizione sulla differenza delle
distanze:
p
p
P F2 P F1 = (x + f )2 + y 2 (x f )2 + y 2 = 2a.
A questo punto, i conti sono abbastanza analoghi a

quelli svolti per lellisse e quindi lasciamo al lettore
tutta la gioia di portarli fino in fondo. Ad un certo
punto (che in realtà può essere del tutto
arbitrario) si
dovrà sostituire f con lespressione a2 + b2 e questo
permette di arrivare alla forma finale:
x2
y2
=1
a2
b2
(7.5)
che fa il paio con quella dellellisse. Invitiamo il lettore a disegnare liperbole con a = 3, b = 4 e quindi
f = 5.
Liperbole per cui a = b si dice equilatera; ruotando uniperbole equilatera di 45 in senso antiorario, si
trova liperbole y = 1/x, cioè xy = 1. Un utile allenamento consiste nel cercar di risolvere i soliti esercizi,
trovando le tangenti (ad uniperbole data dallequazione (7.5)) da un punto assegnato fuori delliperbole
stessa, ad esempio dallorigine (ma questo è un caso
cattivo) oppure dal punto A (a/2, 0).
Nota 7.3
Mentre nellellisse la costante b ha un

significato ben preciso, cioè di lunghezza del semiasse
minore, nelliperbole la b sembra un arbitrio il cui
unico scopo è di semplificare la formula finale (7.5).
In realt`
a non è proprio cos`. Geometricamente, la
nostra iperbole (Figura 6.34) non interseca lasse
delle y, e quindi sembra venir meno laggancio
che legava la costante b allellisse. Tuttavia, se
algebricamente portiamo avanti il sistema tra lequazione (7.5) e lasse y di equazione x = 0, si ottiene
lequazione in y: y 2 = b2 , che chiaramente non ha
soluzioni reali. Essa ha per`
o le soluzioni complesse
y = ib, e quindi possiamo affermare (con un po
di facciatosta matematica) che liperbole incontra
lasse delle y nei due punti immaginari ib. Ecco allora che abbiamo trovato un significato per la nostra b.
Il problema della lunghezza dellellisse (cioè del

suo perimetro) è piuttosto pi`
u complicato e richiede luso del calcolo integrale; pertanto noi non lo
affronteremo e rimandiamo la sua soluzione ai corsi
di Analisi Matematica, che lo studente potrà seguire
allUniversità.
La pi`
u complicata delle coniche è senzaltro liperbole; pertanto, se è già complesso trovare lequazione della generica ellisse, a maggior ragione è laborioso cercare quella della generica iperbole. LimitiaLe due rette y = ab x, cioè ay bx = 0, passanti
mo quindi la nostra ricerca alliperbole della Figura per lorigine, hanno un significato particolare. Con-
7.5. GEOMETRIE NON-EUCLIDEE

sideriamo la retta y = bx/a quando x cresce indefinitamente, e confrontiamola con liperbole, o meglio
col suo ramo positivo. Questo ramo ha equazione:
r
b2 2
y=
x b2 .
a2
La distanza verticale fra le due curve è, per defiizione,
la differenza fra le ordinate delle due curve per uno
stesso valore dellascissa. La distanza verticale non
è la stessa cosa della distanza che, in un punto della
curva, è la minima distanza dai punti dellaltra curva.
Proprio perche la distanza (tout-court) è definita come minimo, essa è pi`
u breve della distanza verticale.
Se questa, al crescere di x, si avvicina a 0, a maggior
ragione si avvicinerà a 0 la distanza. Nel nostro caso
la distanza verticale è:
r
b2 2
b
x b2 .
v (x) = x
a
a2
211
mondo stesso, considerato come una semplice immagine riflessa del mondo delle idee. Tutti ricordiamo il
mito della caverna, ed è difficile dire se Platone fosse
stato influenzato dalla geometria nelle sue concezioni
filosofiche, o se ammirasse la geometria perche rifletteva cos` bene la sua filosofia. Euclide, ottantanni
dopo Platone, non fece che sistematizzare e concretizzare in una teoria ciò che Platone aveva intuito e
creduto. Di conseguenza, fino al 1800 tutti hanno
fermamente creduto che la Geometria Euclidea fosse indubitabile e nessuno ha mai pensato di mettere
in dubbio che gli sviluppi della Geometria Euclidea
fossero gli unici a descrivere il mondo reale.
Questa petizione di principio ha condizionato lattitudine dei matematici a cogliere aspetti importanti,
non solo della geometria, ma anche dellaritmetica e
dellalgebra, discipline che fino al 1600 sono rimaste a
quella subordinate, e che, comunque, hanno con essa
condiviso lidea di rappresentare, nel loro complesso,
la vera descrizione dei fenomeni naturali legati alle
Questa quantità è senzaltro positiva in quanto il mi- forme e ai conteggi. Come vedremo, questa credenza
nuendo è maggiore del sottraendo a causa del b2 . Si fece s` che spiriti brillanti non si accorgessero di strade ampie e interessanti che pure avevano imboccato,
può allora scrivere nel modo seguente:
ma che ritennero false e fuorvianti.
r
r
a2
b2 2 b2 2
b
b
b
Naturalmente, lerrore era nel manico, e questo lo
v (x) = x
x 2a = x x 1 2.
a
a2
a
a
a
x
rendeva pi`
u subdolo, cos` come oggi probabilmente
non vediamo, o siamo portati a trascurare, sviluppi
Osserviamo che a è fisso e quindi, quando x cresce
che non si accordano con la nostra mentalità, condiindefinitamente, a2 /x2 si avvicina sempre pi`
u a 0.
zionata da altri pregiudizi che non ci appaiono tali.
Quindi v (x) si riduce a 0, come differenza di quanCome abbiamo ricordato e come tramanda Platarco,
tità praticamente uguali. Perciò la retta ay bx = 0
la geometria era nata con scopi molto pratici: misurimane sempre al di sopra del ramo delliperbole, ma
rare i terreni, dando modo di ripristinare situazioni di
le due curve si avvicinano sempre pi`
u. Si dice che
fatto cancellate dalle piene del Nilo. I Greci fecero un
la retta è un asintoto della curva. In pratica, lesipasso fondamentale, che però alcuni di loro (risultati
stenza di un asintoto indica che una curva cresce in
poi i pi`
u influenti) portarono troppo lontano. Il pasmodo pressoche lineare quando x va verso linfinito.
so consistette in quel processo di astrazione che portò
Non tutte le curve hanno un asintoto: ad esempio,
appunto alla formulazione assiomatica di Euclide, che
la parabola cresce come x2 e non linearmente; quein forma meno precisa, ma sostanzialmente identica,
sto esclude, per definizione, che la parabola abbia un
era noto ai tempi di Platone. Questa forma sembraasintoto. Ritorneremo su questo argomento quando
va tanto perfetta che si stabil` dovesse costituire la
studieremo il comportamento delle funzioni nella Serealtà stessa, cioè lessenza riposta dietro lapparenza
zione 8.7; infatti, un asintoto può caratterizzare la
dei fenomeni, del reale come ci si presenta. Pertanto,
crescita di una funzione e quindi essere utilissimo per
` la realtà, e
filosoficamente, la Geometria Euclidea e
capire landamento della funzione stessa.
nulla ci può essere di vero al di fuori di ciò che si può
dedurre con tale scienza.
7.5
Geometrie non-Euclidee
La Geometria di Euclide è stata considerata, per circa

2000 anni, lunica geometria possibile e immaginabile, per il semplice motivo che la si riteneva un modello (veritiero) della realtà. Con considerazioni pi`
u
filosofiche che matematiche, si riteneva che la Geometria Euclidea descrivesse esattamente il mondo in
cui viviamo; anzi, da un punto di vista platonico, la
Geometria era lidea del mondo, quindi pi`
u reale del
Questa fede aveva soltanto un piccolo neo. Dei dieci punti che abbiamo visto nella sezione [6.1], nessuno
trovava niente da ridire sui cinque assiomi di Aristotele e sui primi quattro postulati di Euclide. Il quinto,
però, con la sua formulazione abbastanza complicata,
di certo pi`
u complessa di quella di tutti gli altri, era
guardato con sospetto. Nessuno che dubitasse della
sua validità, ma esso veniva meno al concetto di semplicità e immediata evidenza che si pensava dovessero
avere gli assiomi. Si pensò allora che si potesse intro-
212
durre un altro assioma, pi`
u elementare, e dal quale
il quinto postulato potesse essere dedotto. Addirittura, molti ritennero che esso potesse essere dedotto
dai primi quattro, e perciò potesse essere eliminato
dalla formulazione di Euclide.
In effetti, possiamo distinguerne tre filoni:
cercare di dimostrare il quinto postulato mediante tutti gli altri; questo avrebbe permesso di
eliminarlo, addirittura semplificando la teoria;

C
cercare di sostituire il quinto postulato con altri

Figura 7.9: Il quadrilatero di Saccheri
pi`
u semplici, anche se equivalenti; questo avrebbe soddisfatto il senso estetico dei matematici,
AD = CD per costruzione, e possiamo applicare il
senza cambiare nulla della teoria;
terzo principio di congruenza. La conclusione è apb = DCA.
b
Si hanno perciò tre possibilità
negare il quinto postulato per arrivare a qualche punto B DC
b e DCA:
b
conclusione assurda; questo, almeno, avrebbe di- relative agli angoli B DC
mostrato che il postulato era necessario, avrebbe
1. sono entrambi retti;
respinto il primo dei due precedenti modi di ragionare e avrebbe incanalato le ricerche lungo il
2. sono entrambi acuti;
secondo.
3. sono entrambi ottusi.
Intorno allanno 1000, i matematici arabi affrontarono seriamente il problema delle parallele, laltro no- La Geometria Euclidea assume che sia vera la prima
me con cui è nota la questione del quinto postulato di ipotesi. Come sè visto, la retta CD risulta parallela
Euclide. Prima il fisico e matematico Ibn al-Haithan ad r e quindi BD ed AC sono perpendicolari alla stes(latinizzato in Alhazen, poi il poeta e matematico sa CD; questo implica che gli angoli in D e in C sono
Omar Khayyam e infine lastronomo e matematico retti. Se si riuscissero ad escludere le altre due posNasir Eddin al-Tusi studiarono a lungo la faccenda, sibilità, il gioco sarebbe fatto e avremmo dimostrato
senza approdare a nulla di definitivo. Certamente, il il postulato delle parallele.
pi`
u famoso dei tre è Omar Khayyam, la cui opera poeLa cosa non si rivelò affatto semplice e molti cretica è nota in occidente dalle traduzioni ottocentesche dettero di aver dimostrato lassurdità di 2. e di 3.
in inglese e in francese, e lalone esotico, decadente ed laddove, invece, o serano sbagliati oppure avevano
epicureo che lha circondato, lo ha fatto approdare utilizzato involontariamente qualche teorema equivaanche ai fasti del cinematografo. Come matematico, lente al quinto postulato. Il caso pi`
u sconcertante fu
è stato forse il primo ad interessarsi in modo sistema- certo quello dellabate gesuita Girolamo Saccheri. Altico delle equazioni di terzo grado, anche se riteneva linizio del 1700 egli riprese il quadrilatero che porta il
che non potessero essere risolte per via algebrica, ma suo nome e cercò di ragionare per assurdo. Supponiab e DCA
b
solo geometricamente come intersezione di coniche.
mo, disse, che ad esempio i due angoli B DC
Questi matematici arabi introdussero il cosiddet- siano entrambi acuti; vediamo quali conseguenze si
to quadrilatero di Saccheri. Questo nome, che natu- possono dedurre da questa ipotesi e se ne troviamo
ralmente gli arabi non usavano, sarà giustificato pi`
u qualcuna assurda avremo dimostrato che lipotesi di
tardi; la sua costruzione è mostrata nella figura 7.9. acutezza non può andar bene. Operiamo poi in modo
b e DCA
b siano entrambi
Si prendono due punti distinti A e B su una retta analogo supponendo che B DC
r e si tracciano i segmenti AC e BD, perpendicolari ottusi e cos` alla fine avremo la dimostrazione complead r e della medesima lunghezza. Si considera infine ta che lunica condizione ammissibile la 1., proprio
la retta passante per C e D e quindi il quadrilatero quella equivalente al quinto postulato di Euclide.
ABDC.
Con questo bel programma in mente, Saccheri si
E facile dimostrare, senza far uso del quinto po- mise al lavoro, e poiche era un buon matematico scob e C DB
b sono uguali. pr` una serie di teoremi dedotti dallipotesi che i due
stulato, che i due angoli ACD
b e DCA
b fossero acuti. Questo era molto
Infatti, si comincino a considerare i triangoli ABD angoli B DC
e BCA, che sono uguali perche AB è in comune, bello e interessante, ma Saccheri aveva come obiettiAC = BD per costruzione e, ancora per costruzio- vo quello di trovare una conseguenza assurda, e cos`
b e C AB
b sono uguali in quanto tanto sarrabattò e tanto scrisse che a un certo punne, gli angoli ABD
retti. Pertanto, BC = AD e quindi sono uguali i to si convinse di aver trovato il baco che cercava. A
triangoli BDC e ADC; ancora, CD è in comune e quel punto, tutto contento, decise che la Geometria
213
7.5. GEOMETRIE NON-EUCLIDEE

Euclidea era proprio quella vera. Purtroppo per lui,
limpostazione ideologica con la quale era partito gli
aveva fatto prendere lucciole per lanterne; i teoremi
che aveva dimostrato erano tutti validi, ma erano validi in una geometria che supponesse acuti gli angoli
b e DCA,
b e in ciò che aveva trovato non cera nulB DC
la di assurdo. Come conclude malinconicamente C.
B. Boyer: [Saccheri] . . . perdette il diritto di rivendicare a se quella che sarebbe stata la pi`
u significativa
scoperta del XVIII secolo: la geometria non-euclidea.
Il suo nome rimase oscuro per un altro secolo, poiche
limportanza della sua opera fu trascurata da coloro
che vennero dopo di lui.
Lanno cruciale per le geometrie non-Euclidee fu
il 1829, con la pubblicazione del saggio Sui principi
della Geometria di Nicolaj Lobacevskij e il Tantamen, il trattato nel quale Farkas Bolyai riportava
in appendice le idee del figlio Janos sulla questione
del quinto postulato di Euclide. Lobacevskij era un
giovane matematico russo che già da qualche anno
si occupava dei fondamenti della geometria e, dopo
vari tentativi e vari tentennamenti, aveva, come si
suol dire, saltato il fosso operando una vera e prob
pria rivoluzione: ipotizzare che i due angoli B DC
b
e DCA del quadrilatero di Saccheri siano entrambi
acuti non è andare contro la realtà, ma è semplicemente un modo diverso di fondare la geometria rispetto allimpostazione di Euclide. I risultati che si
ottengono sono assolutamente validi, anche se in un
mondo diverso da quello che aveva in mente Euclide. In particolare, nel mondo di Lobacevskij, per
un punto esterno a una retta r passano infinite rette
parallele ad r, cioè che non incontrano mai r, pur
prolungate indefinitamente. Unaltra particolarità è
che la somma dei tre angoli interni di un triangolo
è minore di due angoli retti, invece di essere perfettamente uguale. Naturalmente, le proprietà diverse
sono infinite, ma non sono contraddittorie le une con
le altre, e i teoremi continuano ad essere veri, anche se assai diversi da quelli usuali. Sessantanni dopo Lobacevskij, Felix Klein chiamò iperbolica questa
geometria, contrapponendola a quella Euclidea, che
egli defin` parabolica.
Bolyai aveva in mente una geometria del tutto analoga a quella di Lobacevskij, ma il Tentamen fu reso pubblico soltanto nel 1832. Inoltre, mentre Lobacevskij continuò a sviluppare la sua geometria negli
anni successivi e fino alla morte, Bolyai si disinteressò
della sua, cos` che il riconoscimento per la scoperta
della Geometria non-Euclidea va a tutti gli effetti al
matematico russo. Bolyai rimase male dello scarso
successo delle sue idee; soprattutto, sembra che rimanesse male dellindifferenza con cui le accolse il
pi`
u grande dei matematici, Gauss, che era amico del
padre. Daltra parte, Gauss fu sempre restio a rico-
noscere pubblicamente i meriti degli altri matematici,

e mostrò la stessa indifferenza anche per il lavoro di
Lobacevskij.
Bisogna dire che, in generale, la scoperta delle Geometrie non-Euclidee non fu considerata, a quei tempi,
cos` importante come che la rappresentiamo oggi. La
rilevanza della geometria in Matematica era allora
molto calata, anche solo rispetto a centanni prima,
e se le si dava credito da un punto di vista didattico,
quasi pi`
u nessuno se ne interessava sul versante della ricerca. Questa era presa soprattutto dallAnalisi,
che vedeva lAlgebra classica come un proprio strumento, mentre lAlgebra moderna muoveva appena
i primi timidi passi. In quanto alla geometria come
tale, aspetti speciali quali la Geometria Analitica, la
Geometria Proiettiva e Descrittiva avevano attratto
lattenzione dei matematici. Di fatto, le Geometrie
non-Euclidee sembrarono pi`
u una curiosità che una
rivoluzione scientifica.
Nel giro di una ottantina di anni, però, si verificarono tre fatti che hanno cambiato radicalmente il
nostro atteggiamento nei confronti delle Geometrie
non-Euclidee. Il primo fatto è specifico della Matematica e si tratta della prolusione che Riemann lesse
quando divenne professore allUniversità di Gottinga
nel 1854 (aveva 28 anni!). Per rendersi conto dellimportanza di questa prolusione, basterà ricordare
che Gauss espresse il suo apprezzamento per il lavoro
di Riemann, cosa unica ed eccezionale. La prolusione
trattava dei fondamenti della geometria, anche se della geometria considerata dal punto di vista analitico.
Riemann generalizzava il concetto di distanza tra due
punti che, come sappiamo è espressa dalla formula:
d2 (A, B) = (xA xB )2 + (yA yb )2 + (zA zB )2 =
= dx2 + dy 2 + dz 2
nello spazio a tre dimensioni. Passando a una
combinazione quadratica qualunque:
d2 (A, B) = a1,1 (xA xB )2 +a1,2 (xA xB )(yA yB )+
+a1,3 (xA xB )(zA zB )+a2,1 (yA yB )(xA xB )+ =
= a1,1 dx2 + a1,2 dx dy + a1,3 dx dz + a2.1 dy dx +
si ottiene un concetto di distanza (in termini matematici, una metrica) che conforma lo spazio in infiniti modi possibili. Scegliendo opportunamente i
coefficienti a1,1 , a1,2 , a1,3 , . . . si hanno pertanto geometrie diverse, fra le quali la Geometria Euclidea
è quella in cui tutti i parametri valgono 0, eccetto
a1,1 = a2,2 = a3,3 = 1. Riemann, poi, non legava
la distanza alla differenza di coordinate (xA xB )
o (yA yB ), ma le lasciava come libere funzioni dei
punti A e B coinvolti, purche soddisfacessero certe
regole generali: ad esempio, la distanza tra due punti
214
è nulla se e solo se i due punti coincidono; la distanza
tra A e B è uguale alla distanza di B da A; e cos via.
In questa maniera si può far rientrare la geometria
di Lobacevskij in una teoria pi`
u generale di geometrie Euclidee e non-Euclidee da studiare con gli stessi
strumenti teorici. Il nome di Riemann è rimasto legato a un caso speciale di geometria non-Euclidea, e
b
cioè quello corrispondente al caso che gli angoli B DC
b
e DCA del quadrilatero di Saccheri siano entrambi ottusi. In tale geometria, per un punto posto al di fuori
di una retta r non passa alcuna retta parallela ad r;
inoltre, la somma dei tre angoli di un triangolo è sempre maggiore di due angoli retti. Nella terminologia
di Klein, questa è la Geometria Ellittica.
Lopera di Riemann (che mor` di tisi a soli quarantanni) ricondusse nellalveo della Matematica importante le Geometrie non-Euclidee, anche se le relegava a un ruolo molto subalterno, ad esempi, interessanti fino a un certo punto, di una teoria ben
pi`
u generale. Rientrate comunque in ballo, il secondo fatto che giocò a loro favore (e fu probabilmente
il fatto pi`
u importante) riguarda il rinnovato interesse per la Logica e per i fondamenti della Matematica che prese piede e si sviluppò alla fine del 1800
e allinizio del 1900. Questo merita la nostra attenzione e cercheremo perciò di raccontarlo con qualche
dettaglio.
La Geometria Euclidea costituisce sicuramente il
primo esempio di sistema assiomatizzato; quando i
matematici ripresero ad interessarsi dei fondamenti,
la geometria costitu` un banco di prova immediato
per discutere le idee relative ai processi di assiomatizzazione. Limpianto Euclideo fu analizzato da tutti
i possibili punti di vista e, come abbiamo detto, ne
furono rilevate inesattezze e carenze, fino ad arrivare
alla formulazione di Hilbert, che abbiamo schematizzato nella Sezione 6.1. La possibilità di sviluppare
teorie alternative come le Geometrie Euclidee e nonEuclidee fa capire che non esiste un apparato certo
di assiomi che tutto comprende, e, cosa ancora pi`
u
importante, non esiste un insieme vero di assiomi,
e quindi non esiste una teoria vera, cioè conforme
alla realtà o tale che la realtà le si conformi. Questa è lidea diametralmente opposta alla concezione
antica della Geometria Euclidea, che, come abbiamo
osservato allinizio, era tradizionalmente pensata come vera descrizione della realtà, anzi di realt`
a vera
nellaccezione estrema di Platone.
Ogni teoria ha un suo ambito di validità, cioè è vera
per quella serie di fenomeni che vanno daccordo con
gli assiomi. In questambito, i teoremi costituiscono
risultati veri, ed è ciò che dà senso alla nostra visione
matematica del mondo, secondo lo spirito di Galileo.
Se usciamo dallambito di validità degli assiomi, non
possiamo pi`
u parlate di adeguatezza tra realtà e teo-

ria, e siamo costretti a cambiare la teoria esplicativa.
Tutto ciò è abbastanza evidente, ma cè un problema molto grave dietro questo modo di vedere le cose.
Se impostiamo una teoria dichiarando quali sono gli
assiomi e le regole di inferenza (v. Sezione 1.6), fin
dove possiamo spingerci con larbitrarietà degli assiomi scelti? In altre parole, non possiamo mettere tra
gli assiomi che 2+2 = 4 e allo stesso tempo 2+2 = 5,
ne possiamo tollerare che uno dei due si deduca dallaltro. E questo il problema della consistenza di
una teoria, e requisito fondamentale per un sistema
assiomatico sensato è che esso determini una teoria
consistente, cioè priva di contraddizioni.
Un metodo per stabilire la consistenza di un sistema è quello di trovarne un modello nella realtà (si
veda anche la Sezione 1.6) o almeno in unaltra teoria che riteniamo consistente. Ad esempio, la Geometria Euclidea si considera consistente perche ha come
modello la Geometria Analitica, e questa si basa su
concetti matematici che consideriamo consistenti, o
non contraddittori. Sarebbe allora interessante trovare dei modelli anche per le Geometrie non-Euclidee,
poiche questo ci assicurerebbe che esse non contengono contraddizioni, cioè sono teorie valide alla pari
della Geometria Euclidea. Vorrei osservare che questo aspetto non era stato considerato ne la Lobaceskij
ne da Bolyai che, a rigore, avrebbero potuto creare
delle belle teorie, ma inconsistenti, perche inficiate da
qualche contraddizione interna che avrebbero potuto
non rilevare. Come si ricorda, questa era la non segreta speranza di Saccheri, che desiderava proprio dimostrare linconsistenza delle sue ipotesi assurde relative
al quadrilatero della Figura 7.9.
Un primo e quasi banale modello fu trovato per
la Geometria Ellittica di Riemann. Accontentiamoci
di una realtà bidimensionale e consideriamo quanto
succede sulla superficie della Terra. I punti sono i
punti della superficie di una sfera e le rette sono le
circonferenze massime sulla stessa superficie: pensiamo ai meridiani e allequatore, mentre non sono rette
gli altri paralleli. Questa scelta non è casuale, ma
è dovuta al fatto che presi due qualsiasi punti (ad
esempio, due città) esiste una e una sola circonferenza massima che passa per essi, mentre di altri tipi
di circonferenze ne passano infiniti. Questo è proprio
quello che ci aspettiamo da oggetti che vogliamo chiamare rette, oggetti determinati da due punti e due
soltanto. Se ora pensiamo a un meridiano m (cioè,
una retta) e ad un punto P fuori di esso, vediamo subito che ogni retta che passa per P incontra sempre
e comunque il meridiano m. Infatti, due circonferenze massime non possono non incontrarsi (altrimenti,
una almeno non sarebbe massima) e anzi si incontra
in due punti, come ogni coppia di meridiani si incontrano al Polo Nord e al Polo Sud. Come abbiamo
215
7.6. GEOMETRIA DESCRITTIVA E PROIETTIVA

accennato, in questa geometria la somma degli angoli interni di un triangolo è sempre maggiore di due
retti. Prendiamo ad esempio due punti sullequatore, di modo che la loro distanza sia un quarto della
lunghezza dellequatore stesso; uniamoli tra loro e al
Polo Nord. Otteniamo cos` un triangolo, detto sferico
perche disegnato sulla superficie di una sfera. Basta
un momento di riflessione per capire che i tre angoli
del triangolo sono tutti retti, e quindi la loro somma
di 270 è ben maggiore di 180 !
C
B A
Figura 7.10: Triangoli di Beltrami e di Riemann

Pi`
u laborioso fu trovare un modello per la Geometria Iperbolica di Lobacevskij. Ci riusc`, nella seconda metà del 1800, il matematico italiano Eugenio
Beltrami. Anche lui propose un modello bidimensionale, costituito da una superficie. Questa però è assai complicata e si ottiene per rotazione da una curva
speciale, detta trattrice, definita nel modo seguente:
per ogni punto P sulla trattrice , la tangente a
in P incontra lasse delle x in Q e il segmento P Q
ha lunghezza unitaria. Facendo ruotare questa curva
intorno allasse delle ascisse si ottiene una superficie
detta pseudosfera ed è la superficie considerata da
Beltrami. Questa superficie ha una proprietà importante, ma un po difficile da capire: la curvatura in
ogni punto è costante ed uguale a 1; questo è il giusto il contrario di ciò che succede nella sfera, che ha
anchessa curvatura costante, ma uguale a +1. Nella
sfera, infatti, la curvatura è sempre risolta allinterno,
mentre nella pseudosfera è sempre rivolta allesterno.
Questa analogia al contrario fa s` che, definite opportunamente le rette, succeda proprio ciò che si
vuole nella Geometria Iperbolica: per un punto P
fuori della retta r passano infinite rette parallele
ad r (cioè, che non incontrano mai r). Anche se
la cosa è difficile a vedersi, Beltrami dimostrò che
in ogni triangolo sulla superficie della pseudosfera la
somma degli angoli interni è sempre minore di due
retti. Non tentiamo nemmeno di abbozzare le dimostrazioni, fidando nella fiducia del lettore e sulla credibilità di Beltrami che, ai suoi tempi, fu presidente
dellAccademia dei Lincei e Senatore del Regno.
I modelli non hanno solo la funzione logica di ras-
sicurarci sulla consistenza di una teoria assiomatica;

essi hanno anche un valore psicologico non indifferente, poiche ci mostrano una situazione reale (anche
se in senso molto matematico e astratto) nella quale
gli assiomi, i teoremi, le definizioni e tutto ciò che
deriva dalla nostra teoria hanno un riscontro pratico
ben chiaro. Si può dire, esagerando forse un po, che
il modello sostanzializza la teoria, rendendola plausibile anche agli scettici. Spesso, come nel caso della
Geometria Ellittica, il modello ci mostra come unidea che pareva assurda (quella delle geometrie nonEuclidee) rientri invece nei canoni della Matematica
conosciuta, anzi non sia altro che una situazione ben
nota, solo vista da un punto di osservazione diverso.
I triangoli sferici, infatti, fanno parte della trigonometria sferica, una disciplina che era stata studiata
fin dallantichità, e in modo assai profondo dopo le
grandi scoperte geografiche, essendo legata ai nostri
movimenti sulla superficie terrestre, in primo luogo
quelli delle navi.
A questo punto non ci rimane altro che ricordare il terzo fatto (ultimo, ma non meno importante) che ha portato allaffermazione delle geometrie
non-Euclidee: la geometria di Riemann è la Geometria adottata da Einstein nella teoria della relatività.
Questa non avrebbe neppure avuto inizio, se le Geometrie non Euclidee non avessero fornito gli strumenti
matematici per il suo sviluppo.
7.6
Geometria
proiettiva
descrittiva
7.7
Topologia
7.8
Gli spazi vettoriali
216
Capitolo 8
Trigonometria e Calcolo
C. [canticchiando da ubriaco] Che ne dite della
mia voce?
H. Non vi vedo debuttare allOpera.
C. He, he! Mi chiamo Collins, per mia sfortuna, non Caruso. Sono professore. Insegno
allUniversit`
a di Chicago e ho fatto una conferenza a New York sugli integrali. Nel Calcolo
Differenziale si d`
a una funzione e si ottiene il
differenziale. Avete afferrato?
H. Alla perfezione!
C. Davvero?!
A. Hitchcock Laltro uomo
In questo capitolo conclusivo trattiamo di due argomenti un po pi`

u avanzati e specialistici, almeno dal
punto di vista della Matematica che si insegna nelle
Scuole Medie. La Trigonometria è propriamente lo
studio dei triangoli, ma le funzioni trigonometriche,
seno, coseno, tangente e le loro inverse, hanno una
stretta connessione con la funzione esponenziale, come scopr` Eulero, e ciò imparenta Trigonometria e
Calcolo Differenziale. Non potremo perciò non prendere in considerazione tali funzioni che sono periodiche e quindi qualitativamente diverse dai polinomi,
dalle funzioni razionali fratte, dallesponenziale e dal
logaritmo.
La Trigonometria è nata nellantichità, applicata
soprattutto allastronomia; si è poi affermata nel Medio Evo come ausilio indispensabile alla navigazione,
crescendo vieppi`
u di importanza con le scoperte geografiche del 1400 1500 e la conseguente globalizzazione dei viaggi per mare. Le prime tavole trigonometriche prendevano in considerazione la corda sottesa da un arco di circonferenza, e quindi in pratica
erano relative al seno. Oltre a seno, coseno, tangente e cotangente, ebbero fortuna altre funzioni, come
1 cos x, ma oggi non le si considerano molto importanti; la stessa cotangente, essendo semplicemente linverso della tangente, tende ad essere relegata in
secondo piano. Rimangono importanti tutte le applicazioni della Trigonometria alle misurazioni (triangolazioni), allo studio dei fenomeni oscillatori e pe-
riodici, allanalisi armonica (suoni, immagini, colori,

compressione, etc.).
Il Calcolo Differenziale e Integrale è un po alla base
di tutta la Matematica moderna. Esso fu inventato (o
scoperto) da Newton e da Leibniz nella seconda metà
del 1600. Newton accusò Leibniz di avergli rubato lidea, sfruttando alcune informazioni che gli aveva dato
in una lettera. Leibniz negò, rivendicando loriginalità delle proprie idee. Cos` i due rimasero nemici fino
alla morte. Gli storici oggi sono pressoche daccordo
che i due pensarono e svilupparono il calcolo differenziale in modo indipendente, con concetti e notazioni
equivalenti, ma abbastanza lontane. A parte questa
diatriba, nel giro di pochi anni il calcolo differenziale
divenne la regina della Matematica e uno stuolo di
matematici geniali lo sviluppò tanto da renderlo indispensabile sia alla Matematica sia alla Fisica, come
mostrò per primo lo stesso Newton.
La crescita del calcolo differenziale durante il 1700
ha qualcosa di prodigioso, e uno dei maggiori scienziati che contribu` a questo exploit fu certamente Eulero. Nella prima metà del 1800 i matematici, e primo
fra tutti Cauchy, diedero una sistemazione ai risultati
precedenti, arrivando a unimpostazione che è praticamente quella che oggi conosciamo. Tuttavia, il concetto di funzione e quello di integrale si rivelarono
particolarmente delicati, e occorre arrivare alla fine
del 1800 e allinizio del 1900 per trovarne una caratterizzazione soddisfacente (Peano, Lebesgue). Noi,
bisogna dire, saremo costretti a seguire unimpostazione abbastanza intuitiva, ma speriamo che sia sufficiente a far capire i concetti principali e a permettere
di utilizzarli a livello elementare.
8.1
Le funzioni trigonometriche
Scopo della trigonometria è la misurazione dei triangoli, cioè il calcolo dei valori delle varie misure di un
triangolo: lati, angoli, altezze, mediane e cos` via, a
partire da dati noti, di solito i tre lati, due lati e langolo tra essi compreso, o un lato e i due angoli ad
esso adiacenti. Come sappiamo, questi dati determi-
217
218
CAPITOLO 8. TRIGONOMETRIA E CALCOLO
nano tutti gli altri in modo univoco, ma la geometria

euclidea non dà molto aiuto per valutare le quantità
non note. Proprio a questa mancanza vuol rimediare
la trigonometria che, inizialmente, aveva soprattutto
scopi pratici e veniva usata nella navigazione, nella
topografia, nella balistica e nellastronomia. Le prime
tavole trigonometriche, costruite dagli Arabi, servivano proprio per questi scopi: il citato al-Khuwarizmi,
nell800 D.C. contribu` alla realizzazione delle prime
tavole dei seni e nel XIII secolo il re Alfonso di Castiglia fece preparare le prime tavole nautiche dellOccidente: con grande scandalo in tutta Europa,
affidò tale compito a un gruppo di matematici arabi ed ebrei, che a quel tempo erano i migliori. Gran
parte del lavoro dei matematici applicati del 1700 e
del 1800 fu la compilazione di carte nautiche di tutto
il mondo e di tabelle di puntamento per le artiglierie.
Comunque, dal 1700 con Eulero, fu riconosciuta la
stretta connessione tra la funzione esponenziale e le
funzioni trigonometriche, che cos` entrarono a far parte della matematica teorica e successivamente, come
è noto, divennero parte preponderante nello studio
dellelettricità, del magnetismo e di tutti i fenomeni
oscillatori.
misura dellarco, si ha pertanto la proporzione:
Figura 8.1: Il cerchio goniometrico
Il cerchio di raggio 1 è detto cerchio goniometrico;

di solito lo si rappresenta col centro nellorigine di un
sistema di assi cartesiani ortogonali. Gli angoli sono
rappresentati come angoli al centro e, di regola, una
delle due semirette che definiscono langolo è fatta
coincidere con la semiretta positiva dellasse delle x,
mentre laltra semiretta determina langolo secondo
una rotazione in senso antiorario (si veda la Figura
8.1). Ora si può osservare che larco U A è direttamente proporzionale allangolo . Questo permette
di sostituire la misura in gradi di con la misura di
U A. Detta G() la misura in gradi di ed R() la
G() : 360 = R() : 2,

essendo 2 la misura dellintera circonferenza, corrispondente allangolo di 360 . La quantità R() si
chiama la misura in radianti di e quindi si hanno
le semplici formule di conversione:
R() =
G()
180
G() =
180R()
.
Questo significa che, per definizione, un radiante è la

misura dellangolo che sottende un arco di lunghezza
1 nel cerchio goniometrico. La sua misura in gradi è:
G() =
180
57 17 44 81/100.
Altre misure importanti sono:

18 =
rad
10
30 =
rad
6
45 =
rad
4
rad
90 = rad.
3
2
La misura in radianti è, in un certo senso, la misura
naturale degli angoli. Essa infatti non dipende da
suddivisioni arbitrarie, quali la misurazione del grado
come 360a parte dellangolo giro; dipende solo dalla
misura degli archi, e quindi del raggio del cerchio,
che abbiamo fissato ad 1 per semplicità. Per questo,
la misurazione in radianti è la pi`
u usata nella letteratura scientifica ed è indispensabile nel trattamento
analitico delle funzioni trigonometriche.
Sia ancora un angolo, sia A lintersezione con il
cerchio goniometrico e sia P la proiezione di A sullasse OU ; infine, sia B lintersezione con la retta OA
della perpendicolare ad OU in U . Si hanno le seguenti
definizioni:
60 =
Definizione 8.1 Si dice seno dellangolo , e si indica con sin() (dal latino sinus), la misura (con
segno) del segmento AP . Si dice coseno dellangolo , e si indica con cos(), la misura (con segno)
del segmento OP . Infine, si dice tangente dellangolo , e si indica con tan(), la misura (con segno)
del segmento U B.
Al variare di tra 0 e 360 (cioè tra 0 rad e 2
rad) il seno e il coseno possono assumere solo valori
compresi tra 1 e 1. La tangente, invece, assume valori sempre pi`
u alti man mano che da 0 si va verso i
90 ; per = 90 il valore della tangente non risulta

definito e lo si considera uguale a infinito. Quando
si superano i 90 , la tangente viene ad assumere valori negativi, prima molto alti in valore assoluto, poi
sempre pi`
u vicini a 0. I valori della tangente ritornano ad essere positivi quando si superano i 180 , ma
219
8.1. LE FUNZIONI TRIGONOMETRICHE
a 270 la tangente è di nuovo non definita. Si hanno sono espresse nel sistema decimale anziche in quello
pertanto i seguenti valori:
sessagesimale.
Alla base del calcolo delle funzioni trigonometriche
sin(0 ) = 0 sin(90 ) = 1 sin(180 ) = 0
vi sono i due seguenti teoremi, che permettono di riportare i conteggi a quelli relativi a una sola funzione,
sin(270 ) = 1 sin(360 ) = 0
ad esempio il seno.
cos(0 ) = 1
cos(90 ) = 0
cos(270 ) = 0
tan(0 ) = 0
cos(180 ) = 1
cos(360 ) = 1.
tan(90 ) =
tan(180 ) = 0
Teorema 8.1 Per ogni angolo vale la seguente

identit`
a:
sin2 () + cos2 () = 1.
Prova: Se langolo è compreso tra 0 e 90 , applicando il teorema di Pitagora al triangolo OP A della

Aumentando ulteriormente langolo, i valori del seno Figura 8.1, si ha AP 2 + OP 2 = OA2 , cioè proprio la
e del coseno tornano a ripetersi ogni 360 o 2 ra- relazione cercata. Lasciamo al lettore la verifica di
dianti. Le due funzioni, pertanto, sono periodiche di questa identità in tutti gli altri casi.
periodo 360 o 2 radianti. Si scrive (k Z):
Questa relazione, valida per ogni valore di , si dice
a trigonometrica fondamentale; da essa derisin() = sin( + k360 ) cos() = cos( + k360 ); lidentit`
vano gran parte delle proprietà della trigonometria.
Per quello che riguarda la tangente, si ha:
sin() = sin( + 2k) cos() = cos( + 2k).
tan(270 ) =
tan(360 ) = 0
La tangente, invece, torna a ripetersi ogni 180 o

rad; è pertanto periodica di periodo 180 o rad:
tan() = tan( + k180 )
tan() = tan( + k).
La seguente tabella riassume il segno delle funzioni
trigonometriche di quadrante in quadrante:
sin
cos
tan
I
+
+
+
II
+
III
IV
Teorema 8.2 Qualunque sia langolo :

tan() =
sin()
.
cos()
Prova: Anche in questo caso possiamo limitarci agli

angoli compresi tra 0 e 90 . Sempre con riferimento
alla Figura 8.1, osserviamo che i due triangoli OP A e
OU B sono simili; pertanto vale la proporzione AP :
OP = BU : OU . Ricordando che, per definizione,
OU = 1, questa è esattamente la relazione cercata.
Nella Figura 8.1, langolo in A del triangolo OAP

è chiaramente il complementare di ; da questo
si deducono immediatamente le formule dellangolo
Per trovare il valore del seno e del coseno di un complementare:
angolo, è conveniente riportare langolo a uno equisin(90 ) = cos()
cos(90 ) = sin()
valente compreso tra 0 e 360 o tra 0 rad e 2 rad.
Analogamente, per la tangente si riporta langolo a
1
uno equivalente compreso tra 0 e 180 o tra 0rad e
tan(90 ) =
= cot(),
tan()
rad. Per questo, le tavole contengono solo i valori
di seno, coseno e tangente per tali angoli, spesso ad- dove cot() indica la funzione cotangente che è dedirittura limitatamente ai valori tra 0 e 45 (ovvero finita come linverso della tangente; useremo questa
tra 0 rad e /4 rad), per i motivi che vedremo un po funzione solo il minimo indispensabile. Queste forpi`
u avanti (Tabella 8.1). Il calcolatore dà i valori per mule, in realtà, valgono per tutti i valori di , anche
qualsiasi , ma al suo interno riporta tutto allinter- quando > 90 ; ad esempio, se 90 < < 180 , si
vallo fra 0 e 360 (180 ) o tra 0 rad e 2 (o ) rad ha sin(90 ) = sin() dove < 0, ovvero 270 <
effettuando la riduzione:
< 360 . I due triangoli OAP e OCQ sono uguali e questo dimostra che | sin(90 )| = | cos()|;
mod 360
ovvero
mod 2
daltra parte, i segni sono entrambi negativi e questo
conclude il ragionamento. In modo analogo si può
( mod 180
ovvero
mod ).
procedere negli altri casi, cioè quando langolo è
Di solito, un tasto permette di scegliere se fare i conti compreso negli altri quadranti e/o quando si parte
in gradi o in radianti, e talvolta è presente una ter- dal coseno.
za modalità, quella dei gradi decimali, nei quali lanUn aspetto importante di queste formule è il fatto
golo retto corrisponde a 100 e le frazioni di grado che esse permettono di ridurre il calcolo delle funzioni
220
trigonometriche (e quindi le tavole relative) al solo

ottante (0 ..45 ). Se infatti > 45 , si ha sin() =
cos(90 ), riportandosi cos` a un angolo del primo
ottante.
Dalla circonferenza goniometrica è possibile ricavare anche le formule dellangolo supplementare:
conoscendo un cateto e langolo opposto a tale cateto. Infine, si calcola anche un cateto in funzione dellaltro, risolvendo le precedenti uguaglianze rispetto
allipotenusa:
sin(180 ) = sin()
cos(180 ) = cos()
tan(180 ) = tan().
E buona norma, per non rischiare di commettere errori grossolani, disegnare il cerchio goniometrico e su
di esso langolo di interesse: le relazioni precedenti si
vedono immediatamente.
C
C
BC =
sin()
AB
cos()
AB =
cos()
BC;
sin()
queste relazioni giustificano lintroduzione della

tangente, in quanto esse sono equivalenti a:
BC = tan()AB
e AB =
BC
.
tan()
In qualche caso, queste formule permettono di ottenere il valore del seno e del coseno di certi angoli
particolari. Se = 45 ovvero = /4, il triangolo
rettangolo è met`
a di un quadrato, cioè se AB = ,
allora AC = 2, quindi:
sin(45 ) = cos(45 ) = AB/AC = 2/2
tan(45 ) =
sin(45 )
= 1.
cos(45 )
Figura 8.2: Calcolo dei lati
Se = 30 , il triangolo è metà di un triangolo

equilatero e quindi se AC = risulta AB = 3/2 e
Il teorema di Pitagora permette di calcolare i tre BC = /2; di conseguenza:
lati di un triangolo rettangolo quando ne siano noti
sin(30 ) = BC/AC = 1/2
solo due; non ci dice niente, però, sugli angoli, ne ci
permette di calcolare i lati quando se ne conosca uno
cos(30 ) = AB/AC = 3/2

solo e si conosca invece un angolo diverso da quello
retto. La trigonometria risolve immediatamente que1 2

3
sin(30 )
sti problemi. Si abbia, come in Figura 8.2, il trian= =

.
tan(30 ) =
cos(30 )
2 3
3
golo rettangolo ABC e se ne conosca langolo . Se
prendiamo il punto C in modo che AC = 1, si ha Dalla formula per langolo complementare si ha
per definizione C B = sin() e AB = cos(). Dalla allora:
similitudine dei triangoli ABC e AB C si hanno le
seguenti proporzioni:
sin(60 ) = 3/2
cos(60 ) = 1/2
AC : AC = B C : BC e AC : AC = AB : AB
1 : AC = sin() : BC
e 1 : AC = cos() : AB.
3
sin(60 )
=2
= 3.
tan(60 ) =
cos(60 )
2
Un altro angolo per il quale è facile calcolare i vaQueste permettono di calcolare due lati qualsiasi lori del seno e del coseno è 18 . Si consideri il trianquando se ne conosca il terzo. In particolare, quando golo armonico definito nella Sezione 6.4; se tracciasi conosca lipotenusa si ha:
mo laltezza CH e consideriamo il lato AC = 1, si
ha AH = sin(18 ) e CH = cos(18 ). Questo dà
BC = AC sin()
e
AB = AC cos()
immediatamente:
che si enunciano cos`: la misura di un cateto è data

51
sin(18 ) = cos(72 ) =
0.30901699 . . . .
dal prodotto dellipotenusa per il coseno dellangolo
4
adiacente o per il seno dellangolo opposto. Naturalmente, invertendo queste formule si può calcola- Dallidentità trigonometrica fondamentale si ricava
re lipotenusa di un triangolo rettangolo conoscen- allora:
s
do uno qualsiasi dei cateti e langolo compreso tra
lo stesso cateto e lipotenusa. Applicando le formule

5+ 5
cos(18
)
=
sin(72
)
=
0.95105655 . . .
dellangolo complementare, lipotenusa si trova anche
8
221
8.2. LE FORMULE DI SOMMA E SOTTRAZIONE

e infine:
Oggi, con i nostri calcolatori a disposizione, il problema sembra non pi`

u porsi, ma, ci dobbiamo chiedere,

2( 5 1)
come
riescono
gli
elaboratori
a fare i calcoli necessari?
tan(18 ) = p
In
realt`
a
esistono
vari
metodi
sviluppati dallanalisi
2 5+ 5
matematica, ma le basi sono fornite da alcune forPer completezza ricordiamo che accanto alle tre mule di importanza veramente fondamentale e che
funzioni fondamentali della Trigonometria molte al- sono conosciute già da alcuni secoli. Cominciamo col
tre sono state introdotte per risolvere specifici pro- dimostrare il seguente risultato:
blemi. Oggi sono piuttosto cadute in disuso, ma talvolta capita ancora di incontrarle. Accanto alla già
citata cotangente, inversa della tangente, meritano
B
di essere ricordate la secante e la cosecante, inverse
rispettivamente del coseno e del seno:
p
2 5+ 5
.
tan(72 ) =
2( 5 1)
csc =
1
sin
sec =
1
.
cos
Sono invece importanti le inverse composizionali di

seno, coseno e tangente:
A
C
arcsin(x) si legge: larco del seno di x e indica

langolo il cui seno vale x (nella Figura 8.1, è
larco U A nei confronti del segmento x = AP );
arccos(x) si legge: larco del coseno di x e indica langolo il cui coseno vale x (nella Figura 8.1,
è larco U A nei confronti del segmento x = OP );
arctan(x) si legge: larco della tangente di x e
indica langolo la cui tangente vale x (nella Figura 8.1, è larco U A nei confronti del segmento
x = U B).
Pertanto si ha:
X
R
Q
Figura 8.3: Somma dei seni
Teorema 8.3 Siano e due angoli tali che +

90 ; allora:
sin( + ) = sin() cos() + cos() sin().
sin(arcsin x) = arcsin(sin x) = x
b
Prova: Si consideri la Figura 8.3 in cui = U OA
b
e = AOB, per cui sin( + ) = BQ. Se BX è
cos(arccos x) = arccos(cos x) = x
perpendicolare ad OA, si ha OX = cos() e BX =
tan(arctan x) = arctan(tan x) = x.
sin(). Per le formule sui triangoli rettangoli si ha
Nella nostra trattazione elementare non ci occupere- XP = OX sin() = sin() cos() = CQ. Ora, i due
triangoli rettangoli OQR e RXB sono simili, poiche
mo molto di queste funzioni, se non in contesti
ovb
b
vi come: qual è langolo che ha per
seno 2/2?, ORQ = X RB come angoli opposti al vertice, quindi
b
domanda che ha per risposta: arcsin( 2/2) = 60 . RBX = . Nel triangolo rettangolo BXC si ha ora
Lunica eccezione è la funzione arcotangente, che ha BC = BX cos() = cos() sin() e, in conclusione:
un ruolo molto importante nel calcolo differenziale
sin( + ) = BQ = CQ + BC =
e, soprattutto, nel calcolo integrale; lincontreremo
pertanto in tale contesto.
= sin() cos() + cos() sin()
8.2
Le formule di somma e
sottrazione
come si voleva.
Lavorando per casi, è possibile far vedere che la

condizione + 90 può essere fatta cadere e che
Il calcolo delle funzioni trigonometriche non è per quindi la formula è valida per ogni valore di e di .
niente banale; a parte i pochi valori particolari che Seguendo un cammino analogo, si possono dimostrare
abbiamo visto nella precedente sezione, sappiamo ve- formule simili relative al coseno e alla differenza
ramente poco, e questo ci fa capire quanto benemeriti ; qui riteniamo che la dimostrazione precedente sia
per i naviganti siano stati coloro che hanno calcolato i sufficiente a dare lidea generale di come procedere
valori di seno e coseno, costruendo le apposite tavole. e ci limitiamo quindi a riportare le quattro formule,
222
dette di somma e sottrazione:
Per dimostrare questa relazione basta partire dalla

definizione di tangente e applicare le regole della somma e della sottrazione relative a seno e coseno; ad
esempio:
sin( + )
sin( )
cos( + )
cos( )
= sin() cos() + cos() sin()

= sin() cos() cos() sin()
= cos() cos() sin() sin()
= cos() cos() + sin() sin().
tan( + ) =
sin( + )
sin cos + cos sin
=
;
cos( + )
cos cos sin sin
E opportuno ricordare a memoria queste identità

che, insieme allidentità fondamentale, costituiscono
a questo punto è sufficiente dividere numeratore e dela base di tutta la trigonometria. Esiste una formula
nominatore per cos cos e si trova immediatamente
mnemonica che può aiutare a ricordare le due espresla formula cercata. La duplicazione è allora:
sioni per la somma, dalle quali è poi facile ricavare
quelle della sottrazione. La frase è:
2 tan
(8.1)
tan(2) =
1
tan2
CENTO ROSE MOLTO MENO BELLE.
Qui le E corrispondono al seno e le O al coseno;
le prime due parole si riferiscono alla formula per il
seno, dove si ha la somma del prodotto sin() cos()
con il prodotto cos() sin(). Le ultime tre parole si
riferiscono invece alla formula per il coseno, data dalla sottrazione (meno) fra i prodotti cos() cos()
e sin() sin(). Ad esempio, per langolo di 15 si
trova:
sin(15 ) = sin(45 30 ) =
= sin(45 ) cos(30 ) cos(45 ) sin(30 ) =

2 3
21
6 2
=
0.258819.
=
2 2
2 2
4
Analogamente:
6+ 2
cos(15 ) =
0.965926.
4
e da questa si ricava la formula di bisezione

cambiando in /2:
1 1 + tan2
.
tan =
2
tan
Per completezza, citiamo la formula di triplicazione
per il coseno, che il lettore potrà ricavare sviluppando
cos(3) = cos(2 + ):
cos(3) = 4 cos3 () 3 cos().
Sapendo risolvere le equazioni di terzo grado (in modo esatto o approssimato), questa formula permette,
ad esempio, di calcolare cos(5 ) a partire da cos(15 )
che abbiamo trovato in precedenza. La formula
analoga di triplicazione del seno è:
sin(3) = 3 sin() 4 sin3 ().

Particolarmente importante è il caso = , per
cui si ha:
Ad ogni modo, nella Tavola 8.1 riportiamo il valosin(2) = 2 sin() cos()
re del seno e del coseno di grado in grado; i seni si
leggono direttamente, mentre per leggere i coseni occos(2) = cos2 () sin2 () =
corre considerare langolo complementare, che si tro2
2
= 2 cos () 1 = 1 2 sin ().
va dal lato opposto della tabella. Perciò sin(12 ) =
che si dicono formule di duplicazione. Se poniamo 0.20791169 = cos(78 ).
/2 al posto di , si ottiene:
Nota 8.1
Come si costruisce una tavola come
quella della Tabella 8.1? Oggi la cosa è molto semplice

1, cos() = 1 2 sin2
;
cos() = 2 cos2
2
2
e basta un programma di poche righe per ottenere una
e quindi si hanno le formule di bisezione:
r
r
1 + cos()
1 cos()
, sin =
.
cos =
2
2
2
2
Queste formule permettono di ottenere seno e coseno di angoli sempre pi`

u piccoli e, quindi, di angoli che differiscono tra di loro tanto poco quanto si
vuole, cioè danno la possibilità di costruire le tavole
trigonometriche.
Per quanto riguarda la tangente, le formule di
somma e sottrazione sono le seguenti:
tan( ) =
tan tan
.
1 tan tan
tabella anche pi`

u accurata, con pi`
u cifre decimali e, ad
esempio, di primo in primo o anche di secondo in secondo. Noi abbiamo utilizzato Maple, un programma
di valutazione simbolica, che ci ha permesso di ottenere unuscita utilizzabile direttamente per queste note.
In realt`
a, le tavole come questa non sono pi`
u utilizzate, poiche è pi`
u semplice avere a disposizione una
piccola calcolatrice portatile, che ci pu`
o fornire, con
estrema precisione, il valore di qualsiasi funzione trigonometrica per un valore qualunque dellargomento.
Una volta, diciamo fino agli anni 70 del 1900, le tavole
erano indispensabili in qualsiasi lavoro tecnico e per
lorientamento; notevoli sforzi si sono spesi per rendere tali tavole prive di errori e semplici da usare. Si
narra che, proprio allo scopo di eliminare i numerosi
223
8.2. LE FORMULE DI SOMMA E SOTTRAZIONE
sin / cos
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
valore
0
0.01745241
0.03489950
0.05233596
0.06975647
0.08715575
0.10452847
0.12186935
0.13917310
0.15643447
0.17364818
0.19080900
0.20791169
0.22495106
0.24192190
0.25881905
0.27563736
0.29237171
0.30901700
0.32556818
0.34202014
0.35836797
0.37460659
0.39073114
0.40673664
0.42261827
0.43837114
0.45399051
0.46947158
0.48480963
0.50000000
0.51503808
0.52991928
0.54463903
0.55919292
0.57357643
0.58778525
0.60181504
0.61566148
0.62932041
0.64278761
0.65605904
0.66913061
0.68199837
0.69465837
0.70710680
valore
1.
0.99984770
0.99939083
0.99862953
0.99756405
0.99619470
0.99452189
0.99254615
0.99026807
0.98768834
0.98480775
0.98162718
0.97814760
0.97437006
0.97029573
0.96592583
0.96126170
0.95630475
0.95105655
0.94551857
0.93969262
0.93358042
0.92718386
0.92050485
0.91354546
0.90630778
0.89879405
0.89100652
0.88294758
0.87461970
0.86602540
0.85716730
0.84804809
0.83867057
0.82903756
0.81915205
0.80901700
0.79863549
0.78801075
0.77714595
0.76604444
0.75470957
0.74314482
0.73135369
0.71933980
0.70710680
cos / sin
90
89
88
87
86
85
84
83
82
81
80
79
78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61
60
59
58
57
56
55
54
53
52
51
50
49
48
47
46
45
Tabella 8.1: Tavola dei seni e dei coseni
errori di calcolo delle tavole nautiche, Babbage fosse spinto a progettare e a tentare di realizzare la sua
Macchina Analitica, il prototipo di tutti i calcolatori
programmabili (1835 circa).
Volendo immaginare come venivano costruite queste
tavole, possiamo cominciare osservando che è possibile, con le nostre conoscenze, trovare seno e coseno di
un angolo di 3 . Infatti, si ha immediatamente:
sin(3 ) = sin(18 15 ) =
= sin(18 ) cos(15 ) cos(18 ) sin(15 ) =
s
51 6+ 2
5+ 5 6 2
=
4
4
8
4
0.052335956 . . . .
Non è difficile, almeno numericamente, trovare ora seno e coseno dellangolo di 1 . Infatti, la formula di
triplicazione ci dice:
sin(3 ) = 3 sin(1 ) 4 sin3 (1 )
dove il valore di sin(1 ) è ignoto, ma si conosce
sin(3 ). Questa espressione equivale allequazione di
terzo grado in x = sin(1 ):
4x3 3x + sin(3 ) = 0.
Teoricamente, qui si potrebbe applicare la formula risolutiva delle equazioni di terzo grado. Come abbiamo
osservato a suo tempo, tale applicazione non è banale per i conti che richiede e che devono essere svolti
utilizzando i numeri complessi. Pi`
u conveniente è un
celebre metodo, dovuto a Newton, che permette di
trovare il valore di x con la precisione che si desidera,
applicando iterativamente la seguente formula:
xi+1 = xi
4x3i 3xi + sin(3 )

12x2i 3
e partendo dal valore x0 = 0. Questo d`

a x1 =
sin(3 )/3 0.017445318 . . ., che è gi`
a preciso fino alla
quarta cifra decimale. Applicando ancora la formula
precedente, si trova x2 = 0, 0174524064338 . . . contro un valore vero di 0.0174524064373 . . . (errore nella
12-esima cifra decimale!). Se ci si accontenta, come
abbiamo fatto nella nostra tavola, di 8 cifre decimali,
questa approssimazione va senzaltro bene, e il valore ottenuto si pu`
o prendere come base per costruire
lintera tabella. Onde evitare laccumularsi di errori
di arrotondamento, è bene sfruttare i valori che si conoscono con precisione. Cos` per calcolare sin(12 ) si
useranno i valori relativi a 30 e a 18 . Per calcolare
sin(13 ) si dovranno invece sfruttare i valori relativi a
12 e ad un grado.
Per quanto riguarda primi e secondi, si pu`
o partire
considerando il caso di 22 30 come met`
a dellangolo
di 45 :
s
2 2
0.38268343.
sin(22 30 ) =
4
224
in quanto si supponeva che (p + q)/2 e (p q)/2 si

facessero a mente, e sulle tavole si trovavano diretQuello trovato è il valore di sin(22 30 ) con 8 decimali. tamente i logaritmi delle funzioni trigonometriche.
Dalla Tabella 8.1 possiamo ricavare unapprossima- Stranamente, questo uso delle formule di prostafezione usando il metodo dellinterpolazione lineare, resi (che cercava di sfruttare al meglio le tavole dei
cioè immaginando che la funzione cresca linearmente logaritmi) `
e esattamente il contrario di quello che esfra i valori relativi a sin(22 ) e a sin(23 ). Questo se avevano allorigine, prima dellinvenzione dei logaè vero solo in via approssimativa, ma permette di ritmi. Furono infatti le formule di prostaferesi, letcalcolare sin(22 30 ), o di qualsiasi altro valore del
te da destra verso sinistra, a suggerire che potessero
seno, compreso tra due valori noti, impostando
esistere delle funzioni che trasformassero prodotti e
una semplice proporzione.
Poiche la differenza
sin(23 ) sin(22 ) = 0.01612455 corrisponde a divisioni in somme e sottrazioni, e quindi potessero

60 , la parte corrispondente a 30 si ricava da: semplificare lesecuzione delle operazioni. Esse furono
60 : 0.01612455 = 30 : x, quindi x = 0.00806227. utilizzate, in congiunzione con le tavole dei seni e dei
Aggiungendo infine questo valore a sin(22 ) si trova coseni, proprio a questo scopo, anche se ovviamente
u complicato di quello dei losin(22 30 ) 0.38266886 con un errore di 15 unit`
a il loro uso era molto pi`
su un milione, il che pu`
o essere soddisfacente per la garitmi, che, una volta inventati, le soppiantarono in
maggior parte delle applicazioni.
questo compito.
Con lo stesso spirito e con la stessa tecnica di sommare
e sottrarre le formule di somma e sottrazione,
Le seguenti formule sono oggi poco pi`
u che una
si
ottengono
le formule di Werner:
curiosità anche se in passato sono state molto
importanti da un punto di vista computazionale:
1
sin sin = (cos( ) cos( + ))
2
Teorema 8.4 Valgono le seguenti formule, dette di
1
prostaferesi:
cos cos = (cos( + ) + cos( ))
2
pq
p+q
cos
sin p + sin q = 2 sin
1
2
2
sin cos = (sin( + ) + sin( )).
2
p+q
pq
sin p sin q = 2 cos
sin
Dalle
ultime
due
identità, ponendo = (n 1) e
2
2
=
,
si
hanno
le
formule
di Simpson:
pq
p+q
cos
cos p + cos q = 2 cos
2
2
sin n = 2 cos sin(n 1) sin(n 2)
p+q
pq
cos p cos q = 2 sin
sin
.
cos n = 2 cos sin(n 1) cos(n 2).
2
2
Molto probabilmente, le formule pi`
u utili nella praProva: Si considerino le due prime formule di somma e sottrazione, relative al seno, e si ponga p = +, tica sono quelle che permettono di esprimere sin(),
q = , di modo che risulti = (p + q)/2 e cos() e tan() per mezzo della tangente di /2. Per
la tangente, abbiamo già trovato la formula (8.1);
= (p q)/2. Si ha allora:
per il seno e il coseno possiamo dare la seguente
p+q
pq
p+q
pq
sin p = sin
cos
+ cos
sin
dimostrazione geometrica:
2
2
2
2
Teorema 8.5 Per ogni valore di si ha:
pq
p+q
pq
p+q
cos
cos
sin
.
sin q = sin
2
2
2
2
sin
1 cos
tan =
=
.
Sommando membro a membro queste due uguaglian2
1 + cos
sin
ze si ha la prima formula; sottraendo membro a memb ; lanProva: Come nella Figura 8.4, sia = AOP
bro si ha la seconda. Analogamente si ottengono le
b
b ,
altre due, usando le due ultime formule di somma e golo OQP , come angolo alla circonferenza di AOP
vale /2 e quindi sono simili i tre triangoli AQP ,
sottrazione.
OU B e AU P . Si ottengono pertanto le proporzioni:
Quando andavo al Liceo, ci insegnavano queste forBU : OU = P A : QA = AU : P A,
mule perche semplificavano il calcolo della somma e
della differenza di due seni o di due coseni, specie
e scrivendo al posto di ogni segmento il suo valore,
quando si trovavano entro espressioni pi`
u complicacioè BU = tan(/2), OU = 1, P A = sin , QA =
te, come (sin p + sin q)3 . Lelevamento a potenza ri1 + cos , AU = 1 cos , si hanno le due identità.
chiedeva luso dei logaritmi e quindi poteva essere pi`
u
Questa dimostrazione che riguarda il caso 0
complicato fare 3 log10 (sin p+sin q) piuttosto che fare:
90 , si può ora estendere a tutti gli altri angoli.
pq
p+q
+ log10 sin
)
3(log10 2 + log10 sin
Si ha allora il seguente corollario:
2
2
Si scende poi a livello pi`
u fine usando le formule di
bisezione e trisezione.
225
8.3. RISOLUZIONE DEI TRIANGOLI
8.3
P
B
/2
/2
Figura 8.4: Calcolo della tan(/2)

Corollario 8.6 Per ogni angolo valgono le
seguenti identit`
a:
sin =
2 tan(/2)
1 + tan2 (/2)
cos =
1 tan2 (/2)
.
1 + tan2 (/2)
Prova: Dal teorema precedente abbiamo:

tan2
1 cos
=
,
2
1 + cos
che è una semplice equazione lineare in cos e, risolta, dà il valore annunciato. Per quanto riguarda sin ,
basta osservare che sin = tan cos e utilizzare le
espressioni già trovate per tali quantità.
Uno degli usi pi`
u frequenti di queste formule è la risoluzione delle equazioni trigonometriche, cioè equazioni nelle quali compaiono le funzioni trigonometriche di una quantità incognita. Ad esempio, consideriamo lequazione 2 sin x+cos x = 1. Tutte le equazioni lineari in sin x, cos x e tan x possono essere affrontate sostituendo a queste quantità le loro espressioni
in t = tan(x/2):
sin =
2t
1 + t2
cos =
1 t2
1 + t2
tan =
2t
.
1 t2
Nel nostro caso si ha:

4t
1 t2
+
= 1 ossia
2
1+t
1 + t2
4t + 1 t2 = 1 + t2 .
Questa è lequazione di secondo grado t2 2t = 0,

che ha le due soluzioni t = 0 e t = 2. Ricordando
(cosa che non si deve mai dimenticare) che seno e
coseno sono funzioni periodiche di periodo 360 o 2,
mentre la tangente è periodica di periodo 180 o ,
la soluzione t = 0 corrisponde a x/2 = 0 + k, ovvero
x = 0 + 2k. Infatti, per tutti questi valori si ha
sin x = 0 e cos x = 1. La soluzione t = 2 corrisponde
a x/2 = arctan 2 = 63 26 05 816/1000; il seno di
x vale esattamente 0.8 e il coseno 0.6; quindi la
soluzione generale è x = 126 52 11 63/100 + k360 .
Risoluzione dei triangoli
Come abbiamo ricordato, la Geometria Euclidea stabilisce, attraverso i cosiddetti criteri di uguaglianza
o di congruenza, quali sono i requisiti minimi perche un triangolo sia perfettamente determinato, ma
quasi nulla ci dice di come calcolare le quantità ignote (lati, angoli, altezze, mediane, etc.), basandosi sui
valori dei lati e degli angoli che si conoscono. Per
questo la Trigonometria ha avuto tanto successo pratico e si è rivelata indispensabile ogniqualvolta dalla
determinazione teorica degli elementi di un triangolo,
si debba passare alla loro valutazione numerica. Per
risoluzione di un triangolo si intende la valutazione
numerica degli elementi del triangolo (lati, angoli, altezze, bisettrici, etc.) a partire dagli elementi noti, se
questi determinano il triangolo stesso.
I triangoli sono alla base di ogni metodo di misurazione delle figure poligonali, cioè delle figure determinate da segmenti di retta, caso al quale ci si può
ricondurre in pratica quasi il 100% delle volte. Se
abbiamo una stanza un po sbilenca o un campo di
forma irregolare, si procede alla cosiddetta triangolazione, cioè a scomporre la figura in tanti triangoli, le
cui misure saranno poi calcolate mediante la Trigonometria. In pi`
u larga scala, un procedimento del tutto
analogo si usa in topografia e certi punti del territorio sono marcati per essere usati come punti di riferimento. Cime di monti e colline, edifici pubblici particolari, monumenti, tralicci costruiti appositamente,
costituiscono i vertici di triangoli ideali che permettono di misurare con precisione distanze e angolazioni.
Oggi, anche i satelliti artificiali, situati in posizioni
fisse rispetto alla Terra, permettono triangolazioni di
precisione, sfruttate prima nella navigazione marina
ed aerea, ed ora anche nel trasporto terrestre con il
sistema GPS. Senza la Trigonometria, tutte queste
applicazioni non sarebbero possibili.
Da un punto di vista matematico, la Trigonometria
offre una serie di teoremi che agevolano i calcoli; una
volta questi calcoli si eseguivano con luso delle tavole; oggi si utilizza una calcolatrice da tasca (se i conti
sono pochi) o un elaboratore pi`
u grande, ottenendo
risultati pi`
u accurati e in modo pi`
u veloce. Daltra
parte, bisogna dire, le formule della Trigonometria
sono spesso assai eleganti e tuttaltro che difficili da
dimostrare. Pertanto, una volta che ci si sia impadroniti dei concetti di base, la Trigonometria appare
una disciplina abbastanza elementare, nella quale la
tecnica tende a prevalere sulla scienza. Rimane la bellezza di molti risultati, ai quali ora vogliamo dedicare
la nostra attenzione.
La Trigonometria adotta, per un generico triangolo, una notazione standard, che occorre conoscere per
capire e tenere agevolmente a mente le varie formule.
Con riferimento alla Figura 8.5, ricordiamo che i ver-
226

C
a
mc
hc
Figura 8.5: La notazione trigonometrica dei triangoli

B
a
C
A
Figura 8.6: Il teorema dei seni
il cerchio circoscritto al triangolo e tracciato il diab = in quanto questo anmetro CD, si ha: C DB
b
golo insiste sullo stesso arco CB dellangolo C AB.
b è retto, in quanto insiDaltra parte, langolo C BD
ste su una semicirconferenza, e quindi: a = 2R sin .
Se langolo fosse ottuso, la stessa costruzione porb = 180 C AB,
b
ta ad avere C DB
ma come sappiamo sin() = sin(180 ), e quindi la relazione
a = 2R sin continua a sussistere. La stessa dimostrazione ci dà b = 2R sin e c = 2R sin , da cui
segue il teorema.
Conseguenza immediata del Teorema dei seni è il
seguente risultato, che permette di trovare facilmente
il punto di incontro tra la bisettrice di un angolo e
il lato opposto, quando si conoscano le misure dei
tre lati. Formuliamo il teorema per langolo , ma
ovviamente esso vale per tutti gli angoli, per i quali
è sufficiente ruotare opportunamente le lettere; come
vedremo, questa è una bella caratteristica dei risultati
della Trigonometria.
Teorema 8.8 (delle bisettrici) In un qualsiasi
triangolo, la bisettrice di un angolo divide il lato
opposto in due segmenti proporzionali ai due lati
adiacenti.
C
tici di un triangolo si indicano con le lettere A, B, C;

/2 /2
la lunghezza di ciascun lato è indicata dalla lettera
minuscola corrispondente alla lettera del vertice opa
b
posto: pertanto BC = a, AC = b, AB = c. Gli angoli si denotano con le lettere greche corrispondenti
b = ABC,
b
b
al loro vertice, cioè = B AC,
= B CA.
180
Le altezze si indicano con ha , hb , hc , dove lindice rapyc

xc
A
P
B
presenta il lato su cui cade laltezza; analogamente,
le mediane sono ma , mb , mc . Un ruolo importante
Figura 8.7: Teorema delle bisettrici
hanno le due circonferenze, quella inscritta e quella
circoscritta al triangolo; il centro della circonferenza
Prova: Nella Figura 8.7 il teorema afferma:
inscritta si indica con I e il suo raggio con r; il centro della circonferenza circoscritta si indica con O e
AP : AC = P B : BC;
il suo raggio con R. Infine, con S si indica larea del
dal Teorema dei seni, applicato ad AP C, si ha:
triangolo, mentre il perimetro si denota con 2p, cioè
AC
AP
sin /2
AP
2p = a + b + c; con questo, p indica il semiperimetro
=
ovvero
=
,
del triangolo.
sin /2
sin
AC
sin
Con tali notazioni, cominciamo a dimostrare il primentre applicato a P BC, si ha:
mo teorema, che è un po la base per la misurazione
BC
PB
dei triangoli.
=
.
sin /2
sin(180 )
Teorema 8.7 (dei seni o di Eulero) In un qualPoiche sin = sin(180 ), la conclusione segue
siasi triangolo si ha:
immediatamente.
b
c
a
Se indichiamo con xc il segmento P B e con yc il
=
=
= 2R.
sin
sin
sin
segmento AP , si ottiene il semplice sistema lineare:
Prova: Supponiamo prima di tutto, come nella

xc + yc = c
Figura 8.6, che sia un angolo acuto; considerato
xc /a = yc /b
227
8.3. RISOLUZIONE DEI TRIANGOLI

A
c
A
c
C B
Figura 8.8: Teorema delle proiezioni
Naturalmente, la scelta di chiamare, in un certo

ordine, a, b, c i tre lati e , , i tre angoli, è del
tutto arbitraria, eccetto per il fatto che a deve essere
il lato opposto ad , b a e c a . Pertanto devono
valere (e si dimostrano, se fosse necessario, allo stesso
modo) anche le due relazioni ruotate:
b2
c2
= a2 + c2 2ac cos
= a2 + b2 2ab cos .
Pi`
u avanti ci tornerà utile il seguente:
e risolto dà:
Corollario 8.11 In ogni triangolo si ha:

xc =
ac
a+b
yc =
bc
.
a+b
Il successivo teorema lega ciascun lato ai due angoli adiacenti; anche in questo caso, si noti la simmetria delle formule, che possono essere ottenute per
rotazione luna dallaltra.
Teorema 8.9 (delle proiezioni o di Cotes) In
ogni triangolo valgono le relazioni:
a = c cos + b cos
b = a cos + c cos
c = a cos + b cos
Prova: Se il triangolo è acuto in si ha la situazione della Figura 8.8 a sinistra: BH = c cos e
HC = b cos , da cui segue la prima relazione, essendo: a = BC = BH + CH. Se il triangolo è ottuso in , H cade fuori del segmento BC; tuttavia si
ha: BH = c cos e CH = |b cos |, dove il valore
assoluto è necessario in quanto cos < 0; ma allora
BC = BH CH = c cos + b cos . In modo analogo
si provano le altre due relazioni.
Veniamo allora al pi`
u importante dei teoremi utili
alla risoluzione dei triangoli; questo risultato è noto
come Teorema di Carnot (o del coseno) e costituisce
la generalizzazione del Teorema di Pitagora. Questo
infatti si ritrova non appena poniamo = 90 , cioè
cos = 0.
Teorema 8.10 (del coseno o di Carnot) In ogni
triangolo si ha:
a2 = b2 + c2 2bc cos .
Prova:
Consideriamo le tre relazioni del teorema precedente e moltiplichiamo la prima per a, la
seconda per b e la terza per c:
a2
b2
c2
= ac cos + ab cos
= ab cos bc cos
= ac cos bc cos
Sommando membro a membro e semplificando si trova a2 b2 c2 = 2bc cos , che è la relazione che
stavamo cercando.
cos =
b2 + c2 a2
.
2bc
Di nuovo, valgono le relazioni che si ottengono ruotando tra di loro i lati e gli angoli; si osservi che il
teorema di Carnot ci dà modo di risolvere un triangolo quando se ne conoscano due lati (b e c) e langolo
tra essi compreso (1 criterio di uguaglianza). Il
corollario risolve invece il caso del 3 criterio, quando
si conoscano i tre lati a, b, c. Se sono noti un lato a e
i due angoli ad esso adiacenti (2 criterio), in realtà
sono conosciuti tutti e tre gli angoli; considerando
due delle tre identità di Cotes, si ottiene un sistema
di due equazioni nelle due incognite b e c. In particolare, se si usano le due ultime identità, si ottiene il
sistema:
b
c cos = a cos
b cos +
c
= a cos
Il determinante di questo sistema vale:
1
cos
2
= 1 cos .
cos
1
Questa quantità è zero se e soltanto se cos2 = 1,

cioè = 0 oppure = 180 . Queste sono situazioni
che possiamo scoprire a priori, in quanto il triangolo
degenera in un segmento. Si conclude pertanto che
questo metodo risolve sempre il triangolo.
Il calcolo dei lati e degli angoli di un triangolo permette di trovare anche il valore delle altezze e delle mediane che, di fatto, scompongono il triangolo
in altri triangoli, addirittura rettangoli nel caso delle altezze. Tuttavia, esistono ancora alcune formule
interessanti che permettono di semplificare qualche
calcolo ulteriore. Ad esempio, Nepero, oltre a darsi
da fare per calcolare i logaritmi, scopr` anche queste
formule, che ci saranno di aiuto.
Teorema 8.12 (delle tangenti o di Nepero) In
ogni triangolo vale la relazione:
tan +
a+b
2
,
=
ab
tan
2
assieme alle altre due che si ottengono per rotazione.
228
Prova:
Cerchiamo di vedere le formule dei se- e formule analoghe. Sostituendo:
ni (Teorema 8.7) come proporzioni; componendo e
r
r
2bc b2 c2 + a2
(p b)(p c)
scomponendo si ha:
sin =
=
2
4bc
bc
(a + b) : a = (sin + sin ) : sin
r
r
2bc + b2 + c2 a2
p(p a)
(a b) : a = (sin sin ) : sin .
cos =
=
2
4bc
bc
Queste proporzioni equivalgono a:
e la formula per la tangente discende da queste,
quando si esegua la divisione.
(a + b) : (a b) = (sin + sin ) : (sin sin ).
Questo teorema, già interessante di per se, ci dà

Le prime due formule di prostaferesi implicano allora: modo di dimostrare il Teorema di Erone, nella mia
modesta opinione uno dei pi`
u bei teoremi della Geo
sin +
a+b
2 cos 2
metria e forse di tutta la Matematica. Erone di Ales=
ab
cos +
sandria era interessato piuttosto alle applicazioni del2 sin 2
la Matematica e della Fisica che ai risultati teorici.
e questa non è altro che la formula di Nepero.
Fu inventore di macchine ingegnose, come leliopila e
Briggs, a cui evidentemente piaceva seguire Nepe- lodometro, e si interessò soprattutto della soluzione
ro, sia per i logaritmi, sia per la Trigonometria, scopr` approssimata dei problemi geometrici. Sembra, in efalcune formule che permettono di esprimere le fun- fetti, che il teorema fosse già noto ad Archimede, ma
zioni trigonometriche dei tre angoli di un triangolo non abbiamo documenti in proposito; la dimostrazioin funzione dei soli lati a, b, c, e queste formule sono ne di Erone (geometrica e non trigonometrica) è cos`
u antica che conosciamo.
particolarmente carine quando si faccia intervenire il la pi`
semiperimetro p = (a + b + c)/2, che pertanto fa il
Teorema 8.14 (di Erone) In ogni triangolo si ha:
suo trionfale ingresso operativo:
p
S = p(p a)(p b)(p c).
Teorema 8.13 (di Briggs) In ogni triangolo si ha:
r
r
Prova: Laltezza relativa al lato c si trova facen
(p b)(p c)
p(p a)
do:
hc = b sin e quindi abbiamo: S = (bc sin )/2.
sin =
cos =
2
bc
2
bc
Usando ora la formula di bisezione, si trova:
s
(p b)(p c)
S = bc sin cos
.
tan =
2
2
2
p(p a)
e possiamo ricorrere alle formule di Briggs del
Valgono inoltre le analoghe formule ruotate per gli
teorema precedente, ricavando:
angoli , .
r
r
(p b)(p c) p(p a)
Prova: Si cominci con losservare che langolo /2 è
.
S = bc
bc
bc
senzaltro compreso tra 0 e 90 , per cui seno, coseno
e tangente sono quantità positive. Pertanto, dalle Questa è proprio la formula desiderata.
formule di bisezione e dal Corollario 8.11 si ha:
Concludiamo queste nostre note sulla Trigonos
r
2
2
2
metria
con un risultato che permette di calcolare
1 cos
1
b +c a
sin =
1
=
il
raggio
del cerchio inscritto e quello del cerchio
2
2
2
2bc
circoscritto:
s
r
Teorema 8.15 In ogni triangolo si ha:

b2 + c2 a2
1 + cos
1
1+
.
=
cos =
2
2
2
2bc
S
abc
r=
R=
.
Ci sono ora due osservazioni importanti da fare.
p
4S
Primo:
Prova: Con riferimento alla Figura 8.9, larea del
triangolo ABC è equivalente alla somma dei triangoli
2bc b2 c2 + a2 = (a + b c)(a b + c)
ABI, BCI, CAI le cui aree sono cr/2, ar/2, br/2, cioè
2bc + b2 + c2 a2 = (a + b + c)(a + b + c)
S = pr. Riprendiamo ora, dal teorema precedente, la
come si vede eseguendo i conti sulle espressioni di formula S = (bc sin )/2; dal Teorema dei seni abbiadestra e semplificando; secondo:
mo: sin = a/(2R), che ci dà S = abc/(4R). Questa
formula è equivalente a quella cercata.
a + b c = a + b + c 2c = 2(p c)
229
8.4. IL CONCETTO DI LIMITE
P
B
I
Q
O
R
A
Figura 8.9: Cerchio inscritto e circoscritto
8.4
Il concetto di limite
Fin dallinizio di queste note, abbiamo osservato come

sia impossibile considerare in modo effettivo e diretto ciò che fa riferimento alla nostra idea di infinito.
Ripensando a ciò che abbiamo detto, ci possiamo rendere conto che siamo ricorsi a due tecniche diverse.
Una è stata quella della scommessa, introdotta per
formalizzare il fatto che linsieme N dei numeri naturali non è finito. La seconda tecnica è stata quella
di Cantor, il quale definisce un insieme infinito come
un insieme che possa essere messo in corrispondenza biunivoca con un suo sottoinsieme proprio. Lidea
di Cantor è davvero geniale e va bene nel conteggio degli insiemi, ma non si presta quando si cerca
di ragionare sullinfinitamente vicino o sullinfinitamente lontano. In altre parole, Cantor funziona finche si vogliono distinguere gli infiniti elementi dellinsieme, non funziona pi`
u quando questi diventano
indistinguibili perche troppo vicini o troppo lontani.
Il criterio della scommessa è lo stesso che serv` a
Lucrezio a provare che lo spazio è infinito: recati alla
fine dellUniverso e scaglia la tua freccia; se essa va,
allora quella non è la vera fine; se non va, cè qualcosa oltre quella fine. Questo stesso criterio è quello
che abbiamo usato per definire i numeri reali, quel
qualcosa che possiamo concepire, ma che non esiste
in atto, al termine di una sequenza infinita di numeri
che, globalmente, stanno sempre pi`
u vicini tra di loro.
In barba a Zenone abbiamo detto: prendiamo tutte
le sequenze i cui elementi siano definitivamente vicini
tra di loro e chiamiamo numero reale quella cosa
indefinita che esse hanno in comune, la nostra sensazione che possiamo idealmente afferrare quel qualcosa
che non cè, ma che, con le nostre scommesse, possiamo portare pi`
u in là di qualsiasi limitazione un nostro
avversario ci voglia imporre.
Sicuramente, quello di limite è uno dei concetti fondamentali della Matematica, legato comè a tutti i
ragionamenti che riguardano la vicinanza (o la lonta-
nanza) dei numeri di un insieme, quando questi tendono a diventare sempre pi`
u vicini (o pi`
u lontani).
Questa tendenza coinvolge sempre ragionamenti che
riguardano insiemi infiniti di numeri.
Preliminari però a quello di limite, vi sono alcuni
concetti pi`
u semplici, ma di fondamentale importanza
per chiarire i discorsi che dovremo fare. In modo
alquanto schematico, diamo le seguenti definizioni,
che il lettore vorrà assimilare in modo accurato.
1. Si consideri un insieme A R, finito o infinito; si dice massimo degli elementi di A, e si scrive
max(A), quellelemento a A, se esiste, tale che per
ogni altro elemento b A, si abbia a > b. La clausola sullesistenza è importante, poiche non è detto che
tutti gli insiemi A R abbiano un elemento massimo. Ad esempio, N R, ma N non ha alcun elemento
massimo. Non importa nemmeno che A contenga elementi che crescono indefinitamente perche sia privo
di massimo. Se consideriamo A = {1 1/n}nN0 ,
una successione, è chiaro che al crescere di n gli elementi di A sono sempre pi`
u grandi (anche se di pochino), ma nessun elemento di A è il pi`
u grande di
tutti. Infatti, il numero 1, che saremmo forse tentati
di considerare alla stregua di massimo, di fatto non
sta in A, e quindi non conta. Un insieme finito ha
sempre un massimo, ma gli insiemi con un numero
infinito di elementi possono averlo o non averlo. Naturalmente, il concetto di minimo è del tutto analogo
a quello di massimo, e lasciamo al lettore la soddisfazione di definirlo e di portare avanti considerazioni
ed esempi, sulla falsariga dei precedenti. Comunque,
A = {1/n}nN0 ha 1 come elemento massimo, ma
non ammette alcun elemento minimo.
2. Sia A R come sopra; un elemento R si
dice limite superiore per A se a, per ogni elemento
a A. In generale, non è detto che sia un elemento
di A, anzi, di solito non lo è. E facile vedere che se
è un limite superiore per A ed A, allora è anche
il massimo di A. Di limiti superiori per A ne esistono
molti e, in effetti, basta che ne esista uno, diciamo
pure , e ne esistono infiniti, tutti gli > . Linsieme
A si dice superiormente limitato se ammette un limite
superiore. Ancora una volta, il lettore è chiamato
in causa per definire cosa sia un limite inferiore e
che significhi, per un insieme, essere inferiormente
limitato. Infine, possiamo dire che A è limitato se
è tanto superiormente quanto inferiormente limitato,
cioè, in altre parole, ammette un limite superiore e
un limite inferiore, come si intuisce facilmente.
3. Come sè visto al primo punto, un insieme
A R può non avere elemento massimo; ha però
sempre un elemento speciale, detto estremo superiore e indicato con sup(A). Per comprendere questo
concetto, si consideri un insieme A privo di massimo. Se A non è superiormente limitato, si definisce
230
sup(A) = +, dove il simbolo si legge infinito e

risale al 1500. Altrimenti, si considera linsieme A
dei limiti superiori di A, che non è vuoto per lipotesi che A sia superiormente limitato. Si osserva ora
che A ha sempre un elemento minimo . Infatti, det
to A il complementare di A in R, la coppia (A , A)
costituisce una sezione di R, secondo quanto detto
nella Sezione 3.5. Per lassioma di continuità, A ha
massimo oppure A ha minimo. Sia tale elemento e
vediamo che non può essere il massimo di A . Se
infatti appartenesse ad A , non sarebbe un limite
Esiste allora un
superiore di A (che sono tutti in A).
elemento a A tale che a > , e (a + )/2 è compreso tra a ed , cioè non è un limite superiore per A
ed è maggiore di contro lipotesi che questo fosse il
massimo di A . Questo prova che sup(A) esiste sempre: se A ha un massimo allora sup(A) = max(A),
altrimenti è comunque il minimo dei limiti superiori,
e quindi non sta in A. In modo analogo si definisce
lestremo inferiore di A come il massimo dei limiti
inferiori di A. Esiste sempre e si indica con inf(A); se
A non è limitato inferiormente si pone inf(A) = .
Come esempio si consideri:
ha senso però che sia piccolo, poiche per grande

tutto diviene ovvio. Cos` ha senso che M sia grande,
perche se è piccolo tutto diviene troppo facile.
Le successioni di Cauchy, che abbiamo introdotto nella Sezione 3.5 per i numeri razionali, possono
essere estese ai numeri reali, cambiando opportunamente la Definizione 3.4. La loro importanza è data
dal seguente:
inf {1/n}nN0 = 0
inf {1 1/n2 }nN0 = 0
sup {1/n}nN0 = 1
Teorema 8.16 Una successione è convergente se e

solo se è una successione di Cauchy.
Prova: Supponiamo che la successione tenda al limite ; questo significa che fissato > 0 esiste un
indice m con la proprietà che per ogni n > m si ha
| an | < /2; in particolare è: | am+1 | < /2 e
quindi:
|am+1 an | = |am+1 + an |
+ +
2 2
e questo dimostra che vale il criterio di Cauchy con
m = m + 1. Viceversa, procediamo in modo formale, seguendo quanto detto nella Sezione 1.8 per
la negazione dei predicati. Il criterio di Cauchy si
formula:
|am+1 | + | an | <
sup {1 1/n2 }nN0 = 1.
( > 0)(m N) | (n > m) : |am an | < .

Ora è il momento di introdurre, in modo sistematico, il criterio della scommessa, nella forma che abbia- Pertanto, come abbiamo imparato nella Sezione 1.8,
mo cominciato a vedere con le successioni di Cauchy la negazione è:
(si veda la Sezione 3.5).
( > 0) | (m N)(n > m) | |am an | .
Definizione 8.2 Sia {ak }kN una successione assegnata; si dice che la successione converge al numero Analogamente, il fatto che la successione tenda ad
reale se, fissato un numero reale positivo [piccolo] si esprime scrivendo:
a piacere, esiste un indice m della successione tale
( R) | ( > 0)(p N) | (n > p) : | an | < .
che per ogni indice n > m si ha |an | < . Il
numero si dice limite della successione e si scrive: La negazione è allora:
= lim an .
n
( R)( > 0) | (p N)(n > p) | | an | .
Si dice invece che la successione diverge a + () Poiche questa relazione vale per ogni , vale in
se, fissato un numero M [grande] a piacere, esiste particolare quando = ap , cioè:
un indice m della successione tale che per ogni in( > 0) | (p N)(n > p) | |ap an |
dice n > m si ha an > M (an < M ). Si scrive
rispettivamente:
e questa, come abbiamo visto, altro non è che la
negazione della condizione di Cauchy.
lim an = + e
lim an = .
n
n
Particolarmente importanti sono le successioni moone, cioè le successioni che non decrescono o
La successione {1/n}nN0 converge a 0; la suc- not`
cessione {n}nN diverge a + e la successione non crescono mai. Formalmente, una successione
{(1)n }nN non converge, ne diverge, in quanto {ak }kN è monotona non decrescente se n N si ha:
oscilla tra +1 e 1. Osserviamo esplicitamente che an+1 an . Analoga è la definizione di successione
nella precedente definizione abbiamo posto fra paren- monotona non crescente. Osserviamo esplicitamente
tesi quadra gli aggettivi piccolo e grande. Essi che, in Matematica, il termine tecnico monotono
sono infatti logicamente inutili perche le relazioni de- va pronunciato piano, cioè con laccento tonico sulla
vono valere per o per M arbitrari; psicologicamente, penultima sillaba.
231
Teorema 8.17 Una successione monotona ha sem- i suoi elementi possono essere invertiti; questo perpre un limite; se è limitata, il limite è finito, mette di eseguire anche la divisione. In questi casi,
altrimenti il limite è infinito.
è opportuno vedere come si comporta il limite (per
n ), cioè vedere se il limite della somma, della
Prova: Consideriamo una successione {ak }kN mo- differenza, del prodotto e della divisione di due senotona non decrescente; se non è limitata essa tende quenze è deducibile dai limiti delle due successioni.
ovviamente a +. Supponiamo allora che sia limi- Nel caso che tali limiti siano finiti (e, nel caso del detata e consideriamo linsieme M dei numeri reali che nominatore in una divisione, diversi da 0), ciò è già
sono maggiori di tutti i suoi elementi an . Se M ha un stato visto nella citata sezione, almeno relativamenelemento pi`
u piccolo, lo si chiami ; altrimenti, sia te alle successioni su Q, ma nulla cambia quando si
il pi`
u grande dei numeri che non stanno in M . Vedia- passi ad R. Possiamo ridurre a uno specchietto ciò
mo che limn an = . Sia infatti > 0 un numero che succede per la somma, supponendo che {ak }kN
qualsiasi e osserviamo che deve esistere un elemento e {bk }kN siano le due successioni e A e B siano i
della successione compreso nellintervallo ( , ); se loro limiti:
cos` infatti non fosse, /2 dovrebbe stare in M ,
B = 0 B 6= 0 B = + B =
contro lipotesi che M contenga tutti e soli i numeri
A
=
0
0
B
+
maggiori di (ed eventualmente lo stesso ). Se am è

A
A
+
B
+
A
=
6
0
tale elemento, ogni altro elemento an con n > m deve
+
+
?
A = + +
stare in ( , ) per la monotonicità della successioA
=
ne, e quindi si ha an < . Me questo altro non è

che la definizione di come limite della successione.
A parte le due strane somme + + () e +
Naturalmenet, se la successione è non crescente, essa
(+)
che vedremo tra poco, tutte le altre relazioni
tende a oppure ad un limite minore o uguale a
sono
di
facile dimostrazione. Ad esempio, consideriatutti gli elementi della successione.
mo il caso in cui A = + e B abbia un valore finito.
Le successioni monotone sono particolarmente im- Sia Z lestremo superiore degli elementi di {bk }kN
portanti proprio perche hanno sempre un limite, e e per ogni M R sia m N lindice per il quale
dimostrare la loro limitatezza equivale a dimostrare per ogni n > m si abbia an > M Z. Si ha allora
che il limite è finito. Si pensi al caso ben noto del- an + bn > (M Z) + Z = M , e questo dimostra che
le approssimazioni per difetto e per eccesso di una la successione {an + bn }nN diverge a +. Le altre
quantità incognita; come si ricorderà, è proprio sfrut- dimostrazioni sono analoghe e le lasciamo al lettore
tando questa idea che abbiamo impostato la nostra come puro divertimento.
costruzione dei numeri reali, anche se abbiamo di fatI due casi indicati dal punto interrogativo corrito considerato il concetto pi`
u ampio di successione di spondono invece a situazioni variabili a seconda dei
Cauchy.
casi. Si ha infatti:
Un altro criterio per la convergenza delle
successioni è dato dal seguente:
lim (k 2 ) + lim (k) = +
k
Teorema 8.18 (dei carabinieri) Se si hanno tre

successioni {ak }kN , {bk }kN , {ck }kN tali che k
N si abbia: ak bk ck e per le quali si sappia che:
lim ak = lim ck =
allora si ha anche: limk bk = .

Prova: La condizione sul limite degli ak e dei ck si
scrive come:
< ak < + e
< ck < + .
Poiche bk è compreso tra ak e ck , si deve avere <

bk < + e questo prova che è il limite dei bk .
Come abbiamo visto nella Sezione 3.4, le successioni si possono sommare, sottrarre e moltiplicare elemento per elemento, ottenendo nuove successioni, e
se una successione ha tutti gli elementi diversi da 0,
lim (k 2 ) + lim (k) =
lim (k 2 + 1) + lim (k 2 + 1) = 2,
tre risultati completamente differenti e che dipendono solo dalle successioni considerate. Analogamente, se limk ak = e non esiste limk bk , si
hanno situazioni diverse a seconda che la successione
{bk }kN sia limitata o meno. Nel primo caso si ha:
lim (ak + bk ) = ,
mentre nellaltro caso occorre vedere se {ak }kN domina {bk }kN (e allora il limite della somma è ancora ), o viceversa, e allora tale limite non esiste.
Come esempio si consideri:
lim (k 2 + (1)k k) = +
232

lim ((1)k k 2 + k) non esiste.
I due casi ( ) e ( + ) non sono le uniche

situazioni anomale che si trovano calcolando i limiti;
se il lettore, come dovrebbe fare, prova a disegnare
le tabelline analoghe alla precedente, ma relative alla moltiplicazione e alla divisione, si accorgerà che
si presentano altri casi di incertezza, che vanno perciò risolti di volta in volta. Queste situazioni sono
note come forme indeterminate dei limiti ed è opportuno che siano ricordate per poter dare un segnale
dallarme ogni volta che se ne incontra una:
0
0
Un punto importante di questa definizione è laver

escluso x0 dai punti dellintervallo (x0 , x0 + ) per
i quali la condizione va verificata. Questo permette
di considerare il limite per x x0 (x che tende ad
x0 ) anche quando f (x0 ) non esiste, non è definita.
E proprio in casi del genere che il concetto di limite
rivela la sua potenza, come ora vedremo.
sono i casi pi`

u comuni, ma è bene tener presenti anche
0 e 0 . Vedremo a suo tempo come il Teorema
di de LHopital risolva spesso i casi 0/0 e /, e
quindi, indirettamente, anche 0 = 0 (1/0) = 0/0.
Ciò che mi pare suggestivo nel concetto di limite
di una successione è il fatto che mi posso facilmente
immaginare la successione stessa come una sequenza temporale di punti, che si vanno disponendo sulla
retta reale. Quando la successione converge, io vedo
i punti accumularsi intorno al punto di convergenza; se invece la successione diverge, vedo i suoi punti
scomparire verso linfinito, positivo o negativo, non
importa. Questa immagine mi ha sempre aiutato a
capire il concetto di limite e ad assimilare la definizione, che, come sè visto, non è del tutto elementare.
E come ha aiutato me, penso che sia stata daiuto a
molti altri, anche se ciascuno, naturalmente, tende a
formarsi le proprie immagini di aiuto psicologico.
Il passaggio dal limite di una successione a quello
di una funzione, quando il suo argomento tende a un
valore specifico x0 , si fa riprendendo proprio questa
immagine, sia idealmente sia praticamente. Si dice
che una funzione f (x) tende a un valore nel punto
x0 (appartenente o meno al dominio di f ), e si scrive: limxx0 f (x) = , se e solo se ogni successione
{b
xk }kN tale che limk x
bk = x0 abbia come limite delle sue immagini, cioè: limk f (b
xk ) = . Purtroppo, le successioni che tendono ad x0 sono infinite,
anzi sono addirittura 2 ; da un punto di vista formale, pertanto, si preferisce la seguente definizione,
anche se il nostro intuito rimane piuttosto ancorato
alla precedente:
Definizione 8.3 Data una funzione f : R R, si
dice che f tende ad per x che tende ad x0 , se e solo
se: > 0, R | x (x0 , x0 + ) \ {x0 } si
ha |f (x) | < . La funzione f si dice continua nel
punto x0 del suo dominio, se e solo se si ha:
lim f (x) = f (x0 ).
xx0
Infine, la f è continua nellintervallo (a, b) se è continua in tutti i punti dellintervallo. Un punto x0 nel
quale la funzione f non sia continua, si dice punto di
discontinuità della funzione.
Figura 8.10: Funzione a scalini

Originariamente, nel 1600 e in parte del 1700,
quando si parlava di funzioni, si intendeva riferirsi
alle funzioni continue, cioè alle funzioni il cui grafico poteva essere tracciato in modo continuo, senza
mai dover ritirare la matita dal foglio. I matematici
avevano in mente le funzioni pi`
u comuni: i polinomi
(soprattutto parabole e cubiche), le coniche, le funzioni trigonometriche, e altre figure, ottenute spesso
fisicamente dal moto di un corpo e dalla traiettoria
di un punto fissato su di esso. Ad esempio, la famosa
cicloide si ottiene fissando un punto su una circonferenza e facendo ruotare questa lungo una retta. Ci
si accorse presto, però, che erano interessanti anche
funzioni pi`
u strane. Ad esempio, la funzione y = x
ha una stupenda forma a scalini, e da essa è derivata
la famosa delta di Dirac che vale 1 per x = 0 e vale 0
in tutti gli altri punti. La funzione caratteristica del
numeri razionali (si veda Sezione 1.3) vale 1 per ogni
x razionale e vale 0 per ogni argomento irrazionale:
essa non è continua in alcuno dei suoi punti, ma se
per x0 razionale consideriamo solo le successioni di
numeri razionali, il limite della successione tende al
valore della funzione!
Daltra parte, una caso molto semplice e comune
di discontinuità è costituito dalle funzioni razionali
fratte: nei punti in cui il denominatore si annulla, la
funzione non è definita e quindi non può essere continua. Si consideri il semplice esempio y = 1/x, che
come sappiamo rappresenta uniperbole. Nel punto
x = 0 la funzione non è definita. In questi casi ha
senso considerare il limite quando x 0 per valori
233

negativi, cioè crescendo, e il limite quando x 0 per
valori positivi, e quindi decrescendo. Questi due limiti si dicono, rispettivamente, sinistro e destro. E
facile vedere che:
lim
x0
1
= e
x
lim
x0
1
= +,
x
tipo, disegnando la funzione ci si rende conto che x =

1 è una discontinuità fittizia e la funzione può essere
definita ponendo f (1) = 1. Col senno di poi, ci si
accorge che lespressione può essere semplificata:
y=
x2
x1
x1
1
=
=
3x + 2
(x 1)(x 2)
x2
dove le notazioni x 0 ed x 0+ sono di facile e questo rivela larcano. Naturalmente, è bene

interpretazione e rappresentano i due tipi di limite. imparare ad accorgersi prima di situazioni del genere.
Analogamente, per la funzione S a scalini si ha:
Altri casi di discontinuità fittizia sono pi`
u interessanti, poiche non sono risolubili in modo formale colim S(x) = 0 e lim S(x) = 1.
me il precedente. Tali esempi costituiscono perciò i
x1
x1
cosiddetti limiti notevoli e i principali vanno capiti e
Ciò ha portato a distinguere i punti di discontinuità mandati a memoria. Il caso pi`
u tipico è il limite della
in quattro specie:
funzione y = sin(x)/x quando x tende a zero. Qui la
frazione non è definita a causa dellx a denominatore;
1. si dice discontinuit`
a di 1a specie un punto x0
ma vediamo cosa succede quando x si avvicina a 0,
in cui il limite sinistro è diverso dal limite derimanendo però distinto da 0. Si disegni il cerchio gostro, ma entrambi sono finiti. In tal caso, x0
niometrico e immaginiamo di misurare la variabile x
determina un salto della funzione, e lentità del
in radianti, come si deve sempre fare nellanalisi delle
salto è data dalla differenza dei due limiti. La
funzioni trigonometriche:
funzione a scalini ha un salto di ampiezza 1 in
Dalla Figura 8.1 si ha la disuguaglianza AP
corrispondenza di tutti i numeri interi;
AU U B, che da un punto di vista trigonometri2. si dice discontinuit`
a di 2a specie un punto x0 in co significa: sin(x) x tan(x). Dividendo tutto
cui esistono limite destro e limite sinistro, ma per sin(x):
x
almeno uno dei due è infinito. Questo è il caso
1
cos(x).
sin(x)
delliperbole nel punto x0 = 0, ma anche della
Quando x 0 (rimanendo diverso da 0) il Teorema dei
funzione y = 1/(1 x) nel punto x0 = 1;
Carabinieri
ci dice che x/ sin(x) rimane schiacciato
a di 3a specie un punto x0 in fra 1 e cos(x) 1, per cui il suo valore deve essere 1:
cui uno almeno dei due limiti sinistro e destro
non esiste. Ad esempio, la funzione y = sin(1/x)
sin(x)
x
= lim
= 1.
lim
nel punto x0 = 0 non ha nessuno dei due limiti;
x0
x0 sin(x)
x
essa infatti oscilla tra +1 e 1 senza convergere
In modo analogo si procede per il limite quando x 0,
ad alcun valore;
e ciò prova il nostro primo limite notevole.
a fittizia un punto x0 per il
Il secondo limite che consideriamo sfrutta questo
quale la funzione non è definita, ma i limiti sini- primo risultato: vogliamo dimostrare che:
stro e destro hanno lo stesso valore . In questo
1 cos(x)
1
caso, si può artificialmente definire f (x0 ) = e,
lim
= ,
2
x0
chiaramente, la funzione diviene continua in x0 ;
x
2
da qui lappellativo di fittizia.
nel senso che limite sinistro e destro assumono enI punti x0 di discontinuità fittizia hanno un aspet- trambi questo valore. Per x > 0 dalla formula di
to interessante, in quanto dalla forma analitica della bisezione si ha:
funzione ci si aspetterebbe un comportamento strano
1 cos(x)
2 sin2 (x/2)
1 sin2 (x/2)
in x0 , mentre poi ci si accorge che, nella realtà, que=
=
.
x2
x2
2
(x/2)2
sto punto non ha niente di speciale. Lesempio pi`
u
semplice è costituito dalle funzioni del tipo:
Questultimo valore ci riporta al caso precedente e
per x 0 si ha ovviamente sin(x/2)/(x/2) 1.
Pertanto, il limite sinistro della nostra funzione vale
1/2. Lasciamo il lettore a giocare con i valori assoluti
cercando di capire dove il denominatore si annulla, per far vedere che anche il limite destro è 1/2.
Altri limiti notevoli, come limx0 tan(x)/x = 1 si
si trovano due valori x = 1 ed x = 2, che pertanto
rappresentano punti di discontinuità. Ma mentre x = riconducono al limite di sin(x)/x, che perciò è consi2 si vede essere un punto di discontinuità del secondo derato di fondamentale importanza. Nella prossima
y=
x2
x1
;
3x + 2
234
sezione, dopo aver introdotto la funzione esponenziale e quella logaritmica, vedremo come anche queste nuove funzioni diano origine a importanti limiti
notevoli.
Indubbiamente, anche quando sono limitate a certi
intervalli, le funzioni continue sono le pi`
u simpatiche,
proprio perche corrispondono meglio alla nostra intuizione. Alcune loro proprietà sono tanto evidenti
che potremmo considerarle senzaltro vere, ma le dimostreremo ora formalmente perche in Matematica,
si sa, è bene non fidarsi delle cose ovvie.
Teorema 8.21 Sia f (x) una funzione continua nellintervallo chiuso [a, b] e siano m ed M i valori minimo e massimo che la funzione assume in tale intervallo. Allora, per ogni y [m, M ] esiste almeno
un valore di x tale che f (x) = y.
Prova:
Basta considerare la funzione continua
g(x) = f (x) y e applicare il teorema precedente.
Talvolta può essere conveniente una generalizzazione

di questo teorema. Se f (x) è continua nellintervallo
aperto (a, b), può essere che in uno o in entrambi gli
Teorema 8.19 (della permanenza del segno)
estremi la funzione vada a . Il teorema continua
Se f (x) è una funzione continua nellintervallo (a, b)
a valere purche a minimo e a massimo si sostituiscano
ed è definita in x0 (a, b), allora esiste un intervallo
i concetti di estremo inferiore e superiore.
(x0 , x0 + ) in ogni punto x del quale f (x) ha lo
steso segno di f (x0 ).
Prova: Supponiamo che sia f (x0 ) > 0 e fissiamo
< f (x0 ). Lipotesi di continuità ci dice che esiste
un intervallo (x0 , x0 + ) nel quale si ha |f (x)
f (x0 )| < , cioè f (x0 ) < f (x) < f (x0 ) + e, data
la scelta di , questo significa f (x) > 0 per ogni x
dellintervallo. Analogo è il caso in cui sia f (x0 ) < 0.
8.5
Logaritmo ed esponenziale
Il concetto di logaritmo è stato introdotto nella Sezione 2.8 come una delle operazioni inverse dellelevamento a potenza (laltra operazione inversa è lestrazione di radice). Pertanto, poiche 23 = 8, il logaritmo in base 2 di 8 è proprio 3; e poiche 34 = 81,
si ha log3 81 = 4. Lestensione dei logaritmi a tutti i
Lintuizione ci dice che se percorriamo con la penna numeri reali si è operata nella Sezione 3.6, dalla quale
una traiettoria continua e a un certo punto passiamo riportiamo le principali proprietà dei logaritmi:
da valori positivi a valori negativi (o viceversa), dobbiamo per forza transitare dal valore 0. Formalmente
loga (rv) = loga r + loga v
abbiamo:
loga (r/v) = loga r loga v
loga (rs ) = s loga r
Teorema 8.20 (zeri di una funzione continua)
loga s r = 1s loga r
Se la funzione f (x) è continua nellintervallo chiuso
loga a = 1
[a, b] ed esistono due punti x1 , x2 [a, b] tali che
loga 1 = 0
f (x1 ) ed f (x2 ) hanno segno discorde, allora la
loga b = 1/ logb a.
funzione si annulla in un punto compreso fra x1 ed
x2 .
Sono queste proprietà quelle che portarono Napier
prima e Briggs poi a introdurre il concetto di logaProva:
Per fissare le idee, supponiamo che sia
ritmo e a creare le tavole corrispondenti come aiuto
f (x1 ) < 0, e quindi f (x2 ) > 0. Consideriamo linal calcolo. Daltra parte ci si accorse, circa un secosieme A dei punti x dellintervallo [x1 , x2 ] per i quali
lo dopo, che i logaritmi potevano servire a descrivere
f (x) sia negativo; poiche x1 A, questo insieme non
molti fenomeni naturali o artificiali.
è vuoto ed ha quindi un estremo superiore xi. VeConsideriamo un fenomeno che nel 1600 o 1700 era
diamo che f () = 0. Se infatti f () fosse positivo
sconosciuto, ma che oggi tutti hanno presente: il deper il Teorema della permanenza del segno avrebbe
cadimento delle sostanze radioattive. Gli atomi di taun intorno fatto tutto di elementi non di A, e quindi
li sostanze emettono tre tipi di radiazioni: radiazione
non potrebbe esserne lestremo superiore. Se invece
, cioè nuclei di elio composti da due protoni e due
f () fosse negativo, non sarebbe un limite superiore
neutroni, radiazione , cioè elettroni o positroni, e raper A. Quindi f () = 0.
diazione , radiazioni elettromagnetiche ad altissima
Quando affronteremo lo studio sistematico delle energia. Come conseguenza di tale emissione, parte
funzioni, questo teorema servirà a capire landamen- degli atomi della sostanza si mutano in altri atomi
to di una funzione nei confronti dellasse delle ascisse; pi`
u leggeri, talvolta non pi`
u radioattivi. Comunque,
nel Calcolo Numerico esso serve ad isolare le radici il decadimento cambia la natura della sostanza e, ad
di unequazione e quindi a trovarne una approssima- esempio, luranio si trasforma lentamente in piomzione. Non ci rimane ora che concludere con un altro bo. Si chiama emivita di una sostanza radioattiva
risultato implicito nel nostro concetto di continuità. il tempo necessario affinche una certa quantità della
235
8.5. LOGARITMO ED ESPONENZIALE

sostanza si riduca alla metà a causa del decadimento. LUranio ha unemivita di 4.5 milioni di anni,
il Radio di 1620 anni, il Radon di 3.823 giorni e il
Laurenzio di 35 secondi. Per semplicità, supponiamo
di avere una sostanza con unemivita di un giorno e,
avendo una quantità q di tale sostanza (ad esempio
espressa in grammi) siamo interessati a sapere dopo
quanto tempo il decadimento rende innocua la sostanza stessa perche ne riduce gli atomi a, diciamo,
un grammo. Se abbiamo 8 grammi della sostanza,
dopo un giorno la quantità degli atomi radioattivi si
è ridotta a 4 grammi, dopo due giorni è calata a 2
grammi, e finalmente il terzo giorno è arrivata alla
quantità di sicurezza di un unico grammo. Il ragionamento si estende facilmente e quindi, se t esprime
il tempo in giorni, abbiamo la formula t = log2 (q).
Possiamo disegnare su un piano cartesiano la curva
che ci rappresenta i tempi di decadimento in funzione della quantità; un chilogrammo di sostanza ci dà
un tempo t 10 poiche, come abbiamo già osservato, 1000 1024 = 210 , cos` come una tonnellata di
prodotto richiederà 20 giorni per disattivarsi. Nella
Figura ?? abbiamo riportato il grafico e lo abbiamo
esteso anche a quantità minori di 1 grammo. Che
senso ha questo? Si osservi che mezzo grammo corrisponde a 1 giorno, e questo significa semplicemente
che un giorno prima il nostro mezzo grammo era un
grammo intero di sostanza attiva.
Nota 8.2
Ricordiamo che il decadimento radioattivo serve a datare, con ottima precisione, i reperti organici nelle ricerche archeologiche. Il principio è
semplice, mentre la tecnica che cè dietro è molto sofisticata. Come è noto, il Carbonio ha peso atomico
12, ma in natura esiste anche un isotopo radioattivo di peso atomico 14, il 14 C. Esso costituisce una
percentuale (ridotta, ma misurabile) del Carbonio
che mangiamo e respiriamo, per cui lorganismo delle
piante e degli animali, per il continuo ricambio, contiene costantemente la percentuale di 14 C, rispetto
a tutto il Carbonio presente nei tessuti. Questo è vero fino a che lanimale o la pianta mangia e respira,
cioè finche è in vita. Come arriva la morte, il ricambio non cè pi`
u e il Carbonio rimane quello che era,
se particolari condizioni arrestano la decomposizione.
Questo significa che il Carbonio 14 comincia a diminuire, decadendo nel normale 12 C. Lemivita del 14 C
è di 5730 anni e quindi vediamo cosa fa un archeologo che abbia rinvenuto un reperto organico (il legno
di una nave o di uno strumento, tessuti o escrementi
fossilizzati, etc.). Egli ne preleva una certa quantit`
a
(di solito molto piccola) e con strumenti opportuni determina il rapporto esistente fra Carbonio 14 e 12;
naturalmente tale rapporto è minore di , quello al
momento della morte dellalbero o del tessuto o della deposizione di altro materiale. Se tale rapporto è,
ad esempio, un quarto di , per quello che abbiamo
visto, essendo log2 4 = 2, sono passati due periodi di
5730 anni, cioè il reperto è vecchio di 11. 460 anni. La

formula generale è allora la seguente:
t = 5730 log2
= 5730(log2 log2 )
dove t indica il tempo trascorso, cioè la vetust`

a del
reperto. La tecnica moderna permette di valutare
con estrema accuratezza, e quindi ottenere datazioni
molto attendibili. In certi casi fortunati, si è potuta
confrontare la datazione al Carbonio con date certe
o con altri tipi di datazione, come ad esempio le
circonferenze di accrescimento di alberi molto antichi
(che, fra laltro, ci danno anche informazioni sulle
variazioni climatiche).
In tal modo si è potuta
verificare lattendibilit`
a dei calcoli e si sono messe
a punto certe tarature, per migliorare la tecnica stessa.
Come abbiamo detto, linvenzione dei logaritmi è

dovuta a John Napier. Anche se in Matematica è difficile parlare di invenzione visto che molti pensano
che la Matematica ci sia data e quindi ogni novità è una scoperta, a proposito dei logaritmi pare
giusto parlare proprio di invenzione. Per Napier i logaritmi non avevano nessun risvolto teorico e i suoi
sforzi (ventanni di calcoli indefessi) furono dettati
dal desiderio di arrivare ad uno strumento efficiente
di calcolo. Come tali i logaritmi vennero accolti e diventarono immediatamente popolari. In realtà, la popolarità maggiore la ottennero i logaritmi di Briggs,
il quale, dopo un lungo colloquio con Napier, ormai
vecchio e stanco, calcolò e pubblicò le tavole dei logaritmi decimali, cioè quelli relativi alla base 10. Napier
aveva inventato una sorta di logaritmi che, nella sua
intenzione, non dovevano avere alcuna base, ma che,
col senno di poi, sono i logaritmi in base 1/e; questa
sarebbe una ben strana base se, 150 anni dopo Napier, Eulero non avesse dimostrato come essa fosse
invece una specie di base naturale. La vera base
naturale è il numero e = 2.718281828 . . ., e il simbolo e per indicarla è stato scelto in onore di Eulero.
Questa naturalezza giustifica lopinione di Napier
che i suoi logaritmi fossero senza base, e cerchiamo
pertanto di capire il perche di questa opinione.
Seguire il ragionamento di Napier sarebbe piuttosto capzioso, basato comè su considerazioni fisiche:
due punti si muovono su due rette, uno con velocità
costante e laltro con velocità pari alla distanza dal
punto di arrivo (quindi, una velocità che va calando).
Procediamo allora cos`. Fissiamo un numero N molto grande (Napier scelse N = 107 ) e poniamo, per x
piccolo rispetto ad N (diciamo, qualche migliaio al
pi`
u):
x N
E(x) = 1 +
= y.
N
Data questa formula, conoscendo y si può calcolare il
valore di x; con semplici passaggi algebrici si ottiene
236
infatti:
x = N ( N y 1) = L(y).
Se moltiplichiamo fra di loro due quantità del tipo

E(x), si trova:
x2 N
x1 N
=
1+
E(x1 )E(x2 ) = 1 +
N
N
N
N
x1 + x2
x1 x2
x1 + x2
= 1+
+
1
+
=
N
N2
N
= E(x1 + x2 ).
71908, per cui si conclude log10 (52.37) = 1.71908.

Per questo motivo, fino allavvento dei calcolatori
elettronici tascabili, i logaritmi sono stati lo strumento di base per il calcolo pratico. Oggi non si usano
pi`
u, ma la loro rilevanza teorica non è affatto diminuita e i logaritmi rimangono una delle funzioni di
base di tutta la Matematica (si veda anche la Nota
8.2). Scopriamo allora perche la base e si considera
cos` naturale.
Cominciamo col porre x = 1 nellespressione di Napier e immaginiamo che N non sia pi`
u fisso, ma variabile; lespressione dipende da N e noi scriveremo
n per mettere in rilievo la sua variabilità:
n
1
En = 1 +
.
n
Qui losservazione importante è che la quantità

x1 x2 /N 2 è trascurabile per la nostra ipotesi, secondo la quale N debba essere molto grande rispetto
a x1 e x2 . Se ora chiamiamo y1 e y2 i due numeri
E(x1 ) e E(x2 ) e leggiamo le espressioni precedenti
Questi numeri formano una successione i cui primi
dallinterno verso lesterno, si ottiene:
elementi sono:
L(y1 ) + L(y2 ) = x1 + x2 = L(y1 y2 ).
Quindi, la trasformazione inversa L cambia un prodotto in una somma, la proprietà caratteristica dei
logaritmi, quella che permette di semplificare i calcoli.
Si consideri ad esempio il prodotto 25 32, che si
fa bene anche con la tradizionale moltiplicazione e dà
come risultato 800. Si ha:
7
L(25) = 107 ( 10 25 1) 3.218876
7
L(32) = 107 ( 10 32 1) 3.465737
La somma di queste due quantità è 6.684613 e se
si calcola L(800) si trova proprio 6.684614. Naturalmente, ci siamo aiutati con una calcolatrice elettronica tascabile, cosa che Napier non poteva fare.
Tuttavia, una volta costruite le tavole dei logaritmi,
L(25) ed L(32) si leggono direttamente sulle tavole;
si calcola la loro somma 6.684613 e, usando le tavole
allincontrario, si risale immediatamente al risultato
finale.
Per usare i logaritmi di Napier occorre avere tavole
molto estese poiche non esiste alcuna regola evidente
che leghi, ad esempio, il logaritmo di 2, di 20 o di
200. Si ha infatti L(2) = 0.693147, L(20) = 2.995732
e L(200) = 5.298317. Lidea di Briggs di introdurre
una base esplicita, e proprio la base 10, portò un
enorme vantaggio; dalla regola generale:
log10 (10k r) = k + log10 (r)
discende che se (come è) log10 (2) = 0.301030, allora
log10 (20) = 1.301030 e log10 (200) = 2.301030. Questo permette di scrivere una tabella dei logaritmi decimali dei numeri interi da 1000 a 9999 e di usare tale
tabella in maniera universale. Ad esempio, volendo
conoscere il logaritmo di 52.37, si cerca nella tabella il
numero 5237 e si trova la parte decimale, o mantissa,
E1 = 2,
E2 = 2.25,
E4 = 2.44140625,
E3 = 2.37037037,
E5 = 2.48832000,
...
Come si vede, questi valori vanno crescendo, e questo

è un fatto che si può dimostrare:
Teorema 8.22 La successione E1 , E2 , E3 , . . . è crescente, cioè En+1 > En , n N.
Prova: Espandiamo la potenza usando il binomio
di Newton:
n

n 1
1
1
n 1
+
+ + n =
1+
=1+
n
n
2 n2
1 n
n 1 (n 1)(n 2)
1
+
+ + n =
2
2!n
3!n
n
1
2 1
1 1
+ 1
1
+
=1+1+ 1
n 2!
n
n 3!
1
2
n1 1
+ + 1
1
1
.
n
n
n
n!
=1+1+
Quando passiamo da n ad n + 1, il valore di questa

espressione aumenta per ben due motivi. Primo, il
numero dei termini cresce di uno; secondo, ovunque
sia il fattore (1 k/n), esso diviene (1 k/(n + 1)) e
quindi cresce, facendo s` che ogni termine divenga un
po pi`
u grande. Tutto questo, naturalmente, succede
per ogni valore di n
Per il principio delle successioni crescenti monotone, questa sequenza cresce indefinitamente oppure
è limitata, e quindi esiste un numero reale specifico
al quale si avvicina sempre pi`
u. Vediamo che vale
questa seconda ipotesi:
Teorema 8.23 La successione E1 , E2 , E3 , . . . è limitata superiormente dal numero 3.
237
8.5. LOGARITMO ED ESPONENZIALE

Prova: Se, nellespressione trovata per En sostituiamo 1 a ciascun fattore (1 k/n) < 1, otteniamo la
disuguaglianza:
En < 1 + 1 +
1
1
1
+ + + .
2! 3!
n!
Ora osserviamo che, qualunque sia n > 2, abbiamo

n! < 2n1 , in quanto n! = 2 3 n è il prodotto
di n 1 fattori tutti maggiori o uguali a 2, mentre
2n1 è il prodotto di n 1 fattori tutti uguali a 2.
Abbiamo quindi unulteriore maggiorazione:
En < 1 + 1 +
1
1 1
+ + + n1 < 3,
2 4
2
in quanto questa espressione (a parte il primo addendo 1) è la somma della progressione geometrica di
ragione 1/2 e, come sappiamo, si avvicina, crescendo,
al valore 2.
Quindi la sequenza E1 , E2 , E3 , . . . definisce un numero reale; in onore di Eulero, che studiò queste cose
150 anni dopo Nepero, tale numero si indica con la
lettera e e si dice numero di Eulero o base dei logaritmi naturali. Il suo valore, come ora vedremo,
è:
e = 2.718281827459 . . .
decimali, i conti si possono disporre in questo modo:

1.000000
1.000000
0.500000
0.166667
0.041667
0.008333
0.001389
0.000198
0.000025
0.000003
2.718282
:
:
:
:
:
:
:
:
:
1
2
3
4
5
6
7
8
9
Nepero, naturalmente, non sospettava nemmeno

lesistenza e limportanza del numero e, e quindi
non poteva nemmeno immaginare che la sua funzione
E(y) equivale alla potenza ey (a parte il fatto che una
vera uguaglianza non cè, essendo fissato il numero
N ). Eulero pote dimostrare:
Teorema 8.25 Il valore dellespressione (1 + x/n)n
si avvicina ad ex quando n cresce indefinitamente.
Prova: Sia x un valore fissato; per le proprietà delle

potenze abbiamo:
n/x !x
n
x
1
Personalmente, non sono mai riuscito a ricordare a
1+
1+
=
.
n
n/x
memoria nemmeno le prime cifre di questo numero,
che uso assai di frequente. La seguente filastrocca:
Al variare di n, il valore di n/x cresce anchesso, esai modesti o vanitosi,
sendo x un numero fisso. Quindi lespressione dentro
ai violenti o timorosi,
la parentesi pi`
u esterne si avvicina quanto si vuole ad
do cantando gaio ritmo,
e, e tutta lespressione si avvicina ad ex .
logaritmo!
Quindi Nepero aveva seguito una strada un po inè composta di parole la cui lunghezza dà proprio le voluta per arrivare ad una potenza specifica, cioè ex .
cifre di e. Naturalmente, non mi è mai riuscito ricor- Daltra parte, egli voleva affrancarsi da una base pardarmi nemmeno la filastrocca e preferisco valutare ticolare, e fu proprio questo desiderio (che fece la forEXP(1) col mio calcolatorino tascabile. Si sa che il tuna di Briggs) a portarlo su una strada che qualcuno
numero e è irrazionale e trascendente, cioè non è so- dopo di lui mostrò essere cos` feconda.
luzione di alcuna equazione polinomiale a coefficienti
+
x
interi. Tuttavia, esso può essere calcolato facilmente: Definizione 8.4 La funzione y = e di R R0 si
dice, per antonomasia, la funzione esponenziale; la
Teorema 8.24 Il numero e è il valore della somma sua inversa composizionale, da R+
0 R, si dice la
funzione logaritmo naturale e si scrive x = ln(y);
infinita:
essa indica lesponente x a cui elevare e per ottenere
1
1
1
1
y.
+ .
e = 1 + + + + +
1! 2! 3!
n!
Ragionando come abbiamo fatto per trovare e:
Prova: Riprendiamo lespressione trovata per En
nel Teorema 8.22 e facciamo crescere indefinitamente Teorema 8.26 La funzione esponenziale si calcola
n. Ogni fattore (1k/n) può essere assimilato ad 1 ed mediante la somma infinita:
il numero dei termini diviene infinito, lasciando cos`
x
x2
x3
xn
che ognuno si riduca a 1/k!. Questo dà lespressione
ex = 1 + +
+
+ +
+ .
1!
2!
3!
n!
cercata per e.
Poiche (n + 1)! = n!(n + 1), il calcolo di e si esegue
facilmente anche a mano; ad esempio, usando sei cifre
Prova: Si parte dal risultato del precedente teorema

che ci dà per ex il valore di (1+x/n)n , quando n cresce
238
u conveniente procedere nel

indefinitamente. Si espande questa espressione con la logaritmo naturale, è pi`
regola del binomio di Newton e si identificano i fattori modo seguente:
(1 k/n) con 1, facendo nel contempo aumentare
1
1
indefinitamente il loro numero.
ln(2) = ln = ln 1
=
2
2
Poiche x si deve supporre fisso, i termini di questa
somma, da un certo momento in poi, tendono rapi1 1
1
1
damente a diventare trascurabili; pertanto, la formu= + +
+
+ .
2 8 24 64
la del teorema è un modo effettivo di calcolare ex ,
Purtroppo, al crescere di x, la convergenza diviene
qualunque sia x.
u lenta e nella pratica si usano altri metodi,
Conseguenza immediata di questo metodo per sempre pi`
sviluppati dal Calcolo Numerico, per ottenere ottime
calcolare ex è il seguente limite notevole:
approssimazioni.
Teorema 8.27 Si ha:
Di nuovo, lespressione per ln(1 + x) ci permette di
trovare un altro limite notevole:
ex 1
= 1.
lim
x0
x
ln(1 + x)
=1
lim
Prova: Dal teorema precedente si ha: ex 1 =
x0
x
2
x/1! + x /2! + e quindi:
per la cui dimostrazione si procede come nel caso
x
x2
ex 1
precedente.
=1+ +
+ .
x
2!
3!
Quando x tende a 0, tutti i termini del secondo membro, eccetto il primo, vanno a 0, e quindi il limite ha
il valore considerato.
Il calcolo dei logaritmi, invece, è piuttosto pi`
u complicato, almeno dal punto di vista della quantità di
conti da effettuare. Lequivalente per il logaritmo
naturale della formula dellesponenziale del Teorema
8.26 è:
ln(1 + x) =
x3
x4
x5
x x2
+

1
2
3
4
5
che si ottiene con metodi che non abbiamo affrontato ce che non affronteremo: le serie di potenze. Si
tratta di un argomento bellissimo, ma che va al di là
dei limiti che ci siamo posti; il lettore curioso potrà
consultare un qualsiasi testo universitario di Analisi
Matematica. Che la formula sia corretta può essere
verificato calcolando exp(ln(1 + x)) che deve risultare
in 1 + x. La composizione delle due funzioni si effettua sostituendo lespressione per ln(1 + x) alla x nella
formula per ex data nel Teorema [8.22]. Limitando i
calcoli ad x4 , la difficoltà è molto ridotta e invitiamo
il lettore a portarli in fondo; vedrà cos` che tutto funziona alla meraviglia e avrà fatto un buon esercizio
di calcolo formale.
La formula per il logaritmo naturale vale solo per
1 < x 1; per x = 1 si ottiene la serie armonica che, come abbiamo dimostrato nel Capitolo 4,
diverge; per x = 1 si ha:
ln(2) = 1
1 1 1 1
+ +
2 3 4 5
che converge, anche se molto lentamente. Per calcolare ln(2), cos` come per calcolare altri valori del
8.6
Il calcolo differenziale
Uno dei problemi pi`

u sentiti nella nascente industria
del 1600 era quello di massimizzare i profitti o, in
modo equivalente, di minimizzare i costi, ad esempio
utilizzando nel modo migliore le materie prime. Un
esempio classico è quello della costruzione delle pentole; una pentola, con relativo coperchio, può essere
assimilata a un cilindro di altezza h e con raggio di
base r. Il suo volume è V = r2 h, mentre il materiale usato per la sua costruzione è dato dalla superficie
totale S = 2r2 + 2rh. Si supponga di voler costruire una pentola da 3 litri; il volume V risulta allora
fissato e ci possiamo chiedere qual è la forma che la
pentola deve avere (cioè quale deve essere il rapporto
tra il raggio r e laltezza h) affinche sia minima la
quantità di materiale usato. Se la pentola è troppo
schiacciata, occorre molto materiale per il fondo e il
coperchio; viceversa, se la facciamo troppo slanciata, perdiamo materiale per le pareti. Ci deve essere
perciò una via di mezzo ottimale. Per lazienda produttrice questo è importante, perche usando le misure pi`
u convenienti potrà soddisfare i propri clienti,
interessati al volume del recipiente, risparmiando sul
materiale.
Le pentole sono già un esempio significativo, ma di
problemi del genere ne sorgono ad ogni pie sospinto,
e non solo nella produzione dei beni, ma anche nella
loro distribuzione, nella suddivisione e nella condivisione di risorse. Per questo motivo, i matematici del
1600 (come, daltra parte, i loro successori) si dedicarono spesso e volentieri a risolvere problemi di minimo e di massimo, e in questo furono stimolati anche
dai problemi di Astronomia e di Fisica, che a quel
239
8.6. IL CALCOLO DIFFERENZIALE

tempo assillavano scienziati e filosofi. Fu infatti allora che si cominciarono a cercare soluzioni quantitative
dei problemi, e non solo qualitative.
Diversi problemi di minimo e massimo possono essere risolti con metodi abbastanza elementari. Ad
esempio, Fergus McNab è un pittore dilettante e si
serve di un artigiano per incorniciare i propri quadri.
Purtroppo, si è accorto che sta spendendo pi`
u di cornici che di colori. Di conseguenza si è chiesto quale sia
la dimensione da dare alle proprie tele affiche, a parità
di superficie dipinta, il costo della cornice sia la pi`
u
contenuta possibile. In termini matematici, se b ed
h sono la base e laltezza di un dipinto, come devono
essere scelte perche, pur mantenendo larea A = bh,
il perimetro 2(b + h) sia minimo, visto che il costo
della cornice è ad esso proporzionale? Per risolvere
questo problema, si può usare il seguente teorema,
noto come principio del massimo e del minimo:
Teorema 8.28 Se due quantit`
a variabili a, b hanno
somma costante, allora il loro prodotto assume valore
massimo quando a = b. Analogamente, se a, b hanno
prodotto costante, allora la loro somma assume valore
minimo quando a = b.
Prova: Sia 2x = a + b, cos` che si possa scrivere
a = x + e b = x , con 0, nellipotesi che sia
a b. Per il prodotto si ha: ab = (x + )(x ) =
x2 2 , e poiche 2 0 il massimo si ottiene quando
= 0, cioè a = b = x. Nellaltro caso, se ab = x2 ,
possiamo porre a = x(1 + ) e b = x/(1 + ), cos` che
per quanto sappiamo della progressione geometrica si
ha b = x(1+2 3 + ). Per la somma si ottiene:
a + b = 2x + x(2 3 + ) = 2x +
x2
,
1+
che è sempre maggiore di 2x se > 0; quindi questa

somma assume il valore minimo quando = 0, cioè
a = b.
Questo principio mostra immediatamente che Fergus McNab può ottenere il massimo risparmio quando b = h, ovvero quando i suoi dipinti assumono la
forma quadrata, cioè sono dei veri e propri quadri.
Questo spiega perche ormai da qualche anno i dipinti
di Fergus abbiamo assunto questa forma particolare!
In genere, purtroppo, i problemi di minimo e di
massimo non sono cos` semplici e occorre perciò un
metodo generale per affrontarli. Molti problemi di
Fisica vengono modellati da una funzione y = f (x),
ed è facile rendersi conto che i punti di massimo e
di minimo di tale funzione possono essere studiati
andando a vedere dovè che la funzione cresce e dovè,
invece, che decresce. Questi punti sono caratterizzati
dal cambio crescita/decrescita: se infatti in un punto
x0 la funzione ha un massimo, per i punti x vicini
ad x0 si deve avere f (x) < f (x0 ), sia che x preceda
sia che segua x0 . In altre parole, la funzione deve

crescere prima di x0 e deve decrescere dopo. I punti
x0 con questa caratteristica si dicono propriamente
punti di massimo relativo della funzione. La specifica
di relativo si riferisce al fatto che possono esistere
pi`
u punti con la proprietà detta, e alcuni possono
essere pi`
u massimi di altri, cioè la funzione può
assumere valori pi`
u grandi. Analogamente, un punto
di minimo relativo è un punto nel quale la funzione
prima decresce e poi cresce.
Figura 8.11: Punti di minimo e massimo

Cè un altro motivo per definire relativi i punti di
questo tipo. Se la funzione y = f (x) è definita in un
intervallo [a, b], o semplicemente dobbiamo solo trattarla in questo intervallo, può succedere che il valore
pi`
u alto (e/o quello pi`
u basso) si abbiamo proprio allinizio o alla fine dellintervallo, quando la funzione
cresce (o decresce), ma non sappiamo cosa fa prima
o dopo. Si pensi alla funzione che descrive la velocità
dellEurostar 9543 da Firenze a Roma; si potranno
avere diverse punte di velocità massima e ognuna rappresenta un massimo relativo: la pi`
u alta di tutte sarà
il massimo assoluto. Per quanto riguarda i punti di
minimo, se il treno non si ferma mai, questi saranno la partenza e larrivo, quando la velocità è nulla;
a questi minimi assoluti si contrappone una serie di
minimi relativi, dovuti ai rallentamenti del treno nel
passaggio attraverso una qualche stazione importante
o tratti impegnativi della ferrovia.
I matematici del 1600, specie Newton e Leibniz,
studiarono attentamente il concetto di cambiamento di una funzione, per arrivare a definire cosa si intende per cambiamento istantaneo. Ci ricordiamo
che Zenone, nel paradosso della freccia, aveva obiettato proprio sullesistenza del cambiamento istantaneo: se consideriamo una freccia in movimento, ma
riduciamo a un istante la nostra osservazione, la freccia stessa è in quel momento ferma e quindi non
vi è in realtà alcun movimento o cambiamento. Naturalmente, lidea di Zenone è sbagliata e Newton e
Leibniz, in modo diverso luno dallaltro, fecero vedere che si può definire rigorosamente (e sensatamente)
240
il cambiamento istante per istante. Soprattutto Newton aveva in mente un esempio comune: la velocità
vista come cambiamento della posizione di un oggetto
(di un corpo, come dicono i fisici). E chiaro che possiamo considerare la velocità media in un certo intervallo, ma il cambiamento avviene istante per istante
e quindi deve essere possibile (checche ne pensi Zenone) definire una velocità istantanea, quella che oggi
è segnalata dal tachimetro di una macchina. Ragionarono allora cos`: sia x0 il punto nel quale vogliamo
definire il cambiamento istantaneo della funzione
y = f (x). Consideriamo un punto x1 = x0 + h distinto da x0 (quindi, h può essere positivo o negativo,
ma non nullo). Il cambiamento della funzione da x0
ad x1 = x0 + h è dato da f (x0 + h) f (x0 ), che
però va considerato relativamente allo spostamento
del punto da x0 ad x1 , cioè a x1 x0 = h. Per tener
conto di questo, definiamo il rapporto incrementale di
y = f (x) in x0 come:
y = f (x) nel punto x0 e, per le considerazioni fatte in

precedenza, il rapporto incrementale si approssima a
diventare la misura del cambiamento istantaneo della
curva, sempre nel punto x0 . Possiamo allora dare la
seguente:
f (x0 )
f (x1 ) f (x0 )
f (x0 + h) f (x0 )
=
=
.
x0
x1 x0
h
Definizione 8.5 Data la curva y = f (x) e un punto

x0 in cui la curva è definita, cioè esiste y0 = f (x0 ), si
dice derivata di f (x) nel punto x0 il limite (se esiste)
del rapporto incrementale:
f (x0 + h) f (x0 )
.
h0
h
lim
Tale derivata rappresenta il cambiamento istantaneo

(allistante, o punto, x0 ) della curva, ovvero la pendenza della retta tangente alla curva nel punto x0 .
Si dice derivata della funzione y = f (x) la funzione
y = f (x), definita in tutti i punti x0 nei quali esiste
la derivata di f (x0 ) ed è uguale, in questi punti, alla
derivata stessa. Per abuso di notazione, talvolta la
funzione derivata si indica con la scrittura y . Una
funzione f (x) è derivabile nel punto x0 , se esiste la
derivata di f (x) in x0 ; f (x) è derivabile nellintervallo aperto (a, b) se è derivabile in ogni punto interno
a tale intervallo.
Il rapporto incrementale è il cambiamento medio avvenuto nellintervallo [x0 , x1 ] di lunghezza h. Osserviamo, cosa molto importante, che, come sappiamo
dalla Geometria Analitica, questo rapporto incremenE opportuno fare almeno un esempio. Si consideri
tale altro non è che la pendenza della retta passante la parabola y = x2 3x+2 e il punto x = 3 nel quale
0
per i due punti (x0 , f (x0 )) e (x1 , f (x1 )), cioè della la parabola assume il valore 2. In quanto al rapporto
retta secante la curva y = f (x) in questi due punti.
incrementale abbiamo:
f (3 + h) f (3)
(3 + h)2 3(3 + h) + 2 2
=
=
h
h
x0
f (x0 )
x0 x0 + h
Figura 8.12: Secante/tangente alla curva

Lequazione della retta è data dalla formula 7.1:
f (x1 ) f (x0 )
f (x) f (x0 )
=
x1 x0
x x0
h2 + 3h
= h + 3.
h
Quando h 0, questa quantità tende a 3, e quindi
la derivata della nostra parabola nel punto x0 = 3 è
proprio 3. La retta tangente alla parabola in questo
punto è y 2 = 3(x 3) ovvero y = 3x 7, e questo
può essere controllato col metodo del calcolo della
tangente a una parabola, visto nella Sezione 7.3. Se
poi, invece di limitarci al punto x0 = 3, consideriamo
la situazione globale, cioè relativa al punto generico
x, il rapporto incrementale diventa:
=
(x + h)2 3(x + h) + 2 x2 + 3x 2
=
h
h2 + 2xh 3h
= 2x 3 + h.
h
f (x0 )
f (x) f (x0 ) =
(x x0 ).
Quando h 0, otteniamo la derivata della funzione
x0
y = x2 3x + 2, e il risultato è: f (x) = 2x 3.
Secondo limpostazione di Leibniz, il limite della
Quando facciamo avvicinare x1 ad x0 , cioè, in termini pi`
u matematici, facciamo tendere x1 ad x0 (il che differenza f (x0 + h) f (x0 ), al tendere di h a 0, si
equivale a dire: facciamo tendere h a 0) questa se- dice il differenziale della funzione f (x) nel punto x0
cante si approssima a diventare la tangente alla curva e si indica con df (x); analogamente, il limite della
ovvero:
241
differenza x1 x0 , quando x1 x0 (in pratica, h) di importante accade, ma è bene stare attenti e stusi dice il differenziale di x e si indica con dx. Si ha diare la situazione intorno al punto per stabilire qual
pertanto:
è la vera natura dellevento che si sta verificando.
Data una funzione f (x), il calcolo della funzione
df
(x
)
df
(x)
0
derivata
f (x) non è pi`
u difficile del calcolo della def (x0 ) =
e in generale f (x) =
.
dx
dx
rivata di f (x) in un punto specifico x0 . Per questo,
di regola, si preferisce senzaltro calcolare la funzioSi ricordi che, per la convenzione adottata per i line derivata e poi, se del caso, cercarne il valore in
miti, x1 x0 = h non assume mai il valore 0, che
un punto preciso. Nellesempio precedente della parenderebbe privo di senso il rapporto incrementale, e
rabola, calcolando f (x) = 2x 3 nel punto x = 3
quindi il rapporto dei differenziali, facendoci ricadere
si ritrova naturalmente il valore f (3) = 3. Occorre
nel paradosso di Zenone.
tuttavia osservare che, mentre la derivata di f (x) in
Ritornando al nostro problema di partenza sui un punto x esiste o non esiste, per la funzione de0
massimi e sui minimi, si vede ora il ruolo che può rivata f (x) si possono avere varie situazioni. Anche
svolgere la funzione derivata f (x):

limitandoci a un intervallo (a, b), che potrebbe essere
tutta la retta reale, f (x) può esistere in ogni punTeorema 8.29 Se la funzione f (x) è derivabile in
to dellintervallo, può non esistere in nessuno di tali
(a, b) allora essa è crescente in ogni punto x0 in cui
punti, può esistere in alcuni e non in altri. Per semf (x0 ) > 0, è decrescente in ogni punto x0 in cui
plicità, visto che questo non è un trattato di Analisi
f (x0 ) < 0. I punti di massimo e di minimo relativo
Matematica, supporremo che f (x) esista in tutti i
corrispondono a punti x0 in cui f (x0 ) = 0.
punti considerati, avvertendo esplicitamente tutte le
Prova: Immediato dalla definizione della derivata volte che f (x) non esiste o non si considera.
Unosservazione importante è relativa al fatto che
f (x):
se una funzione f (x) è derivabile in un punto x0 , alloNellesempio precedente, f (x) = 2x 3 si annulla ra essa è sicuramente continua in tale punto. Infatti,
per x = 3/2 ed è del tutto ovvio che per x < 3/2 dovendo essere:
è f (x) < 0, mentre per x > 3/2 si ha f (x) > 0,
f (x0 + h) f (x0 )
di modo che il punto considerato è un minimo re= f (x0 ),
lim
h0
h
lativo. Questo, naturalmente, è ovvio, perchè conosciamo bene la parabola, e avremmo potuto studiare occorre che sia limh0 (f (x0 +h)f (x0 )) = 0 e questo
queste cose con i metodi della Geometria Analitica implica limh0 f (x0 + h) = f (x0 ), che è la condizione
(come abbiamo fatto a suo tempo), ma è importante di continuità. Il viceversa non è vero in generale: si
notare come il ragionamento legato alla derivata sia consideri la funzione continua f (x) = |x| nel punto
semplice ed efficace e, soprattutto, sia estendibile a x0 = 0; si ha:
ogni tipo di curva.
lim |x| = 1 e lim |x| = +1,
x0
x0
Ciò che abbiamo appena detto sui punti nei quali la
derivata si annulla è corretto, ma può trarre in ingane quindi la funzione non ha derivata in questo punto.
no. Il fatto che i punti di massimo e minimo relativo
Il metodo del rapporto incrementale è il metodo
corrispondano a valori di x per i quali f (x) = 0
generale per affrontare il problema della derivazionon significa che, viceversa, se per x = x0 si ha
ne, ma è anche il pi`
u laborioso e, se si vuole, il pi`
u
f (x0 ) = 0, allora x0 sia necessariamente un punto
capzioso. Quando è possibile, si preferisce applicare
di massimo o di minimo. Se prendiamo la funzione
una serie di risultati generali, che aiutano molto, agey = x3 , come presto vedremo la funzione derivata
volando i calcoli. Ecco pertanto una prima serie di
vale f (x) = 3x2 , e il lettore può già dimostrare da
risultati:
se questo fatto, usando la tecnica del rapporto incrementale. Qui ci basta notare che la funzione derivata Teorema 8.30 Siano f (x), g(x) due funzioni derisi annulla per x = 0, ma essendo 3x2 0 per ogni vabili in un intervallo (a, b); allora:
valore di x, la funzione è sempre crescente, prima e
(f (x) + g(x)) = f (x) + g (x)
dopo x = 0. Perciò, f (x) = 0 indica in questo caso
(f (x)g(x))
= f (x)g(x) + f (x)g (x)
un punto di stasi della funzione, un punto cioè in cui
(1/f (x))
= f (x)/f (x)2
la funzione cessa per un attimo di crescere (o decre
2
(f (x)/g(x))
= (f (x)g(x)
f (x)g
(x))/g(x)
scere), ma non cambia il senso della crescita stessa.
(f (g(x)))
= f (y) y = g(x) g (x)
Punti di questo tipo si dicono flessi della funzione, e
sono caratterizzati dal fatto che la funzione cresce (o Questultima formula si dice regola della catena e sidecresce) sia prima che dopo il punto incriminato. In gnifica: per trovare la derivata di una funzione comconclusione: attenzione! quando f (x) = 0 qualcosa posta, si fa la derivata della prima funzione usando
242
una variabile di comodo y; nel risultato si sostitui- Teorema 8.31 Si hanno le seguenti funzioni derivasce y con la funzione interna g(x); la funzione cos` te:
ottenuta si moltiplica per la derivata della funzione
1. (c)
= 0
(c costante)
g(x).
2. (cf (x)) = cf (x)
Prova: Per la somma si ha:
3. (xn )
= nxn1
4. (ln(x)) = 1/x
(f (x) + g(x)) =
5. (ex )
= ex
f (x + h) + g(x + h) f (x) g(x)

6. (sin x)
= cos x
=
= lim
7. (cos x) = sin x
h0
h
8. (tan x) = 1/ cos2 x
f (x + h) f (x)
g(x + h) g(x)
= lim
+ lim
=
h0
h0
h
h
Prova:
= f (x) + g (x).
Il prodotto merita un po dattenzione in pi`
u:
f (x + h)g(x + h) f (x)g(x)
;
h0
h
(f (x)g(x)) = lim
ora aggiungiamo e togliamo al numeratore la quantità

f (x + h)g(x):
g(x + h) g(x)
+
h0
h
f (x + h) f (x)
g(x) =
+ lim
h0
h
= lim f (x + h)
= f (x)g (x) + f (x)g(x).
Per linverso si ha:
1
1
1
1
= lim
=
h0 h
f (x)
f (x + h) f (x)
f (x)
f (x) f (x + h)
=
.
h0 hf (x)f (x + h)
f (x)2
Per la divisione, si scrive:
= lim
f (x)
1
= f (x)
g(x)
g(x)
e si applicano le due regole precedenti. Infine, la
regola della catena è delicata quanto importante:
(f (g(x))) = lim
h0
= lim
h0
f (g(x + h)) f (g(x))

=
h
f (g(x + h) f (g(x)) g(x + h) g(x)

.
g(x + h) g(x)
h
Occorre ora osservare che g(x), essendo derivabile, è

anche continua e quindi, posto y = g(x), si ha g(x +
h) = y + h e quando h tende a 0 anche h tende a 0.
Quindi lespressione precedente si può scrivere:
g(x + h) g(x)
f (y + h ) f (y)
lim
,
h0
h 0
h
h
= lim
ma questa è proprio lespressione desiderata.

Lutilità di queste regole si rivela pienamente al
momento in cui si passano a considerare le derivate
delle principali funzioni:
1. Se c è una costante, il suo rapporto incrementale

è sempre 0.
2. Applicando la regola del prodotto del precedente
teorema e la 1) si ha immediatamente il valore
della derivata.
3. Il rapporto incrementale di xn vale:
(x + h)n xn
=
h

n n n n1
h + + nn hn xn
x + 1 x
= 0
=
h

n n2
n1
= nx
+
x
h + .
2
Tutti i termini, eccetto il primo hanno un fattore
h, cos` che facendo il limite per h 0 solo il
primo termine rimane.
4. Il rapporto incrementale del logaritmo naturale
è:
ln(x + h) ln(x)
=
h
1/h
M
h
1
= ln 1 +
= ln 1 +
;
x
Mx
dove abbiamo sostituito M ad 1/h. Chiaramente, quando h 0 si ha M e, passando al limite, come argomento del logaritmo
riconosciamo e1/x . Pertanto si ha:
M
1
1
lim ln 1 +
= ln(e1/x ) = .
h0
Mx
x
5. Il rapporto incrementale vale:
eh 1
ex+h eh
= ex
ex
h
h
secondo il limite notevole del Teorema 8.27.
243
6. Per il seno si usano i due limiti notevoli trovati Prova: Ecco le varie computazioni:
a suo tempo:
1. La regola della catena ci dice:
sin(x + h) sin(x)
=
ef (x) = [ey y = f (x)]f (x) = f (x)ef (x) .
h
sin x cos h + cos x sin h sin x
=
h
cos h 1
sin h
= sin x
+ cos x
;
h
h
passando al limite per h 0, la prima frazione
tende a 0 e la seconda ad 1, per cui segue il
risultato desiderato.
=
7. Per il coseno vale una dimostrazione analoga.

8. Per la tangente, si scrive tan x = sin x/ cos x
e si applica la regola della divisione vista nel
precedente Teorema 8.30.
Le prime tre regole di questo teorema ci

permettono di calcolare la derivata di qualsiasi
polinomio:
a0 xn + a1 xn1 + + an2 x2 + an1 x + an
2. Per il logaritmo si segue la stessa strada.

3. Partiamo da ln f (x) e deriviamo:
(ln f (x) ) = ( ln f (x)) =
f (x)
.
f (x)
Daltra parte, ancora per la regola precedente:

(ln f (x) ) =
(f (x) )
.
f (x)
Uguagliando i due risultati e ricavando (f (x) )

si ha la formula desiderata.
4. In modo analogo, (ln bf (x) ) = (f (x) ln b) =
(ln b)f (x) e per la regola 2):
(ln bf (x) ) =
(bf (x) )
;
bf (x)
uguagliando i due risultati si ricava la formula

per (bf (x) ) .
= na0 xn1 + (n 1)a1 xn2 + + 2an2 x + an1 .
5. Si consideri lidentità:
Con questa formula si verifica immediatamente che la
blogb (f (x)) = f (x)
derivata della funzione y = x2 3x+1 è effettivamente
y = 2x 3, come si era calcolato in modo diretto in
e si derivino i due membri. Per la formula 4. si
precedenza. Daltra parte, non ci saremmo aspettati
ha:
un risultato diverso.
(ln b)(logb (f (x))) f (x) = f (x)
La dimostrazione del punto 5) può essere portae da questo si ricava la formula desiderata,
ta avanti usando la regola della catena. Si considericordando che 1/ ln b = logb e.
ri lidentità ln(ex ) = x e si derivino i due membri
applicando a sinistra la regola:

1
x
Unapplicazione molto importante della regola
y = e (ex ) = 1;
y
della catena si ha nel seguente:
Sostituendo ad y il valore ex si ricava:
1 x
(e ) = 1
ex
e questo equivale a (ex ) = ex . E bene perciò avere
padronanza con la regola della catena, come mostra
ancor pi`
u chiaramente il seguente teorema.
Teorema 8.32 Valgono le seguenti regole:
1.
2.
3.
4.
5.
ef (x)
(ln(f (x))
(f (x) )
(bf (x) )
(logb (f (x)))
= f (x)ef (x)
= f (x)/f (x)
= f (x)f (x)1 R
= (ln b)f (x)bf (x) b R+
= (logb e)f (x)/f (x)
Teorema 8.33 Vale la formula:

(arctan x) =
1
(1 + x2 )
Prova:
La funzione y = arctan x è linversa composizionale della tangente, e pertanto si ha
lidentità:
arctan(tan x) = tan(arctan x) = x.
Applicando la regola della catena si ottiene:
(arctan(tan x)) = [(arctan y) | y = tan x](tan x) = 1.
Sappiamo che (tan x) = 1/ cos2 x e ci serve ricavare
(arctan y) . Per questo cerchiamo di esprimere x in
244
funzione di y, cioè operiamo dallinterno della formula

verso lesterno. Abbiamo:
1 cos2 x
sin x
=
y = tan x =
cos x
cos x
e tutta la nostra espressione dipende da cos x. Elevando al quadrato la precedente eguaglianza, si
ottiene:
y2 =
1 cos x
cos2 x
ovvero
cos2 x =
Abbiamo di fatto snobbato larcotangente come

funzione trigonometrica; qui essa prende la sua rivincita. Il fatto che, come il logaritmo, la derivata
sia pi`
u semplice della funzione avrà un ruolo importante nellintegrazione. La stessa cosa capita ad
arcoseno ed arcocoseno, per le quali funzioni il lettore
dimostrerà le seguenti formule, sempre sfruttando il
metodo della catena:
arccos (x) =
1
.
1 x2
Come dimostrano questi risultati, la regola della

catena è una specie di panacea per la soluzione di molti problemi di derivazione. Ne abbiamo visto un uso
piuttosto sofisticato, basato sul fatto che conosciamo
il risultato della composizione di certe funzioni. In
particolare, quando due funzioni sono una linversa
composizionale dellaltra, cioè f (g(x)) = x, derivando si ottiene unespressione che contiene sia la derivata di f (x) sia quella di g(x); se ponendo y = g(x) si
riesce a ricavare x in funzione di y, sostituendo questo nella g (x) si ha unespressione che dipende solo
da y e vale 1: si può ricavare allora f (y), se è questo
che si cercava.
La regola della catena si può anche applicare
per trovare la derivata di funzioni complicate; ad
esempio:
p
(1 sin(x2 ))
1 sin(x2 ) = p
=
2 1 sin(x2 )
8.7
sin x
x
0
/2
3/2
cos x
1
.
1 + y2
Riportando questo valore nellespressione della derivata, si ha la relazione (arctan y) (1 + y 2 ) = 1 che

equivale a quella desiderata.
1
arcsin (x) =
1 x2
x cos(x2 )
cos(x2 )(x2 )
= p
.
= p
2 1 sin(x2 )
1 sin(x2 )
Lo studio delle funzioni
Limpostazione, che abbiamo cercato di dare alla Trigonometria e al Calcolo esposti fin qui, è stata essenzialmente numerica: sappiamo che sin(30 ) = 0.5 e
che e2 7.389056; sappiamo risolvere un triangolo e
Figura 8.13: Le funzioni sin x e cos x

calcolare la retta tangente alla parabole y = x2 x+2
nel punto (3, 8). Questo è interessante perche ci permette di risolvere quantitativamente un bel po di
problemi, non solo di Matematica, ma anche di Fisica, di Economia e di Statistica. Tuttavia, spingere
troppo avanti la ricerca quantitativa di soluzioni ai
problemi può voler dire perderne la visione generale,
col rischio evangelico di vedere il fuscello numerico
nellocchio locale di un problema e non scorgere la
trave che ci impedisce di vedere il senso globale del
problema stesso. Ad esempio, abbiamo dimostrato
che le funzioni trigonometriche seno e coseno sono
periodiche di periodo 2, nel senso che il loro valore si ripete se incrementiamo largomento di 2. Ma
siamo sicuri di aver capito cosa vuol dire un risultato
del genere?
E senzaltro utile in questo, come in molti altri casi, cercare di avere una visione complessiva del comportamento di una funzione, una visione che lasci da
parte i dettagli, ma ci dica come è fatta la funzione
nelle sue linee essenziali. Un metodo, che si rivela sempre molto buono, è quello di rappresentare la
funzione mediante un grafico, cioè una figura che ci
permetta di vedere landamento della funzione senza
evidenziare troppo i singoli valori che essa assume.
Certo, se sappiamo calcolare la funzione, possiamo
cercare di costruirci per punti un grafico abbastanza accurato, che ci fornisca sia una visione generale
della funzione, sia una rappresentazione abbastanza
accurata dei suoi valori. Ad esempio, usando la Tabella 8.1 possiamo disegnare noi stessi (o far disegnare allelaboratore) i grafici delle funzioni sin x e
cos x (vedere Figura 8.13), e osservare che la periodicità corrisponde al replicarsi infinite volte della forma
della funzione, che cos` risulta descritta da un unico
tratto, nel nostro esempio [0, 2].
Con la stessa tecnica, abbiamo ottenuto il grafico
di y = x2 + x 1 (vedere Figura 5.4) e possiamo
ottenere quelli di y = ex e y = ln x: essi sono simmetrici rispetto alla retta y = x, come accade sempre
245
8.7. LO STUDIO DELLE FUNZIONI

y
ex
ln x
1
0
Figura 8.14: Le funzioni ex e ln x

quando due funzioni sono una linversa composizionale dellaltra (vedere Figura 8.14). Fatto a mano,
questo lavoro di disegno è davvero improbo e, usando
lelaboratore, si possono perdere aspetti importanti,
legati al fatto che anche lelaboratore ha i suoi limiti, e quando la funzione diverge oppure ha un campo
di definizione infinito, occorre operare oculatamente
per ottenere molte caratteristiche che ci interessano.
Ecco allora che lAnalisi Matematica ci viene in aiuto, fornendo alcuni teoremi (che vedremo tra poco)
e diverse tecniche (essenzialmente limiti e derivate)
che permettono di capire come una funzione si comporta, senza la necessità di calcoli accurati e troppo
numerosi.
Parlando di derivate, abbiamo già osservato che se
una funzione y = f (x) ha in un punto x0 derivata
positiva, allora in tale punto è crescente, mentre è
decrescente se la derivata è negativa. Il segno della
derivata, pertanto, ha una notevole importanza nello studio qualitativo delle funzioni, ma naturalmente
esistono altri aspetti importanti, e perciò è opportuno
affrontare largomento in modo sistematico. Vediamo
allora ordinatamente quali punti vanno considerati e
approfonditi.
1. Il dominio di definizione della funzione:
Preliminare a tutte le altre considerazioni, è la ricerca dellinsieme dei punti nei quali la funzione è
definita, cioè del suo dominio. E chiaro che se la
funzione y = f (x) non è definita in un certo intervallo (a, b), è inutile studiarla in tale insieme; se però
è definita fuori di tale intervallo, cioè per x < a e
per x > b, è interessante sapere come si comporta
quando x a e quando x b, calcolando i rispettivi limiti; questi ci fanno capire cosa succede vicino
agli estremi di definizione. Ad esempio, y = ln x è
definita solo nellintervallo (0, +) e quindi è inutile studiare la funzione per x 0. Tuttavia, sapere
che limx0 ln x = ci dice che, a partire da 0, la

funzione viene su da , una caratteristica molto importante del logaritmo (vedere
la Figura 8.14).
x non è definita
Analogamente, la funzione
y
=
per x < 0, ma limx0 x = 0, e questo ci fa rendere

conto dellandamento completamente diverso di
x nei confronti di ln
x. Ancora differente è la situazione per y = 1/ x, anche
lei non definita per
x 0, ma dove si ha limx0 1/ x = +. Un altro caso interessante è dato dalla funzione y = xx ;
scrivendo xx = ex ln x , possiamo ricordare dalla precedente sezione che limx0 x ln x = 0 e ciò implica
limx0 xx = e0 = 1, un risultato sorprendente che
ci consiglia di definire 00 = 1, una posizione controintuitiva, che però è in accordo col limite appena
calcolato. Può allora essere interessante studiare la
funzione y = xx , cosa che infatti faremo sviluppando
i punti successivi.
Un caso un po diverso è fornito dai punti isolati
x0 in cui la funzione non è definita, come x0 = 0 per
y = 1/x. Qui ha senso studiare i limiti per x x0
della funzione, sia per valori crescenti che decrescenti
di x: infatti, tali limiti possono essere diversi, ma
sono comunque fortemente indicativi dellandamento
della funzione. Nellesempio, si ha limx0 1/x = +
mentre limx0 1/x = , e infatti il grafico della
funzione è quello ben noto delliperbole. Diverso è il
caso della funzione y = 1/x2 , che ancora risulta non
definita per x0 = 0; questa volta, però, i due limiti,
per x 0 da destra e da sinistra, sono entrambi +
e la forma della funzione è assai diversa.
Tutti questi casi ci fanno capire quanto sia importante saper calcolare i limiti, che rappresentano la
parte pi`
u delicata dello studio delle funzioni. Oltre
alle tecniche viste nella Sezione 8.4, esiste un metodo
molto amato dagli studenti, perche di facile applicazione: chiama infatti in ballo il calcolo delle derivate,
ben pi`
u meccanico del calcolo dei limiti eseguito secondo la definizione. Ci riferiamo al celebre Teorema
di de LHopital, che vedremo fra poco, quando avremo introdotto gli strumenti necessari per la sua dimostrazione, e che, purtroppo, data la sua popolarità, è
talvolta applicato a sproposito.
Di solito, legato alla ricerca del dominio di definizione di una funzione, è il problema di stabilire la
continuità della funzione stessa. La maggior parte
delle funzioni espresse mediante formule coinvolgenti
le funzioni elementari (o, come si dice, in forma analitica) sono continue negli intervalli in cui risultano
definite. Possono però presentare punti di discontinuità, che spesso risultano essere fittizi o, al pi`
u, di
prima specie, per cui la funzione presenta un salto.
Le discontinuità di seconda e terza specie corrispondono di solito a punti in cui la funzione non è nemmeno definita. Si consideri y = e1/(x1) nel punto
246
x0 = 1, e ciò ci dice che è sempre bene non aggrapparsi a facili generalizzazioni, se non sono convalidate
da dimostrazioni formali.
Dove sappiamo che una funzione è continua, possiamo utilmente applicare i teoremi visti a suo tempo
per tali funzioni (Teorema della permanenza del segno, degli zeri di una funzione continua, etc.). Spesso, dove è continua una funzione è anche derivabile,
anche se questa affermazione non è vera in generale:
ad esempio, y = |x| è ovunque continua, ma non è
derivabile in x = 0, come il lettore avrà modo di verificare. La derivabilità è una proprietà forte e alcuni
teoremi possono essere di aiuto nello studio delle funzioni. Cominciamo con un risultato che sembra ovvio,
ma che si rivelerà molto fruttifero:
Prova: Questa volta basta applicare il Teorema di

Rolle alla funzione:
Teorema 8.34 (di Rolle) Sia f (x) una funzione

continua nellintervallo [a, b] e derivabile in (a, b);
se f (a) = f (b), esiste un punto (a, b) tale che
f () = 0.
Prova: Come osservato nella Sezione 8.6, la funzione
ha in [a, b] un punto di massimo e uno di minimo; se
coincidono con i due estremi, il massimo è uguale
al minimo e quindi la funzione risulta costante; in
tal caso la funzione ha derivata nulla in ogni punto
dellintervallo. Altrimenti, la funzione ha un massimo
o un minimo relativo in un punto (a, b), ma in
tale punto è f () = 0, come stabilito dal Teorema
8.29.
Una conseguenza immediata del Teorema di Rolle
è:
h(x) = f (x)(g(b) g(a)) g(x)(f (b) f (a)).

E veniamo infine allannunciato Teorema di de
LHopital, che ora dimostreremo relativamente alla
forma indeterminata 0/0; esso può essere dimostrato anche per la forma /, ma lasciamo la prova
formale al lettore volenteroso.
Teorema 8.37 (di de LH
opital) Siano f (x) e
g(x) due funzioni continue e derivabili nellintervallo
[a, b], eccetto al pi`
u in un punto x0 nel quale entrambe
si annullano. Se g(x) e g (x) sono diverse da 0 nellintervallo (escluso ovviamente x0 ) ed esiste, finito
o infinito, il limite del rapporto delle due derivate,
allora:
f (x)
f (x)
= lim
.
lim
xx0 g (x)
xx0 g(x)
Prova:
Si consideri una qualunque successione
{x}nN che tenda ad x0 . Poiche per ipotesi f (x0 ) =
g(x0 ) = 0, si ha:
f (xn )
f (xn ) f (x0
f (n
=
=
g(xn )
g(xn ) g(x0 )
g (n )
dove n è compreso fra xn e x0 per il precedente Teorema di Cauchy. Si ha pertanto n x0 e quindi
si è dimostrato lasserto del teorema dato che, per
ipotesi, lultimo limite esiste (finito o infinito).
Poiche la derivata è di solito pi`

u semplice della funTeorema 8.35 (di Lagrange o del valor medio)
zione
di
partenza,
il
Teorema
di
de LHopital tende
Sia f (x) una funzione continua nellintervallo [a, b] e
a
rendere
pi`
u
facile
il
calcolo
del
limite. Un facile
derivabile in (a, b). Esiste sempre un punto (a, b)
esempio
`
e
il
seguente:
tale che f (b) f (a) = f ()(b a).
ex
ex 1
Prova: Si consideri la funzione h(x) = f (x) (x
= lim
= e0 = 1
lim
x0 1
x0
x
a)(f (b)f (a))/(ba). Il Teorema di Rolle ci assicura
che esiste un punto (a, b) per cui h () = 0. Ma: come sappiamo dal Teorema 8.27. Questa sembra
una dimostrazione diretta e assai carina. Purtroppo, il suo punto debole è di sfruttare il Teorema 8.31,
punto 5. (ex ) = ex , il quale, ohimè, è stato dimostracioè, per x = , proprio la relazione desiderata.
to proprio utilizzando questo limite notevole. Siamo
Il nome del teorema deriva dal fatto che (f (b) entrati in un circolo vizioso e la dimostrazione non è
f (a))/(b a) è una specie di media dei valori del- valida. Queste chicche fanno la delizia dei matematila funzione, e tale valore è assunto dalla derivata in ci, e uno studente è bollato a fuoco se cade in tranelli
un qualche punto.
del genere. Unapplicazione lecita è invece:
Unaltra importante conseguenza del Teorema di
1 1
1
1 cos x
x sin x
Rolle è:
= lim
= =
lim
x0
x0
x3
3x2
3 2
6
Teorema 8.36 (di Cauchy) Siano f (x) e g(x) due
funzioni continue nellintervallo [a, b] e derivabili in dove abbiamo sfruttato il limite notevole dimostrato
(a, b) con g (x) 6= 0. Esiste un punto (a, b) tale nella Sezione 8.4. Importante è il calcolo del seguente
limite del tipo /:
che:
f ()
f (b) f (a)
ex
ex
ex
= .
= lim
=
lim n = lim
g(b) g(a)
g ()
n1
x nx
x n(n 1)xn2
x x
h (x) = f (x)
f (b) f (a)
ba
8.7. LO STUDIO DELLE FUNZIONI

ex
=
x n!
che ci dice come la funzione esponenziale cresca,
quando x , pi`
u rapidamente di qualsiasi polinomio, una proprietà notevole e molto importante.
Analogamente, sempre del tipo /:
247
orizzontale, come nel caso dellesponenziale, ma può

essere anche verticale, come la retta x = 0 per il
logaritmo, o addirittura obliquo, caso che tratteremo
nella prossima Nota.
Gli asintoti orizzontali danno una forte caratterizzazione del comportamento allinfinito della funzione,
poiche fanno vedere come questa si adagi sulla ret1/x
ln x
ta, senza mai toccarla. Il termine adagiarsi va qui
=
lim = lim
x (1/n)x(1/n)1
x n x
preso con attenzione; la funzione si può avvicinare
alla curva rimanendole al di sopra, oppure restandon
ne al di sotto, e queste due situazioni vanno studiate
= lim 1/n = 0
x x
se si vuole avere un grafico corretto della funzione.
che dimostra come, al contrario, il logaritmo cresca In qualche caso, come per y = sin(x)/x , la funzione
meno di qualsiasi radice!
addirittura oscilla intorno al suo asintoto.
Una volta determinato il dominio della funzione,
Si consideri la funzione y = (2x + 1)/(x 2) per la
e quindi dove è continua e come si comporta al quale si ha:
finito, è opportuno vedere come si comporta man
2 + 1/x
2x + 1
mano che la variabile indipendente cresce o decresce
= lim
= 2.
lim
x 1 2/x
x x 2
indefinitamente.
2. Comportamento della funzione allinfini- Questo significa che la funziona ha come asintoto orizto: Quasi tutte le funzioni di interesse hanno domini zontale la retta y = 2. Possiamo essere pi`
u precisi e
non limitati, che cioè comprendono valori positivi del- osservare che, quando x +, il rapporto tra 2x+1
la x sempre pi`
u grandi e/o valori negativi sempre pi`
u e x 2 è sempre un po pi`
u grande di 2, e quindi la
piccoli. Queste sono situazioni che non si possono stu- funzione rimane al di sopra dellasintoto. Quando
diare bene con limpostazione ingenua di calcolare e x , il rapporto è invece minore di 2 (se non
disegnare la funzione per punti: non è possibile infat- lo si vede subito, si provi ponendo x = 1000), e
ti essere sicuri che, un po pi`
u in là di dove arriviamo perciò la funzione rimane sempre un po al di sotto
con i nostri conti, il comportamento della funzione dellasintoto. Osserviamo anche che la retta x = 2
cambi rispetto a quello che siamo riusciti a determi- costituisce un asintoto verticale; infatti, per tale vanare. E qui che si rivela la potenza del concetto di li- lore, la funzione non è definita (il denominatore vale
mite e dellanalisi infinitesimale nel suo complesso: si 0) e si ha una discontinuità di seconda specie. Poiche
ottengono infatti informazioni precise proprio in quel- il numeratore risulta positivo quando x è vicino a 2,
le zone che non possiamo rappresentare graficamente diciamo 2 < x < 2 + , si ha:
e che, perciò, tendono a sfuggirci.
2x + 1
2x + 1
Per la funzione y = x2 , si ha limx+ x2 =
lim
=
lim
= +.
2
x2
x2+
x
2
x2
limx x = +, e ciò rende conto, in modo qualitativo, ma molto appropriato, del fatto che una pa- Queste informazioni ci permettono di disegnare il grarabola come y = x2 cresce man mano che ci allonta- fico della funzione, almeno in una prima approssimaniamo dal suo vertice. Propriamente parlando, e su zione. Come si è visto: i) verso la funzione rimaquesto torneremo pi`
u avanti in modo sistematico, la ne al di sotto dellasintoto y = 2; ii) avvicinandosi da
parabola y = x2 decresce quando da si passi a sinistra a x = 2 la funzione va a ; iii) ripartendo
valori (negativi) sempre pi`
u grandi, e cresce quando da x = 2 la funzione scende da +; iv) proseguendo
ci si incammini su valori positivi via via maggiori.
verso + la funzione si avvicina allasintoto y = 2,
Completamente diverso è il comportamento di y = ma ne rimane al di sopra. Per il momento non posx3 , poiche si ha: limx x3 = e limx+ x3 = siamo dire molto di pi`
u, ma abbiamo già una buona
+. La funzione cresce venendo da e continua idea dellandamento della funzione, e tale andamento
a crescere andando verso +. Per lesponenziale si può essere reso pi`
u realistico calcolando la funzione
ha: limx+ ex = + e limx ex = 0. Questo in qualche punto, ad esempio, per x intero da 4 a
è un caso interessante e significa che lesponenziale si +8 (vedere Figura 8.15).
appiattisce verso la retta y = 0: tale retta si dice un
Nota 8.3
La nostra definizione di asintoto è tropasintoto orizzontale per la funzione y = ex quando
po approssimativa per essere presa sul serio, anche se
x . In generale, data la funzione y = f (x),
a noi interessano solo i casi degli asintoti orizzontali e
si dice che essa ha come asintoto la retta r, se la
verticali. In generale, la retta non verticale y = ax + b
funzione si avvicina sempre di pi`
u alla retta, senza
è un asintoto della funzione y = f (x) per x + se:
però mai raggiungerla; in altre parole, la distanza tra
lim (f (x) ax b) = 0
funzione e retta tende a zero. Lasintoto può essere
x+
= = lim
248

Vediamo subito come esempio la funzione y = (x2 +
2x 1)/(2x 1), che ha un asintoto verticale per x =
1/2. Poiche:
lim
la funzione ha un asintoto obliquo, sia per x +,

sia per x . Si ha inoltre:
lim
Figura 8.15: La funzione y = (2x + 1)/(x 2)
3
2
1
1
1
Figura 8.16: y = (x2 + 2x 1)/(2x 1)
cioè quando la distanza verticale tra la funzione e la
retta tende a 0 (questo ci fa capire perche escludiamo
il caso degli asintoti verticali). Gli asintoti obliqui,
quelli corrispondenti ad a 6= 0, hanno un significato importante; infatti, lesistenza dellasintoto corrisponde a una crescita lineare (cioè, secondo una retta)
della funzione quando x vada verso linfinito. La crescita lineare, a sua volta, corrisponde a una crescita
che potremmo definire media, o, se si preferisce, a
una crescita proporzionale alla crescita della variabile indipendente. Se la funzione cresce di meno (come
y = x oppure y = ln x) la curva, pur crescendo, tende ad abbassarsi (vedere la Figura 8.14), mentre se la
funzione cresce di pi`
u (come y = x2 oppure y = ex ), la
sua curva tende ad impennarsi. Queste considerazioni sono molto importanti nellanalisi degli algoritmi e
nello studio della loro complessit`
a.
Dalla formula precedente si ottengono le regole per
determinare il valore di a e b, quando esistano:
a = lim
x+
f (x)
x
b = lim (f (x) ax) .

x+
x
5
5x 2
x2 + 2x 1
= lim
= .
x 4x 2
x(2x 1)
2
4
Lasintoto è pertanto y = 12 x + 45 ; se poi si calcolano i limiti relativi allasintoto verticale, si ha

landamento approssimativo della funzione (vedere
Figura 8.16). Il grafico è stato disegnato tenendo conto anche di altre informazioni, come fra poco vedremo.
x2 + 2x 1
1
= ,
x(2x 1)
2
3. Crescenza, decrescenza, massimi e minimi. Una volta trovato il dominio di definizione della
funzione che si vuole studiare e stabilito qual è il suo
comportamento allinfinito, occorre trovare gli intervalli in cui la funzione cresce o decresce e, di conseguenza, stabilire quali sono i punti di massimo e di
minimo. Queste informazioni, integrate con le precedenti, ci danno la visione generale del grafico della
funzione.
Sappiamo già che dove la derivata è positiva la funzione è crescente e dove la derivata è negativa la funzione è decrescente. I massimi e i minimi sono i punti
di passaggio dalla crescita alla decrescita, e viceversa.
Trovare i punti in cui la derivata si annulla non ci dà
meccanicamente i massimi e i minimi relativi; come
abbiamo detto, bisogna controllare il comportamento
della funzione in prossimità di tali punti. Lesempio
di y = x3 , funzione che cresce prima e dopo il punto
x = 0 in cui la derivata si annulla, è significativo e
va sempre tenuto presente. Consideriamo lesempio
precedente della funzione y = (2x + 1)/(x 2):
y =
5
2(x 2) (2x + 1)
=
.
(x 2)2
(x 2)2
Poiche sappiamo già che la funzione non è definita per

x = 2, il denominatore non ci dà fastidio; inoltre, per
x 6= 2 esso è sempre positivo, essendo un quadrato.
In conclusione, la derivata è sempre negativa e ciò
significa che la funzione è ovunque decrescente, una
situazione non frequentissima, ma che si accorda bene
con le informazioni già trovate. Se infatti guardiamo
la Figura 8.15 ci accorgiamo che cos` stanno le cose.
Nellesempio della funzione y = (x2 +2x1)/(2x
1) (vedere Figura 8.16), anche se svolto in una nota,
possiamo supporre di conoscere solo lasintoto verticale (dove 2x 1 si annulla) e che va allinfinito con
lo stesso segno della x. La derivata vale:
y =
2x(x 1)
(2x + 2)(2x 1) (x2 + 2x 1)2
=
(2x 1)2
(2x 1)2
249
8.8. IL CALCOLO INTEGRALE

e ancora una volta possiamo permetterci di ignorare
il denominatore, sempre positivo, eccetto nel punto
singolare x = 1/2. Possiamo applicare al numeratore
le nostre conoscenze sulle disequazioni:
x=0
2
x=1
1. La derivata è positiva per x < 0 e quindi la

funzione è crescente da a 0;
2. la derivata è negativa per 0 < x < 1 e quindi la
funzione è decrescente;
5. per x = 1 abbiamo perciò un punto di minimo.

Si osservi che quanto detto in 2. va legato al fatto
che per x = 1/2 la funzione ha un asintoto verticale.
Calcoliamo quindi f (0) = 1 ed f (1) = 2 e possiamo
concludere che:
a. la funzione decresce fra 0 ed 1/2 andando da 1 a
;
b. la funzione decresce fra 1/2 ed 1 andando da +
a 2.
Questo ci permette di rappresentare adeguatamente
la funzione anche senza conoscere lasintoto obliquo;
esso, naturalmente, ci dà linformazione aggiuntiva
di come la funzione va allinfinito. Possiamo infine
utilizzare il fatto che la funzione si annulla quando e
soltanto quando il numeratore si annulla; risolvendo
lequazionex2 + 2x 1 = 0 si trovano le due radici
x = 1 2, che corrispondono alle intersezioni del
grafico con lasse delle x.
Concludiamo con lo studio della funzione y = xx ,
definita solo per x > 0 ed estendibile a x = 0 ponendo
00 = 1. La derivata si calcola nel modo seguente:
x x ln x
(xx ) = (ex ln x ) = ln x +
e
= (ln x + 1)xx .
x
Poiche xx è sempre positiva, il segno della derivata è

legato a ln x+1, che si annulla quando ln x = 1, cioè
quando x = e1 0.367879. Prima di questo valore
la derivata è negativa e quindi la funzione decresce
1
da 1 fino a (e1 )e 0.692201, punto di minimo;
dopo la funzione cresce, tendendo allinfinito molto
rapidamente. La Figura 8.17 evidenzia il grafico di
questa funzione.
Figura 8.17: Grafico della funzione y = xx
3. per x = 0 abbiamo perciò un punto di massimo;

4. La derivata è positiva per x > 1 e quindi la
funzione è crescente;
1/e
8.8
Il calcolo integrale
Il concetto di integrale è probabilmente pi`

u intuitivo
di quello di derivata. Questultimo deve far riferimento al concetto di variazione che noi possediamo in
modo naturale, ma che ci crea problemi non indifferenti di rappresentazione e di valutazione. Basta
pensare allesempio forse pi`
u comune, la velocità, per
renderci conto che siamo di fronte a una grandezza di
non facile approccio. Già presenta qualche difficoltà
calcolare la velocità media in un tratto di percorso,
come di regola facevano e fanno le imbarcazioni col
solcometro (inventato comunque nel 1500): ma come
fare a valutare la velocità istante per istante? Che
tipo di tachimetro avrebbe dovuto e/o potuto usare un auriga per conoscere la forza dei suoi cavalli?
Qui, a rigore, sto dicendo uninesattezza. Nel linguaggio comune diciamo che la velocità della biga è
legata alla forza dei cavalli. In realtà, la faccenda è
pi`
u complessa e la Fisica ci insegna che la forza è legata allaccelerazione, cioè alla variazione di velocità.
Siamo pertanto di fronte a una variazione della variazione, e tutto sembra complicarsi in modo drammatico. Newton fu veramente un genio a dipanare
la matassa ed è merito suo se oggi abbiamo le idee
pi`
u chiare in questo guazzabuglio, ma lo sforzo per
capire è stato grande e ognuno di noi, ancora oggi,
lo deve affrontare, anche se aiutato dai libri e dagli
insegnanti.
Apparentemente, invece, il calcolo integrale è un
concetto abbastanza evidente. Il problema centrale è il calcolo dellarea delle figure, problema che la
Geometria aveva affrontato, e in parte risolto, fino
dallantichità. Come abbiamo visto, lequiscomponibilità permette di calcolare la misura di molte superfici, ma si deve arrendere quando dai poligoni si passa
alle figure rotonde. In particolare, la quadratura del
250
cerchio è stata uno scoglio sul quale sono naufragate molte barche e molte navi. In effetti, come ora
sappiamo, è impossibile scomporre un cerchio e costruire, con la riga e il compasso, un poligono (se non
proprio un quadrato) ad esso equivalente. Lidea di
Archimede di passare da procedimenti finiti a processi infiniti si è rivelata vincente, anche se richiede
accorgimenti piuttosto particolari. Noi abbiamo affrontato il calcolo di (vedi Sezione 6.7) seguendo,
s` lidea di Archimede, ma avendo alle spalle diverse
discussioni sui numeri reali, sulle sequenze infinite e
sulle successioni di Cauchy. In altre parole, benche
non avessimo parlato ancora del concetto di limite,
eravamo armati di (quasi) tutti quegli strumenti che
fanno, di un processo infinito, un qualcosa di logicamente rigoroso e accettabile nel mondo esigente della
Matematica.
Noi seguiremo una strada abbastanza ingenua, anche se è la stessa che diede origine al calcolo integrale
e che è stata seguita dai matematici fino alla fine del
secolo XIX. Infatti, in quegli anni, ci si accorse che
esistevano situazioni alquanto anomale che richiedevano unimpostazione pi`
u sofisticata, e fu Lebesgue,
nel 1902, a introdurre un nuovo concetto di integrale
che comprendeva il vecchio e dava ragione di quei casi
speciali che si erano trovati. Per noi andrà benissimo la strada pi`
u semplice, che comunque ci portarà
a dimostrare quello che è laspetto pi`
u eccezionale, e
curioso, del calcolo integrale, e cioè la sua insospettata (a priori) strettissima connessione con il calcolo
differenziale. In altre parole, scopriremo come la misura delle aree sia la faccia nascosta del calcolo delle
variazioni, cioè della ricerca della retta tangente ai
vari punti di una curva: i due problemi sono esattamente uno linverso dellaltro. Data una curva, se
consideriamo le variazioni istantanee dellarea sottesa
dalla curva man mano che procediamo lungo la curva
stessa, ritroviamo proprio la medesima curva, quella
da cui siamo partiti. E se, viceversa, consideriamo
le aree successive sottese dalla funzione che descrive
le variazioni della curva data, ritroviamo proprio tale
curva. Questo, in modo del tutto fortunato, permette uno sviluppo unitario dei due calcoli che, visti a
priori, avrebbero potuto comportare metodologie del
tutto diverse.
Si consideri allora (v. Figura 8.18) una curva limitata A A1 , A2 , . . . , An1 , An B, M ; per il momento è essenziale la condizione sulla limitatezza, cioè
che la figura non si sperda nel piano, andando a rasentare linfinito. E chiaro che larea di tale figura si
può ottenere per differenza: basta togliere dallarea
che la parte superiore A A1 , A2 , . . . , An1 , An B
sottende fino allasse delle ascisse, larea sottesa dalla
parte inferiore A, M, B. Possiamo perciò limitare le
nostre considerazioni alle curve definite da unequa-

A3
A2
An1
A4
An
A1
M
O
Figura 8.18: Area di una curva
zione y = f (x) e allarea da esse sottesa fino allasse

delle ascisse. Per il momento, possiamo supporre che
la funzione y = f (x) sia continua, ma vedremo come
questa ipotesi possa essere un po rilassata.
Fissiamo pertanto la nostra attenzione su una funzione continua y = f (x) e su un intervallo [a, b] in cui
essa sia definita. Suddividiamo [a, b] in tanti intervallini mediante i punti x0 = a, x1 , x2 , . . . , xn1 , xn = b;
i vari intervalli [xi1 , xi ] possono essere tutti uguali
o tutti diversi, non ha grande importanza; comunque, indicheremo con la loro massima lunghezza.
Da un punto di vista pratico, come vedremo con un
esempio pi`
u avanti, considerare intervalli uguali può
essere pi`
u conveniente; nella teoria, intervalli diversi
danno pi`
u flessibilità. In ogni intervallo [xi1 , xi ] poniamo xi = xi xi1 e indichiamo con i , i i due
punti dellintervallo in cui la funzione f (x) assume il
suo minimo e il suo massimo (si veda la Figura 8.18).
Questo significa che se Ii indica larea sottesa dalla
curva y = f (x) nellintervallo [xi1 , xi ], si ha:
f (i )xi Ii f (i )xi .
A questo punto, possiamo sommare rispetto a tutti
gli intervalli ottenendo:
n
X
i=1
f (i )xi
n
X
i=1
Ii = I
n
X
f (i )xi
i=1
dove I è larea che stiamo cercando. Se ora facciamo

tendere a zero lampiezza massima dei nostri intervalli, i punti i e i tendono a confondersi e, per la
supposta continuità della f (x), i valori f (i ) e f (i )
tenderanno, per il Teorema dei Carabinieri, a diventare uguali (si osservi che 0 implica n ).
Questo però vuol dire che la prima e lultima somma
tendono a diventare uguali e questo definisce univocamente il valore di I, cioè dellarea sottesa dalla nostra
251

curva. Si scrive:
lim
n
X
f (i )xi = lim
i=1
n
X
f (i )xi =
i=1
f (x)dx
che si dice lintegrale definito della

R funzione y = f (x)
nellintervallo [a, b]. Il simbolo fu coniato da Leibniz stilizzando la S iniziale di Summa; a e b si dicono gli
estremi di integrazione e il simbolo dx indica il differenziale di x, come nel caso della derivazione, poiche
in realtà ha lo stesso significato di differenza infinitesima di valori delle ascisse. Unosservazione, banale
Rb
ma importante, è che a f (x)dx = 0 se a = b.
Un esempio classico riguarda la quadratura della
parabola, cioè la determinazione dellarea sottesa da
un arco di parabola. Si tratta di un antico problema e il termine quadratura è usato in analogia alla
quadratura del cerchio, cioè al fatto che, una volta trovata larea desiderata, è anche possibile trovare numericamente il lato di un quadrato con quella
stessa area (basta fare la radice quadrata). Consideriamo la parabola y = x2 e lintervallo [0, X],
che dividiamo in n parti uguali; ogni intervallo ha
pertanto lunghezza = X/n e i vari estremi sono
x0 = 0, xi = i (i = 1, 2, . . . , n), con n = X. Poichè
la funzione è crescente, si ha i = (i 1) e i = i,
cos` che:
n
X
i=1
((i 1))2 I
3
n1
X
i=0
i2 I 3
n
X
(i)2
i=1
n
X
i2 .
i=1
Ricordiamo che la somma dei quadrati dei primi n

naturali vale n(n + 1)(2n + 1)/6 (vedere Teorema ??)
e quindi:
X 3 (n 1)n(2n 1)
X 3 n(n + 1)(2n + 1)
I 3
3
n
6
n
6
3
3
1
1
X
1
1
X
1
2
I
1+
2+
.
6
n
n
6
n
n
Come abbiamo osservato, quando 0 deve essere
n e quindi 1/n 0; le due espressioni agli estremi tendono allora allo stesso valore e per il Teorema
dei Carabinieri si ha:
Z X
X3
x2 dx =
I=
.
(8.2)
3
0
Consideriamo allora una funzione y = f (x) (che
supporremo continua) definita nellintervallo [a, b] e
sia x un punto qualsiasi di tale intervallo. Possiamo restringere la nostra attenzione al sotto-intervalli
[a, x]: si dice funzione integrale della f (x) la funzione:
Z x
F (x) =
f (t)dt.
a
Si noti luso della variabile t per evitare confusione

con la variabile x, usata come variabile indipendente
nella funzione integrale. La variabile t è, come si dice
legata nel senso che, pur apparendo scritta come variabile, il suo ruolo è perso nelloperazione di integrazione, cioè nel calcolo dellaria, che ovviamente non
dipende dalla variabile della funzione y = f (x), ma
solo dal punto x [a, b], che perciò diviene la vera variabile indipendente. Luso del differenziale dx serve
proprio a ricordare questa legatura, evidenziando
la variabile che non cè pi`
u.
Larea sottesa dalla curva y = f (x) è crescente,
se la funzione si mantiene al di sopra dellasse delle
ascisse. Ha senso considerare negative le aree comprese tra lasse delle x e la curva, se questa scende al
di sotto dellasse stesso. Ad esempio, larea sottesa
dalla curva y = sin x nellintervallo [0, 2] è zero, poiche larea positiva dellintervallo [0, ] è bilanciata da
quella negativa di [, 2], di pari estensione. Di regola le considerazioni sulla funzione integrale si basano
su curve che rimangono al di sopra delasse delle x,
ma si possono estendere facilmente a situazioni generali. Anche noi ci atterremo a questa regola, intuitivamente pi`
u semplice, in quanto rispetta la nostra
idea di area di una superficie, una quantità sempre
considerata positiva, a partire dai matematici greci.
Dalla definizione di integrale, discende il seguente:
Lemma 8.38 Se f (x) è una funzione integrabile nellintervallo [a, c] e b è un punto di tale intervallo, cioè
a b c, allora:
Z c
Z b
Z c
f (x)dx =
f (x)dx +
f (x)dx
a
f (x)dx =
Z
f (x)dx
f (x)dx =
f (x)dx
f (x)dx.
c
Con questo in mente, se y = f (x) è una funzione continua in [a, b] e si considerano due punti
a x1 x2 b, indichiamo con m ed M lestremo inferiore e superiore dei valori che la f (x) assume nellintervallo [x1 , x2 ]; è immediato osservare che
del rettangolo x1 m1 m2 x2 è minore o uguale a
Rlarea
x2
f
(x)dx,
che a sua volta è minore o uguale allarea
x1
del rettangolo x1 M1 M2 x2 . Questo si scrive:
Z x2
1
dx M.
m
x2 x1 x1
Poiche sappiamo che una funzione continua in un intervallo chiuso assume tutti i valori compresi tra m
ed M , deve esistere un punto [x1 , x2 ] in cui la
funzione ha proprio il valore centrale. Abbiamo cos`
dimostrato:
252
Teorema 8.39 (della media integrale) Se y =

f (x) è continua in (a, b) e a x1 x2 b, esiste un
punto [x1 , x2 ] tale che:
Corollario 8.42 Sia y = f (x) continua nellintervallo (a, b): ogni primitiva di f (x) differisce al pi`
u
per
una
costante
dalla
funzione
integrale
F
(x)
=
Rx
f (t)dt.
a
1
f () =
x2 x1
x2
dx.
x1
Questo risultato serve a dimostrare il seguente

teorema fondamentale del calcolo integrale:
Teorema 8.40 (fondamentale) Sia f (x) una funzione continua
in (a, b); la sua funzione integrale
Rx
F (x) = a f (t)dt è derivabile e per ogni x [a, b]
si ha F (x) = f (x).
Prova: Calcoliamo il rapporto incrementale della
F (x) in un punto qualsiasi x0 :
Z
1
F (x) F (x0 )
=
x x0
x x0
1
=
x x0
f (t)dt
x0
f (t)dt
x0
f (t)dt = f ().
Per il precedente teorema della media integrale, deve

esistere un punto (a, b) tale che f () sia proprio
uguale allultima espressione. Quando facciamo tendere x x0 , anche x0 e quindi F (x) è derivabile
in x0 e si ha proprio: F (x0 ) = f (x0 ).
Si dice primitiva della funzione (continua) y = f (x)
ogni funzione G(x) tale che G (x) = f (x). Il teorema
precedente ci dice che la funzione integrale della f (x)
è una primitiva della stessa f (x), cioè integrazione e
differenziazione sono due operazioni una inversa dellaltra. Da questo deriva il nome del teorema. Per
maggiore fortuna, possiamo anche dimostrare che le
primitive di una funzione non sono poi molto diverse
luna dallaltra:
Teorema 8.41 Due funzioni G1 (x) e G2 (x) hanno
la stessa derivata, cioè G1 (x) = G2 (x), se e solo se differiscono per una costante, ovvero G2 (x) =
G1 (x) + c.
Prova: Se G2 (x) = G1 (x) + c, dalle regole di derivazione si ha: G1 (x) = G2 (x). Viceversa, si consideri la funzione g(x) = G2 (x) G1 (x); derivando
si deve avere: g (x) = G2 (x) G1 (x) = 0. Vediamo allora che g(x) è costante. Se prendiamo due
punti qualsiasi x1 , x2 [a, b], per il Teorema di Lagrange deve esistere un punto (x1 , x2 ) tale che
g(x1 ) g(x2 ) = g ()(x1 x2 ) = 0, per la proprietà di g(x) appena vista. Ma questo significa
g(x1 ) = g(x2 ), qualunque siano i punti x1 , x2 (a, b),
cioè, la funzione g(x) è costante.
Ne consegue limportante corollario:
In questi pochi risultati è racchiusa tutta (o quasi

tutta) la teoria elementare del calcolo integrale, quella da noi adottata. Il Teorema Fondamentale ci dice
che lintegrazione è loperazione inversa della derivazione, e il Corollario rafforza questa constatazione avvertendoci che non ci sono altre strade per calcolare la
funzione integrale se non quella di procedere a ritroso
rispetto alla derivazione. Cos` tutto è lasciato sulle
spalle di questa operazione che, fortunatamente, già
conosciamo e che ha regole assai precise. Questa è la
teoria. Come vedremo poco pi`
u avanti, la pratica non
è cos` rosea, per il semplice fatto che non è sempre
facile immaginare quale funzione abbia prodotto per
derivazione quella assegnata. Per il momento, accontentiamoci dei lati positivi, osservando e precisando
alcuni aspetti essenziali da un punto di vista pratico.
Se y = f (x) è continua nellintervallo (a, Rb), si dice integrale indefinito della f (x), w si scrive f (t)dt,
una qualsiasi primitiva della f (x); secondo il precedente corollario, se F (x)
R è una qualsiasi primitiva di
f (x), si suol scrivere f (t)dt = F (x) + c, lasciando
indicata la costante c. La relazione tra integrale definito (larea) e lintegrale indefinito (funzione) è dato
semplicemente dal seguente:
Teorema 8.43 Sia y = f (x) una funzione continua
definita nellintervallo (a, b) e sia G(x) una qualunque sua primitiva. Allora, lintegrale definito fra a e
b di f (x) si calcola nel modo seguente:
Z
f (t)dt = [G(x)]a = G(b) G(a).
Rx
Prova: Sia F (x) = a f (t)dt la funzione integrale
di f (x), di modo che si ha: F (x) G(x) = c, una
qualche costante. In particolare, per x = a si trova F (a) G(a) = c, ed essendo F (a) = 0, si ricava
G(a) = c. Questo dà F (x) = G(x) G(a) e per
Rb
x = b si conclude: a f (t)dt = G(b) G(a). La notab
zione [G(x)]a è quella comunemente usate e significa
proprio calcolare la G(x) in x = b e sottrarle il valore
di G(x) valutato in x = a.
Come semplice esempio, si voglia trovare larea sottesa dalla parabola y = x2 nelintervallo [0, 2], problema che abbiamo già risolto con la formula (8.2).
Si comincia osservando che una primitiva di x2 è
x3 /3, come si verifica facilmente calcolando la derivata: Dx3 /3 = 3x2 /3 = x2 . A questo punto si
ha:
3 2
Z 2
8
8
x
= 0= .
x2 dx =
3
3
3
0
0
253
Funzione
xn
1/(x + a)
eax
ax
sin ax
cos ax
1/(cos ax)2
1/(1 + a2 x2 )
Primitiva
xn+1 /n
ln |x + a|
eax /a
ax / ln a
( cos ax)/a
(sin ax)/a
(tan ax)/a
(arctan ax)/a
Tabella 8.2: Alcune primitive
per sostituzione. Sia F (x) la primitiva della funzione continua f (x) e si consideri una funzione derivabile
g(x). Posto G(x) = F (g(x)), derivando con la regola
della catena si ha:
G (x) = F (u) u = g(x) g (x) = f (g(x))g (x),
e questo prova che G(x) è la primitiva di f (g(x))g (x).

Quindi:
Z
f (g(z))g (z)dz = G(t) = F (g(t)) =
=
In realtà, immaginare quale possa essere la primitiva della funzione da integrare è il modo pi`
u semplice
per calcolare gli integrali (definiti o indefiniti). Basandosi sui risultati ottenuti nella Sezione 8.6 sulla
derivazione, è bene tenere a mente le principali e pi`
u
semplici primitive, che riportiamo nella Tabella 8.2.
Usando tale tabella, il lettore calcolerà i seguenti integrali indefiniti, eseguendo poi la riprova mediante
opportuna derivazione:
Z
Z
1
1
dt =
et dt = et
ln
1t
1t
Z
(sin t 2 cos 2t)dt = cos t
1
sin 2t.
2
Anche se la tabella 8.2 costituisce la base dellintegrazione, non sempre un integrale è riconducibile
a forme cos` semplici. Esistono pertanto alcune tecniche generali che possono essere utilmente adottate
in molte occasioni. Lintegrazione indefinita è sempre stata considerata unarte, proprio perche è difficile dare metodi generali di risoluzione ed esistono,
come vedremo, funzioni di cui non si conosce la primitiva. Propriamente, la primitiva esiste, ma non è
esprimibile mediante le funzioni elementari: polinomi, logaritmi, esponenziali e funzioni trigonometriche
(almeno per noi). Tuttavia, si sono sempre ricercati
algoritmi generali di calcolo, con risultati anche notevoli. Allinizio degli anni 1970, il desiderio di far
eseguire gli integrali agli elaboratori elettronici accelerò le ricerche in questo settore e si sono messi a
punto algoritmi tali, per cui oggi un elaboratore è
mediamente pi`
u bravo di un matematico ad eseguire
lintegrazione. Infatti. gli algoritmi sono cos` complessi che la loro esecuzione manuale richiede troppa
attenzione e troppo allenamento.
Classicamente, vi sono quattro metodi che vengono insegnati (non sono certo gli unici!) e qui li
richiamiamo, anche se a un livello molto elementare.
1. Integrazione per sostituzione. Il metodo
pi`
u generale di integrazione è senzaltro quello detto
f (x)dx x = g(t) .
Come ricordiamo dal calcolo differenziale, g (t)dt

equivale al differenziale dg(t) della funzione g(t) e di
solito la formula precedente si scrive:
Z
Z
f (x)dx x = g(t) .
f (g(t))dg(t) =
Linterpretazione di questa formula si fa meglio seguendo un esempio significativo. Si voglia trovare

lintegrale indefinito della funzione y = 2x/(1 + x2 ),
funzione che assomiglia alla y = 1/(1 + x2 ), il cui integrale indefinito è arctan x. Come ora vedremo, il
risultato finale è però del tutto diverso.
Si comincia osservando che 2x è il differenziale della
funzione 1 + x2 , che si trova al denominatore; infatti,
d(1 + x2 )/dx = 2x e quindi d(1 + x2 ) = 2xdx. Si
trova allora:
Z
Z
Z
2xdx
dy
d(1 + x2 )
2
y =1+x .
=
=
1 + x2
1 + x2
y
R
Ma lintegrale indefinito dy/y si trova nella Tabella
8.2 (cioè, lo dobbiamo sapere a memoria) ed è semplicemente ln |y|. Sostituendo ora ad y il suo valore
1 + x2 , si ha il risultato definitivo:
Z
2xdx
= ln |1 + x2 | = ln(1 + x2 )
1 + x2
in quanto 1 + x2 è una quantità sempre positiva. Come detto, questo risultato ha poco a che vedere (almeno sembrerebbe) con arctan x, il che prova che funzioni leggermente differenti possono avere primitive del
tutto non correlate (in questo caso tale affermazione
non è vera in assoluto: nel campo complesso, arctan
e ln sono in effetti correlate tra di loro).
Vista limportanza del metodo, un altro esempio
può essere adeguato. Si voglia trovare una primitiva di y = 1/ cos x; il trucco, non del tutto banale,
consiste nello scrivere:
cos x
cos x
1
=
=
.
cos x
cos2 x
1 sin2 x
254
Ora si ricorda che cos x è la derivata di sin x, cioè

cos xdx = d sin x, per cui:
Z
Z
Z
du
dx
d sin x
=
=
u
=
sin
x
,
cos x
1 u2
1 sin2 x
e per calcolare questo nuovo integrale è opportuno
introdurre il secondo dei quattro metodi annunciati.
2. Espansione in frazioni parziali: se si deve
integrare una funzione razionale fratta, il cui denominatore è fattorizzabile in fattori lineari, si può utilizzare lespansione in frazioni parziali (vedere Sezione
5.4) per riportare il calcolo a frazioni pi`
u semplici. Si
ha infatti nellesempio:
Z
Z
Z
dt
1
dt
dt
=
=
+
1 t2
2
1+t
1t
Z
Z
d(1 + t)
d(1 t)
1
=
=
2
1+t
1t
s
1 + t
1
= (ln |1 + t| ln |1 t|) = ln
2
1 t
E pertanto lintegrale cercato si ottiene sostituendo a

t lespressione sin x:
r
Z
dx
1 + sin x
= ln
cos x
1 sin x
dove è sparito il valore assoluto (perche?).
Invitiamo il lettore a verificare il seguente risultato:
Z 5
x 4x3 x2 4x + 3
dx =
x3 3x 2
potr`
a essere tenuto a modello per casi analoghi. Si
voglia integrare la funzione f (x) = 1/(x2 x + 1), il
cui denominatore è irriducibile avendo = 3. Ci`
o
che vogliamo fare è quello di riportare il polinomio di
secondo grado x2 x + 1 alla forma t2 + 1, per un opportuno valore di t, considerato come funzione di x.
Questo è sempre possibile, con un metodo che è, in un
certo senso, linverso del completamento del quadrato,
la tecnica usata nella dimostrazione del Teorema 5.10.
Ci`
o che è fuori luogo in x2 x + 1 è il termine in x;
possiamo eliminarlo inglobandolo in un quadrato, qui
(x 1/2)2 = x2 x + 1/4. Per differenza si ricava:

!
2
2
1
3 4
1
3
2
x x+1= x
x
+ =
+1
2
4
4 3
2
e il gioco è fatto quando si ponga t2 = 4(x 1/2)2 /3.
Questa è la nostra sostituzione per applicare
proprio
quel metodo; poiche t = 2(x 1/2)/ 3, possiamo

scrivere:
Z
(2/ 3)dt
1
2
f (x)dx =
=
t
=
3(t2 + 1)/4
2
3
2
1
dt
2 3
t=
x
=
=
3
t2 + 1
2
3
1
2
2 3
x
arctan
=
3
2
3
che è il risultato cercato, anche se lespressione non
è molto bella. Comunque, ed è questo che importa,
lintegrale è espresso per mezzo di funzioni elementari
(e larcotangente è tale, anche se usata un po pi`
u
raramente di altre funzioni)
3. Integrazione di funzioni razionali in seno

e coseno: Per funzione razionale in seno e coseno
si intende ogni espressione trigonometrica esprimibix3
3
(x + 1)2
=
x+
+ ln
,
le come rapporto di due polinomi in sin x e cos x; ad
3
x+1
|x 2|
esempio: (sin2 x 3 cos x)/(1 + sin x). Come abbiadove può essere sfruttata lespansione in frazioni
mo visto dopo il Corollario 8.6, si pone t = tan(x/2)
parziali vista come esempio nella Sezione 5.4.
e lespressione diviene razionale in t. Inoltre, poie si ha x = 2 arctan t, differenziando si ottiene
Nota 8.4
La scomposizione del denominatore ch
pu`
o contenere anche fattori irriducibili di secondo gra- dx = 2dt/(1 + t2 ), e lespressione risulta globalmente
do. Un caso semplice è fornito dallaltro esempio della razionale in t, e quindi integrabile. Un semplice esemNota 5.8. Si ha infatti:
pio dovrebbe essere sufficiente; si voglia integrare
Z
Z
2
f (x) = 1/(1 + sin x); si ha allora:
(2x + x 5)dx
=
f (x)dx =
"Z
#
3
2
Z
x 2x + x 2
x
1
2dt
dx
Z
Z
Z
=
1
2xdx
dx
dx
2t 1 + t2 t = tan 2 =
1 + sin x
1 + 1+t
2
=
+
3
+
.
2
1 + x2
1 + x2
x2
Z
Di nuovo, il metodo di sostituzione ci d`

a il risultato:
dt
x
2
=
2
.
t
=
tan
=
Z
2
(1
+
t)
2
1
+
tan(x/2)
1
2
f (x)dx =
ln(1 + x ) + 3 arctan x + ln |x 2|
dove larcotangente risolve, almeno in questo caso, il

problema di avere un fattore irriducibile di secondo
grado a denominatore.
In realt`
a, larcotangente risolve tale problema in generale; ci accontentiamo di sviluppare un esempio, che
4. Integrazione per parti: Nel Teorema 8.30

abbiamo visto come si deriva il prodotto di due funzioni. Tenendo allora presente che lintegrale della
derivata di una funzione è la funzione stessa, si ha:
Z
Z
f (x)g(x) = f (x)g(x)dx + f (x)g (x)dx.
255

Può succedere che uno dei due integrali del membro destro sia facile da eseguire; se ciò accade per il
primo (ma la cosa è indifferente, essendo laddizione
commutativa), possiamo allora trovare laltro:
Z
Z
f (x)g (x)dx = f (x)g(x) f (x)g(x)dx.
Questa formula è nota come regola di integrazione
per parti e in diverse occasioni si rivela molto utile.
Poiche g (x)dx è il differenziale della funzione g(x),
nella regola g (x) si dice il fattore differenziale, mentre
f (x) è detto fattore finito. Lintegrazione per parti,
quindi, si può applicare quando sia nota la funzione
integrale del fattore differenziale, in quanto del fattore finito occorre solo eseguire la derivata. Naturalmente, occorre anche che si riesca ad eseguire lultimo
integrale, e questo di solito succede se f (x) è semplice o può essere semplificata con g(x). Al solito, un
esempio vale pi`
u di tante parole. Si voglia trovare la
primitiva di ln x; immaginiamo che sia: ln x = 1 ln x.
Poiche la derivata di ln x è una funzione semplice e
conosciamo lintegrale della funzione costante 1, scegliamo questa come fattore differenziale. In termini
pi`
u formali: f (x) = ln x e g (x) = 1, onde g(x) = x
ed f (x) = 1/x. La regola di integrazione per parti
dà allora:
Z
Z
x
ln xdx = x ln x
dx = x ln x x.
x
Un altro classico esempio è fornito dallintegrale di
x cos x. In queto caso, cos x non diviene una funzione
pi`
u semplice ne derivando, ne integrando. Viceversa,
la derivata di x è 1. Scegliamo pertanto cos x come
fattore differenziale e otteniamo:
Z
Z
x cos xdx = x sin x sin xdx = x sin x + cos x.
Il lettore si farà ora carico di sperimentare lintegrazione per parti e provare questi due importanti
risultati:
Z
1
arctan xdx = x arctan x ln(1 + x2 )
2
Z
1
sin2 xdx = (x sin x cos x)
2
che sono, a posteriori (cioè conoscendo il risultato) di

facile verifica per derivazione.
Purtroppo, nonostante i quattro metodi esposti e
altri che non possiamo discutere qui, non tutte le funzioni elementari hanno una primitiva che sia esprimibile ancora mediante funzioni elementari. Alcuni
esempi classici sono le funzioni:
2
y = ex , y =
ln x
sin x
, y=
, y = cos x2 .
x
1+x
y
1
x
3
Figura 8.19: Integrare la funzione y = 2x

Unaltra funzione famosa di cui non si conosce
la primitiva è 1/ ln(x), di modo che si dà come
definizione:
Z x
1
dt,
li(x) =
ln(t)
2
e la funzione li si dice logaritmo integrale. Questa

funzione è importante perche è la funzione che approssima meglio la densità dei numeri primi minori o
uguali ad x, cioè (x) li(x) asintoticamente (v. Sezione 2.4). Non è difficile intuire che li(x) x/ ln(x)
e ciò giustifica la formula data a suo tempo. In effetti,
i conteggi danno:
x = 100. 000
x = 1. 000. 000
(x) = 9592
(x) = 78498
li(x) = 9630
li(x) = 78628
e lapprossimazione è molto migliore di quella con

n/ ln(n).
Nota 8.5
Con questo abbiamo esaurito la nostra

veloce presentazione del concetto di integrale. Sono
pi`
u numerose le cose rimaste fuori di quelle cui abbiamo accennato, ma largomento verr`
a ripreso nei corsi
universitari di Analisi Matematica, e quindi qui ci possiamo accontentare se il lettore avr`
a capito il concetto
e sar`
a in grado di calcolare i pi`
u semplici integrali,
definiti o indefiniti che siano. In pratica, abbiamo
trattato solo gli aspetti pi`
u superficiali ed ingenui dellintegrazione, cioè lintegrazione di funzioni continue
in un intervallo in cui sono ovunque definite. E facile
per`
o osservare che se una funzione presenta un numero
finito di discontinuit`
a di prima specie (cioè, dei salti)
nulla o quasi cambia di ci`
o che abbiamo detto. Infatti, se la funzione y = f (x) definita nellintervallo [a, b]
ha un salto in c (a, b), basta scegliere le divisioni di
[a, b] in modo che c risulti sempre un punto di separazione; ci`
o equivale a vedere lintegrale fra a e b come
la somma degli integrali fra a e c, e fra c e b. Alternativamente, si osserva che larea intorno al punto c
varia in effetti con continuit`
a, cioè il salto della funzione scompare nella funzione integrale. Questo, anche
teoricamente, è un punto importante, poiche mostra
come la funzione integrale sia pi`
u regolare, cioè pi`
u
continua della funzione di partenza.
Un aspetto pi`
u complicato è fornito dalle discontinuit`
a
di tipo 2, oppure quando da intervalli finiti si passi ad
256
intervalli infiniti. Entrambi i casi possono dare origine

a situazioni trattabili, anche se la teoria va rivista e
ampliata, proprio per tener conto di questi integrali
impropri. E facile vedere che larea sottesa dalla curva, in questi casi, non necessariamante diviene infinita. Vediamo un facile esempio; si consideri la funzione
y = 2x , rappresentato
R dalla curva nella Figura 8.19;
lintegrale definito 0 2x dx è, per definizione, larea
sottesa dalla curva nellintervallo [0, +). Tale area
è minore di quella costituita dai rettangoli disegnati
nella stessa figura, che è:
A=1+
1
1
1
+ + + = 2
2
4
8
per ci`
o che sappiamo sulle progressioni e le somme infinite (vedere Sezione 3.3). Quindi, larea è finita, nonostante lintervallo sia infinito. Con finta ingenuit`
a,
possiamo ignorare la non finitezza dellintervallo e procedere come se fosse finito. Nella Tabella 8.2 troviamo
la primitiva di y = ax che adattiamo al caso a = 1/2:
Z
1
1
1
+ 0
=
=
2x dx = x
2
ln(1/2)
2
ln
2
2
ln 2
0
0
1
= log2 e = 1.442695041.
ln 2
Pu`
o sorprendere (o forse sorprende solo i matematici), ma questo procedimento, di chiamare cos`
candidamente in campo linfinito, è sostanzialmente
corretto e il risultato ottenuto è giusto. Tuttavia, la
teoria dellintegrazione che sta dietro tutto ci`
o va al
di l`
a dei nostri limiti e la lasciamo ai corsi universitari
di cui sè detto.
=
Indice analitico
angoli interni, 169
angoli supplementari, 168
angolo, 165
angolo acuto, 168
angolo al centro, 184
angolo alla circonferenza, 184
angolo concavo, 168
angolo convesso, 168
angolo diedro, 191
angolo giro, 168
angolo ottuso, 168
angolo piatto, 168
angolo retto, 168
angoloide, 195
anno civile, 96
anno commerciale, 96
antecedenti della proporzione, 92
antiperiodo, 76
antisimmetrica, 17
apertura del compasso, 165
apotema, 187
apotema del cono, 196
appartenere, 202
appartiene, 12
approssimazione per difetto, 79
approssimazione per eccesso, 79
Archimede (c. 287 212 a.C.), 197
arco, 113
arco circolare esplementare, 184
arco circolare esterno, 184
arco circolare interno, 184
arco orientato, 113
area, 177
Argand, J.R. (1768 1822), 153
argomento, 19
arietà, 19
Aristotele (384 322 a. C.), 22, 28
aritmetica modulare, 51
aritmetizzazione, 63
ascissa, 200
ascissa di un punto, 200
asintoto, 211, 247
aspetto strutturale, 117
asse del cono, 182
asse della parabola, 207
asse delle ascisse, 200
addendo, 41
addizione, 41
adicità, 19
affermazione singolare, 30
aggregazione, 11
al-Banna (1256 1321), 59
al-Fars, 59
Al-Haithan, I. (c. 965 - 1039), 212
al-Khuwarizmi (c. 780 850), 24, 133
al-Tusi N. E. (1201 - 1274), 212
alberi binari di ricerca, 112
albero, 114
albero con radice, 114
albero di ricoprimento, 114
albero minimo di ricoprimento, 114
albero orientato, 114
Alef, 22
alfabeto, 37
algebra astratta, 37, 159
algebra Booleana, 13, 61
algebra moderna, 37
algebra retorica, 133
algebra sincopata, 133
Algol60, 117
algorismo, 24
algoritmo del simplesso, 148
algoritmo di Euclide, 59
algoritmo ricorsivo, 43
Alhazen (v. al-Haithan), 212
altezza, 173
altezza del ciclindro, 196
altezza del cono, 196
altezza del prisma, 193
altezza della piramide, 194
amicabili, 59
analisi combinatoria, 99
anello, 160
anello Booleano, 161
angoli alterni, 169
angoli complementari, 168
angoli coniugati, 169
angoli corrispondenti, 169, 184
angoli corrispondenti esplementari, 184
angoli del triangolo, 170
angoli esplementari, 168
angoli esterni, 169
257
258
asse delle ordinate, 200
asse di simmetria, 207
asse di un segmento, 180
asse immaginario, 153
asse reale, 153
assi, 200
assi di riferimento, 200
assioma, 28, 30
assioma indipendente, 29
assorbimento, 20
auxologia, 129
Bolyai, F. ( ), 213
Bolyai, J. (1802 - 1860), 213
Babbage, C. (1792 1871), 13, 223
Backus Normal Form, 117
Backus, J. (1920 ), 117
baricentro, 181
base, 61, 173
base composta, 27
base dei logaritmi naturali, 237
base del prisma, 193
base della piramide, 194
base di dati, 15
Beltrami, E. (1835 1900), 170, 215
binomio, 134
bisettrice, 180
bisettrice di un angolo, 181
bit, 26
biunivoca, 18
Bolyai, J. (1802 1860), 170
Boole, G., 31
Boole, G. (1815 1864), 13
Bourbaki, Nicolas, 99
Briggs, H. (1561 - 1639), 90, 228
Byron, Ada (1815 1852), 13
calcolo combinatorio, 99
calcolo dei predicati, 35, 121
calcolo delle probabilità, 122
calcolo delle proposizioni, 31, 118
calcolo proposizionale, 31
cammino, 113
campo, 161
campo dei numeri complessi, 152
Cantor, G. (1845 1918), 13, 21, 78
capitale, 95
Cardano, G. (1501 1576), 155
cardinalità, 21
cardinalità del continuo, 23
cardinalità del numerabile, 22
cardinalità transfinita, 22
Carnot, L. (1753 1823), 227
Cartesio, 59
Cartesio (1596 1750), 199, 202
Catalan, E. (1814 1894), 116
INDICE ANALITICO
catena di rapporti, 92
Cauchy, A. L. (1789 1857), 217
Cavalieri, B. (1598 1647), 194
centesimi, 72
centro, 182
centro del fascio, 174
centro del poligono, 187
centro della sfera, 197
cerchio, 182
cerchio goniometrico, 218
certezza, 123
Chomski, N. (1928 ), 116, 117
Chuquet, N. (1445 1488), 133
ciclo, 104, 113
cicloide, 232
cifra, 25
cifra binaria, 26
cifre arabiche, 24, 25
cilindro, 196
cilindro indefinito, 196
cilindro retto, 196
circocentro, 181
circonferenza, 182
circonferenza circoscritta, 182
circonferenza inscritta, 182
circonferenze concentriche, 187
circumcentro, 181
classe di equivalenza, 16
classe di grandezze, 93
classi di resti, 51
codominio, 18
coefficiente, 134
coefficiente binomiale, 101
coefficiente binomiale centrale, 103
coerenza, 28
Cohen, Paul (1934 ), 23
combinatoria, 99
combinazioni, 100
commensurabile, 77, 166
commesso viaggiatore, 106
compasso di Galileo, 90
complementare, 168
complemento, 13
complemento a 10, 45
complemento a 9, 45
complessità NP, 35
completamento del quadrato, 141
completezza, 29
componendo, 92
componente connessa, 113
composizione, 18, 104, 159
composto, 53
concatenazione, 37
concetto primitivo, 28
condizione necessaria, 30
259
INDICE ANALITICO
condizione sufficiente, 30
condizioni iniziali, 107
confronto, 42
confronto fra grandezze, 93
confronto fra segmenti, 166
congettura, 30
congettura di Goldbach, 57
congiunzione, 31, 118
congruenza, 51
congruo, 50
conica, 182
connesso, 113
connettivi logici, 32, 118
cono, 182, 196
cono indefinito, 196
cono retto, 196
conseguenti della proporzione, 92
conseguenza logica, 29
contadini russi, 48, 55, 62
contare, 20
contenuto, 12
contesto, 117
contiene propriamente, 12
continuità, 86
continuo, 23
contraddizione, 32, 119
controesempio, 37
contropositiva, 33
convergenza, 230
coordinata, 200
coordinate, 200
coordinate ortogonali, 200
coppie equivalenti, 67
coprimi, 53
corda, 184
corollario, 30
corona circolare, 187
corpo, 161
corrispondenza, 15
corrispondenza biunivoca, 18
corrispondenza inversa, 18
cosecante, 221
coseno, 218
costante, 134
costruzione geometrica, 165
cotangente, 219
Cotes, R. (1682 1716), 227
criteri di similitudine, 175
criterio della scommessa, 82
criterio di allineamento, 206
criterio di divisibilità, 52
crivello di Eratostene, 55
cubo, 62, 194, 195
cubo perfetto, 62
curva, 202
de la Vallee Poussin, C. J. (1866 1962), 58

De Morgan, A. (1806 1871), 13, 36, 121
decile, 129
decimale finito, 73
decimale periodico, 73
decimi, 72
Dedekind, R. (1831 1916), 81, 86
definitivamente, 82
del Ferro, S. (1465 1526), 155
delta di Dirac, 232
denominatore, 69
densità dei primi, 58
densità, 72
derivata, 240
derivazione, 117
derivazione sinistra, 118
Desargues, 199
Descartes, 199
Descartes, R. (1596 1650), 133
determinante, 145
determinante del sistema, 145
deviazione standard, 126
diadica, 19
diagonale, 172
diagonalizzazione di Cantor, 78
diagramma di Hasse, 17, 113
diagramma di Venn, 12
diametro, 182
diedro, 191
Dieudonne, J. (1906 1992), 99
differenza, 12, 44
differenza simmetrica, 12
differenziale, 240
dimostrare, 29
dimostrazione per assurdo, 33
Diofanto (III sec. d. C.), 147
Dirac, P. (1902 1984, 232
direttrice della parabola, 183
direzione del fascio, 174
discontinuità di 1a specie, 233
discontinuità fittizia, 233
discriminante, 141
disequazione, 148
disgiunti, 12
disgiunzione, 32, 118
dispari, 52
dispersione, 126
disposizioni, 100
distanza, 186, 202, 213
distanza di sue rette parallele, 175
distanza di un punto da una retta, 170
distanza tra due rette, 192
distanza verticale, 211
260
distribuzione, 123, 127
distribuzione di Poisson, 129
distribuzione normale, 128
distribuzione pseudocasuale, 127
distribuzione uniforme continua, 127
disuguaglianza triangolare, 202
divergere, 230
diverso, 42
dividendo, 49
divisibile, 49
divisibilità, 49
divisione, 49
divisione decimale, 72
divisione esatta, 49, 137
divisione intera, 49, 72
divisioni successive, 26
divisore, 49
divisore dello zero, 161
dodecaedro, 195
dominio, 18
dominio di integrità, 161
doppia implicazione, 30, 32
Dostoevskij, F. (1821 1881), 124
Einstein, A. (1879 1955), 215
elemento, 11
elevamento a potenza, 61
ellisse, 182
ellissi, 11
emivita, 234
Enrico IV di Francia (1553 1610), 122
equazione, 137
equazione reciproca, 155
equazione algebrica, 138
equazione biquadratica, 155
equazione completa, 206
equazione impossibile, 140
equazione indeterminata, 140
equazione irrazionale, 142
equazione parametrica, 150
equazione reciproca, 155
equazione ridotta, 156
equazione trigonometrica, 225
equazione trinomia, 155
equazioni equivalenti, 138
equipotenza, 21
equiprobabile, 126
equiscomponibilità, 194
equivalenza, 118
equivalenza tra solidi, 194
Eratostene (276 194 a. C.), 55
Erone (II - I sec. a.C.), 228
errore assoluto, 95
errore relativo, 95
esaedro, 195
esagono, 171
INDICE ANALITICO
esclusione, 32
esplementare, 168
esponente, 61, 81
espressione aritmetica, 90
espressione parentesizzata, 116
estensione, 12, 14, 66, 84, 176
estensione algebrica, 152
estremi della proporzione, 92
estremi della somma, 64
estremi di integrazione, 251
estremi di un segmento, 165
estremo inferiore, 230
estremo superiore, 229
Euclide, 59
Euclide (325 265 a. C.), 29, 39, 211, 213
Euler, L. (1707 1783), 57, 111, 128, 217
eventi favorevoli, 122
eventi indipendenti, 123
eventi possibili, 122
faccia, 114
faccia laterale, 193, 194
falsicabilità, 37
fascio di rette, 174
fattore, 46, 49, 137
fattore differenziale, 255
fattore finito, 255
fattoriale, 63
Fermat, 199
Fermat P. de, 59
Fermat, P. de (1601 1665), 199
Ferrari, L. (1522 1565), 155
Fibonacci, L. (1170 1250), 24, 25, 60, 73, 88
figlio, 112
figura limitata, 182
figure cosmiche, 196
figure equiscomponibili, 177
figure equivalenti, 177
flesso, 241
fluttuazione statistica, 125
forma canonica, 31, 138, 148
forma canonica congiuntiva, 121
forma canonica di una retta, 203
forma canonica disgiuntiva, 121
forma normale, 31, 144
forme enunciative, 35
forme indeterminate dei limiti, 232
forme proposizionali, 35
formula analitica, 18
formula asintotica, 58
formula di Cramer, 145
formula di triplicazione, 222
formula ridotta, 141
formule dellangolo complementare, 219
formule dellangolo supplementare, 220
formule di bisezione, 222
261
INDICE ANALITICO
formule di duplicazione, 222
formule di prostaferesi, 224
formule di Simpson, 224
formule di somma e sottrazione, 222
formule di Werner, 224
Fourier, J. B. (1768 1830), 49
Fraenkel, A. (1891 1965), 14
frazione, 68, 69
frazione apparente, 70
frazione impropria, 70
frazione propria, 70
frazione unitaria, 68
frazioni equivalenti, 69
frazioni parziali, 136
Frege, G. (1848 1925), 13
frequenza, 123
frequenze attese, 130
funzione, 17
funzione biunivoca, 18
funzione caratteristica, 19, 100
funzione continua in un intervallo, 232
funzione continua in un punto, 232
funzione derivabile, 240
funzione derivata, 240
funzione esponenziale, 237
funzione identica, 18
funzione iniettiva, 18
funzione integrale, 251
funzione invertibile, 18
funzione moltiplicativa, 54
funzione primitiva, 252
funzione razionale in seno e coseno, 254
funzione surgettiva, 18
funzioni elementari, 253
funzioni periodiche, 219
funzioni razionali fratte, 136, 162
fuoco dellellisse, 182
fuoco delliperbole, 183
fuoco della parabola, 183
K. (1906 1978), 29
Gdel,
Galilei, G. (1564 1642), 22, 24, 200, 214
Galileo, 90
Galois, E. (1811 1832), 155
Gauss, 74
Gauss, F. (1777 - 1855), 213
Gauss, F. (1777 1855), 58, 128
genera, 118
genera immediatamente, 117
generatrice, 196
generatrice del cono, 182
genitore, 112
geometria ellittica, 214
geometria iperbolica, 213
geometria parabolica, 213
gettone, 108
Gherardo da Cremona (1114 1187), 24

gioco equo, 124
Goldbach, C. (1690 1764), 57
GPS, 225
gradi decimali, 219
gradi di libertà, 130
grado, 113, 138, 148, 167
grado duscita, 113
grado di ingresso, 113
grado di un monomio, 134
grado di un polinomio, 134
grado di un sistema, 144
grafico, 157
grafico di una funzione, 244
grafo, 113
grafo bipartito, 113
grafo connesso, 113
grafo orientato, 113
grafo pesato, 113
grafo planare, 114
grammatica context-free, 117
grammatica di tipo 0, 116
grammatica di tipo 2, 116
grammatica formale, 116
grammatica libera dal contesto, 117
grammatica non ambigua, 118
grandezza, 93
grandezza analogica, 93
grandezza continua, 93
grandezza digitale, 93
grandezza discreta, 93
grandezza fisica, 93
grandezza matematica, 93
grandezze direttamente proporzionali, 93
grandezze inversamente proporzionali, 93
grandezze proporzionali, 93
gruppo, 38
gruppo abeliano, 159
gruppo ciclico, 160
gruppo commutativo, 159
Hadamard, J. (1865 1963), 58
Hasse, 113
Hasse, H. (1898 1979), 17
Hausdorf, 199
Hilbert, D. (1862 1943), 164, 214
icosaedro, 195
identità, 20, 35, 104, 138
identità destra, 20
identità trigonometrica fondamentale, 219
immagine, 18
immagine inversa, 18
implicazione, 30, 32
impossibilità, 123
incentro, 181
262
incognita, 133
incommensurabile, 77
indeterminata, 133
indice, 64
indipendenza, 29
indistinguibile, 108
induzione matematica, 34
inferiormente limitato, 229
infinito, 230
insieme, 11
insieme delle parti, 13
insieme di arrivo, 18
insieme di partenza, 18
insieme discreto, 72
insieme finito, 18
insieme infinito, 22
insieme limitato, 229
insieme quoziente, 16
insieme universale di connettivi, 121
insieme universo, 13, 122
insieme vuoto, 12
insiemi equipotenti, 21
insiemi finiti, 99
insiemi uguali, 12
integrale definito, 251
integrale improprio, 256
integrale indefinito, 252
integrazione per parti, 255
integrazione per sostituzione, 253
intensione, 12, 14
intercetta, 31, 204
interesse, 95
interesse composto, 96
interesse semplice, 95
intero negativo, 65
intero positivo, 65
interpolazione lineare, 224
intersezione, 12
intervalli di separazione, 157
intervallo, 86
intervallo aperto, 86
intervallo chiuso, 86
intorno, 199
inversa composizionale, 18
inverso, 38
invertendo, 92
invertibile, 18
involuzione, 106
iperbole, 183
iperbole equilatera, 210
ipotesi, 30
Ippaso di Metaponto, 77
isomorfismo, 66
isomorfo, 81, 154
istogramma, 123
INDICE ANALITICO
Kepler, J. (1571 1630), 210
Keplero, J. (1571 1630), 197
Khayyam O. (c. 1050 1122, 212
kilogrammo, 93
Klein, F. (1849 - 1925), 213
LHopital, G.-F.-A. de (1661 1704), 245
laccio, 113
Lagrange, G. L. di (1736 1813), 246
Lagrange, J. L. (1736 1813), 160
lati del triangolo, 170
lato obliquo, 173
Le Corbusier (1887 1965), 180
Lebesgue, H. L. (1875 1941), 250
Lebesgue, H.-L. (1875 1941), 217
legge dei grandi numeri, 129
legge dell80/20, 130
legge di Pareto-Zipf, 130
Leibniz, 90
Leibniz, G. (1646 - 1716), 217
lemma, 30
lessicografico, 17
lettera, 37
limite, 199, 230
limite destro, 233
limite inferiore, 229
limite notevole, 233
limite sinistro, 233
limite superiore, 229
linearizzazione, 115
linguaggio formale, 116
linguaggio generato, 118
Lobacevsky, N. (1792 1856), 170
Lobacevskij, N. (1793 - 1856), 213
logaritmi per difetto, 63
logaritmi per eccesso, 63
logaritmo, 62, 86, 89
logaritmo integrale, 255
logaritmo naturale, 90, 237
Logica, 31
logica delle proposizioni, 31
logistica, 24
Lucrezio (c. 98 c. 55 a.C.), 229
lunghezza, 167
luogo di punti, 180
luogo geometrico, 180
macchina analitica, 13
maggiore, 42
maggiore o uguale, 42
mantissa, 81, 236
massimo, 61, 229
massimo assoluto, 239
massimo comun divisore, 59, 140
massimo comune multiplo, 140
massimo relativo, 239
263
INDICE ANALITICO
matematica finanziaria, 95
matrice, 145
matrice del sistema, 145
medi della proporzione, 92
media, 125
media aritmetica, 126
media aritmetico/geometrica, 191
media armonica, 126
media geometrica, 126
mediana, 126, 173
medio proporzionale, 93
membro destro, 91, 137
membro sinistro, 91, 137
metodo congruenziale, 127
metodo del chi quadro, 130
metodo delle sezioni, 81
metodo di Newton, 88
metodo egizio, 168
metrica, 213
metro, 167
millesimi, 72
minimo, 61, 229
minimo assoluto, 239
minimo comune multiplo, 60
minimo relativo, 239
minore, 42
minore o uguale, 42
minuendo, 44
minuto, 27
minuto primo, 27
minuto secondo, 27
misura, 11, 93, 166, 200
misura in radianti, 218
moda, 126
modello, 28, 30
modello combinatorio, 108
modello delle urne, 108
modello relazionale, 15
modulo, 49
modulor, 180
modus ponens, 32
modus tollens, 32
molteplicità, 56
moltiplicando, 46
moltiplicatore, 46
moltiplicazione, 45
monadica, 19
Monge, 199
monoide, 37, 159
monomi simili, 134
monomio, 134
montante, 97
multiplo, 49, 137
multiplo di un segmento, 166
n-upla, 15, 103
nand, 121
Napier, J. (1560 1617), 90, 227
Nasir Eddin (v. Al-Tusi N. E.), 212
negazione, 31, 118
Nepero, v. Napier, J., 90
Newton I. (1643 1727), 223
Newton, I. (1642 1727), 217
Newton, I. (1643 1727), 25
nodo, 113
nor, 120
notazione a cicli, 104
notazione a stecchini, 25
notazione ad aste, 25
notazione arabica, 25
notazione funzionale, 19, 20, 104
notazione infissa, 20
notazione posizionale, 25
notazione postfissa, 20
notazione prefissa, 20
notazione vettoriale, 103
numerabile, 22
numeratore, 69
numerazione primitiva, 25
numerazione romana, 24
numeri amicabili, 59
numeri armonici, 82
numeri coniugati, 154
numeri di Catalan, 116
numeri di Fibonacci, 60
numeri discordi, 65
numeri figurati, 109
numeri immaginari, 153
numeri negativi, 65
numeri pentagonali, 110
numeri poligonali, 109
numeri primi tra loro, 53
numeri quadrati, 109
numeri reali computabili, 79
numero, 11, 20
numero algebrico, 78
numero cardinale, 14, 21
numero composto, 53
numero di Eulero, 237
numero frazionario, 68
numero intero, 65, 67
numero irrazionale, 78
numero naturale, 21
numero normalizzato, 81
numero ordinale, 14
numero perfetto, 58
numero primo, 53
numero pseudoreale, 79
numero razionale, 72
numero reale, 84
numero trascendente, 79
264
numero triangolare, 109
oggetti combinatori, 108
Omar Khayyam (v. Khayyam O.), 212
operazione, 19
operazione associativa, 20
operazione binaria, 19
operazione chiusa, 20
operazione commutativa, 20
operazione diadica, 19
operazione idempotente, 20
operazione monadica, 19
operazione ternaria, 19
operazione triadica, 19
opposti al vertice, 168
opposto, 66, 159
ordinamento, 16
ordinamento lessicografico, 17
ordinamento parziale, 17
ordinamento totale, 17
ordinata di un punto, 200
ordine stretto, 16
orientamento della retta, 200
origine, 165, 200
origine delle coordinate, 200
ortocentro, 181
osservazione, 30
ottaedro, 195
pallina, 108
parabola, 183
paradosso di Russell, 13
parallela, 192
parallelogramma, 172
parametro, 133, 150
parentesi graffe, 91
parentesi quadre, 91
parentesi tonde, 91
Pareto, V. (1848 1923), 129
pari, 52
parola, 37
parola vuota, 37
parte letterale, 134
parte numerica, 134
partizione, 16
partizioni di un intero, 128
Pascal, 90
pavimento, 63
Peano G., 21
Peano G. (1858 1932), 63
Peano, G. (1858 1932), 217
Peirce, C. (1839 1914), 121
pendenza, 31, 204
pentagono, 171
percentile, 129
percentuale, 94
INDICE ANALITICO
periodo, 160
permanenza, 142
permutando, 92
permutazione dispari, 106
permutazione pari, 106
permutazioni, 100
peso, 113
peso di un cammino, 113
piani paralleli, 191
piani perpendicolari, 193
piano cartesiano, 15
piano dArgand, 153
piede, 192, 193
piede della perpendicolare, 170
piramide, 194
piramide indefinita, 194
piramide regolare, 194
piramide retta, 194
Pitagora, 68, 69, 77
Pitagorici, 58
pitagorici, 39
Platone (427 347 a. C.), 39, 211, 214
Poisson, S. D. (1781 1840), 129
poliedro, 195
poliedro archiemdeo, 196
poliedro regolare, 195
poligonale, 170
poligoni simili, 175
poligono, 170
poligono concavo, 171
poligono convesso, 170
poligono intrecciato, 171
poligono regolare, 171
polinomio, 134
polinomio irriducibile, 139
polinomio primo, 140
Popper, Karl (1902 1994), 37
postulato, 28
potenza, 21
potenza di un binomio, 134
potenza di un punto, 186
potenza perfetta, 62
precedere, 17
precisione, 79
predicato, 18, 31
prestito, 44
primi gemelli, 58
primitiva, 252
primo, 53, 167
principio del massimo e del minimo, 239
principio del terzo escluso, 32
principio di inclusione ed esclusione, 54
principio di induzione, 34
principio di non contraddizione, 32
prisma, 193
265
INDICE ANALITICO
prisma indefinito, 193
prisma retto, 193
probabilità, 122
probabilità a-posteriori, 125
probabilità a-priori, 125
probabilità statistica, 125
problema del trasporto, 148
problema dellordinamento, 106, 112
problema della ricerca, 111
problema delle parallele, 212
problema indecidibile, 147
problema intrattabile, 106
problema NP, 106
problema NP completo, 35
prodotto, 37, 46, 104
prodotto cartesiano, 15
prodotto notevole, 135
prodotto scalare, 93
produzione, 116, 117
programmazione lineare, 148
progressione, 73
progressione aritmetica, 73
progressione geometrica, 74
proporzione, 92
proposizione, 30, 31
proprietà controsimmetrica, 17
proprietà di aggiunzione, 43, 46
proprietà di antimonotonia, 44
proprietà di assorbimento, 20
proprietà di eliminazione, 41, 43, 46
proprietà di monotonia, 43, 46
proprietà dissociativa, 41, 46
proprietà distributiva, 13, 20, 46
proprietà riflessiva, 15
proprietà simmetrica, 16
proprietà transitiva, 16
proprità antiriflessiva, 16
prostaferesi, 224
prova del nove, 52
punti allineati, 165
punto allinfinito, 199
punto decimale, 79
punto di discontinuità, 232
punto fisso, 104
quadrante, 201
quadrato, 62, 172
quadrato perfetto, 62
quadratura del cerchio, 186
quadrica, 199
quadrilatero, 171
quadrilatero di Saccheri, 212
quantificatore esistenziale, 36
quantificatore universale, 35
quartile, 129
quarto proporzionale, 93
quoziente, 49
radiante, 167, 218
radicale doppio, 89
radice, 35, 86
radice cubica, 62
radice di un albero, 112, 114
radice di un polinomio, 138
radice perfetta, 62
radice quadrata, 62, 87
radici per difetto, 63
radici per eccesso, 63
raggio, 182
raggio del ciclindro, 196
raggio della sfera, 197
ragione, 73, 74
Ramanujan, S. A. (1887 1920), 89
ramo, 114
rango, 18, 126
rapporto, 93
rapporto armonico, 179
rapporto aureo, 179
rapporto incrementale, 240
rapporto tra segmenti, 166
rappresentazione decimale, 25
razionalizzazione, 88, 136
Recorde, R. (1510 1558), 133
regola dei segni, 66
regola del prodotto, 138
regola della catena, 241
regola della somma, 138
regola delle diagonali, 146
regola di inferenza, 30
regola di Ruffini, 139
regola di Sarrus, 146
regolo calcolatore, 90
relazione, 15
relazione binaria, 14
relazione dordine, 17
relazione dordine parziale, 17
relazione di equivalenza, 15
relazione di Eulero, 115
resto, 49
rettangolo, 172
rette parallele, 169
rette perpendicolari, 168
rette sghembe, 192
ricerca binaria, 111
ricoprire, 16
ricorsione, 63
riduzione ai minimi termini, 70
riduzione modulo, 50
Riemann, G. F. B. (1826 - 1866), 213
Riemann, G. F. B. (1826 1866), 170
riporto, 40, 47
risoluzione dei triangoli, 225
266
risolvente, 157
Rivest, 54
Rolle, M. (1652 1719), 246
rombo, 172
rovescione, 52
Russell, B., 32
Russell, B. (1872 1970), 13
Saccheri, G. (1667 - 1733), 212
salto, 233
Sarrus, P.-F. (1798 1861), 146
scala, 201
scala esponenziale, 201
scala logaritmica, 201
scala naturale, 68
scala pitagorica, 68
scala quadratica, 201
scala temperata, 68
scalatura, 48
scodella, 197
scomponendo, 92
scomposizione in fattori primi, 56
scomposizione in frazioni parziali, 146
sconto, 95
secante, 221
secondo, 27, 167
segmenti incommensurabili, 166
segmenti uguali, 165
segmento, 165
segni opposti, 65
semiperimetro, 226, 228
semipiano, 165
semiretta, 165
semispazio, 191
seno, 218
senso antiorario, 206
senso geometrico, 164
senso orario, 206
senso spaziale, 164
separazione, 11
sequenza, 81
sequenza di Fibonacci, 60
sequenza per rango, 126
sequenza vuota, 100
serie di potenze, 238
settore circolare, 184
sezione, 81, 85
sezione aurea, 179
sezione normale del diedro, 193
sfera, 197
simbolo, 37
simbolo di appartenenza, 12
simbolo di somma, 64
simbolo iniziale, 117
simbolo non terminale, 117
simbolo terminale, 117
INDICE ANALITICO
similitudine, 175
simulare, 38
simulazione, 124
sistema di coordinate cartesiane, 200
sistema di disequazioni, 148
sistema di equazioni, 144
sistema impossibile, 145
sistema indeterminato, 145
sistema lineare, 144
sistemi diofantei, 147
soddisfacibilità, 35
soffitto, 63
solido platonico, 195
soluzione, 35, 137, 148
soluzione del sistema, 144
soluzione estranea, 143
somma, 41, 65, 93
somma di due angoli, 166
somma di grandezze, 93
somma di segmenti, 165
somma e sottrazione, 144
soprainsieme, 12
sostegno, 159
sostituzione, 144
sottoalbero, 112
sottografo, 113
sottogruppo, 159
sottogruppo ciclico, 160
sottoinsieme, 12
sottoinsieme proprio, 12
sottomultiplo di un segmento, 166
sottraendo, 44
sottrazione, 44
spazio di Hausdorf, 199
spazio Euclideo, 199
spazio metrico, 199, 202
spigolo, 113, 191
spirale armonica, 179
statistica, 122
stenaritmia, 53, 87
Stevin, 65
Stirling, J. (1692 1770), 103
stringa, 37
struttura algebrica, 37, 159
struttura dati, 111
successione, 81
successione di Cauchy, 82, 230
successione di Fibonacci, 73
successione monotona, 230
successione numerica, 73
successioni equivalenti, 83
superficie laterale, 194
superficie totale, 194
superiormente limitato, 229
supplementare, 168
267
INDICE ANALITICO
sviluppo piano, 195
tabella della somma, 40
tabella di verità, 31, 118
tale che, 12
tangente, 182, 218
Tartaglia, N. (1499 1557), 155
tasso di interesse, 95
tautologia, 119
tavola Pitagorica, 48
teorema, 30
teorema dei seni, 226
teorema del coseno, 227
teorema delle proiezioni, 227
teorema delle tangenti, 227
teorema di Briggs, 228
teorema di Cantor, 23
teorema di Carnot, 227
teorema di Coates, 227
teorema di Erone, 228
teorema di Euclide, 57
teorema di Lagrange, 160
teorema di Nepero, 227
teorema fondamentale del calcolo integrale, 252
teorema fondamentale dellAlgebra, 153
teoria, 28
teoria completa, 29
teoria della computabilità, 116
Teoria della misura, 124
teoria della relatività, 215
termine, 41
termini della proporzione, 92
terna Pitagorica, 178
terna Pitagorica primitiva, 178
tertium non datur, 32
terzo proporzionale, 93
tesi, 30
test, 127
test del chi quadro, 125, 130
tetraedro, 195
totale, 41
toziente, 53
transfinito, 22
trapezio, 172
trasformata veloce di Fourier, 49
trasformazioni lineari, 155
traslare, 165
trasposizione, 105
trattrice, 215
triadica, 19
triangolazione, 225
triangolo, 170
triangolo aritmetico, 101
triangolo armonico, 179
triangolo di Pascal, 101
triangolo di Tartaglia, 101
triangolo
triangolo
triangolo
triangolo
equilatero, 173
isoscele, 173
scaleno, 173
sferico, 215
uguaglianza, 15, 91, 165

uguale, 42
unione, 12
unione disgiunta, 12
unità, 161
unità di misura, 93, 166, 200
unità di misura di superficie, 167, 176
unità di misura di volume, 167
unità immaginaria, 152
urna, 108
valor medio, 125
valore assoluto, 65
valore atteso, 125
valore attuale, 97
valore del decile, 129
valore mediano, 126
valore per difetto, 82
valore per eccesso, 82
valori discordi, 65
variabile, 35, 133
variabile di somma, 64
variabile dipendente, 17
variabile indipendente, 17
variabile legata, 251
varianza, 126
variazione, 142
Venn, J. (1834 1923), 12
verità esistenziale, 36
verità esistenziale forte, 36
verso di una retta, 200
vertice, 113
vertice del cono, 182, 196
vertice dellangolo, 165
vertice delliperbole, 210
vertice della parabola, 207
vertici del triangolo, 170
vettore, 64, 103
Viète, F. (1540 1603), 133, 159
Villani, G. (c. 1275 1348), 25
vincoli, 148
volume, 194
Whitehead, A. N. (1861 1947), 14
Zenone di Elea (490 430 a.C.), 229
Zermelo, E. (1871 1956), 14
zero, 20, 25
zero di un polinomio, 138
Zipf, (), 130

Mate Matic A

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Mate Matic A

Uploaded by

Copyright:

Available Formats

Introduzione alla Matematica

La Matematica della Scuola Media

1 Il linguaggio della Matematica

1. La conoscenza della Matematica `e diventata

2. La Matematica non `e solo una serie di nozioni

Lidea di una Matematica statica, del pensare che

parte, gli antichi avevano gi`a chiara questa differenza

4. C`e, credo, una differenza fondamentale tra lo

unidea personale precisa, cio`e a capire che cosa sia lo

ovvio o banale o chiaro `e una conseguenza diretta di

5. I testi e gli articoli di Matematica sembrano

la Matematica `e conseguenza di una serie ristretta di

tematici sono ben pi`

Il linguaggio della Matematica

Per intenderci, ogni volta che saremo di fronte a

Naturalmente, le convenzioni notazionali appena

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

da sinistra verso destra.

1.1. GLI INSIEMI

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

nito per intensione che contiene se stesso, proprio per

Gli insiemi, anche con la distinzione tra il tutto e i

lequivalenza tra figure. E se passiamo al mondo che

Aver insistito sulle relazioni binarie, `e

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

Sia definita su A una relazione che goda delle propriet`

Avere una relazione di equivalenza R su un insieme

una classe di equivalenza, la sua, per la propriet`a

1.3. FUNZIONI E OPERAZIONI

Un esempio significativo `e dato dalla relazione tra

Figura 1.2: Diagramma di Hasse

(minore) delliniziale della seconda, la prima parola

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

se propriamente si dovrebbe scrivere (x, y) F . La

su questo ritorneremo pi`

Una funzione che faccia corrispondere ad elementi

1.3. FUNZIONI E OPERAZIONI

identifica univocamente il sottoinsieme A: il sottoinsieme definisce il predicato e dal predicato si ricava

La notazione delle operazioni si `e sviluppata dal

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

estetiche piuttosto che razionali. Per le operazioni

cercare segni e disposizioni pi`

dono di questa propriet`a nei confronti dellaltra

Il resto della sezione `e costituito da

i 4 cavalieri dellApocalisse o i 4 angoli dellUniverso

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

Questa definizione `e, quindi, ragionevole e osserviamo

Figura 1.3: Scorrimento di una matrice infinita

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

Rappresentazione dei numeri naturali

Il concetto di contare, come s`e visto, si esprime nel

la stessa ragione si conoscono numerazioni in base 5

Come abbiamo accennato, la notazione

1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI

La notazione arabica `e una notazione posizionale

Come abbiamo accennato, i Babilonesi

Ecco allora che presentiamo il nostro primo

CAPITOLO 1. IL LINGUAGGIO DELLA MATEMATICA

La sequenza dei resti, letta da destra verso sinistra,

per cui la prima cifra da porre in L `e 4. Lestrazione

Teorema 1.2 Se dr dr1 . . . d1 d0 `e la rappresentazione decimale di un numero naturale n, allora tale

Anche la conversione inversa pu`

In questo caso si ha 128 + 32 + 16 + 2 = 178, come si

1.5. RAPPRESENTAZIONE DEI NUMERI NATURALI