Professional Documents
Culture Documents
Cose la Statistica?
La
statistica
Due statistiche
Lintera collettivit oggetto di studio si chiama
popolazione o universo. La statistica che descrive
landamento di fenomeni riguardanti tutto linsieme
definita statistica descrittiva.
Se invece si prende in considerazione una parte
(detta campione) della popolazione e da essa si
intuiscono gli altri valori, si parla di statistica
inferenziale.
Indagine statistica
Si chiama indagine statistica lanalisi di fenomeni
collettivi eseguita secondo criteri statistici. Se eseguita
sullintera popolazione si parla in genere di
censimento; se prende in esame solo una parte (detta
campione), si definisce rilevazione campionaria.
La propriet che si vuole misurare o enumerare detta
carattere. Esso :
quantitativo (variabile statistica), se le varianti con
cui si presenta sono numeri o misure (detti valori)
qualitativo (mutabile), se le varianti con cui si
presenta sono qualit (dette modalit)
Frequenze
Ogni studio statistico ha a che fare con un numero pi
o meno ampio di dati: la loro classificazione
fondamentale per rendere pi agevole e preciso il
lavoro di elaborazione e interpretazione. Lutilizzo di
indici numerici per indicare la frequenza con cui una
modalit (caratt. qualitativo) ritorna nellindagine ha
proprio questa specifica funzione.
La frequenza assoluta indica il numero di volte in cui
una modalit ricorre.
La frequenza relativa il rapporto fra la frequenza
assoluta e il numero totale di rilevazioni (spesso
indicata in percentuale).
Freq. relativa
Apple
4,76%
LG
4,76%
Nokia
13
61,90%
Samsung
28,57%
TOTALE
21
100,00%
Classi
Nella classificazione invece di caratteri quantitativi, pu
essere necessario raggruppare le frequenze in classi (o
intervalli) fra due valori, detti limiti (inferiore e
superiore), in modo da semplificare la lettura delle
tabelle e lelaborazione, ammettendo una piccola
perdita in precisione.
Lavorando con dati raggruppati per classi possibile
anche utilizzare la frequenza cumulata (relativa o
assoluta), che equivale alla somma della frequenza della
classe stessa con tutte quelle che precedono.
Freq. assoluta
Freq. relativa
Freq. cumul.
assoluta
Freq. cumul.
relativa
0-100
0%
0%
101-200
22%
22%
201-300
11%
33%
301-400
33%
12
67%
401-500
17%
15
83%
501-600
11%
17
94%
601-700
6%
18
100%
TOTALE
18*
100%
4
3
2
1
0
Istogramma in pila
Finalita dellutilizzo del computer nella II B
Tempo in minuti
250
200
150
Altro
Facebook
100
50
0
Studenti II B
Istogramma in pila in %
Finalita dellutilizzo del PC nella II B
Tempo in minuti
100%
80%
Altro
Facebook
60%
40%
20%
0%
Studenti II B
1; 4%
1; 5%
6; 27%
Apple
LG
Nokia
Samsung
Sony-Ericsson
13; 59%
200.000
Opere pubblicate
150.000
Tiratura complessiva
(in migliaia di copie)
100.000
50.000
[Dati Istat]
1985
1990
1995
2000 2005
Ideogramma
Generi di TV frequentati nella II B
Rai
Alice TV
Mediaset
11
13
DTV
8
Premium
Satellite
14
SKY
12
Diagrammma a radar
IV
30
20
III
10
Materie
Ore
Ore2
II
Cartogramma a colori
Luoghi di produzione delle scarpe della II B
Cina
Vietnam
Indonesia
Italia
Cartogramma deformante
Distribuzione della popolazione mondiale
[WorldMapper]
Moda
Mediana
Media
Moda
In statistica, la moda o norma della
distribuzione di frequenza X la modalit
(o la classe di modalit) caratterizzata
dalla massima frequenza e viene spesso
rappresentata con la simbologia 0. In
altre parole, il valore che compare pi
frequentemente.
Nel caso ci siano pi valori pari si parla
di distribuzione bimodale, trimodale ecc.
Mediana
La mediana il valore centrale mettendo
una serie di valori in ordine crescente, in
caso di valori uguali al centro si calcola
come media matematica dei due valori
centrali.
Ha il pregio di non essere particolarmente
influenzata da numeri particolarmente
diversi dagli altri, che sono per esclusi e
influenzano invece la media aritmetica.
Media aritmetica
Dati 5 numeri: 2, 5, 6, 7, 9, la loro
media data da:
Media geometrica
La media geometrica, basandosi su prodotti e
non su somme, risente di meno della presenza
di termini "estremi", ovvero lontani dal gruppo.
Ad esempio data la distribuzione: 10, 9, 11, 14,
97 la media aritmetica (28,2) risente della
presenza di quel 97 cos alto, mentre la
geometrica (16,8) da un risultato pi vicino a
quella che potrebbe essere la moda. Diciamo
che la media geometrica fa s che eventuali
picchi anomali nella distribuzione non ne
condizionino l'analisi.
Media geometrica
Essa ha un chiaro significato geometrico: ad esempio la
media geometrica di due numeri la lunghezza del lato di
un quadrato equivalente ad un rettangolo che abbia i lati
di modulo pari ai due numeri. Lo stesso vale in un
numero di dimensioni superiore.
La media geometrica trova impiego soprattutto dove i
valori considerati vengono per loro natura moltiplicati tra
di loro e non sommati. Esempio tipico sono i tassi di
crescita, come i tassi d'interesse o i tassi d'inflazione.
Una caratteristica che valori piccoli (rispetto alla media
aritmetica) sono molto pi influenti dei valori grandi. In
particolare, sufficiente la presenza di un unico valore
nullo per annullare la media.
La media geometrica
Media quadratica
La media quadratica quella che viene
maggiormente influenzata dai valori
molto piccoli e molto grandi della
distribuzione e quindi viene usata per
evidenziare i valori che si discostano
molto dai valori centrali.
Essa altres usata per quei casi in cui i
valori sono elevati al quadrato.
Media quadratica
Media armonica
Giorno
Tempo
impiegato
Velocit
media
Luned
30
28
Marted
20
42
Mercoled
24
35
Gioved
21
40
Venerd
35
24
Campo di variazione
Scarto semplice medio
Scarto quadratico medio
Coefficiente di variazione
Il campo di variazione
Il coefficiente di variazione
Permette di confrontare due fenomeni,
anche differenti per unit di misura.
Esempio:
Fenomeno
Media
Stipendi
1070
348
32,5 %
Et
38 anni
10 anni
26,3 %
Uso e caratteristiche
Come nasce
Prendendo in
considerazione un grafico
che rappresenti le
frequenze, pi aumenta il
numero di misurazioni,
pi questo si avviciner
ad una forma a campana
(detta curva di Gauss)
che si pu calcolare con
la seguente equazione:
Distribuzione normale
Minimi quadrati
Uso peculiare della curva di Gauss
Il problema dellerrore
Nelle misurazioni sempre possibile fare errori
sistematici (che per si possono correggere
facilmente una volta compresi) ed errori
accidentali, che hanno sempre interessato gli
statisti, specie poich molto comuni nelle raccolte
di dati e determinanti per la credibilit sia delle
statistiche che delle previsioni.
In particolare nascono due domande correlate:
Come si correggono gli errori accidentali?
[esigenza pratica]
Come si correggono
La correzione degli errori si basa sul
principio secondo cui la media aritmetica
(principio di Legendre)
Base numerica: il principio dei minimi
quadrati.
Pendolo
Disposizione semplice
Si dice disposizione semplice di n oggetti di classe k ogni
allineamento di k oggetti scelti fra gli n, dove lordine
degli elementi ha importanza (es. 4-3-2 diverso da 34-2)
Dn,k n
n 1 n 2...n k 1
k..elementi
A
B
C
C
D
D
D
C
D
D
D
A
C
B
D
D
D
A
B
B
C
C
C
D4,3 4 4 1 4 3 1 4 3 2 24
Permutazioni
Le permutazioni sono disposizioni semplici particolari in
cui n=k. In tal senso da un insieme di n elementi si
formeranno gruppi di n elementi che differiscono solo
per lordine.
Pn n n 1 n 2... 3 2 1
Pn n! n n 1 n 2... 3 2 1
P5 5! 5 4 3 2 1 120
ln-esimo rn volte
allora:
r1 ,r2 ...rn
Pn
n!
r1!r2 !... rn
P8,2
8!
20160
2!
Combinazione semplice
Le combinazioni, a differenza delle disposizioni, sono
allineamenti di k elementi presi da un insieme di n
elementi, senza considerare lordine con cui vengono
disposti. Cos una combinazione semplice di n oggetti di
classe k:
Dn,k n n 1 n 2... n k 1
Cn,k
k!
k!
Cn,k
n n 1 n 2 ... n k 1
k!
C90,5
90 89 88 87 86
43949268
5 4 3 21
r
n,k
n n 1 n 2 ... n k 1
k!
Un esempio:
Quanti modi ci sono di distribuire a 2 bambini distinguibili 4
caramelle indistinguibili, contando anche i casi in cui uno dei
bambini non riceve nessuna caramella?
r
n 2, k 4
(2 4 1)!
5
4!
Termini di base
Evento aleatorio loggetto del calcolo delle
probabilit (ad es. il lancio di un dado).
Esperimento aleatorio un esperimento dallesito
imprevedibile (ad es. lanciare il dado e leggerne la
faccia superiore).
Spazio campionario la totalit di tutti i possibili esiti di
un esperimento aleatorio (ad es. {1-2-3-4-5-6} per il
lancio del dado) e si indica con .
Punto campionario un singolo esito di un esperimento
aleatorio (ad es. {1} per il lancio del dado).
Eventi
Levento elementare costituito da un singolo punto campionario
(ad es. esce {1} lanciando un dado).
Levento composto un evento non elementare (ad es. esce prima
{1}, poi {2} nel lancio del dado).
Levento impossibile non si pu mai verificare (ad es. che esca {-3});
levento certo quello che coincide con (che esca un numero
compreso fra 1 e 6).
Levento unione AB quello che si realizza quando si realizza o A
o B o entrambi.
Levento intersezione AB quello che si realizza se si realizzano sia
A sia B.
Levento contrario di A quello che si realizza se non si realizza A e
che unito a questo coincide con .
Due eventi sono incompatibili se il realizzarsi delluno esclude il
realizzarsi dellaltro e la loro intersezione impossibile.
La probabilita
Lo scopo del calcolo delle probabilit di attribuire un
grado di aspettativa (un numero) ad un evento.
La probabilit di un evento E quel numero che
rappresenta la fiducia che attribuiamo al fatto che E si
verifichi.
Definizione classica
La probabilit di un evento aleatorio uguale al
rapporto tra il numero dei casi favorevoli e il numero
dei casi ugualmente possibili.
Un esempio: qual la probabilit che, estraendo una
carta da un mazzo di 52 carte, ne esca una di cuori che
non sia lasso? I casi favorevoli sono 12 (13 meno lasso)
mentre i possibili 52.
12
p
0,231
52
Definizione frequentista
Nel caso di molti eventi aleatori non possibile usare la
definizione classica o perch ignoto il numero di casi
favorevoli o possibili, o perch i casi possibili non sono
possibili alla medesima maniera. In tal caso si preferisce
assumere come probabilit empirica di un evento la sua
frequenza relativa. Naturalmente, rispetto al calcolo
teorico offerto dalla def. classica, la definizione
frequentista si riferisce sempre a rilievi e indagini fatte
nel passato, che possono non conservare il medesimo
valore nellattualit.
Definizione soggettiva
A volte, nella quotidianit, pu capitare di fare
riferimento al concetto di probabilit riferendosi a
determinati eventi, quali possono ad es. essere attivit
agonistiche o situazioni meteorologiche. In un caso
come: Sono sicuro al 90%, non si pu parlare di
probabilit matematica, perch non c davvero uno
studio precedente che dia allaffermazione un valore
necessario; piuttosto si potrebbe parlare di grado di
fiducia che si attribuisce al verificarsi di un determinato
evento dopo aver coerentemente preso in esame tutte
le informazioni a disposizione, anche senza osservazioni
statistiche o calcoli di casi favorevoli e possibili.
Certezza e probabilita:
unapplicazione
Bibliografia
Wikipedia
Statistica descrittiva, Bergamini-Trifone-Barozzi
Argomenti di statistica descrittiva, Giancarlo
Bettuzzi
Dispense di probabilit, Dario Palladino
Nozioni introduttive al calcolo della
probabilit, Giampietro Betti
Matematica a colori, Sebastiano Nicosia
Altri materiali vari