Professional Documents
Culture Documents
Esercizio 76
Test chi quadro di adattamento
Indice
Soluzione Esercizio 76
2
Oi
Ai
k
Oi Ai 2
i 1
Ai
frequenze osservate
frequenze attese
numero delle classi nella distribuzione di frequenza
=k1m
dove m il numero di parametri della distribuzione teorica, stimati servendosi dei dati del
campione
La decisione basata sul confronto fra la statistica test e il valore critico
>
Esempio 76.1
Alle ultime elezioni amministrative in un comune si sono presentate quattro liste che hanno
ottenuto le seguenti percentuali
Lista
1
2
3
4
Percentuale
26%
32%
15%
27%
Totale
100%
Nella Sezione elettorale A del comune i 350 voti validi sono risultati cos suddivisi
Lista
Voti
1
80
2
120
3
60
4
90
Totale
350
Nella Sezione elettorale B invece i 320 voti validi sono risultati cos suddivisi
Lista
Voti
1
65
2
120
3
40
4
95
Totale
320
I risultati delle due sezioni si adattano bene ai risultati complessivi oppure le differenze sono
statisticamente rilevanti?
SUGGERIMENTI
Le frequenze attese si calcolano moltiplicando la frequenza percentuale di ciascuna lista per il
numero corrispondente di voti della lista
Sezione A
Ipotesi nulla H0
Ipotesi alternativa H1
Frequenze
osservate O
80
120
60
90
350
Frequenze
attese A
(O-A)^2/A
91
112
52.5
94.5
350
1.330
0.571
1.071
0.214 chi quadro
3.187
In questo caso il numero di classi k=4, e nessun parametro della popolazione stimato dai dati
del campione, quindi m=0 e il grado di libert uguale a 3
Grado di libert
Livello di significativit
Regione di rifiuto:
3
0.05
chi quadro alfa
7.8147
=INV.CHI(D97;D96
Conclusione:
)
Il valore della statistica test chi quadro calcolato non appartiene alla regione di rifiuto, perci
non si pu rifiutare l'ipotesi nulla.
I dati del campione permettono di concludere che non c' una differenza statisticamente
rilevante: la sezione A si adatta ai risultati generali.
Sezione B
Ipotesi nulla H0
Ipotesi alternativa H1
c' adattamento
non c' adattamento
Frequenze
osservate O
65
120
40
95
320
Gradi di libert
Livello di significativit
Regione di rifiuto.
Frequenze
attese A
83.2
102.4
48
86.4
320
(O-A)^2/A
3.981
3.025
1.333
0.856
9.196
3
0.05
chi quadro alfa
chi
quadro
7.8147
=INV.CHI(D120;D119
Conclusione:
)
Il valore della statistica test chi quadro calcolato appartiene alla regione di rifiuto, perci
si rifiuta l'ipotesi nulla.
I dati del campione permettono di concludere che c' una differenza statisticamente rilevante:
la sezione B non si adatta ai risultati generali.
Esercizio 76.2
Nelle classi prime dei licei scientifici di una citt i risultati degli scrutini finali sono i seguenti
Promossi con media superiore a 7/10
Promossi con media inferiore a 7/10
Promossi con debito
Non Promossi
0.18
0.38
0.37
0.07
Nelle classi prime del liceo scientifico Newton si hanno i seguenti risultati:
Promossi con media superiore a 7/10
Promossi con media inferiore a 7/10
Promossi con debito
Non Promossi
Stabilire se i risultati delle prime del liceo Newton si adattano a quelli generali con un livello
di significativit del 5%
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e della statistica test chi quadro
Lista
Frequenze
osservate O
Frequenze
attese A
(O-A)^2/A
24
35
38
18
Gradi di libert
Livello di significativit
Regione di rifiuto:
chi quadro
Conclusione:
Torna
su
chi quadro
E98:
=INV.CHI(D97;D96)
E117:
chi quadro
E121:
=INV.CHI(D120;D119)
E159:
chi quadro
Esercizio 77
Test chi quadro di adattamento. Calcolo del p-value
Indice
Soluzione Esercizio 77
Esercizio 77.1
I tipi di specializzazione post-laurea in medicina sono suddivisi in quattro categorie.
La tabella 1 mostra la distribuzione di frequenza percentuale dei medici di ciascuna categoria
nel 1990
Tabella 1
Specializzazione
A
B
C
D
Frequenza
percentuale
14.1%
30.6%
26.4%
28.9%
100.0%
Frequenza
assoluta
A
B
C
D
62
172
130
136
500
Frequenze
osservate O
62
172
130
136
500
Frequenze attese
A
70.5
153
132
144.5
500
(O-A)^2/A
1.0248
2.3595
0.0303
0.5000
3.9146
chi quadro
In questo caso il numero di classi k=4, e nessun parametro della popolazione stimato dai dati
del campione, quindi m=0 e il grado di libert uguale a 3
Gradi di libert
Livello di significativit
Regione di rifiuto:
3
0.05
chi quadro alfa
7.815
Conclusione:
Il valore della statistica test chi quadro calcolato non appartiene alla regione di rifiuto, perci
non si pu rifiutare l'ipotesi nulla.
I dati del campione non permettono di concludere che la distribuzione sia cambiata
SUGGERIMENTI
Con Excel si pu fare il test di adattamento con la funzione TEST.CHI che restituisce in
uscita il p-value, ossia il pi piccolo livello di significativit (calcolato a partire dalle tabelle
di frequenze osservate e frequenze attese) per il quale si pu rifiutare l'ipotesi nulla.
Un p-value molto prossimo a 0 indica che la probabilit di sbagliare rifiutando l'ipotesi nulla
molto vicina a 0, ossia si praticamente certi di non sbagliare rifiutando l'ipotesi nulla
Un p-value vicino ai classici livelli di significativit indica che la decisione critica.
Un p-value maggiore indica che non si sbaglia non rifutando l'ipotesi nulla.
La funzione TEST.CHI utilizza i valori delle frequenze osservate e delle frequenze attese, gi
calcolati nella tabella 3
Sintassi
TEST.CHI(int_effettivo;int_previsto)
int_effettivo: intervallo delle frequenze osservate
int_previsto: intervallo dele frequenze teoriche attese
Riferendoci all'esercizio precedente, riportiamo la tabella delle frequenze osservate e attese
e calcoliamo il p-value
Specializzazione
Frequenze
osservate O
A
B
C
D
62
172
130
136
500
p-value
Frequenze attese
A
70.5
153
132
144.5
500
0.2708
Conclusione:
In questo caso il valore del p-value grande, rispetto ai solito livelli di significativit,
perci non si sbaglia non rifiutando l'ipotesi nulla.
Esercizio 77.2
E' noto per esperienza che il livello di qualit di ciascun oggetto prodotto da una certa macchina
descritto dalla tabella 4
Tabella 4
Livello di qualit
Di altissima qualit
Di alta qualit
Di media qualit
Di bassa qualit
Percentuale
38%
32%
26%
4%
100%
Una nuova macchina, progettata per la stessa produzione, ha prodotto 500 oggetti con i
risultati riportati nella tabella 5
Tabella 5
Livello di qualit
Di altissima qualit
Di alta qualit
Di media qualit
Di bassa qualit
Percentuale
222
171
98
9
500
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese
Tabella 3
Livello di qualit
Frequenze
osservate O
Frequenze attese
A
Di altissima qualit
Di alta qualit
Di media qualit
Di bassa qualit
Torna
su
hi quadro
chi quadro
Esercizio 78
Test chi quadro di adattamento alla distribuzione uniforme discreta
Indice
Soluzione Esercizio 78
Esercizio 78.1
Per provare l'ipotesi che un dado non sia truccato si effettuano 600 lanci e si osservano
le seguenti uscite (Tabella 1)
Tabella 1
numero
uscito
frequenza
1
2
3
4
5
6
95
115
105
90
115
80
Totale
Stabilire con il test di adattamento alla distribuzione uniforme discreta, se il dado truccato
Provare a cambiare i valori delle uscite osservate e vedere come cambia la conclusione del test.
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e della statistica test chi quadro
numero uscito
frequenze
osservate O
frequenze
attese A
(O-A)^2/A
1
2
3
4
5
6
chi quadro
totale
In questo caso il numero di classi k=6, e nessun parametro della popolazione stimato dai dati
del campione, quindi m=0 e il grado di libert uguale a 5
Gradi di libert
Livello di significativit
Regione di rifiuto
0.05
Conclusione:
p-value
Conclusione:
Esercizio 78.2
Un dado apparentemente non truccato viene lanciato 120 volte, ottenendo le frequenze della tabella 2
Si osserva che in questo campione di risultati i numeri 2 e 4 escono con maggior frequenza.
Stabilire con un test di adattamento se il dado truccato
Effettuare il test per i livelli di significativit alfa=0,05 e alfa=0,01.
Tabella 2
numero
uscito
frequenza
1
2
3
4
5
6
10
32
16
34
16
12
Totale
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e della statistica test chi quadro
numero uscito
frequenze
osservate O
frequenze
attese A
(O-A)^2/A
1
2
3
4
5
6
chi quadro
totale
In questo caso il numero di classi k=6, e nessun parametro della popolazione stimato dai dati
del campione, quindi m=0 e il grado di libert uguale a 5
Gradi di libert
Livello di significativit
Regione di rifiuto
0.05
0.01
Conclusione:
p-value
Torna
su
Conclusione:
Torna
su
chi quadro
E87:
chi quadro
Esercizio 79
Test chi quadro di adattamento alla distribuzione binomiale
Indice
Soluzione Esercizio 79
Esercizio 79.1
Sono state lanciate 2000 volte cinque monete; il numero di teste in ciascuno dei lanci
ha avuto le frequenze riportate nella tabella 1
Tabella 1
numero di
teste
0
1
2
3
4
5
Totale
frequenze
osservate
59
316
596
633
320
76
2000
Se le monete sono tutte eque, le probabilit teoriche che in un singolo lancio si ottenga
un dato numero di teste sono date da una distribuzione binomiale di parametri
n=5
p = 0,5
Stabilire con il test chi quadro se le monete sono eque.
SUGGERIMENTI
Le probabilit teoriche possono essere calcolate con la distribuzione binomiale
usando la funzione DISTRIB.BINOM
Per calcolare le frequenze attese, ossia le frequenze che si avrebbero in 2000 lanci, se le
monete fossero eque, si moltiplica ogni probabilit teorica per il numero totale dei lanci
Ipotesi nulla H0
Ipotesi alternativa H1
n
p
Calcolo delle frequenze attese e della statistica test chi quadro
Probabilit
numero frequenze
(distribuzione
di teste osservate O
binomiale)
frequenze
(O-A)^2/A
attese A
totale
Grado di libert
Livello di significativit
Regione di rifiuto
Conclusione:
p-value
Conclusione:
Esercizio 79.2
Una compagnia di assicurazioni ritiene che il numero di automobilisti che indossano la
cintura di sicurezza sia una variabile binomiale con p = 0,80.
Per verificare questa assunzione si istituiscono dei posti di controllo e si verificano
a campione 10 automobilisti ogni due ore. Raccogliendo i dati di 1000 campioni di
10 guidatori si ottiene la distribuzione di frequenza della Tabella 2
N guidatori
con cintura
0
1
2
3
4
5
6
7
8
9
10
frequenze
osservate
0
0
1
1
7
28
95
215
300
258
95
1000
n
p
N
Probabilit
guidatori frequenze
(distribuzione
con
osservate O
binomiale)
cintura
frequenze
attese A
totale
p-value
Conclusione:
Torna
su
Esercizio 80
Test chi quadro di adattamento alla distribuzione normale
Indice
Soluzione Esercizio 80
Esempio 80.1
Si vuole sottoporre a test il fatto che le et dei residenti di una certa regione abbiano una
distribuzione approssimativamente normale.
Si esamina un campione casuale di 500 residenti nella regione e si ottengono i seguenti
valori di media e scarto quadratico medio, calcolati dal campione (tabella 1)
Tabella 1
et media (in anni)
34.96
scarto quadratico medio
21.82
e la seguente distribuzione di frequenza (tabella 2)
Tabella 2
Freq. assolute
osservate
91
105
84
65
55
46
54
500
Classi
x<=15
15<x<=25
25<x<=35
35<x<=45
45<x<=55
55<x<=65
x>65
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e del valore della statistica test chi quadro
Usare come valor medio e come scarto quadratico medio della distribuzione normale
i valori delle statistiche ottenuti dal campione (quindi, nel calcolo del grado di libert, m=2)
Ricordare che per la correttezza del test le frequenze attese devono essere maggiori di 5;
in caso contrario occorre accorpare delle classi adiacenti (vedi esempio 80.4)
Classi
Estremi destri
classi
x<=15
15<x<=25
25<x<=35
35<x<=45
45<x<=55
55<x<=65
x>65
15
25
35
45
55
65
totali
Grado di libert
Livello di significativit
Frequenze
assolute
osservate O
91
105
84
65
55
46
54
500
Probabilit
(distribuzione
normale)
0.1802
0.1439
0.1767
0.1766
0.1435
0.0949
0.0843
1.0000
4
0.05
Frequenze
attese A
90.08
71.93
88.35
88.28
71.76
47.45
42.15
500
(O-A)^2/A
0.0094
15.1987
0.2143
6.1383
3.9131
0.0443
3.3316
28.8497
chi quadro
9.488
Conclusione:
Il valore delle statistica test chi quadro appartiene alla regione di rifiuto, perci si pu
rifiutare l'ipotesi nulla: i dati del campione permettono di concludere che la distribuzione
non normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
6.49535E-005
Esercizio 80.2
Nella tabella di distribuzione di frequenza sono raccolti i dati di un campione di misure della
lunghezza in cm di 100 sbarrette di metallo (Tabella 3)
Tabella 3
classi
20<x<=30
30<x<=40
40<x<=50
50<x<=60
60<x<=70
70<x<=80
frequenza
assoluta
7
16
25
27
17
8
Il valor medio e lo scarto quadratico medio del campione sono riportati nella tabella 4
Tabella 4
valor medio (in cm)
51.1
scarto quadratico medio
12.85
Verificare l'adattamento dei dati a una distribuzione normale
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e del valore della statistica test chi quadro
Usare come valor medio e come scarto quadratico medio della distribuzione normale
i valori delle statistiche ottenuti dal campione (quindi m=2)
classi
estremi destri
classi
Frequenze
assolute
osservate O
Probabilit
(distribuzione
normale)
Frequenze
attese A
(O-A)^2/A
chi
quadro
Grado di libert
Livello di significativit
Regione di rifiuto
Conclusione:
p-value
Conclusione:
Esercizio 80.3
Nella tabella di distribuzione di frequenza sono raccolti i dati di un campione di misure del
peso in g di 120 sferette di acciaio (Tabella 5)
Tabella 5
classi
90<x<=110
110<x<130
130<x<=150
150<x<=170
170<x<=190
190<x<=210
frequenza
assoluta
7
21
38
33
13
8
Verificare l'adattamento dei dati a una distribuzione normale avente valor medio 150
e scarto quadratico medio 25 (valori teorici assegnati)
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e del valore della statistica test chi quadro
valor medio teorico
scarto quadratico medio teorico
classi
estremi destri
classi
Frequenze
assolute
osservate O
Probabilit
(distribuzione
normale)
Frequenze
attese A
(O-A)^2/A
chi
quadro
Attenzione: nel calcolo del grado di libert ricordare che i due parametri della distribuzione
sono assegnati, non vengono calcolati dai dati del campione (m=0)
Conclusione:
p-value
Conclusione:
Esempio 80.4
Nella tabella di distribuzione di frequenza sono raccolti i dati riguardanti le stature di 60
studenti (Tabella 6)
Tabella 6
classi
162<x<=165
165<x<=168
168<x<=171
171<x<=174
174<x<=177
freq. assoluta
2
13
24
15
6
Verificare l'adattamento a una distribuzione normale con media 170 e scarto quadratico
medio 3 (valori teorici assegnati)
Ipotesi nulla H0
Ipotesi alternativa H1
classi
estremi destri
classi
x<=165
165<x<=168
168<x<=171
171<x<=174
x>174
165
168
171
174
Totale
frequenze
osservate O
2
13
24
15
6
60
170
3
Probabilit
(distrib. normale)
0.0478
0.2047
0.3781
0.2782
0.0912
1.0000
frequenze
attese A
2.87
12.28
22.68
16.69
5.47
60
Poich c' una classe (la prima) con frequenza attesa minore di 5, occorre procedere
all'accorpamento di due classi adiacenti (le prime due)
classi
x<=168
168<x<=171
estremi delle
classi
168
171
frequenze
frequenze attese A
osservate O
15
15.15
24
22.68
(O-A)^2/A
0.0015
0.0764
174
15
6
16.69
5.47
60.00
0.1719
0.0508
0.3005
chi
quadro
Attenzione: nel calcolo del grado di libert ricordare che i due parametri della distribuzione
sono assegnati, non vengono calcolati dai dati del campione (m=0)
Grado di libert
Livello di significativit
Regione di rifiuto
3
0.05
7.815
Conclusione:
Il valore di chi quadro calcolato non appartiene alla regione di rifiuto, perci non si pu rifiutare
l'ipotesi nulla. I dati del campione permettono di concludere che si ha un buon adattamento alla
distribuzione normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
0.960
Esercizio 80.5
Nella tabella di distribuzione di frequenza sono raccolti i dati di un campione di 150
misure di peso in g (Tabella 7)
Tabella 7
classi
80<x<=110
110<x<=140
140<x<=170
170<x<=200
200<x<=230
230<x<=260
260<x<=290
290<x<=320
freq. assoluta
3
10
24
29
36
22
18
8
Verificare l'adattamento a una distribuzione normale con media 210 e scarto quadratico
medio 50 (valori teorici assegnati)
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e della statistica test chi quadro
valor medio teorico
scarto quadratico medio teorico
classi
estremi destri
classi
frequenze
osservate O
Probabilit
(distrib. normale)
frequenze
attese A
Accorpamento classi
classi
estremi delle
classi
frequenze
osservate O
frequenze attese A
(O-A)^2/A
chi
quadro
Attenzione: nel calcolo del grado di libert ricordare che i due parametri della distribuzione
sono assegnati, non vengono calcolati dai dati del campione (m=0)
Grado di libert
Livello di significativit
Regione di rifiuto
Conclusione:
p-value
Conclusione:
Torna
su
i quadro
chi
quadro
chi
quadro
chi
quadro
chi quadro
F271:
chi quadro
G46:
chi quadro
G96:
chi quadro
G144:
chi quadro
Esercizio 81
Test chi quadro di adattamento alla distribuzione normale
Indice
Soluzione Esercizio 81
Esercizio 81.1
Sono assegnati i dati della tabella 1
Costruire una distribuzione di frequenza assoluta, raggruppando i dati in 6 classi
chiuse a destra di uguale ampiezza.
Disegnare l'istogramma della distribuzione di frequenza assoluta
Trovare l'intervallo di confidenza per la media con grado di fiducia del 95%.
Verificare l'adattamento dei dati a una distribuzione normale; usare come parametri
della distribuzione normale i valori calcolati dai dati
Effettuare il test con livello di significativit del 5%
68
84
75
82
86
90
59
88
76
81
79
62
59
97
78
85
76
87
71
75
73
79
88
73
60
93
71
59
85
75
87
80
80
57
88
78
62
76
53
74
Tabella 1
61
65
75
87
94
62
95
78
63
78
86
67
73
81
72
63
76
75
85
96
66
78
82
75
94
77
69
74
68
60
61
65
75
87
74
62
95
78
63
72
numero dati
minimo
massimo
media
varianza
scarto quad. medio
80
78
89
61
75
95
60
79
83
71
66
78
82
75
82
77
69
74
68
60
range
num classi
ampiezza
classi
estremo
destro
frequenza
assoluta
valori
centrali
estremo
destro
frequenza
assoluta
probabilit
(normale)
frequenze
attese
(O-A)^2/A
chi quadro
gradi libert
livello significativit
regione rifiuto
Conclusione:
p-value
Conclusione:
Esercizio 81.2
Sono assegnati i dati della tabella 2
Costruire una distribuzione di frequenza assoluta, raggruppando i dati in 6 classi
chiuse a destra di uguale ampiezza.
Disegnare l'istogramma della distribuzione di frequenza assoluta
Verificare l'adattamento dei dati a una distribuzione normale; usare come parametri
della distribuzione normale i valori calcolati dai dati
Effettuare il test con livello di significativit del 5%
148
149
220
250
208
188
281
165
244
306
221
152
233
153
215
245
267
196
235
102
203
158
107
260
280
Tabella 2
214
179
272
164
203
159
190
259
207
199
148
118
219
226
217
96
237
198
268
206
209
166
142
183
280
192
272
217
173
204
194
277
238
220
166
153
236
280
155
129
294
185
155
131
268
284
297
254
204
217
206
209
166
142
183
280
299
126
221
198
206
244
144
144
215
215
186
187
249
164
190
259
216
285
197
numero dati
minimo
massimo
media
varianza
scarto quadr. medio
274
317
209
106
215
221
194
209
98
117
245
187
110
182
156
237
197
217
227
143
205
193
267
303
217
numero classi
range
ampiezza classi
classi
estremo
destro
frequenza
assoluta
valori
centrali
totale
212
139
300
177
250
269
103
270
265
163
299
126
221
198
206
198
178
169
251
127
194
201
166
104
266
classi
estremo
destro
frequenza
assoluta
probabilit
(normale)
frequenze
attese
(O-A)^2/A
totale
chi quadro
grado libert
livello significativit
regione rifiuto
Conclusione:
p-value
Conclusione:
Torna
su
chi quadro
G169:
chi quadro
Esercizio 82
Test chi quadro di indipendenza
Indice
Soluzione Esercizio 82
I dati raccolti sulle due variabili qualitative sono riassunti in una tabella detta tabella
di contingenza.
Il procedimento consiste nel confrontare la distribuzione delle frequenze osservate con la
distribuzione delle frequenze attese
Il numero contenuto in ogni cella della tabella la frequenza osservata associata a una
delle catagorie rispetto alla prima variabile e a una delle categorie rispetto alla seconda
variabile.
Le frequenze attese, ossia le frequenze che si avrebbero se l'ipotesi nulla fosse vera.
Per la correttezza del test le frequenze attese devono essere maggiori di 5; in caso
contrario occorre procedere all'accorpamento di categorie, e ci deve avvenire con criterio
logico, sulla base del problema trattato
Per valutare l'adattamento delle frequenze osservate alle frequenze attese si utilizza
la statistica test chi quadro calcolata con la formula
r
=
2
Oij
Aij
r
c
( Oij A ij )
A ij
i=1 j=1
frequenze osservate
frequenze attese
numero righe della tabella di contengenza
numero colonne della tabella di contengenza
=( r1 ) ( c1 )
La decisione basata sul confronto fra la statistica test e il valore critico
dove alfa il livello di significativit, di solitp uguale a 0,05 oppure 0,01
La regione di rifiuto data dai valori tali che
2
>
Esempio 82.1
Per stabilire l'efficacia di un vaccino anti-influenzale stata condotta una ricerca,
somministrando il vaccino a 500 persone e controllando il loro stato di salute per sei mesi
dopo la vaccinazione.
Lo stesso controllo stato fatto su un altro gruppo di 500 persone non vaccinate.
I dati ottenuti sono riassunti nella seguente tabella 1
vaccinati
non vaccinati
Totale
nessuna
influenza
252
224
476
una
influenza
145
136
281
pi di una
influenza
103
140
243
Totale
500
500
1000
vaccinati
non vaccinati
Totale
nessuna
influenza
238
238
476
una
influenza
140.5
140.5
281
pi di una
influenza
121.5
121.5
243
Totale
500
500
1000
i 1 j1
A ij
r
numero righe
c
numero colonne
Si possono disporre i calcoli nella seguente tabella, dove in ogni cella compare il
corrispondente termine della sommatoria; nella cella corrispondente al valore di chi
quadro si fa la somma di tutti gli elementi di questa tabella (utile solo per svolgere i calcoli)
vaccinati
non vaccinati
nessuna
influenza
0.8235
0.8235
una
influenza
0.1441
0.1441
pi di una
influenza
2.8169
2.8169
chi quadro
7.569
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
Conclusioni:
2
0.05
5.991
si rifiuta l'ipotesi nulla, il vaccino efficace
Livello di significativit
Regione di rifiuto
Conclusioni:
0.01
9.210
non si rifiuta l'ipotesi nulla, il vaccino non efficace
0.0227
Conclusione: il valore del p-value, vicino ai livelli di significativit comunemente usati, indica
che ci si trova in una situazione critica.
Esercizio 82.2
C' dipendenza tra tipo di lavoro e sesso del lavoratore?
Un campione di 250 lavoratori mostra i seguenti dati (Tabella 1 - frequenze osservate)
Tabella 1
M
Manager
Professionista
Tecnico
Amministrativo
Servizi
Altro
Totali
Totali
42
30
28
12
60
48
18
12
Manager
Professionista
Tecnico
Amministrativo
Servizi
Altro
Totali
Calcolo del valore della statistica test chi quadro
Totali
Manager
Professionista
Tecnico
Amministrativo
Servizi
Altro
chi quadro
Ipotesi nulla H0
Ipotesi alternativa H1
Gradi di libert
Livello di significativit
Regione di rifiuto
Conclusioni:
p-value
Conclusione:
Torna
su
chi quadro
F156:
chi quadro
Esercizio 83
Test chi quadro di indipendenza
Indice
Soluzione Esercizio 83
Esercizio 83.1
Dall'esame del colore dei capelli dei bambini di una certa regione si sono ricavati i seguenti dati
(Tabella 1 - frequenze osservate); stabilire se c' dipendenza fra colore dei capelli
e sesso del bambino, confrontando i due livelli di significativit
maschi
femmine
Totali
biondo
592
544
nero
Totali
36
14
biondo
nero
maschi
femmine
Totali
Calcolo del valore della statistica test chi quadro
biondo
rosso
castano
bruno
nero
maschi
femmine
chi-quadro
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
0.01
Conclusioni:
Grado di libert
Livello di significativit
Regione di rifiuto
0.05
Conclusioni:
Totali
p-value
Conclusione:
Esercizio 83.2
E' stata condotta un'indagine su un gruppo di 400 persone per accertare l'eventuale
dipendenza fra il titolo di studio e il giudizio sulla linea politica di un importante quotidiano.
Il titolo di studio stato distinto in 3 fasce: media inferiore, media superiore, laurea.
Sono previste due risposte al quesito: favorevole o contrario.
I risultati sono raccolti nella tabella 3 delle frequenze osservate
Stabilire con il test chi quadro se esiste o no dipendenza fra titolo di studio e giudizio
Tabella 3 - Frequenze osservate
Favorevoli Contrari
Totale
media
inferiore
media
superiore
laurea
Totale
80
65
58
110
32
55
Contrari
media
inferiore
media
superiore
laurea
chi quadro
0.05
livello significativit
grado libert
chi quadro alfa
0.01
Conclusione:
p-value
Conclusione:
Torna
su
chi quadro
Esercizio 84
Test chi quadro di indipendenza
Indice
Soluzione Esercizio 84
Esercizio 84.1
Una ditta le cui vendite dipendono esclusivamente dalla pubblicit vuole sapere se c'
dipendenza fra i diversi tipi di mezzi di comunicazione che usa per la pubblicit
e l'et del cliente.
La ditta analizza gli ordini di 450 clienti, da cui risultano l'et del cliente e il mezzo di
comunicazione attraverso il quale il cliente ha conosciuto l'azienda, e raccoglie le
informazioni riportate nella tabella 1 (frequenze osservate)
Stabilire con il test chi quadro se c' dipendenza fra et e mezzo di comunicazione.
Livello di significativit alfa = 0,05
internet
televisione
stampa
Totale
>50
Totale
12
25
19
2130
>50
Totale
internet
televisione
stampa
Totale
Calcolo del valore della statistica test chi quadro
2130
3140
4150
>50
internet
televisione
stampa
chi
quadro
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
p-value
Conclusione:
Esercizio 84.2
Un'azienda interessata a valutare se c' una relazione tra il tempo impiegato dai
propri impiegati per raggiungere il luogo di lavoro e il livello di stress sul lavoro.
Uno studio condotto su 116 impiegati con mansioni simili ha portato ai risultati della
tabella 3 (frequenze osservate).
Stabilire con il test chi quadro se c' dipendenza fra tempo impiegato per
raggiungere il luogo di lavoro e livello di stress.
Confrontare i due livelli di significativit alfa = 5% e alfa =1% e trarre le conclusioni
tempo impiegato
meno di 15 minuti
da 15 a 45 minuti
pi di 45 minuti
Totale
tempo impiegato
meno di 15 minuti
da 15 a 45 minuti
pi di 45 minuti
Totale
Totale
tempo impiegato
meno di 15 minuti
da 15 a 45 minuti
pi di 45 minuti
alto
livello di stress
medio
basso
chi quadro
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
0.05
0.01
p-value
Conclusione:
Torna
su
chi quadro
G100:
chi quadro
Soluzione Esercizio 76
Test chi quadro di adattamento
Indice
Ritorna Esercizio 76
Con il test chi quadro di adattamento si stabilisce se i dati osservati di un campione
provengono da una assegnata distribuzione di una popolazione.
Per un test chi quadro di adattamento le ipotesi sono cos formulate
Ipotesi nulla H0
i dati provengono da una popolazione con una specificata distribuzione
di probabilit
Ipotesi alternativa H1 i dati non provengono da una popolazione con la distribuzione
di probabilit specificata
Il procedimento consiste nel confrontare la distribuzione delle frequenze osservate con la
distribuzione delle frequenze attese
Le frequenze osservate si definiscono come il numero reale di osservazioni relative a ogni
classe in una distribuzione di frequenza
Le frequenze attese si definiscono come il numero di osservazioni che si avrebbero per ogni
classe se i dati del campione si distribuissero secondo la distribuzione ipotizzata
Per valutare l'adattamento delle frequenze osservate alle frequenze attese si utilizza
la statistica test chi quadro calcolata con la formula
2
Oi
Ai
k
Oi Ai 2
i 1
Ai
frequenze osservate
frequenze attese
numero delle classi nella distribuzione di frequenza
=k1m
dove m il numero di parametri della distribuzione teorica, stimati servendosi dei dati del
campione
2
La decisione basata sul confronto fra la statistica test e il valore critico
2 > 2
Esempio 76.1
Alle ultime elezioni amministrative in un comune si sono presentate quattro liste che hanno
ottenuto le seguenti percentuali
Lista
1
2
3
4
Totale
Percentuale
26%
32%
15%
27%
100%
Nella Sezione elettorale A del comune i 350 voti validi sono risultati cos suddivisi
Lista
Voti
1
80
2
120
3
60
4
90
Totale
350
Nella Sezione elettorale B invece i 320 voti validi sono risultati cos suddivisi
Lista
Voti
1
65
2
120
3
40
4
95
Totale
320
I risultati delle due sezioni si adattano bene ai risultati complessivi oppure le differenze sono
statisticamente rilevanti?
SUGGERIMENTI
Le frequenze attese si calcolano moltiplicando la frequenza percentuale di ciascuna lista per il
numero corrispondente di voti della lista
Sezione A
Ipotesi nulla H0
Ipotesi alternativa H1
c' adattamento
non c' adattamento
Frequenze
osservate O
80
120
60
90
350
Frequenze
attese A
(O-A)^2/A
91
112
52.5
94.5
350
1.330
0.571
1.071
0.214
3.187
chi quadro
In questo caso il numero di classi k=4, e nessun parametro della popolazione stimato dai dati
del campione, quindi m=0 e il grado di libert uguale a 3
Grado di libert
Livello di significativit
Regione di rifiuto:
3
0.05
chi quadro alfa
7.8147
=INV.CHI(D97;D96
Conclusione:
) di rifiuto, perci
Il valore della statistica test chi quadro calcolato non appartiene alla regione
non si pu rifiutare l'ipotesi nulla.
I dati del campione permettono di concludere che non c' una differenza statisticamente
rilevante: la sezione A si adatta ai risultati generali.
Sezione B
Ipotesi nulla H0
Ipotesi alternativa H1
c' adattamento
non c' adattamento
Frequenze
osservate O
65
120
40
95
320
Gradi di libert
Livello di significativit
Regione di rifiuto.
Frequenze
attese A
83.2
102.4
48
86.4
320
(O-A)^2/A
3.981
3.025
1.333
0.856
9.196
3
0.05
chi quadro alfa
chi quadro
7.8147
=INV.CHI(D120;D119
Conclusione:
)
Il valore della statistica test chi quadro calcolato appartiene alla regione di rifiuto, perci
si rifiuta l'ipotesi nulla.
I dati del campione permettono di concludere che c' una differenza statisticamente rilevante:
la sezione B non si adatta ai risultati generali.
Esercizio 76.2
Nelle classi prime dei licei scientifici di una citt i risultati degli scrutini finali sono i seguenti
Promossi con media superiore a 7/10
Promossi con media inferiore a 7/10
Promossi con debito
Non Promossi
18%
38%
37%
7%
Nelle classi prime del liceo scientifico Newton si hanno i seguenti risultati:
Promossi con media superiore a 7/10
Promossi con media inferiore a 7/10
Promossi con debito
Non Promossi
Stabilire se i risultati delle prime del liceo Newton si adattano a quelli generali con un livello
di significativit del 5%
Ipotesi nulla H0
Ipotesi alternativa H1
c' adattamento
non c' adattamento
Frequenze
osservate O
Frequenze
attese A
(O-A)^2/A
24
35
38
18
20.7
0.526
35
38
18
115
43.7
42.55
8.05
115
1.732
0.487
12.298
15.043
3
0.05
chi quadro alfa
7.8147
Gradi di libert
Livello di significativit
Regione di rifiuto:
chi quadro
Conclusione:
Il valore della statistica test chi quadro calcolato appartiene alla regione di rifiuto, perci
si rifiuta l'ipotesi nulla.
I dati del campione permettono di concludere che c' una differenza statisticamente rilevante:
i risultati delle classi prime del liceo Newton non si adattano ai risultati generali.
Torna
su
chi quadro
E98:
=INV.CHI(D97;D96)
E117:
chi quadro
E121:
=INV.CHI(D120;D119)
E159:
chi quadro
Soluzione Esercizio 77
Test chi quadro di adattamento. Calcolo del p-value
Indice
Ritorna Esercizio 77
Esercizio 77.1
I tipi di specializzazione post-laurea in medicina sono suddivisi in quattro categorie.
La tabella 1 mostra la distribuzione di frequenza percentuale dei medici di ciascuna categoria
nel 1990
Tabella 1
Specializzazione
A
B
C
D
Frequenza
percentuale
14.1%
30.6%
26.4%
28.9%
100.0%
Frequenza
assoluta
A
B
C
D
62
172
130
136
500
c' adattamento
non c' adattamento
Frequenze
osservate O
62
172
130
136
500
Frequenze attese
A
70.5
153
132
144.5
500
(O-A)^2/A
1.0248
2.3595
0.0303
0.5000
3.9146
chi quadro
In questo caso il numero di classi k=4, e nessun parametro della popolazione stimato dai
dati del campione, quindi m=0 e il grado di libert uguale a 3
Gradi di libert
Livello di significativit
3
0.05
Regione di rifiuto:
7.815
SUGGERIMENTI
Con Excel si pu fare il test di adattamento con la funzione TEST.CHI che restituisce in
uscita il p-value, ossia il pi piccolo livello di significativit (calcolato a partire dalle tabelle
di frequenze osservate e frequenze attese) per il quale si pu rifiutare l'ipotesi nulla.
Un p-value molto prossimo a 0 indica che la probabilit di sbagliare rifiutando l'ipotesi nulla
molto vicina a 0, ossia si praticamente certi di non sbagliare rifiutando l'ipotesi nulla
Un p-value vicino ai classici livelli di significativit indica che la decisione critica.
Un p-value maggiore indica che non si sbaglia non rifutando l'ipotesi nulla.
La funzione TEST.CHI utilizza i valori delle frequenze osservate e delle frequenze attese, gi
calcolati nella tabella 3
Sintassi
TEST.CHI(int_effettivo;int_previsto)
int_effettivo: intervallo delle frequenze osservate
int_previsto: intervallo dele frequenze teoriche attese
Riferendoci all'esercizio precedente, riportiamo la tabella delle frequenze osservate e attese
e calcoliamo il p-value
Specializzazione
Frequenze
osservate O
A
B
C
D
62
172
130
136
500
p-value
Frequenze attese
A
70.5
153
132
144.5
500
0.2708
Conclusione:
In questo caso il valore del p-value grande, rispetto ai solito livelli di significativit,
perci non si sbaglia non rifiutando l'ipotesi nulla.
Esercizio 77.2
E' noto per esperienza che il livello di qualit di ciascun oggetto prodotto da una certa macchina
descritto dalla tabella 4
Tabella 4
Livello di qualit
Di altissima qualit
Di alta qualit
Di media qualit
Di bassa qualit
Percentuale
38%
32%
26%
4%
100%
Percentuale
222
171
98
9
500
Ipotesi nulla H0
Ipotesi alternativa H1
c' adattamento
non c' adattamento
Frequenze
osservate O
Di altissima qualit
Di alta qualit
Di media qualit
Di bassa qualit
222
171
98
9
500
Frequenze attese
A
190
160
130
20
500
0.0001640
Torna
su
chi quadro
Soluzione Esercizio 78
Test chi quadro di adattamento alla distribuzione uniforme discreta
Indice
Ritorna Esercizio 78
Esercizio 78.1
Per provare l'ipotesi che un dado non sia truccato si effettuano 600 lanci e si osservano
le seguenti uscite (Tabella 1)
Tabella 1
numero
uscito
frequenza
1
2
3
4
5
6
95
115
105
90
115
80
600
Totale
Stabilire con il test di adattamento alla distribuzione uniforme discreta, se il dado truccato
Provare a cambiare i valori delle uscite osservate e vedere come cambia la conclusione del test.
Ipotesi nulla H0
Ipotesi alternativa H1
frequenze
osservate O
95
115
105
90
115
80
600
frequenze
attese A
100
100
100
100
100
100
600
(O-A)^2/A
0.25
2.25
0.25
1
2.25
4
10
chi quadro
In questo caso il numero di classi k=6, e nessun parametro della popolazione stimato dai dati
del campione, quindi m=0 e il grado di libert uguale a 5
Gradi di libert
Livello di significativit
Regione di rifiuto
5
0.05
11.070
Conclusione:
Il valore della statistica test chi quadro calcolato non appartiene alla regione di rifiuto, perci
non si pu rifiutare l'ipotesi nulla; si conclude che il dado non truccato.
p-value
0.0752
Conclusione:
Il valore del p-value sufficientemente grande, perci non si pu rifiutare l'ipotesi nulla.
Il dado non truccato
Esercizio 78.2
Un dado apparentemente non truccato viene lanciato 120 volte, ottenendo le frequenze della tabella 2
Si osserva che in questo campione di risultati i numeri 2 e 4 escono con maggior frequenza.
Stabilire con un test di adattamento se il dado truccato
Effettuare il test per i livelli di significativit alfa=0,05 e alfa=0,01.
Tabella 2
numero
uscito
frequenza
1
2
3
4
5
6
10
32
16
34
16
12
120
Totale
Ipotesi nulla H0
Ipotesi alternativa H1
frequenze
osservate O
10
32
16
34
16
12
120
frequenze
attese A
20
20
20
20
20
20
120
(O-A)^2/A
5
7.2
0.8
9.8
0.8
3.2
26.8
chi quadro
In questo caso il numero di classi k=6, e nessun parametro della popolazione stimato dai dati
del campione, quindi m=0 e il grado di libert uguale a 5
Gradi di libert
Livello di significativit
Regione di rifiuto
5
0.05
11.070
0.01
15.086
Conclusione:
Il valore della statistica test chi quadro calcolato appartiene alla regione di rifiuto per entrambi i livelli
di significativit, perci si pu rifiutare l'ipotesi nulla; si conclude che il dado truccato.
p-value
0.0001
Torna
su
Conclusione:
Il valore del p-value prossimo a zero, perci non si sbaglia rifiutando l'ipotesi nulla.
Il dado truccato
Torna
su
chi quadro
E87:
chi quadro
Soluzione Esercizio 79
Test chi quadro di adattamento alla distribuzione binomiale
Indice
Ritorna Esercizio 79
Esercizio 79.1
Sono state lanciate 2000 volte cinque monete; il numero di teste in ciascuno dei lanci
ha avuto le frequenze riportate nella tabella 1
Tabella 1
numero di
teste
0
1
2
3
4
5
Totale
frequenze
osservate
59
316
596
633
320
76
2000
Se le monete sono tutte eque, le probabilit teoriche che in un singolo lancio si ottenga
un dato numero di teste sono date da una distribuzione binomiale di parametri
n=5
p = 0,5
Stabilire con il test chi quadro se le monete sono eque.
SUGGERIMENTI
Le probabilit teoriche possono essere calcolate con la distribuzione binomiale
usando la funzione DISTRIB.BINOM
Per calcolare le frequenze attese, ossia le frequenze che si avrebbero in 2000 lanci, se le
monete fossero eque, si moltiplica ogni probabilit teorica per il numero totale dei lanci
Ipotesi nulla H0
Ipotesi alternativa H1
n
5
p
0.5
Calcolo delle frequenze attese e della statistica test chi quadro
Probabilit
numero frequenze
frequenze
(distribuzione
(O-A)^2/A
di teste osservate O
attese A
binomiale)
0
59
0.03125
63
0.196
1
316
0.15625
313
0.039
2
596
0.3125
625
1.346
3
633
0.3125
625
0.102
4
320
0.15625
313
0.180
76
2000
totale
0.03125
1
63
2000
2.916
4.779
In questo caso il numero di classi k=6, e nessun parametro della popolazione stimato
dai dati del campione, quindi m=0 e il grado di libert uguale a 5
Grado di libert
Livello di significativit
Regione di rifiuto
5
0.05
11.0705
Conclusione:
Il valore della statistica test chi quadro calcolato non appartiene alla regione di rifiuto,
perci non si pu rifiutare l'ipotesi nulla; si conclude che le monete sono eque.
p-value
0.4434
Conclusione:
Il valore del p-value sufficientemente grande, perci non si sbaglia non rifiutando l'ipotesi
nulla.
Esercizio 79.2
Una compagnia di assicurazioni ritiene che il numero di automobilisti che indossano la
cintura di sicurezza sia una variabile binomiale con p = 0,70.
Per verificare questa assunzione si istituiscono dei posti di controllo e si verificano
a campione 10 automobilisti ogni due ore. Raccogliendo i dati di 1000 campioni di
10 guidatori si ottiene la distribuzione di frequenza della Tabella 2
N guidatori
con cintura
frequenze
osservate
0
1
2
3
4
5
6
7
8
9
10
0
0
1
1
7
28
95
215
300
258
95
1000
c' adattamento
non c' adattamento
n
p
10
0.8
N
Probabilit
guidatori frequenze
frequenze
(distribuzione
con
osservate O
attese A
binomiale)
cintura
0
0
0.00000
0
1
0
0.00000
0
2
1
0.00007
0
3
1
0.00079
1
4
7
0.00551
6
5
28
0.02642
26
6
95
0.08808
88
7
215
0.20133
201
8
300
0.30199
302
9
258
0.26844
268
10
95
0.10737
107
totale
1000
1.00000
1000
p-value
0.11434
Conclusione:
Il valore del p-value sufficientemente grande, perci non si sbaglia non rifiutando l'ipotesi
nulla. i dati si distribuiscono secondo la distribuzione binomiale
Torna
su
Soluzione Esercizio 80
Test chi quadro di adattamento alla distribuzione normale
Indice
Ritorna Esercizio 80
Esempio 80.1
Si vuole sottoporre a test il fatto che le et dei residenti di una certa regione abbiano una
distribuzione approssimativamente normale.
Si esamina un campione casuale di 500 residenti nella regione e si ottengono i seguenti
valori di media e scarto quadratico medio, calcolati dal campione (tabella 1)
Tabella 1
et media (in anni)
34.96
scarto quadratico medio
21.82
e la seguente distribuzione di frequenza (tabella 2)
Tabella 2
Freq. assolute
osservate
91
105
84
65
55
46
54
500
Classi
x<=15
15<x<=25
25<x<=35
35<x<=45
45<x<=55
55<x<=65
x>65
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e del valore della statistica test chi quadro
Usare come valor medio e come scarto quadratico medio della distribuzione normale
i valori delle statistiche ottenuti dal campione (quindi, nel calcolo del grado di libert, m=2)
Ricordare che per la correttezza del test le frequenze attese devono essere maggiori di 5;
in caso contrario occorre accorpare delle classi adiacenti (vedi esempio 80.4)
Classi
Estremi destri
classi
x<=15
15<x<=25
25<x<=35
35<x<=45
45<x<=55
55<x<=65
x>65
15
25
35
45
55
65
totali
Grado di libert
Livello di significativit
Frequenze
assolute
osservate O
91
105
84
65
55
46
54
500
Probabilit
(distribuzione
normale)
0.1802
0.1439
0.1767
0.1766
0.1435
0.0949
0.0843
1.0000
4
0.05
Frequenze
attese A
90.08
71.93
88.35
88.28
71.76
47.45
42.15
500
(O-A)^2/A
0.0094
15.1987
0.2143
6.1383
3.9131
0.0443
3.3316
28.8497
chi quadro
9.488
Conclusione:
Il valore delle statistica test chi quadro appartiene alla regione di rifiuto, perci si pu
rifiutare l'ipotesi nulla: i dati del campione permettono di concludere che la distribuzione
non normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
6.49535E-005
Esercizio 80.2
Nella tabella di distribuzione di frequenza sono raccolti i dati di un campione di misure della
lunghezza in cm di 100 sbarrette di metallo (Tabella 3)
Tabella 3
frequenza
assoluta
classi
20<x<=30
30<x<=40
40<x<=50
50<x<=60
60<x<=70
70<x<=80
7
16
25
27
17
8
Il valor medio e lo scarto quadratico medio del campione sono riportati nella tabella 4
Tabella 4
valor medio (in cm)
51.1
scarto quadratico medio
12.85
Verificare l'adattamento dei dati a una distribuzione normale
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e del valore della statistica test chi quadro
Usare come valor medio e come scarto quadratico medio della distribuzione normale
i valori delle statistiche ottenuti dal campione (quindi m=2)
classi
estremi destri
classi
20<x<=30
30<x<=40
40<x<=50
50<x<=60
60<x<=70
70<x<=80
Grado di libert
30
40
50
60
70
Frequenze
assolute
osservate O
7
16
25
27
17
8
100
Probabilit
(distribuzione
normale)
0.0503
0.1436
0.2720
0.2898
0.1736
0.0707
1.0000
Frequenze
attese A
5.03
14.36
27.20
28.98
17.36
7.07
100
(O-A)^2/A
0.7722
0.1884
0.1787
0.1357
0.0075
0.1232
1.4057
chi
quadro
chi
quadro
0.05
7.815
Conclusione:
Il valore delle statistica test chi quadro non appartiene alla regione di rifiuto, perci non si pu
rifiutare l'ipotesi nulla: i dati del campione permettono di concludere che la distribuzione
approssimativamente normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
0.924
Esercizio 80.3
Nella tabella di distribuzione di frequenza sono raccolti i dati di un campione di misure del
peso in g di 120 sferette di acciaio (Tabella 5)
Tabella 5
frequenza
assoluta
classi
90<x<=110
110<x<130
130<x<=150
150<x<=170
170<x<=190
190<x<=210
7
21
38
33
13
8
Verificare l'adattamento dei dati a una distribuzione normale avente valor medio 150
e scarto quadratico medio 25 (valori teorici assegnati)
Ipotesi nulla H0
Ipotesi alternativa H1
Calcolo delle frequenze attese e del valore della statistica test chi quadro
valor medio teorico
scarto quadratico medio teorico
classi
90<x<=110
110<x<130
130<x<=150
150<x<=170
170<x<=190
190<x<=210
estremi destri
classi
110
130
150
170
190
150
25
Frequenze
assolute
osservate O
7
21
38
33
13
8
120
Probabilit
(distribuzione
normale)
0.0548
0.1571
0.2881
0.2881
0.1571
0.0548
1.0000
Frequenze
attese A
6.58
18.85
34.58
34.58
18.85
6.58
120
(O-A)^2/A
0.0273
0.2460
0.3388
0.0720
1.8138
0.3084
2.8063
chi
quadro
Attenzione: nel calcolo del grado di libert ricordare che i due parametri della distribuzione
sono assegnati, non vengono calcolati dai dati del campione (m=0)
5
0.05
11.070
Conclusione:
Il valore delle statistica test chi quadro non appartiene alla regione di rifiuto, perci non si pu
rifiutare l'ipotesi nulla: i dati del campione permettono di concludere che la distribuzione
approssimativamente normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
0.730
Esempio 80.4
Nella tabella di distribuzione di frequenza sono raccolti i dati riguardanti le stature di 60
studenti (Tabella 6)
Tabella 6
classi
162<x<=165
165<x<=168
168<x<=171
171<x<=174
174<x<=177
freq. assoluta
2
13
24
15
6
Verificare l'adattamento a una distribuzione normale con media 170 e scarto quadratico
medio 3 (valori teorici assegnati)
Ipotesi nulla H0
Ipotesi alternativa H1
classi
estremi destri
classi
x<=165
165<x<=168
168<x<=171
171<x<=174
x>174
165
168
171
174
Totale
frequenze
osservate O
2
13
24
15
6
60
170
3
Probabilit
(distrib. normale)
0.0478
0.2047
0.3781
0.2782
0.0912
1.0000
frequenze
attese A
2.87
12.28
22.68
16.69
5.47
60
Poich c' una classe (la prima) con frequenza attesa minore di 5, occorre procedere
all'accorpamento di due classi adiacenti (le prime due)
classi
x<=168
168<x<=171
estremi delle
classi
168
171
frequenze
frequenze attese A
osservate O
15
15.15
24
22.68
(O-A)^2/A
0.0015
0.0764
174
15
6
16.69
5.47
60.00
0.1719
0.0508
0.3005
chi
quadro
Attenzione: nel calcolo del grado di libert ricordare che i due parametri della distribuzione
sono assegnati, non vengono calcolati dai dati del campione (m=0)
Grado di libert
Livello di significativit
Regione di rifiuto
3
0.05
7.815
Conclusione:
Il valore di chi quadro calcolato non appartiene alla regione di rifiuto, perci non si pu rifiutare
l'ipotesi nulla. I dati del campione permettono di concludere che si ha un buon adattamento alla
distribuzione normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
0.960
Esercizio 80.5
Nella tabella di distribuzione di frequenza sono raccolti i dati di un campione di 150
misure di peso in g (Tabella 7)
Tabella 7
classi
80<x<=110
110<x<=140
140<x<=170
170<x<=200
200<x<=230
230<x<=260
260<x<=290
290<x<=320
freq. assoluta
3
10
24
29
36
22
18
8
Verificare l'adattamento a una distribuzione normale con media 210 e scarto quadratico
medio 50 (valori teorici assegnati)
Ipotesi nulla H0
Ipotesi alternativa H1
estremi destri
classi
110
140
170
210
50
frequenze
osservate O
Probabilit
(distrib. normale)
3
0.0228
10
0.0580
24
0.1311
frequenze
attese A
3.41
8.70
19.66
200
230
260
290
29
36
22
18
8
150
Totale
0.2089
0.2347
0.1859
0.1039
0.0548
1.0000
31.33
35.20
27.89
15.58
8.22
150
Poich c' una classe (la prima) con frequenza attesa minore di 5, occorre procedere
all'accorpamento di due classi adiacenti (le prime due)
classi
x<=140
140<x<=170
170<x<=200
200<x<=230
230<x<=260
260<x<=290
x>290
estremi delle
classi
140
170
200
230
260
290
frequenze
frequenze attese A
osservate O
13
12.11
24
19.66
29
31.33
36
35.20
22
27.89
18
15.58
8
8.22
150
150
(O-A)^2/A
0.0649
0.9557
0.1737
0.0181
1.2433
0.3764
0.0059
2.8380
chi
quadro
Attenzione: nel calcolo del grado di libert ricordare che i due parametri della distribuzione
sono assegnati, non vengono calcolati dai dati del campione (m=0)
Grado di libert
Livello di significativit
Regione di rifiuto
6
0.05
12.592
Conclusione:
Il valore di chi quadro calcolato non appartiene alla regione di rifiuto, perci non si pu rifiutare
l'ipotesi nulla. I dati del campione permettono di concludere che si ha un buon adattamento alla
distribuzione normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
0.829
Torna
su
i quadro
chi
quadro
chi
quadro
chi
quadro
chi quadro
F271:
chi quadro
G46:
chi quadro
G96:
chi quadro
G144:
chi quadro
Soluzione Esercizio 81
Test chi quadro di adattamento alla distribuzione normale
Indice
Ritorna Esercizio 81
Esercizio 81.1
Sono assegnati i dati della tabella 1
Costruire una distribuzione di frequenza assoluta, raggruppando i dati in 6 classi
chiuse a destra di uguale ampiezza.
Disegnare l'istogramma della distribuzione di frequenza assoluta
Trovare l'intervallo di confidenza per la media con grado di fiducia del 95%.
Verificare l'adattamento dei dati a una distribuzione normale; usare come parametri
della distribuzione normale i valori calcolati dai dati
Effettuare il test con livello di significativit del 5%
68
84
75
82
86
90
59
88
76
81
79
62
59
97
78
85
76
87
71
75
73
79
88
73
60
93
71
59
85
75
87
80
80
57
88
78
62
76
53
74
numero dati
minimo
massimo
media
varianza
scarto quad. medio
Tabella 1
61
65
75
87
94
62
95
78
63
78
86
67
73
81
72
63
76
75
85
96
66
78
82
75
94
77
69
74
68
60
61
65
75
87
74
62
95
78
63
72
100
53
97
75.580
108.105
10.397
classi
52<x<=60
60<x<=68
68<x<=76
76<x<=84
84<x<=92
estremo
destro
60
68
76
84
92
80
78
89
61
75
95
60
79
83
71
66
78
82
75
82
77
69
74
68
60
range
num classi
ampiezza
frequenza
assoluta
9
18
27
24
14
valori
centrali
56
64
72
80
88
44
6
8
92<x<=100
100
96
25
20
18
14
15
9
10
5
0
56
64
72
80
88
96
0.950
2.04
73.54
77.62
I parametri della distribuzione normale sono calcolati dai dati osservati (m=2)
valor medio
75.58
scarto quadratico medio
10.40
classi
x<=60
60<x<=68
68<x<=76
76<x<=84
84<x<=92
x>92
estremo
frequenza
destro
assoluta
60
9
68
18
76
27
84
24
92
14
92
8
100
gradi libert
livello significativit
regione rifiuto
probabilit
(normale)
0.067
0.166
0.283
0.275
0.152
0.057
1.000
frequenze
(O-A)^2/A
attese
6.701
0.789
16.598
0.118
28.312
0.061
27.487
0.442
15.188
0.093
5.714
0.915
100.000
2.418
3
0.05
7.815
chi quadro
Conclusione:
Il valore di chi quadro calcolato non appartiene alla regione di rifiuto, perci non si pu rifiutare
l'ipotesi nulla. I dati del campione permettono di concludere che si ha un buon adattamento
p-value
0.7888
Esercizio 81.2
Sono assegnati i dati della tabella 2
Costruire una distribuzione di frequenza assoluta, raggruppando i dati in 6 classi
chiuse a destra di uguale ampiezza.
Disegnare l'istogramma della distribuzione di frequenza assoluta
Verificare l'adattamento dei dati a una distribuzione normale; usare come parametri
della distribuzione normale i valori calcolati dai dati
Effettuare il test con livello di significativit del 5%
148
149
220
250
208
188
281
165
244
306
221
152
233
153
215
245
267
196
235
102
203
158
107
260
280
Tabella 2
214
179
272
164
203
159
190
259
207
199
148
118
219
226
217
96
237
198
268
206
209
166
142
183
280
192
272
217
173
204
194
277
238
220
166
153
236
280
155
129
294
185
155
131
268
284
297
254
204
217
numero dati
minimo
massimo
media
varianza
scarto quadr. medio
206
209
166
142
183
280
299
126
221
198
206
244
144
144
215
215
186
187
249
164
190
259
216
285
197
150
96
317
205.13
2720.38
52.16
classi
80<x<=120
120<x<=160
estremo
destro
120
160
274
317
209
106
215
221
194
209
98
117
245
187
110
182
156
237
197
217
227
143
205
193
267
303
217
numero classi
range
ampiezza classi
frequenza
assoluta
10
22
valori
centrali
100
140
212
139
300
177
250
269
103
270
265
163
299
126
221
198
206
198
178
169
251
127
194
201
166
104
266
6
221
40
200
240
280
320
totale
36
43
28
11
180
220
260
300
150
frequenza assoluta
50
43
45
40
36
35
28
30
25
22
20
15
10
11
10
5
0
100
140
180
220
260
300
I parametri della distribuzione normale sono calcolati dai dati osservati (m=2)
media
205.13
scarto quadratico medio
52.16
estremo
destro
120
160
200
240
280
280
totale
classi
x<=120
120<x<=160
160<x<=200
200<x<=240
240<x<=280
x>280
frequenza
assoluta
10
22
36
43
28
11
150
grado libert
liv. significativit
regione rifiuto
probabilit
(normale)
0.051
0.142
0.267
0.287
0.176
0.076
1.000
frequenze
(O-A)^2/A
attese
7.699
0.688
21.320
0.022
40.108
0.421
43.092
0.000
26.445
0.091
11.335
0.010
150
1.232
chi quadro
3
0.05
7.815
Conclusione:
Il valore di chi quadro calcolato non appartiene alla regione di rifiuto, perci non si pu rifiutare
l'ipotesi nulla. I dati del campione permettono di concludere che si ha un buon adattamento
alla distribuzione normale
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
0.9418
Torna
su
chi quadro
G197:
chi quadro
Soluzione Esercizio 82
Test chi quadro di indipendenza
Indice
Ritorna Esercizio 82
I dati raccolti sulle due variabili qualitative sono riassunti in una tabella detta tabella
di contingenza.
Il procedimento consiste nel confrontare la distribuzione delle frequenze osservate con la
distribuzione delle frequenze attese
Il numero contenuto in ogni cella della tabella la frequenza osservata associata a una
delle catagorie rispetto alla prima variabile e a una delle categorie rispetto alla seconda
variabile.
Le frequenze attese, ossia le frequenze che si avrebbero se l'ipotesi nulla fosse vera.
Per la correttezza del test le frequenze attese devono essere maggiori di 5; in caso
contrario occorre procedere all'accorpamento di categorie, e ci deve avvenire con criterio
logico, sulla base del problema trattato
Per valutare l'adattamento delle frequenze osservate alle frequenze attese si utilizza
la statistica test chi quadro calcolata con la formula
r
=
2
Oij
Aij
r
c
( Oij A ij )
A ij
i=1 j=1
frequenze osservate
frequenze attese
numero righe della tabella di contengenza
numero colonne della tabella di contengenza
=( r1 ) ( c1 )
La decisione basata sul confronto fra la statistica test e il valore critico
dove alfa il livello di significativit, di solitp uguale a 0,05 oppure 0,01
La regione di rifiuto data dai valori tali che
2
>
Esempio 82.1
Per stabilire l'efficacia di un vaccino anti-influenzale stata condotta una ricerca,
somministrando il vaccino a 500 persone e controllando il loro stato di salute per sei mesi
dopo la vaccinazione.
Lo stesso controllo stato fatto su un altro gruppo di 500 persone non vaccinate.
I dati ottenuti sono riassunti nella seguente tabella 1
vaccinati
non vaccinati
Totale
nessuna
influenza
252
224
476
una
influenza
145
136
281
pi di una
influenza
103
140
243
Totale
500
500
1000
vaccinati
non vaccinati
Totale
nessuna
influenza
238
238
476
una
influenza
140.5
140.5
281
pi di una
influenza
121.5
121.5
243
Totale
500
500
1000
i 1 j1
A ij
r
numero righe
c
numero colonne
Si possono disporre i calcoli nella seguente tabella, dove in ogni cella compare il
corrispondente termine della sommatoria; nella cella corrispondente al valore di chi
quadro si fa la somma di tutti gli elementi di questa tabella (utile solo per svolgere i calcoli)
vaccinati
non vaccinati
nessuna
influenza
0.8235
0.8235
una
influenza
0.1441
0.1441
pi di una
influenza
2.8169
2.8169
chi quadro
7.569
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
Conclusioni:
2
0.05
5.991
si rifiuta l'ipotesi nulla, il vaccino efficace
Livello di significativit
Regione di rifiuto
Conclusioni:
0.01
9.210
non si rifiuta l'ipotesi nulla, il vaccino non efficace
0.0227
Conclusione: il valore del p-value, vicino ai livelli di significativit comunemente usati, indica
che ci si trova in una situazione critica.
Esercizio 82.2
C' dipendenza tra tipo di lavoro e sesso del lavoratore?
Un campione di 250 lavoratori mostra i seguenti dati (Tabella 1 - frequenze osservate)
Tabella 1
M
Manager
Professionista
Tecnico
Amministrativo
Servizi
Altro
Totali
Totali
42
30
72
28
12
60
142
48
18
12
108
76
30
72
250
Totali
40.90
31.10
72.00
43.17
17.04
40.90
142.00
32.83
12.96
31.10
108.00
76.00
30.00
72.00
250.00
Manager
Professionista
Tecnico
Amministrativo
Servizi
Altro
0.030
0.039
5.330
1.491
8.924
7.007
1.960
11.734
chi quadro
36.51
Ipotesi nulla H0
Ipotesi alternativa H1
Gradi di libert
Livello di significativit
Regione di rifiuto
3
0.01
11.345
Conclusioni:
Il valore della statistica test chi quadro appartiene alla regione di rifiuto, perci si rifiuta l'ipotesi
nulla: c' dipendenza fra tipo di lavoro e sesso del lavoratore
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
5.829E-08
Torna
su
chi quadro
F156:
chi quadro
Soluzione Esercizio 83
Test chi quadro di indipendenza
Indice
Ritorna Esercizio 83
Esercizio 83.1
Dall'esame del colore dei capelli dei bambini di una certa regione si sono ricavati i seguenti dati
(Tabella 1 - frequenze osservate); stabilire se c' dipendenza fra colore dei capelli
e sesso del bambino, confrontando i dule livelli di significativit
maschi
femmine
Totali
biondo
592
544
1136
nero
36
14
50
Totali
2100
1783
3883
nero
27.04
22.96
50.00
Totali
2100.00
1783.00
3883.00
nero
2.97
3.50
chi-quadro
10.47
maschi
femmine
Totali
biondo
614.37
521.63
1136.00
maschi
femmine
biondo
0.81
0.96
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
rosso
0.04
0.05
castano
0.68
0.80
bruno
0.30
0.36
Conclusioni:
Il valore della statistica test chi quadro non appartiene alla regione di rifiuto, perci non si rifiuta
l'ipotesi nulla. C' evidenza statistica di dipendenza fra colore dei capelli e sesso
Grado di libert
Livello di significativit
Regione di rifiuto
4
0.05
9.488
Conclusioni:
Il valore della statistica test chi quadro appartiene alla regione di rifiuto, perci si rifiuta l'ipotesi nulla
Non c' evidenza statistica di dipendenza fra colore dei capelli e sesso
Confrontando le conclusioni ai due diversi livelli di significativit si evidenzia una situazione critica!
Soluzione con la funzione TEST.CHI
Conclusione:
p-value
0.03325
Esercizio 83.2
E' stata condotta un'indagine su un gruppo di 400 persone per accertare l'eventuale
dipendenza fra il titolo di studio e il giudizio sulla linea politica di un importante quotidiano.
Il titolo di studio stato distinto in 3 fasce: media inferiore, media superiore, laurea.
Sono previste due risposte al quesito: favorevole o contrario.
I risultati sono raccolti nella tabella 3 delle frequenze osservate
Stabilire con il test chi quadro se esiste o no dipendenza fra titolo di studio e giudizio
Tabella 3 - Frequenze osservate
Favorevoli Contrari
Totale
media
inferiore
media
superiore
laurea
Totale
80
65
145
58
110
248
32
55
152
90
165
400
90
55
145
56
102
248
34
63
152
90
165
400
Contrari
1.0902
1.7788
0.0867
0.5796
0.1415
0.9456
chi quadro
4.6224
Ipotesi nulla H0:
Ipotesi alternativa H1
livello significativit
grado libert
chi quadro alfa
livello significativit
grado libert
chi quadro alfa
0.01
2
9.210
Conclusione:
non si rifiuta l'ipotesi nulla, c' indipendenza fra titolo di studio e giudizio
p-value
0.099
Torna
su
chi quadro
Soluzione Esercizio 84
Test chi quadro di indipendenza
Indice
Ritorna Esercizio 84
Esercizio 84.1
Una ditta le cui vendite dipendono esclusivamente dalla pubblicit vuole sapere se c'
dipendenza fra i diversi tipi di mezzi di comunicazione che usa per la pubblicit
e l'et del cliente.
La ditta analizza gli ordini di 450 clienti, da cui risultano l'et del cliente e il mezzo di
comunicazione attraverso il quale il cliente ha conosciuto l'azienda, e raccoglie le
informazioni riportate nella tabella 1 (frequenze osservate)
Stabilire con il test chi quadro se c' dipendenza fra et e mezzo di comunicazione.
Livello di significativit alfa = 0,05
internet
televisione
stampa
Totale
>50
Totale
12
25
19
56
135
202
113
450
internet
televisione
stampa
Totale
>50
Totale
16.8
135
25.1
202
14.1
113
56
450
0.13
0.45
0.24
3140
0.33
0.00
0.43
4150
0.12
0.86
0.74
>50
1.37
0.00
1.73
chi
quadro
6.43
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
p-value
0.377
Esercizio 84.2
Un'azienda interessata a valutare se c' una relazione tra il tempo impiegato dai
propri impiegati per raggiungere il luogo di lavoro e il livello di stress sul lavoro.
Uno studio condotto su 116 impiegati con mansioni simili ha portato ai risultati della
tabella 3 (frequenze osservate).
Stabilire con il test chi quadro se c' dipendenza fra tempo impiegato per
raggiungere il luogo di lavoro e livello di stress.
Confrontare i due livelli di significativit alfa = 5% e alfa =1% e trarre le conclusioni
tempo impiegato
meno di 15 minuti
da 15 a 45 minuti
pi di 45 minuti
Totale
tempo impiegato
meno di 15 minuti
da 15 a 45 minuti
pi di 45 minuti
Totale
tempo impiegato
meno di 15 minuti
da 15 a 45 minuti
pi di 45 minuti
livello di stress
alto
medio
0.81
0.01
0.48
0.05
3.31
0.17
basso
0.78
0.59
3.62
chi quadro
9.83
Ipotesi nulla H0
Ipotesi alternativa H1
Grado di libert
Livello di significativit
Regione di rifiuto
0.01
13.277
p-value
0.043
Conclusione: il valore del p-value compreso fra i livelli classici di significativit e conferma
che siamo in presenza di una decisione critica.
Torna
su
chi quadro
G100:
chi quadro