Professional Documents
Culture Documents
ISCTE
SOCIOLOGIA E SOCIOLOGIA E PLANEAMENTO
Ano Lectivo 2003/2004 (2 Semestre)
ESTATSTICA II
(Textos de Apoio das Aulas)
Testes de Hipteses
Teste Para a Diferena de Mdias em Amostras Emparelhadas
(paired-samples t-test)
Carlos Loureno, Dep. Mtodos Quantitativos
(carlos.lourenco@iscte.pt)
Carlos Loureno
ISCTE, 2004
Estatstica II
Sociologia e Sociologia e Planeamento
Carlos Loureno
ISCTE, 2004
Estatstica II
Sociologia e Sociologia e Planeamento
D=
(D
n
Di
i =1
e s' D =
D)
i =1
n 1
Note-se agora a semelhana deste teste com o teste para uma mdia, porque efectivamente
estamos a testar a diferena de mdias (entre amostras emparelhadas) atravs de um teste a uma
s mdia (a mdia populacional de D, D ).
Uma vez que testamos se a mdia populacional de D nula ( D = 0 ), o teste simplifica-se para
t=
s'
D
t ( n 1) (simplesmente, a mdia amostral D sobre o seu erro-padro D ).3
s' D
n
n
Mas com quantos pares de observaes vamos contar para a realizao deste teste?
Consideremos a seguinte informao:4
Descriptive Statistics
N
Que nota obteve em
Estatstica I?
Que nota espera vir a
ter em Estatstica II?
Valid N (listwise)
Mean
114
8,85
152
11,69
110
Como se pode verificar, houve consideravelmente mais respostas questo sobre a nota
esperada para o 2 semestre (152 respostas) do que questo sobre a nota obtida no 1 semestre
(114 respostas). Obtiveram-se 110 respostas simultaneamente s duas questes (listwise),
significando que muitos dos alunos no responderam questo relativa nota obtida em
Estatstica I (provavelmente porque no tiveram aprovao cadeira), mas expressaram a sua
expectativa face a Estatstica II. Do quadro sobressai ainda o contraste entre a mdia negativa
das notas no 1 semestre e o visvel optimismo para o 2 semestre.
Apenas por curiosidade, vejamos agora a informao relativa apenas aos 110 alunos que
responderam a ambas as questes:
3
Tal como anteriormente para uma mdia populacional, a aplicao do teste t para 2 amostras
emparelhadas pressupe que a varivel D tenha uma distribuio normal. Em amostras de grande
dimenso habitual aplicarmos o T.L.C. e negligenciar a aplicao prvia do teste K-S normalidade.
4
Comando no SPSS: Analyze Descriptive Statistics Descriptives Options Mean
Carlos Loureno
ISCTE, 2004
Estatstica II
Sociologia e Sociologia e Planeamento
Statistic
Que nota obteve em
Estatstica I?
Que nota espera vir a ter
em Estatstica II?
Mean
8,89
Mean
11,93
H apenas a registar um ligeiro aumento na mdia da nota esperada a Estatstica II, que se
explica por muitos dos alunos que no responderam questo sobre Estatstica I no estarem
tambm a ser includos para o clculo da mdia da questo sobre Estatstica II. Era de esperar
que este valor aumentasse uma vez que sairam os alunos que por no terem tido avaliao no 1
semestre tm as expectativas um pouco mais baixas para o 2 semestre.
Como podemos ento realizar os clculos para este teste? Podemos muito simplesmente incluir
no SPSS uma nova varivel D que corresponder exactamente s diferenas entre as duas
variveis nota obtida e nota esperada, e obter os dados necessrios.5 Veja-se o aspecto geral
desta varivel: Di .
Diferena entre nota obtida e nota esperada a Estatstica
Di
Di
Di
Di
Di
Di
Di
Di
(missing)
19
39
-2
53
63
-1
73
-3
85
-2
96
-1
-2
20
-3
40
(missing)
(missing)
(missing)
(missing)
(missing)
-4
21
-2
41
-10
54
-4
(missing)
74
-8
(missing)
97
-8
(missing)
22
-5
42
55
-2
64
-5
75
-1
(missing)
98
-8
(missing)
43
-3
56
(missing)
(missing)
86
-5
99
-2
-5
23
44
(missing)
65
76
(missing)
100
24
45
-2
(missing)
(missing)
(missing)
(missing)
101
-3
-6
25
-2
(missing)
(missing)
66
77
-3
(missing)
(missing)
-3
26
-7
(missing)
(missing)
(missing)
(missing)
87
-8
(missing)
-4
27
-1
46
-5
57
-2
(missing)
78
88
-10
102
-5
-3
28
-4
(missing)
(missing)
67
79
-8
89
-4
103
-4
10
-2
29
-2
47
(missing)
68
-5
80
-5
90
-6
(missing)
11
-2
30
-9
48
58
-4
(missing)
(missing)
91
-8
(missing)
12
-4
31
-2
(missing)
(missing)
(missing)
(missing)
92
-1
104
-4
13
-7
32
-9
(missing)
59
-1
69
81
-9
93
-2
105
-2
14
-1
33
-2
(missing)
60
(missing)
(missing)
94
-1
106
15
-3
34
-3
49
(missing)
70
(missing)
(missing)
107
-9
16
-4
35
-15
(missing)
(missing)
(missing)
82
-5
(missing)
108
-6
17
36
-1
50
-2
61
-8
71
83
-1
(missing)
109
-5
(missing)
37
-6
51
62
72
-3
84
-1
95
-10
110
18
-3
38
-3
52
(missing)
D ( 2) + ( 4) + ( 8) + K + ( 6) + ( 5) + (0)
D=
=
= 3,04
i
i =1
110
Carlos Loureno
ISCTE, 2004
Estatstica II
Sociologia e Sociologia e Planeamento
(D
n
s' D =
=
D)
i =1
n 1
= 3,240
O valor crtico do teste dado pelo valor da distribuio t de Student para uma probabilidade
1 = 1 0,05 = 0,95 (uma vez que o teste unilateral) e com 109 graus de liberdade
( n 1 = 110 1 = 109 ), ou seja, t1 ;( n 1) = t 0,95;(109) 1,658 .
Assim sendo, uma vez que t t 0,95;(109) 9,828 < 1,658 , e portanto a estatstica de teste se
situa na regio de rejeio, a hiptese nula rejeitada. Note-se que embora a hiptese nula esteja
formulada para a mdia populacional das diferenas, ela corresponde, como vimos, hiptese
nula inicial que postula no haver diferenas entre a mdia das notas esperadas a Estatstica e a
mdia das notas obtidas a Estatstica I.
Concluindo, atravs da amostra recolhida e com um nvel de significncia de 5% (probabilidade
de cometer o Erro Tipo I: rejeitar H 0 quando H 0 verdadeira), rejeita-se a hiptese nula de
no existncia de uma diferena significativa entre as duas mdias na populao (alunos de
Sociologia e Sociologia e Planeamento do ISCTE inscritos a Estatstica no ano lectivo 20032004), havendo por isso evidncia estatstica para afirmar que a mdia da nota esperada a
Estatstica II superior mdia da nota obtida a Estatstica I (hiptese alternativa H a ).
Atravs do SPSS, temos exactamente os mesmos resultados
Paired Samples Test
Paired Differences
Mean
Pair
1
-3,04
Std. Deviation
Std. Error
Mean
3,240
,309
95% Confidence
Interval of the
Difference
Lower
Upper
-3,65
-2,42
t
-9,828
df
Sig. (2-tailed)
109
,000
Nota final
Note-se que neste exemplo usmos a distribuio t de Student mesmo com amostras de grande
dimenso, podendo, no entanto, usar-se a sua aproximao normal-padro:
Usaram-se propositadamente 5 casas decimais de modo a obter o mesmo valor da estatstica dado pelo
SPSS.
Carlos Loureno
ISCTE, 2004
Estatstica II
Sociologia e Sociologia e Planeamento
Z=
D o
N (0,1) , e, obviamente, o valor da estatstica de teste Z, o mesmo, -9,828.
s' D
n
O valor crtico do teste agora dado pelo valor da distribuio normal-padro para uma
probabilidade 1 = 1 0,05 = 0,95 , ou seja, z 0,95 = 1,645 . Desta forma, a deciso
anteriormente obtida de rejeio de H 0 mantm-se: Z z 0,95 9,828 < 1,645 .7
Mean
Mean
11,63
12,13
Note-se, tal como seria de prever, a proximidade dos valores crticos da distribuio t de Student e da
distribuio normal padro para a mesma probabilidade associada: -1,658 e -1,645, respectivamente.
8
Quando no se conhecem os parmetros populacionais, o teste K-S v a sua potncia (rej. H 0 quando
H 0 falsa, ou seja, capacidade de levar a uma deciso correcta) diminuir de forma desconhecida. Como
tal, nessa situao, deve usar-se a correco de Lilliefors.
Mais uma vez se insiste que o teste K-S (de Kolmogorov-Smirnov) ser devidamente apresentado no
captulo dos testes no-paramtricos.
9
Carlos Loureno
ISCTE, 2004
Estatstica II
Sociologia e Sociologia e Planeamento
Kolmogorov-Smirnov
Statistic
df
Sig.
Diferena entre nota
obtida e nota esperada
a Estatstica
,342
Statistic
,006
Shapiro-Wilk
df
,840
Sig.
,075
Qual dos dois testes devemos usar? o Kolmogorov-Smirnov ou o Shapiro-Wilk? Dado que o
SPSS apresenta o teste de Shapiro-Wilk sempre que tivermos um n 50 , e apesar de este teste
no ser tradicionalmente muito usado para testar a normalidade, ele prefervel ao K-S em
pequenas amostras n 30 .10 O resultado do teste de Shapiro-Wilk, para um nvel de
significncia de 5%, leva ento no rejeio da hiptese de normalidade da varivel D (para o
mesmo nvel de significncia o teste K-S levaria deciso contrria):
p value > 0,05 0,075 > 0,05
Uma vez que o pressuposto de normalidade que preside aplicao do teste para a diferena de
duas mdias em amostras emparelhadas de pequena dimenso no foi violado, a nossa anlise
pode prosseguir nos termos em que foi apresentada.11
Mean
8
-,50
Std. Deviation
2,138
a. Turma = SA3
Ento t =
D
0,50 0,50
=
=
= 0,661
s' D
2,138 0,756
8
n
Tal como j foi dito, neste caso (amostra de pequena dimenso) a estatstica de teste, sob H 0 ,
segue uma t de Student com n-1 graus de liberdade: t t ( n 1) .
10
Nestas condies, o teste de Shapiro-Wilk revela-se mais potente que o teste de K-S. A potncia de um
teste refere-se sua capacidade de rejeitar a hiptese nula quando este falsa, ou seja, sua capacidade
de tomar uma deciso correcta.
11
Caso o pressuposto fosse violado, e como sempre se faz quando um pressuposto de um teste
paramtrico violado, teramos de avanar para uma anlise no-paramtrica aplicando testes noparamtricos equivalentes. Neste caso, o teste no-paramtrico equivalente ao teste t paramtrico para
duas amostras emparelhadas o teste de Wilcoxon.
Carlos Loureno
ISCTE, 2004
Estatstica II
Sociologia e Sociologia e Planeamento
Assim sendo, uma vez que t > t 0,95;( 7 ) 0,661 > 1,895 , e portanto a estatstica de teste se
situa na regio de no rejeio, a hiptese nula no rejeitada.
Concluindo, atravs da amostra recolhida e com um nvel de significncia de 5% (probabilidade
de cometer o Erro Tipo I: rejeitar H 0 quando H 0 verdadeira), no se rejeita a hiptese nula
de no existncia de uma diferena significativa entre as duas mdias na populao (alunos de
Sociologia e Sociologia e Planeamento do ISCTE inscritos a Estatstica no ano lectivo 20032004 na turma SA3). A diferena no estatisticamente significativa.
Atravs do SPSS:
Paired Samples Testa
Paired Differences
Mean
Pair
1
-,50
Std. Deviation
Std. Error
Mean
2,138
,756
95% Confidence
Interval of the
Difference
Lower
Upper
-2,29
1,29
t
-,661
df
Sig. (2-tailed)
7
,529
a. Turma = SA3
Carlos Loureno
ISCTE, 2004