You are on page 1of 8

Estatstica II

Sociologia e Sociologia e Planeamento

ISCTE
SOCIOLOGIA E SOCIOLOGIA E PLANEAMENTO
Ano Lectivo 2003/2004 (2 Semestre)

ESTATSTICA II
(Textos de Apoio das Aulas)

Testes de Hipteses
Teste Para a Diferena de Mdias em Amostras Emparelhadas
(paired-samples t-test)
Carlos Loureno, Dep. Mtodos Quantitativos
(carlos.lourenco@iscte.pt)

Carlos Loureno

ISCTE, 2004

Estatstica II
Sociologia e Sociologia e Planeamento

3. TESTES PARAMTRICOS (cont.)


Todos os testes de hipteses sero realizados para um nvel de significncia de 5% ( = 0,05 ).

3.2. Teste Para a Diferena de 2 Mdias Populacionais

Relembremos os conceitos de amostras independentes e de amostras emparelhadas.


Duas (ou mais) amostras dizem-se independentes se os indivduos das vrias amostras so
seleccionados de forma independente, ou seja, se estes no esto (propositadamente ou no)
relacionados entre si.
Duas (ou mais) amostras dizem-se emparelhadas se os indivduos das vrias amostras esto de
alguma forma relacionados entre si. Os exemplos mais comuns so as investigaes com grupos
experimentais: comportamento dos doentes depressivos antes e depois de sujeitos ao tratamento
com um novo anti-depressivo;
3.2.2. Amostras Emparelhadas (com n1 , n 2 > 30 , ou seja, grandes amostras)

A fim de se saber se a mdia da nota esperada a Estatstica II (populao 2) significativamente


superior nota obtida em Estatstica I (populao 1), vai efectuar-se um teste para comparar as
duas mdias num mesmo grupo de alunos.1

Formulao das hipteses estatsticas

No enunciado do problema em anlise no referida a igualdade, pelo que a hiptese postulada


corresponde hiptese alternativa. Na hiptese alternativa vir ento a hiptese de que a mdia
da nota esperada a Estatstica II superior mdia da nota obtida a Estatstica I. A hiptese nula
tem obrigatoriamente de conter a igualdade, em exclusivo ou formando o complementar da
hiptese alternativa:
H 0 : 1 = 2 ou H 0 : 1 2
H a : 1 < 2 ou H a : 1 < 2

Habitualmente, escrevemos ento as hipteses como:


H 0 : 1 2 = 0 2
H a : 1 2 < 0 (teste unilateral esquerda)
Dado que estamos na presena de pares de observaes feitas sobre os mesmos elementos, as
amostras no so independentes. Ou seja, as observaes esto relacionadas entre si (alm do facto
de, para as 2 notas, se tratarem excatamente dos mesmos alunos). Assim sendo, o teste ser
igualdade de mdias entre os dois pares de observaes e ser necessrio calcular as diferenas de
valores para cada par de observaes. A estas diferenas chamamos Di : Di = X 1i X 2i .

In Helena Carvalho (2004), Interpretao de Outputs do SPSS - Intervalo de Confiana para a


Diferena de Duas Mdias Populacionais e Ensaio de Hipteses para a Diferena de Duas Mdias
Populacionais, Textos de apoio das aulas, p.11 (adaptado).
2
Ao escrevermos assim a hiptese nula, a interpretao pode ser lida como a diferena entre as mdias
no significativa (ou seja, nula).

Carlos Loureno

ISCTE, 2004

Estatstica II
Sociologia e Sociologia e Planeamento

Sob H 0 ( H 0 verdadeira), os valores de D pertencem a uma populao de mdia zero, e


podemos ento escrever novamente as hipteses anteriores como:
H0 : D = 0
H a : D < 0 (teste unilateral esquerda)

Escolha da estatstica de teste (escolha do teste adequado)

Neste caso, a estatstica de teste a seguinte:


D D
, a qual, sob H 0 , segue uma t de Student com n-1 graus de liberdade: t t ( n 1) .
t=
s' D
n
Em que a mdia e o desvio-padro amostrais de D so dados por:
n

D=

(D
n

Di

i =1

e s' D =

D)

i =1

n 1

Note-se agora a semelhana deste teste com o teste para uma mdia, porque efectivamente
estamos a testar a diferena de mdias (entre amostras emparelhadas) atravs de um teste a uma
s mdia (a mdia populacional de D, D ).
Uma vez que testamos se a mdia populacional de D nula ( D = 0 ), o teste simplifica-se para
t=

s'
D
t ( n 1) (simplesmente, a mdia amostral D sobre o seu erro-padro D ).3
s' D
n
n

Mas com quantos pares de observaes vamos contar para a realizao deste teste?
Consideremos a seguinte informao:4
Descriptive Statistics
N
Que nota obteve em
Estatstica I?
Que nota espera vir a
ter em Estatstica II?
Valid N (listwise)

Mean
114

8,85

152

11,69

110

Como se pode verificar, houve consideravelmente mais respostas questo sobre a nota
esperada para o 2 semestre (152 respostas) do que questo sobre a nota obtida no 1 semestre
(114 respostas). Obtiveram-se 110 respostas simultaneamente s duas questes (listwise),
significando que muitos dos alunos no responderam questo relativa nota obtida em
Estatstica I (provavelmente porque no tiveram aprovao cadeira), mas expressaram a sua
expectativa face a Estatstica II. Do quadro sobressai ainda o contraste entre a mdia negativa
das notas no 1 semestre e o visvel optimismo para o 2 semestre.
Apenas por curiosidade, vejamos agora a informao relativa apenas aos 110 alunos que
responderam a ambas as questes:
3

Tal como anteriormente para uma mdia populacional, a aplicao do teste t para 2 amostras
emparelhadas pressupe que a varivel D tenha uma distribuio normal. Em amostras de grande
dimenso habitual aplicarmos o T.L.C. e negligenciar a aplicao prvia do teste K-S normalidade.
4
Comando no SPSS: Analyze Descriptive Statistics Descriptives Options Mean

Carlos Loureno

ISCTE, 2004

Estatstica II
Sociologia e Sociologia e Planeamento
Statistic
Que nota obteve em
Estatstica I?
Que nota espera vir a ter
em Estatstica II?

Mean

8,89

Mean

11,93

H apenas a registar um ligeiro aumento na mdia da nota esperada a Estatstica II, que se
explica por muitos dos alunos que no responderam questo sobre Estatstica I no estarem
tambm a ser includos para o clculo da mdia da questo sobre Estatstica II. Era de esperar
que este valor aumentasse uma vez que sairam os alunos que por no terem tido avaliao no 1
semestre tm as expectativas um pouco mais baixas para o 2 semestre.
Como podemos ento realizar os clculos para este teste? Podemos muito simplesmente incluir
no SPSS uma nova varivel D que corresponder exactamente s diferenas entre as duas
variveis nota obtida e nota esperada, e obter os dados necessrios.5 Veja-se o aspecto geral
desta varivel: Di .
Diferena entre nota obtida e nota esperada a Estatstica
Di

Di

Di

Di

Di

Di

Di

Di

(missing)

19

39

-2

53

63

-1

73

-3

85

-2

96

-1

-2

20

-3

40

(missing)

(missing)

(missing)

(missing)

(missing)

-4

21

-2

41

-10

54

-4

(missing)

74

-8

(missing)

97

-8

(missing)

22

-5

42

55

-2

64

-5

75

-1

(missing)

98

-8

(missing)

43

-3

56

(missing)

(missing)

86

-5

99

-2

-5

23

44

(missing)

65

76

(missing)

100

24

45

-2

(missing)

(missing)

(missing)

(missing)

101

-3

-6

25

-2

(missing)

(missing)

66

77

-3

(missing)

(missing)

-3

26

-7

(missing)

(missing)

(missing)

(missing)

87

-8

(missing)

-4

27

-1

46

-5

57

-2

(missing)

78

88

-10

102

-5

-3

28

-4

(missing)

(missing)

67

79

-8

89

-4

103

-4

10

-2

29

-2

47

(missing)

68

-5

80

-5

90

-6

(missing)

11

-2

30

-9

48

58

-4

(missing)

(missing)

91

-8

(missing)

12

-4

31

-2

(missing)

(missing)

(missing)

(missing)

92

-1

104

-4

13

-7

32

-9

(missing)

59

-1

69

81

-9

93

-2

105

-2

14

-1

33

-2

(missing)

60

(missing)

(missing)

94

-1

106

15

-3

34

-3

49

(missing)

70

(missing)

(missing)

107

-9

16

-4

35

-15

(missing)

(missing)

(missing)

82

-5

(missing)

108

-6

17

36

-1

50

-2

61

-8

71

83

-1

(missing)

109

-5

(missing)

37

-6

51

62

72

-3

84

-1

95

-10

110

18

-3

38

-3

52

(missing)

E a mdia amostral desta nova varivel D, vem


n

D ( 2) + ( 4) + ( 8) + K + ( 6) + ( 5) + (0)
D=
=
= 3,04
i

i =1

110

A explicao para a construo da varivel D encontra-se em Helena Carvalho (2004), Interpretao de


Outputs do SPSS - Intervalo de Confiana para a Diferena de Duas Mdias Populacionais e Ensaio de
Hipteses para a Diferena de Duas Mdias Populacionais, Textos de apoio das aulas, pags. 16 e 17.

Carlos Loureno

ISCTE, 2004

Estatstica II
Sociologia e Sociologia e Planeamento

e o desvio-padro amostral corrigido de D fica

(D
n

s' D =
=

D)

i =1

n 1

( 2 ( 3,04))2 + ( 4 ( 3,04))2 + ( 8 ( 3,04))2 + K + ( 6 ( 3,04))2 + ( 5 ( 3,04))2 + (0 ( 3,04))2


109

= 3,240

E finalmente obtemos o valor da estatstica de teste


D
3,04 3,04 3,03636
t=
=
=
=
= 9,828 .6
3,240 0,309
s' D
0,30859
110
n

Determinao do valor crtico e Tomada de deciso

O valor crtico do teste dado pelo valor da distribuio t de Student para uma probabilidade
1 = 1 0,05 = 0,95 (uma vez que o teste unilateral) e com 109 graus de liberdade
( n 1 = 110 1 = 109 ), ou seja, t1 ;( n 1) = t 0,95;(109) 1,658 .

Assim sendo, uma vez que t t 0,95;(109) 9,828 < 1,658 , e portanto a estatstica de teste se
situa na regio de rejeio, a hiptese nula rejeitada. Note-se que embora a hiptese nula esteja
formulada para a mdia populacional das diferenas, ela corresponde, como vimos, hiptese
nula inicial que postula no haver diferenas entre a mdia das notas esperadas a Estatstica e a
mdia das notas obtidas a Estatstica I.
Concluindo, atravs da amostra recolhida e com um nvel de significncia de 5% (probabilidade
de cometer o Erro Tipo I: rejeitar H 0 quando H 0 verdadeira), rejeita-se a hiptese nula de
no existncia de uma diferena significativa entre as duas mdias na populao (alunos de
Sociologia e Sociologia e Planeamento do ISCTE inscritos a Estatstica no ano lectivo 20032004), havendo por isso evidncia estatstica para afirmar que a mdia da nota esperada a
Estatstica II superior mdia da nota obtida a Estatstica I (hiptese alternativa H a ).
Atravs do SPSS, temos exactamente os mesmos resultados
Paired Samples Test
Paired Differences

Mean
Pair
1

Que nota obteve em


Estatstica I? - Que
nota espera vir a ter
em Estatstica II?

-3,04

Std. Deviation

Std. Error
Mean

3,240

,309

95% Confidence
Interval of the
Difference
Lower
Upper
-3,65

-2,42

t
-9,828

df

Sig. (2-tailed)
109

,000

Nota final
Note-se que neste exemplo usmos a distribuio t de Student mesmo com amostras de grande
dimenso, podendo, no entanto, usar-se a sua aproximao normal-padro:

Usaram-se propositadamente 5 casas decimais de modo a obter o mesmo valor da estatstica dado pelo
SPSS.

Carlos Loureno

ISCTE, 2004

Estatstica II
Sociologia e Sociologia e Planeamento

Z=

D o
N (0,1) , e, obviamente, o valor da estatstica de teste Z, o mesmo, -9,828.
s' D
n

O valor crtico do teste agora dado pelo valor da distribuio normal-padro para uma
probabilidade 1 = 1 0,05 = 0,95 , ou seja, z 0,95 = 1,645 . Desta forma, a deciso
anteriormente obtida de rejeio de H 0 mantm-se: Z z 0,95 9,828 < 1,645 .7

3.2.2. Amostras Emparelhadas (com n1 , n 2 30 , ou seja, pequenas amostras)


Desta feita, queremos agora saber se a mdia da nota esperada a Estatstica II (populao 2)
significativamente superior nota obtida em Estatstica I (populao 1) na turma SA3 (8 alunos
na amostra). Na amostra, os 8 alunos da turma SA3 que responderam a ambas as questes
apresentam os seguintes valores:
Que nota obteve em
Estatstica I?
Que nota espera vir a ter
em Estatstica II?

Mean
Mean

11,63
12,13

Formulao das hipteses estatsticas


H 0 : 1 2 = 0
H a : 1 2 < 0 (teste unilateral esquerda)

Escolha da estatstica de teste (escolha do teste adequado)


D
t=
t ( n 1)
s' D
n
Uma vez que estamos a lidar com uma amostra de pequena dimenso, a distribuio daquela
estatstica de teste no pode ser aproximada a uma distribuio normal-padro, seguindo
portanto uma distribuio t de Student como definido originalmente.
Mas antes de avanar com este teste necessrio verificar o pressuposto para a sua aplicao, o
de que a varivel D segue uma normal. Depois de construda a varivel D no SPSS aplica-se um
teste K-S (com a correco de Lilliefors8) a essa mesma varivel, sendo as nossas hipteses as
seguintes:9
H 0 : a varivel D segue uma distribuio normal
H a : a varivel D no segue uma distribuio normal
7

Note-se, tal como seria de prever, a proximidade dos valores crticos da distribuio t de Student e da
distribuio normal padro para a mesma probabilidade associada: -1,658 e -1,645, respectivamente.
8
Quando no se conhecem os parmetros populacionais, o teste K-S v a sua potncia (rej. H 0 quando

H 0 falsa, ou seja, capacidade de levar a uma deciso correcta) diminuir de forma desconhecida. Como
tal, nessa situao, deve usar-se a correco de Lilliefors.
Mais uma vez se insiste que o teste K-S (de Kolmogorov-Smirnov) ser devidamente apresentado no
captulo dos testes no-paramtricos.
9

Carlos Loureno

ISCTE, 2004

Estatstica II
Sociologia e Sociologia e Planeamento

E temos o seguinte output:


Tests of Normalityb
a

Kolmogorov-Smirnov
Statistic
df
Sig.
Diferena entre nota
obtida e nota esperada
a Estatstica

,342

Statistic

,006

Shapiro-Wilk
df

,840

Sig.
,075

a. Lilliefors Significance Correction


b. Turma = SA3

Qual dos dois testes devemos usar? o Kolmogorov-Smirnov ou o Shapiro-Wilk? Dado que o
SPSS apresenta o teste de Shapiro-Wilk sempre que tivermos um n 50 , e apesar de este teste
no ser tradicionalmente muito usado para testar a normalidade, ele prefervel ao K-S em
pequenas amostras n 30 .10 O resultado do teste de Shapiro-Wilk, para um nvel de
significncia de 5%, leva ento no rejeio da hiptese de normalidade da varivel D (para o
mesmo nvel de significncia o teste K-S levaria deciso contrria):
p value > 0,05 0,075 > 0,05
Uma vez que o pressuposto de normalidade que preside aplicao do teste para a diferena de
duas mdias em amostras emparelhadas de pequena dimenso no foi violado, a nossa anlise
pode prosseguir nos termos em que foi apresentada.11

Vejamos a informao de que dispomos relativamente amostra de 8 alunos da turma SA3:


Descriptive Statisticsa
N
Diferena entre nota
obtida e nota esperada
a Estatstica
Valid N (listwise)

Mean
8

-,50

Std. Deviation
2,138

a. Turma = SA3

Ento t =

D
0,50 0,50
=
=
= 0,661
s' D
2,138 0,756
8
n

Tal como j foi dito, neste caso (amostra de pequena dimenso) a estatstica de teste, sob H 0 ,
segue uma t de Student com n-1 graus de liberdade: t t ( n 1) .

Determinao do valor crtico e Tomada de deciso


O valor crtico do teste dado pelo valor da distribuio t de Student para uma probabilidade
1 = 1 0,05 = 0,95 (uma vez que o teste unilateral) e com 7 graus de liberdade
( n 1 = 8 1 = 7 ), ou seja, t1 ;( n 1) = t 0,95;( 7 ) = 1,895 .

10

Nestas condies, o teste de Shapiro-Wilk revela-se mais potente que o teste de K-S. A potncia de um
teste refere-se sua capacidade de rejeitar a hiptese nula quando este falsa, ou seja, sua capacidade
de tomar uma deciso correcta.
11
Caso o pressuposto fosse violado, e como sempre se faz quando um pressuposto de um teste
paramtrico violado, teramos de avanar para uma anlise no-paramtrica aplicando testes noparamtricos equivalentes. Neste caso, o teste no-paramtrico equivalente ao teste t paramtrico para
duas amostras emparelhadas o teste de Wilcoxon.

Carlos Loureno

ISCTE, 2004

Estatstica II
Sociologia e Sociologia e Planeamento

Assim sendo, uma vez que t > t 0,95;( 7 ) 0,661 > 1,895 , e portanto a estatstica de teste se
situa na regio de no rejeio, a hiptese nula no rejeitada.
Concluindo, atravs da amostra recolhida e com um nvel de significncia de 5% (probabilidade
de cometer o Erro Tipo I: rejeitar H 0 quando H 0 verdadeira), no se rejeita a hiptese nula
de no existncia de uma diferena significativa entre as duas mdias na populao (alunos de
Sociologia e Sociologia e Planeamento do ISCTE inscritos a Estatstica no ano lectivo 20032004 na turma SA3). A diferena no estatisticamente significativa.
Atravs do SPSS:
Paired Samples Testa
Paired Differences

Mean
Pair
1

Que nota obteve em


Estatstica I? - Que
nota espera vir a ter
em Estatstica II?

-,50

Std. Deviation

Std. Error
Mean

2,138

,756

95% Confidence
Interval of the
Difference
Lower
Upper
-2,29

1,29

t
-,661

df

Sig. (2-tailed)
7

,529

a. Turma = SA3

Como se comprova, a hiptese nula no rejeitada ( p value > 0,05 ).

Carlos Loureno

ISCTE, 2004

You might also like