Professional Documents
Culture Documents
INSTITUTO DE MATEMTICA
Cadernos de Matemtica e Estatstica
Srie B: Trabalho de Apoio Didtico
Elsa Mundstock
Jandyra Maria Guimares Fachel
Suzi Alves Camey
Marilyn Agranonik
Srie B, Nmero XX
Porto Alegre - maio de 2006
NDICE
1. INTRODUO AO SPSS ........................................................................................................ 3
1.1 - BANCO DE DADOS: Definio ............................................................................... 4
1.2 - COMO CRIAR UM BANCO DE DADOS................................................................. 4
1.3 - COMO DAR NOME AOS NVEIS DE UMA VARIVEL ......................................... 5
1.4 - COMO ACESSAR UM BANCO DE DADOS J EXISTENTE ................................ 6
2. INTRODUO AOS MTODOS ESTATSTICOS.................................................................. 7
2.1 - TIPOS DE VARIVEIS: Definio........................................................................... 7
2.2 - DESCRIO E EXPLORAO DE DADOS.......................................................... 7
2.3 - CATEGORIZAO DE VARIVEIS ....................................................................... 8
2.3.1 - COMO CATEGORIZAR UMA VARIVEL QUANTITATIVA................................ 8
2.3.2 - COMO DAR NOME AOS NVEIS DE UMA VARIVEL .................................... 10
2.4 - COMO CRIAR UMA VARIVEL A PARTIR DE UMA DATA................................ 10
2.5 - COMO CRIAR UMA VARIVEL ATRAVS DA COMBINAO DE OUTRAS
DUAS ............................................................................................................................. 10
3. ANLISE UNIVARIADA ......................................................................................................... 12
3.1 - VARIVEIS QUANTITATIVAS .............................................................................. 12
3.1.1 - COMO OBTER AS ESTATSTICAS DESCRITIVAS ......................................... 12
3.1.2 - COMO OBTER UM HISTOGRAMA ................................................................... 12
3.2 - VARIVEIS CATEGRICAS (QUALITATIVAS)................................................... 13
3.2.1 - COMO OBTER A DISTRIBUIO DE FREQNCIAS ................................... 13
3.2.2 - COMO OBTER GRFICOS ............................................................................... 14
4. ANLISE BIVARIADA ............................................................................................................ 16
4.1 - VARIVEIS QUANTITATIVAS X QUANTITATIVAS............................................. 16
4.1.1 - COMO CALCULAR A CORRELAO ENTRE DUAS VARIVEIS
QUANTITATIVAS........................................................................................................... 16
4.1.2 - COMO OBTER GRFICO
DE PONTOS (SCATTERPLOT) ................. 16
4.1.3 - COMO OBTER O COEFICIENTE DE CORRELAO DE PEARSON ............ 18
4.1.4 - COMO FAZER REGRESSO LINEAR SIMPLES............................................. 19
4.2 - VARIVEIS CATEGRICAS X CATEGRICAS ................................................. 22
4.2.1 - COMO VERIFICAR A EXISTNCIA DE ASSOCIAO ENTRE VARIVEIS
CATEGRICAS: Teste Qui - Quadrado........................................................................ 23
4.2.2 - COMO CALCULAR OS RESDUOS AJUSTADOS ........................................... 26
4.3 - VARIVEIS QUANTITATIVAS X CATEGRICAS ............................................... 27
4.3.1 - COMO FAZER O BOX-PLOT............................................................................. 28
5. COMPARAO DE MDIAS................................................................................................. 31
5.1 - COMO COMPARAR MDIAS ENTRE DOIS GRUPOS: Teste t para Amostras
Independentes. .............................................................................................................. 31
5.2 - COMO COMPARAR AS MDIAS DE TRES OU MAIS GRUPOS: Anlise de
Varincia ANOVA para um fator ............................................................................. 33
7. MANIPULAO DE DADOS ................................................................................................. 36
7.1 SORT CASES.......................................................................................................... 36
7.2 SELECT CASES...................................................................................................... 37
7.3 SPLIT FILE............................................................................................................... 39
7.4 MANIPULAO DE ARQUIVOS............................................................................. 41
7.5 COMO APAGAR ANLISES NO DESEJADAS NO ARQUIVO DE RESULTADOS
*.spo............................................................................................................................. 41
7.6 COMO REALIZAR ALTERAES DE DADOS PARA CONSTRUO DE
GRFICO....................................................................................................................... 41
8. ESTATSTICA NO PARAMTRICA .................................................................................... 43
8.1 TESTE DE KOLMOGOROV-SMIRNOV.................................................................. 43
9. AMOSTRAGEM...................................................................................................................... 45
1. INTRODUO AO SPSS
O pacote estatstico SPSS (Statistical Package for Social
Sciences) uma ferramenta para anlise de dados utilizando tcnicas
estatsticas bsicas e avanadas. um software estatstico de fcil
manuseio internacionalmente utilizado h muitas dcadas, desde suas
verses para computadores de grande porte.
Tela inicial do SSPS 13.0 for Windows.
(a)
(b)
Figura 1: Tela inicial do SSPS 13.0 for Windows. 1(a): Planilha Data View;
1(b): Planilha Variable View.
b)
c)
d)
e)
f)
g)
h)
a)
b)
c)
d)
e)
CATEGORIZAR
UMA
VARIVEL
Frequencies
Statistics
Population in thousands
N
Valid
Missing
Percentiles 25
50
75
109
0
5000,00
10400,00
37100,00
Intervalo de valores
Mnimo at 5000,00
5001,00 at 10400,00
10401,00 at 37100,00
37101,00 at o Mximo no Banco de Dados
11
3. ANLISE UNIVARIADA
3.1 - VARIVEIS QUANTITATIVAS
3.1.1 - COMO OBTER AS ESTATSTICAS DESCRITIVAS
Para calcular as estatsticas descritivas procede-se da seguinte
forma:
a) Clicar em Analyze, Descriptive Statistics, Descriptives;
b) Localizar na janela esquerda a varivel de interesse (por
exemplo, mortalidade infantil) e clicar na ;
c) Clicar em Options, e assinalar as opes desejadas;
d) Clicar em Continue; OK;
e) Os resultados da anlise estatstica aparecem na janela de
resultados (OUTPUT), que poder ser salva, dando origem a um
arquivo do tipo .spo (SPSS output).
EXEMPLO:
Descriptives
Descriptive Statistics
N
Infant mortality (deaths per 1000 live births)
Valid N (listwise)
109
109
Minimum
4,0
Maximum
168,0
Mean
42,313
Std. Deviation
38,0792
12
30
25
Frequency
20
15
10
5
Mean =42,313
Std. Dev. =38,0792
N =109
0
0,0
50,0
100,0
150,0
200,0
RESULTADO:
Frequencies
Statistics
Region or economic group
N
Valid
109
Missing
0
13
Valid
OECD
East Europe
Pacific/Asia
Africa
Middle East
Latn America
Total
Frequency
21
14
17
19
17
21
109
Percent
19,3
12,8
15,6
17,4
15,6
19,3
100,0
Valid
Percent
19,3
12,8
15,6
17,4
15,6
19,3
100,0
Cumulative
Percent
19,3
32,1
47,7
65,1
80,7
100,0
14
RESULTADO:
Region or economic
group
OECD
East Europe
Pacific/Asia
Africa
Middle East
Latn America
a)
b)
c)
d)
RESULTADO:
Region or economic
group
OECD
East Europe
Pacific/Asia
Africa
19,27%
Middle East
19,27%
Latn America
12,84%
15,6%
15,6%
17,43%
15
4. ANLISE BIVARIADA
Para realizar uma anlise bivariada, ou seja, anlise da relao
entre duas variveis, utilizam-se testes estatsticos e/ou grficos
adequados:
a)
b)
PONTOS
16
Graph
200,0
150,0
100,0
50,0
0,0
0
20
40
60
80
100
17
RESULTADO:
18
Correlations
Correlations
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Infant mortality
People who
(deaths per
read (%)
1000 live births)
1
-,900**
,
,000
107
107
-,900**
1
,000
,
107
109
CONCLUSO:
Regression
Variables Entered/Removedb
Model
1
Variables
Entered
People
whoa read
(%)
Variables
Removed
Method
,
Enter
Model Summaryb
Model
1
R
R Square
,900a
,811
Adjusted
R Square
,809
Std. Error of
the Estimate
16,7334
Regression
Residual
Total
Sum of
Squares
126066,8
29400,822
155467,7
df
1
105
106
Mean Square
126066,834
280,008
F
450,226
Sig.
,000a
Model
1
(Constant)
People who read (%)
Unstandardized
Coefficients
B
Std. Error
160,732
5,794
-1,507
,071
Standardized
Coefficients
Beta
-,900
t
27,740
-21,219
Sig.
,000
,000
onde o
coeficiente linear da reta a = 160,732 e o coeficiente angular
b = -1,507. Como o sig de b menor que 0,001, rejeitamos a
hiptese nula de que = 0. A partir desta equao podemos estimar
(predizer) os valores da varivel dependente (babymort).
21
Casewise Diagnosticsa
Case Number
1
Std. Residual
3,046
Infant mortality
(deaths per 1000
live births)
168,0
Predicted
Value
117,027
Residual
50,973
Minimum
10,026
-38,888
-,947
-2,324
Maximum
133,605
50,973
2,637
3,046
Mean
42,674
,000
,000
,000
Std. Deviation
34,4864
16,6543
1,000
,995
N
107
107
107
107
22
Valid
N
SEXRACE * Total Family
Income
1500
Percent
100,0%
Cases
Missing
N
Percent
0
,0%
Total
N
1500
Percent
100,0%
23
SEXRACE
1,00
2,00
3,00
4,00
5,00
6,00
Total
Count
Expected Count
Count
Expected Count
Count
Expected Count
Count
Expected Count
Count
Expected Count
Count
Expected Count
Count
Expected Count
24,999 or
less
181
215,3
285
275,0
30
25,7
58
39,8
13
9,0
18
20,3
585
585,0
60,000 or
more
137
141,7
196
181,0
14
16,9
17
26,2
5
5,9
16
13,3
385
385,0
Total
552
552,0
705
705,0
66
66,0
102
102,0
23
23,0
52
52,0
1500
1500,0
TL - total da linha i
TC - total da coluna j
TG - total geral
24
RESULTADOS:
SEXRACE * Total Family Income Crosstabulation
SEXRACE
1,00
2,00
3,00
4,00
5,00
6,00
Total
Count
Expected Count
% within SEXRACE
Count
Expected Count
% within SEXRACE
Count
Expected Count
% within SEXRACE
Count
Expected Count
% within SEXRACE
Count
Expected Count
% within SEXRACE
Count
Expected Count
% within SEXRACE
Count
Expected Count
% within SEXRACE
24,999 or
less
181
215,3
32,8%
285
275,0
40,4%
30
25,7
45,5%
58
39,8
56,9%
13
9,0
56,5%
18
20,3
34,6%
585
585,0
39,0%
60,000 or
more
137
141,7
24,8%
196
181,0
27,8%
14
16,9
21,2%
17
26,2
16,7%
5
5,9
21,7%
16
13,3
30,8%
385
385,0
25,7%
Total
552
552,0
100,0%
705
705,0
100,0%
66
66,0
100,0%
102
102,0
100,0%
23
23,0
100,0%
52
52,0
100,0%
1500
1500,0
100,0%
25
RESULTADO:
Chi-Square Tests
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
Value
42,956a
44,902
6,226
15
15
Asymp.
Sig.
(2-sided)
,000
,000
,013
df
1500
26
RESULTADOS:
SEXRACE * Total Family Income Crosstabulation
SEXRACE
1,00
2,00
3,00
4,00
5,00
6,00
Total
Count
Adjusted Residual
Count
Adjusted Residual
Count
Adjusted Residual
Count
Adjusted Residual
Count
Adjusted Residual
Count
Adjusted Residual
Count
24,999 or
less
181
-3,8
285
1,1
30
1,1
58
3,8
13
1,7
18
-,7
585
60,000 or
more
137
-,6
196
1,8
14
-,8
17
-2,2
5
-,4
16
,9
385
Total
552
705
66
102
23
52
1500
27
Explore
Region or economic group
Case Processing Summary
Region or
economic group
OECD
East Europe
Pacific/Asia
Africa
Middle East
Latn America
Valid
N
21
14
17
19
17
21
Percent
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
Cases
Missing
N
Percent
0
,0%
0
,0%
0
,0%
0
,0%
0
,0%
0
,0%
Total
N
21
14
17
19
17
21
Percent
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
28
INTERPRETAO:
29
LEGENDA:
30
5. COMPARAO DE MDIAS
5.1 - COMO COMPARAR MDIAS ENTRE DOIS GRUPOS:
Teste t para Amostras Independentes.
O teste t apropriado para comparar as mdias de uma
varivel quantitativa entre dois grupos independentes.
EXEMPLO: Comparar a mdia de salrios entre os sexos masculino e
feminino na empresa.
a) Sexo (masculino, feminino) - Dois grupos (varivel que define os
grupos).
b) Idade no 1. Casamento (Agewed) - Varivel resposta ou de teste.
31
RESULTADO:
T-Test
Group Statistics
Respondent's Sex
Male
Female
N
492
710
Mean
24,16
21,84
Std.
Deviation
4,87
4,93
Std. Error
Mean
,22
,18
F
Age
When
First
Married
Equal variances
assumed
Equal variances not
assumed
,342
Sig.
,559
df
Sig.
(2-tailed)
Mean
Difference
Std. Error
Difference
95%
Confidence
Interval of the
Difference
Lower
Upper
8,066
1200
,000
2,32
,29
1,76
2,88
8,085
1064,66
,000
2,32
,29
1,76
2,88
vemos o seguinte:
a) Observa-se o resultado do teste para varincias iguais (Teste de
Levene). Neste exemplo, o valor de p para o teste Levene
0,559, no se rejeita a hiptese de varincias iguais.
b) O teste t a ser utilizado o que aparece na primeira linha (Equal
variances assumed), considerando que p < 0,000 (Sig 2-tailed),
rejeita-se a hiptese nula (H0) de igualdade das mdias dos
dois grupos, logo, pode-se concluir que as mdias da varivel
agewed so significativamente diferentes entre os dois grupos
de sexo.
so:
Hiptese Nula (H0): As varincias dos dois grupos so iguais.
Hiptese Alternativa (H1): As varincias dos dois grupos so
diferentes.
32
33
RESULTADOS:
Oneway
Descriptives
Infant mortality (deaths per 1000 live births)
OECD
East Europe
Pacific/Asia
Africa
Middle East
Latn America
Total
N
21
14
17
19
17
21
109
Mean
6,91
16,89
53,88
94,18
41,39
39,11
42,31
Std.
Deviation
1,17
5,48
46,44
28,65
19,18
24,52
38,08
Std.
Error
,26
1,47
11,26
6,57
4,65
5,35
3,65
95% Confidence
Interval for Mean
Lower
Upper
Bound
Bound
6,38
7,44
13,73
20,06
30,00
77,76
80,37
107,99
31,53
51,25
27,95
50,28
35,08
49,54
Minimum
4,0
8,7
4,4
39,3
8,6
10,2
4,0
Maximum
9,2
27,0
168,0
137,0
76,4
109,0
168,0
ANOVA
Infant mortality (deaths per 1000 live births)
Between Groups
Within Groups
Total
Sum of
Squares
88983,515
67619,443
156602,958
df
5
103
108
Mean
Square
17796,703
656,499
F
27,108
Sig.
,000
34
East Europe
Pacific/Asia
Africa
Middle East
Latn America
(J) Region or
economic group
East Europe
Pacific/Asia
Africa
Middle East
Latn America
OECD
Pacific/Asia
Africa
Middle East
Latn America
OECD
East Europe
Africa
Middle East
Latn America
OECD
East Europe
Pacific/Asia
Middle East
Latn America
OECD
East Europe
Pacific/Asia
Africa
Latn America
OECD
East Europe
Pacific/Asia
Africa
Middle East
Mean
Difference
(I-J)
-9,983*
-46,972*
-87,269*
-34,484*
-32,204*
9,983*
-36,989
-77,286*
-24,501*
-22,221*
46,972*
36,989
-40,297
12,488
14,768
87,269*
77,286*
40,297
52,785*
55,065*
34,484*
24,501*
-12,488
-52,785*
2,280
32,204*
22,221*
-14,768
-55,065*
-2,280
Std. Error
8,841
8,359
8,113
8,359
7,907
8,841
9,247
9,025
9,247
8,841
8,359
9,247
8,554
8,788
8,359
8,113
9,025
8,554
8,554
8,113
8,359
9,247
8,788
8,554
8,359
7,907
8,841
8,359
8,113
8,359
Sig.
,000
,010
,000
,000
,000
,000
,060
,000
,001
,008
,010
,060
,064
,991
,972
,000
,000
,064
,000
,000
,000
,001
,991
,000
1,000
,000
,008
,972
,000
1,000
35
7. MANIPULAO DE DADOS
7.1 SORT CASES
Uma das necessidades na hora da manipulao dos dados no
dia-a-dia a ordenao dos casos segundo uma ou mais variveis.
Para fazer isso no SPSS for Windows, usar o procedimento Sort
Cases presente no menu Data.
Aps clicar em Data opo Sort Cases, uma janela aberta.
Movemos para o quadro Sort by a varivel segundo a qual o arquivo
deve ser ordenado. Podemos mover para esse quadro mais do que
uma varivel. Nesse caso, o arquivo ordenado, em primeiro lugar,
pelos valores da primeira varivel no quadro e, em segundo lugar, pela
segunda varivel no quadro; a segunda ordenao feita para os
valores comuns da primeira varivel.
Podemos escolher tambm entre ordem crescente ou
decrescente de ordenao para cada uma das variveis. Isso feito
atravs do quadro Sort Order opes Descending (decrescente) ou
Ascending (crescente).
Vamos fazer uma ordenao segundo idade (ordem
decrescente) dentro dos cdigos de sexo (ordem crescente). Para
isso movemos a varivel sexo para ao quadro Sort Cases e
escolhemos a opo Ascending no quadro Sort Order. Movemos em
seguida a varivel idade para o quadro Sort Cases e escolhemos a
opo Descending no quadro Sort Order. Agora, basta clicar OK
para executar a ordenao.
Note que aps a execuo deste comando a posio dos
indivduos nas linhas fica completamente alterada, pois o indivduo na
linha 1 do banco de dados aps ordenado pode no ser o primeiro
caso digitado. Para que esta informao no se perca essencial que
exista uma varivel com o nmero do indivduo.
36
37
40
41
OBSERVAO:
42
8. ESTATSTICA NO PARAMTRICA
8.1 TESTE DE KOLMOGOROV-SMIRNOV
Para verificar se uma varivel segue determinada distribuio
procede-se da seguinte maneira:
a) Clicar em Analyze, Non-Parametric Tests, 1-Sample KS;
b) Assinalar a varivel dependente em Dependent List, clicar sobre
a seta correspondente (pode-se realizar mais de um teste incluindo
outras variveis na lista, o teste ser repetido para cada varivel
includa na lista), neste caso utilize Infant mortality;
c) Assinalar a distribuio em relao a qual a varivel ser testada
em Test Distribution. Neste caso, distribuio Normal;
d) Clicar o boto Options.
e) Clicar na alternativa do quadro Statistics Descriptive;
f) Clicar em Continue, "OK".
RESULTADO:
NPar Tests
Descriptive Statistics
N
Infant mortality (deaths
per 1000 live births)
Mean
109
42,313
Std.
Deviation
38,079
Minimum
Maximum
4,0
168,0
43
N
Normal Parameters a,b
Most Extreme
Differences
Mean
Std. Deviation
Absolute
Positive
Negative
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
44
9. AMOSTRAGEM
Para acessar o mdulo que permite selecionar diferentes tipos
de amostras no SPSS 13.0, procede-se da seguinte maneira:
a) Analyze; complex samples; select a sample
Abre uma janela sampling wizard
Escolhe-se o que se quer fazer:
Desing a sample
Edit a sample desing
Draw a sample
Utilizando desing sample:
a) Em file, escolher o local onde deseja salvar os resultados.
gravado um arquivo do tipo .csplan.
b) Clicar em avanar. Aparece a janela desing variables, pode-se
escolher estratificar ou criar clusters para a amostra. Por exemplo,
para criar extratos por regio, selecionar a varivel region na janela
da esquerda, clicar em passando a varivel para o quadro stratify
by, clicar em avanar.
c) Uma nova janela aparece. Deve-se escolher o mtodo de seleo
da amostra dentro dos estratos definidos anteriormente (region). Em
type, pode-se escolher entre simple random sampling (amostra
aleatria simples) simple sistematic(amostra sistemtica simples)
simple sequential (amostra seqencial simples) PPS PPS
systematic e PPS sequential
Para a amostra aleatria simples existem as opes de
amostragem com ou sem reposio.
Aps escolher o mtodo, clicar em Continue.
d) Aparece uma janela, na qual deve-se especificar o tamanho da
amostra. Colocar o valor escolhido em value, clicar em Continue.
e) Uma nova janela output variables aparece. Aqui possvel
salvar variveis como tamanho da populao (population size),
tamanho da amostra (sample size), proporo da amostra (sample
proportion) e peso da amostra (sample weight). Clicar em avanar.
f) Na prxima janela (plan summary) aparece um resumo do que foi
pedido at ento. Pode-se escolher criar mais um estgio de
45
Number of Units
Sampled
Requested
Actual
10
10
10
10
10
10
10
10
10
10
10
10
Proportion of Units
Sampled
Requested
Actual
47,6%
47,6%
71,4%
71,4%
58,8%
58,8%
52,6%
52,6%
58,8%
58,8%
47,6%
47,6%
46