You are on page 1of 25

INSTRUÇÕES BÁSICAS PARA O USO DO SPSS,

VERSÃO 11.

Professor José Aroudo Mota, Dr. (jamota@ipea.gov.br)

APRESENTAÇÃO

O soft SPSS (Social Package Statistical Science) é uma poderosa ferramenta de


Estatística Aplicada para a análise de dados observados captados por meio de pesquisa de
campo ou coletados a partir de pesquisa indireta. O SPSS é composto por 9 (nove)
argumentos: FILE, EDIT, VIEW, DATE, TRANSFORM, ANALYZE, GRAPHS,
UTILITIES, WINDOW, HELP. O SPSS trabalha também como planilha eletrônica aos
moldes das planilhas tradicionais comumente usadas.
A fim de tornar o processo de aprendizagem mais atrativo, apresentam-se todas as
funções do SPSS, denominando-as de ARGUMENTO, e os seus sub-conjuntos de
Conteúdos.
Além disso, este manual apresenta ao mesmo tempo um exemplo didático, assim
como os procedimentos requeridos por cada argumento com os seus respectivos conteúdos
e itens e os resultados estatísticos.
2

1. O ARGUMENTO FILE

O argumento FILE proporciona ao pesquisador realizar as operações corriqueiras


que estão contidas nos demais softs, ou seja, criar um arquivo (new), abrir um arquivo
(open), salvar e salvar como (save e save as ...), imprimir documento (print) e sair do SPSS
(exit). (Ver Figura 1)

Figura 1: Conteúdos do argumento File

2. O ARGUMENTO EDIT

Com o uso do argumento EDIT pode-se realizar operações complementares ao


argumento FILE, isto é, copiar (copy), copiar objetos (copy objets), colar (paste) e
selecionar todos os objetos (select all). Essas operações ajudam o pesquisador a trabalhar
simultaneamente com o seu texto em Word for Windows, exportando a planilha de dados e
as tabelas e quadros para o seu texto no Word (Figura 2).

Figura 2: Conteúdos do argumento Edit


3

3. A PLANILHA DE TRABALHO DO SPSS

A planilha de trabalho do SPSS se assemelha a outras planilhas eletrônicas, onde a


linha indica a variável de estudo e a coluna os dados referentes a esta variável (Figura 3).
Ao se clicar o argumento ‘criação de variáveis’ a planilha mudará de página e o SPSS
apresenta uma nova página, a qual permite inserir as variáveis do survey de pesquisa, assim
como as suas características (tipo de variável: numérica ou quantitativa, qualitativa, etc;
tamanho da célula, número de decimais, explicações sobre a variável ou label, etc).

Figura 3: Modelo de planilha de entrada de dados

Criação de Variáveis
Entrada de Dados
4

4. CRIANDO UM ARQUIVO

Para se criar um arquivo no SPSS clique no espaço ‘criação de variáveis’. Por


exemplo, vamos criar o arquivo denominado de ‘perfil’, o qual se refere a uma enquete a 10
clientes de uma loja de produtos in natura (Tabela 1).

Tabela 1: Pesquisa sobre o perfil dos clientes


de uma loja de cosméticos
Cliente Sexo Renda (R$) Idade
1 2 800 40
2 2 670 43
3 2 530 44
4 2 400 37
5 1 800 30
6 1 700 32
7 2 500 48
8 1 850 35
9 2 500 50
10 1 700 35

A Figura 4 mostra como as variáveis foram criadas. Como detalhe especial,


demonstra-se o preenchimento da coluna label, a qual é utilizada para se escrever alguma
observação sobre a variável ou mesmo transcrever a questão do survey de pesquisa. Depois
de criar as variáveis da pesquisa clique em Date View (entrada de Dados).

Figura 4: Planilha de criação de variáveis


5

Ao clicar Date View (Entrada de Dados) tem-se acesso a uma página para a entrada
dos dados da pesquisa, digite-os. Os dados digitados na planilha devem ser salvados, de
modo que ficarão disponibilizados no arquivo do SPSS para usos futuros (Figura 5).

Figura 5: Planilha de entrada de dados


6

4. O ARGUMENTO VIEW

Para se ter um ponto de vista melhor da planilha devem-se utilizar os argumentos do


View (Fonts, Grid Lines e Values Labels). Esses três argumentos permitem melhorar a
estética da planilha de trabalho (Figura 6). O argumento Fonts fornece as formas e
tamanhos de letras; o argumento Grid Lines permite que se trabalhe com a planilha sem as
linhas verticais e horizontais e; o Values Labels proporciona ao pesquisador fazer uma
permuta entre o código usado para categorizar a variável e a sua denominação, ou seja, com
esse recurso pode-se permutar uma variável quantificada para uma variável qualificada.
Para tanto, clique no argumento Variable View e, logo após, no Values, escreva então: 1
Sexo masculino; 2 Sexo feminino (Figuras 7,8 e 9).

Figura 6: Conteúdos do argumento View

Figura 7: Melhorando a fonte da planilha de dados


7

Figura 8: Apresentação da planilha de dados sem as linhas tracejadas

Figura 9: Planilha de dados com a nominação da variável categórica sexo


8

5. O argumento DATA

O argumento DATA é composto por vários conteúdos que ajudam o pesquisador a


melhorar a sua planilha de trabalho (Figura 10). Os principais conteúdos são o Insert
Variable (insere uma nova variável de estudo), Insert Case (insere um novo caso), Go to
Case (vai até a um caso específico) e Select Cases (seleciona casos). Vamos analisar
especialmente o Select Cases, pois este conteúdo ajuda o pesquisador a separar casos, a
segregar uma variável em partes, as quais se deseja analisar. Por exemplo, supondo-se que
o pesquisador deseja analisar somente as rendas dos clientes que ganham pelos menos $
800, então o procedimento é (Figura 11 e 12).

Figura 10: Conteúdos do argumento Data

Figura 11: Conteúdo de selecionar casos


9

Como pode ser visto, deseja-se analisar as rendas que são iguais e maiores do que $
800, então escolhe-se o conteúdo ‘If Condition is Satisfied’ e clica-se no conteúdo ‘If’
(Figura 7). Isso ordena ao SPSS criar um conteúdo denominado de ‘Select Cases: If’.
Selecione a variável Renda mensal do cliente e insira-a no boxe retangular localizado à
direita, complemente esta operação acrescentando o sinal de ‘maior igual 800’. Assim, a
expressão matemática é: ‘Renda>=800’ (Figura 12). Clique nos conteúdos ‘Continue’ e
‘OK’, o SPSS mostra, na planilha de trabalho, uma variável chamada de ‘Filter _$’, que
demonstra os casos que foram selecionados conforme a especificação ordenada (Figura 13).
Portanto existem 3 (três) casos selecionados, os de número 1, 5 e 8. Este procedimento é
muito importante para estudos futuros, com banco de dados compostos por muitos casos.

Figura 12: Selecionando casos especificados

Figura 13: Criação de variável filtro para separar casos


10

6. O ARGUMENTO TRANSFORM

Os principais conteúdos do argumento TRANSFORM são ‘Compute’, ‘Recode’ e


‘Categorize Variables’ (Figura 14). O conteúdo ‘Compute’ permite que se elaborem todos
os cálculos que comumente são realizados nos softs convencionais (o melhor exemplo é o
Excel). Ele é útil para se somar, subtrair, multiplicar ou dividir colunas, trabalhar com
potenciação e radiciação e as demais operações que estão indicadas no boxe ‘functions’
(funções ou operações matemáticas e estatísticas).

Figura 14: Conteúdos do argumentos Transform

As operações com o conteúdo Compute servem para demonstrar como o SPSS


trabalha como se fosse uma planilha eletrônica, ou seja, no boxe ‘target variable’ escreve-se
o nome da nova variável para os resultados do cálculo que se deseja fazer (Figura 15). Por
exemplo, vamos calcular a renda anual dos clientes, então clique em ‘Transform’, depois
em ‘Compute’, e escreva no boxe ‘target variable’ a nova variável ‘renda1’ e no boxe
‘numeric expression’ a expressão matemática que se deseja realizar, isto é, renda*12, clique
OK, e visualize o resultado na planilha do SPSS, a qual está situada à direita da última
variável (Figura 16).
11

Figura 15: Computando variáveis

Figura 16: Renda anual dos clientes

Agora nós queremos separar os clientes em dois grupos, os que têm renda entre $
400 e $ 530 e entre $ 670 e $ 850. O SPSS resolve facilmente essa segregação, então,
clique em ‘Transform’, ‘Recode’ e ‘Into Different Variables’. Escolha a variável ‘renda’ e
coloque-a no boxe ‘Input Variable’, e no boxe ‘Output Variable, Name’ escreve-se o nome
da nova variável, por exemplo ‘renda1’, e clique ‘Change’. Isso permite ordenar ao SPSS
realizar a tarefa de contar os elementos da variável renda e fornecer a resposta por meio da
variável renda1. Agora clique no boxe ‘Old and New Values’ (Figura 17) e em ‘Old Value’
12

(Figura 18) escolha o boxe ‘Range’ e escreva no boxe à esquerda 400 e no boxe à direita
530. No boxe ‘New Value, Value, escreva 1 (o SPSS associará 1 ao intervalo que se deseja,
isto é, de $ 400 a $ 530), clique em ‘add’ no boxe ‘Old  New’ (Figura 18) e, finalmente
clique no boxe ‘continue’ e ‘ok’. Repita essa manipulação para a segunda parte do
problema, de $ 670 a $ 850 (Figura 19). Veja agora na planilha de dados que o SPSS criou
uma nova variável chamada de ‘renda1’ (Figura 20), em que os clientes foram classificados
com o indexador 1 (para aqueles que estão no intervalo de $ 400 a $ 530) e 2 (para aqueles
que estão no intervalo de $ 670 a $ 850).

Figura 17: Segregando dados

Figura 18: Criando a estrutura de dados


13

Figura 19: Configuração completa da estrutura de dados

Figura 20: Classificação dos clientes com um indexador


14

O argumento ‘Transform’ ainda fornece o conteúdo ‘Categorize Variables’ (Figura


21), o qual permite que se agrupe uma variável em várias categorias, de modo que cada
categoria tenha em média o mesmo número de observações. Preliminarmente, o SPSS
trabalha com 4 categorias, mas o pesquisador pode simular a distribuição dos dados no
número de categorias que acha necessária.
Vamos criar 4 categorias para a variável renda, então, selecione a variável de
interesse, no caso a renda dos clientes, e coloque-a no boxe ‘Create Categorize for’ e no
boxe ‘Number of categories” escreva o número de categorias que você deseja e clique OK.
O SPSS criará uma nova variável chamada de ‘nrenda’ (Figura 22), que classificará os
dados nas categorias 1, 2, 3 e 4.

Figura 21: Criando categorias de variáveis

Figura 22: Criação da variável categórica ‘nrenda’


15

7. O ARGUMENTO ANALYZE

O argumento Analyze possibilita trabalhar os dados pesquisados de vários modos


(Figura 23). O conteúdo ‘Reports’ gera relatórios que sumarizam as principais estatísticas
das variáveis. O conteúdo ‘Descriptive Statistics’ proporciona a geração de resultados das
variáveis por meio de tabelas de freqüências e realiza exploração de dados por intermédio
de seus cruzamentos. O conteúdo ‘Compare Means’ realiza operações e provas de hipóteses
para uma amostra, duas amostras e amostras emparelhadas. O conteúdo ‘Correlate’ esboça
uma matriz de correlação, com os respectivos testes de significância para a aceitação ou
rejeição de relação linear entre as variáveis. O conteúdo ‘Regression’ apresenta as técnicas
de estimação de parâmetros para as regressões linear simples e múltipla, modelos de
escolhas binárias (logística binária e multinomial), modelos probit e de estimação
ponderada. O conteúdo ‘Loglinear’ realiza operações, especialmente com o modelo logit. O
conteúdo ‘Classifly’ demonstra como o pesquisador trabalha com análise de agrupamentos
de dados, cluster analysis, e como pode segregar ou discriminar dados conforme o
comportamento de várias variáveis, cujos dados estão distribuídos em grupos distintos. O
conteúdo ‘Scale’ trabalha com técnicas de agregação de fatores, ou análise fatorial,
permitindo ao pesquisador criar novos constructos a partir da aglutinação de várias
variáveis. O conteúdo ‘Nonparametric Testes’ testa estatísticas da distribuição de Qui-
Quadrado, por exemplo testes de aderência de dados, e realiza vários outros testes de
estatística não-paramétrica.

Figura 23: Conteúdos do argumento Analyze

O conteúdo ‘Reports’ combinado com o ‘Case Summaries’ possibilita calcular


várias medidas estatísticas (por exemplo médias aritmética, geométrica e harmônica, desvio
padrão e percentuais em relação aos totais de dados) conforme o número de casos que o
pesquisador estipule. Alimente o boxe ‘Variables’ com as variáveis que você deseja
calcular medidas estatísticas e no boxe ‘Grouping Variable(s)’ a variável categórica.
Escreva no boxe ‘Limit cases to first’ o número de casos que você deseja considerar no
cálculo, clique no boxe ‘Statistics’ e o SPSS lhe mostrará um conteúdo chamado ‘Sumary
16

Reports: Statistics’, escolha as medidas estatísticas que lhe interessa e alimente o boxe ‘Cell
Statistics’, clique ‘continue’ e ‘OK’ (Figuras 24 e 25 e Quadro 1).

Figura 24: Sumarizando dados estatísticos

Figura 25: Indicação de medidas estatísticas a serem sumarizadas


17

Quadro 1: Cálculo da média aritmética por estrato de sexo


Renda
mensal
do cliente
1 Sexo masculino; Sexo masculino 1 800,00
2 Sexo feminino 2 700,00
3 850,00
4 700,00
Total N 4
Mean 762,5000
Sexo feminino 1 800,00
2 670,00
3 530,00
4 400,00
5 500,00
6 500,00
Total N 6
Mean 566,6667
Total N 10
Mean 645,0000

O conteúdo ‘Reports’ combinado com ‘Report Summaries in Columns’ permite a


você fazer uma série de operações que são relevantes para a tomada de decisão.
Inicialmente, vamos colocar os dados de nosso arquivo em ordem descendente de renda.
Observe os boxes que estão preenchidos nas Figuras 26 e 27. O procedimento para que o
SPSS faça esse comando é: escolha a variável que ordena o banco de dados (no nosso caso
é a variável ‘cliente’) e alimente o boxe ‘Date Columns’. Agora clique no boxe ‘Summary’
e escolha a estatística ‘Number of Cases’ (ou outra qualquer) e clique ‘Continue’. Logo
após, escolha a variável ‘Renda’ e alimente o boxe ‘Break Columns’ e, finalmente clique
nos itens ‘Descending’ em ‘Sort Sequence’ e ‘OK’
18

Figura 26: Ordenando uma coluna de dados

O SPSS gera resultados, os quais demonstram as rendas em ordem decrescente com


as suas respectivas freqüências. O mesmo procedimento pode ser repetido para as demais
estatísticas constantes da Figura 27, ou seja, o pesquisador pode solicitar a média, desvio
padrão, assimetria, curtose ou percentuais acima ou abaixo de determinado valor da renda.
Observe que o SPSS gerou duas informações importantes, ou seja, um relatório de saída, no
qual as rendas são apresentadas em ordem decrescente e uma planilha ajustada a este
procedimento, isto é, com as rendas em ordem decrescente (Figura 28)

Figura 27: Incorporando estatísticas à ordenação de dados


19

Figura 28: Planilha com a variável renda em ordem decrescente

O conteúdo ‘Descriptive Statistics’ compreende um conjunto de operações que


permitem determinar as principais medidas estatísticas (média, moda, mediana, desvio
padrão, coeficientes momentos de assimetria e curtose, medidas percentílicas, esboçar os
dados por meio de gráficos de barra, pizza e histograma com curva normal Figura 29).

Figura 29: Composição do conteúdo Descriptive Statistics

Para você trabalhar com esse conteúdo clique em ‘Descriptive Statistics’ e


‘Frequencies’, alimente o boxe ‘Variable(s)’ com a variável ‘Renda’ (Figura 30). Agora
clique no boxe ‘Statistics’ e escolha as medidas estatísticas que você deseja que o SPSS
calcule (Figura 31). Note que existem vários sub-boxes que determinam valores percentis,
20

medidas de tendência central, avaliação da dispersão dos dados e coeficientes de assimetria


e curtose.

Figura 30: Determinando freqüências de variáveis

Figura 31: Escolha das principais medidas estatísticas

Agora clique em ‘Continue’, Figura 31, (o SPSS voltará para o comando anterior,
Figura 30), escolha o boxe ‘Charts’ e clique em ‘Histograms’, Figura 32, (o SPSS
desenhará o histograma para os dados da variável renda, assim como a sua inserção na
curva normal). Finalmente, clique em ‘Continue’ e ‘OK’, o SPSS demonstrará todos os
resultados solicitados para a variável renda (Quadros 2, 3 e Figura 33).
21

Figura 32: Principais tipos de gráficos de freqüências

Quadro 2: Cálculo das medidas de tendência central e desvio padrão


Renda mensal do cliente
N Valid 10
Missing 0
Mean 645,0000
Median 685,0000
Mode 500,00a
Std. Deviation 153,4963
a. Multiple modes exist. The smallest value is shown

Quadro 3: Distribuição de freqüência para a variável renda


Cumulative
Frequency Percent Valid Percent Percent
Valid 400,00 1 10,0 10,0 10,0
500,00 2 20,0 20,0 30,0
530,00 1 10,0 10,0 40,0
670,00 1 10,0 10,0 50,0
700,00 2 20,0 20,0 70,0
800,00 2 20,0 20,0 90,0
850,00 1 10,0 10,0 100,0
Total 10 100,0 100,0

Figura 33: Histograma com curva normal para a variável renda


22

3,5

3,0

2,5

2,0

1,5

1,0
Frequency

,5 Std. Dev = 153,50


Mean = 645,0
0,0 N = 10,00
400,0 500,0 600,0 700,0 800,0 900,0

Renda mensal do cliente

Agora vamos trabalhar com o conteúdo ‘Descriptive Statistics’ associado ao item


‘Descriptives’. Então, alimente o boxe ‘Variable(s)’ com as variáveis ‘Renda’ e ‘Idade’
(Figura 34). Selecione o boxe ‘Options’ e escolha as medidas estatísticas que você deseja
que o SPSS calcule (Figura 35) e finalmente clique em ‘Continue’ e ‘OK’. O SPSS gerou
um quadro que contém todas as medidas estatísticas solicitadas (Quadro 4).

Figura 34: Calculando medidas estatísticas descritivas

Figura 35: Escolha de medidas estatísticas descritivas


23

Quadro 4: Medidas estatísticas descritivas


N Minimum Maximum Mean Std. Deviation
Idade do cliente 10 30 50 39,40 6,74
Renda mensal do cliente 10 400,00 850,00 645,0000 153,4963
Valid N (listwise) 10

O conteúdo ‘Explore’ de ‘Descriptive Statistics’ é um modelo especial para se


trabalhar concomitantemente com estatísticas descritivas e inferenciais, pois é possível
extrair medidas estatísticas descritivas e inferenciais de variáveis isoladas ou sujeitas a uma
lista de fatores. Essas medidas incluem média aritmética simples, média aparada com 5%
para os valores extremos da variável, mediana, variância, desvio padrão, valores mínimo e
máximo, coeficientes de assimetria e curtose, percentis, indicação de valores extremos
(outliers), plotes com histograma, testes de normalidade para a variável e intervalo de
confiabilidade para a média para uma variável, por exemplo ‘Idade’. Essas mesmas
medidas estatísticas podem ser calculadas para variáveis cruzadas, isto é, combinando-se
duas variáveis, por exemplo combinação das variáveis ‘Idade’ e ‘Sexo’.
Exercitando estes procedimentos vamos determinar as medidas estatísticas
descritivas e o intervalo de confiabilidade (com 95% de probabilidade) para a variável
‘Idade’. Clique em ‘Analyze’, Descriptive Statistics’ e ‘Explore’ (Figura 36), insira a
variável ‘Idade’ no boxe ‘Dependent List’, clique no boxe ‘Statistics’ e altere a
probabilidade de confiabilidade para a média de 95% para 90% (Figura 37), clique
‘Continue’ e ‘OK’ (Quadro 5).

Figura 36: Explorando medidas estatísticas para uma variável


24

Figura 37: Definindo o intervalo de confiança para a média

Quadro 5: Principais medidas estatísticas descritivas exploradas


Statistic Std. Error
Idade do cliente Mean 39,40 2,13
90% Confidence Lower Bound 35,50
Interval for Mean Upper Bound
43,30

5% Trimmed Mean 39,33


Median 38,50
Variance 45,378
Std. Deviation 6,74
Minimum 30
Maximum 50
Range 20
Interquartile Range 10,75
Skewness ,250 ,687
Kurtosis -1,128 1,334
25

You might also like