You are on page 1of 117

Universidad Centroamericana Jos Simen Caas

Departamento de Matemtica

TCNICAS ESTADSTICAS EN
APOYO A LA INVESTIGACION

Mdulo 1:
INTRODUCCIN AL ANLISIS
ESTADSTICO CON SPSS

William W. Lzaro Apolaya

San Salvador, Marzo del 2011

INTRODUCCION
A pesar de los aos, la Estadstica sigue constituyndose en la herramienta
bsica, por no decir, imprescindible, en el desarrollo de toda investigacin,
sobre todo si se quiere que sta cumpla con el rigor cientfico.
La evolucin de la informtica, tambin ha permitido que se desarrollen
sistemas potentes para el anlisis de datos, uno de ellos es el SPSS, cuya
versatilidad y amabilidad con el usuario facilita su rpida aplicacin.
En aras de colaborar con la difusin del conocimiento, se ha desarrollado
este documento, que tiene como objetivo que los participantes del Curso de
Postgrado de Tcnicas Estadsticas en Apoyo a la Investigacin, que viene
desarrollando la Universidad Centroamericana Jos Simen Caas, a travs
de su Departamento de Matemtica, conozcan el manejo y aplicacin bsica
de este software en un corto tiempo.
El documento denominado Introduccin al Anlisis Estadstico con SPSS
14 contiene 15 captulos, habindose incluido como anexo diferentes tpicos
sobre Estadstica Bsica, as como el desarrollo de 3 laboratorios.
Adicionalmente, se presentan 3 tareas, que deben ser desarrolladas
individualmente, y que sern de utilidad para ir verificando el avance del
participante en el conocimiento y aplicacin del software.
Los ejemplos, que acompaan las diferentes explicaciones corresponden
fundamentalmente a bases de datos que contiene informacin sobre las
principales caractersticas demogrficas, educativas, laborales y de vivienda
de los jefes de hogar de un departamento del pas.

El autor

INDICE
Pg.
1.

ESTRUCTURA Y OPCIONES GENERALES DEL SPSS PARA WINDOWS.............................1

1.1
1.2
1.3
1.4
1.5

VENTANAS.........................................................................................................................................1
MENUS...............................................................................................................................................4
BARRAS DE HERRAMIENTAS..........................................................................................................5
BARRA DE ESTADO..........................................................................................................................5
CUADROS DE DIALOGO...................................................................................................................6

2.

ARCHIVO DE DATOS EN SPSS........................................................................................................8

2.1
2.1.1
2.1.2
2.1.3
2.1.4
2.1.5

ABRIR UN ARCHIVO..........................................................................................................................8
TIPOS DE ARCHIVOS DE DATOS QUE RECONOCE SPSS ..........................................................9
OPCIONES DE ABRIR ARCHIVO EN HOJAS DE CALCULO Y ARCHIVOS
DELIMITADOS POR TABULADORES................................................................................................9
LECTURA DE HOJAS DE CALCULO EN EL EDITOR DE DATOS...................................................9
LECTURA DE ARCHIVOS DE dBASE EN EL EDITOR DE DATOS................................................ 11
LECTURA DE ARCHIVOS DELIMITADOS POR TABULADORES EN EL EDITOR DE DATOS..... 11

2.2
2.3
2.4

LECTURA DE ARCHIVOS DE DATOS DE TEXTO..........................................................................11


LECTURA DE ARCHIVOS DE BASE DE DATOS CON ODBC........................................................17
GUARDAR ARCHIVO DE DATOS ...................................................................................................22

3.

EDITOR DE DATOS..........................................................................................................................24

3.1
3.2
3.3

VISTA DE DATOS Y VISTA DE VARIABLES....................................................................................24


INTRODUCCION DE DATOS............................................................................................................29
EDICION DE DATOS.........................................................................................................................29

4.

PREPARACION DE DATOS..............................................................................................................32

4.1
4.2

PROPIEDADES DE LAS VARIABLES..............................................................................................32


AGRUPACION VISUAL.....................................................................................................................34

5.

TRANSFORMACIONES DE LOS DATOS........................................................................................38

5.1
5.2
5.3
5.4

CALCULAR VARIABLE.....................................................................................................................38
RECODIFICACION DE VALORES....................................................................................................40
CONTAR APARICIONES DE VALORES DENTRO DE CASOS......................................................41
RECODIFICACION AUTOMATICA...................................................................................................42

6.

MANIPULACION DE ARCHIVOS.....................................................................................................44

6.1
6.2
6.3
6.4
6.5

ORDENAR DATOS...........................................................................................................................44
SELECCIONAR CASOS...................................................................................................................45
SEGMENTAR ARCHIVO..................................................................................................................46
PONDERAR CASOS........................................................................................................................47
TRANSPONER.................................................................................................................................48

TAREA 1...49
6.6

FUSION DE ARCHIVOS DE DATOS..............................................................................................51

ii

6.7

AGREGAR DATOS............................................................................................................................54

7.

FRECUENCIAS Y DESCRIPTIVOS...................................................................................................56

7.1
7.1.1
7.1.2
7.1.3
7.2

FRECUENCIAS..................................................................................................................................56
FRECUENCIAS: ESTADISTICOS.....................................................................................................56
FRECUENCIAS: GRAFICOS.............................................................................................................57
FRECUENCIAS: FORMATO..............................................................................................................57
DESCRIPTIVOS.................................................................................................................................60

8.

CUBOS OLAP....................................................................................................................................61

9.

EXPLORAR........................................................................................................................................63

TAREA 2...68
10.
10.1
10.2

TRABAJO CON RESULTADOS.........................................................................................................69


ALGUNAS OPCIONES DEL VISOR..................................................................................................69
GUARDAR UN DOCUMENTO DEL VISOR......................................................................................69

11.

EDITOR DE TABLAS PIVOTE...........................................................................................................70

11.1
11.2
11.3
11.4
11.5

PIVOTAR UNA TABLA UTILIZANDO ICONOS.................................................................................70


TRABAJO CON CAPAS.....................................................................................................................70
EDICION DE UN TABLA PIVOTE......................................................................................................72
CAMBIO DE FORMATO DE PRESENTACION DE DATOS DE UN TABLA PIVOTE.......................73
CAMBIO DEL ASPECTO DE TABLA POR DEFECTO......................................................................73

12.
12.1
12.2

TABLAS..............................................................................................................................................75
TABLAS PERSONALIZADAS............................................................................................................75
APLICACIN PRACTICA DE TABLAS PERSONALIZADAS............................................................85

13.
13.1
13.2
13.3

GRAFICOS.........................................................................................................................................91
CREACION DE UN GRAFICO...........................................................................................................91
EDICION DE GRAFICOS...................................................................................................................93
GENERADOR DE GRAFICOS.......93

14.

GRAFICOS INTERACTIVOS.............................................................................................................97

14.1
14.2
14.3

CREACION DE GRAFICOS INTERACTIVOS...................................................................................97


CREACION DE GRAFICOS INTERACTIVOS A PARTIR DE TABLAS PIVOTE.............................100
EDICION DE GRAFICOS INTERACTIVOS.....................................................................................100

15.

TABLAS DE CONTINGENCIA.........................................................................................................103

15.1

ESTADSTICOS QUE SE PUEDEN DETERMINAR CON EL PROCEDIMIENTO TABLAS DE


CONTINGENCIA..............................................................................................................................103
PROCEDIMIENTO PARA DETERMINAR TABLAS DE CONTINGENCIA......................................109

15.2

TAREA 3.113
BIBLIOGRAFIA............................................................................................................................................114
ANEXO 1: LABORATORIOS DESARROLLADOS..115
ANEXO 2: ESTADISTICA BASICA149

iii

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

1. ESTRUCTURA Y OPCIONES GENERALES DEL SPSS PARA WINDOWS


SPSS para Windows es un software que proporciona un poderoso sistema de anlisis estadstico y de
gestin de datos en un entorno grfico, mediante el uso de mens descriptivos y cuadros de dilogo
sencillos que realizan la mayor parte del trabajo. La mayora de las tareas se pueden realizar ubicando el
puntero del ratn en el lugar deseado y pulsando en el botn.
1.1

VENTANAS

En SPSS existen diversos tipos de ventanas:


Editor de datos: Esta ventana se abre automticamente al iniciar una sesin de SPSS. El editor de
datos muestra el contenido del archivo de datos y a travs de l se puede crear nuevos archivos de
datos o modificar los existentes. No se puede tener ms de un archivo de datos abierto al mismo
tiempo.

Figura 1: Ventana Editor de datos

Visor de borrador: En esta ventana los resultados se ofrecen a modo de borrador, en ella los resultados
se ofrecen a modo de texto en lugar de tablas pivote y los grficos como imgenes de metaarchivo en
lugar de objetos de grfico.
Visor: Es una ventana en la que aparecen todas las tablas, grficos y resultados estadsticos realizados
con el programa, los mismos que pueden ser editados y guardados para su utilizacin posterior. Hay
que tener presente que esta ventana se abre automticamente la primera vez que se ejecuta un
procedimiento que genera resultados (Ver figura 2).

1|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 2: Ventana Visor


Editor de tablas pivote: Por medio de esta ventana es factible modificar los resultados mostrados en
este tipo de tablas de diversas maneras.

Figura 3: Ventana Editor de tablas pivote


Editor de grficos: Permite modificar los grficos y diagramas de alta resolucin en las ventanas de los
grficos.

2|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 4: Ventana Editor de grficos


Editor de resultados de texto: Permite modificar los resultados de texto que no aparecen en las tablas
pivote, de esta forma se pueden editar los resultados y cambiar las caractersticas de las fuentes como
tipo, estilo, color y tamao.
Editor de sintaxis: Se puede pegar en esta ventana la sintaxis de los comandos seleccionados desde la
ventana de dilogo de cualquier opcin. Debe tenerse presente que esto permite editar la sintaxis de
estos comandos y ampliarla con aquellas funciones especiales que tiene el SPSS que no se encuentran
disponibles en los cuadros de dilogo. Estos comandos pueden archivarse (en archivos de texto con
extensin .sps) y recuperarlos en sesiones posteriores con SPSS.

Figura 5: Ventana Editor de sintaxis


3|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Editor de procesos: El procesamiento y la automatizacin OLE permiten personalizar y automatizar


muchas tareas en SPSS.
Ventana designada frente a ventana activa
Si tiene varias ventanas de visor, los resultados se dirigirn hacia la ventana designada del visor, debe
tenerse presente que la ventana designada es aquella que tiene un signo de exclamacin (!) en la barra de
estado. De la misma forma, si se tiene abierta ms de una ventana del Editor de sintaxis, la sintaxis de
comandos se pegar en la ventana designada. La ventana designada no debe confundirse con la ventana
activa, que es la ventana actualmente seleccionada. Tambin debe tenerse presente que al abrir una nueva
ventana de editor de sintaxis o del visor, sta se convierte automticamente en la ventana activa y en la
ventana designada.
Cmo cambiar la ventana designada del visor o del editor de sintaxis? Existen dos procedimientos:
a. Convierta la ventana que desee designar en la ventana activa (Pulsar en cualquier punto de la ventana)
y luego, pulsar en la barra de herramienta Designar ventana (la que tiene el signo de exclamacin), tal
como se observa en la figura 6.

Cambiar la ventana
designada

Figura 6: Cambiar ventana designada


b. Elija en los mens:
Utilidades/designar ventana
1.2 MENUS
Desde el men se accede a la mayora de funciones de SPSS. Cada ventana de SPSS tiene su propia barra
de mens con los mens adecuados para cada una de ellas. Debe tenerse presente que los mens
ANALIZAR y GRAFICOS aparecen en todas las ventanas, de esta forma se facilita la generacin de nuevos
resultados sin tener que cambiar de ventana.
Por ejemplo, la ventana Editor de datos (Ver figura 7) comprende los siguientes mens:

Figura 7: Mens de la ventana editor de datos


Archivo: Utilice este men para crear un nuevo archivo de SPSS, abrir uno existente, grabar, leer datos
creados con otras aplicaciones, imprimir, etc.
Edicin: Utilice este men para copiar datos, buscar, pegar, etc.
Ver: Utilice el men Ver para cambiar la fuente, cuadrculas, rtulo de las variables, etc.
Datos: Emplee este men para definir variables, insertar casos, insertar variables, disear plantillas.
Tambin se realizan con este men la fusin de archivos, transposicin de variables y casos o la
creacin de subgrupos de casos para su anlisis.
Transformar: Utilice este men para realizar cambios en variables seleccionadas y para calcular nuevas
variables basadas en los valores de las ya existentes.
Analizar: Se hace uso de este men para seleccionar diferentes procedimientos estadsticos que se
quiere utilizar como reportes, frecuencias, tablas de contingencias, tablas, anlisis de varianza,
correlacin, regresin, anlisis factorial, etc.
Grficos: Este men deber emplearse para crear grficas de barras, sectores, histogramas, reas,
diagramas de dispersin y grficos en tercera dimensin de alta resolucin y a todo color, entre muchos
4|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

otros. Dentro de este men tambin se incluye los grficos interactivos, caracterizndose estos por
disponer de ms tipos de grficos como grficos de rea, grficos de barras apiladas o grficos de
mltiples variables, estos tambin comprenden ms funciones como lneas de referencia, ejes
secundarios, trazos en los diagramas de dispersin, mayor flexibilidad en la presentacin de claves y
mayor control en la presentacin de paneles, y tambin permite la obtencin de grficos a partir de
tablas pivote.
Utilidades: Este men se utiliza para obtener informacin completa sobre la base da datos, as como
para la edicin de procesos.
Ventana: Por medio de este men se puede ordenar, seleccionar y controlar atributos de las ventanas
abiertas.
? (Ayuda): Este men comprende las opciones temas (el mismo que proporciona acceso a las pestaas
Contenido, ndice, y buscar, que pueden emplearse para ubicar temas especficos de la ayuda), tutorial
(el que facilita una introduccin global ms detallada sobre los aspectos bsicos de SPSS) y asesor
estadstico (el mismo que puede ayudarle solicitndole informacin mediante preguntas simples,
utilizando un lenguaje no tcnico y ejemplos visuales que permitirn seleccionar las funciones bsicas
de los estadsticos y los grficos ms apropiados para sus datos).
1.3

BARRAS DE HERRAMIENTAS

Cada ventana de SPSS tiene su propia barra de herramientas, las mismas que se ubican debajo de la barra
de mens, y permite el acceso rpido y fcil a las funciones ms habituales. Debe tenerse presente que las
pistas proporcionan una breve descripcin de cada herramienta.
Por ejemplo, la ventana Editor de datos (ver figura 8) comprende la siguiente barra de herramientas:

Figura 8: Barra de herramientas de la ventana editor de datos


Procedimiento para mostrar u ocultar barras de herramientas:

Ver/Barras de herramientas
En el cuadro de dilogo Mostrar barras de herramientas, seleccionar las que se desee mostrar u ocultar.

Procedimiento para mover una barras de herramientas:

1.4

Pulsar en cualquier punto de la barra que no sean los botones


Arrastrar la barra de herramientas hasta la nueva ubicacin.
BARRA DE ESTADO

Est situada en la base de cada ventana de SPSS, proporciona la informacin siguiente:

Estado del comando: Nmero de casos procesados


Estado del filtro: Si se est utilizando slo una parte del archivo de datos
Estado de ponderacin: Si se utiliza un criterio de ponderacin
Estado de divisin del archivo: Si se est trabajando con el archivo de datos dividido en subgrupos a
partir de una o ms variables de agrupacin.

En la figura 9 puede observarse la barra de estado de la ventana editor de datos

Figura 9: Barra de estado de la ventana editor de datos

5|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

1.5

CUADROS DE DIALOGO

Los cuadros de dilogo se emplean para seleccionar variables y opciones para el anlisis.
1.5.1

COMPONENTES: Un cuadro de dilogo (Ver figura 10) tiene los siguientes componentes:

a.

Lista de variables de origen: Es la lista de variables del archivo de datos de trabajo, aqu debemos
tener presente que las variables numricas se identifican con el smbolo almohadilla (#), y las
variables alfanumricas o de cadena se identifican por un icono con la letra A, y dentro de estas
ltimas, las variables de cadena corta (de 8 menos caracteres de longitud se identifican con el
signo menor que (<) del icono, en tanto que las de cadena larga (de ms de 8 caracteres de longitud
se identifican con el signo mayor que (>) del icono.
Para seleccionar una o ms variables en un cuadro de dilogo tengan presente lo siguiente:

b.

Una slo variable.- En este caso debe resaltar la variable en la lista de origen y pulsar el botn
flecha o hacer doble clic en la misma.

Ms de una variable consecutiva.- Pulse en la primera de ellas y despus en la ltima ,


manteniendo pulsada la tecla Mays.

Ms de una variable alterna.- Pulse en la primera variable, luego pulse en la siguiente mientras
mantiene la tecla Ctrl pulsada.

Todas las variables de la lista.- Pulse Ctrl +A

Listas de variables de destino: En el aparecern las variables elegidas para el anlisis.

Figura 10: Controles de un cuadro de dilogo

Lista de variables
de origen

Lista de variables
de destino

Botones de
comando

Botones del subcuadro

6|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

c.

Botones de comando del cuadro de dilogo: Son aquellos que dan la instruccin al programa
para que se realice una accin. Si se desea informacin sobre los controles particulares de un
cuadro de dilogo, deber pulsar en l para realizar especificaciones adicionales.
En la mayora de cuadros de dilogo existen cinco botones de comandos estndar: aceptar, pegar,
restablecer, cancelar y ayuda.

d.

Botones del subcuadro de dilogo: Una caracterstica de los cuadros de dilogo es que ofrecen
normalmente la informacin mnima que se requiere para ejecutar un procedimiento. Precisamente
una funcin de los subcuadros de dilogo es realizar especificaciones adicionales, estos se
identifican por ir seguido de puntos suspensivos despus del nombre.

1.5.2

OBTENCION DE INFORMACION: Aqu nos referiremos a informacin sobre los controles y


variables en un cuadro
de dilogo y sobre las
variables

a.

Informacin sobre los


controles del cuadro de
dilogo (ver figura 11)

Pulse con el botn


derecho del ratn
en el control sobre
el
que
desea
obtener
la
informacin.
Elija Qu es esto?
en
el
men
contextual
emergente.
Figura 11: Obtencin de informacin sobre los controles de
un cuadro de dilogo

b.

Informacin sobre las variables en un cuadro de dilogo (ver figura 12)

Seleccione una variable de la


lista con el botn izquierdo
del ratn

Pulse en cualquier parte de la


lista con el botn derecho

Pulse en informacin de las


variables
en
el
men
contextual emergente

Figura 12: Obtencin de informacin sobre las variables en


un cuadro de dilogo
7|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

2. ARCHIVO DE DATOS EN SPSS


2.1

ABRIR UN ARCHIVO

Para abrir archivos de SPSS, de SYSTAT, de hojas de clculo, de DBASE o archivos de datos delimitados
por tabuladores, sin necesidad de convertirlos a un formato intermedio ni de introducir informacin sobre la
definicin de las variables, efecte lo siguiente:
Seleccione Archivo/Abrir... (del men principal de la ventana editor de datos)
Aparecer el cuadro de dilogo correspondiente (ver figura 13)
En Nombre del archivo puede
seleccionarse un archivo de la lista o
especificar una ruta y extensin distinta.
Por defecto SPSS muestra la relacin de
los archivos de su directorio con
extensin .sav
Buscar en el cual identifica la carpeta en
la que se ubica el archivo a seleccionarse
o seleccionado.
Archivos de tipo permite seleccionar
entre los distintos tipos de archivos de
datos. Tngase presente que por defecto
siempre se tendr la opcin SPSS (*.sav)
seleccionada.
Figura 13: Cuadro de dilogo de Archivo/abrir...
Pulse en Abrir
2.1.1

TIPOS DE ARCHIVOS DE DATOS QUE RECONOCE SPSS


SPSS (*.sav).- Es el tipo por defecto. Permite abrir archivos guardados con formato SPSS,
incluyendo SPSS para Windows, Macintosh, Unix y el producto SPSS/PC+ para DOS.
SPSS/PC+ (*.sys).- Abre archivos de datos de SPSS/PC+
SYSTAT (*.syd, *.sys).- Abre archivos de datos de SYSTAT.
SPSS porttil (*.por).- Abre archivos de datos guardados con formato SPSS porttil. El
almacenamiento de archivos en este formato lleva mucho ms tiempo que guardarlos en formato
SPSS.
Excel (*.xls).- Abre archivos de hojas de clculo de Excel
Lotus (*.w*).- Abre archivo de datos guardados en formato 1-2-3.
SYLK (*.slk).- Abre archivo de datos guardados en formato SYLK (vnculo simblico), un formato
empleado por algunas aplicaciones de hojas de clculo.
Dbase (*.dbf).- Abre archivos de formato dBASE para dBASE IV, dBASE III III PLUS Dbase II.
Nombre de archivo largo de SAS. Versin de 7-9 para SAS Windows, extensin larga.
Nombre de archivo corto de SAS. Versin de 7-9 para SAS Windows, extensin corta.
SAS v6 para Windows. Versin 6.08 de SAS para Windows y OS2.
SAS v6 para UNIX. Versin 6 de SAS para UNIX (Sun, HP, IBM).
Transporte de SAS. Archivo de transporte de SAS.
Texto. Archivo de texto ASCII.
Stata. Versiones 48 de Stata.
Texto. Archivo de texto ASCII.
8|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

2.1.2

OPCIONES DE ABRIR ARCHIVO EN HOJAS DE CALCULO Y ARCHIVOS DELIMITADOS POR


TABULADORES

En este caso se presentan dos opciones:

Leer los nombres de las variables.- Esta opcin permite leer los nombres de las variables de la
primera fila del archivo o de la primera fila del rango definido.

Rango: En los archivos de hoja de clculo, tambin es factible leer un rango de casillas, para lo cual
deber especificarse el rango correspondiente.

Figura 14: Opciones de Abrir en Excel


2.1.3

LECTURA DE HOJAS DE CALCULO EN EL EDITOR DE DATOS

Para abrir archivos de este tipo hay que tener presente que las dimensiones de la base de datos en SPSS
son el nmero de filas (casos) y columnas (variables). No existen casillas vacas dentro de esta matriz de
filas por columnas y todas las celdas tienen un valor incluso si este valor est en blanco.
Para leer los datos de las hojas de clculo, en el caso de Excel de versiones anteriores a la versin 5, se
aplican las siguientes reglas:
Las filas son casos y las columnas son variables.
El tipo y ancho de los datos para cada variable es determinado segn la anchura de la columna y el tipo
de datos de la primera casilla de la columna (Ver figura 15).
En las variables numricas las casillas en blanco se convierten en valor perdido (el mismo que es
indicado por un punto). En las variables de cadena los espacios en blanco son valores de cadena
vlidos (ver figura 15).
De no leerse los nombres de variable de la hoja de clculo se utilizan las letras de las columnas
a,b,c,.....) como los nombres de variables de los archivos de Excel y Lotus.

9|Pg ina

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 15: Lectura de un archivo de hoja de clculo por el SPSS


A.

Lectura de un archivo de hoja de clculo con nombre de variable y sin valores perdidos
Hoja de clculo

B.

Lectura de un archivo de hoja de clculo con nombre de variable, columna y valor perdido
Hoja de clculo

Valor de otro
tipo

C.

Nombre de variable en
blanco. Como se ve no es
incluida en el archivo SPSS

Archivo de datos SPSS

Perdido por el
sistema

Lectura de un archivo de hoja de clculo sin nombre de variable, columna vaca y valor perdido
Hoja de clculo

Valor de otro
tipo

D.

Archivo de datos SPSS

Archivo de datos SPSS

Perdido por el
sistema

Lectura de un archivo de hoja de clculo sin nombre de variable, columna vaca y valor perdido
Hoja de clculo

Variable de
cadena en blanco

Variable numrica
en blanco

Archivo de datos SPSS

Valor de cadena vlido

Perdido por el
sistema

10 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

2.1.4

LECTURA DE ARCHIVOS DE dBASE EN EL EDITOR DE DATOS

En este caso, los nombres de campo se


convierten automticamente en nombres
de variables. Hay que tener en cuenta
que los dos puntos en los nombres de
campo de dBASE se convierten en
subrayado.
De la misma forma, se incluyen aquellos
registros que fueron marcados para ser
eliminados y que an no haban sido
eliminados definitivamente. El programa
tambin crea una nueva variable de
cadena, D_R, que incluye un asterisco en
los casos marcados para su eliminacin.
Figura 16: Opciones de Abrir en dBase
2.1.5

LECTURA DE ARCHIVOS DELIMITADOS POR TABULADORES EN EL EDITOR DE DATOS

En este caso, los valores pueden ser numricos o de cadena. El tipo y la anchura de los datos de cada
variable estn determinados por el tipo y ancho del primer valor de los datos de la columna. Los valores de
otro tipo se convierten en valor perdido por el sistema. Tngase presente tambin que si no se leen los
nombres de la variable del archivo, el programa les asigna por defecto v1, v2, v3 y as sucesivamente.

2.2

LECTURA DE ARCHIVOS DE DATOS DE TEXTO

Para ejecutar esta accin efecte lo siguiente:


Seleccione Archivo/Leer datos de texto
Seleccione el archivo de texto en el cuadro de dilogo Abrir
Siga los pasos indicados en el asistente para la importacin de texto para definir como desea leer el
archivo correspondiente.
Para los ejemplos haga uso de la base de datos POBLA_FIJO.DAT y POBLA_TXT.DAT
a.

Asistente para la importacin de texto: Paso 1

El archivo de texto se mostrar en una ventana de vista previa. Aqu existe la posibilidad de aplicar un
formato predefinido (guardado con anterioridad desde el asistente para la importacin de texto) o seguir los
pasos del asistente (usando la opcin Siguiente >), situacin que se observa en la figura 17.

11 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 17: Asistente para la importacin de texto: Paso 1

b.

Asistente para la importacin de texto: Paso 2

Este segundo paso ofrece informacin sobre las variables, debiendo determinarse:

Si las variables son delimitadas o de anchura fija, es decir, determinar cmo estn organizadas sus
variables?
Ser delimitada cuando para separar las variables se utilizan espacios, comas, tabulaciones u otros
caracteres, de esta forma, las variables quedan registradas en el mismo orden para cada caso, pero
no necesariamente conservando la misma ubicacin para las columnas. Por el contrario, ser de
anchura fija cuando cada variable es registrada en la misma posicin de columna en el mismo
registro para cada caso del archivo de datos.

Si la primera fila del archivo contiene las etiquetas para cada variable, hay que tener presente que si
los nombres de las variables tienen ms de ocho caracteres se truncan.

Situacin que se observa en la figura 18.

12 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 18: Asistente para la importacin de texto: Paso 2


c.

Asistente para la importacin de texto Ancho Fijo: Paso 3

Este paso ofrece informacin sobre los casos, debiendo determinarse:

El nmero de la lnea en la que


comienza el archivo de datos que
contiene los valores, esto implica
que si la lnea o lneas superiores
del archivo de datos contienen
etiquetas o cualquier otro texto que
no sean valores dicha lnea no
podra ser la nmero 1.

El nmero de lneas que representa


cada caso.

La cantidad de casos que desea


importar, pudiendo ser todos los
casos del archivo de datos, los
primero
n
casos
(n
ser
determinado por el usuario) o una
muestra aleatoria a partir de un
porcentaje especificado tambin
por el usuario. (ver figura 19).
Figura 19: Asistente para la importacin de texto ancho fijo: Paso 3

13 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

d.

Asistente para la importacin de texto Ancho Fijo: Paso 4

En este paso se muestra la mejor


suposicin del asistente para la
importacin de texto sobre la forma de
leer el archivo de datos.
Las lneas verticales en la ventana de
vista previa muestran el lugar en que a
criterio del asistente comienza cada
variable del archivo, lo que le da al
usuario la posibilidad de corregir dichas
lneas ya sea insertando, moviendo o
eliminando lneas de ruptura segn
convenga para separar variables.
Situacin que se observa en la figura
20.

Figura 20: Asistente para la importacin de texto ancho fijo: Paso 4


e.

Asistente para la importacin de texto Archivos delimitados: Paso 3

Este paso ofrece informacin sobre los casos, debiendo determinarse:

El nmero de la lnea en la que


comienza el archivo de datos
que contiene los valores.

La forma como se representan


sus casos, ya sea que cada
lnea representa un caso o que
un
nmero
concreto
de
variables representan un caso,
en esta ltima situacin deber
sealarse el
nmero de
variables que representan un
caso.

La cantidad de casos que


desea importar, pudiendo ser
todos los casos del archivo de
datos, los primero n casos (n
ser determinado por el
usuario)
o
una
muestra
aleatoria a partir de un
porcentaje
especificado
tambin por el usuario (ver
figura 21)
Figura 21: Asistente para la importacin de texto archivos
delimitados: Paso 3
14 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

f.

Asistente para la importacin de texto Archivos delimitados: Paso 4

En este paso se muestra la mejor suposicin del asistente para la importacin de texto sobre la forma de
leer el archivo de datos. De ah que sea necesario indicarse los caracteres o smbolos que separan los
valores, pueden seleccionarse cualquier combinacin de espacios, comas, signos de punto y coma,
tabulaciones o cualquier otro caracter.
Situacin se visualiza en la figura 22.

Figura 22: Asistente para la importacin de texto archivos delimitados: Paso 4


g.

Asistente para la importacin de texto: Paso 5

En este paso se controla el nombre de la variable, el formato de datos, as como las variables que se
incluirn en el archivo definitivo (ver figura 23).
Aqu tenga presente lo siguiente:

En la opcin NOMBRE DE VARIABLE puede sobrescribir los nombres predeterminados de


variables y sustituirlos por otros diferentes. Los nombres de variable que tengan ms de 8
caracteres o que estn repetidos sern modificados de manera automtica.

Para utilizar la opcin FORMATO DE DATOS primero seleccione una variable en la ventana y luego
escoja el formato (slo si es necesario). Entre las opciones de formato se encuentran: No importar
(omite la variable o variables seleccionadas del archivo de datos importado), Numrico (los valores
vlidos incluyen nmeros, los signos ms y menos iniciales y un indicador decimal), Cadena (son
valores vlidos todos los caracteres del teclado y los espacios en blanco incrustados), Fecha/hora,
Dlar (los valores vlidos son nmeros con un signo de dlar inicial optativo y puntos separadores
de millares tambin optativos, Coma (los valores vlidos son nmeros que emplean un punto para
separar decimales y una coma para separar millares) y Punto (los valores vlidos son nmeros que
emplean un coma para separar decimales y un punto para separar millares)

15 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 23: Asistente para la importacin de texto: Paso 5


h.

Asistente para la importacin de texto: Paso 6

Es el ltimo paso que se


realiza, en el cual se puede
guardar las especificaciones
en un archivo para hacer
uso de ellas cuando se
trabaje con archivo de datos
de textos similares, tambin
es posible pegar la sintaxis
generada en una ventana
de sintaxis.

Situacin se visualiza en la
figura 24.

Figura 24: Asistente para la importacin de texto: Paso 6

16 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

2.3

Lectura de archivos de bases de datos con ODBC

Mediante esta opcin podr leer cualquier tipo de base de datos para los que disponga de un controlador
ODBC. De esta forma se puede accesar a archivos de Excel 5, Access, DBASE, Foxpro, entre otros.
Para leer archivos de bases de datos con ODBC efecte lo siguiente:
Seleccione Archivo/Captura de bases de datos/Nueva consulta
Seleccionar el origen de los datos. Puede ser un formato de base de datos, un archivo de Excel o un
archivo de texto.
Seleccione el archivo de base de datos (en algunos archivos de bases de datos tendr que
introducir un nombre de acceso y una contrasea)
Seleccionar las tablas y los campos de datos.
Especificar cualquier relacin existente entre las tablas
Si el usuario deseas tiene la posibilidad de:

Especificar algn criterio de seleccin de los datos


Definir cualquier atributo de variable
Guardar la consulta creada antes de ejecutarla

A continuacin se presenta un ejemplo de cmo importar un archivo de datos en Excel 5. El nombre


del archivo a importar es: POBLA.XLS
Seleccionar origen de datos

Seleccionar el archivo de base de datos

17 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Seleccionar datos

Establecer criterio de seleccin de los datos

Definir atributo de variable

Guardar la consulta antes de ejecutarla

Figura 25: Pasos para la importacin de un archivo en Excel

18 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

En este segundo ejemplo se importarn bases de datos generadas en FoxPro. Los nombres de las
bases de datos a importarse son POBLA.DBF (que contiene informacin sobre algunas caractersticas
del hogar) y pob2004.dbf (que contiene informacin sobre cada uno de los miembros o personas que
conforman los hogares encuestados). La relacin entre ambas tablas ser determinada mediante la
variable Ficha.
Seleccionar origen de datos

Especificar relacin entre las tablas

Seleccionar las tablas y los campos

Especificar criterio de seleccin de los datos

19 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Definir atributo de variable

Guardar la consulta antes de ejecutarla

Figura 26: Pasos para la importacin de un archivo en FoxPro


En el tercer ejemplo se importarn bases de datos generadas en Access. El archivo es Cipotes2.mdb, el
mismo que contiene informacin sobre beneficiarios de un programa de erradicacin del trabajo infantil.
Dicho archivo contiene diferentes tablas: NNA, padres, servicios, etc. Sin embargo, para efectos de este
ejemplo se importar slo la tabla de NNA (nios, nias y adolescentes).
Seleccionar origen de datos

Seleccionar las tablas y los campos

20 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Seleccionar las tablas y los campos

Definir atributo de variable

Especificar criterio de seleccin de los datos

Guardar la consulta antes de ejecutarla

Figura 27: Pasos para la importacin de un archivo en Access

21 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

2.4

GUARDAR ARCHIVO DE DATOS

Se presentan dos casos:


2.4.1

GUARDAR LOS CAMBIOS DE UN ARCHIVO DE DATOS

Este procedimiento se utilizar para guardar cualquier cambio que se realice en un archivo de datos abierto.
Seleccione la ventana del Editor de datos (para convertirla en la ventana activa)
Seleccionar Archivo/Guardar
El archivo de datos modificado se guarda y sobreescribe la versin anterior del archivo.
2.4.2

GUARDAR UN ARCHIVO DE DATOS NUEVO O GUARDAR LOS DATOS CON UN FORMATO


DISTINTO

Seleccione la ventana del Editor de datos


Seleccionar Archivo/Guardar como...
Seleccione un tipo de archivo de la lista desplegable
Anote un nombre de archivo para el nuevo archivo de datos. Para escribir nombres de variable en la
primera fila de una hoja de clculo o de archivo de datos delimitados por tabuladores pulse en escribir
nombres de variable en hoja de clculo.
Pulsar guardar

Figura 28: Guardar archivo de datos nuevo o guardar con formato distinto

22 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

2.4.3

GUARDAR UN SUBCONJUNTO DE VARIABLES

Para datos almacenados como un archivo de datos de SPSS, el cuadro de dilogo Guardar datos como:
Variables permite seleccionar las variables que desea guardar en el nuevo archivo de datos. Tenga
presente que por defecto, se almacenan todas las variables.
Bajo tal situacin, anule la seleccin de las variables que no desea guardar o pulse en Eliminar todo y, a
continuacin, seleccione aquellas variables que desea guardar.
Active la ventana del Editor de datos
Seleccionar Archivo/Guardar como...
Seleccione SPSS (*.sav) de la lista de tipos de archivos
Pulse en Variables y seleccione la (las) que va a guardar.
Anote un nombre de archivo para el nuevo archivo de datos.
Pulsar guardar

Figura 29: Guardar un subconjunto de variables

23 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

3. EDITOR DE DATOS
El Editor de datos permite la creacin y edicin de archivos de datos. Esta ventana se abre
automticamente cuando se inicia una sesin en SPSS. Algunas de sus caractersticas (ver figura 30) son:
Las filas representan casos
Las columnas representan variables
La casilla es la interseccin del caso y la variable, las mismas que solo contienen valores de datos.
Las dimensiones del archivo estn dadas por el nmero de casos y de variables, de esta forma es
factible introducir datos en cualquier casilla. Al introducir datos en una casilla fuera de los lmites del
archivo definido, ste se ampliar para incluir todas las filas y columnas situadas entre esa casilla y los
lmites del archivo. No hay casillas vacas en los lmites del archivo de datos, de tratarse de variables
numricas stas se convierten en valor perdido, pero si se trata de variables de cadena, un espacio en
blanco se considera como vlido.
Variable

Caso
Casillas

Figura 30: Editor de datos de SPSS


3.1

VISTA DE DATOS Y VISTA DE VARIABLES

La ventana editor de datos presenta en la parte inferior dos pestaas: la primera (vista de datos) pertenece
a la ventana de datos propiamente dicha, en la misma, los datos se introducen y se manipulan de la misma
manera y con las mismas opciones de copiado, pegado, etc., que en cualquier otro programa de sistema
operativo Windows. La segunda pestaa (vista de variables) es ms y novedosa, ya que da acceso a una
24 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

hoja de captura de datos, en la cual se definen las variables a utilizar, as como sus caractersticas
principales: tipo, anchura, decimales, etiqueta, valores, medida, etc.
Los pasos que se siguen para definir una variable en la pestaa vista de variables son:
Introduzca el nombre de la variable (este primer paso, slo cuando se est creando una base de datos
en SPSS).
Definir el tipo
Definir anchura y nmero de decimales
Definir etiquetas
Definir valores
Definir valores perdidos (si es necesario)
Definir tamao de la columna y la alineacin
Definir medida
Adems de la definicin de propiedades de variables en la vista Variable, existen otros dos procedimientos
para definir las propiedades de variables: El Asistente para la copia de propiedades de datos, y, la opcin
Definir propiedades de variables.

Figura 31: Pestaa vista de variables


3.1.1

Nombre de las variables

Por defecto el programa asigna el prefijo var seguido de un nmero de cinco dgitos, el mismo que puede
ser cambiado introduciendo el nuevo. Para los nombres de las variables se debe cumplir los requisitos
siguientes:
25 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

3.1.2

Deben comenzar por una letra Los dems caracteres pueden ser letras, dgitos, puntos o los
smbolos @, #, _ $.
No pueden terminar en punto.
No pueden contener espacios en blanco ni caracteres especiales (!, ?, y *)
Se deben evitar los nombres de variable que terminan con subrayado, esto evitar conflictos con las
variables creadas automticamente por algunos procedimientos.
La longitud del nombre no debe exceder los 64 bytes, esto equivale en el caso del idioma espaol a
64 caracteres.
No puede haber dos nombres de variables repetido.
Cada nombre de variable debe ser nico; no se permiten duplicados.
No se pueden utilizar como nombres de variables las palabras reservadas (ALL, AND, BY, EQ, GE,
GT, LE, LT, NE, NOT, OR, TO, WITH).
Los nombres de variable se pueden definir combinando de cualquier manera caracteres en
maysculas y en minsculas, esta distincin entre maysculas y minsculas se conserva en lo que
se refiere a la presentacin.
Definir tipo de variable

Por defecto el programa asume que todas las variables nuevas son numricas. Esta opcin se emplea para
cambiar el tipo de datos. El contenido del cuadro de dilogo depende del tipo de dato seleccionado, para
algunos de ellos hay cuadros de texto para el ancho y el nmero de decimales, para otros hay que
seleccionar un formato de una lista desplegable de ejemplos.
En este mismo cuadro de dilogo se define la ANCHURA y el nmero de cifras DECIMALES, este ltimo
slo si le corresponde.

Figura 32: Cuadro de dilogo Definir tipo de variable


26 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

3.1.3

Definir etiquetas

Esta opcin permite etiquetar la variable (etiqueta descriptiva de variable). Estas pueden tener hasta 256
caracteres.
3.1.4

Definir valores

Esta opcin permite asignar un nombre a cada valor de la variable (etiqueta descriptiva de valor). Estas
pueden tener hasta 60 caracteres. Hay que tener presente que las etiquetas de valor no estn disponibles
para las variables de cadena larga.
Utilice \n cuando quiera dividir la etiqueta, en este caso, debe colocarla en el punto de la etiqueta en la que
busca se divida.

Figura 33: Cuadro de dilogo Definir valores

3.1.5

Definir valores perdidos

Permite definir los datos especificados como perdidos por el usuario. Estos valores aparecen marcados para
un tratamiento especial y se excluyen de la mayora de clculos.
Tal como se visualiza en la figura 34, se pueden introducir hasta tres valores perdidos individuales de tipo
discreto, un rango de valores perdidos o un rango ms un valor de tipo discreto.

27 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 34: Cuadro de dilogo Definir valores perdidos


3.1.6

Definir formato de columna y alineacin

Se emplea esta opcin para controlar el ancho de columnas y la alineacin de los valores de datos. Hay que
tener presente que los formatos de columna afectan slo la presentacin de datos en el editor de datos, es
decir, al variar el ancho de columna no vara el ancho definido de la variable.
3.1.7

Definir nivel de medida

Aqu hay que determinar si la variable es de escala (datos numricos de una escala de intervalo o de
razn), ordinal (datos cuyos valores representan categoras con algn orden intrnseco) y nominal (datos
cuyos valores representan categoras que no guardan un orden intrnseco), estos dos ltimos pueden ser de
cadena (alfanumricos) o numricos.

Figura 35: Cuadro de dilogo Definir nivel de medida


28 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

3.2 INTRODUCCION DE DATOS


Una ventaja que presenta el SPSS es que brinda la posibilidad de ingresar datos directamente en el Editor
de datos, cabe sealar que se puede hacer la entrada de datos en cualquier orden, ya sea por caso o por
variable. Sin embargo, es pertinente sealar que la forma ms ordenada es hacerla caso por caso, luego de
haber definido las variables. Algunas caractersticas a tener presente son:
La casilla activa aparece remarcada con un borde ms grueso.
El nombre de la variable y nmero de fila de la casilla activa aparece en la parte superior izquierda del
Editor de datos.
Al introducir un valor de datos, ste se muestra en el editor de casillas (parte superior del Editor de
datos), cabe sealar que ste no es registrado hasta que se pulse Intro o se seleccione otra casilla.
En el ingreso de datos es factible utilizar las etiquetas de valor definidas en la introduccin de datos, si
stas no aparecen en la ventana Editor de datos seleccione en los mens Ver/Etiquetas de valor, luego
efecte lo siguiente:
- Pulse la tecla Ctrl y el botn de ratn en la casilla donde desee introducir el dato.
- Pulse dos veces en la etiqueta de valor que desee, de esta forma se introduce el valor y la
etiqueta de valor se mostrar en la casilla (ver figura 36).

Figura 36: Uso de Etiquetas de valor


3.3

EDICION DE DATOS

Con el editor de datos es posible modificar un archivo de datos de muchas maneras, entre las cuales se
tiene:
Cambiar valores de datos
Cortar, copiar y pegar valores de datos
Insertar nuevos casos

Insertar nuevas variables


Borrado de casos y/o variables
Desplazamiento de las variables
29 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Cambiar las definiciones de las variables


Encontrar un caso
3.3.1

Buscar datos

Cambiar valores de datos

Eliminar el valor anterior e introducir uno nuevo

Pulse en la casilla, su valor aparecer en el


editor de casillas
Introduzca nuevo valor, reemplaza el valor
anterior en el editor de casillas
Para registrar el valor nuevo, pulse Intro o
desplcese a otra casilla.

3.3.2

Modificar un valor de datos

Pulse en la casilla, su valor aparecer en


el editor de casillas
Pulse en el editor de casillas y edite el
valor de datos
Para registrar el valor modificado, pulse
Intro o desplcese a otra casilla.

Cortar, copiar y pegar valores de datos

En este caso tiene las siguientes posibilidades:


Mover o copiar un nico valor de casilla a otra casilla
Mover o copiar un nico valor de casilla en un grupo de casillas
Mover o copiar para un nico caso en casos mltiples
Mover o copiar para un nica variable en variables mltiples
Mover o copiar un grupo de valores de casillas en otro grupo de casillas.
3.3.3

Insertar nuevos casos

El procedimiento a ejecutar es el siguiente:


Seleccione cualquier casilla en el caso (fila) abajo de la posicin donde desea insertar el nuevo caso.
Seleccione Datos/Insertar caso, de esta forma se inserta una fila nueva y todas las variables reciben el
valor perdido por el sistema.
Hay que tener presente que la introduccin de datos en una casilla de una fila vaca crea automticamente
un nuevo caso.
3.3.4

Insertar nuevas variables

El procedimiento a ejecutar es el siguiente:


Seleccione una casilla de la variable (columna) a la derecha de la posicin donde desea insertar la
nueva variable.
Seleccione Datos/Insertar variable, de esta forma se inserta una nueva variable con el valor perdido por
el sistema para todos los casos.
Hay que tener presente que la introduccin de datos en una columna vaca crea automticamente una
nueva variable con un nombre por defecto (prefijo var y un nmero de 5 dgitos) y un tipo de datos tambin
por defecto (numrico).
3.3.5

Borrado de casos y/o variables

El procedimiento a ejecutar es el siguiente:


Seleccione la fila (s), la columna (s) o el rea a eliminar.
Seleccione Edicin/Eliminar o pulsar Supr
30 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

3.3.6

Desplazamiento de las variables

El procedimiento a ejecutar es el siguiente:


Si el objetivo es colocar la variable entre dos variables existentes, inserte una nueva variable en la
posicin donde ha pensado colocarla
En la variable a desplazar, pulse el nombre (ubicado en la parte superior de la columna) con lo que se
resaltar la columna entera.
Seleccione Edicin/Cortar
Pulse el nombre de la variable de la columna donde desee mover la variable, tambin se resaltar la
variable entera.
Seleccione Edicin/Pegar
3.3.7

Cambiar las definiciones de las variables

El tipo de datos de una variable es factible de ser cambiado, para lo cual deber ingresarse al cuadro de
dilogo Definir tipo de variable.
3.3.8

Ir a caso

El procedimiento a ejecutar es el siguiente:


Seleccione la ventana del Editor de datos (para
convertirla en la ventana activa)
Seleccione Datos/Ir a caso
Anote el nmero de fila a la que desee ir.
Figura 37: Cuadro de Dilogo Ir a caso

3.3.9

Buscar dato

El procedimiento a ejecutar es el siguiente:


Seleccione cualquier casilla en la
columna de la variable que desee buscar.
Seleccione Edicin/Buscar....
Anote el valor de datos que desea
buscar
Pulse en Buscar siguiente.
Figura 38: Cuadro de Dilogo Buscar dato

31 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

4. PREPARACION DE DATOS
En este captulo se detalla un conjunto de funciones de preparacin inicial de los datos antes de entrar al
anlisis, entre estas se incluyen:

4.1

Asignar propiedades de las variables que describan los datos y definir cmo se deben tratar ciertos
valores.
Identificar aquellos casos que pueden contener informacin duplicada y excluir de los anlisis o
eliminarlos del archivo de datos.
Crear nuevas variables con algunas categoras distintas que representen rangos de valores de
variables que tengan un mayor nmero de valores posibles.
PROPIEDADES DE LAS VARIABLES

Todas las propiedades de variables se pueden asignar en la Vista de Variables del Editor de datos (tal como
se vio en el acpite 3.1). Sin embargo, en esta versin, existen dos opciones que les pueden facilitar este
proceso:
Definir propiedades de variables, opcin que le permite definir etiquetas de valor descriptivas y valores
perdidos. Esto es especialmente til para datos categricos (nominales u ordinales) con cdigos numricos
utilizados para valores de categoras.
Copiar propiedades de datos, opcin que le ofrece la posibilidad de utilizar un archivo de datos con
formato SPSS como plantilla para definir las propiedades de variables y archivos en el archivo de datos
actual.
4.1.1

Definicin de propiedades de variables

Mediante esta opcin es factible:

Explorar los datos reales y enumerar todos valores de datos nicos para cada variable
seleccionada.
Identificar valores sin etiquetas y ofrece una funcin de etiquetas automticas.
Copiar etiquetas de valor definidas de otra variable en la variable seleccionada o de la variable
seleccionada a varias variables adicionales.
Nota: Para utilizar Definir propiedades de
variables sin explorar primero los casos,
introduzca 0 para el nmero de casos que
se van a explorar.
El procedimiento a ejecutar es el siguiente:
Seleccione Datos/Definir Propiedades
de Variables
Seleccione las variables numricas o de
cadena corta para las que desea crear
etiquetas de valor o definir o cambiar otras
propiedades de las variables, como los
valores perdidos o las etiquetas de variable
descriptivas.
Especificar el nmero de casos que se
van a explorar para generar la lista de
valores nicos.
Figura 39: Cuadro de Dilogo Definicin de
propiedades de variable
32 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Especifique un lmite superior para el nmero de valores nicos que se va a visualizar.


Pulse en Continuar para abrir el cuadro de dilogo Definir propiedades de variables principal.

Figura 40: Cuadro de Dilogo principal Definicin de propiedades de variable


Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar otras
propiedades de las variables. En la figura 40 puede observarse que en el recuadro Lista de Variables
Exploradas existen una sola variable POBREZA que tiene marcada una X en la columna Sin Etiqueta..
Para este ejemplo se ha hecho uso del archivo BD_DPTO.SAV

Figura 40A: Cuadro de Dilogo principal Definicin de propiedades de variable pobreza


Repita este proceso para cada variable de la lista para la que desee crear etiquetas de valor.

33 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.
4.1.2

Copia de propiedades de datos

A partir de esta opcin es factible utilizar un archivo de datos de SPSS como plantilla para definir las
propiedades de las variables y del archivo del archivo de datos de trabajo. De la misma forma, es factible
utilizar las variables del archivo de datos de trabajo como plantillas para el resto de las variables del archivo
de datos de trabajo.
En general, el uso de esta opcin les permite:

4.2

Copiar las propiedades de archivo seleccionadas de un archivo de datos externo en el archivo de


datos de trabajo. Las propiedades de archivo incluyen documentos, etiquetas de archivos, conjuntos
de respuestas mltiples, conjuntos de variables y ponderacin.
Copiar las propiedades de variable seleccionadas de un archivo de datos externo en las variables
coincidentes del archivo de datos de trabajo. En este caso como propiedades de variable se
incluyen etiquetas de valor, valores perdidos, nivel de medida, etiquetas de variable, formatos de
impresin y escritura, alineacin y ancho de columna.
Copiar las propiedades de variable seleccionadas de una variable, ya sea del archivo de datos
externo o del archivo de datos de trabajo, en diversas variables del archivo de datos de trabajo.
Crear nuevas variables en el archivo de datos de trabajo a partir de variables seleccionadas del
archivo de datos externo.
AGRUPACIN VISUAL

Esta opcin permite crear variables nuevas, a partir de la agrupacin de los valores contiguos (o categoras)
de las variables existentes, para dar lugar a un nmero limitado de categoras diferentes.
En general esta opcin permite:

Crear variables categricas a partir


de variables de escala continuas.
Por ejemplo, a partir de la variable
de escala EDAD puede crear una
variable categrica nueva que
contenga GRUPOS DE EDAD.

Generar a partir de un nmero


elevado de categoras ordinales una
nueva variable que tenga menos
categoras. Por ejemplo, a partir de
una variable de opinin que tenga 5
categoras: muy bueno, bueno,
regular, malo y muy malo se puede
obtener una nueva variable de tres
categoras: bueno, regular y malo.
Figura 41: Cuadro de Dilogo Agrupacin Visual

En este caso el procedimiento a ejecutar es el siguiente:


Seleccione Transformar /Agrupacin visual...

34 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Seleccione las variables numricas de


escala u ordinales para las que desee
crear nuevas variables categricas (en
intervalos). Tenga presente que las
variables de cadena y las variables
numricas nominales no se muestran en
la lista de variables origen.
Seleccione una variable de la Lista de
variables exploradas. En el ejemplo, se
est seleccionando la variable Edad
(p106).
Anote el nombre para la nueva variable
categorizada.
Defina los criterios de categorizacin para
la nueva variable.
Pulse en Aceptar.

Figura 42: Cuadro de Dilogo Categorizador Visual


Para este ejemplo se ha hecho uso del archivo BD_DPTO.SAV

Figura 43: Cuadro de Dilogo principal Categorizador Visual

35 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Generacin automtica de categoras


El cuadro de dilogo Crear puntos de corte permite la creacin automtica de categoras en funcin de los
criterios seleccionados.
Los criterios de generacin de los puntos de corte que definirn los intervalos son:
a.

Intervalos de igual amplitud. Genera categoras de igual amplitud (por ejemplo, 15, 610, 1115,
etc.), esto se determina sobre la base de dos de los tres criterios siguientes:
Posicin del primer punto de corte. Valor que define el lmite superior de la categora inferior.
Nmero de puntos de corte. El nmero de intervalos es el nmero de puntos de corte ms uno.
Por ejemplo, 5 puntos de corte generan 6 intervalos.
Amplitud. La amplitud de cada intervalo. Por ejemplo, el valor 3 categorizar la variable Edad en
intervalos de 3 aos de edad.

b.
Percentiles iguales basados
en los casos explorados. Genera
intervalos con un nmero igual de
casos en cada categora, esto
se determina sobre la base de uno de
los criterios siguientes:
Nmero de puntos de corte. El
nmero de intervalos es el nmero
de puntos de corte ms uno. Por
ejemplo, cuatro puntos de corte
generan
cinco
categoras
percentiles (quintiles), conteniendo
cada una el 20% de los casos.
% de casos. Amplitud de cada
intervalo, expresado en forma de
porcentaje sobre el nmero total
de casos. Por ejemplo, el valor 25
generara cuatro categoras (tres
puntos de corte), conteniendo
cada una el 25% de los casos.
Figura 44: Cuadro de dilogo Crear puntos de corte
c.

Puntos de corte en media y desviaciones tpicas seleccionadas, basadas en casos


explorados. Genera categoras basndose en los valores de la media y la desviacin tpica de la
distribucin de la variable.
Debe tenerse presente en este caso, que en una distribucin normal, el 68% de los casos se
encuentra dentro de una distancia de una desviacin tpica respecto a la media, el 95% entre dos
desviaciones tpicas y el 99% dentro de tres desviaciones tpicas.

Para este ejemplo se ha hecho uso del archivo BD_DPTO.SAV y se han definido quintiles para la variable
APROBA1, que est referido al grado de escolaridad alcanzado por cada persona

36 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 45: Cuadro de Dilogo principal Agrupacin Visual

37 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

5. TRANSFORMACIONES DE LOS DATOS


Otra caracterstica del SPS
S es la posibilidad de ejecutar transformaciones de los datos de todo tipo,
desde tareas sencillas, como la agrupacin de categoras hasta otras ms complejas como la creacin de
nuevas variables basadas en ecuaciones complejas e instrucciones condicionales.
Aqu nos vamos a referir a las siguientes funciones del men Transformar:

Calcular variable
Recodificacin de valores
Contar apariciones de valores dentro de los casos
Categorizar variables
Recodificacin automtica

5.1 CALCULAR VARIABLE


Esta funcin permite asignar valores a una variable a partir de las transformaciones numricas de otras
variables, sean estas variables numricas o de cadenas (alfanumricas).
Para calcular variables efecte lo siguiente:
Seleccione Transformar/Calcular...
Escriba el nombre de la variable de destino, esta puede ser una variable existente o una nueva, en el
caso de estas ltimas existe la opcin para especificar la etiqueta de variable descriptiva y el tipo de
variable.
Escriba la expresin numrica que generar la nueva variable, en la cual se pueden pegar variables
de la lista de origen, nmeros y operadores del teclado de calculadora y funciones de la lista de
funciones. En este ltimo caso, primero hay que seleccionar un grupo de la lista Grupo de funciones y
pulsar dos veces en la funcin o variable de las listas de funciones y variables especiales (o
seleccione la funcin o variable y pulse en la flecha que se encuentra sobre la lista Grupo de
funciones). Rellene los parmetros indicados mediante interrogaciones (aplicable slo a las
funciones). En el caso de las constantes de cadena, stas deben ir entre comillas o apstrofes.
Activar el cuadro de dilogo Si los casos slo si el usuario quiere establecer una expresin
condicional, de modo que la nueva variable sea calculada para aquellos casos que cumplan con la
condicin.
Funciones
Se dispone de muchos tipos de funciones, entre ellos:

Funciones aritmticas

Funciones estadsticas

Funciones de cadena

Funciones de fecha y hora

Funciones de distribucin

Funciones de variables aleatorias

Funciones de valores perdidos

Funciones de puntuacin (slo servidor de SPSS)


Veamos ahora con un ejemplo como funciona esta opcin:

Abrir el archivo GENERALES.SAV y seleccionar Transformar/Calcular... del men. Crear ahora la


variable GASTOPER que representa el Gasto per cpita del Hogar.

38 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Como se observa en la figura 46, en la variable de destino se ha anotado la nueva variable que se est
generando GASTOPER. Como expresin numrica se anot GASTOHOG/MIEMH. De la misma forma, se
abri el cuadro de dilogo Tipo y etiqueta para anotar como etiqueta Gasto per cpita del hogar.

Figura 46: Cuadro de Dilogo Calcular variable

Con el mismo ejemplo anterior, imagnense que se quiere obtener el Gasto per cpita del hogar slo
de los hogares del rea rural (REA = 0), entonces adems del proceso anterior deber activarse el
cuadro de dilogo Si los casos

Figura 47: Cuadro de Dilogo Si los casos

39 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

5.2

RECODIFICACION DE VALORES

Esta funcin permite modificar los valores de las variables recodificndolos, situacin que es de gran utilidad
para agrupar o combinar categoras. El resultado de la recodificacin puede guardarse en la misma variable,
sustituyendo de esta forma los valores originales o crear una nueva variable.
5.2.1

RECODIFICAR EN LAS MISMAS VARIABLES

En este caso se reasigna los valores de las variables existentes o se agrupa rangos de valores existentes
en nuevos valores para la misma variable. Hay que tener presente que se puede recodificar variables
numricas y de cadena, adems, si se seleccionan mltiples variables, todas deben ser del mismo tipo.
Para recodificar en las mismas variables efecte lo siguiente:
Seleccione Transformar/Recodificar/En las mismas variables...
Seleccione la variables que desee recodificar, si se selecciona ms de una variable, estas deben ser
del mismo tipo.
Pulse en valores Antiguos y nuevos, especificando como deben recodificarse los valores.
Activar el cuadro de dilogo Si los casos cuando el usuario quiere establecer una expresin
condicional, de modo que la nueva variable sea recodificada slo para aquellos casos que cumplan
con la condicin.
Veamos ahora con un ejemplo como funciona esta opcin:

Abrir el archivo POBLA.SAV y seleccionar Transformar/Recodificar/En las mismas variables... del


men. Se busca recodificar la variable R107 que representa el ESTADO FAMILIAR en dos grupos:
1 CON PAREJA, 2 SIN PAREJA.

Como se observa en la figura 48, en el set Variables se anot la variable R107 (variable a recodificar), en
tanto que en la figura 49 se observan los dos grupos especificados para recodificar dicha variable.

Figura 48: Cuadro de Dilogo Recodificar en


las mismas variables

Figura 49: Cuadro de Dilogo Valores antiguos y nuevos


40 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

5.2.2

RECODIFICAR EN DISTINTAS VARIABLES

En este caso se reasignan los valores de variables existentes o agrupa rangos de valores existentes en
nuevos valores para una nueva variable.
Para recodificar en distintas variables efecte lo siguiente:
Seleccione Transformar/Recodificar/En distintas variables...
Seleccione la variables que desee recodificar, si se selecciona ms de una variable, estas deben ser
del mismo tipo.
Anote el nombre y etiqueta de la nueva variable y pulse en Cambiar
Pulse en valores Antiguos y nuevos, especificando como deben recodificarse los valores.
Activar el cuadro de dilogo Si los casos cuando el usuario quiere establecer una expresin
condicional, de modo que la nueva variable sea recodificada slo para aquellos casos que cumplan
con la condicin.
Veamos ahora con un ejemplo como funciona esta opcin:

Abrir el archivo POBLA.SAV y seleccionar Transformar/Recodificar/En distintas variables... del


men. Se busca recodificar la variable R106 (Edad). La variable a generarse es gedad (Grupos de
edad), en los siguientes grupos: 0 a 17 (clave 1), 18 a 24 (clave 2), 25 a 49 (clave 3) y 50 y ms
(clave 4). El desarrollo de este ejemplo se observa en las figuras 50 y 51.

Figura 50: Cuadro de Dilogo Recodificar en


distintas variables

Figura 51: Cuadro de Dilogo Valores antiguos y nuevos


5.3

CONTAR APARICIONES DE VALORES DENTRO DE CASOS

Este cuadro de dilogo crea una variable que contabiliza las apariciones del mismo valor o valores en una
lista de variables para cada caso. Para ejecutar esta opcin efecte lo siguiente:

41 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Seleccione Transformar/Contar apariciones...


Anote el nombre y la etiqueta de la variable de destino.
Seleccione dos o ms variables del mismo tipo.
Pulse en Definir valores, especificando el valor o valores que deben contabilizarse (estos pueden ser
valores individuales, valores perdidos, valores perdidos por el sistema y rangos).
Activar el cuadro de dilogo Si los casos cuando el usuario quiere establecer una expresin
condicional, de modo que se pueda contar las apariciones de valores slo para aquellos casos que
cumplan con la condicin.

Veamos ahora con un ejemplo como funciona esta opcin:

Abrir el archivo POBLA.SAV y contabilice la cantidad de electrodomsticos de lnea marrn de que


dispone el hogar. Esta nueva variable se denominar ELECTRO (Electrodomsticos en el hogar), tal
como se observa en la figura 52.
Los tipos de recursos a incluirse son radio, equipo de sonido, TV y videocasetera, para lo cual
deber contarse el nmero de respuestas SI (clave 1) de dichos recursos (ver figura 53).

Figura 52: Cuadro de Dilogo Contar apariciones dentro


de los casos

Figura 53: Cuadro de Dilogo Contar los valores


5.4

RECODIFICACION AUTOMATICA

Esta opcin realiza la misma funcin que Recodificar variables, la diferencia estriba en que el usuario no es
quien asigna los antiguos y nuevos valores, sino que el mismo programa los asigna en valores enteros
consecutivos. La nueva variable o variables creadas mantienen cualquier variable definida y las etiquetas de
valor de la variable antigua. Al final, en el visor, una tabla muestra los valores antiguos, los nuevos y las
etiquetas de valor. Hay que tener presente, en el caso de valores de cadena, que estos se recodifican por
orden alfabtico, con las maysculas antes que las minsculas.
Para ejecutar esta opcin efecte lo siguiente:
42 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Seleccione Transformar/Recodificacin automtica...


Seleccione la variable o variables que desee recodificar
Anote un nombre para la nueva variable, luego pulse en Nuevo nombre (esta accin hay que hacerla
para cada variable seleccionada (ver figura 54).
Ejemplo:

Abrir el archivo EMPLEO.SAV y usando la opcin recodificacin automtica recodifique la variable


R436TXT (CUAL ERA LA OCUPACION QUE DESEMPEABA) en la nueva variable OCUP_ANT

Figura 54: Cuadro de Dilogo Recodificacin automtica

Figura 55: Tabla en el visor, generada al realizar la recodificacin automtica


43 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

6. MANIPULACION DE ARCHIVOS
Los archivos de datos no siempre estn organizados de la forma que nos resulte adecuada, de ah que el
SPSS ofrezca una serie de opciones para combinar archivos de datos, organizar los datos en un orden
diferente, seleccionar submuestras de casos o cambiar la unidad de anlisis agrupando casos.
En este captulo se utilizarn las siguientes opciones: Ordenar datos, seleccionar casos, segmentar archivo,
ponderar casos, transponer casos y variables, fusin de archivos de datos y agregar datos.
6.1

ORDENAR DATOS

Esta opcin permite ordenar todos los casos del archivo basndose en los valores de una o ms variables
de ordenacin. Estos pueden ser ordenados en forma ascendente o descendente.
Para ejecutar esta opcin efecte lo siguiente:
Seleccione Datos/Ordenar casos...
Seleccione una o ms variables de
ordenacin

Abrir el archivo POBLA.SAV y al igual que


en la figura 56 ordene la informacin por
R104 (SEXO) y R106 (EDAD) en orden
ascendente
Figura 56: Cuadros de Dilogo Ordenar datos

En la figura 57 se
observa
cmo
queda el archivo
de
datos
al
ordenar
la
informacin por
SEXO y EDAD.
Los casos han
sido ordenados
por EDAD dentro
de cada categora
de la variable
SEXO.

Figura 57: Archivo de datos luego de la ordenacin

44 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

6.2

SELECCIONAR CASOS

El SPSS proporciona varios mtodos para seleccionar un subgrupo de casos, basndose en ciertos criterios
que incluyen variables y expresiones condicionales, en una muestra aleatoria de casos, en un rango o en
una variable criterio especfica.
Es importante mencionar que una vez que se define el criterio de seleccin, es necesario decidir que hacer
con los datos no seleccionados, pudiendo ser filtrados o eliminados, en la primera situacin se filtran los
casos no seleccionados pero no desaparecen del archivo de datos, al seleccionar la opcin Seleccionar
todos los casos vuelven a aparecer en el archivo, por el contrario, en la segunda situacin se eliminan los
datos no seleccionados del archivo (la nica forma de recuperarlos es no guardando el archivo de datos).
Las opciones que aparecen en este cuadro de dilogo son las siguientes:
Seleccionar todos los casos, se utilizarn todos los casos del archivo en los anlisis que se realicen.
Seleccionar casos que cumplen una condicin, al pulsar en el botn S...se abre un cuadro de
dilogo en la que se anotar una expresin condicional. En el anlisis sern incluidos slo aquellos
casos que cumplen tal condicin.
Muestra aleatoria de casos, al pulsar el botn Muestra... se abre un cuadro de dilogo en el que se
puede especificar el porcentaje de casos aproximado a incluirse en la muestra o bien el nmero de
casos exacto que debe incluirse.
Basados en rango de tiempo o de casos, al entrar en esta opcin deber anotar el primer caso y
ltimo caso a incluir.
Usar variable de filtro, en este caso la variable debe ser numrica, incluyndose slo aquellos casos
que tengan un valor diferente de cero o del valor perdido para la variable seleccionada.
Veamos ahora con un ejemplo como funciona esta opcin:
En la figura 58 se puede observar el procedimiento para la seleccin de aquellos casos en los que la
variable R104 = 2 (sexo FEMENINO) y R103 = 1 (relacin de parentesco JEFE DE HOGAR) del archivo
POBLA.SAV, y en el que adems, los casos no seleccionados sean filtrados.

Figura 58: Cuadro de dilogo Seleccionar casos Si

Figura 59: Cuadro de dilogo Seleccionar casos


45 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 60: Archivo de datos luego de la seleccin


6.3

SEGMENTAR ARCHIVO

Esta opcin permite dividir el archivo de datos en distintos grupos, en base a los valores de una o ms
variables de agrupacin, el mismo que se utilizar en todos los anlisis posteriores.
Para segmentar un archivo de datos efecte lo siguiente:
Seleccionar Datos/Segmentar archivo...
Seleccionar Comparar grupos (en este caso los grupos de segmentacin se presentan juntos para
poder compararlos) u organizar los resultados por grupos (los resultados de cada procedimiento son
presentados por separado).
Seleccione una o ms variables de
agrupacin
Seleccione
ordenar
archivo
segn
variables de agrupacin (cuando el
archivo an no ha sido ordenado) o el
archivo ya est ordenado.
Veamos ahora con un ejemplo como funciona
esta opcin:

Segmentar el archivo POBLA.SAV segn


la variable R104 (SEXO), adems se
tiene que el archivo no ha sido ordenado y
que para el anlisis es necesario que los
grupos de segmentacin se presenten
juntos para poder compararlos.
Figura 61: Archivo de datos luego de la segmentacin
46 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 62: Archivo de datos luego de la segmentacin


6.4

PONDERAR CASOS

Si cada fila del archivo de datos representa ms de un caso puede especificarse un factor de ponderacin,
hay que tener presente que al aplicar una variable de ponderacin, sta permanecer activada hasta que se
seleccione una nueva variable o se desactive la ponderacin.
Para ponderar casos efecte lo siguiente:
Seleccionar Datos/Ponderar casos...
Seleccionar Ponderar casos mediante
Seleccionar una variable de frecuencia

Figura 63: Cuadro de dilogo Ponderar casos

47 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

6.5

TRANSPONER

Esta opcin permite crear un nuevo archivo de datos en el que se transponen las filas y las columnas del
archivo original, de esta forma las filas se convierten en variables y las variables en casos. Puede
seleccionarse una, varias o todas las variables para transponer.
En el nuevo archivo generado se crea automticamente una variable de cadena CASE_LBL, que contiene
los nombres originales de la variable
Para ejecutar esta opcin efecte lo siguiente:
Seleccione Datos/Transponer...
Seleccione una o ms variables que
desee transponer en casos.

En la figura 64 se han transpuesto las


variables: R101, R103, R104, R106,
R107, CASE1, FACT01 del archivo
POBLA.SAV
Figura 64: Cuadro de dilogo Transponer

Figura 65: Archivo de datos luego de la transposicin

48 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Tarea 1 (Desarrollo individual)


1.

ABRIR LA BASE DE DATOS POBLA.DBF, LUEGO GUARDELA CON EL NOMBRE POBLA1.SAV.


Esta base de datos contiene informacin de la poblacin que habita en un departamento de el
Salvador, a quienes se les aplic una encuesta.

2.

HACIENDO USO DE LA BASE DE DATOS POBLA1.SAV EJECUTE LO SIGUIENTE:


Para cada una de las variables del archivo definir nombre, tipo, etiquetas y nivel de medida.
Nombre
R103

Etiqueta
Relacin de parentesco

R104

Sexo

R106

Edad

R107

Estado familiar

R108A

R108

FAC01

Tenencia de algn seguro mdico

Exposicin a sntoma, enfermedad o


lesin durante el mes anterior

Valores

Categora de las variables

Jefe

Esposa(o), compaera(o)

Hijo(a)

Padre / Madre

Hermano(a)

Yerno / Nuera

Nieto (a)

Suegro (a)

Otros Familiares

10

Empleada (o) domstica (o)

11

Otros

Hombre

Mujer
Edad

Acompaado (a)

Casado (a)

Viudo (a)

Divorciado (a)

Separado (a)

Soltero (a)

ISSS Cotizante

ISSS Beneficiario

ISSS Retirado

Bienestar Magisterial

IPSFA

Colectivo

Individual (Privado)

No tiene

Otros

Algn sntoma

Alguna enfermedad

Lesin por accidente

Lesin por hecho violento

No tuvo

Factor de expansin

49 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Expandir los resultados


Determine la relacin de parentesco de la poblacin. Comente los resultados
Determine la proporcin de hombres y mujeres
Determine el estado familiar de esta poblacin.
3.

HACIENDO USO DE LAS OPCIONES DATOS/SELECCIONAR CASOS Y DATOS/SEGMENTAR,


DETERMINE:
Poblacin con edades entre 18 y 49 aos
Poblacin femenina con edades entre 18 y 49 aos
Poblacin femenina con edades entre 18 y 49 aos y por estado familiar
Jefes de hogar con edades entre 18 a 49 aos y por sexo

4.

HACIENDO USO DE LA OPCION TRANSFORMAR/RECODIFICAR O DE LA AGRUPACIN


VISUAL, DETERMINE
Recodificar la variable EDAD (R106) como GEDAD (grupos de edad) en las siguientes categoras

Hasta 4
5 a 14
15 a 24
25 a 34
35 a 44
45 a 54
55 a 64
65 a 74
75 y ms

Determine la frecuencia de la variable GEDAD


5.

HACIENDO USO DE LA OPCION TRANSFORMAR/RECODIFICAR O DE LA AGRUPACIN


VISUAL, DETERMINE
Recodificar la variable ESTADO FAMILIAR (R107) como RE_R107 (situacin familiar) en las
siguientes categoras

Con pareja
Sin pareja

Determine la frecuencia de la variable RE_R107


6.

HACIENDO USO DE LA OPCION TRANSFORMAR/CALCULAR, DETERMINE


Gasto del hogar en salud. Para ello asuma que todas aquellas personas que declararon haber tenido
algn sntoma, enfermedad, lesin por accidente o lesin por hecho violento gastan mensualmente $
450. Para lo que no tuvieron anote 0.
Determine el gasto promedio del hogar en salud.

7.

HACIENDO USO DE LA OPCION DATOS/SEGMENTAR, DETERMINE:


Edad promedio de jefes de hogar hombres y jefes de hogar mujer
Situacin familiar de la poblacin de 18 a 49 aos.
Compare la situacin familiar de las personas que declararon haber tenido lesin por accidente y de
las que declararon lesin por hecho delictivo. Comente los resultados
Determine la edad promedio por situacin familiar
50 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

6.6

FUSION DE ARCHIVOS DE DATOS

Permite unir los datos de dos archivos, presentndose dos opciones: Unir archivos con las mismas variables
pero casos diferentes (Aadir casos) o unir archivos con los mismos casos pero variables diferentes (Aadir
variables).
6.6.1

AADIR CASOS

En este caso se unen dos archivos de datos que contienen las mismas variables pero diferentes casos.
Para aadir casos efecte lo siguiente:
Abrir uno de los archivos da datos.
Seleccionar Fundir archivos/Aadir casos...
Seleccione el archivo de datos que desea unir con el archivo abierto
Elimine las variables que no desee incluir de la lista Variables en el nuevo archivo de datos, para lo
cual deber seleccionar la variable en la lista y pulsar botn flecha
, la variable pasar a la
lista de Variables desemparejadas.
Aada pareja de variables de la lista Variables desemparejadas que representan la misma informacin
registrada con nombres diferentes en los dos archivos. En este caso, deber pulsar en una de las
variables en la lista se variables desemparejadas, luego mantenga pulsada la tecla Ctrl mientras
selecciona la otra variable de la lista con el ratn, finalmente pulse CASAR para que stas se
desplacen a la lista de Variables en el nuevo archivo de datos de trabajo.

Por ejemplo, tanto en el DEPARTAMENTO A como en el DEPARTAMENTO B se aplicaron


encuestas. A efectos de establecer comparaciones se proceder a unir el archivo POBLA.SAV (que
contiene la informacin de encuestas aplicadas en el DEPARTAMENTO A) con el archivo
DPTO11.SAV (que contiene la informacin de encuestas aplicadas en el DEPARTAMENTO B). Otro
dato es que en el primer archivo la variable gnero tiene el nombre R104 y en el segundo SEXO. La
fusin de estos dos archivos se presenta en la figura 66).

Figura 66: Cuadros de dilogo Aadir datos

51 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

6.6.2

AADIR VARIABLES

Con la opcin Aadir variables se podr: Unir los archivos de datos que contengan los mismos casos pero
variables diferentes o utilizar un archivo de tabla de claves o de referencia para aadir los datos de cada
caso a varios casos de otro archivo.
Para tal efecto, debe cumplir con los siguientes requisitos:

Los casos deben tener el mismo orden en ambos archivos


Si se emplea una o ms variables clave para emparejar los casos, ambos archivos deben estar
ordenados en orden ascendente de las variables clave.
Los nombres de las variables del segundo archivo que duplican los del archivo de trabajo se excluyen
por defecto (se entendera que estas variables contienen informacin duplicada).
La opcin Variables clave se emplean para identificar y emparejar correctamente los casos de ambos
archivos, as como cuando se trabaja con tablas de referencia o de clave.

Caso 1: Archivos que contienen los mismos casos pero variables diferentes. Para esto se va a unir el
archivo JHOGAR.SAV (que contiene informacin de los jefes de hogar) con el archivo VIVIENDA.SAV (que
contiene informacin sobre las viviendas en la que habitan los jefes de hogar)
Para aadir variables efecte lo siguiente:
Abrir uno de los archivos da datos
(JHOGAR.SAV).
Seleccionar Fundir archivos/Aadir
variables...
Seleccione el archivo de datos que desea
unir con el archivo abierto, con esta accin
concluira la fusin (VIVIENDA.SAV).
Seleccione las variables clave en la lista
de variables excluidas.
Seleccione Emparejar los casos en las
variables clave para los archivos
ordenados.
Aada las variables a la lista Variable
clave
Seleccione Ambos archivos facilitan casos
Luego, Aceptar

Figura 67: Cuadro de dilogo


Aadir variables

52 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Caso 2: Archivos en el que uno de ellos es una de tabla de claves o de referencia para aadir los datos de
cada caso a varios casos del otro archivo.
Para esto se va a unir el archivo POBLA.SAV (que contiene informacin de las personas de un determinado
departamento) con el archivo VIVIENDA.SAV (que contiene informacin sobre las viviendas en la que estos
habitan)

Figura 68: Cuadro de dilogo Aadir variables

53 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

6.7

AGREGAR DATOS

Esta opcin permite agrupar casos de un archivo de datos basndose en los valores de una variable de
agrupacin, de esta forma se genera un nuevo archivo que contiene un caso para cada grupo.
Para agregar datos efecte lo siguiente:
Seleccionar Datos/Agregar...
Seleccione una o ms variables de segmentacin, aqu hay que tener presente que cada combinacin
nica de estos factores define un grupo y por lo tanto genera un caso en le nuevo archivo agregado.
Seleccione una o ms variables numricas para incluirlas en el nuevo archivo de datos. Hay que tener
presente que por defecto Agregar datos crea automticamente los nombres de las variables
agregadas, sin embargo estos pueden ser modificados por el usuario, para lo cual deber resaltarse la
variable en la lista Agregar variables y luego pulsar en Nombre y Etiqueta. Tambin es factible crear
una variable que contenga el nmero de casos en cada grupo.
Seleccione una funcin de agregacin para cada variable agregada. Hay que tener presente que por
defecto la funcin de agregacin es la media de los valores, sin embargo, sta pueden ser cambiada
por el usuario, para lo cual deber resaltarse la variable en la lista Agregar variables y luego pulsar en
Funcin1.
Definir el almacenamiento de los resultados agregados.
En este ltimo caso puede aadir variables agregadas al archivo de datos de trabajo o crear un archivo de
datos agregados nuevo.

Aadir las variables agregadas al archivo de datos de trabajo

Las nuevas variables basadas en las funciones de agregacin se aaden al archivo de datos de trabajo. El
propio archivo de datos no se agrega. Cada caso con los mismos valores en las variables de segmentacin
recibe los mismos valores en las nuevas variables agregadas.

Crear nuevo archivo de datos que contenga slo variables agregadas

Crea un nuevo archivo de datos con los datos agregados. Por defecto, se guarda un archivo denominado
aggr.sav en el directorio actual.

Sustituir el archivo de datos de trabajo slo con variables agregadas


Sustituye el archivo de datos de trabajo con el archivo de datos agregado. El archivo incluye las variables de
segmentacin que definen los casos agregados y todas las variables agregadas definidas por las funciones
de agregacin. Esto no afecta al archivo de datos original. El archivo de datos agregado no se guardar a
menos que se guarde el archivo de datos de manera explcita.
Veamos ahora con un ejemplo como funciona esta opcin:

Supongamos que en el archivo JEFE_HOGAR.SAV se desea obtener algunas estadsticas por


AREA y SEXO. Para cada AREA y SEXO se generarn las siguientes variables: ingreso promedio
del hogar, ingreso promedio per cpita, promedio de miembros por hogar, gasto promedio del hogar,
edad promedio y edad mediana. Guardar el archivo generado como aggr.sav

Las funciones desagregacin incluyen: Funciones de resumen, porcentaje o fraccin de los valores por encima o debajo de un va lor
especificado, porcentaje o fraccin de los valores dentro o fuera de un rango especificado.

54 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 70: Cuadro de dilogo Funcin de


Agregacin

Figura 69: Cuadro de dilogo Agregar datos

Figura 71: Base de datos aggr.sav generada a partir del proceso de agregacin

55 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

7. FRECUENCIAS Y DESCRIPTIVOS
7.1

FRECUENCIAS

El procedimiento Frecuencias tiene la ventaja de generar estadsticos y representaciones grficas que


resultan de gran utilidad para describir las variables. Es importante sealar que tanto para los informes de
frecuencias como para los grficos de barras, se puede organizar los diferentes valores en orden
ascendente o descendente u ordenar las categoras por sus frecuencias, de otro lado, los grficos pueden
etiquetarse con las frecuencias (opcin por defecto) o con los porcentajes.
Para obtener frecuencias efecte lo siguiente:
Seleccionar Analizar/Estadsticos descriptivos/Frecuencias...
Seleccionar una o ms variables
(categricas o cuantitativas)
Si lo desea tiene la posibilidad de:
Pulsar en Estadsticos, lo que la
da la posibilidad de obtener
estadsticos descriptivos para las
variables numricas.
Pulsar en Grficos para obtener
grficos de barras, sectores e
histogramas.
Pulsar
en
Formato
para
determinar el orden en el que se
muestran los resultados.
Figura 72: Cuadro de dilogo Frecuencias
7.1.1

FRECUENCIAS: ESTADISTICOS

Al ingresar en esta opcin es posible determinar los estadsticos descriptivos siguientes:


Valores percentiles: Son valores de una variable cuantitativa que dividen los datos ordenados en
grupos, de manera tal que un porcentaje de los casos se ubique por encima y otro porcentaje por
debajo. Por ejemplo, el percentil 50, o mediana, es el valor por encima y por debajo del cual se
encuentra el 50% de los casos. Las opciones aqu consideradas son:

Cuartiles: Divide las observaciones en cuatro grupos de igual tamao (calcula los percentiles
25, 50 y 75).
Puntos de corte para n grupos iguales: Muestra los valores de la variable que dividen la
muestra en grupos de casos de igual tamao.
Percentiles: mediante esta opcin es factible especificar percentiles individuales, por ejemplo el
percentil 95 muestra el valor por debajo del cual se encuentra el 95% de las observaciones.

Tendencia central: Los estadsticos que describen la localizacin de la distribucin incluyen:


Media, mediana, moda y suma de todos los valores.
Dispersin: Los estadsticos que miden la cantidad de variacin o de dispersin en los datos
incluyen Desviacin tpica, varianza, rango, mnimo, mximo y error tpico de la media.
Distribucin: Asimetra y curtosis son estadsticos que describen la forma y la simetra de las
distribuciones. Estos estadsticos se muestran con sus errores tpicos.
Los valores son puntos medios de grupos: Si los valores de los datos son puntos medios de
grupos seleccione esta opcin para estimar la mediana y los percentiles para los datos originales no
agrupados.
56 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 73: Cuadro de dilogo Frecuencias: Estadsticos


7.1.2

FRECUENCIAS: GRAFICOS

Al ingresar en esta opcin se tiene los siguientes tipos de grficos:


Grfico de barras: Muestran la frecuencia de cada valor o categora distinta como una barra diferente,
lo que facilita la comparacin visual.
Grfico de sectores: Cada sector de un grfico de este tipo
corresponde a un grupo definido por una nica variable de
agrupacin.
Histogramas: Este tipo de grficos tambin cuenta con barras,
pero se representan a lo largo de una escala de intervalos
iguales, estos adems muestran la forma, la media y la
dispersin de la distribucin. En este tipo, hay la posibilidad de
superponer una curva normal, la mima que permite visualizar
si los datos estn normalmente distribuidos.
Tambin es importante sealar que para los grficos de barras se
puede etiquetar el eje de escala con las frecuencias o los
porcentajes.
Figura 74: Cuadro de dilogo
Frecuencia: Grficos

7.1.3

FRECUENCIAS: FORMATO

Esta opcin permite ordenar la tabla de frecuencias segn los valores de la variable o las frecuencias y en
orden ascendente o descendente.
De la misma forma, cuando se genera
tablas de frecuencias para mltiples
variables es factible presentar todas las
variables en una sola tabla (comparar
variables) o bien en forma independiente
para cada variable (organizar resultados
segn variables).
Figura 75: Cuadro de dilogo Frecuencia: Formato
57 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Tambin existe un comando que permite suprimir aquellas tablas que contengan ms categoras que le
nmero especificado.
Veamos ahora con un ejemplo como funciona esta opcin:

Supongamos que en base a la informacin del archivo JEFE_HOGAR.SAV se desea determinar el


nivel de pobreza de los hogares y que adems los resultados porcentuales sean presentados en un
grfico de barras.

Pobreza
Total
Pobreza extrema
Pobreza relati va
No pobre

Frecuenci a
148525
17562
38336
92627

Porcentaje
100.0
11.8
25.8
62.4

Figura 76: Desarrollo del ejemplo

58 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Supongamos que en base a la informacin del archivo POBLA.SAV se desea determinar los
siguientes estadsticos: quintiles, medidas de tendencia central, de dispersin y de distribucin de la
variable R106 (edad) de la poblacin de 14 a 29 aos. Para graficar utilice el histograma con curva
normal.

Esta dsticos
Ed ad
N

Vli dos
Per did os

Media
Er ro r tp. d e la med ia
Mediana
Moda
Desv. tp .
Var ianza
Asimetr a
Er ro r tp. d e asimetr a
Cur tosis
Er ro r tp. d e cur tosis
Rango
Mnimo
Mximo
Per centil es
20
40
60
80

2207
0
20.33
.095
20.00
14
4.483
20.098
.315
.052
-1.042
.104
15
14
29
16.00
18.00
21.00
25.00

Figura 77: Desarrollo de


ejemplo 2

59 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

7.2

DESCRIPTIVOS

El procedimiento Descriptivos permite calcular algunos estadsticos de tendencia central, de dispersin y de


distribucin en una nica tabla. Como opciones adicionales, este procedimiento tambin permite:

Guardar en variables los valores tipificados (puntuaciones z) de las variables seleccionadas, las
mismas que se aaden a los datos del Editor de datos.
Decidir si los resultados a obtenerse se ordenaran por el tamao de sus medias (ascendente o
descendente), alfabticamente o por el orden en el que se seleccionaron las variables (valor por
defecto)

Para obtener estadsticos descriptivos efecte lo siguiente:


Seleccionar Analizar/Estadsticos descriptivos/Descriptivos...
Seleccionar una o ms variables
Si el usuario desea tiene la posibilidad de:

Seleccionar Guardar valores tipificados como variables

Pulsar en opciones para seleccionar estadsticos opcionales y el orden de la visualizacin


Veamos ahora con un ejemplo como funciona esta opcin:

Supongamos que del archivo JEFE_HOGAR.SAV se desea obtener los estadsticos descriptivos de
las variables INGFA (ingreso mensual del hogar), MIEMH (nmero de miembros del hogar) y
GASTOHOG (gasto mensual del hogar). En la figura 78 se presenta las opciones a utilizar y los
resultados obtenidos.

Estadsticos descriptivos
INGFA
Total de Miembros del Hogar
Gasto del Hogar
N vlido (segn lista)

N
148525
148525
148525
148525

Mnimo
11.25
1
17.82

Mximo
4533.50
18
3803.58

Media
447.7279
3.75
331.6462

Desv. tp.
461.40429
1.940
282.46751

Varianza
212893.92
3.762
79787.896

Figura 78: Desarrollo del ejemplo

60 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

8. CUBOS OLAP
El procedimiento Cubos OLAP (siglas del ingls On-Line Analytic Processing, Procesamiento analtico
interactivo) calcula totales, medias y otros estadsticos univariados para variables de resumen continas
dentro de las categoras de una o ms variables categricas de agrupacin. En la tabla se crear una nueva
capa para cada categora de cada variable de agrupacin.
Ejemplo. El total y el promedio de ventas para diversas regiones y lneas de producto, dentro de las
regiones.
Para obtener estadsticos descriptivos efecte lo siguiente:
Seleccionar Analizar/Informes/Cubos OLAP...
Seleccionar una o ms variables de resumen continuas
Seleccionar una o ms variables de agrupacin categricas
Si el usuario desea tiene la posibilidad de:

Seleccionar diferentes estadsticos de resumen (pulsar en Estadsticos2)

Calcular las diferencias entre pares de variables y pares de grupos definidos por una
variable de agrupacin (pulsar en Diferencias)

Crear ttulos de tabla personalizada (pulsar en Ttulo


Veamos ahora con un ejemplo como funciona esta opcin:

Supongamos que del archivo JEFE_HOGAR.SAV se desea obtener informacin estadstica


(nmero de casos, media y desviacin tpica) sobre la edad (R106) y nivel de escolaridad
(APROBA1) de los jefes, segn actividad sexo (R104) haciendo uso de la opcin Cubos OLAP. En
la figura 79 se presenta las opciones a utilizar y los resultados obtenidos.

Incluye: Suma, nmero de casos, media, mediana, mediana agrupada, error tpico de la media, mnimo, mximo, rango, valor de l a
variable para la primera categora de la variable de agrupacin, Valor de la variable para la ltima categora de la variable de
agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de casos
totales, porcentaje de la suma total, porcentaje de casos totales dentro de las variables agrupadas, porcentaje de la suma total dentro
de las variables agrupadas, media geomtrica y media armnica.

61 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Edad y nivel de escolaridad de los jefes de hogar, por sexo


Sexo
Total

Edad
GRADOS APROBADOS
Hombre Edad
GRADOS APROBADOS
Mujer
Edad
GRADOS APROBADOS

N
148525
148525
97249
97249
51276
51276

Media
48.50
5.57
47.10
5.92
51.15
4.92

Desv. tp.
16.379
4.775
16.117
4.784
16.544
4.689

Figura 79: Desarrollo del ejemplo

Si al ejemplo anterior le agregamos la variable REGION en el recuadro variables de agrupacin y


sta se ubica antes de la R104 (sexo), la tabla obtenida presenta ahora un nivel de desagregacin
de los jefes de hogar, por mbito geogrfico y sexo (Ver figura 80)
Edad y nivel de escolaridad de los jefes de hogar, por mbito geogrfico
y sexo
Sexo
Total
Hombre
Mujer
Rural
Total
Hombre
Mujer
Urbana Total
Hombre
Mujer
GRADOS APROBADOS Total
Total
Hombre
Mujer
Rural
Total
Hombre
Mujer
Urbana Total
Hombre
Mujer
Edad

Area
Total

N
148525
97249
51276
47652
35377
12275
100873
61872
39001
148525
97249
51276
47652
35377
12275
100873
61872
39001

Media
48.50
47.10
51.15
48.74
47.78
51.49
48.38
46.71
51.04
5.57
5.92
4.92
2.96
3.21
2.23
6.81
7.47
5.77

Desv. tp.
16.379
16.117
16.544
16.757
16.422
17.397
16.196
15.927
16.265
4.775
4.784
4.689
3.162
3.207
2.910
4.908
4.848
4.821

Figura 80: Desarrollo del ejemplo

62 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

9. EXPLORAR
El procedimiento Explorar genera estadsticos de resumen y representaciones grficas, bien para todos los
casos o bien de forma separada para grupos de casos. Este procedimiento es til para:

Verificar los datos, identificar valores extremos o atpicos, obtener descripciones, comprobar
supuestos y caracterizar diferencias entre grupos de casos. Esta verificacin adquiere importancia
en tanto puede mostrar la existencia de valores inusuales, valores extremos, discontinuidad en los
datos, etc.
Determinar si las tcnicas estadsticas que est empleando para el anlisis son adecuadas.

Para explorar los datos efecte lo siguiente:


Seleccionar Analizar/Estadsticos descriptivos/Explorar...
Seleccionar una o ms variables dependientes. Estas deben ser cuantitativas (de intervalos o de
razn)
Si el usuario desea tiene la posibilidad de:
Seleccionar una o ms variables de factor, stas tienen por funcin dividir los datos en grupos
de caso, pudiendo ser de cadena corta o numrica, pero adems deben tener un nmero
razonable de categoras.
Seleccionar una variable de identificacin para etiquetar los casos, pudiendo ser sta numrica
o de cadena (corta o larga).
Pulsar en Estadsticos para obtener descriptivos, estimadores robustos centrales, valores
atpicos y percentiles.
Pulsar en grficos para obtener diagramas de caja, grficos de tallos y hojas, histogramas,
grficos con pruebas de normalidad y diagramas de dispersin por nivel con estadsticos de
Levene.
Pulsar en opciones para manipular los valores perdidos.
Veamos ahora con algunos ejemplos como funciona este procedimiento:

A partir de la variable INGPE (Ingreso per cpita del hogar) del archivo JEFE_HOGAR.SAV
determinar slo los estadsticos que genera el procedimiento Explorar (ver figura 81).

63 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0


Resumen d el procesamien to d e los caso s

Vlidos
N
Porcentaje
1887
100.0%

INGPE

Casos
Perdidos
Porcentaje
0
.0%

Total
N
Porcentaje
1887
100.0%

Descriptivos
INGPE

Media
Interv alo de conf ianza
para la media al 95%

Estadstico
112.9801
107.7560

Lmite inf erior


Lmite superior

INGPE

118.2043

Media recortada al 5%
Mediana
Varianza
Desv . tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis

Esti madores-M

Error tp.
2.66370

97.0817
79.1700
13388.876
115.71031
1.41
1376.34
1374.93
87.89
3.609
20.579

Estimador-M
a
de Huber
85.6213

Biponderado
b
de Tukey
77.7142

Estimador-M
c
de Hampel
83.8145

Onda de
d
Andrews
77.5999

a. La constante de ponderacin es 1.339.


b. La constante de ponderacin es 4.685.
c. Las constantes de ponderacin son 1.700, 3.400 y 8. 500.
d. La constante de ponderacin es 1.340*pi.

Valo res extremos

.056
.113

INGPE

May ores

Menores

1
2
3
4
5
1
2
3
4
5

Nmero
del caso
1887
1084
1886
1885
1884
1
2
3
4
5

Valor
1376.34
1133.38
954.17
915.00
912.50
1.41
2.85
5.17
6.00
8.25

Percentil es

5
Promedio
ponderado(def inicin 1)

INGPE

Bisagras de Tukey

INGPE

20.0000

10
27.6300

25

Percentiles
50

75

90

95

47.3300

79.1700

135.2200

224.5120

313.5580

47.3300

79.1700

135.1800

Figura 81: Desarrollo del ejemplo 1

En este segundo ejemplo, a partir de las variables INGPE (ingreso per cpita del hogar), GASPER
(gasto per cpita del hogar) y AREA (mbito geogrfico como factor) del archivo
JEFE_HOGAR.SAV obtener los grficos de tallo y hojas, los grficos con pruebas de normalidad y
los diagramas caja, estos ltimos con la opcin niveles de los factores juntos (Ver figura 82).

64 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 82: Desarrollo del ejemplo 2


En el procedimiento tallos y hojas, al igual que el histograma, la longitud de cada fila corresponde al
nmero de casos que hay dentro del intervalo. A la izquierda se muestra la frecuencia de cada intervalo.
Cada caso es representado dentro de la fila con un valor numrico que se corresponde con el valor
observado, el cual se divide en dos componentes: el dgito o dgitos iniciales (tallo o stem) y los dgitos
finales (hojas o leaf). Observemos que en la parte inferior del grfico se explica cmo se debe interpretar
cada valor de tallo (factor por el que hay que multiplicar para obtener los valores reales, en nuestro ejemplo
es igual a 10) y cuantos casos hay incluidos en cada valor de hoja (en nuestro caso 3). En el ejemplo
propuesto, el tallo constituye la parte entera correspondiente al ingreso per cpita en el rea rural y la hoja
corresponde a la parte decimal. En el primer intervalo la primera hoja 9 mostrara que existen 3 casos con
ingreso per cpita menor de 10.
La ltima fila muestra los casos extremos, si existen. En nuestro ejemplo slo existen casos extremos con
valores altos, 73 casos con valores mayores o iguales a 206.
El procedimiento grfico con pruebas de normalidad
busca determinar si los datos que se estn analizando
proceden de una distribucin normal. Tal situacin se
determina a partir de dos grficos (Grfico Q-Q normal y
grfico Q-Q normal sin tendencias) y un test analtico. En
el primer plot (quantiles reales y tericos de una
distribucin normal) los valores correspondientes a una
distribucin normal terica viene representado por la
recta y los puntos corresponden a las diferentes
puntuaciones de los sujetos en la distribucin emprica.
Si los puntos estn prximos a la recta significa que el
ajuste es aceptable y no aceptable cuando ms se alejan
estos de la recta. El segundo plot muestra las
65 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

desviaciones de los sujetos respecto a la recta, si la


muestra procede de una poblacin normal los puntos
deben fluctuar alrededor de cero. Si bien estas
curvas dan una idea aproximada del ajuste o no de
los datos a una distribucin normal, se hace
necesario determinar una prueba analtica, ya sea
mediante el test de Shapiro-Wills o el de
Kolmogorov-Smirnov con adaptacin de Lilliefors),
los datos mostrados por este ltimo, para el rea
urbana, indicaran que sta no se ajusta a una
distribucin normal, en tanto cuando ms pequeo
es el estadstico y ms grande el nivel de
significacin mejor es el ajuste de los datos a una ley
normal3.
Pruebas de no rmali dad
a

INGPE
GASPER

Area
Rural
Urbana
Rural
Urbana

Kolmogorov -Smirnov
Estadst ico
gl
Sig.
.180
1084
.000
.177
803
.000
.182
1084
.000
.151
803
.000

Estadst ico
.657
.717
.717
.799

Shapiro-Wilk
gl
1084
803
1084
803

Sig.
.000
.000
.000
.000

a. Correccin de la signif icacin de Lillief ors

Figura 82: Continuacin Desarrollo del ejemplo 2

Los diagramas de caja permiten resumir


la distribucin de los valores de una o
ms variables, en ella se representan
estadsticos bsicos de la distribucin
como la mediana, los percentiles 25 y 75
(bisagras de Tukey) y una serie de
valores (atpicos, extremos) que junto con
la mediana y la misma caja proporcionan
informacin completa sobre el grado de
dispersin de los datos y el grado de
asimetra de la distribucin.
Los valores ms pequeos y ms grandes
que se encuentren dentro de los lmites
primer cuartil - 1.5 IQR (rango intercuartil)
y tercer cuartil + 1.5 IQR constituyen los
bigotes
del
grfico
y
aparecen
representados mediante dos lneas
horizontales ubicadas a ambos extremos
de la caja central.
En el caso del diagrama de caja que se presenta a continuacin y que corresponde al ingreso per cpita del
hogar tanto del rea urbana como rural, hay que tener presente, en ambos, que dado que la mediana no se
localiza exactamente en el centro de la caja, se tratara de una distribucin asimtrica positiva (est ms
prxima al lmite inferior de la caja).
3

Se rechaza la hiptesis de normalidad cuando el nivel crtico (Sig.) es menor que el nivel de significacin establecido (generalmente
0.05).

66 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Respecto a los casos extremos, en el ejemplo que se presenta, son varios los valores que estn alejados
entre 1.5 y tres veces el rango intercuartil (representados mediante un crculo4, en el que se indica el
nmero de caso que en el que se ubica dicho dato).

Figura 82: Continuacin Desarrollo del ejemplo 2

Aquellos casos con valores alejados ms de tres veces el rango intercuartil desde el extremo superior o inferior de la caja estn
representados con un *.

67 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Tarea 2 (Desarrollo individual)


Para el desarrollo de este laboratorio haga uso de la base de datos JHOGAR.SAV. Esta base de datos
contiene las principales caractersticas demogrficas, educativas y laborales de los jefes de hogar de un
departamento del pas.
1.

Calcular el nivel de pobreza (NIV_POB)

2.

Pobres: Hogares cuyo INGPE es menor o igual a $ 86.


No pobres: Hogares cuyo INGPE es superior a $ 86

Use el procedimiento Agrupacin Visual para recodificar la variable EDAD (R106) como JH_GEDAD
(grupos de edad) en las siguientes categoras

Menos de 24.1
25 a 342
35 a 443
45 a 544
55 a 645
65 a 746
75 y ms.7

Calcule frecuencias y compare los resultados por SEXO (R104).


3.

Al archivo JHOGAR.SAV aada las variables del archivo VIVIENDA.SAV, luego calcule el nivel de
hacinamiento de estos hogares. Este nuevo archivo gurdelo como FAMILIA.SAV
Nivel de hacinamiento (NHACI): Es el cociente entre el nmero de miembros del hogar (MIEMH) y el
nmero de habitaciones (R305). Cuando el resultado de esta operacin es mayor que 3, se
considera que el hogar est hacinado

4.

Comente el nivel de hacinamiento (NHACI) y el nivel de pobreza (NIV_POB) por rea geogrfica
(AREA)

5.

Cul es la edad promedio (R106) de los jefes de hogar. Tambin, determine los estadsticos:
Mediana, moda, desviacin estndar, varianza, as como el histograma correspondiente. Comente
los resultados obtenidos

6.

Cmo vara la edad promedio (R106) al desagregar la informacin por CONDICION DE


ACTIVIDAD (LABORAL)? Cul es el grupo poblacional con la mayor edad promedio? Cul es el
grupo poblacional con la menor edad promedio? Utilice Cubos OLAP

7.

Calcule quintiles para la variable INGRESO PER CAPITA (INGPE). Luego determine para cada
quintil el NIVEL DE ESCOLARIDAD (APROBA1). Comente los resultados obtenidos.

8.

Utilice el procedimiento Descriptivos para la variable GASTO PER CAPITA DEL HOGAR
(GASPER). Comete los resultados obtenidos.

9.

Utilice el procedimiento Agregar utilizando como variables de segmentacin REA GEOGRFICA


(AREA) y SEXO (R104) y agregando las variables edad (R106), INGRESO DEL HOGAR (INGFA),
INGRESO PER CAPITA (INGPE), GASTO DEL HOGAR (GASTOHOG), NIVEL DE ESCOLARIDAD
(APROBA1) y NUMERO DE MIEMBROS DEL HOGAR (MIEMH). Comente los resultados
obtenidos.

10.

Utilice la opcin Explorar para analizar la variable NIVEL DE ESCOLARIDAD (APROBA1), utilice los
submens Estadsticos y Grficos y como factor AREA. Comente los resultados.
68 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

10. TRABAJO CON RESULTADOS


El visor es una ventana del SPSS en el que se muestran los resultados obtenidos al ejecutar un
procedimiento. Se divide en dos paneles: el panel izquierdo que muestra una presentacin de los titulares y
el panel derecho que contiene tablas estadsticas, grficos y resultados de texto. Para examinar los
resultados se puede utilizar las barras de desplazamiento, de la misma forma, tambin puede pulsarse en
un elemento de los titulares para dirigirse directamente a la tabla o al grfico correspondiente.
10.1

ALGUNAS OPCIONES DEL VISOR


Si el usuario tiene la
necesidad de cambiar la
anchura del panel de
titulares puede pulsar y
arrastrar el borde derecho
de dicho panel
Un icono de libro abierto
junto a un elemento del
panel de titulares indica que
dicho
elemento
se
encuentra visible en el
panel de presentacin. Para
ocultar una tabla o un
grfico sin eliminarlo, pulse
dos veces en su icono de
libro en el panel de titulares.
El icono de libro abierto
cambiar a un icono de libro
cerrado, indicando que el
elemento est oculto.
Figura 83: Ventana Visor
Panel de titulares

Panel de contenido

Para ocultar todos los resultados de un procedimiento deber pulsar en el recuadro situado a la
izquierda del nombre del procedimiento en el panel de titulares, al hacerlo, tambin se ocultar la
presentacin de los titulares correspondientes.
Si requiere cambiar la posicin de las tablas o de los grficos, en la pantalla, deber pulsar en los
elementos en el panel de titulares o de contenidos, arrastrndolos al lugar donde desee colocarlos,
luego suelte el botn del ratn para colocarlos en la nueva ubicacin.
10.2

GUARDAR UN DOCUMENTO DEL VISOR

Para guardar un documento del visor efecte lo siguiente:


Seleccionar en los mens de la ventana del visor Archivo/Guardar...
Anote el nombre del documento y pulsar en Guardar.
Tenga presente que si desea guardar los resultados en otros formatos externos como HTML, texto, Excel,
Word, PowerPoint, deber utilizar el comando exportar del men Archivo.

69 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

11. EDITOR DE TABLAS PIVOTE


Muchas de los resultados del visor se presentan en tablas que pueden pivotarse de forma interactiva, es
decir, es factible reorganizar las filas, columnas y capas. Son muchas las opciones que se presentan para
manipular estas tablas, sin embargo nos ocuparemos de las ms importantes:
11.1

PIVOTAR UNA TABLA UTILIZANDO ICONOS

Para pivotar una tabla efecte lo siguiente:


Pulse dos veces en la tabla, al realizar esta accin se activa el Editor de tablas pivote.
Seleccione Pivotar/Paneles de pivotado.... (Editor de tablas pivote)
Pulse en un icono de pivotado y arrstrelo de una dimensin a otra.
Para intercambiar las filas y las columnas deber arrastrar el icono de pivotado de columnas (en el
ejemplo de la variable material del piso) hasta el panel Fila (correspondiente a la variable sexo),
despus arrastre el icono de pivotado de filas hasta el panel columna, observndose pues que las
columnas y las filas de la tabla se han intercambiado, de esta forma, de acuerdo al ejemplo
mostrado la variable Sexo pasa a columna y el material del piso a fila (ver figura 84).
Para este ejemplo haga uso de la base de datos JEFE_HOGAR.SAV
Jefes de hogar, por material del piso de la vivienda que habitan, segn sexo

Total
Hombre
Mujer

Total
100.0
69.2
30.8

Ladrillo
cermico
100.0
71.3
28.7

Ladrillo
cemento
100.0
66.7
33.3

Ladrillo
de barro
100.0
60.0
40.0

Cemento
100.0
70.7
29.3

Tierra
100.0
71.4
28.6

Otros
materiale
s .0
.0
.0

Encuesta 2009

Tabla pivote
obtenida

Jefes de hogar, por material del piso de la vi vienda que habitan,


segn sexo
Total
Ladrillo cermico
Ladrillo cement o
Ladrillo de barro
Cemento
Tierra
Otros materiales

Total
100.0
100.0
100.0
100.0
100.0
100.0
.0

Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0

Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0

Encuesta 2009

Figura 84: Pivotar tabla utilizando iconos


11.2

TRABAJO CON CAPAS

Al trabajar con capas es factible mostrar una tabla de dos dimensiones distintas para cada categora o
combinacin de categoras, en este caso la tabla puede considerarse como una apilacin de capas en la
que puede verse bsicamente la capa superior
70 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Para ejecutar esta accin efecte lo siguiente:


Pulse dos veces en la tabla, al realizar esta accin se activa el Editor de tablas pivote.
Seleccione Pivotar/Paneles de pivotado.... (Editor de tablas pivote)
Arrastre un icono de pivotado del panel Fila o Columna hasta el panel Capa. Para ver las distintas
capas, pulse en las flechas del icono de pivotado de capas.
Para este ejemplo haga uso de la base de datos JEFE_HOGAR.SAV

Jefes de hogar, por materi al del piso de la vivienda que habitan, segn rea geogrfica y sexo
Total

Total
Hombre
Mujer

Total
100.0
69.2
30.8

Ladrillo
cermico
100.0
71.3
28.7

Ladrillo
cemento
100.0
66.7
33.3

Ladrillo
de barro
100.0
60.0
40.0

Cemento
100.0
70.7
29.3

Tierra
100.0
71.4
28.6

Otros
materiale
s .0
.0
.0

Encuesta 2009

Tabla pivote
obtenida

Trasladando variables

Jefes de hogar, por material del piso de la vivienda que habitan,


segn rea geogrfica y sexo
Total

Rural

Urbana

Total
Ladrillo cermico
Ladrillo cemento
Ladrillo de barro
Cemento
Tierra
Otros materiales
Total
Ladrillo cermico
Ladrillo cemento
Ladrillo de barro
Cemento
Tierra
Otros materiales
Total
Ladrillo cermico
Ladrillo cemento
Ladrillo de barro
Cemento
Tierra
Otros materiales

Total
100.0
100.0
100.0
100.0
100.0
100.0
.0
100.0
100.0
100.0
100.0
100.0
100.0
.0
100.0
100.0
100.0
100.0
100.0
100.0
.0

Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0
71.9
66.7
70.4
72.7
73.6
72.8
.0
65.6
73.4
63.6
25.0
63.2
67.9
.0

Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0
28.1
33.3
29.6
27.3
26.4
27.2
.0
34.4
26.6
36.4
75.0
36.8
32.1
.0

Encuesta 2009

Figura 85: Trabajo con capas

71 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

11.3

EDICION DE UN TABLA PIVOTE

Para cambiar los atributos, alineacin de las fuentes o el texto en una tabla efecte lo siguiente:
Pulse dos veces en la tabla, al realizar esta accin se activa el Editor de tablas pivote.
Pulse en la celda o en la etiqueta de la tabla que se desee modificar. Esta accin la puede
desarrollar utilizando la barra de herramientas de formato, la cual le permitir cambiar la fuente, el
estilo, el color o la alineacin5. Si desea especificar opciones adicionales de fuente y alineacin,
seleccione Fuente en el men Formato para abrir el cuadro de dilogo.
Para modificar el texto pulse dos veces en el texto que desee modificar o en F2, luego edite el texto.
Veamos con un ejemplo como funciona este procedimiento:

En la figura 86 se presenta una tabla


sin editar y otra editada. En esta
ltima se ha cambiado el tamao de
fuente del ttulo (modificacin de
texto), el mismo que se ampli al
tamao de letra a 12 y en negritas
cursiva. Mientras que la etiqueta de
la variable material del piso se centr
y qued en negritas, en el caso de
las categoras de la variable sexo, el
estilo de fuente pas a negrita. Y
finalmente la fila de totales se coloc
en negrita.

Jefes de hogar, por material del piso de la vi vienda que habitan,


segn sexo
Total
Ladrillo cermico
Ladrillo cement o
Ladrillo de barro
Cemento
Tierra
Otros materiales

Total
100.0
100.0
100.0
100.0
100.0
100.0
.0

Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0

Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0

Encuesta 2009

Tabla no
editada

Jefes de hogar, por material del piso de la


vivienda que habitan, segn sexo
Materi al del piso
Total
Ladrillo cermico
Ladrillo cement o
Ladrillo de barro
Cemento
Tierra
Otros materiales

Total
100.0
100.0
100.0
100.0
100.0
100.0
.0

Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0

Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0

Tabla editada

Encuesta 2009

Figura 86: Tablas sin editar y editadas

Si la barra de herramientas de formato no est abierta, seleccinela en el men Ver.

72 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

11.4

CAMBIO DE FORMATO DE PRESENTACION DE DATOS DE UN TABLA PIVOTE

El formato de presentacin de los datos en las tablas pivote que comprende valores, alineacin, mrgenes y
sombreado puede ser modificado fcilmente. Por ejemplo, si no desea mostrar los decimales deber
efectuar lo siguiente:
Pulse dos veces en la tabla, al realizar esta accin se activa el Editor de tablas pivote.
Pulse las teclas Ctrl+Alt mientras pulsa en la etiqueta de la columna para seleccionar la columna.
Seleccione Formato/Propiedades de casilla o pulse con el botn derecho del ratn en la etiqueta de
la columna seleccionada y seleccione Propiedades de casilla en el men contextual emergente y
anote 0 para el nmero de decimales. Los valores de los datos aparecern sin decimales.

Figura 87: Cambio de aspecto de la tabla en el nmero de decimales


11.5

CAMBIO DEL ASPECTO DE TABLA POR DEFECTO

El aspecto (fuentes, colores, bordes, etc.) de las nuevas tablas pivote se basa en el aspecto de tabla por
defecto.
Para cambiar el aspecto de tabla por defecto de las nuevas tablas pivote deber efectuar lo siguiente:
Seleccione Edicin/Opciones en el men de cualquier ventana.
Seleccione la pestaa Tablas pivote en el cuadro de dilogo Opciones.
Seleccione un aspecto de tabla de la lista. La ventana muestra ofrece una presentacin en miniatura
del aspecto de tabla seleccionado. El nuevo aspecto de tabla por defecto se aplicar a todas las
tablas pivote que genere. Puede utilizar uno de los aspectos de tabla que se incluyen con el
programa o crear uno propio.

73 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 88: Cambio de aspecto de la tabla por defecto

Cuadro 1
Jefes de hogar, por material del piso de la vivienda que habitan, por sexo
Sexo
Total
Hombre
Mujer

Total
100.0
69.2
30.8

Ladrill o
cermi co
100.0
71.3
28.7

Ladrill o
cemento
100.0
66.7
33.3

Ladrill o de
barro
100.0
60.0
40.0

Cemento
100.0
70.7
29.3

Tierra
100.0
71.4
28.6

Fuente: Encuesta 2009

Figura 89: Tabla con el cambio de aspecto de la tabla por defecto

74 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

12. TABLAS
En la opcin Tablas existen cuadros de dilogo para Tablas personalizadas y conjuntos de respuestas
mltiples.
Las tablas pueden ser de una, dos o tres dimensiones. Debe tenerse presente que cada dimensin est
definida por una sola variable o una combinacin de variables, de esta forma existiran tres tipos de
variables: Variables de fila, las que aparecen en el lateral izquierdo de una tabla, variables de columna,
aquellas que aparecen en la parte superior de una tabla y las variables de capa que son las que aparecen
en tablas apiladas.
El cuerpo de una tabla se compone de casillas, stas pueden contener informacin bsica de la tabla como
recuentos, sumas, medias, porcentajes, mediana, moda, etc. Otro aspecto importante en relacin a las
tablas est relacionado a su forma de presentacin cuando se ubican mltiples variables en una misma
dimensin, pudiendo optarse por las siguientes formas: apiladas, cuando las categoras aparecen
separadas como si cada variable fuera una tabla distinta en la misma presentacin y anidadas, cuando
todas las categoras de la variable anidada aparecen para cada categora de la variable que se encuentre
sobre ella.
12.1

TABLAS PERSONALIZADAS

Tablas personalizadas utiliza una sencilla interfaz para el generador de tablas, que utiliza el sistema de
arrastrar y colocar, y que permite una representacin previa de la tabla, sta cambia a medida que se
seleccionan variables y opciones. De la misma forma, proporciona un nivel de flexibilidad que no se
encuentra en un cuadro de dilogo tpico, incluyendo la capacidad de cambiar el tamao de la ventana y el
tamao de los paneles incluidos dentro de la ventana.
Para los ejemplos haga uso de la base de datos JEFE_HOGAR.SAV
12.1.1 TABLAS PERSONALIZADAS: PESTAA TABLAS
En este caso, hay que seguir el siguiente procedimiento:
Seleccione Analizar/Tablas/Tablas personalizadas...
Seleccione la pestaa Tablas

A. Lista de variables

C. Panel de lienzo

B. Categoras

Figura 90: Cuadro de dilogo de Tablas Personalizadas


75 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

A.

Lista de variables. Ubicado en el panel superior


izquierdo de la ventana, en ella se observan las
diferentes variables de la base de datos con la
cual se est trabajando. Es importante
mencionar, que
Tablas personalizadas
distingue entre dos niveles de medida
diferentes para las variables y trata de manera
distinta las variables en funcin de su nivel de
medida: Categricas y de Escala
Un icono situado junto a cada variable de la
lista de variables identifica el tipo de variable.
Las variables categricas definen categoras (filas, columnas y capas) en la tabla y el estadstico de
resumen por defecto es el recuento (nmero de casos en cada categora). Por ejemplo, una tabla
por defecto de la variable categrica AREA mostrar el nmero de personas que viven en el rea
urbana y el nmero de las que viven en el rea rural.
Las variables de escala por lo general se resumen dentro de las categoras de las variables
categricas. Por defecto, el estadstico de resumen es la media aritmtica. Por ejemplo, una tabla
por defecto del ingreso del hogar dentro de las categoras de AREA mostrar el ingreso promedio
de las personas que viven en el rea urbana y el ingreso promedio de las que viven en el rea rural.

B.

Categoras. Ubicado en la parte inferior del recuadro LISTA DE VARIABLES. En ella se visualizan
las categoras de de las variables categrica (cuando una de ellas es seleccionada en la lista de
variables). Estas categoras tambin se visualizarn en el panel de lienzo cuando se utilice la
variable en una tabla.

Figura 91: Recuadro Categoras de la pestaa Tablas


C.

Panel de lienzo. Es el recuadro al cual se arrastra la (s) variable (s) con las que se va a generar una
tabla, ubicndolas ya sea en las filas o en las columnas. Una ventaja de este panel es que muestra
una vista previa de la tabla que se va a crear, no muestra en las casillas los valores reales de los
datos, pero proporciona una representacin de como quedara la tabla final.

76 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Arrastre y coloque una o ms variables en las reas de filas y/o columnas del panel de lienzo.
Pulse en Aceptar para crear la tabla.

Vista normal

Vista compacta

Figura 92: Vistas normal y compacta del panel de lienzo

La pestaa Tabla del generador de tablas ofrece un alto grado de control sobre el diseo y contenido de las
tablas, incluyendo:

APILACIN
ANIDACIN
CAPAS
ESTADSTICOS DE RESUMEN
CATEGORAS Y TOTALES

Apilar variables
En la lista de variables, seleccione todas las variables que desee apilar, arrstrelas todas juntas y
colquelas en las filas o columnas del panel de lienzo, o
Arrastre y coloque las variables por separado, colocando cada una por encima o por debajo de las
variables existentes en las filas o a la derecha o la izquierda de las variables existentes en las
columnas.

77 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Para eliminar una variable del panel de


lienzo del generador de tablas:

Seleccione (pulse en) la variable del


panel de lienzo.
Arrastre la variable a cualquier parte
fuera del panel de lienzo o pulse la
tecla Supr.

Para cambiar el nivel de medida de una


variable:

Pulse con el botn derecho del


ratn en la variable de la lista de
variables (slo puede hacer esto en
la lista de variables, no en el lienzo).
Seleccione Categrica o Escala en
el men contextual emergente.
Figura 93: Apilacin de variables en filas

Anidar variables
Arrastre una variable categrica y colquela en el rea de filas o columnas del panel de lienzo.
Arrastre una variable categrica o de escala y colquela a la derecha o la izquierda de la variable de
fila categrica o por encima o por debajo de la variable de columna categrica. En la figura 94, la
variable MATERIAL DEL PISO est anidada en la variable AREA.

Figura 94: Anidacin de variables en filas


78 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Adicionar capas
Pulse en Capas en la pestaa Tabla del generador de tablas para visualizar la lista Capas.
Arrastre y coloque las variables de escala o categricas que definirn las capas en la lista Capas.
Tambin puede arrastrar y soltar variables en el botn Capas sin ver la lista Capas.
En la lista Capas, no puede mezclar variables de escala y categricas. Todas las variables deben ser
del mismo tipo. Si tiene varias variables de capas que sean categricas, las capas se pueden apilar o
anidar.

Figura 95: Capas en una tabla

Estadsticos de resumen
Los estadsticos de resumen (y las dems opciones) disponibles aqu dependen del nivel de medida de la
variable origen de los estadsticos de resumen. El origen de los estadsticos de resumen (la variable en la
que se basan los estadsticos de resumen) est determinado por:
Nivel de medida. Si una tabla (o una seccin de una tabla en una tabla apilada) contiene una variable
de escala, los estadsticos de resumen se basarn en la variable de escala.
Orden de seleccin de las variables. La dimensin origen de los estadsticos por defecto (fila o
columna) para las variables categricas depende del orden en el que se arrastren y coloquen las
variables en el panel de lienzo. Por ejemplo, si arrastra una variable primero al rea Filas, la
dimensin de las filas es, por defecto, la dimensin origen de los estadsticos.
Anidar. Para las variables categricas, los estadsticos de resumen se basan en la variable ms al
interior de la dimensin origen de los estadsticos.
Una tabla apilada puede tener varias variables origen de los estadsticos de resumen (tanto de escala como
categricas), pero cada seccin de la tabla slo puede tener un origen de los estadsticos de resumen.
79 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 96: Estadsticos de resumen/ Origen

Si lo que se busca es cambiar la


dimensin
origen
de
los
estadsticos de resumen, el
proceso consiste en seleccionar la
dimensin (filas, columnas o
capas) en la lista desplegable
Origen del grupo Estadsticos de
resumen.
Para definir los estadsticos de
resumen que aparecen en una
tabla existen 2 opciones:
Seleccionar la variable
origen de los estadsticos
de resumen del panel de
lienzo y luego en el
recuadro Definir (que se
activa al seleccionar la
variable),
pulse
en
Estadsticos de resumen.
Figura 97: Definicin de los Estadsticos de resumen (opcin 1)
La otra opcin consiste en pulsar con el botn derecho del ratn en la variable origen de los
estadsticos de resumen del panel de lienzo y luego en el men contextual emergente seleccionar la
opcin Estadsticos de resumen (tal como se observa en la figura 98).

80 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Seleccionada una u otra opcin, el


siguiente paso es seleccionar los
ESTADSTICOS DE RESUMEN que
desee incluir en la tabla. Puede utilizar la
flecha para desplazar los estadsticos
seleccionados de la lista Estadsticos a la
lista Visualizacin o arrastrar y colocar en
la lista Visualizacin los estadsticos
seleccionados en la lista Estadsticos.
Tambin puede pulsar en las flechas
hacia arriba o hacia abajo para cambiar la
POSICIN DE PRESENTACIN del
estadstico de resumen actualmente
seleccionado.
Adems, debe seleccionar el FORMATO
DE PRESENTACIN para el estadstico
de resumen seleccionado en la lista
desplegable Formato.
Finalmente, debe introducir el nmero de
decimales que se van a visualizar en la
casilla DECIMALES para el estadstico de
resumen seleccionado.
Figura 98: Definicin de los Estadsticos de resumen (opcin 2)

Figura 100: Definicin de los Estadsticos de


resumen: variables de escala

Figura 99: Definicin Estadsticos de resumen:


variables categricas
Pulse en APLICAR A SELECCIN para incluir los estadsticos de resumen seleccionados para las variables
seleccionadas actualmente en el panel de lienzo.
Pulse en APLICAR A TODO para incluir los estadsticos de resumen seleccionados para todas las variables
apiladas del mismo tipo en el panel de lienzo.
81 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 101: Pestaa Tabla concluida

Categoras y totales

Este cuadro de dilogo slo est disponible para las variables categricas. No est disponible para las
variables de escala.
Para acceder al cuadro de dilogo Categoras y Totales existen 2 opciones:
Arrastre una variable categrica y colquelo en el panel de lienzo. Luego, pulse con el botn
derecho del ratn en el panel de lienzo y seleccione Categoras y totales en el men contextual
emergente
Seleccione la variable del panel de lienzo y, a continuacin, pulse en Categoras y totales en el
grupo Definir de la pestaa Tabla.

Figura 102: Cuadro de dilogo Categoras y totales


82 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

El cuadro de dilogo Categoras y totales permite:

Reordenar y excluir categoras.


Insertar totales y subtotales.
Incluir o excluir categoras vacas.
Incluir o excluir categoras que contienen valores perdidos.
Incluir o excluir categoras que no tienen etiquetas de valor definidas.

12.1.2 TABLAS PERSONALIZADAS: PESTAA OPCIONES


Para acceder a la pestaa Opciones,
seleccione: Analizar
/ Tablas/ Tablas
personalizadas.... Luego, pulse en la
pestaa Opciones.
La pestaa Opciones le permite:
Especificar lo que se visualiza
en las casillas vacas y en las
casillas para las que no se
pueden calcular estadsticos.
Controlar cmo se van a tratar
los valores perdidos en el
clculo de los estadsticos de
las variables de escala.
Establecer los anchos mnimo
y/o mximo de las columnas de
datos.
Controlar el tratamiento de las
respuestas duplicadas en los
conjuntos
de
categoras
mltiples.
Figura 103: Cuadro de dilogo de la pestaa Opciones
12.1.3 TABLAS PERSONALIZADAS: PESTAA TTULOS
Para acceder a la pestaa Ttulos,
seleccione:
Analizar / Tablas/ Tablas
personalizadas.... Luego, pulse en la
pestaa Ttulos.
La
pestaa
Ttulos
controla
la
presentacin de ttulos, textos al pie y
etiquetas de esquina.

Figura 104: Cuadro de dilogo de


la pestaa Ttulos

83 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

12.1.4 TABLAS PERSONALIZADAS: PESTAA ESTADSTICOS DE CONTRASTE


Para acceder a la pestaa Estadsticos de contraste, seleccione:
personalizadas.... Luego, pulse en la pestaa Estadsticos de contraste.

Analizar

/ Tablas/ Tablas

La pestaa Estadsticos de contraste le permite solicitar varias pruebas de significacin para las tablas
personalizadas, incluyendo:

Pruebas chi-cuadrado de independencia.


Pruebas sobre la igualdad de las medias de columna.
Pruebas sobre la igualdad de las proporciones de columna.
Pruebas de significacin para conjuntos de respuestas mltiples y subtotales.

Cuadro 1
Jefes de hogar, por materi al del piso de la vivienda que habi tan, por sexo

Total
Hombre
Mujer

Total
100.0
69.2
30.8

Ladrillo
cermico
100.0
71.3
28.7

Ladrillo
cemento
100.0
66.7
33.3

Ladrillo
de barro
100.0
60.0
40.0

Cemento
100.0
70.7
29.3

Tierra
100.0
71.4
28.6

Fuente: Encuesta 2009

Pruebas de chi -cuadrado de Pearson


Chi-cuadrado
gl
Sig.

4.806
4
.308

Los resultados se basan en f ilas y columnas


no v ac as de cada subtabla ms al int erior.

Figura 105: Cuadro de dilogo de la pestaa Estadstico de contraste y tablas generadas

84 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

12.2

APLICACIN PRCTICA DE TABLAS PERSONALIZADAS

Ejemplo 1: Tomando como base la informacin del archivo JEFE_HOGAR.SAV elabore una tabla
que muestre la distribucin de los jefes de hogar, por situacin laboral, segn sexo.

En este caso el proceso parte por:


Seleccione Analizar/Tablas/Tablas personalizadas...
Ahora slo tiene que arrastrar y colocar las variables en el sitio donde desea que aparezcan en la tabla.
Seleccione la variable R104 (SEXO) de la lista de variables, arrstrela y colquela en el rea Filas del
panel de lienzo.
Seleccione LABORAL1 (SITUACION LABORAL) de la lista de variables, arrstrela y colquela sobre
el rea Columnas del panel de lienzo.
El panel de lienzo muestra ahora una tabla de doble clasificacin de Situacin laboral por sexo. Como
puede observarse, por defecto, los recuentos se muestran en las casillas de las variables categricas.

Figura 106: Cuadro de Dilogo Tablas Personalizadas

Supongamos que adems se quiere tener informacin porcentual (porcentajes de columna y totales),
entonces es necesario:
Pulse con el botn derecho del ratn en la variable SITUACIN LABORAL en el panel de lienzo y
seleccionar Estadsticos de resumen en el men contextual emergente. En el cuadro de dilogo
Estadsticos de resumen, seleccione % del N de la columna de la lista Estadsticos y pulse en el botn
de flecha para aadirlo a la lista Visualizacin.
Ahora aparecern tanto los recuentos como los porcentajes de columna.
85 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Pulse en Aplicar a seleccin para guardar estas opciones y volver al generador de tablas.

Figura 107: Cuadro de dilogo Estadsticos de resumen para variables categricas


Para los totales, ubquese en la variable SITUACION LABORAL en el panel de lienzo y seleccionar
Categoras y totales en el men contextual emergente. Luego, marque en Total del recuadro Mostrar (parte
inferior izquierda del cuadro de dilogo) y en la opcin Por encima de las categoras a las que se aplican del
recuadro Totales y subtotales aparecen. Repita el mismo proceso con la variable Sexo

Figura 108: Cuadro de dilogo Categoras y totales para variables categricas


El panel de lienzo muestra los cambios realizados, mostrando las columnas correspondientes a ambos
recuentos y porcentajes de columna
86 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Sexo

Total
Hombre
Mujer

Total
Recuento
148525
97249
51276

%
100.0
65.5
34.5

Situacin l aboral
Trabaja
Recuento
%
114586
100.0
83218
72.6
31368
27.4

No trabaja
Recuento
%
33939
100.0
14031
41.3
19908
58.7

Figura 109: Recuentos y porcentajes de columna mostrados en el panel de lienzo


y su correspondiente tabla

Ejemplo 2: Sobre la base del mismo ejemplo 1, supngase que se quiere anidar la variable POBREZA
en la variable SEXO. Adems el ttulo del cuadro sera JEFES DE HOGAR, POR SITUACIN
LABORA, SEGN SEXO DEL JEFE DE HOGAR Y NIVEL DE POBREZA.

Figura 110: Recuentos y porcentajes de columna mostrados en el panel de lienzo


con variable anidada
87 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Jefes de hogar, por situacin laboral, segn sexo del jefe de hogar y nivel de
pobreza
Sexo y nivel de pobreza
Total

Hombre

Mujer

Total
Pobreza extrema
Pobreza relativ a
No pobre
Total
Pobreza extrema
Pobreza relativ a
No pobre
Total
Pobreza extrema
Pobreza relativ a
No pobre

Total
Recuento
148525
17562
38336
92627
97249
11562
26279
59408
51276
6000
12057
33219

%
100.0
11.8
25.8
62.4
100.0
11.9
27.0
61.1
100.0
11.7
23.5
64.8

Si tuacin laboral
Trabaja
Recuento
%
114586
100.0
12978
11.3
28774
25.1
72834
63.6
83218
100.0
10191
12.2
21998
26.4
51029
61.3
31368
100.0
2787
8.9
6776
21.6
21805
69.5

No trabaja
Recuento
%
33939
100.0
4584
13.5
9562
28.2
19793
58.3
14031
100.0
1371
9.8
4281
30.5
8379
59.7
19908
100.0
3213
16.1
5281
26.5
11414
57.3

Figura 111: Tabla generada

Ejemplo 3: Sobre la base del mismo ejemplo 1, supngase que se quiere insertar un subtotal para las
categoras pobreza extrema y pobreza relativa, as como obtener el total global
Para aadir totales y subtotales a una tabla personalizada aplique lo siguiente:
Pulse con el botn derecho del
ratn en la variable POBREZA
en el panel de lienzo y
seleccione Categoras y totales
en
el
men
contextual
emergente.
En el cuadro de dilogo
Categoras y totales, seleccione
2 en la lista de valores y de clic
en insertar
del recuadro
Subtotal, con lo cual se insertar
una fila con el subtotal de las
dos primeras categoras de la
variable POBREZA (pobreza
extrema y pobreza relativa)
En el campo de texto Etiqueta
que hay junto al botn escriba
POBRE.
Para incluir el total global,
seleccione
la
casilla
de
verificacin
Total
y
a
continuacin pulse en Aplicar.
Figura 112: Insercin de totales y subtotales

Pulse en Aceptar para generar la tabla.


88 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Jefes de hogar, por situacin laboral, segn sexo del jefe de hogar y nivel de
pobreza

Total

Hombre

Mujer

Pobreza extrema
Pobreza relativ a
Pobre
No pobre
Total
Pobreza extrema
Pobreza relativ a
Pobre
No pobre
Total
Pobreza extrema
Pobreza relativ a
Pobre
No pobre
Total

Total
Recuento
17562
38336
55898
92627
148525
11562
26279
37841
59408
97249
6000
12057
18057
33219
51276

%
11.8
25.8
37.6
62.4
100.0
11.9
27.0
38.9
61.1
100.0
11.7
23.5
35.2
64.8
100.0

Trabaja
Recuento
%
12978
11.3
28774
25.1
41752
36.4
72834
63.6
114586
100.0
10191
12.2
21998
26.4
32189
38.7
51029
61.3
83218
100.0
2787
8.9
6776
21.6
9563
30.5
21805
69.5
31368
100.0

No trabaja
Recuento
%
4584
13.5
9562
28.2
14146
41.7
19793
58.3
33939
100.0
1371
9.8
4281
30.5
5652
40.3
8379
59.7
14031
100.0
3213
16.1
5281
26.5
8494
42.7
11414
57.3
19908
100.0

Figura 113: Tabla generada

Ejemplo 4: Generar una tabla que muestre el ingreso promedio mensual, mediana y modal de los jefes
de hogar, segn condicin laboral (LABORAL1). A dicha tabla hay que colocarle el siguiente ttulo:
Jefes de Hogar, por medidas de tendencia central del ingreso mensual del hogar, segn situacin
laboral
El proceso a desarrollar es el siguiente:
Seleccione
Analizar/Tablas/Tablas
personalizadas...
Seleccione la variable Situacin
(LABORAL1) de la lista de variables,
arrstrela y colquela en el rea Filas
del panel de lienzo.
Seleccione Ingreso mensual del hogar
(INGFA) de la lista de variables,
arrstrela y colquela sobre el rea
Columnas del panel de lienzo.
Luego defina los estadsticos de
resumen (media, mediana y moda) a
dos decimales.
Ubicarse en la variable Situacin
laboral y entrar a Categoras y totales
para marcar el recuadro de Total.
Finalmente entre la pestaa Ttulos,
escriba
el
ttulo
del
cuadro
correspondiente
Pulse en Aceptar para generar la
tabla.
Figura 114: Cuadro de dilogo para el ejemplo 4

89 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Jefes de Hogar, por medidas de tendencia central del


ingreso mensual del hogar, segn situacin laboral
Media
447.73
468.39
377.98

Total
Trabaja
No trabaja

Mediana
309.16
325.50
275.00

Moda
150.00
350.00
250.00

Fuente: Encuesta 2009

Figura 115: Tabla generada

Ejemplo 5: Sobre la base del mismo ejemplo 4, supngase que se quiere agregar una variable en
capas, en este caso AREA.

El proceso a desarrollar es el siguiente:


Utilice el mismo cuadro de dilogo del
ejemplo anterior
Pulse en Capas para visualizar la lista
Capas. Luego, arrastre y coloque ah
la variable AREA.
Entre a Categoras y totales para
marcar el recuadro de Total.
Finalmente entre la pestaa Ttulos,
escriba
el
ttulo
del
cuadro
correspondiente
Pulse en Aceptar para generar la
tabla.

Figura 115: Cuadro de dilogo para el ejemplo 5

Jefes de Hogar, por medidas de tendencia central del ingreso


mensual del hogar, segn mbito geogrfico y situacin laboral
Total

Rural

Urbana

Total
Trabaja
No trabaja
Total
Trabaja
No trabaja
Total
Trabaja
No trabaja

Media
447.73
468.39
377.98
299.46
309.70
264.66
517.77
543.50
431.14

Mediana
309.16
325.50
275.00
220.00
227.08
200.00
372.50
399.84
300.00

Moda
150.00
350.00
250.00
120.00
120.00
50.00
150.00
350.00
250.00

Fuente: Encuesta 2009

Figura 116: Tabla generada

90 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

13. GRAFICOS
13.1

CREACION DE UN GRAFICO

Para crear un grfico efecte lo siguiente:


Seleccione Grficos en la barra de mens.
Seleccione el tipo de grfico que desee en el men Grficos, en
este caso se trabajar con la opcin Barras
Seleccione el icono del tipo concreto de grfico 6 que desee
7
Seale cmo estn organizados sus datos
Pulse en definir
Seleccionar la variable o variables correspondientes segn el
Cuadro de dilogo correspondiente.
Veamos ahora con ejemplos como se generan algunos tipos de grficos:
Para los ejemplos haga uso de la base de datos JEFE_HOGAR.SAV

En el siguiente ejemplo se generar un grfico de barras simples para grupos de casos (observar
procedimiento en la figura 118). Para lo cual, en el cuadro de dilogo seleccione en el Eje de
categoras la variable SEXO (R104) y la alternativa % de casos en el grupo Las barras representan.

Figura 117: Resmenes para grupos de casos en grficos de barras simples


6

Simple: Grfico con una sola barra para cada categora, caso o variable, del eje de categoras. Agrupados: Tipo de grfico que
muestra un grupo de barras para cada categora del eje de categoras. Cada barra dentro de esos grupos representa un grupo de
casos, una variable distinta o un caso individual. Apilados: Grficos en los que segmentos de barras se apilan unos sobre otros.
Existe una barra apilada para cada categora, caso o variable, del eje de categoras. Los segmentos dentro de cada barra
representan grupos de casos, variables distintas o casos individuales.

Resmenes para grupos de casos: El grfico resume una nica variable dentro de los subgrupos definidos por una variable
categrica. Los grficos complejos utilizan dos variables categricas para definir los subgrupos. Resmenes para variables
separadas: Resume ms de una variable. Los grficos simples resumen cada variable para la totalidad de los casos del archivo de
datos. Los grficos complejos resumen cada variable dentro de las categoras de otra variable. Valores individuales: Representa
los valores individuales de una o ms variables.

91 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

En el siguiente ejemplo se crear un grfico de barras agrupadas para distintas variables (observar
procedimiento en la figura 118).

Figura 118: Resmenes para distintas variables en grfico de barras agrupados

En el siguiente ejemplo se crear un grfico de barras apiladas para distintas variables (observar
procedimiento en la figura 119).

Figura 119: Resmenes para distintas variables en grficos de barras apiladas

92 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

13.2

EDICION DE GRAFICOS

Una vez que ha creado un grfico, puede editar muchos de sus atributos para cambiar su aspecto. Puede
cambiar el ttulo, el etiquetado, las fuentes y los colores. De la misma forma, puede eliminar categoras,
cambiar la amplitud del eje de escala e intercambiar los ejes, as como cambiar el tipo de grfico (observar
figura 120).
El procedimiento para la edicin de grficos es el siguiente:
Pulse dos veces en el grfico que desee editar, con esta accin, el grfico aparecer en la ventana
Editor de grficos.
Puede editar el grfico con los mens, con la barra de herramientas o pulsando dos veces en el
objeto que desee modificar. Para seleccionar objetos en el grfico, pulse en ellos. Para editar un
grfico usando los mens de la ventana de grficos, haga una seleccin en un men y edite el
cuadro de dilogo resultante. Finalmente es importante sealar que una forma rpida de acceder a
la mayora de las funciones de edicin de grficos es pulsar dos veces en los objetos.
Por ejemplo, compare el grfico que aparece en la figura 118 con el de la figura 120 y podr observar que
ahora las barras se presentan en forma horizontal, para lo cual se hizo uso de la funcin Tambin puede
Transponer sistemas de coordenadas de grficos. Tambin se ha variado la fuente, estilo y el tamao del
ttulo. La posicin de la leyenda cambi. De igual forma, se vari el color de las barras y ahora stas tienen
trama.

Figura 120: Grfico de la figura 118 editado


13.3

GENERADOR DE GRFICOS

El generador de grficos es una opcin del SPSS que permite crear grficos a partir de los grficos
predefinidos de la galera o a partir de los elementos individuales, como por ejemplo, ejes y barras.
A medida que va creando el grfico, observar una presentacin preliminar del grfico en el lienzo. Aunque
la presentacin preliminar utiliza etiquetas de variable definidas y niveles de medida, no muestra los datos
reales.
Para iniciar el generador de grficos seleccione Grficos/ Generador de grficos. La figura 121
muestra el cuadro de dilogo, con su correspondiente estructura.

93 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

A.
Lienzo
Es la zona del cuadro de dilogo Generador de grficos donde se genera el grfico.
B.
Conjunto de ejes
Este determina los ejes de un espacio de coordenadas definido. Este se genera automticamente cuando
se aade un elemento de la galera al lienzo. Cada eje incluye una zona de colocacin del eje a la que se
pueden arrastrar y colocar variables.
C.
Elementos grficos
Los elementos grficos son los elementos del grfico que representan datos. Dichos elementos son las
barras, los puntos, las lneas, etc.
D.
Lista de variables
La lista de variables muestra las variables disponibles.
E.
Lista de categoras
Muestra las categoras de aquellas variables que son categricas
F.
Zonas de colocacin
Las zonas de colocacin son las zonas del lienzo donde se arrastra y coloca una variable de la lista
Variables. Tal como se ha indicado anteriormente, la zona de colocacin bsica es la zona de colocacin del
eje.
Conjunto
de ejes

Variable en zona
de agrupacin

Lista de
variables

Lienzo

Conjunto de ejes

Lista de
categoras

Figura 121: Cuadro de dilogo de generador de grficos

Generacin de un grfico desde la galera


El mtodo ms sencillo para generar grficos es utilizar la galera. A continuacin, se indican los pasos
generales que hay que seguir para crear un grfico utilizando la galera.

94 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Pulse en la pestaa Galera si


no est seleccionada. La galera
incluye un gran nmero de
grficos
predefinidos,
organizados por tipo de grfico.
En la lista ELIJA ENTRE,
seleccione una categora de
grficos. Cada categora ofrece
varios tipos.
Para nuestro ejemplo, pulse en
la pestaa Barra. Los iconos que
representan los grficos de
barras que hay disponibles en la
galera aparecen en la parte
derecha del cuadro de dilogo.
Arrastre la imagen del grfico
deseado al lienzo. Tambin
puede pulsar dos veces en la
imagen (Figura 122).
Figura 122: Cuadro de dilogo de generador de grficos
Arrastre variables desde la lista variables y colquelas en las zonas de colocacin del eje. Recordar
que la zona de colocacin correspondiente al eje X siempre es necesaria. La variable de esta zona
de colocacin controla dnde aparecen las barras en el eje X. En nuestro ejemplo trasladaremos la
variable POBREZA. Adems, dependiendo del tipo de grfico que se est creando, puede que
tambin sea necesario arrastrar una variable a la zona de colocacin del eje Y. Asimismo, por
defecto aparece en el eje Y el estadstico RECUENTO, pero este lo vamos a cambiar a
PORCENTAJE.

Figura 123: Cuadro de dilogo definicin de variables en las zonas de colocacin del eje
95 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Si necesita incluir otras variables al grfico (por ejemplo, para la agrupacin o la adicin de
paneles), pulse en la pestaa Grupos/ID de puntos y seleccione una o ms opciones. Luego, deber
arrastrar las variables categricas a las nuevas zonas de colocacin que aparecen en el lienzo.
Pulse en Ttulos/notas al pie y anote tanto el ttulo del grfico como la fuente de donde proviene.

Figura 124: Cuadro de dilogo definicin de Ttulos y notas al pie

Luego pulse en Aceptar.

Figura 125: Grfico obtenido usando Generador de grficos/ Galeras


96 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

14. GRAFICOS INTERACTIVOS


Los grficos interactivos se caracterizan por ser dinmicos. La interfaz para la creacin y modificacin de
este tipo de grficos presenta las siguientes caractersticas:

14.1

La seleccin de variables se efecta mediante el sistema de arrastre del ratn.


En los cuadros de dilogo se puede alternar entre mostrar los nombres y las etiquetas de las
variables, haciendo uso del men contextual (aparece al pulsar con el botn derecho del ratn sobre
una lista de variables).
En los cuadros de dilogo las listas de variables tienen iconos que identifican si son variables
preincorporadas
(produce grficos de frecuencias, porcentajes o por casos), de
escala
(los
valores se ubican en cualquier lugar de una escala) o categricas
(contiene un
nmero limitado de variables discretas).
Pueden ser modificados para insertar variables, elementos o funciones de resumen adicionales. As
como cambiar etiquetas, ajustar ejes, modificar paneles, cambiar leyendas y claves, cambiar el
tamao y relleno de la regin de datos, editar aspectos del grfico, cambiar colores y estilos
CREACION DE GRAFICOS INTERACTIVOS

Antes de mostrar el procedimiento a seguir para crear grficos interactivos, en la figura 126 se presenta, a
manera de ejemplo, el Cuadro de dilogo Crear grfico de barras pestaa Asignar variables, para mostrar
sus componentes bsicos: Lista de origen, ejes de destino, funciones de resumen, orientacin y nmero de
dimensiones.
Orien
tacin

Nmero de
disemnsiones

Ejes de destino
Lista de
origen

Funciones
de
resumen

Grfico 126: Cuadro de dilogo Crear grfico de barras


Para crear un grfico interactivo efecte lo siguiente:
Seleccione Grficos/Interactivos
Seleccione un tipo de grfico
Arrastre y coloque variables desde la lista de origen hasta las listas de destino.
Si el usuario lo desea tiene la posibilidad de:
97 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Determine la orientacin del grfico (vertical u horizontal)


Determine el nmero de dimensiones
Pulsar Mostrar la clave para identificar la funcin.

Veamos ahora con ejemplos como se crea un grfico interactivo:


Para los ejemplos haga uso de la base de datos JEFE_HOGAR.SAV

Ejemplo 1: Se generar un grfico de barras en tercera dimensin que muestre el Porcentaje de


Jefes de hogar, segn el mbito geogrfico (AREA) en el que viven (ver figura 127).

Figura 127: Grfico interactivo de barras simples

Ejemplo 2: Se generar un grfico de barras en tercera dimensin que muestre Jefes de hogar, por
nivel de pobreza, segn mbito geogrfico en el que vive. En este caso, deber arrastrar la variable
POBREZA al eje X, $pct al eje Y, y finalmente AREA en el recuadro Variables del panel.
De esta forma se pasa de un grfico de barras simples a un grfico de barras agrupado (ver figura
128).

98 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Figura 128: Grfico interactivo de barras agrupado

Ejemplo 3: Observaremos como vara el grfico al sustituir los recuentos del eje vertical por un
resumen de los datos de INGFA (ingreso familiar). Por defecto, se muestran los valores promedio,
ahora puede visualizar en la figura 129 un grfico de barras agrupado que muestra el ingreso
promedio mensual del hogar, por SEXO (R104) y segn AREA (rea geogrfica).

Figura 129: Grfico interactivo de barras agrupado mostrando un resumen de datos

99 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

14.2

CREACION DE GRAFICOS INTERACTIVOS A PARTIR DE TABLAS PIVOTE

Para crear un grfico a partir de una tabla pivote ejecute el siguiente procedimiento:
Active la tabla pivote; para ello, pulse dos veces en cualquier punto de la tabla.
Seleccione las casillas que desee que aparezcan en el grfico.
Pulsar con el botn derecho del ratn en cualquier punto del rea seleccionada, le aparecer un
men contextual emergente.
Pulse en Crear grfico.
Pulse en el tipo de grfico que desee.
Veamos ahora como se generan un grfico interactivo a partir de una tabla pivote:

Partiendo de la tabla Jefes de hogar, por situacin laboral, segn sexo, se proceder a generar un
grfico de barras. Tal como se observa en la figura 130, en el grfico cada barra representa una de
las casillas seleccionadas de la tabla pivote.

Figura 130: Generacin de grfico interactivo a partir de una tabla pivote


14.3

EDICION DE GRAFICOS INTERACTIVOS

Para editar un grfico interactivo, actvelo pulsando dos veces en l, el siguiente paso ser pulsar dos veces
en un elemento para modificar sus atributos. A manera de ejemplo, se va a editar el grfico interactivo de la
figura 130 (ver figura 133), efectuando las siguientes modificaciones:

Mostrar los valores en las barras.- La accin ser pulsar dos veces en cualquiera de las barras, lo
que le abrir el cuadro de dilogo Barras, ah deber pulsar en la opcin Valores de la seccin

100 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Etiquetas de las barras, sealando al


mismo tiempo la posicin (para fines del
ejemplo se ha determinado que los
valores sean ubicados en la base
exterior.

Mostrar
el
grfico
en
tercera
dimensin.- Si ya est editando el
grfico deber seleccionar el men
Ver/Tercera dimensin.

Modificar ttulos, etiquetas de los ejes,


de leyendas.- Para efectuar estas
modificaciones deber pulsar dos veces
en el texto a modificar, luego de cambiar
el texto, el usuario tambin tiene la
posibilidad de modificar fuente y tamao

Cambiar colores y estilos de las


barras.- La accin ser pulsar dos veces
en cualquiera de las barras, esto le
permitir acceder al cuadro de dilogo
Barras, ah deber pulsar en las opciones
estilo y color de la seccin Relleno de la
Barra.
Figura 131: Cuadro de dilogo para cambiar opciones de las barras

Cambiar el formato, fuente y tamao de


los valores numricos.- Para editar los
atributos de un solo elemento o de un
subconjunto de elementos, pulse en l con
el botn derecho del ratn, esto lo llevar a
un men contextual, pulsar ahora Etiquetas
de las barras para cambiar los atributos de
todas las barras del grfico, de esta manera
se resaltarn todas los valores numricos,
nuevamente botn derecho para accesar al
men contextual y pulsar Texto, modificando
fuente, tamao y formato numrico, ste
ltimo a un decimal y con el signo de
porcentaje.

Cambiar colores y estilos de las barras.La accin ser pulsar dos veces en
cualquiera de las barras, esto le permitir
acceder al cuadro de dilogo Barras, ah
deber pulsar en las opciones estilo y color
de la seccin Relleno de la Barra.
Figura 132: Cuadro de dilogo para cambiar fuente

101 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Jefes de hogar, por situacin laboral, segn sexo

Hombre

72.6%

Mujer

58.7%
41.3%
27.4%

Figura 133: Edicin de grfico interactivo

102 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

15. TABLAS DE CONTINGENCIA


El procedimiento Tablas de contingencia permite crear tablas de clasificacin doble y mltiple, pero adems
de esto, proporciona una serie de pruebas y medidas de asociacin para las tablas de doble clasificacin,
hay que tener presente que la estructura de la tabla y el hecho de que las categoras estn ordenadas o no
determinan las pruebas o medidas a utilizarse.
Los estadsticos de tablas de contingencia y las
medidas de asociacin slo pueden determinarse
para las tablas de doble clasificacin. Esto quiere
decir, que de especificarse una fila, una columna y
un factor de capa (variable de control), el
procedimiento Tablas de contingencia crea un
panel de medidas y estadsticos asociados para
cada valor del factor de capa (o una combinacin
de valores para dos o ms variables de control). As
por ejemplo, si la variable SEXO es un factor de
capa para una tabla de NIVEL EDUCATIVO y
CATEGORIA LABORAL, los resultados para una
tabla de doble clasificacin para los hombres se
generan de forma independiente de los resultados
de las mujeres, visualizndose en paneles uno
detrs del otro.
En la definicin de cada una de las variables debe
emplear valores de una variable numrica o de
cadena corta.
Figura 134: Cuadro de dilogo de Tablas de Contingencia

15.1

ESTADSTICOS QUE SE PUEDEN DETERMINAR CON EL PROCEDIMIENTO TABLAS DE


CONTINGENCIA

Entre estos estadsticos se tienen los siguientes: Chicuadrado, correlaciones, nominal, ordinal, nominal
por intervalo, Kappa, riesgo, Mc Nemar y estadsticos
de Cochran y Mantel - Haenszel.
15.1.1 Chi-cuadrado
Este grupo compren los siguientes estadsticos:
2

El chi-cuadrado de Pearson (X ), es un
estadstico utilizado para contrastar la
hiptesis de que las variables de fila y
columna son independientes. No debe
utilizarse si cualquiera de las casillas tiene un
valor esperado menor que 1, o si ms de un
20% de las casillas tienen valores esperados
menores que 5. A efectos prcticos, el valor
de significacin es ms importante que el
valor real del estadstico.
Figura 135: Cuadro de dilogo de Tablas de Contingencia: Estadsticos

103 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Se calcula sumando los cuadrados de los residuos de todas las celdas divididos por las frecuencias
esperadas, tal como se muestra en la frmula siguiente:

X2

Oij Eij
Eij

Donde:
Oij es la frecuencia observada en cada celdaij
Eij es la frecuencia esperada en cada celdaij
Debe tenerse presente que Eij es el producto de la probabilidad bajo la independencia de que una
observacin caiga en la celdaij por el tamao total de la muestra.

frecuenciafilai frecuenciacolumna j
Eij

N
N
N

O lo que es lo mismo:

Eij

frecuenciaen filai frecuenciaen columna j


N

Chi-cuadrado de la razn de verosimilitud, es un estadstico de bondad de ajuste similar al chicuadrado de Pearson. Para grandes tamaos de muestra, los dos estadsticos son equivalentes. La
ventaja del chi-cuadrado de la razn de verosimilitud es que puede subdividirse en partes
interpretables que se suman hasta el total. A efectos prcticos, el valor de significacin es ms
importante que el valor real del estadstico.
Prueba de asociacin lineal por lineal, es una medida de la asociacin lineal entre las variables de
fila y columna de una tabla de contingencia. Este estadstico no debe utilizarse con datos
nominales. Se conoce tambin como contraste de chi-cuadrado de Mantel-Haenszel. Para
propsitos generales, el valor de significacin es ms importante que el valor real del estadstico.
Chi-cuadrado corregido de Yates, es una correccin que se aplica en ocasiones al clculo del chicuadrado para tablas 2x2 para mejorar su aproximacin. Los valores corregidos de chi-cuadrado
son siempre ms pequeos que los valores no corregidos. Implica la resta de 0.5 a las diferencias
positivas observadas entre las frecuencias observadas y esperadas (residuos) y la suma de 0.5 a
las diferencias negativas antes de elevarlas al cuadrado.
Prueba exacta de Fisher o Prueba de independencia para una tabla 2 x 2, es de mayor utilidad
cuando son pequeos el tamao total de la muestra y el de los valores esperados. SPSS utiliza esta
prueba cuando el tamao de la muestra en una tabla 2 x 2 es 20 o menor o cuando una tabla
presenta una casilla con una frecuencia esperada menor que cinco.
15.1.2 Correlaciones
Este grupo comprende los siguientes estadsticos:
Coeficiente de Correlacin de Pearson (r) es una medida de asociacin lineal entre dos variables
cuantitativas. Los valores del coeficiente de correlacin varan entre -1 y 1. El signo del coeficiente
indica la direccin de la relacin y el valor absoluto indica la intensidad. Los valores absolutos
mayores indican que las relaciones son ms fuertes. Su frmula es:
104 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

n xy x y
n x 2 x 2 n y 2 y2

Coeficiente de correlacin de Spearman (r s ) es la versin no paramtrica del coeficiente de


correlacin de Pearson, que se basa en los rangos de los datos en lugar de hacerlo en los valores
reales. Resulta apropiada para datos ordinales, o los de intervalo que no satisfagan el supuesto de
normalidad. Los valores del coeficiente van de -1 a +1. El signo del coeficiente indica la direccin de
la relacin y el valor absoluto del coeficiente de correlacin indica la fuerza de la relacin entre las
variables. Los valores absolutos mayores indican que la relacin es mayor. Su frmula es:

rs 1

6 d 2
n n 2 1

Donde:
d = Diferencia de rangos
n = Nmero de pares de calificaciones
15.1.3 Nominal
Se emplea para los datos nominales. Este grupo comprende los siguientes estadsticos:
Estadstico
Coeficiente Phi

Frmula

Coeficiente de
contingencia

V de Cramer

X2
X 2 N

X2
V
Nk 1

Lambda
P(1)= 1 - prob. de
categora modal.
P(2)= Suma de las
prob. de celdas
que no sean moda
de las filas.

X2
N

p1 p2
p1

Interpretacin
Medida de asociacin basada en chi-cuadrado, aplicable
slo para las tablas 2x2. Vara de 0 a 1, donde "cero"
implica ausencia de correlacin entre las variables y "ms
uno" que las variables estn correlacionadas de manera
perfecta.
Coeficiente de contingencia es una medida de asociacin
basada en chi-cuadrado. El valor siempre est
comprendido entre 0 y 1. El valor 0 indica que no hay
asociacin entre la fila y la columna. Los valores cercanos
a 1 indican que hay gran relacin entre las variables. El
valor mximo posible depende del nmero de filas y
columnas de la tabla.
Medida del grado de asociacin basada en chi-cuadrado
que se emplea para tablas mayores de 2x2. El valor
siempre est comprendido entre 0 y 1. El valor 0 indica
que no hay asociacin entre las variables de fila y de
columna. Los valores cercanos a 1 indican que hay gran
relacin entre las variables. La V de Cramer puede
alcanzar un valor de 1 para tablas de cualquier dimensin
Medida de asociacin que refleja la reduccin proporcional
en el error cuando se utilizan los valores de la variable
independiente para pronosticar los valores de la variable
dependiente. Un valor igual a 1 significa que la variable
independiente pronostica perfectamente la variable
dependiente. Un valor igual a 0 significa que la variable
independiente no ayuda en absoluto a pronosticar la
variable dependiente.
105 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Tau de Kruskal y
Goodman

Coeficiente de
incertidumbre

Medida de asociacin que refleja la reduccin proporcional


del error cuando los valores de la variable independiente
se emplean para pronosticar los valores de la variable
dependiente. Los valores oscilan entre 0 y 1. A diferencia
de lambda, donde se utiliza la categora modal para los
pronsticos, tau utiliza las proporciones marginales.
Medida de asociacin que indica la reduccin proporcional
del error cuando los valores de una variable se emplean
para pronosticar valores de la otra variable. Por ejemplo,
un valor de 0.83 indica que el conocimiento de una
variable reduce en un 83% el error al pronosticar los
valores de la otra variable. SPSS calcula tanto la versin
simtrica como la asimtrica del coeficiente de
incertidumbre.

15.1.4 Ordinal
Estn basadas en la ordenacin por rangos de los valores de las variables, se parte de un atabla con los
pares de valores concordantes (un individuo tiene valores superiores o inferiores a otro en ambas variables)
o discordantes (superiores en una e inferiores en otra) o empatados (empatado en X pero no en Y,
empatado en Y pero no en X o empatado en ambas variables). Este grupo comprende los siguientes
estadsticos:
Gamma de Goodman y Kruskal es una medida
de asociacin simtrica entre dos variables
ordinales cuyo valor siempre est comprendido
entre menos 1 y 1. Los valores prximos a 1,
en valor absoluto, indican una fuerte relacin
entre las dos variables. Los valores prximos a
cero indican que hay poca o ninguna relacin
entre las dos variables. Para las tablas de
doble clasificacin, se muestran las gammas de
orden cero. Para las tablas de tres o ms
factores de clasificacin, se muestran las
gammas condicionales.
Tau b es una medida no paramtrica de
asociacin para variables ordinales o de rangos
que tiene en consideracin los empates. El
signo del coeficiente indica la direccin de la
relacin y su valor absoluto indica la magnitud
de la misma, de tal modo que los mayores
valores absolutos indican relaciones ms
fuertes. Los valores posibles van de -1 a 1,
pero un valor de -1 o +1 slo se puede obtener
a partir de tablas cuadradas.

Tau c es una medida no paramtrica de


asociacin para variables ordinales que ignora
los empates. El signo del coeficiente indica la
direccin de la relacin y su valor absoluto
indica la magnitud de la misma, de tal modo
que los mayores valores absolutos indican
relaciones ms fuertes. Los valores posibles
van de -1 a 1, pero un valor de -1 o +1 slo se
puede obtener a partir de tablas cuadradas.
D de Somers es una medida de asociacin
entre dos variables ordinales que toma un valor
comprendido entre -1 y 1. Los valores prximos
a 1, en valor absoluto, indican una fuerte
relacin entre las dos variables. Los valores
prximos a cero indican que hay poca o
ninguna relacin entre las dos variables. La d
de Somers es una extensin asimtrica de
gamma que difiere slo en la inclusin del
nmero de pares no empatados en la variable
independiente. Tambin se calcula una versin
no simtrica de este estadstico.

15.1.5 Nominal por intervalo


En este caso, el estadstico a emplear es eta, definido ste como una medida de asociacin cuyo valor
siempre est comprendido entre 0 y 1. El valor 0 indica que no hay asociacin entre las variables de fila y de
columna. Los valores cercanos a 1 indican que hay gran relacin entre las variables. Eta resulta apropiada
para una variable dependiente medida en una escala de intervalo (por ejemplo, gasto del hogar) y una
variable independiente con un nmero limitado de categoras (por ejemplo, gnero). Se calculan dos valores
de eta: uno trata la variable de las filas como una variable de intervalo; el otro trata la variable de las
columnas como una variable de intervalo.
106 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

15.1.6 Kappa
La kappa de Cohen mide la concordancia entre las apreciaciones de dos evaluadores cuando ambos estn
valorando el mismo objeto. Un valor igual a 1 indica un acuerdo perfecto. Un valor igual a 0 indica que el
acuerdo no es mejor que el que se obtendra por azar. Kappa slo est disponible para las tablas cuadradas
(tablas en las que ambas variables tienen el mismo nmero de categoras).
15.1.7 Riesgo
Es una medida del grado de asociacin entre la presencia de un factor y la ocurrencia de un evento. Si el
intervalo de confianza para el estadstico incluye un valor de 1, no se podr asumir que el factor est
asociado con el evento. Cuando la ocurrencia del factor es rara, se puede utilizar la razn de las ventajas
(odds ratio) como estimacin del riesgo relativo. Un ejemplo muy comn asociado a este indicador es
determinar si el hecho de fumar est relacionado con las enfermedades cardacas.
15.1.8 McNemar
Es una prueba no paramtrica para dos variables dicotmicas relacionadas. Contrasta los cambios en las
respuestas utilizando la distribucin de chi-cuadrado. Es til para detectar cambios en las respuestas
debidas a la intervencin experimental en los diseos del tipo "antes-despus". Tpicamente, un valor de
significacin menor que 0.05 se considera significativo.
15.1.9 Estadsticos de Cochran y Mantel - Haenszel
Dentro de este grupo se tiene los siguientes estadsticos:
El estadstico de Cochran, comprueba la
independencia entre una variable de factor
dicotmica y una variable de respuesta
dicotmica, condicionada por los patrones en
las covariables, los cuales vienen definidos por
una o ms variables "de estratificacin".
El estadstico de Mantel-Haenszel es similar al
de Cochran, slo que efecta correcciones en
los tamaos muestrales ms pequeos.
15.2

El estadstico de Breslow-Day comprueba la


homogeneidad de la razn de las ventajas
comn.
El estadstico de Tarone es similar al de
Breslow-Day, slo que efecta correcciones en
el estimador empleado para medir la razn de
las ventajas comn. De la misma forma se
calcula la razn de ventajas comn de MantelHaenszel.

PROCEDIMIENTO PARA DETERMINAR TABLAS DE CONTINGENCIA

Para determinar tablas de contingencia efecte lo siguiente:


Seleccionar Analizar/Estadsticos descriptivos/Tablas de contingencia...
Seleccionar una o ms variables de fila y una o ms variables de columna.
Si el usuario desea tiene la posibilidad de:

Seleccionar una o ms variables de control (capas de la tabla de contingencia). Hay que tener
presente que se genera una tabla de contingencia por cada categora de cada variable de
capa.
Pulsar en grficos de barras agrupadas, una ventaja de estos es que ayudan a resumir los
datos por grupos de casos. Se genera una agrupacin de barras por cada valor de la variable
especificada en el cuadro filas, en tanto que la variable que define las barras dentro de cada
agrupacin es la variable especificada en el cuadro de columnas.
Pulsar en Estadsticos para obtener pruebas y medidas de asociacin para las tablas de
doble clasificacin, debiendo tenerse presente lo especificado en el acpite anterior.

109 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Pulsar en Casillas para obtener frecuencias (nmero de casos realmente observados y


esperados si las variables de fila y columna son independientes entre s o no relacionados
entre s), porcentajes (por fila, por columna y sobre el total de la tabla (una capa) y residuos:
no tipificados (diferencia entre las frecuencias observadas y la terica, tipificados (dicha
diferencia entre la raz cuadrada de la frecuencia terica) y tipificados corregidos (dicha
diferencia entre una estimacin de su error estndar).
Pulsar en Formato para ordenar las filas en forma ascendente o descendente.

Veamos ahora algunos ejemplos de cmo funciona este procedimiento:


Para los ejemplos haga uso de la base de datos JEFE_HOGAR.SAV

Ejemplo 1: Determinar una tabla de contingencia para las variables NIVEL DE POBREZA
(NIV_POBREZA) y MATERIAL DE LOS PISOS (R304). En la opcin Estadsticos generar chicuadrado, correlaciones y los nominales. En lo que se refiere a las casillas considerar las
frecuencias observadas, esperadas, todos los porcentajes y los residuos no tipificados, finalmente
en la opcin Formato dejar
las filas en orden ascendente (por defecto).
En la figura 136 se presenta las opciones a utilizar y los resultados obtenidos.

Figura 136: Desarrollo del ejemplo 1


110 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Algunos comentarios de los resultados obtenidos de la tabla de contingencia nivel de pobreza y material
predominante en los pisos de las viviendas que habitan:

En la categora pobre se
ubica el 40.7% de los
jefes de hogar, en la de
no pobres se ubica el
59.3%. (marginales de
columna). En relacin a
la variable material de
los pisos, el 10.0% de
jefes de hogar seal
que
el
material
predominante en el piso
de la vivienda que
habitan es el ladrillo
cermico, el 41.2%
ladrillo cemento, 22.0%
de cemento y 26.0% de
tierra (marginales de
fila).

Tabla de contingencia Nivel de pobreza * Material del piso

Pobre

No
pobre

Total

Recuent o
Frecuencia esperada
% de Niv el de pobreza
% de Material del piso
% del total
Residuo
Recuent o
Frecuencia esperada
% de Niv el de pobreza
% de Material del piso
% del total
Residuo
Recuent o
Frecuencia esperada
% de Niv el de pobreza
% de Material del piso
% del total
Residuo

En el ejemplo, hay 4 grados de libertad


(5-1) * (2-1) y el valor del chi-cuadrado
de Pearson es de 208.628 (ver tabla de
Test de Chi-cuadrado), adems, en tanto
el nivel de significacin es menos a
0.05% se rechaza la hiptesis nula de
que ambas variables son independientes,
aceptndose
que
el
materia
predominante en los pisos influye en el
nivel de pobreza del hogar.

Ladril lo
cermico
30
76.5
3.9%
16.0%
1.6%
-46.5
158
111.5
14.1%
84.0%
8.4%
46.5
188
188.0
10.0%
100.0%
10.0%

Materi al del piso


Ladril lo Ladril lo de
cemento
barro
Cemento
220
7
203
316.6
6.1
169.3
28.6%
.9%
26.4%
28.3%
46.7%
48.8%
11.7%
.4%
10.8%
-96.6
.9
33.7
558
8
213
461.4
8.9
246.7
49.9%
.7%
19.0%
71.7%
53.3%
51.2%
29.6%
.4%
11.3%
96.6
-.9
-33.7
778
15
416
778.0
15.0
416.0
41.2%
.8%
22.0%
100.0%
100.0%
100.0%
41.2%
.8%
22.0%

Tierra
308
199.4
40.1%
62.9%
16.3%
108.6
182
290.6
16.3%
37.1%
9.6%
-108.6
490
490.0
26.0%
100.0%
26.0%

Total
768
768.0
100.0%
40.7%
40.7%
1119
1119.0
100.0%
59.3%
59.3%
1887
1887.0
100.0%
100.0%
100.0%

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Correccin por
continuidad
Razn de v erosimilitudes
Asociacin lineal por
lineal
N de casos v lidos

Sig. asinttica
(bi lateral)
.000

214.827

.000

207.377

.000

Valor
208.628a

gl

1887

a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La


frecuencia mnima esperada es 6.10.

En la tabla de Medidas simtricas se observa que los estadsticos V de Cramer (0.333), Coeficiente
de Contingencia (0.316) y coeficiente de correlacin de Spearman (-0.332) refuerzan la relacin
existente entre las variables nivel de pobreza y material de los pisos. El signo positivo del
coeficiente indica la existencia de una relacin inversa entre las variables y su valor absoluto indica
la magnitud de la misma, aunque cabe sealar que sta no es una relacin muy fuerte.

Medidas simtricas
a

Phi
V de Cram er
Nominal por nominal
Coef iciente de
contingencia
Interv alo por interv alo R de Pearson
Ordinal por ordinal
Correlacin de Spearman
N de casos v lidos

Valor
Error tp. asi nt. T aproximada
.333
.333
.316
-.332
-.332
1887

Si g.
aproximada
.000
.000
.000

.021
.021

-15.260
-15.276

.000c
.000c

a. Asumiendo la hiptesis alternativa.


b. Empleando el er ror tpico asinttico basado en la hiptesis nula.
c. Basada en la aproximacin normal.

Figura 136: Continuacin desarrollo del ejemplo 1

111 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Ejemplo 2: Determinar una tabla de contingencia para las variables GRADOS APROBADOS
(APROBA1) y el
INGRESO PER CAPITA (INGPE). En la opcin Estadsticos generar
correlaciones. En este caso, el R de Pearson es 0.366, como el signo del coeficiente es positivo
indica que existe una relacin directa entre ambas variables, sin embargo en tanto el coeficiente
est ms cerca de 0 que de 1, significa que existe una baja intensidad en dicha relacin.

Resumen del procesamiento de los casos


Casos
Perdidos
N
Porcentaje

Vli dos
N
Porcentaje
GRADOS
APROBADOS *
INGPE

581

100.0%

.0%

Total
Porcentaje
581

100.0%

Medidas simtricas
a

Interv alo por interv alo R de Pearson


Ordinal por ordinal
Correlacin de Spearman
N de casos v lidos

Valor
Error tp. asi nt. T aproximada
.366
.049
9.452
.288
.040
7.232
581

Si g.
aproximada
.000c
.000c

a. Asumiendo la hiptesis alternativa.


b. Empleando el er ror tpico asinttico basado en la hiptesis nula.
c. Basada en la aproximacin normal.

Figura 137: Desarrollo del ejemplo 2

112 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

Tarea 3 (Desarrollo individual)


Para el desarrollo de este laboratorio haga uso de la base de datos FAMILIA.SAV (creada en el laboratorio
2). Esta base de datos contiene las principales caractersticas demogrficas, educativas, laborales y de
vivienda de los jefes de hogar de un departamento del pas.
1.

Haciendo uso del procedimiento TABLAS PERSONALIZADAS obtenga los cuadros siguientes:

Jefes de hogar, por sexo (R104), segn grupos de edad (JH_GEDAD), en porcentaje de fila.

Jefes de hogar, por sexo (R104) y grupos de edad (JH_GEDAD), segn material
predominante en las paredes (R103). Tenga presente que las variables de sexo y grupos de
edad deben ir apiladas, la primera en porcentajes de fila y la segunda en porcentaje de
columna.

Jefes de hogar con ocupacin (LABORAL=1), por nivel de pobreza (NIV_POB), segn
categora de ocupacin (R418). En porcentajes de fila

Jefes de hogar, por nivel de pobreza (NIV_POB), segn sexo (R104) y mbito geogrfico
(AREA). En porcentaje de columna. Colocar la variable nivel de hacinamiento (NHACI) en
capas.

Nivel de escolaridad de los jefes de hogar (APROBA1), por grupos de edad (JH_GEDAD),
segn nivel de pobreza (NIV_POB).

2.

Haciendo uso del procedimiento Grficos de barras represente grficamente el Ingreso promedio del
hogar (INGFA), por condicin de actividad del jefe de hogar (LABORAL)

3.

Haciendo uso del procedimiento grficos interactivos represente grficamente Nmero promedio de
miembros del hogar por mbito geogrfico (AREA)

4.

Grafique el nivel de pobreza (NIV_POB), por mbito geogrfico (AREA)

5.

Grafique el nivel de pobreza (NIV_POB), por nivel de alfabetismo del jefe de hogar (R202A)

6.

Determinar si existe asociacin entre las variables nivel de pobreza (NIV_POB) y nivel de
alfabetismo del jefe de hogar (R202A)

7.

Determinar si para los jefes de hogar del rea urbana (AREA=1) existe asociacin entre las
variables Ingreso promedio del hogar (INGFA) y nmero de habitaciones (R305)

113 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

BIBLIOGRAFIA

SPSS (1999). SPSS Base para Windows Versin 9.0.Gua del Usuario. Chicago:
SPSS.

SPSS (1993). SPSS Base para Windows Versin 6.0.Gua del Usuario. Chicago:
SPSS.

SPSS (1999). Grficos interactivos. CHICAGO: SPSS

SPSS (1997). Tablas de SPSS 7.5 CHICAGO: SPSS

SPSS (1997). Tablas de SPSS 7.5 CHICAGO: SPSS

SPSS (2004). SPSS 13.0 Base Manual del usuario. Chicago 2004

SPSS (20049. SPSS Tablas 13.0. Chicago 2004.

B. Visauta Vinacua (1997). Anlisis Estadstico con SPSS para Windows


Estadstica Bsica..- Ediciones McGraw-Hill

Pardo Merino, Antonio y Ruiz Das Miguel Angel (02002). SPSS 11. Gua para el
anlisis de datos

Ferrn Aranaz Magdalena (2002). Curso de SPSS para Windows. Ediciones


McGraw-Hill

Ferrn Aranaz Magdalena (2001). Curso de SPSS para windows. Anlisis


Estadstico. Ediciones McGraw-Hill

INEI (2001). Gua para la evaluacin de indicadores sociales de las encuestas de


hogares.

Lzaro William (2003). Introduccin al SPSS 11.0

Csar Prez (2005).Tcnicas Estadsticas con SPSS 12.

Pablo Valderrey Sanz (2010). Extraccin del conocimiento a partir del anlisis de
datos

114 | P g i n a

William W. Lzaro Apolaya: Introduccin al Anlisis Estadstico con SPSS 14.0

LABORATORIOS DESARROLLADOS

115 | P g i n a

You might also like