Professional Documents
Culture Documents
Departamento de Matemtica
TCNICAS ESTADSTICAS EN
APOYO A LA INVESTIGACION
Mdulo 1:
INTRODUCCIN AL ANLISIS
ESTADSTICO CON SPSS
INTRODUCCION
A pesar de los aos, la Estadstica sigue constituyndose en la herramienta
bsica, por no decir, imprescindible, en el desarrollo de toda investigacin,
sobre todo si se quiere que sta cumpla con el rigor cientfico.
La evolucin de la informtica, tambin ha permitido que se desarrollen
sistemas potentes para el anlisis de datos, uno de ellos es el SPSS, cuya
versatilidad y amabilidad con el usuario facilita su rpida aplicacin.
En aras de colaborar con la difusin del conocimiento, se ha desarrollado
este documento, que tiene como objetivo que los participantes del Curso de
Postgrado de Tcnicas Estadsticas en Apoyo a la Investigacin, que viene
desarrollando la Universidad Centroamericana Jos Simen Caas, a travs
de su Departamento de Matemtica, conozcan el manejo y aplicacin bsica
de este software en un corto tiempo.
El documento denominado Introduccin al Anlisis Estadstico con SPSS
14 contiene 15 captulos, habindose incluido como anexo diferentes tpicos
sobre Estadstica Bsica, as como el desarrollo de 3 laboratorios.
Adicionalmente, se presentan 3 tareas, que deben ser desarrolladas
individualmente, y que sern de utilidad para ir verificando el avance del
participante en el conocimiento y aplicacin del software.
Los ejemplos, que acompaan las diferentes explicaciones corresponden
fundamentalmente a bases de datos que contiene informacin sobre las
principales caractersticas demogrficas, educativas, laborales y de vivienda
de los jefes de hogar de un departamento del pas.
El autor
INDICE
Pg.
1.
1.1
1.2
1.3
1.4
1.5
VENTANAS.........................................................................................................................................1
MENUS...............................................................................................................................................4
BARRAS DE HERRAMIENTAS..........................................................................................................5
BARRA DE ESTADO..........................................................................................................................5
CUADROS DE DIALOGO...................................................................................................................6
2.
2.1
2.1.1
2.1.2
2.1.3
2.1.4
2.1.5
ABRIR UN ARCHIVO..........................................................................................................................8
TIPOS DE ARCHIVOS DE DATOS QUE RECONOCE SPSS ..........................................................9
OPCIONES DE ABRIR ARCHIVO EN HOJAS DE CALCULO Y ARCHIVOS
DELIMITADOS POR TABULADORES................................................................................................9
LECTURA DE HOJAS DE CALCULO EN EL EDITOR DE DATOS...................................................9
LECTURA DE ARCHIVOS DE dBASE EN EL EDITOR DE DATOS................................................ 11
LECTURA DE ARCHIVOS DELIMITADOS POR TABULADORES EN EL EDITOR DE DATOS..... 11
2.2
2.3
2.4
3.
EDITOR DE DATOS..........................................................................................................................24
3.1
3.2
3.3
4.
PREPARACION DE DATOS..............................................................................................................32
4.1
4.2
5.
5.1
5.2
5.3
5.4
CALCULAR VARIABLE.....................................................................................................................38
RECODIFICACION DE VALORES....................................................................................................40
CONTAR APARICIONES DE VALORES DENTRO DE CASOS......................................................41
RECODIFICACION AUTOMATICA...................................................................................................42
6.
MANIPULACION DE ARCHIVOS.....................................................................................................44
6.1
6.2
6.3
6.4
6.5
ORDENAR DATOS...........................................................................................................................44
SELECCIONAR CASOS...................................................................................................................45
SEGMENTAR ARCHIVO..................................................................................................................46
PONDERAR CASOS........................................................................................................................47
TRANSPONER.................................................................................................................................48
TAREA 1...49
6.6
ii
6.7
AGREGAR DATOS............................................................................................................................54
7.
FRECUENCIAS Y DESCRIPTIVOS...................................................................................................56
7.1
7.1.1
7.1.2
7.1.3
7.2
FRECUENCIAS..................................................................................................................................56
FRECUENCIAS: ESTADISTICOS.....................................................................................................56
FRECUENCIAS: GRAFICOS.............................................................................................................57
FRECUENCIAS: FORMATO..............................................................................................................57
DESCRIPTIVOS.................................................................................................................................60
8.
CUBOS OLAP....................................................................................................................................61
9.
EXPLORAR........................................................................................................................................63
TAREA 2...68
10.
10.1
10.2
11.
11.1
11.2
11.3
11.4
11.5
12.
12.1
12.2
TABLAS..............................................................................................................................................75
TABLAS PERSONALIZADAS............................................................................................................75
APLICACIN PRACTICA DE TABLAS PERSONALIZADAS............................................................85
13.
13.1
13.2
13.3
GRAFICOS.........................................................................................................................................91
CREACION DE UN GRAFICO...........................................................................................................91
EDICION DE GRAFICOS...................................................................................................................93
GENERADOR DE GRAFICOS.......93
14.
GRAFICOS INTERACTIVOS.............................................................................................................97
14.1
14.2
14.3
15.
TABLAS DE CONTINGENCIA.........................................................................................................103
15.1
15.2
TAREA 3.113
BIBLIOGRAFIA............................................................................................................................................114
ANEXO 1: LABORATORIOS DESARROLLADOS..115
ANEXO 2: ESTADISTICA BASICA149
iii
VENTANAS
Visor de borrador: En esta ventana los resultados se ofrecen a modo de borrador, en ella los resultados
se ofrecen a modo de texto en lugar de tablas pivote y los grficos como imgenes de metaarchivo en
lugar de objetos de grfico.
Visor: Es una ventana en la que aparecen todas las tablas, grficos y resultados estadsticos realizados
con el programa, los mismos que pueden ser editados y guardados para su utilizacin posterior. Hay
que tener presente que esta ventana se abre automticamente la primera vez que se ejecuta un
procedimiento que genera resultados (Ver figura 2).
1|Pg ina
2|Pg ina
Cambiar la ventana
designada
otros. Dentro de este men tambin se incluye los grficos interactivos, caracterizndose estos por
disponer de ms tipos de grficos como grficos de rea, grficos de barras apiladas o grficos de
mltiples variables, estos tambin comprenden ms funciones como lneas de referencia, ejes
secundarios, trazos en los diagramas de dispersin, mayor flexibilidad en la presentacin de claves y
mayor control en la presentacin de paneles, y tambin permite la obtencin de grficos a partir de
tablas pivote.
Utilidades: Este men se utiliza para obtener informacin completa sobre la base da datos, as como
para la edicin de procesos.
Ventana: Por medio de este men se puede ordenar, seleccionar y controlar atributos de las ventanas
abiertas.
? (Ayuda): Este men comprende las opciones temas (el mismo que proporciona acceso a las pestaas
Contenido, ndice, y buscar, que pueden emplearse para ubicar temas especficos de la ayuda), tutorial
(el que facilita una introduccin global ms detallada sobre los aspectos bsicos de SPSS) y asesor
estadstico (el mismo que puede ayudarle solicitndole informacin mediante preguntas simples,
utilizando un lenguaje no tcnico y ejemplos visuales que permitirn seleccionar las funciones bsicas
de los estadsticos y los grficos ms apropiados para sus datos).
1.3
BARRAS DE HERRAMIENTAS
Cada ventana de SPSS tiene su propia barra de herramientas, las mismas que se ubican debajo de la barra
de mens, y permite el acceso rpido y fcil a las funciones ms habituales. Debe tenerse presente que las
pistas proporcionan una breve descripcin de cada herramienta.
Por ejemplo, la ventana Editor de datos (ver figura 8) comprende la siguiente barra de herramientas:
Ver/Barras de herramientas
En el cuadro de dilogo Mostrar barras de herramientas, seleccionar las que se desee mostrar u ocultar.
1.4
5|Pg ina
1.5
CUADROS DE DIALOGO
Los cuadros de dilogo se emplean para seleccionar variables y opciones para el anlisis.
1.5.1
COMPONENTES: Un cuadro de dilogo (Ver figura 10) tiene los siguientes componentes:
a.
Lista de variables de origen: Es la lista de variables del archivo de datos de trabajo, aqu debemos
tener presente que las variables numricas se identifican con el smbolo almohadilla (#), y las
variables alfanumricas o de cadena se identifican por un icono con la letra A, y dentro de estas
ltimas, las variables de cadena corta (de 8 menos caracteres de longitud se identifican con el
signo menor que (<) del icono, en tanto que las de cadena larga (de ms de 8 caracteres de longitud
se identifican con el signo mayor que (>) del icono.
Para seleccionar una o ms variables en un cuadro de dilogo tengan presente lo siguiente:
b.
Una slo variable.- En este caso debe resaltar la variable en la lista de origen y pulsar el botn
flecha o hacer doble clic en la misma.
Ms de una variable alterna.- Pulse en la primera variable, luego pulse en la siguiente mientras
mantiene la tecla Ctrl pulsada.
Lista de variables
de origen
Lista de variables
de destino
Botones de
comando
6|Pg ina
c.
Botones de comando del cuadro de dilogo: Son aquellos que dan la instruccin al programa
para que se realice una accin. Si se desea informacin sobre los controles particulares de un
cuadro de dilogo, deber pulsar en l para realizar especificaciones adicionales.
En la mayora de cuadros de dilogo existen cinco botones de comandos estndar: aceptar, pegar,
restablecer, cancelar y ayuda.
d.
Botones del subcuadro de dilogo: Una caracterstica de los cuadros de dilogo es que ofrecen
normalmente la informacin mnima que se requiere para ejecutar un procedimiento. Precisamente
una funcin de los subcuadros de dilogo es realizar especificaciones adicionales, estos se
identifican por ir seguido de puntos suspensivos despus del nombre.
1.5.2
a.
b.
ABRIR UN ARCHIVO
Para abrir archivos de SPSS, de SYSTAT, de hojas de clculo, de DBASE o archivos de datos delimitados
por tabuladores, sin necesidad de convertirlos a un formato intermedio ni de introducir informacin sobre la
definicin de las variables, efecte lo siguiente:
Seleccione Archivo/Abrir... (del men principal de la ventana editor de datos)
Aparecer el cuadro de dilogo correspondiente (ver figura 13)
En Nombre del archivo puede
seleccionarse un archivo de la lista o
especificar una ruta y extensin distinta.
Por defecto SPSS muestra la relacin de
los archivos de su directorio con
extensin .sav
Buscar en el cual identifica la carpeta en
la que se ubica el archivo a seleccionarse
o seleccionado.
Archivos de tipo permite seleccionar
entre los distintos tipos de archivos de
datos. Tngase presente que por defecto
siempre se tendr la opcin SPSS (*.sav)
seleccionada.
Figura 13: Cuadro de dilogo de Archivo/abrir...
Pulse en Abrir
2.1.1
2.1.2
Leer los nombres de las variables.- Esta opcin permite leer los nombres de las variables de la
primera fila del archivo o de la primera fila del rango definido.
Rango: En los archivos de hoja de clculo, tambin es factible leer un rango de casillas, para lo cual
deber especificarse el rango correspondiente.
Para abrir archivos de este tipo hay que tener presente que las dimensiones de la base de datos en SPSS
son el nmero de filas (casos) y columnas (variables). No existen casillas vacas dentro de esta matriz de
filas por columnas y todas las celdas tienen un valor incluso si este valor est en blanco.
Para leer los datos de las hojas de clculo, en el caso de Excel de versiones anteriores a la versin 5, se
aplican las siguientes reglas:
Las filas son casos y las columnas son variables.
El tipo y ancho de los datos para cada variable es determinado segn la anchura de la columna y el tipo
de datos de la primera casilla de la columna (Ver figura 15).
En las variables numricas las casillas en blanco se convierten en valor perdido (el mismo que es
indicado por un punto). En las variables de cadena los espacios en blanco son valores de cadena
vlidos (ver figura 15).
De no leerse los nombres de variable de la hoja de clculo se utilizan las letras de las columnas
a,b,c,.....) como los nombres de variables de los archivos de Excel y Lotus.
9|Pg ina
Lectura de un archivo de hoja de clculo con nombre de variable y sin valores perdidos
Hoja de clculo
B.
Lectura de un archivo de hoja de clculo con nombre de variable, columna y valor perdido
Hoja de clculo
Valor de otro
tipo
C.
Nombre de variable en
blanco. Como se ve no es
incluida en el archivo SPSS
Perdido por el
sistema
Lectura de un archivo de hoja de clculo sin nombre de variable, columna vaca y valor perdido
Hoja de clculo
Valor de otro
tipo
D.
Perdido por el
sistema
Lectura de un archivo de hoja de clculo sin nombre de variable, columna vaca y valor perdido
Hoja de clculo
Variable de
cadena en blanco
Variable numrica
en blanco
Perdido por el
sistema
10 | P g i n a
2.1.4
En este caso, los valores pueden ser numricos o de cadena. El tipo y la anchura de los datos de cada
variable estn determinados por el tipo y ancho del primer valor de los datos de la columna. Los valores de
otro tipo se convierten en valor perdido por el sistema. Tngase presente tambin que si no se leen los
nombres de la variable del archivo, el programa les asigna por defecto v1, v2, v3 y as sucesivamente.
2.2
El archivo de texto se mostrar en una ventana de vista previa. Aqu existe la posibilidad de aplicar un
formato predefinido (guardado con anterioridad desde el asistente para la importacin de texto) o seguir los
pasos del asistente (usando la opcin Siguiente >), situacin que se observa en la figura 17.
11 | P g i n a
b.
Este segundo paso ofrece informacin sobre las variables, debiendo determinarse:
Si las variables son delimitadas o de anchura fija, es decir, determinar cmo estn organizadas sus
variables?
Ser delimitada cuando para separar las variables se utilizan espacios, comas, tabulaciones u otros
caracteres, de esta forma, las variables quedan registradas en el mismo orden para cada caso, pero
no necesariamente conservando la misma ubicacin para las columnas. Por el contrario, ser de
anchura fija cuando cada variable es registrada en la misma posicin de columna en el mismo
registro para cada caso del archivo de datos.
Si la primera fila del archivo contiene las etiquetas para cada variable, hay que tener presente que si
los nombres de las variables tienen ms de ocho caracteres se truncan.
12 | P g i n a
13 | P g i n a
d.
f.
En este paso se muestra la mejor suposicin del asistente para la importacin de texto sobre la forma de
leer el archivo de datos. De ah que sea necesario indicarse los caracteres o smbolos que separan los
valores, pueden seleccionarse cualquier combinacin de espacios, comas, signos de punto y coma,
tabulaciones o cualquier otro caracter.
Situacin se visualiza en la figura 22.
En este paso se controla el nombre de la variable, el formato de datos, as como las variables que se
incluirn en el archivo definitivo (ver figura 23).
Aqu tenga presente lo siguiente:
Para utilizar la opcin FORMATO DE DATOS primero seleccione una variable en la ventana y luego
escoja el formato (slo si es necesario). Entre las opciones de formato se encuentran: No importar
(omite la variable o variables seleccionadas del archivo de datos importado), Numrico (los valores
vlidos incluyen nmeros, los signos ms y menos iniciales y un indicador decimal), Cadena (son
valores vlidos todos los caracteres del teclado y los espacios en blanco incrustados), Fecha/hora,
Dlar (los valores vlidos son nmeros con un signo de dlar inicial optativo y puntos separadores
de millares tambin optativos, Coma (los valores vlidos son nmeros que emplean un punto para
separar decimales y una coma para separar millares) y Punto (los valores vlidos son nmeros que
emplean un coma para separar decimales y un punto para separar millares)
15 | P g i n a
Situacin se visualiza en la
figura 24.
16 | P g i n a
2.3
Mediante esta opcin podr leer cualquier tipo de base de datos para los que disponga de un controlador
ODBC. De esta forma se puede accesar a archivos de Excel 5, Access, DBASE, Foxpro, entre otros.
Para leer archivos de bases de datos con ODBC efecte lo siguiente:
Seleccione Archivo/Captura de bases de datos/Nueva consulta
Seleccionar el origen de los datos. Puede ser un formato de base de datos, un archivo de Excel o un
archivo de texto.
Seleccione el archivo de base de datos (en algunos archivos de bases de datos tendr que
introducir un nombre de acceso y una contrasea)
Seleccionar las tablas y los campos de datos.
Especificar cualquier relacin existente entre las tablas
Si el usuario deseas tiene la posibilidad de:
17 | P g i n a
Seleccionar datos
18 | P g i n a
En este segundo ejemplo se importarn bases de datos generadas en FoxPro. Los nombres de las
bases de datos a importarse son POBLA.DBF (que contiene informacin sobre algunas caractersticas
del hogar) y pob2004.dbf (que contiene informacin sobre cada uno de los miembros o personas que
conforman los hogares encuestados). La relacin entre ambas tablas ser determinada mediante la
variable Ficha.
Seleccionar origen de datos
19 | P g i n a
20 | P g i n a
21 | P g i n a
2.4
Este procedimiento se utilizar para guardar cualquier cambio que se realice en un archivo de datos abierto.
Seleccione la ventana del Editor de datos (para convertirla en la ventana activa)
Seleccionar Archivo/Guardar
El archivo de datos modificado se guarda y sobreescribe la versin anterior del archivo.
2.4.2
Figura 28: Guardar archivo de datos nuevo o guardar con formato distinto
22 | P g i n a
2.4.3
Para datos almacenados como un archivo de datos de SPSS, el cuadro de dilogo Guardar datos como:
Variables permite seleccionar las variables que desea guardar en el nuevo archivo de datos. Tenga
presente que por defecto, se almacenan todas las variables.
Bajo tal situacin, anule la seleccin de las variables que no desea guardar o pulse en Eliminar todo y, a
continuacin, seleccione aquellas variables que desea guardar.
Active la ventana del Editor de datos
Seleccionar Archivo/Guardar como...
Seleccione SPSS (*.sav) de la lista de tipos de archivos
Pulse en Variables y seleccione la (las) que va a guardar.
Anote un nombre de archivo para el nuevo archivo de datos.
Pulsar guardar
23 | P g i n a
3. EDITOR DE DATOS
El Editor de datos permite la creacin y edicin de archivos de datos. Esta ventana se abre
automticamente cuando se inicia una sesin en SPSS. Algunas de sus caractersticas (ver figura 30) son:
Las filas representan casos
Las columnas representan variables
La casilla es la interseccin del caso y la variable, las mismas que solo contienen valores de datos.
Las dimensiones del archivo estn dadas por el nmero de casos y de variables, de esta forma es
factible introducir datos en cualquier casilla. Al introducir datos en una casilla fuera de los lmites del
archivo definido, ste se ampliar para incluir todas las filas y columnas situadas entre esa casilla y los
lmites del archivo. No hay casillas vacas en los lmites del archivo de datos, de tratarse de variables
numricas stas se convierten en valor perdido, pero si se trata de variables de cadena, un espacio en
blanco se considera como vlido.
Variable
Caso
Casillas
La ventana editor de datos presenta en la parte inferior dos pestaas: la primera (vista de datos) pertenece
a la ventana de datos propiamente dicha, en la misma, los datos se introducen y se manipulan de la misma
manera y con las mismas opciones de copiado, pegado, etc., que en cualquier otro programa de sistema
operativo Windows. La segunda pestaa (vista de variables) es ms y novedosa, ya que da acceso a una
24 | P g i n a
hoja de captura de datos, en la cual se definen las variables a utilizar, as como sus caractersticas
principales: tipo, anchura, decimales, etiqueta, valores, medida, etc.
Los pasos que se siguen para definir una variable en la pestaa vista de variables son:
Introduzca el nombre de la variable (este primer paso, slo cuando se est creando una base de datos
en SPSS).
Definir el tipo
Definir anchura y nmero de decimales
Definir etiquetas
Definir valores
Definir valores perdidos (si es necesario)
Definir tamao de la columna y la alineacin
Definir medida
Adems de la definicin de propiedades de variables en la vista Variable, existen otros dos procedimientos
para definir las propiedades de variables: El Asistente para la copia de propiedades de datos, y, la opcin
Definir propiedades de variables.
Por defecto el programa asigna el prefijo var seguido de un nmero de cinco dgitos, el mismo que puede
ser cambiado introduciendo el nuevo. Para los nombres de las variables se debe cumplir los requisitos
siguientes:
25 | P g i n a
3.1.2
Deben comenzar por una letra Los dems caracteres pueden ser letras, dgitos, puntos o los
smbolos @, #, _ $.
No pueden terminar en punto.
No pueden contener espacios en blanco ni caracteres especiales (!, ?, y *)
Se deben evitar los nombres de variable que terminan con subrayado, esto evitar conflictos con las
variables creadas automticamente por algunos procedimientos.
La longitud del nombre no debe exceder los 64 bytes, esto equivale en el caso del idioma espaol a
64 caracteres.
No puede haber dos nombres de variables repetido.
Cada nombre de variable debe ser nico; no se permiten duplicados.
No se pueden utilizar como nombres de variables las palabras reservadas (ALL, AND, BY, EQ, GE,
GT, LE, LT, NE, NOT, OR, TO, WITH).
Los nombres de variable se pueden definir combinando de cualquier manera caracteres en
maysculas y en minsculas, esta distincin entre maysculas y minsculas se conserva en lo que
se refiere a la presentacin.
Definir tipo de variable
Por defecto el programa asume que todas las variables nuevas son numricas. Esta opcin se emplea para
cambiar el tipo de datos. El contenido del cuadro de dilogo depende del tipo de dato seleccionado, para
algunos de ellos hay cuadros de texto para el ancho y el nmero de decimales, para otros hay que
seleccionar un formato de una lista desplegable de ejemplos.
En este mismo cuadro de dilogo se define la ANCHURA y el nmero de cifras DECIMALES, este ltimo
slo si le corresponde.
3.1.3
Definir etiquetas
Esta opcin permite etiquetar la variable (etiqueta descriptiva de variable). Estas pueden tener hasta 256
caracteres.
3.1.4
Definir valores
Esta opcin permite asignar un nombre a cada valor de la variable (etiqueta descriptiva de valor). Estas
pueden tener hasta 60 caracteres. Hay que tener presente que las etiquetas de valor no estn disponibles
para las variables de cadena larga.
Utilice \n cuando quiera dividir la etiqueta, en este caso, debe colocarla en el punto de la etiqueta en la que
busca se divida.
3.1.5
Permite definir los datos especificados como perdidos por el usuario. Estos valores aparecen marcados para
un tratamiento especial y se excluyen de la mayora de clculos.
Tal como se visualiza en la figura 34, se pueden introducir hasta tres valores perdidos individuales de tipo
discreto, un rango de valores perdidos o un rango ms un valor de tipo discreto.
27 | P g i n a
Se emplea esta opcin para controlar el ancho de columnas y la alineacin de los valores de datos. Hay que
tener presente que los formatos de columna afectan slo la presentacin de datos en el editor de datos, es
decir, al variar el ancho de columna no vara el ancho definido de la variable.
3.1.7
Aqu hay que determinar si la variable es de escala (datos numricos de una escala de intervalo o de
razn), ordinal (datos cuyos valores representan categoras con algn orden intrnseco) y nominal (datos
cuyos valores representan categoras que no guardan un orden intrnseco), estos dos ltimos pueden ser de
cadena (alfanumricos) o numricos.
EDICION DE DATOS
Con el editor de datos es posible modificar un archivo de datos de muchas maneras, entre las cuales se
tiene:
Cambiar valores de datos
Cortar, copiar y pegar valores de datos
Insertar nuevos casos
Buscar datos
3.3.2
3.3.6
El tipo de datos de una variable es factible de ser cambiado, para lo cual deber ingresarse al cuadro de
dilogo Definir tipo de variable.
3.3.8
Ir a caso
3.3.9
Buscar dato
31 | P g i n a
4. PREPARACION DE DATOS
En este captulo se detalla un conjunto de funciones de preparacin inicial de los datos antes de entrar al
anlisis, entre estas se incluyen:
4.1
Asignar propiedades de las variables que describan los datos y definir cmo se deben tratar ciertos
valores.
Identificar aquellos casos que pueden contener informacin duplicada y excluir de los anlisis o
eliminarlos del archivo de datos.
Crear nuevas variables con algunas categoras distintas que representen rangos de valores de
variables que tengan un mayor nmero de valores posibles.
PROPIEDADES DE LAS VARIABLES
Todas las propiedades de variables se pueden asignar en la Vista de Variables del Editor de datos (tal como
se vio en el acpite 3.1). Sin embargo, en esta versin, existen dos opciones que les pueden facilitar este
proceso:
Definir propiedades de variables, opcin que le permite definir etiquetas de valor descriptivas y valores
perdidos. Esto es especialmente til para datos categricos (nominales u ordinales) con cdigos numricos
utilizados para valores de categoras.
Copiar propiedades de datos, opcin que le ofrece la posibilidad de utilizar un archivo de datos con
formato SPSS como plantilla para definir las propiedades de variables y archivos en el archivo de datos
actual.
4.1.1
Explorar los datos reales y enumerar todos valores de datos nicos para cada variable
seleccionada.
Identificar valores sin etiquetas y ofrece una funcin de etiquetas automticas.
Copiar etiquetas de valor definidas de otra variable en la variable seleccionada o de la variable
seleccionada a varias variables adicionales.
Nota: Para utilizar Definir propiedades de
variables sin explorar primero los casos,
introduzca 0 para el nmero de casos que
se van a explorar.
El procedimiento a ejecutar es el siguiente:
Seleccione Datos/Definir Propiedades
de Variables
Seleccione las variables numricas o de
cadena corta para las que desea crear
etiquetas de valor o definir o cambiar otras
propiedades de las variables, como los
valores perdidos o las etiquetas de variable
descriptivas.
Especificar el nmero de casos que se
van a explorar para generar la lista de
valores nicos.
Figura 39: Cuadro de Dilogo Definicin de
propiedades de variable
32 | P g i n a
33 | P g i n a
Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.
4.1.2
A partir de esta opcin es factible utilizar un archivo de datos de SPSS como plantilla para definir las
propiedades de las variables y del archivo del archivo de datos de trabajo. De la misma forma, es factible
utilizar las variables del archivo de datos de trabajo como plantillas para el resto de las variables del archivo
de datos de trabajo.
En general, el uso de esta opcin les permite:
4.2
Esta opcin permite crear variables nuevas, a partir de la agrupacin de los valores contiguos (o categoras)
de las variables existentes, para dar lugar a un nmero limitado de categoras diferentes.
En general esta opcin permite:
34 | P g i n a
35 | P g i n a
Intervalos de igual amplitud. Genera categoras de igual amplitud (por ejemplo, 15, 610, 1115,
etc.), esto se determina sobre la base de dos de los tres criterios siguientes:
Posicin del primer punto de corte. Valor que define el lmite superior de la categora inferior.
Nmero de puntos de corte. El nmero de intervalos es el nmero de puntos de corte ms uno.
Por ejemplo, 5 puntos de corte generan 6 intervalos.
Amplitud. La amplitud de cada intervalo. Por ejemplo, el valor 3 categorizar la variable Edad en
intervalos de 3 aos de edad.
b.
Percentiles iguales basados
en los casos explorados. Genera
intervalos con un nmero igual de
casos en cada categora, esto
se determina sobre la base de uno de
los criterios siguientes:
Nmero de puntos de corte. El
nmero de intervalos es el nmero
de puntos de corte ms uno. Por
ejemplo, cuatro puntos de corte
generan
cinco
categoras
percentiles (quintiles), conteniendo
cada una el 20% de los casos.
% de casos. Amplitud de cada
intervalo, expresado en forma de
porcentaje sobre el nmero total
de casos. Por ejemplo, el valor 25
generara cuatro categoras (tres
puntos de corte), conteniendo
cada una el 25% de los casos.
Figura 44: Cuadro de dilogo Crear puntos de corte
c.
Para este ejemplo se ha hecho uso del archivo BD_DPTO.SAV y se han definido quintiles para la variable
APROBA1, que est referido al grado de escolaridad alcanzado por cada persona
36 | P g i n a
37 | P g i n a
Calcular variable
Recodificacin de valores
Contar apariciones de valores dentro de los casos
Categorizar variables
Recodificacin automtica
Funciones aritmticas
Funciones estadsticas
Funciones de cadena
Funciones de distribucin
38 | P g i n a
Como se observa en la figura 46, en la variable de destino se ha anotado la nueva variable que se est
generando GASTOPER. Como expresin numrica se anot GASTOHOG/MIEMH. De la misma forma, se
abri el cuadro de dilogo Tipo y etiqueta para anotar como etiqueta Gasto per cpita del hogar.
Con el mismo ejemplo anterior, imagnense que se quiere obtener el Gasto per cpita del hogar slo
de los hogares del rea rural (REA = 0), entonces adems del proceso anterior deber activarse el
cuadro de dilogo Si los casos
39 | P g i n a
5.2
RECODIFICACION DE VALORES
Esta funcin permite modificar los valores de las variables recodificndolos, situacin que es de gran utilidad
para agrupar o combinar categoras. El resultado de la recodificacin puede guardarse en la misma variable,
sustituyendo de esta forma los valores originales o crear una nueva variable.
5.2.1
En este caso se reasigna los valores de las variables existentes o se agrupa rangos de valores existentes
en nuevos valores para la misma variable. Hay que tener presente que se puede recodificar variables
numricas y de cadena, adems, si se seleccionan mltiples variables, todas deben ser del mismo tipo.
Para recodificar en las mismas variables efecte lo siguiente:
Seleccione Transformar/Recodificar/En las mismas variables...
Seleccione la variables que desee recodificar, si se selecciona ms de una variable, estas deben ser
del mismo tipo.
Pulse en valores Antiguos y nuevos, especificando como deben recodificarse los valores.
Activar el cuadro de dilogo Si los casos cuando el usuario quiere establecer una expresin
condicional, de modo que la nueva variable sea recodificada slo para aquellos casos que cumplan
con la condicin.
Veamos ahora con un ejemplo como funciona esta opcin:
Como se observa en la figura 48, en el set Variables se anot la variable R107 (variable a recodificar), en
tanto que en la figura 49 se observan los dos grupos especificados para recodificar dicha variable.
5.2.2
En este caso se reasignan los valores de variables existentes o agrupa rangos de valores existentes en
nuevos valores para una nueva variable.
Para recodificar en distintas variables efecte lo siguiente:
Seleccione Transformar/Recodificar/En distintas variables...
Seleccione la variables que desee recodificar, si se selecciona ms de una variable, estas deben ser
del mismo tipo.
Anote el nombre y etiqueta de la nueva variable y pulse en Cambiar
Pulse en valores Antiguos y nuevos, especificando como deben recodificarse los valores.
Activar el cuadro de dilogo Si los casos cuando el usuario quiere establecer una expresin
condicional, de modo que la nueva variable sea recodificada slo para aquellos casos que cumplan
con la condicin.
Veamos ahora con un ejemplo como funciona esta opcin:
Este cuadro de dilogo crea una variable que contabiliza las apariciones del mismo valor o valores en una
lista de variables para cada caso. Para ejecutar esta opcin efecte lo siguiente:
41 | P g i n a
RECODIFICACION AUTOMATICA
Esta opcin realiza la misma funcin que Recodificar variables, la diferencia estriba en que el usuario no es
quien asigna los antiguos y nuevos valores, sino que el mismo programa los asigna en valores enteros
consecutivos. La nueva variable o variables creadas mantienen cualquier variable definida y las etiquetas de
valor de la variable antigua. Al final, en el visor, una tabla muestra los valores antiguos, los nuevos y las
etiquetas de valor. Hay que tener presente, en el caso de valores de cadena, que estos se recodifican por
orden alfabtico, con las maysculas antes que las minsculas.
Para ejecutar esta opcin efecte lo siguiente:
42 | P g i n a
6. MANIPULACION DE ARCHIVOS
Los archivos de datos no siempre estn organizados de la forma que nos resulte adecuada, de ah que el
SPSS ofrezca una serie de opciones para combinar archivos de datos, organizar los datos en un orden
diferente, seleccionar submuestras de casos o cambiar la unidad de anlisis agrupando casos.
En este captulo se utilizarn las siguientes opciones: Ordenar datos, seleccionar casos, segmentar archivo,
ponderar casos, transponer casos y variables, fusin de archivos de datos y agregar datos.
6.1
ORDENAR DATOS
Esta opcin permite ordenar todos los casos del archivo basndose en los valores de una o ms variables
de ordenacin. Estos pueden ser ordenados en forma ascendente o descendente.
Para ejecutar esta opcin efecte lo siguiente:
Seleccione Datos/Ordenar casos...
Seleccione una o ms variables de
ordenacin
En la figura 57 se
observa
cmo
queda el archivo
de
datos
al
ordenar
la
informacin por
SEXO y EDAD.
Los casos han
sido ordenados
por EDAD dentro
de cada categora
de la variable
SEXO.
44 | P g i n a
6.2
SELECCIONAR CASOS
El SPSS proporciona varios mtodos para seleccionar un subgrupo de casos, basndose en ciertos criterios
que incluyen variables y expresiones condicionales, en una muestra aleatoria de casos, en un rango o en
una variable criterio especfica.
Es importante mencionar que una vez que se define el criterio de seleccin, es necesario decidir que hacer
con los datos no seleccionados, pudiendo ser filtrados o eliminados, en la primera situacin se filtran los
casos no seleccionados pero no desaparecen del archivo de datos, al seleccionar la opcin Seleccionar
todos los casos vuelven a aparecer en el archivo, por el contrario, en la segunda situacin se eliminan los
datos no seleccionados del archivo (la nica forma de recuperarlos es no guardando el archivo de datos).
Las opciones que aparecen en este cuadro de dilogo son las siguientes:
Seleccionar todos los casos, se utilizarn todos los casos del archivo en los anlisis que se realicen.
Seleccionar casos que cumplen una condicin, al pulsar en el botn S...se abre un cuadro de
dilogo en la que se anotar una expresin condicional. En el anlisis sern incluidos slo aquellos
casos que cumplen tal condicin.
Muestra aleatoria de casos, al pulsar el botn Muestra... se abre un cuadro de dilogo en el que se
puede especificar el porcentaje de casos aproximado a incluirse en la muestra o bien el nmero de
casos exacto que debe incluirse.
Basados en rango de tiempo o de casos, al entrar en esta opcin deber anotar el primer caso y
ltimo caso a incluir.
Usar variable de filtro, en este caso la variable debe ser numrica, incluyndose slo aquellos casos
que tengan un valor diferente de cero o del valor perdido para la variable seleccionada.
Veamos ahora con un ejemplo como funciona esta opcin:
En la figura 58 se puede observar el procedimiento para la seleccin de aquellos casos en los que la
variable R104 = 2 (sexo FEMENINO) y R103 = 1 (relacin de parentesco JEFE DE HOGAR) del archivo
POBLA.SAV, y en el que adems, los casos no seleccionados sean filtrados.
SEGMENTAR ARCHIVO
Esta opcin permite dividir el archivo de datos en distintos grupos, en base a los valores de una o ms
variables de agrupacin, el mismo que se utilizar en todos los anlisis posteriores.
Para segmentar un archivo de datos efecte lo siguiente:
Seleccionar Datos/Segmentar archivo...
Seleccionar Comparar grupos (en este caso los grupos de segmentacin se presentan juntos para
poder compararlos) u organizar los resultados por grupos (los resultados de cada procedimiento son
presentados por separado).
Seleccione una o ms variables de
agrupacin
Seleccione
ordenar
archivo
segn
variables de agrupacin (cuando el
archivo an no ha sido ordenado) o el
archivo ya est ordenado.
Veamos ahora con un ejemplo como funciona
esta opcin:
PONDERAR CASOS
Si cada fila del archivo de datos representa ms de un caso puede especificarse un factor de ponderacin,
hay que tener presente que al aplicar una variable de ponderacin, sta permanecer activada hasta que se
seleccione una nueva variable o se desactive la ponderacin.
Para ponderar casos efecte lo siguiente:
Seleccionar Datos/Ponderar casos...
Seleccionar Ponderar casos mediante
Seleccionar una variable de frecuencia
47 | P g i n a
6.5
TRANSPONER
Esta opcin permite crear un nuevo archivo de datos en el que se transponen las filas y las columnas del
archivo original, de esta forma las filas se convierten en variables y las variables en casos. Puede
seleccionarse una, varias o todas las variables para transponer.
En el nuevo archivo generado se crea automticamente una variable de cadena CASE_LBL, que contiene
los nombres originales de la variable
Para ejecutar esta opcin efecte lo siguiente:
Seleccione Datos/Transponer...
Seleccione una o ms variables que
desee transponer en casos.
48 | P g i n a
2.
Etiqueta
Relacin de parentesco
R104
Sexo
R106
Edad
R107
Estado familiar
R108A
R108
FAC01
Valores
Jefe
Esposa(o), compaera(o)
Hijo(a)
Padre / Madre
Hermano(a)
Yerno / Nuera
Nieto (a)
Suegro (a)
Otros Familiares
10
11
Otros
Hombre
Mujer
Edad
Acompaado (a)
Casado (a)
Viudo (a)
Divorciado (a)
Separado (a)
Soltero (a)
ISSS Cotizante
ISSS Beneficiario
ISSS Retirado
Bienestar Magisterial
IPSFA
Colectivo
Individual (Privado)
No tiene
Otros
Algn sntoma
Alguna enfermedad
No tuvo
Factor de expansin
49 | P g i n a
4.
Hasta 4
5 a 14
15 a 24
25 a 34
35 a 44
45 a 54
55 a 64
65 a 74
75 y ms
Con pareja
Sin pareja
7.
6.6
Permite unir los datos de dos archivos, presentndose dos opciones: Unir archivos con las mismas variables
pero casos diferentes (Aadir casos) o unir archivos con los mismos casos pero variables diferentes (Aadir
variables).
6.6.1
AADIR CASOS
En este caso se unen dos archivos de datos que contienen las mismas variables pero diferentes casos.
Para aadir casos efecte lo siguiente:
Abrir uno de los archivos da datos.
Seleccionar Fundir archivos/Aadir casos...
Seleccione el archivo de datos que desea unir con el archivo abierto
Elimine las variables que no desee incluir de la lista Variables en el nuevo archivo de datos, para lo
cual deber seleccionar la variable en la lista y pulsar botn flecha
, la variable pasar a la
lista de Variables desemparejadas.
Aada pareja de variables de la lista Variables desemparejadas que representan la misma informacin
registrada con nombres diferentes en los dos archivos. En este caso, deber pulsar en una de las
variables en la lista se variables desemparejadas, luego mantenga pulsada la tecla Ctrl mientras
selecciona la otra variable de la lista con el ratn, finalmente pulse CASAR para que stas se
desplacen a la lista de Variables en el nuevo archivo de datos de trabajo.
51 | P g i n a
6.6.2
AADIR VARIABLES
Con la opcin Aadir variables se podr: Unir los archivos de datos que contengan los mismos casos pero
variables diferentes o utilizar un archivo de tabla de claves o de referencia para aadir los datos de cada
caso a varios casos de otro archivo.
Para tal efecto, debe cumplir con los siguientes requisitos:
Caso 1: Archivos que contienen los mismos casos pero variables diferentes. Para esto se va a unir el
archivo JHOGAR.SAV (que contiene informacin de los jefes de hogar) con el archivo VIVIENDA.SAV (que
contiene informacin sobre las viviendas en la que habitan los jefes de hogar)
Para aadir variables efecte lo siguiente:
Abrir uno de los archivos da datos
(JHOGAR.SAV).
Seleccionar Fundir archivos/Aadir
variables...
Seleccione el archivo de datos que desea
unir con el archivo abierto, con esta accin
concluira la fusin (VIVIENDA.SAV).
Seleccione las variables clave en la lista
de variables excluidas.
Seleccione Emparejar los casos en las
variables clave para los archivos
ordenados.
Aada las variables a la lista Variable
clave
Seleccione Ambos archivos facilitan casos
Luego, Aceptar
52 | P g i n a
Caso 2: Archivos en el que uno de ellos es una de tabla de claves o de referencia para aadir los datos de
cada caso a varios casos del otro archivo.
Para esto se va a unir el archivo POBLA.SAV (que contiene informacin de las personas de un determinado
departamento) con el archivo VIVIENDA.SAV (que contiene informacin sobre las viviendas en la que estos
habitan)
53 | P g i n a
6.7
AGREGAR DATOS
Esta opcin permite agrupar casos de un archivo de datos basndose en los valores de una variable de
agrupacin, de esta forma se genera un nuevo archivo que contiene un caso para cada grupo.
Para agregar datos efecte lo siguiente:
Seleccionar Datos/Agregar...
Seleccione una o ms variables de segmentacin, aqu hay que tener presente que cada combinacin
nica de estos factores define un grupo y por lo tanto genera un caso en le nuevo archivo agregado.
Seleccione una o ms variables numricas para incluirlas en el nuevo archivo de datos. Hay que tener
presente que por defecto Agregar datos crea automticamente los nombres de las variables
agregadas, sin embargo estos pueden ser modificados por el usuario, para lo cual deber resaltarse la
variable en la lista Agregar variables y luego pulsar en Nombre y Etiqueta. Tambin es factible crear
una variable que contenga el nmero de casos en cada grupo.
Seleccione una funcin de agregacin para cada variable agregada. Hay que tener presente que por
defecto la funcin de agregacin es la media de los valores, sin embargo, sta pueden ser cambiada
por el usuario, para lo cual deber resaltarse la variable en la lista Agregar variables y luego pulsar en
Funcin1.
Definir el almacenamiento de los resultados agregados.
En este ltimo caso puede aadir variables agregadas al archivo de datos de trabajo o crear un archivo de
datos agregados nuevo.
Las nuevas variables basadas en las funciones de agregacin se aaden al archivo de datos de trabajo. El
propio archivo de datos no se agrega. Cada caso con los mismos valores en las variables de segmentacin
recibe los mismos valores en las nuevas variables agregadas.
Crea un nuevo archivo de datos con los datos agregados. Por defecto, se guarda un archivo denominado
aggr.sav en el directorio actual.
Las funciones desagregacin incluyen: Funciones de resumen, porcentaje o fraccin de los valores por encima o debajo de un va lor
especificado, porcentaje o fraccin de los valores dentro o fuera de un rango especificado.
54 | P g i n a
Figura 71: Base de datos aggr.sav generada a partir del proceso de agregacin
55 | P g i n a
7. FRECUENCIAS Y DESCRIPTIVOS
7.1
FRECUENCIAS
FRECUENCIAS: ESTADISTICOS
Cuartiles: Divide las observaciones en cuatro grupos de igual tamao (calcula los percentiles
25, 50 y 75).
Puntos de corte para n grupos iguales: Muestra los valores de la variable que dividen la
muestra en grupos de casos de igual tamao.
Percentiles: mediante esta opcin es factible especificar percentiles individuales, por ejemplo el
percentil 95 muestra el valor por debajo del cual se encuentra el 95% de las observaciones.
FRECUENCIAS: GRAFICOS
7.1.3
FRECUENCIAS: FORMATO
Esta opcin permite ordenar la tabla de frecuencias segn los valores de la variable o las frecuencias y en
orden ascendente o descendente.
De la misma forma, cuando se genera
tablas de frecuencias para mltiples
variables es factible presentar todas las
variables en una sola tabla (comparar
variables) o bien en forma independiente
para cada variable (organizar resultados
segn variables).
Figura 75: Cuadro de dilogo Frecuencia: Formato
57 | P g i n a
Tambin existe un comando que permite suprimir aquellas tablas que contengan ms categoras que le
nmero especificado.
Veamos ahora con un ejemplo como funciona esta opcin:
Pobreza
Total
Pobreza extrema
Pobreza relati va
No pobre
Frecuenci a
148525
17562
38336
92627
Porcentaje
100.0
11.8
25.8
62.4
58 | P g i n a
Supongamos que en base a la informacin del archivo POBLA.SAV se desea determinar los
siguientes estadsticos: quintiles, medidas de tendencia central, de dispersin y de distribucin de la
variable R106 (edad) de la poblacin de 14 a 29 aos. Para graficar utilice el histograma con curva
normal.
Esta dsticos
Ed ad
N
Vli dos
Per did os
Media
Er ro r tp. d e la med ia
Mediana
Moda
Desv. tp .
Var ianza
Asimetr a
Er ro r tp. d e asimetr a
Cur tosis
Er ro r tp. d e cur tosis
Rango
Mnimo
Mximo
Per centil es
20
40
60
80
2207
0
20.33
.095
20.00
14
4.483
20.098
.315
.052
-1.042
.104
15
14
29
16.00
18.00
21.00
25.00
59 | P g i n a
7.2
DESCRIPTIVOS
Guardar en variables los valores tipificados (puntuaciones z) de las variables seleccionadas, las
mismas que se aaden a los datos del Editor de datos.
Decidir si los resultados a obtenerse se ordenaran por el tamao de sus medias (ascendente o
descendente), alfabticamente o por el orden en el que se seleccionaron las variables (valor por
defecto)
Supongamos que del archivo JEFE_HOGAR.SAV se desea obtener los estadsticos descriptivos de
las variables INGFA (ingreso mensual del hogar), MIEMH (nmero de miembros del hogar) y
GASTOHOG (gasto mensual del hogar). En la figura 78 se presenta las opciones a utilizar y los
resultados obtenidos.
Estadsticos descriptivos
INGFA
Total de Miembros del Hogar
Gasto del Hogar
N vlido (segn lista)
N
148525
148525
148525
148525
Mnimo
11.25
1
17.82
Mximo
4533.50
18
3803.58
Media
447.7279
3.75
331.6462
Desv. tp.
461.40429
1.940
282.46751
Varianza
212893.92
3.762
79787.896
60 | P g i n a
8. CUBOS OLAP
El procedimiento Cubos OLAP (siglas del ingls On-Line Analytic Processing, Procesamiento analtico
interactivo) calcula totales, medias y otros estadsticos univariados para variables de resumen continas
dentro de las categoras de una o ms variables categricas de agrupacin. En la tabla se crear una nueva
capa para cada categora de cada variable de agrupacin.
Ejemplo. El total y el promedio de ventas para diversas regiones y lneas de producto, dentro de las
regiones.
Para obtener estadsticos descriptivos efecte lo siguiente:
Seleccionar Analizar/Informes/Cubos OLAP...
Seleccionar una o ms variables de resumen continuas
Seleccionar una o ms variables de agrupacin categricas
Si el usuario desea tiene la posibilidad de:
Calcular las diferencias entre pares de variables y pares de grupos definidos por una
variable de agrupacin (pulsar en Diferencias)
Incluye: Suma, nmero de casos, media, mediana, mediana agrupada, error tpico de la media, mnimo, mximo, rango, valor de l a
variable para la primera categora de la variable de agrupacin, Valor de la variable para la ltima categora de la variable de
agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de casos
totales, porcentaje de la suma total, porcentaje de casos totales dentro de las variables agrupadas, porcentaje de la suma total dentro
de las variables agrupadas, media geomtrica y media armnica.
61 | P g i n a
Edad
GRADOS APROBADOS
Hombre Edad
GRADOS APROBADOS
Mujer
Edad
GRADOS APROBADOS
N
148525
148525
97249
97249
51276
51276
Media
48.50
5.57
47.10
5.92
51.15
4.92
Desv. tp.
16.379
4.775
16.117
4.784
16.544
4.689
Area
Total
N
148525
97249
51276
47652
35377
12275
100873
61872
39001
148525
97249
51276
47652
35377
12275
100873
61872
39001
Media
48.50
47.10
51.15
48.74
47.78
51.49
48.38
46.71
51.04
5.57
5.92
4.92
2.96
3.21
2.23
6.81
7.47
5.77
Desv. tp.
16.379
16.117
16.544
16.757
16.422
17.397
16.196
15.927
16.265
4.775
4.784
4.689
3.162
3.207
2.910
4.908
4.848
4.821
62 | P g i n a
9. EXPLORAR
El procedimiento Explorar genera estadsticos de resumen y representaciones grficas, bien para todos los
casos o bien de forma separada para grupos de casos. Este procedimiento es til para:
Verificar los datos, identificar valores extremos o atpicos, obtener descripciones, comprobar
supuestos y caracterizar diferencias entre grupos de casos. Esta verificacin adquiere importancia
en tanto puede mostrar la existencia de valores inusuales, valores extremos, discontinuidad en los
datos, etc.
Determinar si las tcnicas estadsticas que est empleando para el anlisis son adecuadas.
A partir de la variable INGPE (Ingreso per cpita del hogar) del archivo JEFE_HOGAR.SAV
determinar slo los estadsticos que genera el procedimiento Explorar (ver figura 81).
63 | P g i n a
Vlidos
N
Porcentaje
1887
100.0%
INGPE
Casos
Perdidos
Porcentaje
0
.0%
Total
N
Porcentaje
1887
100.0%
Descriptivos
INGPE
Media
Interv alo de conf ianza
para la media al 95%
Estadstico
112.9801
107.7560
INGPE
118.2043
Media recortada al 5%
Mediana
Varianza
Desv . tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Esti madores-M
Error tp.
2.66370
97.0817
79.1700
13388.876
115.71031
1.41
1376.34
1374.93
87.89
3.609
20.579
Estimador-M
a
de Huber
85.6213
Biponderado
b
de Tukey
77.7142
Estimador-M
c
de Hampel
83.8145
Onda de
d
Andrews
77.5999
.056
.113
INGPE
May ores
Menores
1
2
3
4
5
1
2
3
4
5
Nmero
del caso
1887
1084
1886
1885
1884
1
2
3
4
5
Valor
1376.34
1133.38
954.17
915.00
912.50
1.41
2.85
5.17
6.00
8.25
Percentil es
5
Promedio
ponderado(def inicin 1)
INGPE
Bisagras de Tukey
INGPE
20.0000
10
27.6300
25
Percentiles
50
75
90
95
47.3300
79.1700
135.2200
224.5120
313.5580
47.3300
79.1700
135.1800
En este segundo ejemplo, a partir de las variables INGPE (ingreso per cpita del hogar), GASPER
(gasto per cpita del hogar) y AREA (mbito geogrfico como factor) del archivo
JEFE_HOGAR.SAV obtener los grficos de tallo y hojas, los grficos con pruebas de normalidad y
los diagramas caja, estos ltimos con la opcin niveles de los factores juntos (Ver figura 82).
64 | P g i n a
INGPE
GASPER
Area
Rural
Urbana
Rural
Urbana
Kolmogorov -Smirnov
Estadst ico
gl
Sig.
.180
1084
.000
.177
803
.000
.182
1084
.000
.151
803
.000
Estadst ico
.657
.717
.717
.799
Shapiro-Wilk
gl
1084
803
1084
803
Sig.
.000
.000
.000
.000
Se rechaza la hiptesis de normalidad cuando el nivel crtico (Sig.) es menor que el nivel de significacin establecido (generalmente
0.05).
66 | P g i n a
Respecto a los casos extremos, en el ejemplo que se presenta, son varios los valores que estn alejados
entre 1.5 y tres veces el rango intercuartil (representados mediante un crculo4, en el que se indica el
nmero de caso que en el que se ubica dicho dato).
Aquellos casos con valores alejados ms de tres veces el rango intercuartil desde el extremo superior o inferior de la caja estn
representados con un *.
67 | P g i n a
2.
Use el procedimiento Agrupacin Visual para recodificar la variable EDAD (R106) como JH_GEDAD
(grupos de edad) en las siguientes categoras
Menos de 24.1
25 a 342
35 a 443
45 a 544
55 a 645
65 a 746
75 y ms.7
Al archivo JHOGAR.SAV aada las variables del archivo VIVIENDA.SAV, luego calcule el nivel de
hacinamiento de estos hogares. Este nuevo archivo gurdelo como FAMILIA.SAV
Nivel de hacinamiento (NHACI): Es el cociente entre el nmero de miembros del hogar (MIEMH) y el
nmero de habitaciones (R305). Cuando el resultado de esta operacin es mayor que 3, se
considera que el hogar est hacinado
4.
Comente el nivel de hacinamiento (NHACI) y el nivel de pobreza (NIV_POB) por rea geogrfica
(AREA)
5.
Cul es la edad promedio (R106) de los jefes de hogar. Tambin, determine los estadsticos:
Mediana, moda, desviacin estndar, varianza, as como el histograma correspondiente. Comente
los resultados obtenidos
6.
7.
Calcule quintiles para la variable INGRESO PER CAPITA (INGPE). Luego determine para cada
quintil el NIVEL DE ESCOLARIDAD (APROBA1). Comente los resultados obtenidos.
8.
Utilice el procedimiento Descriptivos para la variable GASTO PER CAPITA DEL HOGAR
(GASPER). Comete los resultados obtenidos.
9.
10.
Utilice la opcin Explorar para analizar la variable NIVEL DE ESCOLARIDAD (APROBA1), utilice los
submens Estadsticos y Grficos y como factor AREA. Comente los resultados.
68 | P g i n a
Panel de contenido
Para ocultar todos los resultados de un procedimiento deber pulsar en el recuadro situado a la
izquierda del nombre del procedimiento en el panel de titulares, al hacerlo, tambin se ocultar la
presentacin de los titulares correspondientes.
Si requiere cambiar la posicin de las tablas o de los grficos, en la pantalla, deber pulsar en los
elementos en el panel de titulares o de contenidos, arrastrndolos al lugar donde desee colocarlos,
luego suelte el botn del ratn para colocarlos en la nueva ubicacin.
10.2
69 | P g i n a
Total
Hombre
Mujer
Total
100.0
69.2
30.8
Ladrillo
cermico
100.0
71.3
28.7
Ladrillo
cemento
100.0
66.7
33.3
Ladrillo
de barro
100.0
60.0
40.0
Cemento
100.0
70.7
29.3
Tierra
100.0
71.4
28.6
Otros
materiale
s .0
.0
.0
Encuesta 2009
Tabla pivote
obtenida
Total
100.0
100.0
100.0
100.0
100.0
100.0
.0
Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0
Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0
Encuesta 2009
Al trabajar con capas es factible mostrar una tabla de dos dimensiones distintas para cada categora o
combinacin de categoras, en este caso la tabla puede considerarse como una apilacin de capas en la
que puede verse bsicamente la capa superior
70 | P g i n a
Jefes de hogar, por materi al del piso de la vivienda que habitan, segn rea geogrfica y sexo
Total
Total
Hombre
Mujer
Total
100.0
69.2
30.8
Ladrillo
cermico
100.0
71.3
28.7
Ladrillo
cemento
100.0
66.7
33.3
Ladrillo
de barro
100.0
60.0
40.0
Cemento
100.0
70.7
29.3
Tierra
100.0
71.4
28.6
Otros
materiale
s .0
.0
.0
Encuesta 2009
Tabla pivote
obtenida
Trasladando variables
Rural
Urbana
Total
Ladrillo cermico
Ladrillo cemento
Ladrillo de barro
Cemento
Tierra
Otros materiales
Total
Ladrillo cermico
Ladrillo cemento
Ladrillo de barro
Cemento
Tierra
Otros materiales
Total
Ladrillo cermico
Ladrillo cemento
Ladrillo de barro
Cemento
Tierra
Otros materiales
Total
100.0
100.0
100.0
100.0
100.0
100.0
.0
100.0
100.0
100.0
100.0
100.0
100.0
.0
100.0
100.0
100.0
100.0
100.0
100.0
.0
Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0
71.9
66.7
70.4
72.7
73.6
72.8
.0
65.6
73.4
63.6
25.0
63.2
67.9
.0
Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0
28.1
33.3
29.6
27.3
26.4
27.2
.0
34.4
26.6
36.4
75.0
36.8
32.1
.0
Encuesta 2009
71 | P g i n a
11.3
Para cambiar los atributos, alineacin de las fuentes o el texto en una tabla efecte lo siguiente:
Pulse dos veces en la tabla, al realizar esta accin se activa el Editor de tablas pivote.
Pulse en la celda o en la etiqueta de la tabla que se desee modificar. Esta accin la puede
desarrollar utilizando la barra de herramientas de formato, la cual le permitir cambiar la fuente, el
estilo, el color o la alineacin5. Si desea especificar opciones adicionales de fuente y alineacin,
seleccione Fuente en el men Formato para abrir el cuadro de dilogo.
Para modificar el texto pulse dos veces en el texto que desee modificar o en F2, luego edite el texto.
Veamos con un ejemplo como funciona este procedimiento:
Total
100.0
100.0
100.0
100.0
100.0
100.0
.0
Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0
Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0
Encuesta 2009
Tabla no
editada
Total
100.0
100.0
100.0
100.0
100.0
100.0
.0
Hombre
69.2
71.3
66.7
60.0
70.7
71.4
.0
Mujer
30.8
28.7
33.3
40.0
29.3
28.6
.0
Tabla editada
Encuesta 2009
72 | P g i n a
11.4
El formato de presentacin de los datos en las tablas pivote que comprende valores, alineacin, mrgenes y
sombreado puede ser modificado fcilmente. Por ejemplo, si no desea mostrar los decimales deber
efectuar lo siguiente:
Pulse dos veces en la tabla, al realizar esta accin se activa el Editor de tablas pivote.
Pulse las teclas Ctrl+Alt mientras pulsa en la etiqueta de la columna para seleccionar la columna.
Seleccione Formato/Propiedades de casilla o pulse con el botn derecho del ratn en la etiqueta de
la columna seleccionada y seleccione Propiedades de casilla en el men contextual emergente y
anote 0 para el nmero de decimales. Los valores de los datos aparecern sin decimales.
El aspecto (fuentes, colores, bordes, etc.) de las nuevas tablas pivote se basa en el aspecto de tabla por
defecto.
Para cambiar el aspecto de tabla por defecto de las nuevas tablas pivote deber efectuar lo siguiente:
Seleccione Edicin/Opciones en el men de cualquier ventana.
Seleccione la pestaa Tablas pivote en el cuadro de dilogo Opciones.
Seleccione un aspecto de tabla de la lista. La ventana muestra ofrece una presentacin en miniatura
del aspecto de tabla seleccionado. El nuevo aspecto de tabla por defecto se aplicar a todas las
tablas pivote que genere. Puede utilizar uno de los aspectos de tabla que se incluyen con el
programa o crear uno propio.
73 | P g i n a
Cuadro 1
Jefes de hogar, por material del piso de la vivienda que habitan, por sexo
Sexo
Total
Hombre
Mujer
Total
100.0
69.2
30.8
Ladrill o
cermi co
100.0
71.3
28.7
Ladrill o
cemento
100.0
66.7
33.3
Ladrill o de
barro
100.0
60.0
40.0
Cemento
100.0
70.7
29.3
Tierra
100.0
71.4
28.6
74 | P g i n a
12. TABLAS
En la opcin Tablas existen cuadros de dilogo para Tablas personalizadas y conjuntos de respuestas
mltiples.
Las tablas pueden ser de una, dos o tres dimensiones. Debe tenerse presente que cada dimensin est
definida por una sola variable o una combinacin de variables, de esta forma existiran tres tipos de
variables: Variables de fila, las que aparecen en el lateral izquierdo de una tabla, variables de columna,
aquellas que aparecen en la parte superior de una tabla y las variables de capa que son las que aparecen
en tablas apiladas.
El cuerpo de una tabla se compone de casillas, stas pueden contener informacin bsica de la tabla como
recuentos, sumas, medias, porcentajes, mediana, moda, etc. Otro aspecto importante en relacin a las
tablas est relacionado a su forma de presentacin cuando se ubican mltiples variables en una misma
dimensin, pudiendo optarse por las siguientes formas: apiladas, cuando las categoras aparecen
separadas como si cada variable fuera una tabla distinta en la misma presentacin y anidadas, cuando
todas las categoras de la variable anidada aparecen para cada categora de la variable que se encuentre
sobre ella.
12.1
TABLAS PERSONALIZADAS
Tablas personalizadas utiliza una sencilla interfaz para el generador de tablas, que utiliza el sistema de
arrastrar y colocar, y que permite una representacin previa de la tabla, sta cambia a medida que se
seleccionan variables y opciones. De la misma forma, proporciona un nivel de flexibilidad que no se
encuentra en un cuadro de dilogo tpico, incluyendo la capacidad de cambiar el tamao de la ventana y el
tamao de los paneles incluidos dentro de la ventana.
Para los ejemplos haga uso de la base de datos JEFE_HOGAR.SAV
12.1.1 TABLAS PERSONALIZADAS: PESTAA TABLAS
En este caso, hay que seguir el siguiente procedimiento:
Seleccione Analizar/Tablas/Tablas personalizadas...
Seleccione la pestaa Tablas
A. Lista de variables
C. Panel de lienzo
B. Categoras
A.
B.
Categoras. Ubicado en la parte inferior del recuadro LISTA DE VARIABLES. En ella se visualizan
las categoras de de las variables categrica (cuando una de ellas es seleccionada en la lista de
variables). Estas categoras tambin se visualizarn en el panel de lienzo cuando se utilice la
variable en una tabla.
Panel de lienzo. Es el recuadro al cual se arrastra la (s) variable (s) con las que se va a generar una
tabla, ubicndolas ya sea en las filas o en las columnas. Una ventaja de este panel es que muestra
una vista previa de la tabla que se va a crear, no muestra en las casillas los valores reales de los
datos, pero proporciona una representacin de como quedara la tabla final.
76 | P g i n a
Arrastre y coloque una o ms variables en las reas de filas y/o columnas del panel de lienzo.
Pulse en Aceptar para crear la tabla.
Vista normal
Vista compacta
La pestaa Tabla del generador de tablas ofrece un alto grado de control sobre el diseo y contenido de las
tablas, incluyendo:
APILACIN
ANIDACIN
CAPAS
ESTADSTICOS DE RESUMEN
CATEGORAS Y TOTALES
Apilar variables
En la lista de variables, seleccione todas las variables que desee apilar, arrstrelas todas juntas y
colquelas en las filas o columnas del panel de lienzo, o
Arrastre y coloque las variables por separado, colocando cada una por encima o por debajo de las
variables existentes en las filas o a la derecha o la izquierda de las variables existentes en las
columnas.
77 | P g i n a
Anidar variables
Arrastre una variable categrica y colquela en el rea de filas o columnas del panel de lienzo.
Arrastre una variable categrica o de escala y colquela a la derecha o la izquierda de la variable de
fila categrica o por encima o por debajo de la variable de columna categrica. En la figura 94, la
variable MATERIAL DEL PISO est anidada en la variable AREA.
Adicionar capas
Pulse en Capas en la pestaa Tabla del generador de tablas para visualizar la lista Capas.
Arrastre y coloque las variables de escala o categricas que definirn las capas en la lista Capas.
Tambin puede arrastrar y soltar variables en el botn Capas sin ver la lista Capas.
En la lista Capas, no puede mezclar variables de escala y categricas. Todas las variables deben ser
del mismo tipo. Si tiene varias variables de capas que sean categricas, las capas se pueden apilar o
anidar.
Estadsticos de resumen
Los estadsticos de resumen (y las dems opciones) disponibles aqu dependen del nivel de medida de la
variable origen de los estadsticos de resumen. El origen de los estadsticos de resumen (la variable en la
que se basan los estadsticos de resumen) est determinado por:
Nivel de medida. Si una tabla (o una seccin de una tabla en una tabla apilada) contiene una variable
de escala, los estadsticos de resumen se basarn en la variable de escala.
Orden de seleccin de las variables. La dimensin origen de los estadsticos por defecto (fila o
columna) para las variables categricas depende del orden en el que se arrastren y coloquen las
variables en el panel de lienzo. Por ejemplo, si arrastra una variable primero al rea Filas, la
dimensin de las filas es, por defecto, la dimensin origen de los estadsticos.
Anidar. Para las variables categricas, los estadsticos de resumen se basan en la variable ms al
interior de la dimensin origen de los estadsticos.
Una tabla apilada puede tener varias variables origen de los estadsticos de resumen (tanto de escala como
categricas), pero cada seccin de la tabla slo puede tener un origen de los estadsticos de resumen.
79 | P g i n a
80 | P g i n a
Categoras y totales
Este cuadro de dilogo slo est disponible para las variables categricas. No est disponible para las
variables de escala.
Para acceder al cuadro de dilogo Categoras y Totales existen 2 opciones:
Arrastre una variable categrica y colquelo en el panel de lienzo. Luego, pulse con el botn
derecho del ratn en el panel de lienzo y seleccione Categoras y totales en el men contextual
emergente
Seleccione la variable del panel de lienzo y, a continuacin, pulse en Categoras y totales en el
grupo Definir de la pestaa Tabla.
83 | P g i n a
Analizar
/ Tablas/ Tablas
La pestaa Estadsticos de contraste le permite solicitar varias pruebas de significacin para las tablas
personalizadas, incluyendo:
Cuadro 1
Jefes de hogar, por materi al del piso de la vivienda que habi tan, por sexo
Total
Hombre
Mujer
Total
100.0
69.2
30.8
Ladrillo
cermico
100.0
71.3
28.7
Ladrillo
cemento
100.0
66.7
33.3
Ladrillo
de barro
100.0
60.0
40.0
Cemento
100.0
70.7
29.3
Tierra
100.0
71.4
28.6
4.806
4
.308
84 | P g i n a
12.2
Ejemplo 1: Tomando como base la informacin del archivo JEFE_HOGAR.SAV elabore una tabla
que muestre la distribucin de los jefes de hogar, por situacin laboral, segn sexo.
Supongamos que adems se quiere tener informacin porcentual (porcentajes de columna y totales),
entonces es necesario:
Pulse con el botn derecho del ratn en la variable SITUACIN LABORAL en el panel de lienzo y
seleccionar Estadsticos de resumen en el men contextual emergente. En el cuadro de dilogo
Estadsticos de resumen, seleccione % del N de la columna de la lista Estadsticos y pulse en el botn
de flecha para aadirlo a la lista Visualizacin.
Ahora aparecern tanto los recuentos como los porcentajes de columna.
85 | P g i n a
Pulse en Aplicar a seleccin para guardar estas opciones y volver al generador de tablas.
Sexo
Total
Hombre
Mujer
Total
Recuento
148525
97249
51276
%
100.0
65.5
34.5
Situacin l aboral
Trabaja
Recuento
%
114586
100.0
83218
72.6
31368
27.4
No trabaja
Recuento
%
33939
100.0
14031
41.3
19908
58.7
Ejemplo 2: Sobre la base del mismo ejemplo 1, supngase que se quiere anidar la variable POBREZA
en la variable SEXO. Adems el ttulo del cuadro sera JEFES DE HOGAR, POR SITUACIN
LABORA, SEGN SEXO DEL JEFE DE HOGAR Y NIVEL DE POBREZA.
Jefes de hogar, por situacin laboral, segn sexo del jefe de hogar y nivel de
pobreza
Sexo y nivel de pobreza
Total
Hombre
Mujer
Total
Pobreza extrema
Pobreza relativ a
No pobre
Total
Pobreza extrema
Pobreza relativ a
No pobre
Total
Pobreza extrema
Pobreza relativ a
No pobre
Total
Recuento
148525
17562
38336
92627
97249
11562
26279
59408
51276
6000
12057
33219
%
100.0
11.8
25.8
62.4
100.0
11.9
27.0
61.1
100.0
11.7
23.5
64.8
Si tuacin laboral
Trabaja
Recuento
%
114586
100.0
12978
11.3
28774
25.1
72834
63.6
83218
100.0
10191
12.2
21998
26.4
51029
61.3
31368
100.0
2787
8.9
6776
21.6
21805
69.5
No trabaja
Recuento
%
33939
100.0
4584
13.5
9562
28.2
19793
58.3
14031
100.0
1371
9.8
4281
30.5
8379
59.7
19908
100.0
3213
16.1
5281
26.5
11414
57.3
Ejemplo 3: Sobre la base del mismo ejemplo 1, supngase que se quiere insertar un subtotal para las
categoras pobreza extrema y pobreza relativa, as como obtener el total global
Para aadir totales y subtotales a una tabla personalizada aplique lo siguiente:
Pulse con el botn derecho del
ratn en la variable POBREZA
en el panel de lienzo y
seleccione Categoras y totales
en
el
men
contextual
emergente.
En el cuadro de dilogo
Categoras y totales, seleccione
2 en la lista de valores y de clic
en insertar
del recuadro
Subtotal, con lo cual se insertar
una fila con el subtotal de las
dos primeras categoras de la
variable POBREZA (pobreza
extrema y pobreza relativa)
En el campo de texto Etiqueta
que hay junto al botn escriba
POBRE.
Para incluir el total global,
seleccione
la
casilla
de
verificacin
Total
y
a
continuacin pulse en Aplicar.
Figura 112: Insercin de totales y subtotales
Jefes de hogar, por situacin laboral, segn sexo del jefe de hogar y nivel de
pobreza
Total
Hombre
Mujer
Pobreza extrema
Pobreza relativ a
Pobre
No pobre
Total
Pobreza extrema
Pobreza relativ a
Pobre
No pobre
Total
Pobreza extrema
Pobreza relativ a
Pobre
No pobre
Total
Total
Recuento
17562
38336
55898
92627
148525
11562
26279
37841
59408
97249
6000
12057
18057
33219
51276
%
11.8
25.8
37.6
62.4
100.0
11.9
27.0
38.9
61.1
100.0
11.7
23.5
35.2
64.8
100.0
Trabaja
Recuento
%
12978
11.3
28774
25.1
41752
36.4
72834
63.6
114586
100.0
10191
12.2
21998
26.4
32189
38.7
51029
61.3
83218
100.0
2787
8.9
6776
21.6
9563
30.5
21805
69.5
31368
100.0
No trabaja
Recuento
%
4584
13.5
9562
28.2
14146
41.7
19793
58.3
33939
100.0
1371
9.8
4281
30.5
5652
40.3
8379
59.7
14031
100.0
3213
16.1
5281
26.5
8494
42.7
11414
57.3
19908
100.0
Ejemplo 4: Generar una tabla que muestre el ingreso promedio mensual, mediana y modal de los jefes
de hogar, segn condicin laboral (LABORAL1). A dicha tabla hay que colocarle el siguiente ttulo:
Jefes de Hogar, por medidas de tendencia central del ingreso mensual del hogar, segn situacin
laboral
El proceso a desarrollar es el siguiente:
Seleccione
Analizar/Tablas/Tablas
personalizadas...
Seleccione la variable Situacin
(LABORAL1) de la lista de variables,
arrstrela y colquela en el rea Filas
del panel de lienzo.
Seleccione Ingreso mensual del hogar
(INGFA) de la lista de variables,
arrstrela y colquela sobre el rea
Columnas del panel de lienzo.
Luego defina los estadsticos de
resumen (media, mediana y moda) a
dos decimales.
Ubicarse en la variable Situacin
laboral y entrar a Categoras y totales
para marcar el recuadro de Total.
Finalmente entre la pestaa Ttulos,
escriba
el
ttulo
del
cuadro
correspondiente
Pulse en Aceptar para generar la
tabla.
Figura 114: Cuadro de dilogo para el ejemplo 4
89 | P g i n a
Total
Trabaja
No trabaja
Mediana
309.16
325.50
275.00
Moda
150.00
350.00
250.00
Ejemplo 5: Sobre la base del mismo ejemplo 4, supngase que se quiere agregar una variable en
capas, en este caso AREA.
Rural
Urbana
Total
Trabaja
No trabaja
Total
Trabaja
No trabaja
Total
Trabaja
No trabaja
Media
447.73
468.39
377.98
299.46
309.70
264.66
517.77
543.50
431.14
Mediana
309.16
325.50
275.00
220.00
227.08
200.00
372.50
399.84
300.00
Moda
150.00
350.00
250.00
120.00
120.00
50.00
150.00
350.00
250.00
90 | P g i n a
13. GRAFICOS
13.1
CREACION DE UN GRAFICO
En el siguiente ejemplo se generar un grfico de barras simples para grupos de casos (observar
procedimiento en la figura 118). Para lo cual, en el cuadro de dilogo seleccione en el Eje de
categoras la variable SEXO (R104) y la alternativa % de casos en el grupo Las barras representan.
Simple: Grfico con una sola barra para cada categora, caso o variable, del eje de categoras. Agrupados: Tipo de grfico que
muestra un grupo de barras para cada categora del eje de categoras. Cada barra dentro de esos grupos representa un grupo de
casos, una variable distinta o un caso individual. Apilados: Grficos en los que segmentos de barras se apilan unos sobre otros.
Existe una barra apilada para cada categora, caso o variable, del eje de categoras. Los segmentos dentro de cada barra
representan grupos de casos, variables distintas o casos individuales.
Resmenes para grupos de casos: El grfico resume una nica variable dentro de los subgrupos definidos por una variable
categrica. Los grficos complejos utilizan dos variables categricas para definir los subgrupos. Resmenes para variables
separadas: Resume ms de una variable. Los grficos simples resumen cada variable para la totalidad de los casos del archivo de
datos. Los grficos complejos resumen cada variable dentro de las categoras de otra variable. Valores individuales: Representa
los valores individuales de una o ms variables.
91 | P g i n a
En el siguiente ejemplo se crear un grfico de barras agrupadas para distintas variables (observar
procedimiento en la figura 118).
En el siguiente ejemplo se crear un grfico de barras apiladas para distintas variables (observar
procedimiento en la figura 119).
92 | P g i n a
13.2
EDICION DE GRAFICOS
Una vez que ha creado un grfico, puede editar muchos de sus atributos para cambiar su aspecto. Puede
cambiar el ttulo, el etiquetado, las fuentes y los colores. De la misma forma, puede eliminar categoras,
cambiar la amplitud del eje de escala e intercambiar los ejes, as como cambiar el tipo de grfico (observar
figura 120).
El procedimiento para la edicin de grficos es el siguiente:
Pulse dos veces en el grfico que desee editar, con esta accin, el grfico aparecer en la ventana
Editor de grficos.
Puede editar el grfico con los mens, con la barra de herramientas o pulsando dos veces en el
objeto que desee modificar. Para seleccionar objetos en el grfico, pulse en ellos. Para editar un
grfico usando los mens de la ventana de grficos, haga una seleccin en un men y edite el
cuadro de dilogo resultante. Finalmente es importante sealar que una forma rpida de acceder a
la mayora de las funciones de edicin de grficos es pulsar dos veces en los objetos.
Por ejemplo, compare el grfico que aparece en la figura 118 con el de la figura 120 y podr observar que
ahora las barras se presentan en forma horizontal, para lo cual se hizo uso de la funcin Tambin puede
Transponer sistemas de coordenadas de grficos. Tambin se ha variado la fuente, estilo y el tamao del
ttulo. La posicin de la leyenda cambi. De igual forma, se vari el color de las barras y ahora stas tienen
trama.
GENERADOR DE GRFICOS
El generador de grficos es una opcin del SPSS que permite crear grficos a partir de los grficos
predefinidos de la galera o a partir de los elementos individuales, como por ejemplo, ejes y barras.
A medida que va creando el grfico, observar una presentacin preliminar del grfico en el lienzo. Aunque
la presentacin preliminar utiliza etiquetas de variable definidas y niveles de medida, no muestra los datos
reales.
Para iniciar el generador de grficos seleccione Grficos/ Generador de grficos. La figura 121
muestra el cuadro de dilogo, con su correspondiente estructura.
93 | P g i n a
A.
Lienzo
Es la zona del cuadro de dilogo Generador de grficos donde se genera el grfico.
B.
Conjunto de ejes
Este determina los ejes de un espacio de coordenadas definido. Este se genera automticamente cuando
se aade un elemento de la galera al lienzo. Cada eje incluye una zona de colocacin del eje a la que se
pueden arrastrar y colocar variables.
C.
Elementos grficos
Los elementos grficos son los elementos del grfico que representan datos. Dichos elementos son las
barras, los puntos, las lneas, etc.
D.
Lista de variables
La lista de variables muestra las variables disponibles.
E.
Lista de categoras
Muestra las categoras de aquellas variables que son categricas
F.
Zonas de colocacin
Las zonas de colocacin son las zonas del lienzo donde se arrastra y coloca una variable de la lista
Variables. Tal como se ha indicado anteriormente, la zona de colocacin bsica es la zona de colocacin del
eje.
Conjunto
de ejes
Variable en zona
de agrupacin
Lista de
variables
Lienzo
Conjunto de ejes
Lista de
categoras
94 | P g i n a
Figura 123: Cuadro de dilogo definicin de variables en las zonas de colocacin del eje
95 | P g i n a
Si necesita incluir otras variables al grfico (por ejemplo, para la agrupacin o la adicin de
paneles), pulse en la pestaa Grupos/ID de puntos y seleccione una o ms opciones. Luego, deber
arrastrar las variables categricas a las nuevas zonas de colocacin que aparecen en el lienzo.
Pulse en Ttulos/notas al pie y anote tanto el ttulo del grfico como la fuente de donde proviene.
14.1
Antes de mostrar el procedimiento a seguir para crear grficos interactivos, en la figura 126 se presenta, a
manera de ejemplo, el Cuadro de dilogo Crear grfico de barras pestaa Asignar variables, para mostrar
sus componentes bsicos: Lista de origen, ejes de destino, funciones de resumen, orientacin y nmero de
dimensiones.
Orien
tacin
Nmero de
disemnsiones
Ejes de destino
Lista de
origen
Funciones
de
resumen
Ejemplo 2: Se generar un grfico de barras en tercera dimensin que muestre Jefes de hogar, por
nivel de pobreza, segn mbito geogrfico en el que vive. En este caso, deber arrastrar la variable
POBREZA al eje X, $pct al eje Y, y finalmente AREA en el recuadro Variables del panel.
De esta forma se pasa de un grfico de barras simples a un grfico de barras agrupado (ver figura
128).
98 | P g i n a
Ejemplo 3: Observaremos como vara el grfico al sustituir los recuentos del eje vertical por un
resumen de los datos de INGFA (ingreso familiar). Por defecto, se muestran los valores promedio,
ahora puede visualizar en la figura 129 un grfico de barras agrupado que muestra el ingreso
promedio mensual del hogar, por SEXO (R104) y segn AREA (rea geogrfica).
99 | P g i n a
14.2
Para crear un grfico a partir de una tabla pivote ejecute el siguiente procedimiento:
Active la tabla pivote; para ello, pulse dos veces en cualquier punto de la tabla.
Seleccione las casillas que desee que aparezcan en el grfico.
Pulsar con el botn derecho del ratn en cualquier punto del rea seleccionada, le aparecer un
men contextual emergente.
Pulse en Crear grfico.
Pulse en el tipo de grfico que desee.
Veamos ahora como se generan un grfico interactivo a partir de una tabla pivote:
Partiendo de la tabla Jefes de hogar, por situacin laboral, segn sexo, se proceder a generar un
grfico de barras. Tal como se observa en la figura 130, en el grfico cada barra representa una de
las casillas seleccionadas de la tabla pivote.
Para editar un grfico interactivo, actvelo pulsando dos veces en l, el siguiente paso ser pulsar dos veces
en un elemento para modificar sus atributos. A manera de ejemplo, se va a editar el grfico interactivo de la
figura 130 (ver figura 133), efectuando las siguientes modificaciones:
Mostrar los valores en las barras.- La accin ser pulsar dos veces en cualquiera de las barras, lo
que le abrir el cuadro de dilogo Barras, ah deber pulsar en la opcin Valores de la seccin
100 | P g i n a
Mostrar
el
grfico
en
tercera
dimensin.- Si ya est editando el
grfico deber seleccionar el men
Ver/Tercera dimensin.
Cambiar colores y estilos de las barras.La accin ser pulsar dos veces en
cualquiera de las barras, esto le permitir
acceder al cuadro de dilogo Barras, ah
deber pulsar en las opciones estilo y color
de la seccin Relleno de la Barra.
Figura 132: Cuadro de dilogo para cambiar fuente
101 | P g i n a
Hombre
72.6%
Mujer
58.7%
41.3%
27.4%
102 | P g i n a
15.1
Entre estos estadsticos se tienen los siguientes: Chicuadrado, correlaciones, nominal, ordinal, nominal
por intervalo, Kappa, riesgo, Mc Nemar y estadsticos
de Cochran y Mantel - Haenszel.
15.1.1 Chi-cuadrado
Este grupo compren los siguientes estadsticos:
2
El chi-cuadrado de Pearson (X ), es un
estadstico utilizado para contrastar la
hiptesis de que las variables de fila y
columna son independientes. No debe
utilizarse si cualquiera de las casillas tiene un
valor esperado menor que 1, o si ms de un
20% de las casillas tienen valores esperados
menores que 5. A efectos prcticos, el valor
de significacin es ms importante que el
valor real del estadstico.
Figura 135: Cuadro de dilogo de Tablas de Contingencia: Estadsticos
103 | P g i n a
Se calcula sumando los cuadrados de los residuos de todas las celdas divididos por las frecuencias
esperadas, tal como se muestra en la frmula siguiente:
X2
Oij Eij
Eij
Donde:
Oij es la frecuencia observada en cada celdaij
Eij es la frecuencia esperada en cada celdaij
Debe tenerse presente que Eij es el producto de la probabilidad bajo la independencia de que una
observacin caiga en la celdaij por el tamao total de la muestra.
frecuenciafilai frecuenciacolumna j
Eij
N
N
N
O lo que es lo mismo:
Eij
Chi-cuadrado de la razn de verosimilitud, es un estadstico de bondad de ajuste similar al chicuadrado de Pearson. Para grandes tamaos de muestra, los dos estadsticos son equivalentes. La
ventaja del chi-cuadrado de la razn de verosimilitud es que puede subdividirse en partes
interpretables que se suman hasta el total. A efectos prcticos, el valor de significacin es ms
importante que el valor real del estadstico.
Prueba de asociacin lineal por lineal, es una medida de la asociacin lineal entre las variables de
fila y columna de una tabla de contingencia. Este estadstico no debe utilizarse con datos
nominales. Se conoce tambin como contraste de chi-cuadrado de Mantel-Haenszel. Para
propsitos generales, el valor de significacin es ms importante que el valor real del estadstico.
Chi-cuadrado corregido de Yates, es una correccin que se aplica en ocasiones al clculo del chicuadrado para tablas 2x2 para mejorar su aproximacin. Los valores corregidos de chi-cuadrado
son siempre ms pequeos que los valores no corregidos. Implica la resta de 0.5 a las diferencias
positivas observadas entre las frecuencias observadas y esperadas (residuos) y la suma de 0.5 a
las diferencias negativas antes de elevarlas al cuadrado.
Prueba exacta de Fisher o Prueba de independencia para una tabla 2 x 2, es de mayor utilidad
cuando son pequeos el tamao total de la muestra y el de los valores esperados. SPSS utiliza esta
prueba cuando el tamao de la muestra en una tabla 2 x 2 es 20 o menor o cuando una tabla
presenta una casilla con una frecuencia esperada menor que cinco.
15.1.2 Correlaciones
Este grupo comprende los siguientes estadsticos:
Coeficiente de Correlacin de Pearson (r) es una medida de asociacin lineal entre dos variables
cuantitativas. Los valores del coeficiente de correlacin varan entre -1 y 1. El signo del coeficiente
indica la direccin de la relacin y el valor absoluto indica la intensidad. Los valores absolutos
mayores indican que las relaciones son ms fuertes. Su frmula es:
104 | P g i n a
n xy x y
n x 2 x 2 n y 2 y2
rs 1
6 d 2
n n 2 1
Donde:
d = Diferencia de rangos
n = Nmero de pares de calificaciones
15.1.3 Nominal
Se emplea para los datos nominales. Este grupo comprende los siguientes estadsticos:
Estadstico
Coeficiente Phi
Frmula
Coeficiente de
contingencia
V de Cramer
X2
X 2 N
X2
V
Nk 1
Lambda
P(1)= 1 - prob. de
categora modal.
P(2)= Suma de las
prob. de celdas
que no sean moda
de las filas.
X2
N
p1 p2
p1
Interpretacin
Medida de asociacin basada en chi-cuadrado, aplicable
slo para las tablas 2x2. Vara de 0 a 1, donde "cero"
implica ausencia de correlacin entre las variables y "ms
uno" que las variables estn correlacionadas de manera
perfecta.
Coeficiente de contingencia es una medida de asociacin
basada en chi-cuadrado. El valor siempre est
comprendido entre 0 y 1. El valor 0 indica que no hay
asociacin entre la fila y la columna. Los valores cercanos
a 1 indican que hay gran relacin entre las variables. El
valor mximo posible depende del nmero de filas y
columnas de la tabla.
Medida del grado de asociacin basada en chi-cuadrado
que se emplea para tablas mayores de 2x2. El valor
siempre est comprendido entre 0 y 1. El valor 0 indica
que no hay asociacin entre las variables de fila y de
columna. Los valores cercanos a 1 indican que hay gran
relacin entre las variables. La V de Cramer puede
alcanzar un valor de 1 para tablas de cualquier dimensin
Medida de asociacin que refleja la reduccin proporcional
en el error cuando se utilizan los valores de la variable
independiente para pronosticar los valores de la variable
dependiente. Un valor igual a 1 significa que la variable
independiente pronostica perfectamente la variable
dependiente. Un valor igual a 0 significa que la variable
independiente no ayuda en absoluto a pronosticar la
variable dependiente.
105 | P g i n a
Tau de Kruskal y
Goodman
Coeficiente de
incertidumbre
15.1.4 Ordinal
Estn basadas en la ordenacin por rangos de los valores de las variables, se parte de un atabla con los
pares de valores concordantes (un individuo tiene valores superiores o inferiores a otro en ambas variables)
o discordantes (superiores en una e inferiores en otra) o empatados (empatado en X pero no en Y,
empatado en Y pero no en X o empatado en ambas variables). Este grupo comprende los siguientes
estadsticos:
Gamma de Goodman y Kruskal es una medida
de asociacin simtrica entre dos variables
ordinales cuyo valor siempre est comprendido
entre menos 1 y 1. Los valores prximos a 1,
en valor absoluto, indican una fuerte relacin
entre las dos variables. Los valores prximos a
cero indican que hay poca o ninguna relacin
entre las dos variables. Para las tablas de
doble clasificacin, se muestran las gammas de
orden cero. Para las tablas de tres o ms
factores de clasificacin, se muestran las
gammas condicionales.
Tau b es una medida no paramtrica de
asociacin para variables ordinales o de rangos
que tiene en consideracin los empates. El
signo del coeficiente indica la direccin de la
relacin y su valor absoluto indica la magnitud
de la misma, de tal modo que los mayores
valores absolutos indican relaciones ms
fuertes. Los valores posibles van de -1 a 1,
pero un valor de -1 o +1 slo se puede obtener
a partir de tablas cuadradas.
15.1.6 Kappa
La kappa de Cohen mide la concordancia entre las apreciaciones de dos evaluadores cuando ambos estn
valorando el mismo objeto. Un valor igual a 1 indica un acuerdo perfecto. Un valor igual a 0 indica que el
acuerdo no es mejor que el que se obtendra por azar. Kappa slo est disponible para las tablas cuadradas
(tablas en las que ambas variables tienen el mismo nmero de categoras).
15.1.7 Riesgo
Es una medida del grado de asociacin entre la presencia de un factor y la ocurrencia de un evento. Si el
intervalo de confianza para el estadstico incluye un valor de 1, no se podr asumir que el factor est
asociado con el evento. Cuando la ocurrencia del factor es rara, se puede utilizar la razn de las ventajas
(odds ratio) como estimacin del riesgo relativo. Un ejemplo muy comn asociado a este indicador es
determinar si el hecho de fumar est relacionado con las enfermedades cardacas.
15.1.8 McNemar
Es una prueba no paramtrica para dos variables dicotmicas relacionadas. Contrasta los cambios en las
respuestas utilizando la distribucin de chi-cuadrado. Es til para detectar cambios en las respuestas
debidas a la intervencin experimental en los diseos del tipo "antes-despus". Tpicamente, un valor de
significacin menor que 0.05 se considera significativo.
15.1.9 Estadsticos de Cochran y Mantel - Haenszel
Dentro de este grupo se tiene los siguientes estadsticos:
El estadstico de Cochran, comprueba la
independencia entre una variable de factor
dicotmica y una variable de respuesta
dicotmica, condicionada por los patrones en
las covariables, los cuales vienen definidos por
una o ms variables "de estratificacin".
El estadstico de Mantel-Haenszel es similar al
de Cochran, slo que efecta correcciones en
los tamaos muestrales ms pequeos.
15.2
Seleccionar una o ms variables de control (capas de la tabla de contingencia). Hay que tener
presente que se genera una tabla de contingencia por cada categora de cada variable de
capa.
Pulsar en grficos de barras agrupadas, una ventaja de estos es que ayudan a resumir los
datos por grupos de casos. Se genera una agrupacin de barras por cada valor de la variable
especificada en el cuadro filas, en tanto que la variable que define las barras dentro de cada
agrupacin es la variable especificada en el cuadro de columnas.
Pulsar en Estadsticos para obtener pruebas y medidas de asociacin para las tablas de
doble clasificacin, debiendo tenerse presente lo especificado en el acpite anterior.
109 | P g i n a
Ejemplo 1: Determinar una tabla de contingencia para las variables NIVEL DE POBREZA
(NIV_POBREZA) y MATERIAL DE LOS PISOS (R304). En la opcin Estadsticos generar chicuadrado, correlaciones y los nominales. En lo que se refiere a las casillas considerar las
frecuencias observadas, esperadas, todos los porcentajes y los residuos no tipificados, finalmente
en la opcin Formato dejar
las filas en orden ascendente (por defecto).
En la figura 136 se presenta las opciones a utilizar y los resultados obtenidos.
Algunos comentarios de los resultados obtenidos de la tabla de contingencia nivel de pobreza y material
predominante en los pisos de las viviendas que habitan:
En la categora pobre se
ubica el 40.7% de los
jefes de hogar, en la de
no pobres se ubica el
59.3%. (marginales de
columna). En relacin a
la variable material de
los pisos, el 10.0% de
jefes de hogar seal
que
el
material
predominante en el piso
de la vivienda que
habitan es el ladrillo
cermico, el 41.2%
ladrillo cemento, 22.0%
de cemento y 26.0% de
tierra (marginales de
fila).
Pobre
No
pobre
Total
Recuent o
Frecuencia esperada
% de Niv el de pobreza
% de Material del piso
% del total
Residuo
Recuent o
Frecuencia esperada
% de Niv el de pobreza
% de Material del piso
% del total
Residuo
Recuent o
Frecuencia esperada
% de Niv el de pobreza
% de Material del piso
% del total
Residuo
Ladril lo
cermico
30
76.5
3.9%
16.0%
1.6%
-46.5
158
111.5
14.1%
84.0%
8.4%
46.5
188
188.0
10.0%
100.0%
10.0%
Tierra
308
199.4
40.1%
62.9%
16.3%
108.6
182
290.6
16.3%
37.1%
9.6%
-108.6
490
490.0
26.0%
100.0%
26.0%
Total
768
768.0
100.0%
40.7%
40.7%
1119
1119.0
100.0%
59.3%
59.3%
1887
1887.0
100.0%
100.0%
100.0%
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Correccin por
continuidad
Razn de v erosimilitudes
Asociacin lineal por
lineal
N de casos v lidos
Sig. asinttica
(bi lateral)
.000
214.827
.000
207.377
.000
Valor
208.628a
gl
1887
En la tabla de Medidas simtricas se observa que los estadsticos V de Cramer (0.333), Coeficiente
de Contingencia (0.316) y coeficiente de correlacin de Spearman (-0.332) refuerzan la relacin
existente entre las variables nivel de pobreza y material de los pisos. El signo positivo del
coeficiente indica la existencia de una relacin inversa entre las variables y su valor absoluto indica
la magnitud de la misma, aunque cabe sealar que sta no es una relacin muy fuerte.
Medidas simtricas
a
Phi
V de Cram er
Nominal por nominal
Coef iciente de
contingencia
Interv alo por interv alo R de Pearson
Ordinal por ordinal
Correlacin de Spearman
N de casos v lidos
Valor
Error tp. asi nt. T aproximada
.333
.333
.316
-.332
-.332
1887
Si g.
aproximada
.000
.000
.000
.021
.021
-15.260
-15.276
.000c
.000c
111 | P g i n a
Ejemplo 2: Determinar una tabla de contingencia para las variables GRADOS APROBADOS
(APROBA1) y el
INGRESO PER CAPITA (INGPE). En la opcin Estadsticos generar
correlaciones. En este caso, el R de Pearson es 0.366, como el signo del coeficiente es positivo
indica que existe una relacin directa entre ambas variables, sin embargo en tanto el coeficiente
est ms cerca de 0 que de 1, significa que existe una baja intensidad en dicha relacin.
Vli dos
N
Porcentaje
GRADOS
APROBADOS *
INGPE
581
100.0%
.0%
Total
Porcentaje
581
100.0%
Medidas simtricas
a
Valor
Error tp. asi nt. T aproximada
.366
.049
9.452
.288
.040
7.232
581
Si g.
aproximada
.000c
.000c
112 | P g i n a
Haciendo uso del procedimiento TABLAS PERSONALIZADAS obtenga los cuadros siguientes:
Jefes de hogar, por sexo (R104), segn grupos de edad (JH_GEDAD), en porcentaje de fila.
Jefes de hogar, por sexo (R104) y grupos de edad (JH_GEDAD), segn material
predominante en las paredes (R103). Tenga presente que las variables de sexo y grupos de
edad deben ir apiladas, la primera en porcentajes de fila y la segunda en porcentaje de
columna.
Jefes de hogar con ocupacin (LABORAL=1), por nivel de pobreza (NIV_POB), segn
categora de ocupacin (R418). En porcentajes de fila
Jefes de hogar, por nivel de pobreza (NIV_POB), segn sexo (R104) y mbito geogrfico
(AREA). En porcentaje de columna. Colocar la variable nivel de hacinamiento (NHACI) en
capas.
Nivel de escolaridad de los jefes de hogar (APROBA1), por grupos de edad (JH_GEDAD),
segn nivel de pobreza (NIV_POB).
2.
Haciendo uso del procedimiento Grficos de barras represente grficamente el Ingreso promedio del
hogar (INGFA), por condicin de actividad del jefe de hogar (LABORAL)
3.
Haciendo uso del procedimiento grficos interactivos represente grficamente Nmero promedio de
miembros del hogar por mbito geogrfico (AREA)
4.
5.
Grafique el nivel de pobreza (NIV_POB), por nivel de alfabetismo del jefe de hogar (R202A)
6.
Determinar si existe asociacin entre las variables nivel de pobreza (NIV_POB) y nivel de
alfabetismo del jefe de hogar (R202A)
7.
Determinar si para los jefes de hogar del rea urbana (AREA=1) existe asociacin entre las
variables Ingreso promedio del hogar (INGFA) y nmero de habitaciones (R305)
113 | P g i n a
BIBLIOGRAFIA
SPSS (1999). SPSS Base para Windows Versin 9.0.Gua del Usuario. Chicago:
SPSS.
SPSS (1993). SPSS Base para Windows Versin 6.0.Gua del Usuario. Chicago:
SPSS.
SPSS (2004). SPSS 13.0 Base Manual del usuario. Chicago 2004
Pardo Merino, Antonio y Ruiz Das Miguel Angel (02002). SPSS 11. Gua para el
anlisis de datos
Pablo Valderrey Sanz (2010). Extraccin del conocimiento a partir del anlisis de
datos
114 | P g i n a
LABORATORIOS DESARROLLADOS
115 | P g i n a