You are on page 1of 36

UNIDAD

Gua didctica

11
UNIDAD

Fundamentacin
Con el desarrollo de nuevas tecnologas, los clculos estadsticos dejaron de ser una ardua tarea digna de un genio y se han convertido en una labor relativamente sencilla que cualquier persona puede realizar. En la actualidad existen, en el mercado, diversos software para el anlisis de datos, destacndose entre ellos el paquete estadstico SPSS, que es un programa estadstico informtico muy usado en las ciencias sociales y las empresas de investigacin de mercado. En esta Unidad reforzars tus conocimientos en el uso de esta herramienta que te permitan realizar un anlisis descriptivo de datos, lo cual te facilitar las consultas, el anlisis y la generacin de resumen especficos para la toma de decisiones. Recuerda siempre que su uso exige la destreza y experiencia que tengas en la forma correcta de utilizar esta herramienta para obtener los resultados esperados.

Capacidad
El participante al final de esta unidad, estar en capacidad de realizar un anlisis estadstico de la muestra de datos, a travs del uso de tablas de contingencias y de un anlisis descriptivo confiabilidad de la muestra mediante el coeficiente de correlacin de Pearson y el mtodo de regresin en base a una aplicacin del mundo real.

Contenidos
Anlisis Estadstico Bsico y Estadstica Aplicada con SPSS:

Anlisis Estadstico Bsico Distribucin de Frecuencias. Anlisis Descriptivo de datos por estratos. Anlisis Descriptivo de datos seleccionados Medidas descriptivas de datos Representacin de grficos Tablas de contingencias Coeficiente de correlacin de Pearson Anlisis de regresin

Actividades
Las actividades a desarrollar en la Unidad son: Actividad: ESTADSTICA APLICADA: Realiza el caso en mencin diseando tabla de contingencia para medir asociaciones, calculando coeficiente de correlacin entre variables determinadas y obteniendo la ecuacin de regresin en base a variables establecidas.

P g i n a | 542

Estrategias Metodolgicas
Para desarrollar la presente unidad, llevars a cabo dos tipos de actividades: 1. Lectura Inicial de Contenidos, la realizars de manera ordenada, presenta los aspectos tericos. Si se presenta alguna duda, puedes realizar lecturas sobre puntos especficos en la seccin de Material Complementario o en las direcciones electrnicas de tus slabos para esta unidad 11. 2. Actividades a Desarrollar en la Unidad, se encuentran en el apartado de Actividades, donde constan: las consignas o indicaciones de cada aplicacin propuesta. Recuerda que el Aula el Virtual docente de la y el UCV, servir estudiante, como plataforma consultas, de

comunicacin

entre

como

foros,

evaluaciones virtuales, acciones de tutora acadmica y resultados de evaluacin de los aprendizajes.

Evaluacin
En esta Unidad Ud., ser evaluado en: 1. Diseo de tabla de contingencia (para medir la asociacin entre estado civil e ingresos familiares). 2. Calculo del coeficiente de correlacin (entre variables edad e ingresos). 3. Calculo de la ecuacin de regresin (entre variables edad e ingresos). Es importante que tengas una comunicacin fluida con tu docente Tutor, para informar tus dificultades en los avances de las actividades o cualquier inconveniente en el desarrollo del curso. Todo ello ser calificado de acuerdo a las rbricas de evaluacin de cada actividad; por ejemplo: se le evaluar por la entrega oportuna de sus actividades.

P g i n a | 543

Material Complementario
A fin de ampliar y profundizar conocimientos te recomendamos revisar la informacin contenidas en las carpetas: Material Complementario Mdulo II: Tablas de contingencia o cruzadas Correlacin y Regresin Anlisis de Preguntas de Respuesta Simple Creacin de tablas personalizadas

Videos Mdulo II: Anlisis Estadstico con SPSS 20

cis@ucv.edu.pe http://www.ucv.edu.pe/cis/

P g i n a | 544

UNIDAD

Anlisis estadstico bsico y Estadstica aplicada con SPSS

11

Estructura de contenidos:
Anlisis Estadstico Bsico y Estadstica Aplicada con SPSS. 1. Anlisis Estadstico Bsico: Distribucin de Frecuencias. 2. Anlisis Descriptivo de datos por estratos. 3. Anlisis Descriptivo de datos seleccionados. 4. Medidas descriptivas de datos. 5. Tablas de contingencias. 6. Coeficiente de correlacin de Pearson. 7. Anlisis de regresin.

Estimado participante: Esta sesin de aprendizaje tiene como objetivo, explicar el anlisis estadstico bsico y grfico de los datos de una muestra, aplicar opciones avanzadas de anlisis descriptivo de la muestra con SPSS para realizar correlacin y regresin de variables, tablas de contingencia. 1 ANLISIS ESTADSTICO BSICO

Con SPSS (Statistical Package for the Social Sciences), su aplicacin est presente en todas las reas de la ciencia e investigacin as como tambin en los negocios; de all el motivo de estudio de esta herramienta. Antes de comenzar el anlisis descriptivo debemos precisar la naturaleza de las caractersticas del objeto de estudio. Si la caracterstica es por naturaleza no cuantificable (sexo, religin, estado civil, etc.) se trata de un ATRIBUTO (o variable cualitativa), mientras que si la caracterstica es cuantificable se trata de una VARIABLE. Entra stas consiguen establecer una clara diferencia entre VARIABLE DISCRETA y VARIABLE CONTINUA.

ATRIBUTO

VARIABLE

No cuantificable Ejemplo: sexo, religin, etc.

Discreta Ejemplo: N de hijos, edad, N de vehculos de una familia, etc.

Continua Ejemplo: la altura, el peso de una persona, el tiempo, etc.

Ingresada la informacin a las variables de un archivo de datos, debemos analizar en forma cuantitativa y cualitativa dicha informacin, para ello veremos las siguientes herramientas:

IMPORTANTE: Todos los archivos usados en cada ejercicio a desarrollar en esta unidad 11, se encuentran en la carpeta Material Complementario Mdulo II.

P g i n a | 546

DISTRIBUCIN DE FRECUENCIAS Un anlisis estadstico permite obtener tablas de frecuencias y porcentajes de los distintos valores que toman las variables. Para explicar este proceso lo haremos con el siguiente ejercicio: Ejercicio 01: Obtener la distribucin de frecuencias de la variable materia, usando el archivo de datos LibrosFrecuencias.sav (ver la carpeta Material Complementario Mdulo II)

Solucin: 1. Selecciona el men Analizar / Estadsticos descriptivos / Frecuencias

P g i n a | 547

2. En la ventana que se muestra, agregue con doble clic la(s) variable(s) objeto del anlisis.

3. Luego haz clic en el botn Aceptar. Para las variables no numricas no sirve aplicar las opciones del botn Estadsticos Opcionalmente se consigue incluir un grfico a la tabla de frecuencias, con el botn Grficos, que veremos luego. El resultado es el siguiente:

Observe que se muestra no solo la estadstica de frecuencias, sino tambin el N de la muestra valida.

P g i n a | 548

ANLISIS DESCRIPTIVO DE DATOS POR ESTRATOS

Hacer anlisis descriptivo por estratos consiste en agrupar y comparar los datos para hacer un tratamiento estadstico por separado. Ejercicio: Comparar los precios promedios de los libros formando estratos con los valores de la variable materia. Usa tambin el archivo LibrosEstratos.sav (ver la carpeta Material Complementario Mdulo II)

Solucin: 1. Dividimos el archivo de datos Ingrese al Men: Datos, Opcin: Dividir archivo Luego selecciona la variable Materia. Activar la opcin Comparar los grupos para formar los estratos (o grupos) con los valores de la variable Materia Haz clic en el botn Aceptar.

2. Aplicar el Anlisis Estadstico descriptivo: Una vez que se han formado los estratos de la variable Materia, se procede al anlisis estadstico descriptivo. Selecciona el men: Analizar / Estadsticos descriptivos / Frecuencias

P g i n a | 549

Haz doble clic en la variable Precio, para aadirla al anlisis.

Como la variable Precio es de tipo numrico, entonces se ingresa a la opcin Estadsticos y activa los indicadores mostrados para analizar:

Ahora haz clic en el botn Continuar. Finalice la operacin haciendo clic con el mouse en el botn Aceptar de la ventana Frecuencias.

P g i n a | 550

El resultado es el siguiente:

Mire, los datos de la variable materia se analizan agrupados. Todo anlisis sucesivo que se realicen con esos datos, siempre se harn con los valores agrupados. Si se desea dejar sin efecto la agrupacin, se debe activar la opcin: Analizar todos los casos, no crear los grupos: ficha Datos/Dividir archivo

P g i n a | 551

ANLISIS DESCRIPTIVO DE DATOS SELECCIONADOS

En SPSS se consigue excluir algunos casos en el anlisis estadstico es decir seleccionar solo los casos que cumplan un criterio de seleccin. Ejercicio: Del archivo LibrosSeleccion.sav (ver la carpeta Material Complementario Mdulo II), seleccionar los casos que correspondan a los libros cuya vejez es de 4 a 6 aos (Valor=2), y realizar un anlisis descriptivo de frecuencias de la variable materia. Solucin: 1. Seleccionar los casos(registros) Ingrese al men: Datos, Opcin: Seleccionar casos Seleccionar la opcin: Si se satisface la condicin.

P g i n a | 552

Luego haz clic en el botn para establecer el criterio de seleccin. As tenemos: Se agrega la variable vejez, para crear la expresin de criterio: vejez=2

Se finaliza haciendo clic en el botn Continuar y en la ventana. Seleccionar casos se hace clic en el botn Aceptar. Observar el resultado de los datos en la figura:

Los datos que aparecen con diagonal en la cabecera de fila de cada uno de los casos no estn seleccionados y en consecuencia no sern analizados. Los seleccionados son los de valor 2: Entre 4 y 6.

P g i n a | 553

Si deseas comprobar esta seleccin, activa las etiquetad de valor: Men Ver/Etiqueta de valor

2. Analizando la muestra de los casos seleccionados: Haz clic en el men Analizar/Anlisis descriptivo/Frecuencias, para la variable materia.

Haz clic en el botn Aceptar y el resultado es el siguiente.

P g i n a | 554

Observa que la muestra ya no es 30, sino solo 10, sobre los cuales se hizo el anlisis.

!
5

Importante: Espero haya entendido lo facil y til que es trabajar este programa. La siguiente unidad continuaremos con el anlisis estadistico y estadstica aplicada.

MEDIDAS DESCRIPTIVAS DE LOS DATOS

Ahora que ya conocemos como obtener la frecuencia de la muestra estadstica, debemos tambin aprender a obtener las medidas descriptivas de los datos: ndices de Dispersin, ndices de Tendencia Central, Distribucin y Valores Percentiles. Los conceptos tericos que usaremos en el anlisis se encuentran detallados en las lecturas modulares, por ello te pido agenciarte de ellos.

Ejercicio: Siguiendo con los datos del archivo LibrosDescriptivas.sav (ver la carpeta Material Complementario Mdulo II), realizar un anlisis estadstico descriptivo de la variable Precio.

P g i n a | 555

Solucin: 1. Selecciona el men Analizar/ Estadsticos

descriptivos/Frecuencias. 2. En la ventana Frecuencias, agregue la variable precio para su anlisis.

3. Haz clic en el botn Estadsticos y en la ventana Frecuencias: Estadsticos se muestran varias medidas estadsticas las cuales se seleccionan las que son convenientes para el anlisis:

4. Haz clic en el botn Continuar y luego en el botn Aceptar 5. El resultado ser:

P g i n a | 556

Dnde: El precio promedio de los libros es de 178.87 La asimetra es 1.192, es decir es asimtricamente positiva. El precio menor en los libros es 68 El precio mayor en los libros es 400 El percentil 20, indica que el 20% de los libros tienen precios menores que 104.60 El percentil 25 (o primer cuartil) quiere decir que el 25% de los libros tienen precios menores a 121.75 El percentil 50 (tambin es la mediana), indica que el 50% de los libros tienen precios menores a 160.50

TABLAS DE CONTINGENCIA

Son aquellas tablas de doble entrada que clasifica la muestra de acuerdo a un doble criterio. A travs de ellas se alcanza obtener una descripcin cuantitativa de las distintas cualidades vicariantes de la muestra, en forma de frecuencias y porcentajes. La caracterstica ms importante de ellas es el contraste de homogeneidad o independencia que propone, como hiptesis a rechazar, que ambos criterios de clasificacin son independientes.

P g i n a | 557

Ejercicio: Se desea medir la asociacin entre los niveles de ansiedad y gnero en una muestra de 38 estudiantes. Para ello tenemos en el archivo de datos TablaContingencia.sav (ver la carpeta Material Complementario Mdulo II). Solucin: A. Disee la tabla de contingencia: 1. Selecciona el men: Analizar, Opcin: Estadsticos Descriptivos, Opcin: Tablas de Contingencia 2. Colocar las variables ansiedad (en Filas) y sexo (en columnas) respectivamente:

3. Luego hacer clic en el botn Estadsticos y activar la casilla Chicuadrado y luego haz clic en el botn Continuar.

P g i n a | 558

4. Al regresar a la ventana Tablas de contingencia, se accede al botn Casillas: y activa las casillas: Observadas y Esperadas.

5. Haga clic en el botn Continuar 6. Finalmente cerrar todas las ventanas y observar resultados: los siguientes

P g i n a | 559

B. Interpretacin y anlisis de los resultados: El Chi cuadrado terico es 5.99 (con 2 grados de libertad y = 0.05) y es menor que 9.646 (Chi cuadrado esperado), por lo tanto se dice que las mujeres (2) tienen menores niveles de ansiedad que los hombres (1). Tambin se logra comparar 0.008 (Sig. asinttica bilateral) con 0.05 y se llega a la misma conclusin.

P g i n a | 560

El uso de Chi-cuadrado no se aplica cuando se tiene que ms del 25% de las observaciones esperadas son menores que 5.

COEFICIENTE DE CORRELACIN DE PEARSON

La correlacin es una prueba de hiptesis que debe ser sometida a contraste y el coeficiente de correlacin cuantifica la correlacin entre dos variables, cundo sta existe. Ejercicio: Utilice el archivo de datos Correlacin.sav (ver la carpeta Material Complementario Mdulo II), para calcular el coeficiente de correlacin de la siguiente serie de datos de estatura y peso de los alumnos de una clase:

Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso 1 2 3 4 5 6 7 8 9 10 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29 32 33 34 30 32 35 34 32 32 35 11 12 13 14 15 16 17 18 19 20 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29 33 35 34 30 33 34 35 32 33 33 21 22 23 24 25 26 27 28 29 30 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29 33 34 34 31 32 34 34 31 35 34

Solucin: Abra el archivo Correlacin.sav (ver la carpeta Material Complementario Mdulo II). 1. Selecciona en el men: Analizar, la opcin: Correlaciones y luego clic en la opcin: Bivariadas 2. Agregue las variables a analizar su relacin: estatura y peso.

P g i n a | 561

3. Haz clic en el botn Aceptar y el resultado es el siguiente:

Como el coeficiente de correlacin de Pearson entre estatura y peso es de 82.8%, entonces la relacin existente entre estas dos variables es elevada. Otra herramienta muy importante en SPSS, es el ANALISIS DE REGRESION.

P g i n a | 562

ANLISIS DE REGRESIN

El anlisis de regresin es una tcnica estadstica que estudiar la relacin entre variables. Se emplea para pronosticar valores de una variable criterio (Y: dependiente) a partir de datos histricos de una variable predictora (X: independiente). Para definir la recta hay que determinar los valores de los parmetros de a y b. Ejercicio: Calcular la ecuacin de regresin de los datos de altura y peso de los alumnos de una clase. Considera que la altura es la variable independiente X y el peso es la variable dependiente Y. Usa el archivo de datos Regresin.sav (ver la carpeta Material Complementario Mdulo II)

Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso 1 2 3 4 5 6 7 8 9 10 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29 32 33 34 30 32 35 34 32 32 35 11 12 13 14 15 16 17 18 19 20 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29 33 35 34 30 33 34 35 32 33 33 21 22 23 24 25 26 27 28 29 30 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29 33 34 34 31 32 34 34 31 35 34

Solucin: Abra el archivo Regresin.sav (ver la carpeta Material Complementario Mdulo II) 1. Selecciona el men: Analizar, la opcin: Regresin y clic en la opcin: Lineal 2. Agregue la variable estatura(al recuadro de independientes) y la variable peso (al recuadro de dependientes).

P g i n a | 563

3. Los resultados son:

P g i n a | 564

4. Ahora obtendr la ecuacin de la regresin lineal, sabiendo que es: Y=b+ax La ecuacin a usar en nuestro ejercicio ser: Y = -17.714 + 40.265*X 5. Podemos predecir los pesos de los siguientes datos: Estatura X 1,20 1,21 1,26 Peso Y 30,6 31,0 33,0
Muy bien, espero que todo lo aprendido en todas nuestras sesiones, le hayan servido para medir la importancia de nuestro curso en tu formacin profesional. Muchas gracias y nos veremos muy pronto.

P g i n a | 565

PRACTICA GUIADA

Crear una tabla que resuma la profesin con los ingresos, del archivo de datos Profesionales.sav (ver la carpeta Material Complementario Mdulo II). Es decir crear una tabla de doble entrada con estas variables.

Solucin: 1. Selecciona el men Analizar/Tablas/Tabla personalizada. 2. Ahora arrastra con el mouse las variables Ingreso (a filas) y Profesin (a columnas) y colquelo en los recuadros Filas y Columnas respectivamente.

3. Haz clic en el botn Aceptar y obtendrs el resultado:

P g i n a | 566

4. Ahora crearemos un grfico de barras que represente la frecuencia de las edades actuales de los profesionales. Selecciona Agregue la el variable de men las cuales Analizar/Estadsticos se quiere obtener su descriptivos/Frecuencias. representacin grfica (Edad), y a continuacin se pulsa el botn Grficos. Elige el tipo de grfico:

Haz clic en el botn Continuar y luego en el botn Aceptar, el resultado ser:

P g i n a | 567

5. Ahora se desea medir la asociacin entre las profesiones e ingresos en una muestra de 33 profesionales. Para ello usaremos el archivo de datos Profesionales.sav. Selecciona el men: Analizar/Estadsticos Descriptivos/Tablas de Contingencia Coloque las variables Profesin (en Filas) e Ingreso (en columnas) respectivamente:

Luego hacer clic en el botn Estadsticos y activar la casilla Chicuadrado y luego haz clic en el botn Continuar. Al regresar a la ventana Tablas de contingencia, se accede al botn Casillas: y activa las casillas: Observadas y Esperadas. Finalmente cerrar todas las ventanas y observe resultados: los siguientes

P g i n a | 568

P g i n a | 569

AUTOEVALUACIN: Ahora demuestra lo aprendido: 1. Responda V (Verdadero) o F (Falso), marca con X: V F

a. Las frecuencias solo se representan cuantitativamente ( ) ( b. La media es un ndice de dispersin ( ) ( c. Podemos insertar grficos en 3D, en el SPSS ( ) ( d. El error tpico de la muestra debe ser >10%, para rechazarlo ( ) ( 2. Es un indicador de dispersin de una muestra: a. Moda b. Media c. Asimetra d. Cuartiles e. Desviacin estndar 3. Al crear una tabla personalizada en SPSS, consigues usar: a. 2 variables b. 1 variable c. Ninguna variable d. Todas las anteriores.

) ) ) )

P g i n a | 570

Actividades de aprendizaje

Prctica de Reforzamiento
Con la presente prctica, el alumno podr reforzar sus conocimientos en la utilizacin de tcnicas avanzadas de SPSS, en el anlisis estadstico de una muestra de datos. Nota:
Los archivos a usar en cada actividad a desarrollar, las puedes encontrar en la Carpeta Material Complementario MOD II.

ACTIVIDAD 01: CASO 01: TABLAS DE CONTINGENCIA, COEFICIENTE DE CORRELACION Y ANALISIS DE REGRESION. Ejercicio: Usando Situacion.sav (ver carpeta Material Complementario Modulo II) realice lo siguiente: A. Disee una tabla de contingencia para medir la asociacin entre Estado civil e Ingresos familiares. B. Calcular el coeficiente de correlacin entre las variables edad e ingresos de los encuestados. C. Calcular la ecuacin de regresin entre las variables edad e ingresos de los encuestados. Considera que la edad es la ingresos es la variable "Y". variable "X" y los

CONSIGNA: Disee una tabla de contingencia para medir la asociacin entre Estado civil e Ingresos familiares 1. Abrir el archivo en mencin. Para nuestro caso Situacion.sav 2. Seleccione la Vista de datos y elija el men AnalizarEstadsticos descriptivosTablas de contingencia

3. Aadir una variable a Filas(Estado civil) y la otra a Columnas (ingreso familiar) 4. Aceptar la ventana

P g i n a | 572

Calcular el coeficiente de correlacin entre las variables edad e ingresos de los encuestados 1. Debes definir la variable independiente (edad) y la variable dependiente (ingresos). 2. Seleccione el men Analizar Correlaciones Bivariadas y luego agregar al panel recuadro derecho las variables a analizar su correlacin (edad e ingresos).

3.

Aceptar su ventana.

P g i n a | 573

4. Aparecer la ventana de resultados. Si la correlacin es est cercana a 1; entonces diremos que ambas variables guardan una estrecha relacin, caso contrario no. De este resultado depende posteriormente el anlisis de regresin que se aplique a ambas variables. 5. Grabe su resultado. Calcular la ecuacin de regresin entre las variables edad e ingresos de los encuestados. Considera que la edad es la variable "X" y los ingresos es la variable "Y". Nota: Debes conocer que la ecuacin lineal a calcular es: Y=AX+-B, donde A (coeficiente de la variable X: edad) y B (constante de la ecuacin). 1. Conociendo el resultado de correlacin de las variables edad e ingresos, seleccione el men AnalizarRegresinLineales

2. Agregar

la

variable

independiente

(X:

edad)

la

variable

dependiente (Y: ingresos) a su respectivo recuadro.

P g i n a | 574

3. Aceptar su ventana 4. En la ventana de resultados se mostrar el valor del coeficiente de la variable edad y el valor de la constante respectiva, con los cuales se crear la ecuacin lineal

P g i n a | 575

RUBRICA DE EVALUACIN
CRITERIOS Deficiente (0) Regular (9) Bueno (18)

CASO 01: Utiliza tcnicas avanzadas para analizar una muestra estadstica de datos.

No crea nada.

Realiza un anlisis estadstico a travs de tcnicas avanzadas de SPSS, pero no interpreta los resultados obtenidos.

TOTAL ACTIVIDAD 01 0 puntos PUNTUALIDAD UNIDAD 10

9 puntos

Realiza un anlisis estadstico a travs de tcnicas avanzadas de SPSS como tablas de contingencia, correlaciones y regresiones, interpretando los resultados obtenidos 18 puntos 02 puntos

http://www.ucv.edu.pe/cis/ cis@ucv.edu.pe

P g i n a | 576

You might also like