Professional Documents
Culture Documents
Anlisis de la
informacin
7. Anlisis de la
informacin
7.1. Anlisis e interpretacin de los datos
Las tareas previas al anlisis de datos, una vez completados todos los aspectos
de la captura, deben llevarse a cabo antes de iniciar el anlisis propiamente
dicho. Esas tareas consisten en codificar las respuestas de preguntas abiertas,
cargar los datos y depurar errores de carga o inconsistencias.
1
Figura 1: Fases del anlisis de datos
Se denomina anlisis univariado al que considera una por una cada variable del
estudio.
2
Figura 2: Anlisis de datos
Fuente: [Imagen intitulada sobre anlisis de datos] (s. f.). Recuperada de http://goo.gl/LVVo9q
Tomemos como ejemplo la encuesta sobre uso del tiempo (Indec, 2013) para
mostrar los conceptos involucrados en este mdulo.
3
28,9 % respondi No, y el 0,1 % Ns/Nr. La cuarta columna indica los
porcentajes vlidos. Como a esta pregunta la responden todos los encuestados,
coincide con la columna anterior. Pero si la pregunta se realizara a solo una
parte de los encuestados, el porcentaje de una y otra columna diferira.
Finalmente, la quinta columna indica el porcentaje acumulado. Si bien puede
analizarse, en el caso de las variables cualitativas este anlisis es menos
interesante que en el caso de las variables cuantitativas.
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Ns/Nr 64 ,1 ,1 100,0
4
Figura 4: Grfico circular. Diagrama de sectores
5
Medidas de posicin o tendencia central
Las medidas de tendencia central son medidas sintticas que permiten indicar,
con un nico nmero, un valor de referencia del conjunto de datos. Las
principales son: la media, la mediana y la moda.
Mediana = 5
Mo = 45 aos
6
Tabla 2: Salida de SPSS. Estadsticas descriptivas
Estadsticos
Tiempo dedicado a trabajo voluntario
N Vlido 65352
Perdidos 0
Media ,5487
Mediana ,0000
Moda ,00
Tomemos el conjunto de edades de los gerentes de 8 empresas: 40, 45, 45, 48,
52, 60, 65, 68. El rango es:
Rango = 68 40 = 28 aos
Media: 52,875
7
para poder contar con una medida de dispersin, se eleva cada diferencia al
cuadrado. La varianza se calcula dividiendo la suma de desvos al cuadrado en la
cantidad de casos:
40 -12,875 165,765625
45 -7,875 62,015625
45 -7,875 62,015625
48 -4,875 23,765625
52 -0,875 0,765625
60 7,125 50,765625
65 12,125 147,015625
68 15,125 228,765625
Suma: 0 740,875
Hay que tener en cuenta que la unidad de medida de la varianza est expresada
en la misma unidad de medida que la variable original, pero elevada al
cuadrado, como lo expresa el resultado anterior (en aos2).
8
DS = 92,609 aos2 = 9,623 aos
Figura 6: Varianza
CV = (DS /Media).100
CV = (9,623/52,875).100 = 18,2 %
La siguiente tabla muestra la salida de SPSS respecto de medidas de dispersin, en este
caso de la variable tiempo dedicado a trabajo voluntario, con datos de la encuesta
de uso del tiempo (Indec, 2013).
Estadsticos
Tiempo dedicado a trabajo voluntario
N Vlido 65352
Perdidos 0
Desviacin estndar 3,16122
Varianza 9,993
Rango 105,00
Fuente: elaboracin propia.
9
Medidas de asimetra y curtosis
Figura 7: Asimetra
10
Figura 8: Curtosis
N Vlido 65352
Perdidos 0
Asimetra 11,570
Error estndar de asimetra ,010
Curtosis 188,328
Error estndar de curtosis ,019
11
Figura 9: Otras estadsticas descriptivas
Razones y tasas
12
Una tasa es la relacin entre una categora y un total. Por ejemplo, la tasa de
desocupacin, que mide la proporcin de la poblacin activa que est sin
empleo en cierto perodo y busca uno de manera activa.
Una razn es un cociente entre dos categoras de una variable. Por ejemplo, la
razn de masculinidad en una poblacin mide la cantidad de hombres respecto
de mujeres en un conjunto.
Referencias: Rosa: pases con un ndice de masculinidad menor que 1 (ms mujeres que
hombres). Azul: pases con un ndice de masculinidad mayor que 1 (ms hombres que mujeres).
Verde: pases con un ndice de 1. Gris: sin datos. Fuente: [Imagen intitulada sobre razn de
masculinidad en el mundo] (s. f.). Recuperada de http://goo.gl/0fKKHL
13
Anlisis de la no respuesta
Validez y confiabilidad
Confiabilidad
Validez
14
poblacional) y a pruebas de hiptesis (decisiones basadas en una
fundamentacin estadstica).
Fuente: [Imagen intitulada sobre anlisis de datos] (s. f.). Recuperada de http://goo.gl/1hA9S3
Este coeficiente sirve para cuantificar la relacin entre dos variables, ambas
medidas en escalas de intervalo o razn.
15
Tabla 6: Interpretacin del coeficiente de correlacin
Valor Significa
-1 Correlacin negativa perfecta.
-0.9 Correlacin negativa muy fuerte.
-0,75 Correlacin negativa considerable.
-0,5 Correlacin negativa media.
-0,25 Correlacin negativa reducida.
-0,1 Correlacin negativa muy dbil.
0 No existe correlacin entre las variables.
0,1 Correlacin positiva muy dbil.
0,25 Correlacin positiva reducida.
0,5 Correlacin positiva media.
0,75 Correlacin positiva considerable.
0,9 Correlacin positiva muy fuerte.
1 Correlacin positiva perfecta.
16
La frmula de clculo parece sumamente compleja, pero veamos con un
ejemplo cmo se aplica.
Tabla 7: Datos
Una primera exploracin grfica nos permite tener una hiptesis sobre la
relacin entre las variables:
17
Figura 15: Diagrama de dispersin
10
9,5
9
8,5
8
7,5
7
6,5
6
5,5
5
5 6 7 8 9 10
Se observa una relacin positiva entre las variables consideradas. Ahora, con el
coeficiente de correlacin de Pearson, podemos cuantificar esta relacin.
40 -12,875 165,765625
45 -7,875 62,015625
45 -7,875 62,015625
48 -4,875 23,765625
52 -0,875 0,765625
60 7,125 50,765625
65 12,125 147,015625
68 15,125 228,765625
Suma: 0 740,875
18
Tabla 9: Clculo de coeficiente de correlacin
Nota Notas
promedio promedio en
en el el primer ao
secundario en la carrera
(xi) universitaria
(yi) xiyi xi2 yi2
6 5 30 36 25
7 6 42 49 36
7,5 6 45 56,25 36
7 8 56 49 64
8 6,5 52 64 42,25
8 7,5 60 64 56,25
9 8 72 81 64
19
r= 10 .536,9 - 77,1 . 68,5
10. 603,85- (77,1)2 10.482,25 (68,5)2
r = 0,7917
20
Asociacin entre dos variables categricas
Jvenes 48 42 60 150
Adultos 70 105 175 350
Total 118 147 235 500
Para obtener esta tabla que refleje independencia, tenemos que hacer algunos
clculos auxiliares. Para esto tengamos presente los conceptos de frecuencias
marginales, que son las que corresponden a los mrgenes de la tabla. All
figuran, tanto para fijas como para columnas, los totales. En la siguiente tabla
slo dejamos los datos de las frecuencias marginales.
21
Tabla 11: Tabla de contingencia
Jvenes 150
Adultos 350
Total 118 147 235 500
a11 = 35,4
22
a12= (150 . 147) / 500 = 44,1
a13= (150 . 235) / 500 = 70,5
a21= (350 . 118) / 500 = 82,6
a22= (350 . 147) / 500 = 102,9
a23= (350 . 235) / 500 = 164,5
Para determinar las diferencias, vamos a trabajar celda por celda y elevar tales
valores al cuadrado.
23
Generalmente, para una prueba estadstica de la independencia de dos
variables categricas, se usa el estadstico:
Que tiene distribucin chi cuadrado, donde O hace referencia a los valores
de las frecuencias observadas y E a las frecuencias esperadas.
24
7.2 Informe y exposicin de conclusiones
Fuente: [Imagen intitulada sobre otras estadsticas descriptivas] (s. f.). Recuperada de
http://goo.gl/WlktRs
25
Asimismo, no puede descuidarse la atencin en cuanto a la situacin o el
contexto. En este sentido, tambin siguiendo las recomendaciones de Naciones
Unidas (2009) tendientes a entender el contexto en el que se comunican los
datos, se sugiere usar las herramientas del lenguaje, la estructura y la
presentacin ms apropiada para transmitir el mensaje (p. 3).
26
ndices: tabla de contenido de todos los captulos y, si corresponde, un
ndice de tablas y figuras.
27
Mtodo: se presentan el enfoque y los diseos adoptados, la
contextualizacin temporal y espacial, y aspectos de la muestra
utilizada. Tambin deben estar los procedimientos, los mtodos de
captura de datos y las operaciones de procesamiento y anlisis
aplicadas.
28
estas referencias. En algunos casos el autor elige qu estilo usar; en
otros (por ejemplo, en artculos para revistas o congresos), se especifica
qu estilo se debe aplicar como condicin.
comenzar cada prrafo con la idea central del prrafo. Luego desagregar
el anlisis en sus componentes relevantes;
29
Cuando se elabora un grfico para un reporte, se debe tener en cuenta que,
adems de ser atractivo, no pierda sencillez, claridad y precisin. Un grfico no
debe inducir a errores de interpretacin. El tipo de grfico que se defina aplicar
debe ser lo ms sinttico posible, de modo que haga ms fciles las
comparaciones y destaque las diferencias, si existen, o haga evidenciar las
tendencias que describe.
Grfico de barras:
30
Figura 21: Grficos de barras
Grficos de lneas
Los grficos de lneas permiten ilustrar tendencias a lo largo del tiempo. Por eso
es el tipo de grfico ms conveniente cuando se necesita mostrar series
temporales.
31
Figura 23: Grficos de lneas
Grficos circulares
32
La recomendacin, desde el punto de vista de la comunicacin, es que solo
conviene mostrar un pequeo nmero de categoras (no ms de seis en un
grfico).
Diagrama de dispersin
33
Cmo lograr que un grfico sea efectivo?
Los datos
La representacin de los datos son las barras, lneas, sectores o puntos de los
diferentes grficos mencionados previamente.
Informacin de apoyo
El ttulo del grfico debe dar una idea clara y concisa de lo que el grfico
contiene. Los ttulos pueden ser:
34
La fuente de los datos debe estar indicada en la parte inferior del
grfico.
Figura 26: Dos grficos con diferentes escalas para ilustrar los mismos datos
Nubes de etiquetas
Las nubes de etiquetas son una forma til de identificar los trminos comunes
de un texto y construir taxonomas de palabras clave.
35
Figura 27: Nube de etiquetas
Fuente: [Imagen intitulada sobre nube de palabras] (s. f.). Recuperada de http://goo.gl/lllPx4
Otros grficos
36
Figura 29: Grfico de sectores enriquecido
En primer lugar, la tabla que forma parte del reporte o de una presentacin
tiene que tener algn nivel de sntesis y no todo el detalle de los datos
recogidos.
37
Fuente: indica de dnde provienen los datos, es decir, la organizacin
que elabor los datos, el mtodo de recogida de datos y el perodo de
obtencin, si corresponde.
38
No dejar ninguna celda de datos vaca.
39
Referencias
Bsica:
Hernndez Sampieri, R., Fernndez Collado, C., & Baptista Lucio, P. (2010).
Metodologa de la investigacin. Mxico: Mc Graw Hill.
Ampliatoria:
Di Pietro, S.; Tfalo, A.; Medela, P. y Pitton, E. (2013). La situacin educativa a travs
de los censos nacionales de poblacin. Direccin General de Evaluacin de la Calidad
Educativa: Buenos Aires.
Rivas, A., Vera, A. & Bezem, P. (2010). Radiografa de la educacin argentina. CIPPEC:
Buenos Aires.
Imgenes
40
Imagen intitulada sobre razn de masculinidad en el mundo] (s. f.). Recuperada de
http://goo.gl/0fKKHL
41