You are on page 1of 42

Mdulo 4

Anlisis de la
informacin
7. Anlisis de la
informacin
7.1. Anlisis e interpretacin de los datos

Anlisis de datos: conjunto de transformaciones numricas de los


datos para conseguir que stos sean interpretables, generalmente
en relacin con la hiptesis de investigacin (Del Ro Sadornil,
2013, p. 22).

Las tareas previas al anlisis de datos, una vez completados todos los aspectos
de la captura, deben llevarse a cabo antes de iniciar el anlisis propiamente
dicho. Esas tareas consisten en codificar las respuestas de preguntas abiertas,
cargar los datos y depurar errores de carga o inconsistencias.

El anlisis estadstico involucra diferentes procedimientos descriptivos e


inferenciales que se realizan, en su totalidad, a travs de la aplicacin de
software especfico para este fin. Durante este mdulo los ejemplos se
presentarn utilizando SPSS. En el texto de bibliografa bsica se emplea
predominantemente Minitab. En ambos casos son ilustraciones. No se
pretende que el alumno sepa manejarlos como resultado de este curso, sino
que pueda interpretar resultados bsicos provenientes de estos programas de
uso generalizado.

1
Figura 1: Fases del anlisis de datos

Fuente: elaboracin propia a partir de Hernndez Sampieri et al., 2010.

7.1.1. Anlisis descriptivos: distribucin de frecuencias y


medidas de tendencia central
Al cargar los datos en el respectivo programa de anlisis estadstico queda
determinada una matriz donde cada caso es una fila y cada columna una
variable o un aspecto considerado. En el caso de una encuesta, una variable
puede corresponder a una pregunta de un cuestionario (preguntas que
admiten una sola respuesta) o puede ser necesaria ms de una variable para
capturar la informacin proveniente de una pregunta (aquellas que admiten
respuestas mltiples).

Para decidir qu tipo de anlisis descriptivo se puede aplicar, hay que


considerar el nivel de medicin de cada variable (nominal, ordinal, de intervalo
o de razn), al tiempo que las hiptesis a las que responde y cmo est
formulada.

Se denomina anlisis univariado al que considera una por una cada variable del
estudio.

2
Figura 2: Anlisis de datos

Fuente: [Imagen intitulada sobre anlisis de datos] (s. f.). Recuperada de http://goo.gl/LVVo9q

Distribucin de frecuencias y su representacin grfica

La frecuencia de una variable es la representacin de la cantidad de veces que


aparece en cierto conjunto cada uno de los valores de esa variable. Esta
representacin sinttica puede aplicarse a variables de todos los niveles de
medicin.

Los indicadores de frecuencias son:

Frecuencia absoluta o simplemente frecuencia: cantidad de veces que


aparece cada valor.

Frecuencia relativa: proporcin de las veces que aparece cada valor en


el total. Se la suele expresar en porcentajes a fin de facilitar su
interpretacin.

Frecuencia acumulada: apariciones totales acumuladas hasta cierto


valor de la variable.

Tomemos como ejemplo la encuesta sobre uso del tiempo (Indec, 2013) para
mostrar los conceptos involucrados en este mdulo.

La siguiente tabla presenta una salida de SPSS a partir de la base de datos


correspondientes. Veamos qu informacin contiene. Cada columna posee
informacin relevante. La primera indica los valores posibles de la variable (S,
No, Ns/Nr). La segunda muestra la frecuencia absoluta, es decir, cuntos casos
en la encuesta respondieron cada valor. En este caso, 46.372 dijeron S, en
tanto 18.916 dijeron No. La tercera columna presenta la frecuencia relativa
expresada en trminos porcentuales. El 71 % respondi S, mientras que el

3
28,9 % respondi No, y el 0,1 % Ns/Nr. La cuarta columna indica los
porcentajes vlidos. Como a esta pregunta la responden todos los encuestados,
coincide con la columna anterior. Pero si la pregunta se realizara a solo una
parte de los encuestados, el porcentaje de una y otra columna diferira.
Finalmente, la quinta columna indica el porcentaje acumulado. Si bien puede
analizarse, en el caso de las variables cualitativas este anlisis es menos
interesante que en el caso de las variables cuantitativas.

Tabla 1: Salida de SPSS

Particip en quehaceres domsticos

Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado

Vlido S 46372 71,0 71,0 71,0

No 18916 28,9 28,9 99,9

Ns/Nr 64 ,1 ,1 100,0

Total 65352 100,0 100,0

Fuente: elaboracin propia.

Las frecuencias tambin pueden representarse a travs de grficos.

Figura 3: Grfico de barras

Fuente: elaboracin propia.

4
Figura 4: Grfico circular. Diagrama de sectores

Fuente: elaboracin propia.

Figura 5: Polgono de frecuencias

Fuente: elaboracin propia.

5
Medidas de posicin o tendencia central

Las medidas de tendencia central son medidas sintticas que permiten indicar,
con un nico nmero, un valor de referencia del conjunto de datos. Las
principales son: la media, la mediana y la moda.

La media es el promedio de todos los valores de un conjunto de datos


cuantitativos (escalas de intervalo o razn). Se calcula sumando todos los
valores y dividiendo esa suma por la cantidad de casos totales que el conjunto
incluya. Por ejemplo, si tenemos los datos de la cantidad de miembros de 5
familias en una zona: 2, 3, 5, 5 y 7 miembros respectivamente, la media de
miembros por familia es:

Media = (2 + 3 + 5 + 5 + 7) / 5 = 22/5 = 4,4 miembros por familia.

La mediana corresponde al valor del conjunto de datos (ordenados de menor a


mayor) que se encuentra exactamente en medio de la distribucin, o ms
formalmente, el valor tal que no ms de la mitad de los datos de la distribucin
es mayor que tal valor, y no ms de la mitad de los datos es menor a ese valor.
La mediana se calcula para variables de escalas de razn, intervalo u ordinal.

En el ejemplo anterior, la mediana (Me) ser el valor que ocupe la tercera


posicin de la serie ordenada:

Mediana = 5

La mediana puede o no pertenecer al conjunto. En el caso de los conjuntos con


un nmero par de casos, la mediana se calcula como el promedio de los dos
valores centrales. Por ejemplo, si tenemos las edades de los gerentes de 8
empresas de la ciudad: 40, 45, 45, 48, 52, 60, 65, 68, la mediana es Indec:

Me = (48 + 52) /2= 50 aos

La moda seala el valor que tiene ms repeticiones de un conjunto de datos.


Una distribucin puede tener ms de una moda o valor modal. Del ejemplo
anterior (edades de los gerentes), la moda es:

Mo = 45 aos

Veamos cmo es la salida de datos de SPSS al analizar las medidas de tendencia


central de un conjunto de datos. La variable que consideramos de la encuesta
de uso del tiempo (Indec, 2013) es el tiempo dedicado la semana anterior a
actividades de voluntariado.

6
Tabla 2: Salida de SPSS. Estadsticas descriptivas

Estadsticos
Tiempo dedicado a trabajo voluntario

N Vlido 65352

Perdidos 0
Media ,5487
Mediana ,0000
Moda ,00

Cmo interpretar estos resultados?

La tabla nos muestra que, en promedio, de los 65,352 encuestados, el tiempo


dedicado a actividades de voluntariado la semana anterior es 0,5487 horas. Si
consideramos el valor central de la distribucin (Mediana), vemos que el 50%
(mitad de la distribucin) dedica, a lo sumo, 0 horas a voluntariado, y que el 50
% dedica 0 horas o ms. Finalmente, tambin podemos afirmar que lo ms
frecuente es que se dediquen 0 horas a actividades de voluntariado.

Medidas de dispersin o variabilidad

Como complemento necesario de las medidas de tendencia central,


necesitamos otras medidas que hagan referencia a cun concentrados estn los
datos del conjunto respecto de tales medidas de tendencia central. Estas
medidas se denominan de dispersin. Las medidas de dispersin ms utilizadas
son: rango, varianza, desviacin estndar y coeficiente de variacin.

El rango o recorrido se define como la diferencia entre el mayor valor y


el menor valor de un conjunto de datos cuantitativos.

Tomemos el conjunto de edades de los gerentes de 8 empresas: 40, 45, 45, 48,
52, 60, 65, 68. El rango es:

Rango = 68 40 = 28 aos

La varianza surge de calcular el promedio de los desvos al cuadrado de cada


valor del conjunto respecto de la media. Veamos cmo se calcula para el
ejemplo anterior:

Media: 52,875

Como puede observarse, por la propia naturaleza de la definicin de la media,


la suma de los desvos de cada valor respecto de la media, es cero. Por eso,

7
para poder contar con una medida de dispersin, se eleva cada diferencia al
cuadrado. La varianza se calcula dividiendo la suma de desvos al cuadrado en la
cantidad de casos:

Var = 740,875/8 = 92,609 aos2

Tabla 3: Clculo de varianza

Valor (xi) xi - Media (xi Media)2

40 -12,875 165,765625

45 -7,875 62,015625

45 -7,875 62,015625

48 -4,875 23,765625

52 -0,875 0,765625

60 7,125 50,765625

65 12,125 147,015625

68 15,125 228,765625

Suma: 0 740,875

Fuente: elaboracin propia.

Hay que tener en cuenta que la unidad de medida de la varianza est expresada
en la misma unidad de medida que la variable original, pero elevada al
cuadrado, como lo expresa el resultado anterior (en aos2).

La desviacin estndar (la medida de dispersin ms utilizada) surge de tomar


la raz cuadrada positiva de la varianza. Por lo tanto, la desviacin estndar s
est expresada en la misma unidad de medida que la variable original y que la
media.

Utilizando los datos del ejemplo anterior:

8
DS = 92,609 aos2 = 9,623 aos

Figura 6: Varianza

Fuente: [Imagen intitulada sobre varianza] (s. f.). Recuperada de http://goo.gl/xMeuV6

El coeficiente de variacin vincula la desviacin estndar con la media y permite


comparar la variabilidad de varias distribuciones entre s:

CV = (DS /Media).100

Con los datos del ejercicio anterior:

CV = (9,623/52,875).100 = 18,2 %
La siguiente tabla muestra la salida de SPSS respecto de medidas de dispersin, en este
caso de la variable tiempo dedicado a trabajo voluntario, con datos de la encuesta
de uso del tiempo (Indec, 2013).

Tabla 4: Salida de SPSS. Estadsticos descriptivos

Estadsticos
Tiempo dedicado a trabajo voluntario

N Vlido 65352

Perdidos 0
Desviacin estndar 3,16122
Varianza 9,993
Rango 105,00
Fuente: elaboracin propia.

9
Medidas de asimetra y curtosis

Las medidas de asimetra y curtosis hacen referencia a la forma de la grfica de


la distribucin de datos.

La asimetra mide cun diferente es una distribucin especfica respecto de una


distribucin terica denominada normal, que es simtrica. Si el indicador es 0
significa que la distribucin es simtrica (no difiere en simetra de la
distribucin normal). Si la medida de asimetra es positiva, quiere decir que hay
ms valores agrupados a la izquierda de la curva; y, por el contrario, si el
indicador es negativo, quiere decir que la mayor proporcin de datos se agrupa
del lado derecho del eje de simetra.

Figura 7: Asimetra

Fuente: [Imagen intitulada sobre asimetra] (s. f.). Recuperada de http://goo.gl/R1w7IX

La curtosis indica qu tan plana o empinada es la distribucin. Nuevamente, el


patrn de comparacin es la distribucin normal. Si la curtosis es 0 significa que
la distribucin que consideramos es igual de empinada que la normal; si es
positiva quiere decir que es ms empinada que la normal; y, por el contrario, si
es negativa, quiere decir que es ms aplanada que la distribucin normal.

10
Figura 8: Curtosis

Fuente: [Imagen intitulada sobre curtosis] (s. f.). Recuperada de http://goo.gl/1ooLfX

La siguiente tabla muestra la salida de SPSS respecto de medidas de curtosis y


asimetra, en este caso de la variable tiempo dedicado a trabajo voluntario,
con datos de la Encuesta de uso del tiempo (Indec, 2013). Vemos que la
distribucin del tiempo es asimtrica positiva (los valores estn concentrados
en el lado izquierdo respecto del eje de simetra) y la curtosis es positiva. Por lo
tanto, la distribucin es bastante ms empinada que la normal. El grfico
siguiente permite observar la distribucin de datos de la variable tiempo
dedicado a trabajo voluntario, junto con la distribucin normal (lnea azul) de
referencia.

Tabla 5: Salida de SPSS

Tiempo dedicado a trabajo voluntario

N Vlido 65352

Perdidos 0
Asimetra 11,570
Error estndar de asimetra ,010
Curtosis 188,328
Error estndar de curtosis ,019

Fuente: elaboracin propia.

11
Figura 9: Otras estadsticas descriptivas

Fuente: elaboracin propia a partir de Hernndez Sampieri et al., 2010.

Figura 10: Ejemplo

Fuente: elaboracin propia a partir de Hernndez Sampieri et al., 2010.

Razones y tasas

12
Una tasa es la relacin entre una categora y un total. Por ejemplo, la tasa de
desocupacin, que mide la proporcin de la poblacin activa que est sin
empleo en cierto perodo y busca uno de manera activa.

Una razn es un cociente entre dos categoras de una variable. Por ejemplo, la
razn de masculinidad en una poblacin mide la cantidad de hombres respecto
de mujeres en un conjunto.

Figura 11: Tasa de desempleo en el mundo

Referencias: Verde: es menor, mientras ms intenso ms reducida la tasa; Rojo: mayor,


mientras ms intenso ms elevada la tasa. Fuente: [Imagen intitulada sobre tasa de desempleo
en el mundo] (s. f.). Recuperada de https://goo.gl/ag8dGH

Figura 12: Razn de masculinidad en el mundo

Referencias: Rosa: pases con un ndice de masculinidad menor que 1 (ms mujeres que
hombres). Azul: pases con un ndice de masculinidad mayor que 1 (ms hombres que mujeres).
Verde: pases con un ndice de 1. Gris: sin datos. Fuente: [Imagen intitulada sobre razn de
masculinidad en el mundo] (s. f.). Recuperada de http://goo.gl/0fKKHL

13
Anlisis de la no respuesta

Una de las consideraciones relativas a la no respuesta se vincula con el


porcentaje de casos vlidos. Si el porcentaje es demasiado alto, por ejemplo, 20
%, no corresponde analizar esos datos.

Validez y confiabilidad

Confiabilidad

1) Medida de estabilidad: se mide dos veces un mismo instrumento con el


mismo grupo de personas, en dos oportunidades distintas, separadas
por un perodo de tiempo. Si tal perodo no es tan extenso, se espera
una alta correlacin en las respuestas si el instrumento es confiable.
2) Mtodo de formas paralelas o alternativas: dos versiones de un mismo
instrumento se miden con el mismo grupo de personas, en dos
oportunidades distintas o de manera simultnea. Se espera una alta
correlacin en las respuestas si el instrumento es confiable.
3) Mtodo de mitades partidas: se divide el conjunto de reactivos y se
separa la muestra en dos partes (asignacin aleatoria), y a cada una se
la mide con una parte de los reactivos. Se espera correlacin entre las
mediciones de ambas partes.
4) Mtodo de coherencia o consistencia interna:
o Alpha de Cronbach.
o KR 20 y KR21.

Validez

1) De contenido: opiniones de expertos que ayudan a asegurarse de que


aquellas dimensiones que se consideraron en el instrumento sean
representativas.
2) De criterio: correlacin entre los puntajes obtenidos con el instrumento
y las puntuaciones correspondientes en el criterio.
3) De constructo: cuntas dimensiones integran a una variable y, a su vez,
los tems que integran cada dimensin, identificando aspectos
redundantes.

El anlisis descriptivo presentado se complementa con una serie de


herramientas de ndole inferencial, a travs de las cuales se trata de sacar
conclusiones referidas a la poblacin de estudio a partir de los datos
muestrales. En dos grandes grupos, estas herramientas se refieren a tcnicas de
estimacin (es decir, indicar cul es el valor aproximado de un cierto indicador

14
poblacional) y a pruebas de hiptesis (decisiones basadas en una
fundamentacin estadstica).

Figura 13: Anlisis de datos

Fuente: [Imagen intitulada sobre anlisis de datos] (s. f.). Recuperada de http://goo.gl/1hA9S3

7.1.2. Anlisis de la relacin entre variables:


clasificacin segn el tiempo, la direccin y la intensidad
de la relacin
Coeficiente de correlacin de Pearson (r)

Este coeficiente sirve para cuantificar la relacin entre dos variables, ambas
medidas en escalas de intervalo o razn.

El coeficiente de correlacin de Pearson (r) puede asumir valores entre -1 y 1. El


signo del coeficiente permite identificar el sentido de la correlacin. La
interpretacin de los valores se indica en la siguiente tabla.

15
Tabla 6: Interpretacin del coeficiente de correlacin

Valor Significa
-1 Correlacin negativa perfecta.
-0.9 Correlacin negativa muy fuerte.
-0,75 Correlacin negativa considerable.
-0,5 Correlacin negativa media.
-0,25 Correlacin negativa reducida.
-0,1 Correlacin negativa muy dbil.
0 No existe correlacin entre las variables.
0,1 Correlacin positiva muy dbil.
0,25 Correlacin positiva reducida.
0,5 Correlacin positiva media.
0,75 Correlacin positiva considerable.
0,9 Correlacin positiva muy fuerte.
1 Correlacin positiva perfecta.

Fuente: elaboracin propia a partir de Hernndez Sampieri et al., 2010.

Figura 14: Coeficiente de correlacin

Fuente: [Imagen intitulada sobre coeficiente de correlacin] (s. f.). Recuperada de


http://goo.gl/HLj77l

16
La frmula de clculo parece sumamente compleja, pero veamos con un
ejemplo cmo se aplica.

Pensemos en las variables nota promedio en el secundario y notas promedio


en el primer ao en la carrera universitaria. Supongamos que tenemos una
muestra de 10 alumnos con la siguiente informacin:

Tabla 7: Datos

Nota promedio en el Notas promedio en el primer ao en la


secundario carrera universitaria
6 5
7 6
7 5.5
7.5 6
7 8
8 6.5
8 7.5
8.2 7.5
9 8
9.4 8.5

Fuente: elaboracin propia.

Una primera exploracin grfica nos permite tener una hiptesis sobre la
relacin entre las variables:

17
Figura 15: Diagrama de dispersin

10
9,5
9
8,5
8
7,5
7
6,5
6
5,5
5
5 6 7 8 9 10

Fuente: elaboracin propia.

Se observa una relacin positiva entre las variables consideradas. Ahora, con el
coeficiente de correlacin de Pearson, podemos cuantificar esta relacin.

Tabla 8: Clculo de desvos

Valor (xi) xi - Media (xi Media)2

40 -12,875 165,765625

45 -7,875 62,015625

45 -7,875 62,015625

48 -4,875 23,765625

52 -0,875 0,765625

60 7,125 50,765625

65 12,125 147,015625

68 15,125 228,765625

Suma: 0 740,875

Fuente: elaboracin propia.

18
Tabla 9: Clculo de coeficiente de correlacin

Nota Notas
promedio promedio en
en el el primer ao
secundario en la carrera
(xi) universitaria
(yi) xiyi xi2 yi2

6 5 30 36 25

7 6 42 49 36

7 5,5 38,5 49 30,25

7,5 6 45 56,25 36

7 8 56 49 64

8 6,5 52 64 42,25

8 7,5 60 64 56,25

8,2 7,5 61,5 67,24 56,25

9 8 72 81 64

9,4 8,5 79,9 88,36 72,25

Sumatoria 77,1 68,5 536,9 603,85 482,25

Fuente: elaboracin propia.

19
r= 10 .536,9 - 77,1 . 68,5
10. 603,85- (77,1)2 10.482,25 (68,5)2

r = 0,7917

Por lo tanto, la relacin positiva que observamos en el grfico implica una


asociacin entre considerable y fuerte (0.7917).

En esta asignatura no se espera que el alumno realice habitualmente este tipo


de clculos, pero s que sepa interpretarlos.

Cuando se eleva el coeficiente de Pearson al cuadrado, se obtiene el coeficiente


de determinacin (con una interpretacin sumamente difundida en los anlisis
de regresin).

Figura 16: Diagrama de dispersin

Fuente: [Imagen intitulada sobre diagrama de dispersin] (s. f.). Recuperada de


http://goo.gl/GgaTFE

20
Asociacin entre dos variables categricas

Si queremos conocer el grado de asociacin entre dos variables categricas,


debemos recurrir a otros estadsticos. La idea bsica en todos los casos es ver si
la distribucin de valores de una de las variables difiere segn los valores que
tiene que la otra variable.

Veamos el siguiente ejemplo:

Tabla 10: Tabla de contingencia

Percepcin de la situacin personal en el Total


ltimo ao

Grupo etario Buena Regular Mala

Jvenes 48 42 60 150
Adultos 70 105 175 350
Total 118 147 235 500

Fuente: elaboracin propia.

La idea, ahora, es comparar la distribucin que presenta la tabla de datos con


aquella hipottica que correspondera a una situacin en la cual las dos
variables analizadas no poseen ningn tipo de asociacin entre s, es decir, de
modo que los valores de una variable no condicionen los que se observan en la
otra.

Para obtener esta tabla que refleje independencia, tenemos que hacer algunos
clculos auxiliares. Para esto tengamos presente los conceptos de frecuencias
marginales, que son las que corresponden a los mrgenes de la tabla. All
figuran, tanto para fijas como para columnas, los totales. En la siguiente tabla
slo dejamos los datos de las frecuencias marginales.

A la tabla que refleje situacin de no asociacin la vamos a construir utilizando


las frecuencias marginales. Para cada celda de la tabla vamos a multiplicar el
valor de la frecuencia marginal de la fila que le corresponde a ese valor y el
valor de la frecuencia marginal de la columna que le corresponde a ese valor.
Luego, a este resultado lo vamos a dividir por el total de casos.

21
Tabla 11: Tabla de contingencia

Percepcin de la situacin personal en el Total


ltimo ao

Grupo etario Buena Regular Mala

Jvenes 150
Adultos 350
Total 118 147 235 500

Fuente: elaboracin propia.

Veamos la celda de la posicin (1,1), es decir, de la primera fila y la primera


columna de datos.

a11 = (150 . 118) / 500

a11 = 35,4

Y completamos el primer valor de la tabla de no asociacin:

Tabla 12: Tabla de contingencia

Percepcin de la situacin personal en el Total


ltimo ao
Buena
Grupo etario
Grupo etario Buena Regular
Jvenes 35,4 150
Adultos 350
Total 118 147 235 500

Fuente: elaboracin propia.

De la misma manera, procedemos para calcular los siguientes valores:

22
a12= (150 . 147) / 500 = 44,1
a13= (150 . 235) / 500 = 70,5
a21= (350 . 118) / 500 = 82,6
a22= (350 . 147) / 500 = 102,9
a23= (350 . 235) / 500 = 164,5

Veamos la tabla completa, a la que llamaremos tabla de valores esperados:

Tabla 13: Tabla de contingencia

Percepcin de la situacin personal en el Total


ltimo ao
Grupo etario Buena Regular Mala
Jvenes 35,4 44,1 70,5 150
Adultos 82,6 102,9 164,5 350
Total 118 147 235 500

Fuente: elaboracin propia.

La idea, ahora, es comparar las frecuencias reales/observadas con los datos


hipotticos de esta tabla que muestra los valores que podramos esperar en
cada celda si ambas variables entre s no tuvieran ninguna asociacin. En el
caso de que las diferencias fueran importantes estadsticamente hablando
(esto es lo que luego aporta cada uno de los indicadores de asociacin
especficos que se usen), podramos concluir que existe una asociacin.

Para determinar las diferencias, vamos a trabajar celda por celda y elevar tales
valores al cuadrado.

Tabla de diferencias de valores observados y esperados, elevados al cuadrado.

Tabla 14: Tabla de contingencia

Percepcin de la situacin personal


en el ltimo ao
Grupo Buena Regular Mala
etario
Jvenes 158,76 4,41 110,25
Adultos 158,76 4,41 110,25
Fuente: elaboracin propia.

23
Generalmente, para una prueba estadstica de la independencia de dos
variables categricas, se usa el estadstico:

Que tiene distribucin chi cuadrado, donde O hace referencia a los valores
de las frecuencias observadas y E a las frecuencias esperadas.

Existen otros ndices bivariados. La eleccin entre ellos depende


fundamentalmente del nivel de medicin de las variables consideradas. La tabla
siguiente resume los principales ndices de correlacin disponibles.

Tabla 15: Tabla de contingencia

Tipo de Smbolo Variable 1 Variable 2 Cundo usar


correlacin

Pearson r Continua Continua Es la tcnica


ms estable
Kendall tau Ordinal Ordinal n<10
Biserial r bis Dicotmica Continua Anlisis de
tems
Biserial r pbis Dicotmica Continua Correlaciones
puntual inferiores que
r bis
Tetracrica rt Dicotmica Dicotmica
Coeficiente fi Fi Dicotmica Dicotmica
Coeficiente eta Continua Continua
eta
Fuente: Bisquerra Alzina, 2009.

24
7.2 Informe y exposicin de conclusiones

Una vez realizado el anlisis y la sntesis de la


informacin el proceso siguiente y ltimo de la
investigacin consiste en presentar el informe con los
resultados obtenidos. Para su elaboracin es necesario
por un lado, seleccionar el material que se va a incluir
y, por el otro, estructurar el documento de tal manera
que se facilite la comprensin de su contenido (Rojas
Soriano, 2006, p. 351).

Un aspecto central al comenzar a preparar un reporte de investigacin es


considerar el pblico receptor y el propsito que tiene la presentacin, en el
marco del estudio desarrollado. El manual de las Naciones Unidas (2009), en
relacin con la presentacin de datos estadsticos, menciona la pregunta crucial
y la respuesta que todo investigador debe darse al momento de elaborar cada
reporte: Para quin estoy escribiendo? Sencillamente, el pblico es quien
manda (p. 1).

Figura 17: Otras estadsticas descriptivas

Fuente: [Imagen intitulada sobre otras estadsticas descriptivas] (s. f.). Recuperada de
http://goo.gl/WlktRs

25
Asimismo, no puede descuidarse la atencin en cuanto a la situacin o el
contexto. En este sentido, tambin siguiendo las recomendaciones de Naciones
Unidas (2009) tendientes a entender el contexto en el que se comunican los
datos, se sugiere usar las herramientas del lenguaje, la estructura y la
presentacin ms apropiada para transmitir el mensaje (p. 3).

Si bien cada combinacin de estos aspectos sugiere una estructura y una


extensin particular (de las cuales presentaremos las normas usuales), en todos
los casos corresponde aplicar un criterio de especificidad. En tal sentido, lo que
se debe presentar es lo estrictamente necesario: que no falte nada de lo que
es importante.

Figura 18: Reporte de investigacin. Contenido

Fuente: elaboracin propia a partir de Hernndez Sampieri et al., 2010.

Portada: es la cartula del reporte. Contiene el ttulo, el/los autores, la


filiacin institucional, el lugar y fecha de la investigacin. Adems,
tambin se incluye el financiador, si es que lo hay, y toda otra norma de
estilo que haya definido la institucin que determin la existencia de la
investigacin.

26
ndices: tabla de contenido de todos los captulos y, si corresponde, un
ndice de tablas y figuras.

Resumen: redactado de manera simple, clara y concisa, debe dar cuenta


de los objetivos, la metodologa y los resultados ms relevantes, as
como de las conclusiones que se lograron. Para el caso de publicaciones
cientficas, suelen existir normas en cuanto la extensin mxima
permitida.

Cuerpo del reporte: incluye las diferentes secciones con el contenido


pormenorizado.

Introduccin: se detallan, sin demasiada extensin, los antecedentes, el


planteo del problema y las hiptesis.

Marco terico: teoras consideradas, as como estudios previos


relevantes, sumario de los hallazgos previos y su interrelacin con la
presente investigacin.

Figura 19: Contenido del cuerpo del reporte

Fuente: elaboracin propia a partir de Hernndez Sampieri et al., 2010.

27
Mtodo: se presentan el enfoque y los diseos adoptados, la
contextualizacin temporal y espacial, y aspectos de la muestra
utilizada. Tambin deben estar los procedimientos, los mtodos de
captura de datos y las operaciones de procesamiento y anlisis
aplicadas.

Resultados: resumir lo obtenido del anlisis descriptivo e inferencial


llevado a cabo. En este apartado se detallan las tablas estadsticas, cada
una de las cuales tiene que incluir su ttulo respectivo. Tambin pueden
incluirse figuras y grficas, siempre que sean sencillas y aporten al
anlisis de la investigacin.

Discusin: se exponen las conclusiones y recomendaciones (si


corresponde). Se presentan comparaciones con otros estudios, se
extrapolan los resultados y se mencionan limitaciones, entre otros
productos finales.

Figura 20: Reporte de investigacin

Fuente: [Imagen intitulada sobre reporte de investigacin] (s. f.). Recuperada de


https://goo.gl/s6nUuh

Referencias bibliogrficas: listado de trabajos de autores que fueron


consultados y citados en el reporte. Hay diferentes estilos para realizar

28
estas referencias. En algunos casos el autor elige qu estilo usar; en
otros (por ejemplo, en artculos para revistas o congresos), se especifica
qu estilo se debe aplicar como condicin.

Apndices: aspectos que son importantes o interesantes, pero que


podran distraer el foco durante la lectura del cuerpo principal del texto.

En el caso de los reportes no acadmicos, una seccin adicional y central


corresponde al Resumen ejecutivo. En tal resumen se indican los resultados
ms importantes, presentados de manera predominantemente grfica. Por otra
parte, los reportes no acadmicos no suelen contar con la seccin Referencias
bibliogrficas. Las dems secciones no difieren significativamente de las
indicadas para textos acadmicos.

Elementos para la redaccin del informe

Siguiendo el manual de recomendaciones de Naciones Unidas (2009),


mencionamos algunas de las sugerencias que sirven para lograr un buen
reporte, desde lo comunicacional:

utilizar frases cortas;

tratar una idea en cada frase;

comenzar cada prrafo con la idea central del prrafo. Luego desagregar
el anlisis en sus componentes relevantes;

desarrollar prrafos cortos;

mantener una redaccin concisa.

Cmo presentar grficos y tablas?

La mayora de los reportes de investigacin cuantitativos incluye como


elementos centrales de exposicin de los hallazgos, diferentes tablas y grficos.

A continuacin, listamos diferentes recomendaciones para su aplicacin


efectiva.

En particular, los grficos se privilegian en diferentes formatos sintticos, ya


que se constituyen como una de las mejores tcnicas para hacer comprensibles
los datos, como una representacin de nmeros mediante imgenes (Naciones
Unidas, 2009, p. 7). A travs de una presentacin visual de los datos, se intenta
facilitar la comprensin y la extraccin de conclusiones por parte del pblico
destinatario del informe (Naciones Unidas, 2009, p. 9).

29
Cuando se elabora un grfico para un reporte, se debe tener en cuenta que,
adems de ser atractivo, no pierda sencillez, claridad y precisin. Un grfico no
debe inducir a errores de interpretacin. El tipo de grfico que se defina aplicar
debe ser lo ms sinttico posible, de modo que haga ms fciles las
comparaciones y destaque las diferencias, si existen, o haga evidenciar las
tendencias que describe.

Sin embargo, hay situaciones en las cuales no se recomienda el uso de grficos.


En su lugar es mejor explicar los resultados a travs de textos o tablas. Estas
situaciones se dan cuando los datos se caracterizan por una gran dispersin o
cuando no permiten detectar ningn tipo de diferencia o variacin entre grupos
o categoras. Adems, resultan poco tiles cuando la cantidad de valores de la
variable considerada es demasiado elevada o demasiado reducida.

Los grficos que presentamos previamente en este mdulo, asociados a la


ilustracin de frecuencias, son los ms utilizados en general en los reportes.
Veamos qu aspectos hay que considerar al aplicarlos en un reporte de
investigacin.

Grfico de barras:

Se usan tanto los grficos de barras horizontales como verticales.


Desde la experiencia del lector, es ms clara la lectura de las barras
horizontales.
Se recomienda que las barras tengan ms ancho que el espacio entre
tales barras.
Una variante muy til para comparar participaciones de distintas
categoras en diferentes totales es el grfico de barras apiladas. En este
caso resulta efectiva la transmisin de informacin si no hay demasiadas
categoras.

30
Figura 21: Grficos de barras

Fuente: Rivas et al., 2010.

Figura 22: Grficos de barras apiladas

Fuente: Rivas et al., 2010.

Grficos de lneas

Los grficos de lneas permiten ilustrar tendencias a lo largo del tiempo. Por eso
es el tipo de grfico ms conveniente cuando se necesita mostrar series
temporales.

31
Figura 23: Grficos de lneas

Fuente: Domenech, 2013.

Grficos circulares

Como mencionamos al inicio de la lectura sobre representacin de frecuencias,


los grficos circulares o de sectores sirven para mostrar la distribucin
porcentual de una variable.

Figura 24: Grfico circular

Fuente: Rivas, 2013.

32
La recomendacin, desde el punto de vista de la comunicacin, es que solo
conviene mostrar un pequeo nmero de categoras (no ms de seis en un
grfico).

Algunos especialistas indican que es difcil comparar los diferentes segmentos


del crculo y comparar datos entre diferentes grficos circulares. Para facilitar la
lectura, los segmentos tendran que estar etiquetados con sus valores reales.

En la mayora de los casos, grficos como los de barras son ms apropiados,


pero los grficos circulares no se deben descartar por completo, ya que son
eficaces para visualizar la importancia relativa de una categora en el total
(Naciones Unidas, 2009, p. 23). Los grficos circulares pueden ser muy tiles
para brindar una visin general, como en el ejemplo.

Diagrama de dispersin

El diagrama de dispersin sirve para ilustrar grficamente la relacin entre dos


variables. Es la manera ms exacta de mostrar correlaciones. Sin embargo,
debe tenerse en cuenta que, en general, no son susceptibles de ser
interpretados intuitivamente para alguien no entrenado.

Figura 25: Diagrama de dispersin

Fuente: Rivas, 2013.

33
Cmo lograr que un grfico sea efectivo?

Los diferentes elementos de un grfico compiten entre s por la atencin del


pblico destinatario. Mientras ms elementos tenga el grfico, menos foco se
dispone para atender a lo esencial del mensaje.

Los datos

La representacin de los datos son las barras, lneas, sectores o puntos de los
diferentes grficos mencionados previamente.

Informacin de apoyo

Ttulo, leyenda, etiquetas de datos, lneas de divisin, notas a pie y la fuente de


los datos.

El ttulo del grfico debe dar una idea clara y concisa de lo que el grfico
contiene. Los ttulos pueden ser:

o informativos: proporcionan toda la informacin necesaria para


entender los datos. Responde a tres preguntas: qu?,
dnde? y cundo?;

o descriptivo: enfatiza en las principales pautas o tendencias


mostradas en el grfico y plantea sintticamente lo que este
muestra.

Las etiquetas de los ejes deben indicar las variables mostradas en el


grfico. Conviene mostrar los niveles de las categoras horizontalmente
en ambos ejes.

Los ttulos de los ejes se utilizan para identificar la unidad de medida de


los datos. Puede resultar redundante en algunos casos y pueden
omitirse si esa es la situacin.

Las lneas de divisin sirven de ayuda a leer y comparar los valores de


los datos en los grficos de barras y lneas. Debe revisarse que no quede
demasiado sobrecargado el grfico.

Las leyendas y etiquetas de datos identifican los smbolos o colores


utilizados para representar los datos. La leyenda no se debe mostrar
cuando solo una serie de valores est representada en el grfico.
Siempre que sea posible, es mejor emplear etiquetas que leyendas.

Las notas al pie tienen como finalidad proporcionar definiciones, alguna


aclaracin o informacin metodolgica.

34
La fuente de los datos debe estar indicada en la parte inferior del
grfico.

Elementos de esttica visual

Evitar las tres dimensiones en los grficos, ya que no suele aportar


informacin adicional y distrae la atencin del lector con otra carga
cognitiva adicional.

Siempre utilizar la menor cantidad posible de variaciones de colores que


exprese adecuadamente la informacin.

Hay que prestar atencin a las escalas utilizadas, de modo de no


distorsionar el mensaje de los datos. Como ejemplo, la siguiente figura
muestra un caso donde con solo cambiar la escala se da una idea
diferente de la informacin.

Figura 26: Dos grficos con diferentes escalas para ilustrar los mismos datos

Fuente: Naciones Unidas, 2009.

Nubes de etiquetas

Una nube de etiquetas (tambin llamada nube de palabras) es una


representacin visual de la frecuencia de palabras (por ejemplo, en el anlisis
cuantitativo de textos o anlisis de contenido) o etiquetas en un texto.

Las nubes de etiquetas son una forma til de identificar los trminos comunes
de un texto y construir taxonomas de palabras clave.

35
Figura 27: Nube de etiquetas

Fuente: [Imagen intitulada sobre nube de palabras] (s. f.). Recuperada de http://goo.gl/lllPx4

Otros grficos

Los siguientes grficos combinan elementos estadsticos, como el polgono de


frecuencias, con elementos de diseo que facilitan la transmisin de la
informacin.

Figura 28: Polgono de frecuencias enriquecido

Fuente: Rivas et al., 2003.

36
Figura 29: Grfico de sectores enriquecido

Fuente: Rivas et al., 2003.

Cmo lograr que una tabla sea efectiva en comunicar el mensaje?

En primer lugar, la tabla que forma parte del reporte o de una presentacin
tiene que tener algn nivel de sntesis y no todo el detalle de los datos
recogidos.

Cuando a alguna tabla detallada se la considera importante, pero pesada de


leer y con posibilidades de distraer la atencin del foco principal que se est
intentando presentar, se la debe colocar en el anexo.

Las tablas tambin tienen elementos constitutivos esenciales que deben


incluirse para cumplir los requisitos formales que las investigaciones respetan:

Ttulo de la tabla: descripcin clara y precisa de los datos que contiene.


Debe responder las tres preguntas: "qu?", "dnde?" y "cundo?".
Un ttulo es mejor mientras ms breve y conciso sea. Se debe evitar el
uso de verbos en un ttulo.

Encabezados de las columnas: indican qu datos estn presentes en


cada columna de la tabla. Tienen que tener las especificaciones breves
que sean necesarias.

Encabezados de las filas: identifican los datos ubicados en cada fila de la


tabla.

Notas al pie: indican cualquier informacin adicional necesaria para


comprender y utilizar correctamente los datos.

37
Fuente: indica de dnde provienen los datos, es decir, la organizacin
que elabor los datos, el mtodo de recogida de datos y el perodo de
obtencin, si corresponde.

Figura 30: Elementos constitutivos de una tabla

Fuente: Basado en Naciones Unidas, 2009.

Algunas recomendaciones de las Naciones Unidas (2009) para asegurarse de


que las tablas sean fciles de entender:

Evitar texto innecesario.


Presentar los datos por orden cronolgico en el caso de series
temporales o usando una clasificacin estndar.
Usar las mnimas posiciones decimales que sean necesarias.
Usar separadores de miles.
Alinear los nmeros hacia la derecha hace claramente apreciable su
valor relativo. No centrar los nmeros en una columna, a menos que
todos tengan la misma extensin.

38
No dejar ninguna celda de datos vaca.

Figura 31: Ejemplo de una tabla

Fuente: Rivas et al., 2010.

39
Referencias
Bsica:

Hernndez Sampieri, R., Fernndez Collado, C., & Baptista Lucio, P. (2010).
Metodologa de la investigacin. Mxico: Mc Graw Hill.

Ampliatoria:

Bisquerra Alzina, R. (2009). Metodologa de la investigacin educativa. La Muralla:


Madrid.

Di Pietro, S.; Tfalo, A.; Medela, P. y Pitton, E. (2013). La situacin educativa a travs
de los censos nacionales de poblacin. Direccin General de Evaluacin de la Calidad
Educativa: Buenos Aires.

Domenech, R. (2013). La evolucin del nivel educativo en la OCDE, 1960-2010.


Observatorio Econmico Global. BBVA: Madrid.

Naciones Unidas. Comisin Econmica para Europa. (2009). Cmo hacer


comprensibles los datos? Una gua para presentar estadsticas. Naciones Unidas:
Ginebra.

Ro Sadornil, D. (2013). Diccionario-glosario de Metodologa de Investigacin Social.


Universidad Nacional de Educacin a Distancia: Madrid.

Rivas, A., Vera, A. & Bezem, P. (2010). Radiografa de la educacin argentina. CIPPEC:
Buenos Aires.

Rojas Soriano, R. (2006). Gua para la realizacin de investigaciones sociales. Plaza y


Valdez: Mxico.

Imgenes

Imagen intitulada sobre anlisis de datos] (s. f.). Recuperada de http://goo.gl/LVVo9q

Imagen intitulada sobre varianza] (s. f.). Recuperada de http://goo.gl/xMeuV6

Imagen intitulada sobre asimetra] (s. f.). Recuperada de http://goo.gl/R1w7IX

Imagen intitulada sobre curtosis] (s. f.). Recuperada de http://goo.gl/1ooLfX

Imagen intitulada sobre tasa de desempleo en el mundo] (s. f.). Recuperada de


https://goo.gl/ag8dGH

40
Imagen intitulada sobre razn de masculinidad en el mundo] (s. f.). Recuperada de
http://goo.gl/0fKKHL

Imagen intitulada sobre anlisis de datos] (s. f.). Recuperada de http://goo.gl/1hA9S3

Imagen intitulada sobre coeficiente de correlacin] (s. f.). Recuperada de


http://goo.gl/HLj77l

Imagen intitulada sobre diagrama de dispersin] (s. f.). Recuperada de


http://goo.gl/GgaTFE

Imagen intitulada sobre otras estadsticas descriptivas] (s. f.). Recuperada de


http://goo.gl/WlktRs

Imagen intitulada sobre reporte de investigacin] (s. f.). Recuperada de


https://goo.gl/s6nUuh

Imagen intitulada sobre nube de palabras] (s. f.). Recuperada de http://goo.gl/lllPx4

41

You might also like