You are on page 1of 63

Diseo de Cuestionarios y

Anlisis de Datos

Dr. Luis Alzamora de los Godos


Dra. Jully Pahola Caldern Saldaa
Formulacin del cuestionario
Cuestiones a considerar:
Claridad: los encuestados entienden correctamente la
formulacin de las preguntas?
Comprensin: son las preguntas y las posibles respuestas
suficientemente comprensivas?
Podra ser que algunas preguntas sean irrelevantes, otras
incompletas y finalmente, que no se hayan incorporado
preguntas que generen informacin importante para la
investigacin.
Aceptabilidad: es el cuestionario aceptable? No contiene
preguntas inaceptables?

2
Formulacin del cuestionario

Reglas bsicas:
Ser especfico.
Usar palabras simples.
Armar preguntas cortas.
No generar un dilogo con el entrevistado.
No ser excesivamente especfico.

3
Tipos de preguntas: De respuesta
abierta
Estas preguntas no proveen respuestas opcionales.

Estas preguntas suelen ser las mas fciles de


formular. Sin embargo, poseen claras desventajas.
son difciles de responder,
pueden generar respuestas de cualquier tipo y,
son muy complicadas de codificar.

4
Tipos de preguntas: De respuesta abierta
Estas preguntas pueden ser tiles cuando:
El entrevistador no conoce el tema a fondo,
Cuando queremos obtener mayor informacin sobre la respuesta a
una pregunta anterior. Por ejemplo, si respondi s en la pregunta
anterior, podra explicar por qu?
Para evaluar comportamientos rutinarios, por ejemplo, cuntas
horas mira TV por da?
Cuando se necesita informacin precisa, como la provincia de
nacimiento.
Para darle una oportunidad al entrevistado de expresarse. Por
ejemplo, al final de la encuesta, hay algo ms que le gustara
comentar respecto de este tema?

5
Tipos de preguntas: De opciones
ordenadas
El club necesita ms canchas de tenis
completamente en desacuerdo
Cul es su edad?
Menos de 25
medianamente en desacuerdo entre 25 y 35
ni de acuerdo ni en desacuerdo entre 36 y 50
medianamente de acuerdo entre 51 y 65
completamente de acuerdo ms de 65

Las posibles respuestas son provistas en el cuestionario. El


entrevistado debe seleccionar entre una de ellas.
Este tipo de preguntas es menos demandante para el encuestado
que las preguntas de respuesta abierta y son mas fciles de
codificar.
6
Tipos de preguntas: De opciones
Cul de las siguientes opciones describe mejor su vivienda
actual?
departamento
casa
pensin
casa rodante

En este caso, a diferencia del anterior, no existe una


secuencia ordinal de opciones entre una respuesta y otra.
El encuestado debe elegir la respuesta que mejor describe
su situacin.
7
Tipos de preguntas: De opciones,
parcialmente abierta
En que rea prefiere que se realicen mejoras en su barrio
calles y veredas
red cloacal
parques y plazas
Otra (especificar):___________

En este caso, si bien hay opciones, se deja la posibilidad de que el


encuestado pueda crear su propia respuesta.
Generalmente, la opcin de la respuesta abierta no se utiliza. Sin embargo,
tiene la ventaja de que si el encuestado no considera ninguna respuesta
apropiada a su situacin, no esta forzado a responder dentro de la
opciones predefinidas y, ocasionalmente, generan nueva informacin.

8
Estructura de una pregunta:
Comparaciones
Respuesta abierta:
En su opinin, qu problemas tuvo que afrontar la
agricultura durante los 90s?
Es ideal para focus groups y para otro tipo de entrevistas
exploratorias.
Sirve para identificar distintos tipos de respuestas que
pueden ser posteriormente utilizadas en cuestionarios ms
estructurados.
Raramente puede darnos alguna idea sobre que porcentaje de
personas poseen pensamientos o caractersticas particulares.

9
Estructura de una pregunta:
Comparaciones
Respuesta con opciones ordenadas:

Durante los 90s la agricultura sufri algunos problemas.
En su opinin, qu tan serio fue cada uno de ellos?
A- Problemas ambientales muy serio serio poco serio
B- Problemas econmicos muy serio serio poco serio
C- Problemas polticos muy serio serio poco serio

En este caso, cada entrevistado responde a cada problema en


forma independiente y se mide cun serio considera a cada uno
de ellos.

10
Estructura de una pregunta:
Comparaciones
Respuesta con opciones:
En su opinin, cul de los siguientes problemas que
afectaron a la agricultura durante los 90s es el ms
serio?
A- Problemas ambientales
B- Problemas econmicos
C- Problemas polticos
El entrevistado debe elegir el problema que considera
ms importante dentro de una lista predefinida.

11
Estructura de una pregunta:
Comparaciones
Respuesta con opciones, parcialmente abierta:
En su opinin, cul de los siguientes problemas que
afectaron a la agricultura durante los 90s fue el ms serio?
A- Problemas ambientales
B- Problemas econmicos
C- Problemas polticos
D- Otro (especificar):___________________
En este caso, la situacin es similar a la anterior, pero se
permite que el encuestado tenga la libertad de elegir algn
otro problema que no ha sido considerado.

12
Secuencia del cuestionario
Preguntas introductorias: Las primeras preguntas deben
estar relacionadas al tema principal de investigacin y
deben despertar el inters del encuestado.
Preguntas relacionadas: Deben agruparse en secciones
del cuestionario.
Preguntas sensitivas: Se recomienda incluirlas hacia el
final del cuestionario.
Preguntas importantes: Es deseable incorporar tests sobre
la calidad de las respuestas a estas preguntas.
Secuencia lgica: Siempre debe respetarse.

13
Diseo de Cuestionario
1) Con que frecuencia visita el shopping? 4) Cual de las promociones del shopping recuerda?
Diaria Pascuas
3 por semana Da del padre
1 por semana
Da de la madre
1 por mes
2) Cual es el motivo de la visita? Da del amigo
Compras Navidad
Entretenimientos Ninguna
Otros 5) Y qu recuerda?
3) Es usted de participar en promociones?
No
Premios
Por que? Juegos
No me interesan Nada
No creo en ellas 6) Particip?
No me gustan los premios Si
Otros No
Si Sigue el cuestionario con otras preguntas.

14
Resultados
Participa en promociones?

27%

No
73% Si
n = 200

15
Resultados
Figura 2

25%
No participa en las
promociones del
shopping
Participa en las
promociones del
shopping
75%

n = 200

16
Resultados
Participa en promociones y ademas...

70
63
60
50
37
40
%

30
20
10
0
No participa en las promociones Participa en las promociones
del shopping del shopping

n = 54 (El resto no participa en promociones)

17
Diseo de Cuestionario
0) Presentacin general y datos personales.
1) Con que frecuencia visita el shopping? 4) Cual de las promociones del shopping recuerda?
Diaria Pascuas

3 por semana
Da del padre
Da de la madre
1 por semana Da del amigo
1 por mes Navidad
2) Cual es el motivo de la visita? Ninguna
Compras 5) Y qu recuerda?
Premios
Entretenimientos
Juegos
Otros
Nada
3) Es usted de participar en promociones? 6) Particip?
No Si
Distintas opciones de No
por que. (Fin Sigue el cuestionario con otras preguntas.

entrevista)
Si (Pase a pregunta 4)
18
Resultados
Participa de promociones?

Shopping
17%

No Si
73%
27%

Otras
10%

No Si y ademas shopping Si pero no shopping

19
Algunas consideraciones especiales
Muchas veces los encuestados responden de forma
apresurada. Ello puede generar errores de medicin.

Un diseo cognitivo puede ayudar para evitar que ello


ocurra.

Si bien este diseo hace que los cuestionarios se alarguen,


es efectivo y se recomienda utilizarlo en aquellas
preguntas que requieren una respuesta precisa.

20
Diseo cognitivo: Ejemplo
Queremos responder a la siguiente pregunta:
Utiliz el cinturn de seguridad la ultima vez que anduvo en
auto como acompaante?
Bajo un diseo cognitivo, esta pregunta se divide en tres:
Cundo fue la ltima vez que viajo en auto como acompaante?
Hoy Ayer Anterior a ayer
Qu tan largo fue el viaje?
1 KM Entre 1 y 2 KM Mas de 2 KM
Us cinturn de seguridad?
Todo el tiempo Parte del tiempo No lo utilizo

21
Tipos de Datos

D a to s

C a t e g r ic o s C u a n t it a t iv o s

O r d in a le s N o m in a le s

22
Variables discretas y
continuas
Una variable es discreta si toma solo un
nmero contable de valores. Una variable es
contnua si la misma toma un nmero
incontable
Variable de valores.
discreta Variable continua

0 1 2 3 ... 0 1/16 1/4 1/2 1


Por lo tanto, el nmero de Por lo tanto, el nmero de
valores es contable valores es incontable

23
Estadstica Descriptiva
Abarca la agrupacin, resumen y presentacin
de los datos para permitir su interpretacin y
poder tomar decisiones basadas en dicha
interpretacin.

La estadstica descriptiva utiliza


Tcnicas grficas
Medidas de descripcin numricas

24
Variables Categricas

Pie chart Grfico de barras

Estas son algunas de las representaciones


ms utilizadas para variables categricas.

25
Variables cuantitativas
Las variables cuantitativas continuas toman un
nmero considerable de valores.

Su representacin grfica resulta ms clara si se


agrupan los valores prximos de la variable.

El grfico ms comn de la distribucin de una


variable cuantitativa continua es un histograma.

26
Histograma: distribucin del salario horario en
el Gran Buenos Aires

2 00

1 60

1 20

80

40

0
0 1 2 3 4

27
Medidas de Posicin Central:
Usualmente, nuestra atencin se centra en
dos aspectos de las medidas de posicin
central:

Medicin del punto central (promedio)

Medicin de la dispersin en torno al promedio

28
Medidas de Posicin Central: la media

Es la medida mas popular.


Suma de las observaciones
Media =
Nmero de observaciones

Es decir, tenemos una muestra de n


observaciones: x1, x2,,xn. Su media muestral
es: ( x1 x 2 ... x n )
x
n
29
La mediana
La mediana (M) es el valor central de un histograma.

Para hallar la mediana de una distribucin debemos:


1. Ordenar las observaciones en orden ascendente.
2. Si el nmero de observaciones n es impar, M es la
observacin central de la lista ordenada. M se halla
contando (n+1)/2 observaciones desde el comienzo de
la lista.
3. Si el nmero de observaciones n es par, M es la media
de las dos observaciones centrales de la lista ordenada.

30
La Moda
La Moda es el valor que ocurre con
mayor frecuencia en un grupo de
observaciones. Cuando la muestra
El modo es grande, los datos
se agrupan en intervalos
y obtenemos el
Intervalo modal

En un conjunto de observaciones puede haber ms de un modo.

31
Media y Mediana
La media es sensible a observaciones extremas y a outliers.

La mediana solo es sensible a cambios en su entorno que la cruzan.


Por ello, se dice que la mediana es un estimador robusto de la
tendencia central.

La media y la mediana de una distribucin simtrica se encuentran


muy cerca. Si la distribucin es exactamente simtrica, la media y la
mediana coinciden.

Si la distribucin es asimtrica, la media queda desplazada hacia la


cola ms larga del histograma de la distribucin.

32
Distribuciones simtricas y
asimtricas
Una distribucin es simtrica si el lado derecho e
izquierdo del histograma con respecto a la mediana son
aproximadamente iguales.
Un distribucin es asimtrica hacia la derecha si el lado
derecho del histograma se extiende sobre un mayor
nmero de valores (intervalos) que el lado izquierdo.
Una distribucin es asimtrica hacia la izquierda si el
lado izquierdo del histograma se extiende sobre un mayor
nmero de valores (intervalos) que el lado derecho.

33
Aspecto general de una
La figura muestra la distribucin de ventas de
distribucin
libros por individuo en la feria del libro. Esta
distribucin es asimtrica hacia la derecha. Es
decir hay muchas ventas de 3 o 4 libros y pocas
ventas de 10 libros.
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12

34
Medidas de dispersin
Caracterizar una distribucin solamente a travs de una
medida central no es apropiado.

Las distribuciones del ingreso de dos provincias con el mismo


ingreso medio por hogar son muy distintas si una de ellas
tiene extremos de pobreza y de riqueza, mientras que la otra
tiene poca variacin de ingresos entre familias.

Estamos interesados en la dispersin o variabilidad de los


ingresos, adems de estarlo en sus centros.

35
Medidas de dispersin
Rango

Una manera de medir la dispersin es calcular el


recorrido de la distribucin emprica, es decir, la
diferencia entre las observaciones mxima y mnima.

Su mayor ventaja es que se puede calcular facilmente,


sin embargo, no brinda informacin sobre la dispersin
existente entre ambos valores extremos.

36
Medidas de dispersin
El rango depende slo de las observaciones
mxima y mnima, que podran ser observaciones
atpicas.
Podramos mejorar nuestra descripcin de la
dispersin fijndonos, por ejemplo, tambin en la
dispersin del 50% de los valores centrales de
nuestros datos.
Un conjunto de estadsticos de utilidad son los
cuartiles de una distribucin.

37
Cuartiles
Para calcular los cuartiles de una distribucin
debemos:

1. Ordenar las observaciones en orden creciente y


localizar la mediana.
2. El primer cuartil Q1 es la mediana de las
observaciones situadas a la izquierda de la mediana de
la distribucin.
3. El tercer cuartil Q3 es la mediana de las observaciones
situadas a la derecha de la mediana de la distribucin.

38
Cuartiles
Los cuartiles son medidas de tendencia no central de una
distribucin.

Dividen los datos ordenados en 4 cuartos iguales:


25% 25% 25% 25%

Q1 Q2 Q3
El segundo cuartil de una distribucin es su mediana.

El Rango Intercuartil es la diferencia entre el tercer y el primer


cuartil.
39
Percentiles
Los percentiles son otro conjunto de medidas de
tendencia no central de una distribucin.

Dividen los datos ordenados en 100 partes iguales.

El percentil 25 es el primer cuartil ...

40
Diagrama de caja
Los cinco nmeros resumen de una distribucin son
representados grficamente por un diagrama de caja.
L - Observacin mxima
Q3 - Tercer cuartil

Q2 - Mediana
Q1 - Primer cuartil
S - Observacin mnima

41
Diagrama de caja
Los lados inferior y superior de la caja van del primer al
tercer cuartil. Por tanto, la altura de la caja es la
amplitud del 50% de los datos centrales.
El segmento del interior de la caja indica la mediana.
Los extremos de los segmentos perpendiculares a los
lados superior e inferior indican, respectivamente, los
valores mximo y mnimo de la distribucin.

S Q1 Q2 Q3 L

42
Una medida de dispersin: La varianza
La varianza s2 de un conjunto de observaciones es el
promedio de los cuadrados de la desviaciones de las
observaciones respecto a su media. Formalmente:

( x1 x ) ( x 2 x ) ... ( x n x )
2 2 2
s
2

De forma compacta:
n 1

1
s
2

n 1
( x i x ) 2

43
El desvo estndar
La desviacin tpica es la raz cuadrada positiva
de la varianza s2:
1
s
n 1
i
( x x ) 2

44
Coeficiente de variacin
El coeficiente de variacin es una medida de dispersin relativa.
Muestra la dispersin de una distribucin en relacin a su media.
Se utiliza para comparar distintas distribuciones.
Su frmula es:

Por ejemplo, un desvio standard de 10, puede ser grande si la


s es 500.
media es 100, pero no lo es si la media
CV
x

45
Medidas de asociacin en variables
cuantitativas
(x i x)(y i y)
Covarianza muestral cov(X, Y)
n -1

Coeficiente de correlacion muestral


cov( X , Y )
r
sx s y

46
Coeficiente de Correlacin
+1 Correlacin lineal positiva fuerte
El valor se encuentra cerca de 1 COV(X,Y)>0

No hay correlacin lineal


o r = 0
Coeficiente cercano a cero COV(X,Y)=0

Correlacin lineal negativa fuerte


-1 COV(X,Y)<0
El valor se encuentra cerca de -1

47
Medidas de Asociacin en
Variables Categricas
Tablas de Contingencia
El objetivo de la tabulacin cruzada es identificar la
relacin que existe entre dos variables. Con los datos de
una muestra podemos observar si existe alguna relacin
entre dos variables y la pregunta que surge naturalmente
es si esta relacin es verdadera o es el resultado del error
muestral.
Las tablas de contingencia son tabulaciones cruzadas
entre dos variables X e Y con r y c categoras
respectivamente. Es decir que la tabla de contingencia
entre X e Y tendr r filas y c columnas.

48
Tablas de Contingencia y
Medidas de Asociacin
Para identificar si existe relacin entre dos variables categricas se
utiliza un test de hiptesis conocido como el test Chi-cuadrado de
Pearson. La hiptesis nula del test es que las dos variables
analizadas son independientes. La hiptesis alternativa es que las
variables no son independientes, es decir que existe una relacin
entre las dos variables.
Por ejemplo, la siguiente tabla de contingencia muestra la
tabulacin cruzada de la variable ingreso anual (dividido en tres
categoras) y la ltima marca de coche comprada (dividida en tres
marcas).

49
Tablas de Contingencia y
Medidas Marca
de Asociacin
del ltimo auto comprado
Ford Toyota Renault Total
Ingreso anual

Menos de 20,000 50 200 125 375


20,000 - 40,000 200 100 350 650
ms de 40,000 100 25 50 175

Total 350 325 525 1200

Existe relacin entre el ingreso anual y la marca del


ltimo auto comprado?
50
Tablas de Contingencia y
Medidas de Asociacin
Las entradas de la tabla representan el nmero de
personas en la muestra con cada combinacin de
ingreso y marca de auto. Por ejemplo, 50 personas que
ganan menos de 20,000 $ compraron un auto marca
Ford.
El test Chi-cuadrado de Pearson se basa en encontrar
cual hubiera sido el valor de cada entrada si las
variables fueran independientes. Es decir el valor
esperado de cada celda de la tabla si las variables
ingreso y marca son independientes.

51
Tablas de Contingencia y
Medidas de Asociacin
Si ingreso y marca son independientes, la probabilidad
del evento conjunto "A1: ganar menos de 20,000$" y
"B1: comprar marca Ford" es el producto de esas dos
probabilidades:

Pr(A1 y B1) = Pr(A1)*Pr(B1)

Pr(A1) = A1/A = 375/1200,


Pr(B1) = B1/B = 350/1200
Donde A y B son las frecuencias totales de los eventos.

52
Tablas de Contingencia y
Medidas de Asociacin
Por lo tanto:

Pr(A1 y B1) = Pr(A1)*Pr(B1) = 375*350/


(1200*1200) = 0.091

El nmero esperado en la entrada A1B1 es entonces:

N* Pr(A1 y B1) = 1200*0.091 = 109.38

53
Tablas de Contingencia y Medidas
de Asociacin
En general la frmula del valor esperado es:

Eij = (NAi*NBj)/N.

Eij = nmero esperado


NAi= nmero de elementos en la categora Ai
NBi= nmero de elementos en la categora Bi

Para A1B1 el nmero esperado es:


E11 = (375*350)/1200 = 109.38

54
Tablas de Contingencia y
Medidas de Asociacin
Este proceso se puede repetir para cada una de las entradas
de la tabla. Una vez hecho esto el estadstico Chi-cuadrado
se calcula con la siguiente frmula:
r c O ij E ij
2
2
i 1 j 1 E ij

r = nmero de categoras de la variable en las filas


c = nmero de categoras de la variable en las columnas
Oij = nmero observado en entrada ij
Eij = nmero esperado en la entrada ij
Este estadstico Chi-cuadrado tiene (r-1)*(c-1) grados de
libertad.
55
Tablas de Contingencia y
Medidas de Asociacin
En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de
libertad. Realizando todas las cuentas con la tabla
del ejemplo, el estadstico da 252.2.
Comparando este nmero con el valor crtico de la
distribucin Chi-cuadrado con 4 grados de libertad
a un nivel de significatividad del 5% el valor
crtico correspondiente es 9.49.
Como 252.2 > 9.49 se rechaza la hiptesis nula. Es
decir, las variables no son independientes.

56
Tablas de Contingencia y
Medidas de Asociacin
El estadstico de Pearson nos dice si dos variables son
independientes una de otra pero no nos dice nada
acerca de la naturaleza de la relacin.

Esto es, no sabemos cuan fuerte es la asociacin entre


las variables analizadas.

Para medir el grado de relacin entre las variables se


utiliza el denominado Coeficiente de Contingencia (C).

57
Tablas de Contingencia y
Medidas de Asociacin
El coeficiente de contingencia se calcula
fcilmente desde el estadstico de Pearson:

C

2
n

donde n es el tamao muestral.

58
Tablas de Contingencia y
Medidas de Asociacin
El coeficiente de contingencia es una extensin del
coeficiente al caso de que al menos una de las
variables presente ms de dos categoras. Toma
valores entre 0 y Cmax, donde si r y c son el nmero
de categoras de cada una de las variables:

Cuando no hay relacin entre las variables el


coeficiente C = 0. El valor mximo de C est dado
por Cmax = [min(r-1,c-1)/(1+ min(r-1,c-1))]1/2

59
Medidas de Asociacin para
Tablas de 2x2
Cuando analizamos variables dicotmicas
(adoptan solo los valores 0, 1) el estadstico
de Pearson puede ser poco preciso. En esos
casos se suelen utilizar otras medidas de
asociacin.

60
Medidas de Asociacin para
Tablas de 2x2
El Coeficiente Phi ()
Es una medida del grado de asociacin entre
dos variables dicotmicas basada en el
estadstico Chi-cuadrado de Pearson.
Este coeficiente toma valores en el intervalo
cero-uno. Valores prximos a cero indican
poca asociacin entre las variables y valores
cercanos a uno indican una fuerte asociacin.

61
Medidas de Asociacin para
Tablas de 2x2
Puede ser calculado utilizando el estadstico
Chi-cuadrado de Pearson con la siguiente
frmula:

= (2/N)1/2

donde N es el nmero de datos.

62
GRACIAS

Consultores de Investigacin
Pgina Web: conasin.es.tl
Correos: paholitacalderon@yahoo.es
alzamoradelosgodos@yahoo.es
Telefonos:
992740368 63

You might also like