You are on page 1of 9

UNMSM

Facultad de Ciencias Matemticas


Curso: Muestreo II Profesor: Julio Ramos R.

Introduccin
En un proceso de muestreo, basado en una tcnica probabilstica, se busca recoger informacin de
los elementos seleccionados de una poblacin, con el propsito de establecer una inferencia acerca
de las principales caractersticas numricas de la poblacin en estudio. En este proceso se ha
supuesto que los datos fueron correctamente registrados y que proporcionan una representacin
exacta de los elementos seleccionados. Segn estas suposiciones se estiman ciertos parmetros y se
establece inclusive el lmite para el error de estimacin.
Existen muchas situaciones en las cuales estas suposiciones fundamentales no son satisfechas,
usualmente se les denomina fuentes potenciales de error que pueden afectar el diseo de la encuesta
por muestreo. Un buen diseo intentar controlar las distintas fuentes de error. Aunque gran parte
de estos errores se estudian con mayor detalle en los siguientes captulos, en este momento, resulta
conveniente proporcionar algunas descripciones breves.
El error total en la encuesta es la variacin entre el valor real del parmetro a estimar y el valor
del estimador (estimacin) observado en la muestra. En la figura 1 se muestra la composicin del
error total en la encuesta.























Fig. 1: Error total en la Encuesta por Muestreo.

El error de muestreo ocurre porque la muestra probabilstica seleccionada es una representacin
imperfecta de la poblacin que se estudia. Este error es completamente aleatorio.


Error Total




Error de Muestreo Error de No Muestreo





Sesgo de Respuesta No Respuesta Marcos Imperfectos



Sesgo del Investigador Negativas o Rechazos Marcos Incompletos
Sesgo del Entrevistador Ausencia de Entrevistados Marcos Desactualizados
Sesgo del Entrevistado
El error de no muestreo puede atribuirse a fuentes distintas al muestreo y pueden ser aleatorios y
no aleatorios. Se originan por varias causas que incluyen errores en la definicin del problema, las
escalas, el diseo del cuestionario, los mtodos de entrevistas y la preparacin y anlisis de datos.
Aqu tambin estn incluidos principalmente los errores debido al sesgo de respuesta, no respuesta
y marcos imperfectos.

La NO RESPUESTA. La obtencin de los datos muestrales puede ser imposible debido a la ndole
delicada de las preguntas, rechazo parcial y total a la entrevista, ausencia de respondientes, etc.
El SESGO DE RESPUESTA. Las mediciones registradas no son siempre una representacin exacta
de los datos deseados, debido a sesgos de los entrevistadores, sesgo del equipo de medicin, sesgo
del entrevistado o a una respuesta falsa del entrevistado cuando la pregunta le es inconveniente.
MARCO DE MUESTREO IMPERFECTO. El Marco de muestreo no es siempre el adecuado, a
veces est desactualizado, y por lo tanto la muestra puede no haber sido seleccionada de la
poblacin completa de estudio.

Estas tres situaciones anteriores constituyen las fuentes principales de ERRORES AJENOS AL
MUESTREO. En el presente trabajo de investigacin solo nos ocupamos del problema de la NO
RESPUESTA. El proyecto de Investigacin trata sobre los mtodos para controlar y reducir la No
Respuesta en las Encuestas por Muestreo.

II EL PROBLEMA DE LA NO RESPUESTA
1. El problema de la No Respuesta en las Encuestas por
Muestreo
En las encuestas por Muestreo, la no respuesta se constituye como una de las principales
fuentes de error no muestral en este tipo de investigaciones. El error por la no respuesta
surge cuando algunos de los entrevistados potenciales, que se incluyen en la muestra, no
responden o estn ausentes. Las personas que no responden difieren de quienes si
responden en trminos de las variables demogrficas, psicogrficas, de personalidad, de
actitud, motivacionales y conductuales. Para un estudio determinado, si las personas que no
responden difieren de las que si lo hacen en trminos de las caractersticas de inters, los
estimados de la muestra presentarn graves tendencias. En general, los ndices de
respuesta ms altos implican ndices de tendencia a la falta de respuesta ms bajos, aunque
el ndice de respuesta quiz no sea un indicador adecuado de la tendencia a la falta de
respuesta. Los ndices de respuesta por si solos no indican si los entrevistados son
representativos de la muestra original. Es probable que el incremento de la tasa de respuesta
no reduzca la tendencia a la falta de respuesta si los entrevistados adicionales no son
diferentes a aquellos que ya respondieron, pero s lo son de aquellos que todava no
contestan. Puesto que las tasas de respuesta bajos aumentan la probabilidad de tendencia a
la falta de respuesta, es preciso tratar de mejorar la tasa de respuesta.

2. Algunos mtodos para controlar y reducir la No
Respuesta
Estos Mtodos se han agrupado en tres grupos:

1. Mtodos Cortos y Rpidos (Bsicos)
Se refieren a los mtodos administrativos que suelen implementarse antes o en pleno trabajo de
campo. Estos mtodos estn orientados a mejorar la tasa de respuesta.
2. Mtodos Intermedios
Estos mtodos se utilizan para ajustar la falta de respuesta una vez culminado la recoleccin de
los datos. Aqu se encuentran los mtodos de Sustitucin, Reemplazo, estimacin subjetiva, el
mtodo de ponderacin. submuestreo de no respondientes y el anlisis de tendencia.
3. Mtodos Avanzados
Aqu se encuentran los mtodos de imputacin de datos y los modelos de respuesta
aleatorizada.
Los mtodos de imputacin de datos que estn siendo utilizados son: el mtodo de imputacin
por medias, imputacin por regresin y el mtodo de imputacin por anlisis discriminante.
Los modelos de Respuesta Aleatorizada estn basados en diseos que conservan el anonimato
de la respuesta, por lo que da plena libertad al entrevistado a responder la encuesta. Los ms
difundidos son: el modelo de Warner, el de Simons y el de Greenberg.
III METODOS BASICOS
Como se dijo antes, se refieren a los mtodos administrativos que suelen implementarse antes o en
pleno trabajo de campo. Estos mtodos estn orientados a mejorar las bajas tasas de respuesta. Las
tasas de respuesta bajas se deben fundamentalmente a los rechazos y a los ausentes en casa.
Los rechazos o negativas que resultan de la falta de disposicin o la incapacidad para participar de
las personas que se incluyen en la muestra, dan como resultado tasas de respuesta bajos y aumento
de la falta de respuesta.
Los ausentes en casa, en las encuestas dirigidas al hogar o telefnicas, pueden disminuir
notoriamente la tasa de respuesta si se tratan de entrevistados potenciales para la encuesta.
Veamos a continuacin los mtodos que intentar resolver estos problemas.


1. Notificacin Previa
En la notificacin previa, se enva a los entrevistados potenciales una carta en la que se les informa
sobre la encuesta inminente por correo (postal o electrnico), por telfono o personal. La
notificacin previa incrementa la tasa de respuesta para las muestras en general porque reduce la
sorpresa y la incertidumbre, al tiempo que crea un ambiente cooperativo.

2. Motivacin de los Entrevistados
Puede motivarse a los entrevistados potenciales para que participen en la encuesta al aumentar su
inters y participacin. Dos de las formas en que esto puede lograrse son: Las estrategias de
detener la puerta con el pie y la puerta en la cara. Ambas tratan de obtener participacin
mediante el uso de peticiones secuenciales.
En la estrategia de detener la puerta con el pie, el entrevistador empieza con una peticin
relativamente pequea, como hara el favor de concederme 5 minutos para responder 5
preguntas?, ante la que una gran mayora de las personas aceptar. Despus de esta peticin viene
una peticin mayor, la peticin crtica, que pide la participacin en la encuesta o experimento. El
razonamiento es que la aceptacin ante una peticin inicial debe incrementar las probabilidades de
una aceptacin a la peticin subsecuente.
La estrategia de la puerta en la cara es opuesta. La peticin inicial es relativamente grande y la
mayora de las personas se niega a aceptar. Despus de esta peticin viene una peticin menor, la
peticin crtica, pidiendo la participacin en la encuesta. El razonamiento subyacente es que la
conexin a la peticin crtica subsecuente debe aumentar las probabilidades de aceptacin.
La primera estrategia es ms efectiva que la segunda.

3. Incentivos
La tasa de respuesta puede aumentarse al ofrecer incentivos monetarios y no monetarios a los
entrevistados potenciales. Los incentivos monetarios pueden pagarse en forma previa o posterior. El
incentivo que se paga en forma previa se incluye en la encuesta o cuestionario. El incentivo
posterior se enva slo a los entrevistados que terminan la encuesta. Los incentivos no monetarios
que se utilizan con mayor frecuencia son los premios y recompensas, como lapiceros, lpices, libros
y ofrecimientos de los resultados de la encuesta. Los incentivos que se pagan en forma previa han
demostrado que aumentan la tasa de respuesta en mayor medida que aquellos a futuro. La cantidad
del incentivo pude variar hasta $50 o ms. La cantidad del incentivo tiene una relacin positiva con
la tasa de respuesta, pero el costo de los incentivos monetarios elevados puede superar el valor de la
informacin adicional obtenida.

4. Diseo y Aplicacin del cuestionario
Un cuestionario bien diseado puede reducir el ndice general de rechazos parcial y total. De modo
similar la habilidad que se emplea para aplicar el cuestionario en las entrevistas personales y
telefnicas puede aumentar la tasa de respuesta. Los entrevistadores bien capacitados son hbiles
para la conversin del rechazo a una persuasin. No aceptan una respuesta negativa sin una peticin
adicional. La peticin adicional puede enfatizar la brevedad del cuestionario o la importancia que
tiene la opinin del entrevistado.

5. Seguimiento
El seguimiento, o contactar, en forma peridica, a las personas que no respondieron, despus de la
entrevista inicial, es efectivo en especial para reducir los rechazos en las encuestas por correo. El
investigador puede enviar una tarjeta postal o una carta para recordarles que deben terminar y
regresar el cuestionario. Adems, del envo original, se necesitan dos o tres ms. Los seguimientos
pueden llevarse a cabo por correo electrnico, telfono, fax o contactos personales.

6. Llamadas subsecuentes
El porcentaje de personas que no se encuentran en casa puede reducirse en forma significativa al
emplear una serie de llamadas subsecuentes a la encuesta para tratar de contactar a los
entrevistados. En la mayor parte de las encuestas dirigidas al hogar, pueden ser aceptables tres o
cuatro llamadas subsecuentes. Aun cuando la primera llamada produce la mayor parte de las
respuestas, la segunda y tercera llamadas tienen un ndice de respuesta ms alto por llamada. Es
importante que las llamadas subsecuentes se hagan y se controlen de acuerdo con un plan
establecido.

IV METODOS INTERMEDIOS
1. Mtodo de Sustitucin
En el mtodo de sustitucin, el investigador cambia a las personas que no responden con otros
elementos del marco de la muestra que se espere contesten. El marco de la muestra se divide en
subgrupos que son internamente homogneos, en trminos de las caractersticas de los
entrevistados, pero heterogneos en trminos de los ndices de respuesta. Despus, estos subgrupos
se utilizan para identificar a los sustitutos que son similares a las personas que no respondieron,
pero distintos a las personas que ya contestaron en la muestra. Ntese que esta estrategia no
reducir la tendencia a la falta de respuesta si los sustitutos son similares a las personas que ya
respondieron en la muestra.

2. Mtodo de Reemplazo
En el mtodo de reemplazo, las personas que no responden la encuesta actual se reemplazan con
personas que no respondieron en una encuesta anterior similar. El investigador trata de establecer
contacto con las personas que no respondieron en la encuesta anterior y les aplica la entrevista
actual, ofrecindoles quiz un incentivo adecuado. Es importante que la naturaleza de la No
Respuesta en la encuesta actual sea similar al de la encuesta anterior. Ambas encuestas deben
utilizar tipos de entrevistados parecidos y el intervalo de tiempo entre estas debe ser breve.

3. Mtodo de Ponderacin
La ponderacin trata de tomar en cuenta la falta de respuesta al asignar a los datos ponderaciones
diferentes dependiendo de los ndices de respuesta. Al analizar los datos, se asignan a los estratos
ponderaciones inversamente proporcionales a sus ndices de respuesta. A pesar de que la
ponderacin puede corregir los efectos diferentes de la falta de respuesta, destruye la naturaleza de
autoponderacin del diseo de la muestra y puede dar lugar a complicaciones.

4. Mtodo de Submuestreo de no respondientes
La submuestra de no respondientes, en especial en el caso de las encuestas por correo, puede ser
efectiva para ajustar la tendencia a la falta de respuesta. En esta tcnica, el investigador establece
contacto con una submuestra de los no respondientes, por lo general mediante entrevistas
telefnicas o personales. Con frecuencia, esta tcnica da como resultado un indice de respuesta alto
dentro de esa submuestra. Los valores que se obtienen para la submuestra se proyecta despus a
todas las personas que no respondieron y los resultados de la encuesta se ajustan para tomar en
cuenta la falta de respuesta.

V METODOS AVANZADOS
A. Modelos de Respuesta Aleatorizada
En encuestas que tratan temas delicados, muchas veces las personas entrevistadas no estn
dispuestas a responder con honestidad o simplemente sealan una negativa de respuesta. La No
Respuesta es tan pronunciada en estos casos. La modalidad de entrevista directa para investigar
sobre temas delicados, resulta estril; una solucin a este problema puede ser el uso de los
Modelos de Respuesta Aleatorizada. La respuesta aleatorizada es la que da el entrevistado a una
pregunta, la cual fue elegida aleatoriamente, mediante un mecanismo aleatorio (urnas, monedas,
bolas de calores, etc.).
Los modelos de respuesta aleatorizada estn orientados al logro de dos objetivos:
Incrementar la tasa de respuesta
Disminuir el sesgo de respuesta


1. Modelo de Warner
En este modelo se busca estimar el parmetro , proporcin de personas que pertenecen a una
categora de inters y comprometedora a la vez, conservando el anonimato de la respuesta dada por
el entrevistado.
Supongamos que la categora A, resulta comprometedora para el entrevistado. Una pregunta
adecuada ser pertenece a la categora A? la respuesta ser SI (pertenece al grupo A) NO (no
pertenece al grupo A).
El modelo de Warner estima la proporcin poblacional de personas que pertenecen al grupo A, a
partir de una muestra seleccionada bajo Muestreo Aleatorio Simple (MAS) con reposicin de n
personas. El entrevistador debe usar un mecanismo aleatorio para seleccionar una de dos preguntas,
cada uno de los cuales requiere una respuesta SI NO por parte del entrevistado, sin revelar al
entrevistador su posicin personal con respecto a la pregunta. Las dos proposiciones a las que se
supone responde correctamente son:
1. Pertenezco al grupo A, representada con probabilidad p
2. No pertenezco al grupo A, representado con probabilidad 1-p

Definamos los siguientes parmetros:
n = tamao de la muestra
= proporcin de elementos de la poblacin que pertenecen al grupo A
p = probabilidad de que el procedimiento aleatorio seleccione la proposicin Pertenece al grupo A

=
NO reponde persona sima - i la si ; 0
SI responde persona sima - i la si ; 1
i
x


Luego,
P = P(X
i
= 1) = p+(1-)(1-p)
Q = 1 - P = (1-)p + (1-p)


El estimador insesgado que presenta el modelo de Warner, es:

) 1 2 (
) 1 (
) 1 2 (

=
p
p
p n
x
n
i
i
w



La varianza del estimador es:

2
) 1 2 (
) 1 ( ) 1 (
)

=
p n
p p
n
V
w



Warner observa que la cooperacin del entrevistado est en funcin del grado de anonimato y
depender de p.

Si p=0.5, el estimador de Warner no estar definido y por lo tanto, la muestra no arroja
informacin sobre el parmetro.
Si p=1, el estimador de Warner, se reduce a la estimacin convencional de , que requiere que
el entrevistado informe sin reserva si pertenece o no al grupo A.
Si p=0, el estimador de Warner se reduce a la estimacin convencional de (1-)
Warner, basado en su experiencia, propone utilizar un valor de p entre 0.70 y 0.80

El estimador insesgado de la varianza del estimador de es dado por:



=
2
2
) 5 . 0

(
) 5 . 0 ( 16
1
1
1
)

w w
p n
V


2. Modelo de Simons
Simmons y Horvitz modificaron el modelo de Warner, con el propsito de que el entrevistado tenga
una mayor disposicin a colaborar, sustituyendo la segunda proposicin No pertenezco al grupo
A por otra pregunta referente a una caracterstica B, no relacionada con A.
En consecuencia el entrevistado debe seleccionar a travs de un mecanismo aleatorio, una de las
siguientes proposiciones a las que se supone responde correctamente.
1. Pertenezco al grupo A
2. Pertenezco al grupo B
Los parmetros que se desean estimar son:

A
= proporcin de elementos de la poblacin que pertenecen al grupo A

B
= proporcin de elementos de la poblacin que pertenecen al grupo B
Estos dos parmetros se estiman en base a dos muestras aleatorias simples independientes de
tamao n
1
y n
2
respectivamente. Definimos las variables:

=
NO reponde 2 muestra la de persona sima - i la si ; 0
SI responde 1 muestra la de persona sima - i la si ; 1
1i
x

=
NO reponde 2 muestra la de persona sima - j la si ; 0
SI responde 1 muestra la de persona sima - j la si ; 1
2 j
x


Luego, mediante un proceso de estimacin por el mtodo de momentos, obtenemos los estimadores
insesgados siguientes:
2 1
2
2
1
2
1
1
1
1
1
2
) 1 ( ) 1 (

p p
n
x
p
n
x
p
n
n
j
j
i
i
A

+
=

=
=


1 2
2
2
1
2
1
1
1
1
1
2

p p
n
x
p
n
x
p
n
n
j
j
i
i
B

+
=

=
=




La Varianza de los estimadores anteriores esta dado mediante la siguiente frmula:

2
2 1 2
2 2 2
1
1
1 1 2
2
) (
1 ) 1 (
) 1 (
) 1 (
) 1 ( )

(
p p n
u u
p
n
u u
p V
A

=


2
2 1 2
2 2 2
1
1
1 1 2
2
) (
1 ) 1 ( ) 1 (
)

(
p p n
u u
p
n
u u
p V
B

=


Uno de los problemas en la aplicacin del modelo de Simmons, es la eleccin de los valores p
1
y p
2
.
Se sugiere:
- Disminucin de la varianza
- Disposicin a colaborar por parte del entrevistado. Para mantener esta disposicin se propone
que p
1
+ p
2
=1.

Moors (1971) demuestra que si en el modelo de Simmmons se escoge p
2
=0, se obtiene un diseo
ms eficiente que el obtenido a travs de la eleccin de p
2
=1-p
1
y n
1
y n
2
con afijacin ptima.
Lanke (1975) demuestra que, en muchos casos resulta conveniente escoger la caracterstica B de tal
forma que
B
tome valores grandes.

3. Modelo de Greenberg
Greenberg sugiere una extensin del modelo de la pregunta no correlacionada de Simmons, para
variables cuantitativas.
Sea X la variable cuantitativa que resulta comprometedor para el entrevistado. Suponemos que la
funcin de densidad de probabilidad de X es g(x).
Sea Y la variable cuantitativa no correlacionada y no comprometedora que se supone tiene funcin
de densidad h(y).
El entrevistado debe responder a la pregunta sobre la variable comprometedora con probabilidad
Py a la pregunta sobre la variable no correlacionada con probabilidad (1-P)=Q.
Luego el estimador esta relacionado a la variable Z que es la mezcla de X e Y segn P y (1-P).
Suponemos un MAS con reemplazamiento, entonces la respuesta aleatorizada Z, tiene funcin de
densidad:
f(z)=Pg(z) + Qh(z)

Sean z
1
, z
2
, ....., z
n
las respuestas aleatorizadas. Entonces la media y varianza muestral de Z son:
n
z
Z
n
i
i
=
=
1

1
) (
1
2
2

=
n
Z z
S
n
i
i
z


El estimador insesgado del parmetro
x
es dado por:

P
Q Z
y
x
) (


=

cuya varianza es dada por:
2
2
2
) (
)

(
nP P
Z V
V
z
x

= =


Luego, un estimador insesgado de esta varianza es dado por:

2
2
)

nP
S
V
z
x
=

En algunos casos el valor de
y
es desconocido por lo tanto es necesario una estimacin del
mismo. Este problema se puede solucionar seleccionando dos muestras aleatorias simples
independientes, similar al modelo de Simmons.

B. I mputacin de Datos
Es un mtodo para ajustar la falta de respuesta al asignar la caracterstica de inters a las personas
que no responden con base en la similitud de las variables disponibles tanto para las personas que
no respondieron como para quienes si lo hicieron.
El procedimiento de imputacin de datos, por lo general, se realiza en la etapa de estimacin de
parmetros, con el propsito de reemplazar datos faltantes de las unidades que no respondieron para
reducir el sesgo de no respuesta.

You might also like