Professional Documents
Culture Documents
ESTADISTICA INFERENCIAL
Los mtodos de muestreo probabilstico son aquellos en los que todos los individuos tienen la
misma probabilidad de ser elegidos para formar parte de una muestra. Slo estos mtodos de
muestreo probabilstico aseguran la representatividad de la muestra extrada y son, por tanto,
los ms recomendables. Dentro de los mtodos de probabilstico se encuentran los siguientes
tipos:
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la
poblacin que se est manejando es muy grande.
Este procedimiento exige numerar todos los elementos de la poblacin, pero en lugar de
extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un
nmero elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares
i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de
dividir el tamao de la poblacin entre el tamao de la muestra: k=N/n. El nmero i que se
emplea como punto de partida ser un nmero al azar entre 1 y k.
1
Estadstica Inferencial
El riesgo de este tipo de muestreo est en los casos en que se dan periodicidades en la
poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) se
puede introducir una homogeneidad que no se da en la poblacin.
Trata de obviar las dificultades que presentan los anteriores, ya que simplifica los procesos y
suele reducir el error muestral para un tamao dado de la muestra. Consiste en considerar
categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a
alguna caracterstica(se puede estratificar, por ejemplo, segn la profesin, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de inters estarn representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn
parte de la muestra. En ocasiones, las dificultades que plantea son demasiado grandes, pues
exige un conocimiento detallado de la poblacin (tamao geogrfico, sexos, edades...).
Afijacin ptima: se tiene en cuenta la previsible dispersin de los resultados, de modo que se
consideran la proporcin y la desviacin tpica.
2
Estadstica Inferencial
privados. Como el inters es que en la muestra estn representados todos los tipos de colegio,
se realiza un muestreo estratificado empleando como variable de estratificacin el tipo de
colegio.
Si se emplea una afijacin simple seran 300 nios de cada tipo de centro, pero en este caso
parece ms razonable utilizar una afijacin proporcional pues hay bastante diferencia en el
tamao de los estratos. Por consiguiente, se calcula la proporcin para cada uno de los estratos
respecto de la poblacin, para poder reflejarlo en la muestra.
Para conocer el tamao de cada estrato en la muestra se multiplica la proporcin por el tamao
muestral.
Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los
elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la
poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de
la poblacin que forman una unidad, a la que se denomina conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc. son
conglomerados naturales. En otras ocasiones, se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo por reas".
3
Estadstica Inferencial
Por ejemplo, en una investigacin se trata de conocer el grado de satisfaccin laboral de los
empleados de una cadena de almacenes; se toma una muestra de 700 empleados. Ante la
dificultad de acceder individualmente a estos empleados, se decide hacer una muestra por
conglomerados.
Sabiendo que el nmero de empleados por almacn es aproximadamente de 35, los pasos a
seguir seran:
Elegir por muestreo aleatorio simple o sistemtico los 20 almacenes (700/35 = 20) que
proporcionarn los 700 empleados que se necesitan.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que
renen determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo
femenino y residentes en una misma ciudad. Una vez determinada la cuota, se eligen los
4
Estadstica Inferencial
primeros que se encuentre que cumplan esas caractersticas. Este mtodo se utiliza mucho en
las encuestas de opinin.
Por ejemplo, una universidad desea estudiar la incidencia de las drogas en la adolescencia. Lo
que debera hacer sera: conocer por los informes del Estado cules son los centros educativos
ms afectados por el problema, fijar un nmero de sujetos a entrevistar, proporcional a cada
uno de los estratos (cuotas) y, finalmente, dejar en manos de los responsables del trabajo de
campo a qu sujetos concretos se deber entrevistar.
Muestreo intencional
Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y stos a otros, y as hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos,
egresados de una institucin, etc.
Aun cuando en las encuestas se utilizan mtodos de muestreo probabilstico, estn sujetas a
errores potenciales, los cuales se describen a continuacin:
5
Estadstica Inferencial
La clave para una seleccin apropiada en la muestra es un marco de poblacin adecuado o una
lista actualizada de todos los elementos que participarn en el muestreo. El error de cobertura
ocurre si se excluyen ciertos elementos de la lista de poblacin, de manera que no tienen
oportunidad de ser seleccionados en la muestra. El error de cobertura conduce a un sesgo de
seleccin. Si el listado es inadecuado porque no se incluyeron algunos elementos de la
poblacin, cualquier muestra probabilstica aleatoria proporcionar una estimacin de las
caractersticas del marco, no de la poblacin real.
No todas las personas estn dispuestas a contestar una encuesta. El error de no respuesta
surge del fracaso al recopilar datos de todos los sujetos de la muestra y el resultado es un sesgo
de no respuesta. Como en general no se puede suponer que las personas que no responden son
semejantes a aquellas que s responden, es importante realizar un seguimiento a las no
respuestas despus de un periodo determinado. Deben hacerse varios intentos, ya sea por
correo o por telfono, para convencerlos de que diligencien la encuesta. Con base en estos
resultados, las estimaciones obtenidas con las respuestas iniciales se combinan con las
estimaciones obtenidas con el seguimiento, de manera que las inferencias hechas a partir de la
encuesta sean vlidas.
Error de muestreo
Error de medicin
6
Estadstica Inferencial
Se refiere a la falta de precisin en las respuestas registradas, debido a fallas en la redaccin del
enunciado de las preguntas, la influencia del entrevistador en la persona que responde, o por el
esfuerzo que realiza la persona que responde.
7
Estadstica Inferencial
El tercer factor est relacionado con la desviacin estndar poblacional. Si la poblacin est
muy dispersa, se requerir una muestra grande. Si la poblacin es homognea, se requerir una
poblacin pequea
La frmula que nos permitir hallar el tamao de la muestra para estimar la media poblacional
est dado por:
z
2
n
E
Donde:
n es el tamao de la muestra
z es el valor normal estndar que corresponde al tamao de la muestra
es una estimacin de la desviacin estndar de la poblacin
E es el mximo error permitido
EJEMPLO
Se quiere determinar el ingreso medio mensual de los trabajadores de un cantn. El error al estimar la
media debe ser inferior a $100 con un nivel de confianza de 95%. Por estudios anteriores se sabe que la
desviacin estndar es de $1000. De qu tamao debe ser la muestra?
Como datos tenemos:
El valor de z para un nivel de confianza del %95 que es de z 1.96 (ver tabla de apndice D), E 100
y 1000 , al reemplazar en la frmula tenemos:
2
1.96 * $1000
n (19.6) 384.16
2
$100
2
2.58 * $1000
n (25.8) 665.64
2
$100
8
Estadstica Inferencial
1.3 Ms del 35% de las solicitudes de prstamo en el banco x son para vivienda.
H 0 : P 0.35
H 1 : P 0.35
1.4 Un fabricante de cierta marca de cereal de arroz afirma que el contenido de grasa saturada
no excede 1.5 gramos.
9
Estadstica Inferencial
H 0 : 1.5
H 1 : 1.5
PASO 2. Seleccionar el nivel de significancia
El nivel de significancia es la probabilidad de rechazar la hiptesis nula cuando es verdadera. Se
le denota mediante la letra griega , tambin es denominada como nivel de riesgo; este
trmino es ms adecuado, ya que se corre el riesgo de rechazar la hiptesis nula, cuando en
realidad es verdadera. Este nivel est bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin
indicar la probabilidad de no aceptarla, es decir, que est fuera de rea de aceptacin. El nivel
de confianza (1-) indica la probabilidad de aceptar la hiptesis planteada, cuando es verdadera
en la poblacin.
Tradicionalmente se selecciona el nivel 0.05 (5%) para proyectos de investigacin sobre
consumo, el nivel 0.01 (1%) para el aseguramiento de calidad, y el 0.10 (10%) para encuestas
polticas. El investigador es el que debe decidir qu nivel de significancia usar antes de formular
una regla de decisin y recopilar los datos mustrales.
PASO 3. Calcular el valor estadstico de prueba
Existen algunos estadsticos de prueba: La prueba F (Fisher), la prueba 2 (Ji cuadrada), la
X
z
/ n
X
z
s/ n
10
Estadstica Inferencial
X
t
s/ n
PASO 4. Definir la regin de rechazo
Es necesario definir estadsticamente, y sujetos al nivel de significancia, el rea a partir de qu
valores vamos a aceptar la hiptesis nula y rechazar la hiptesis alternativa. Esto es lo que se
conoce como regin de rechazo. La regin de rechazo define la ubicacin de todos los valores
que son tan grandes o tan pequeos, que la probabilidad de que se presenten bajo la
suposicin de que la hiptesis nula es verdadera, es muy remota.
11
Estadstica Inferencial
12
Estadstica Inferencial
13