Professional Documents
Culture Documents
FACES
ESCUELA DE ESTADÍSTICA
MUESTREO
LUIS A. NAVA PUENTE
ENERO 2018
INTRODUCCIÓN
En todo proceso de investigación estadística,
entre otras cosas se requiere información,
datos.
Características de la información:
Censo
Muestra
INTROSUCCIÓN
• Ventajas
a) Existe una cobertura total.
b) Tiene aceptación pública.
c) No se requieren grandes conocimientos de estadística.
• Desventajas
a) Aspecto logístico
b) Aspecto económico
c) Mayor probabilidad de cometer error
INTRODUCCIÓN
a) Costos reducidos.
b) Mayor rapidez para obtener resultados.
c) Mayor exactitud o mejor calidad de la información, debido
a:
c.1 Volumen de trabajo reducido.
c.2 Mayor y mejor supervisión en el trabajo.
c.3 Menor probabilidad de cometer errores durante el
procesamiento de la información.
d) Factibilidad de hacer el estudio cuando la toma de datos
implica la destrucción de los elementos muestreados.
INTRODUCCIÓN
• Errores en el muestreo.
a) Error de muestreo. Error de estimación.
Variación natural existente entre muestras
tomadas de la misma población.
b) Error ajeno al muestreo. Errores que surgen
al tomar las muestras. Ocurren en cualquier
etapa de la investigación y el que más aporte
da al error total.
CONCEPTOS FUNDAMENTALES
5. Trabajo de campo.
• Las unidades a medir.
• Las variables objeto de medida.
• El instrumento de medida.
• La realización de la medida.
6. La encuesta piloto. Es de gran utilidad probar el
instrumento y los métodos de campo en pequeña
escala.
7. Resumen y análisis de los datos.
8. Evaluación de los resultados. Medir la calidad..
9. Presentación de resultados.
CONCEPTOS FUNDAMENTALES
Tipos de muestreo.
Tipos de muestreo.
CON
REPOSICIÓN
MAS
SIN
REPOSICIÓN
MUESTREO ALEATORIO SIMPLE
𝑁! 𝑁 − 𝑛 ! 𝑛!
𝑃 𝑚𝑖 = 1 =
𝑁 − 𝑛 ! 𝑛! 𝑁!
𝑁−1 𝑁 𝑛
𝑃 𝐸𝑖 = =
𝑛−1 𝑛 𝑁
𝑁−2 𝑁 𝑛 𝑛−1
𝑃 𝐸𝑖 , 𝐸𝑗 = =
𝑛−2 𝑛 𝑁 𝑁−1
MUESTREO ALEATORIO SIMPLE
𝑢1 , 𝑢2 , ⋯ , 𝑢𝑁 𝝁, 𝝈𝟐
𝑦1 , 𝑦2 , ⋯ , 𝑦𝑛
𝑛
𝑖=1 𝑦𝑖
𝑦=
𝑛
Estimador insesgado de la media poblacional
MUESTREO ALEATORIO SIMPLE
Estimación de la Media Poblacional
Estimador de la varianza de 𝑝
𝑝𝑞
𝑠 2 𝑝 = 𝑓𝑐
𝑛−1
Estimador de la varianza de 𝐴
2 2
𝑝𝑞
𝑠 𝐴 = 𝑁 𝑓𝑐
𝑛−1
Muestreo Aleatorio Simple
Estimación de la Proporción y el total de elementos en la población
Alternativas:
1. Distribución Hipergeométrica (Valores exactos).
2. Distribución binomial (Valores bastante
próximos)
Muestreo Aleatorio Simple
Estimación en subpoblaciones
A veces es necesario obtener estimaciones tanto
a nivel de la población como a nivel de
subconjuntos de ella, denominados DOMINIOS.
Estos dominios se identifican después de
registrar la información de los elementos.
Muestreo Aleatorio Simple
Estimación en subpoblaciones
𝑖∈𝑈𝑑 𝑦𝑖
Estimador insesgado de 𝜇𝑈𝑑 =
𝑁𝑑
𝑦𝑖 𝑠𝑖 𝑖 ∈ 𝑈𝑑
𝑌𝑑 → 𝑦𝑑𝑖 =
0 𝑠𝑖 𝑖 ∉ 𝑈𝑑
𝑁
𝑦𝑖
𝑛𝑁𝑑 Si 𝑵𝒅 se conoce
𝑖∈𝑚𝑑
𝜇𝑈𝑑 = 𝑦𝑈𝑑 =
𝒊∈𝑼𝒅 𝒚𝒊
𝒏𝒅 Si 𝑵𝒅 no se conoce
Muestreo Aleatorio Simple
Estimación en subpoblaciones
𝑵 𝟐 𝒇𝒄 𝟐
𝒔𝒚 Si 𝑵𝒅 se conoce
𝑵𝟐𝒅 𝒏 𝒅𝒎
𝒔𝟐 𝒚𝑼𝒅 =
Si 𝑵𝒅 no se
¿?
conoce
Muestreo Aleatorio Simple
Estimación en subpoblaciones
Estimación de Proporciones
𝑎 𝑈𝑑
𝑝𝑈𝑑 =
𝑛𝑑
𝑵𝒅 − 𝒏𝒅 𝒑𝑼𝒅 𝒒𝑼𝒅
𝑵𝒅 𝒏𝒅 − 𝟏 Si 𝑵𝒅 se conoce
𝒔𝟐 𝒑𝑼𝒅 =
𝑵 − 𝒏 𝒑𝑼 𝒅 𝒒 𝑼 𝒅
Si 𝑵𝒅 no se
𝑵 𝒏𝒅 − 𝟏 conoce
Muestreo Aleatorio Simple
Tamaño de Muestra
• Representa uno de los principales problemas a
resolver en una investigación por muestreo.
• Tamaños de muestra insuficientes no
garantizan precisión ni confiabilidad.
• Tamaños de muestras muy grandes implica
incurrir en gastos innecesarios en general,
difícil de cubrir.
Muestreo Aleatorio Simple
Tamaño de Muestra
• Precisión absoluta
𝑃 𝑦−𝜇 <𝑒 =1−𝛼
• Precisión relativa
𝑦−𝜇
𝑃 <𝑒 =1−𝛼
𝜇
1 −∝ es el nivel confianza
𝑒 es el error máximo admisible
Muestreo Aleatorio Simple
Tamaño de Muestra
𝑠2 𝑁 − 𝑛
𝑒 = 𝑧∝ 2 𝑠 𝑦 = 𝑧∝ 2
𝑛 𝑁
𝑒
𝑠 𝑦 =
𝑧∝ 2
2 2
𝑧∝ 2 𝑠
𝑒2 𝑠2
𝑛= 2 2
=
1 𝑧∝ 2 𝑠 𝑒2 𝑠2
1+𝑁 2 +𝑁
𝑒2 𝑧∝ 2
Muestreo Aleatorio Simple
Tamaño de Muestra
𝑛 es:
• bastante sensible a cambios en la precisión
• Sensible a los niveles de confiabilidad y a la variabilidad
Muestreo Aleatorio Simple
Tamaño de Muestra
𝑛0
𝑛= 𝑛0
1+
𝑵
Muestreo Aleatorio Simple
Tamaño de Muestra
𝑧𝛼2 2 𝑠 2 𝑧𝛼2 2 𝑠 2
𝑁= 2 2
−1
𝑒 𝑒
Muestreo Aleatorio Simple
Tamaño de Muestra
𝑠 2 𝑧∝2 2 𝐶𝑉 2 𝑧∝2 2
𝑛= =
𝑠 2 𝑧∝2 2 𝐶𝑉 2 𝑧∝2 2
𝑒𝜇 2 + 𝑒2 +
𝑁 𝑁
𝐶𝑉 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑌
Muestreo Aleatorio Simple
Tamaño de Muestra
𝑛0 𝑁
𝑛=
𝑁 + 𝑛0
Muestreo Aleatorio Simple
Tamaño de Muestra
𝑛0 𝑁
𝑛=
𝑁 + 𝑛0
Muestreo Aleatorio Simple
Tamaño de Muestra
La selección de la muestra:
1. Se calcula el intervalo muestral (salto), 𝑘
𝑁
𝑘=
𝑛
2. Se selecciona en forma aleatoria, una unidad
muestral entre las 𝑘 primeras, digamos,
𝑡 = 1, 2, … , 𝑘.
3. Seguidamente, se seleccionan las unidades
muestrales correspondientes a las posiciones
𝑡 + 𝑘, 𝑡 + 2𝑘, … , 𝑡 + 𝑛 − 1 𝑘.
MUESTREO SISTEMÁTICO
Si se desconoce 𝑁
En base a la experiencia y la disponibilidad de
recursos, se decide la fracción de elementos a
muestrear (1 de cada 5, 1 de cada 8, 1 de cada
15, etc.)
MUESTREO SISTEMÁTICO
𝑘 𝑛
2 1 2
𝑠𝑑𝑒 = 𝑦𝑟𝑗 − 𝑦𝑟.
𝑘 𝑛−1
𝑟=1 𝑗=1
𝑛−1
𝑖=1 𝑦𝑟+𝑖𝑘
𝑦𝑟. =
𝑛
MUESTREO SISTEMÁTICO
Estimación de la media poblacional
𝒎
𝟏
𝒚′𝒔𝒊𝒔 = 𝒚𝒊
𝒎
𝒊=𝟏
MUESTREO SISTEMÁTICO
Estimación de la media poblacional
𝑚 ′
′ 𝑘′ − 𝑚 𝑖=1 𝑦𝑖 − 𝑦𝑠𝑖𝑠 2
𝑠 2 𝑦𝑠𝑖𝑠 =
𝑘′𝑚 𝑚−1
MUESTREO SISTEMÁTICO
𝑁 − 𝑛 𝑝𝑠𝑖𝑠 𝑞𝑠𝑖𝑠
𝑠2 𝑝𝑠𝑖𝑠 =
𝑛 𝑛−1
MUESTREO SISTEMÁTICO
Tamaño de muestra
Orden aleatorio: 𝑛 ⟶ 𝑀𝐴𝑆
Si no se cumple el orden aleatorio:
• Se obtienen estimaciones iniciales de los
parámetros mediante 𝑚′ muestras pilotos
de tamaño 𝑛.
5 ≤ 𝑚′ ≤ 6
5 ≤ 𝑛 ≤ 10
MUESTREO SISTEMÁTICO
Tamaño de muestra
Tipos de poblaciones:
1. Población aleatoria. Orden aleatorio
respecto a la variable de interés.
2. Población con tendencia lineal. Si sus
elementos pueden expresarse de la forma
𝒀𝒊 = 𝒂 + 𝒃𝒊 .
MUESTREO SISTEMÁTICO
Tipos de poblaciones
n1 n2 n3 nL-1 nL
𝐿
𝑛= 𝑛ℎ
ℎ=1
MUESTREO ESTRATIFICADO
L
N Nh
h 1
L
n nh
h 1
MUESTREO ESTRATIFICADO
SUPUESTOS
• HOMOGENEIDAD:
Entre elementos de un mismo estrato
• HETEROGENEIDAD:
Entre estratos
• INDEPENDENCIA:
Entre estratos al seleccionar la muestra
MUESTREO ESTRATIFICADO
Número de Estratos
• No se debe pensar que aumentando notablemente el número de estratos
se obtienen altos beneficios. En la práctica el aumento mas allá de 6
estratos produce pocas ganancias en la reducción de las varianzas.
• Definido por criterio del investigador
• Calculado por fórmula teórica:
2𝑛𝐶𝑢
𝐿=
𝐶𝑒
donde,
• Método Cluster
Cuando se tienen varias variables de estratificación, se puede formar
estratos de elementos similares en base a las medidas de distancia entre
elementos.
Método de Dalenius.
• Dalenius (1957), diseñó un método para determinar los mejores
límites para estratos cuando se dispone de datos correspondientes
a una variable cuantitativa para toda la población.
• Los resultados son muy buenos cuando la variable de estratificación
está altamente correlacionada con la variable de interés.
• Este método tiende a minimizar la varianza del estimador.
• Se requiere de manera preliminar contar con una gran cantidad de
estratos estrechos (intervalos de clase)
MUESTREO ESTRATIFICADO
𝑁ℎ
2. Número de muestras posibles en el estrato ℎ :
𝑛ℎ
𝑁ℎ
3. Cada muestra posible es seleccionada con probabilidad:1
𝑛ℎ
𝑛ℎ
4. La fracción o tasa de muestreo en cada estrato: 𝑓ℎ =
𝑁ℎ
𝑁ℎ
5. El peso muestral o factor de expansión en cada estrato: 𝑤ℎ =
𝑛ℎ
MUESTREO ESTRATIFICADO
𝑇= 𝑇ℎ
ℎ=1
• Debido a la independencia, la varianza es:
𝑉 𝑇 = 𝑉 𝑇ℎ
ℎ=1
𝑆2 𝑇 = 𝑆 2 𝑇ℎ
ℎ=1
MUESTREO ESTRATIFICADO
Estimación
𝒏𝒉
𝟏
𝒚𝒉 = 𝒚𝒉𝒋
𝒏𝒉
𝒋=𝟏
MUESTREO ESTRATIFICADO
Estimación
𝑳 𝟐
𝟐
𝟏 𝟐 𝑵𝒉 − 𝒏 𝒉 𝑺𝒉
𝑺 𝒚𝒔𝒕 = 𝟐 𝑵𝒉
𝑵 𝑵𝒉 𝒏𝒉
𝒉=𝟏
MUESTREO ESTRATIFICADO
Estimación
Tamaño de Muestra
¿Cuál es el tamaño de muestra n? y ¿cómo afijar el
tamaño de muestra a cada estrato?
1. Existen muchas maneras de dividir el tamaño de
muestra total entre los estratos. (afijación de la
muestra).
2. Cada división diferente puede originar una precisión
diferente para el estimador.
MUESTREO ESTRATIFICADO
Tamaño de la muestra
𝑒 = 𝑧𝛼 ∗ 𝑆 2 𝑦
2 𝑠𝑡