You are on page 1of 91

UNIVERSIDAD DE LOS ANDES

FACES
ESCUELA DE ESTADÍSTICA

MUESTREO
LUIS A. NAVA PUENTE
ENERO 2018
INTRODUCCIÓN
En todo proceso de investigación estadística,
entre otras cosas se requiere información,
datos.

Datos Elementos Universo


INTRODUCCIÓN

Características de la información:

1. De calidad. Suficiente y confiable


2. Oportuna.
3. Costos bajos
INTRODUCCIÓN

• Como acceder a la información:

Censo

Muestra
INTROSUCCIÓN

Censo. Se define como la enumeración completa de todos los


elementos de la población de interés.

• Ventajas
a) Existe una cobertura total.
b) Tiene aceptación pública.
c) No se requieren grandes conocimientos de estadística.

• Desventajas
a) Aspecto logístico
b) Aspecto económico
c) Mayor probabilidad de cometer error
INTRODUCCIÓN

Muestreo. Procedimiento mediante el cual se


selecciona y estudia una parte de la población
llamada “muestra”.

Muestra. Parte de la población (colección de


elementos, no todos) a estudiar y que se usan
para representarla
INTRODUCCIÓN

Ventajas del muestreo.

a) Costos reducidos.
b) Mayor rapidez para obtener resultados.
c) Mayor exactitud o mejor calidad de la información, debido
a:
c.1 Volumen de trabajo reducido.
c.2 Mayor y mejor supervisión en el trabajo.
c.3 Menor probabilidad de cometer errores durante el
procesamiento de la información.
d) Factibilidad de hacer el estudio cuando la toma de datos
implica la destrucción de los elementos muestreados.
INTRODUCCIÓN

Desventajas del muestreo.

a) Muestra representativa: no existe definición


formal que permita afirmar que una muestra es o
no representativa de la población objeto de
estudio.
b) Error de muestreo o error aleatorio: Error que se
comete debido al hecho de proyectar sobre la
población, las conclusiones obtenidas partir del
análisis de una muestra de ella.
CONCEPTOS FUNDAMENTALES
• Universo Estadístico. Se define como un
conjunto finito o infinito de personas u
objetos que presentan características
comunes, las cuales son objeto de estudio.
Población objetivo.
• Población. Conjunto de medidas de las
variables en estudio en cada uno de los
elementos del Universo. Población
estadística.
CONCEPTOS FUNDAMENTALES

• Unidad elemental. Objeto o elemento sobre


el cual se realizan las mediciones de las
características de interés.
• Unidad de muestreo. Se utilizan para
seleccionar la muestra. Conjunto no solapado
de elementos que cubre totalmente la
población.
CONCEPTOS FUNDAMENTALES

• Marco muestral. Base sobre la cual deben


diseñarse los procesos de selección. Es una
lista de unidades de muestreo. Debemos
intentar contar con un marco cuya diferencia o
separación del universo sea tan pequeña
como sea posible.
• Muestra. Subconjunto o parte de la población
objetivo (colección de elementos, no todos) a
estudiar y que se usan para representarla.
CONCEPTOS FUNDAMENTALES

• Errores en el muestreo.
a) Error de muestreo. Error de estimación.
Variación natural existente entre muestras
tomadas de la misma población.
b) Error ajeno al muestreo. Errores que surgen
al tomar las muestras. Ocurren en cualquier
etapa de la investigación y el que más aporte
da al error total.
CONCEPTOS FUNDAMENTALES

• Exactitud. Magnitud de las desviaciones


respecto al verdadero parámetro.
• Precisión. Magnitud de las desviaciones
respecto al estimador muestral.
CONCEPTOS FUNDAMENTALES

Etapas de una Investigación por Muestreo.


1. Fijar Objetivos.
• Objetivos Generales.
• Objetivos Específicos.
2. Cobertura. Debe definirse el alcance geográfico
(cobertura horizontal) y el nivel de desagregación
deseado de la información (cobertura vertical).
3. Periodo de Referencia. Es necesario definir el periodo
al cual va a estar referida la información.
CONCEPTOS FUNDAMENTALES

4. Diseño de la muestra. Representa el aspecto fundamental


de la teoría del muestreo. Deben considerarse en el
diseño de la muestra los siguientes puntos:
• Especificaciones de las unidades de muestreo.
• Posible utilización de información complementaria.
• Análisis y determinación del tamaño de la muestra.
• Método de selección de la muestra.
• Fórmulas para la estimación de los errores de muestreo.
• Métodos estadísticos para el tratamiento de la falta de
respuesta.
• Control de otros errores ajenos al muestreo.
CONCEPTOS FUNDAMENTALES

5. Trabajo de campo.
• Las unidades a medir.
• Las variables objeto de medida.
• El instrumento de medida.
• La realización de la medida.
6. La encuesta piloto. Es de gran utilidad probar el
instrumento y los métodos de campo en pequeña
escala.
7. Resumen y análisis de los datos.
8. Evaluación de los resultados. Medir la calidad..
9. Presentación de resultados.
CONCEPTOS FUNDAMENTALES

Tipos de muestreo.

• No Probabilístico. Selección de una muestra en


forma intencional, de acuerdo a opiniones o
criterios personales. No involucra ningún
elemento aleatorio en el procedimiento de
selección.
Se utiliza cuando el probabilístico resulta muy
costoso
No sirve para hacer generalizaciones (No garantiza
representatividad)
CONCEPTOS FUNDAMENTALES

Tipos de muestreo.

• Probabilístico. Procedimiento que asigna a


cada elemento de la población, una
probabilidad conocida de ser seleccionado.
Garantiza representatividad
CONCEPTOS FUNDAMENTALES
MUESTREO ALEATORIO SIMPLE
El MAS representa el procedimiento de
muestreo probabilístico más sencillo. Consiste
en seleccionar n elemento de un universo de
tamaño N.
• Todas las muestras de un tamaño fijo tienen la
misma probabilidad de ser seleccionadas.
• Los elementos se seleccionan uno a la vez.
MUESTREO ALEATORIO SIMPLE

CON
REPOSICIÓN
MAS
SIN
REPOSICIÓN
MUESTREO ALEATORIO SIMPLE

MAS con reposición. Muestras con la misma


probabilidad de ser seleccionadas. Cada
elemento puede ser seleccionado más de una
vez.
MAS sin reposición. Muestras con la misma
probabilidad de ser seleccionadas. Cada
elemento puede ser seleccionado solo una vez.
MUESTREO ALEATORIO SIMPLE

Muestreo Aleatorio Simple sin reposición.

𝑁! 𝑁 − 𝑛 ! 𝑛!
𝑃 𝑚𝑖 = 1 =
𝑁 − 𝑛 ! 𝑛! 𝑁!

𝑁−1 𝑁 𝑛
𝑃 𝐸𝑖 = =
𝑛−1 𝑛 𝑁

𝑁−2 𝑁 𝑛 𝑛−1
𝑃 𝐸𝑖 , 𝐸𝑗 = =
𝑛−2 𝑛 𝑁 𝑁−1
MUESTREO ALEATORIO SIMPLE

Todo diseño muestral comprende:


1. Método de selección de la muestra
2. Estimadores y sus propiedades
3. Determinación del tamaño muestral
4. Ajustes
MUESTREO ALEATORIO SIMPLE

Como se selecciona una muestra irrestricta


aleatoria:
1. Tablas de números aleatorios
2. Computadoras
MUESTREO ALEATORIO SIMPLE

Condiciones ideales para usar el MAS:


1. Poblaciones homogéneas (variabilidad
cercana a cero)
2. Lista enumerada de 1 a N
MUESTREO ALEATORIO SIMPLE

Estimación de la media poblacional

Ingreso mensual de la familia Ingreso promedio mensual


Producción anual de maíz en Producción media anual de
una unidad de producción maíz por unidad de
Venezolana producción en Venezuela
Tiempo de vida de los Tiempo de vida promedio de
habitantes de una zona los habitantes de una zona
determinada determinada
MUESTREO ALEATORIO SIMPLE
Estimación de la Media Poblacional

𝑢1 , 𝑢2 , ⋯ , 𝑢𝑁 𝝁, 𝝈𝟐

𝑦1 , 𝑦2 , ⋯ , 𝑦𝑛

𝑛
𝑖=1 𝑦𝑖
𝑦=
𝑛
Estimador insesgado de la media poblacional
MUESTREO ALEATORIO SIMPLE
Estimación de la Media Poblacional

Estimador insesgado de la varianza poblacional


𝑛 2
2 𝑖=1 𝑖𝑦 − 𝑦
𝑠 =
𝑛−1

Estimador insesgado de la varianza de la media muestral


𝑛 𝑠 2
𝑠2 𝑦 = 1 −
𝑁 𝑛
𝑛
𝑓𝑐 = 1 − = Factor de corrección para poblaciones
𝑁
finitas
MUESTREO ALEATORIO SIMPLE
Estimación de la Media Poblacional

Error estándar de la estimación


𝑠 𝑦 = 𝑠2 𝑦

Límite de error de estimación


𝑒 = 𝑧𝛼 2 𝑠 𝑦
MUESTREO ALEATORIO SIMPLE

Estimación del total poblacional

Ingreso mensual de la familia Ingreso promedio mensual


Producción anual de maíz en Producción Total anual de
una unidad de producción maíz por unidad de
Venezolana producción en Venezuela
Tiempo de vida de los Tiempo total de vida de los
habitantes de una zona habitantes de una zona
determinada determinada
MUESTREO ALEATORIO SIMPLE
Estimación del total Poblacional

Estimador insesgado del total poblacional


𝑇 = 𝜏 = 𝑁𝑦

Varianza estimada del total muestral


2
𝑠
𝑠 2 𝜏 = 𝑁 2 𝑓𝑐
𝑛
MUESTREO ALEATORIO SIMPLE

Estimación de la Proporción y el total de


elementos en la población
• Proporción de personas que prefieren
determinada marca de crema dental.
• Proporción de personas a favor de un candidato.
• Cantidad de profesores universitarios que
califican como investigadores.
• Cantidad de personas a favor de determinada
decisión.
Muestreo Aleatorio Simple
Estimación de la Proporción y el total de elementos en la población

Estimador de la Proporción Poblacional


𝑎
𝑝=
𝑛
𝑎 =Número de elementos en la muestra con el
atributo

Estimador del número total de elementos en la


población con el atributo
𝐴 = 𝑁𝑝
Muestreo Aleatorio Simple
Estimación de la Proporción y el total de elementos en la población

Estimador de la varianza de 𝑝
𝑝𝑞
𝑠 2 𝑝 = 𝑓𝑐
𝑛−1

Estimador de la varianza de 𝐴
2 2
𝑝𝑞
𝑠 𝐴 = 𝑁 𝑓𝑐
𝑛−1
Muestreo Aleatorio Simple
Estimación de la Proporción y el total de elementos en la población

Uso de la distribución normal. Para la construcción


de intervalos de confianza y pruebas de hipótesis
para 𝜋 y 𝐴.
𝒑 0,5 0,4 0,3 0,2 0,1 0,05 <0,05
𝑛 30 50 80 200 600 1400 >1400

Alternativas:
1. Distribución Hipergeométrica (Valores exactos).
2. Distribución binomial (Valores bastante
próximos)
Muestreo Aleatorio Simple

Estimación en subpoblaciones
A veces es necesario obtener estimaciones tanto
a nivel de la población como a nivel de
subconjuntos de ella, denominados DOMINIOS.
Estos dominios se identifican después de
registrar la información de los elementos.
Muestreo Aleatorio Simple
Estimación en subpoblaciones

Ejemplo. Estudio sobre el hábito de fumar


• Estimar el porcentaje de fumadores en la
población
• Estimar el porcentaje de fumadores para
HOMBRES
• Estimar el porcentaje de fumadores para
MUJERES
Muestreo Aleatorio Simple
Estimación en subpoblaciones

• Sea 𝑈𝑑 , subpoblación 𝑑 , de tamaño 𝑁𝑑


perteneciente al universo estadístico, 𝑈.
• 𝜇𝑈𝑑 = Media de los elementos en 𝑈𝑑 .
• 𝑚𝑑 = 𝑚 ∩ 𝑈𝑑 = Elementos de 𝑚 que
pertenecen a 𝑈𝑑 .
• 𝑛𝑑 = Tamaño de 𝑚𝑑 .
Muestreo Aleatorio Simple
Estimación en subpoblaciones

𝑖∈𝑈𝑑 𝑦𝑖
Estimador insesgado de 𝜇𝑈𝑑 =
𝑁𝑑
𝑦𝑖 𝑠𝑖 𝑖 ∈ 𝑈𝑑
𝑌𝑑 → 𝑦𝑑𝑖 =
0 𝑠𝑖 𝑖 ∉ 𝑈𝑑

𝑁
𝑦𝑖
𝑛𝑁𝑑 Si 𝑵𝒅 se conoce
𝑖∈𝑚𝑑

𝜇𝑈𝑑 = 𝑦𝑈𝑑 =
𝒊∈𝑼𝒅 𝒚𝒊
𝒏𝒅 Si 𝑵𝒅 no se conoce
Muestreo Aleatorio Simple
Estimación en subpoblaciones

Estimador de la varianza del estimador


𝟏 𝟐 𝟏 𝟐
Sea 𝒔𝟐𝒚𝒅𝒎 = 𝒚
𝒊∈𝒎𝒅 𝒊 − 𝒊∈𝒎𝒅 𝒚𝒊
𝒏−𝟏 𝒏

𝑵 𝟐 𝒇𝒄 𝟐
𝒔𝒚 Si 𝑵𝒅 se conoce
𝑵𝟐𝒅 𝒏 𝒅𝒎
𝒔𝟐 𝒚𝑼𝒅 =
Si 𝑵𝒅 no se
¿?
conoce
Muestreo Aleatorio Simple
Estimación en subpoblaciones

Estimación de Proporciones
𝑎 𝑈𝑑
𝑝𝑈𝑑 =
𝑛𝑑

𝑵𝒅 − 𝒏𝒅 𝒑𝑼𝒅 𝒒𝑼𝒅
𝑵𝒅 𝒏𝒅 − 𝟏 Si 𝑵𝒅 se conoce
𝒔𝟐 𝒑𝑼𝒅 =
𝑵 − 𝒏 𝒑𝑼 𝒅 𝒒 𝑼 𝒅
Si 𝑵𝒅 no se
𝑵 𝒏𝒅 − 𝟏 conoce
Muestreo Aleatorio Simple

Tamaño de Muestra
• Representa uno de los principales problemas a
resolver en una investigación por muestreo.
• Tamaños de muestra insuficientes no
garantizan precisión ni confiabilidad.
• Tamaños de muestras muy grandes implica
incurrir en gastos innecesarios en general,
difícil de cubrir.
Muestreo Aleatorio Simple
Tamaño de Muestra

Tamaño de muestra para estimar la media


• Considerar una fórmula que incluya 𝑛.
𝑛 𝜎2
𝑉 𝑦 = 1−
𝑁 𝑛
• Controlar el error máximo absoluto
• Controlar el error máximo relativo
Muestreo Aleatorio Simple
Tamaño de Muestra

• Precisión absoluta
𝑃 𝑦−𝜇 <𝑒 =1−𝛼

• Precisión relativa
𝑦−𝜇
𝑃 <𝑒 =1−𝛼
𝜇
1 −∝ es el nivel confianza
𝑒 es el error máximo admisible
Muestreo Aleatorio Simple
Tamaño de Muestra

Usando precisión absoluta


Aplicando el teorema del límite central
𝑦 ∓ 𝑧∝ 2 𝑠 𝑦
Representa un intervalo de confianza del 1 −∝ % para 𝜇

𝑠2 𝑁 − 𝑛
𝑒 = 𝑧∝ 2 𝑠 𝑦 = 𝑧∝ 2
𝑛 𝑁
𝑒
𝑠 𝑦 =
𝑧∝ 2

2 2
𝑧∝ 2 𝑠
𝑒2 𝑠2
𝑛= 2 2
=
1 𝑧∝ 2 𝑠 𝑒2 𝑠2
1+𝑁 2 +𝑁
𝑒2 𝑧∝ 2
Muestreo Aleatorio Simple
Tamaño de Muestra

El tamaño de muestra es función de:


1. La confiabilidad para las estimaciones.
2. La variabilidad de la población.
3. La precisión en las estimaciones.
4. El tamaño de la población (es realmente importante
cuando su valor es pequeño).

𝑛 es:
• bastante sensible a cambios en la precisión
• Sensible a los niveles de confiabilidad y a la variabilidad
Muestreo Aleatorio Simple
Tamaño de Muestra

Si 𝑁 es lo suficientemente grande (𝑁 → ∞), o el


muestreo es con reemplazo, 𝑛 puede
aproximarse por
𝑧𝛼2 2 𝑠 2
𝑛0 =
𝑒2

𝑛0
𝑛= 𝑛0
1+
𝑵
Muestreo Aleatorio Simple
Tamaño de Muestra

El tamaño de la muestra no debe crecer de


acuerdo al tamaño de la población.
Existe un valor 𝑁 a partir del cual no debe
incrementarse 𝑛.

𝑧𝛼2 2 𝑠 2 𝑧𝛼2 2 𝑠 2
𝑁= 2 2
−1
𝑒 𝑒
Muestreo Aleatorio Simple
Tamaño de Muestra

Usando la precisión relativa


Reemplazar en la ecuación para el cálculo del
tamaño muestral a 𝑒 por 𝑒𝜇

𝑠 2 𝑧∝2 2 𝐶𝑉 2 𝑧∝2 2
𝑛= =
𝑠 2 𝑧∝2 2 𝐶𝑉 2 𝑧∝2 2
𝑒𝜇 2 + 𝑒2 +
𝑁 𝑁

𝐶𝑉 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑌
Muestreo Aleatorio Simple
Tamaño de Muestra

Si 𝑁 es lo suficientemente grande (𝑁 → ∞), o el


muestreo es con reemplazo, 𝑛 puede
aproximarse por
𝑧𝛼2 2 𝐶𝑉 2
𝑛0 =
𝑒2

𝑛0 𝑁
𝑛=
𝑁 + 𝑛0
Muestreo Aleatorio Simple
Tamaño de Muestra

Tamaño de muestra para estimar el total


Usando un procedimiento similar al utilizado en
el caso de la media
𝑠2
𝑛=
𝑒2 1 𝑠2
+
2
𝑧∝ 2 𝑁 2 𝑁
Muestreo Aleatorio Simple
Tamaño de Muestra

Tamaño de muestra para estimar la proporción


Usando error máximo absoluto
𝑧∝2 2 𝑝𝑞
𝑒 2 𝑁𝑝𝑞
𝑛= 2 =
𝑁 − 1 1 𝑧∝ 2 𝑝𝑞 𝑒2
𝑁 − 1 + 𝑝𝑞
+ 2
𝑁 𝑁 𝑒 2 𝑧∝ 2
Muestreo Aleatorio Simple
Tamaño de Muestra

Si 𝑁 es lo suficientemente grande (𝑁 → ∞), o el


muestreo es con reemplazo, 𝑛 puede
aproximarse por
𝑧𝛼2 2 𝑝𝑞
𝑛0 =
𝑒2

𝑛0 𝑁
𝑛=
𝑁 + 𝑛0
Muestreo Aleatorio Simple
Tamaño de Muestra

Usando precisión relativa


Muestreo Aleatorio Simple
Tamaño de Muestra
MUESTREO SISTEMÁTICO

• Es uno de los esquemas de muestreo más


utilizados, debido a la facilidad que ofrece
para la selección de la muestra.
• Los elementos de la población se consideran
en una secuencia ordenada(1 a N).
MUESTREO SISTEMÁTICO

La selección de la muestra:
1. Se calcula el intervalo muestral (salto), 𝑘
𝑁
𝑘=
𝑛
2. Se selecciona en forma aleatoria, una unidad
muestral entre las 𝑘 primeras, digamos,
𝑡 = 1, 2, … , 𝑘.
3. Seguidamente, se seleccionan las unidades
muestrales correspondientes a las posiciones
𝑡 + 𝑘, 𝑡 + 2𝑘, … , 𝑡 + 𝑛 − 1 𝑘.
MUESTREO SISTEMÁTICO

• Se tienen 𝑘 posibles muestras sistemáticas.


• Cada muestra se determina al seleccionar su
primer elemento.
• Suponiendo 𝑁 = 𝑛𝑘
Elementos 1 2 … t … k
1 𝑦1 𝑦2 … 𝑦𝑡 … 𝑦𝑘
2 𝑦1+𝑘 𝑦2+𝑘 … 𝑦𝑡+𝑘 … 𝑦2𝑘
⋮ ⋮ ⋮ ⋮ ⋮
n 𝑦1+(𝑛−1)𝑘 𝑦2+(𝑛−1)𝑘 … 𝑦𝑡+(𝑛−1)𝑘 … 𝑦𝑛𝑘
Media 𝑦1 𝑦2 … 𝑦𝑡 𝑦𝑘
MUESTREO SISTEMÁTICO

Cuando 𝑘 no es un número entero, se acostumbra a redondear al


entero más próximo Sesgo
Alternativa 1.
I. Aproximar 𝑘 a su parte entera.
II. Calcular 𝑛𝑘.
III. Eliminar aleatoriamente 𝑁 − 𝑛𝑘 elementos de la población.
Alternativa 2.
I. Seleccionar 𝑘 como el entero más cercano a 𝑁 𝑛
II. Seleccionar como primer elemento, un elemento entre 1 y 𝑁, 𝑚.
III. Los siguientes elementos se seleccionan agregando (sumando) a
𝑚 la amplitud 𝑘, 𝑛 − 1 veces.
MUESTREO SISTEMÁTICO

Si se desconoce 𝑁
En base a la experiencia y la disponibilidad de
recursos, se decide la fracción de elementos a
muestrear (1 de cada 5, 1 de cada 8, 1 de cada
15, etc.)
MUESTREO SISTEMÁTICO

Estimación de la media poblacional


Si 𝑁 = 𝑛𝑘, la siguiente expresión es un estimador
insesgado de 𝜇
𝑛
𝑖=1 𝑦𝑖
𝑦𝑠𝑖𝑠 =
𝑛

La varianza del estimador está dada por:


𝑁−1 2 𝑘 𝑛−1 2
𝑉 𝑦𝑠𝑖𝑠 = 𝜎 − 𝑠𝑑𝑒
𝑁 𝑁
MUESTREO SISTEMÁTICO
Estimación de la media poblacional

𝑘 𝑛
2 1 2
𝑠𝑑𝑒 = 𝑦𝑟𝑗 − 𝑦𝑟.
𝑘 𝑛−1
𝑟=1 𝑗=1

𝑛−1
𝑖=1 𝑦𝑟+𝑖𝑘
𝑦𝑟. =
𝑛
MUESTREO SISTEMÁTICO
Estimación de la media poblacional

Población con un orden aleatorio respecto a la


variable de interés
𝑛
𝑛 𝑦𝑖 −𝑦𝑠𝑖𝑠 2
𝑠𝑦2𝑠𝑖𝑠 = 1 − 𝑖=1
𝑁 𝑛 𝑛−1
Estimador insesgado de 𝑽 𝒚𝒔𝒊𝒔
MUESTREO SISTEMÁTICO
Estimación de la media poblacional

Población con variación periódica respecto a


la variable de interés
Alternativa.
Número de muestras 1 ⟹ 𝑚 de tamaño 𝒏 𝒎
Punto aleatorio de partida 1 ↔ 𝑘 ′ ; 𝑘 ′ = 𝑘𝑚
𝑵
𝒌=
𝒎
MUESTREO SISTEMÁTICO
Estimación de la media poblacional

Este procedimiento es equivalente a


seleccionar 𝑚 elementos mediante el MAS de
una muestra de tamaño 𝑘 ′ , cuyos elementos
son las medias de las muestras sistemáticas
obtenidas.

𝒎
𝟏
𝒚′𝒔𝒊𝒔 = 𝒚𝒊
𝒎
𝒊=𝟏
MUESTREO SISTEMÁTICO
Estimación de la media poblacional

Estimador de la varianza de la media

𝑚 ′
′ 𝑘′ − 𝑚 𝑖=1 𝑦𝑖 − 𝑦𝑠𝑖𝑠 2
𝑠 2 𝑦𝑠𝑖𝑠 =
𝑘′𝑚 𝑚−1
MUESTREO SISTEMÁTICO

Estimación del total poblacional


𝑇𝑠𝑖𝑠 = 𝜏𝑠𝑖𝑠 = 𝑁𝑦𝑠𝑖𝑠

Varianza del estimador


𝑉 𝑡𝑠𝑖𝑠 = 𝑁 2 𝑉 𝑦𝑠𝑖𝑠

Si la población tiene un orden aleatorio respecto


a la variable de interés
𝑠 2 𝜏𝑠𝑖𝑠 = 𝑁 2 𝑠 2 𝑦𝑠𝑖𝑠
MUESTREO SISTEMÁTICO

Estimación de la proporción poblacional 𝑃 = 𝜋 .


𝑎
𝑝𝑠𝑖𝑠 =
𝑛

Varianza del estimador


𝑁 − 𝑛 𝑃𝑄
𝑉 𝑝𝑠𝑖𝑠 =
𝑁−1 𝑛

𝑁 − 𝑛 𝑝𝑠𝑖𝑠 𝑞𝑠𝑖𝑠
𝑠2 𝑝𝑠𝑖𝑠 =
𝑛 𝑛−1
MUESTREO SISTEMÁTICO

Tamaño de muestra
Orden aleatorio: 𝑛 ⟶ 𝑀𝐴𝑆
Si no se cumple el orden aleatorio:
• Se obtienen estimaciones iniciales de los
parámetros mediante 𝑚′ muestras pilotos
de tamaño 𝑛.
5 ≤ 𝑚′ ≤ 6
5 ≤ 𝑛 ≤ 10
MUESTREO SISTEMÁTICO
Tamaño de muestra

• Obtener el valor definitivo de 𝑚


2
𝑧𝛼 2 𝑠 2 𝑦𝑖 𝑁
𝑦2 𝑛
𝑚= 2 2 𝑦
2 𝑁 𝑧𝛼 2 𝑠 𝑖
𝑒 −1 +
𝑛 𝑦2
𝑚′ 𝑚′ 2
1 𝑖=1𝑦𝑖 − 𝑦
𝑦= ′ 𝑦𝑖 ; 𝑠 2 𝑦𝑖 =
𝑚 𝑚−1
𝑖=1
MUESTREO SISTEMÁTICO

Tipos de poblaciones:
1. Población aleatoria. Orden aleatorio
respecto a la variable de interés.
2. Población con tendencia lineal. Si sus
elementos pueden expresarse de la forma
𝒀𝒊 = 𝒂 + 𝒃𝒊 .
MUESTREO SISTEMÁTICO
Tipos de poblaciones

3. Población periódica. Orden de acuerdo a


una condición cíclica de la variable de
interés.
4. Población autocorrelacionada. Las
observaciones tienden a ser muy
semejantes.
MUESTREO ESTRATIFICADO
• A veces es conveniente dividir a la población en grupos o estratos para
mejorar la eficiencia del muestreo o bien para obtener resultados
desagregados por dominios de estudio.
• La población de estudio, formada por N unidades, se divide en L estratos,
los cuales constituyen una población, es decir, no se solapan y la unión de
todos ellos es el total.
• El estrato ℎ estará conformado por 𝑁ℎ unidades de forma que
𝐿
𝑖=1 𝑁ℎ = 𝑁.
• Los estratos, para mejorar la eficiencia del diseño, se forman en función de
variables altamente correlacionadas con las variables en estudio.
MUESTREO ESTRATIFICADO

• Si la selección en cada estrato es aleatoria simple, el


muestreo se denomina Muestreo Aleatorio
Estratificado (MAE).
• Su principal objetivo es mejorar la precisión de las
estimaciones reduciendo los errores de muestreo.
Minimiza la varianza de los estimadores mediante la
creación de estratos internamente lo más homogéneos
posible y entre ellos, lo más heterogéneo.
MUESTREO ESTRATIFICADO

• Es eficiente en poblaciones heterogéneas.


• Reduce el costo del muestreo al reducir los tamaños de
muestra sin perder precisión.
• Forma parte de los diseños de muestras complejas.
• Administrativamente el muestreo estratificado facilita
el trabajo de campo (supervisiones y control).
MUESTREO ESTRATIFICADO

n1 n2 n3 nL-1 nL
𝐿

𝑛= 𝑛ℎ
ℎ=1
MUESTREO ESTRATIFICADO

L
N   Nh
h 1

L
n   nh
h 1
MUESTREO ESTRATIFICADO

SUPUESTOS
• HOMOGENEIDAD:
Entre elementos de un mismo estrato

• HETEROGENEIDAD:
Entre estratos

• INDEPENDENCIA:
Entre estratos al seleccionar la muestra
MUESTREO ESTRATIFICADO

Número de Estratos
• No se debe pensar que aumentando notablemente el número de estratos
se obtienen altos beneficios. En la práctica el aumento mas allá de 6
estratos produce pocas ganancias en la reducción de las varianzas.
• Definido por criterio del investigador
• Calculado por fórmula teórica:

2𝑛𝐶𝑢
𝐿=
𝐶𝑒

donde,

𝐶𝑢 : costo por unidad de muestra


𝐶𝑒 : costo por estratificación
MUESTREO ESTRATIFICADO

Como formar los estratos:


• Método de Dalenius
Cuando se tiene una variable cuantitativa de estratificación, se puede
determinar los límites de los intervalos para cada estrato.

• Método Cluster
Cuando se tienen varias variables de estratificación, se puede formar
estratos de elementos similares en base a las medidas de distancia entre
elementos.

• A criterio del investigador


Cuando se forman estratos por dominios geográficos, por dominios
temáticos, etc, que favorecen el análisis de la muestra.
MUESTREO ESTRATIFICADO

Método de Dalenius.
• Dalenius (1957), diseñó un método para determinar los mejores
límites para estratos cuando se dispone de datos correspondientes
a una variable cuantitativa para toda la población.
• Los resultados son muy buenos cuando la variable de estratificación
está altamente correlacionada con la variable de interés.
• Este método tiende a minimizar la varianza del estimador.
• Se requiere de manera preliminar contar con una gran cantidad de
estratos estrechos (intervalos de clase)
MUESTREO ESTRATIFICADO

Procedimiento de selección de la muestra


1. Preparar el marco muestral tal que contenga
la variable que identifica el estrato al que
pertenece cada unidad del marco
2. Seleccionar la muestra aleatoria (simple con
o sin reemplazo, sistemática, etc) de forma
independiente en cada estrato
3. La muestra estratificada es la unión de todas
las muestras obtenidas de cada estrato
MUESTREO ESTRATIFICADO

MAS sin reemplazo en cada estrato

1. En el estrato ℎ, las selecciones no son independientes

𝑁ℎ
2. Número de muestras posibles en el estrato ℎ :
𝑛ℎ

𝑁ℎ
3. Cada muestra posible es seleccionada con probabilidad:1
𝑛ℎ
𝑛ℎ
4. La fracción o tasa de muestreo en cada estrato: 𝑓ℎ =
𝑁ℎ

𝑁ℎ
5. El peso muestral o factor de expansión en cada estrato: 𝑤ℎ =
𝑛ℎ
MUESTREO ESTRATIFICADO

Estimación del Total Poblacional, 𝑻


• El estimador del total poblacional esta dado por:

𝑇= 𝑇ℎ
ℎ=1
• Debido a la independencia, la varianza es:

𝑉 𝑇 = 𝑉 𝑇ℎ
ℎ=1

𝑆2 𝑇 = 𝑆 2 𝑇ℎ
ℎ=1
MUESTREO ESTRATIFICADO
Estimación

Estimador de la Media Poblacional, 𝛍


𝑳 𝑳
𝟏
𝝁 = 𝒚𝒔𝒕 = 𝑵𝒉 𝒚 𝒉 = 𝑾 𝒉 𝒚𝒉
𝑵
𝒉=𝟏 𝒉=𝟏

𝒏𝒉
𝟏
𝒚𝒉 = 𝒚𝒉𝒋
𝒏𝒉
𝒋=𝟏
MUESTREO ESTRATIFICADO
Estimación

La varianza de la media muestral


𝑳 𝟐
𝟏 𝟐 𝑵𝒉 − 𝒏 𝒉 𝝈𝒉
𝑽 𝒚𝒔𝒕 = 𝟐 𝑵𝒉
𝑵 𝑵𝒉 𝒏𝒉
𝒉=𝟏

𝑳 𝟐
𝟐
𝟏 𝟐 𝑵𝒉 − 𝒏 𝒉 𝑺𝒉
𝑺 𝒚𝒔𝒕 = 𝟐 𝑵𝒉
𝑵 𝑵𝒉 𝒏𝒉
𝒉=𝟏
MUESTREO ESTRATIFICADO
Estimación

Un ejemplo. Muestreo estratificado con asignación proporcional


Estrato 1 Estrato 2
𝑁1 = 110 𝑁2 = 168
𝑛1 =¿ ? 𝑛2 =¿ ?
𝑛1 𝑛2

𝑦1𝑗 = 240.00 0 𝑦2𝑗 = 420,000


𝑗=1 𝑗=1
𝑛1 𝑛2
2 2
𝑦1𝑗 = 2.980.000.000 𝑦2𝑗 = 6.010.000.000
𝑗=1 𝑗=1

Estimar 𝝁 y el error de estimación usando un nivel de significación


del 5%.
MUESTREO ESTRATIFICADO

Tamaño de Muestra
¿Cuál es el tamaño de muestra n? y ¿cómo afijar el
tamaño de muestra a cada estrato?
1. Existen muchas maneras de dividir el tamaño de
muestra total entre los estratos. (afijación de la
muestra).
2. Cada división diferente puede originar una precisión
diferente para el estimador.
MUESTREO ESTRATIFICADO
Tamaño de la muestra

¿Qué factores influyen en el mejor esquema de afijación?


1. La variabilidad de las observaciones dentro de cada
estrato.
2. El número total de elementos de cada estrato.
3. El costo de obtener una observación de cada estrato.
MUESTREO ESTRATIFICADO
Tamaño de la muestra

Tamaño de muestra para estimar 𝜇

𝑒 = 𝑧𝛼 ∗ 𝑆 2 𝑦
2 𝑠𝑡

You might also like