You are on page 1of 18

Tema: Estadstica Inferencial

1. MUESTREO ALEATORIO

Muestra y poblacin
Poblacin: es el conjunto de todos los elementos que poseen una determinada
caracterstica. En general supondremos que la poblacin es muy grande.
Muestra: es un subconjunto de la poblacin.
Muestreo: es el proceso mediante el cual se escoge una muestra de la poblacin.
Inferencia estadstica: proceso a travs del cual se obtienen conclusiones sobre una
poblacin, a travs de la informacin que proporciona una muestra. La confianza de
tal extrapolacin depender de la representatividad de la muestra.
Razones para usar muestras: economa, observacin destructiva, etc.
La representatividad de la muestra depende de dos
cosas:
a) Del mecanismo de seleccin: que ha de
garantizar que no hay un elemento de la
poblacin con ms probabilidad que otro de
entrar en la muestra. Si no, sera una muestra
sesgada.

b) Del tamao de la muestra: si el mecanismo
de seleccin es correcto, cuanto ms grande
sea la muestra mayor ser la probabilidad de
que se parezca a la poblacin.
Tipos de muestreo
Muestreo aleatorio
Muestreo no aleatorio
Ejemplo. Tres empresas estn investigando el nivel adquisitivo de las
personas que acuden a un determinado concierto de msica clsica. Para
ello, cada una elige una muestra de la siguiente manera:
1.- 50 primeras personas que entren en el auditorio.
2.- 50 personas elegidas al azar de las que se ubican en la platea baja.
3.- 50 personas elegidas al azar de todas las asistentes.
Ventajas y desventajas
Tipos de muestreo aleatorio
Muestreo aleatorio simple: todos los
elementos de la poblacin tienen la
misma probabilidad de ser elegidos
para formar parte de la muestra.
Muestreo aleatorio estratificado: la
poblacin se divide en grupos
homogneos que llamamos estratos.
La proporcin de cada estrato en la
poblacin se mantiene en la muestra.
Cada uno de los estrato de la muestra
se obtiene por muestreo aleatorio
simple sobre el estrato
correspondiente de la poblacin.
Poblacin
Estrato 1 Estrato 2
Muestra
Tipos de muestreo aleatorio (II)
Muestreo aleatorio sistemtico: se
selecciona al azar un elemento de la
poblacin y a partir de l se
seleccionan de k en k los elementos
siguientes.
Muestreo por conglomerados y
reas: se divide la poblacin en
distintas secciones o conglomerados.
Se eligen al azar unas pocas de estas
secciones y se toman todos los
elementos de las secciones elegidas
para formar la muestra.
Para dividir la poblacin en secciones
podemos usar las provincias.
Tipos de muestreo no aleatorio

Muestras errticas o casuales

Muestras intencionadas o racionales

Muestras por cuotas

Muestras bola de nieve



Distribucin en el muestreo de la media

Los distintos valores de

x
i
dan lugar a una variable aleatoria que representamos
por

X y se llama media muestral. La distribucin de los valores de

X se llama
distribucin en el muestreo de la media.

La variable aleatoria

X tiene las siguientes caractersticas:


1. Media :
2. Desviacin tpica:
o
n

3. A medida que n crece, la distribucin de

X se aproxima a la normal.

Si es desconocida, se aproxima con s n / (n 1) Apuntes
Supongamos que en una poblacin una variable aleatoria se distribuye con media y
desviacin tpica .
Al tomar diferentes muestras de igual tamao en la poblacin y calcular sus medias
y sus desviaciones tpicas, obtendremos

x
1
,

x
2
, ...,

x
n
y s
1
, s
2
, ... , s
n


Distribucin en el muestreo de la media
Se supone que la distribucin de la temperatura del cuerpo humano en la
poblacin tiene una media = 37 y una desviacin tpica = 0,85. Se elige
una muestra de 105 personas. Se desea obtener la probabilidad de la media
de la muestra sea menor que 36,9.
La variable aleatoria

X se distribuye como una N(,


o
n
) = N (37, 0,083)
Se debe recordar que para una variable aleatoria continua se tiene que:
p(Z s a) = p(Z < a)
Al ser n = 105, consideramos que la variable aleatoria media muestral es normal.
Por tanto:
p(

X
s
36,9) = p
\


|
.
|
|
|

X 37
0,083

s

36,9 37
0,083
= p( Z
s
1,20) = 1 p(Z
s
1,20) = 1 0,8849 =
= 0,115
Teorema central del lmite: idea intuitiva
Muchos fenmenos se pueden considerar como suma de efectos parciales
independientes, pudiendo ocurrir que aunque los efectos no se ajusten a la normal, el
fenmeno resultante tienda asintticamente a la normal.
Una simulacin con ordenador nos puede ayudar a entender esto:
1000 lanzamientos de un dado
1000 medias de dos dados
1000 medias de 4 dados
1000 medias de 10 dados
Teorema central del lmite
Sea X una variable aleatoria de una poblacin de media y desviacin tpica o,
entonces se verifica que
1. La variable aleatoria media muestral (con muestras de tamao n) tiene
media y desviacin tpica
o
n

2. La variable aleatoria media muestral se aproxima a una normal a medida
que crece el tamao de la muestra n

Qu se entiende por "cuando crece n"?

Si la poblacin de partida es normal, la distribucin de las medias
muestrales es normal, cualquiera que sea n.
Si la distribucin de partida no es normal, la distribucin de las medias
muestrales es normal si n > 30.
Ya dijimos que
Teorema central del lmite: visin grfica
Normal Uniforme Sesgada
Distribucin
de la
poblacin de
partida
Distribucin
de las medias
muestrales
para n = 5
Distribucin
de las medias
muestrales
para n = 10
Distribucin
de las medias
muestrales
para n = 30
EJERCICIO 1
Un investigador desea estimar la media de
una poblacin utilizando una muestra
grande (n>30), de modo que la
probabilidad que la media muestral no
difiera de la media poblacional en ms del
10% de la desviacin estndar, sea 0,95.
De qu tamao escoger la muestra?
EJERCICIO 2
Las calificaciones de un examen de
Estadstica y Probabilidades en la UJCM,
se distribuye con u=9 y o=4,21 puntos.
Cuntos estudiantes deben tomar una
muestra para garantizar que un 95% de
probabilidad que la media muestral sea
mayor que 8,2?
EJERCICIO 3
Un investigador quiere estimar la media
de una poblacin utilizando una muetsra
suficientemente grande, para que la
probabilidad que la media muestral no
difiera de la medial poblacional en ms de
25% de la desviacin estndar, sea 95%.
Qu tamao deber adoptar para la
muestra?
EJERCICIO 4
Las calificativos de un examen a nivel
nacional se distribuyen con u=11,80 y o=
3,6 puntos. Cuntos estudiantes se
deben tomar en una muestra para
garantizar, con un 95% de probabilidad,
que la media muestral sea mayor que
11,08?
Distribucin en el muestreo de una proporcin
Supongamos que en una poblacin la proporcin de elementos con una determinada
caracterstica es p.

En una muestra cualquiera la proporcin de individuos con dicha caracterstica ser
^
p.

Los distintos valores de
^
p dan lugar a una variable aleatoria que representamos por
^
P, y
que recibe el nombre de proporcin muestral. La distribucin de
^
P se llama distribucin
en el muestreo de una proporcin.

La variable aleatoria
^
P tiene las siguientes caractersticas:
1. Media : = p
2. Desviacin tpica: o =
p(1 p)
n

3. A medida que n crece, la distribucin de
^
P se aproxima a la normal,
siempre que p no se acerque ni a 0 ni a 1. En cualquier caso, se considera
normal si n 30.

Distribuciones en el muestreo de una proporcin
Un nuevo medicamento ha curado al 85 % de los enfermos a los que se les ha
aplicado. Determinar las distribuciones en el muestreo de la proporcin de enfermos
curados para muestras de tamao 30, 100 y 1000 personas.
Tamao
de la
muestra:
n
Media:
= p
Desviacin tpica:
o =
p(1 p)
n
Distribucin
muestral
N(p,
p(1 p)
n
)
30 0,85
0,85(1 0,85)
30
= 0,065
N(0,85; 0,065)
100 0,85
0,85(1 0,85)
100
= 0,036
N(0,85; 0,036)
1000 0,85
0,85(1 0,85)
1000
= 0,011
N(0,85; 0,011)
En nuestro caso p = 0,85
Conviene observar cmo, a medida que el
tamao de la muestra crece, la desviacin
tpica disminuye.