Professional Documents
Culture Documents
Distribucion en el muestreo
Estadstica
Ingeniera Informatica
Curso 2009-2010
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 1 / 21
Contenidos
1
Introduccion. Poblacion y Muestra
2
Concepto de estadstico
3
Estadsticos mas utilizados
Media muestral
Varianza muestral
Cuasivarianza muestral
Proporcion muestral
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 2 / 21
Introduccion. Poblacion y Muestra
Uno de los objetivos principales de la Estadstica es el de extraer
informacion, no solo en peque nos conjuntos de datos sino, sobre todo, en
grandes poblaciones que resulta muy difcil o imposible observar
los censos son muy costosos y requieren mucho tiempo para su
realizacion
Importancia de la Inferencia Estadstica: permite llegar a conclusiones
precisas sobre la poblacion que se considera (colecci on grande de
elementos que tienen asociadas caractersticas numericas), observando solo
una parte de ella relativamente peque na, que se denomina muestra.
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 3 / 21
Introduccion. Poblacion y Muestra
Las muestras deben ser representativas de las poblaciones; en caso
contrario, las conclusiones obtenidas a partir de ellas no son ables.
En particular, la forma de elegir los elementos de la muestra puede
dar lugar a
X =
X
1
+ ... + X
n
n
El valor de
X viene determinado por los valores de las variables aleatorias
de la muestra
X es una variable aleatoria.
Propiedades:
1
E
_
= (
X
_
=
2
n
(su varianza es menor que la de X, siendo tanto mas
peque na cuanto mayor es n)
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 11 / 21
Estadsticos mas utilizados Media muestral
Media muestral
X
n
N(,
n
)
o tambien:
X
/
n
n
N(0, 1)
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 12 / 21
Estadsticos mas utilizados Media muestral
Ejemplo:
Los niveles de colesterol en la sangre de una poblacion de
trabajadores tiene media 202 y desviacion tpica 14. Se selecciona
una muestra de 36 trabajadores y queremos aproximar la
probabilidad de que la media muestral de sus niveles de colesterol
este comprendida entre 198 y 206.
Seg un el TCL,
X se distribuye aproximadamente como una
N( = 202,
2
=
14
2
36
=
49
9
). Haciendo Z N(0, 1):
P(198
X 206) = P
_
198 202
7/3
X 202
7/3
206 202
7/3
_
P(1,714 Z 1,714) = 0,913
Con otro tama no muestral, por ejemplo, n = 64, repetimos los calculos y
se obtiene P(198
X
64
206) 0,978, es decir, al aumentar el tama no
muestral, aumenta la probabilidad de que la media muestral diera de la
media poblacional en menos de 4 unidades.
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 13 / 21
Estadsticos mas utilizados Media muestral
Media muestral
Caso particular: Distribucion de
X en una poblacion normal X N(, )
Si (X
1
, ..., X
n
) procede de una distribucion N(, ):
X N
_
,
_
2
n
_
o tambien
X
/
n
N(0, 1)
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 14 / 21
Estadsticos mas utilizados Varianza muestral
Varianza muestral
Dada una muestra aleatoria (X
1
, ..., X
n
), se dene la varianza muestral
s
2
n
mediante
s
2
n
=
n
i =1
(X
i
X)
2
n
Al igual que
X, s
2
n
es una variable aleatoria.
Propiedades:
E
_
s
2
n
=
n 1
n
2
(la media de s
2
n
no coincide con
2
)
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 15 / 21
Estadsticos mas utilizados Cuasivarianza muestral
Cuasivarianza muestral
Para evitar el problema anterior, se dene el estadstico (variable aleatoria)
cuasivarianza muestral, mediante
s
2
n1
=
n
i =1
(X
i
X)
2
n 1
Propiedades:
E
_
s
2
n1
=
2
(la media de s
2
n1
coincide con
2
)
Nota
La notacion de la varianza y la cuasivarianza muestrales puede variar de un texto
a otro; por ejemplo, es frecuente encontrar la varianza como s
2
y la cuasivarianza
como S
2
, pero por comodidad utilizaremos la notacion empleada anteriormente.
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 16 / 21
Estadsticos mas utilizados Cuasivarianza muestral
Cuasivarianza muestral
Teorema: Distribuci on en el muestreo de s
2
n1
en poblaciones normales
n s
2
n
2
=
(n 1) s
2
n1
2
=
n
i =1
(X
i
X)
2
2
2
n1
Intuitivamente, la justicacion del teorema viene dada por el hecho de que
si X
i
es una variable aleatoria N(, ), entonces
X
i
i =1
(X
i
)
2
2
2
n
Si remplazamos la media poblacional por la media muestral
X, la nueva
variable aleatoria contin ua siendo una variable chi-cuadrado, pero pierde
un grado de libertad al hacer la sustitucion.
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 17 / 21
Estadsticos mas utilizados Cuasivarianza muestral
Cuasivarianza muestral
Propiedades:
Del teorema se deduce: V(s
2
n1
) =
2
4
n 1
Es inmediato comprobarlo, ya que:
la varianza de una chi-cuadrado es el doble de sus grados de libertad:
V
_
(n 1)s
2
n1
2
_
= 2(n 1)
por las propiedades de la varianza:
V
_
(n 1)s
2
n1
2
_
=
(n 1)
2
(
2
)
2
V(s
2
n1
) = 2(n 1) V(s
2
n1
) =
2
4
n 1
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 18 / 21
Estadsticos mas utilizados Proporcion muestral
Proporci on muestral
Hay situaciones en las que el parametro que nos interesa es una
proporcion (frecuencia con la que cierto atributo o caracterstica aparece
o esta ausente en una poblacion).
Sea una poblacion con N elementos, entre los cuales pN individuos
presentan la caracterstica que deseamos estudiar y (1 p)N individuos no
la presentan.
Representamos por T
n
el n umero total de unidades muestrales que poseen
la caracterstica de interes en la muestra (X
1
, ..., X
n
), donde cada X
i
vale 1
si se presenta la caracterstica en estudio y vale 0 en caso contrario:
T
n
B(n, p),
con p la proporcion poblacional de dicha caracterstica.
E[T
n
] = np
V(T
n
) = np(1 p)
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 19 / 21
Estadsticos mas utilizados Proporcion muestral
Proporci on muestral
Se dene el estadstico (variable aleatoria) proporcion muestral como
p =
T
n
n
Propiedades:
1
E[ p] = p
2
V ( p) =
p(1p)
n
analogamente al caso de
X, pues p es la media muestral en una poblacion
cuya caracterstica en estudio toma solo dos posibles valores: 0 y 1.
3
Por el TCL, p
n
N
_
p,
_
p(1 p)
n
_
o tambien
p p
_
p(1 p)/n
n
N(0, 1)
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 20 / 21
Estadsticos mas utilizados Proporcion muestral
Ejemplo:
El 46 % de la poblacion de una ciudad esta descontento con la
gestion realizada por el ayuntamiento. Si extraemos una muestra
aleatoria de tama no 200, cual es la probabilidad de que al menos
100 de ellos esten descontentos?
Por un lado, p = 0,46, y nos piden calcular la probabilidad de que el total
muestral de descontentos T
200
sea mayor o igual que 100, o lo que es lo
mismo, que p
100
200
= 0,5. Como
p
n
N(p,
_
p(1 p)/n)
podemos aproximar la probabilidad pedida por:
P( p 0,5) P
_
p 0,46
_
0,46 0,54/200
0,5 0,46
_
0,46 0,54/200
_
= P(Z 1,135) = 0,1281877
Estadstica (Aurora Torrente) 7. Distribucion en el muestreo Curso 2009-2010 21 / 21