You are on page 1of 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

DISTRIBUCIONES MUESTRALES

Pgina 1 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

CONTENIDO
1. Introduccin
2. Teorema del lmite central
3. Aplicacin de las distribuciones muestrales
4. Distribuciones muestrales Chi 2, t y F

Pgina 2 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

DISTRIBUCIONES MUESTRALES
1. Introduccin
A las distribuciones de los estadsticas muestrales se les llama
distribuciones muestrales.

ESTADSTICA INFERENCIAL: La estadstica inferencial involucra el uso


de un estadstico para sacar una conclusin o inferencia sobre el
parmetro correspondiente de la poblacin
Por ejemplo se usa:

X media de muestra para estimar la media poblacional

s desv. Est. De muestra para estimar la desv. Est. poblacional


p proporcin en la muestra para estimar la proporcin poblacional
ERROR DE MUESTREO: es la diferencia entre el parmetro poblacional
y el estadstico de la muestra utilizado para estimar el parmetro.
Por ejemplo la diferencia entre:

X y

s y

p y

Pgina 3 de 22

Poblacin
Con N
elementos

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

DISTRIBUCIN MUESTRAL: es un conjunto de todos los valores posibles


para un estadstico y la probabilidad relacionada con cada valor.
Media muestral Xi P (cada. Xi )
Xmedia 1
Desv.est.
1

Xmedia K
Desv.est.
K

150

1/6

200

1/6

250

2/6

300

1/6

350

1/6

Tomando K=6 muestras de

1.0

tamao n cada una

MEDIA DE LAS MEDIAS MUESTRALES o GRAN MEDIA o MEDIA DE


MEDIAS:

Xi

K
150 200 250 250 300 350
X
250
6

VARIANZA DE LA DISTRIBUCIN MUSTRAL DE LAS MEDIAS


MUESTRALES

X2

(X X )
K

(X )

Del ejemplo anterior:

X2

(150 250) 2 (200 250) 2 ... (350 250) 2


4.167
6

ERROR ESTNDAR DE LA DISTRIBUCIN MUESTRAL DE LAS MEDIAS


MUESTRALES
Pgina 4 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

X X2

En el caso anterior vale 64.55

Si el muestreo se realiza sin reemplazo y si el tamao de muestra es


ms del 5% de la poblacin (n > 0.05N) debe aplicarse el factor de
correccin para poblaciones finitas (FPC) al error estndar.

N n
N 1

2. TEOREMA DEL LMITE CENTRAL


La distribucin de las medias de las muestras tiende a la normalidad
independientemente de la forma de la distribucin poblacional de la
que sean obtenidas. Es la base de las cartas de control X-R.
F(X)
Distribucin de las medias
muestrales
Distribucin de valores individuales

Distribucin muestral de la media

Pgina 5 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

X 1 , X 2 ,..., X n

A medida que n se vuelve ms grande, la distribucin de las medias


muestrales se aproximar a una distribucin normal con una media
X X / n

Si

es una muestra aleatoria de una Poblacion (X) con

distribucin normal n( , 2 )

.EntoncesX
se
2
distribuye normalmente con media , y varianza / n

Por ejemplo, para los siguientes datos de la poblacin:


DATOS DE LA POBLACIN PARA MOSTRAR EL TEOREMA DEL
LMITE CENTRAL
2
1
5
7
7
1
7
6
9
8
5
5
5
3
4
9
2
7
3
4
5
8
7
2

7
7
8
1
6
6
3
7
7
3
3
9
5
1
3
1
1
7
4
8
3
1
5
2

PROMEDIO
5
7
1
4
9
4
1
9
7
4
3
9
3
9
9
7
7
9
5
3
2
5
9
7

5
9
1
1
8
7
7
4
6
4
4
1
9
1
5
7
8
8
6
4
2
5
6
2

Pgina 6 de 22

2
4
5
4
5
9
3
3
1
7
2
9
5
5
5
8
6
3
8
5
6
9
8
1

4.2
5.6
4.0
3.4
7.0
5.4
4.2
5.8
6.0
5.2
3.4
6.6
5.4
3.8
5.2
6.4
4.8
6.8
5.2
4.8
3.6
5.6
7.0
2.8

DISTRIBUCIONES MUESTRALES

3
9
6
5
9
2
9
2
5
4
8
3
5
7
5
9
7
5
8
8
5
7
9
2
4
9
1
7
8
2
9
7
1
2
2
2

1
3
2
2
6
6
2
6
4
2
1
2
8
9
6
6
9
5
4
7
5
7
5
5
5
2
7
7
1
2
4
8
2
4
9
6

4
2
7
6
2
3
2
6
2
9
2
8
9
3
8
4
9
1
7
7
1
2
2
3
8
6
7
2
1
1
3
4
9
6
3
7

P. Reyes / Sept. 2007

1
3
4
8
9
5
3
8
1
4
1
5
6
8
7
8
8
4
8
1
7
9
5
5
4
6
3
8
7
4
7
3
3
2
3
8

Pgina 7 de 22

7
8
4
6
4
5
6
3
9
2
4
4
2
5
5
7
3
6
7
8
5
8
9
8
2
1
4
7
6
9
3
2
8
8
1
7

3.2
5.0
4.6
5.4
6.0
4.2
4.4
5.0
4.2
4.2
3.2
4.4
6.0
6.4
6.2
6.8
7.2
4.2
6.8
6.2
4.6
6.6
6.0
4.6
4.6
4.8
4.4
6.2
4.6
3.6
5.2
4.8
4.6
4.4
3.6
6.0

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

El histograma de los datos de la poblacin, es el siguiente:

Histogram of Poblacion
40

Frequency

30

20

10

Poblacion

Al hacer una prueba de normalidad de Anderson Darling en los datos


se tiene:
Probability Plot of Poblacion
Normal
99.9

Mean
StDev
N
AD
P-Value

99

Percent

95
90

5.073
2.584
300
5.965
<0.005

80
70
60
50
40
30
20
10
5
1
0.1

-5

5
Poblacion

10

15

Como el P value es menor a 0.05 los datos no siguen una distribucin


normal.

Pgina 8 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

El histograma de los promedios muestrales (subgrupos de 5 datos) se


muestra a continuacin:

Al hacer una prueba de normalidad de Anderson Darling se tiene:


Probability Plot of Muestra
Normal
99.9

Mean
StDev
N
AD
P-Value

99

Percent

95
90

5.073
1.118
60
0.527
0.172

80
70
60
50
40
30
20
10
5
1
0.1

5
Muestra

Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias


siguen una distribucin normal.
La sigma de la poblacin estimada con la media de la muestra es:
Pgina 9 de 22

DISTRIBUCIONES MUESTRALES

S pob.
Sn=5

2.5840
1.1181

P. Reyes / Sept. 2007

Raiz(n)
Spob est.
2.2361 2.5001243

Tomando un tamao de subgrupo de n = 10 se tiene:


PROM.
N=10
4.9
3.7
6.2
5.0
5.6
5.0
4.6
5.8
5.8
5.0
4.6
4.9
4.1
5.0
5.1

4.7
4.2
3.8
6.2
6.5
5.7
6.5
5.6
5.3
4.7
5.3
4.1
5.0
4.5
4.8

Histogram of PROM. N=10


9
8

Frequency

7
6
5
4
3
2
1
0

3.5

4.0

4.5

5.0
PROM. N=10

5.5

6.0

6.5

Por lo que con un tamao de muestra de n = 5 es suficiente para


mostrar normalidad.
3. APLICACIN DE LAS DISTRIBUCIONES MUESTRALES

Pgina 10 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

Muchas decisiones en los negocios dependen de una muestra


completa no tanto de una observacin, por tanto se trabaja con la
distribucin muestral de las medias o de las proporciones, para el caso
de las medias se tiene:

X X

X
/ n

Con este valor se determina P(Z <= z)

Donde n es el tamao de la muestra y si no se conoce sigma, se


estima con el valor de S. Ejemplos pginas 153 156.
Ejemplo:
Una empresa de constestacin de llamadas telefnicas, est
interesada en conocer la probabilidad de que la media de n llamadas
dure un cierto periodo de tiempo, no le interesa una llamada
individual, ya que no le permitira determinar la cantidad de personas
que requiere:
Las llamadas durante un mes promediaron 150 seg. Con una
desviacin estndar de 15 seg.
a. Cul es la probabilidad de que una llamada en particular dure entre
150 y 155 segundos?

155 150
Z 155
0.33
15

En tablas P(Z <= 0.33) = 0.6293 ;

150 150
Z 150
0.0
15

P(Z<=0) = 0.500

Por tanto P( 0 <= Z <= 0.33) = 0.1293 o 12.93%

Pgina 11 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

Por tanto la probabilidad de que una llamada dure entre 150 y 155
segundos es del 12.93%.
b. Cul es la probabilidad de que la media de n=50 llamadas est
entre 150 y 155 segundos?
Ahora se aplica la distribucin muestral de las medias, con:
X
Z
/ n
155 150
Z 155
2.36
15 / 50

En tablas P(Z <= 2.36) = 0.9909 ;

150 150
Z 150
0 .0
15 / 50

P(Z<=0) = 0.500

Por tanto P( 0 <= Z <= 2.36) = 0.4909 o 49.09%

P(150 <= X < = 155)

150

155

150

155

P (150 X 155)

Para el caso de las medias el rea es mayor debido a que las medias
muestrales estn menos dispersas que los valores individuales de
llamadas

Pgina 12 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

c. Cul es la probabilidad de que la media de n=35 llamadas est


entre 145 y 155 segundos?
Ahora se aplica la distribucin muestral de las medias, con:
X
Z
/ n
155 150
Z 155
1.97
15 / 35

145 150
Z 150
1.97
15 / 35

En tablas P(Z <= -1.97) = 0.0244 ;

P(Z<=1.97) = 0.9756

Por tanto P( -1.97 <= Z <= 1.97) = 0.9512

o 95.12%

d. Cul es la probabilidad de que la media de n=35 llamadas sea


mayor a 155 segundos?
Ahora se aplica la distribucin muestral de las medias, con:
X
Z
/ n
155 150
Z 155
1.97
15 / 35

En tablas P(Z <= -1.97) = 0.0244 o

1-P(Z<=1.97) = 1 - 0.9756 =

0.0244
Por tanto P(Z >= 1.97) = 0.0244

2.44%

Con la informacin anterior ahora la empresa ya puede tomar


decisiones.

Pgina 13 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

Ejercicios:
1. Los choferes de camniones de una empresa recorren en promedio
8,500 km. cada trimestre, con una desviacin estndar de 1,950 Km. Si
se toma una muestra de n = 100 choferes, Cul es la probabilidad de
que la media de la muestra sea o encuentre en:
a. Mayor a 8,500 Km.?
b. Menor a 8,000 Km.?
c. Entre 8,200 y 8,700 Km?
d. Entre 8,100 y 8,400 Km.?
2. Los refrescos de una embotelladora tienen una media de 16.1 oz.,
con una desviacin estndar de 1.2 oz. Si se toma una muestra de n =
200 refrescos, cul es la probabilidad de que la media sea:
a. Menor que 16.27 oz.?
b. A lo ms 15.93 oz.?
c. Entre 15.9 y 16.3 oz.?
d. Ms de 16.2 oz.?

Pgina 14 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

Para el caso de proporciones se tiene:

E ( p) p

(1 )
Si n>0.05N puede requerirse el
n

FCP
Una vez calculando lo anterior ahora se determina Z

p
p

Ejemplo:
Una empresa adquiere lotes de partes de tamao n = 200, el lote tiene
una tasa de partes con falla del 10%, la poltica de la empresa ahora es
que:
a. Si hay ms del 12% de defectos se buscar un nuevo proveedor.
b. Entre el 10 y 12% se considerar la bsqueda de un nuevo
proveedor
c. Entre el 5 y 10%, se seguir con el mismo proveedor
d. Menos del 5%, se incrementarn los pedidos
Solucin:
p

(1 )

0.1(1 0.1)
0.021
200

a. P(p > 0.12)

p
0.12 0.1

0.95
p
0.021

P(Z >= 0.95) = 0.1711 o sea el 17.11%


b. P(0.10 <= p <= 0.12) = 0.3289 o el 32.89%
c. P(0.05 <= p <= 0.10)

Pgina 15 de 22

DISTRIBUCIONES MUESTRALES

Z 0.05

p
0.05 0.1

2.38
p
0.021

P. Reyes / Sept. 2007

Z 0.1

p
0.1 0.1

0. 0
p
0.021

P(-2.38 <= Z <= 0.1) = 0.4913 o el 49.13%


d. P(p <= 0.05) = 0.0087 o el 0.87%
Por tanto como la mayor probabilidad es la del inciso c, no se cambia
al proveedor actual.
Ejercicios:
1. La proporcin de personas que comen en un restaurante es del 75%.
En una muestra de 100 clientes, Cul es la probabilidad de que menos
del 20% compren comida para llevar?
2. El 60% de los empleados en una empresa vive cerca. De 100
empleados al azar, Cul es la probabilidad de que por lo menos 30
vivan cerca?

Pgina 16 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

4. Distribuciones muestrales derivadas de la normal:


Chi 2, t y F

Distribucin Chi Cuadrada


Esta distribucin se forma al sumar los cuadrados de las variables
aleatorias normales estndar.
Si Z es una variable aleatoria normal, entonces el estadstico Y
siguiente es una variable aleatoria Chi cuadrada con n grados de
libertad.

Media y varianza de una ji-cuadrada.


E(X)=k
V(X)=2k

Pgina 17 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

Calculo de puntos crticos usando las tablas de ji-cuadrada

Ejemplo: Calcule el valor critico que satisface

De tablas de ji-cuadrada con alfa=.05 y k=20

Pgina 18 de 22

DISTRIBUCIONES MUESTRALES

Si X 1 , X 2 ,..., X n

P. Reyes / Sept. 2007

es una muestra aleatoria de una Poblacion (X) con

( n 1) 2
.Entonces
S

2
distribucin normal n( , )

se distribuye ji-

cuadrada con k= n-1 grados de libertad.

Donde S cuadrada es la varianza muestral.

Distribucin t-student
Si X 1 , X 2 ,..., X n

es una muestra aleatoria de una poblacin (X) con

distribucin normal
n( , 2 )

(X
. Entonces

) (s /

t-student con n-1 grados de libertad

Pgina 19 de 22

n)

se distribuye

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

La media y la varianza de la distribucin t son:

De una muestra aleatoria de n artculos, la probabilidad de que

Caiga entre dos valores especificados es igual al rea bajo la


distribucin de probabilidad t de Student con los valores
correspondientes en el eje X, con n-1 grados de libertad
Ejemplo:
La resistencia de 15 sellos seleccionados aleatoriamente son: 480,
489, 491, 508, 501, 500, 486, 499, 479, 496, 499, 504, 501, 496, 498
Cul es la probabilidad de que la resistencia promedio de los sellos
sea mayor a 500?. La media es 495.13 y la desviacin estndar es de
8.467.
t = -2.227 y el rea es 0.0214

Pgina 20 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

Distribucin F
Surge de dividir dos ji-cuadradas independientes
F=(W/u)/(Y/v)
W se distribuye ji-cuadrada con u g.l.
Y se distribuye ji-cuadrada con v g.l.
El uso de esta distribucin es para comparar varianzas (Recuerde el
anlisis de varianza)

Pgina 21 de 22

DISTRIBUCIONES MUESTRALES

P. Reyes / Sept. 2007

Para determinar la otra cola de la distribucin F se determina con la


expresin.
Falfa, k1, k2 = 1 / F(1-alfa), k2, k1
Dado K1 = 8 y K2 = 10, F0.05 = 3.07, encontrar el valor de F0.05 con
K1 = 10 y K2 = 8
F0.05,10,8 = 1/ F0.95,8,10 = 1/ 3.07 = 0.326
.

Pgina 22 de 22

You might also like