You are on page 1of 6

UNMSM Facultad de Qumica e Ingeniera Qumica CEUPS

36

DISTRIBUCIONES MUESTRALES
POBLACIONES Y MUESTRAS
El uso del trmino poblacin en estadstica es un vestigio de la poca en que la
estadstica se aplicaba principalmente a los fenmenos sociolgicos y
econmicos. En nuestros das, se aplica a conjuntos o colecciones de objetos,
reales o conceptuales, y principalmente a conjuntos de nmeros, mediciones u
observaciones. Una poblacin de donde los inspectores obtienen una muestra
para determinar una caracterstica de un producto puede estar constituda por las
mediciones correspondientes a todas las unidades en un lote determinado
(poblacin finita); segn los objetivos de la inspeccin, puede tambin constar
de todas las mediciones correspondientes de todos los artculos que puedan
fabricarse (poblacin infinita).
El muestreo en poblaciones finitas estar definido como sigue
Un conjunto de observaciones x1, x2, .. , x n constituye una muestra
aleatoria de tamao n de una poblacin finita de medida N, si es
elegida en forma tal que cada subconjunto de n de los N elementos
de la poblacin tenga la misma probabilidad de ser elegido
Obsrvese que esta definicin de aleatoriedad se refiere en esencia a la manera
en la que los valores de la muestra son elegidos. Esto vale tambin para la
siguiente definicin de una muestra aleatoria de una poblacin infinita.
Un conjunto de observaciones x1, x 2, .. , xn constituye una muestra
aleatoria de tamao n de una poblacin infinita f(x) si:
1. Cada xi es un valor de una variable aleatoria cuya distribucin
tiene los valores f(x).
2. Estas n variables aleatorias son independientes.

Deberemos asegurarnos, por consiguiente, de que la seleccin de una muestra


sea lo ms aleatoria posible.
Cuando trabajamos con una poblacin finita podramos hacer la seleccin
numerando los elementos de la poblacin (v.g., un lote en un almacn) y usando
nmeros aleatorios para escoger las muestras.
Cuando trabajamos con poblaciones infinitas, la situacin difiere un poco puesto
que no podemos numerar fsicamente los elementos de la poblacin; pero nos
esforzamos en aproximar las condiciones de aleatoriedad por medio de
Control de Calidad de Procesos

Ing. Heber Helfer

UNMSM Facultad de Qumica e Ingeniera Qumica CEUPS

37

artificios. Por ejemplo, al seleccionar una muestra de una lnea de produccin


podemos aproximar las condiciones de aleatoriedad eligiendo un artculo cada
media hora. El uso apropiado de los artificios para seleccionar muestras
aleatorias es siempre preferible a la decisin humana, por ser difcil evitar
predilecciones inconscientes cuando efectuamos una eleccin.
DISTRIBUCIN MUESTRAL DE LA MEDIA ( CONOCIDA)
Supngase que una muestra aleatoria de n observaciones se ha extrado de
alguna poblacin y que se ha calculado x ,digamos, para estimar la media de la
poblacin. Debera ser claro que, si tomamos una segunda muestra aleatoria de
tamao n de esta poblacin, sera poco razonable esperar el mismo valor para x ,
si tomamos varias muestras ms, probablemente ninguna de las x sera igual a
otra. Las diferencias entre tales x se atribuyen generalmente al azar, y esto trae a
colacin importantes problemas relativos a su distribucin, en especial los
relacionados con la amplitud de sus fluctuaciones.
Con el fin de abordar este problema experimentalmente, supngase que se
extraen 50 muestras aleatorias, cada una de 10 elementos (n = 10), de una
poblacin que tiene una distribucin uniforme discreta.
1/10 para x = 0,1,2,..,9
f(x) =
0

en los dems puntos

El muestreo es con reemplazo, por as decirlo; de modo que estamos


muestreando de una poblacin infinita. De esta forma, obtenemos 50 muestras
cuyas medias son
4,4
3,1
3,0
5,3
3,6

3,2
5,3
3,0
5,5
2,7

5,0
3,8
4,6
4,8
4,0

3,5
4,3
5,8
6,4
5,0

4,1
3,3
4,6
4,9
2,6

4,4
5,0
4,0
6,5
4,2

Al agruparlas en una distribucin con las clases

Control de Calidad de Procesos

3,6
4,9
3,7
3,5
4,4

6,5
4,8
5,2
4,5
5,6

5,3
3,1
3,7
4,9
4,7

4,4
5,3
3,8
5,3
4,3

2,0 - 2,9
3,0 - 3,9
...
6,0 - 6,9

Ing. Heber Helfer

UNMSM Facultad de Qumica e Ingeniera Qumica CEUPS

38

obtenemos
x

2,0 - 2,9
3,0 - 3,9
4,0 - 4,9
5,0 - 5,9
6,0 - 6,9

Frecuencia
2
14
19
12
3
50

En esta distribucin y en su histograma, mostrado en la figura 6.1, es obvio que la distribucin de las
medias tiene claramente forma de campana, a pesar que la poblacin tiene una distribucin uniforme

FRMULAS PARA x Y

x2

Teorema 6.1
Si una muestra aleatoria de tamao n se elige de una
poblacin que tiene media y variancia 2, entonces x es un valor de
una variable aleatoria cuya distribucin tiene media .
Para muestras tomadas de poblaciones infinitas, la variancia de esta

2
distribucin es
;
n
Para muestras extradas de poblaciones finitas de tamao N la variancia

2 N n
es
.
n N 1

Control de Calidad de Procesos

Ing. Heber Helfer

UNMSM Facultad de Qumica e Ingeniera Qumica CEUPS

39

En otras palabras

1 n
x = =
n i =1

1
= 2
n
2
x

2
=

n
i =1
n

La confiabilidad de la media con una estimacin de a menudo es medida por


x =
tambin denominado error estndar de la media. Obsrvese que
n

esta medida de la confiabilidad de la media decrece en proporcin a la raz


cuadrada de n; por ejemplo, es necesario cuadruplicar el tamao de la muestra a
fin de reducir a la mitad la desviacin estndar de la distribucin muestral de la
media. Esto indica tambin lo que podra ser llamada "ley de retribuciones
disminudas" en cuanto a incrementar el tamao de la muestra. Rara vez
extraemos muestras muy grandes, pues lo que se paga en esfuerzo y costo extra
no es recompensado con una ganancia proporcional en confiabilidad. Por
ejemplo, si incrementamos la medida de la muestra de 25 a 25.000, los errores a
que estamos expuestos se reducen apenas en un factor de 10.
El teorema 6.1 da slo informacin parcial acerca de las distribuciones
muestrales tericas de la media. En general, es imposible determinar una
distribucin de ese tipo sin conocer la forma real de la poblacin, pero es posible
calcular la distribucin lmite cuando n de una variable aleatoria cuyos
valores estn estrechamente relacionados con x , suponiendo slo que la
poblacin tiene una variancia finita 2. La variable a la que nos estamos
refiriendo aqu es la media estandarizada; sus valores estn dados por

z=

es decir, por la diferencia entre x y dividida entre el error estndar de la media.

Control de Calidad de Procesos

Ing. Heber Helfer

UNMSM Facultad de Qumica e Ingeniera Qumica CEUPS

40

TEOREMA DEL LMITE CENTRAL


Teorema 6.2
Si x es la media de una muestra aleatoria de tamao
n extrada de una poblacin que tiene media y variancia finita 2,
entonces

z=

es el valor de una variable aleatoria cuya funcin de distribucin se


aproxima a la de la distribucin normal estnar cuando n .

Control de Calidad de Procesos

Ing. Heber Helfer

UNMSM Facultad de Qumica e Ingeniera Qumica CEUPS

41

EJEMPLO. Si un bote de 1 galn de cierta clase de pintura cubre en promedio


513,3 pies cuadrados con una desviacin estndar de 31,5 pies cuadrados, cul
es la probabilidad de que el rea media cubierta por una muestra de 40 de estos
botes est entre 510,0 y 520,0 pies cuadrados?
Solucin Por el teorema 6.2 tenemos que calcular el rea bajo la curva
normal entre
z=

510,0 513,3
= 0,66
31,5 40

z=

520,0 513,3
= 1,34
31,5 40

F(1,34) - F(-0,66) = 0,9099 - (1 - 0,7454) = 0,6553


Ntese que si x hubiera resultado mucho menor que 513,3 (digamos menor que
500,0), esto podra despertar serias dudas de que la muestra realmente
procediera de una poblacin que tuviera una media = 513,3 y = 31,5; la
probabilidad de obtener uno de tales valores pequeos (un valor z menor que 2,67) es de apenas 0,038.

Control de Calidad de Procesos

Ing. Heber Helfer

You might also like