You are on page 1of 19

Distribuciones Fundamentales para el Muestreo

Distribucin Muestral de la Media (Muestras Grandes)

Hay varias distribuciones de muestreo importantes, la primera distribucin muestral


importante a considerar es la de la media. Dependiendo del estimador, es decir, si tenemos,
por ejemplo la media aritmtica, entonces podemos hablar de DISTRIBUCIN EN EL
MUESTREO DE LA MEDIA, pero si el estimador es la proporcin, hablaremos de
DISTRIBUCIN EN EL MUESTREO DE LA PROPORCIN, etc.

Distribucin de muestreo es la distribucin de probabilidad de una estadstica.


(Entendiendo por estadstica cualquier funcin de las observaciones en una muestra aleatoria
( X , s2, s)).

Si X es la media de una muestra aleatoria de tamao n tomada de una poblacin con media
y varianza 2, entonces la distribucin muestral de X es normal con media y varianza
2 / n si la poblacin esta distribuida normalmente.

El error estndar de un estadstico es la desviacin estndar de su distribucin muestral, es


decir:

x
n

Ahora, si no se conoce , se puede sustituir por s entonces tendremos el error estndar


estimado de
s
x:
n

Adems, sin importar el tamao de la muestra n, si se tiene una poblacin normal de


tamao N, con media y desviacin estndar , las medias de todas las muestras de
tamao n, que se pueden tomar de esa poblacin, tambin se distribuirn normalmente. Por
lo tanto, la frmula a emplear, incluyendo el error estndar:

Pero, si la poblacin est normalmente distribuida y se conoce pero se desconoce ,


entonces el valor de , puede reemplazarse por la desviacin estndar de la muestra S,

ESTADSTICA I
siempre y cuando el tamao de la muestra sea grande(n 30). En estas condiciones el valor
de Z sera:

Si tomamos muestras de una poblacin con distribucin desconocida, finita o infinita, la


distribucin muestral de X an ser aproximadamente normal con media y 2/n siempre
que el tamao de la muestra sea grande, esto se deduce a partir del Teorema el del lmite
central, el cual se define como:

Teorema del lmite central. Si X es la media de una muestra aleatoria de tamao n tomada
de una poblacin con media y varianza finita 2, entonces la forma lmite de la distribucin
de
x
Z

n
Conforme n , es la distribucin normal estndar n(z; 0, 1)

La aproximacin normal para X por lo general ser buena:

Si n 30 sin importar la forma de la poblacin.


Si n < 30, la aproximacin es buena slo si la poblacin no es muy diferente de una
distribucin normal y como se estableci antes, si se sabe que la poblacin es normal,
la distribucin muestral de X seguir una distribucin normal exacta, no importa qu
tan pequeo sea el tamao de las muestras.

La importancia del teorema del lmite central es que nos permite usar estadsticas de muestra
para hacer inferencias con respecto a los parmetros de poblacin sin saber nada sobre la
forma de la distribucin de frecuencias de esa poblacin ms que lo que podamos obtener de
la muestra.

1.- Una agencia de empleo normalmente aplica pruebas de inteligencia y aptitudes a todos
los que buscan trabajo a travs de ella. La empresa ha reunido datos durante aos, y sabe
que la distribucin de las puntuaciones es normal, con una media de 86 y una desviacin
estndar de 16, cul es la probabilidad de que, en una muestra de 75 candidatos, la
puntuacin promedio sea por lo menos 84?

Solucin
= 86
= 16
n = 75
P( X > 84)

ESTADSTICA I Unidad 2 2
La probabilidad que buscamos est dada por la regin sombreada de la siguiente curva

84 86

Por tanto tenemos que


x 84 86
Z 1.08
16
n 75

Dado que P( X > 84) = P(Z > -1.08) = 1 - 0.1401 = 0.8599

Podemos concluir que la probabilidad de que el promedio en la prueba de inteligencia y


aptitudes de los 75 candidatos sea por lo menos de 84 es de 0.8599

2.- Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40
horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio de menos de 775 horas.

Solucin
= 800 horas
= 40 horas
n = 16
P( X < 775)

La probabilidad que buscamos esta dada por la regin sombreada de la siguiente curva

775 800

Por tanto tenemos que


x 775 800
Z 2.5
40
n 16

ESTADSTICA I Unidad 2 3
Dado que P( X < 775) = P(Z < -2.5) = 0.0062

Podemos concluir que la probabilidad de que la vida media de la muestra de 16 focos sea
menor de 775 horas es de 0.0062

3.- Ciertos tubos fabricados por una compaa, tienen una duracin media de 900 horas y una
desviacin estndar de 70 horas. Si se seleccionan aleatoriamente una muestra de 36 tubos,
cul es la probabilidad de que dichos tubos tengan una duracin media entre 870 y 925
horas?

Como el rea que se busca es la marcada, es decir, est entre 2 puntos; adems los datos de
probabilidad es de la tabla normal acumulada, entonces, se procede a realizar lo siguiente:

F(-2.57) = 0.0051
F(2.14) = 0.9838

P(870< X < 925) = 0.9838 0.0051 = 0.9787

ESTADSTICA I Unidad 2 4
Distribucin t de Student (Muestras Pequeas)
En el tema anterior, dijimos que si una poblacin era normal, las medias muestrales tambin
se distribuirn normalmente. Esta situacin tambin se cumple si la muestra es pequea (n <
30) y se conoce la desviacin estndar poblacional. Dijimos tambin que si una distribucin
era normal pero se desconoce LA DESVIACIN ESTNDAR POBLACIONAL (), esta
puede ser remplazada por la desviacin estndar muestral S, si el tamao de la muestra n >
30. Por ltimo dijimos, que segn el teorema central del lmite, si una poblacin no est
normalmente distribuida o se desconoce tal situacin, las medias muestrales se distribuirn
normalmente si el valor n > 30.

Con relacin a lo anterior, queda entonces un vaco. Qu pasar si el tamao de la muestra


es pequeo (n < 30) y no se conoce la desviacin estndar poblacional ? A este respecto,
el descubridor de la ley t-student, William S Gosset, encontr que en lugar del valor de Z
utilizado para la distribucin normal, se puede utilizar el estadstico t, similar a Z, que
denomin ley t-Student y que podemos escribir de manera similar al estadstico Z, como
aparece a continuacin:

La distribucin t-Student se utiliza bajo el supuesto de que la poblacin se distribuye


normalmente; sin embargo, segn varios estudios sta no es una restriccin muy rigurosa y
en la prctica bastara tener cuidado que la poblacin sea aproximadamente campaniforme y
no demasiado asimtrica.

La forma de la distribucin t-Student es semejante a la normal pero ms achatada, simtrica,


campaniforme, con media cero (0), pero con mayor probabilidad de obtener valores
extremos. Es bueno anotar, que a medida que el tamao de la muestra (n) crece, la curva t-
Student se normaliza.

La distribucin t-Student utiliza una tabla de probabilidad especial, cuyo uso sugiere como
compensacin el clculo previo de los grados de libertad (v), que se define como el tamao
de la muestra n, al cual se le ha restado tantas unidades como parmetros de la poblacin
halla que estimar a partir de la muestra. En el caso de la distribucin en el muestreo de la
media, tendremos que estimar al parmetro, por lo cual para conocer los grados de libertad
v, tendremos que restar al tamao de la muestra n, el valor de la unidad (1). Otros autores
simbolizan los grados de libertad como df o gl.

ESTADSTICA I Unidad 2 5
Ejemplos:

1.- Un fabricante de una determinada droga, afirma que la misma tiene una vida media til
de 1.000 horas. Un distribuidor pone en duda sta afirmacin y para probarlo toma una
muestra de 25 frascos de la droga y encuentra que la vida media til de dicha muestra es de
970 horas con desviacin estndar de 24 horas. Que deber concluir el distribuidor? Se
supone que la duracin de la droga se distribuye normalmente, considerando para =0.05

V=1 n
= 1- 25 = 24
t ,v =
t 0.025,24 = 2.064

Por lo anterior, el distribuidor podra rechazar la afirmacin del fabricante. Dicho de otra
forma, la media de la muestra obtenida por el distribuidor no pertenece a la poblacin
sealada por el fabricante, pues solo un 5% de las medias muestrales se salen del intervalo +
2.064, como se puede ver en la anterior grfica.

2.- Un ingeniero afirma que el rendimiento medio de cierto programa de software es mayor
a 500 procesos por hora. Para verificar esta afirmacin muestrea 25 horas cada mes. Qu
conclusin obtendra de una muestra que tiene una media de 518 procesos por hora y una
desviacin estndar de 40 procesos? Considere para = 0.05 Suponga que la distribucin de
rendimiento es aproximadamente normal.

ESTADSTICA I Unidad 2 6
V=1 n
= 1- 25 = 24
t,v =
t0.05,24 = 1.711

Como el valor calculado de t, se encuentra dentro del rea de aceptacin, se puede concluir
que la afirmacin del rendimiento del programa de software es correcta, es decir, si realiza
los 500 procesos por hora.

Cuando en una muestra no se cuenta con el valor de la desviacin estndar muestral, pero s
se cuenta con el valor de cada muestra, entonces se puede calcular empleando la siguiente
frmula:

( )2
=
1

2.- Un Jefe de Calidad en una planta, desea saber si la resistencia que existe en un cierto
material es lo suficiente para emplearlo en su proceso de fabricacin, realiza una medicin
en 11 piezas. Los cuales arrojaron los siguientes resultados:

Pieza 1 2 3 4 5 6 7 8 9 10 11
Kg/fuerza 2.8 2.5 2.3 2.1 2.6 2.7 2.4 2.4 2.1 2.8 2.5

El fabricante le asegura al Jefe de calidad, que el material tiene un promedio de resistencia


de 2.6 kg/fuerza. Con base a los datos proporcionados, debera el Jefe de Calidad comprar
el material para su empresa?; tomando en cuenta que las especificaciones que la empresa
tiene es para =0.025

ESTADSTICA I Unidad 2 7
= 2.47

( )2 0.6019
= = = 0.245
1 10

= = (2.8 2.47)2 + (2.5 2.47)2 + (2.3 2.47)2+ + (2.5 2.47)2 = 0.6019

V=n - 1
= 11 - 1 = 10
t /2,v =
t 0.05/2,10 = 2.228
t 0.025,10 = 2.228

Como T calculada se encuentra dentro de la zona de aceptacin, se puede concluir que la


resistencia del material es suficiente para emplearlo en el proceso de fabricacin.

ESTADSTICA I Unidad 2 8
Distribucin Muestral para la Diferencia de Medias
(Muestras Grandes)
Con mucha frecuencia estamos interesados en conocer las diferencias entre dos medias de
dos poblaciones independientes; as por ejemplo podramos estar interesados en comparar
los ingresos promedios que presentan dos regiones dadas. Supongamos entonces, que
tenemos dos poblaciones independientes que identificamos como X y Y de tamaos N 1 y N2
respectivamente con medias respectivas 1 y 2 y sus desviaciones estndar respectivas 1 y
2. Supongamos adems que de las poblaciones X y Y, obtenemos muestras de tamaos n1 y
n2, con medias respectivas X y Y , cuya diferencia es: X Y .

Por lo tanto, la distribucin de las diferencias de las medias muestrales, es una variable
aleatoria que se distribuye normalmente en los siguientes casos:

a) Cuando las poblaciones X y Y se distribuyen normalmente y se conoce la desviacin


estndar de ambas poblaciones, sin importar el tamao de las muestras.

b) Cuando las poblaciones X y Y se distribuyen normalmente y no se conocen la


desviacin estndar de ambas poblaciones, pero: (n1 30 y n2 30 o n1+n2 60). En
ste caso, las desviaciones estndar, reemplazan adecuadamente las de las respectivas
muestrales.

c) Por ltimo, adaptando el teorema central del lmite, cuando las poblaciones no son
normales o no se sabe nada de ellas, pero:

Ahora, la frmula para Z, se representa de la siguiente manera:

Ejemplo 1:

Un rodamiento para una troqueladora producida por la empresa A, tiene una vida media til
de 3.5 aos con una desviacin estndar de 0.4 aos. El mismo tipo de rodamientos producido
por la empresa B, tiene una vida media til de 3.3 aos con una desviacin estndar de 0.3
aos. Cul es la probabilidad de que una muestra de 25 rodamientos de la empresa A tenga
una vida media de por lo menos 0.4 aos ms, que la vida media de una muestra de 36
rodamientos de la empresa B?

ESTADSTICA I Unidad 2 9
Buscando el valor de probabilidad en las tablas de la distribucin normal, de 2.12, es de
0.9830, como son valores acumulados, de izquierda a derecha, y adems nos interesan valores
mayores al de Z calculada, entonces:

1-0.9830= 0.017

1
( 2 < 0.4) = 0.017

Ejemplo 2:

Las compaas A y B fabrican dos tipos de cables que tienen una resistencia media a la rotura
de 4.000 y 4.500 libras y desviaciones estndar de 300 y 200 libras respectivamente. Si se
comprueban 100 cables de A y 50 cables de B; cul es la probabilidad de que la media a la
rotura de B sea mayor que la de A en 400 libras?

1
Se pide calcular ( 2 400 lbras).
Si calculamos el valor de z segn la frmula, tenemos:

ESTADSTICA I Unidad 2 10
0.007
5

Como el valor de probabilidad que interesa, son los mayores a 400 libras (Z calculada es
-2.43), y los valores de probabilidad dados en tabla son acumulados, entonces:

1- 0.0075 = 0.9925
1
( 2 400) = 0.9925

ESTADSTICA I Unidad 2 11
Distribucin Muestral para la Diferencia de Medias
(Muestras Pequeas)
Cuando las poblaciones son pequeas (n1 < 30 y n2 < 30 o n1+n2 < 60) y adicionalmente, no
se conocen las desviaciones estndar poblacionales 1 y 2. Si las dos poblaciones se
distribuyen normalmente, la ley t-Student nos permite resolver situaciones como sta.
Entonces, obtendremos el estadstico t, similar al estadstico Z. La frmula correspondiente
es la siguiente:

(1 1)12 + (2 1)22
=
(1 + 2 2)

El denominador de sta ltima frmula, equivale a los grados de libertad, puesto que en ste
caso, para obtener dicho valor (v), se restan 2 unidades a la suma de las dos muestras ya que
a travs de S1 y S2, se deben estimar los dos parmetros poblacionales 1 y 2
respectivamente. La curva que se genera, es idntica a la vista en la pgina anterior, excepto
que es ms achatada y adems, el eje Z, debe ser reemplazado por el eje t.

Ejemplo:

1.- Supongamos que se ha recibido informacin de parte de un vendedor, en el sentido de


que cierta pieza de cobre fabricado por una empresa A, tiene una duracin media que supera
en 60 horas a la misma pieza producida por una empresa B de la competencia. Un analista
quiere poner a prueba dicha afirmacin, para lo cual toma una muestra de 9 piezas para ambas
empresas, encontrado que para la empresa A, la duracin promedio es de 1.000 horas con
una desviacin estndar de 60 horas, mientras que para la empresa B, la duracin media es
de 925 horas con desviacin estndar de 50 horas. El analista aceptar la afirmacin del
vendedor, si el valor de t, de la diferencia de medias, est en el intervalo t0.05 y +t0.05. Se
sabe que la duracin de las piezas se comporta normalmente en ambas empresas.

ESTADSTICA I Unidad 2 12
Como t calculada, se encuentra dentro del rea del intervalo establecido, se puede concluir
que el vendedor tiene la razn respecto a la afirmacin en cuanto a la duracin de las piezas.

ESTADSTICA I Unidad 2 13
Distribucin Muestral de la Proporcin
Frecuentemente en estadstica es importante conocer la proporcin de una cosa con respecto
al todo, como la proporcin de piezas defectuosas en un lote de produccin dado, proporcin
de electores a favor de un cierto candidato, etc. La distribucin en el muestreo de la
proporcin, consiste en la distribucin de las proporciones de todas las posibles muestras que
pueden ser seleccionadas de una poblacin. Aclaremos los siguientes trminos:

n = tamao de la muestra

Ejemplo:

1.- Se ha demostrado por reclamos del cliente que las entregas a domicilio de cierta
mensajera tiene el 20% del total de sus entregas con defectos. Cul es la probabilidad de
que al realizar 100 entregas a domicilio, la proporcin de defectos sea menor que el 25%?

2.- En una gran compaa, el 18% de los trabajadores estn de acuerdo con un proyecto de
ley que modifica el cdigo laboral Colombiano. La gerencia de la compaa desea conocer
la probabilidad de que en una muestra aleatoria de 120 trabajadores, 36 de ellos o ms estn
de acuerdo con dicho proyecto de ley.

ESTADSTICA I Unidad 2 14
Al buscar en valor de probabilidad en las tablas de la Z, nos da 0.9997, pero los valores de
tablas son acumuladas de izquierda a derecha, y el valor de probabilidad que nos interesa es
el del lado derecho, entonces:

1 0.9997 = 0.0003

ESTADSTICA I Unidad 2 15
Distribucin en el Muestreo de la Diferencia de Proporciones
Con mucha frecuencia estamos interesados en conocer la diferencia entre dos proporciones
de dos poblaciones independientes; as por ejemplo, supongamos que se sabe por experiencia
que la proporcin de la poblacin empleada respecto a la poblacin econmicamente activa
de una regin es el 60%, mientras que para otra regin vecina es el 66%. Podramos estar
interesados en conocer la probabilidad de que para un ao dado, las diferencias entre las
proporciones no sobrepase el 5%, con muestras de tamao 150.
En la distribucin en el muestreo de la diferencia de las proporciones, se cumplen las siguientes propiedades:

Ejemplo:
Dos mquinas A y B, producen un mismo artculo. La mquina A produce como trmino
medio una proporcin de 14% de artculos defectuosos, mientras que la mquina B, produce
en trmino medio una proporcin de 20% de artculos defectuosos. Si se obtiene una muestra
aleatoria de 200 unidades del artculo que provenga de la mquina A y una muestra aleatoria
de 100 unidades provenientes de la mquina B, calcular la probabilidad de que B tenga una
proporcin de defectos del 8% o ms que A. Se supone que la poblacin es infinita.

Valor de probabilidad de 0.43 = 0.6664


1 0.6664 = 0.3336

ESTADSTICA I Unidad 2 16
Distribucin Muestral de la Varianza
Podemos estar interesados en investigar sobre la variabilidad de un conjunto poblacional,
como por ejemplo, conocer la variabilidad del peso de un gran lote de ganado vacuno. La
costumbre estadstica, es medir la variabilidad a travs de la varianza o la desviacin
estndar. En consecuencia, el estimador utilizado para propsitos inferenciales es la varianza
muestral.
Podemos decir que X2, es una variable aleatoria, que tiene distribucin Ji-cuadrada, con
parmetro v = n-1 grados de libertad y se expresar as:

La curva, a diferencia de la normal y la t, en la ji-cuadrada, se presenta de la siguiente


manera

Se puede observar que la curva tiene su origen en el 0 de la recta numrica, y contina del
lado derecho hasta +

Ejemplo 1:

ESTADSTICA I Unidad 2 17
Un fabricante de bateras para automvil garantiza que sus bateras duran en promedio 3 aos
con desviacin estndar de 1 ao. Si 5 de dichas bateras presentan una varianza de 0.815,
est el fabricante an convencido de que la duracin de sus bateras tiene una desviacin
estndar de un ao? Se sabe que la duracin de las bateras se distribuye normalmente.
Considera = 0.01

Se sabe que la poblacin es normal y nos estn dando los valores de las varianzas muestral y
poblacional respectivamente. Por lo tanto si calculamos el valor de Ji-cuadrada segn la
frmula tenemos:

1 (0.01/2)= (0.01/2)= 0.005


1 0.005 = 0.995

Al graficar 2, se puede observar que se encuentra dentro del rea de aceptacin, por lo que
se puede concluir que el fabricante tiene razn respecto a la duracin de sus bateras.

ESTADSTICA I Unidad 2 18
Distribucin Muestral de la Relacin De Varianzas

Con alguna frecuencia en la industria y en otras aplicaciones en el campo cientfico, se


plantea la necesidad de comparar la variabilidad de dos procesos determinados utilizando
para tal fin el cociente de las varianzas de dos muestras aleatorias e independientes. Si el
referido cociente es cercano a la unidad, se puede afirmar que el comportamiento de ambos
procesos es igual; de lo contrario, podemos concluir que los dos procesos son de
comportamientos diferentes.
La distribucin F, fue descubierta por Ronald A Fisher y puede ser definida como: la
distribucin de la razn de dos variables Ji-cuadradas independientes, cada una dividida por
los grados de libertad correspondientes.
La distribucin F, es una herramienta muy valiosa para efectuar inferencias respecto de las
varianzas de dos poblaciones. Como cualquier otra distribucin, la distribucin F tiene su
correspondiente funcin de densidad y dada su complejidad, nos limitaremos a decir, que la
distribucin F tal como la distribucin Ji-cuadrada, solo tiene valores positivos. Podemos
tambin decir, que la curva que genera dicha distribucin es similar a la distribucin Ji-
cuadrada, es decir, sesgada a la derecha.

Ahora bien, si S12 y S22, son las varianza de muestras aleatorias independientes de tamao n1
y n2 respectivamente, tomadas de dos poblaciones normales que tienen igual varianza,
entonces la ecuacin

ESTADSTICA I Unidad 2 19

You might also like