You are on page 1of 12

MUESTREO SIN REEMPLAZO

Considere una población de N elementos x1, x2, …, xN a partir de la cual se


seleccionan muestras de tamaño n. ¿Cuál es la media de las medias de las
muestras, en términos de la media de la población; esto es, cómo se puede
expresar µ x en términos de µx? Considere primero, el número de muestras de
tamaño n que se forman a partir de la población de N elementos.

Para una población de N elementos x1, x2, … , xN a partir de la cual se


escogen muestras de tamaño n, la media de las medias de todas las muestras
posibles de tamaño n es igual a la media de la población original. Esto es,
µx = µx.

Para la población de N elementos ..., a partir de la cual se


seleccionan muestras de tamaño n, la relación entre la desviación estándar σx ,
de las medias de todas las muestras posibles de tamaño n y la desviación
estándar, σx, de la población original es

σx = σx

1. Supongamos que la probabilidad de tener una unidad defectuosa en


una línea de
ensamblaje es de 0.05. Si el conjunto de unidades terminadas constituye
un conjunto de
ensayos independientes:
1. ¿cuál es la probabilidad de que entre diez unidades dos se encuentren
defectuosas?
2. ¿y de que a lo sumo dos se encuentren defectuosas?
3. ¿cual es la probabilidad de que por lo menos una se encuentre
defectuosa?
SOLUCIÓN:
Seaδ i una variable aleatoria que representa el estado de una unidad terminada
en la línea de
ensamblaje en el momento i, siendo δ i= 1 si la unidad es defectuosa y δ =0 en
caso contrario.
La variable δ sigue una distribución Bernoulli con parámetro p=0’05, de
acuerdo con el dato
inicial del problema. Además, nótese que un conjunto de unidades terminadas
constituye un
conjunto de ensayos independientes, por lo que el número de unidades
defectuosas de un total
de n unidades terminadas (δ 1……….δ n), esto es, i
n
i
n p Σ=
=
1
, η δ , sigue una distribución
binomial de parámetros n y p=0,05. Hechas estas consideraciones iniciales,
procedemos a
resolver el problema:
1. Procedamos a calcular:
* * 0,0476
2
10
( 2) 0'05 (1 0,05)2 8
10,0'05 =  


 

Pη==−
2. Se tiene que:
* * 0,9984
10
( 2) 0'05 (1 0,05)10
10,0'05 =  


 

≤ = − i −i
i

3. Por último:
* * 1 0,5987 0,4013
0
10
( 1) 1 ( 0) 1 0,05 (1 0,05) 0 10 0
10,0'005 10,0'05 = − =  


 

≥=−==−−−PηPη
2. El gerente de un restaurante que sólo da servicio mediante reservas
sabe, por
experiencia, que el 20% de las personas que reservan una mesa no
asistirán. Si el
restaurante acepta 25 reservas pero sólo dispone de 20 mesas, ¿cuál es
la probabilidad de
que a todas las personas que asistan al restaurante se les asigne una
mesa?
SOLUCIÓN:
Representemos por la variable aleatoria δ la decisión de asistir (δ = 0) o no (δ =
1)
finalmente al restaurante por parte de una persona que ha hecho una reserva.
Esta variable sigue
una distribución de Bernoulli de parámetro p = 0,2, de acuerdo con el
enunciado del ejercicio.
Suponiendo que las distintas reservas son independientes entre sí, se tiene
que, de un total de n
reservas (δ 1….δ n), el número de ellas que acuden finalmente al restaurante
es una variable
aleatoria Yn =Σ=
n
i1
δ 1, con distribución binomial de parámetros n y p=0,2. En el caso particular
del problema, n=25. Entonces, para aquellas personas que asistan al
restaurante de las 25 que
han hecho la reserva puedan disponer de una mesa, debe ocurrir que acudan
20 o menos. Así se
tiene que:
*0,2 *(1 0,2) 0,5799
25
( 20) 25
20
0
=−


 

≤=−

ii
ii
PY

MUESTREO CON REEMPLAZO

En muchos problemas de muestreo, el proceso tiene lugar como si una unidad


fuera reemplazada una vez que se ha sacado. Por ejemplo, si un dado se tira,
hay 6 resultados posibles (digamos 1, 2, 3, 4, 5 y 6). Si el dado se tira por
segunda vez, hay también 6 resultados posibles. No se podría pensar en que si
el resultado fue 1 la primera vez, es menos probable que aparezca la segunda.
El mismo resultado se puede obtener si se sacaran bolas marcadas con los
números del 1 al 6 de una bolsa y se reemplazaran antes de sacar otra.
Supongamos que se desea hacer varias mediciones de la longitud de un
tablero para tomar el promedio de ellas como una mejor estimación de la
medida. Después que se obtuviera una medición 1.80 m, ¿se podría pensar
que esto reduce la probabilidad de obtener 1.80 m en el segundo intento?

Así, un muestreo de mediciones es una clase de muestreo con reemplazo.


De estos ejemplos se puede ver que esta clase de muestreo se puede
considerar cuando se trata de poblaciones indefinidamente grandes.
En el teorema 6-1 hemos demostrado que en el caso de muestras sin
reemplazo, la media de las medias de todas las muestras posibles es igual a la
media de la población original. Un resultado semejante se cumple para la
muestras con reemplazo. Consideremos una población de N elementos x1, x2,
…, xN a partir de la cual se seleccionan muestras de tamaño n, con la
condición de que después de que cada elemento de la muestra se escoja, el
elemento se reintegre a la población. De esta manera hay N posibilidades de
escoger el primer elemento de la muestra, N para el segundo, y así
sucesivamente, hasta que los n elementos se hayan seleccionado. Por tanto,
cuando el remplazo es permitido, se pueden formar muestras diferentes de
tamaño n a partir de una población de tamaño N.

Ahora, vamos a deducir la relación entre la media de la población original, µx, y


la media de las medias de las muestras, µx. Por definición,

En las diferentes muestras, cada elemento de la población original aparece


n veces.

Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar


la proporción correspondiente, que es 0.95. Lo que se buscaría en seguida es
el valor Z para la variable aleatoria z tal que el área simétrica bajo la curva
normal desde -Z hasta Z sea igual a 0.95, es decir, P(-Z<z<Z)=0.95.

Utilizando las tablas, o la función DISTR.NORM.ESTAND.INV() del Excel, se


puede calcular el valor de Z, que sería 1.96 (con una aproximación a dos
decimales).

Esto quiere decir que P(-1.96<z<1.96)=0.95.

En el Colegio de Bachilleres, una institución de nivel medio superior, se desea


realizar una investigación sobre los alumnos inscritos en primer y segundo
años, para lo cual se aplicará un cuestionario de manera aleatoria a una
muestra, pues los recursos económicos y el tiempo para procesar la
información resultaría insuficiente en el caso de aplicársele a la población
estudiantil completa.

En primera instancia, suponiendo que no se conoce el tamaño exacto de la


población, pero con la seguridad de que ésta se encuentra cerca a los diez
millares, se aplicará la primera fórmula.

Se considerará una confianza del 95%, un porcentaje de error del 5% y la


máxima variabilidad por no existir antecedentes en la institución sobre la
investigación y porque no se puede aplicar una prueba previa.
Primero habrá que obtener el valor de Z de tal forma que la confianza sea del
95%, es decir, buscar un valor de Z tal que P(-Z<z<Z)=0.95. Utilizando las
tablas o las funciones de Excel se pueden obtener, o viendo (en este caso) el
ejemplo anterior, resulta que Z=1.96.

De esta manera se realiza la sustitución y se obtiene:

Esto quiere decir que el tamaño de la muestra es de 385 alumnos.

Supongamos ahora que sí se conoce el tamaño de la población estudiantil y es


de 9,408, entonces se aplicará la segunda fórmula. Utilizando los mismos
parámetros la sustitución queda como:

Con lo que se tiene una cota mínima de 370 alumnos para la muestra y así
poder realizar la investigación sin más costo del necesario, pero con la
seguridad de que las condiciones aceptadas para la generalización
(confiabilidad, variabilidad y error) se mantienen.

1. En un lote de frascos para medicina, con una población de 8000


unidades, se desea estimar la media de la capacidad en centímetros
cúbicos de los mismos.

A través de un premuestreo de tamaño 35 se ha estimado que la desviación


estándar es de 2 centímetros cúbicos. Si queremos tener una precisión 0.25
cms3, y un nivel de significancia del 5% . ¿De que tamaño debe de ser la
muestra?

DATOS:

S = 2 cms3 ; N = 8000 ; d = 0.25 cms3 ; a = 0.05 (5%)

Za/2= 1.96

N Z²a/2S² 8000(1.96)²(2)²

n = -------------- = --------------------------- = 238 frascos

Nd² + Z²a/2S² 8000(0.25)² + (1.96)²(2)²


Solo faltaría muestrear 203 frascos, pues los datos de los 35 frascos del
premuestreo siguen siendo válidos.

2. Una cantidad, con frecuencia, de interés para una clínica es el porcentaje de


pacientes retrasados para su vacunación. Algunas clínicas examinan cada
registro para determinar el porcentaje; Sin embargo, en una clínica grande, la
realización de un censo de los registros puede llevar mucho tiempo. Cullen
(1994) realizo una muestra de los 580 niños a los que da servicio una clínica
familiar, en Auckland para estimar la proporción de interés.

Que tamaño de muestra seria necesario con una muestra aleatoria simple (sin
reemplazo) para estimar la proporción con el 95% de confianza y un margen de
error de 0.10 .

DATOS:

N = 580 Niños

En realidad, Cullen realizo una muestra aleatoria simple con reemplazo de


tamaño 120, de los cuales 27 resultaron como no retrasados para la vacuna.
De un intervalo de confianza al 95% para la proporción de niños no retrasados.

Solución:

3. En un estudio, se desea determinar en que proporción los niños de una


región toman incaparina en el desayuno. Si se sabe que existen 1,500
niños y deseamos tener una precisión del 10 porciento, con un nivel de
significancia del 5%. De que tamaño debe de ser la muestra?

DATOS:
N = 1500 ; d = 10 % = 0.1 ; a = 5 %

p = 0.5 y q = 0.5 (asumiendo varianza máxima).

Za/2= 1.96

Z²a/2 pq 1500 (1.96)²(0.5)(0.5)

n= ----------------- = ------------------------------- = 91

d² + Z²a/2 pq 1500(0.1)² + (1.96)²(0.5)(0.5)

Se deben de muestrear 91 niños.

DISTRIBUCION MUESTRAL DE MEDIA

En estadística, numerosos problemas están relacionados con la estimación de


la media o la desviación estándar de una población dada, apartir del estudio de
una muestra de tamaño n. Por ejemplo, si a una empresa le puede interesar el
número promedio de piezas defectuosas producidas por una cierta máquina; a
un ingeniero especialista en cohetes le puede interesar la variabilidad en el
funcionamiento de un tipo dado de proyectil.

En las secciones anteriores se vio que si se supone que cada muestra de


tamaño n tiene la misma probabilidad de ser seleccionada, entonces la media
de la distribución de las medias de la muestra es la misma que la de la
población original, µx = µx. Aún más, para poblaciones suficientemente
grandes, o para muestreo con reemplazo, la desviación estándar de la
distribución de las medias de la muestra, σx, está relacionada con la desviación
estándar de la población σx, por la ecuación σx = .

Si en una aplicación particular fuera practico seleccionar todas las posibles


muestras de tamaño n, para determinar la media de cada una de ellas y,
después, calcular la media y la desviación estándar de la distribución de las
medias de las muestras, las fórmulas anteriores permitirían calcular µx y σx
directamente. Por lo general, este procedimiento no es práctico. Lo que
comúnmente se hace es no estudiar todas las muestras de tamaño n, sino
únicamente una de ellas. La media, x, y la desviación estándar, s, de esa
muestra únicamente se toman como estimaciones de µx y σx, la media y la
desviación estándar que corresponden a la población original. Puesto que µx =
µx y σx = las estimaciones para µx y σx son x y respectivamente. En
seguida se ilustra el procedimiento de estimación con un ejemplo.
Se escoge una muestra aleatoria de 36 niños de una guardería infantil. Las
alturas (en cm) de los niños que constituyen la muestra son:

63 64 64 65 65 66
66 66 67 67 67 67
67 68 68 68 69 69
69 69 69 70 70 70
71 72 72 72 72 73
73 74 74 76 76 77

La media de la muestra x es 69, (al cm más próximo), y la desviación estándar


s, es 3.5. Utilizando x y s como estimaciones de µx y σx, podemos afirmar que
la altura media de todos los niños de esa guardería es alrededor de 69 cm. Aún
más, podemos decir que la desviación estándar de las alturas respecto a la
media es, aproximadamente, 3.5 cm.

1 La me di a y lo s qu e d e l o s pe so s de 5 00 e stu di a n te s
de un co l eg i o e s 7 0 kg y l a d e svi a ci ón típ i ca 3 kg .
S up o ni e n do q u e l o s pe so s se d i strib u ye n no rmal me n te ,
ha l la r cu á n to s e stu d ia n te s pe sa n :

1 . E n tre 6 0 kg y 65 kg .

2 . Má s d e 9 0 kg .

3 . Me n o s de 64 kg .

4 . 6 4 kg .

5 . 6 4 kg o me n o s.

La me d i a y l o s qu e de l o s p e so s de 50 0 e stu di a n te s d e
un co le g io e s 70 kg y la de svi a ci ó n típ i ca 3 kg . S up o n ie n d o
qu e lo s p e so s se di stri b u ye n n o rma l men te , ha l la r cu án to s
e s tud i a n te s pe sa n :

1 . E n tre 6 0 kg y 65 kg .

2 .Má s de 90 kg .

3 .Men o s d e 6 4 kg .

4 .64 kg .

5 .64 kg o men o s.
2 E n un a ci u da d se esti ma q u e la te mpe ra tu ra má xi ma en el me s

de ju ni o si un a d i strib u ció n no rmal , co n med i a 2 3 ° y d e svia ci ón

típ i c a 5 ° . C al cu l a r e l nú me ro de d ía s de l me s e n l o s qu e se

e sp e r a a l ca n za r má xi ma s en tre 21 ° y 27 ° .

E n un a ci u da d se esti ma q u e la te mpe ra tu ra má xi ma
en e l me s de j un i o si u na d i strib u ci ón n o rma l , co n me d i a
23 ° y de svi a ció n típ i ca 5° . C a l cu l a r el nú me ro de d ía s de l
m e s en lo s q u e se e spe ra a l can za r má xi ma s en tre 21 ° y
27 ° .

TEOREMA DEL LIMITE CENTRAL

La aproximación anterior representa sólo un caso especial de un resultado


general. A fin de verificar esto, recordemos que la variable aleatoria X
distribuida binomialmente se puede representar como la suma de las siguientes
variables aleatorias independientes:

Xi = 1 si el éxito ocurre en la i-ésima repetición;

= 0 si la falla ocurre en la i-ésima repetición.


Luego X = X1 + X2 + … + Xn. Para esta variable aleatoria hemos demostrado
que E(X) = np, V(X) = np(1 - p) y, además. Que para un n grande, (X – np)/
tiene la distribución aproximada N(0,1).

Si una variable aleatoria X puede representarse como una suma de n variables


aleatorias independientes cualesquiera (satisfaciendo ciertas condiciones que
son validas en la mayor parte de las aplicaciones), entonces esta suma para un
n suficientemente grande está distribuida aproximadamente normal. Este
resultado notable se conoce como el teorema del límite central.

Sea X1, X2, . . . , Xn . . . una sucesión de variables aleatorias independientes


con E(Xi) = µi, y V(Xi) = , i = 1, 2, . . . Sea X = Xi + X2 + . . . + Xn. Luego bajo
ciertas condiciones generales (que no se indicarán explícitamente aquí),

Zn =

Tiene aproximadamente la distribución N (0, 1). Es decir, si es la fda dela


variable aleatoria Zn tenemos limn ∞ Gn (z) = Φ(z).
Este teorema representa una generalización obvia de la aproximación de
DeMoivre-Laplace. Las variables aleatorias independientes Xi que toman sólo
los valores 1 y 0 han sido sustituidas por variables aleatorias que poseen
cualquier clase de distribución (mientras tengan esperanzas y varianzas
finitas). El hecho de que las Xi pueden tener (evidentemente) cualquier clase
de distribución y aún así la suma X = X1 + . . . + Xn puede ser aproximada por
una variable aleatoria distribuida normalmente, representa la razón básica para
la importancia de la distribución normal en la teoría de probabilidades. Resulta
que en muchos problemas, la variable aleatoria que se considera, puede ser
representada como la suma de n variables aleatorias independientes y, por
tanto, su distribución puede aproximarse por la distribución normal.

1 . C al cu la r la p ro ba b i li d ad de qu e l a med i a d e l os
pe s o s d e l a s bo l sa s d e u n pa q u e te se a men o r q u e 4 95 g .
2 . Ca l cu l a r la p ro b a bi l id a d de q ue u na ca ja 1 0 0 d e
bo l sa s p e se má s de 51 kg .

NOMBRE: CRISTIAN DE JESUS GALINDO LOPEZ

Bibliografía:

Probabilidad y estadística. Autor Stephen S. Willoughby. Sexta reimpresión


1978 México. Editorial CIA. Impresora Gutenberg
Probabilidad y aplicaciones estadísticas. Autor Paul L. Meyer. 1989 México.
Editorial Impresora Azteca.
http://www.uaq.mx/matematicas/estadisticas/xu5.html
http://sitios.ingenieria-
usac.edu.gt/estadistica/estadistica3/muestreosimplealeatorio.html
http://www.mat.uda.cl/hsalinas/cursos/2009/estadistica/resueltos-
probabilidades.pdf
http://www.vitutor.com/pro/5/a_a.html

You might also like