You are on page 1of 62

INTRODUCCIN

Para lograr un verdadero aprendizaje de la estadstica, como en cualquier rama de las matemticas, no basta con la
memorizacin de sus conceptos ni definiciones, incluso ni de sus procesos. La Estadstica tiene como objetivo el
desarrollo de las capacidades racionales del estudiante, considerando sus conocimientos previos, con la finalidad de
propiciar el logro de aprendizajes significativos que le permitan comprender la importancia y utilidad en lo que ser su
vida profesional.

Por lo anterior, es necesario que cualquier estudiante de esta disciplina resuelva problemas que le permitan el desarrollo
de esa capacidad en base a un slido marco contextual dentro del cual se desempear, tal es el caso de los
estudiantes de cualquier rea de la administracin.

Todas las licenciaturas de la Facultad de Ciencias Econmico Administrativas, de la Universidad Autnoma del Carmen,
cuentan en su currcula con dos cursos de Estadstica: Estadstica I donde se contemplan los temas de estadstica
descriptiva, mientras que en Estadstica II se encuentra integrados los contenidos propios de la
estadstica Inferencia, ambas secuenciales y complementarias.

Este cuaderno de trabajo est dirigido a todos los estudiantes de las carreras de Administracin, Contabilidad, Negocios
Internacionales, Hospitalidad y Mercadotecnia, que se enfrentan a problemas propios de su rea y que se presentan bajo
condiciones muy diversas; por lo cual se ha tenido que valorar el enfoque de las aplicaciones, buscando aquellos
ejemplos ms ilustrativos a los temas que se desarrollan en el programa de Estadstica II.

El documento se desarrolla partiendo de una breve explicacin que sirve de retroalimentacin al tema que previamente
se ha visto en clase, para continuar con la realizacin independiente por parte de los estudiantes de los 14 ejercicios
numerados, distribuidos de acuerdo a los contenidos de las tres experiencias, que integran el programa del curso. En una
primera seccin tenemos el material (lectura, ejercicios resueltos y ejercicios de autoaprendizaje) que corresponden a
Distribuciones Muestrales y Estimaciones por Intervalo; la segunda seccin est integrada por el tema de Prueba de
Hiptesis y el Anlisis de Varianza, ANOVA; finalmente, tenemos el tercer apartado que corresponde al Anlisis de
Regresin y Correlacin. Cada ejercicio est compuesto, dependiendo de la complejidad del tema, de varios sub-
ejercicios resueltos y de autoaprendizaje.

Es conveniente sealar que este material completo, que incluye los resultados correctos de cada uno de los ejercicios, al
final del documento, se encuentra en el sitio del curso. En el sitio sealado, se pueden obtener los ejercicios individuales
numerados sin el material de retroalimentacin, para aquellos que as lo deseen.

Por ltimo, slo resta mencionar, que todos los ejercicios se seleccionaron, buscando una variedad de temticas
comunes a los cinco programas acadmicos a los que estn dirigidos y fueron extrados de las fuentes bibliogrficas
que aparecen al final del documento.


LA AUTORA



OBJETIVO



Con este documento se pretende que el estudiante tenga un material de apoyo acorde con el programa de Estadstica II,
ltimo de dos cursos que llevarn todos los estudiantes de la Facultad de Ciencias Econmicas Administrativas de la
Universidad Autnoma del Carmen.

El documento le brinda definiciones, conceptualizaciones y la explicacin de un conjunto de problemas aplicados, afines
a su rea de estudio.

El desarrollo del documento fue diseado para proporcionar no slo una revisin de la base terica, sino su aplicacin a
travs de un conjunto de ejercicios que le permitan alcanzar los siguientes objetivos:

El manejo de conceptos estadsticos y la utilizacin de las medidas estadsticas, que permiten realizar inferencias
de una poblacin por medio de anlisis estadsticos.

Probar hiptesis estadsticas, en base a estadsticos obtenidos de muestras probabilsticas comunes a problemas
del rea econmica-administrativa.

Plantear, resolver e interpretar situaciones que necesiten mtodos estadsticos-probabilsticas para la solucin de
problemas reales, logrando con ello un aprendizaje significativo a travs de su resolucin.





TEMA I

DISTRIBUCIN MUESTRAL Y ESTIMACIN POR INTERVALO DE CONFIANZA

DISTRIBUCIN NORMAL
o campana de Gauss-Laplace
Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su propio nombre indica su extendida utilizacin,
justificada por la frecuencia o normalidad con la que ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica tiene forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores,
se ve que sus polgonos de frecuencias se aproximan a una curva en "forma de campana".
En resumen, la importancia de la distribucin normal se debe principalmente a que hay muchas variables asociadas a fenmenos
naturales que siguen el modelo de la normal
- Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una especie, p.ejm. tallas, pesos, envergaduras, dimetros,
permetros,...
- Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco, o de una misma cantidad de abono.
- Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.
- Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de adaptacin a un medio,...
- Errores cometidos al medir ciertas magnitudes.
- Valores estadsticos muestrales, por ejemplo: la media.
- Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ...
Y en general cualquier caracterstica que se obtenga como suma de muchos factores.
FUNCIN DE DENSIDAD
Empleando clculos bastante laboriosos, puede demostrarse que el modelo de la funcin de densidad que corresponde a tales distribuciones
viene dado por la frmula
La distribucin normal queda definida por dos parmetros, su media y su desviacin tpica y la representamos as




FUNCIN DE DISTRIBUCIN
- Es el modelo de distribucin ms utilizado en la prctica, ya que multitud de fenmenos se comportan segn una distribucin
normal.
- Esta distribucin de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor
central que coincide con el valor medio de la distribucin:
- Puede tomar cualquier valor (- , + ).
- Esta distribucin viene definida por dos parmetros:
- X: N (, o 2)
- :es el valor medio de la distribucin y es precisamente donde se sita el centro de la curva (de la campana de
Gauss).
- : es la varianza. Indica si los valores estn ms o menos alejados del valor central: si la varianza es baja los
valores estn prximos a la media; si es alta, entonces los valores estn muy dispersos.
- Son ms probables los valores cercanos a media .
- Conforme nos separamos de , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simtrica).
- Un 50% de los valores estn a la derecha de este valor central y otro 50% a la izquierda
- Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma ms o menos rpida dependiendo de ,
que es la desviacin tpica.


F(x) es el rea
sombreada de
esta grfica

TIPIFICACIN
Cuando la media de la distribucin es 0 y la varianza es 1se denomina "normal tipificada", y su ventaja reside en que hay tablas
donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribucin.
Adems, toda distribucin normal se puede transformar en una normal tipificada:


A la variable Z se la denomina variable tipificada de X, y a la curva de su funcin de densidad curva normal tipificada.
Caracterstica de la distribucin normal tipificada (reducida, estndar)
- No depende de ningn parmetro
- Su media es 0, su varianza es 1 y su desviacin tpica es 1.
- La curva f(x) es simtrica respecto del eje OY
- Tiene un mximo en este eje
- Tiene dos puntos de inflexin en z =1 y z = -1
Ejemplo.
Una variable aleatoria sigue el modelo de una distribucin normal con media 10 y varianza 4. Transformarla en una normal
tipificada.
X: N (10, 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y) que ser igual a la anterior (X) menos su media y dividida
por su desviacin tpica (que es la raz cuadrada de la varianza)
Z = En el ejemplo, la nueva variable sera: Z =
Esta nueva variable se distribuye como una normal tipificada, permitindonos, por tanto, conocer la probabilidad acumulada en cada
valor.
Z: N (0, 1)
La distribucin normal tipificada tiene la ventaja, como ya hemos indicado, de que las probabilidades para cada valor de la curva se
encuentran recogidas en una tabla. Ver Antologa Tablas estadsticas (Tabla E).
Cmo se lee esta tabla?
La columna de la izquierda indica el valor cuya probabilidad acumulada queremos conocer. La primera fila nos indica el segundo
decimal del valor que estamos consultando.
Ejemplo: queremos conocer la probabilidad acumulada en el valor 2,75.Entonces buscamos en la columna de la izquierda el valor 2,7
y en la primera fila el valor 0,05. La casilla en la que se interceptan es su probabilidad acumulada (0,99702, es decir 99.7%).
Atencin: la tabla nos da la probabilidad acumulada, es decir, la que va desde el inicio de la curva por la izquierda hasta dicho valor.
No nos da la probabilidad concreta en ese punto. En una distribucin continua en el que la variable puede tomar infinitos valores, la
probabilidad en un punto concreto es prcticamente despreciable.
Ejemplo.
Imaginemos que una variable continua puede tomar valores entre 0 y 5. La probabilidad de que tome exactamente el valor 2 es
despreciable, ya que podra tomar infinitos valores: por ejemplo: 1,99, 1,994, 1,9967, 1,9998, 1999791, etc.
Veamos otros ejemplos:
Probabilidad acumulada en el valor 0,67: la respuesta es 0,7486
Probabilidad acumulada en el valor 1,35: la respuesta es 0,9115
Probabilidad acumulada en el valor 2,19: la respuesta es 0,98574
Veamos ahora, como podemos utilizar esta tabla con una distribucin normal:
Ejemplo.
El salario medio de los empleados de piso de una empresa se distribuye segn una distribucin normal, con media de $5,000.00 y
desviacin tpica $1,000.00. Calcular el porcentaje de empleados con un sueldo inferior a $7,000.00.
Lo primero que haremos es transformar esa distribucin en una normal tipificada, para ello se crea una nueva variable (Z) que ser
igual a la anterior (X) menos su media y dividida por la desviacin tpica
Z = En el ejemplo, la nueva variable sera: Z =
Esta nueva variable se distribuye como una normal tipificada. La variable Z que corresponde a una variable X de valor 7 es:
Z =
Ya podemos consultar en la tabla la probabilidad acumulada para el valor 2 (equivalente a la probabilidad de sueldos inferiores a
$7,000.00). Esta probabilidad es 0,97725. Por lo tanto, el porcentaje de empleados con salarios inferiores a $7,000.00 es del 97.73%.

Respuesta: P(X<$7,000.00)=97.73%

Ejemplo.
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada lanzamiento es una variable
independiente que se distribuye segn el modelo de Bernouilli, con media 0,5 y varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60 caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto, segn una distribucin normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal tipificada
equivalente: Z =
(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
P (X > 60) = P (Z > 2.0) = 1- P (Z < 2.0) = 1 0.9772 = 0.0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de 60 caras es tan slo del 2.28%.
REFERENCIA BIBLIOGRAFICA:
BLACK, Ken (2005). Estadstica en los Negocios. Edit.. CECSA. Mxico. Pags. 55-60

TEOREMA CENTRAL DEL LMITE
El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo
modelo de distribucin (cualquiera que ste sea), la suma de ellas se distribuye segn una distribucin normal.
Si los parmetros de la distribucin normal son:
- Media: n * (media de la variable individual multiplicada por el nmero de variables independientes)
- Varianza: n * (varianza de la variable individual multiplicada por el nmero de variables individuales)
Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
Si se seleccionan muestras aleatorias de n observaciones de una poblacin con media y desviacin estndar , entonces, cuando n es
grande, la distribucin muestral de medias tendr aproximadamente una distribucin normal con una media igual a y una desviacin
estndar de . La aproximacin ser cada vez ms exacta a medida de que n sea cada vez mayor.


DISTRIBUCIN MUESTRAL
Ejemplo.
Se forman muestras de tamao n=2 con reemplazo, con los nmeros 0, 2, 4 y 6. Se tendran en total 2
4
= 16 muestras.
Distribucin Muestral
x P(x)
0 1/16
1 2/16
2 3/16
3 4/16
4 3/16
K=16 muestras
Muestra x
(0,0) 0
(0,2) 1
(0,4) 2
(0,6) 3
(2,0) 1
(2,2) 2
(2,4) 3
(2,6) 4
(4,0) 2
(4,2) 3
(4,4) 4
(4,6) 5
(6,0) 3
(6,2) 4
(6,4) 5
(6,6) 6

Para la distribucin muestral de medias del ejercicio, encuentre:
a. El error muestral de cada media
b. La media de los errores muestrales
c. La desviacin estndar de los errores muestrales.
Solucin:
a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales:

Muestra x Error muestral, e=x-
(0,0) 0 0 - 3 = -3
5 2/16
6 1/16
TOTAL 6/16= 1 =100%
(0,2) 1 1 - 3 = -2
(0,4) 2 2 - 3 = -1
(0,6) 3 3 3 = 0
(2,0) 1 1 3 = -2
(2,2) 2 2 3 = -1
(2,4) 3 3 3 = 0
(2,6) 4 4 3 = 1
(4,0) 2 2 3 = -1
(4,2) 3 3 3 = 0
(4,4) 4 4 3 = 1
(4,6) 5 5 3 = 2
(6,0) 3 3 3 = 0
(6,2) 4 4 3 = 1
(6,4) 5 5 3 = 2
(6,6) 6 6 3 = 3
b. La media de los errores muestrales es
e
, es:

c. La desviacin estndar de la distribucin de los errores muestrales
e, es entonces:

La desviacin estndar de la distribucin muestral de un estadstico se conoce como error estndar del estadstico. Para el ejercicio anterior el
error estndar de la media denotado por
x
, es 1.58. Con esto se puede demostrar que si de una poblacin se eligen muestras de
tamao n con reemplazo, entonces el error estndar de la media es igual a la desviacin estndar de la distribucin de los errores muestrales.
En general se tiene:
Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar la formula siguiente para encontrar
x
.

donde es la desviacin estndar de la poblacin de donde se toman las muestras, n es el tamao de la muestra y N el de la poblacin.
Como regla de clculo, si el muestreo se hace sin reemplazo y el tamao de la muestra es mayor al 5% de la poblacin (n>5%N), entonces se
puede usar la frmula.
El factor se denomina factor de correccin (f.c.p.) para una poblacin finita.
Ejemplo.
Suponga que la tabla siguiente muestra la antigedad en aos en el trabajo de tres maestros universitarios de matemticas:
Maestro de matemticas Antigedad
A 6
B 4
C 2
Suponga adems que se seleccionan muestras aleatorias de tamao 2 sin reemplazo. Calcule la antigedad media para cada muestra, la media
de la distribucin muestral y el error estndar, o la desviacin estndar de la distribucin muestral.
Solucin:
Se pueden tener
3
C
2
=3, n= 3 muestras posibles. La tabla lista todas las muestras posibles de tamao 2, con sus respectivas medias muestrales.
Muestras Antigedad
Media
Muestral
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
La media poblacional es:
La media de la distribucin muestral es la GRAN MEDIA= .
=
La desviacin estndar de la poblacin es:

El error estndar o la desviacin estndar de la distribucin muestral es:

Si utilizamos la frmula del error estndar sin el f.c.p. tendramos que:

Por lo que observamos que este valor no es el verdadero. Agregando el factor de correccin obtendremos el valor correcto:

Ejemplo.
Se quiere determinar la distribucin muestral de los ingresos de 4 estudiantes que trabajaron en el periodo de vacaciones. Los ingresos que
percibieron fueron de $1,000.00, $2,000.00, $3,000.00 y $4,000.00 respectivamente. Entonces tenemos que:
Poblacin: N= 4 ingresos para estudiantes universitarios
Para disminuir esfuerzo se selecciona una muestra de n=2 para estimar (parmetro desconocido).

X
1
= 1,000
X
2
= 2,000
X
3
= 3,000
X
4
= 4,000
Ingreso promedio
Nmero de muestras:
4
C
2
= 6 posibles muestras

Muestra Elementos muestrales Medias muestrales
X
i


(X
1,
X
2
) 1 1000,2000 1500
(X
1,
X
3
) 2 1000,3000 2000
(X
1,
X
4
) 3 1000,4000 2500
(X
2,
X
3
) 4 2000,3000 2500
(X
2,
X
4
) 5 2000,4000 3000
(X
3,
X
4
) 6 3000,4000 3500

La probabilidad de seleccionar una muestra que de igual a es de:
2/6 = 33.33%
Cuatro de las 6 muestras resultaron con algn error en el proceso de estimacin
Error de muestreo= E = ( )
Error de muestreo: la diferencia entre el parmetro poblacional y el estadstico de la muestra utilizado para estimar el parmetro.



TABLA PARA EL CALCULO DE LA DISTRIBUCIN MUESTRAL DEL INGRESO PROMEDIO
Media muestral Frecuencia de Probabilidad de P( )
1,500 1 1/6
2,000 1 1/6
2,500 2 2/6

Ya que N=4, tenemos que la distribucin muestral es:



3,000 1 1/6
3,500 1 1/6
6/6 = 1
DISTRIBUCIN MUESTRAL DEL INGRESO PROMEDIO
Media muestral Probabilidad de P( )
1,500 1/6
2,000 1/6
2,500 2/6
3,000 1/6
3,500 1/6
6/6 = 1


LA MEDIA DE LAS MEDIAS MUESTRALES
Media de las medias muestrales: GRAN MEDIA = (doble barra)
= K= Nmero de muestras en la distribucin muestral
= = =2,500.00

LA VARIANZA Y EL ERROR ESTNDAR DE LAS MEDIAS MUESTRALES





4,167 dlares
Error estndar de la distribucin muestral = =
= dlares
Error estndar mide la tendencia a sufrir del error de muestreo en el esfuerzo por estimar .
Una aproximacin para la varianza de la distribucin muestral

Siempre y cuando la muestra se realice con reemplazo o si la muestra se toma de una poblacin muy grande.
Si el muestreo es sin reemplazo y si el tamao de la muestra es ms del 5% de la poblacin,

Se aplica el factor de correccin para poblaciones finitas (fcp).
DIAGRAMA DE FLUJO
El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del error estndar:
TEOREMA DEL LMITE CENTRAL

DISTRIBUCIN MUESTRAL DE MEDIAS
Recordemos que la distribucin normal, es una distribucin continua, en forma de campana en donde la media, la mediana y la moda tienen un
mismo valor y es simtrica.
Con esta distribucin podamos calcular la probabilidad de algn evento relacionado con la variable aleatoria, mediante la siguiente frmula:

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta frmula se pueden a hacer los clculos de
probabilidad para cualquier ejercicio, utilizando la tabla de la distribucin z.
Sabemos que cuando se extraen muestras de tamao mayor a 30 (grandes) o bien de cualquier tamao de una poblacin normal, la distribucin
muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la formula de la distribucin normal con
= y , entonces la frmula para calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra ,
quedara de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

Ejemplo.
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y
desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775
horas.
Solucin:
Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062, o sea 0.62%
Ejemplo.
Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con una media de 174.5 centmetros y una desviacin
estndar de 6.9 centmetros. Si se extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine:
a. El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros.
b. El nmero de medias muestrales que caen por debajo de 172 centmetros.
Solucin:
Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin reemplazo, por lo que se
tendr que agregar el factor de correccin. Se proceder a calcular el denominador de Z para slo sustituirlo en cada
inciso.

a.





(0.7607)(200)=152 medias muestrales
b.


(0.0336)(200)= 7 medias muestrales
DISTRIBUCIN MUESTRAL DE PROPORCIONES
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporcin de artculos
defectuosos o la proporcin de alumnos reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar respuesta a
estas situaciones. Esta distribucin se genera de igual manera que la distribucin muestral de medias, a excepcin de que al extraer las muestras
de la poblacin se calcula el estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y "n" el tamao de la
muestra) en lugar del estadstico media.

GENERACIN DE LA DISTRIBUCIN MUESTRAL DE PROPORCIONES
Muchos asuntos de negocios tratan sobre la proporcin de la poblacin (t). Una firma de marketing puede querer averiguar si un cliente (1)
compra o (2) no compra el producto. Un maestro puede querer averiguar si sus estudiantes (1) aprobaron o (2) no aprobaron el curso. En estos
casos se utiliza la proporcin muestral p (estadstico) para estimar el parmetro desconocidot.
El proceso de las proporciones es muy similar al de las medias. De cualquier poblacin es posible obtener muchas muestras diferentes de un
tamao dado. Cada muestra tendr su propia proporcin de xitos p y por consecuencia su proporcin de fracasos 1-p (tambin conocida
como q).
El valor esperado de la distribucin muestral de las proporciones mustrales E (p) = t
Ejemplo.
Los ejecutivos de Mueblera Ramos preguntan a toda la poblacin N=4 clientes si vieron el anuncio publicitario de la mueblera en el peridico de
esta maana. Se registr una respuesta de si como xito, y de no como fracaso. Los cuatro clientes respondieron S
1
, N
2
, N
3
y S
4.
La
proporcin poblacional de xitos es:
t = 2/4 = 0.50.
Se tomaron muestras de tamao n=2, y la proporcin de xitos se registra en la siguiente tabla:




En el caso de Mueblera Ramos E (p) = 3.00/ 6 = 0.50 y comprobamos que E (p) = t
El error estndar es: op =
Si n > 0.05 N, se usar el fcp y entonces el error estndar se calcula:
op =
Como n = 2 > 0.05 (4), se usar la frmula con el fcp para el caso de Muebleras Ramos.
op = = 0.289
Ejemplo.
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin
reemplazo. Genere la distribucin muestral de proporciones para el nmero de piezas defectuosas.
Como se puede observar en este ejercicio la proporcin de artculos defectuosos de esta poblacin es 4/12=1/3. Por lo que podemos decir que el
33% de las piezas de este lote estn defectuosas.
El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es
12
C
5
=792, las cuales se pueden desglosar de la
siguiente manera:
Artculos
Buenos Artculos Malos
Proporcin de
artculos
defectuoso
Nmero de
maneras en las que
se puede obtener la
muestra
1 4 4/5=0.8 8C
1
*
4
C
4
=8
2 3 3/5=0.6 8C
2
*
4
C
3
=112
3 2 2/5=0.4 8C
3
*
4
C
2
=336
4 1 1/5=0.2 8C
4
*
4
C
1
=280
5 0 0/5=0 8C5*4C0=56
Total 792
Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la sumatoria de la frecuencia por el valor de la proporcin
muestral y dividirla entre el nmero total de muestras. Esto es:

Como podemos observar la media de la distribucin muestral de proporciones es igual a la Proporcin de la poblacin.
p = E(p) =0.3333=33.33%
Tambin se puede calcular la desviacin estndar de la distribucin muestral de proporciones:
La varianza de la distribucin binomial es
2
= npq, por lo que la varianza de la distribucin muestral de proporciones es
2
p
=(Pq)/n. Si
se sustituten los valores en esta frmula tenemos que:
, este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de
correccin para una poblacin finita y un muestreo sin reemplazo:



La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la
distribucin normal a la binomial. Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.



A esta frmula se le puede agregar el factor de correccin de si se cumple con las condiciones necesarias.
Ejercicio.
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes.
Calcule la probabilidad de que la proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solucin:
Datos:
n=800 estudiantes
=0.60
p= 0.55
P(p< 0.55) = ?


La interpretacin en esta solucin, estara enfocada a la proporcin de la muestra, por lo que diramos que la probabilidad de que al extraer una
muestra de 800 estudiantes de esa universidad, la proporcin de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.
Ejemplo.
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reaccin adversa a l, ms an, se
piensa que alrededor del 3% de los usuarios tienen tal reaccin. Si una muestra aleatoria de 150 personas con malestar estomacal usa el
medicamento, encuentre la probabilidad de que la proporcin de la muestra de los usuarios que realmente presentan una reaccin adversa,
exceda el 4%. Resolverlo con la distribucin muestral de proporciones
Datos:
n=150 personas
=0.03
p= 0.04
P(p>0.04) = ?


Existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporcin mayor de 0.04 presentando una reaccin
adversa.
Ejemplo.
Se sabe que la verdadera proporcin de los componentes defectuosos fabricados por una firma es de 4%, encuentre la probabilidad de que una
muestra aleatoria de tamao 60 tenga:
a. Menos del 3% de los componentes defectuosos.
b. Ms del 1% pero menos del 5% de partes defectuosas.
Solucin:
a. Datos:
n= 60 artculos
=0.04
p= 0.03
P(p<0.03) = ?


La probabilidad de que en una muestra de 60 artculos exista una proporcin menor de 0.03 artculos defectuosos es de 0.2327.
b. Datos:
n= 60 artculos
=0.04
p= 0.01 y 0.05
P(0.01<p<0.05) = ?

La
probabi
lidad
de que
en una
muestr
a de 60 artculos exista una proporcin entre el 1% y 5% es de 0.3290.








ESTIMACIN CON INTERVALOS DE CONFIANZA

ESTIMACIN PUNTUAL Y POR INTERVALO
Las medias o desviaciones estndar calculadas de una muestra se denominan ESTADSTICOS, podran ser consideradas como un punto
estimado de la media y desviacin estndar real de poblacin o de los PARAMETROS.
Qu pasa si no deseamos una estimacin puntual como media basada en una muestra, qu otra cosa podramos obtener como margen, algn
tipo de error?
Un Intervalo de Confianza
ESTIMADOR PUNTUAL Utiliza un estadstico para estimas el parmetro en un solo valor o punto.
Ejemplo.
El gerente de una tienda puede seleccionar una muestra de n = 500 clientes y hallar el gasto promedio de sus clientes de = 371.00.



ESTIMADOR POR INTERVALO Especfica el rango dentro del cual est el parmetro desconocido.
Ejemplo: el gerente de la tienda puede decidir que la media poblacional est en algn sitio entre 350.00 y 380.00.



LIMITES DE CONFIANZA: Son los lmites del intervalo de confianza inferior (LIC) y superior (LSC), se determinan sumando y restando a la media
de la muestra un cierto nmero Z (dependiendo del nivel o coeficiente de confianza) de errores estndar de la media .


INTERPRETACIN DEL INTERVALO DE CONFIANZA: Tener un 95% de confianza en que la media poblacional real y desconocida se encuentra
entre los valores LIC y LSC.
NIVEL DE SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA = ERROR TIPO 1 = ALFA
Cmo obtenemos un intervalo de confianza?
Estimacin puntual + error de estimacin
De dnde viene el error de estimacin?
Desv. estndar X multiplicador de nivel de confianza deseado Zo/2
Ejercicio.
Si la media de la muestra es 100 y la desviacin estndar es 10, el intervalo de confianza al 95% donde se encuentra la media para una
distribucin normal es:
100 + (10) X 1.96 => (80.4, 119.6) NC= 95% Z=1.96
El 95% de Nivel de Confianza significa que slo tenemos un 5% de oportunidad de obtener un punto fuera de ese intervalo.

Hay tres niveles de confianza relacionados comnmente con los intervalos de confianza: 99, 95 y 90% se les conoce como COEFICIENTE DE
CONFIANZA.
Los intervalos de confianza nos permiten conocer que tan grande es el error de muestreo.
INTERVALO DE CONFIANZA
Un intervalo de confianza tiene un LIMITE DE CONFIANZA (LIC) y un lmite superior de confianza (LSC).
Estos lmites se hallan calculando primero la media muestral, X, luego se le suma cierta cantidad para obtener LSC se le resta la misma cantidad
para obtener LIC.
FUNDAMENTO DE UN INTERVALO DE CONFIANZA
Un intervalo de confianza tiene un lmite de confianza (LIC) y un lmite superior de confianza (LSC).
Estos lmites se hallan calculando primero la media muestral, X. Luego se suma una cierta cantidad a X para obtener el LSC, y la misma cantidad
se resta de X para obtener el LIC. La determinacin de dicha cantidad es el tema de este captulo.
Cmo se puede construir un intervalo y luego argumentar que se puede tener un 95% de confianza que contiene , si incluso no se sabe cul es
la media poblacional?
Vale la pena recordar de la discusin sobre la Regla Emprica que el 95.5% de todas las medias muestrales caen dentro de dos errores estndar
de la media poblacional. Entonces la media poblacional est mximo a dos errores estndar del 95.5% de todas las medias muestrales. Por tanto.
Al comenzar concualquier media muestral, si se pasa de dos errores estndar por encima de dicha media y dos errores estndar por debajo de
ella. Se puede tener un 95.5% de confianza en que el intervalo resultante contenga la media poblacional desconocida
La discusin sobre distribuciones de muestreo seala que de toda poblacin se puede obtener muchas muestras diferentes de un tamao dado,
cada una con propia media. La figura 7.1 muestra seis de estas medias muestrales posibles. Si la muestra da X
1
, un intervalo que se extiende dos
errores estndar por encima y dos errores estndar por debajo de X
1
todava incluye el valor desconocido de media poblacional. De igual forma, si
la muestra hubiese dado una media de X
2
, el intervalo resultante tambin incluir la media poblacional. Vale la pena destacar que slo X
3
y
X
5
quedan tan lejos de la media poblacional que un intervalo de 2 errores estndar no incluye la media poblacional. Todas las muestras
consideradas producirn un intervalo que contiene la media poblacional. Entonces, la clave para recordar es esta: como la media poblacional est
a lo ms a dos errores estndar para el 95.5% de todas las medias muestrales, entonces dada una media muestral cualquiera, se puede estar
95.5% seguro de que el intervalo de dos errores estndar alrededor de dicha media muestral contiene a media poblacional desconocida.



Si se desea construir un intervalo ms convencional de 95% (en lugar del 95.5%), cuntos errores estndar se debe mover por encima y por
debajo de la media muestral? Como lo demuestra la figura 7.2, debido a que la tabla Z contiene valores slo para el rea que
est por encima o por debajo de la media, se debe dividir el 95% por 2, produciendo 0.4750. Luego, se halla el valor de Z,
correspondiente a un rea de 0.4750, el cual es Z = 1.96. As, para construir un intervalo de confianza del 95%,
simplemente se especifica un intervalo de 1.96 errores estndar por encima y por debajo de la media muestral. Este valor del 95%
es llamado coeficiente de confianza.


Quiz se puede ilustrar mejor utilizando un ejemplo. Se comienza desarrollando una estimacin por intervalo para la media poblacional con una
muestra grande (n 30).
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL MUESTRAS GRANDES
Uno de los usos ms comunes de los intervalos de confianza es estimar la media poblacional. Un fabricante puede querer estimar la produccin
mensual promedio de su planta: un representante de mercadeo puede interesarse en la reduccin en las ventas semanales promedio; el jefe
financiero de una firma, que aparece entre las 500 mejores firmas en la revista Fortune, puede querer estimar los rendimientos trimestrales
promedio que se tuvieron en operaciones corporativas. El nmero de circunstancias que se encuentren comnmente en el mundo de los negocios
y que requiere de una estimacin de la media poblacional es casi ilimitado.
Se debe recordar que el intervalo se forma utilizando la media muestral como una estimacin puntual para el cual se adiciona y se resta un cierto
valor para obtener los lmites superior e inferior del intervalo de confianza, respectivamente. Por tanto el intervalo es

Cundo debe sumarse y restarse, depende en parte del nivel de confianza deseado, estipulado por el valor de Z en la frmula. Un nivel de
confianza del 95% requiere un valor de Z de 1.96 (0.95/2 = 0.4750). El rea de 0.4750 corresponde a un valor de Z de 1.96.
Ejemplo.
Consideremos en caso de un promotor inmobiliario quien intenta construir un gran centro comercial. Puede estimar en el rea el ingreso promedio
por familia como indicador de las ventas esperadas. Una muestra de n = 100 familias de una media de = US$35,500. Se asume que la
desviacin estndar poblacional es = US$7,200. Dado que , se estima un intervalo del 95% como:
I.C. para estimar
= 34,088.80 36,911.20
INTERPRETACIN DE UN INTERVALO DE CONFIANZA
El promotor puede interpretar los resultados de su intervalo de confianza de dos formas.
- La primera, y la ms comn, establece que el promotor tiene un 95% de confianza en que la media poblacional real desconocida est entre
US$34,088.80 y US$36,911.20. Aunque el valor real para la media poblacional sigue siendo desconocido, el promotor tiene un 95% de
confianza en que est entre estos dos valores.
- La segunda interpretacin reconoce que se puede desarrollar muchos intervalos de confianza diferentes. Otra muestra probablemente
producira una media muestral diferente debido al error de muestreo. Con una diferente, el intervalo tendra lmite superior e inferior distintos.
Por tanto, la segunda interpretacin establece que si se construyen todos los
N
C
x
intervalos de confianza, el 95% de ellos contendr la media
poblacional desconocida.
Si una segunda muestra da una media de US$35,600 en lugar de US$35,500, el intervalo es:
I.C. para estimar
= US$34,188.80 US$37,011.20
Interpretacin: El promotor puede estar un 95% seguro de que la media poblacional est comprendida entre US$34,188.80 y US$37,011.20.
Si todos los intervalos posibles se construyeran con base en todas las medias muestrales diferentes, el 95% de ellas contendran la media
poblacional desconocida.
Esto por supuesto significa que el 5% de todos los intervalos estara errado, no contendra la media poblacional. Este 5% hallado como (1-
coeficiente de confianza), es denominado el valor alfa y representa la probabilidad de error. El valor alfa es la probabilidad de que cualquier
intervalo dado no contenga la media poblacional.


INTERVALO DE CONFIANZA CUANDO o ES DESCONOCIDA
La frmula del intervalo de confianza para estimar requiere la suposicin improbable que la desviacin estndar poblacional es conocida. En
el evento probable que sea desconocida, la desviacin estndar de la muestra debe sustituirse:



En donde
Ejemplo.
Gerry Gerber, CPA, acaba de registrar las declaraciones de impuestos de sus clientes. Desea estimar la cantidad promedio que deben al Servicio
de Renta Interna. De los 50 clientes que seleccion en su muestra, la cantidad promedio que se adeudaba era de US$652.68. Ya que la
desviacin estndar de todos sus clientes es desconocida, Gerber debe estimar con la desviacin estndar de la muestra de s = US$217.43.
Si se desea un nivel del 99% de confianza, el valor de Z apropiado es 2.58 (0.99/2 = 0.4950). De la tabla Z, un rea de 0.4950 revela que Z =
2.58.
I.C. para estimar = Zs


=
= US$573.35 732.01
Interpretacin. Se puede estar un 99% seguro que los clientes de Gerry adeudan en promedio entre $573.35 y $732.01 al Servicio de Renta
Interna.
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL MUESTRAS PEQUEAS
En los ejercicios anteriores se manej el uso de la distribucin z, la cual se poda utilizar siempre y cuando los tamaos de las muestras fueran
mayores o iguales a 30 en muestras ms pequeas si la distribucin o las distribuciones de donde proviene la muestra o las muestras son
normales.
Cuando debe tomarse una muestra pequea, la distribucin normal puede no aplicarse. El Teorema del Lmite Central asegura la normalidad en
el proceso de muestreo slo si la muestra es grande. Cundo se utiliza una muestra pequea, puede ser necesaria una distribucin alternativa,
la distribucin t Student.
A la teora de pequeas muestras tambin se le llama teora exacta del muestreo, ya que tambin la podemos utilizar con muestras aleatorias de
tamao grande.
La distribucin t se utiliza cuando se cumplen las tres condiciones:
1. La muestra es pequea.
2. es desconocida.
3. La poblacin es normal o casi normal.
Si es conocida, la Distribucin Z se usa inclusive si la muestra es pequea.
La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo de W. S. Gosset. En esa poca, Gosset era empleado de
una cervecera irlandesa que desaprobaba la publicacin de investigaciones de sus empleados. Para evadir esta prohibicin, public su trabajo en
secreto bajo el nombre de "Student". En consecuencia, la distribucin t normalmente se llama distribucin t de Student, o
simplemente distribucin t. Para derivar la ecuacin de esta distribucin, Gosset supone que las muestras se seleccionan de una poblacin
normal. Aunque esto parecera una suposicin muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en
forma casi de campana an proporcionan valores de t que se aproximan muy de cerca a la distribucin t.
En esta unidad se ver un nuevo concepto necesario para poder utilizar a las tres distribuciones mencionadas. Este concepto es "grados de
libertad".
Para definir grados de libertad se har referencia a la varianza muestral:

Esta frmula est basada en n-1 grados de libertad (degrees of freedom). Esta terminologa resulta del hecho de que si bien s
2
est basada
en ncantidades . . . , stas suman cero, as que especificar los valores de cualquier n-1 de las
cantidades determina el valor restante. Por ejemplo, si n=4 y
; y , entonces automticamente tenemos , as que slo
tres de los cuatro valores de estn libremente determinamos 3 grados de libertad.
Entonces, en esta unidad la frmula de grados de libertad ser n-1 y su simbologa es gl.
DISTRIBUCION "t DE STUDENT"
Supngase que se toma una muestra de una poblacin normal con media y varianza . Si es el promedio de
las n observaciones que contiene la muestra aleatoria, entonces la distribucin es una distribucin normal estndar.
Supngase que la varianza de la poblacin 2es desconocida. Qu sucede con la distribucin de esta estadstica si se reemplaza por
s? La distribucin t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucin t son = 0 y
2
= gl/gl-2 para gl>2, respectivamente.
La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la distribucin t es similar a la de la distribucin normal
estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada se alcanza en la media = 0.Sin embargo, la
distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribucin normal. A medida que el
nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin normal estndar.

Propiedades de las distribuciones t
1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, est ms dispersa que la curva normal estndar z.
3. A medida que (gl) aumenta, la dispersin de la curva t correspondiente disminuye.
4. A medida que gl , la secuencia de curvas t se aproxima a la curva normal estndar, por lo que la curva z recibe a veces el
nombre de curva t con gl =
Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes que son todas normales con media y desviacin estndar . Entonces la
variable aleatoria tiene una distribucin t con gl= n-1 grados de libertad.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la muestra y siempre es mayor a uno. nicamente cuando el
tamao de la muestra tiende a infinito las dos distribuciones sern las mismas.
Se acostumbra representar con to,glel valor t por arriba del cual se encuentra un rea igual a . Como la distribucin t es simtrica
alrededor de una media de cero, tenemos que el valor t que deja un rea de a la derecha y por tanto un rea de a la izquierda,
es igual al valor t negativo que deja un rea de en la cola derecha de la distribucin. Esto es, t
0.95
= -t
0.05
, t
0.99
=-t
0.01
, etc.
Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t de cualquier libro de Probabilidad y Estadstica.
Ejemplo.
El valor t con gl= 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por tanto un rea de 0.975 a la derecha, es
t
0.975,14
=-t
0.025,14
= -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de . La
manera de encontrar el valor de t es buscar el valor de en el primer rengln de la tabla y luego buscar los grados de libertad en la primer
columna y donde se intercepten y gl se obtendr el valor de t.
Ejemplo.
Encuentre la probabilidad de t
0.025
< t < t
0.05.

Solucin:

Como t
0.05
deja un rea de 0.05 a la derecha, y t
0.025
deja un rea de 0.025 a la izquierda, encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t
0.025
< t < t
0.05
) = 0.925
El estadstico t se calcula en gran parte como el estadstico Z.

Ejemplo.
Una muestra de 15 aves tomadas al azar en un establecimiento con 5000 aves, (que elabora alimentos balanceados), permiti
establecer un aumento de peso promedio de 90 g por semana y por ave, y un desvo tpico de 10 g. Se busca estimar el incremento
de peso promedio para las 5000 aves del establecimiento con un intervalo de confianza del 90%.
X = aumento de peso por ave
n = 15
= 90 g
S = 10 g
Por tabla:
y el intervalo resulta:

85.5ss94.6
Se puede estar 90% seguro que las aves incrementan en promedio entre 85.5 y 94.6 g.
INTERVALO DE CONFIANZA DE UNA PROPORCION
Al seguir la variable p una distribucin normal, se puede calcular un intervalo que contenga entre sus lmites una gran proporcin de
los valores de la variable p:


Ejemplo.
En un estudio para el estado de la salud oral de una ciudad, se toma una muestra aleatoria de 280 hombres entre 35 y 44 aos, y se
estudia la variable nmero de dientes en la boca. Se desea realizar la estimacin por intervalo de confianza del 0.95 de la proporcin
de individuos de esta ciudad con 28 dientes o ms, considerando este valor como denticin completa.
Luego del examen clnico se encontr que hay 70 individuos con 28 diente o ms dientes. La estimacin puntual de es p, siendo:
p= 70/280 = 0,25, que representa el 25% de los individuos con denticin completa. Sabiendo que q =1- p q = 1 - 0,25 = 0,75, y
consultando la tabla de la distribucin normal tipificada, se encuentra que el valor de para una confianza del 0,95 es de 1.96, se
obtiene:




19.33%ss30.07
De manera que, el intervalo de confianza del 95% de la proporcin de hombres con denticin completa est entre 0.1933 y 0.3007;
es decir, que existe una probabilidad del 0,95% de que este intervalo contenga entre sus lmites el valor de .
CLCULO DEL TAMAO DE LA MUESTRA
A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parmetro a
estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de clculo
del tamao muestral delimitemos estos factores.
Parmetro. Son las medidas o datos que se obtienen sobre la poblacin.
Estadstico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacin de los parmetros.
Error Muestral, de estimacin o standard. Es la diferencia entre un estadstico y su parmetro correspondiente. Es una medida de la
variabilidad de las estimaciones de muestras repetidas en torno al valor de la poblacin, nos da una nocin clara de hasta dnde y
con qu probabilidad una estimacin basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo
completo. Siempre se comete un error, pero la naturaleza de la investigacin nos indicar hasta qu medida podemos cometerlo (los
resultados se someten a error muestral e intervalos de confianza que varan muestra a muestra). Vara segn se calcule al principio
o al final. Un estadstico ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que es la desviacin de la
distribucin muestral de un estadstico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la estimacin efectuada se ajuste a la realidad. Cualquier informacin que queremos
recoger est distribuida segn una ley de probabilidad (Gauss o Student), as llamamos nivel de confianza a la probabilidad de que
el intervalo construido en torno a un estadstico capte el verdadero valor del parmetro.
Varianza Poblacional. Cuando una poblacin es ms homognea la varianza es menor y el nmero de entrevistas necesarias para
construir un modelo reducido del universo, o de la poblacin, ser ms pequeo. Generalmente es un valor desconocido y hay que
estimarlo a partir de datos de estudios previos.
Tamao de muestra para estimar la media de la poblacin
Veamos los pasos necesarios para determinar el tamao de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de
dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error mximo que estamos dispuestos
a admitir en nuestra estimacin.
As pues los pasos a seguir son:
1.- Obtener el tamao muestral imaginando que :

donde:
: z correspondiente al nivel de confianza elegido
: varianza poblacional
e: error mximo
2. Comprobar si se cumple

Si no se cumple, pasamos a una tercera fase:
3.- Obtener el tamao de la muestra segn la siguiente frmula:

Ejemplo.
La Consejera de Trabajo planea un estudio con el inters de conocer el promedio de horas semanales trabajadas por las mujeres del servicio
domstico. La muestra ser extrada de una poblacin de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se
conoce a travs de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un
error mximo de 0.1, cul debe ser el tamao muestral que empleemos?
Buscamos en las tablas de la curva normal el valor de que corresponde con el nivel de confianza elegido: =
1.96 y seguimos los pasos propuestos arriba.
1.-

2.- Comprobamos que no se cumple , pues en este caso
10000 < 3706 (3706 - 1); 10000 < 13730730
3.-

Interpretacin. Si se quiere obtener un intervalo de confianza del 95% se tienen que muestrear 2,704 mujeres para mantener un
error mximo de 0.1
Tamao de muestra para estimar la proporcin de la poblacin
Para calcular el tamao de muestra para la estimacin de proporciones poblacionales hemos de tener en cuenta los mismos factores que en el
caso de la media. La frmula que nos permitir determinar el tamao muestral es la siguiente:

donde
: z correspondiente al nivel de confianza elegido
p: proporcin de una categora de la variable
e: error mximo
NOTA
Si se desconoce el valor de p y por tanto de q,
se considera que p=0.50 y por tanto q=0.50


Ejemplo.
Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar la proporcin de mujeres que trabajan diariamente
10 horas o ms. De un estudio piloto se dedujo que p=0.30, fijamos el nivel de confianza en 0.95 y el error mximo 0.02.

Interpretacin. Para construir un intervalo de confianza del 95% se deben de estudiar 1,678 mujeres y poder mantener un error no
mayor al 2%.

FUENTES CONSULTADAS

BIBLIOGRAFA
ANDERSON, David R. et, al. (2005). Estadstica para Administracin y Economa. International Thomson
Editores. Mxico. 884 pags
BERENSON, Mark L. y LEVINE, D.M. (1999). Estadstica Bsica en Administracin; Conceptos y aplicaciones.
Edit.Prentice Hall, Pearson. Mxico. 943 pags.
BLACK, Ken (2005) Estadstica en los Negocios. Edit.. CECSA. Mxico. 827 pags.
CHRISTENSEN, Howard B. (2001). Estadistica Paso a Paso. Edit. Trillas, Mxico. 681 pags.
KOHLER, Heinz (1998). Estadstica para Negocios y Economa. Edit. CECSA, Mxico. 1051 pags.
LEVIN, Richard I. y RUBIN, David S. (1998). Estadstica para Administradores. Edit.Prentice Hall, Pearson.
Mxico. 1018 pags.

WEBSTER, Allen L.. (1998).Estadstica Aplicada a la Empresa y a la Economa. Edit. Mc. Graw-Hill. Mxico.
640 pags.

PAGINAS WEB

De los Santos Sergio, et, al: El Osio de los Santos. PhpBB Group, Barcelona Espaa, 2005(ref. de 15 de junio de 2006). Disponible
en Web: <http://www.elosiodelosantos.com/descriptiva.html>

Curso de Estadstica, Aula Fcil.Com. Aula Fcil S.L. 2000 (ref. mayo 2006) Disponible en web:
< http://www.aulafacil.com/CursoEstadistica/Lecc-27-est.htm>

You might also like