Professional Documents
Culture Documents
MÓDULO 9
PRUEBA DE HIPÓTESIS
1
Probabilidad y Estadística Módulo 9
Í NDI CE
INTRODUCCIÓN ............................................................................................................................. 4
Diagrama I ....................................................................................................................................... 13
ACTIVIDAD 1 ................................................................................................................... 17
ACTIVIDAD 2 ................................................................................................................... 19
ACTIVIDAD 3 ................................................................................................................... 21
Diagrama II ...................................................................................................................................... 23
ACTIVIDAD 4 ................................................................................................................... 25
ACTIVIDAD 5 ................................................................................................................... 27
2
Probabilidad y Estadística Módulo 9
ACTIVIDAD 6 ................................................................................................................... 29
ACTIVIDAD 7 ................................................................................................................... 32
ACTIVIDAD 8 ................................................................................................................... 37
3
Probabilidad y Estadística Módulo 9
TEST DE HIPÓTESIS
INTRODUCCIÓN
4
Probabilidad y Estadística Módulo 9
Ejemplo:
Una máquina empacadora que llena cajas de arroz responde a una distribución normal con
media 468 g. Según datos históricos del proceso, la desviación estándar de la población es de 15 g.
En este caso, el gerente de producción está preocupado por evaluar si el proceso está
funcionando o no de una manera que asegure que, en promedio, la cantidad adecuada de arroz (es
decir 468 gr.) está siendo depositada en cada caja. Para ello decide seleccionar una muestra
aleatoria de 20 cajas del proceso de empaque y examinar su peso para determinar qué tanto se
aproxima cada una de las cajas a la especificación de la compañía de 468 gramos.
El gerente espera encontrar que el proceso funciona bien, dentro de los parámetros esperados
y que, por lo tanto, no sea necesario realizar ninguna acción correctiva. Sin embargo, podría
encontrar que las cajas muestreadas pesan demasiado poco, o bien mucho y tener la duda si detiene
o no la producción para reparar o sustituir alguna parte de las máquinas.
Por esto, al analizar las diferencias entre los pesos obtenidos de la muestra y los 468 gramos
esperados, se tomará una decisión basada en la información de muestra y se llegará a una de las
siguientes conclusiones:
Definición:
El test de hipótesis es un proceso mediante el cual se trata de establecer la validez de una
hipótesis estadística. Considerando como hipótesis estadística a un supuesto formulado acerca de
una característica poblacional.
Las pruebas de hipótesis incluyen el uso de evidencia muestral para evaluar la probabilidad
de que una suposición sobre alguna característica de una población sea rechazada o no.
Respecto a la prueba que vamos a estudiar, un medio seguro de llevarla a cabo consiste en el
análisis de toda la población, pero este proceso puede ser poco práctico, costoso e incluso,
imposible. Es por ello, que utilizaremos en lugar de un censo, una muestra y con ella inferiremos
respecto de la característica poblacional en análisis.
El propósito del estadístico será entonces establecer si existe o no evidencia muestral
suficiente para rechazar la hipótesis que sometemos a prueba.
5
Probabilidad y Estadística Módulo 9
Para explicar los pasos anteriores se requiere ciertos conceptos básicos como:
La prueba de hipótesis comienza con una afirmación con respecto a un parámetro particular
θ de una población, de la cual se extrae una muestra.
En nuestro ejemplo, el gerente de producción elige como hipótesis inicial que el proceso
está bajo control, es decir que todo funciona como es de esperar y que no es necesario implementar
medias correctivas, ésto significa que el contenido promedio es de 468 gramos.
En general como hipótesis nula planteamos lo contrario de lo que esperamos demostrar. Por
ejemplo, si queremos demostrar que un método de enseñanza de programación en computación es
más eficiente que otro, damos como hipótesis que los dos son igualmente efectivos; si deseamos
demostrar que un método de irrigación de suelos es más costoso que otro, nuestra hipótesis es que
ambos son igualmente costosos. Puesto que esta hipótesis se basa en que no hay diferencia en los
métodos, la hipótesis se denomina hipótesis nula, y la denotamos con H0. Actualmente la hipótesis
nula se usa para cualquier hipótesis establecida cuya validez queremos demostrar o rechazar. La
hipótesis nula establece que el parámetro de la población θ conserva un valor especificado y que
no ha existido cambio alguno.
Definición:
Para el ejemplo que estamos presentando; nuestro gerente establecería como hipótesis nula
que el proceso de llenado está bajo control y funcionando apropiadamente, que la cantidad media
de arroz por caja es la especificación de la compañía, es decir 468 gramos.
Esto se puede simbolizar como: H 0 : µ X = 468
La metodología de la prueba de hipótesis supone que la hipótesis nula sea considerada
verdadera hasta que las evidencias indiquen que ésta es falsa.
6
Probabilidad y Estadística Módulo 9
Siempre que enunciamos una hipótesis nula también debemos especificar una hipótesis
alternativa.
Hipótesis alternativa: afirmación que será aceptada, si la evidencia muestral es suficiente
para decidir que la hipótesis nula es falsa.
La hipótesis alternativa, simbolizada con H1 , es lo opuesto a la hipótesis nula H 0 . Para el
gerente de producción de nuestro ejemplo será:
H 1 : µ X ≠ 468
Ésto indica que si el peso de las cajas muestreadas estuvieran muy por arriba o muy por
debajo del promedio 468 gramos, especificado por el fabricante, el gerente rechazaría la hipótesis
nula a favor de la hipótesis alternativa que establece que la cantidad promedio del contenido es
diferente de 468 gramos. Por consiguiente detendría la producción para tomar medidas correctivas.
La prueba de hipótesis, de este modo, puede determinar el rechazo de la hipótesis nula,
tomando como evidencia los datos muestrales. Pero ésto no nos indica que la hipótesis nula sea
falsa, sólo podemos asegurar que no la podemos aceptar basándonos en la muestra analizada.
Como los resultados son evidencia muestral y no poblacional, puede ocurrir que tomando otra
muestra la hipótesis nula resulte verdadera; ya que no trabajamos con la población entera.
Por lo antes expuesto en muchos casos no emitimos un juicio sobre la veracidad o falsedad
de la hipótesis nula, sino que, por el contrario, no emitimos juicio o nos reservamos la opinión,
diciendo que, con la evidencia muestral no encontramos pruebas para aceptar tal hipótesis.
En consecuencia, si aceptamos la hipótesis nula, lo único que podemos decir es que la
evidencia no fue insuficiente para garantizar su rechazo.
2) Nivel de significación:
Al usar una estadística de muestra para estimar un parámetro de población, existe el riesgo
de llegar a una conclusión incorrecta.
La situación en la toma de decisión que se ha descripto hasta ahora, puede resumirse en la
siguiente tabla:
Aceptar H 0 Rechazar H 0
H 0 es verdadera Decisión correcta (1 − α ) Error tipo I α
H 0 es falsa Error tipo II β Decisión correcta (1 − β )
7
Probabilidad y Estadística Módulo 9
Definición:
Definición:
Valor crítico: valor de la estadística de prueba que señala el punto divisorio entre la región
de rechazo y la de aceptación de la hipótesis nula.
8
Probabilidad y Estadística Módulo 9
Zona de aceptación
Continuando con nuestro ejemplo director del aprendizaje, decimos que el gerente de
producción ha establecido como hipótesis nula que la cantidad promedio de arroz por caja, de todo
el proceso de llenado, es de 468 gramos. Luego toma una muestra de cajas, pesa cada una y calcula
la media de la muestra. Recordemos que una estadística obtenida de una muestra es una estimación
del parámetro correspondiente de la población de la cual se tomó la muestra y es probable que
difiera del valor real del parámetro debido al azar de muestreo. Además, si la hipótesis nula fuera
verdadera la estadística de muestra no necesariamente tendría que ser igual al correspondiente
parámetro poblacional.
Si, por ejemplo, el promedio de la muestra fuera de 467,6 gramos, nos inclinaríamos a
pensar que el proceso tiene realmente una media de 468 gramos, según lo especificado por el
fabricante ( µ X = 468 gramos). Intuimos que la hipótesis nula es verdadera.
Si, por el contrario, la muestra tiene un peso promedio de 420 gramos, se no ocurriría pensar
que el promedio del proceso sí ha cambiado y que algo está fuera de control, es decir que debemos
investigar e introducir medidas correctivas. Es decir, que intuimos que la hipótesis nula no se
verifica o es improbable que sea verdadera ( µ X ≠ 468 gramos). En estas circunstancias
rechazaríamos la hipótesis nula.
Esta forma tan subjetiva de tomar una decisión no es la recomendable pues sería algo
arbitrario que cada individuo considera como “muy cercano” o “muy diferente”.
La metodología de prueba de hipótesis proporciona valores cuantificables para la toma de
decisión, y esto se logra, primero, determinando la distribución de muestreo de la estadística de
muestra (es decir de la media de la muestra, en el ejemplo en cuestión) y luego, calculando la
9
Probabilidad y Estadística Módulo 9
estadística de prueba particular, basándose en el resultado obtenido de la muestra. Como la
distribución de muestreo de la estadística de prueba, generalmente, sigue una distribución bien
conocida, como la normal o la t de Student, podemos usar estas distribuciones para determinar la
probabilidad de que una hipótesis nula sea verdadera.
Definición:
Valor estadístico de prueba: valor obtenido a partir de la información muestral, que se utiliza
para determinar si se rechaza o no la hipótesis nula.
Según si se desea hacer inferencia sobre media o sobre varianza, si la muestra es grande o
pequeña, si se conoce o no la varianza poblacional, existen distintas formas de calcular dicha
estadística de prueba.
X − µX 467,6 - 468
Para el ejemplo es ZP = = = − 0,12
σX 15
n 20
Para el ejemplo, como − 1,96 ≤ ZP ≤ 1,96 , la evidencia brindada por esta muestra de 20 cajas
con un peso promedio de 467,6 no permite rechazar la hipótesis nula.
10
Probabilidad y Estadística Módulo 9
Para el ejemplo director de este tema, con X = 467,6 gramos hallamos ZP = − 0,12 . Para
encontrar la probabilidad de obtener una estadística de prueba ZP que sea más exacta que – 0,12
trabajando con una prueba bilateral, es necesario calcular la probabilidad de hallar un valor de Z
mayor o igual que 0,12 junto con la probabilidad de hallar un ZP menor o igual que – 0,12.
P ( ZP ≥ 0,12) = 0, 4522
Dada la simetría de la distribución normal el p-valor es
P ( Z P ≥ 0,12 ∨ ZP ≤− 0,12) = 2 . 0, 4522 = 0,90
Por ser este valor mayor que el α seleccionado 0,05; la hipótesis nula no es rechazada.
TIPOS DE PRUEBAS
Se pueden presentar tres tipos de test de hipótesis que son:
• Bilateral
El investigador desea comprobar la hipótesis de un cambio en el parámetro. El nivel de
significancia se divide en dos y existen dos regiones de rechazo, cada una de ellas con una
α
probabilidad de % . Estas regiones de rechazo se consideran repartidas en ambas colas de la
2
distribución.
H 0 : µ X = µ 0
Las hipótesis serán:
H 1 : µ X ≠ µ 0
• Unilateral Derecho
El investigador desea comprobar la hipótesis de un aumento en el parámetro, en este caso el
nivel de significancia se considera concentrado todo en la cola derecha de la distribución. Esto
implica que la zona de rechazo se ubica en el extremo derecho.
H 0 : µ X ≤ µ 0
Las hipótesis serán:
H 1 : µ X > µ 0
11
Probabilidad y Estadística Módulo 9
• Unilateral Izquierdo
El investigador desea comprobar la hipótesis de una disminución en el parámetro, en este
caso el nivel de significancia se considera concentrado todo en la cola izquierda de la distribución.
Esto implica que la zona de rechazo se ubica en el extremo izquierdo.
H 0 : µ X ≥ µ 0
Las hipótesis serán:
H 1 : µ X < µ 0
Este proceso está resumido en los diagramas de decisión I y II. Basaremos nuestro
razonamiento en ejemplos y resolveremos actividades que nos permitan aclarar el uso de las
estadísticas de prueba y la toma de decisión.
12
Probabilidad y Estadística Módulo 9
DIAGRAMA I
Población normal
Sí σX No
¿Conocida?
X − µX
Zp =
σX
Sí No
n n ≥ 30
X − µX X − µX
Zp = =
s ˆs
n −1 n X −µX
tα =
;n−1 s
2
n −1
X − µX X − µX
La estadística de prueba será: ZP = =
σX σX
n
13
Probabilidad y Estadística Módulo 9
Comparamos luego la estadística de prueba hallada con el valor crítico Zc , sacado de tabla
normal estándar, para determinar si la misma cae dentro de la zona de aceptación o en la zona de
rechazo de la hipótesis nula para el nivel de significación elegido.
Como aplicación para este caso se puede regresar a la pregunta de interés para el gerente de
producción de la planta de empaque de arroz, problema presentado desde el comienzo del módulo
en el cual conocemos la desviación estándar poblacional y la población tiene una distribución
normal.
Ejemplo:
Él desea determinar si el proceso de llenado de las cajas está bajo control o no, es decir, si el
contenido promedio por caja en todo el proceso seguía siendo de 468 gramos como está
especificado o si se deben introducir medidas correctivas.
Para estudiar la situación se planea tomar una muestra aleatoria de 20 cajas, pesar cada caja
y evaluar la diferencia entre la estadística de la muestra y el supuesto parámetro poblacional.
H 0 : µ X = µ0 H 0 : µ X = 468
En este caso la hipótesis nula es
H1 : µ X ≠ µ0 H1 : µ X ≠ 468
y la alternativa es
Si suponemos que la desviación estándar, σ X , es conocida y que la distribución de la
población es normal, entonces, basándose en el teorema del límite central, la distribución de
muestreo de la media debería tener una distribución normal y la estadística de prueba Z es:
X − µX
ZP =
σX
n
472,5 − 468
Zp = = +1,34
15
20
14
Probabilidad y Estadística Módulo 9
Como Z está dentro de la zona de aceptación, pues − 1,96 < + 1,34 < + 1,96 , nuestra decisión
es no rechazar H 0 . Llegamos a la conclusión de que la cantidad promedio de contenido es de 468
gramos. Decimos que “no hay evidencia de que el contenido promedio sea diferente a 468
gramos”.
¿Estamos ahora en condiciones de resolver el mismo problema con los siguientes datos?
a) El nivel de significación o probabilidad de un error tipo I, es del 10 %.
b) El nivel de confianza es de 99%.
c) La muestra es de 30 cajas.
d) La varianza de la población, dada por la fábrica, es 215 unidades de varianza.
Rta: en todos los casos se acepta H .
0
Ejemplo:
Tomamos una muestra de 35 ladrillos para determinar la conductividad térmica del material.
Según información del fabricante la conductividad térmica promedio es de 0,34 W/m.ºK y la
desviación estándar es de 0,010 W/m.ºK. Realizamos un ensayo y tenemos que
X = 0,343 W/m.ºK . ¿Se acepta o se rechaza la afirmación del fabricante, con un nivel de
confianza del 95%?
µ X = 0,34 X = 0,343 n = 35
1. H 0 : µ X = 0, 34 H1 : µ X ≠ 0,34
2. α = 0, 05 Z = 1, 96
X − µX 0,343 − 0, 34
3. Z P = = = 1, 77 como 1,77 < 1,96 la estadística de prueba cae en la zona
σX 0, 010
35
de aceptación. Por esto no rechazamos la hipótesis nula y puede decirse con un 95% de
confianza que el fabricante tiene razón.
15
Probabilidad y Estadística Módulo 9
Para el caso en el que la muestra se extrae de una población finita el estadístico de prueba es:
X − µX
ZP =
σX N −n
.
n N −1
Ejemplo:
1. H 0 : µ X = 0, 34 H1 : µ X ≠ 0,34
2. α = 0, 05 Z = 1, 96
X − µX 0,343 − 0,34
3. Z P = = = 1,84 como 1,84 < 1,96 la estadística de prueba se
σ X N − n 0, 010 500 − 35
. .
n N −1 35 500 − 1
ubica en la zona de aceptación. Por esto no rechazamos la hipótesis nula y a partir de la
evidencia muestral podemos decir que el fabricante está en lo cierto.
16
Probabilidad y Estadística Módulo 9
ACTIVIDAD 1
1) En una fábrica que enlata tomates se desea verificar que las latas resultan en
promedio con un peso de 1 kilogramo. Se conoce que el tamaño de los tomates
introduce una variación en los pesos de las latas de manera que estos se distribuyen
normalmente con una desviación estándar del 8%. Se selecciona una muestra de
100 latas en las que resulta el peso promedio 980 gramos. ¿Podemos aceptar la
afirmación de que el peso promedio es de 1 kg. para un riesgo del 5%?
2) La empresa “New Time” fabrica diversos modelos de muebles de jardín en las
diversas plantas de nuestro país. La producción semanal de reposeras modelo R101
en la planta de Santa Rosa se distribuye normalmente con una media de 120 y una
desviación estándar de 9. Recientemente, debido a la expansión del mercado y a la
temporada se han incorporado nuevos métodos de producción. El jefe de
producción desea saber si el número medio de reposeras producidos en dicha
planta ha variado, es decir si es diferente de 120, con un nivel de significancia de
0,01; si una muestra de 50 semanas de producción arroja un número medio de
123,4 reposeras. ¿Vale la pena invertir en el nuevo sistema productivo o la
diferencia se debe solamente al azar?
3) En un problema de decisión se han planteado las siguientes hipótesis:
H 0 : µ X = 60 y H1 : µ X ≠ 60 . La media muestral es 59, y el tamaño de la
muestra es 36. La desviación estándar de población es 6,2 y el nivel de
significancia es del 5%. Responder:
a) ¿Cuánto vale la magnitud de la estadística de prueba?
b) ¿Cuál es su decisión respecto de H 0 ?
4) a) Una máquina expendedora de café se programa de modo que la cantidad de café
que sirva se distribuye en forma aproximadamente normal con media 100 mililitros
y una desviación estándar de 5 mililitros. La máquina se verifica periódicamente
tomando una muestra de 15 vasos resultando en esta ocasión una media muestral
X = 97, 6 ml. ¿Está la máquina fuera de control o está funcionando correctamente
si el nivel de riesgo es del 5%?
b) ¿Cuál sería tu respuesta si te informan que los 15 vasos son seleccionados
aleatoriamente de los 200 despachados períodicamente por la máquina?
5) Se desea analizar la evolución de los precios en el mercado de hacienda. El mes
pasado el precio promedio por kilo vivo de novillos fue de $8 con una desviación
estándar de $0,4. Un periódico asegura que los precios promedios han variado este
mes respecto al anterior. Se seleccionó una muestra de 40 ventas, la que arrojó un
precio medio de $9,50 por kilo vivo. Si los precios se distribuyen normalmente, ¿el
periodismo tiene o no razón, con un nivel de significación del 0,01?
6) Una empresa eléctrica fabrica elementos con una duración que se distribuye en
forma aproximadamente normal con una media de 800 horas y una desviación
estándar de 40 horas. Si una muestra aleatoria de 30 de tales elementos tiene una
duración promedio de 788 horas ¿muestran los datos suficiente evidencia para
decir que la duración media ha cambiado, con un nivel de significancia del 5%?
Responder empleando el método del p-valor.
17
Probabilidad y Estadística Módulo 9
7) Un taladro produce agujeros cuyos diámetros siguen una distribución normal con
media 2 cm y desviación típica 0.06 cm. Para verificar su correcto funcionamiento
se miden aleatoriamente nueve taladros, con un diámetro medio de 1.95 cm.
Realiza un contraste bilateral para un nivel de significación del 5% utilizando el
método del p-valor.
Para asegurar una hipótesis acerca de una población infinita con esas características se
X − µX
trabaja con la estadística de prueba ZP = con s, desviación estándar de la muestra o
s
n −1
X −µX
ZP = con ŝ , la desviación estándar corregida de la muestra, para estimar σ X .
ŝ
n
X − µX
ZP =
s N −n
.
n −1 N −1
18
Probabilidad y Estadística Módulo 9
ACTIVIDAD 2
1) Una muestra de los pesos de 35 plantas en una estación experimental dio un peso
medio de 50 gramos y una desviación típica de 8 grs. Sabiéndose que la VA “peso
de una planta” tiene una distribución normal de probabilidades con µ X = 54
gramos, determinar para un nivel de confianza del 90% si la muestra permite o no
aceptar tal afirmación.
2) Un nutricionista, especialista en nutrición animal desea probar si el contenido
vitamínico promedio de cierto alimento balanceado es de 18 mg como indica el
paquete. Toma una muestra de 45 paquetes del alimento y determina que el
contenido promedio de vitaminas es de 12 mg con una desviación estándar de 2 mg.
¿Está de acuerdo con lo indicado en el paquete para un nivel de significación del
5%?
3) Una empresa eléctrica fabrica focos cuya duración se distribuye en forma
aproximadamente normal con una media de 2.800 horas. Pruebe esta hipótesis si una
muestra de 30 focos tiene una duración promedio de 1.788 horas con una desviación
estándar de 40 horas. Use un nivel de significación de 4%.
4) Un científico está interesado en vigilar el consumo de lácteos en 700 adultos
varones, ya que sospecha que el nivel del mismo no es el deseado, siendo éste de
800 ml diarios. Eligió una muestra de 50 adultos varones y encontró que la ingesta
promedio diaria es de 756 ml con una desviación estándar de 35 ml por día. Con
esta información y con un riesgo del 5%, se podría asegurar que la ingesta de
productos lácteos en varones adultos, no es la deseable?
5) Según la FEDEFUT, el peso promedio de un jugador nuevo de la Liga Nacional de
Fútbol es de 168. Ahora, la nutricionista del equipo XYZ piensa que el peso
promedio del equipo XYZ es diferente que 168. Como se están haciendo
incorporaciones, escoge una muestra aleatoria del peso de 40 candidatos y se obtuvo
que el peso promedio es de 166,5 y la desviación típica 23. Sabiendo que el peso es
una variable normal, ¿tiene razón el nutricionista, con un nivel de significancia del
1%? Responder empleando el método del p-valor.
6) Una línea de producción funciona con un peso de llenado de 16 gr por envase. De
acuerdo con datos anteriores, se sabe que el peso sigue una distribución normal. El
exceso o defecto de peso en el llenado son problemas graves, y la línea de
producción debe parar si se presenta alguno de ellos. Un inspector de calidad toma
una muestra de 30 artículos y de acuerdo con los resultados toma la decisión de
parar la línea o dejarla trabajando. Para un nivel de significación del 5%, si se
encuentra que el peso promedio es 16.32 y la desviación estándar es de 0.8 ¿qué
acción recomendarías? Responder empleando el método del p-valor.
19
Probabilidad y Estadística Módulo 9
X − µX
La estadística de prueba tiene la forma: t P = y el valor crítico tc se extrae de la
s
n −1
tabla de la curva t, donde t es la distribución t de Student con ( n − 1) GL.
Ejemplo:
20
Probabilidad y Estadística Módulo 9
Para una muestra seleccionada de una población finita el estadístico de prueba es:
X − µX
tP =
s N −n
.
n −1 N −1
ACTIVIDAD 3
21
Probabilidad y Estadística Módulo 9
22
Probabilidad y Estadística Módulo 9
DIAGRAMA II
Población no normal
Sí σX No
¿Conocida?
Sí No
n ≥ 30
Sí No
n ≥ 30
X − µX
Zp =
σX
n X − µX
Zp =
s
n −1
X − µX ¿?
Kp =
σX
n
X − µX
ZP =
σX
n
23
Probabilidad y Estadística Módulo 9
Comparamos luego la estadística de prueba hallada con el valor crítico Zc sacado de tabla
para determinar si la misma queda dentro de la zona de aceptación o en la zona de rechazo de la
hipótesis nula para el nivel de significación elegido.
Ejemplo:
Un fabricante de esquís asegura que la fuerza media para soltar sus ataduras es de 2.700
gramos. Si las ataduras resisten menos es riesgoso para el esquiador pues pueden fallar durante su
carrera en la nieve y soltarse los esquís; si resisten más es dificultoso desatarlos para aquellas
personas que no tienen fuerza suficiente en sus manos. Un almacén de esquís en los Alpes decide
renovar su equipamiento y está interesado en comprar esa marca. Para verificar lo que el fabricante
dice toma una muestra de 40 esquís y encuentra que la fuerza media para soltarse es de 60 gramos.
Por historia del proceso productivo se sabe que la desviación estándar poblacional es de 226
gramos. ¿Qué aconsejaría Ud. al almacén con un nivel de significación del 5%?
Para encontrar el valor de Z que corresponde a esta zona de rechazo debemos buscar en la
tabla la probabilidad 0,975, (es decir que el área bajo la curva normal, a la izquierda del Z buscado
es del 97,5%) lo que nos indica que Z = 1,96. Esto significa que los valores críticos que separan a
la región de rechazo de la de no rechazo son +1,96 y -1,96.
2760 − 2700
La estadística de prueba es : Z P = = + 1, 679
226
40
Como Z P < Zc se acepta la hipótesis nula o decimos que esta muestra no presenta evidencia
suficiente para rechazar la hipótesis nula y por lo tanto la sostenemos.
24
Probabilidad y Estadística Módulo 9
X − µX
ZP =
σX N −n
.
n N −1
ACTIVIDAD 4
1) Una empresa transportista sabe que el consumo medio de combustible de
sus camiones semanalmente es de 120.000 litros con un desvío estándar
de 3200 litros. En el último año el propietario de la compañía ha
comprado unidades nuevas, ha notado un cambio en dicho consumo y
desea verificar si realmente el servicio ha cambiado o si dicha variación se
debe al azar. Toma una muestra de 30 semanas y obtiene un consumo de
118.325 litros en promedio. ¿Qué opina Ud., el propietario está en lo
cierto al asegurar que el servicio es diferente? Resuelva la cuestión con
un 5% y 1% de nivel de significación.
2) Los investigadores de un laboratorio están trabajando sobre la
concentración de cierta enzima en una población de microorganismos. Se
preguntan: ¿puede decirse que la concentración media de la enzima en
esta población es distinta de 25 unidades al 5% de nivel de significación?
Se extrae una muestra de 35 individuos y de ella se ha calculado que la
X es de 22 unidades y de estudios anteriores se sabe que la varianza
poblacional es de 45 unidades. ¿Cuál será la repuesta de los
investigadores?
3) Un empresario desea comprar una lavandería en una gran ciudad. El
dueño actual de la lavandería afirma que en los últimos cuatro años se han
lavado diariamente, en promedio, 23 kilogramos de ropa en una jornada
corrida de 12 horas, con una desviación estándar poblacional de 2,1
kilogramos. El potencial comprador quiere verificar tal afirmación y para
ello toma una muestra de 60 jornadas lavándose en ese tiempo, en
promedio 19 kilogramos. Si seleccionamos un nivel de significancia del
5% ¿Cuál es la decisión del comprador?
25
Probabilidad y Estadística Módulo 9
X −µX 1
La estadística de prueba es KP = y el valor crítico es K c = .
σX α
n
26
Probabilidad y Estadística Módulo 9
X − µX
KP =
σX N −n
.
n N −1
ACTIVIDAD 5
27
Probabilidad y Estadística Módulo 9
X −µX
ZP =
s
n −1
X −µX
ZP =
s N −n
.
n −1 N −1
28
Probabilidad y Estadística Módulo 9
ACTIVIDAD 6
1) Se desea saber si la media de cierta población es 5.800. Para ello se seleccionaron
al azar 285 elementos obteniéndose una media muestral de 5.740 y una desviación
estándar de 170. Realizar la prueba para un nivel de significación de 1%.
2) La producción media de lana, en cierta zona del país es de 3,5 kg. por cabeza, para
ovejas de la raza Corriedale. Un exportador de lana desea saber si la producción
media está realmente en ese valor pues, si disminuye pierde dinero y si aumenta en
exceso tendrá que buscar nuevos mercados. Para verificar la hipótesis toma una
muestra de 60 animales con similares características obteniéndose un rendimiento
medio de 4,2 kg. con un desvío típico de 0,78 kg. ¿Con un nivel de significación
del 2% puede aceptar lo que dicen los productores?
3) La duración de la enfermedad de Alzheimer desde el inicio de los síntomas hasta la
muerte tiene un promedio de 10 años. En un centro médico se seleccionan de 400
expedientes a los de 30 pacientes que murieron de Alzheimer y se obtiene que la
duración media fue de 7 años con una desviación estándar de 3 años. Los
investigadores sostienen con un 95% de confianza, que este promedio ha variado.
¿es cierta esta afirmación?
4) Se desea saber si la media de cierta población es 5.800. Para ello se seleccionaron
al azar 285 elementos obteniéndose una media muestral de 5.740 y una desviación
estándar de 170. Realizar la prueba con el método del p-valor, para un nivel de
significación de 1%.
5) En un proceso de fabricación de placas de silicio cubiertas con tungsteno la
resistencia objetivo para una placa es de 85m Ω. En una muestra aleatoria
simple de 50 placas, la media de la resistencia de la muestra era de 84.8 de m Ω
y la desviación estándar 0.5 m Ω.
Un ingeniero de control de calidad prueba que H 0 : µ x = 85 H1 : µ x ≠ 85
a) Determine el p-valor.
b) ¿Prueba si la media esté en el objetivo o ha cambiado, con un nivel de
significancia del 5%?
Nuevamente no tenemos forma de realizar estimaciones en este caso, de la misma forma que
lo planteado al ver intervalos de confianza.
29
Probabilidad y Estadística Módulo 9
30
Probabilidad y Estadística Módulo 9
Ejemplo 1:
X − µX 27.468 − 28.000
3. Z = = = − 2,52 como – 2,52 < - 2,33 la estadística de prueba cae en
σX 1348
40
la zona de rechazo. Por esto rechazamos la hipótesis nula o decimos que no hay evidencia para
aceptar la hipótesis nula.
Ejemplo 2:
Las especificaciones para cierto listón imponen una resistencia a la rotura media de 180 kg.
Si 5 piezas, tomadas de una pila de madera de 200 piezas, tienen una resistencia media de 169,5 kg
con s = 5,7 kg. ¿Puede tomarse cómo válida la especificación?
31
Probabilidad y Estadística Módulo 9
Ejemplo 3:
Si los listones del ejemplo anterior son extraídos de una pila de madera de 30 piezas, ¿Varía
en algo la decisión?
La especificación no es cierta.
Se observa en este ejemplo la incidencia del tamaño del lote en una prueba. Si la muestra
(5 piezas) es pequeña con respecto al tamaño del lote la incidencia del coeficiente de corrección es
prácticamente nula. Si la muestra es grande frente al tamaño del lote, cobra importancia.
ACTIVIDAD 7
1) Se desea estudiar la evolución de los precios en el mercado de hacienda. La
semana pasada el precio promedio por kilo vivo de novillos fue de $$5,34 con una
desviación estándar de $0,33. Según los expertos, el precio promedio de esta
semana ha aumentado respecto a la anterior. Para corroborarlo se sacó una muestra
de 40 ventas, la que dio un precio promedio de $5,70 por kilo vivo. Si los precios
siguen una distribución normal, ¿se puede decir que los periodistas tienen razón,
con un nivel de significación del 1%?
2) El tiempo que tardan los pollos en alcanzar su peso comercial, es una variable
aleatoria normal con media 50 días y desviación estándar 2 días. Este tiempo es
considerado excesivo para las exigencias modernas y para tratar de disminuirlo se
ensaya una nueva dieta en un conjunto de 25 pollos, seleccionados de un galpón de
400 pollos. El tiempo medio que tardaron éstos en engordar fue de 43 días. ¿Cree
que la nueva dieta ha dado resultado, con un nivel de significación del 3%?
32
Probabilidad y Estadística Módulo 9
5) Una encuesta realizada a estudiantes del ciclo medio reveló que los jóvenes miran,
en promedio, 7,5 videos musicales por mes. Una muestra de 35 alumnos
universitarios dio como resultado que los mismos habían visto el mes pasado 6.9
videos con una desviación estándar de 0,5. Para el nivel de significación del 2%.
¿puede decirse que los estudiantes universitarios miran menos videos al mes que
los de enseñanza media?
8) Un colegio bilingüe desea organizar un curso de apoyo para sus estudiantes que
deseen rendir el examen anual final de los tres primeros niveles de la London
University. El año pasado el tiempo promedio de preparación de tal examen fue de
68 días hábiles. Para este año, seleccionaron una muestra de 8 estudiantes
obteniéndose: 64, 55, 58, 72, 70, 63, 56, 71 días. ¿Son los estudiantes del presente
año mejores que los del año pasado para un α = 1% ?
33
Probabilidad y Estadística Módulo 9
34
Probabilidad y Estadística Módulo 9
a) Establezca una estimación del contenido promedio de crema de todos los potes de 200 ml
que se fabrican con una confianza del 99%.
b) Basándose en los resultados obtenidos, ¿cree Ud. que son necesarias medias correctivas
al proceso de llenado de las cremas de enjuague?
c) Hay evidencia de que la cantidad promedio de crema de enjuague es diferente de 200
ml? (Utilice un nivel de significación del 1% y del 5%?
d) Al nivel de significación del 1%, ¿existe evidencia de que la cantidad promedio de crema
es menor que 200 ml?
e) Explique las diferencias entre los incisos a), c) y d) del presente ejercicio.
f) Constaste nuevamente las preguntas si los frascos fueron extraídos de un lote de 600
unidades?
Rtas: a) 195,94 ≤ µ ≤ 203,96 ; b) No ; c) No existe evidencia. : d) Se acepta H .
X 0
la hipótesis alternativa σ X2 ≠ σ 02 .
Pruebas como estas son importantes para cuando se desea controlar la uniformidad de un
producto u operación.
2 ( n − 1) s 2
La estadística de prueba que consideramos es: χ = ya que basamos estas
σ 02
pruebas en el hecho de que para muestras aleatorias de una población normal con varianza σ 02 es
una variable aleatoria con distribución ji cuadrado con n-1 grados de libertad.
Ejemplo:
Supongamos que un disco de silicio será cortado en pequeños cubos o dados para ser usados
en al manufactura de un dispositivo semiconductor. Como ciertas características eléctricas del
dispositivo terminado pueden depender del grosor del dado, es importante que todos los dados
cortados de un disco de silicio tengan aproximadamente el mismo grosor. La variación del grosor
de un disco debe responder a las especificaciones del fabricante de un punto a otro del disco.
El proceso de alisado que se usa para pulir ciertos discos de silicio a fin de que su grosor sea
el apropiado sólo es aceptable si σ , la desviación estándar de la población del grosor de dados
cortados de los discos, es como máximo de 0,50 milésima de pulgadas. Si usamos un nivel de
35
Probabilidad y Estadística Módulo 9
significación de 0,05 para probar la hipótesis nula σ X ≤ σ 0 , o sea σ X ≤ 0,50 contra la hipótesis
alternativa σ X > 0, 50 . Si ensayamos una muestra de 15 dados cortados de esos discos y tenemos
una desviación estándar de 0,64 milésimas de pulgadas resulta:
Ejemplo:
La desviación estándar de las piezas fabricadas por una máquina es de 5 mm. Existe la
posibilidad de comprar una máquina similar, más moderna y con un desvío estándar notablemente
menor, según el importador. Sin embargo, antes de emprender la compra se solicitó permiso al
importador para fabricar como prueba 10 piezas, las que finalmente brindaron una varianza de
18,46 mm2. Utilizando una probabilidad de incurrir en un error tipo I del 10% determinar si es
verdad la afirmación del importador.
Se trata, en este caso, de comprobar si el desvío estándar es notablemente menor como
afirma el importador, por lo tanto el parámetro a testear es el desvío poblacional.
1. Planteamos la hipótesis nula : H0 : σ ≥ 5
y la hipótesis alternativa: H1 : σ < 5
2. Nivel de significación : α = 0,10
36
Probabilidad y Estadística Módulo 9
Como 6,646 > 4,168 la estadística de prueba cae en la zona de aceptación de la hipótesis
nula, por lo que no existe evidencia para rechazarla y podemos decir que ambas máquinas tienen
igual desviación estándar. Por ello podemos suponer que el desvío de la nueva máquina no es
notablemente menor como afirma el importador. ¿Está de acuerdo con esto?
ACTIVIDAD 8
37
Probabilidad y Estadística Módulo 9
ACTIVIDAD DE REPASO
1) El director de manufactura de una fábrica de telas necesita determinar si una
nueva máquina está produciendo un tipo particular de tela según las
especificaciones del fabricante, que indican que la resistencia de rotura debe ser
de 70 libras con una desviación estándar de 3,5 libras. Con una muestra de 36
piezas se obtuvo una media de muestra de 69,7 libras. ¿Existe evidencia de que la
máquina no está cumpliendo con las especificaciones del fabricante? ( α = 5% )
2) Suponga que se sabe que los resultados de una prueba de aptitudes, usada para
determinar la admisión a una universidad, están distribuidos normalmente, con
una media de población de 500 y una desviación estándar de 100. Si una muestra
de 12 solicitantes a ingresar a la universidad tiene una media de muestra de 537,
¿existe evidencia de que el resultado medio es diferente de la media esperada de
todos los aspirantes? (Use un nivel de significación de 0,01)
3) Un fabricante de equipos deportivos desarrolla una nueva cuerda sintética que
afirma tiene una resistencia media a la tracción de 8 kilogramos con una
desviación estándar de 0,5 kilogramos. Si se prueba una muestra de 50 cuerdas,
extraídas de un lote de 500, y se encuentra que tiene una resistencia media a la
tracción de 7,8 kilogramos, ¿está de acuerdo con el fabricante para un nivel de
significación de 0,01?
4) Se afirma que un automóvil se maneja en promedio más de 20.000 km por año.
Para probar ésto, se pide a una muestra de 100 propietarios de automóviles que
lleven un registro de los kilómetros que viajan. ¿Está de acuerdo con esta
afirmación si la muestra aleatoria da un promedio de 23.500 kilómetros y una
desviación estándar de 3.900 kilómetros? ( α = 1% )
5) Se quiere estimar el peso promedio de los vacunos del mercado de Liniers. Un
estudio cuarenta vacunos mostró que la desviación estándar de sus pesos es de
12.2 kilogramos. ¿Qué tan grande debe ser una muestra para que con un 95% de
confianza se tenga un error de estimación de como máximo de 4 kilogramos?
6) Una empresa eléctrica fabrica luminarias que tienen una duración
aproximadamente normal con una desviación estándar de 40 horas. ¿De qué
tamaño se necesita una muestra si se desea tener 99% de confianza de que la
media real esté dentro de 10 horas de la media muestral? ¿Qué pasaría si en lugar
de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?
7) La compañía eléctrica publica cifras de la cantidad anual de Kilowatt-hora que
gastan los aparatos electrodomésticos. Se afirma que una aspiradora gasta un
promedio de 44 kw/h al año. Si una muestra aleatoria de 15 hogares que se
incluyen en un estudio exploratorio en un barrio de 100 viviendas, indica que las
aspiradoras gastan un promedio de 40 kw/h al año con una desviación estándar de
12,5 kw/h, ¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras
gastan, en promedio, menos de 44 kw/h anualmente? Suponga que la población de
kilowatt-hora es normal.
8) Una compañía que produce una parte maquinada para un motor, afirma que tiene
una varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de
10 de dichas partes dio una varianza de muestra s2 = 0.0003. Si se supone que las
medidas del diámetro se distribuyen en forma normal, ¿hay evidencia para refutar
lo que afirma el proveedor? Use α = 5% .
38
Probabilidad y Estadística Módulo 9
Respuestas a ejercicios
ACTIVIDAD 1
ACTIVIDAD 2
ACTIVIDAD 3
ACTIVIDAD 4
39
Probabilidad y Estadística Módulo 9
ACTIVIDAD 5
ACTIVIDAD 6
ACTIVIDAD 7
40
Probabilidad y Estadística Módulo 9
ACTIVIDAD 8
1) χ 2 = 16 y χ 9;0.05
2
= 16.919 2) χ 2 = 42.36 y χ 24;0.05
2
= 36.415
Se acepta Hip. Nula Se rechaza Hip. Nula
6) Sí, la evidencia muestral permite decir que la varianza de las calificaciones difiere de la
varianza histórica.
7) Se respeta la especificación poblacional.
ACTIVIDAD DE REPASO
41