You are on page 1of 143

Test (Docimasia, Contraste,

Prueba) de Hiptesis

Estadstica Aplicada 2017-1


Danielmavila@yahoo.es
Inferencia estadstica

Dado una conjunto de N elementos (denominado poblacin)


donde cada elemento est identificado por un ndice k y tiene
asociado un atributo numrico de valor xk:
Si dispusiramos de todos los valores xk (censo), podramos
calcular ciertos parmetros como la media o la varianza de
la poblacin.

Obtener todos los valores xk es muy costoso. Entonces


tratamos de inferir el valor de ciertos parmetros de la
poblacin a partir de n valores de xk (una muestra de tamao n).
Inferencia estadstica

Existen tres tcnicas bsicas dentro de la inferencia estadstica


clsica:

1. Estimacin puntual.
2. Estimacin por intervalos.
3. Test de hiptesis.

Dichas tcnicas nos ayudarn en nuestro objetivo ltimo, el


cual es obtener conclusiones sobre determinados parmetros
poblacionales (valores fijos y nicos).
Estimacin puntual
Ejemplo. Sean X1, X2, ..., Xn una muestra aleatoria de tamao n,
obtenida de una poblacin donde E(Xi) = y V(Xi) = 2. Se definen
como las siguientes expresiones:
1 = X1; 2 = (X1 + X2); 3 = (X1 + 2X5); 4 = X,
Cul estimador recomendaras?
Solucin:
Se determinar el sesgo y la eficiencia de los estimadores.
a) Analizando el sesgo
E(1) = E(X1) =
E(2) = E((X1 + X2)) = E((X1 + X2) = ( + ) =
E(3) = E( (X1 + 2X5)) = ( + 2) = 3/2
E(4) = E(X) =
Como el estimador 3 es diferente de la media poblacional, se
concluye que 3 es sesgado y el resto son estimadores
insesgados de la media poblacional
Estimacin puntual...

b) Para analizar la eficiencia, calculamos la varianza de cada


estimador, recordando la proposicin V(aX + b) = a2V(X):
V(1) = V(X1) = 2.
V(2) = V((X1 + X2)) = (2 + 2) = (2 )
V(3) = V( (X1 + 2X5)) = (2 + 4 2) = 5/4(2)
V(4) = V(X) = 2 /n
Respuesta:
4 es el mejor estimador dado que tiene mnima varianza
(eficiente) si n es mayor que 2, siendo adems insesgado.
Qu es una hiptesis?

Hiptesis: Es una suposicin acerca del valor de un parmetro de


una poblacin con el propsito de discutir su validez.
Ejemplos de hiptesis acerca de un parmetro de una poblacin:
El tiempo promedio de estacionamiento de los clientes de la
Inmobiliaria Arte/Facto no es mayor a 80 minutos.
La proporcin de compras por internet de la empresa Me Llega al
Twitter, no ha cambiado, se mantiene en 10%.

Qu es una prueba de hiptesis?


Es un procedimiento, basado en la evidencia de la muestra y en la
teora de las probabilidades, usado para determinar si la hiptesis es
una afirmacin razonable y debera no ser rechazada o si no es
razonable debera ser rechazada
Definiciones
Hiptesis nula (H0): Una afirmacin acerca del valor de un parmetro de la
poblacin. Es la afirmacin de que todo sigue igual, no ocurre nada extrao que
prcticamente lo invita a desafiar su veracidad. En la filosofa de una prueba de
hiptesis, se supone que la hiptesis nula es verdadera a menos que tengamos una
evidencia estadstica abrumadora de lo contrario. En otras palabras, tiene el
beneficio de la duda.

Hiptesis alternativa (H1; (Ha): Una afirmacin que es aceptada si la muestra


provee la evidencia de que la hiptesis nula es falsa.

Nivel de significacin de la prueba de hiptesis (): La probabilidad de rechazar


la hiptesis nula cuando en realidad es verdadera.

Error tipo I (): Rechazar la H0 cuando en realidad es verdadera. El nmero ,


llamado nivel de significacin, puede fijarse dependiendo de la importancia que le
demos al error tipo I. Los valores ms comunes son = 0,1; 0,05; 0,01 y 0,001.
indica la fuerza con la que se rechaza Ho, pudindose fijar el valor que se quiera.

As, si rechazamos Ho para = 0,1 ser menos significativo que si rechazamos Ho


para a = 0,001. Recprocamente, si = 0,001 es ms fcil que aceptemos Ho (por
ser fuerza de rechazo menor) que si = 0,1; Por tanto, la aceptacin de la
hiptesis nula no debe verse como una demostracin de que sta es cierta, sino
como que no se dispone de pruebas suficientes que demuestren su falsedad.
Definiciones

Error tipo II (): Aceptar la hiptesis nula


cuando en realidad es falsa.

Estadstico de prueba: Es un valor,


determinado a partir de la informacin de la
muestra, usado para decidir si rechazar o no la
hiptesis nula.

Valor crtico: El punto que divide la regin


entre el lugar en el que la hiptesis nula es
rechazada y la regin donde la hiptesis nula es
no rechazada.
Pasos de una prueba de hiptesis
Hiptesis nula bilateral ( = 0)

r a l i t r b u i o n : m = 0 , s2 = 1

Distribucin de muestreo para la estadstica z


dos colas- Nivel de significacin 0.05
0 . 4

0 . 3

0.95 probabilidad

0.025 regin de
0 . 2
0.025 regin
rechazo de rechazo
f ( x

0 . 1 Regin de no
rechazo

. 0

- 5

-4 -3 -2 -1 0 1 2 3 4
Valor crtico Valor crtico
z = -1.96 z = 1.96
Hiptesis nula unilateral a derecha ( 0)
Distribucin de muestreo para la estadstica z
r a l i t r b u i o n : m = 0 , s2 = 1

una cola- 0.05 Nivel de significacin


0 . 4

0 . 3

0.95 probabilidad

0 . 2 0.05 regin de
rechazo
f ( x

0 . 1

Regin de no
. 0 rechazo

- 5

0 1 2 3 4
Valor Critico
z = 1.65
Hiptesis nula unilateral a izquierda ( 0)
Distribucin de muestreo para la estadstica z
r a l i t r b u i o n : m = 0 , s2 = 1

una cola- 0.05 Nivel de significacin


0 . 4

0 . 3

0.95 probabilidad

0 . 2

0.05 regin de
rechazo
f ( x

0 . 1

Regin de no
Regin de no
. 0
rechazo
rechazo
- 5

Valor 0 1 2 3 4
crtico
z= -1.65
Distribuciones de probabilidad para muestras
pequeas

1. Distribucin t de Student

2. Distribucin Chi Cuadrada (2)

3. Distribucin F de Fisher

13
1) Distribucin t de Student
La distribucin muestral del promedio se ajusta muy bien a la
distribucin Normal cuando se conoce . Si n es grande, esto
no presenta ningn problema, aun cuando sea
desconocida, por lo que en este caso es razonable sustituirla
por s.
Sin embargo, en el caso de usar valores de n < 30, o sea en
el caso de pequeas muestras, esto no funciona tan bien.
Definiendo el estadstico t:

x-m
t=
s/ n
Se puede probar que siendo `x el promedio de una
muestra tomada de una poblacin normal con media m y
varianza s2, el estadstico t es el valor de una variable
aleatoria con distribucin t de Student y parmetro (Ni,
grados de libertad) = n - 1.
Caractersticas de la Distribucin t de Student
Tiene media igual a 0, es asinttica al eje x y su
dominio va de - a + ;
El rea bajo la curva, desde - a + es igual a 1
m = 0, la s2 depende del parmetro (grados libertad)
Varianza > 1, pero se aproxima a 1 cuando n
Al aumentar n, la distribucin t se aproxima a la
Normal; n >= 30, excelente aproximacin
Entre las aplicaciones:
Estimacin de intervalos de confianza para medias a partir de
muestras pequeas.
Pruebas de hiptesis basadas en muestras pequeas (n <
30)
Forma de la distribucin Normal estandarizada y la t-Student

9-3
9-3

Los grados de Distribucin z


libertad de la
distribucin t
son gl = n - 1.
Distribucin t
Cmo usar las tablas?
2. Determinar los grados de libertad () tal que = n - 1.
3. Calcular el valor de t = (x - m)/(s/().
4. Localizar en tablas el valor de la probabilidad asociada a los
valores de t y de . Los valores de t pueden ser negativos o
positivos. Contrario a la tabla de la distribucin normal aqu
los valores de t estn dentro de la tabla y los valores de
probabilidad en la parte superior de la misma. En algunos
casos puede ser necesario interpolar para encontrar el valor
exacto buscado, de lo contrario se escoge el que ms se
aproxime.
Cmo usar las tablas?...
Por ejemplo si t es igual 0,92 con 5 grados de libertad, el
valor de la probabilidad es 0,80 pues se localiza en la
direccin vertical en la parte superior tal y como se
muestra a continuacin.

La tabla se puede usar tambin al revs, sea dada una


probabilidad se determina el valor de t que le corresponde.
EJEMPLO
La empresa Silencio Sonoro especifica que el peso medio de
uno de sus productos debe ser de 2 kg. Sabiendo que la
desviacin estndar de una muestra de 17 unidades es 0,1.
a. Cul es la probabilidad de que la media sea:
menos de 1,9666 kg?
ms de 2,0646 kg?
entre 1,9935 y 2,053 kg?
b. Qu valor de promedio genera una probabilidad de 0,15 a su
izquierda?
SOLUCIN

m = 2 kg. s*x = 0,1/16 = 0,025 kg con 16 grados de libertad


a. P(x 1,9666) = ?

1,9666 2
P( x 1,9666) = T = T (1,366) = 0,1
0,025
La probabilidad de que la media sea menor a 1,9666 kg es 0,1.
SOLUCION

m=2 Kg. sxbarra=0.1/16 = 0.025 Kg.


con 16 grados de libertad
a. P(xbarra1.9666)=?
En Excel se pulsa en el men:
INSERTAR/FUNCIN ESTADSTICAS: DISTR.T.N
P(x 1,9666) se introduce el valor de t que es 1,336 positivo, el
nmero de grados de libertad que es 16 y se indica que es 1
cola. Excel retorna el valor de la probabilidad que es 0,1 que es
el mismo valor a la izquierda de -1,336 por la simetra.
La probabilidad de que la media sea menor a 1,9666 kg es 0,1.
Desarrolla con la tabla de la Distribucin t y con Excel
a) Calcula la probabilidad de obtener un valor mayor que
2,26 en una distribucin t con 9 gl
b) Calcula la probabilidad de obtener un valor mayor que
2,26 o menor que -2,26 en una distribucin t con 9 gl
c) Calcula el valor de t despus del cual se encuentre el
5% del rea de la curva con 9 gl
d) Calcula el valor de t para = 0,05 con 9 gl y dos colas
e) Encuentra k tal que P(k < t < -1,761) = 0,045, para una
muestra aleatoria de tamao 15 que se selecciona de
una distribucin normal.
f) Tomasa, ingeniera industrial, afirma que el rendimiento medio de la
poblacin de cierto proceso en lotes es 500 gramos por milmetro
de materia prima. Para verificar esta afirmacin toma una muestra
de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05 y
t0.05, queda satisfecha con su afirmacin Qu conclusin
extraeras de una muestra que tiene una media de 518 gramos por
milmetro y una desviacin estndar de 40 gramos? Supn que la
distribucin de rendimientos es aproximadamente normal.
Rpta t = 2,25
2) Distribucin de probabilidad Chi-cuadrado (2)

Es una funcin de densidad de probabilidad que


representa la distribucin muestral de la varianza.

Definimos el estadstico Ji-cuadrado (2) como:

2
(n -1) s
=2

s 2
Grficos de Chi-cuadrado (2)

df = Degrees of freedom
Caractersticas de la distribucin Ji-cuadrado
Asimtrica y asinttica al eje X por la derecha
Su dominio va de 0 a +
rea bajo la curva desde 0 a + = 1
Tiene parmetro = n-1 (gl)
Al aumentar n se aproxima a la normal
Representa distribucin muestral de varianza.
Entre las aplicaciones:
Determinacin de intervalos de confianza para varianzas
Pruebas de hiptesis para una varianza
Tablas de contingencia
El ajuste de datos a una distribucin dada conocida
Las pruebas de independencia.
EJEMPLO (supervivencia en el Titanic)

Sobrevive No sobrevive Total


Primera clase 194 128 322
Segunda clase 119 161 280
Tercera clase 138 573 711
Total 451 862 1313

Tenemos una tabla (sin totales):


Frecuencias absolutas
Sobrevive No sobrevive
Primera clase 194 128
Segunda clase 119 161
Tercera clase 138 573

Calcular el valor Chi cuadrado con un nivel de significacin de 0,05


Traduccin

Tenemos una tabla (sin totales):


Frecuencias absolutas
Sobrevive No sobrevive
Primera clase 194 128
Segunda clase 119 161
Tercera clase 138 573

Calcular el valor Chi cuadrado con un nivel de significacin de:


a) 0,05
b) 0,10
c) Con un nivel de confianza de 93%
Calculemos el valor de la tabla Chi-cuadrado

1) Grados de libertad:
K = (nmero de filas - 1)*(nmero de columnas - 1)
= (3 - 1)*(2 - 1) = 2
2) El valor alfa (0,05 si no se dice).
3) El valor que buscamos
2
g .l .; = 2
2;0, 05 = 5,99
SIGNIFICADO: La probabilidad de obtener un
valor mayor que 5,99 es 0,05
Distribucin de
probabilidad
Chi cuadrado

Probabilidad de un valor superior -


Alfa ()
Grados libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
Ejercicios : Resuelve con la tabla de Distribucin Ji-cuadrado y con excel

a) Calcula la probabilidad de obtener un valor mayor de 23,7 en una distribucin 2 con n


= 14 gl.
b) Calcula el valor de 2 despus del cual se encuentra el 5% del rea en una
distribucin Ji-cuadrado con 4 gl.
c) Supn que los tiempos requeridos por Orin Mortal Combat para alcanzar uno de sus
destinos forman una distribucin normal con una desviacin estndar de 1 minuto. Si
se elige al azar una muestra de 17 tiempos, encuentra la probabilidad de que la
varianza muestral sea mayor que dos. R. 0,01.
d) En un trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la
variabilidad de los resultados que producen muestras estndar. En un estudio de la
cantidad de calcio en el agua potable, el cual se efecta como parte del control de
calidad, se analiz seis veces la misma muestra en el laboratorio en intervalos
aleatorios. Los seis resultados en partes por milln fueron 9,54; 9,61; 9,32; 9,48; 9,70
y 9,26. Estimar la varianza de los resultados de la poblacin para este estndar,
usando un nivel de confianza del 90%.
R. Varianzas 0,1246 y 0,0129 mxima y mnima.
3) Distribucin de probabilidad F de Fisher
Tambin llamada F de Fisher - Snedecor
Representa la distribucin muestreal de la razn de
dos varianzas. Es decir que se obtiene de la razn de
dos distribuciones Ji-cuadrado.
Definimos el estadstico F como:
2
s
F= 2 1

s2
F es el valor de una variable aleatoria que tiene una
distribucin F con parmetros 1 = n1 - 1 y 2 = n2 - 1.
Propiedades de la distribucin F

Asimtrica, y asinttica al eje X por el lado derecho


Su dominio va de 0 a +
rea bajo la curva desde 0 a + = 1
Tiene parmetros 1 = n1 - 1 y 2 = n2 - 1.
Entre sus aplicaciones:
Pruebas de hiptesis entre 2 varianzas
Anlisis de varianza
Anlisis de covarianza.
La Distribucin F.
Cmo usar las tablas?
La tabla da valores de probabilidad acumulados de
izquierda a derecha. Para extraer valores de probabilidad
de esta tabla se sigue el siguiente procedimiento:
1. Extraer muestras de dos poblaciones y estimar las
desviaciones estndar.
2. Determinar los grados de libertad (v1 y v2) tal que v1 =
n1-1 y v2 = n2 - 1.
3. Calcular el valor de F = s12 / s22. Si se conocen las
varianzas entonces F = (s12 *s22) / (s22 * s12)
Cmo usar las tablas?
3. Localizar en tablas, la probabilidad asociada a los valores de
F, 1 y 2. En algunos casos se puede interpolar, de lo
contrario, se escoge el que ms se aproxime. Por ejemplo, si
F es igual 3,28 con 1 = 12 y 2 = 8 grados de libertad, el
valor de la probabilidad menor que el es 0,95, pues se
localiza en la segunda columna a la izquierda tal y como se
muestra a continuacin.
EJEMPLO
En un proceso hay dos mquinas cortadoras diferentes en
antigedad lo que hace pensar que las varianzas de corte
no son iguales. Se toma una muestra de 16 partes de cada
mquina, cul es la probabilidad de que la razn de
varianzas sea:
a. mayor a 1,97?
b. menor a 3,52?
F DE FISHER

SOLUCIN
a.
P( F 1,97) = 1 0,9 = 0,1 para v1 = 15 y v2 = 15

La probabilidad de que la razn de varianzas sea mayor a


1,97 es 0,1.
b.
P( F 3,52) = 0,99 para v1 = 15 y v2 = 15

La probabilidad de que la razn de varianzas sea menor a


3,52 es 0,99.
F DE FISHER
Ejercicios: Resuelve con la tabla de distribucin F y con excel

a) Determina la probabilidad de tener un valor de F mayor


que 9,28 en una distribucin F con 1 = 3 y 2 = 3 gl.

b) Halla la el valor crtico de F(0.05) para 1 = 3 y 2 = 15 gl.


c) Si s12 y s22 representan las varianzas de las muestras
aleatorias independientes de tamao n1 = 25 y n2 = 31,
tomadas de poblaciones normales con varianzas s12 = 10
y s22 = 15, respectivamente, encuentra P(s12/s22 > 1,26).
Pruebas paramtricas de hiptesis

Se aplican cuando la distribucin de probabilidad


de la poblacin es conocida
Pruebas paramtricas de hiptesis
Estadstico
Prueba sobre Hiptesis nula Suposiciones
de prueba
m = m0 s2 conocida Normal
La media
m = m0 s2 desconocida t
m1 = m2 s12 = s22 conocidas Normal
Igualdad de
m1 = m2 s12 = s22 desconocidas t
medias
m1 = m2 s12 s22 conocidas t
s2 = s0 2 dist. Normal, n pequea Ji2
La varianza
s2 = s0 2 n grande Normal
Igualdad de dos
s1 2 = s2 2 t
varianzas
Una proporcin p = p0 Normal
Igualdad de dos
p1 = p2 Normal
proporciones
Estadsticos para medias, varianzas y proporciones
X m
Z = ;Una.media; n 30; s conocida
s/ n
X m
t= ;Una.media; n 30; s desconocida
S/ n
S12
F = 2 ; DF = n1 1, n2 1; prueba.dos. var ianzas
S2
X1 X 2
t= ; dos.medias; s ' s desconocidas. pero. =
1 1
Sp /
n1 n2
( n1 1) s12 ( n2 1) s22
Sp = ; DF = n1 n2 2
n1 n2 2
X1 X 2
t= ; dos.medias; s ' s desconocidas.diferentes
2 2
s s
1
2
n1 n2
DF = formula.especial
42
Estadsticos para medias, varianzas y proporciones...

Para el caso de muestras pareadas se calculan las


diferencias d individuales como sigue:

d
t= ; Pares.de.medias; d i . para.cada. par
Sd / n
( n 1) S 2
X 2
= ; DF = ( n 1); prueba.una.v ar ianza
s 2

(O E ) 2
X2 = ; DF = ( r 1)(c 1); bondad .ajuste
E

43
RESUMEN DE ERRORES DE LA PRUEBA DE HIPTESIS
Condicin verdadera
Conclusiones de la
muestra H0 es verdadero H0 es falso

No rechaza H0 1 Decisin correcta 1 Error Tipo II


2 Nivel de confianza 2 Probabilidad =
3 Probabilidad = 1 -

Rechaza H0 1 Error Tipo I 1 Decisin correcta


2 Nivel de significacin 2 Potencia de la prueba
3 Probabilidad = 3 Probabilidad = 1 -
Errores Tipo I y Tipo II
Ejemplo. La empresa Vuelos Areos SA tiene inters en la
rapidez de combustin de un agente propulsor para los
sistemas de salida de emergencia en aeronaves (esta rapidez
es una variable aleatoria con alguna distribucin de
probabilidad). Especialmente interesa la rapidez de combustin
promedio. De manera ms especfica, interesa decidir si esta
rapidez promedio es o no 50 cm/s. Adems s = 2,5 cm/s

El planteamiento formal de la situacin se realiza en trminos


de una hiptesis nula (que es la proposicin que se quiere
poner a prueba) y una hiptesis alternativa, la cual se aceptar
si se rechaza la hiptesis nula:
Hiptesis nula: H0: m = 50 cm/s
Hiptesis alternativa: H1: m 50 cm/s
En el ejemplo se tiene una hiptesis alternativa bilateral, ya que
se verifica para valores de m (rapidez de combustin) a ambos
lados de 50 cm/s.
Errores Tipo I y Tipo II...
_
Aceptacin de H0.- Un valor de la media muestral x muy
cercano a 50 cm/s es una evidencia que apoya a la hiptesis
nula, sin embargo es necesario introducir un criterio para
decidir qu tanto es_ muy cercano, para el ejemplo este criterio
pudiera ser: 48,5 x 51,5, si esto ocurre se acepta H0
_ _
De lo contrario, es decir, si x < 48,5 o x > 51,5, se acepta H1

Regin crtica Regin de aceptacin Regin crtica


Se acepta H1 Se acepta H0 Se acepta H1
m 50 m = 50 m 50

48,5 50 51,5
Valores Crticos
Errores Tipo I y Tipo II...

El procedimiento anterior puede llevarnos a una de dos


conclusiones errneas:
Error Tipo I.- Se rechaza H0 cuando sta es verdadera
Error Tipo II.- Se acepta H0 cuando sta es falsa
En el ejemplo de Vuelos
_ Areos se cometer un error de tipo I
cuando m = 50, pero x para la muestra considerada cae en la
regin crtica _
Y se cometer un error de tipo II cuando m 50 pero x para la
muestra considerada cae en la regin de aceptacin
Condicin real
H0 verdadera H0 falsa
Decisin
Rechazar H0 Error Tipo I Ok
Aceptar H0 Ok Error Tipo II
Grfica de los errores Tipo I y Tipo II


Ho z 1

ACEPTACIN RECHAZO

Valor crtico
Grfica de los errores Tipo I y Tipo II...
Si disminuimos aumenta



Ho z 1

ACEPTACIN RECHAZO

Valor crtico
Error Tipo I
A la probabilidad de cometer un error de tipo I (riesgo del
productor) se denota por , y se le llama el nivel o tamao de
significancia de la prueba es decir:
= P(error Tipo I) = P(rechazar H0 | H0 es verdadera)
Ejemplo: Calcular para el ejemplo (Vuelos Areos) de la rapidez de
combustin para una muestra de n = 10 datos, suponiendo que la desviacin
estndar de la rapidez de combustin es s = 2.5 cm/s y = P( x caiga en la
regin crtica | m = 50), es decir:
_ _
= P( x < 48.5) + P( x > 51.5)
_
Recordando que la distribucin de x es Normal con media m = 50 y desviacin
estndar s/n = 0,79:

= 0,0576 (Verificar)

Esto significa que el 5,76% de las muestras de tamao 10 conducirn al


rechazo de la hiptesis H0: m = 50 cm/s, cuando sta es verdadera.
Error Tipo I...
se puede reducir de dos maneras:
- Aumentando la regin de aceptacin
- Aumentando el tamao de la muestra
Ejemplo. Recalcular del ejemplo anterior (Vuelos Areos)
para el tem: a) considerando los nuevos lmites de la
regin de aceptacin 48 y 52. b) Para n = 16 con los
lmites originales. c) con ambas modificaciones.
Solucin (verifica con excel):
a) = 0,0114
b) = 0,0164
c) = 0,0014
Error tipo II
Para evaluar un experimento de prueba de hiptesis tambin se
requiere calcular la probabilidad del error de tipo II (riesgo del
consumidor), denotada por , es decir:
= P(error Tipo II) = P(aceptar H0 | H0 es falsa)

Sin embargo, no es posible calcular si no se tiene una hiptesis


alternativa especfica, es decir, un valor particular del parmetro
bajo prueba en lugar de un rango de valores
Por ejemplo (Vuelos Areos), supongamos que es importante
rechazar H0 si la rapidez promedio de combustin m es mayor que
52 cm/s o menor que 48 cm/s. Dada la simetra solo se requiere
evaluar la probabilidad de aceptar H0: m = 50 cuando el valor
verdadero es m = 52. s = 2.5 cm/s y n = 10
Error tipo II...
0.7

0.6 H0: m = 50 H1: m = 52


0.5

0.4

0.3

0.2

0.1

0
45 46 47 48 49 50 51 52 53 54 55

_
De acuerdo a la figura: = P(48,5 x 51,5 | m = 52)

= 0,2643 (Verifica)
Error tipo II...
La probabilidad de obtener un error de tipo II aumenta muy
rpido a medida que el valor verdadero m tiende al valor
hipottico, por ejemplo, si suponemos que m = 50,5, y
recalculamos , obtenemos:

= 0,8923 (Verifica)

tambin depende del tamao de la muestra, por ejemplo, si n =


16 obtenemos en el ejemplo cuando m = 52: s = 0.625, por lo
tanto:
= 0.2119 (Verifica)

Es decir, disminuye cuando n aumenta, excepto si el valor real


de m est muy cerca del hipottico
POTENCIA DE UNA PRUEBA

La potencia de una prueba estadstica o el poder estadstico es la probabilidad


de que la hiptesis nula sea rechazada cuando la hiptesis alternativa es
verdadera (es decir, la probabilidad de no cometer un error del tipo II). La
potencia es en general una funcin de las distribuciones posibles, a menudo
determinada por un parmetro, bajo la hiptesis alternativa. A medida que
aumenta la potencia, las posibilidades de que se presente un error del tipo II
disminuyen. La probabilidad de que ocurra un error de tipo II se conoce como
la tasa de falsos negativos (). Por lo tanto la potencia es igual a 1 - , que
tambin se conoce como la sensibilidad.

El anlisis de poder se puede utilizar para calcular el tamao mnimo de la


muestra necesario para que uno pueda detectar razonablemente un efecto de un
determinado tamao. El anlisis de poder tambin se puede utilizar para
calcular el tamao del efecto mnimo que es probable que se detecte en un
estudio usando un tamao de muestra dado. Adems, el concepto de
alimentacin se utiliza para hacer comparaciones entre diferentes
procedimientos de anlisis estadsticos: por ejemplo, entre uno paramtrico y
una prueba no paramtrica de la misma hiptesis.
POTENCIA DE UNA PRUEBA

El complemento (1-) de la probabilidad de cometer un error del tipo II se


conoce como POTENCIA de una prueba estadstica.

NOTA:
Una manera en que podemos controlar la probabilidad de cometer un error del
tipo II, consiste en aumentar el tamao de la muestra. Tamaos ms grandes
de muestra, permitirn detectar diferencias incluso muy pequeas entre las
estadsticas de muestra y los parmetros de la poblacin. Cuando se
disminuye , aumentar de modo que una reduccin en el riesgo de cometer
un error de tipo I tendr como resultado un aumento en el riesgo de cometer un
error tipo II.
La potencia de prueba 1- representa la sensibilidad de la prueba estadstica
para detectar cambios que se presentan al medir la probabilidad de rechazar la
hiptesis nula cuando de hecho es falsa. La potencia de la prueba estadstica
depende de qu tan diferente en realidad es la media verdadera de la
poblacin del valor supuesto.
Una prueba de un extremo es ms poderosa que una de dos extremos, y se debera
utilizar siempre que sea adecuado especificar la direccin de la hiptesis alternativa.
Conclusin Fuerte y Dbil

Como el investigador puede elegir los valores crticos del


intervalo de aceptacin, ste controla el valor de . Se puede
entonces controlar la probabilidad de rechazar de manera errnea
H0.
Es por eso que el rechazo de H0 siempre se considera como una
Conclusin Fuerte. Los datos aportan fuerte evidencia de que H0
es falsa.
La decisin de aceptar H0 se considera una Conclusin Dbil, a
menos que se sepa que es considerablemente pequeo.
Por esto en lugar de decir se acepta H0 se prefiere decir
incapaz de rechazar H0, es decir, no se ha encontrado evidencia
suficiente para rechazar H0. O sea, no quiere decir que exista gran
evidencia de que H0 sea cierta sino que no hay gran evidencia de
que sea falsa.
Valor P, p-valor, la p, valor p consignado, o
directamente en ingls p-value)
Una manera de notificar los resultados de una prueba de hiptesis
es establecer si la hiptesis nula fue o no rechazada con un nivel
especificado de significancia

Una alternativa es especificar el nivel de significancia ms


pequeo que conduce al rechazo de la hiptesis nula. A este se le
llama el Valor P

Este valor P slo depende de la muestra tomada, es decir, para una


muestra y un estadstico calculado se puede obtener su valor P y
comparar con un especificado. Entonces, si P < , H0 se
rechaza.
Valor p...

Es la probabilidad de obtener una muestra que discrepe an


ms que la nuestra de la H0.
Es la probabilidad de que por puro azar obtengamos una
muestra ms extraa que la obtenida.
p es conocido despus de realizar el experimento aleatorio
El contraste es significativo cuando p <

No se rechaza H0: m=40


Regin de rechazo para
H0: m=40

/2

X = 43 p/2
Valor p...

El contraste es estadsticamente significativo cuando p<


Es decir, si el resultado experimental discrepa ms de lo
tolerado a priori.

Se rechaza H0: m=40


P/2

Se acepta H1: m40 /2

X = 50
Valor P...

En el caso de la distribucin normal para la prueba sobre la media


es fcil calcular el valor P (p-valor). Si z0 fue el valor calculado
del estadstico de prueba, entonces:

2 [ 1- F(|z0|) ] Prueba de dos colas: H0:m = m0, H1:m m0


P= 1- F(z0) Prueba de cola superior: H0:m=m0, H1:m > m0
F(z0) Prueba de cola inferior: H0:m = m0, H1:m < m0

Donde F(z) = P(Zz) (Funcin de distribucin normal N(0;1))

Por ejemplo para z0 = 3,25; entonces P = 2(1-F(3,25)) = 0,0012.


Es decir, H0 ser rechazada con cualquier nivel de significancia
0,0012
Caso 1. Prueba de hiptesis para la media de una poblacin,
desviacin estndar poblacional conocida o muestras grandes

Cuando se plantean hiptesis para la media de la poblacin y la

desviacin estndar poblacional es conocida o el tamao de la muestra es

grande (n > 30), el estadstico de prueba est dado por:

X m
z= N (0;1)
s/ n
el cual se distribuye como una Normal de media 0 y desvo estndar 1.

El estadstico se conoce como Prueba Z.


Ejemplo 1. El laboratorio farmacutico En El Dolor Hermanos
afirma que el antiinflamatorio fabricado por ellos elimina la
inflamacin en 14 min en los casos corrientes.
Con el objeto de comprobar estadsticamente esta afirmacin,
se elige al azar 18 pacientes con inflamaciones varias y se
toma como variable de respuesta el tiempo transcurrido entre
la administracin del antiinflamatorio y el momento en que
desaparece la inflamacin. Se sabe que la variable tiempo
transcurrido entre la administracin del antiinflamatorio y el
momento en que desaparece la inflamacin sigue una
distribucin normal de media 14 y desviacin 7. El tiempo
medio de respuesta de la muestra fue de 19 min.
Comprobar la afirmacin del laboratorio a un nivel de significa-
cin de 0,05.
Propuesta de solucin

Los datos que se tienen:


X = 19, = 14, = 7, n = 18
Se quiere contrastar la hiptesis nula a partir de la afirmacin
de la empresa que dice que la inflamacin desaparece en 14
min; as se tiene:
Hiptesis nula Ho : = 14
La hiptesis alternativa ser el caso desfavorable, en esta
ocasin para la empresa, y puede escribirse:
Hiptesis alternativa Ha : > 14
Procederemos aceptando de entrada la hiptesis nula (m = 14),
calculando el estadstico y observando si se sita en la regin
crtica. Si as sucediera, rechazaramos la creencia inicial de
aceptacin de la hiptesis nula.
Propuesta de solucin...

Sustituyendo:

x m 0 19 14
z= = = 3,03
s 7
n 18
Si Z > 1,645 rechazamos H0 al nivel de significancia del 5%
Con lo que se observa que el estadstico se sita en la regin
crtica y, por lo tanto no sigue el criterio de aceptacin de la
hiptesis nula.

De ese modo, se rechaza la hiptesis Ho de que = 14 y


concluimos que a un nivel 0,05 el tiempo medio de eliminar la
inflamacin por este antiinflamatorio es superior a 14 min.
Ejemplo 2. La empresa Star Waska fabrica focos que
tienen una duracin que se distribuye de forma
aproximadamente normal con una media de 800 h y una
desviacin estndar de 40 h. Prueba la hiptesis de que
800 h si una muestra aleatoria de 30 focos tiene una
duracin promedio de 788 h. Utiliza un nivel de signifi-
cancia de 0,04.

Datos
H0: 1 = 800 H1: 2 800
= 40 h
X = 788
Significancia = 0,04
Propuesta de solucin

Se llega a la conclusin de que no hay evidencia para


rechazar que la duracin media de los focos
corresponde a 800 h por lo que la hiptesis nula no
es rechazada.
Caso II. Prueba de hiptesis para la media de una poblacin,
desviacin estndar desconocida y tamao muestral pequeo

Cuando se plantean hiptesis para la media de la


poblacin, la desviacin estndar poblacional es desco-
nocida y el tamao de la muestra es pequeo, el
estadstico de prueba est dado por:

xm
t= t gl = n 1
S n 1 / n
el cual se distribuye como una t de Student con n - 1
grados de libertad.
Ejemplo 1. El gerente de la fbrica DC_OS
procesadora de cristal (templado, insulado y laminar),
afirma que la media del saldo para los clientes con
crdito es de US$410. El auditor interno selecciona
una muestra aleatoria de 18 cuentas y encuentra una
media de saldo de $511,33 y una desviacin
estndar de $183,75. Si la declaracin del gerente no
es apoyada por estos datos, el auditor pretende
examinar todos los saldos de las cuentas de crdito.
Se supone que la poblacin de saldos de crdito
tiene una distribucin aproximadamente normal,
qu accin debe emprender el auditor?
Propuesta de solucin:
Formular las hiptesis nula y alternativa (1)
H0: = 410 El saldo medio real es $410.
H1: 410 El saldo medio real es algn otro valor
Para evaluar la afirmacin del gerente, es adecuada una
prueba de dos colas, porque es una afirmacin no direccional
que puede rechazarse a causa de un resultado extremo en
cualquier direccin. El centro de distribucin de la hiptesis
para la media muestral, para una muestra de n = 18, ser 0 =
$410.

Seleccionar el nivel de significancia (2)


Para esta prueba, utilizaremos el nivel de significancia de 0,05.
La suma de las reas de las dos colas ser de 0,05.
Propuesta de solucin
Seleccionar el estadstico de prueba y calcular su valor (3)

El estadstico de prueba es
,

xm
t= t gl = n 1
S n 1 / n
y se usar la distribucin t para describir la distribucin muestral
de la media para las muestras de n = 18. El centro de la
distribucin es 0 = $410, lo cual corresponde a t = 0,000.

Como se desconoce la desviacin estndar de la poblacin, se


emplea s para estimar

La distribucin muestral tiene un error estndar estimado de:


$43,31 y el valor calculado de t ser 2,340
Propuesta de solucin

Identificar los valores crticos para el


estadstico de prueba y plantear la regla de
decisin (4)
Para esta prueba, = 0.05, y el nmero de grados
de libertad es df = 17. Al consultar la tabla de la
distribucin t, se encuentra que los valores crticos
para el estadstico de prueba son t = -2.110 y t =
+2.110. La regla de decisin se plantea como
Rechazar H0 si t calculada es < -2.110 o >
+2.110, de lo contrario, no rechazar.
Propuesta de solucin
Comparar los valores calculado y crtico y llegar a una
conclusin para la hiptesis nula (5)

El estadstico calculado para la prueba, t = 2.340, excede el


lmite superior y cae dentro de la zona de rechazo. Se rechaza
H0.

Tomar la decisin correspondiente (6)

El resultado sugiere que la media del saldo de las cuentas es


un valor diferente a $410. El auditor debe examinar todos los
saldos de las cuentas de crdito.
Propuesta de solucin
Solucin con computadora
One-Sample T
Test of mu = 410 vs not = 410
N Mean StDev SE Mean 95% CI T P
18 511.330 183.750 43.310 (419.953, 602.707) 2.34 0.032

En las soluciones con computadora, aparece el valor de p


(0,032) para la prueba. Este valor de p corresponde a la
afirmacin siguiente: Si la media de la poblacin en realidad
es de $410, slo hay una probabilidad de 0,032 de obtener una
media muestral tan alejada de $410 solo por casualidad.
Como el valor de p es menor que el nivel de significancia que
utilizamos para llegar a una conclusin (es decir, el valor p =
0,032 es < = 0,05), se rechaza H0: = 410 .
Propuesta de solucin

Comentarios a la solucin por computadora

En los resultados se aprecia que el intervalo de confianza


de 95% va de $419,953 a $602,707. La media poblacional
de la hiptesis ($410) no cae dentro del intervalo de
confianza de 95%; por lo tanto, con este nivel de
confianza, el resultado sugiere que la media de la
poblacin es un valor diferente de $410. Se llega a esta
misma conclusin en nuestra prueba de dos colas con un
nivel de significancia de 0,05.
Ejemplo 2. La Shesu Rubber Company, en dificultades financieras
por la mala reputacin de la calidad del producto, sac una campaa
de anuncios donde declara que la duracin media de los neumticos
Shesu en carretera es de al menos 60 000 km. Escpticos, los
editores del peridico El Bocn compran 36 neumticos y los
prueban en carretera. La duracin media de los neumticos en la
muestra es X = 58 341,69 km, con una desviacin estndar muestral
de s = 3 632,53 km Es cierto lo afirmado por Shesu?
Propuesta de solucin
Formular la hiptesis nula y alternativa (1)
Debido a la naturaleza direccional de la afirmacin del
anuncio y al escepticismo de los editores con respecto a su
veracidad, las hiptesis nula y alternativa son:
H0: 60 000 km. La duracin media de los neumticos es
de al menos 60 000 km.
H1: < 60 000 km. La duracin media de los neumticos es
menor a 60 000 km.
Propuesta de solucin
Seleccionar el nivel de significancia (2)
Para esta prueba, utilizaremos el nivel de significancia de 0.01.
Seleccionar el estadstico de prueba y calcular su valor (3)
El estadstico de prueba es t = , y se usar
muestras de n = 36 y = 60 000 km. Como se desconoce la
desviacin estndar de la poblacin, se usa s para estimar . La
distribucin muestral tiene un error estndar estimado de:

km

y el valor calculado de t es:


Identificar el valor crtico para el estadstico de prueba y plantear
la regla de decisin (4)
Para esta prueba, se especific como 0.01. El nmero de grados
de libertad es df = 35. Al consultar en la tabla, se encuentra que
este valor crtico es t = -2.438. (Aunque el valor listado es positivo,
recuerde que la distribucin es simtrica). La regla de decisin se
plantea como Rechazar H0 si la t calculada es menor que -2.438,
de lo contrario, no rechazar.
Comparar los valores calculado y crtico y llegar a una
conclusin para la hiptesis nula (5)
El estadstico calculado para la prueba t = -2.739, es menor que el
valor crtico, t = -2.438, y cae dentro de la regin de rechazo de la
prueba. La hiptesis nula, H0: 60 000 km debe ser rechazada.
Tomar la decisin correspondiente (6)
El resultado de la prueba sustenta las dudas de los editores con
respecto a la afirmacin del anuncio de Shesu. El peridico puede
ejercer presin legal sobre Shesu o con sus lectores, para que
modifique su anuncio.
Ejercicios
1.- Tomasa es una asesora de inversiones que afirma que sus
clientes tienen una media de 340 acciones burstiles. En una
muestra de 50 clientes, la media del nmero de acciones
posedas es 315, con una desviacin estndar de 83,2
acciones. Tiene razn Tomasa? Considera un coeficiente de
confianza de 95%.
2.- La Cmara de Comercio de Lima (CCL) dice que la
media del nmero de aos de educacin primaria y
secundaria de los integrantes de la fuerza laboral local es de
al menos 10 aos. La empresa Me Llega al Twitter considera
instalar una planta de fabricacin de envases de vidrio, toma
una muestra de 60 trabajadores y encuentra que tiene una
media de 8,4 aos de educacin escolar, con una desviacin
estndar de 2,7 aos.
Tiene validez lo indicado por la CCL? Usa un nivel de
confianza de 95%.
3.- La cementera El ltimo Cuartucho vende una marca
especial de cemento en sacos de 50 kg. Se eligen 11 de ellos al
azar y se observa que su masa en kg es: 49,2; 50,1; 49,8; 49,7;
50,1; 50,5; 49,6; 49,9; 50,4; 50,2 y 49,7 Son tales resultados
congruentes con el supuesto de que los sacos pertenecen a una
poblacin que tiene una media de 50 kg? Utiliza = 10%

Rpta. t calculada es 0,64. No hay diferencia significativa al


nivel de 10%.
Caso III. Prueba de hiptesis para la proporcin de una
poblacin cuando se conoce y n > 30

Cuando se plantean hiptesis para la proporcin de la


poblacin, el estadstico de prueba est dado por:

p pHo
z= N (0,1) donde
sp =
pHo * qHo
sp n

el cual se distribuye como una Normal de media 0 y


desvo estndar 1.
Si se desconoce la varianza poblacional, sta es
reemplazada por la varianza muestral.
Si n es pequea se debe utilizar la distribucin
binomial.
Ejemplo 1. El Vicerrector de Mamanis University declar que 70%
de los egresados entra al mercado laboral en un puesto directamente
relacionado con su rea de estudio. En una muestra formada por 200
graduados de la promocin del ao anterior, 66% obtuvo empleos
relacionados con su rea de estudios. Comprobar la afirmacin del
Vice.
Propuesta de solucin:
Formular las hiptesis nula y alternativa (1)

La afirmacin del director es no direccional y conduce a las hiptesis nula y alternativa


de:

H0: p = 0.70 La proporcin de graduados que consiguen empleos en su rea de


estudios es de 0.70.

H1: p 0.70 La proporcin es un valor diferente de 0.70

Seleccionar el nivel de significancia (2)

Para esta prueba, se utilizar un nivel de significancia de 0.05. La suma de las reas de
las dos colas ser 0.05.
Propuesta de solucin:
Seleccionar el estadstico de la prueba y calcular su valor (3)

El estadstico de la prueba ser z, el nmero de unidades de error estndar entre la


proporcin poblacional de la hiptesis, p = 0.70, y la proporcin muestral, p = 0.66. El
error estndar de la proporcin muestral es:

= 0.0324

y el valor calculado de z es:

= -1.23
Identificar los valores crticos para el estadstico de la
prueba y plantear la regla de decisin (4)

Dado que esta prueba es de dos colas y el nivel de


significancia seleccionado es de 0,05, los valores crticos
sern z = -1,96 y z = +1,96. La regla de decisin se
plantea como Rechazar H0 si la z calculada es < -1,96 o
> +1,96, de lo contrario no rechazar.
Comparar los valores calculado y crtico y llegar a una
conclusin para la hiptesis nula (5)

El valor calculado del estadstico de la prueba, z = -1,23,


cae entre los dos valores crticos, lo cual lo coloca en la
regin de no rechazo de la distribucin. La hiptesis nula
no se rechaza.
Propuesta de solucin:

Tomar la decisin correspondiente (6)

No rechazar la hiptesis nula nos hace concluir


que la proporcin de graduados que entran al
mercado laboral en puestos relacionados con su
rea de estudios puede ser igual al valor declarado
de 0,70. Si el Vice afirma esto ante los estudiantes
o sus padres, el anlisis sugiere que su aseveracin
no ser cuestionada.
Ejemplo 2. En una decisin administrativa, EsSalud cerr las
unidades de ciruga cardaca en varios de sus hospitales que
realizaban menos de 150 operaciones al ao o tenan tasas de
mortalidad superiores a 5,0%. En una de las unidades quirrgi-
cas cerradas del Hospital La Muerte Lenta, se haban efectuado
100 operaciones durante el ao anterior, con una tasa de
mortalidad de 7,0%. Con un nivel de significancia de 0,01 la
tasa de mortalidad de este hospital fue significativamente mayor
que el valor lmite de 5,0%?
Considera que el desempeo del Hospital representa una
muestra de la poblacin de operaciones que pudieron realizarse
si hubieran tenido pacientes.
Propuesta de solucin
(1)
Propuesta de solucin
Seleccionar el nivel de significancia (2)

El nivel de significancia se especific como = 0.01. Si la hiptesis nula fuera


verdadera, no habr ms que una probabilidad de 0.01 de rechazar incorrectamente.

Seleccionar el estadstico de prueba y calcular su valor (3)

El estadstico de prueba ser z, calculada como . El error estndar de la


proporcin de la muestra y el valor calculado del estadstico de prueba son:

= 0.92
Propuesta de solucin

(4)

(5)
Propuesta de solucin

Tomar la decisin correspondiente (6)

La tasa de mortalidad por ciruga cardaca para el


Hospital La Muerte Lenta pudo ser de 0,07 slo por
casualidad, y su cierre no puede ser justificado con
base en el argumento es significativamente mayor
que 0,05.
Prueba de hiptesis de dos poblaciones

Con frecuencia queremos hacer comparaciones


de dos grupos.
Los mtodos estadsticos usados para la
comparacin de dos medias dependen de cmo
las dos medias fueron obtenidas. Los datos
pueden ser obtenidos de muestras pareadas
(pares de datos) o no pareadas.
Caso 1. Prueba de z para comparar las medias de dos muestras
independientes

La prueba z se presenta como una alternativa de la prueba t con


varianzas desiguales cuando n1 y n2 son 30. Adems de no
requerir suposiciones respecto a la forma de las distribuciones
poblacionales, ofrece la ventaja de una simplicidad ligeramente
mayor y evita los df utilizada en la prueba t con varianzas
desiguales; se usa como mtodo para comparar las medias de dos
muestras grandes, independientes, cuando se desconocen 1 y 2, y
de dos muestras independientes de cualquier tamao cuando se
conocen 1 y 2 y las dos poblaciones tienen una distribucin
normal. Igual que la prueba t con varianzas desiguales, la prueba z
no supone que son iguales las desviaciones estndar poblacionales,
y se utilizan s1 y s2 para estimar las respectivas desviaciones
estndar poblacionales 1 y 2.
Prueba z para comparar las medias de dos muestras
independientes, 1 y 2 son desconocidas y cada n 30:

Donde:
y : medias muestrales 1 y 2.
: diferencia hipottica entre las medias
poblacionales.
n1 y n2 : tamaos de las muestras 1 y 2.
s1 y s2 : desviaciones estndar de las muestras 1 y 2.
Ejemplo

En un estudio para evaluar la eficacia de la solucin de


rehidratacin oral (SRO) en nios con diarrea, 40 nios
estuvieron en el grupo de tratamiento y otros 40 en el
grupo control. Se midi la duracin media en horas de
la diarrea y la desviacin estndar.
Media de
Grupo n S
duracin

Tratamiento 40 72 10

Control 40 120 12

Probar la eficacia de la SRO.


Prueba de hiptesis para dos medias independientes...
Para calcular la probabilidad (valor de p) de que las dos
medias son iguales, usamos la prueba de hiptesis.
La hiptesis nula es que las dos medias son iguales:
Ho: 1 2 = 0
La hiptesis alternativa es: H1: 1 - 2 0
La frmula para la prueba de z es:
_ _
(X1 X2) - 0
z = ------------------
ES(X1 X2)
Donde ES (X1 X2) (Error estndar para la distribucin de la
diferencia de medias):

ES (X1 X2) = (s21 /n1 + s21 /n2)


Ejemplo...
Apliquemos la prueba de hiptesis para el estudio de
SRO, de que la duracin de la diarrea es en promedio
la misma para ambos grupos.
La diferencia de medias es 48 horas. El error
estndar es 2.47.
- 48 - 0
Z = ----------- = - 19.43
2.47
Esto nos dice que la diferencia observada es -19.43
errores estndar del centro de la distribucin (cero).
El valor de p, para z = - 19.43 es < 0.0001
Si no hubiera diferencia en la duracin de la diarrea entre los dos
grupos, debera haber una pequea oportunidad (p < 0.0001) de
observar una diferencia tan extrema como la observamos.
Podemos decir que es ms probable que la diferencia entre las dos
medias sea diferentes, o sea, que la diferencia en el promedio del
grupo con SRO con el control, son estadsticamente diferentes.
Caso 2. Muestras pequeas con dos medias
independientes

Cuando comparamos dos muestras independientes


que son pequeas, usamos la distribucin t en lugar de
la distribucin Normal para calcular los intervalos de
confianza y para probar hiptesis.
El procedimiento es similar al usado para datos de una
muestra, con una excepcin: el clculo del error
estndar.
La varianza comn:
Con muestras pequeas estimamos una varianza comn
usando los datos de dos muestras independientes. Es el
promedio de las dos varianzas:

(n1 1)s21 + (n2 -1)s22


S2 = -----------------------------
(n1 1) + (n2 -1)
Prueba de hiptesis para la diferencia de dos medias desviaciones
estndar poblacionales desconocidas pero iguales y muestras
pequeas - Muestras independientes
Cuando se plantean hiptesis para la diferencia de medias de
dos poblaciones, desviaciones estndar poblacionales
desconocidas y tamao de muestra pequeo, el estadstico
de prueba est dado por:
( x1 x2 ) ( m1 m )
t= t gl =n1 n2 2
2 1 1
Sp( )
n1 n2
(n1 1) * S (n2 1) * S
2 2
S =
2 1 2
(n1 1) (n2 1)
p

el cual se distribuye como una t de Student con (n1 + n2 2)


grados de libertad
Ejemplo 1. Se tienen los resultados de un anlisis del peso de
calcio en cemento estndar y en cemento contaminado con
plomo. Los niveles bajos en calcio indican que el mecanismo de
hidratacin del cemento queda bloqueado y esto permite que el
agua ataque varias partes de una estructura de cemento. Al tomar
10 muestras del cemento estndar, se encontr que el peso
promedio de calcio es de 90 con una desviacin estndar de 5; los
resultados obtenidos con 15 muestras de cemento contaminado
con plomo fueron de 87 en promedio con una desviacin
estndar de 4. Supn que el porcentaje de peso de calcio est
distribuido de manera normal Existen diferencias en la media
del peso de cemento entre el estndar y el contaminado con un
nivel de significancia del 95%? Por otra parte, suponga que las
dos poblaciones normales tienen la misma desviacin estndar.
Propuesta de solucin
Poblaciones con igual varianza

Muestras pequeas < 30

El estadstico a utilizar es la distribucin t ya que la muestra es


pequea y no tenemos la varianza poblacional.

Reemplazando tenemos
Propuesta de solucin...

Regla de decisin se acepta si t > -2,069 o t < 2,069 en


otros casos se rechaza y se acepta

Operando tenemos t = 1,586

Como la t < 2,069 no se rechaza

Conclusin: no existe diferencia en la media del peso del


calcio entre el cemento estndar y el contaminado.
Ejercicio 2. Tres muestras de concreto de alta calidad tienen las
siguientes resistencias de compresin (en kg/cm2)
357 359 413
Para tres muestras de concreto ordinario, los valores fueron
346 358 302
Asumiendo que las poblaciones de donde se han tomado las
muestras estn distribuidas normalmente y tienen la misma
variancia, probar la hiptesis de que las medias de la poblacin
correspondiente x, y son iguales, contra la alternativa sugerida
x > y por la naturaleza del experimento.
Ejemplo 2. Se desea saber si existen diferencias entre ambos grupos
GRUPO 1 6,2 6,3 5,4 4,5 5,0 4,7 5,7 3,3
GRUPO 2 5,8 6,6 6,8 5,9 5,4 5,0 6,5 6,7

Ho: 1 2 = 0

H1: 1 - 2 0

n1 = 8 x1 = 5,14 S1 = 0,99
n2 = 8 x2 = 6,09 S 2 = 0,66
___ ___

t = X X 1 2

(n 1 ) s (n 1 ) s 1 1
2 2

1 1 2 2
(n 1) (n 1)
1 n n2 1 2
Ejemplo 2
n1 = 8 x1 = 5,14 S1 = 0,99
n2 = 8 x2 = 6,09 S 2 = 0,66
___ ___

t = X X 1 2

(n 1 ) s (n 1 ) s 1 1
2 2

1 1
2 2
(n 1) (n 1)
1 n n
2 1 2

CLCULO DEL VALOR T OBSERVADO

5,14 6,09
t =
(8 1)0,992 (8 1)0,662 1 1

(8 1) (8 1) 8 8
Ejemplo 2
Valor calculado
to = 2.28

Existen diferencias de rend. favorables


= 0.05 bilateral al grupo 2 ( x 2 = 6,09) respecto del grupo 1
valor critico ( x1 = 5,14), t(14) = 2,28, p < 0.05.

t0.025;14 = 2.14
t0.975;14 = 2.14
grados de libertad
(n1 - 1) + (n2 - 1)
to = 2.28

Se Rechaza Ho
Ejemplo 3. Se lleva a cabo un experimento para comparar
el desgaste por abrasivo (*) de dos diferentes materiales
laminados. Se prueban 12 piezas del material 1 mediante
la exposicin de cada pieza a una mquina para medir el
desgaste. Diez piezas del material 2 se prueban de
manera similar. En cada caso, se mide la profundidad del
desgaste. Las muestras del material 1 dan un desgaste
promedio de 85 unidades con una desviacin estndar
muestral de 4, mientras que las muestras del material 2
dan un promedio de 81, desviacin estndar muestral de 5
Podemos concluir con un nivel de significancia del 0.05
que el desgaste abrasivo del material 1 excede el del
material 2 en dos unidades?
(*) Sustancia que tiene como finalidad actuar sobre otros
materiales con diferentes clases de esfuerzo mecnico
triturado, molienda, corte, pulido.
Propuesta de solucin:

Representemos con y las medias poblacionales del


desgaste abrasivo para el material 1 y 2, respectiva-
mente.

H: - = 2
H: - 2
= 0,05

Regin critica: con = 20 grados de libertad t > 1,725


Las regiones criticas unilaterales rechaza a H: - =
d cuando t > t(n + n - 2)
Propuesta de solucin
Clculos:

x1 = 85 s1 = 4 n1 = 12
x 2 = 81 s2 = 5 n 2 = 10

(11)(16 ) (9)( 25 ) (85 81) 2


sp = = 4.478, t = = 1,04
12 10 - 2 4 . 478 (1 / 12 ) (1 / 10 )

P = P(T > 1,04) 0,16

Decisin: No rechazar H. Somos incapaces de concluir


que el desgaste abrasivo del material 1 excede el del
material 2 en ms de dos unidades.
Ejemplo 4. Suponga que Francisco Rupto, analista
financiero, desea comparar el rdito de dividendos
promedio de las acciones negociadas en la Bolsa
de Nueva York (NYSE) con los producidos por las
acciones negociadas directamente en la BVL. Se
seleccion una muestra aleatoria de 21 compaas
de la NYSE y otra de 25 acciones que se negocian
en la BVL. Los resultados se presentan a
continuacin:
Bolsa de Nueva York BVL
Rdito de Rdito de
Compaa Compaa
Dividendo Dividendo
American Express 3,4 Antamina 1,2

Anheuser-Bush 2,7 Southern 5,1

Bristol-Myers-Squibb 5,4 Credicorp 4,3

Dayton-Hudson 2,1 Luz del SUR 0,8

Dresser Industries 3,0 CLAE 3,2

Ford Motors 3,1 Banco BBVA 3,0

General Electric 3,0 Banco Ali Baba 3,8


General Mills 3,5 Harper Group 1,3

IBM 1,6 Innovex 2,2

Kellogs Co. 2,6 Intel Corp. 0,4

Merck & Co. 3,6 Lindberg Corp. 2,7

NYNEX 6,4 Natures Sunshine Prod. 1,5

Occidental Petroleum 5,3 Newcor 2,1

Pfizer Inc. 3,0 PCA Internacional 3,3

PPG Inc. 3,0 T Rowe Price Assoc. 1,8

Sara Lee Corp. 2,9 PSB Holding Corp. 2,4


Texaco Inc. 5,0 Research Inc. 4,6

Texas Instruments 0,9 Seacoast Banking Corp. 2,8

Whirlpool Corp. 2,2 Span-America Med. Sys. 1,8


Winn-Dixe 3,1 Sumitomo Bank of Cal. 3,6

Seros Corp. 2,9 TCA Cable TV 2,2

United Fire & Casualty 2,8

West Coast Bancorp 1,7


Whitney Holding Corp. 2,6

Worthington Industries 2,1


Propuesta de solucin:
1) Planteo de hiptesis
Ho : m1 = m2
Ha : m1 m2
2) Nivel de significacin
= 0,01

x x 2 - m1 m2
3) Prueba estadstica
=
1
tc
1 1
S
2

n1 n2
p

con los supuestos:


- las poblaciones se distribuyen normalmente
- las muestras han sido seleccionadas al azar

Variancia =
1 1 2 2
n 1 S 2
n 1 S 2

S p2 n1 n2 2
ponderada
4) Criterios de decisin
to con (n1 + n2 - 2) = 2,0154

ZONA DE

m1 m2 ACEPTACIN
m1 > m2
m1 = m2
ZONA DE ZONA DE
RECHAZO RECHAZO

/2 1- /2
-t t
-2,0154 2,0154

Si {2,0154 tc 2,0154} se rechaza la Ho, en


caso contrario no se rechaza
5) Clculos 20(1,30 )2 24 1,16
2
=
2
S p
21 25 2

66,432
S 2 = = 1,51
p 44

Entonces (3,27 2,53) 0


tc =
1 1
1,510
21 25
0,74
tc = = 2,03
0,364
6) Conclusiones
a) Se rechaza la hiptesis planteada y se acepta la
hiptesis alternante a un nivel de significacin
de 0,05. La prueba es significativa.
b) La evidencia estadstica disponible permite
rechazar la hiptesis nula.
c) Es muy probable que el rdito de dividendos
promedio de las acciones negociadas en la
NYSE es mayor al rdito de dividendos
promedio de los producidos por las acciones
negociadas en la BVL.
Ejercicio 1. Para comparar la resistencia a la tensin de dos tipos de cemento, se
hicieron seis briquetas de argamasa con cada uno de ellos, y se registraron las
siguientes resistencias (kN/m2):
Cemento A : 4600; 4710; 4820; 4670; 4760 y 4480
Cemento B : 4400; 4450; 4700; 4400; 4170 y 4100
Existe una diferencia significativa entre las resistencias a la tensin de ambos
cementos? Utiliza = 10%.
Rpta. t calculada es 3,02. Hay una diferencia significativa al nivel de
significacin del 5%.
Ejercicio 2. Se llevan a cabo pruebas de resistencia a la tensin sobre dos
diferentes clases de largueros de acero utilizados en la construccin. De
experiencia pasada con el proceso de construccin las desviaciones estndar de
la resistencia a la tensin son conocidas e iguales. Se sabe que el
comportamiento de las resistencias a la tensin de las dos clases de largueros es
aproximadamente normal. Se toma una muestra de 10 largueros del tipo 1
obtenindose una media de 87,6 kg/mm2, desviacin estndar de 1,0 kg/mm2 y
otra de tamao 12 para el larguero 2 obtenindose una media de 86,5 kg/mm2 y
desviacin estndar de 1,5 kg/mm2 Se podra afirmar que la resistencia a la
tensin media para el larguero 1 es mayor a la del larguero 2 con un nivel de
confianza del 95%?
Rpta. Z = 2,052. Conclusin _________________
Caso 3. Prueba de hiptesis para dos medias desviacin
estndar poblacional conocida o muestras grandes. Muestras
independientes
Cuando se plantean hiptesis para la diferencia de medias de
dos poblaciones y las desviaciones estndar poblacionales
son conocidas o el tamao de la muestra es grande, el
estadstico de prueba est dado por:

( x1 x2 ) ( m1 m 2)
z= N (0,1)
s1 s 2
2 2

n1 n2
el cual se distribuye como una Normal de media 0 y desvo
estndar 1.
Prueba de hiptesis sobre la igualdad de dos medias
(varianzas conocidas)

Ejemplo 1. Jos Mastrkalo, diseador de interiores, quiere


reducir el tiempo de secado de una pintura. Se prueban dos
frmulas de pintura. La frmula 1 es la normal y la frmula 2
posee un ingrediente secante que se espera reduzca el tiempo de
secado. Se sabe que el tiempo de secado tiene una desviacin
estndar de 8 min y que sta no se afecta con la adicin del nuevo
ingrediente. Se pintan diez especmenes
_ con la frmula
_ 1, y diez
con la frmula 2, obtenindose tiempos promedio de secado de x1
= 121 min, y x2 = 112 min respectivamente A qu conclusin se
llega sobre la eficacia del nuevo ingrediente utilizando = 0,05?
1) Cantidad de inters: m1 - m2
2) H0: m1 = m2
3) H1: m1 > m2 (se busca evidencia fuerte que indique que el
tiempo de secado promedio de la muestra 2 es menor)
Prueba de hiptesis sobre la igualdad de dos medias
(varianzas conocidas)
4 = 0,05
___ ___ 12 22
5) El estadstico de prueba es Z = ( X1 X 2) /
N1 N2

6) H0 se rechazar si z > z0.05 = 1,645


7) Sustituyendo obtenemos z = (121 - 112)/(12,8)1/2 = 2,52
8) Conclusin: Puesto que z = 2,52 > 1,645 se rechaza H0 con un
nivel de significancia = 0,05 concluyndose que el nuevo
ingrediente s disminuye el tiempo de secado.

Alternativamente puede calcularse un valor P = 1 - F(2,52) =


0,0059, es decir, se rechazar H0 para cualquier nivel de
significancia 0,0059
Ejemplo 2.
Se desea saber si el demanda de agua mineral sin gas es igual al
consumo de agua mineral con gas de la marca SCIELO, para lo
cual se hace un muestreo aleatorio entre 10 distribuidoras
resultando que se venden en promedio 20 litros diarios de agua
mineral con gas (S1 = 3).
De manera simultnea se hace otro muestreo aleatorio entre
otras 5 distribuidoras resultando que se vende en promedio 16
litros diarios de agua mineral sin gas (S2 = 2).
Podemos afirmar que la demanda de ambos tipos de agua
mineral son iguales?
Propuesta de solucin

Ho: 1 = 2
H1: 1 2

Con un = 0,10

Usamos el estadstico de prueba t:


t = x1 x2
Sx1-x2
donde: Sx1-x2 = (n1)S12 + (n2)S22 (n1 + n2)
n1 + n2 -2 n1.n2
Sx1-x2 = (9)(3)2 + (4)(2)2 . 10 + 5
10+5-2 (10)(5)
= 1.59

Entonces : t = 20 16 = 2.52
1.59

Cuando: = 0.10 y gl = 10 + 5 - 2 = 13

Para una prueba de dos colas nos da 1,77. Como la t


calculada es mayor que la t critica, rechazamos la hiptesis
nula que sostiene que la demanda de agua mineral de
ambos tipos son iguales.
Caso 4. Prueba de hiptesis para dos medias desviaciones
estndar poblacionales desconocidas, distintas y muestras
pequeas - Muestras independientes
Cuando se plantean hiptesis para la diferencia de medias de
dos poblaciones y las desviaciones estndar poblacionales son
desconocidas y el tamao de la muestra es pequeo, el
estadstico de prueba est dado por:
( x1 x2 ) ( m1 m )
t= t gl =v
2 2
S S
( )
1 2
n1 n2
S12 S 22 2
( )
n1 n2
v= parte entera
S12 2 S 22 2
( ) ( )
n1 n
2
(n1 1) (n2 1)

el cual se distribuye como una t de Student con v grados de


libertad
Caso 5. Prueba de hiptesis para dos medias desviacin
estndar poblacional conocida o muestras grandes Muestras
relacionadas o dependientes
Cuando las muestras estn relacionadas y se quiere probar si
luego de aplicar un tratamiento las medias difieren
(antes/despus) y las desviaciones estndar poblacionales
son desconocidas y el tamao de la muestra es pequeo, el
estadstico de prueba est dado por:

d md
t= t gl = n 1
sd
n
n

i
n n

d (x x )
i i 2
( d d ) 2

d= i =1
= i =1 S 2d = i =1

n n n 1
el cual se distribuye como una t de Student con n - 1 grados
de libertad.
Ejemplo. Al investigar la manera de aumentar la productividad en
las oficinas, el gerente de la empresa de saneamiento Yo Hago
Agua adquiri 12 teclados ergonomtricos y los distribuy a un
grupo de secretarias. Si los teclados aumentan la productividad de
manera sustancial, el gerente planea sustituir todos los teclados
actuales por los modelos nuevos. Antes de entregar los teclados,
cada uno de los 12 integrantes de la muestra escribi un documento
comn con su viejo teclado, y se midi el nmero de palabras por
minuto. Despus de recibir los nuevos teclados y de dedicar
algunas semanas a familiarizarse con ellos, cada secretaria escribi
el mismo documento con el modelo ergonomtrico.
La siguiente tabla contiene el nmero de palabras por
minuto que escribi cada secretaria en cada prueba:
x2,
x1, Palabras/Minuto Palabras/Minuto Diferencia Diferencia
Secretaria
con teclado viejo con teclado d = (x1 - x2) al cuadrado
nuevo
1 25.5 43.6 -18.1 327.61
2 59.2 69.9 -10.7 114.49
3 38.4 39.8 -1.4 1.96
4 66.8 73.4 -6.6 43.56
5 44.9 50.2 -5.3 28.09
6 47.4 53.9 -6.5 42.25
7 41.6 40.3 1.3 1.69
8 48.9 58.0 -9.1 82.81
9 60.7 66.9 -6.2 38.44
10 41.0 66.5 -25.5 650.25
11 36.1 27.4 8.7 75.69
12 34.4 33.7 0.7 0.49
-78.7 1407.33
= =

Existe mayor velocidad con los teclados ergonomtricos?


Propuesta de solucin
Propuesta de solucin
Propuesta de solucin
Comparacin de dos proporciones muestrales
Las siguientes son algunas situaciones
posibles:
1.- Comparar el porcentaje de piezas
defectuosas entre embarques de dos
proveedores diferentes.
2.- Determinar si la proporcin de pacientes
con dolor de cabeza que sienten alivio con un
nuevo medicamento es significativamente
mayor que quienes emplean aspirina.
3.- Comparar el porcentaje de alumnos de
ltimo ao de enseanza media enrolados en
el servicio militar que vieron la versin A de
una pelcula sobre el reclutamiento comparado
con quienes vieron la versin B.
Las pruebas suponen que ambos
tamaos de muestras son grandes (cada uno
n 30) .Adems, n1p1, n1(1 p1), n2p2 y n2(1
p2), todos deben ser 5. (Estos requisitos son
necesarios para que la distribucin normal
utilizada sea una aproximacin cercana a la
distribucin binomial). Igual que la
comparacin de medias de muestras
independientes, las pruebas relacionadas con
proporciones pueden ser direccionales o no
direccionales.
Estadstico de la prueba para comparar
proporciones de dos muestras
independientes
1.- Cuando la diferencia hipottica es cero (lo
usual)

; donde:
P1 y p2 = las proporciones muestrales
n1 y n2 = los tamaos de las muestras
= la estimacin combinada de la proporcin
poblacional, con
Estadstico de la prueba para comparar
proporciones de dos muestras
independientes

2.- Cuando la diferencia hipottica es


( 0 0
Ejemplo. En un estudio que dur diez aos, 3 806 hombres de
mediana edad con niveles altos de colesterol, pero sin problemas
cardacos detectados, se dividieron en dos grupos. Los
integrantes del primero recibieron un nuevo medicamento
diseado para reducir los niveles de colesterol, mientras que los
del segundo recibieron diariamente dosis de un placebo. Adems
de reducir los niveles de colesterol, el medicamento pareca
eficaz para reducir la incidencia de infartos cardacos. Durante
los diez aos, 155 integrantes del primer grupo sufrieron un
infarto, mientras que del grupo con placebos, 187 sufrieron un
infarto. Compruebe la eficacia del nuevo medicamento
Propuesta de solucin:
Suponiendo que los 3806 participantes se
dividieron de manera aleatoria en dos
grupos, haba 1903 hombres en cada grupo.
As, las proporciones muestrales de infartos
dentro de los dos grupos son p1 = 155/1905
= 0.0815 y p2 = 187/1903 = 0.0983. Dado
que la intencin del estudio era evaluar la
eficacia del nuevo medicamento, la prueba
de hiptesis ser direccional. En trminos de
las proporciones poblacionales, las hiptesis
nula y alternativa son y
. Las hiptesis tambin se
Solucin...
Hiptesis nula
Los usuarios del nuevo medicamento tienen
una menor probabilidad de sufrir un infarto.
Hiptesis alternativa
Los usuarios del nuevo medicamento tienen
cuando menos la misma probabilidad de sufrir un infarto.
Para poner a prueba la hiptesis nula, utilizaremos el nivel de
significancia de 0.05. La estimacin combinada de las proporciones
poblacionales (que se suponen iguales) se calcula como:

= 0.0899
El valor calculado del estadstico de la prueba, z, es:
Solucin...

Para el nivel de 0.05 en esta prueba de cola izquierda, el valor crtico de z


es z = -1.645. La regla de decisin es, Rechazar H0 si el valor calculado
del estadstico de la prueba es < - 1.645; de lo contrario, no rechazar.
Como se puede apreciar, el valor calculado del estadstico de la prueba, z =
-1.81, es menor que el valor crtico y cae dentro de la regin de rechazo.
Con un nivel de significancia de 0.05, se rechaza la hiptesis nula y
concluimos que el nuevo medicamento es eficaz.
Usando la tabla de distribucin normal y buscando el rea del punto medio
a z = -1.81, encontramos que el rea es 0.4649. Restando este valor de
0.5000, el rea de una cola (0.5000 0.4649) es 0.0351. Este es el valor de
p aproximado para la prueba.
Prueba de hiptesis para diferencia de proporciones

Ejemplo. Supn que Jose Chu Leton, director de personal,


se encuentra investigando la consideracin de los
empleados sobre la justicia de dos diferentes mtodos de
evaluacin del desempeo en su trabajo. Para probar las
diferencias entre los dos mtodos se asignaron, de manera
aleatoria, 160 empleados para ser evaluados con uno de los
mtodos. Un total de 78 empleados fueron asignados para
ser evaluados con el mtodo 1, que permite a los sujetos
proporcionar una retroalimentacin a los requerimientos de
supervisin como parte del proceso de evaluacin. Los
restantes 82 empleados fueron evaluados con el mtodo 2,
que permite a los individuos proporcionar estimaciones
propias sobre su desempeo..
Ejemplo...
Despus de las evaluaciones, se pregunt a los
empleados si consideraban que el proceso de evaluacin
de desempeo haba sido justo. De la primera muestra, 63
empleados sentan que el mtodo 1 es justo. De la
segunda muestra, 49 empleados creen que el mtodo 2 es
justo. Los resultados se muestran a continuacin.
Mtodo de
evaluacin
1 2
Tamao de la muestra n1 = 78 n2 = 82
N de empleados que
consideraron que el mtodo es X1 = 63 X2 = 49
justo
Utiliza un nivel de significacin de 0,01 para probar la
hiptesis respectiva.
Propuesta de solucin:
1) Planteo de hiptesis
Ho : p1 = p2
Ha : p1 p2
2) Nivel de significacin:
= 0,01
3) Prueba estadstica
( p1 - p2 ) - (p 1 - p 2 )
Zc =
s p1- p2

con los supuestos:


- las poblaciones se distribuyen normalmente
- las muestras se han elegido al azar
Solucin...
4) Criterios de decisin

ZONA DE

p1 p2 ACEPTACIN
p1 > p2
p1 = p2
ZONA DE ZONA DE
RECHAZO RECHAZO

/2 1- /2
-Z Z
- 2,58 2,58

Si {2,58 Zc <-2,58} se rechaza la Ho, en


caso contrario se acepta
Solucin... 5) Clculos
X 1 63 X 2 49
p1 = = = 0,808 p2 = = = 0,598
n1 78 n2 82

n1p1 n 2p2 780,808 (82)(0,598) 112


p = = = = 0,70
n1 n 2 78 82 160

p q p q (0,808)(1 0,808) (0,598)(1 0,598)


s = =
p1 p2 n n
78 82
1 2
s 1 2 = 0,005253
p p
Entonces, ( p - p ) - (p 1 - p 2 ) (0,808 0,598) 0
Zc = 1 2
=
s p -p 1 2
0,005253
0,210
Zc = = 2,90
0,0725
Solucin...
6) Conclusiones

a) Se rechaza la hiptesis planteada y se acepta la


hiptesis alternante a un nivel de significacin de
0,01. La prueba fue altamente significativa.
b) La evidencia estadstica no permite aceptar la
hiptesis nula.
c) Existe diferencia significativa en la proporcin de
empleados que perciben que el mtodo fue justo
comparando los dos mtodos. Es muy probable
que los empleados evaluados por el mtodo 1
perciban mayor justicia que los del mtodo 2.

You might also like