Professional Documents
Culture Documents
Y 0 aprox
X
t (v) , con v = 13.745
E.P. TC = 2
= 14 .
S1
S22
+ 10
10
R.Crtica:
{TC | TC > t/2 (14)} = {TC | |TC | > t0.025 (14) } = { TC | |TC | > 2.145 }
421 426
TC =
= 3.3989 3.40 .
4
4.2 2
+ 10
10
un la
Como |TC | = 3.40 > 2.145, se rechaza H0 : y se concluye que seg
informacion suministrada por ambas muestras, hay evidencia suciente
para armar que los puntos medios de fusion son diferentes.
Pruebas de hip
otesis para proporciones
Suponga que X es una v.a tal que X bin(n , p), con p desconocida.
Sea p0 un valor de interes para p.
Tres hipotesis pueden ser planteadas acerca de p.
p < p0
p > P0 .
H0 : p = p0 vs H a :
p = p0
Por el T.L.C. sabemos que si n es grande.
p p
p (1p)
n
Si H0 es cierta
a ser usado es
pp0
p0 (1p0 )
n
aprox
aprox
n(0, 1) .
p p0
ZC =
p0 (1p0 )
n
ZC | ZC < z
ZC | ZC > z
R.C. :
153
Ejemplo
En cierta region, tres candidatos aspiran a cierto cargo p
ublico. Para
elegir uno de los tres se realiza una votacion entre todas las personas
mayores de edad. Para tener idea si existe preferencia por alguno de
los tres, se realiza una encuesta a 1000 personas y se observo 365 a favor
de A, 330 a favor de B y 305 a favor de C. Existe mayor preferencia
por el candidato A?
Soluci
on
X: # votantes en la encuesta a favor de A.
Xi bin (1000, p).
H0 : p =
1
3
vs H1 : p >
1
.
3
Estadstico de Prueba:
p 1/3
ZC = 1 2
aprox
(3)
1000
n(0, 1) .
Si = 0.05
forma:
0.365 1/3
1 2
= 2.12 .
( )
3 3
1000
Z0.02 = 1.96
ZC > 1.96.
La conclusion
154
Si = 0.01
chazar H0 .
Z0.01 = 2.33
p < p0
p > p0 .
H0 : p = p0 vs Ha :
p = p0
E.Prueba
X bin (n, p) .
X |X < k
X |X > k
R.C =
.
X | X > k1 v X > k 2
155
posible encontrar un k tal que la probabilidad de Error Tipo I sea exactamente igual a .
En este caso se halla el menor valor de k tal que
P (Error T ipo I)
P (X > k | p = p0 ) .
Ejemplo
Un tratamiento para dejar de fumar a mostrado ser efectivo en el 60 % de
los casos. Se propone un nuevo tratamiento que se cree mejorara dicho
porcentaje. Para vericar esto se tiene una muestra de 20 voluntarios
que se someten a este tratamiento y 17 de ellos deja de fumar. Es el
nuevo tratamiento mejor?. Use = 0.05. Luego = 0.01. Cambia
la conclusion?
Soluci
on
Sea X: # de pacientes tratados que dejan de fumar.
X bin (20, p). Las hipotesis a probar son:
H0 : p = 0.6 vs Ha : p > 0.6 .
E. Prueba X. Bajo H0 X bin (20, 0.6). R.C.: {X | X > k }.
Si = 0.05, se trata de hallar el menor valor de k tal que: P (X >
k | p = 0.6) 0.05. Ahora, se tiene que:
Si k = 19
Si k = 18
Si k = 17
Si k = 16
Si k = 15
156
100
X
S
50
N (0, 1) .
Z = 1.645
Z = 1.96
Z = 2.05
Z = 2.33
= 0.02 se rechaza H0 , pero para = 0.01, No se
157
158
Observe que: Si < Vp , no se puede rechazar H0 . Si >> Vp , se rechaza H0 con seguridad. Como el valor elegido para puede indicar que se
rechace o acepte H0 , la decision recae en el valor p.
Ejemplo En los datos anteriores se sabe que las tensiones a la ruptura se distribuyen normales n(, 2 ). De una muestra aleatoria de 20
hilos se obtiene una tension a la ruptura promedio de 100.95 con una
desviacion estandar de 2.21psi. Se puede armar que la tension a la
ruptura es superior a 100psi?
Soluci
on
Sea X1 , , X20 una m.a. de una n(, 2 ) que representa las tensiones
a la ruptura de los 20 hilos. De la muestra obtenemos x = 100.95 y
S = 2.21. Las hipotesis a probar son:
TC =
100.95 100
2.21
20
= 1.922 .
159
< 0
> 0
vs Ha :
= 0
P (Z < ZC )
X 0
P (Z > ZC ) .
, Vp :
E.P ZC =
n
P (|Z| > |Zc |)
Caso II: Muestras que provienen de poblaciones normales con varianza
2 desconocida.
P ( t(n 1) < TC )
X 0
P ( t(n 1) > TC )
.
, Vp :
E.P TC =
n
P ( |t(n 1)| > |TC |)
160
P (Z < ZC )
X 0
P (Z > ZC ) .
,
V
:
E.P ZC =
p
S
n
P (|Z| > |Zc |)
Para una porporcion.
H0 : p = p 0
p < p0
p > p0
vs Ha :
p = p0
p p0
p0 (1p0 )
P (Z < ZC )
P (Z > ZC ) .
Vp :
p 0.008
0.008 (10.008)
3000
161
13
= 0.0043, se tiene que ZC = 2.25. Luego, el Valor p de
Como p = 3000
esta prueba se obtiene como:
162
x 2 1 e 2
x>0 , >0.
V ar[X] = 2 .
P X > 2 () = .
Un graco de dicha distribucion y el respectivo cuantil superior se
muestra en la gura 30.
163
Suponga que se tiene una experimento multinomial, es decir una serie
de ensayos (n ensayos) identicos e independientes y k posibles categoras
o clases. Sea p i la probabilidad de clasicar en la categora i y sea Ni el
n
umero de ensayos que caen en la categora i de los n ensayos. Se tiene
que N1 + + Nk = n. Cada Ni sera una v.a. binomial con parametros
n y pi ; i = 1, 2 , k. El n
umero esperado de ensayos en la categora
i es E [Ni ] = n pi ; i = 1, 2 , k
Se desea establecer si los datos observados provienen de cierta distribucion especial con c.d.f. F 0 (x). Las hipotesis a probar son:
H0 : F (x) = F0 (x) vs
Ha : F0 (x) no es la c.d.f. asociada a la muestra.
Si F0 esta claramente especicada, es posible conocer valores particulares para los pi ; i = 1, 2, . . . , k y asi obtener E [Ni ]. En otro caso, los pi
deberan ser estimados y en vez de tener E [Ni ], se estima con n pi .
En resumen tenemos:
clase
1
Frec observada n1
Probabilidad
p1
Frec esperada n p1
2
n2
p2
n p2
...
...
k
nk
pk
n pk
total
n
1
n
Si n pi 5 ; i = 1, 2 . . . , k , la v.a.
X=
k
(Ni n pi ) 2
n pi
i=1
2 (k 1) .
Observe que
X=
k
(Ni n pi ) 2
i=1
n pi
(f.obs f.esp) 2
2 (k 1) .
f.esp
todas las celdas
vs Ha : j tal que pj = pj 0
164
E.P:
XC =
k
(ni n pi ) 2
i=1
n pi
2 (k 1) .
R.C.:
{XC |XC > 2 (k 1) } ;
Finalmente
para dado .
Vp = P 2 (k 1) > XC .
reas a derecha
TABLA PARA LA JI-CUADRADO. A
0,1
0,06
0,05
0,025
0,02
0,01
2,706
3,537
3,841
5,024
5,412
6,635
4,605
5,627
5,991
7,378
7,824
9,210
6,251
7,407
7,815
9,348
9,837 11,345
7,779
9,044
9,488 11,143 11,668 13,277
9,236 10,596 11,070 12,833 13,388 15,086
10,645 12,090 12,592 14,449 15,033 16,812
12,017 13,540 14,067 16,013 16,622 18,475
13,362 14,956 15,507 17,535 18,168 20,090
14,684 16,346 16,919 19,023 19,679 21,666
15,987 17,713 18,307 20,483 21,161 23,209
17,275 19,061 19,675 21,920 22,618 24,725
18,549 20,393 21,026 23,337 24,054 26,217
19,812 21,711 22,362 24,736 25,472 27,688
21,064 23,017 23,685 26,119 26,873 29,141
22,307 24,311 24,996 27,488 28,259 30,578
0,005
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
Ejemplo
Para determinar si un dado esta cargado o no, este es lanzado 600 veces
y se anota cuantas veces aparece cada cara. Los resultados observados
fueron:
165
Cara
Fre.obs
Frec.esp
1
85
100
2
94
100
3
108
100
4
112
100
5
98
100
6
103
100
1
1
, i = 1, 2, , 6 vs Ha : j tal que pj = .
6
6
En este caso la distribucion acumulada F 0 (x), esta asociada a una distribucion uniforme discreta.
Estadstico de Prueba:
XC =
6
(n i 100) 2
i=1
100
2 (5) .
0
11
10
1
11
10
2
9
10
3
8
10
4
8
10
5
11
10
6
9
10
7
11
10
8
13
10
9
9
10
= 10:
F.esperada = 100 10
E.Prueba:
10
(n i 10) 2
Xc =
2 (9) .
10
i=0
H 0 : pi =
166
En este caso Xc = 2.4. As, el valor p de esta prueba es:
V p = P ( 2 (9) > 2.4) >> 0.1 .
En R se usa el comando: ((1-pchisq(2.4,9) = 0.983453 )). Como no se puede rechazar H0 , se asume que los n
umeros se generan aleatoriamente.
El siguiente ejemplo muestra porque no es adecuado usar esta prueba
para datos continuos.
Ejemplo
Una prueba que consta de 100 preguntas es presentada por 50 estudiantes. Se tiene la creencia de que el puntaje obtenido es una v.a. normal.
Los resultados obtenidos son:
30
70
80
40
70
82
42
70
83
52
71
84
55
72
84
60
72
85
60
73
86
62
74
88
64
74
90
65
75
90
66
76
92
66
76
93
67
78
93
67
78
94
68
78
95
68
79
97
68
80
67
= 9.571 10 .
7
167
Las hipotesis a probar son:
H0 : Los puntajes se distribuyen n (, 2 ).
Ha : Los puntajes no se distribuyen n (, 2 ).
Como y 2 son desconocidas, usamos estimadores puntuales para
y S 2.
y 2 ; estos seran X
Bajo H0 asuma que X: puntaje obtenido en la prueba, es una v.a ,
S 2 ). x = 73.64, S = 14.257, n = 50. Para calcular
donde X n (X,
las probabilidades de clase, se procede as:
p1 = P (X < 40|X n (73.64, 203.256))
40 73.64
=P Z<
= P (Z < 2.36) = 0.00914
14.257
Fre.obs
1
2
2
12
16
9
8
Probabilidad
0.00914
0.03932
0.12007
0.22890
0.27622
0.20128
0.12507
Frec.Esperada
0.457
1.966
6.0035
11.445
13.811
10.064
6.2535
168
Clase
< 60
60 X < 70
70 X < 80
80 X < 90
X 90
E. Prueba:
XC =
Fre.obs
5
12
16
9
8
Probabilidad
0.16853
0.22890
0.27622
0.20128
0.12507
5
(n i n pi ) 2
i=1
n pi
Frec.Esperada
8.4265
11.445
13.811
10.064
6.2535
2 (5 2 1) .
169
Usando codigo en R:
shapiro.test(puntajes)
Shapiro-Wilk normality test
data: puntajes
W = 0.9521, p-value = 0.04163
El valor p obtenido permite rechazar H0 y se concluye entonces que los
puntajes obtenidos NO se disstribuyen normalmente. En la gura 32
se muestra la densidad ajustada a los puntajes. Observe que su forma
dista mucho de ser simetrica. El codigo en R:
((plot(density(puntajes), xlab=Puntaje, main=Densidad para Puntajes, ylab=))).
170
Ejemplo
De la produccion diaria de una empresa se seleccionan de manera aleatoria 4 artculos y se examinan uno a uno para vericar si son defectuosos
o no. A pesar de desconocer la proporcion diaria de defectuosos en la
empresa, se tiene la idea de que el n
umero de artculos defectuosos de los
4 seleccionados es Binomial. Para vericarlo, se repite este experimento
durante 100 das y cada vez se registra el n
umero de defectuosos entre
los 4 seleccionados. Los resultados se muestran en la siguiente tabla.
No exitos 0
Frec Obs 11
1
17
2
42
3
21
4
9
Verique si en efecto el n
umero de defectuosos tiene una distribucion
Binomial, con n = 4.
Soluci
on
Sea X1 , X2 , , X100 una muestra aleatoria que representa el n
umero
de defectuosos para los 100 das observados. Seg
un el enunciado se desea
probar las hipotesis:
H0 : Xi b(4 , p) vs Ha : Xi no se distribuye b(4 , p) .
171
Como p es desconocido, bajo H0 cierta es posible estimar a p usando el
metodo de maxima verosimilitud.
100
100
100
100
Xi
4Xi
4
4
Xi
4Xi
i=1
i=1
L(p) =
p (1 p)
p
=
(1 p)
.
X
X
i
i
i=1
i=1
100
100
(p) = K +
Xi ln(p) + 4 100
Xi .
i=1
i=1
Al derivar esta u
ltima ecuacion e igualar a cero se obtiene que:
100
1
Xi .
p =
4 100 i=1
4
4
1
, i = 0, 1, 2, 3, 4 .
2
i
1
1
1
1
1
, p1 = 4
, p2 = 6
, p3 = 4
, p4 =
.
16
16
16
16
16
1
17
25
2
42
37.5
3
21
25
4
9
6.25
4
(Ni n pi )2
i=0
n pi
2 (3) .
172
Para los datos observados se tiene que: XC = 8.567 . El valor p de la
prueba se calcula como: V p = P (2 (3) > 8.567) . Observando la tabla
para la Ji-cuadrado, se tiene que
0.025 < V p < 0.05 . Con esta informacion se rechaza H0 y se concluye que seg
un la informacion registrada, el n
umero de exitos NO se
distribuye Binomial con p = 12 .
0 , x < x(1)
k
, x(k) x < x(k+1) .
Sn (x) =
n
1 , x x(n)
Ya que bajo H0 , F0 (x) se encuentra completamente especicada, es posible evaluar F0 (x) para cualquier otro valor de x y compararlo con
Sn (x). Si H0 es cierta, se espera que la diferencia entre Sn (x) y F0 (x)
sea peque
na. La estadstica de Kolmogorov-Smirnov se dene como:
Dn = max |Sn (x) F0 (x)| .
x
173
Ejemplo
A partir de una muestra de 215 estudiantes, se recopilo informacion
acerca de 5 variables de interes: Estrato, Horas (dedicadas semanalmente
a estudiar), Edad (en a
nos), Trab(Trabaja 1:Si; 2: No) y Prom (obtenido
en el semestre anterior). Se muestra una parte de los datos:
> ind[1:10,]
Estrato Horas edad trab prom
1
1
28
20
1 3.8
2
1
24
21
1 3.7
3
1
18
19
1 3.9
4
1
20
20
2 3.7
5
1
23
25
2 3.7
6
1
26
18
2 3.6
7
2
12
35
1 3.0
8
2
30
26
1 3.2
9
2
4
32
1 2.9
10
2
9
26
1 3.4
174