Professional Documents
Culture Documents
1/29
Introduccin
2/29
Introduccin (cont.)
El problema clsico de bondad de ajuste se presenta cuando suponemos que
la hiptesis nula est completamente especificada. As, con base en una m.a.
X1 , X2 , ..., Xn de F (x) se desea probar la hiptesis nula:
H0 : F (x) = F0 (x), para toda x
(1)
(2)
3/29
Introduccin (cont.)
El problema en que estamos interesados es cuando la hiptesis nula es
compuesta, esto es,
H0 : F (x) = F (x; )
(3)
4/29
5/29
Prueba de Shapiro-Wilk
Sean x(1) < x(2) < ... < x(n) las estadsticas de orden de una m.a. de tamao
n de una funcin de distribucin F .
Sea (.) la funcin de distribucin normal estndar. Para probar la hiptesis
de normalidad univariada:
x
H0 : F (x) =
, donde < y > 0 son desconocidos,
n
P
i=1
n
P
2
ai x(i)
(4)
(xi x)
i=1
donde x =
n
1P
xi y
n i=1
Conferencia Bimestral de la AME
6/29
a = (a1 , ..., an ) =
m0 V1
(m0 V1 V1 m)
1/2
7/29
(5)
8/29
9/29
1. La distribucin Weibull
Sea X una v.a. exponencial(). Para > 0, la v.a. Y = X 1/ tiene distribucin
Weibull(, ) con funcin de distribucin
F (y ; , ) = 1 ey , y > 0,
donde es el parmetro de forma.
Se desea probar H0 : F (y ) = F (y ; , ) con base en una m.a. Y1 , Y2 , ..., Yn de
F (y ).
Para esto note que Z = log Y tiene distribucin Gumbel con parmetro de
localidad (log )/ y parmetro de escala 1/.
Debido a que la distribucin Gumbel es de localidad y escala, la prueba de
Anderson-Darling puede ser utilizada para probar H0 con base en los datos
transformados y estimando los parmetros por mxima verosimilitud.
Stephens (1977) obtuvo los valores crticos para la distribucin Gumbel.
10/29
Se dice que la v.a. X tiene distribucin Pareto clsica con parmetro de forma
si tiene funcin de distribucin
F (x; ) = 1 1/x , x > 1, > 0.
(6)
11/29
(7)
donde > 0, y R tal que x > 0 para 0 y 0 < x < / cuando < 0.
Cuando 0+ , F (x; , ) 1 exp (x/) , la cual es la distribucin
Exponencial().
Cuando = 1, F (x; , ) = x/, la cual es la distribucin Uniforme(0, ).
La familia PG contiene distribuciones de cola pesada, la familia de
distribuciones exponencial, as como una subclase de distribuciones Beta y
otras de soporte acotado.
12/29
(8)
13/29
lm
= lm
.
1/ =
x F (x; , )
x
1+ x
(9)
k
X
1
bN = Wnk +1
Wnj+1 ,
k
(10)
j=1
donde
Wj = log Y(j) , j = n k + 1, n k + 2, ..., n.
(11)
y Y(1) < Y(2) < ... < Y(n) son las estadsticas de orden correspondientes a
una m.a. Y1 , Y2 , ..., Yn de la distribucin PG(, ) .
Conferencia Bimestral de la AME
14/29
Sea U = F (X )
, esto es, U = 1 + X . Note que U tiene distribucin
Beta(1/, 1).
Proponemos el siguiente procedimiento en dos etapas para estimar el
parmetro .
15/29
m=
1 X
1 + Xi = 1 + X
n
(12)
i=1
= Pn Xi /n.
donde X
i=1
Por otro lado, el valor esperado de U es E{U} = 1/(1 ).
Entonces, por el mtodo de momentos,
Resolviendo para ,
=1+ X
.
1
(13)
=1 .
X
(14)
16/29
, cuando
< 0.
Entonces, el EMV de
es X(n) = ma
x {X1 , X2 , ..., Xn }.
Un estimador
de es:
= X(n) .
(15)
X
=
.
X X(n)
(16)
17/29
18/29
F (x; , )
(17)
= 1 + x, > 0, <.
Por (17), bajo H0 se tiene una relacin lineal entre Y = F (X ; , )
y X.
Adems, por (18), existe una relacin lineal entre las v.a.
Y = log F (X ; , )
1 y X = log(X ).
19/29
Sea Yi = F n (Xi )
, i = 1, 2, ..., n, donde Fn es la funcin de distribucin
emprica de la m.a. y = k es el estimador dado de Hill.
El coeficiente de correlacin muestral de Xi y Yi , denotado como R1 , es un
estimador de la correlacin lineal entre Y y X cuando 0 < 0.5, donde
__
__
Pn
Yj Y
j=1 Xj X
q
,
(19)
R1 =
n SX2 SY2
__
__
20/29
21/29
+
Sean R(j)
los valores ordenados Rj+ , j = 1, ..., B.
+
c+ = R(B)
.
22/29
F (x; , )
= 1 + x, > 0, <,
(20)
23/29
Prueba de Interseccin-Unin
(21)
24/29
.05
.10
-10
.01
.03
-5
.01
.02
-2
.01
.02
-1
.01
.03
0
.04
.09
1
.04
.09
2
.02
.05
5
.02
.04
10
.03
.08
25/29
n = 50
.02
.11
.67
.21
.52
.40
.64
.87
.61
.21
.04
.35
.70
.15
.41
.85
n = 100
.03
.31
.97
.54
.90
.84
.94
1
.93
.54
.11
.76
.97
.55
.88
.99
26/29
Aplicacin
Osterman (1993) (Reiss y Thomas, 2001) estudi un conjunto de datos que
contiene 135 registros en horas por semana de televidentes. La Tabla 1
presenta los registros que exceden las 20 horas.
Tabla: Horas de TV / semana
20.00
24.00
28.50
20.00
24.75
29.00
20.00
25.00
29.50
20.50
25.00
30.00
20.50
26.00
31.50
22.00
26.00
33.00
22.00
27.00
37.00
22.00
27.00
40.00
23.00
27.50
45.00
23.0
27.5
49.0
27/29
Referencias
Anderson, T.W. y Darling, D.A. (1952). Asymptotic theory of certain
goodness of fit criteria based on stochastic processes. Ann. Math.
Statist., 23, 193-212.
Casella, G. y Berger, J. (1990). Statistical Inference. Brooks/Cole, USA.
Cox D. y Oakes D. (1984). Analysis of Survival Data. Chapman and Hall.
USA.
Kolmogorov, A.N. (1933). Sulla determinasione empirica di una legge di
distribuzione. Giornale dell Istituto Italiano degli Attuari, 4, 83-91.
Reiss, R.D. y Thomas, M. (2007). Statistical Analysis of Extreme
Values with Applications to Insurance, Finance, Hydrology and Other
Fields. 3a Ed. Birkhuser.
Stephens, M.A. (1977). Goodness of Fit for the Extreme Value
Distribution, Biometrika, 64, 583-588.
Shapiro, S.S. y Wilk, M. B. (1965). An analysis of variance test for
normality: complete samples. Biometrika, 52, No. 3/4, 591-611.
Conferencia Bimestral
de la AME
Pruebas para
distribuciones con parmetro
de forma
Wand M. 2010. SemiPar:
Semiparametic
Regression.
R package
version28/29
Referencias
29/29