Professional Documents
Culture Documents
RESUMEN
Un problema tipico en series temporales es la estimacin de la
densidad espectral o espectro de un proceso estacionario. Este problema ha sido ampliamente estudiado desde un enfoque paramtrico.
Sin embargo, en los ltimos aos, los mtodos no paramtricos han
crecido en importancia como rntodos de estimacin de funciones, y
en particular para estimar la densidad espectral. En este trabajo proponemos utilizar un M-spline como estimador del espectro. Estudiaremos, en un contexto general, la forma ptima de seleccin del
M-spline y aplicaremos los resultados tericos obtenidos a la estimacin del espectro. Por ltimo, los estudios de Monte Car1o muestran
en la prctica la mejora producida por esta forma de estimacin frente
a otras, tanto paramtricas como no paramtricas.
(*)
Este trabajo es parte de la tesis doctoral de la autora, quien quisiera expresar su ms
sincera gratitud a su director de tesis Fernando Tusell, y a sus compaeros Vicente Nez y
Juan Rodrguez por sus tiles comentarios. Agradezco as mismo la financiacin del proyecto
Direccin General de Enseanza Superor del Ministerio de Educacin y Cencia P695-0346.
436
ESTADSTiCA ESPAOLA
1.
,
iNTRQDUCC^ON
^9fe^^^ ( )^^
donde 9 es un vector de parmetros, f^{} es la densidad espectral, I{} es el periodograma, y ^.E [-1,1 ], {Dzhaparidze, 1986),
Como forma de evitar la inconvenieneia de !a especificacin paramtrica, los
estimadores no paramtricos, basados en la suavizacin del periodograma, aparecen como una solucin razonable. EI problema con los primeros mtodos que
aparecieron (ventanas espectrales, estimador de Daniell}, surga al decidir cunto
suavizar et perodograma. Para los dos principales mtodos no paramtricos existentes, splines y kerneis, este problema se traduce en la eleccin del parmetro de
suavizado, y se puede resolver mediante el uso de distintos criterios objetivos. En
particular, Wahba and Woid (1975) proponen un spline peridico como estimador
del logaritmo del espectro, donde la eleccin del parmetro de suavizado se reaiiza
mediante el mtodo de validacin cruzada mnimo-cuadrtica. Beltro y Bloomfield
{1987} y Hurvich and Beltro (1990) usan estimadores kernel, usando un criterio de
validacin cruzada de !a verosimiiitud para elegir el parmetro de suavizada, basado en la parte principal de la verosimilitud del proceso estacionario de partida.
IVuestro objetivo es utilizar un criterio de mxima verosimilitud en la estimacin
mediante splines, !o que bsicamente significa realizar mxima verosimilitud penalizada. EI origen de esta idea !o encontramos aplicado a estimacin de funciones de
densidad (Good and Gaskins, 1971). En el contexto espectral, Chow y Grenander
(1985} proponen un mtdo "sieve" para estimar la densidad espectral. Aqu proponemos un M-spline {Huber, 1979) como estimador del espectro. Pawitan y
O"Sullivan (1994) han usado este tip0 de estimacin pero no demuestran las propiedades tericas que aqu se derivan.
^i3i
2.
M-SPLINES
2.1.
[2]
donde 4<_ t, < t^ <... < tn < 1 son nodos equiespaciados y los errores aleatorios E; se
suponen independientes e idnticamente distribuidos (iid), con funcin de densidad
denotada por p y varianza 0< cr2 <^.
La estimacin clsica mediante splines implica resolver el problema variacional
en el espacio W2 ={g E C^^^ [0,1 ] tal que g^m"'^, ( m-1 derivada de g), es absolutamente continua y g^m^ E L2[o,1 ]},
'
[3]
^
donde [g,g] _(g{m^ (t)) dt , h es el parmetro de suavizado y m? 2.
Este tipo de estimacin tiene su origen en Whittaker (1923}. Nos referiremos a
la solucin de [3] como al spline clsieo y lo denotaremos por g^,,. Despus de ms
de medio siglo, Huber {1979) propuso los Ilamados M-splines o splines tipo M, que
denotaremos por gM, definidos como los minimizadores sobre W2 del funcionai
438
f^STADESTK'A ESPAlVOLA
h[ 9^ 9^ ,
[4]
{- y}
(2m-1}^ '
para i= 1,...,n. Entonces, el minimizador gM del funcional [4J pertenece al subespacio S^ c W^ , donde S^ = So+ {e^}n ^ y So = { f tal que f^m^ = 0 para casi todo t}. Es
decir, gM es una funcin polinmica a trozos, de grado 2m-1.
Teorema 2. Sea p() una funcin estrictamente convexa, con al menos dos derivadas continuas, de forma que para cualquier u, p"(u) > K> 0. Entonces, existe un
nico minimizador de w(g} en e1 espacio W2 .
Ntese que la condicin p"{) >_ K> 0 es ms fuerte que la convexidad estricta
de p{). De hecho, si slo imponemos que p sea estrictamente convexa, garantizariamos la unicidad pero no Ca existencia.
2.2.
^^^i)
^
^
= ^t.1. { ti } -^- Vi
[5^
439
decir, gCZ minimiza n -' ^{z^ - g(tr))2 + n[g, g] . Todos los splines dependen de h y
; -,
n, dependencia que omitimos en la notacin por simplicidad.
Supuestos. Consideremos y^ E C2, tal que:
(i} M= sup I y^ "1 <^, E^" ^ 0, E yr = 0, Var( ^") <^, Var( u} <>,
( ii) nh ^^m -^ ^ , cuando n --^ ^ y h ---^ ^ .
Consideremos la norma II-II inducida por la distancia usual
1
[6]
Ntese que el supuesto 2 en Cox ( 1983} se cumple aqu bajo el supuesto (ii}.
Este teorema establece que, con alta probabilidad, gM y g^Z comparten las mismas
propiedades asintticas. Est claro que el modelo de pseudo-datos no es til en la
prctica, pero nos permite estudiar fcilmente las propiedades asintticas del
estimador M-spline. De hecho, podemos comparar M-splines con splines clsicos
para un rnismo modelo a travs del anlisis de dos splines clsicos, tales que sus
modelos asociados slo se diferencian en el trmino de error. Mientras en [2] los
errores son ^;, con funcin de densidad p, en el modelo de pseudo-datos los errores
son v; _^(^;)/Eyr ; y, por tanto, en general con diferente funcin de densidad.
Por otra parte, tambin es claro que si p(u) = u2, el spline clsico y el M-spline
coinciden. En este caso ^y(u) = 2u y yi" = 2, por lo que v; = 2^;12 = E; y los modelos
[2] y[5] son equivalentes, como era de esperar.
Sin ernbargo, en general, las diferentes elecciones de la funcin p() proporcionarn diferentes distribuciones de los errores en el modelo equivalente de pseudodatos.
Este hecho nos conducir a1 criterio propuesto de eleccin de p, de la forma
enunciada en el siguiente teorema.
Teorema 4. Consideremos el modelo general [2], y supongamos que se conoce la
funcin de densidad p del #rmino de error p, y es tal que p(^)=p(-^)=p'(^}=p'(-^)= 0.
Entonces, si elegimos como funcin p() _- lo^ p() en [4] y bajo los supuestos (i) y
ESTAD^STICA ESPAOLA
(ii), el modelo asociado de pseudo-datos tiene los errores v; con la menor varianza
posible, en el sentido de que cualquier otra eleccin de p, proporcionara errores de
varianza mayor o igual, en el modelo equivalente de pseudo-datos.
Clyden asinttico dei MISE para M-splines. Para cada estimador spline
A
9 =9^,9^^9M,
MISE(h^ = J E^(t^- ^(t )^ 2dt
[7j
bservemos que
MISE (h^ = J^(t ^ - E^^(t )^^Zdt + J VB^^^^t^^2dt = B ^ h^+ V^^h^
[8]
^n^/7} <
Km t7 2
nh i/(2m)
2.3.
^l
j=1
donde g^;^(t^ denota la funcin estimada en t;, cuando este nodo no se utiliza en la
estimacin.
Un criterio ms general ser el siguiente.
Definicin 1. Llamamos criterio de validacin cruzada tipo M(MCV) a aqul que
selecciona el parmetro de suavizado como el minimizador de
1
[^ 2l
i=^
44 2
3.
3.1.
^STADSTICA ESPAfVOLA
EI rnadelo
r^^,;) _ ? ^
f (^)
2 X2
i ^ ^, n
[ 14]
si
Ji = ^^^ - xZ
^ _ ^, n
donde n= {N/2} +1, ^,; _(i-1)/{n-1), f(^,) denota la verdadera densidad espectral, I(^,)
el periodograma, y^, E[-1,1 ]. De este resultada, la distribucin asinttica de los
errores definidos como ^; = log I(^,;) - log f(^,,), con i= 2,...,n-1 es
Prob(^; <_ u) = Prob(log J; <_ u) _
2 exp(u) 1
_t
PrOb ^ Ji < ex PtU)) = jo
2 exp ( 2 )di
[^ r^]
[16]
donde y; _!og I(^,;) + 0.57772 y q(^,) = log f(1). La funcin de densidad de los errores insesgados es,
P(E) = expcE-c^exp(-exP^^-c))
con C= 0.57772, y donde E(^) = o y Var(^;) = n2/6. {Los valores de los extremos ^,,
y^,,, necesitan otra correccin para el sesgo y tienen diferente varianza.)
Wahba y Wald (1975) consideran este mismo modelo y proponen estimar q(}
con un spline clsico peridico, con seleccin del parmetro de suavizado mediante
CV. Por tanto, el spline g^,, obtenido minimizara
443
[^ 9]
donde p=-log p y p es la densidad definida en [17]. Ntese que minimizar [19] es,
en este caso, equivalente a minimizar
n ^^ {9(^')-exP9(^^)}+h[9^91
[20]
[21]
F.STAD1STiCA E.SPAOLA
donde
m
t.t(t) _ ^8it^-^ +bV2X{t}
^^^
[22]
con t E[0,1], 8={9,,...8m)" un vector de parmetros fijo, b una constante estrictamente positiva, E-- N(o,^ly y X(t} representa un proceso de Wiener estndar. En
este contexto, podemos interpretar un spline clsico como el estimador insesgado
de ^c( ^y, con parmetro de suavizado h= a2/nb. Adems, la matriz de covarianzas
del vector de valores estimados (g^^(t,},...,g^,{t}), ^A(h), es A{h} _{a;,};,;^,,.^.,^, la
matriz de proyeccin que genera los valores estimados a partir de los datos.
Por tanto, con probabilidad 1-, ^u{t;) estar en el intervalo
9cy ^ti ^ - ^a/2 a 2 a^; ^h), gcy Ct j ^ + ZI2
^ 2aii ^h^ *
9y ^^^ - Zi2
^2
6 a^^ (h^
y para e1 M-spline,
Zi2 a^^ th}, 9nn (1^,^^ - 2r2
a^^ (h^ ,
^4 ^
4.
4.1.
Q2^9^ -`
n
i=1
+ 1
2^ ^=^
p^y^ - 9%'^^ -
p.. ^Yr
2
l
- 9^'^l ^9^ - 9^1 ^^
+ h^9' 9^
[23]
Sustituyendo p() y sus derivadas, obtenemos que minimizar Q^(g) es equivalente a minimiiar
n
1
w^2^^ z^2^ - 9^ ^ 2+ h^9^ 9l
n ^_^
[24]
n ^,^
g^k-1] - y, 1 y
w^k] = expl ^/^ - g^k-1]1 ^ 2
[25]
ESTA[^^ST1CA ESPAC}C.A
(En !a prctica, !os resultados son aceptables desde la segunda o tercera iteracin}. En cada iteracin, la seleccin de h se ha efectuado mediante validacin
cruzada mnimo-cuadrtica (CV^. Asintticamente, por tanto, el proceso ser equivalente a minimizar [20], con e! parmetro h elegido mediante MGV.
4.^.
j26]
La razn para presentar los resultados para este proceso tan simple es ofrecer
por un lado los mtodos splines, tanto los splines clsicos como ios M-splines,
como buenas aiternativas frente a estimadores paramtricos, y por otro, analizar si
las diferencias tericas entre ambos tipos de splines se presentan de forma evidente tambin en la prctica.
Por el primer motivo, hems considerado corno mtodo paramtrico un estimador autorregresivo de orden creciente, seleccionado mediante la minimizacin del
FPE, error final de prediccin, definido como:
FPE( r) = N+ r ^o - br1 ^^ -. .. b^ ^ ^ ,
N--r
^8]
l i^
[2g]
4^%
,^
q(^; ) - q(^; ) 12
n ;^^ ^
MSE= -
[30]
SG?SE _ ^
,_,
.f u2
^^ 2
^ ^^
^^ -V2^ ^^
f u2
( ,^ }
[3^ ]
Esta medida aparece como una generalizacin de la medida del error propuesta
por Sims (1974) para el caso paramtrico. Sims define la medida
f(^^ b * (^.) -- b * (^,)12 d^,
[32]
[33]
Esta medida proporciona una idea de la capacidad del estimador para resolver
picos o valles.
Tablas. Hemos generado series temporales de tamaos N= 512, 1024 y 2048,
con 1000 replicaciones cada una.
Las Tablas 1, 2 y 3 presentan los principales resultados de las distribuciones
empricas de los errores descritos anteri0rmente. Los mtodos utilizados se denotan por LSCV, MCV y FP'E y representan en ese orden al spline clsico con selec-
ESTADSTICA ESPAQL,A
5.
CONCLUSIONES
Los resultados obtenidos a lo largo del trabajo proporcionan las siguientes con-
clusiones.
3. En la aplicacin concreta a la estimacin espectral, tanto los resultados tericos como los provenientes de tas simulaciones, Ilevan a considerar al M-spline
elegido como ei rnejor estimador del espectro de entre los estimadores analizados.
4. Por ltimo, en las simulaciones observamos que tambin ios splines clsicos
se presentan corno mejor alternativa de estimacin del espectro que el estimador
pararntrico utilizada. De hecho, los resultados empricos observados para el
proceso simulado se repiten de forma general para una amplia variedad de procesos estacionarios (Ferreira, 1993).
449
APNDICE
Demostracin del Teorema 1
Necesitamos el lema previo
m-,)(^)9(m-t)(^^ +
,
f(m)(t)g(m)(t^dt
[34]
[35]
2m-1
e; (t) = Co + C^t+...+Cm_^t
(2m _ ^) i
[36]
_^
m-1
^
(m} (ti - t)
_^ dt =-- f
(m 1).
(m-1)
m-2
j
^
(m-1) (ti - t)
m-k
t^
(0) m_ 1 i+ f
(
).
o
m-^
_... _ -k-^
f(m-k} ^
m- 2 ^ dt
).
(
^i
+ ^ f' ^t^dt
Cmk^
(
- }. 0
e^k}(0} = t!` l k!
con
r \3
450
ESTADSTICA ESPAOLA
[37]
[38]
4S ^
i) Continuidad. Para ello demostraremos la siguiente caracterizacin : si g ^k converge a g en la norma [38], entonces w(gk) converge a w(g). Directamente de la
definicin de la norma, gk converge a g si y slo si
n
(39]
[40j
F^^ 9 ) = d
F^
de ^U)
En el caso especfico de w,
W^^9)^^)=-^^u^ti^P^^Yi-9^ti^^+2hJog^m)^t^u("')^t^dt
,=t
[41]
(W' (.t) - W' ^9)X f - 9 ) _ ^ ^ (f (^; ) - 9(r; )){P' ^Y; - 9^t; )) - P' (y% - f (t; ))}
;_^
[42]
Ahora bien, aplicando el teorema del valor medio a los valores (y; - gr(t;)) y (y; - f(t;))
obtenemos
452
ESTADSTiCA ESPA{?LA
zcllf-^I^
[43]
E(w)2
^EW ^^z
Sin prdida de la generalidad, podemos considerar las funciones p() tales que
Ey.r' = 1 (En otro caso, el resultada se obtiene tomando p()/ Ey^' en vez de p(}.)
Consideremos la funcin y^ +(log p)' . Como el valor E(x2} es siempre positivo,
cualquiera que sea x, en particular
(^yr + (logp)'^Z^ >
_0
^
[44]
(W (^)a(^)+W(^1
p ' (u
[45]
y, claramente,
r 4^^^)^^09 P )^ ^ ^) P ^ ^) _ - rV^^ ^^) P ^ u)du = -1
[46]
4S3
Por otra parte tenemos r^(log p)'(u)^2 p(u)du ^/ar(-logp)'=1 y usando los resultados obtenidos en la desigualdad [44], riy2 (u) p(u)du - 2+ 1^ 0, lo que nos
Ileva inmediatamente a la expresin
Var(yr) z 1= Var(-log p)' ,
que concluye la demostracin del teorema.
Demostracin del Teorema 5. Podemos escribir
(
(
(
w^Ei ^
Zi -9(i)l^i^-^l^i^-9(i)lti^+ Ew,
Entonces,
z
^^^ ^
^zi - 9(i) ^ti ^^2 - ^^ti ^ - 9(i) ^ ^i ^^ Z +
+ 2 ^^, J (
lri ^ - 9U) l^ i ^^
[47]
[4^l
=1
w" ^e^ )
2
(
2
^9(i)^ri ^ - 1^i ^^
[49J
donde A j es algn valor entre ^y^ - g^^^ ^t^ ^) y^y^ - ^i^ ^^ . Por tanto, minimizar
MCV es equivalente a re solver
4S4
ESTADISTICA ESPAC}LA
min ^
^
n ^^1
re
^' \
- g(i)^t i ^^ +
2 ^ ^ ^ti ^ -9(i)^ti ^^
[50]
Reemplazando ^r' (8^ ^ por E^r' ^ej ^, el problema anter es equivalente a resolver
min ^ ^ ^ yi^e i ^^^
ti ^ - 9(i ) ^ri ^^ + E2 ' ^^ri ^ - 9(i) ^^i ^^ 2 }
i=^
^51 ]
Finalmente, multiplicando esta ^itima expresin por 2/ E^r' obtenemos exactamente [48], lo que completa la equivalencia.
EI nico paso que queda por j ustificar es la sustitucin de yi'^8^^ por el valor
espe rado Ey^'^e^ ^ . La diferencia deb ida a esta sustitucin es
^
z
(
(
2
{E^^^Ei^^u^
i
i^^
}^
ti
-9(i)
^
^^
-w
^^
^lei^^
l^i^
-9(i)
^r
2n^
i= ^
equivalente a
2
/
i^^
^^i^
i^
-w
^^e
-9(i)1ti^^
^
2n^ {Ew ^^
i=^
REFERENCIAS
AKAiKE, H(1969). Fitting autoregressive madels far prediction. Annals of the
lnstitute of Statistical Mathematics, 21:243--247.
BEI.TR^40, K.L and B1.00MFIELD, P(1987). Determining the bandwidth of a kernel
spectrum estimate^} Journa/ af Time Series Ana/ysis, 8:21--38.
4SS
45b
FSTADfSTICA ESPAOLA
Tabla 1
DISTRIBUC^IONES EMP^RICAS, N = 512
Valores extremos, Mediana y Cuartiles
MSE
Mximo
3er. Cuartil
Mediana
1 er. Cuartil
M i n i mo
LSCV
0.21788900
0.10378365
0.05042825
0.02673070
0.00145120
MCV
0.0728654
0.0389526
0.0249221
0.0158349
0.0025223
FPE
0.19525130
0.13478515
0.11260170
0.09416095
0.04319570
0.05426368
0.04659282
0.02607282
0.02377138
0.1146238
0.i 105796
LSCV
0.0592050
0.0278330
0.0129578
0.0067903
0.0006131
MCV
0.02015140
0.01062150
0.00650585
0.00415400
0.00065600
FPE
0.0525746
0.0357152
0.0294564
0.02^L0631
0.0107930
0.01400523
0.01191037
0.006827780
0.006183919
0.0300364
0.0288764
LSCV
MCV
FPE
0.24385530
0.11396885
0.05311505
0.02642025
0.00146870
0.06548100
0.03543880
0.02334010
0.01497765
0.00242700
0.2506147
0.1661308
0.1370763
0.1083027
0.0445616
0.05747292
0.04875718
0.02435859
0.02232161
0.1399548
0.1341978
LSCV
MCV
FPE
1.4882569
0.8131586
0.5220835
0.3513287
0.0735053
0.7181165
0.4465432
0.3442175
0.2648074
0.0887227
1.3417478
1.0079781
0.8777393
0.7783675
0.4856646
0.5450718
0.4990952
0.3532637
0.3351713
0.8891685
0.8663100
4S%
4$$
ESTAaf$TICA ESPAfYOLA
Tabla 2
,
DISTRIBUGIONES EMPIRICAS, N ^ 1024
Valores extremos, Mediana y Cuartiles
MSE
Mximo
3er. Cuartil
Mediana
1 er. Cuartil
Minirno
LSCV
0,09060610
0.04437765
0.02289215
0.01297445
0.00165930
MCV
0.03455130
0.01896750
0.01260165
0.00816780
0.00192580
FPE
0.09758660
0.06697451
0.05588345
0.04634040
0.02222810
0.02445529
0.02132900
0.01313922
0.01206408
0.05691055
0.05485636
LSCV
0.02355840
0.01137625
0.00579775
0.00325095
0.00043010
MCV
0.00924230
0.00498015
0.00325710
0.00210810
0.00048310
FPE
0.02510970
0.01729120
0.01426215
0.01185200
0.00537370
0.00620220
0.005393301
0.003400061
0.003114139
0.01453289
0.01399141
LSCV
0.09106560
0.04495775
0.02286360
0.01283990
0.00165070
MCV
0.03377890
0.01823685
0.01208715
0.00787245
0.00193960
FPE
{3.11182140
0.07480550
0.06^116090
0.04991165
0.02338540
0.02446232
0.02126488
0.01260305
0.01157125
0.06240003
0.05992177
LSCV
0.6147385
0.3570300
0.2431456
0.1835441
0.0623336
MCV
0.3568214
0.2313454
0.1833788
0.1460325
0.0603464
FPE
0.6601238
0.4982609
0.4403910
0.3902574
0.2566475
0.2517811
0.234510 i
0.1876254
0. ^ 791323
0.445767
0.4350i 5
Tabla 3
DISTRIBUCIONES EMPRICAS, N = 2048
Valores extremos, Mediana y Cuartiles
MSE
Mximo
3er. Cuartil
Mediana
1 er. Cuartil
Mnimo
LSCV
0.0374143
0.0193063
0.0112697
0.0069458
0.0009879
MCV
0.017356001
0.009691849
0.006742050
0.004543850
0.000464200
FPE
0.0495E68
0.0344137
0.0285968
0.0237755
0.0115285
0.01188496
0.01065444
0.0069983
0.0064858
0.02912633
0.02806727
LSCV
0.00983030
0.00499330
0.00286035
0.00173210
0.00025510
MCV
0.00445690
0.00249540
0.00172195
0.00116115
0.00011670
FPE
0.01231550
0.00869565
0.00721810
0.00601360
0.00292050
0.007351603
0.007U84597
Valores extremos,
RSE
Mximo
3er. Cuartil
Mediana
1 er. Cuartil
Mnimo
FPE
0.05385520
0.03641735
0.02999500
0.02470980
0.01162650
Mediana y Cuartiles
LSCV
MCV
0.0378206
0.01630180
0.0194060
0.00928255
0.0113092
0.00660765
0.0069545
0.00444080
0.0009984
0.00046960
0.03057776
0.02941224
MCV
FPE
Mximo
1.0392478
0.5131873
0.9387144
3er. Cuartil
Mediana
1 er. Cuartil
Mnirno
0.5618110
0.3496923
0.2432481
0.0801758
0.3222286
0.2506689
0.1947241
0.0882172
0.7070889
0.6219968
0.5520726
0.3366852
0.3655493
0.3338353
0.2570156
0.2443222
0.6297129
0.6142806
4S9