You are on page 1of 80

Modelos de Series Temporales

Mara Cruz Valsero Blanco Departamento de Estadstica e Investigacin Operativa Universidad de Valladoli

Introduccin:
Una serie de tiempo o serie temporal es una coleccin de observaciones tomadas a lo largo del tiempo. Las observaciones estn ordenadas respecto al tiempo y sucesivas observaciones son generalmente dependientes. De hecho esta dependencia entre las observaciones jugar un papel importante en el anlisis de la serie. DenotaremosXt, a la observacin en el instante t. Las series aparecen en diversos campos. Economa Precios de venta en das sucesivos. Exportaciones totales en sucesivos aos. Beneficios de una empresa en sucesivos aos Fsica (Meteorologa, Geofsica, etc...) Lluvias en sucesivos das. Temperatura en sucesivas horas. Presin atmosfrica en diversos das. Demografa Poblacin de Espaa medida anualmente. Procesos de control El problema consiste en detectar cambios en la ejecucin de un proceso de manufactura. Para ello se considera una variable que nos muestra la calidad del proceso. Esta medida se representa frente al tiempo y cuando se aleja de un determinado valor lmite, entonces hemos de efectuar las correcciones oportunas sobre el proceso. Procesos binarios Son unas series temporales especiales, en las que las observaciones, slo toman dos valores (que usualmente se representan por 0 y 1), suelen darse en teora de la comunicacin. Por ejemplo la posicin de un enchufe, bien apagado o encendido puede ser represetado como 0 y 1, respectivamente.

Clasificacin
Clasificamos las series atendiendo a distintos puntos de vista. Segn la recogida de los datos tenemos: Continua. Una serie de tiempo es continua cuando las observaciones son tomadas continuamente en el tiempo, aun cuando la variable medida slo tome un nmero de valores finitos.

Discreta. Una serie temporal es discreta cuando las observaciones son tomadas en tiempos especficos, normalmente igualmente espaciados. stas sern las que nosotros estudiaremos; se supondrn los datos en intervalos regulares de tiempo (horas, das, meses, aos,..). El trmino discreto es usado aun cuando la variable medida sea continua. Las series discretas pueden surgir de varias maneras: Muestral. Dada una serie de tipo continua es posible construir una serie de tipo discreta, tomando los valores en intervalos de tiempo de igual longitud. Un ejemplo de serie temporal de tipo continua es la temperatura en un lugar dado, considerando la temperatura diaria a las tres de la tarde, obtenemos una serie temporal discreta muestral. Agregada o acumulada. Este tipo de series ocurre cuando una variable no tiene valor en un instante (slo tiene sentido en algunos instantes de tiempo) pero podemos acumular los valores en intervalos de tiempo igualmente espaciados. Ejemplos: las lluvias torrenciales, los accidentes de trfico mensualmente, el nmero de pasajeros mensuales en las lneas areas espaolas. De hecho los accidentes de trfico mensuales son una agregacin de sucesos discretos. Los valores tomados no se observan en cada instante sino que se vanacumulando en intervalos de tiempo. Inherentes o discretas Las que realmente los datos se obtienen en momentos discretos. Por ejemplo el salario mensual. Teniendo en cuenta el nmero de variables que observamos en cada tiempo. Series temporales univariantes Cuando interviene una sola variable. Series temporales multivariantes Cuando intervienen varias variables. El primer paso a llevar a cabo en cualquier anlisis de una serie de tiempo es realizar la representacin grfica de la serie. En el eje horizontal se representa la escala del tiempo, y en el eje vertical, los valores asignados a los tiempos. Es habitual observar que los datos aparentemente fluctan a lo largo del tiempo en torno a algn patrn. Desde un punto de vista formal, este hecho responde al concepto de proceso estocstico, concepto matemtico que hay subyacente en una serie temporal. La representacin grfica de una serie de tiempo es la representacin de una trayectoria del proceso estocstico subyacente. En dicha representacin, podemos observar las principales fuentes de variacin.

Descomposicin Clsica
Tradicionalmente se establecen cuatro tipos de variaciones: tendencia, efecto estacional, cambios cclicos y otras variaciones que podemos llamar irregulares. Efecto estacional: Muchas series temporales tales como por ejemplo: cifras de ventas, lecturas de temperatura, etc..., presentan una variacin que se va repitiendo a lo largo de la trayectoria. Este tipo de variacin, con periodicidad,en general, menor o igual a un ao, se conoce con el nombre de estacionalidad. Esta componente es debida al entorno en el que se recogen los datos, ya que la mayoria de procesos varian segn la estacin del ao (navidad, verano etc) o el da de la semana, horario diurno o nocturno etc. Es fcil de comprender y se puede calcular, eliminar o modelar. Cambios cclicos: Adems de los efectos estacionales algunas series presentan variaciones sin perodo fijo, debido a algunas otras causas fsicas. Un ejemplo es la variacin diaria de la temperatura. Tambin se definen ciclos a las variaciones superiores a un ao, debidas generalmente a las fluctuaciones de la actividad econmica y social. Muchas veces los datos econmicos quedan afectados por ciclos de negocios variando entre 5 y 7 aos. En Economa se suelen distinguir tres tipos de ciclos en cunto a su periodicidad: los cortos o de Kintchine que tienen lugar ms o menos cada tres aos, los medios o de Jutglar cuyo perodo oscila entre cinco y diez aos y los largos o de Kondratiev que aparecen cada cuarenta o cincuenta aos. El anlisis de esta componente es dficil pues la duracin de los ciclos puede no ser constante, razn por la cual cualquier variacin puede dar lugar a una prediccin errnea. Otros ciclos son debidos al propio modelo que rige el proceso en estudio. Tendencia: Debe recoger el movimiento de la serie a lo largo del tiempo, se puede definir por tanto como la variacin a largo plazo, pero hemos de precisar lo que entendemos por a largo plazo. Hay, por ejemplo, series de tiempo que presentan variaciones cclicas, en un perodo de 50 aos o ms, entonces si disponemos de pocos datos se puede confundir las variaciones cclicas con la tendencia, sin embargo si disponemos de datos suficientes esta confusin no se dar. As pues al hablar de tendencia hay que tener en cuenta el nmero de observaciones de las que se dispone. Otras variaciones irregulares: Una vez que la tendencia-ciclo y estacionalidad han sido analizados y eliminadas de nuestros datos, nos quedamos con una serie de residuos, que pueden ser o no aleatorios. Veremos varias tcnicas, para el anlisis de series de este tipo, con el objeto de ver si algunas de las variaciones aparentemente irregulares, pueden ser explicadas en trmino de modelos probabilsticos, tales como los modelos ARIMA que introduciremos ms adelante.

EJEMPLO: Nmero de desempleados mensuales en USA de enero de 1948 a diciembre de 1978. (En unidades de 100.000)
1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 Enero 235.1 299.5 464.8 264.9 225.8 213.2 356.1 366.9 306.6 320.6 446.4 467.8 411.9 533.5 462.1 462.7 451.8 394.1 324.4 315.9 307.4 287.5 340.6 541.4 544.7 467.5 500.8 818 817.4 784.8 689.7 Febrero 280.7 347.4 479.1 253.8 234 196.4 398.3 356.9 309.2 308.5 511.6 469.8 388.6 565.4 448.1 487 446.1 417.2 310.9 318.4 328.7 292.3 379.4 544.2 541.2 484.5 514 830.9 803.3 810.9 673.9 Marzo 264.6 338.3 431.3 232.3 200.2 182.8 403.7 329.7 309.5 282.2 515.5 429.8 416.4 542.3 432.3 444.2 422.5 369.9 299 295.4 292.9 274.7 373.3 517.5 521.5 451.2 475.5 835.9 752.5 755.6 647.9 Abril 240.7 327.7 366.5 193.8 183.6 176.4 384.6 316.2 271 262.7 506.4 355.8 360.7 488.7 386.3 399.3 383.1 349.2 273 266.4 249.1 254.2 355.2 469.4 469.7 417.4 430.1 782 689 656.8 568.8 Mayo 201.4 351.6 326.3 177 178.2 153.6 365.8 269 279.9 263.5 483.2 332.7 338 467.1 395.2 394.9 352.8 321.4 279.3 245.8 230.4 230 338.4 439.4 434.4 379.9 414.4 762.3 630.4 615.1 545.7 Junio 240.8 396.6 355.1 213.2 203.2 173.2 368.1 289.3 317.9 313.1 522.3 378 417.2 531.3 421.9 455.4 445.3 405.7 359.2 362.8 361.5 339 466.9 549 542.6 484.7 538 856.9 765.5 745.3 632.6 Julio 241.1 438.8 331.6 207.2 208.5 171 367.9 266.2 298.4 284.3 509.8 360.5 388.4 496.1 382.9 414 367.5 342.9 305 324.9 321.7 318.2 451 533 517.3 455 526 820.9 757.7 694.1 643.8 Agosto 223.8 395.6 261.3 180.6 191.8 151.2 347 253.6 246.7 252.6 460.7 334.7 371.1 444 384.2 375.5 355.1 316.5 282.1 294.2 277.2 287 422 506.1 485.7 420.8 488.5 769.6 732.2 675.7 593.1 Septiem 206.1 363.5 249 188.6 172.8 161.9 343.3 233.8 227.3 250.3 405.8 319.5 331.5 403.4 345.5 347 326.2 284.2 250.3 289.5 260.7 295.8 429.2 484 465.8 416.5 520.2 752.2 702.6 643.7 579.7 Octubr 174.7 378.8 205.5 175.4 148 157.2 292.9 228.4 209.1 246.5 375 323.1 353.7 386.3 323.4 339.4 319.8 270.9 246.5 295.2 251 284 425.9 457 447 376.3 504.4 724.4 683.3 622.1 546 Noviem 203.3 357 235.6 199 159.4 201.7 311.5 253.6 259.9 312.7 378.5 363.6 396.7 394.1 372.6 385.8 331.8 288.8 257.9 290.3 257.6 271 460.7 481.5 426.6 405.6 568.5 723.1 709.5 634.6 562.9 Diciem 220.5 369 240.9 179.6 154.5 236.4 300.9 260.1 266 333.2 406.8 352.1 447 404.1 376 378.8 340.9 278.8 266.5 272 241.8 262.7 463.6 469.5 411.6 405.8 610.6 719.5 702.2 588 572.5

Representacin grfica de la serie


parados
900,00

800,00

700,00

600,00

500,00

400,00

300,00

200,00

100,00

0,00 1948

1950

1952

1954

1956

1958

1960

1962

1964

1966

1968

1970

1972

1974

1976

1978

serie mensual de parados


900,00

800,00

700,00

Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiem Octubr Noviem Diciem

600,00

500,00

400,00

300,00

200,00

100,00 1948 1950 1952 1954 1956 1958 1960 1962 1964 1966 1968 1970 1972 1974 1976 1978

parados
550,00

500,00

450,00 1948 400,00 1953 1950 1951 350,00 1952 1954 1955 300,00 1956 1957 250,00 1958 1959 1960 200,00

150,00

100,00 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiem Octubr Noviem Diciem

parados
900,00

800,00

700,00

600,00

500,00

400,00

300,00

200,00

100,00

0,00 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978

Objetivos
Chatfield (1989) describe en su libro "The analysis of time series. An introduction'', que los objetivos principales del anlisis de una serie temporal son describir, explicar, predecir y controlar. Descripcin. Se trata de un estudio preliminar de la serie para analizar los tipos de variaciones y ver cmo se comportan los datos. El primer paso, es representar los datos frente al tiempo, lo cual nos dar una idea sobre las principales variaciones presentes en nuestra serie temporal; y tener una primera idea sobre el modelo que podemos ajustar. Asimismo podemos observar si existen tambin datos extraos, es decir, observaciones que no parecen ser consistentes con el resto de los datos. El tratamiento de estas observaciones es muy complejo y requiere tener cuidado, pues pueden ser observaciones vlidas y entonces es importante que el modelo al que ajustemos las tenga en cuenta; o por el contrario, pueden ser observaciones fuera de lugar, por ejemplo pensemos en errores a la hora de la toma de la observacin. Otros rasgos que se pueden observar por medio del grfico son los puntos de cambio, donde por ejemplo hay un cambio de tendencia, de una tendencia creciente se pasa una tendencia decreciente. En estos casos se suele ajustar modelos diferentes a cada una de las partes o efectuar un anlisis de intervencin. Explicacin. Construir un modelo para explicar el comportamiento de la serie de tiempo en trminos de otras variables o de ella misma. Cuando las observaciones son tomadas para dos o ms variables, es posible usar la variacin en una de las series temporales, para explicar las variaciones en las otras. Esto nos conduce a un mayor conocimiento sobre la serie dada. Los modelos de regresin dinmica y funcin de transferencia pueden ser tiles en estos casos. Por ejemplo es interesante ver cmo el nivel del mar es afectado por la temperatura y la presin, y ver como las ventas estn afectadas por los precios y las condiciones econmicas. Prediccin. Dada una serie de tiempo, podemos estar interesados en la prediccin de futuros valores de la serie. La prediccin est estrechamente relacionada con los problemas de control, por ejemplo si podemos predecir que en un proceso de manufactura la variable que mide la calidad va a estar muy desviada de un determinado valor lmite, entonces podemos realizar correcciones oportunas para evitarlo. La prediccin es uno de los objetivos de las series de tiempo. En general, los mtodos de prediccin se pueden agrupar en mtodos cualitativos o cuantitativos. Mtodos cualitativos Los mtodos cualitativos o tambin conocidos como subjetivos, dependen de la intuicin y no necesariamente dependen de las observaciones pasadas. A pesar de su falta de rigor, en algunos casos pueden ser bastante apropiados e incluso el nico mtodo de previsin. Como por ejemplo, en la aparicin de nuevos productos en el mercado, si estamos interesados en las ventas de un nuevo producto, no se puede recurrir al volumen de ventas en aos anteriores pues ste no exista. En este tipo de

mtodos podemos destacar el mtodo Delphi, la previsin est basada en la utilizacin sistemtica e iterativa de juicios de opinin de un grupo de expertos hasta llegar a un acuerdo. Mtodos cuantitativos En las previsiones de tipo cuantitativo, se parte del supuesto de que se tiene registrada informacin sobre el pasado acerca del fenmeno que se quiere estudiar. Generalmente, esta informacin sobre el pasado aparece en forma de series temporales. En los mtodos cuantitativos, la misin del estadstico es extraer toda la informacin posible contenida en los datos, y en base al patrn de conducta seguida en el pasado hacer conjeturas en el futuro. Los mtodos de alisado o suavizado Se basan en separar el patrn de comportamiento de la serie de la parte aleatoria. Los mtodos de descomposicin Tratan de identificar las componentes del patrn bsico de la serie, normalmente la tendencia (Tt), la estacionalidad (St) y ciclos (Ct), de manera que una serie de observaciones(X1,X2, ,Xn), se puede expresar como Xt = f(Tt,St,Ct) +It La componente irregular, It representa la parte aleatoria de la serie, es decir, la parte no explicada por las otras componentes que en general se modela mediante un proceso estoctico estacionario. Para modelar el proceso estocstico en anlisis de series temporales, comnmente, hay principalmente dos enfoques conocidos como anlisis en el dominio del tiempo y anlisis en el dominio de la frecuencia. El anlisis en el dominio del tiempo Se basa en la estructura de la correlacin de los procesos estocsticos estacionarios. Box y Jenkins (1970) desarrollaron una clase de modelos, los modelos autorregresivos integrados de medias mviles (ARIMA) para tratar de modelar y predecir series estacionarias o no estacionarias a las que se les ha eliminado la tendencia y la estacionalidad. Esta metodologa tambin puede aplicarse a series multivariantes definiendo los modelos ARIMA vectoriales. Casos especiales de esta metodologa son los modelos que relacionan una variable salida con una o ms variables entradas (Box y Jenkins (1976)), conocidos como modelos de funcin de transferencia o de regresin dinmica, y como caso particular es el anlisis de intervencin. Otro tipo de modelos son los modelos de espacio-estado para el tratamiento de series temporales. Un modelo de espacio-estado est formado por dos ecuaciones: una ecuacin de medida, que describe el estado del proceso en el momento y una ecuacin de transicin que representa el vector de estado en el momento t, en funcin del estado en t-1. Estos incluyen los modelos de regresin tradicionales y los modelos ARIMA. Los modelos de espacio-estado hacen uso del filtrado de Kalman para realizar estimaciones y predicciones. 9

El anlisis de las series en el dominio de la frecuencia, Est basado en el teorema de descomposicin espectral de un proceso estacionario que nos asegura que la variabilidad de la serie es suma de la variabilidad de ondas seno-coseno. Estas variaciones peridicas son causadas a menudo por fenmenos biolgicos, fsicos o medioambientales de inters. Por ejemplo, las temperaturas de la superficie del mar causadas por las oscilaciones de El Nio puede afectar al nmero de peces en el ocano (Shumway, R. H. and Stoffer, D. S. (2000), pg. 6). El estudio de la periodicidad se extiende tambin al campo de la Economa y de las Ciencias Sociales, donde uno puede estar interesado en periodicidades anuales en series como las tasas de desempleados mensuales o nacimientos mensuales. Los mtodos de regresin, Se pueden considerar como un mtodo ms para realizar predicciones de la variable dependiente en funcin de las independientes (ver Shumway, R. H. and Stoffer, D. S. (2000), ejemplos: ventas trimestrales de Johnson & Johnson y temperatura globales). En el caso de series univariantes, regresiones de la serie Xt en funcin del ndice t pueden servir para modelar sus componentes. Control. Cuando una serie de tiempo est generada con una medida que nos indica la calidad de un proceso de manufactura, entonces el objetivo del anlisis de la serie de tiempo ha de ser el control del proceso, mantener o cambiar distintos valores futuros de la serie, distintos procedimientos de control se han estudiado. Para predecir sucesos que ocurrirn en el futuro, un predictor debe confiar en la informacin relativa a los sucesos que ocurrieron en el pasado. Esto es, para realizar una prediccin, el predictor debe analizar los datos pasados y predecir en funcin de ese anlisis.

10

En general el esquema seguido en el anlisis de series temporales ser

11

Mtodos de descomposicin
EJEMPLO: Los datos siguientes corresponden al nmero de muertos en accidentes mensualmente en U.S.A. de 1973 a 1978 (fuente National Sadety Council) 1973 1974 1975 1976 1977 1978 Enero 9007 7750 8162 7717 7792 7836 Febrero 8106 6981 7306 7461 6957 6892 Marzo 8928 8038 8124 7776 7726 7791 Abril 9137 8422 7870 7925 8106 8129 Mayo 10017 8714 9387 8634 8890 9115 Junio 10826 9512 9556 8945 9299 9434 Julio 11317 10120 10093 10078 10625 10484 Agosto 10744 9823 9620 9179 9302 9827 Septiembre 9713 8743 8285 8037 8314 9110 Octubre 9938 9129 8433 8488 8850 9070 Noviembre 9161 8710 8160 7874 8265 8633 Diciembre 8927 8680 8034 8647 8796 9240

S e r ie n m e r o d e m u e r to s e n a c c id e n te s m e n s u a lm e n te e n U S A 1 9 7 3 - 1 9
11800 10800 9800

serie

8800 7800 6800 0 20 40 60 80

Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

media mensual 8044.0 7283.83 8063.83 8264.83 9126.17 9595.33 10452.8 9749.17 8700.33 8984.67 8467.17 8720.67

12

S e aso nal S u b s e rie s P lo t fo r s e rie


11800 10800 9800

serie

8800 7800 6800 0 3 6 9 12 15

S easo n

P e r io d o g r a m a p a r a la s e r ie n m e r o d e m u e r t o s e n a c c id e n t e s
(X 1 .E 7 ) 4 3

Ordinate

2 1 0 0 0 .1 0 .2 0 .3 0 .4 0 .5 0 .6

fre q u en c y
Procedimiento para tendencias pequeas Medias anuales Ao 1973 1974 1975 Media 9651.75 8718.5 8585.83

1976 8396.75

1977 8576.83

1978 8796.7 5

M ed ias anu ales d e la s erie nm ero d e m uerto s en ac c id entes


9800 9500

media_anual

9200 8900 8600 8300 0 20 40 60 80

Serie menos media anual correspondiente 1973 1974

1975

1976

1977

1978 13

Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

-644.75 -1545.75 -723.75 -514.75 365.25 1174.25 1665.25 1092.25 61.25 286.25 -490.75 -724.75

-968.5 -1737.5 -680.5 -296.5 -4.5 793.5 1401.5 1104.5 24.5 410.5 -8.5 -38.5

-423.83 -1279.83 -461.83 -715.83 801.17 970.17 1507.17 1034.17 -300.83 -152.83 -425.83 -551.83

-679.75 -935.75 -620.75 -471.75 237.25 548.25 1681.25 782.25 -359.75 91.25 -522.75 250.25

-784.83 -1619.83 -850.83 -470.83 313.17 722.17 2048.17 725.17 -262.83 273.17 -311.83 219.17

-960.75 -1904.75 -1005.75 -667.75 318.25 637.25 1687.25 1030.25 313.25 273.25 -163.75 443.25

S e rie - M e d ia s a n u a le s
(X 100 0) 3 2

serie_mediaanual

1 0 -1 -2 0 20 40 60 80

Medias mensuales de los valores de la tabla anterior Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Sj (componente estacional) -743.735 -1503.9 -723.902 -522.902 338.432 807.598 1665.1 961.432 -87.4017 196.932 -320.568 -67.0683

14

C o m p o n e n te e s ta c io n a l
3000 2400 1800 1200 600 0 -60 0 -1 20 0 -1 80 0 -2 40 0 1 2 3 4 5 6 7 8 9 10 11 12

Residuos: (serie menos media anual correspondiente menos la componente estacional) 1973 1974 1975 1976 1977 Enero 98.985 -224.765 319.905 63.985 -41.095 Febrero -41.85 -233.6 224.07 568.15 -115.93 Marzo 0.152 43.402 262.072 103.152 -126.928 Abril 8.152 226.402 -192.928 51.152 52.072 Mayo 26.818 -342.932 462.738 -101.182 -25.262 Junio 366.652 -14.098 162.572 -259.348 -85.428 Julio 0.15 -263.6 -157.93 16.15 383.07 Agosto 130.818 143.068 72.738 -179.182 -236.262 Septiembre 148.6517 111.9017 -213.4283 -272.3483 -175.4283 Octubre 89.318 213.568 -349.762 -105.682 76.238 Noviembre -170.182 312.068 -105.262 -202.182 8.738 Diciembre -657.6817 28.5683 -484.7617 317.3183 286.2383

1978 -217.015 -400.85 -281.848 -144.848 -20.182 -170.348 22.15 68.818 400.6517 76.318 156.818 510.3183

re s id u o s
800 400 0 -400 -800 0 20 40 60 80

Procedimiento general

15

La tendencia inicialmente la calculamos con la media mvil simtrica 1 1 1 mt = X t 6 + X t 5 + ... + X t + X t +1 + ... + X t +5 + X t + 6 12 2 2 1973 1974 1975 1976 Enero 9051.54 8799.71 8422.96 Febrero 8963.29 8790.13 8403.96 Marzo 8884.5 8762.58 8375.25 Abril 8810.38 8714.5 8367.21 Mayo 8757.88 8662.58 8357.58 Junio 8728.79 8612.75 8371.21 Julio 9599.38 8735.67 8567.29 8399.88 Agosto 9500.13 8766.38 8555.21 8382.0 Septiembre 9416.17 8783.5 8547.17 8358.92 Octubre 9349.29 8764.08 8534.96 8364.38 Noviembre 9265.21 8769.13 8505.88 8382.58 Diciembre 9156.17 8799.0 8449.04 8408.0 Grfico de esta media mvil a lo largo de la serie
m ed ia m vil ( tend enc ia )
11800 10800 9800 8800 7800 6800 0 12 24 36 48 60

1977 8445.54 8473.46 8490.13 8516.75 8548.13 8570.63 8578.67 8577.79 8577.79 8581.46 8591.79 8606.79

1978 8606.54 8622.54 8677.58 8719.92 8744.42 8778.25

72

Comparmoslo con el procedimiento anterior


98 00 95 00 92 00 89 00 86 00 83 00 0 20 40 60 80

Si a la serie le restamos esta tendencia tendremos 1973 1974 1975 Enero -1301.542 -637.708

1976 -705.958

1977 -653.542

1978 -770.542

16

Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

1717.625 1243.875 296.833 588.708 -104.208 -229.167

-1982.292 -846.5 -388.375 -43.875 783.208 1384.333 1056.625 -40.5 364.917 -59.125 -119

-1484.125 -638.583 -844.5 724.417 943.25 1525.708 1064.792 -262.167 -101.958 -345.875 -415.042

-942.958 -599.25 -442.208 276.417 573.792 1678.125 797 -321.917 123.625 -508.583 239

-1516.458 -764.125 -410.75 341.875 728.375 2046.333 724.208 -263.792 268.542 -326.792 189.208

-1730.542 -886.583 -590.917 370.583 655.75

s erie m eno s m ed ia m vil


2500 1500 500 -500 -1500 -2500 0 20 40 60 80

Medias mensuales de los valores de la tabla anterior y componente estacional Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Medias mensuales -813.858 -1531.28 -747.008 -535.35 333.883 736.875 1670.42 977.3 -118.308 248.767 -268.917 -67.0 Sj (componente estacional) -804.304033 -1521.726033 -737.454033 -525.796033 343.436967 746.428967 1679.973967 986.853967 -108.754033 258.320967 -259.363033 -57.446033

17

c o mp o nente es tac io nal


36 0 0 30 0 0 24 0 0 18 0 0 12 0 0 6 00 0 -6 00 -12 00 -18 00 -24 00 1 2 3 4 5 6 7 8 9 10 11 12

Serie desestacionalizada Xt - St :
serie d esestacio nalizada
1 1800 1 0800 9800 8800 7800 6800 0 20 40 60 80

Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

1973 9811.304 9627.726 9665.454 9662.796 9673.563 10079.57 9637.026 9757.146 9821.754 9679.679 9420.363 8984.446

1974 8554.304 8502.726 8775.454 8947.796 8370.563 8765.571 8440.026 8836.146 8851.754 8870.679 8969.363 8737.446

1975 8966.304 8827.726 8861.454 8395.796 9043.563 8809.571 8413.026 8633.146 8393.754 8174.679 8419.363 8091.446

1976 8521.304 8982.726 8513.454 8450.796 8290.563 8198.571 8398.026 8192.146 8145.754 8229.679 8133.363 8704.446

1977 8596.304 8478.726 8463.454 8631.796 8546.563 8552.571 8945.026 8315.146 8422.754 8591.679 8524.363 8853.446

1978 8640.304 8413.726 8528.454 8654.796 8771.563 8687.571 8804.026 8840.146 9218.754 8811.679 8892.363 9297.446

18

Mtodos de suavizado Suavizado exponencial simple


.- Suprime las fluctuaciones a corto plazo y suaviza la serie. .- Media ponderada de los valores previos con major peso para las observaciones recientes. .-No hay tendencia ni estacionalidad

Ft+1 = Yt + (1 )Ft, 0 < < 1.


As Ft+1 is la media ponderada de la observacin anterior Yt, con la prediccin anterior Ft, Iterando

Ft +1 = (1 ) F1 + (1 ) j Yt j
t j =0

t 1

Es decir la dependencia de las predicciones con observaciones anteriores decrece exponencialmente con velocidad . Cuanto mayor es ms deprisa decrece la dependencia. Si = 1, la predicin coincide con la ltima observacin . Si est prximo a 1, entonces los valores recientes pesan ms Si est prximo a 0 entonces valores remotos tienen un peso comparable a los ms recientes. Est indicado cuando hay gran aleatoriedad en los datos. El algoritmo necesita inicializarse F2 = Y1. Aunque otras inicializaciones son posibles

Suavizado exponencial lineal de Holt


Es una extensin del suavizado exponencial. .- Introduce un factor tendencia al mtodo anterior .- Hay tendencia lineal pero no estacionalidad. F(t) = L(t) + b(t) F(t+m) = L(t) + m*b(t) Hay 2 constantes de suavizado and . Las ecuaciones son:

Lt = Yt + (1 )( Lt 1 + bt 1 ) Ft + m = Lt + bt m

bt = ( Lt Lt 1 ) + (1 )bt 1
Lt es un estimador de la media y bt estima la tendencia lineal de la serie en el instante t, y Ft+m es la prediccin. Las ecuaciones se inicializan L1 = Y1 and b1 = 0.Sin embargo inicializar la pendiente a 0 puede dar problemas y en ocasiones hay que tomar cuidadosamente un estimador inicial.

19

Mtodo de Holt-Winter
Es una extensin del mtodo anterior que tiene en cuenta la estacionalidad .- Introduce tendencia y estacionalidad F(t) = (L(t) + b(t))*S(t-12) F(t+m) = (L(t) + m*b(t))*S(t-12+m) Mtodo multiplicativo Con ecuaciones

Lt =

Yt + (1 )( Lt 1 + bt 1 ) St s Yt + (1 ) St s Lt

bt = ( Lt Lt 1 ) + (1 )bt 1 St =

Ft + m = ( Lt + bt m ) St s + m
Siendo s la estacionalidad o nmero de estaciones en un ciclo. Para inicializar necesitamos un ciclo completo de datos, es decir los s primeros valores.

Para la tendencia s + k datos.

1 Ls = (Y1 + Y2 + ... + Ys ) s

1 Y Y Y Y Y Yk bs = s +1 1 + s + 2 2 + ... + s + k k s s s .

Si hay suficientes datos k = s, es decir dos ciclos completos. Sin embargo podemos tomar k = 1. Los ndices estacionales se inicializan

Sk =

Yk Ls

k = 1, 2, ..., s

, , parmetros en (0, 1). Mtodo aditivo

Lt = (Yt St s ) + (1 )( Lt 1 + bt 1 )

bt = ( Lt Lt 1 ) + (1 )bt 1 St = (Yt Lt ) + (1 ) St s
Los valores iniciales Ls y bs se eligen como en el caso multiplicativo Los ndices estacionales iniciales

Ft + m = Lt + bt m + St s + m k = 1, 2, ..., s .

S k = Yk Ls

20

Modelos de Box-Jenkins
Una caracterstica esencial de las series temporales es la dependencia que existe entre las observaciones. A comienzo de los aos 70, G.E.P. Box, profesor de Estadstica de la Universidad de Wisconsin, y G.M. Jenkins, profesor de Ingeniera de Sistemas de la Universidad de Lancaster, introdujeron una pequea revolucin en el enfoque del anlisis de series temporales, en sus trabajos sobre el comportamiento de la contaminacin en la baha de San Francisco, con el propsito de establecer mejores mecanismos de pronstico y control. El libro (1976) en el que describen la metodologa, se convirti rpidamente en un clsico, y sus procedimientos se utilizan ampliamente desde entonces en diferentes ramas de la ciencia, conocindose como modelos ARIMA y tambin como modelos Box-Jenkins. La metodologa de Box-Jenkins modela esta dependencia utilizando la teora probabilstica suministrada por los procesos estocsticos estacionarios y la metodologa estadstica suministrada por la teora de la estimacin y contraste de hiptesis. Un proceso estocstico es una coleccin de variables indexadas por el tiempo { X (t )} tT Un proceso es estacionario si su distribucin no varia a lo largo del tiempo. Definicin. Proceso fuertemente estacionario. Un proceso estocstico { X (t )} tT , se dice, fuertemente estacionario si la familia de distribuciones finito-dimensionales Ft1t 2 ...t n permanece invariante frente al tiempo. La distribucin finito-dimensional Ft1t 2 ...t n es la distribucin conjunta de las variables aleatorias ( X (t1 ), X (t2 )... X (tn ) ) . A1... An As Ft1t 2 ...t n ( A1... An ) = P ( X (t1 ) A1... X (tn ) An ) en trminos de distribucin. P{ X (t1 ) A1... X (tn ) An } = P{ X (t1 + h) A1... X (tn + h) An } . Las distribucines finito-dimensionales slo dependen de la posicin relativa de las coordenadas entre s y no del instante del tiempo en que esten tomadas En particular, Todas las distribuciones unidimensionales son iguales, es decir, todas las variables aleatorias X(t) estn igualmente distribuidas. Para las distribuciones bidimensionales se verifica: Esta definicin es bastante restrictiva y daremos la siguiente definicin en trminos de los momentos de primer y segundo orden. Definicin. Proceso dbilmente estacionario Un proceso estocstico { X (t )} tT se dice dbilmente estacionario si posee primer y segundo momento y verifica: E [ X (t )] = , t Var [ X (t )] = 2 , t Cov[ X (t ), X (t + s)] = Cov[ X (0), X ( s)] = K ( s) 21 Y por permanecer invariante se verifica Ft1t 2 ...t n = Ft1+h t 2 ...t n+h t1...tn , h

( X (t1 ), X (t2 ) ) = ( X (0), X (t2 t1 ) )

A la funcin K que slo depende de un parmetro se la denomina funcin de covarianza y es una funcin simtrica y semidefinida positiva. t1 , t 2 ,...t n T a1 , a 2 ,...a n T

a K (t
i =1 j =1 i

t j )a j 0

Los modelos de procesos estocsticos que utilizaremos para el modelado son : Modelos autorregresivos AR(p) : Su expresin matemtica es ( X t ) = 1 ( X t 1 ) + 2 ( X t 2 ) + ... + p ( X t p ) + Z t Se pone cada observacin como combinacin lineal de observaciones pasadas. 1, 2, ... p son nmeros reales , la media de la serie y Zt es una sucesin de variables incorreladas. Expresado en forma abreviada ( B )( X t ) = Z t siendo (B) un polinomio en B, donde B es el operador retardo definido B(Xt)=Xt-1 Las raices de (B) fuera del crculo unidad Modelos de media mvil MA(q) : con expresin matemtica ( X t ) = 1 Z t 1 + 2 Z t 2 + ... + p Z t p + Z t Cada observacin es combinacin lineal de errores pasados y presentes . En forma abreviada ( X t ) = ( B ) Z t Las raices de (B) fuera del crculo unidad Modelos mixtos : ARMA(p,q) ( B )( X t =( B ) Z t . ) Cada observacin es combinacin lineal de observaciones pasadas y de errores pasados y presentes. Las raices de (B) y de (B) fuera del crculo unidad Las series temporales presentan variaciones que pueden ser debidas al propio modelo o al medio en el que se tomaron las observaciones o a las dos causas. Para tener en cuenta los factores externos se introducen los modelo estacionales. Estos modelos tienen en cuenta que las series presentan variaciones peridicas regulares o aleatorias debidas al transcurrir del tiempo y a la sucesin de las estaciones. (meses, trimestres, etc.) Modelos estacionales autorregresivos SAR(p) : Su expresin matemtica es ( X t ) = 1 ( X t s ) + 2 ( X t 2 s ) + ... + p ( X t ps ) + Z t Con s la longitud del periodo ( 12 con datos mensuales, 4 si son datos trimestrales) 1, 2, ... p son nmeros reales , la media de la serie y Zt es una sucesin de variables incorreladas. s Expresado en forma abreviada ( B )( X t ) = Z t

22

Siendo ( B s ) un polinomio en Bs y Bs es el operador retardo estacional definido Bs(Xt)=Xt-s Las raices de (Bs) fuera del crculo unidad Modelos estacionales de media mvil SMA(q) : con expresin matemtica ( X t ) = 1 Z t s + 2 Z t 2 s + ... + p Z t ps + Z t
s En forma abreviada ( X t ) = ( B ) Z t Se pueden combinar los anteriores modelos para dar lugar a Las raices de (Bs) fuera del crculo unidad

Modelos SARMA(p,q)(P,Q) multiplicativos con expresin matemtica ( B)( B s )( X t ) = ( B )( B s ) Z t Las raices de (Bs) y de (Bs) fuera del crculo unidad Todos lo modelos anteriormente expuestos son modelos estacionarios en el sentido amplio o dbilmente estacionarios, es decir, su media permanece constante a lo largo del tiempo y la funcin de correlacin depende del retardo y no del tiempo en el que se calcule es decir E(Xt) = t Corr(Xt, Xt+h) = corr(X0,Xh) = (h) t Sin embargo las series temporales, adems de variaciones aleatorias, cclicas y estacionales, presentan tendencia y componentes estacionales (la media vara a lo largo del tiempo y de las estaciones) que hace que los procesos estacionarios anteriormente citados no sean suficientes para su modelado. Por esta razn se introducen los modelos integrados, mediante estos modelos retiramos la componente tendencial y estacional. Modelos SARIMA(p,d,q)(P,D,Q)s multiplicativos: La expresin genrica del modelo es la siguiente: ( B )( B s )(Wt ) = ( B )( B s ) Z t
Wt = (1 B ) d (1 B s ) D X t = dsD(Xt) Los operadores introducidos en la frmulas son: Bs : operador de retardo estacional definido Bs(Xt) = Xt-s = (1-B) operador diferencia regular s = (1-Bs) operador diferencia estacional. Los operadores diferencia y diferencia estacional, en general quitan tendencias y componentes estacionales de la serie respectivamente. Wt es la serie desestacionalizada y sin tendencia, es decir, es estacionaria. Xt: serie observada B: Operador de retardos (B): Polinomio autorregresivo de orden p, correspondiente a la parte ordinaria de la serie (B): Polinomio de medias mviles de orden q, correspondiente a la parte ordinaria de la serie

23

(Bs): Polinomio autorregresivo de orden P, correspondiente a la parte estacional de la serie (Bs): Polinomio de medias mviles de orden Q, correspondiente a la parte estacional de la serie :la media de la serie estacionaria Zt: Perturbacin del modelo D,d: Nmero de veces que se han aplicado los operadores diferencia estacional y diferencia regular a la serie original para convertirla en estacionaria. Las raices de (B) ,(Bs) , (B) y de (Bs) fuera del crculo unidad

Identificacin
Cmo identificamos el modelo? Para identificar el modelo nos basamos ademas de la grfica de los datos frente al tiempo, de las grficas de la funcin de autocorrelacin y funcin de autocorrelacin parcial muestrales.. Estas grficas se comparan con las grficas de las correspondientes funciones tericas que tiene una forma caracterstica para cada modelo. Denotamos por ACF la funcin de autocorrelacin. Esta funcin est definida en el retardo k como (k) = Cov(xt, xt+h)/var(xt) Mide la relacin lineal entre estas variables. PACF la funcin de autocorrelacin parcial. En el retardo k mide la relacin lineal entre Xt y Xt+k pero quitando la dependencia entre las variables intermedias. En general Modelos AR(p) ACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente. PACF se anula a partir del retardo p Modelos MA(q) ACF se anula a partir del retardo q PACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente. Modelos ARMA(p,q) p<q ACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente; como en el modelo AR(p) pero a partir del retardo q-p+1, es decir que los primeros q-p+1 retardos no tienen pauta fija. PACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente, es decir como el modelo MA(q)

24

p>q ACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente; como en el modelo AR(p) PACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente, es decir como el modelo MA(q), pero a partir del retardo p-q+1, es decir que los primeros p-q+1 retardos no tienen pauta fija. p=q ACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente; como en el modelo AR(p) pero a partir del retardo 1, es decir que el primer retardo no sigue este patrn PACF decrece exponencialmente hacia o mediante ondas seno-coseno con amplitudes decreciendo exponencialmente, es decir como el modelo MA(q), pero a partir del retardo 1, es decir el primer retardo no varia segn este patrn. Modelos estacionales En estos modelos hay que distinguir la parte regular, es decir los retardos comprendidos entre los retardos estacionales y la parte estacional, es decir los retardos estacionales. Para la parte regular el comportamient de ACF y PACF como en los modelos ARMA. Para los retardos estacionales, la misma pauta que los modelos ARMA pero en los retardos s, 2s, Los retardos vecinos de los retardos estacionales, dependiendo del orden ARMA de la parte regular tambin se ven afectados.A continuacin vemos grficas de estas funciones

25

ACF
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 - 0 .2 - 0 .4 - 0 .6 - 0 .8 - 1 .0 0 6 12 18 24 30

PACF
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8

12

18

24

30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

-1 .0

12

18

24

30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

26

ACF
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

PACF
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8
0 6 12 18 24 30

12

18

24

30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0

-1 .0
1 .0

12

18

24

30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

27

ACF
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30

PACF
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 - 0 .2 - 0 .4 - 0 .6 - 0 .8 - 1 .0
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8

12

18

24

30

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 6 12 18 24 30 0 6 12 18 24 30 0 6 12 18 24 30

-1 .0 1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0

12

18

24

30

12

18

24

30

12

18

24

30

28

ACF

PACF

(0,1)(0,1)

(0,1)(1,1)

(0,1)(0,1)
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 12 24 36 48 60 1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 12 24 36 48 60

(0,2)(0,1)

29

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 12 24 36 48 60

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 12 24 36 48 60

(0,0)(1,0)
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 12 24 36 48 60

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 - 0 .2 - 0 .4 - 0 .6 - 0 .8 - 1 .0 0 12 24 36 48 60

(0,0)(1,1)
1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 12 24 36 48 60

1 .0 0 .8 0 .6 0 .4 0 .2 0 .0 -0 .2 -0 .4 -0 .6 -0 .8 -1 .0 0 12 24 36 48 60

(2,0)(1,0)

(o,1)(1,0)

30

Estimacin:
Una vez identificado el modelo, se estiman los parmetros con los mtodos habituales.

validacin
Hay que verificar las hiptesis del modelo. .- Todos los parmetros son significativos. .-Los residuos estn incorrelados. Se calcula para ello el estadstico de Ljung-Box: Q1 = [N(N+2)]/(N-k) k r2a(h) h=1 Bajo la hiptesis nula de que el modelo est bien ajustado, se distribuye segn una chi cuadrado con grados de libertad k-p-q (r1, r2, ..., rk) las correlaciones correspondientes a los k primeros retardos. .- El modelo es estacionario.

Ejemplo
Serie Nmero de Parados registrados en Castilla y Len. El periodo estudiado comprende datos desde enero de 1980 hasta mayo de 2001 Representacin grfica de la serie
p r to l C s a o ta a tillayL en 200 000 100 800 100 600 100 400 100 200 100 000 800 00 600 00 400 00 200 00
F e c h e a n e -8 1 fe b -8 m 2 a r8 3 a b rm 84 a y -8 5 ju n -8 6 ju l8 a 7 g o -8 s 8 e p -8 9 o c t9 0 n o v -9 1 d ic -9 e 2 n e -9 4 fe b -9 m 5 a r9 6 a b rm 97 a y -9 8 ju n -9 9 ju l0 0

A la vista del grfico vemos que nuestra serie no es estacionaria, presenta una clara tendencia que sigue los ciclos de la economa, tambin muestra componentes estacionales. Este hecho tambin se pone de manifiesto en las grficas de las funciones de autocorrelacin, autocorrelacin parcial y periodograma de la serie. En la funcin de autocorrelacin observamos que hay un decrecimiento muy lento, muy lejano del decrecimiento exponencial de los modelos estacionarios.

31

La grfica de la funcin de autocorrelacin parcial muestra una correlacin muy alta en el retardo 1 y muy baja en los dems retardos , indicativo de la existencia de una tendencia en la serie o variacin a largo plazo. Por ltimo la grfica del periodograma muestra un pico muy pronunciado en las bajas frecuencias que oculta cualquier otra variacin de los datos. De estas tres grficas se deduce que la serie no es estacionaria y que las variaciones a largo plazo o tendencia de la serie, ocultan la estructura de los datos. Por tanto diferenciamos la serie de orden 1 para eliminar la tendencia.

Autocorrelacin para el paro en Castilla y Len


1

Autocorrelaciones

0.6 0.2 -0.2 -0.6 -1 0 10 20 30 40 50

lag Autocorrelacin parcial paro de Castilla y Len


1 0.6 0.2 -0.2 -0.6 -1 0 10 20 30 40 50

Autocorrelaciones Parciales

lag

Periodograma Paro Castilla y Len


(X 1.E10) 12 10 8 6 4 2 0 0 0.1 0.2 0.3 0.4 0.5

frecuencia

A continuacin representamos las mismas grficas correspondientes a la serie diferenciada. En la funcin de autocorrelacin se observa un comportamiento pseudoperidico de la serie con periodo 12 ya que los datos son mensuales.

32

As nos encontramos con una serie estacional. Si nos fijamos en los retardos estacionales (12, 24, 36, 48) el decrecimiento de la correlacin puede o no puede ser exponencial, necesitamos ms grficas para saber si la serie es estacionaria. La funcin de autocorrelacin parcial no muestra falta de estacionariedad, ni el retardo 1 ni el primer retardo estacional son demasiado grandes frente a los dems. La grfica del periodograma muestra un pico muy pronunciado en la frecuencia 0.08 indicativo de estacionalidad de periodo 12 y otros picos menos pronunciados en los armnicos siendo el siguiente en orden de magnitud el correspondiente a la frecuencia 0.25, es decir periodo 4 indicativo de cierta periodicidad trimestral. Tambin observamos un pico de menor magnitud en una frecuencia prxima a cero indicativo de una variacin a largo plazo que todava persiste en la serie y que la aleja de la estacionariedad. La diferencia de orden 1 no ha sido suficiente para quitar la tendencia.
Autocorrelacin para el paro en Castilla y Len diferenciada de orden 1
1

Autocorrelaciones

0.6 0.2 -0.2 -0.6 -1 0 10 20 30 40 50

lag Autocorrelacin parcial paro de Castilla y Len diferenciada de orden 1


1 0.6 0.2 -0.2 -0.6 -1 0 10 20 30 40 50

Autocorrelaciones Parciales

lag

Periodograma Paro Castilla y Len diferenciada de orden 1


(X 1.E8) 8 6 4 2 0 0 0.1 0.2 0.3 0.4 0.5

frecuencia

Aplicamos una diferencia estacional a la serie para comprobar si esta operacin hace a la serie estacionaria y analizamos nuevamente los grficos.

33

La funcin de autocorrelacin decrece muy lentamente. La funcin de autocorrelacin parcial no muestra falta de estacionariedad, ni el retardo 1 ni el primer retardo estacional son demasiado grandes frente a los dems y el periodograma sigue mostrando un pico muy superior a todo lo dems en las bajas frecuencias. Es decir esta operacin no nos convierte a la serie en estacionaria.
Autocorrelacin para el paro en Castilla y Len diferenciada de orden 12
1

Autocorrelaciones

0.6 0.2 -0.2 -0.6 -1 0 10 20 30 40 50

lag Autocorrelacin parcial paro de Castilla y Len diferenciada de orden 12


1 0.6 0.2 -0.2 -0.6 -1 0 6 12 18 24 30 36 42 48

Autocorrelaciones Parciales

lag

Periodograma Paro Castilla y Len diferenciada de orden 12


(X 1.E9) 15 12 9 6 3 0 0 0.1 0.2 0.3 0.4 0.5

frecuencia

Por tanto procedemos a aplicar una diferencia regular y una diferencia estacional a la serie original. Las tres grficas siguientes no muestran falta de estacionariedad, as modelaremos esta serie. Observamos en la funcin de autocorrelacin que los primeros retardos decrecen exponencialmente, indicativo de un polinomio autorregresivo de orden 1 y slo hay un retardo estacional que podamos considerar distinto de 0, indicativo de un polinomio de media mvil estacional de orden 1.

34

La funcin de autocorrelacin parcial est de acuerdo con esta identificacin del modelo ya que slo hay un retardo regular , el primero, que podamos considerar distinto de 0 y en los retardos estacionales (12, 24, 36, 48) se observa decrecimiento exponencial. En el periodograma se pueden entrever 6 ondas de amplitudes decrecientes indicativo de que nos encontramos ante un modelo estacional multiplicativo.
Autocorrelacin para el paro en Castilla y Len diferenciada de orden 1 y 12
1

Autocorrelaciones

0.6 0.2 -0.2 -0.6 -1 0 10 20 30 40 50

lag

Autocorrelaciones Parciales

Autocorrelacin parcial paro de Castilla y Len diferenciada de orden 1 y12


1 0.6 0.2 -0.2 -0.6 -1 0 10 20 30 40 50

lag
Periodograma Paro Castilla y Len diferenciada de orden 1 y 12
(X 1.E7) 8 6 4 2 0 0 0.1 0.2 0.3 0.4 0.5

frecuencia

As hemos identificado un modelo SARIMA(1,1,0)(1,1,0)12 para la serie diferenciada de orden 1 y 12 del paro total registrado durante el periodo comprendido entre Enero de 1980 y Mayo de 2001.
ARIMA Procedure Name of variable = CYL. Period(s) of Differencing = 1,12. Mean of working series = -93.3074 Standard deviation = 1899.651 Number of observations = 244 NOTE: The first 13 observations were eliminated by differencing. ARIMA Procedure Maximum Likelihood Estimation Parameter Estimate Std Error T Ratio Lag AR1,1 0.43581 0.05765 7.56 1

35

AR2,1 -0.28994 0.06283 -4.61 12 Variance Estimate = 2727641.33 Std Error Estimate = 1651.55725 AIC = 4311.52136 SBC = 4318.5157 Number of Residuals= 244 Correlations of the Estimates Parameter AR1,1 AR2,1 AR1,1 1.000 -0.049 AR2,1 -0.049 1.000 Model for variable CYL No mean term in this model. Period(s) of Differencing = 1,12. Autoregressive Factors Factor 1: 1 - 0.43581 B**(1) Factor 2: 1 + 0.28994 B**(12) ARIMA Procedure Name of variable = RESIDUAL. Mean of working series = -69.8716 Standard deviation = 1648.301 Number of observations = 244 Autocorrelations Lag Square DF Prob 6 12.13 6 0.059 -0.029 -0.006 0.114 0.141 -0.121 0.000 12 16.81 12 0.157 0.017 0.076 -0.068 -0.011 0.065 -0.057 18 19.06 18 0.388 -0.054 0.060 0.018 -0.042 -0.007 -0.001 24 33.17 24 0.101 -0.042 -0.045 -0.033 -0.020 0.008 -0.215 30 34.19 30 0.273 -0.012 -0.023 0.018 0.041 0.025 0.019 36 41.43 36 0.246 0.018 -0.046 0.007 0.037 -0.083 -0.120

Despus de realizar los ajustes, el modelo elegido y su expresin matemtica es la siguiente:

(1 B )(1 B 12 )(1 0.43 B )(1 + 0.29 B 12 ) X t = Z t En forma ms expandida. Para el incremento mensual (Xt -Xt-1)=(Xt-12-Xt-13)+0.42(Xt-1-Xt-2)-0.3(Xt-12-Xt-13)-0.55(Xt-13-Xt-14)+ 0.3(Xt-24-Xt-25)-0.13(Xt-25-Xt-26)+Zt Para el incremento anual (Xt -Xt-12)=(Xt-1-Xt-13)+0.42(Xt-1-Xt-13)-0.42(Xt-2-Xt-14)-0.3(Xt-12-Xt-24)+ 0.17(Xt-13-Xt-25)+0.13(Xt-14-Xt-26)+Zt
As vemos que el incremento del nmero de parados en un mes determinado depende positivamente -Del incremento del nmero de parados en el mes anterior (0.42) -Del incremento del nmero de parados del mismo mes del ao anterior (0.7) - Del incremento del nmero de parados del mismo mes de dos aos anteriores (0.3) Depende negativamente -Del incremento del paro un mes anterior del ao anterior (0.55) -Del incremento del paro un mes anterior de dos aos antes (0.13) El incremento anual del nmero de varones parados crece -Con el incremento anual del mes anterior (1.42) -Con el incremento anual del mes anterior del ao anterior (0.17) -Con el incremento anual de dos meses anteriores del ao anterior.(0.17)

36

Decrece -Con el incremento anual de dos meses anteriores (0.42) -Con el incremento anual del ao anterior (0.3) Paro total en la comunidad /*Lectura de Datos: */ libname d 'c:\juntas\salidas'; data d.datos; infile 'c:\juntas\ paro registrado total\paro registrado.txt' dlm='09'x; input Av Bu CyL Le Pa Sa Se So Va Za; date= intnx('month','31dec79'd,_n_); format date monyy.; run; /*******************************/ /*Identificacin de las series:*/ /*******************************/ /*Serie de la provincia de vila: */ title1 'Paro registrado en vila'; title2 '( Enero 1980 - Mayo 2001 )'; /*modelo SARIMA(0,1,1)(1,1,1)12 */ PROC ARIMA data= d.datos; IDENTIFY var=Av(1,12) nlag=36 ; ESTIMATE q=(1)(12) noconstant method=ml plot outcorr outest=resul.test outstat=resul.stat outmodel=resul.model; FORECAST out=b id=date interval=month noprint; run; PROC ARIMA data=b; IDENTIFY var=residual nlag=36; run;

Anlisis de intervenciny funcin de transferencia


Las series temporales a menudo se ven afectadas por cambios en el entorno donde se producen. Estos cambios afectan a la evolucin de la serie y deben ser incorporados al modelo. Estos modelos se denominan modelos con intervencin.

37

La intervencin se define mediante una variable escaln It*(t) = 1 si t t* siendo t* el momento en el que se produjo la intervencin =0 si t < t*

Los efectos de la intervencin pueden ser permanentes o transitorios. Los efectos son permanentes si la intervencin permanece desde el momento en que se produjo Son transitorios si el efecto solo dura mientras se produce la intervencin. En este caso la intervencin tiene la forma (1-B) It*. Una vez identificado el instante en el que se produce la intervencin, sta la modelamos como una funcin de It*, cociente de dos polinomios f(It*) = (W(B)/()) It* en caso de efectos permanentes f(It*) = (W(B)/()) (1-B)It* para efectos transitorios. El polinomio de numerador refleja el cambio en la serie postintervenida. El polinomio del denominador indica la velocidad a la que la serie se aproxima al proceso estacionario postintervenido. Generalmente un grado 0 1 del polinomio numerador y un grado 1 del denominador son suficientes para modelar la mayora de las intervenciones. Efectos permanentes Instantneo:
1,2 1 0,8 0,6 0,4 0,2 0 1 3 5 7 9 11 13

Efectos transitorios f(It*) = w0(1-) It* w0 = 1


1 0,8 0,6 0,4 0,2 0 1 3 5 7 9 11 13

f(It*) = w0 It* w0 = 1

Efectos permanentes Gradual f(It*) = (w0/1- 1) It* w0=1 1=0.5

Efectos transitorios f(It*) = (w0/1- 1) (1) It*

38

2 1,5 1 0,5 0 1 3 5 7 9 11 13

0,5 0,4 0,3 0,2 0,1 0 1 3 5 7 9 11 13

El modelo completo se escribe Yt = f(It*) + Nt Siendo f la funcin que modela la intervencin y Nt un modelo estacionario. Para construir el modelo, se parte de un modelo anterior para la serie Yt que nos servir para identificar el ruido Nt y la funcin f se construye pensando en los posibles efectos de la intervencin, bien por el conocimiento previo o por el comportamiento de los datos.

Funcin de transferencia
Los modelos vistos hasta ahora son modelos univariantes. Se modela la serie como un filtro, es decir como una combinacin lineal de valores pasados y presentes. Ahora veremos un modelo que relaciona una serie con sus valores pasados y presentes y con los valores pasados y presentes de otra serie. Sean Xt e Yt dos series temporales estacionarias. Xt representa el input o variable causa Yt el output o variable respuesta. Nt es un ruido incorrelado con la serie input Xt que ser modelado como ARMA. El modelo final se expresa Yt = vj Xt-j + Nt El operador V(B) = vj Bj se llama funcin de transferencia Los pesos vi son los pesos impulso-respuesta del sistema. Si los parmetros v0 = v1 = . . . = vb-1, entonces las variaciones en el input se manifiestan en el output b retardos despus. En la formulacin del modelo, se supone que el presente y el pasado del input influyen en el presente del output, pero no al revs, es decir, no existe retroalimentacin o feed-back. La correlacin entre Yt y Xt+k es 0. Los valores futuros de X no dependen de los valores pasados y presentes de Y.

39

La correlacin entre Xt y Yt+k es distinta de 0. Los valores futuros de Y dependen de los valores pasados y presentes de X. Los modelos de funcin de transferencia se diferencian de los modelos de regresin principalmente en: Permiten que los errores estn correlados. La relacin entre el regresor y la variable independiente es una relacin dinmica output-input. Tanto la variable dependiente como la independiente presentan autocorrelacin. Nos limitaremos a modelos en los que vj Bj < Si |B| 1, es decir cambios finitos en el input producen cambios finitos en el output. Esto asegura la estacionalidad del output. V(1) = vj = g < . A g se le denomina ganancia del sistema y representa el valor del output si el input es constante e igual a 1 y no hay perturbacin. El modelo presenta un problema y es que tiene infinitos parmetros, una alternativa sera truncar el polinomio V(B), es decir, Yt = v0 Xt + v1 Xt-1 + ... + vh Xt-h + Nt. Donde h se elige de forma que el efecto de los retardos posteriores a h sea despreciable, sin embargo es una decisin difcil y puede evitarse poniendo V(B) como cociente de dos polinomios. V(B)= W(B) Bb/ (B) W(B) = w0 + w1B + ... + ws Bs (B) = 1- 1B - 2 B2 - ... - r Br De esta forma se reduce el nmero de parmetros y el modelo es Yt = [W(B) Bb/ (B)] Xt + Nt Si no existe perturbacin, es decir Nt = 0 el modelo sera ( 1 - 1B - 2 B2 - ... - r Br) Yt = (w0 + w1B + ... + ws Bs)Bb Xt Expresin anloga a la de un modelo ARMA(r, s). Es decir un modelo ARMA es un caso particular de un modelo dinmico de funcin de transferencia en el que el input es un ruido blanco, no existe perturbacin y la funcin de transferencia es el cociente de dos polinomios correspondientes a la parte de media mvil el numerador y a la parte autorregresiva el denominador. As las condiciones de estacionaridad e invertibilidad para la funcin de transferencia son las mismas que para los modelos ARMA, es decir, las races de los polinomios W(B) y (B) fuera del crculo unidad.

Identificacin
Necesitamos calcular los rdenes de los polinomios W(B) y (B) y el retardo b 40

Para ello, calculamos los pesos vi impulso-respuesta en funcin de los coeficientes de los polinomios numerador y denominador. V(B)= W(B) Bb/ (B)multiplicando ambas partes de la igualdad por (B) (B) V(B)= W(B) Bb Desarrollando ( 1- 1B - 2 B2 - ... - r Br)( v0 + v1B + ...) = (w0 + w1B + ... + ws Bs)Bb Igualando coeficientes v0 = v1 = ... = vb-1 = 0 vb = 1 vb-1 + 2 vb-2 + ... + r vb-r + w0 vj = 1 vj-1 + 2 vj-2 + + r vj-r + wj-b vj = 1 vj-1 + 2 vj-2 + ... + r vj-r

j = b+1, ...b+s j> b + s

Estas relaciones hay que tenerlas presentes ya que son muy tiles para identificar la funcin de transferencia, lo que es equivalente a identificar b, retardo a partir del cual una variacin en el input se refleja en el output s, orden del polinomio del numerador. r, orden del polinomio del denominador. En las ecuaciones que verifican los coeficientes se observa - los b-1 primeros coeficientes son 0 v0 = v1 = ... = vb-1 = 0 - los siguientes s+1 no siguen ninguna pauta fija vb vb+1 ... vb+s - a partir del coeficiente s+b+1 los vk verifican una ecuacin en diferencias anloga a la que verifica la funcin de autocorrelacin de un modelo AR(r), es decir decrecimiento suma de exponenciales y ondas seno coseno. Para identificar la funcin de transferencia es importante una estimacin inicial de los pesos vj. Para ello necesitaremos la funcin de autocorrelacin cruzada ya que como veremos los vk son proporcionales a ella. Antes daremos algunas definiciones. Definicin: Un proceso estocstico bivariante (Xt, Yt) se dice que es estacionario en el sentido amplio si Cada componente Xt Yt es estacionario. La funcin de autocovarianza solo depende del retardo que separa las variables y no del tiempo en que se mide. KX(h) = cov(Xt, Xt+h) KY(h) = cov(Yt, Yt+h) h = 0 , 1, 2, . . .

La funcin de covarianza cruzada entre las dos series solo depende del retardo que las separa.

41

KX,Y (h) = cov(Xt, Yt+h) h = 0 , 1, 2, . . . Notar que la funcin de covarianza cruzada no es una funcin par y verifica la relacin KX,Y (h) = KY,X (-h). Se define la funcin de autocorrelacin cruzada por la relacin X,Y (h) = KX,Y (h)/X Y h = 0 , 1, 2, . . . Si tenemos una muestra de tamao N de una serie bivariante, los estimadores de la correlacin cruzada son los habituales rX,Y (h) = CX,Y (h)/sX sY h = 0 , 1, 2, . . . (1/N) N-h Xt Yt+h h = 0, 1, 2, ... t=1 CX,Y (h) = (1/N) N-h Xt+h Yt h = 0, -1, -2, ... t=1 En general las varianzas y covarianzas de estos estimadores son difciles de calcular. En algunos casos especiales disponemos de aproximaciones. - Si Xt es ruido blanco e Yt y Xt son incorreladas la aproximacin de Barlett (1955) da como resultado Var [rX,Y (h)] (N-h)-1 Corr [rX,Y (h), rX,Y (h+1)] Y(1). Es decir, aunque los procesos sean incorrelados, los estimadores de la funcin de correlacin cruzada estn correlados y reproducen la autocorrelacin del output en el primer retardo. - Si Xt e Yt son los dos ruido blanco y estn incorrelados entonces Var [rX,Y (h)] (N-h)-1 Corr [rX,Y (h), rX,Y (h+1)] 0. Por analoga con los modelos ARMA, se puede intentar identificar la funcin de transferencia a partir de las correlaciones cruzadas muestrales, pero las propiedades muestrales no son fciles de establecer, al estar estos estimadores correlados. Los clculos se simplificaran sobremanera si el input fuera un ruido blanco, ya que en este caso disponemos de la aproximacin de Barlett. Por lo que vamos a utilizar la tcnica de preblanqueo para conseguirlo. Tcnica de preblanqueo: Se realiza en dos etapas 1. - Ajustamos un modelo ARMA a la serie input Xt X(B) Xt = X(B)t. 42

La serie t de los residuos es un ruido blanco t = X(B) -1X(B) Xt 2. - Aplicamos el mismo filtro a la serie output t = X(B) -1X(B) Xt La correlacin cruzada entre t y t juega un papel importante a la hora de identificar la funcin de transferencia como se ve a continuacin despus de establecer los resultados Las funciones de transferencia que relacionan Yt con Xt y t con t son iguales. Sea el modelo Yt = V(B) Xt + Nt con Y, X y N procesos estacionarios. Aplicando el filtro X(B) -1X(B) a ambos lados de la igualdad anterior t = V(B) t + t con t = X(B) -1X(B) Nt La funcin de covarianza cruzada entre y es proporcional a V(B) Calculemos esta covarianza cruzada Cov(t , t+h) = E(t t+h) = E[t ( V(B) t+h + t+h] = v0 E(t, t+h) + v1 E(t, t+h-1) + . . . + vh E(t, t) + ... + E(t, t+h) = vh 2 ya que t es ruido blanco y est incorrelado con t. Despejando vh = K, (h) / 2 = ( / )( K, (h) / ) = ( / ) , (h) h = 0,1,2, Con lo que vh es proporcional a la correlacin cruzada entre el input y el output preblanqueados en el retardo h. Identificacin de los rdenes b, s y r vh puede ser estimada por (s / s) r, (h). Estos estimadores en general son no eficientes, pero sirven de base para una primera modelacin de la funcin de transferencia. Mediante la aproximacin de Barlett podemos comparar r, (h) con su desviacin tpica (N-h)-1/2. Tambin hay que comprobar que r, (h) = 0 si h < 0, es decir que no hay retroalimentacin. b es el primer retardo positivo tal que r, (h) 0. Los rdenes s y r de los polinomios W(B) y (B) se pueden determinar por forma de la funcin de correlacin cruzada entre y a partir del retardo b, ya que r, (b) . . . r, (b+s) no presentan ninguna pauta de comportamiento A partir del retardo b+s r, (h) se comporta como la funcin de autocorrelacin de un modelo AR(r). Identificacin del modelo para Nt. Una vez elegidos los ordenes b, r y s, la funcin de transferencia se estima

la

43

V(B) = 1 ( ) W ( ) b y se calculan los residuos N t = Yt - V(B)X t = Yt 1 ( ) W ( ) b N t es un proceso estacionario y por los mtodos habituales de identificacin, identificamos un modelo ARMA(p, q) para N t N (B) N t = N(B)at

con at ruido blanco.

Finalmente el modelo identificado es Yt = [W(B)/(B)]Bb Xt + [ N(B)/ N (B)]at o tambin (B) N Yt = W(B) N (B) Xt-b + (B) N(B) at que en forma desarrollada Yt = d1 Yt-1 + . . . +dp+r Yt-r-p + c0 Xt-b + c1 Xt-b-1 +... + cp+sXt-b-p-s + at + b1 at-1 +... + bq+r a t-q-r Aqu finaliza la etapa de identificacin que nos da un modelo base que debe ser estimado. El modelo identificado puede ser modificado para eliminar parmetros superfluos una vez superada la etapa de estimacin. El orden de los polinomios en general no ser muy grande (2 suele ser suficiente) y si encontramos factores comunes, deben ser simplificados ya que en caso contrario, los resultados serian errneos.

Estimacin
Los mtodos de estimacin son los mismos que en las series univariantes. Si W(B) y (B) son polinomios de orden 0, se obtienen estimadores mnimo cuadrados con expresin exacta, en caso contrario los estimadores se obtienen por aproximaciones sucesivas. Debemos estimar los coeficientes de los polinomios (B) W(B) N(B) N(B). Sea el parmetro a estimar = ( , W , N, N). Para cualquier eleccin de b se pueden calcular los errores at a partir de t > m siendo m = max ( p+r, b+p+s ) + 1 mediante la expresin (B) N Yt = W(B) N (B) Xt-b + (B) N(B) at que en forma desarrollada at = Yt - d1 Yt-1 - . . . -dp+r Yt-r-p - c0 Xt-b - c1 Xt-b-1 -... - cp+sXt-b-p-s - b1 at-1 -... - bq+r a t-q-r nos permite calcular la suma de los cuadrados de los residuos. Si suponemos a0 = a1 = . . . = am = 0 obtenemos mnimos cuadrados condicionados. Si estimamos por el mtodo de mxima verosimilitud y suponemos normalidad, como los residuos at son incorrelados tambin sern independientes.

44

L(,2/X, Y) -n exp[(-1/2)2 N at2()]. t=m+1 La verosimilitud se aproxima por la suma de cuadrados de los residuos, que hay que minimizar.

Validacin
Es la etapa siguiente a la estimacin. El modelo ajustado puede no ser vlido por .- El modelo para el ruido Nt no es el adecuado. En este caso los residuos son correlados y a(h) 0 para algn h > 0, Pero como la funcin de transferencia est bien ajustada, el input preblanqueado y los residuos estn incorrelados, es decir, ,a (h) = 0 h. En este supuesto hay que buscar un nuevo modelo para el ruido, sin modificar la funcin de transferencia. .- El modelo para la funcin de transferencia no es el adecuado. El input preblanqueado y los residuos estn correlados, es decir ,a (h) 0 para algn h. En este caso hay que modificar la funcin de transferencia lo que llevar consigo tambin una modificacin del modelo para el ruido o perturbacin. .- Ninguno de los dos modelos es adecuado. Este caso se comporta como el anterior. A continuacin vamos a probar estas afirmaciones. Supongamos el modelo Yt = -1(B)W(B) Xt-b + N-1 (B) N(B) at = V(B) Xt + (B) at y que hemos seleccionado el modelo Yt = V0(B) Xt + 0(B) a0t Despejando aot = 0-1(B) [Yt - V0(B)Xt] = 0-1(B) [V(B) - V0(B)]Xt + 0-1(B) (B) at. Si la funcin de transferencia es correcta aot = 0-1(B) (B) at. {a0t} no es un ruido blanco, presenta autocorrelacin a0(h) 0 para algn h Pero {a0t} y {t}son incorrelados ya que {t} y {at} lo son.

Si la funcin de transferencia no es correcta 45

{a0t} presenta correlacin cruzada con la serie {Xt} por tanto tambin presenta autocorrelacin y correlacin con la serie {t}, es decir, ,a0 (h) 0 para algn h. Independientemente de s el modelo para la perturbacin est bien o mal modelado, el clculo de la correlacin cruzada de los residuos, resultado del ajuste de la funcin de transferencia, con el input preblanqueado puede informarnos acerca de los cambios que hay que hacer en la funcin de transferencia. Consideremos el modelo preblanqueado t = V(B) t + t con t = X(B) -1X(B) Nt , Los residuos del modelo errneo son t = X(B) -1X(B) Xt

0t = t - V0(B) t = (V(B) -V0(B)) t + t Ahora calculamos la correlacin cruzada entre 0t y t. Esta correlacin en el retardo h mide la discrepancia que existe entre vh y v0h E(t 0t+h) = E{t [(V(B) -V0(B)) t+h + t+h]} = (vh-vh0) E(t2) + E(t t+h) = (vh-vh0) E(t2) por estar las series t y t incorreladas. Despejando (vh-vh0) = ,0 (h) (0/) Es decir una correlacin cruzada alta en un retardo entre el ruido y el input preblanqueado es debido a una diferencia grande entre el valor de la funcin impulso respuesta estimada y la real en ese mismo retardo. En resumen para la validacin del modelo utilizaremos las pruebas de correlacin .- Autocorrelacin de los residuos. Si esta funcin da seales de que los residuos no son aleatorios, esto puede ser debido a que la funcin de transferencia no es correcta, o a que la perturbacin est mal modelada, o las dos causas a la vez. . - Correlacin cruzada entre el input preblanqueado y los residuos. Si la correlacin cruzada entre el input preblanqueado y los residuos es distinta de cero para algn retardo, hay que modificar la funcin de transferencia. Si la correlacin cruzada no da muestras de que el error est en la funcin de transferencia, si los residuos siguen presentando autocorrelacin hay que modificar el modelo para el ruido. Es necesario comprobar las dos funciones de correlacin. Debido a que las autocorrelaciones y las correlaciones cruzadas estn correladas entre s, el comprobar que estos valores son 0, puede llevar a errores, sobre todo en los retardos bajos. Por esta razn se utilizan los estadsticos Q1 = [N(N+2)]/(N-k) k r2a(h) 46

h=1 r2a(h) es la autocorrelacin en el retardo h de los residuos Q2 = [N(N+2)]/(N-k) k r2 ,a(h) h=1 r2, a(h) correlacin cruzada en el retardo h del input preblanqueado y los residuos Bajo la hiptesis nula de que el modelo est bien ajustado, estos estadsticos se distribuyen segn una chi cuadrado con grados de libertad k-p-q y k-r-s respectivamente. Siendo p y q los ordenes autorregresivo y de media mvil de la perturbacin y r y s los ordenes del numerador y denominador de la funcin de transferencia. Necesitamos los dos estadsticos para asegurarnos de la bondad del modelo. Estos dos estadsticos son muy conservadores, por lo que adems es conveniente estudiar la aleatoriedad de los residuos at por los mtodos habituales.

Prediccin
Las tcnicas utilizadas para la prediccin son las mismas que en el caso univariante. Partiendo del modelo ajustado Yt = -1(B)W(B) BbXt + N-1 (B) N(B) at . Dejando libre el error obtenemos N (B) N-1(B)Yt = N(B) N-1(B) -1(B)W(B)Bb Xt + at. Desarrollando ambos miembros N (B) N-1(B) = 1-1B-2B2 - . . . N(B) N-1(B) -1(B)W(B)Bb = v0* + v1*B + v2*B2 + ... De donde Yt = (1Yt-1 + 2Yt-2 + ... ) + (v0*Xt + v1*Xt-1 + v2*Xt-2 + ... ) + at. Ecuacin que puede ser usada para obtener la prediccin de YN+s como combinacin lineal de valores pasados de Xt e Yt hasta el instante N, de forma que el error cuadrtico medio sea mnimo. En caso de normalidad YN(s) = E(YN+s/ YN, YN-1,... XN, XN-1 ,...). Tambin puede ponerse la prediccin como combinacin lineal de los errores y del input preblanqueado, ya que por ser estas series ruido blanco e incorreladas entre s, nos facilitar el clculo de la varianza del error de prediccin.

Errores de prediccin Partiendo de la misma ecuacin Yt = -1(B)W(B) BbXt + N-1 (B) N(B) at

47

como Xt = X-1 (B) X(B) t llegamos a la ecuacin Yt = -1(B)W(B) Bb X-1 (B) X(B) t + N-1 (B) N(B) at = u(B) t + (B) at Con u(B) = -1(B)W(B) Bb X-1 (B) X(B) (B) = N-1 (B) N(B) Que desarrollada da lugar a YN+s = u0 N+s + u1 N+s-1 + . . . + us N + . . . + aN+s + 1aN+s-1 + . . . + saN + . . . Si expresamos la prediccin de la forma YN(s) = (0(1) aN + 1(1) aN-1 + . . . ) + (0(2) N + 1(2) N-1 + . . . ) Elegiremos los i(j) de forma que el error cuadrtico E(|YN+s - YN(s)|2 )sea mnimo. E(|YN+s - YN(s)|2 ) = E{( u0 N+s + u1 N+s-1 + . . . + us-1 N+l + aN+s + 1aN+s-1 + . . . + s-1aN )+ [(us-0(2))N + (us-1-1(2))N-1 + . . . ] +[( s-0(1))aN + ( s-1-1(1))aN-1 + . . . ]}2 El mnimo de esta funcin se alcanza para 0(2)= us , 1(2) = us-1 , . . . 0(1) = s , 1(1) = s-1, ...

El valor de la prediccin es YN(s) = (us N + us+1 N-1 + . . . ) + ( saN + s+1aN-1 + . . .) Con error de prediccin eN(s) = u0 N+s + u1 N+s-1 + . . . + us-1 N+l + aN+s + 1aN+s-1 + . . . + s-1aN+1 y varianza del error de prediccin V(eN(s)) = ( u02 + u12 + . . . + us-12 ) + (1 + 12+ . . . + s-12 )2a
2

Sentencias SAS para intervencin y funcin de transferencia

48

intervenciones parados total data enero80; infile "datosluis\transfer\enero80.txt" dlm='09'x firstobs=2; input ano mes $ total sinemple servicio agric indtotal x2; date= intnx('month','31dec79'd,_n_); format date monyy.; year = year( date ); month =month( date ); x1 = (year >= 1987); proc print; run; Proc arima data=enero80; Identify var=total(1,12) crosscorr=( x1(1,12) x2(1,12)) nlag=36 noprint; estimate p=(1)(12) noconstant input=( (0)/(1)x2 ) method=ml outcov outcorr; forecast lead=12 out=prueba id=date noprint; run; proc gplot data=prueba gout=prueba2; plot residual*date; run; title2 'residuos'; Proc arima data=prueba; Identify var=residual nlag=36; run; title2; Transferencia mujeres paradas libname i 'c:\dataluis\ipc'; title1 'IPC paro'; data i.paroipc; infile "datosluis\paroipc2.txt" dlm='09'x firstobs=2; input ipc totalpar hombres mujeres; /* date= intnx('month','31dec77'd,_n_); */ /* format date monyy.; */ proc print; run; proc arima data=i.paroipc; /*--- identifica el input---------*/ identify var=ipc(1,12) nlags=48; run; /*--- ajusta el input --------*/ estimate q=(12) noconstant; run; /*--- correlacin cruzada entre el input y el output preblanqueados */ identify var=mujeres(1,12) crosscorr=(ipc(1,12)) nlags=48; run; /*--- ajusta function transferencia,identifica residuos */ estimate noconstant input=( (0)/(1) ipc ) ; forecast lead=12 out=prueba id=date noprint; 49

proc arima data=prueba; identify var=residual nlag=36; run; /*--- modelo completo -----------*/ proc arima data=i.paroipc; identify var=ipc(1,12) nlags=48; estimate q=(12) noconstant; identify var=mujeres(1,12) crosscorr=(ipc(1,12)) nlags=48; estimate p=(1)(12) noconstant input=( (0)/(1) ipc ); run;

50

Ejemplo anlis intervencin


Trabajamos con los datos de parados que buscan primer empleo en la comunidad de Castilla y Len . Los datos son mensuales y van desde enero de 1980 hasta mayo de 2001 En el ao 1987 se produce un cambio en la forma de registrar el paro para poder equipararlo con el resto de pases europeos. Hubo un cambio menor en el ao 92. En el ao 1995, se aprueba la reforma del Derecho del Trabajo RD.LEG. 1/1995 de 24 de marzo. Grfico de la serie
parados segn actividad
70000

60000

50000

40000

30000

sin empleo anterior sevcios agricultura total indust

20000

10000

Parados sin empleo anterior


Maximum Likelihood Estimation Parameter Estimate Std Error T Ratio Lag Variable AR1,1 0.32447 0.05873 5.53 1 SINEMPLE AR1,2 0.13201 0.05919 2.23 3 SINEMPLE AR2,1 0.61911 0.04904 12.62 12 SINEMPLE NUM1 -344.48175 181.62336 -1.90 0 X1 Variance Estimate = 371282.535 Std Error Estimate = 609.329579 AIC = 3956.93215 SBC = 3971.04986 Number of Residuals= 252 Shift 0 0 0 0

Correlations of the Estimates SINEMPLE SINEMPLE SINEMPLE Variable Parameter AR1,1 AR1,2 AR2,1 SINEMPLE AR1,1 1.000 -0.120 -0.035

A O 19 78 19 79 19 80 19 81 19 82 19 83 19 84 19 85 19 86 19 87 19 88 19 89 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00

X1 NUM1 0.007

51

SINEMPLE AR1,2 SINEMPLE AR2,1 X1 NUM1

-0.120 1.000 0.021 -0.076 -0.035 0.021 1.000 -0.126 0.007 -0.076 -0.126 1.000

Model for variable SINEMPLE No mean term in this model. Period(s) of Differencing = 1. Autoregressive Factors Factor 1: 1 - 0.32447 B**(1) - 0.13201 B**(3) Factor 2: 1 - 0.61911 B**(12) Input Number 1 is X1. Overall Regression Factor = -344.482 Name of variable = RESIDUAL. Mean of working series = 50.15968 Standard deviation = 618.3341 Number of observations = 252 Autocorrelation Check for White Noise To Chi Autocorrelations Lag Square DF Prob 6 3.83 6 0.700 -0.009 -0.074 -0.038 0.050 -0.054 -0.050 12 22.16 12 0.036 0.169 0.125 -0.037 -0.045 0.053 -0.138 18 25.96 18 0.101 -0.081 -0.006 0.058 0.047 -0.042 0.011 24 31.69 24 0.135 -0.039 -0.128 -0.044 -0.008 -0.007 0.027 30 37.19 30 0.172 -0.098 0.000 0.014 -0.062 0.038 -0.066 36 42.98 36 0.197 0.064 0.020 -0.026 -0.048 -0.055 0.096

Poblacin sin empleo anterior. El modelo encontrado es un SARIMA (3,1,0)(1,0,0)12 y tiene la frmula (1 - B)(1 - 0.32B - 0.13B3)(1 - 0.61B12)Xt = -344.82X1 + Zt Este modelo incorpora las componentes estacionales ya que puede observarse que no ha hecho falta una diferencia estacional. Del desarrollo de la frmula se desprende: -El incremento mensual del nmero de parados sin empleo anterior de cualquier mes anterior a enero de 1988 se puede obtener como 0.32 veces el incremento mensual del mes anterior ms 0.13 veces el incremento mensual de tres meses anteriores ms el incremento mensual del mismo mes del ao anterior menos 0.2 veces el incremento mensual de un mes anterior del ao anterior menos 0.08 veces el incremento mensual de de tres meses anteriores del ao anterior. - El incremento mensual del nmero de parados sin empleo anterior de cualquier mes posterior a enero de 1988 se puede obtener de la anterior manera restndole El cambio en la forma de contabilizar el paro introducido en el ao 87 tuvo influencia en este colectivo reduciendo el incremento mensual del nmero deparados sin empleo anterior en 345. -La nueva ley no tiene ningn efecto en este colectivo

Ejemplo de funcin de transferencia


Relacin del paro de las mujeres de la comunidad con el IPC Hemos tomado como variable input el IPC y como variable output el para femenino. Los datos son mensuales y el periodo de tiempo estudiado es el mismo que en el ejemplo anterior Las salidas de sas son Ajuste del input
Name of variable = IPC.

52

Period(s) of Differencing = 1,12. Mean of working series = 0.005112 Standard deviation = 0.335187 Number of observations = 268 NOTE: The first 13 observations were eliminated by differencing ARIMA Procedure Conditional Least Squares Estimation Parameter Estimate Std Error T Ratio Lag MA1,1 0.58550 0.05161 11.34 12 Variance Estimate = 0.08922208 Std Error Estimate = 0.29870066 AIC = 113.893229* SBC = 117.484216* Number of Residuals= 268 Autocorrelation Check of Residuals To Chi Autocorrelations Lag Square DF Prob 6 3.59 5 0.610 0.114 0.003 0.004 -0.000 -0.017 -0.001 12 12.98 11 0.294 0.059 0.086 0.092 0.055 0.094 0.049 18 16.85 17 0.465 0.028 0.044 0.057 0.068 -0.008 0.053 24 20.64 23 0.603 -0.009 -0.007 -0.090 -0.049 0.047 0.011 30 25.12 29 0.672 0.066 0.012 -0.039 -0.053 -0.055 -0.055 36 32.58 35 0.586 0.069 -0.127 -0.025 0.011 0.015 -0.050 42 38.00 41 0.605 -0.045 -0.070 -0.048 -0.054 -0.069 -0.017 48 43.51 47 0.618 -0.053 -0.014 -0.034 -0.061 -0.058 -0.076 Model for variable IPC No mean term in this model. Period(s) of Differencing = 1,12. Moving Average Factors Factor 1: 1 - 0.5855 B**(12) Ajuste de la funcin de transferencia Name of variable = MUJERES. Period(s) of Differencing = 1,12. Mean of working series = -63.4133 Standard deviation = 917.1056 Number of observations = 196 NOTE: The first 13 observations were eliminated by differencing. Both variables have been prewhitened by the following filter: Prewhitening Filter Moving Average Factors Factor 1: 1 - 0.5855 B**(12) Conditional Least Squares Estimation Parameter Estimate Std Error T Ratio Lag Variable Shift NUM1 -96.03385 136.77718 -0.70 0 IPC 0 DEN1,1 -0.86075 0.34807 -2.47 1 IPC 0 Variance Estimate = 851037.549 Std Error Estimate = 922.516964 AIC = 3234.43909* SBC = 3240.99532* Number of Residuals= 196 Correlations of the Estimates IPC IPC Variable Parameter NUM1 DEN1,1 IPC NUM1 1.000 -0.470 IPC DEN1,1 -0.470 1.000 Ajuste del ruido Conditional Least Squares Estimation. Parameter Estimate Std Error T Ratio Lag Variable Shift AR1,1 0.38683 0.06734 5.74 1 MUJERES 0 AR2,1 -0.33426 0.07410 -4.51 12 MUJERES 0 NUM1 -112.84190 95.75468 -1.18 0 IPC 0 DEN1,1 -0.88856 0.14475 -6.14 1 IPC 0 Variance Estimate = 671232.373 Std Error Estimate = 819.287723 AIC = 3189.88917* SBC = 3203.00163*

53

Number of Residuals= 196 Correlations of the Estimates MUJERES MUJERES IPC IPC Variable Parameter AR1,1 AR2,1 NUM1 DEN1,1 MUJERES AR1,1 1.000 -0.147 0.013 -0.015 MUJERES AR2,1 -0.147 1.000 0.009 0.031 IPC NUM1 0.013 0.009 1.000 -0.598 IPC DEN1,1 -0.015 0.031 -0.598 1.000 Validacin Crosscorrelation Check of Residuals with Input IPC To Chi Crosscorrelations Lag Square DF Prob 5 2.53 4 0.639 -0.050 0.007 -0.002 -0.072 -0.013 -0.071 11 7.22 10 0.705 -0.052 0.032 0.051 0.072 0.108 0.027 17 16.01 16 0.452 -0.105 0.060 -0.014 -0.022 0.130 0.113 23 19.56 22 0.611 0.044 0.058 0.054 -0.015 -0.062 0.076 29 22.34 28 0.765 0.038 -0.007 0.046 0.041 -0.081 0.049 35 25.38 34 0.857 0.023 -0.001 0.115 -0.031 0.021 -0.016 41 28.41 40 0.915 0.021 0.018 -0.103 -0.015 0.044 0.043 47 30.69 46 0.960 -0.003 -0.059 -0.036 0.017 0.057 0.058 Autocorrelation Check of Residuals To Chi Autocorrelations Lag Square DF Prob 6 6.78 4 0.148 -0.020 0.024 0.070 0.120 -0.112 -0.027 12 12.11 10 0.277 -0.002 0.084 -0.054 0.101 0.072 -0.017 18 19.65 16 0.236 0.133 0.067 0.005 -0.079 0.068 -0.046 24 27.66 22 0.187 -0.030 -0.068 0.078 -0.122 -0.044 -0.086 30 32.59 28 0.251 0.013 -0.054 0.008 0.115 -0.009 0.069 36 43.72 34 0.123 0.007 -0.061 -0.082 0.067 -0.108 -0.139 42 49.87 40 0.136 -0.001 0.053 -0.140 0.044 0.018 0.016

modelo ajustado

Model for variable MUJERES No mean term in this model. Period(s) of Differencing = 1,12. Autoregressive Factors Factor 1: 1 - 0.38683 B**(1) Factor 2: 1 + 0.33426 B**(12) Input Number 1 is IPC. Period(s) of Differencing = 1,12. Overall Regression Factor = -112.842 The Denominator Factors are Factor 1: 1 + 0.88856 B**(1)

El modelo encontrado tiene la frmula (1 B )(1 B 12 )Yt = 112.84 (1 B )(1 B 12 ) X t + (1 0.39 B )(1 + 0.33B 12 ) Z t (1 + 0.89 B)

La ganancia de la funcin de transferencia es -59,70. Esto es, una variacin del incremento mensual del incremento anual de una unidad en el IPC hace que el incremento mensual del incremento anual en el nmero de mujeres paradas el mismo mes sea de 60 desempleadas menos. Aparte de este efecto, la serie del paro femenino sigue evolucionando segn un modelo estacional SARIMA(1,1,0)(1,1,0)12. Un incremento en el IPC produce ese mismo mes un descenso en el paro femenino

54

Modelos multivariantes Modelos ARIMA


Se definen igual que en el caso univariante, solo que los coeficientes en lugar de ser nmeros sern matrices. AR(p)

X t = 1 X t 1 + 2 X t 2 + ... + p X t p + Z t
X t = 1 Z t 1 + 2 Z t 2 + ... + pq Z t q + Z t

MA(q)

Con Xt =(X1,t; X2,t;Xk,t) 1,2, p, 1 ,2,q matrices kxk Zt =(Z1,t; Z2,t;Zk,t) vector ruido verificando E(Zt, Zs) = 0 E(Zt, Zt) = Las componentes de Zt son procesos de ruido blanco univariantes, incorrelados con los dems en distintos tiempos, pero posiblemente correlados en el mismo tiempo, es decir no es una matriz diagonal. Para que exista una solucin estacionaria del modelo es necesario que las raices de | (z)| esten fuera del crculo unidad. Para que el modelo sea identificable, es necesario que las raices de | (z)| esten fuera del crculo unidad.

55

Siendo (z) = u=0, k u Zu (z) = u=0, k u Zu

Para ajustar estos modelos usamos la sentencia SAS proc statespace que utiliza el modelo de espacio de estados que es una representacin mediante un proceso de markov de las series multivariantes.

Modelos de espacio de estados


Sea Xt un vector rx1 que representa el vector de observaciones. Zt un vector sx1 con s>r que representa el vector de estados. Denotamos por Xt+k|t la prediccin de Xt+k cuando se tienen observaciones hasta el instante t. Las ltimas componentes de Zt son de la forma Xt+k|t El modelo se expresa Zt+1 = F Zt + G et+1, ecuacin de transicin o ecuacin de estado. Con F matriz sxs o matriz de transicin, determina las propiedades dinmicas del modelo G matriz sxr o matriz de innovacin, Determina la estructura de la varianza de la ecuacin de transicin. Las primeras r filas y columnas es la matriz identidad Et vector rxr o vector de innovacin , formado por variables incorreladas en distintos tiempos. La ecuacin de medida se obtiene Xt =[Ir, 0] Zt

Ejemplo
libname d 'c:\datos'; title1 'Castilla y Leon'; data d.cyl; infile "datos\cyl.txt" dlm='09'x firstobs=2; input Paro Hombres Mujeres Sinempleo Cregistrados Cindefinidos Colocaciones Demandas men25 de20a24 de25a29 de30a34 mayo25 meno20 de35a39 de40a44 de45a49 de50a54 de55a59 mayo59 EmpresaE empCyL TI3M ILP ipc12 ipc13 ipc14 ipc15 ipc16 ipc17 ipc18 ipc19 ipc20 ; date= intnx('month','31dec79'd,_n_); format date monyy.; /*proc print; */ run; proc statespace data=d.cyl out= cylfuera lead=12; var Mujeres(1,12) Sinempleo(1,12) Colocaciones (1,12) ILP(1); id date; form Mujeres 4 Sinempleo 1 Colocaciones 1 ILP 1; restrict F(2,1)=0 F(2,4)=0 F(3,2)=0 F(3,5)=0 F(4,1)=0 F(4,2)=0 F(4,3)=0 F(4,5)=0F(7,1)=0 F(7,3)=0 F(7,4)=0 F(7,7)=0 G(5,3)=0 G(6,1)=0G(6,2)=0 G(6,3)=0 G(6,4)=0 G(7,4)=0 F(2,3)=0 F(3,1)=0F(3,4)=0 F(4,4)=0 F(7,6)=0 G(5,2)=0 F(7,5)=0 G(5,4)=0 G(7,2)=0 G(5,1)=0 G(7,1)=0 G(7,3)=0; run;

56

Ajuste de un un modelo bivariante a las series de variacin interanual de Espaa y de la comunidad.

57

Tasa d e variacin anu al P IB


30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 -2 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 E s paa 1999 2000 2001 2002

Cas tilla y Len

Standard Variable Mean Error __CastillayLeon 9.273182 4.311289 Espana 9.740455 3.402027 The STATESPACE Procedure Selected Statespace Form and Preliminary Estimates State Vector __CastillayLeon(T;T) Espana(T;T) Maximum likelihood estimation has converged. Estimate of Transition Matrix -0.34349 1.103079 -0.1863 0.820067 Input Matrix for Innovation 1 0 0 1 Variance Matrix for Innovation 12.04467 7.44271 7.44271 7.069811

Parameter Estimates Parameter Estimate Standard Error t Value

58

F(1,1) F(1,2) F(2,1) F(2,2)

-0.34349 1.103079 -0.18630 0.820067

0.347871 0.440728 0.266635 0.337817

-0.99 2.50 -0.70 2.43

Name of Variable = RES1 Mean of Working Series -0.10864 Standard Deviation 3.35048 Number of Observations 22 To Lag 6 Autocorrelation Check for White Noise ChiPr > Square DF ChiSq --------------------Autocorrelations-------------------1.35 6 0.9689 0.134 0.038 0.038 0.023 -0.153 -0.051 Name of Variable = RES2 Mean of Working Series -0.09089 Standard Deviation 2.56095 Number of Observations 22 ChiPr > Square DF ChiSq --------------------Autocorrelations-------------------2.72 6 0.8429 0.034 -0.100 0.179 0.069 0.186 0.099 Correlation of RES1 and RES2 Crosscorrelations Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 -10 -1.043939 -.12167 | . **| . -9 0.576598 0.06720 | . |* . -8 -0.558740 -.06512 | . *| . -7 -1.361354 -.15866 | . ***| . -6 0.844707 0.09845 | . |** . -5 0.075422 0.00879 | . | . -4 1.947410 0.22696 | . |***** . -3 1.095254 0.12765 | . |*** . -2 0.600521 0.06999 | . |* . -1 0.397556 0.04633 | . |* . 0 6.877300 0.80151 | . |**************** 1 1.071854 0.12492 | . |** . 2 -1.613803 -.18808 | . ****| . 3 0.925098 0.10782 | . |** . 4 0.213451 0.02488 | . | . 5 1.050565 0.12244 | . |** . 6 0.150554 0.01755 | . | . 7 -1.266643 -.14762 | . ***| . 8 -0.733530 -.08549 | . **| .

To Lag 6

Como puede apreciarse hemos ajustado un modelo VARMA(1). Los coeficientes correspondientes a la serie de Castilla y Len son poco significativos, an as los hemos dejado por el mejor ajuste del modelo y posterior prediccin. Tambin se observa que los residuos de cada serie son incorrelados, as como que las dos series de residuos no presentan correlacin cruzada. En el siguiente grfico se representa las dos series conjuntamente con sus

59

predicciones. Se observa como las series predichas son ms suaves, presentan menos oscilaciones, que las series originales. Tambin como a partir del ao 1990 las serie de Castilla y Len siempre est por debajo de la serie de Espaa , signo de el menor crecimiento econmico de nuestra comunidad que el crecimiento medio a nivel nacional.
variacin interanual PIB Castilla y Len -Espaa
25

20 CastillayLeon prediccioncyl Espaa 10 predicionespaa

15

0
a o 19 81 19 82 19 83 19 84 19 85 19 86 19 87 19 88 19 89 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04

vila 60

tasas de variacin anual Pib


30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 -2 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 vila 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

Castilla y Len

Espaa

Se ha ajustado un modelo trivariante a las series de la variacin interanual del PIB en Castilla y Len, Espaa y Avila. Los datos procesados muestran
The STATESPACE Procedure Number of Observations 22 Standard Variable Mean Error __CastillayLeon 9.273182 4.311289 Espana 9.740455 3.402027 Avila 8.842273 4.401761 The STATESPACE Procedure Selected Statespace Form and Preliminary Estimates State Vector __CastillayLeon(T;T) Espana(T;T) Avila(T;T) Maximum likelihood estimation has converged. Estimate of Transition Matrix 0 0.861068 -0.20253 0 0.590153 0 0.597553 0 0 Input Matrix for Innovation 1 0 0 0 1 0 0 0 1 Variance Matrix for Innovation

61

11.73739 7.56436 4.860158

7.56436 7.226412 4.662947

4.860158 4.662947 13.1272

Parameter Estimates Standard Parameter Estimate Error F(1,2) 0.861068 0.231554 F(1,3) -0.20253 0.121041 F(2,2) 0.590153 0.162895 F(3,1) 0.597553 0.173264

t Value 3.72 -1.67 3.62 3.45

Name of Variable = RES1 Mean of Working Series -0.05042 Standard Deviation 3.338473 Number of Observations 22 To Lag 6 Autocorrelation Check for White Noise ChiPr > Square DF ChiSq --------------------Autocorrelations-------------------0.69 6 0.9947 -0.069 0.048 0.012 0.123 -0.041 0.010 Correlation of RES1 and RES2 Variance of input = 6.731576 Number of Observations 22 Lag -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 Covariance -0.716465 0.289003 -0.109605 -1.408363 0.652823 0.730121 2.208398 0.446340 0.720759 -0.585625 7.121899 0.478219 -1.650747 1.439995 1.188948 1.264630 0.487752 -0.863886 -0.523020 1.406699 -2.336863 Crosscorrelations Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 -.08272 | . **| . | 0.03337 | . |* . | -.01265 | . | . | -.16260 | . ***| . | 0.07537 | . |** . 0.08429 | . |** . 0.25496 | . |***** . 0.05153 | . |* . 0.08321 | . |** . -.06761 | . *| . 0.82222 | . |**************** 0.05521 | . |* . -.19058 | ****| . 0.16625 | . |*** . 0.13726 | . |*** . 0.14600 | . |*** . 0.05631 | . |* . -.09974 | . **| . -.06038 | . *| . 0.16240 | . |*** . -.26979 | . *****| .

Name of Variable = RES2 Mean of Working Series -0.08505 Standard Deviation 2.594528 Number of Observations 22 Autocorrelation Check for White Noise

62

To Lag 6

ChiPr > Square DF ChiSq --------------------Autocorrelations-------------------2.69 6 0.8469 0.025 -0.094 0.162 0.112 0.186 0.090 Correlation of RES2 and RES3 Variance of input = 12.35423 Number of Observations 22 Lag -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 Covariance -1.910090 2.688432 -1.149504 -0.982808 2.439418 2.245745 0.739302 3.344567 -0.552505 -0.351285 4.279745 -1.179240 -0.398727 -0.669390 -0.103661 -0.699936 1.902586 -2.075009 -1.963786 1.031299 -1.227639 Crosscorrelations Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 -.20945 | . ****| . 0.29480 | . |****** . -.12605 | . ***| . -.10777 | . **| . 0.26750 | . |***** . 0.24626 | . |***** . 0.08107 | . |** . 0.36675 | . |***** . -.06059 | . *| . -.03852 | . *| . 0.46930 | . |********* -.12931 | . ***| . -.04372 | . *| . -.07340 | . *| . -.01137 | . | . -.07675 | . **| . 0.20863 | . |**** . -.22754 | . *****| . -.21534 | . ****| . 0.11309 | . |** . -.13462 | . ***| .

Name of Variable = RES3 Mean of Working Series -0.08755 Standard Deviation 3.514858 Number of Observations 22 To Lag 6 Autocorrelation Check for White Noise ChiPr > Square DF ChiSq --------------------Autocorrelations-------------------2.06 6 0.9137 -0.095 0.024 0.065 -0.171 0.134 0.094 Correlation of RES3 and RES1 Variance of input = 11.1454 Number of Observations 22 Lag -10 -9 -8 -7 -6 -5 -4 -3 Covariance -1.386896 1.517526 -2.501320 -1.231276 2.706255 -0.680085 0.924432 -1.899108 Crosscorrelations Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 -.11819 | . **| . 0.12932 | . |*** . -.21316 | . ****| . -.10493 | . **| . 0.23063 | . |**** . -.05796 | . *| . 0.07878 | . |** . -.16184 | . ***| .

63

-2 -1 0 1 2 3 4 5 6 7 8 9 10

-0.308584 -1.877841 4.537718 -1.464646 -0.455613 1.814367 2.437544 2.631974 4.851007 -0.902383 -1.425162 2.286682 -2.848317

-.02630 -.16003 0.38671 -.12482 -.03883 0.15462 0.20773 0.22430 0.41341 -.07690 -.12145 0.19487 -.24274

| | | | | | | | | | | | |

. . . . . . . . . . . . .

*| . ***| . |********. **| . *| . |*** . |**** . |**** . |**** . **| . **| . |**** . *****| .

De las anteriores salidas podemos deducir el modelo trivariante ajustado y teniendo en cuenta los coeficientes podemos afirmar. El modelo relaciona el crecimiento de Castilla y Len negativamente con el crecimiento de Avila (-0.20) y positivamente con el crecimiento espaol. El crecimiento espaol no tiene ningn coeficiente ni en Castilla y Len ni en vila, es decir el PIB regional conjuntamente con el PIB de vila no influye en el PIB nacional. Por ltimo el crecimiento de vila depende nicamente del crecimiento espaol (0.597). Los coeficientes puede verse que son incorrelados y no presentan correlacin cruzada. todos significativos y los residuos

En el grfico siguiente se ve la evolucin conjunta de los tres ndices, destacando cmo el ndice de crecimiento de vila est siempre por debajo del nacional y regional.
indice de variacin interanual vila
25 20 15 10 5 0

Mujeres, Sin empleo anterior y colocaciones registradas


The STATESPACE Procedure

19 81 19 82 19 83 19 84 19 85 19 86 19 87 19 88 19 89 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04
Cas tillay Leon predic ion CyL Es pana predicion espaa A vila predic c ion avila

a o

64

Number of Observations 192 Standard Variable Mean Error Mujeres -44.3125 916.8836 Has been differenced. With period(s) = 1,12. Sinempleo -40 672.4131 Has been differenced. With period(s) = 1,12. Colocaciones 13.375 2924.21 Has been differenced. With period(s) = 1,12. The STATESPACE Procedure Information Criterion for Autoregressive Models Lag=0 Lag=1 Lag=2 Lag=3 Lag=4 Lag=5 Lag=6 Lag=7 Lag=8 Lag=9 Lag=10 8177.44 8077.26 8036.53 8029.24 7885.47 7895.93 7906.62 7912.03 7883.95 7888.18 7895.05 Schematic Representation of Correlations Name/Lag 0 1 2 3 4 5 6 7 8 9 10 Mujeres ++. ++. .++ .+. .+. .+. ... .+. +.. ... ... Sinempleo ++. .+. .+. .+. .+. .+. ... .+. -+. -.. ... Colocaciones ..+ ..- ... ... ... ..- ... ..+ .+ is > 2*std error, - is < -2*std error, . is between Schematic Representation of Partial Autocorrelations Name/Lag 1 2 3 4 5 6 7 8 9 Mujeres +.. ... .+. .+. ... ... ... .-. ... ... Sinempleo .+. ... ... ... ... ... ... -.. ... ... Colocaciones ..- -.- ... ... ... ... ... ..- ... ... 10

..+

..-

+ is > 2*std error, - is < -2*std error, . is between Yule-Walker Estimates for Minimum AIC ----------------Lag=1---------------- ----------------Lag=2---------------Mujeres Sinempleo Colocaciones Mujeres Sinempleo Colocaciones Mujeres 0.25125 -0.03747 -0.0439 -0.01928 -0.02205 0.001651 Sinempleo -0.04908 0.241922 0.016191 0.020564 0.047593 0.005984 Colocaciones0.257782 0.032916 -0.79586 -0.44116 0.178353 -0.54635 Yule-Walker Estimates for Minimum AIC ----------------Lag=3---------------- ----------------Lag=4---------------Mujeres Sinempleo Colocaciones Mujeres Sinempleo Colocaciones Mujeres -0.07557 0.131602 -0.05068 0.144801 1.018071 -0.03263 Sinempleo -0.04836 0.063421 0.009556 -0.05226 0.158971 0.031726 Colocaciones 0.158702 -0.06259 -0.23426 0.526054 0.266897 -0.19839 Yule-Walker Estimates for Minimum AIC ----------------Lag=5---------------- ----------------Lag=6---------------Mujeres Sinempleo Colocaciones Mujeres Sinempleo Colocaciones Mujeres -0.04171 -0.12712 0.00866 -0.01119 -0.11387 0.008202 Sinempleo -0.06997 0.07945 0.047442 0.045021 -0.00811 0.038477 Colocaciones -0.37516 -0.66988 -0.10166 0.52161 0.06588 -0.16238 Yule-Walker Estimates for Minimum AIC ----------------Lag=7---------------- ----------------Lag=8---------------Mujeres Sinempleo Colocaciones Mujeres Sinempleo Colocaciones Mujeres 0.036331 0.112582 0.007535 0.062913 -0.31271 -0.01612 Sinempleo -0.02058 0.154331 0.030765 -0.20816 0.159434 0.015094 Colocaciones -0.06616 -0.35333 -0.23426 0.223824 -0.5398 -0.28402 Maximum likelihood estimation has converged.

State Vector Mujeres(T;T) Sinempleo(T;T) Colocaciones(T+1;T) Mujeres(T+2;T) 0 0 0 0 0 0 0 0 -0.10656 0 0 0 0 0 0 0 0

Selected Statespace Form and Fitted Model


Colocaciones(T;T) Mujeres(T+3;T) 0 0 0 0 1 0 Mujeres(T+1;T)

Estimate of Transition Matrix 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 Input Matrix for Innovation

65

1 0 0 0 1 0 0 0 1 0 0 -0.03337 0 0 -0.73448 0 0 0.03502 0 0.432555 -0.05713 Variance Matrix for Innovation 719538.2 45385.57 195740.9 45385.57 452139.4 -80561.8 195740.9 -80561.8 5148956 Parameter Estimates Standard Parameter Estimate Error t Value F(5,1) -0.10656 0.090399 -1.18 G(4,3) -0.03337 0.026871 -1.24 G(5,3) -0.73448 0.048492 -15.15 G(6,3) 0.035020 0.026945 1.30 G(7,2) 0.432555 0.090523 4.78 G(7,3) -0.05713 0.026905 -2.12

Ecuaciones del modelo 12M(T+1:T) = 0.43 eS(T-3:T) 0.06eC(T-3:T) 12S(T+1:T) = eS(T:T) 12C(T+1:T) = - 0.10 12C(T:T) -0.73 eC(T-1:T) Por la forma del modelo podemos deducir que las tres series analizadas son dependientes entre s siendo las unas a la vez la causa y el efecto de las otras. Cabe destacar que la serie desempleados sin empleo anterior no interacta con la serie Contratos registrados ya que ninguna de ellas est en la ecuacin de la otra.Ambas estn relacionadas a travs de la serie de mujeres paradas Otro rasgo a destacar es que la serie de mujeres paradas aporta dimensin cuatro al espacio de estados que es de dimensin 7. Los contratos aportan dimensin 2

Modelos de Heterocedasticidad Condicional


En la teora clsica de series temporales (metodologa de Box-Jenkins), el desarrollo estadstico se realiza a partir de un proceso estocstico estacionario; es decir (en sentido amplio o dbil) de un proceso con: - Media constante. - Varianza constante. - correlacin entre dos observaciones distintas igual a la de otras dos cualquiera separadas por la misma distancia (mismo nmero de perodos). En torno a la confirmacin de la ausencia de tendencia (determinista o aleatoria), hay un nutrido conjunto de teoras y desarrollos matemticos centrados en la

66

diferenciabilidad de la serie temporal y en la existencia o no de races unitarias a partir de los conocidos test de Dickey y Fuller, de Phillips y Perron, etc. Sin embargo, el estudio de la componente de varianza constante es un fenmeno menos extendido y, no tener en cuenta una posible no constancia de este componente, puede suponer diversos problemas estadsticos cuando se estiman modelos economtricos (problemas ligados con la eficiencia de los parmetros estimados y su fuerte volatilidad ante el amplio intervalo de confianza en el que se mueven). Determinar un patrn de comportamiento estadstico para la varianza es el cometido de los modelos Autorregresivos condicionales heterocedsticos: ARCH. Engle (1982) es el autor de una primera aproximacin a la varianza condicional del tipo que describiremos ms adelante. Despus de estos hay una amplia familia de sofisticaciones del modelo inicial que darn nombre a los modelos GARCH, IGARCH, EARCH, TARCH, SWARCH, QS-ARCH, APARCH, FACTOR-ARCH, ... En el artculo seminal de los modelos ARCH, Engle cita tres situaciones que motivan y justifican la modelacin de la heterocedasticidad condicional Autorregresiva Estas seran las siguientes: 1. La experiencia emprica nos lleva a contrastar perodos de amplia varianza de error seguidos de otros de varianza ms pequea. Es decir, el valor de la dispersin del error respecto a su media cambia en el pasado, por lo que es lgico pensar que un modelo que atienda en la prediccin a los valores de dicha varianza en el pasado servir para realizar estimaciones ms precisas. 2. En segundo lugar, Engle expone la validez de estos modelos para determinar los criterios de mantenimiento o venta de activos financieros. Los agentes econmicos deciden esta cuestin en funcin de la informacin proveniente del pasado respecto al valor medio de su rentabilidad y la volatilidad que sta ha tenido. Con los modelos ARCH se tendran en cuenta estos dos condicionantes. 3. El modelo de regresin ARCH puede ser una aproximacin a un sistema ms complejo en el que no hubiera factores innovacionales con heterocedasticidad condicional. Los modelos estructurales admiten, en multitud de ocasiones, una especificacin tipo ARCH infinito. Los modelos ARCH son modelos para las innovaciones Et de una serie observada. Suponemos que se ha modelado la media condicional de la serie mediante un modelo ARMA, o no lineal, pero que las innovaciones del proceso pueden escribirse como: (t )2= tet donde et y t son dos procesos estacionarios independientes entre s. El proceso et es de ruido blanco estandarizado, es decir, formado por variables independientes de media cero y varianza unidad. Supondremos que la distribucin de este proceso es normal, aunque todo el anlisis puede generalizarse suponiendo otra distribucin, como la t de Student. El proceso t es estacionario y con estructura dinmica, siendo su valor en t funcin del conjunto (et1, ..., e1) de las innovaciones previas a t. La independencia entre et y t implica que las innovaciones Et forman una secuencia de variables con media marginal y condicional igual a cero varianza marginal constante, pero varianza condicionada dada por (t)2 funcin de autocorrelacin nula correlaciones entre los cuadrados de las innovaciones 67

El modelo ARCH(1) supone que la varianza condicional de las innovaciones, 2t , tiene una estructura similar a un AR(1), y depende slo de la ltima innovacin, Es decir si el valor de 2 t1 es alto, la varianza de la siguiente innovacin ser tambin alta, haciendo ms probable que el valor de 2t= t et sea alto. Esto explica la aparicin de correlaciones entre los cuadrados de las innovaciones. Este modelo tiene la capacidad de producir rachas de valores con alta varianza. Por otro lado, como la media marginal es cero, aunque la varianza sea alta siempre es posible que aparezca un valor pequeo de 2t , que disminuir la varianza marginal de la observacin siguiente y facilitar que la siguiente observacin sea pequea. De esta manera las innovaciones presentan rachas de valores altos, pero globalmente forman un proceso estacionario

Modelo arch (p) (t )2= tet

Donde: sigma es la varianza condicional Siendo t-1 la historia pasada del proceso t Los alpha son los parmetros especificados por el modelo Epsiln son la innovaciones

Modelo garch (p,q)


Este modelo fue desarrollado por Bollerslev (1987), extendiendo el modelo ARCH para incluir retardos en la varianza condicional. En definitiva un GARCH es un modelo ARCH infinito, un GARCH (p,q) se define como:

(t )2= tet

No hay que olvidar que los modelos Garch son para las innovaciones o errores, en la prctica, se ajustan modelos ARIMA con residuos heterocedsticos, con o sin tendencia.La sentencia SAS que se utiliza es proa autoreg

68

data d.cyl1; set d.cyl; diferencia=importaciones-exportaciones; retardo=lag1(diferencia); run; proc autoreg data=d.cyl1 corrb covb outest= d.fuera covout; model diferencia=retardo/lagdep nlag=1 dwprob archtest; output out =d.b R=residuos RM=residuosestructurales P=prediccion PM=prediccionestructural LCL=lcl UCL=ucl LCLM=lclestructural UCLM=uclestructural; run; data h; set d.fuera; proc print; run; data g; set d.b; cuadrado = residuos*residuos; /* proc print;*/ run; proc arima data =g; identify var=residuos; identify var=cuadrado; identify var= residuosestructurales; run; proc gplot data =d.b; plot diferencia*date prediccion*date lcl*date ucl*date/overlay; symbol1 i=joint v=none;symbol2 i=joint v=none;symbol3 i=joint v=none;symbol4 i=joint v=none; run; plot residuos*date; symbol1 i=joint v=none; run; plot diferencia*date prediccionestructural*date lclestructural*date uclestructural*date/overlay; symbol1 i=joint v=none;symbol2 i=joint v=none;symbol3 i=joint v=none;symbol4 i=joint v=none; run; plot residuosestructurales*date; symbol1 i=joint v=none; run; plot diferencia*date prediccionestructural*date /overlay; symbol1 i=joint v=none;symbol2 i=joint v=none; run; plot diferencia*date lclestructural*date uclestructural*date/overlay; symbol1 i=joint v=none;symbol2 i=joint v=none;symbol3 i=joint v=none; 69

run; plot lclestructural*date uclestructural*date/overlay; symbol1 i=joint v=none;symbol2 i=joint v=none; run; Con resultados Variable Dependiente diferencia Estimadores SSE 3,10189E11 DFE MSE 1704336109 Root MSE SBC 4441,77354 AIC Regress R-Square 0,0321 Total R-Square Durbin's t -1,9467 Pr < t El test de Durbin nos dice que la serie presenta autocorrelacin Q and LM Tests for ARCH Disturbances(homocedasticidad) Order Q Pr > Q LM Pr > LM 1 0,3282 0,5667 0,3281 0,5668 2 0,5252 0,7690 0,5169 0,7723 3 0,5651 0,9044 0,5484 0,9081 4 0,6849 0,9532 0,6734 0,9546 5 0,7388 0,9808 0,7304 0,9813 6 0,8001 0,9921 0,8158 0,9916 7 0,8020 0,9974 0,8160 0,9973 8 1,1186 0,9974 1,0834 0,9977 9 1,1191 0,9991 1,0973 0,9992 10 1,8474 0,9974 1,9299 0,9968 11 1,8474 0,9990 1,9300 0,9987 12 2,0862 0,9993 2,1268 0,9992 El contraste de homocedasticidad nos dice que la varianza condicionada de la serie no varia a lo largo del tiempo por lo que un modelo heterocedstico (modelo GARCH) puede no ser adecuado Estimacin Standard Approx Variable DF Estimador Error t Value Pr > |t| Intercept 1 4575 3079 1,49 0,1390 Retardo 1 0,1816 0,0739 2,46 0,0150 Todos los parmetros son significativos Covarianza de los Estimadores de los Parmetros Intercept retardo Intercept 9479142 -34,39605 70

182 41284 4435,34367 0,0321 0,0266

Retardo

-34,39605

0,005466

Correlacin de los Estimadores de los Parmetros Intercept retardo Intercept 1 -0,15111 Retardo -0,15111 1 Los parmetros no estn correlados Estimacin de Autocorrelaciones Lag Covarianza Correlacin -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 0 1,6858E9 1,000000 | |********************| 1 -4,387E7 -0,026021 | *| | Preliminar MSE 1,6847E9 Estimadores de los Parmetros Autoregresivos Standard Lag Coefficient Error t Value 1 0,026021 0,074304 0,35 Algoritmo converge El valor del parmetro es muy pequeo, aunque es significativamente distinto de cero ya que presenta un valor del estadstico t muy pequeo. Estimadores SSE 3,03622E11 MSE 1677468855 SBC 4443,15335 Regress R-Square 0,2131 Variable Intercept Retardo AR1 DF 1 1 1 DFE 181 Root MSE 40957 AIC 4433,50855 Total R-Square 0,0526 Approx t Value 1,15 4,69 2,96 Pr > |t| 0,2496 <,0001 0,0035

Standard Estimador Error 2763 2392 0,4725 0,1007 0,3119 0,1055

Covarianza de los Estimadores de los Parmetros Intercept retardo Intercept 5720820,9 -64,46492 Retardo -64,46492 0,0101349 AR1 -49,60026 0,0078809

AR1 -49,60026 0,0078809 0,0111281

Correlacin de los Estimadores de los Parmetros Intercept retardo AR1 Intercept 1 -0,26772 -0,19658 Retardo -0,26772 1 0,74209 AR1 -0,19658 0,74209 1 Los parmetros presentan una correlacin moderadamente baja. 71

Suponiendo parmetros autoregresivos conocidos, Standard Approx Variable DF Estimate Error t Value Intercept 1 2763 2345 1,18 Retardo 1 0,4725 0,0675 7,00 Covarianza de los Estimadores de los Parmetros Intercept retardo Intercept 5499742,8 -29,33806 Retardo -29,33806 0,0045536 Correlacin de los Estimadores de los Parmetros Intercept retardo Intercept 1 -0,18539 Retardo -0,18539 1 Obs MODEL TYPE_ _STATUS_ 1 OLS 0 Converged 2 COV 0 Converged 3 COV 0 Converged 4 COV 0 Converged Obs 1 2 3 4 _SSE_ _STDERR_ 303621862785 , 303621862785 2391,82 303621862785 0,10 303621862785 0,11 _DEPVAR METHOD NAME_ diferencia ML diferencia ML Intercept diferencia ML retardo diferencia ML _A_1

Pr > |t| 0,2404 <,0001

_MSE_ 1677468855,2 1677468855,2 1677468855,2 1677468855,2

Intercept diferencia retardo 2762,52 -1 0,4725 5720820,93 , -64,4649 -64,46 , 0,0101 -49,60 , 0,0079

_A_1 0,3119 -49,6003 0,0079 0,0111

Ahora verificamos si el modelo es aceptable Variable residuos estructurales Media -17,9208 Desv. Est. 42769,4 Observaciones 184 Test de autocorrelacin para ruido blanco To Lag 6 12 18 24 ChiSquare 23,70 29,33 36,14 44,37 DF 6 12 18 24 Pr > ChiSq 0,0006 0,0035 0,0068 0,0069 --------------------Autocorrelations--------------------0,312 -0,043 0,082 0,146 0,025 0,081 -0,036 -0,062 0,147 -0,070 0,044 0,054 -0,056 0,056 -0,027 -0,038 0,053 0,105 0,100 -0,018 0,025 -0,035 -0,112 0,097

Los residuos estructurales estn correlados por lo que no sobra el haber ajustado un modelo estructural, la ecuacin de medida no produce residuos incorrelados. 72

Variable Media Desv. Est. Observaciones

residuos 27,73732 40621,65 184

Test de autocorrelacin para ruido blanco To Lag 6 12 18 24 ChiSquare 6,31 12,04 15,14 19,89 DF 6 12 18 24 Pr > ChiSq --------------------Autocorrelations-------------------0,3898 0,4424 0,6522 0,7032 -0,028 -0,013 0,076 0,119 -0,030 0,056 0,000 -0,005 0,168 -0,037 0,030 0,023 -0,003 0,080 0,017 -0,032 0,050 0,132 0,075 -0,003 0,031 0,023 -0,052 0,084

Los residuos del modelo completo estn incorrelados Variable Media Desv. Est. Observaciones cuadrado 1.6501E9 5.6603E9 184

Test de autocorrelacin para ruido blanco To Lag 6 12 18 24 ChiSquare 1.18 2.24 7.09 9.53 DF 6 12 18 24 Pr > ChiSq 0.033 -0.013 0.074 0.074 0.062 -0.038 0.052 0.067 0.015 0.002 0.027 -0.025 0.014 0.055 0.069 -0.027 -0.025 0.003 0.093 -0.020 0.016 -0.027 -0.039 0.007

--------------------Autocorrelations-------------------0.9778 0.9989 0.9893 0.9962

Los residuos al cuadrado no estn correlados, indicando que la varianza condicionada permanece constante a lo largo del tiempo. El modelo final ajustado tiene la siguiente frmula Dt = 2763 + 0.47 Dt-1 + et et = 0.31 et-1 + Zt Ecuacin de medida Ecuacin estructural

Los grficos correspondientes a este modelo estn a continuacin. Los grficos indican que el modelo se adapta mejor a los datos a pesar de que parece que hay residuos altos, sin embargo como la desviacin estndar es de 40.621 la mayoria de los residuos

73

estn dentro de los lmites de confianza de una serie aleatoria. Sigue habiendo residuos muy altos negativos en los mismos datos que en el modelo anterior.
importacin-exportacin y su prediccin Castilla y Len (modelo2)
100000 80000 60000 40000 20000 0 -20000 -40000 -60000 -80000 -100000 -120000 -140000 -160000 -180000 -200000 -220000 -240000 date dic-88 dic-89 dic-90 dic-91 dic-92 dic-93 dic-94 dic-95 dic-96 dic-97 dic-98 dic-99 dic-00 dic-01 dic-02

prediccion

diferencia

importacin-exportacin y su prediccin estructural Castilla y Len (modelo2)


100000 80000 60000 40000 20000 0 -20000 -40000 -60000 -80000 -100000 -120000 -140000 -160000 -180000 -200000 -220000 -240000
d m ate ay -8 oc 8 tm 88 ar ag 89 oen 89 e9 ju 0 nno 90 v9 ab 0 r-9 se 1 p9 fe 1 b92 ju l -9 di 2 cm 92 ay -9 oc 3 tm 93 ar ag 94 oen 94 e9 ju 5 nno 95 v9 ab 5 rse 96 p9 fe 6 b97 ju l- 9 di 7 cm 97 ay -9 oc 8 tm 98 ar ag 99 oen 99 e0 ju 0 nno 00 v0 ab 0 rse 01 p0 fe 1 b02 ju l-0 di 2 cm 02 ay -0 3

pestructural

diferencia

74

residuos importacin-exportacinCastilla y Len (modelo2)


140000 120000 100000 80000 60000 40000 20000 0 -20000 -40000 -60000 -80000 -100000 -120000 -140000 -160000 -180000 -200000 -220000 -240000 -260000 date dic-88 dic-89 dic-90 dic-91 dic-92 dic-93 dic-94 dic-95 dic-96 resiest dic-97 dic-98 dic-99 dic-00 dic-01 dic-02

residuos

Variable acerinox: Analysis Summary Data variable: ACERINOX Number of observations = 248 Start index = 02/01/98 Sampling interval = 1,0 day(s)

75

Time Series Plot for ACERINOX


(X 10000) 3

ACERINOX

2,5 2 1,5 1 0,5 0 29/11/97 18/01/98 09/03/98 28/04/98 7/06/98 1 06/08/98 25/09/98

Estimated Autocorrelations for ACERINOX


1 0,6 0,2 -0,2 -0,6 -1 0 5 10 15 20 25

Autocorrelations

lag
Estimated Partial Autocorrelations for ACERINOX Partial Autocorrelations
1 0,6 0,2 -0,2 -0,6 -1 0 5 10 15 20 25

lag

variable acerinox diferenciada de orden 1 Runs above and below median Median = -10,0 Number of runs above and below median = 121 Expected number of runs = 122,498 Large sample test statistic z = -0,128304 P-value = 0,897904 Runs up and down Number of runs up and down = 154 Expected number of runs = 164,333 Large sample test statistic z = -1,48941 76

P-value = 0,13638 Box-Pierce Test Test based on first 24 autocorrelations Large sample test statistic = 4,30292 P-value = 0,999997
Time Series Plot for adjusted ACERINOX

(X 1000) 3

adjusted ACERINOX

-1 -5 -9 -13 -17 29/11/97

18/01/98

09/03/98

28/04/98

17/06/98

06/08/98

25/09/98

Estimated Autocorrelations for adjusted ACERINOX


1

Autocorrelations

0,6 0,2 -0,2 -0,6 -1 0 5 10 15 20 25

lag
Estimated Partial Autocorrelations for adjusted ACERINOX Partial Autocorrelations
1 0,6 0,2 -0,2 -0,6 -1 0 5 10 15 20 25

lag

variable acerinox elevada al cuadrado y diferenciada dos veces Tests for Randomness of adjusted ACERINOX Runs above and below median Median = 33300,0 Number of runs above and below median = 158 Expected number of runs = 124,0 Large sample test statistic z = 4,28051 P-value = 0,0000186596

77

Runs up and down Number of runs up and down = 175 Expected number of runs = 163,667 Large sample test statistic z = 1,64423 P-value = 0,100129 Box-Pierce Test Test based on first 24 autocorrelations Large sample test statistic = 77,4085 P-value = 1,56572E-7
Time Series Plot for adjusted ACERINOX
(X 1,E7) 58

adjusted ACERINOX

38 18 -2 -22 -42 29/11/97

18/01/98

09/03/98

28/04/98

17/06/98

06/08/98

25/09/98

Estimated Autocorrelations for adjusted ACERINOX


1

Autocorrelations

0,6 0,2 -0,2 -0,6 -1 0 5 10 15 20 25

lag
Name of Variable = ACERINOX Mean of Working Series 13155.56 Standard Deviation 10052 Number of Observations 248 Autocorrelation Check for White Noise To Lag ChiSquare Pr > DF ChiSq --------------------Autocorrelations----------------

6 1420.03 12 2706.40 18 3853.16 24 4850.47

6 <.0001 0.990 0.980 0.970 0.961 0.952 0.943 12 <.0001 0.932 0.923 0.914 0.904 0.893 0.883 18 <.0001 0.873 0.863 0.852 0.841 0.830 0.819 24 <.0001 0.808 0.796 0.785 0.773 0.762 0.751 Name of Variable = ACERINOX Period(s) of Differencing 1 Mean of Working Series -78.9676 Standard Deviation 1099.983 Number of Observations 247 Observation(s) eliminated by differencing 1

78

Autocorrelation Check for White Noise To Lag 6 12 18 24 ChiSquare 0.78 2.68 3.85 4.54 Pr > DF ChiSq --------------------Autocorrelations---------------0.041 -0.031 0.001 0.006

6 0.9926 -0.005 -0.005 -0.023 0.019 -0.022 12 0.9974 -0.072 0.008 0.025 0.020 -0.007 18 0.9998 -0.019 0.012 0.061 0.009 0.010 24 1.0000 0.039 -0.010 -0.011 -0.028 0.001

variable acerinox elevada al cuadrado Name of Variable = acerinoxc Period(s) of Differencing 2 Mean of Working Series -4252743 Standard Deviation 42614839 Number of Observations 246 Observation(s) eliminated by differencing 2 Autocorrelation Check for White Noise To Lag 6 12 18 24 ChiSquare 61.10 65.17 70.74 73.92 Pr > DF ChiSq --------------------Autocorrelations---------------6 <.0001 0.494 -0.023 -0.013 -0.002 -0.009 -0.027 12 <.0001 -0.075 -0.029 0.051 0.045 -0.019 -0.067 18 <.0001 -0.027 0.059 0.102 0.069 0.026 0.032 24 <.0001 0.042 -0.003 -0.057 -0.059 -0.002 0.056

libname d 'c:\datos'; title1 'ibex98'; data d.ibex98; infile "datos\ibex98.txt" dlm='09'x firstobs=2; input ene fecha $ ACESA ACERINOX AGUAS_BARNA CORP_FIN_ALBA AMPER ARGENTARIA AUMAR BK_BILBAO_VIZC BK_C_HISPANO BANKINTER BANESTO CANTABRICO CONTINENTE GAS_NATURAL DRAGADOS_Y_CONST ENDESA E_N_CELULOSA FOMENTO_DE_CONST FECSA GESA IBERDROLA MAPFRE METROVACE BK_POPULAR PRYCA REPSOL BK_SANTANDER SEVILLANA_ELEC TABACALERA TELEFONICA_ESP U_FENOSA URALITA VALLEHERMOSO VISCOFAN IBEX; proc print; run; proc arima data =d.ibex98; identify var = ACERINOX ; identify var = ACERINOX(1);run; data b; set d.ibex98; acerinoxc = acerinox*acerinox; run; proc print; run; proc arima data = b; identify var=acerinoxc(2);run; proc autoreg data = d.ibex98 /*outest= a covout=c */ archtest /*out= fuera*/; model acerinox(1)= ene corrb covb lagdep hetero cev = varcond cpev= varpred garch(q=1,p=1);run;

Bibliografa
.- Bollerslev, T. Engle, r. y Nelson, D(1994): ARCH Models.. Robert Engle y D. McFadden editores. Handbook of Econometrics, Vol IV. Elservier, Amsterdam.

.- Abraham, B. y Ledolter, J. (1983). Statistical Methods for Forecasting. Wiley. .- Box , G. E. P. y Jenkins, G. M. (1976). Time Series Analysis: Forecasting and Control. Holden-Day.

79

.-Brockwell, P. J. y Davis, R. A. (1991). Time Series: Theory and Methods. [2 edicin]. Springer-Verlag. .- Brockwell, P. J. y Davis, R. A. (1996). Introduction to Time Series and Forecasting. Springer-Verlag. .-Chatfield, C. (1989). The Analysis of Time Series: An Introduction. [4 Edicin]. Chapman and Hall. .-Diggle, P. J. (1990). Time Series. A Biostatistical Introduction. Oxford University Press. .-Fuller, W. A. (1996). Introduction to Statistical Time Series. [2 Edicin]. Wiley.. .-Harvey, A. C. (1990. The Econometric Analysis of Time Series. [2 Edicin]. Phillip Allan. .- Harvey, A. C. (1989). Forecasting, Structural Time Series Models and the Kalman Filter. Cambridge University Press. . .-Makridakis, S., Wheelwright, S. C. y Hyndman, R. J. (1998). Forecasting: Methods and Applications. Wiley. .-Pankratz, A. (1991). Forecasting with Dynamic Regression Models. Wiley. .- Pea, D. (1989). Estadstica: Modelos y Mtodos, 2 (Modelos Lineales y Series Temporales). [2 Edicin].Alianza Universidad Textos. .- Pea, D ., Tiao, G. C. y Tsay, R. S. (eds.) (2001). A Course in Time Series Analysis. Wiley. .- Pea, D. (2005). Anlisis de Series Temporales). Alianza Universidad Textos .-Shumway, R. H. y Stoffer, D. S. (2000). Time Series Analysis and its Applications. Springer. .-Taylor, S.J. (1986): Modelling Financial Time Series, John Wiley, Chichester, U.K.. .- Uriel, E. (1984). Seri es Temporales. Modelos ARIMA. Paraninfo. .-Wei, W. W. S. (1990). Time Series Analysis: Univariate and Multivariate Methods. Addison-Wesley.

80

You might also like