You are on page 1of 50

Ìndice de producción Industrial

Yubar Daniel Marín Benjumea

27/3/2019
Introducción

El índice de Producción Industrial (IPI) es un indicador económico


publicado por la Junta de la Reserva Federal de los Estados Unidos
que mide la producción real de la producción en la minería y los
servicios públicos. Esta serie inicia en marzo 3 de 1948.
Serie original
140
120
100
z

80
60
40

1980 1985 1990 1995 2000 2005 2010

Time
Anàlisis de la varianza
Encontramos la primera diferencia de la serie ya que esta permite
observar de forma más sencilla si su varianza es constante o no.
5
0
Dz

−5
−10

1980 1985 1990 1995 2000 2005 2010

Time
Transformación Box-Cox
Se obtuvo como el valor de máxima verosimilitud 0.18
aproximadamente con un inetervalo de confianza entre -0.01 y 0.35
para la mayoría de los metodos de estimación.
1600

95%
1550
Log Likelihood

1500
1450
1400

−2 −1 0 1 2
Se toman como posibles valores tranformadores 0.18, 0 y 0.25
λ = 0.16 λ = 0.25
0.04

0.05
0.02
DTz1

DTz2

0.00
0.00

−0.05
−0.04

1980 1985 1990 1995 2000 2005 2010 1980 1985 1990 1995 2000 2005 2010

Time Time

λ=0
0.10
0.05
DTz3

0.00
−0.10

1980 1985 1990 1995 2000 2005 2010

Time
Se elige como transformación adecuada para la varianza ln(z) que
es equivalente a valor λ = 0 ya que induce a un buen
comportamiento en la varianza de la serie.

Serie tranformada

5.0

4.5
ln(z)

4.0

1980 1985 1990 1995 2000 2005 2010

Time
ACF y PACF de la serie transformada

ACF serie transformada


0.8
ACF

0.4
0.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag

PACF serie transformada


1.0
Partial ACF

0.6
0.2
−0.2

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag
Al Observar las gráficas de la ACF y la PACF muestral se puede
concluir que como la ACF muestral decae muy lentamente en forma
aritmética y la PACF no presenta corte después del rezago 1 , esto
indica que posiblemente es necesario diferenciar la serie. Como en la
PACF los rezagos aparecen en periodos de 12 meses posiblemente
sea necesario aplicar una diferencia estacional a la serie.
Test Dickey-Fuller Aumentado

p
X
∆Zt = β0 + β1 t + γZt−1 + φi ∆Zt−1 + at
i=1

Valores del estadístico de test: -3.1138 8.6279 5.2291

1pct 5pct 10pct


τ3 -3.98 -3.42 -3.13
φ2 6.15 4.71 4.05
φ3 8.34 6.30 5.36

En este caso llegamos a que como τ3 < τ (α, n) para 1pct, 5pct y
10 pct no se tienen sufiente evidencia muestral para rechazar H0 por
lo que se concluye que la serie transformada no es estacionaria.
Diferencia Regular
A continuación la ACF y PACF para la primera diferencia regular de
la serie transformada.
Series DTz
0.6
ACF

0.2
−0.2

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag

Series DTz
0.6
Partial ACF

0.2
−0.2

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag
Basándonos en la gráfica anterior podemos observar una evidente
aparición de una componente estacional en múltiplos de 12. En la
ACF se puede ver como la componente estacional decae lentamente
tipo cola y la PACF presenta cortes en los rezagos 11,23 y 36 lo que
da a entender la necesidad de aplicar una diferencia estacional. Al
hablar de la componente regular podemos observar que, aunque en
la ACF y la PACF existan cortes en algunos rezagos estos son poco
significativos.
Test Dickey-Fuller Aumentado

Valores del estadístico de test: -7.5806 19.2389 28.8255


Valores críticos para el test:

1pct 5pct 10pct


τ3 -3.98 -3.42 -3.13
φ2 6.15 4.71 4.05
φ3 8.34 6.30 5.36

En este caso llegamos a que como τ3 > τ (α, n) para 1pct, 5pct y
10 pct se tienen sufiente evidencia muestral para rechazar H0 por lo
que se concluye que la primera diferencia regular de la serie
transformada es estacionaria.
Diferencia estacional y regular
A continuación la ACF y PACF para las primeras diferencias regular
y estacional de la serie transformada.

Series DETz
0.0 0.2
ACF

−0.4

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag

Series DETz
0.2
Partial ACF

0.0
−0.4

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag
Al analizar el comportamiento de la componente estacional en la
ACF y la PACF se puede observar un decaimiento de cola
exponencial (PACF) y aunque se presentan cortes en otros rezagos
estos tienen magnitudes poco significativas, la ACF presenta corte
en el rezago 12; dado todo lo anterior utilizaremos un modelo MA
(1). En la componente regular la PACF presentan cortes para los
rezagos 1, 2 y la ACF presenta un comportamiento de cola que
decae rápidamente el cual puede ser explicado con un AR (2).
Modelo 1

Φ(B)(1−B)(1−B 12 ) ln(Zt ) = Θ(B 12 )at , Φ(B) = 1−φ1 B −φ2 B 2

Θ(B 12 ) = 1 − θ1 B 12

## Series: z
## ARIMA(2,1,0)(0,1,1)[12]
## Box Cox transformation: lambda= 0
##
## Coefficients:
## ar1 ar2 sma1
## 0.2313 0.1308 -0.8309
## s.e. 0.0523 0.0523 0.0309
##
## sigma^2 estimated as 0.0002332: log likelihood=986.69
## AIC=-1965.38 AICc=-1965.26 BIC=-1949.84
Pronóstico y ajuste

Forecasts from ARIMA(2,1,0)(0,1,1)[12]


160
140
120
100
80
60
40

1980 1985 1990 1995 2000 2005 2010


Residuales
Se concluye que no existe violación del supuesto de errores no
correlacionados.
Series re1
0.10
0.00
ACF

−0.10

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag

Series re1
0.10
Partial ACF

0.00
−0.10

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag
Cuantiles Muestrales residuals(modelo1)

−0.10 −0.05 0.00 0.05 −0.10 −0.05 0.00 0.05

−3
40

−2
60

−1
80

0
100

fitted(modelo1)

Cuantiles Teóricos
1
Normal Q−Q Plot
120

2
140

3
residuals(modelo1)

−0.10 −0.05 0.00 0.05


1980
1985
1990
1995

Time
2000
2005
2010
Cuando se evalúa el supuesto de varianza se puede observar que a
excepción de algunos valores atípicos no existe violación. Cuando
observamos la grafico qqplot se observa un violación del supuesto de
normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box

k
(n − j)−1 ρ̂2j (â)
X
Q = n(n + 2)
j=1

##
## Box-Ljung test
##
## data: re1
## X-squared = 0.015221, df = 1, p-value = 0.9018

Como Vp > 0.05 no se rechaza H0 por lo que se concluye que


ρ1 = ρ2 = ... = ρk = 0
Modelo 2

auto.arima(Tz, max.p=5, max.q=5, ic=c("aic"))

## Series: Tz
## ARIMA(2,1,0)(1,0,0)[12]
##
## Coefficients:
## ar1 ar2 sar1
## 0.2141 0.1697 0.8031
## s.e. 0.0517 0.0514 0.0301
##
## sigma^2 estimated as 0.0003711: log likelihood=934.11
## AIC=-1860.22 AICc=-1860.12 BIC=-1844.56
Φ(B)Φ(B 12 )(1 − B) ln(Zt ) = at , Φ(B) = 1 − φ1 B − φ2 B 2

Φ(B 12 ) = 1 − φ1 B 12

## Series: z
## ARIMA(2,1,0)(1,0,0)[12]
## Box Cox transformation: lambda= 0
##
## Coefficients:
## ar1 ar2 sar1
## 0.2141 0.1697 0.8031
## s.e. 0.0517 0.0514 0.0301
##
## sigma^2 estimated as 0.0003711: log likelihood=934.11
## AIC=-1860.22 AICc=-1860.12 BIC=-1844.56
Pronóstico y ajuste

Forecasts from ARIMA(2,1,0)(1,0,0)[12]


160
140
120
100
80
60
40

1980 1985 1990 1995 2000 2005 2010


Residuales
Se concluye que no existe violación del supuesto de errores no
correlacionados.
Series re2
0.1
ACF

−0.1
−0.3

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag

Series re2
0.0 0.1
Partial ACF

−0.2

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag
Cuantiles Muestrales residuals(modelo1)

−0.10 −0.05 0.00 0.05 −0.10 −0.05 0.00 0.05

−3
40

−2
60

−1
80

0
100

fitted(modelo1)

Cuantiles Teóricos
1
Normal Q−Q Plot
120

2
140

3
residuals(modelo1)

−0.10 −0.05 0.00 0.05


1980
1985
1990
1995

Time
2000
2005
2010
Cuando se evalúa el supuesto de varianza se puede observar que a
excepción de algunos valores típicos no existe violación. Cuando
observamos la grafico qqplot se observa un violación del supuesto de
normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box

k
(n − j)−1 ρ̂2j (â)
X
Q = n(n + 2)
j=1

##
## Box-Ljung test
##
## data: re1
## X-squared = 0.015221, df = 1, p-value = 0.9018

Como Vp > 0.05 no se rechaza H0 por lo que se concluye que


ρ1 = ρ2 = ... = ρk = 0
Modelo 3

## Series: DETz
## ARIMA(3,0,0)(2,0,1)[12] with zero mean
##
## Coefficients:
## ar1 ar2 ar3 sar1 sar2 sma1
## 0.2431 0.1458 -0.0493 -0.1832 -0.240 -0.6940
## s.e. 0.0527 0.0544 0.0531 0.0708 0.063 0.0583
##
## sigma^2 estimated as 0.0002249: log likelihood=993.91
## AIC=-1973.83 AICc=-1973.51 BIC=-1946.65
Φ(B)Φ(B 12 )(1−B)(1−B 12 ) ln(Zt ) = Θ(B 12 )at , Φ(B 12 ) = 1−φ1 B

−φ2 B 2 Θ(B 12 ) = 1 − φ1 B 12 , Φ(B) = 1 − φ1 B − φ2 B 2 − φ3 B 3

## Series: z
## ARIMA(3,1,0)(2,1,1)[12]
## Box Cox transformation: lambda= 0
##
## Coefficients:
## ar1 ar2 ar3 sar1 sar2 sma1
## 0.2431 0.1458 -0.0493 -0.1833 -0.2401 -0.6939
## s.e. 0.0527 0.0544 0.0531 0.0708 0.0630 0.0583
##
## sigma^2 estimated as 0.0002254: log likelihood=993.93
## AIC=-1973.85 AICc=-1973.53 BIC=-1946.67
Pronóstico y ajuste

Forecasts from ARIMA(3,1,0)(2,1,1)[12]


160
140
120
100
80
60
40

1980 1985 1990 1995 2000 2005 2010


Residuales
Se concluye que no existe violación del supuesto de errores no
correlacionados.
Series re3
0.10
0.00
ACF

−0.10

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag

Series re3
0.10
Partial ACF

0.00
−0.10

0.0 0.5 1.0 1.5 2.0 2.5 3.0

Lag
Cuantiles Muestrales residuals(modelo3)

−0.10 −0.05 0.00 0.05 −0.10 −0.05 0.00 0.05

−3
40

−2
60

−1
80

0
100

fitted(modelo3)

Cuantiles Teóricos
1
Normal Q−Q Plot
120

2
140

3
residuals(modelo3)

−0.10 −0.05 0.00 0.05


1980
1985
1990
1995

Time
2000
2005
2010
Cuando se evalúa el supuesto de varianza se puede observar que a
excepción de algunos valores típicos no existe violación. Cuando
observamos la grafico qqplot se observa un violación del supuesto de
normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box

k
(n − j)−1 ρ̂2j (â)
X
Q = n(n + 2)
j=1

##
## Box-Ljung test
##
## data: re3
## X-squared = 0.0058579, df = 1, p-value = 0.939

Como Vp > 0.05 no se rechaza H0 por lo que se concluye que algún


ρ1 = ρ2 = ... = ρk = 0
Valores Atípicos

Original and adjusted series


5
4.5
4

Outlier effects

0.02 0.04 0.06


0
−0.04
1980 1985 1990 1995 2000 2005 2010
Series Tz1
0.8
ACF

0.4
0.0

0 5 10 15 20 25 30 35

Lag

Series Tz1
1.0
Partial ACF

0.6
0.2
−0.2

0 5 10 15 20 25 30 35

Lag
Al observar las gráficas de la ACF y la PACF muestral se puede
concluir que como la ACF muestral decae muy lentamente en forma
aritmética y la PACF no presenta corte después del rezago 1 , esto
indica que posiblemente es necesario diferenciar la serie. Como en la
PACF los rezagos aparecen en periodos de 12 meses posiblemente
sea necesario aplicar una diferencia estacional a la serie.
ACF y PACF de la serie diferenciada

Series DTz1
0.6
ACF

0.2
−0.2

0 5 10 15 20 25 30 35

Lag

Series DTz1
0.6
Partial ACF

0.2
−0.2

0 5 10 15 20 25 30 35

Lag
Para la serie diferenciada la ACF para la componente regular no
presenta cortes significativos, la componente estacional presenta un
decaimiento lento en forma de cola. La PACF en la componente
regular no muestra cortes significativos para ningunos de los rezagos
y la componente estacional presenta corte en el rezago 12. Lo
anterior muestra la necesidad de una diferencia regular.
Serie con diferencia regular y estacional

Series DETz1
0.2
0.0
ACF

−0.4 −0.2

0 5 10 15 20 25 30 35

Lag

Series DETz1
0.1
Partial ACF

−0.1
−0.3

0 5 10 15 20 25 30 35

Lag
Modelo 4

auto.arima(Tz1)

## Series: Tz1
## ARIMA(2,1,2)
##
## Coefficients:
## ar1 ar2 ma1 ma2
## 0.9934 -0.9696 -1.0936 0.9716
## s.e. 0.0143 0.0133 0.0154 0.0192
##
## sigma^2 estimated as 0.000682: log likelihood=819.69
## AIC=-1629.38 AICc=-1629.21 BIC=-1609.84
Φ(B)(1 − B) ln(Zt ) = Θ(B)at , Φ(B) = 1 − φ1 B − φ2 B 2

Θ(B) = 1 − θ1 B − θ2 B 2

## Series: z1
## ARIMA(2,1,2)
## Box Cox transformation: lambda= 0
##
## Coefficients:
## ar1 ar2 ma1 ma2
## 0.9934 -0.9696 -1.0936 0.9716
## s.e. 0.0143 0.0133 0.0154 0.0192
##
## sigma^2 estimated as 0.000682: log likelihood=819.69
## AIC=-1629.38 AICc=-1629.21 BIC=-1609.84
Pronóstico y ajuste

Forecasts from ARIMA(2,1,2)


160
140
120
100
80
60
40

0 100 200 300


Residuales
Se concluye que existe violación del supuesto de errores no
correlacionados.
Series re4
0.2 0.4
ACF

−0.2

0 5 10 15 20 25 30 35

Lag

Series re4
0.4
Partial ACF

0.0
−0.4

0 5 10 15 20 25 30 35

Lag
Cuantiles Muestrales residuals(modelo4)

−0.10 −0.05 0.00 0.05 −0.10 −0.05 0.00 0.05

−3
40

−2
60

−1
80

0
100

fitted(modelo4)

Cuantiles Teóricos
1
Normal Q−Q Plot
120

2
140

3
residuals(modelo4)

−0.10 −0.05 0.00 0.05


0
100

Time
200
300
Cuando se evalúa el supuesto de varianza se puede observar que a
excepción de algunos valores típicos no existe violación. Cuando
observamos la grafico qqplot se observa un violación del supuesto de
normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box

k
(n − j)−1 ρ̂2j (â)
X
Q = n(n + 2)
j=1

##
## Box-Ljung test
##
## data: re4
## X-squared = 6.7566, df = 1, p-value = 0.00934

Como Vp < 0.05 se rechaza H0 por lo que se concluye que algún


ρk 6= 0
Elección del modelo

AIC AICc BIC


modelo1 -1965.376 -1965.263 -1949.843
modelo2 -1860.225 -1860.115 -1844.560
modelo3 -1973.851 -1973.532 -1946.668
modelo4 -1629.377 -1629.211 -1609.837

ME RMSE MAE MAPE


modelo1 0.0019484 1.120138 0.7889148 1.012995
modelo2 0.0286146 1.436086 1.0627495 1.374529
modelo3 0.0037263 1.098309 0.7807411 1.002980
modelo4 0.3253056 2.313185 1.6671659 1.971603
Se elige el modelo 1 como el mejor, ya que aunque el modelo 2 y el
modelo 4 presentan mejores medidas de ajuste, estos presentan
mayores violaciones de supuestos y además sus medidas de
pronóstico son peores comparadas con la del modelo 1.

You might also like