You are on page 1of 13

Aplicaciones Economtricas

PAUTA Prctico N4
Tema: Anlisis Factorial.
Prof. Mauricio Gallardo Altamirano
Ayudante: Pablo Ramrez
Instrucciones.
En la plataforma de Intranet est disponible la base de datos datos_practico4.sav,
que contiene informacin real de las siguientes variables para la economa chilena:

1.
2.
3.
4.
5.
6.

ndice de Ventas Fsicas Industriales del INE (IVF_INE).


ndice de Ventas de Supermercados (IVS).
ndice de Ventas de Comercio Minorista No Durable del INE (IVC_ND).
ndice de Ventas de Comercio Minorista Durable del INE (IVC_D).
ndice de Ventas Fsicas Industriales de la SOFOFA (IVF_SOFOFA).
Ventas de Automviles Nuevos de ANAC (V_AUTOS).

Se le pide usar la tcnica de Anlisis Factorial para construir un Indicador Sinttico


del Comercio para la economa chilena. Para realizar la tarea deber aplicar utilizar el
programa SPSS.
En el informe del prctico usted deber incluir los siguientes resultados con su
correspondiente interpretacin:
1. Matriz de Correlaciones (incluye significancia y determinante).
2. KMO y Prueba de Esfericidad de Bartlett.
3. Comunalidades (no es necesario interpretar la inicial, slo la final).
4. Varianza Total Explicada.
5. Grfico de Sedimentacin.
6. Matriz Factorial.
7. Matriz de Factores Rotados por Varimax.
8. Grfico de Factores en el Espacio Rotado (por el mtodo Varimax).
9. Matriz de Coeficientes para el Clculo de la Puntuaciones Factoriales.
Deber adems explicar cmo gener el indicador sinttico solicitado e incluir
adems una tabla, en la cual se muestren los valores obtenidos para los factores y
para el ndice sinttico.

I.
Tablas y sus respectivas interpretaciones.
1. Matriz de Correlaciones

Matriz de correlacionesa
IVF_INE
Correlacin

Sig. (Unilateral)

a.

IVF_INE

IVS

IVCM_ND

IVCM_D

IVF_SOFOFA

V_AUTOS

1,000

,243

,430

,440

,858

,410

IVS

,243

1,000

,927

,886

-,144

,502

IVCM_ND

,430

,927

1,000

,962

,079

,566

IVCM_D

,440

,886

,962

1,000

,080

,723

IVF_SOFOFA

,858

-,144

,079

,080

1,000

,172

V_AUTOS

,410

,502

,566

,723

,172

1,000

,020

,000

,000

,000

,000

,000

,000

,114

,000

,000

,256

,000

,251

,000

IVF_INE
IVS

,020

IVCM_ND

,000

,000

IVCM_D

,000

,000

,000

IVF_SOFOFA

,000

,114

,256

,251

V_AUTOS

,000

,000

,000

,000

,074
,074

Determinante = .000

La parte superior de la tabla adjunta contiene los coeficientes de correlacin


mltiple que indican el grado de asociacin entre una variable y todas las dems
que intervienen en el anlisis. En este caso observamos que 14 de 30 correlaciones
entre estas variables son altas, es decir, mayores a 0,5. Aunque no son la mayora,
si son un grupo importante de correlaciones altas.
La parte inferior contiene la significatividad de los coeficientes anteriores. Un valor
inferior a 0,05 indica que la correlacin correspondiente es significativamente
distinta a cero (al 5% de significancia) y que, por tanto, existe dependencia y
factores comunes. En este caso observamos que la mayora de los coeficientes (22
de 30) son significativos. Por lo tanto hay muchas correlaciones significativas pero
slo algunas son altas y no podemos obtener una conclusin clara an sobre si las
variables estn correlacionadas o no.
Luego, al observar el determinante de la matriz (0,000) vemos que es cercano a
cero lo cual indica que hay alto grado de asociacin lineal entre las variables.
Los tres indicios anteriores, nos dicen que es factible usar la tcnica de Anlisis
Factorial a los datos.

2. KMO y Prueba de Esfericidad de Bartlett.

KMO y prueba de Bartlett


Medida de adecuacin muestral de Kaiser-Meyer-Olkin.
Prueba de esfericidad de

Chi-cuadrado aproximado

Bartlett

Gl

,601
583,884
15

Sig.

,000

En la tabla adjunta observamos la medida de adecuacin muestral de Kaiser-MeyerOlkin la cual contrasta si las correlaciones parciales entre las variables son
suficientemente pequeas. El estadstico KMO vara entre 0 y 1. Los valores mayores
a 0,5, como en este caso, indican que las correlaciones parciales son chicas en
comparacin con las correlaciones de Pearson.
La prueba de esfericidad de Bartlett consiste en contrastar la hiptesis nula de que la
matriz de correlaciones es esfrica (igual a la Matriz Identidad) en cuyo caso no
existiran correlaciones significativas entre las variables y el modelo factorial no sera
pertinente. En este caso el p-value de la Prueba de Bartlett es 0,000 y por ende, se
rechaza la hiptesis nula.
Frente a estos dos nuevos antecedentes es posible determinar que es factible usar
una tcnica de reduccin de la dimensin como lo es Anlisis Factorial.
3. Comunalidades.
Comunalidadesa
Inicial

Extraccin

IVF_INE

,881

,875

IVS

,914

,914

IVCM_ND

,975

,984

IVCM_D

,974

,940

IVF_SOFOFA

,879

,999

V_AUTOS

,765

,379

Mtodo de extraccin: Mxima


verosimilitud.
a. Se han encontrado una o ms
estimaciones de comunalidad mayores
que 1 durante las iteraciones. La solucin
resultante deber ser interpretada con
precaucin.

En esta tabla se presentan las comunalidades de cada variable. Se denomina


comunalidad final (o extraccin) a la proporcin de variabilidad (o varianza) de cada
variable explicada por los factores comunes. La comunalidad puede oscilar entre 0 y
1; 0 indica que los factores comunes explican poco de la variable y 1 que explican el
100% de la variabilidad de la variable. La variabilidad total explicada se recoge en la
siguiente tabla.
4. Varianza Total Explicada.

Varianza total explicada


Sumas de las saturaciones al cuadrado de la
Autovalores iniciales

extraccin

% de la
Factor

Total

Suma de las saturaciones al cuadrado de la rotacin

% de la

varianza

% acumulado

Total

varianza

% de la
% acumulado

Total

varianza

% acumulado

3,587

59,783

59,783

1,805

30,090

30,090

3,232

53,874

53,874

1,723

28,713

88,496

3,286

54,765

84,855

1,859

30,981

84,855

,541

9,017

97,513

,081

1,351

98,864

,056

,925

99,789

,013

,211

100,000

Mtodo de extraccin: Mxima verosimilitud.

Esta tabla nos muestra la varianza explicada por cada factor. Observamos 6 factores
con sus respectivos autovalores, de los cuales los primeros 2 tienen un autovalor
mayor a uno y que segn el criterio de la media aritmtica sern considerados para
la construccin del ndice.
En este caso los factores 1 y 2 cuyos autovalores son mayores a 1, explican en
conjunto el 88,496% de la varianza total.
Cabe mencionar que las saturaciones al cuadrado de cada factor no han modificado
significativamente la varianza explicada por los 2 primeros componentes, ya que slo
ha disminuido aproximadamente un 4%.

5. Grfico de Sedimentacin.

Este grfico sirve para determinar el nmero ptimo de factores. Consiste


simplemente en una representacin grfica de los autovalores. Un autovalor indica la
cantidad de varianza explicada por un factor. Observamos los autovalores ordenados
de mayor a menor: el primer autovalor es el mayor de los posibles, seguido del
segundo y as consecutivamente. Si un autovalor se aproxima a cero significa que el
factor correspondiente a ese autovalor es incapaz de explicar una cantidad relevante
de la varianza total. En este caso observamos que desde el factor 4 la pendiente
pierde inclinacin casi por completo, entonces debemos considerar como
desechables estos factores para nuestro anlisis factorial. Si observamos el autovalor
asociado al tercer factor, observamos que a pesar de ser menor que uno, logra
explicar una parte considerable de la varianza total (ms del 9%), as que depender
del criterio de la persona que realiza el ndice si incorporar un tercer factor que puede
ser justificado. Sin embargo para este anlisis se considerar slo dos factores ya que
la varianza explicada es bastante aceptable (88,5% aproximadamente).

6. Matriz Factorial.

Matriz factoriala
Factor
1
IVF_INE

2
,861

,366

-,136

,946

IVCM_ND

,087

,988

IVCM_D

,088

,965

IVF_SOFOFA

,999

-,008

V_AUTOS

,177

,590

IVS

Mtodo de extraccin: Mxima


verosimilitud.
a. 2 factores extrados. Requeridas 10
iteraciones.

La matriz factorial asocia cada variable a cada factor, por lo que se puede relacionar
cada factor con elementos que tengan las variables en comn. En este caso las
variables asociadas al factor 1 son: ndice de Ventas Fsicas Industriales del INE
(IVF_INE) e ndice de Ventas Fsicas Industriales de la SOFOFA (IVF_SOFOFA); mientras
que las variables asociadas al factor 2 son:
ndice
de
Ventas
de
Supermercados (IVS), ndice de Ventas de Comercio Minorista No Durable del INE
(IVC_ND), ndice de Ventas de Comercio Minorista Durable del INE (IVC_D) y Ventas
de Automviles Nuevos de ANAC (V_AUTOS). Claramente hay una interpretacin para
cada factor identificado: el factor 1 corresponde al comercio a nivel industrial y el
factor 2 puede asimilarse al comercio a nivel minorista.
Esta matriz muestra las variables como combinacin lineal de los factores:

X i = b1 z1 + b2 z2 +K + bk zk , de manera que mientras mayor sea el valor absoluto de

stos mayor relacin tiene con la variable. Por ejemplo: en el caso de la variable
V_AUTOS, el factor 2 seria el que posee mayor influencia sobre sta, dado que posee
el mayor valor absoluto en la combinacin lineal que se puede obtener con los datos
de la tabla, y que se muestra a continuacin:

X1 = V _ AUTOS
X1 = 0,177 * Z1 + 0,590* Z2

7. Matriz de Factores Rotados.

Matriz de factores rotadosa


Factor
1

IVF_INE

,318

,880

IVS

,952

-,085

IVCM_ND

,982

,140

IVCM_D

,959

,140

-,062

,998

,579

,209

IVF_SOFOFA
V_AUTOS

Mtodo de extraccin: Mxima


verosimilitud.
Mtodo de rotacin: Normalizacin
Varimax con Kaiser.
a. La rotacin ha convergido en 3
iteraciones.

El mtodo de rotacin busca variables que saturen, a ser posible, en un nico factor,
y factores que contengan un nmero reducido de variables que saturen inequvoca y
exclusivamente en ellos. Mediante el mtodo VARIMAX se rotan los ejes en cualquier
direccin sin cambiar la localizacin relativa de los factores hasta obtener un claro
esquema de la relacin entre las variables y factores.
Esta tabla muestras que las variables han cambiado el factor al que se asocian, ahora
las variables asociadas al factor 1 son: ndice de Ventas de Supermercados (IVS),
ndice de Ventas de Comercio Minorista No Durable del INE (IVC_ND), ndice de
Ventas de Comercio Minorista Durable del INE (IVC_D) y Ventas de Automviles
Nuevos de ANAC (V_AUTOS); mientras que las variables asociadas al factor 2 son:
ndice de Ventas Fsicas Industriales del INE (IVF_INE) e ndice de Ventas Fsicas
Industriales de la SOFOFA (IVF_SOFOFA).
Como se observa, todas las variables cambiaron el factor al cual se asocian, ya que
se rotaron los ejes sin producir mayores cambios en las saturaciones y as la
interpretacin de los factores no ha cambiado (slo se han intercambiado entre 1 y
2).

8. Grfico de Factores en el Espacio Rotado.

El grfico de factores en espacio factorial rotado, nos indica la asociacin que tiene
cada variable con cada factor, cuyos valores estn entre -1 y 1. En este caso
confirmamos la relacin constatada en la matriz de factores rotados, es decir las
variables asociadas al factor 1 son: ndice de Ventas de Supermercados (IVS), ndice
de Ventas de Comercio Minorista No Durable del INE (IVC_ND), ndice de Ventas de
Comercio Minorista Durable del INE (IVC_D) y Ventas de Automviles Nuevos de ANAC
(V_AUTOS); mientras que las variables asociadas al factor 2 son: ndice de Ventas
Fsicas Industriales del INE (IVF_INE) e ndice de Ventas Fsicas Industriales de la
SOFOFA (IVF_SOFOFA).

9. Matriz de Coeficientes para el Clculo de la Puntuaciones Factoriales.

Matriz de coeficientes para el clculo


de las puntuaciones factoriales
Factor
1

IVF_INE

,032

,009

IVS

,123

,005

IVCM_ND

,688

,043

IVCM_D

,179

,011

-,142

,987

,011

,001

IVF_SOFOFA
V_AUTOS

Mtodo de extraccin: Mxima


verosimilitud.
Mtodo de rotacin: Normalizacin
Varimax con Kaiser.
Mtodo de puntuaciones factoriales:
Regresin.

La matriz de coeficientes para el clculo de puntuaciones muestra los factores como


combinacin lineal de las variables. Es decir, muestra el valor de cada factor i, para
cada observacin j en funcin de las variables y sus cargas:

Z ji = a1 X j1 + a2 X j 2 +K + ak X jk

De acuerdo a los valores que se observan en la matriz se puede deducir que la


relacin entre factores y variables es:

Z1 = 0,032IVF _INE+ 0,123IVS


+

0,688IVCM _+ND

0,179IVCM _D

0,142 IVF_ SOFOFA


+ 0,011 V_ AUTOS
Z1 = 0,009IVF _INE+ 0,005IVS
+ 0,043IVCM _+ND

0,011IVCM _D

+0,987 IVF_ SOFOFA


+ 0,001 V_ AUTOS

II.

Construccin del Indicador Sinttico del Comercio para la economa


chilena (ISC).

Fecha

Factor 1 Factor 2

ISC0
ISC1
ISC 2
1.1642747 0.230251 0.165110
-1.14661
9
6
98
1.3945263
0.000071
-1.49478
9
0.0001*
70

01-012005

-1.17276

02-012005

-1.34637

ISC
16.51%
0.01%

03-012005

-1.0133

0.74574

04-012005

-1.07547

0.56853

05-012005

-0.91244

-0.58175

06-012005

-1.14212

-0.91119

07-012005

-0.90007

-0.63083

08-012005

-1.14731

0.12654

09-012005

-0.97433

0.20671

10-012005

-0.84725

-0.25995

-1.02641

0.44901

0.48198

1.58659

-1.09244

0.05263

-1.19288

-0.70082

-0.77582

2.13355

-0.7906

0.11272

-0.76286

0.56261

-0.88058

-0.11652

07-012006

-0.71102

-0.61619

08-012006

-0.84691

0.15203

11-012005
12-012005
01-012006
02-012006
03-012006
04-012006
05-012006
06-012006

09-012006

-0.53362

-0.39314

0.4425229
9
0.5420214
1
0.8051370
1
1.0671873
5
0.8127064
4
0.7339684
7
0.5911036
5
0.6566816
6
0.5476626
1
0.8404061
8
0.7208852
7
1.0332153
3
0.1682185
1
0.4974888
2
0.3327687
0.6326562
0.6802493
6
0.5227718
4
0.4880367
5

0.952003 0.682671
4
53

68.27%

0.852504 0.611322
98
27

61.13%

0.589389 0.422644
38
87

42.26%

0.327339 0.234731
04
35

23.47%

0.581819 0.417216
95
91

41.72%

0.660557 0.473679
92
08

47.37%

0.803422 0.576125
74
92

57.61%

0.737844 0.529100
73
62

52.91%

0.846863 0.607277
78
03
60.73%
2.234932 1.602646
57
42
160.26%
0.673641 0.483060
12
89

48.31%

0.361311 0.259092
06
32
25.91%
1.562744 1.120627
9
78
112.06%
0.897037 0.643256
57
12
1.061757 0.761375
69
17
0.761870 0.546329
19
03

64.33%
76.14%
54.63%

0.714277 0.512200
03
47

51.22%

0.871754 0.625125
55
93

62.51%

0.906489 0.650034
64
1

65.00%

10-012006
11-012006
12-012006
01-012007
02-012007
03-012007
04-012007
05-012007

-0.62631
-0.58077
1.14984
-0.70933
-0.89232
-0.33126
-0.47769
-0.46328

06-012007

-0.44216

07-012007

-0.53507

08-012007

-0.52352

09-012007
10-012007
11-012007
12-012007
01-012008
02-012008
03-012008
04-012008
05-012008
06-012008
07-012008

-0.24094

0.3145281
0.33455
2
0.1317127
0.80315
2
1.2057352
1.3221
9
0.34098 0.3685232
0.4397128
0.50254
9
0.5955225
2.52493
6
0.1439763
0.55076
7
0.2062628
1.60014
7
0.0756185
0.68746
2
0.3604596
0.00305
9
0.1198350
0.72057
5
0.4288086
-0.81992
5

-0.22093

1.0246

-0.11527

0.73284

1.84467

1.2188

-0.23786

0.4227

-0.37515

0.43783

0.04703

2.03019

-0.10983

1.3648

0.19752

0.49316

-0.01102

0.49414

-0.13965

0.91683

0.1832222
0.1599265
2
1.6415863
8
0.0235201
0.1113525
3
0.6905299
4
0.3686610
5
0.2934498
9
0.1528953
8
0.2031588
6

1.079998 0.774455
27
29

77.45%

1.262813 0.905550
67
28
90.55%
2.600261 1.864620
68
05
186.46%
1.026003
19
0.735736 73.57%
0.954813 0.684686
5
63
68.47%
1.990048 1.427042
95
97
142.70%
1.250550 0.896756
02
14
89.68%
1.600789 1.147908
26
99
114.79%
1.318907 0.945774
87
83

94.58%

1.034066 0.741518
7
25

74.15%

1.274691 0.914067
34
63

91.41%

0.965717
74
1.577748
59
1.554452
91
3.036112
77
1.371006
29

0.692505
94
69.25%
1.131386
77
113.14%
1.114681
68
111.47%
2.177164
24
217.72%
0.983134
06
98.31%

1.283173
85
2.085056
33
1.763187
44
1.687976
28
1.547421
77
1.597685
25

0.920150
35
92.01%
1.495171
76
149.52%
1.264363
1.210429
87
1.109639
73
1.145683
13

126.44%
121.04%
110.96%
114.57%

08-012008

-0.00779

0.12187

0.03392

-0.2919

0.12796

0.58125

0.18237

-0.91332

1.91683

0.4345

0.09556

-1.25052

-0.26802

-1.52595

0.14432

0.09938

04-012009

-0.0504

-0.8346

05-012009

0.35427

-0.97498

06-012009

0.01864

-1.42067

0.06099

-0.38067

0.25869

-0.3252

0.23192

-0.88448

0.42041

-0.01

0.49677

-0.81592

2.60506

0.67723

0.52093

-1.36073

0.17342

-1.68141

1.12516

-2.10531

1.27904
1.53813

-1.79998
-1.75775

09-012008
10-012008
11-012008
12-012008
01-012009
02-012009
03-012009

07-012009
08-012009
09-012009
10-012009
11-012009
12-012009
01-012010
02-012010
03-012010
04-012010
05-01-

0.0342823 1.428808 1.024583


5
74
58
0.0718027 1.322723 0.948511
6
63
07
1.669570 1.197231
0.2750445
89
56
1.221364 0.875827
0.1731618
59
58
1.4358404 2.830366
4
82
2.029626
0.3412188 1.053307 0.755315
8
51
64
0.6761957 0.718330 0.515107
8
61
25
0.1297377 1.524264 1.093033
7
16
65
0.3048588 1.089667 0.781389
7
52
01
0.0770478 1.317478 0.944749
4
55
88
0.4483903 0.946136 0.678464
4
05
11
0.0823207 1.312205 0.940968
7
62
72
0.0692281 1.463754 1.049642
4
53
84
0.1303318 1.264194 0.906540
3
56
5
0.2807496 1.675276 1.201322
6
05
67
0.0708255 1.465351 1.050788
8
97
34
1.9795136 3.374040 2.419488
6
05
3
0.0896350 1.304891 0.935723
1
38
76
0.4284391 0.966087 0.692770
5
24
9
0.0769302 1.471456 1.055165
8
67
96
1.674479 1.200751
0.2799531
49
46
0.4686759 1.863202 1.336082

102.46%
94.85%
119.72%
87.58%
202.96%
75.53%
51.51%
109.30%
78.14%
94.47%
67.85%
94.10%
104.96%
90.65%
120.13%
105.08%
241.95%
93.57%
69.28%
105.52%
120.08%
133.61%

2010
06-012010
07-012010
08-012010
09-012010
10-012010
11-012010
12-012010

0.96911

-1.44314

1.11314

-0.36694

0.97642

-0.30359

1.18512

-0.2178

1.40259

-0.05395

1.4169

-0.33161

4.1344

1.58513

1
0.1863780
3
0.6328805
2
0.5610796
6
0.7298975
6
0.9299688
3
0.8495397
9
3.3072074
9

3
1.580904
42
2.027406
91
1.955606
05
2.124423
95
2.324495
22
2.244066
18
4.701733
88

59
1.133649
78
1.453831
97
1.402344
33
1.523401
86
1.666870
84
1.609196
03
3.371563
45

113.36%
145.38%
140.23%
152.34%
166.69%
160.92%
337.16%

La tabla anterior muestra el ISC que se construye como una suma ponderada de
factores: ISC = c1 * Z1 + c2 * Z 2 , tomando como ponderadores cada uno de los valores
propios asociados, divididos entre la suma de ellos. En este caso:

c1 =

1
2
; c2 =
1 + 2
1 + 2

Luego se hacen ciertos arreglos para que el ndice quede positivo (restndole el valor
mnimo, ISC1=ISC0-MN { }) y ya que son series de tiempo, es adecuado arreglar los
valores de tal manera que sean ms interpretables, dividiendo los ndices por el
promedio de todos los ndices (ISC2=ISC1/PROMEDIO { }). Luego se calcula el
porcentaje de cada uno (ISC=ISC2*100%), el valor ms cercano al promedio sera
igual a 100 y as es ms fcil interpretar y comparar la variabilidad del ndice a
travs del tiempo.
*Le asignamos al ISC del 1 de Feb de 2005 un valor lo suficientemente pequeo
(0,0001) para que su ISC sea distinto a cero y no pierda interpretabilidad.

You might also like