Professional Documents
Culture Documents
PAUTA Prctico N4
Tema: Anlisis Factorial.
Prof. Mauricio Gallardo Altamirano
Ayudante: Pablo Ramrez
Instrucciones.
En la plataforma de Intranet est disponible la base de datos datos_practico4.sav,
que contiene informacin real de las siguientes variables para la economa chilena:
1.
2.
3.
4.
5.
6.
I.
Tablas y sus respectivas interpretaciones.
1. Matriz de Correlaciones
Matriz de correlacionesa
IVF_INE
Correlacin
Sig. (Unilateral)
a.
IVF_INE
IVS
IVCM_ND
IVCM_D
IVF_SOFOFA
V_AUTOS
1,000
,243
,430
,440
,858
,410
IVS
,243
1,000
,927
,886
-,144
,502
IVCM_ND
,430
,927
1,000
,962
,079
,566
IVCM_D
,440
,886
,962
1,000
,080
,723
IVF_SOFOFA
,858
-,144
,079
,080
1,000
,172
V_AUTOS
,410
,502
,566
,723
,172
1,000
,020
,000
,000
,000
,000
,000
,000
,114
,000
,000
,256
,000
,251
,000
IVF_INE
IVS
,020
IVCM_ND
,000
,000
IVCM_D
,000
,000
,000
IVF_SOFOFA
,000
,114
,256
,251
V_AUTOS
,000
,000
,000
,000
,074
,074
Determinante = .000
Chi-cuadrado aproximado
Bartlett
Gl
,601
583,884
15
Sig.
,000
En la tabla adjunta observamos la medida de adecuacin muestral de Kaiser-MeyerOlkin la cual contrasta si las correlaciones parciales entre las variables son
suficientemente pequeas. El estadstico KMO vara entre 0 y 1. Los valores mayores
a 0,5, como en este caso, indican que las correlaciones parciales son chicas en
comparacin con las correlaciones de Pearson.
La prueba de esfericidad de Bartlett consiste en contrastar la hiptesis nula de que la
matriz de correlaciones es esfrica (igual a la Matriz Identidad) en cuyo caso no
existiran correlaciones significativas entre las variables y el modelo factorial no sera
pertinente. En este caso el p-value de la Prueba de Bartlett es 0,000 y por ende, se
rechaza la hiptesis nula.
Frente a estos dos nuevos antecedentes es posible determinar que es factible usar
una tcnica de reduccin de la dimensin como lo es Anlisis Factorial.
3. Comunalidades.
Comunalidadesa
Inicial
Extraccin
IVF_INE
,881
,875
IVS
,914
,914
IVCM_ND
,975
,984
IVCM_D
,974
,940
IVF_SOFOFA
,879
,999
V_AUTOS
,765
,379
extraccin
% de la
Factor
Total
% de la
varianza
% acumulado
Total
varianza
% de la
% acumulado
Total
varianza
% acumulado
3,587
59,783
59,783
1,805
30,090
30,090
3,232
53,874
53,874
1,723
28,713
88,496
3,286
54,765
84,855
1,859
30,981
84,855
,541
9,017
97,513
,081
1,351
98,864
,056
,925
99,789
,013
,211
100,000
Esta tabla nos muestra la varianza explicada por cada factor. Observamos 6 factores
con sus respectivos autovalores, de los cuales los primeros 2 tienen un autovalor
mayor a uno y que segn el criterio de la media aritmtica sern considerados para
la construccin del ndice.
En este caso los factores 1 y 2 cuyos autovalores son mayores a 1, explican en
conjunto el 88,496% de la varianza total.
Cabe mencionar que las saturaciones al cuadrado de cada factor no han modificado
significativamente la varianza explicada por los 2 primeros componentes, ya que slo
ha disminuido aproximadamente un 4%.
5. Grfico de Sedimentacin.
6. Matriz Factorial.
Matriz factoriala
Factor
1
IVF_INE
2
,861
,366
-,136
,946
IVCM_ND
,087
,988
IVCM_D
,088
,965
IVF_SOFOFA
,999
-,008
V_AUTOS
,177
,590
IVS
La matriz factorial asocia cada variable a cada factor, por lo que se puede relacionar
cada factor con elementos que tengan las variables en comn. En este caso las
variables asociadas al factor 1 son: ndice de Ventas Fsicas Industriales del INE
(IVF_INE) e ndice de Ventas Fsicas Industriales de la SOFOFA (IVF_SOFOFA); mientras
que las variables asociadas al factor 2 son:
ndice
de
Ventas
de
Supermercados (IVS), ndice de Ventas de Comercio Minorista No Durable del INE
(IVC_ND), ndice de Ventas de Comercio Minorista Durable del INE (IVC_D) y Ventas
de Automviles Nuevos de ANAC (V_AUTOS). Claramente hay una interpretacin para
cada factor identificado: el factor 1 corresponde al comercio a nivel industrial y el
factor 2 puede asimilarse al comercio a nivel minorista.
Esta matriz muestra las variables como combinacin lineal de los factores:
stos mayor relacin tiene con la variable. Por ejemplo: en el caso de la variable
V_AUTOS, el factor 2 seria el que posee mayor influencia sobre sta, dado que posee
el mayor valor absoluto en la combinacin lineal que se puede obtener con los datos
de la tabla, y que se muestra a continuacin:
X1 = V _ AUTOS
X1 = 0,177 * Z1 + 0,590* Z2
IVF_INE
,318
,880
IVS
,952
-,085
IVCM_ND
,982
,140
IVCM_D
,959
,140
-,062
,998
,579
,209
IVF_SOFOFA
V_AUTOS
El mtodo de rotacin busca variables que saturen, a ser posible, en un nico factor,
y factores que contengan un nmero reducido de variables que saturen inequvoca y
exclusivamente en ellos. Mediante el mtodo VARIMAX se rotan los ejes en cualquier
direccin sin cambiar la localizacin relativa de los factores hasta obtener un claro
esquema de la relacin entre las variables y factores.
Esta tabla muestras que las variables han cambiado el factor al que se asocian, ahora
las variables asociadas al factor 1 son: ndice de Ventas de Supermercados (IVS),
ndice de Ventas de Comercio Minorista No Durable del INE (IVC_ND), ndice de
Ventas de Comercio Minorista Durable del INE (IVC_D) y Ventas de Automviles
Nuevos de ANAC (V_AUTOS); mientras que las variables asociadas al factor 2 son:
ndice de Ventas Fsicas Industriales del INE (IVF_INE) e ndice de Ventas Fsicas
Industriales de la SOFOFA (IVF_SOFOFA).
Como se observa, todas las variables cambiaron el factor al cual se asocian, ya que
se rotaron los ejes sin producir mayores cambios en las saturaciones y as la
interpretacin de los factores no ha cambiado (slo se han intercambiado entre 1 y
2).
El grfico de factores en espacio factorial rotado, nos indica la asociacin que tiene
cada variable con cada factor, cuyos valores estn entre -1 y 1. En este caso
confirmamos la relacin constatada en la matriz de factores rotados, es decir las
variables asociadas al factor 1 son: ndice de Ventas de Supermercados (IVS), ndice
de Ventas de Comercio Minorista No Durable del INE (IVC_ND), ndice de Ventas de
Comercio Minorista Durable del INE (IVC_D) y Ventas de Automviles Nuevos de ANAC
(V_AUTOS); mientras que las variables asociadas al factor 2 son: ndice de Ventas
Fsicas Industriales del INE (IVF_INE) e ndice de Ventas Fsicas Industriales de la
SOFOFA (IVF_SOFOFA).
IVF_INE
,032
,009
IVS
,123
,005
IVCM_ND
,688
,043
IVCM_D
,179
,011
-,142
,987
,011
,001
IVF_SOFOFA
V_AUTOS
Z ji = a1 X j1 + a2 X j 2 +K + ak X jk
0,688IVCM _+ND
0,179IVCM _D
0,011IVCM _D
II.
Fecha
Factor 1 Factor 2
ISC0
ISC1
ISC 2
1.1642747 0.230251 0.165110
-1.14661
9
6
98
1.3945263
0.000071
-1.49478
9
0.0001*
70
01-012005
-1.17276
02-012005
-1.34637
ISC
16.51%
0.01%
03-012005
-1.0133
0.74574
04-012005
-1.07547
0.56853
05-012005
-0.91244
-0.58175
06-012005
-1.14212
-0.91119
07-012005
-0.90007
-0.63083
08-012005
-1.14731
0.12654
09-012005
-0.97433
0.20671
10-012005
-0.84725
-0.25995
-1.02641
0.44901
0.48198
1.58659
-1.09244
0.05263
-1.19288
-0.70082
-0.77582
2.13355
-0.7906
0.11272
-0.76286
0.56261
-0.88058
-0.11652
07-012006
-0.71102
-0.61619
08-012006
-0.84691
0.15203
11-012005
12-012005
01-012006
02-012006
03-012006
04-012006
05-012006
06-012006
09-012006
-0.53362
-0.39314
0.4425229
9
0.5420214
1
0.8051370
1
1.0671873
5
0.8127064
4
0.7339684
7
0.5911036
5
0.6566816
6
0.5476626
1
0.8404061
8
0.7208852
7
1.0332153
3
0.1682185
1
0.4974888
2
0.3327687
0.6326562
0.6802493
6
0.5227718
4
0.4880367
5
0.952003 0.682671
4
53
68.27%
0.852504 0.611322
98
27
61.13%
0.589389 0.422644
38
87
42.26%
0.327339 0.234731
04
35
23.47%
0.581819 0.417216
95
91
41.72%
0.660557 0.473679
92
08
47.37%
0.803422 0.576125
74
92
57.61%
0.737844 0.529100
73
62
52.91%
0.846863 0.607277
78
03
60.73%
2.234932 1.602646
57
42
160.26%
0.673641 0.483060
12
89
48.31%
0.361311 0.259092
06
32
25.91%
1.562744 1.120627
9
78
112.06%
0.897037 0.643256
57
12
1.061757 0.761375
69
17
0.761870 0.546329
19
03
64.33%
76.14%
54.63%
0.714277 0.512200
03
47
51.22%
0.871754 0.625125
55
93
62.51%
0.906489 0.650034
64
1
65.00%
10-012006
11-012006
12-012006
01-012007
02-012007
03-012007
04-012007
05-012007
-0.62631
-0.58077
1.14984
-0.70933
-0.89232
-0.33126
-0.47769
-0.46328
06-012007
-0.44216
07-012007
-0.53507
08-012007
-0.52352
09-012007
10-012007
11-012007
12-012007
01-012008
02-012008
03-012008
04-012008
05-012008
06-012008
07-012008
-0.24094
0.3145281
0.33455
2
0.1317127
0.80315
2
1.2057352
1.3221
9
0.34098 0.3685232
0.4397128
0.50254
9
0.5955225
2.52493
6
0.1439763
0.55076
7
0.2062628
1.60014
7
0.0756185
0.68746
2
0.3604596
0.00305
9
0.1198350
0.72057
5
0.4288086
-0.81992
5
-0.22093
1.0246
-0.11527
0.73284
1.84467
1.2188
-0.23786
0.4227
-0.37515
0.43783
0.04703
2.03019
-0.10983
1.3648
0.19752
0.49316
-0.01102
0.49414
-0.13965
0.91683
0.1832222
0.1599265
2
1.6415863
8
0.0235201
0.1113525
3
0.6905299
4
0.3686610
5
0.2934498
9
0.1528953
8
0.2031588
6
1.079998 0.774455
27
29
77.45%
1.262813 0.905550
67
28
90.55%
2.600261 1.864620
68
05
186.46%
1.026003
19
0.735736 73.57%
0.954813 0.684686
5
63
68.47%
1.990048 1.427042
95
97
142.70%
1.250550 0.896756
02
14
89.68%
1.600789 1.147908
26
99
114.79%
1.318907 0.945774
87
83
94.58%
1.034066 0.741518
7
25
74.15%
1.274691 0.914067
34
63
91.41%
0.965717
74
1.577748
59
1.554452
91
3.036112
77
1.371006
29
0.692505
94
69.25%
1.131386
77
113.14%
1.114681
68
111.47%
2.177164
24
217.72%
0.983134
06
98.31%
1.283173
85
2.085056
33
1.763187
44
1.687976
28
1.547421
77
1.597685
25
0.920150
35
92.01%
1.495171
76
149.52%
1.264363
1.210429
87
1.109639
73
1.145683
13
126.44%
121.04%
110.96%
114.57%
08-012008
-0.00779
0.12187
0.03392
-0.2919
0.12796
0.58125
0.18237
-0.91332
1.91683
0.4345
0.09556
-1.25052
-0.26802
-1.52595
0.14432
0.09938
04-012009
-0.0504
-0.8346
05-012009
0.35427
-0.97498
06-012009
0.01864
-1.42067
0.06099
-0.38067
0.25869
-0.3252
0.23192
-0.88448
0.42041
-0.01
0.49677
-0.81592
2.60506
0.67723
0.52093
-1.36073
0.17342
-1.68141
1.12516
-2.10531
1.27904
1.53813
-1.79998
-1.75775
09-012008
10-012008
11-012008
12-012008
01-012009
02-012009
03-012009
07-012009
08-012009
09-012009
10-012009
11-012009
12-012009
01-012010
02-012010
03-012010
04-012010
05-01-
102.46%
94.85%
119.72%
87.58%
202.96%
75.53%
51.51%
109.30%
78.14%
94.47%
67.85%
94.10%
104.96%
90.65%
120.13%
105.08%
241.95%
93.57%
69.28%
105.52%
120.08%
133.61%
2010
06-012010
07-012010
08-012010
09-012010
10-012010
11-012010
12-012010
0.96911
-1.44314
1.11314
-0.36694
0.97642
-0.30359
1.18512
-0.2178
1.40259
-0.05395
1.4169
-0.33161
4.1344
1.58513
1
0.1863780
3
0.6328805
2
0.5610796
6
0.7298975
6
0.9299688
3
0.8495397
9
3.3072074
9
3
1.580904
42
2.027406
91
1.955606
05
2.124423
95
2.324495
22
2.244066
18
4.701733
88
59
1.133649
78
1.453831
97
1.402344
33
1.523401
86
1.666870
84
1.609196
03
3.371563
45
113.36%
145.38%
140.23%
152.34%
166.69%
160.92%
337.16%
La tabla anterior muestra el ISC que se construye como una suma ponderada de
factores: ISC = c1 * Z1 + c2 * Z 2 , tomando como ponderadores cada uno de los valores
propios asociados, divididos entre la suma de ellos. En este caso:
c1 =
1
2
; c2 =
1 + 2
1 + 2
Luego se hacen ciertos arreglos para que el ndice quede positivo (restndole el valor
mnimo, ISC1=ISC0-MN { }) y ya que son series de tiempo, es adecuado arreglar los
valores de tal manera que sean ms interpretables, dividiendo los ndices por el
promedio de todos los ndices (ISC2=ISC1/PROMEDIO { }). Luego se calcula el
porcentaje de cada uno (ISC=ISC2*100%), el valor ms cercano al promedio sera
igual a 100 y as es ms fcil interpretar y comparar la variabilidad del ndice a
travs del tiempo.
*Le asignamos al ISC del 1 de Feb de 2005 un valor lo suficientemente pequeo
(0,0001) para que su ISC sea distinto a cero y no pierda interpretabilidad.