Professional Documents
Culture Documents
Se dispone de una muestra de 41 ciudades de USA en las que se midieron diferentes variables
relacionadas con la contaminacin atmosfrica.
Las variables son:
Contenido de SO2 (Dixido de Azufre).
Temperatura anual en grados F = Temp
Nmero de empresas mayores de 20 trabajadores = Emp
Poblacin (en miles de habitantes) = Pob
Velocidad media del viento = Viento
Precipitacin anual media = Precip
Das lluviosos al ao = Das
El inters de la investigacin est basado sobre la relacin entre la concentracin de SO2 y el
resto de las variables, para ello, debemos intentar disminuir el nmero de variables por
medio de un Anlisis de Componentes Principales, si es posible.
Matriz de Correlaciones:
Para comprobar que las correlaciones entre las variables son distintas de cero de modo
significativo, se comprueba si el determinante de la matriz de correlacin es distinto de uno,
es decir, si sta es diferente de la matriz identidad.
Contraste del Test de Bartlett:
De aqu (Comunalidades por extraccin) podemos valorar cules de las variables son peor
explicadas por el modelo. En el estudio, la variable Viento es la peor explicada, ya que el
modelo slo es capaz de reproducir el 42,4% de su variabilidad original, por otro lado, la
variable que mejor logra representar el modelo es a la Poblacin (97,9%).
Este mtodo de extraccin de componentes o factores (Anlisis de Componentes
Principales), es un mtodo que asume por defecto, que puede explicar todas y cada una de
las variables incluidas en el anlisis.
b) En este mtodo (de ejes factoriales) partimos de la base de que slo una parte de la
variabilidad total de cada variable depende de factores comunes y, por tanto, la
comunalidad inicial no ser 1. Estima dichas comunalidades mediante los
coeficientes de determinacin mltiple de cada variable con el resto. Se sustituyen
estos valores en la diagonal principal de la matriz R* y se procede a efectuar un ACP.
Una vez obtenido el resultado, se estiman de nuevo las comunalidades, se vuelven
a sustituir en la diagonal principal de la matriz R* y el proceso se retroalimenta hasta
alcanzar un criterio de parada (por ejemplo cuando la diferencia entre lasa
comunalidades de dos iteraciones sucesivas sea menor que una cantidad prefijada).
La eleccin de uno u otro mtodo depende de los objetivos del AF. As el ACP es adecuado
cuando el objetivo es resumir la mayora de la informacin original (varianza total) con una
cantidad mnima de factores con propsitos de prediccin. El AFC resulta adecuado para
identificar los factores subyacentes o las dimensiones que reflejan qu tienen en comn las
variables. El inconveniente del mtodo PAF es que el clculo de las comunalidades requiere
mucho tiempo y muchos recursos informticos y, adems, no siempre se pueden estimar o,
incluso, pueden ser no vlidas (comunalidades menores que 0 o mayores que 1).
Rotacin de Factores
Con el fin de facilitar la interpretacin del significado de los factores seleccionados se suele
llevar a cabo una rotacin de los ejes factoriales. Uno de los mtodos ms corrientes es el
Varimax, desarrollado por Kaiser (1958), que efecta una rotacin ortogonal de los ejes
factoriales.
El objetivo de la rotacin Varimax es conseguir que la correlacin de cada una de las variables
sea lo ms prxima a 1 con slo uno de los factores y prxima a cero con todos los dems.