You are on page 1of 12

Tema 10 Anlisis factorial a

El anlisis factorial es una tcnica cuyo propsito es denir la estructura subyacente de a e o un conjunto de datos, de tal manera que analiza la estructura de correlacin entre las variao bles mediante la denicin de una serie de dimensiones subyacentes llamadas Factores. Esto o se realiza con un doble n: el resumen y la reduccin de los datos. A la hora de resumir se o obtiene unas dimensiones que cuando son interpretadas describen los datos de una manera ms sencilla; con respecto a la reduccin, se pueden obtener los clculos de las puntuaciones a o a para cada dimensin y sustituirlos por las variables originales. o La ventaja que tiene el Anlisis Factorial es que se tratan todas las variables simultneaa a mente, cada una relacionada con las dems y no existe una variable dependiente y otras a independientes.

10.1.

El anlisis factorial a

El objetivo fundamental ser el encontrar una manera de resumir la informacin contenida a o en una serie de variables originales, mediante una serie de dimensiones compuestas (factores) o valores tericos con una m o nima perdida de informacin. o

10.1.1.

Hiptesis previas o

Dentro de las hiptesis previas la primera de ellas ser la normalidad, aunque esta solo o a ser necesaria si se realizan pruebas estad a sticas de signicacin. Tambin es deseable que exiso e ta un cierto grado de multicolinealidad, ya que el objetivo es identicar variables relacionadas. El anlisis factorial debe tener sucientes correlaciones para poder aplicarse. Si no hay a una nmero sustancial de correlaciones mayores de 0.3 entonces es probablemente inadecuado. u Las correlaciones entre variables pueden ser analizadas mediante el clculo de las correlaa ciones parciales de tal manera que si las correlaciones parciales son bajas, entonces no existen factores subyacentes verdaderos y el anlisis factorial es inapropiado. Esta hiptesis tambin a o e se puede contrastar buscando que los valores de la diagonal de la matriz anti-imagen sean altos.

125

Anlisis factorial a

126

10.1.2.

Estimacin de los factores o

Para decidir el nmero de factores que se deben extraer, utilizaremos el porcentaje de la u varianza total de los datos, de tal manera que el porcentaje de varianza debe explicar un valor que consideremos vlido. Por ejemplo, en ciencias naturales se toman factores hasta explicar a al menos un 95 % de la varianza, frente a ciencias sociales que es normal considerar sobre el 60 %-65 % de la varianza total. Las comunalidades sern el porcentaje de varianza de cada variable explicada por el nmero a u de factores escogido.

10.1.3.

Interpretacin de los factores o

Para determinar la solucin utilizaremos las cargas factoriales, que son el medio para intero pretar la funcin que cada variable desempea para denir cada factor. Son las correlaciones o n entre cada variable y el factor, de tal manera que indican la correspondencia entre cada variable y el factor. Las cargas con valores entre 0,30 se consideran de nivel m nimo, mayores de 0,40 son ms importantes y de 0,50 son signicativas. Por lo tanto cuanto mayor sea a el valor absoluto de la carga ms importante es esa variable para interpretar el factor, por a ejemplo, una carga de 0.30 implica una explicacin del 10 % de la varianza del factor, y uno o de 0,50 una explicacin del 25 %. o

10.1.4.

Rotacin de los factores o

La rotacin consiste en girar los ejes factoriales. La solucin inicial extrae los factores segn o o u su importancia, de tal manea que el primer factor explica la mayor parte de la varianza (y por lo tanto estar en funcin de ms variables) y los siguientes factores van explicando proa o a gresivamente menor porcentaje de varianza. Con la rotacin se distribuye la varianza en otros o factores para lograr un patrn de factores ms simple y ms signicativo. o a a Existen muchos mtodos de rotacin y la seleccin de uno u otro depender de las soluciones, e o o a de tal manera que esta se simplique el mximo posible. a

10.2.

Aplicacin mediante SPSS o

Como ejemplo de Anlisis Factorial vamos a utilizar el chero Factorial, el cul contiene a a los valores de 17 indicadores de tipo sanitario para 23 pa ses. El objetivo es realizar una anlisis a factorial para encontrar una estructura subyacente en estos datos. Para realizar una anlisis factorial tenemos que elegir los mens: a u Analizar Reduccin de datos o Anlisis factorial a ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a obteniendo el siguiente men: u Figura 10.1: Men anlisis factorial u a

127

10.2.1.

Botn Descriptivos o

Con este botn podremos obtener: o Estad sticos: 1. Descriptivos univariados: la media, la desviacin t o pica y el nmero de casos vlidos u a para cada variable. 2. Solucin inicial muestra las comunalidades iniciales, los autovalores y el porcentaje o de varianza explicada. Matriz de correlaciones: 1. Coecientes, niveles de signicacin y determinante. o 2. Inversa, reproducida, anti-imagen 3. KMO (medida de Kaiser-Meyer-Olkin) y prueba de esfericidad de Bartlett.

Figura 10.2: Descriptivos

Si seleccionamos todas las opciones, obtendremos los siguientes resultados: Con la opcin estad o sticos descriptivos obtenemos para todas las variables la media, la desviacin t o pica, el nmero de casos vlidos y si hay algn datos faltante. u a u ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

128

Figura 10.3: Estad sticos

Con la matriz de correlaciones, su signicacin y el determinante. Es conveniente, como o ocurre en este caso que los coecientes de la matriz de correlaciones sean signicativos en su mayor parte. Tambin es interesante que el determinate de la matriz de correlaciones e 10 sea bajo, 1,35 10 en este ejemplo. Figura 10.4: Matriz de correlaciones

KMO y prueba de esfericidad de Bartlett. Con la prueba KMO contrastamos que las correlaciones parciales sean pequeas. Si es estad n stico KMO es grande el procedimiento es adecuado, si es pequeo ser inadecuado, este estad n a stico oscila entre 0 y 1. La prueba de Bartlett contrasta si la matriz de correlaciones es una matriz identidad como hiptesis nula, es decir, que las variables estn incorreladas; en caso de aceptarse o a esta hiptesis indicar que el modelo factorial es inadecuado. o a Matriz anti-imagen. En un buen modelo factorial la mayor de los elementos no diagoa nales deben ser pequeos y los de la diagonal grandes. En nuestro ejemplo ocurre esta n circunstancia por los que el modelo factorial ser bueno. a ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

129

Figura 10.5: KMO y Bartlett

Las pruebas de KMO y Bartlett, y el estudio de la matriz anti-imagen y la matriz de correlaciones y su signicacin resultan satisfactorias por lo que al anlisis factorial puede o a proporcionarnos buenos resultados.

10.2.2.

Extraccin o

Con este botn obtendremos el anlisis factorial propiamente dicho. Las opciones ms o a a importantes son: Mtodo: con esta opcin seleccionaremos el mtodo para extraer los factores. Las opciones e o e disponibles son: 1. Componentes principales. 2. M nimos cuadrados no ponderados. 3. M nimos cuadrados generalizados. 4. Mxima verosimilitud. a 5. Factorizacin de Ejes principales. o 6. Factorizacin Alfa. o 7. Factorizacin Imagen. o Nosotros usaremos el mtodo de componentes principales que consiste en realizar una e combinacin lineal de las variables, de tal manera que el primer componente princio pal sea la combinacin que ms varianza explique, el segundo la segunda mayor y que o a est incorrelado con el primero y as sucesivamente. a Analizar. Permite especicar o una matriz de correlaciones o una matriz de covarianzas. Utilizaremos la matriz de correlaciones si las variables estn en diferente escala y la de a covarianzas en caso contrario. Extraer. Podemos elegir entre utilizar tantos factores como autovalores mayores de un valor. Se conoce como regla de Kaiser a quedarse con tantos factores como autovalores mayores que uno existan. Tambin podemos indicar un nmero concreto de factores a e u extraer. Mostrar : ofrece la solucin sin rotar y el grco de sedimentacin. o a o

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

130

Figura 10.6: Extraer

En este ejemplo, por lo tanto usaremos la matriz de correlaciones, el mtodo de componentes e principales y usaremos la ya comentada regla de Kaiser, es decir, nos quedaremos con tantos factores como autovalores mayores que 1. Los resultados son: 1. Las comunalidades son la proporcin de varianza explicada por los factores de cada una o de las variables. Vemos que todas las variables van a ser bien explicadas por la estructura factorial, salvo quizs las variables PIB Gasto Publico en Salud y Heridos de Traco. a

Figura 10.7: Comunalidades

2. Con la tabla de Varianza Explicada obtenemos una tabla con todos los autovalores y el porcentaje de varianza explicada por cada uno de ellos. En principio tendremos tantos autovalores como variables tengamos. Mediante la regla de Kaiser tomamos tantos factores como autovalores mayores de 1, en este caso tomar amos 5 factores. Estos cinco factores explican un 83.66 % de la varianza total. A partir de ahora surge la decisin del o investigador, de tal manera que si este 83.66 % nos parece suciente nos quedar amos con esos cinco factores, si nos parece poco aumentar amos algn factor y si queremos un u modelo ms sencillo eliminar a amos algn factor. Como vimos anteriormente, en probleu mas de tipo socioeconmico es suciente con una explicacin del 60-70 %, por lo que ser o o a interesante para simplicar el problema quedarnos con una estructura de 3 o 4 factores; para ello en el botn extraer (10.2.2), indicar o amos el nmero concreto que nos interese. u ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

131

Figura 10.8: Varianza explicada

3. El grco de sedimentacin es la representacin grca de los autovalores, de tal manera a o o a que se suele usar para decidir el nmero de factores a utilizar, tomando factores hasta u que la pendiente de la recta sea paralela al Eje X. Figura 10.9: Grco de sedimentacin a o

Por lo tanto, a partir del grco de sedimentacin y principalmente del estudio de la a o varianza, nos quedaremos con una estructura factorial con 3 o 4 factores. Dependiendo de esta decisin las comunalidades sern: o a Figura 10.10: Comunalidades con tres y cuatro factores

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

132

Evidentemente, con cuatro factores las comunalidades son ms altas, el problema est en a a que este modelo es mas complejo que con tres factores, por lo que habr que decidir a entre estas dos estructuras, en nuestro ejemplo vamos a optar por una estructura con tres factores. 4. Una vez decidido el nmero de factores obtendremos la solucin nal que es la matriz u o de componentes, pero con una pequea restriccin. La matriz de componentes (tambin n o e conocida como Factor Scores) son las cargas de cada variable en cada uno de los factores originados, de modo que las variables con cargas ms altas en un factor, nos indica a una estrecha relacin entre la variable y ese factor, en denitiva es la correlacin entre o o el factor y la variable. Por ello, solo nos interesarn aquellos valores que tengan altas a cargas factoriales, para obtener estos valores, seleccionaremos el botn de opciones y o seleccionaremos las pestaas de ordenar valores y suprimir aquellas con un valor menor n de 0.30, Figura 10.11: Botn Opciones o

Resultando que el primer factor viene determinado por las variables Tasa de Mortalidad Perinatal, Tasa de Mortalidad Infantil, Gasto per Capita en Mdico, Poblacin por e o Cama, Esperanza de Vida Masculina, Tasa Heptica, PIB en Gasto Pblico, Consumo a u de Alcohol, Esperanza de Vida Femenina y PIB en Salud; el segundo factor viene determinado por Gasto per Capita en Mdicos, Esperanza de Vida Masculina, Consumo de e Alcohol, Esperanza de Vida Femenina, PIB en salud, Heridos de Trco, Porcentaje Proa tegido por Ambulatorio, Tasa de Cancer de Pulmn, Porcentaje Protegido por Hospital, o Tasa de admisin Hospitalaria y Dias en Cama y el tercer factor por Gasto per Capita en o mdicos, Poblacin por Cama Hospitalaria, Esperanza de Vida Masculina, Esperanza de e o Vida Femenina, PIB en salud, Porcentaje Protegido por Ambulatorio, Tasa de Cancer de Pulmn, Porcentaje Protegido por Hospital,Tasa de admisin Hospitalaria y Dias en o o Cama. El problema est en que para la interpretacin ser interesante que una variable tuviera a o a una importante carga factorial para un solo factor y no dependiese de varios, para intentar que se de esta situacin se recurre a las rotaciones factoriales. o

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

133

Figura 10.12: Cargas factoriales

10.2.3.

Rotacin o

El n de la rotacin es ayudar a interpretar en los casos en los que las cargas factoriales o no estn claras; las rotaciones simplemente son movimientos de los ejes de tal manera que e se mantenga la comunalidad y el porcentaje de varianza explicada por el modelo, aunque no por cada eje. Lo que buscaremos ser que cada factor tenga unos pocos pesos altos y el resto a cercanos a cero, y que cada variable este saturada en solo un factor. Para realizar una rotacin elegiremos el botn rotacin, el cul nos permite escoger entre: o o o a Mtodo: para elegir el mtodo de rotacin entre: varimax, equamax, quartimax, oblimin e e o directo y promax. Mostrar : 1. Solucin rotada: se selecciona un mtodo de rotacin para obtener la solucin rotada. o e o o 2. Grcos de saturaciones: muestra las representaciones tridimensional de las saturaa ciones factoriales para los tres primeros factores. Para una solucin de dos factores, o se representa un diagrama bidimensional. No se muestra el grco si slo se extrae a o un factor. En este caso, vamos a elegir una de las rotaciones que SPSS nos ofrece y concretamente la VARIMAX. Adems marcaremos la solucin rotada y el grco de saturaciones. Si vemos la a o a tabla de la varianza explicada, observamos que no han cambiado la varianza total explicada (66,12 %) aunque si lo que explica cada factor, 31,478 % en el primer factor y sin rotar frente a 25,052 % rotado; 19,406 frente a 23,134 del segundo factor y 15,238 frente a 17,935 del tercer factor.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

134

Figura 10.13: Varianza explicada

Tambin vemos que como las soluciones rotadas se han simplicado: e Figura 10.14: Cargas factoriales rotadas

En este caso el primer factor viene determinado por las variables Esperanza de Vida Masculina, Esperanza de Vida Femenina, Tasa de Mortalidad Infantil, Consumo de Alcohol, Tasa Heptica, Tasa de Mortalidad Perinatal, Tasa de Cancer de Pulmn, Gasto per Capita en a o Mdico y Heridos de Trco; el segundo factor vendr marcado por la Tasa de Mortalidad Ine a a fantil, Tasa de admisin Hospitalaria, Dias en Cama, Poblacin por Cama, Tasa de Mortalidad o o Perinatal, PIB en Salud y Gastos per Capita en Mdicos y el tercer factor determinado por e Porcentaje Protegido por Hospital, PIB en Salud, Gasto per Capita en Mdicos, Porcentaje e Protegido por Ambulatorio y Heridos de Trco. En este caso los factores vienen determinados a por menos variables y son ms sencillos. a Por medio de los grcos podemos deducir el sentido y signicado de los factores. A cona tinuacin vemos los grcos bidimensionales y tridimensionales. Estos grcos son las cooro a a denadas de cada variable con respecto a los factores, que como hemos visto son valores entre -1 y 1, siendo mayor la contribucin cuanto mayor sea este valor. A partir de la posicin de o o las variables con respecto a los ejes es donde se puede deducir el sentido y signicado de los factores. Lo ideal es que no estn centrados en torno al punto (0,0) sino prximos al borde e o del grco, ya que la idea es identicar las variables con mayor peso factorial. Por ejemplo, a con respecto a las componentes 1 y 2, vemos que las variables Esperanza de Vida Masculina y Femenina estn muy juntas, por lo que estn muy correladas entre si y a su vez con el factor 1 a a negativamente, y Consumo de Alcohol y Cirrosis Heptica lo estn entre si y con el factor uno a a positivamente, por lo que podr amos concluir que el primer factor contrapone la Esperanza de ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a Vida con el Consumo de Alcohol.

135

Figura 10.15: Grcos a

Figura 10.16: Grcos a

Si estudiamos por ejemplo el grco de las componentes 2 y 3, vemos que las variables a Gasto per Capita y PIB en salud estn correladas entre si y positivamente con el factor tres, a frente a Poblacin protegida por Hospital y Ambulatorio, por lo que este tercer eje marcar o a la separacin entre el gasto y la poblacin protegida. o o

10.2.4.

Puntuaciones Factoriales

Finalmente, si escogemos el Botn Puntuaciones y seleccionamos Guardar como variables: o Figura 10.17: Puntuaciones factoriales

Obtenemos las puntuaciones factoriales, que consisten en reducir el conjunto de variables de cada individuo al conjunto de factores o dicho en modo matemtico, las puntuaciones a ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Anlisis factorial a

136

de cada individuo sobre el conjunto de factores extra do. Estas puntuaciones se aaden en el n Fichero de Datos, con los nombres FAC1 1, FAC1 2, FAC1 3. De tal manera que solo tendremos que representar estas tres variables (Men Grcos; Dispersin; Dispersin 3D; Introducir u a o o las tres variables nuevas en los ejes y establecer marcas por Pa Resultando el siguiente s). grco: pudiendo sacar las conclusiones referentes a los pa a ses, como que Islandia tiene un Figura 10.18: Grco puntuaciones factoriales a

comportamiento parecido a Suecia, o que Espaa es similar a Grecia y USA con Japn. n o

10.3.
10.3.1.

Ejercicios obligatorios
Ejercicio primero

Una empresa dedicada al diseo de automviles desea estudiar cuales son los deseos del n o comprador. Para ello realiza una encuesta a 20 individuos preguntndoles 10 caracter a sticas de sus productos que valoran de 1 a 5. Los datos estn en el chero factorial2. Intentar encontrar a los factores de comportamiento latentes en los encuestados, identicar los factores numrica y e grcamente. Ser factible alguna rotacin? Obtener las puntuaciones factoriales y su grco a a o a tridimensional.

10.3.2.

Ejercicio segundo

Se estudian 100 individuos para comprobar la idea que los consumidores tienen sobre una empresa. Para ello se estudian siete variables sobre la empresa. Se desea realizar un anlisis a factorial para intentar reducir la dimensin de 7 a menos variables. Realizar el anlisis factorial o a del chero Factorial3.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

You might also like