Bienio 2006-2008 Bienio 2006-2008 CARMELO A. VILA ZARZA Departamento de Estadstica UNIVERSIDAD DE SALAMANCA An Anlisis Factorial lisis Factorial.. Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 2 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA ANLISIS DE COMPONENTES PRINCIPALES ANLISIS DE COMPONENTES PRINCIPALES AN ANLISIS DE COMPONENTES PRINCIPALES LISIS DE COMPONENTES PRINCIPALES El objetivo del ANLISIS DE COMPONENTES PRINCIPALES ANLISIS DE COMPONENTES PRINCIPALES es analizar si es posible representar adecuadamente esta informacin, a partir de un nmero menor de variables, construidas como combinaciones lineales e incorreladas de las variables originales Aunque esta tcnica es debida a Hotelling (1933), sus orgenes se deben a Pearson, K. (1901), cientfico britnico quien trat de encontrar la matriz de menor dimensin que la original que, en el sentido de los mnimos cuadrados, mejor resumiera la informacin de los datos originales. Pearson, K. Disponemos de los valores que para p-variables, toman n individuos (unidades experimentales), en una Matriz X de datos (dimensin n*p) Deseamos obtener UN ESPACIO DE DIMENSIN REDUCIDA que represente de forma adecuada los datos Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 4 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA C Cmo realizar un mo realizar un PCA PCA en SPSS? en SPSS? No existe en el programa SPSS una opcin propia para realizar un ACP. Para hacerlo, deberemos recurrir a la opcin Anlisis Factorial (AF)
Dado que el mtodo de las componentes principales es una tcnica descriptiva (geomtrica) para la reduccin de la dimensin, puede considerarse tambin como una solucin para el problema factorial. As lo considera el SPSS. Por tanto, veremos este anlisis tras revisar el ANLISIS FACTORIAL Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 5 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA AN ANLISIS FACTORIAL LISIS FACTORIAL ANLISIS FACTORIAL ANLISIS FACTORIAL Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 6 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA An Anlisis factorial lisis factorial - -FA FA- - El AN AN LISIS FACTORIAL LISIS FACTORIAL (como el an anlisis de componentes principales), lisis de componentes principales), TIENE COMO OBJETIVO REDUCIR LA DIMENSIONALIDAD DE LOS DATOS Es decir, tiene por objeto explicar un conjunto de variables observadas por un pequeo nmero de variables latentes o no observadas, que llamaremos factores, obtenidos a partir de correlaciones de las variables observadas. El anlisis factorial surge del inters por comprender las dimensiones de la inteligencia humana en los aos 30 del siglo pasado. Sus orgenes se deben a Spearman, C. (1904) Psiclogo ingls. Tambin contribuyeron al mismo de forma significativa Pearson y Hotelling (1933) Thurstone, (1947). Los mayores avances en esta tcnica se han producido en el campo de la psicometra. C. Spearman Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 7 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Variables Cuantitativas Variables Cuantitativas Al igual que en el caso del ANLISIS DE COMPONENTES PRINCIPALES, el ANLISIS FACTORIAL debe realizarse a partir de datos obtenidos de variables cuantitativas. Los datos categricos o cualitativos (tales como el sexo o la nacionalidad) no son adecuados para estas tcnicas, existiendo otras especficas (algunas de las cuales se vern en este curso) para dichos datos. En general disponemos de los valores que para p-variables, toman n individuos (unidades experimentales), en una Matriz X de datos (dimensin n*p), es decir, se parte de una matriz de datos correspondientes a los valores de n individuos medidos sobre p variables ! X nxp = 12 1,01 1245 56 9,6 124 14 0, 46 3254 64 3,2 185 19 0, 74 845 56 4,5 172 11 0,98 2143 53 3, 4 136 11 0,01 9854 46 3, 4 214 13 0,62 6231 57 3,6 169 10 0,12 8451 86 7,5 128 " # $ $ $ $ $ $ $ $ $ % & ' ' ' ' ' ' ' ' ' Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 8 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA PCA PCA vs vs FA FA) El AN AN LISIS FACTORIAL LISIS FACTORIAL y el AN ANLISIS DE COMPONENTES PRINCIPALES LISIS DE COMPONENTES PRINCIPALES, a pesar de compartir un objetivo comn (REDUCIR LA DIMENSIONALIDAD) presentan distintas peculiaridades: AF *Estudiamos la estructura de correlaciones entre VARIABLES *Se buscan factores hipotticos que EXPLIQUEN las variables originales *Representamos CORRELACIONES entre variables y entre variables y factores ACP *Nos interesa la informacin de los INDIVIDUOS *Queremos describir los valores de los individuos mediante un pequeo n de variables, que sean combinacin de las originales *Representamos INDIVIDUOS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 9 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Tipos de AF Tipos de AF ANLISIS FACTORIAL EXPLORATORIO -Anlisis a priori -Reduccin del nmero de variables -Plano factorial -SPSS-BASE ANLISIS FACTORIAL CONFIRMATORIO -Anlisis a posteriori -Confirmacin del ajuste realizado por el investigador -Modelos de Ecuaciones estructurales -SPSS- AMOS- LISREL Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 10 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Variables Cuantitativas Variables Cuantitativas Los datos para los cuales razonablemente se pueden calcular los coeficientes de correlacin de Pearson, deberan ser adecuados para el anlisis factorial. Supuestos. Los datos deben tener una distribucin normal bivariada para cada pareja de variables y las observaciones deben ser independientes. En general se parte de una matriz de datos correspondientes a los valores de n individuos medidos sobre j variables ! X = 12 1,01 1245 56 9,6 124 14 0, 46 3254 64 3,2 185 19 0, 74 845 56 4,5 172 11 0,98 2143 53 3, 4 136 11 0,01 9854 46 3, 4 214 13 0,62 6231 57 3,6 169 10 0,12 8451 86 7,5 128 " # $ $ $ $ $ $ $ $ $ % & ' ' ' ' ' ' ' ' ' El procedimiento de anlisis factorial puede aceptar entradas en forma de una matriz de correlacin generada desde otro procedimiento, como el procedimiento Correlaciones (debe usar la sintaxis de comandos para leer en los datos de la matriz). Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 11 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Objetivo del AF Objetivo del AF El modelo de anlisis factorial especifica que las variables vienen determinadas por los FACTORES COMUNES (los factores estimados por el modelo) y por FACTORES NICOS (los cuales no se superponen entre las distintas variables observadas); las estimaciones calculadas se basan en el supuesto de que ningn factor nico est correlacionado con los dems, ni con los factores comunes. Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 12 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Calificaciones de 8 estudiantes en 4 asignaturas: Matemtica, Fsica, Historia e Ingls, ejemplo ejemplo n = 8 estudiantes p = 4 asignaturas X 1 = notas Matemticas X 2 = notas Fsica X 3 = notas Historia X 4 = notas Ingls Abordemos ste problema desde un EJEMPLO Disponemos de los valores (notas) que para 4 variables (asignaturas), toman n individuos (8 estudiantes), en una Matriz X de datos (dimensin8*4). El problema que se desea resolver pasa por ENCONTRAR UN ESPACIO DE DIMENSIN REDUCIDA en el que los FACTORES permitan explicar de forma adecuada los datos X = Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 13 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Cada calificacin puede ser contemplada como funcin de la inteligencia (Int) del alumno ! factor comn la aptitud (Apt)para la materia en cuestin ! factor especfico M = a Int + Apt M F = b Int + Apt F H = c Int + Apt H I = d Int + Apt I Calificaciones de 8 estudiantes en 4 asignaturas: Matemtica, Fsica, Historia e Ingls, ejemplo ejemplo Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 14 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA o tambin cada calificacin puede ser contemplada como funcin de la capacidad cuantitativa (CC) del alumno ! factor comn la capacidad verbal (CV) del alumno ! factor comn la aptitud (Ap) para la materia en cuestin ! factor especfico M = a 1 CC + a 2 CV + Ap M F = b 1 CC + b 2 CV + Ap F I = c 1 CC + c 2 CV + Ap I H = d 1 CC + d 2 CV + Ap H Calificaciones de 8 estudiantes en 4 asignaturas: Matemtica, Fsica, Historia e Ingls, ejemplo ejemplo Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 15 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA p k pk p p p k k k k U F a F a F a X U F a F a F a X U F a F a F a X + + + + = + + + + = + + + + = ... ... ... ... 2 2 1 1 2 2 2 22 1 21 2 1 1 2 12 1 11 1 X i variables observadas F 1 , F 2 , , F k factores comunes U i. U p. factores nicos (especficos) a i1 , a i2 , , a ik i=1,p saturaciones Modelo del An Modelo del Anlisis Factorial lisis Factorial MODELO FACTORIAL LINEAL: Sean X 1 , , X 2 variables aleatorias observables sobre una poblacin. Se trata de encontrar p+q nuevas variables denominadas factores, F 1 , , F q , U 1 , , U p , tales que i k ik i i i U F a F a F a X + + + + = ... 2 2 1 1 Ecuacin Fundamental del Anlisis Factorial Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 16 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Modelo del An Modelo del Anlisis Factorial lisis Factorial A la suma de las contribuciones de todos los factores comunes
h i 2 = a i1 2 +K+ a iq 2
se la denomina comunal idad, de forma q ue la variabilidad de una va riable cualquiera es la suma de su comunalidad ms su unicidad
1= h i 2 + d i 2 , i = 1,K, p
El modelo factorial lineal puede expresarse en notacin matricial como
X = AF + DU X = (X1 ,K, Xp ! ) ; F =(F1 , K, Fq ); U = (U1, K, Up ! ) A = (a ij ); D= diag(di )
Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 17 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA C Cmo realizar un mo realizar un AF AF en SPSS? en SPSS? Para obtener un Anlisis Factorial (AF) Seleccione los mens:
SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 18 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Selecci Seleccin de variables n de variables
En primer lugar, se deben seleccionar las variables que intervendrn en el anlisis factorial. Seleccin de casos en el anlisis factorial Para seleccionar los casos para el anlisis, elija una variable de seleccin y pulse en Valor para introducir un entero como el valor de seleccin. En el anlisis factorial, slo se usarn los casos con ese valor para la variable de seleccin. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 19 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Estad Estadsticos descriptivos sticos descriptivos DESCRIPTIVOS DESCRIPTIVOS SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 20 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Estad Estadsticos descriptivos sticos descriptivos DESCRIPTIVOS DESCRIPTIVOS ESTAD ESTADSTICOS STICOS Los DESCRIPTIVOS UNIVARIADOS incluyen la media, la desviacin tpica y el nmero de casos vlidos para cada variable. La SOLUCIN INICIAL muestra las comunalidades iniciales, los autovalores y el porcentaje de varianza explicada. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 21 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Estad Estadsticos descriptivos sticos descriptivos DESCRIPTIVOS DESCRIPTIVOS MATRIZ DE CORRELACIONES MATRIZ DE CORRELACIONES Las opciones disponibles son: Coeficientes, niveles de significacin, determinante, inversa, reproducida, anti-imagen KMO Y PRUEBA DE ESFERICIDAD DE BARTLETT. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 22 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA La MATRIZ DE CORRELACIONES, nos informa de la estructura de correlaciones entre las variables observadas Matriz de correlaciones Matriz de correlaciones Correlation Matrix 1,000 ,943 ,302 ,560 ,943 1,000 ,544 ,758 ,302 ,544 1,000 ,934 ,560 ,758 ,934 1,000 MATEMATI FISICAS HISTORIA INGLES Correlation MATEMATI FISICAS HISTORIA INGLES El KMO y el test DE ESFERICIDAD DE BARTLETT, nos proporcionan informacin acerca de la VALIDACIN DEL MODELO DE ANLISIS FACTORIAL El Test de esfericidadd de Bartlet (BARTLET 1950), es el anlogo multivariante del test estadstico que es frecuentemente aplicado para ver si el coeficiente de correlacin simple es significativamente diferente de cero y sigue una distribucin Ji-cuadrado. Contrasta si la matriz de correlaciones es la matriz identidad, lo cual indicaa lo inadecuado del modelo factorial Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 23 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA El CONTRASTE DE KAISER-MEYER-OLKIN (KMO) - ndice que mide la suficiencia de muestreo (o adecuacin muestral). Su rango es entre 0 y 1 indicando que, para valores bajos, el modelo es inadecuado Kaiser (1970). Segn Kaiser (1970), el KMO debera ser mayor que 0.5 para asumir que ha sido alcanzada medianamente la asuncin de Guttman (1954) quien sugiri que las estimaciones de las correlaciones parciales tuviesen valores prximos a cero y las estimaciones de las correlaciones mltiples valores elevados (es decir, cercanos a uno). Especficamente Medida KMO Recomendaci n ! 0.9 Maravilloso 0. 8 Meritorio 0. 7 Regular 0. 6 Mediocre 0. 5 Miserable < 0.5 Inaceptable
KMO KMO Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 24 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Extracci Extraccin de factores n de factores EXTRACCI EXTRACCIN N SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 25 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA M Mtodos de e todos de extracci xtraccin n EXTRACCI EXTRACCIN N MTODOS Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son: COMPONENTES PRINCIPALES MNIMOS CUADRADOS NO PONDERADOS MNIMOS CUADRADOS GENERALIZADOS MXIMA VEROSIMILITUD FACTORIZACIN DE EJES PRINCIPALES FACTORIZACIN ALFA FACTORIZACIN IMAGEN. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 26 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA M Mtodos de e todos de extracci xtraccin n EXTRACCI EXTRACCIN N MTODOS Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son: COMPONENTES PRINCIPALES Mtodo para la extraccin de factores utilizada para formar combinaciones lineales independientes de las variables observadas. La primera componente tiene la varianza mxima. Las componentes sucesivas explican progresivamente proporciones menores de la varianza y no estn correlacionadas las unas con las otras. El anlisis de componentes principales se utiliza para obtener la solucin factorial inicial. Puede utilizarse cuando una matriz de correlaciones es singular. SPSS Mtodo de estimacin de la matriz factorial Parte del modelo que considera slo los factores comunes y prescinde de los factores nicos. Calcula los valores y vectores propios directamente de la matriz de correlaciones de las variables originales sin utilizar las comunalidades en la diagonal. Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 27 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA M Mtodos de e todos de extracci xtraccin n EXTRACCI EXTRACCIN N MTODOS Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son: ESTE ES EL MODO DE REALIZAR, CON EL SPSS, UN ANLISIS DE COMPONENTES PRINCIPALES POR SUPUESTO SIN ROTACION SPSS Mtodo de estimacin de la matriz factorial Parte del modelo que considera slo los factores comunes y prescinde de los factores nicos. Calcula los valores y vectores propios directamente de la matriz de correlaciones de las variables originales sin utilizar las comunalidades en la diagonal. Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 28 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA M Mtodos de e todos de extracci xtraccin n EXTRACCI EXTRACCIN N MTODOS Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son: MNIMOS CUADRADOS NO PONDERADOS Mtodo de extraccin factorial que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlaciones observada y reproducida, ignorando las diagonales.
MNIMOS CUADRADOS GENERALIZADOS Mtodo de extraccin de factores que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlacin observada y reproducida. Las correlaciones se ponderan por el inverso de su unicidad, de manera que las variables que tengan un valor alto de unicidad reciban un peso menor que aqullas que tengan un valor bajo de unicidad. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 29 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA M Mtodos de e todos de extracci xtraccin n EXTRACCI EXTRACCIN N MTODOS Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son: MXIMA VEROSIMILITUD Mtodo de extraccin factorial que proporciona las estimaciones de los parmetros que con mayor probabilidad han producido la matriz de correlaciones observada, si la muestra procede de una distribucin normal multivariada. Las correlaciones se ponderan por el inverso de la unicidad de las variables, y se emplea un algoritmo iterativo. FACTORIZACIN DE EJES PRINCIPALES Mtodo para la extraccin de factores que parte de la matriz de correlaciones original con los cuadrados de los coeficientes de correlacin mltiple insertados en la diagonal principal como estimaciones iniciales de las comunalidades. Las saturaciones factoriales resultantes se utilizan para estimar de nuevo las comunalidades y reemplazan a las estimaciones previas en la diagonal de la matriz. Las iteraciones continan hasta que el cambio en las comunalidades, de una iteracin a la siguiente, satisfaga el criterio de convergencia para la extraccin SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 30 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA M Mtodos de e todos de extracci xtraccin n EXTRACCI EXTRACCIN N MTODOS Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son: FACTORIZACIN ALFA Mtodo de extraccin factorial que considera a las variables incluidas en el anlisis como una muestra del universo de las variables posibles. Este mtodo maximiza el Alfa de Cronbach para los factores. FACTORIZACIN IMAGEN Mtodo para la extraccin de factores, desarrollado por Guttman y basado en la teora de las imgenes. La parte comn de una variable, llamada la imagen parcial, se define como su regresin lineal sobre las restantes variables, en lugar de ser una funcin de los factores hipotticos. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 31 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA An Anlisis lisis EXTRACCI EXTRACCIN N ANALIZAR ANALIZAR Permite especificar o una MATRIZ DE CORRELACIONES Es til si las variables de su anlisis se miden sobre escalas distintas. o una MATRIZ DE COVARIANZAS: Es til si se desea aplicar el anlisis factorial a varios grupos con distintas varianzas para cada variable. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 32 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Cu Cuntos factores debemos retener? ntos factores debemos retener? Criterios Criterios SPSS VALORES PROPIOS MAYORES QUE UNO El nmero de factores estar determinado por el nmero de valores propios mayores que uno. REGLA DEL 75% DE LA VARIANZA El nmero de factores esta determinado por la absorcin de inercia. Se tomarn tantos valores propios como sean necesarios para conseguir un 75% de inercia absorbida. REGLA DEL CODO (CATTELL (1966) SCREE PLOT El procedimiento del scree plot de Cattell consiste en representar grficamente los valores propios en orden descendente y dibujar una recta a travs de las componentes con los valores propios ms bajos. Se retienen las componentes que se corresponden con los autovalores que quedan por encima de la lnea. ESPECIFICACION DEL USUARIO Es posible especificar personalmente el nmero de factores. Usualmente no ser mayor que el nmero de variables dividido por dos. En el caso en que se sobrestime ste valor, el n ser ajustado por el ordenador. Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 33 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Criterios extracci Criterios extraccin n EXTRACCI EXTRACCIN N EXTRAER EXTRAER Opcin en la que se especifican los ejes(factores) a retener: * Se pueden retener todos los factores cuyos autovalores excedan un valor especificado (1 por defecto - Regla K1-, aunque puede ser sustituido por otro valor) * o retener un nmero especfico de factores. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 34 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Resultados mostrados Resultados mostrados EXTRACCI EXTRACCIN N MOSTRAR MOSTRAR Permite solicitar la solucin factorial sin rotar : Muestra las saturaciones factoriales sin rotar (la matriz de configuracin factorial), las comunalidades y los autovalores de la solucin factorial. y el grfico de sedimentacin de los autovalores (Scree Plot) Grfico de la varianza asociada a cada factor. Se utiliza para determinar cuntos factores deben retenerse. Tpicamente el grfico muestra la clara ruptura entre la pronunciada pendiente de los factores ms importantes y el descenso gradual de los restantes (los sedimentos). SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 35 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Gr Grfico de Sedimentacin fico de Sedimentacin SPSS GRFICO DE SEDIMENTACIN de los autovalores (Scree Plot) Grfico de la varianza asociada a cada factor. Se utiliza para determinar cuntos factores deben retenerse. Tpicamente el grfico muestra la clara ruptura entre la pronunciada pendiente de los factores ms importantes y el descenso gradual de los restantes (los sedimentos). Scree Plot Component Nu mber 9 8 7 6 5 4 3 2 1 E i g e n v a l u e 3,5 3,0 2,5 2,0 1,5 1,0 ,5 0,0 4 4 Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 36 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA N iteraciones N iteraciones EXTRACCI EXTRACCIN N Iteraciones Iteraciones N mximo de iteraciones para convergencia. Permite especificar el nmero mximo de pasos que el algoritmo puede seguir para estimar la solucin (25 es el valor por defecto). SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 37 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Rotaci Rotacin n ROTACIN ROTACIN
SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 38 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Objetivo: Los ejes factoriales se rotan para mejorar la interpretabilidad de los factores , de forma que aumenten unas saturaciones y disminuyan otras. Se mantiene la solucin general paro cambian los factores individuales para que sean ms interpretables Para qu Para qu rotar? rotar? FISICA MATEMTICAS HISTORIA FILOSOFIA FRANCS LITERATURA Grficamente Diagrama que muestra una rotacin ortogonal de 35 (clockwise) Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 39 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Rotaciones ortogonales Rotaciones ortogonales ROTACIN ROTACIN M MTODO TODO Permite seleccionar el mtodo de rotacin factorial. Los mtodos disponibles son: (ortogonales) VARIMAX, QUARTIMAX, EQUAMAX, y (oblcuos) oblimin directo y promax. VARIMAX Mtodo de rotacin ortogonal que minimiza el nmero de variables que tienen saturaciones altas en cada factor. Simplifica la interpretacin de los factores. QUARTIMAX Mtodo de rotacin que minimiza el nmero de factores necesarios para explicar cada variable. Simplifica la interpretacin de las variables observadas. EQUAMAX Mtodo de rotacin que es combinacin del mtodo varimax, que simplifica los factores, y el mtodo quartimax, que simplifica las variables. Se minimiza tanto el nmero de variables que saturan alto en un factor como el nmero de factores necesarios para explicar una variable.
SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 40 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Rotaciones oblicuas Rotaciones oblicuas ROTACIN ROTACIN M MTODO TODO Permite seleccionar el mtodo de rotacin factorial. Los mtodos disponibles son: (ortogonales) varimax, quartimax, equamax, y (oblcuos) OBLIMIN DIRECTA Y PROMAX. OBLIMIN DIRECTA Mtodo de rotacin oblicua (no ortogonal). Cuando delta es igual a cero (valor por defecto) las soluciones son las ms oblicuas. A medida que delta se va haciendo ms negativo, los factores son menos oblicuos. Para anular el valor por defecto 0 para delta, introduzca un nmero menor o igual que 0,8. PROMAX Rotacin oblicua que permite que los factores estn correlacionados. Puede calcularse ms rpidamente que una rotacin oblimin directa, por lo que es til para conjuntos de datos grandes.
SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 41 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Resultados mostrados Resultados mostrados ROTACIN ROTACIN M MOSTRAR OSTRAR Permite incluir los resultados de : Solucin rotada Debe seleccionarse un mtodo de rotacin para obtener la solucin rotada. Para las rotaciones ortogonales, se muestran la matriz de configuracin rotada y la matriz de transformacin. Para las rotaciones oblicuas, se muestran las matrices de estructura, de configuracin y de correlaciones entre los factores. Diagrama de las saturaciones factoriales. Representacin tridimensional de las saturaciones factoriales para los tres primeros factores. Para una solucin de dos factores, se representa un diagrama bidimensional. No se muestra el grfico si slo se extrae un factor. Si se solicita la rotacin, los diagramas representan las soluciones rotadas.
SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 42 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA N iteraciones N iteraciones ROTACIN ROTACIN
Iteraciones Iteraciones N mximo de iteraciones para convergencia. Permite especificar el nmero mximo de pasos que el algoritmo puede seguir para llevar a cabo la rotacin. SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 43 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Puntuaciones Factoriales Puntuaciones Factoriales PUNTUACIONES FACTORIALES PUNTUACIONES FACTORIALES
SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 44 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Guardar como variables Guardar como variables PUNTUACIONES FACTORIALES PUNTUACIONES FACTORIALES Guardar como variables Guardar como variables Las puntuaciones pueden guardarse como variables para anlisis adicionales (Por ejemplo, es posible construir un modelo de regresin logstica basndose en las puntuaciones factoriales). En sta opcin se puede crear una nueva variable para cada factor en la solucin final. Seleccione uno de los siguientes mtodos alternativos para calcular las puntuaciones factoriales: MTODO DE REGRESIN. Mtodo para estimar los coeficientes de las puntuaciones factoriales. Las puntuaciones resultantes tienen de media 0 y varianza igual al cuadrado de la correlacin mltiple entre las puntuaciones factoriales estimadas y los valores factoriales verdaderos. Las puntuaciones pueden estar correlacionadas incluso cuando los factores son ortogonales. PUNTUACIONES DE BARTLETT. Mtodo para estimar los coeficientes de las puntuaciones factoriales. Las puntuaciones resultantes tienen una media de 0. Se minimiza la suma de cuadrados de los factores nicos sobre el rango de las variables. MTODO DE ANDERSON-RUBIN . Mtodo para calcular los coeficientes para las puntuaciones factoriales; es una modificacin del mtodo de Bartlett, que asegura la ortogonalidad de los factores estimados. Las puntuaciones resultantes tienen una media 0, una desviacin tpica de 1 y no correlacionan entre s.
SPSS Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 45 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Mostrar coeficientes Mostrar coeficientes PUNTUACIONES FACTORIALES PUNTUACIONES FACTORIALES Mostrar matriz de coeficientes de las puntuaciones factoriales. Muestra los coeficientes por los cuales se multiplican las variables para obtener puntuaciones factoriales. Tambin muestra las correlaciones entre las puntuaciones factoriales.
Formato de presentacin de los coeficientes. Permite controlar aspectos de las matrices de resultados. Los coeficientes se ordenan por tamao y se suprimen aqullos cuyos valores absolutos sean menores que el valor especificado. SPSS Valores perdidos. Permite especificar el tratamiento que reciben los valores perdidos. Las alternativas disponibles son: Excluir casos segn lista, Excluir casos segn pareja y Reemplazar por la media. Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 48 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA ACP ACP versus versus AF AF AN ANLISIS FACTORIAL LISIS FACTORIAL COMPONENTES COMPONENTES PRINCIPALES PRINCIPALES Explica variabilidad, representamos individuos Explica y representa correlaciones Proyecta las observaciones en un espacio de Trata de explicar las variables observadas en dimensin reducida con minima prdida funcin de unos cuantos factores hipotticos de informacin Las componentes principales son incorreladas Los Factores son incorrelados slo dentro incondicionalmente del espacio de los factores comunes Un nico procedimiento de estimacin Hay varios procedimientos de estimacin Una nica solucin Hay varias soluciones Aadir una nueva componentes principal Aadir un nuevo Factor puede cambiar no cambia las anteriores los factores anteriores La solucin cambia con los cambios de escala Algunas soluciones son invariantes respecto de los cambios de escala No hay que estimar comunalidades Hay que estimar comunalidades, y en algunos modelos es difcil hacerlo Los clculos son bastante simples En los modelo ms complejos los clculos son problemticos Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 49 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA CUADRAS, C.M. (1996). Mtodos de Anlisis Multivariante, EUB, Barcelona. HAIR, J.F., ANDERSON,R.E., TATHAM, R.L. and BLACK, W.C. (1998). Multivariate Data Analysis, Prentice Hall,New Jersey. JOLLIFE, I.T. (1986). Principal Component Analysis, Springer-Verlag, New York. JOHNSON, D.E. (1998). Mtodos Multivariados aplicados al anlisis de datos, Thomson Eds., Mxico. HARMAN, H.H. (1980): Anlisis factorial moderno. Madrid: Salts. MARDIA, K.V., KENT, J.T. and BIBBY, J.M. (1979). Multivariate Analysis, Academic Press, London. PEA, D. (2002). Anlisis de Datos Multivariantes, Mc Graw-Hill, Madrid. SHARMA, S. (1996). Applied Multivariate Techniques, John Wiley and Sons, New York. Bibliograf Bibliografa a Carmelo Carmelo vila Zarza vila Zarza 2007 2007 - 50 - Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA Curso Doctorado ESTADISTICA MULTIVARIANTE APLICADA GRACIAS