You are on page 1of 40

AL ANALISIS INTRODUCCION MULTIVARIADO

Vladimir Moreno G. Universidad Javeriana

July 4, 2013

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.

El an alisis multivariado es el nombre dado a un conjunto de t ecnicas estad sticas que busca describir la situaci on problema en la que cada unidad observada tiene una cantidad de atributos (variables ) que la caracterizan en cierto sentido. Con el advenimiento de la inform atica computacional ha habido una explosi on en el uso de estas t ecnicas en el estudio de fen omenos que implican un volumen grande de datos. El objetivo de estas lecciones es presentar algunos de estos m etodos a trav es de ejemplos ilustrativos y apoyados en los programas SPSS y R.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.
Las t ecnicas del AM tratan con datos provenientes de los atributos de un conjunto de individuos (unidades) estudiadas. La presentaci on del conjunto de individuos juntos con sus atributos es mediante una tabla (matriz ) donde las las corresponden a los individuos y las columnas a las variables. Las metodolog as seguidas en el AM son diversas, bien sea por los distintos tipos de situaciones que se dan al obtener los datos, bien sea por el objetivos especico del estudio. Algunos enfoques consideran las siguientes metodolog as: Simplicaci on de la estructura de los datos Clasicaci on An alisis de la interdependencia An alisis de la dependencia Formulaci on y prueba de hip otesis
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.
La mayoria de enfoques del AM se encuentran concentrados en el An alisis de interdependencia y en el An alisis de dependencia. Las siguientes son algunas de las metodolog as consideradas en estos enfoques: ANALISIS DE DEPENDENCIA MULTIPLE REGRESION ANALISIS DISCRIMINANTE CANONICA ANALISIS DE CORRELACION ANALISIS LOGIT ANALISIS DE VARIANZA MULTIVARIADO

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.
MULTIPLE REGRESION Esta metodolog a centra su an alisis al estudiar el efecto que un determinado n umero de variables predictoras o regresoras independintes puede tener sobre la variable respuesta. Mediante esta metodolog a se mide el efecto de cada una de las variables predictoras sobre la variable respuesta. ANALISIS DISCRIMINANTE La poblaci on de donde proviene la muestra que da lugar a los individuos observados se ha particionado de acuerdo a las caracter sticas (atributos o variables ) que se quieren estudiar, por tanto cada individuo de la muestra puede ser asignado a uno de los conjuntos de la partici on. El an alisis discriminante es un valioso instrumento estad stico para realizar esta asignaci on.
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.

CANONICA ANALISIS DE CORRELACION Metodolog a para encontrar una relaci on lineal entre un conjunto de variables predictoras y un conjunto de criterios (representado por variables dependientes). El an alisis can onico se puede exter a m as de dos grupos de variables. ANALISIS LOGIT Esta metodolog a es un caso especial de la Regresi on m ultiple, en el sentido en que la variable respuesta es de tipo categ orico o discreto y la funci on de enlace en el modelo no es lineal sino la funci on log stica.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.

ANALISIS DE VARIANZA MULTIPLE Es la generalizaci on natural de ANOVA, solo que en este caso se eval uan m ultiples criterios (tratamientos ) con el prop osito de determinar su efecto sobre una o m as variables respuesta en un experimento.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.

ANALISIS DE INTERDEPENDENCIA ANALISIS DE COMPONENTES PRINCIPALES ANALISIS DE FACTORES COMUNES ANALISIS DE CORRESPONDENCIAS ANALISIS DE CONGLOMERADOS ESCALAMIENTO MULTIDIMENSIONAL MODELOS LOG-LINEALES ANALISIS DE COMPONENTES INDEPENDIENTES

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.

ANALISIS DE COMPONENTES PRINCIPALES Un problema central en AM es la reducci on de la dimensionalidad, es decir describir con precisi on los valores de p variables por un subconjunto de r variables de ellas, a costa de una peque na p erdida de informaci on. El an alisis de componentes principales (ACP) tiene este objetivo: Dadas n observaciones (atributos) de p variables, se analiza si es posible representar adecuadamente esta informaci on con un n umero menor de variables construidas como combinaciones lineales de las originales.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.

ANALISIS DE FACTORES COMUNES El an alisis factorial describe cada variable en t erminos de una combinaci on lineal de un peque no n umero de factores comunes no observables y un factor u nico para cada variable. Los factores comunes reejan la parte de la variabilidad quees compartida con las otras variables, mientras que el factor u nico expresa la variaci on que es exclusiva de esa variable.El objetivo es encontrar los factores comunes que recojan la m axima informaci on de las variables originales.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

INTRODUCCION.

ANALISIS DE CORRESPONDENCIAS En el caso m as sencillo, el an alisis de correspondencias est a dirigido al estudio de tablas de contingencia. El objetivo es encontrar la mejor representaci on simult anea de los dos conjuntos de datos contenidos en la tabla. ANALISIS DE CONGLOMERADOS El objetivo de esta metodolog a es identicar un n umero peque no de grupos en los cuales se pueden distribuir los individuos de manera que los elementosen cada grupo sean similares (cercanos) respecto de sus variables y muy diferentes (lejanos) de los elementos de otros grupos.
AL ANALISIS INTRODUCCION MULTIVARIADO

Vladimir Moreno G.Universidad Javeriana

INTRODUCCION.

ESCALAMIENTO MULTIDIMENSIONAL Con este m etodo se puede explorar e inferir criterios sobresalientes que la gente utiliza en la formaci on de percepciones acerca de la similitud y preferencias entre varios objetos. MODELOS LOG-LINEALES Permite investiar la interrelaci on entre variables categ oricas que forman una tabla de contingencias o de clasicaci on cruzada. Con este m etodo se expresan las probabilidades de las celdas en una tabla de contingencias m ultiple en t erminos de efectos principales para las variables de la tabla.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE VARIANZA.

ANOVA. En la investigaci on emp rica es muy frecuente que repitiendo un experimento en condiciones indistinguibles para el investigador, los resultados obtenidos presenten variabilidad (error experimental ). Si mediante experimentaci on ordenamos, por magnitud, los efectos de posibles ajustes para mejorar un proceso, existir an ciertas variables (factores) que producen cambios muy importantes en el resultado de dicho proceso que se denominan factores inuyentes, y que deben ser r apidamente identicados por el investigador y cuanticar el grado de su inuencia.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE VARIANZA.

Te oricamente es posible dividir la variabilidad del resultado en un experimento en dos partes: la originada por los factores que inuyen directamente en el resultado del experiment, estudiados en sus distintos niveles o tratamientos, y la producida por el resto de los factores con inuencia en el resultado del experimento, que es desconocida o no controlable (error experimental). La metodolog a ANOVA estudia c omo realizar comparaciones lo m as homog enas posibles, cone el prop osito de aumentar la probabilidad de detectar cambios o identicar factores o variables inuyentes en el proceso. Comprobar si un tratamiento mejora un proceso, requiere comparar los resultados antes y despu es de aplicarlo.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANOVA: EJEMPLO.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE CORRESPONDENCIAS.
El An alisis de Correspondencias es una t ecnica estad stica que se utiliza para analizar, desde un punto de vista gr aco, las relaciones de dependencia e independencia de un conjunto de variables categ oricas a partir de los datos de tablas de contingencia y construye un diagrama cartesiano basado en la asociaci on entre las variables analizadas. En dicho gr aco se representan conjuntamente las distintas modalidades de la tabla de contingencia, de forma que la proximidad entre los puntos representados est a relacionada con el nivel de asociaci on entre dichas modalidades. Mediante el an alisis de correspondencias se asocia a cada una de las modalidades de la tabla, un punto en el espacio RN , (habitualmente N = 2) de forma que las relaciones de cercan a/lejan a entre los puntos calculados reejen las relaciones de dependencia y semejanza existentes entre ellas.
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE CORRESPONDENCIAS.

En general es u til en grandes tablas de contingencias. Por ejemplo, si tenemos 25 especies de arboles y 40 bosques, y hemos hecho un recuento por muestreo entonces tendremos una tabla de contingencias con las especies (de arboles) por las y los bosques por columnas. Cada casilla de la tabla nos dar a la frecuencia relativa bidimensional para cada especie y bosque. El An alisis de Correspondencias nos permitir a representar las especies y los bosques en una misma gr aca, de manera que podamos asociar especies con perl de distribuci on similar, bosques anes, e identicar las especies caracter sticas de cada bosque.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE CORRESPONDENCIAS.
Sean X y Y dos variables categ oricas con valores {x1 , x2 , . . . xr }, {y1 , y2 , . . . ys }, se observan dichas variables en n elementos de una poblaci on obteni endose resultados que se resumen en una tabla como la siguiente: X/Y x1 ... xr Marginal Y y1 n1,1 ... nr,1 n .1 ... ... ... ... ... ys n1,s ... nr,s n.s Marginal X n1. ... nr. n

donde ni,j es el n umero de elementos de la muestra con X = xi y Y = yj . La tabla de frecuencias cruzadas recibe el nombre de Tabla de Correspondencias. La frecuencia ni. = s umero de casos con X = xi , y j =1 ni,j es el n recibe el nombre de Frecuencia Marginal de X . La frecuencia nj. = r umero de casos con Y = yj , y i=1 ni,j es el n recibe el nombre de Frecuencia Marginal de Y .
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE CORRESPONDENCIAS.

PERFIL DE FILAS Y DE COLUMNAS Cada la de la tabla establece un perl de la denido por su frecuencias. El perl de la la i esima es la proporci on de de cada n . categoria de la variable j en la la i: rij = ni,j .j Cada columna de la tabla establece un perl de columna denido por su frecuencias. El perl de la columna j esima es la proporci on de de cada n categoria de la variable i en la columna j : rij = ni,j . i.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE CORRESPONDENCIAS.
La mejor medida de distancia entre perles es la distanciadada por la distribuci on ji cuadrado, ya que esta distancia tiene la propiedad importante de equivalencia, seg un la cual si agregamos dos perles iguales, el perl agregado que sustituye a ambos conserva la distancia de los anteriores con cualquier otro perl, y no cambia ninguna otra distancia. Como la agregaci on de las y columnas es habitual en tablas de contingencias, esta propiedad adquiere una importancia escencial en el An alisis de Correspondencias. Por esta raz on se realizan algunas transformaciones simples en los datos para lograr esta distancia ji cuadrado. Por ejemplo la distancia ji cuadrado entre perles la es: d2 2 (ri , ri ) =
(rij ri ,ri )2 s j =1 n.j

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DE CORRESPONDENCIAS.

EJEMPLO En el archivo hormonas.sav hay datos de los niveles alto, medio y bajo de 4 clases de hormononas auxinas, acido absc sico, citoquininas y giberelina medida en 12 individuos de una especie vegetal que estaba en diferentes fases siol ogicas. Auxina con altas concentraciones es Au.A, Giberelina a bajas concentraciones es Gi.B, etc. OBJETIVO: Determinar el grado de asociaci on que existe entre las hormonas y la fase en la que se encuentra el individuo.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DISCRIMINANTE.

El An alisis Discriminante es una t ecnica estad stica multivariante cuya nalidad es analizar si existen diferencias signicativas entre grupos de objetos respecto a un conjunto de variables medidas sobre los mismos para, en el caso de que existan, explicar en qu e sentido se dan y proporcionar procedimientos de clasicaci on sistem atica de nuevas observaciones de origen desconocido en uno de los grupos analizados. El m etodo consiste en la determinaci on de unas funciones de las variables originales, llamadas funciones discriminantes, que permiten decidir en qu e clase debe estar cada elemento, utilizano como criterio de asignaci on la proximidad (o similitud) de cada elemento a las distintas clases o grupos existentes.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DISCRIMINANTE.

La construcci on de las funciones discriminantes, combinaciones lineales de las variables originales, se realiza buscando aquellas que hacen m axima la separaci on entre grupos, lo que equivale a minimizar la variabilidad dentro de las clases. Las funcioens obtenidas permiten discriminar de la mejor forma posible entre los elementos pertenecientes a las distintas clases o grupos. La asignaci on de los elementos a clases se realiza mediante el criterio de Bayes: Cada elemento se asigna a la clase para la que es mayor la probabilidad de pertenencia condicionada por los valores que toman las funciones discriminantes

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DISCRIMINANTE.
CONDICIONES Para que pueda usarse correctamente se requiere la hip otesis de homogeneidad de las varianzas, es decir, que la dispersi on sea similar en cada clase para todas las variables. Se emplea la prueba M de Box para contrastar esta hip otesis de homogeneidad. Es necesario que las funciones discriminantes tengan distribuci on Normal (aunque en muchos casos el m etodo funciona ante un cierto grado de incumplimiento de esta condici on). Para comprobar si el An alisis Discriminante es adecuado podemos utilizar la matriz de clasicaci on, que muestra el porcentaje de casos asignados correctamente en aquellos elementos de la muestra cuya clase es conocida. Es necesario que el porcentaje de acierto sea alto no solamente en el conjunto de los elementos,sino tambi en en cada uno de los grupos.
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS DISCRIMINANTE.

EJEMPLO En el archivo longitud peces.sav hay datos de medidas del cuerpo, estandarizas en funci on de la longitud est andar, de 7 especies de peces del g enero Haemulon. OBJETIVO: Determinar si en funci on de las medidas biom etricas es posible discriminar entre las especies.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.


El An alisis de Componentes Principales (ACP) es una t ecnica estad stica de s ntesis de la informaci on, o reducci on de la dimensi on (n umero de variables). Es decir, ante un conjunto de datos con muchas variables, el objetivo ser a reducirlas a un menor n umero perdiendo la menor cantidad de informaci on posible. Los nuevos componentes principales o factores ser an una combinaci on lineal de las variables originales, y adem as ser an independientes entre s . Un aspecto clave en ACP es la interpretaci on de los factores, ya que esta no viene dada a priori, sino que ser a deducida tras observar la relaci on de los factores con las variables iniciales (habr a, pues, que estudiar tanto el signo como la magnitud de las correlaciones). Esto no siempre es f acil, y ser a de vital importancia el conocimiento que el experto tenga sobre la materia de investigaci on.
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.

El ACP consiste en la transformaci on del conjunto de variables originales en otro conjunto de variables, Componentes Principales, obtenidas como combinaci on lineal de aquellas. Las nuevas variables, en igual n umero que las originales, conservan toda la informaci on (en lo quese reere a variabilidad del conjunto de elementos) de las variables primitivas, pero la mayor a de las componentes principales tienen una variabilidad tan peque na que pueden ignorarse, de tal manera que solo quedar an unas pocas componentes (generalmente 3 o menos) con las cuales sepodr an representar y explicar razonablemente el conjunto de elementos de la muestra sin p erdida importante de informaci on.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.


Fases de un an alisis de componentes principales An alisis de la matriz de correlaciones: Un an alisis de componentes principales tiene sentido si existen altas correlaciones entre las variables, ya que esto es indicativo de que existe informaci on redundante y, por tanto, pocos factores explicar an gran parte de la variabilidad total. Selecci on de los factores: La elecci on de los factores se realiza de tal forma que el primero recoja la mayor proporci on posible de la variabilidad original; el segundo factor debe recoger la m axima variabilidad posible no recogida por el primero, y as sucesivamente. Del total de factores se elegir an aqu ellos que recojan el porcentaje de variabilidad que se considere suciente. A estos se les denominar a componentes principales.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.

An alisis de la matriz factorial: Una vez seleccionados los componentes principales, se representan en forma de matriz. Cada elemento de esta representa los coecientes factoriales de las variables (las correlaciones entre las variables y los componentes principales). La matriz tendr a tantas columnas como componentes principales y tantas las como variables. Interpretaci on de los factores: Para que un factor sea f acilmente interpretable debe tener las siguientes caracter sticas:
a) Los coecientes factoriales deben ser pr oximos a 1. b) Una variable debe tener coecientes elevados s olo con un factor. c) No deben existir factores con coecientes similares.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.

La primera componente principal es la combinaci on lineal de las variables originales y que tiene m axima variana. La segunda componente principal es la combinaci on de lineal de las variables originales, con m axima varianza, y que resulte independiente (ortogonal) con la primera componente, y as sucesivamente se pueden obtener todas las componentes principales que no comparten informaci on por ser independientes (o no correlacionadas) Cada componente principal explica por lo tanto la m axima variabilidad residual (la que no han explicado las anteriores construidas)

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.

Para encontrar las combinaciones optimas de las variables originales se calcular los autovalores y autovectores de la matriz de covarianzas (o de la matriz de correlaciones). Los autovalores, ordenadosde mayor a menor, son las varianzas de las nuevas componentes, y los autovectores expresan las combinaciones lineales que denen las componentes principales. Debemos decidir cuantas componentes principales deben conservarse, un n umero alto de componentes principales peritir a explicar una mayor proporci on de la variabilidad total; un n umero bajo permite garantizar simplicidad en la representaci on gr aca. Veamos algunos criterios que resultan de u tilidad en la decisi on del n umero de componentes principales:

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.


Criterio de la varianza. Se seleccionan las componentes que exlican un porcentaje suciente de la varianza, por ejemplo un 80% o un 90%. Criterio de Kaiser. Se conservan las componentes cuyas varianzas (autovalores) son mayores que la varianza media. Graco de sedimentaci on (Scree plot). Representamos los autovalores, los cuales decrecen rapidamente y luego se estabiliza su maginitud, y conservamos unicamente las componentes principales cuyos valores propios se ubican por encima del codo de la curva. Dos componentes. Mantener solamente las dos primeras componentes. Esto permite construir un gr aco bidimensional para describir el conjunto de datos.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS COMPONENTES PRINCIPALES.

EJEMPLO En el archivo algas.sav hay datos del n umero de especies, de diferentes tipos de algas del loplancton, presentes en lagosde diferentes regiones geogr acas y en dos epoca distintas del a no. OBJETIVO. Determinar si es posible explicar la composici on de especies de toplancton con base a la regi on geogr aca y epoca del a no.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS FACTORIAL.
El An alisis Factorial es una t ecnica estad stica multivariante cuyo principal prop osito es sintetizar las interrelaciones observadas entre un conjunto de variables en una forma concisa y segura como una ayuda a la construcci on de nuevos conceptos y teor as. Para ello utiliza un conjunto de variables aleatorias inobservables, que llamaremos factores comunes, de forma que todas las covarianzas o correlaciones son explicadas por dichos factores y cualquier porci on de la varianza inexplicada por los factores comunes se asigna a t erminos de error residuales que llamaremos factores u nicos o espec cos. El An alisis Factorial puede ser exploratorio o conrmatorio.El an alisis exploratorio se caracteriza porque no se conocen a priori el n umero de factores y es en la aplicaci on emp rica donde se determina este n umero. Por el contrario, en el an alisis de tipo conrmatorio los factores est an jados a priori, utiliz andose contrastes de hip otesis para su corroboraci on.
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS FACTORIAL.
Sean X1 , X2 , . . . , Xp , las p variables objeto de an alisis que supondremos est an tipicadas. Si no lo estuvieran el an alisis se realizar a de forma similar pero la matriz utilizada para calcular los factores no ser a la matriz de correlaci on sino la de varianzas y covarianzas. El investigador mide estas variables sobre n individuos, obteni endose una matriz de datos como la siguiente: Sujetos/Variables 1 2 ... n X1 x1,1 x2,1 ... xn,1 ... ... ... ... ... Xp x1,p x2,p ... xn,p

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS FACTORIAL.

El modelo del An alisis Factorial viene dado habitualmente por un sistema de ecuaciones como el siguiente: X1 = a11 F1 +a12 F2 + . . . +a1k Fk +u1 X2 = a21 F2 +a22 F2 + . . . +a2k Fk +u2 ... ... ... ... ... ... Xp = ap1 Fp +ap2 Fp + . . . +apk Fk +up donde F1 , F2 , . . . , Fk , (k < p) son los factores comunes, y u1 , u2 , . . . , up son los factores u nicos o espec cos, y los coecientes aij , las cargas factoriales.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS FACTORIAL.

Se supone, adem as, que los factores comunes est an a su vez estandarizados: E [Fi ] = 0; V ar(Fi ) = 1, los factores espec cos tienen media 0 y est an incorrelacionados: E [ui ] = 0; Cov (ui , uj ) = 0, i = j , y que ambos tiposde factores est an incorrelacionados: Cov (Fi , uj ) = 0 Si adem as los factores est an incorrlacionados Cov (Fi , Fj ) = 0, i = j , estamos ante un modelo con factores ortogonales. Si no es el caso, de incorrelaci on, entonces el modelo se llama de factores oblicuos.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS FACTORIAL.
EJEMPLO En el archivo clientes.sav hay datos que corresponden a los clientes de un banco. Las 6 variables indican el nivel de ingresos, la relaci on (en porcentaje) entre deduas e ingresos, deudas con tarjetas de cr edito, deudas por hipoteca, deudas por autom ovil, y otras deudas. Supondremos que todas las variables del conjunto de datos, que est an relacionadas con el gasto y el endeudamiento, dependen de dos factores: 1) Capacidad de gasto (relacionado con nivel de ingresos, patrimonio, expectativas de futuro, disponibilidad de cr eito, etc.) 2) Sostenibilidad (prudencia, ajuste gasto/ingreso, solvencia, h abitos de ahorro, etc.)
Vladimir Moreno G.Universidad Javeriana AL ANALISIS INTRODUCCION MULTIVARIADO

ANALISIS FACTORIAL.
Todos los clientes que forman la muestra tienen un factor de capacidad de gasto, mayor o menor, dicil de cuanticar o de medir pero real, que incide en todas las variables nancieras que s podemos medir; y tambi en cada uno de estos clientes tiene un factor de sostenibilidad relacionado con sus h abitos de gasto y con su forma de tomar decisiones en el ambito nanciero. Se espera que los clientes con mayor capacidad de gasto tengan m as deudas de todo tipo y viceversa; y tambi en que los clientes m as prudentes tengan menos deudas. Estos dos factores podr an explicar razonablemente la correlaci on observada entre las distintas variables. OBJETIVO. Comprobar si este modelo responde razonablemente a la realidad y es, por lo tanot, adecuado para explicar nuestros datos.

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

BIBLIOGRAF IA.

[1] [Diaz Guillermo, Morales Mario, An alisis estad stico de datos multivariados, Colecci on textos, Universidad Nacional de Colombia, 2012]. [2] [Pe na Daniel, An alisis de datos multivariantes, McGraw-Hill, 2002]. [3] [Rencher Alvin, Methods of Multivariate Analysis, Second edition, John Wiley and Sons, Inc., 2002].

Vladimir Moreno G.Universidad Javeriana

AL ANALISIS INTRODUCCION MULTIVARIADO

You might also like