You are on page 1of 21

ANÁLISIS DE

CORRESPONDENCIAS
SIMPLES
Integrantes:
Laura Marín
Camila Reina
Laura Silva
Carlos Villegas
¿Qué es? Es una técnica descriptiva
o exploratoria cuyo objetivo
es resumir una gran
cantidad de datos en un
número reducido de
dimensiones, con la menor
pérdida de información
posible.
Condiciones de aplicación
• Variables cualitativas (nominales / ordinales)
• Variables escalares si se recodifican en variables ordinales
• Mínimo categorías = 3
Métrica
variables
• Variables asociadas ( verificar a través de chi2)
• Es recomendable diferenciar entre variable independiente y
dependiente
Relación entre
variables
• Tamaño pequeños y grandes.
• Mínimo muestral = Verificar condiciones aplicación chi2 (menos de
un 20% de celdas esperadas con frecuencia menor a 5 / es esperable
Tamaño que no existan celdas con valor 0)
muestral
Características

Se utiliza a menudo en la
Implican el tratamiento de tablas
representación de datos que se
de proximidad o distancia entre
pueden presentar en forma de
elementos, y tablas de
tablas de contingencia de dos
preferencias.
variables nominales u ordinales.
Objetivos de la técnica
Perspectiva Estadística Perspectiva Teórica

• Simplificar la información contenida en • Profundizar en el análisis de la


una tabla de contingencia, sobre la asociación entre 2 variables
asociación entre variables. cualitativas.

• Generar ejes/ factores explicativos que • Análizar la estructura de relación


resuman la información del conjunto de entre categorías de variables
variables y categorías.
asociadas.
• Posicionar las categorías de las
variables en un mapa que de cuenta de la • Identificar dimensiones que
inercia entre estas (distancia/dispersión). representen esquemas conceptuales
de análisis.
Puntuaciones Categorías = Cálculo Perfiles
• La asignación de puntuaciones a
las categorías de las variables se
realiza a partir del cálculo de los
perfiles fila y columna.

• Consiste en dividir el valor de


cada celda interna de la tabla por
su marginal fila o columna, según
sea el perfil que se está
calculando.

• Se obtienen 2 tablas de perfiles.


Estos valores corresponden a las
coordenadas iniciales de ubicación
de las categorías
Representación gráfica perfiles fila

• A partir de las tablas de


frecuencias relativas(perfiles)
es posible establecer
coordenadas de puntos y
medir la distancia entre ellos.

• En la representación gráfica
de los perfiles fila, las
categorías de las variables
columna pasan a ser los ejes
de un mapa multidimensional
donde las categorías fila son
posicionadas
Representación gráfica perfiles fila

• El mapa tridimensional se puede transformar en un plano en el


que los ejes iniciales forman una figura bidimensional. Esto se
realiza con el fin de simplificar la representación gráfica del
posicionamiento de las categorías.

• En el caso del ejemplo la figura asume la forma de un triángulo

• El centroide de esta representación corresponde al valor


promedio de los perfiles
Inercia del modelo
• La inercia corresponde a la dispersión de las categorías del
modelo y es medida en términos de distancia.

• La distancia de Benzecri es la medida más común


utilizada para medir la inercia y corresponde a la sumatoria de
las diferencias de las frecuencias relativas respecto al
centroide, dividida por el número total de puntos (categorías).
Se calcula en función de los perfiles filas y columnas.
Se denomina también distancia chi2.

• La inercia total permite evaluar la dispersión de la nube de


puntos respecto del centroide general, por ende es la suma
de las inercias fila y columna dividida por el número total
de categorías.

• Geométricamente la inercia mide lo lejos/cerca que se


encuentran los perfiles fila/columna de su perfil medio, el cual
simboliza la hipótesis de homogeneidad.
Cálculo de Ejes (Factores)
● Punto de origen de los ejes corresponde al centroide de
la nube de puntos.
● Los ejes se obtienen bajo el criterio de maximizar la
explicación de dispersión de las categorías en el mapa.
● Los ejes se obtienen en forma jerárquica en función de
la proporción de inercia total que logran explicar.
● Los ejes se interpretan como factores y son
independientes (ortogonales) entre sí.
● El número de ejes a obtener corresponden al número
mínimo de categorías menos 1.
● El mapa se construye a partir de los 2 primeros ejes
más explicativos.
● Los ejes se trazan buscando representar la inercia del
modelo, la idea es que mediante su trazado no se
modifique la posición de los puntos, que no se altere la
dispersión entre ellos.
Normalización

Es el proceso mediante Este proceso No Mediante la


el cual se distribuye la altera la solución normalización se
inercia del modelo en
las filas y/o columnas,
inicial de trazado de simplifica la lectura
optimizando la distancia ejes, solo afecta las del mapa y su
entre las categorías puntuaciones interpretación
Interpretación
• Se interpretan como coeficientes de correlación, miden la
Valores propios de relación entre puntuaciones filas y columnas.
• El valor propio al cuadrado corresponde a la inercia explicada por
los ejes cada eje, la que luego se traduce en % de inercia explicada

• Dan cuenta de la importancia de las categorías en los


Contribución factores
puntuosa a inercia • Permiten interpretarlos y denominarlos
de ejes

• Puntos cercanos indican relación entre categorías


Distancia entre • Puntos cercanos al centroide del mapa indican nula
asociación o variabilidad
puntos del mapa
Dependencia e independencia en tablas
de contingencia
El análisis clásico de la posible relación entre las variables cualitativas se
realiza mediante una prueba de hipótesis nula. La H0: establece que las
variables son independientes, La H1: establece que las variables son
dependientes. El estadístico de contraste es:

Donde nob son las frecuencias absolutas y nesp las esperadas bajo la Ho.
Las frecuencias esperadas se obtienen de la siguiente manera:

El estadístico de contraste se distribuye con (I-


1)x(J-1) grados de libertad y se rechaza la hipótesis
nula si P< α. Los residuos tipificados corregidos
se calculan con la expresión
Pasos

PASO 1:
Realizar la tabla de contingencia y frecuencia relativa
PASO 2:
Elaborar la tabla de perfiles fila y columna
PASO 3:
Calcular Test de Independencia. Hallar la Prueba de Hipótesis,
luego identificar la variable j e i
Distancia
A la tabla (matriz) de perfiles-fila la denotamos como F. A la tabla (matriz) de perfiles-
columna la denotamos como C. Las filas de F pueden considerarse como puntos en el
espacio de las columnas (R J). De la misma manera las columnas de C pueden considerarse
como puntos en el espacio de las filas (RI). Para medir la distancia entre los puntos
representados indistintamente en el espacio R J o RI se utiliza la distancia X^2..
Ejemplo

1. Tabla de
contingencia

2. Calcular la distancia

3. El resultado ubicarlo dentro de la


matriz
Práctica en R-studio y R-commander

Nota:
● Instalar el paquete para R-Commander: “ca”
● Instalar el paquete para R-Studio: “stats”

You might also like