You are on page 1of 26

Anlisis discriminante.

Es una generalizacin de la regresin logstica


Es un mtodo que permite clasificar nuevos individuos en grupos apriorimente
formados.
Ejemplo
Iris.
X1 largo de sepalos
X2 ancho de sepalos
X3 largo de petalos
Grupo :

setosa
Versicolor
Virginca

x3 x1 x2 x3
r
uur
G1 x ~ N p U1 , 1
r
uur
G2 x ~ N p U 2 , 2
r
uur
G3 x ~ N p U 3 , 3

Si
1

1 2 3

, la funcin discrimnate es lineal

Prueba de igualdad de medias


X1 longitud de sepalo

H 0 : U G1 U G2 U G3
H a : U Gi U G j

P=sig=0,000<0.05 se acepta Ha
Prueba de igualdad de medias
X2 ancho de sepalo

H 0 : U G1 U G2 U G3
H a : U Gi U G j

P=sig=0,000<0.05 se acepta Ha
Prueba de igualdad de medias
X3 largo de petalos

H 0 : U G1 U G2 U G3
H a : U Gi U G j
P=sig=0,000<0.05 se acepta Ha
Graf
A menor valor de lambda de wilks (lambda cercano a cero) mayor poder
discriminante.
Lambda de wilks de x3 es menor que las dems variables entonces x3 presenta
mayor discriminante.
A mayor F mayor poder discriminate

Prueba de M de box
qu funcin discriminante es la ms adecuada?

H 0 : 1 2 3

discri min ante lineal

H a : i j

discri min ante no lineal

P=sig=0.000<0.05 se acepta Ha

F1 es la ms adecuada

f1 0.633 x1 0.33 x2 1.399 x3


f 2 0.33 x1 1.046 x2 0.283 x3
Estn en su propia escala

Tiene una escala tipificada (estandarizada)


Centroides

x1

x2

x3

f1 6.7 1.79 4.99

f 2 0.16 0.6 0.45


Funcin discriminante cannica

f1cannica 1.229 x1 0.971x2 3.251x3 2.066


f 2cannica 0.64 x1 3.079 x2 0.658 x3 8.146

Reemplazando medias para setosa, versicolor y virginica en la funcin cannica


Setosa

f1cannica 6.7

f 2cannica 0.16
Versicolor
virginica

Ejemplo:
X1=5.4
X2=3.9
X3=1.7

f1cannica 1.229 x1 0.971x2 3.251x3 2.066


f 2cannica 0.64 x1 3.079 x2 0.658 x3 8.146
f1cannica 6.96
f 2cannica 1.52

Se nota q f1 discrimina mejor


q f2 por otro lado entre
versicolor y virginica se puede
tener error

Anlisis de clster
Tcnica multivariado para agrupar eltos con caractersticas similares (estratos,
segmentos, clases, taxonoma,)
Agrupan casos(sujetos, pases, plantas,)
Grupo homogneomnima distancia (variables cuantitativas).
mxima similitud (variables cualitativa).
Agrupamiento de Variables.

Si corr ( xi ; x j ) 1

Para formar grupos homogneos


Existen dos mtodos de clster:
jerrquicos (se desconoce el nmero de grupos a formar)
Mtodos:
Aglomerativos: Todos los sujetos son grupos diferentes y luego se agrupan de
acuerdo con sus similitudes.
Mtodo de vecino ms cercano, vecino ms lejano,

Disociativos: se asume al inicio como un solo grupo y paso a paso se extrae los
sujetos con caractersticas diferentes
Mtodo ward
no jerrquicos (se conoce de antemano el nmero de grupos a establecer).
Mtodo K-medias.
Ejemplo supongamos que se ha evaluado las competencias acadmicas de 5
docentes en los siguientes indicadores

x1 : conocimiento
x2 : metodo log a
x3 : uso de tics
x4 : relacin docente alumno
profes
or
A

X1

X2

X3

X4

C
D
E
Sup la sigte matrz de distancias
A
B
C
D
A
0
B
9
0
D=
C
3
7
0
D
6
5
9
0
E
11
10
2
8

Utilizando el mtodo jerrquico de vecino ms cercano.


d(E,C)=2 forman el primer clster.
A
B
EC
D
A
0
B
9
0
D1= EC
3
7
0
D
6
5
8
0

d EC , A Min d ( E , A);d(C, A) min 11,3 3


d EC , B Min d ( E , B);d(C, B) min 10, 7 7
d EC , D Min d ( E , D );d(C, D) min 8,9 8
PASO 2 EC y A
A
A(EC) 0
D2= B
9

B
0

d A EC , B Min d ( A, B );d(EC, B ) min 9, 7 8


d D, A EC Min d ( D, A);d(D, EC) min 6,8 6

PASO 3 D y B
A
D3= A(EC) 0
BD

BD
0

d A EC , DB Min d ( A EC , D );d( A EC , B )

Dendograma

Ejemplo con spss mundo2.sav


Clster jerrquico

Los pases son casos

Y aceptar
Cluster

Se ven 3 grupos
Ahora de nuevo sabiendo el nmero de grupos

Continuar y aceptar

Vemos si las variables sirven para discriminar

Var: Averange linkage


Rango: min=1 y max=3
Pasamos la varialbles seleccionadas.
Cont y aceptar

De acuerdo a la significancia se ve que se pueden quitar 3 variables que no son


necesarias.
Mejorando
Ana-clas-cluste je
Eliminamos pobl, ingesta, natalidad.
Se repite todo
En mtodo vecino ms cercano

Ejemplo spss 2: distritos peruanos.sav


(si las variables dan la misma informacin osea presentan relacin entre variables
se agrupan usando un anlisis factorial)
1 generamos nuevas variables independientes. (Ana Fact)
En otro caso donde se aplica primero ana fact cuando p>o =30

Pasamos todas las variables cuantitativas

Cont y aceptar

Se encuentran 3 nuevas variables


Ana-class-cluster j.

Aceptar

Ana-clas-cl j

Datos-ordenar

Las variables cualitativas se usan para el clster con los factores hallados
Ana-clas-clu j

En los casos de muchas variables se recomienda el mtodo de Ward


Las variabales puede ser correlaciones, coseno, ..

Las dos primeras para casos


Las dos siguientes variables cuantitativas
Casos o var cualitativas : chebychev y minkowski

Anlisis de clster no jerrquico


El nmero de clster est definido a priori K=5
Tcnica K-medias

Correlacin cannica: analiza la relacin entre factores


Se tiene:

x1 , x2 ,..., x p
var independiente

var dependiente

x1 : gnero 0,1

x2 : edadCategrica 1,5

x3 : FrecuenciaCompra 0, 4
x4 : motivo principal 1, 4
x5 : motivo comun 1, 4

x6 : area principal 1, 7
x7 : 0,1

x8 : met pago 1,5


x10 : dis tan cia 1, 7

(factores)

existe relacin?

y1 , y2 ,..., y p

x9 : 1,5

F1 , F2 ,..., Fk

C1 , C2 ,..., Cm

(factores)

y13 : satis precio 1,5

y14 : satis var iedad 1,5


y15 : satis orga 1,5
y16 : satis serv 1,5
y17 : satis cal 1,5

Satisf.sav
Se selecciona de acuerdo a las variables

Definir

Pasamos las Y y definimos rangos

Sig
Pasamos las X y definimos rango de cada una de ellas

Opciones

Cont-aceptar

1.347 el modelo es adecuado (mximo es 2 por en nmero de dimensiones)

La suma mide la importancia a mayor suma mayor importancia

Relacin entre variables


Correlacin mltiple:

Datos-ponderar casos-mediante-frecuencia (aceptar)


Ana-reduccin de dimensin escalonamiento

You might also like