Professional Documents
Culture Documents
ESTUDIO DE TCNICAS DE
RECONOCIMIENTO FACIAL
Pgina 2
Agradecimientos
Me gustara agradecer a mi familia y mi
pareja el apoyo que me han dado durante
todos estos aos, al Dr. Ramon Morros sus
consejos
guiado
durante
todo
este
Pgina 3
Pgina 4
0 ndice
0
NDICE ........................................................................................................ 5
INTRODUCCIN ........................................................................................ 7
2.2
3.2
PCA.................................................................................................... 33
DCT.................................................................................................... 34
3.3.1 Reconocimiento.............................................................................. 35
3.4
LPP .................................................................................................... 36
4.2
4.3
4.4
RESULTADOS ......................................................................................... 45
5.1
5.2
Pgina 5
5.3
5.3.1 Normalizacin................................................................................. 53
5.3.2 Descarte de coeficientes ................................................................ 55
5.4
5.5
5.6
BIBLIOGRAFA ........................................................................................ 83
Pgina 6
1 Introduccin
Pgina 7
Descripcin
del proyecto
Manchester,
NH. Visaje
Cognitec,
'Smart Gate'
Aeropuerto de
Sydney
Sector
vertical
viajes y
transportes
Sector
Horizontal
Vigilancia/Seguimi
ento
Descripcin
aplicacin
Cognitec
viajes y
transportes
ACC/T&A
Acceso
US-YA
Identix
Aplicacin
Ley
Identificacin
Criminal
Vigilancia
Aeropuerto de
Berln
Germany
ZN
viajes y
transportes
ACC/T&A
Acceso
Programa
VISA de
diversidad
US-MA
Viisage
Gobierno
Identificacin civil
Identificacin
CODL
US-CO
Identix
Gobierno
Identificacin civil
DL
Caras
aeropuerto
Zurich
Suiza
C-VIS
viajes y
transportes
Vigilancia/Seguimi
ento
Seguimiento
Departamento
de polica de
Brentwood
US-CA
Imagis
Cumplimient
o Ley
Identificacin
Criminal
Forense
Situacin
Empresa
US-NH
Viisage
Australia
Vigilancia
playa de
Virginia
Seguimiento
Descripcin
adicional
4th US solucin
para aeropuerto
Basado en
lectura de
pasaporte
Base de datos
de 600
imgenes, 10
sujetos
Terminal de
reconocimiento
facial, muestra
guardada en CS
Imagen a la vez
que se
introduce la
tarjeta y
prevenir 2x
aplic. tarjeta y
prevenir 2x
aplic.
Deteccin de
inscripcin
duplicada
Sistema de la
polica de
Zurich, usado
para encontrar
inmigrantes
ilegales de
S.Africa, Asia y
P.Este
Sistema
integrado con la
base de datos
del servicio 911
Figura 1. Desglose del porcentaje que ocupa cada tcnica biomtrica dentro del mercado.
Pgina 8
tener
en
cuenta
analizar
muchas
caractersticas.
Estas
caractersticas pueden ser tanto fsicas, como sera el caso de las pupilas, la
cara, el iris, etc., o se puede tratar de caractersticas psicolgicas como seran
los gestos. Todas estas propiedades, presentan sus propias peculiaridades, las
cuales pueden ser analizadas siguiendo entre otros, los siguientes criterios:
Pgina 9
Ruido.
Expresin facial.
Vello facial.
Envejecimiento.
Pgina 10
Figura 5. Ejemplo de 10 imgenes de un individuo de la base de datos Yale [7] con diferente
iluminacin, expresin y postura.
Pgina 11
Pgina 12
Pgina 13
Pgina 14
Pgina 15
Por otro lado estn los sistemas basados en modelos (figura 9), los cuales
intentan construir un modelo lo ms descriptivo posible de la cara humana
capaz de detectar con precisin las variaciones faciales.
Figura 10. Deteccin de la posicin y distancia de los ojos a travs del mtodo de convolucin
Ventajas:
o Ms rpidos.
Pgina 16
Inconvenientes:
o Ms afectados por cambios en la orientacin o expresin de la
cara.
o Ms dificultades frente a cambios en la iluminacin.
Imgenes
de entrada
Preprocesado
imgenes
Proyeccin de
las imgenes
Decisin
Resultado
Base de datos
de referencia
Pgina 17
Los pasos que se llevan a cabo para este reconocimiento, sin tener en cuenta
el preprocesado previo de las imgenes, son los que se detallan a continuacin
[34]:
Figura 12. Esquema de proyeccin de una imagen de referencia al nuevo subespacio [34].
Pgina 18
Pgina 19
Pgina 20
ejes del subespacio donde proyectaremos las imgenes de caras humanas los
cuales se corresponden con las direcciones de mxima varianza de los datos.
La
matriz
de
transformacin,
esta
formada
por
los
autovectores
Figura 17. Cara media de los 7 primeros autovectores (Obtenidos de la base de datos de caras
ORL [18]).
Otra de las cualidades de PCA, es que realiza una discriminacin entre clases,
es decir, todas las caras correspondientes a un mismo individuo estn cerca
entre si, mientras que las imgenes correspondientes a individuos diferentes
estn ms alejadas. Esta propiedad es ms destacable en las primeras
componentes de las imgenes proyectadas. En la figura 19 se muestra un
Pgina 21
Pgina 22
(2)
SW = ( xi c ) ( xi c )T
c
ic
c =
x=
1
xi
N c ic
(3)
1
1
xi = N c c
N i
N c
Pgina 23
Pgina 24
Figura 22. En esta imagen podemos ver como a diferencia de PCA, en LPP se conserva la
estructura local de los datos.
Pgina 25
LPP es un mtodo lineal, lo que hace que sea rpido y conveniente para
aplicaciones prcticas.
LPP esta definida para todos los casos, a diferencia de las tcnicas de
reduccin no lineales que solo estn definidos para el conjunto de datos
de entrenamiento, de manera que al tener un nuevo dato LPP es capaz
de representarlo en el nuevo subespacio sin tener que recalcularse las
matrices de proyeccin.
Figura 23. Representacin de la estructura de los datos en el nuevo subespacio. Este ejemplo
esta formado por 5 personas y cuatro imgenes por persona.
Pgina 26
2 N
2 M
(4)
0 k1 N 1
0 k2 M 1
(0) =
1
,
N M
( k1 ) =
2
, (k 2 ) =
N
2
M
1 k1 N 1, 1 k2 M 1
(5)
1
NM
c(k,) =
(6)
2 2 ( 2n+1) k1 ( 2m+1) k2
cos
cos
N M 2 N 2M
De esta manera se puede tratar este algoritmo del mismo modo que PCA o
LPP, es decir, como un sistema que tiene una matriz de proyeccin (en este
Pgina 27
caso nica para cada imagen) gracias a la cual se puede proyectar las
imgenes a un subespacio de baja dimensionalidad de igual modo que se hace
en PCA (figura 15).
c(0)
Imagen
8
pxeles
c(0)
c(1)
8
pxeles
d
elementos
c(n)
c(0)
c(n)
c(d)
Este sistema hace uso parcial de los sistemas basados en modelos porque
requiere de la localizacin de alguna caracterstica facial. En este caso para el
buen funcionamiento del sistema se necesita que las imgenes estn
recortadas y totalmente alineadas [12]. Por esta razn previamente a aplicar el
algoritmo, se debe detectar la posicin de los ojos y alinear la imagen segn un
criterio (figura 25). En caso de que no se realice esta alineacin previa de las
imgenes, el sistema no funcionar correctamente. En la figura 26 se puede
ver el efecto causado al no realizar una correcta alineacin de las caras.
Pgina 28
Figura 25. Alineacin de las caras usando DCT por bloques [12].
Pgina 29
Pgina 30
Imgenes de
test
Preprocesado
imgenes
Imgenes de
entrenamiento
Imgenes de
referencia
Preprocesado
imgenes
Mtodo de
clasificacin
Entrenamiento
del sistema *
Decisin
Resultado
Mtodo de
clasificacin
Pgina 31
(7)
Pgina 32
3.2 PCA
PCA es un proceso que permite realizar una reduccin dimensional, de manera
que nuestro anlisis se reduce a unas pocas componentes. Para ello se
necesita tener la matriz de proyeccin PCA. A continuacin se detallarn los
pasos a seguir para preparar esta matriz y el procedimiento a seguir para el
reconocimiento.
= xi
(8)
i =1
ST = ( xi ) ( xi )T
(9)
i =1
Pgina 33
(10)
3.2.2 Reconocimiento
Cuando se tiene una nueva imagen de test en el sistema, el procedimiento que
se realiza es el siguiente:
Una vez realizados estos tres pasos la imagen est lista para ser proyectada al
nuevo subespacio. En este procedimiento toda imagen de entrada al sistema x
(imagen facial), es proyectada al subespacio caras por el mtodo de PCA, tal
como hemos visto en la ecuacin 7, donde W es la matriz de proyeccin PCA,
y es la imagen proyectada en el nuevo subespacio de baja dimensionalidad y x
es la imagen de entrada. Despus de realizar esta proyeccin, el vector
(imagen) n-dimensional de entrada se reducir a un vector d-dimensional en el
subespacio caras (figura 15). Este nuevo tamao del vector depender del
nmero de componentes principales que se utilicen.
3.3 DCT
DCT puede ser utilizada como otro sistema de clasificacin basado en la
apariencia, aunque en este caso la matriz de transformacin es fija e
independiente de la imagen. A diferencia de PCA, este mtodo no necesita de
un entrenamiento previo del sistema con otras imgenes.
Pgina 34
3.3.1 Reconocimiento
Cuando el sistema recibe una nueva imagen de test se realizan los siguientes
pasos para llevar a cabo el reconocimiento:
Pgina 35
3.4 LPP
Este mtodo realiza una reduccin dimensional y requiere, como PCA, de un
entrenamiento previo del sistema con otras imgenes de caras para crear una
matriz de proyeccin.
1) Se preprocesan las imgenes del mismo modo que se hace para PCA en la
etapa de reconocimiento (pasos 1, 2 y 3 del captulo 3.2.2).
2) Se proyectan las imgenes haciendo uso de la matriz de proyeccin PCA
para evitar las matrices singulares.
3) Una vez se tienen proyectadas las imgenes mediante PCA, se construye
un grafo de adyacencia. Este grafo se forma de manera que las imgenes
consideradas como vecinas tienen un conector entre ellas. Se pueden
diferenciar dos casos:
a. -neighborhoods. (El parmetro pertenece a R) Los nodos i y j
estn conectados si ||xi xj||2 < , donde la norma es la norma
Eucldea usual en Rn.
b. K-nearest neighbors. (k pertenece a N). Los nodos i y j estn
conectados entre si en el caso en que i sea de los k vecinos ms
cercanos a j o j sea de los k vecinos ms cercanos de i.
Pgina 36
4) Escoger los pesos. Hay 2 mtodos para asignar estos pesos. La matriz que
se crea, W, es una matriz simtrica de d x d elementos que tendr un valor,
dependiendo del mtodo que se utilice, si hay una conexin entre los
elementos i y j en el grafo de adyacencia o cero en caso de no conexin.
Los mtodos que se usan son:
xi x j
(11)
X1 X2 X3 X4 X5 X6 X7 X8 X9
Distribucin de las
imgenes (K = 3)
X3
X4
X1
X2
X7
X6
X5
0 X1
0 X2
0 X3
0 1
1Simtrica
0
0 X4
1 X5
1 X6
X8
X9
0
0
0
0 X7
0
0
1 X8
0 X9
* Pesos Simple-minded
Figura 30. Ejemplo de matriz de pesos utilizando mtodo Simple-minded.
Pgina 37
(12)
L = D W
(13)
X L X T a = X D XT a
(14)
A = (a0 , a1 , , al 1 )
(15)
Pgina 38
3.4.2 Reconocimiento
Para realizar el reconocimiento de imgenes con LPP se realizan unos pasos
muy parecidos a los que se siguen con el mtodo PCA. Para una nueva
imagen de test en el sistema el procedimiento a seguir es el siguiente:
y = WPCA i ALPP
) x
T
(16)
Pgina 39
Pgina 40
4 Bases de datos
Pgina 41
Pgina 42
Como es posible observar en la figura 33 y 34, todas las imgenes han sido
previamente convertidas a escala de grises y recortadas de modo que las
imgenes solo contengan la cara.
Pgina 43
Pgina 44
5 Resultados
Del mismo modo que sern evaluadas diferentes bases de datos, se tendr en
cuenta la capacidad de las diferentes tcnicas que hacen uso de matrices de
proyeccin para funcionar con unos buenos resultados si se utilizan matrices
creadas con imgenes diferentes a las que se utilizaran para el reconocimiento.
Durante los siguientes resultados y para el caso concreto del mtodo LPP, se
va a utilizar la siguiente configuracin ya que los resultados aunque son
bastante similares para todos los casos, son levemente mejores utilizando
estos parmetros (figura 36):
Pgina 45
Para este experimento se har uso de las bases de datos XM2VTS y BANCA
Controlled ya que se trata de conjuntos de imgenes tomadas bajo unas
condiciones de iluminacin y fondo controladas a la vez que presentan
pequeas variaciones en cuanto a la posicin de la cara y las expresiones
faciales se refiere.
Pgina 46
Distancia Eucldea.
Para el caso de utilizar las imgenes XM2VTS, los resultados se pueden ver en
la figura 38. Como se puede observar, la tasa de identificacin correcta es muy
inferior a la obtenida para el caso anterior. Esto es debido en gran medida a
que el experimento es ms complejo para el sistema ya que se tienen muchos
ms individuos tanto en el set de referencia como en el de test y adems ahora
Pgina 47
Figura 37. Tasa de identificacin correcta para la base de datos BANCA Controlled
Nuevamente
LPP
ofrece
unos
mejores
resultados
para
nmero
de
componentes bajo mientras que los otros dos mtodos mejoran cuantas ms
Pgina 48
Nmero de componentes
max. Rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
44
100
100% (55)
DCT
29
99,9182
99.8365% (80)
LPP
23
99,8365
99.6729% (40)
Nmero de componentes
max. Rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
XM2VTS
Mtodo
PCA
97
45,4237
43.7288% (55)
DCT
100
45,2542
41.8644% (80)
LPP
49
48,6441
47.9661% (40)
Los parmetros del sistema que se van a utilizar son los siguientes
Pgina 49
Distancia Eucldea.
Como es posible observar en las figuras 39a, 39b, 39c y 39d, la tasa de
identificacin correcta mejora a medida que se utilizan menos individuos para el
reconocimiento obteniendo su mejor rendimiento para 50 individuos. De este
modo se verifica la conclusin del apartado anterior donde se dijo que el
funcionamiento del sistema mejora cuanto mayor es el ratio entre nmero de
imgenes y el nmero de sujetos en las imgenes de referencia. Con esto se
obtiene que cuando se haga uso de muchos individuos en el set de referencia
el sistema requerir muchas imgenes por cada uno de ellos, de no ser as el
rendimiento se ver afectado.
Pgina 50
Los resultados obtenidos son parecidos a los del apartado anterior, es decir,
LPP obtiene una tasa de identificacin mayor para un nmero de componentes
bajo y a partir de un cierto punto se ve superado por los otros mtodos.
XM2VTS 50 individuos
Mtodo
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. rendimiento
reconocimiento (%) (Nmero componentes)
PCA
73
68,6275
63.72.55% (55)
DCT
94
68,6275
64.7059% (80)
LPP
57
70,5882
65.6863% (40)
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. rendimiento
reconocimiento (%) (Nmero componentes)
PCA
94
61
56% (55)
DCT
78
61,5
60.5% (80)
LPP
43
65,5
62.5% (40)
Tabla 3.1. Detalle de resultados Captulo 5.2. En la primera columna: nmero de componentes
mxima tasa de identificacin, segunda columna: mxima tasa de identificacin, tercera
columna: tasa de identificacin para el nmero de componentes elegido para el caso general.
Pgina 51
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. rendimiento
reconocimiento (%) (Nmero componentes)
PCA
89
51,75
50% (55)
DCT
100
53,25
49.75% (80)
LPP
43
55,75
53.5% (40)
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. rendimiento
reconocimiento (%) (Nmero componentes)
PCA
97
45,4237
43.7288% (55)
DCT
100
45,2542
41.8644% (80)
LPP
49
48,6441
47.9661% (40)
Tabla 3.2. Detalle de resultados Captulo 5.2. En la primera columna: nmero de componentes
mxima tasa de identificacin, segunda columna: mxima tasa de identificacin, tercera
columna: tasa de identificacin para el nmero de componentes elegido para el caso general.
Pgina 52
5.3.1 Normalizacin
El procedimiento consiste en normalizar las imgenes en la etapa de
preprocesado de modo que se atenen los efectos de los cambios de
iluminacin. Este preprocesado se ha explicado en los captulos 3.2 y 3.4.
Distancia Eucldea.
Los resultados obtenidos, para cambios de iluminacin uniformes, son los que
se pueden ver en la figura 40, donde se puede observar que aunque se estn
usando imgenes tomadas en un entorno no controlado, la tasa de
identificacin correcta es muy elevada. Las razones por las que se tiene un
rendimiento tan alto del sistema, son varias.
En primer lugar, est el hecho de que nuevamente, igual que con BANCA
Controlled, se utilizan muchas imgenes de referencia para cada individuo
haciendo as ms fcil para el sistema el reconocimiento.
Pgina 53
En tercer y ltimo lugar, se debe tener en cuenta que las imgenes utilizadas
son de buena calidad y con pocos cambios de expresin y posicin facial a
pesar de ser tomadas en un entorno no controlado.
Los resultados obtenidos para todos los mtodos son parecidos y ninguno
destaca sobre los dems.
Figura 40. Tasa de identificacin correcta para el caso de cambios de iluminacin uniformes
utilizando normalizacin.
Pgina 54
Figura 41. Tasa de identificacin correcta para el caso de cambios de iluminacin no uniformes
utilizando normalizacin.
BANCA Degraded
Mtodo
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
65
96,3731
96.0276% (55)
DCT
100
96,7185
96.5458% (80)
LPP
73
95,6822
95.1641% (40)
Mtodo
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
14
84.4444
80% (55)
YALE
DCT
29
84.4444
80% (80)
LPP
17
86.6667
77.7778% (40)
Pgina 55
resultados utilizando DCT son los mismos que en el caso de normalizar las
imgenes ya que en DCT siempre se descarta el primer coeficiente en lugar de
hacer una normalizacin. Los parmetros utilizados son:
Distancia Eucldea.
Pgina 56
Como conclusin de este apartado se puede decir que el mtodo con el que
funciona mejor esta tcnica es con DCT, mientras que para el caso LPP este
procedimiento afecta de manera muy negativa en los resultados sobretodo si
descartamos ms de 1 coeficiente.
Figura 42. Tasa de identificacin correcta para el caso de cambios de iluminacin uniformes
descartando coeficientes.
Figura 43. Tasa de identificacin correcta para el caso de cambios de iluminacin no uniformes
descartando coeficientes.
Pgina 57
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. Rendimiento
reconocimiento (%) (Nmero componentes)
PCA
61
95,8549
95.6822% (55)
DCT
100
96,7185
96.5458% (80)
LPP
32
95,5959
95.3368% (40)
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. Rendimiento
reconocimiento (%) (Nmero componentes)
56
95,8622
95.5959% (55)
DCT
92
96,4594
96.2867% (80)
LPP
31
95,4231
94.9914% (40)
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. Rendimiento
reconocimiento (%) (Nmero componentes)
PCA
61
95,5095
95.4231% (55)
DCT
55
96,3731
96.1140% (80)
LPP
71
95,1641
94.5596% (40)
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. Rendimiento
reconocimiento (%) (Nmero componentes)
PCA
15
82.2222
80% (55)
DCT
29
84.4444
80% (80)
LPP
16
88.8889
73.333% (40)
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. Rendimiento
reconocimiento (%) (Nmero componentes)
12
82.2222
77.7778% (55)
DCT
13
84.4444
80% (80)
LPP
21
80
68.8889% (40)
Nmero de componentes
Tasa de
Tasa de reconocimiento
max. Rendimiento
reconocimiento (%) (Nmero componentes)
PCA
24
80
77.7778% (55)
DCT
16
84.4444
77.7778% (80)
LPP
11
71.1111
57.7778% (40)
Pgina 58
Distancia Eucldea.
En segundo lugar, DCT se comporta de una manera muy parecida a PCA pero
obteniendo unos niveles de funcionamiento alrededor al 3% mejores. Como
sucede con PCA el sistema aumenta su rendimiento hasta estabilizarse.
Como conclusin de este apartado, podemos decir que LPP es el mtodo que
mejor funciona frente a variaciones en el aspecto de las caras. Los otros
Pgina 59
Figura 44. Tasa de identificacin correcta para imgenes con variaciones en el aspecto de las
caras.
Olivetti (ORL)
Mtodo
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
41
89,5
89% (55)
DCT
27
93
91.5% (80)
LPP
25
96
96% (40)
Pgina 60
Para este experimento, se han utilizado los siguientes parmetros del sistema:
Distancia Eucldea.
Los resultados obtenidos son los de la figura 45, para el caso de utilizar las
imgenes de la base de datos Olivetti para el reconocimiento, la figura 46 para
el caso BANCA Controlled y la figura 47 y 48 para el caso de utilizar la matriz
de proyeccin generalizada.
Como se puede observar en las grficas, los resultados para el segundo caso
son muy parecidos a los obtenidos en el captulo 5.1 cuando se entrenaba el
Pgina 61
sistema con imgenes tomadas bajo las mismas condiciones, mientras que
para el primer caso el rendimiento ha variado por completo.
Figura 45. Tasa de identificacin correcta obtenida utilizando para el reconocimiento imgenes
de la base de datos ORL y entrenando el sistema con imgenes de la base de datos BANCA
Degraded.
Figura 46. Tasa de identificacin correcta obtenida utilizando para el reconocimiento imgenes
de la base de datos BANCA Controlled y entrenando el sistema con imgenes de la base de
datos BANCA Degraded.
Pgina 62
ambos casos pero esta es poco apreciable al ser el funcionamiento del sistema
para este caso casi perfecto.
Figura 47. Tasa de identificacin correcta obtenida utilizando para el reconocimiento imgenes
de la base de datos ORL y entrenando el sistema con imgenes de todas las bases de datos.
Pgina 63
Figura 48. Tasa de identificacin correcta obtenida utilizando para el reconocimiento imgenes
de la base de datos BANCA Controlled y entrenando el sistema con imgenes de todas las
bases de datos
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
50
95,8549
92% (55)
LPP
42
88
87% (40)
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
93
99,9182
99.7547% (55)
LPP
37
99,7547
99.7547% (40)
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
61
93
91%(55)
LPP
81
88
84% (40)
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
54
100
100% (55)
LPP
47
99,8365
99.5094% (40)
Pgina 64
Para este experimento, se han utilizado los siguientes parmetros del sistema:
Pgina 65
Distancia Eucldea.
Los otros dos mtodos tienen un rendimiento muy discreto. En el caso de DCT,
es comprensible que frente a cambios en las condiciones de iluminacin, entre
las imgenes del set de test y referencia, su rendimiento empeore
cualitativamente ya que es un mtodo sin entrenamiento previo. PCA tiene una
tasa de identificacin ligeramente superior a DCT pero muy inferior a LPP.
Pgina 66
Figura 49. Tasa de identificacin correcta obtenida utilizando la base de datos BANCA
Controlled (referencia), Degraded (test) y entrenando el sistema con imgenes del grupo
Controlled para los diferentes mtodos de estudio.
Figura 50. Tasa de identificacin correcta obtenida utilizando la base de datos BANCA
Degraded (referencia), Controlled (test) y entrenando el sistema con imgenes del grupo
Degraded para los diferentes mtodos de estudio.
Pgina 67
Distancia Eucldea.
Los resultados que hemos obtenido, son los que se pueden ver en las figuras
51 y 52. Como se puede observar, los resultados son inferiores a los obtenidos
cuando se entrenaba al sistema con imgenes de la base de datos utilizada
como set de referencia.
inferior para LPP y superior para PCA que en el segundo caso (figura 52). LPP
Pgina 68
sigue mostrando una mejor tasa de identificacin para casi cualquier nmero
de componentes vindose esta ligeramente reducida en comparacin al
apartado anterior mientras que PCA presenta prcticamente los mismos
resultados no vindose afectado por el nuevo entrenamiento.
La segunda grfica, figura 52, LPP presenta unos resultados inferiores a los
obtenidos en el segundo caso del apartado 5.6.1 mientras que para PCA son
prcticamente los mismos. Nuevamente LPP es el mtodo que presenta una
mejor tasa de identificacin correcta.
Figura 51. Tasa de identificacin correcta obtenida utilizando la base de datos BANCA
Controlled (referencia), Degraded (test) y entrenando el sistema con imgenes del grupo
Degraded para los diferentes mtodos de estudio.
Figura 52. Tasa de identificacin correcta obtenida utilizando la base de datos BANCA
Degraded (referencia), Controlled (test) y entrenando el sistema con imgenes del grupo
Controlled para los diferentes mtodos de estudio.
Pgina 69
Como conclusin de este apartado hemos podido ver que el sistema tiene su
mejor rendimiento si se utilizan como set de referencia imgenes con buena
calidad y tomadas en un entorno controlado a la vez que se utilicen imgenes
tomadas bajo las mismas condiciones para realizar el entrenamiento del
sistema. Por otro lado, hemos podido ver que el mtodo que ofrece unos
mejores resultados para este tipo de situaciones es LPP.
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
95
46,852
45.7073% (55)
DCT
99
35,8953
34.6888% (80)
LPP
31
78,332
73.9166% (40)
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
100
44,9050
41.1054% (55)
DCT
100
33,5060
32.3834% (80)
LPP
26
71,1572
68.8256% (40)
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
99
43,7449
40.8831% (55)
LPP
37
58,8716
56.5822% (40)
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
100
43,437
38.9465% (55)
LPP
54
62,3489
57.0812% (40)
Nmero de componentes
max. Rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
44
100
100% (55)
DCT
29
99,9182
99.8365% (80)
LPP
23
99,8365
99.6729% (40)
Nmero de componentes
max. rendimiento
Tasa de
reconocimiento (%)
Tasa de reconocimiento
(Nmero componentes)
PCA
65
96,3731
96.0276% (55)
DCT
100
96,7185
96.5458% (80)
LPP
73
95,6822
95.1641% (40)
Tabla 8. Detalle de resultados Captulo 5.6 y resultados de los captulos 5.1 y 5.3.1. En la
primera columna: nmero de componentes mxima tasa de identificacin, segunda columna:
mxima tasa de identificacin, tercera columna: tasa de identificacin para el nmero de
componentes elegido para el caso general.
Pgina 70
Los parmetros del sistema utilizados para este experimento son los
siguientes:
Base de datos Olivetti, formada por 400 imgenes (10 imgenes por
persona con 40 individuos).
Pgina 71
Otra cosa que se puede observar es que, como es lgico el tiempo necesario
para hacer el reconocimiento aumenta con el nmero de componentes
utilizadas. En este aspecto podemos ver como tanto PCA como LPP
incrementan el tiempo necesario de una manera parecida, casi lineal ( t= iti )
mientras que en DCT este incremento es poco notable.
Pgina 72
Pgina 73
Distancia Eucldea.
Los resultados obtenidos para la imagen de entrada de la figura 54, son los que
se pueden observar en la figura 55. Como es posible observar en la imagen, se
verifican los resultados obtenidos en el apartado 5.6.1, el sistema funciona
correctamente para el caso de LPP obteniendo 5 resultados correctos de entre
los primeros 5, mientras que en los otros casos el sistema no tiene un correcto
funcionamiento. De los mtodos PCA y DCT, en ninguna ocasin, tenemos un
reconocimiento correcto de entre los 5 primeros.
Figura 54. Imagen que hemos utilizado para la entrada del sistema.
Figura 55. Resultados para cada uno de los mtodos (primera fila PCA, segunda DCT y
tercera LPP). De izquierda a derecha resultados de la primera a la quinta posicin.
Pgina 74
Consiste en una aplicacin en tiempo real para ver el rendimiento del sistema
en un entorno de funcionamiento prctico. Para la realizacin de esta
aplicacin se ha utilizado partes de cdigo ya existentes en la plataforma
ImaGeplus del Grupo de Procesado de Imagen y Video de la UPC las cuales
han sido modificadas para que funcionen con LPP. La aplicacin se ha utilizado
en el entorno de la smart room de la UPC y consiste en detectar y reconocer
los individuos que entran en la sala.
Esta aplicacin realiza reconocimiento facial basado en video con fusin de los
resultados individuales [33], es decir, no se muestran los reconocimientos
instantneos sino que se hace uso del resultado acumulado de las ltimas N
imgenes (N=10). De este modo, el resultado mostrado en el video es ms
estable y se evita que vare constantemente en caso de reconocimiento
incorrecto. Para realizar este reconocimiento, aunque se hace uso de modelos
para identificar a los individuos, seguimos empleando el criterio de distancia
mnima aunque en este caso se utiliza la distancia Manhattan.
Las imgenes utilizadas para esta aplicacin, son sin recortar y presentan
caras en diferentes posiciones y expresiones. Sobre estas imgenes se
detectarn las caras frontales y laterales haciendo uso del detector facial ViolaJones. Esta deteccin puede no ser siempre correcta o puede no poderse
realizar, en este caso no se muestra ningn resultado.
Pgina 75
Los mtodos utilizados para la ejecucin de esta aplicacin han sido DCT y
LPP. El nmero de componentes utilizado para el reconocimiento en cada caso
ha sido el que se ha determinado como ms adecuado para un sistema
general.
Imgenes obtenidas del video de la sala como set de test (se trata de
2706 imgenes no recortadas con 12 individuos diferentes).
Distancia Manhattan
Los resultados obtenidos del uso de esta aplicacin son los que se pueden ver
en los videos adjuntos en el CD final del proyecto, y para ver de manera exacta
el funcionamiento se muestran en la tabla 10 las tasas de reconocimiento
instantneo para cada cara detectada y el acumulado de cada 10 imgenes.
Mtodo
Resultados instantneos
Resultados acumulados
DCT
78.744%
81.7%
LPP
77.456%
85.4%
Pgina 76
Pgina 77
Pgina 78
Pgina 79
Pgina 80
Algunas de las proposiciones que se realizan para trabajos futuros son utilizar
pequeas variaciones del mtodo LPP original y hacer uso de otras tcnicas en
la etapa de decisin. Es por ello que para futuros trabajos se recomienda el
estudio de los mtodos derivados de LPP como son OLPP (Orthogonal
laplacianfaces) [30] [32], ONPP
(Orthogonal Neighborhood
Preserving
Por otro lado, ya que LPP preserva la estructura local de los datos y presenta
un buen rendimiento frente a situaciones adversas, como cambios en la
orientacin y expresiones faciales, se podra estudiar la posibilidad de utilizar
este mtodo para el reconocimiento de expresiones faciales o estados de
nimo (sonrisa, felicidad, tristeza). Tambin puede ser interesante ver si
utilizar mtodos no supervisados para el entrenamiento de LPP puede ayudar a
que el sistema tenga un mejor funcionamiento al ser entrenado con imgenes
de individuos distintos a los que se tengan en el sistema.
Por ltimo y no solamente para el mtodo LPP se puede estudiar las ventajas
de utilizar imgenes en color para mejorar las tasas de identificacin y otros
mtodos de compensacin de los cambios de iluminacin.
Pgina 81
Pgina 82
9 Bibliografa
Pgina 83
Pgina 84
Pgina 85
Pgina 86