You are on page 1of 174

UNIVERSIDAD AUTÓNOMA DE TLAXCALA

Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a


DIVISIÓN DE ESTUDIOS DE POSGRADO

Clasificación de Leucocitos utilizando Visión por Computadora

Tesis

Que para obtener el grado de:

Maestro en Ciencias en Ingenierı́a en Computación

Presenta:

Marı́a del Rocı́o Ochoa Montiel

Asesor:

M. en C. Ricardo Solano Monje

Apizaco,Tlax. Abril del 2006


c
Propiedad literaria °2006 por Marı́a del Rocı́o Ochoa Montiel.

U.A.T. Todos los Derechos Reservados.


Dedicatoria

A mi familia.
IV
Índice general

Índice general V

Índice de figuras IX

Índice de tablas XVII

Prefacio XIX

Motivación personal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix

Organización de la Tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix

Resumen XXIII

1. Introducción 1

2. Antecedentes 5

2.1. ¿Cómo identificar leucocitos empleando visión por computadora? . . . . . . 5

2.2. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.2. Objetivos Especı́ficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.4. Método de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.5. Hardware y software utilizado . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.5.1. Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.5.2. Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
VI ÍNDICE GENERAL

3. Fundamentos 11

3.1. Conceptos biológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.1.1. Composición de la sangre humana . . . . . . . . . . . . . . . . . . . 12

3.1.2. Recuento Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.2. Conceptos Estadı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.2.1. Métricas de similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.2.2. Análisis de Componentes Principales –PCA– . . . . . . . . . . . . . 25

3.3. Análisis de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3.1. Segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3.2. Filtrado espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.4. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.5. Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.5.2. Tipos de Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . 40

3.5.3. Entrenamiento por Retropropagación . . . . . . . . . . . . . . . . . 44

3.6. Técnicas de Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4. Estado del Arte 53

4.1. Segmentación de una imagen celular para diagnóstico patológico . . . . . . 53

4.2. Automatización del Recuento Diferencial de la sangre . . . . . . . . . . . . 56

4.3. Mejorado automático de detección de piel en imágenes de color . . . . . . . 57

4.4. Identificación automática de objetos aéreos usando Redes Neuronales . . . . 58

4.5. Análisis de imagen y aprendizaje supervisado en la diferenciación automáti-

ca de células blancas de imágenes microscópicas . . . . . . . . . . . . . . . . 60

4.6. Localización y rastreo de rostros humanos con Redes Neuronales . . . . . . 62

4.7. Localización de rostros humanos en Tiempo Real . . . . . . . . . . . . . . . 65

5. Clasificación de leucocitos 69

5.1. Método para el reconocimiento de células sanguı́neas Segmentadas y No

Segmentadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
ÍNDICE GENERAL VII

5.2. Etapas en la solución del problema . . . . . . . . . . . . . . . . . . . . . . . 70

5.3. Método de clasificación de leucocitos . . . . . . . . . . . . . . . . . . . . . . 71

5.3.1. Adquisición y Preprocesamiento de la imagen . . . . . . . . . . . . . 72

5.3.2. Segmentación en color . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.3.3. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . 81

5.3.4. Entrenamiento de la red . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.3.5. Reconocimiento de observaciones originales . . . . . . . . . . . . . . 94

6. Pruebas y análisis de resultados 95

6.1. Pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

6.1.1. Adquisición y preprocesamiento de la imagen . . . . . . . . . . . . . 95

6.1.2. Segmentación de la imagen . . . . . . . . . . . . . . . . . . . . . . . 98

6.1.3. Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . 105

6.1.4. Entrenamiento de la Red Neuronal . . . . . . . . . . . . . . . . . . . 109

6.2. Análisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7. Conclusiones 117

7.1. Conclusiones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

7.2. Trabajo a Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

Referencias 121

A. Espacios de color 127

A.1. Espacio RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

A.2. Espacio TSL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

A.3. Espacio HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

A.4. Los espacios XYZ, Luv, Lab . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

A.5. Los espacios de color YIQ, YUV, YCbCr y YCC . . . . . . . . . . . . . . . 131

A.6. El espacio CMY(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

B. Galerı́a de imágenes 133


VIII ÍNDICE GENERAL

C. Listado de módulos que componen el método de clasificación 141

Índice alfabético 143


Índice de figuras

1.1. Contadores hematológicos. . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.1. Proceso de reconocimiento de células sanguı́neas. . . . . . . . . . . 7

2.2. Hardware utilizado en el sistema de visión. . . . . . . . . . . . . . . . 9

3.1. Componentes de una célula básica. . . . . . . . . . . . . . . . . . . . . 12

3.2. Componentes de la sangre humana. . . . . . . . . . . . . . . . . . . . . 13

3.3. Porcentajes normales en un Recuento Diferencial. . . . . . . . . . . 14

3.4. Tipos de leucocitos y sus caracterı́sticas. . . . . . . . . . . . . . . . . 16

3.5. Preparación de frotis sanguı́neo. . . . . . . . . . . . . . . . . . . . . . 16

3.6. Observación y conteo de leucocitos. . . . . . . . . . . . . . . . . . . . 17

3.7. Tecnologı́a VCS. a) Preparación de la muestra. b) Volumen. b) Conduc-

tividad. d) Dispersión. e) Pruebas simultáneas. . . . . . . . . . . . . . . . . 19

3.8. Contadores Hematológicos. . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.9. Gráfica representativa de una Distribución Gaussiana . . . . . . . . 24

3.10. Proyección sobre el plano definido por las variables X1 y X2 . . . . 24

3.11. Modelo de un sistema de visión. . . . . . . . . . . . . . . . . . . . . . . 27

3.12. Procedimiento para implementar el Filtro de la mediana. . . . . . . 31

3.13. Diseño de un sistema de reconocimiento de patrones. . . . . . . . . 32

3.14. Caracterı́sticas morfológicas de una región. . . . . . . . . . . . . . . . 33

3.15. Momentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
X ÍNDICE DE FIGURAS

3.16. Dos curvas de contornos sencillos y sus correspondientes firmas de

distancia-ángulo. En (a) r(θ) es constante. En (b) r(θ) = A sec(θ). . . . . 36

3.17. Regiones con número de Euler -2 y 0, respectivamente. . . . . . . . 36

3.18. Convex Hull. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.19. De la neurona biológica a la neurona artificial. . . . . . . . . . . . . . 38

3.20. Proceso básico de una red neuronal. . . . . . . . . . . . . . . . . . . . 39

3.21. Esquema básico de una neurona artificial que contiene una sóla

entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.22. Funciones de transferencia de uso común. . . . . . . . . . . . . . . . . 41

3.23. Clasificación de las redes neuronales. . . . . . . . . . . . . . . . . . . . 41

3.24. Modelo de red neuronal multicapa alineada hacia adelante (pro-

gresiva). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.1. Proceso de segmentación de imágenes celulares para diagnóstico

patológico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.2. Imagen de un leucocito tı́pico. La imagen segmentada se presenta en

pseudocolor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.3. Calidad de la segmentación. a). Imágenes originales, arriba una célula de

linfoma de Mantle y las dos de abajo son especı́menes de leucemia linfocı́tica

crónica. b). Contornos. c). Células segmentadas. . . . . . . . . . . . . . . . . 55

4.4. Segmentación de núcleos de varias categorı́as de células. El borde

del núcleo está marcado con blanco. . . . . . . . . . . . . . . . . . . . . . . 55

4.5. Esquema de segmentación. a). Generación de subimágenes conteniendo

células solas. b). Segmentación de núcleos y citoplasmas. . . . . . . . . . . . 56

4.6. Secuencia de procesamiento. a. Imagen original. b. Imagen saturada. c.

Salida K-medias. d. Salida final. . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.7. Esquema de la detección automática de piel en imágenes de color. 58

4.8. Secuencia de procesamiento. Imagen original y resultados obtenidos des-

pués de aplicar la segmentación. . . . . . . . . . . . . . . . . . . . . . . . . 58


ÍNDICE DE FIGURAS XI

4.9. Componentes del sistema de clasificación de objetos aéreos. Adqui-

sición de caracterı́sticas y entrenamiento de la red neuronal. . . . . . . . . . 59

4.10. Aviones utilizados en el estudio. . . . . . . . . . . . . . . . . . . . . . . 59

4.11. Sistema de clasificación de células blancas sanguı́neas. . . . . . . . . 60

4.12. Ejemplos de imágenes completas utilizadas en la investigación. De

izquierda a derecha: basófilo, eosinófilo, linfocito, neutrófilos. . . . . . . . . 61

4.13. Eosinófilo. Resultados de la detección de bordes Canny. . . . . . . . . . . 61

4.14. Ejemplos de cı́rculos ajustados manualmente. Resultados del algorit-

mo de detección de cı́rculos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.15. Estructura del sistema de localización y rastreo de rostros humanos. 63

4.16. Localización de un rostro. a). Imagen original b). Imágenes en secuencia

c). Diferencia de las dos imágenes d). Conjunto de pixeles con caracterı́sticas

de movimiento e). Aplicación del clasificador general de color de rostros

–GFCC– f). Conjunto de pixeles con caracterı́sticas de color de piel g).

Objetos con caracterı́sticas de movimiento y color de piel h). Objetos más

grandes i). Rostro localizado. . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.17. Creación del clasificador de color de rostros. a). Primero se escoge un

área de interés en la imagen b). Se crea un modelo de distribución de color

para el área seleccionada c). Se umbraliza como pixeles de piel aquellos que

posean valores que se encuentren dentro de la media promedio. . . . . . . . 64

4.18. Localización de un rostro utilizando el modelo de color de piel. . . 65

4.19. Ejemplo de localización de un rostro usando una combinación de

color, geometrı́a, e información de movimiento. . . . . . . . . . . . . 67

5.1. Organización general. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

5.2. Proceso de adquisición de la imagen. . . . . . . . . . . . . . . . . . . . 72

5.3. Procedimiento de instalación de la cámara. Izq.- Montaje de Acceso-

rios. Der.- Cámara ajustada al microscopio. . . . . . . . . . . . . . . . . . . 74

5.4. Tipos de Leucocitos. Segmentados: neutrófilo y eosinófilo, No Segmenta-

dos: linfocito y monocito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74


XII ÍNDICE DE FIGURAS

5.5. Célula segmentada neutrófila. . . . . . . . . . . . . . . . . . . . . . . . 75

5.6. Desarrollo del proceso de segmentación. . . . . . . . . . . . . . . . . . 76

5.7. Histogramas de los canales RGB de un recorte de núcleo de una

célula segmentada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5.8. Diferencias entre d1 y d2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

5.9. Resultados de Filtro inicial aplicado a una célula segmentada. . . . 78

5.10. Umbralización con el Modelo de Mahalanobis. a)Imagen original.

b)Imagen después de aplicar filtro inicial. c)Imagen después de aplicar mo-

delo de Mahalanobis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.11. Extracción de caracterı́sticas. . . . . . . . . . . . . . . . . . . . . . . . 82

5.12. Almacenamiento de las caracterı́sticas estructurales. . . . . . . . . . 83

5.13. Método para el cálculo de las caracterı́sticas radiales. . . . . . . . . 87

5.14. Almacenamiento de las caracterı́sticas radiales obtenidas aleato-

riamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

5.15. Izquierda. Perı́metro de un núcleo. Centro. Puntos escogidos para formar

V 0 en el escalamiento aleatorio. Derecha. Puntos escogidos para formar V 0

en el escalamiento lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

5.16. A la izquierda: Región nuclear de una célula segmentada. A la derecha:

Perı́metro de la región de la izquierda. . . . . . . . . . . . . . . . . . . . . . 89

5.17. Perı́metro de la región de interés. Arriba. Representación del perı́me-

tro en el dominio del tiempo. Abajo. Representación del perı́metro en el

dominio de la frecuencia, considerando solo la parte de magnitud después

de aplicar la FFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.18. Almacenamiento de las caracterı́sticas obtenidas después de apli-

car FFT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

6.1. Recolección de muestras sanguı́neas. Izquierda. Elección del paciente.

Centro. Extracción de la sangre. Derecha. Preparación y tinción del frotis. . 96


ÍNDICE DE FIGURAS XIII

6.2. Adquisición de las observaciones. Izquierda: Gota de aceite sobre el

frotis. Centro: Colocación del frotis sobre la base del microscopio. Derecha:

Campo visto a través de la cámara. . . . . . . . . . . . . . . . . . . . . . . . 97

6.3. Campos vistos al microscopio con diferentes aumentos. Izquierda:

Utilizando el objetivo de 40X. Derecha: Utilizando el objetivo de 100X. . . 97

6.4. Tipos de glóbulos blancos. Arriba.- Segmentados: Neutrófilo, Eosinófilo,

Basófilo. Abajo.- No Segmentados: Linfocito y monocito. . . . . . . . . . . . 98

6.5. Glóbulos blancos digitalizados. . . . . . . . . . . . . . . . . . . . . . . 98

6.6. Recorte de núcleo de una célula de la clase Segmentada. . . . . . . 99

6.7. Histogramas de los canales RGB de 4 tipos de recortes de núcleos.

La primera fila de histogramas corresponde a una célula Segmentada Eo-

sinófila. La segunda fila de histogramas pertenece a una célula Segmentada

Neutrófila. La tercera fila de histogramas es de una célula No Segmentada

linfocı́tica. La cuarta fila es de una célula No Segmentada Monocı́tica . . . . 100

6.8. Resultados del filtro inicial. a).- Célula Segmentada Eosinófila. b).-

Célula Segmentada Neutrófila. c).- Célula No Segmentada linfocı́tica.

d).- Célula No Segmentada Monocı́tica . . . . . . . . . . . . . . . . . . . 101

6.9. Resultados del filtro inicial aplicado a imágenes muy claras. a).-

Célula No Segmentada Monocı́tica. b).- Célula Segmentada Neutrófila.

c) y d) Células Segmentadas eosinófila. . . . . . . . . . . . . . . . . . . . 101

6.10. Resultados del filtro inicial aplicado a imágenes obscuras. La célula

que esta en la parte superior izquierda es un neutrófilo y las demás son

eosinófilos, ambas pertenecientes a la clase segmentados. . . . . . . . . . . 102

6.11. Resultados del filtro inicial aplicado a imágenes de células semi-

destruidas. En este caso la claridad no se considera. . . . . . . . . . . . . . 102

6.12. Resultados del filtro inicial aplicado a imágenes de células con el

núcleo muy dividido. En este caso la claridad no se considera. . . . . . . 103

6.13. Conversión del espacio de color RGB a TSL. . . . . . . . . . . . . . . 103

6.14. Unión de los vectores T y S de los n Recortes de núcleos. . . . . . 103


XIV ÍNDICE DE FIGURAS

6.15. Correlación entre las variables Tono y Saturación correspondientes

a los vectores T y S, respectivamente. Los valores de T son normalizados.105

6.16. Resultados de la segmentación del núcleo de un monocito. . . . . . 105

6.17. Matriz de caracterı́sticas estructurales. Las columnas denotadas con

Si representan a las caracterı́sticas de células Segmentadas mientras que

las que se denotan con Ni indican a las caracterı́sticas de células No Seg-

mentadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

6.18. Matriz de caracterı́sticas estructurales con análisis de varianza. . . 108

6.19. Matriz de caracterı́sticas radiales utilizando escalamiento con trans-

formación lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

6.20. Tipos de entrenamiento y funciones de transferencia. . . . . . . . . 110

6.21. Distribución de las observaciones para la experimentación. . . . . . 110

6.22. Distribución de las observaciones por clase. . . . . . . . . . . . . . . . 111

6.23. Resultados de las configuraciones utilizando diferentes observacio-

nes de células Segmentadas y No Segmentadas. . . . . . . . . . . . . 112

6.24. Comportamiento de entrenamiento utilizando diferentes observa-

ciones de células Segmentadas y No Segmentadas con caracterı́sti-

cas estructurales y radiales. . . . . . . . . . . . . . . . . . . . . . . . . . 113

A.1. Diagrama esquemático de los 3 ejes del sistema de color Mun-

sell.Tomado de Hall, E.L. Computer Image Processing and Recognition.

Academic Press, New York. 1979 . . . . . . . . . . . . . . . . . . . . . . . . 129

B.1. Leucocitos segmentados: Eosinófilos. (Continúa) . . . . . . . . . . . . 134

B.2. Leucocitos segmentados: Eosinófilos. (Continuación) . . . . . . . . . . 135

B.3. Leucocitos segmentados: Neutrófilos. (Continúa) . . . . . . . . . . . . 136

B.4. Leucocitos segmentados: Neutrófilos. (Continuación) . . . . . . . . . . 137

B.5. Leucocitos no segmentados: Linfocitos. (Continúa) . . . . . . . . . . . 138

B.6. Leucocitos no segmentados: Linfocitos. (Continuación) . . . . . . . . . 139

B.7. Leucocitos no segmentados: Monocitos. . . . . . . . . . . . . . . . . . 139


ÍNDICE DE FIGURAS XV

B.8. Casos especiales. En b1 y b2 se observan células basófilas pertenecientes

a la clase segmentados, es un tipo de célula que por su rareza fue excluı́da

de las pruebas hechas en la investigación. DOSe66-n contiene abajo un

neutrófilo pequeño, arriba un eosinófilo con el núcleo parcialmente destruido

y distribuido en el citoplasma. DOSe103-mono muestra arriba a la izquier-

da un eosinófilo y abajo a la derecha un monocito. En DOSl40mono3 se

observa arriba a la derecha un monocito y abajo a la izquierda un linfocito.

DOSn28linfo10 arriba a la derecha presenta un neutrófilo grande y abajo

a la izquierda un linfocito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140


Índice de tablas

3.1. Caracterı́sticas que permiten describir la forma de una región. . . 35

4.1. Principales trabajos relacionados . . . . . . . . . . . . . . . . . . . . . 66

5.1. Caracterı́sticas estructurales. . . . . . . . . . . . . . . . . . . . . . . . 83

5.2. Caracterı́sticas estructurales iniciales para el análisis de varianza. 84

5.3. Resultados del análisis de varianza para 17 caracterı́sticas estruc-

turales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.4. Caracterı́sticas estructurales obtenidas con el análisis de varianza. 86

C.1. Principales funciones programadas . . . . . . . . . . . . . . . . . . . . 142


Prefacio

Motivación personal

La fuerza motivadora para la realización de este trabajo de tesis ha sido el interés por

aplicar técnicas de visión por computadora en el área del análisis clı́nico, encaminado a

encontrar un método que permita a la computadora realizar el proceso de visión como lo

harı́a el ser humano en la identificación de células sanguı́neas.

Ası́, el objetivo principal es proponer una técnica que permita identificar leucocitos y

clasificarlos biológicamente en segmentados y no segmentados.

La técnica propuesta no pretende competir con las máquinas disponibles en el mercado

que son capaces de realizar tareas similares empleando mecanismos no visuales. Tampoco

es una meta de este trabajo obtener un sistema listo para ser utilizado en el área clı́nica

y reemplazar a los métodos ya existentes, debido a que el análisis visual consume más

tiempo que los métodos fı́sico-quı́micos. Además la automatización completa requiere de

un sistema que permita la manipulación del microscopio para la adquisición de la imagen,

lo cual resulta difı́cil aún para un experto del área clı́nica.

Organización de la Tesis

Este trabajo de tesis se ha dividido en 7 capı́tulos que progresivamente llevarán al lec-

tor a tener una idea clara del proceso de Clasificación de Células Sanguı́neas empleando

técnicas de Visión por computadora.

En el primer Capı́tulo, se encontrará un resumen sobre la situación actual en el área


XX

de los análisis clı́nicos respecto al proceso de identificación y clasificación de células san-

guı́neas, en especial de leucocitos o glóbulos blancos. Además se presenta un bosquejo

general acerca de la problemática abordada en este trabajo y su método de solución.

En el Capı́tulo 2 se presenta la definición del problema, ası́ como las propuestas de

solución, objetivos y material utilizado en el transcurso de la investigación.

El Capı́tulo 3 es dedicado a la explicación de los antecedentes teóricos, necesarios pa-

ra el entendimiento de las secciones posteriores; incluyendo tópicos como definiciones de

elementos biológicos y hematológicos, técnicas de preparación de las muestras biológicas

y métodos de clasificación de las mismas, conceptos estadı́sticos, teorı́a de procesamiento

de imágenes, extracción de caracterı́sticas, redes neuronales y técnicas de validación de

resultados.

En el Capı́tulo 4 se comentan algunos trabajos relacionados con el problema aborda-

do en esta tesis, considerando principalmente aquellos que se relacionan con técnicas de

segmentación en color.

En el Capı́tulo 5 se describe el diseño y la implementación del proceso de identificación

y clasificación de leucocitos Segmentados y No segmentados.

En el Capı́tulo 6 se muestran las pruebas realizadas y se comentan los resultados obte-

nidos.

En el Capı́tulo 7 estan las conclusiones y sugerencias para trabajos futuros.

Esperando sea útil para futuros trabajos de investigación, se anexa la base de datos

utilizada en formato digital, además de los códigos fuente correspondientes a las funciones

implementadas incluyendo algunos experimentos adicionales que no se reportan en este

trabajo, ası́ como el código latex que produjo este documento.

Marı́a del Rocı́o Ochoa Montiel1

Asesor: M. en C. Ricardo Solano Monje2 .

Apizaco, Tlax. Abril 2006.

1
Email: rocio730@prodigy.net.mx
2
Email: rsolanomonje@hotmail.com
Agradecimientos

A todas las personas que de manera incondicional, brindaron parte de su valioso tiempo

para conocer y hacer posible la realización de este trabajo.

Para empezar quiero agradecer a mi tı́a Genobeba Montiel Corona, quien me ha apo-

yado mucho al hacerse cargo del cuidado de mis hijos y las labores domésticas para que

yo pudiera dedicar el tiempo necesario para hacer posible la realización de este trabajo de

tesis.

Doy gracias a mi asesor por su apoyo y guı́a en las actividades involucradas en la rea-

lización de este trabajo y por sus consejos para que esta tesis fuera posible.

También deseo agradecer al M. en C. José Alberto Chávez Aragón3 por las sugerencias

que permitieron mejorar este trabajo de tesis.

Agradezco al Dr. Francisco J. Albores Velasco4 por su apoyo persistente y desinteresado

en la resolución de mis problemas matemáticos.

Quiero agradecer especialmente al M. en C. Orión Fausto Reyes Galaviz5 por la revisión

desinteresada de mi trabajo de tesis y por su disposición constante en las revisiones del

código correspondiente al uso de Redes Neuronales.

Al Dr. Isaı́as López Morales6 , al Dr. Manuel Hernández Gutiérrez7 y al M. en C.

3
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
Email: achavez@ingenieria.uatx.mx
4
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
Email: jalbores@ingenieria.uatx.mx
5
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
Email: orionfrg@ingenieria.uatx.mx
6
Catedrático del área de Matemáticas Aplicadas en la Facultad de Ciencias Básicas.
Email: ilm@ingenieria.uatx.mx
7
Catedrático del área de Computación en la Facultad de Ingenierı́a y Tecnologı́a.
XXII

José Erasmo Pérez Vázquez8 por su apoyo en la resolución de mis dudas relacionadas con

el código Latex producido de esta tesis.

No menos importante es agradecer a Laboratorios Biodiagnostics por prestar sus ins-

talaciones y equipo clı́nico para la obtención de las muestras biológicas y especialmente

reconocer el trabajo realizado por el Q.F.B. Gonzálo Romero Tirso en las tareas de reco-

lección y preparación de los frotis sanguı́neos ası́ como su valioso apoyo en la identificación

de las células que se utilizaron en este trabajo de tesis.

Finalmente, al M. en C. Antonio Durante Murillo9 agradezco las facilidades brindadas

durante el proceso administrativo y que han permitido que este trabajo concluya exitosa-

mente.

A todos mis colegas que me han hecho crı́ticas y sugerencias, mil gracias.

8
Catedrático del área de Matemáticas Aplicadas en la Facultad de Ciencias Básicas.
Email: erasmo@ingenieria.uatx.mx
9
Director de la Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a.
Resumen

El propósito de este trabajo de tesis es utilizar visión por computadora para identificar

y clasificar células sanguı́neas. Estas células estan contenidas en un conjunto de imáge-

nes adquiridas a través de un sistema de visión. El método propuesto esta basado en un

algoritmo de segmentación que fue utilizado originalmente para la segmentación de piel.

Adicionalmente, se utilizó una red neuronal para la tarea de clasificación.

El algoritmo de segmentación adaptado permite crear un modelo de color, y haciendo

uso de este modelo se realiza el proceso de segmentación. Esto permite extraer las carac-

terı́sticas de la región de interés. Hay 3 tipos de caracterı́sticas extraı́das: estructurales,

estructurales con análisis de varianza y radiales.

El proceso de identificación esta constituido por un sistema de aprendizaje – la red

neuronal –, la cual es entrenada con las caracterı́sticas mencionadas anteriormente. Los

resultados se basan en el uso de una red neuronal de retropropagación, utilizando ya sea

caracterı́sticas estructurales, estructurales con análisis de varianza o radiales para la etapa

de entrenamiento.

El primer conjunto de datos de entrenamiento consistió de 13 atributos de la región de

interés. El ı́ndice de reconocimiento obtenido con éste conjunto fue de 84.54 %.

El segundo conjunto de datos de entrenamiento fue formado por 8 caracterı́sticas ob-

tenidas después de realizar un análisis de varianza a un subconjunto de 17 caracterı́sticas

estructurales. En este caso se obtiene un ı́ndice de reconocimiento del 85.82 %.

El tercer conjunto de datos de entrenamiento consiste de 111 caracterı́sticas radiales,

que corresponden a las distancias del centro de masa de la región de interés a su perı́metro.

Antes de usar este conjunto de datos para el entrenamiento de la red neuronal, se aplicó la
XXIV

FFT(Transformada Rápida de Fourier –por sus siglas en inglés–) para eliminar variacio-

nes en las caracterı́sticas extraı́das relacionadas con la rotación o escala, incrementando el

desempeño de la fase de clasificación hasta en un 99.54 %.

En todos los casos, las caracterı́sticas se preprocesaron con PCA. El desempeño de la

fase de entrenamiento –el desempeño de la red neuronal–, se evaluó utilizando la técnica

de validación cruzada en 10 particiones.


Abstract

The purpose of this work is to use computer vision in order to identify and clasify blood

cells. These cells are extracted from a set of images which were adquired through a vision

system. The proposed method is based on segmentation algorithm, that was previously

used for skin segmentation. Additionally, a neural network was used for the classification

task.

The adapted segmentation algorithm allows to create a color model and making used

of this model the segmentation process is performed. This allows to extract the characte-

ristics of the region that concerns us. There are three types of extracted characteristics:

structurals, structurals with variance analysis and radials. The identification process is ac-

complished by means of a learning system -the neural network- which is trained with the

characteristics of the previous phase. The results are based on the use of a back-propagation

neural network, using the structural, structurals with variance analysis or radial characte-

ristics for the training phase.

The first set of training data consists of 13 attributes of the segmented region of inter-

est. The positive index obtained from this set was of 84.54 %.

The second training data was made of 8 characteristics obtained from a variance analy-

sis of a subset of 17 structurals characteristics. In this case the recognition rate obtained

was 85.82 %.

The third training data set consisted of 111 radial characteristics which were corres-

ponded to the distances taken from the center of mass of the region of interest to its

perimeter. Before using this data set for training the neural network. The FFT (Fourier

Fast Transform) was applied in order to eliminate to variations in the extracted features
XXVI

such as rotation or scaling changes. As a result, the classification performance increased up

to 99.54 %. In every case the characteristics were propocessed with PCA. The performance

of the training phase –the neural network performance– were evaluated using the Ten Fold

Cross Validation approach.


Capı́tulo 1

Introducción

En instituciones de salud pública y privada se realizan exámenes de laboratorio rela-

cionados con el análisis de sangre, uno de ellos es el Recuento Diferencial que consiste en

la identificación, clasificación y conteo de glóbulos blancos. El objetivo principal de esta

prueba es contribuir en conjunto con los resultados de otras pruebas de laboratorio, a

proporcionar al médico datos que ayuden a dar un diagnóstico en un paciente, además de

formar parte de los análisis preoperatorios requeridos en intervenciones quirúrgicas. Los

resultados de un Recuento Diferencial también son útiles en diagnósticos de leucemias,

parasitosis, cuadros infecciosos y anemia, entre otros [Oppenheim, 1998].

De esta manera una gran cantidad de células sanguı́neas de la serie blanca1 son clasifi-

cadas en laboratorios clı́nicos utilizando microscopios , lo que resulta en una tarea subjetiva

y detallada [Ushizima et al., 2004]. Un técnico clı́nico capacitado toma de 10 a 15 minutos

para evaluar y contar 100 células para cada laminilla2 , un tiempo considerable y susceptible

para que ocurra un error en el análisis.

Debido a la importancia que este tipo de análisis tiene, sus aplicaciones y el volu-

men de muestras que es necesario revisar diariamente, algunas instituciones de salud uti-

lizan máquinas capaces de realizar un cierto número y tipo de análisis clı́nicos incluyendo

el Recuento Diferencial, disminuyendo en parte el riesgo para el humano al tener me-

nos contacto directo con muestras posiblemente infectadas. En la Figura 1.1, tomada de
1
glóbulos blancos o leucocitos
2
muestra de frotis sanguı́neo teñido para recuento diferencial
2 1 INTRODUCCIÓN

Figura 1.1: Contadores hematológicos.

[Beckman Coulter, 2006] se muestran dos tipos de máquinas empleadas en análisis clı́nicos.

Sin embargo, la desventaja de realizar los análisis empleando máquinas de este tipo

es que su mantenimiento es costoso, además de que son productos caros que no propor-

cionan resultados completos y certeros en el examen llamado Recuento Diferencial debido

posiblemente a que los mecanismos que emplean para hacer esta diferenciación se basan

en métodos fı́sicos y quı́micos, no en un análisis visual; hecho que ha ocasionado que aún

se siga utilizando el método manual descrito en la sección 3.1.2.

En busca de un método que permita realizar esta identificación empleando visión por

computadora, surge este trabajo de tesis, el cual una vez terminado no pretende de ninguna

manera sustituir a los métodos tradicionales para la realización del Recuento Diferencial,

ya sea hecho por un experto o por una máquina sino encontrar una alternativa para el

análisis visual de especı́menes biológicos y en un futuro servir como marco de referencia

para el desarrollo de una aplicación que sirva de apoyo a los estudiantes del área clı́nica en

algunas instituciones educativas del nivel medio superior o superior.

Por otra parte, la imagen completa de un leucocito es insuficiente para diferenciarlos

de entre sus propios subtipos. Su clasificación se realiza en principio considerando carac-

terı́sticas de la forma del núcleo de la célula.

El presente trabajo aborda por un lado el problema de reconocimiento de patrones

en el análisis de imágenes de sangre humana, y por otro el cómo la información de color

presente en su núcleo puede hacer posible la extracción de caracterı́sticas que permitan

la diferenciación de leucocitos en 2 subclases: leucocitos segmentados y leucocitos no

segmentados.

Como parte de la solución propuesta se trabaja con un grupo de 354 muestras obteni-

das con una cámara digital adaptada al ocular de un microscopio óptico. Posteriormente se
3

utiliza un modelo propuesto por [Tomaz et al., 2003] para la segmentación de piel humana

que se adaptó para la segmentación de núcleos celulares . Una vez obtenida la región de

interés se extraen caracterı́sticas que permiten clasificar a los leucocitos en dos clases: célu-

las segmentadas y células no segmentadas. El método usado para la clasificación es

una red neuronal de retropropagación que recibe como entrada un vector de caracterı́sticas

de cada núcleo extraı́do durante la segmentación.

Finalmente se concluye que para el espacio de color utilizado, la detección eficiente

–segmentación adecuada– depende de la capacidad del modelo de color para estimar la

distribución de color del núcleo celular y, lo más importante la discriminabilidad entre

distribuciones de núcleo y no núcleo.

Por otra parte, se comprobó que las caracterı́sticas radiales son buenos descriptores de

las formas nucleares de los leucocitos.

El aporte que se puede apreciar en este trabajo, es que el uso de un espacio de color

adaptado para núcleos celulares y la aplicación de métodos estadı́sticos, son útiles en la

segmentación en color de núcleos en leucocitos, permitiendo extraer caracterı́sticas que

permiten definir la forma del núcleo de la célula.

De esta manera, los resultados demuestran que es factible el uso de la técnica pro-

puesta en el presente trabajo para el análisis de muestras biológicas, en las cuales es de

suma importancia la detección de anormalidades morfológicas y colorimétricas, además de

constituir una alternativa para el análisis e identificación de cualquier tipo de objeto con

técnicas de visión por computadora.


Capı́tulo 2

Antecedentes

Este capı́tulo refiere el problema de la segmentación de células blancas y su clasificación.

Se describe la hipótesis, los objetivos y el método de solución propuesta. Finalmente se hace

mención del hardware y software utilizado durante el desarrollo de esta tesis.

2.1. ¿Cómo identificar leucocitos empleando visión por compu-

tadora?

La respuesta a esta pregunta constituye la problemática principal de este trabajo de

tesis. La razón principal de intentar dar respuesta a esta pregunta es, por un lado en-

contrar un método que se asemeje al proceso realizado por un ser humano al tratar de

identificar células blancas, y por otro proponer una alternativa para la identificación de

este tipo de muestras que esté apoyada en técnicas de visión por computadora. El método

de clasificación propuesto consiste en determinar si una célula blanca es Segmentada o

No segmentada1 considerando su color y morfologı́a nuclear. Se toman caracterı́sticas de

color y forma debido a que un experto humano identifica y clasifica a los glóbulos blancos

vistos en un frotis, detectando estas caracterı́sticas en primera instancia.

Como se comenta en la Introducción de esta tesis, actualmente la mayorı́a de los la-


1
los términos segmentada y no segmentada corresponden a una clasificación en la cual se considera la
morfologı́a nuclear para determinar ambas clases. El tipo segmentado corresponde a un núcleo fragmenta-
do(dividido) y el no segmentado a un núcleo semicircular, sin divisiones.
6 2 ANTECEDENTES

boratorios clı́nicos en México, realizan el análisis llamado Recuento Diferencial empleando

un método manual realizado por un experto.

2.2. Hipótesis

El tema principal de este trabajo esta directamente relacionado con técnicas de visión

por computadora. Y como variable principal en el proceso de identificación se utiliza el

color para la segmentación y la morfologı́a nuclear para la clasificación, pues una buena

caracterización del núcleo es suficiente para ubicar a los glóbulos blancos en dos grupos:

segmentados y no segmentados. De esta manera, la hipótesis se enuncia de la siguiente

manera:

Es posible clasificar a los glóbulos blancos en segmentados y no segmentados uti-

lizando técnicas de visión por computadora, especı́ficamente mediante la segmentación en

color de los núcleos celulares, y el uso de caracterı́sticas que describen la forma dicho

núcleo: caracterı́sticas estructurales, caracterı́sticas estructurales con análisis de varianza

o caracterı́sticas radiales.

2.3. Objetivos

2.3.1. Objetivo General

Desarrollar un método que permita clasificar glóbulos blancos de sangre humana, en

segmentados y no segmentados a partir de imágenes digitalizadas obtenidas de una

cámara adaptada a un microscopio óptico.

2.3.2. Objetivos Especı́ficos

Revisar el procedimiento manual actualmente utilizado para modelar la solución.

Analizar visualmente las células blancas para elegir las caracterı́sticas utilizadas en

su clasificación.

Sustentar los resultados dentro de varias alternativas factibles.


2.4 Método de solución 7

Figura 2.1: Proceso de reconocimiento de células sanguı́neas.

En capı́tulos posteriores se describirán los procedimientos detallados para la demostración

de la hipótesis formulada y el logro de los objetivos propuestos.

2.4. Método de solución

En la Figura 2.1 se muestra el modelo que compone el proceso de reconocimiento de

células sanguı́neas. Como se observa, se comienza por adquirir las muestras biológicas que

se utilizan durante el proceso de investigación.

El siguiente paso es digitalizar las imágenes de leucocitos para iniciar el proceso de

análisis de la imagen, que consiste en segmentar a la región de interés. En este caso, la

región de interés corresponde al núcleo de la célula, dado que la forma que lo caracteriza

es lo que hace la diferencia entre las dos clases de leucocitos que se deben reconocer. Estas

clases son:

1. Leucocitos segmentados: Poseen un núcleo de forma irregular, presentan de 2 a 3

lóbulos. En ocasiones el núcleo no se distingue bien debido a los gránulos2 presentes

en el citoplasma como en el caso de los basófilos.

2. Leucocitos no segmentados: Poseen un núcleo de forma redondeada, ovoide y

compacta. En la mayorı́a de los casos no hay protuberancias3 .


2
partı́culas pequeñas que se encuentran suspendidas en el citoplasma de la célula.
3
extensiones de la célula ocasionadas por el rompimiento de la membrana que la rodea.
8 2 ANTECEDENTES

En el proceso de análisis de la imagen se propone un modelo de color que permita realizar

una segmentación automática de los núcleos celulares, para delimitarlos de la mejor manera

posible y extraer caracterı́sticas que mejor describan su forma.

Al concluı́r la etapa de análisis de la imagen se extraen caracterı́sticas de la región de

interés. Las caracterı́sticas que describen a la región se agrupan en 3 clases:

1. Descriptores estructurales

2. Descriptores estructurales con análisis de varianza

3. Descriptores de Fourier

Los descriptores estructurales considerados en este trabajo corresponden a atributos de la

región que son medibles y que además, proporcionan información útil sobre la composición

de la región [Pajares and de la Cruz, 2002]. Algunas de ellas son el área, el perı́metro, el

centro de masa, el número de huecos, la longitud de eje mayor y menor respectivamente.

Los descriptores estructurales con análisis de varianza están formados por un conjunto

de caracterı́sticas estructurales que resultan de hacer un análisis de varianzas, en el cual se

eligen aquellas caracterı́sticas cuya varianza entre ambas clases de células sea significativa.

Los descriptores de Fourier son representaciones gráficas de la forma de la región, que

se calculan utilizando la técnica de [Abdallah et al., 1995].

Como resultado de la extracción de caracterı́sticas se obtiene un vector de caracterı́sticas

estructurales, un vector de caracterı́sticas estructurales con análisis de varianza y un vector

de caracterı́sticas radiales (descriptores de Fourier) para cada imagen. Con cada conjunto

de caracterı́sticas se entrena una red neuronal de retroprogapación, que es el clasificador

elegido para evaluar a las caracterı́sticas seleccionadas, dado que en el trabajo reportado

por [Katz, 2000], se observa un buen desempeño cuando se trabaja con datos similares a

los que integran a los vectores de caracterı́sticas utilizados en esta tesis.


2.5 Hardware y software utilizado 9

Figura 2.2: Hardware utilizado en el sistema de visión.

2.5. Hardware y software utilizado

Los elementos que fueron utilizados en el desarrollo de este trabajo se mencionan a

continuación.

2.5.1. Hardware

El hardware utilizado para el sistema de visión se muestra en la Figura 2.2. Las imágenes

fueron tomadas de [Mot, 2004].

La implementación fue realizada en una computadora con un procesador INTEL Centrino

1.5Ghz y 512MB.

2.5.2. Software

El software utilizado en este trabajo consiste en:

Sistema operativo: Windows XP Home Edition versión 2002 Service Pack 2.

Software de la cámara: Motic Images 2000 versión 1.2 [Mot, 2004].


10 2 ANTECEDENTES

Software de programación: Matlab 6.0.0.88.


Capı́tulo 3

Fundamentos

En este capı́tulo se describen los conceptos básicos, necesarios para la plena compren-

sión del resto del trabajo de tesis. Se definen conceptos relacionados con citologı́a, hema-

tologı́a, procesamiento de imágenes, estadı́stica, redes neuronales, y técnicas de validación

de resultados.

3.1. Conceptos biológicos

Para tener una descripción más amplia respecto a los elementos biológicos que consti-

tuyen el objeto de estudio en este trabajo de tesis, se describe la anatomı́a y fisiologı́a de

la célula.

Una célula es la unidad anatómica y fisiológica que compone a un ser vivo y está for-

mada fundamentalmente por una membrana, un citoplasma y un núcleo. La membrana es

la parte que cubre a la célula y que visualmente representa su silueta marcando los lı́mites

entre ella y su entorno. El citoplasma es la parte que se encuentra después de la mem-

brana en el cual estan suspendidos los órganos internos de la célula, su consistencia puede

ser lı́quida o viscosa. Dentro del citoplasma se encuentra el núcleo, que regularmente esta

situado en la parte central de la célula y es el encargado de controlar la actividad celular.

En la Figura 3.1, tomada de [Sánchez, 2006] se muestra un ejemplo señalando algunas de

sus partes.
12 3 FUNDAMENTOS

Figura 3.1: Componentes de una célula básica.

En ocasiones la célula es incolora, dificultando su análisis visual a través de un micros-

copio. Al conocerse su composición quı́mica es posible determinar qué tipo de colorantes

usar (ácidos o básicos) para teñirlas y poder visualizarlas distinguiendo mejor sus partes.

Debido a que en el núcleo se encuentra la información genética de la célula y como conse-

cuencia los ácidos nucléicos ADN1 y RDN2 [Wikipedia Foundation, 2006], su composición

generalmente es ácida, en cambio el citoplasma tiende a ser quı́micamente más básico3 . Ası́,

los núcleos de los leucocitos generalmente se tiñen de morado en respuesta a los colorantes

utilizados para teñirlos.

3.1.1. Composición de la sangre humana

La sangre humana es un compuesto formado por 2 elementos fundamentales, el plasma

y el paquete globular. El plasma es la parte lı́quida de la sangre, mientras que el paquete

globular lo forman un conjunto de células que se encuentran suspendidas en él, como los

glóbulos rojos (eritrocitos), glóbulos blancos (leucocitos) y las trombocitos (plaquetas).

Cada uno de ellos tiene su función particular [Woodliff and Herrmann, 1993].

El color de la sangre esta determinado por la hemoglobina presente en los eritroci-


1
ácido desoxirribonucléico, constituye el materal genético de los organismos.
2
ácido ribonucléico, sirve como una plantilla para la traducción de genes.
3
se refiere a que posee un PH alcalino.
3.1 Conceptos biológicos 13

Figura 3.2: Componentes de la sangre humana.

tos, cuya función principal es transportar el oxı́geno a todo el cuerpo. Las plaquetas se

encargan de los procesos de coagulación, en tanto que los leucocitos constituyen el me-

canismo de defensa desempeñándose como anticuerpos4 . En la Figura 3.2 se muestra un

esquema de la clasificación completa de las células que se encuentran en la sangre humana

[Cormack, 1997].

Leucocitos

Etimológicamente los leucocitos deben su nombre a las palabras leuco (blanco) y ci-

to (célula). En personas saludables, el número de leucocitos varı́a entre 5000 y 10, 000,

en condiciones patológicas pueden estar aumentados (leucocitosis) o disminuidos (leucope-

nia). En la Figura 3.3 se muestran los subtipos de leucocitos y los porcentajes normalmente

encontrados en un Recuento Diferencial según [Oppenheim, 1998].

Los neutrófilos, monocitos y eosinófilos poseen propiedades fagocitarias5 que consti-

tuyen un mecanismo de defensa antibacteriana y una contribución para la eliminación de

desechos. Los linfocitos son productores de anticuerpos, mientras que los basófilos poseen
4
son un tipo de proteı́nas producidas por el sistema inmune en respuesta a la presencia de sustancias
extrañas potencialmente dañinas que pueda ser una amenaza para el organismo: como quı́micos, partı́culas
de virus, esporas (cuerpos microscópicos unicelulares o pluricelulares que por división propia dan nacimiento
a nuevos organismos en vegetales criptógamos, hongos y algunas especies protozoarias.) o toxinas (proteı́nas
o lipopolisacáridos que causan daños concretos a un huésped) de las bacterias [Webner, 2006].
5
propiedad de una célula para atraer partı́culas y destruirlas o digerirlas.
14 3 FUNDAMENTOS

Figura 3.3: Porcentajes normales en un Recuento Diferencial.


3.1 Conceptos biológicos 15

gránulos de heparina e histamina6 .

En las infecciones, cuadros tóxicos y hemorragias se produce una respuesta leucocitaria

en la sangre, de acuerdo con la intensidad del estı́mulo y la capacidad de reacción del

individuo. Las primeras células que aumentan en número ante un cuadro infeccioso son los

neutrófilos, mientras los monocitos y linfocitos aumentan en etapas posteriores. En ejerci-

cios muy forzados o embarazo puede haber una moderada leucocitosis7 fisiológica, no rela-

cionada con procesos patológicos. En la Figura 3.4, tomada de [Freggiaro and Espejo, 2006]

se muestran imágenes de los tipos de leucocitos más comunes.

3.1.2. Recuento Diferencial

Método manual

El Recuento Diferencial consiste en examinar la morfologı́a de glóbulos blancos, ası́ como

su tamaño y número [Oppenheim, 1998]. El método para la preparación de la muestra em-

pleada para hacer un Recuento Diferencial es el siguiente:

Preparación del frotis sanguı́neo. Se coloca una gota de sangre fresca sobre un por-

taobjetos y se extiende con ayuda de otro portaobjetos para formar una capa delgada

que se deja secar, como se observa en la Figura 3.5.

Tinción. Se realiza con colorantes ácidos (eosina-rojo) y básicos (azul de metileno). Los

Leucocitos (glóbulos blancos) se tiñen de color azul, pues reaccionan quı́micamente

con el azul de metileno tomando dicha coloración. Los Eritrocitos (glóbulos rojos)

se tiñen de color rojo, ya que reaccionan quı́micamente con la eosina pintándose de

rojo. Los glóbulos blancos con gránulos que toman ambos colorantes se denominan

neutrófilos. Las células con gránulos que toman color azul se llaman basófilos. Los

leucocitos que poseen gránulos que se tiñen con eosina (rojo) se denominan eosinófi-

los. Una vez teñidos los leucocitos, se identifican por sus caracterı́sticas y grado de

desarrollo.
6
mediadores quı́micos que modulan los procesos de la inflamación.
7
aumento en el número de leucocitos.
16 3 FUNDAMENTOS

Tipo de célula Imagen de un Atlas de Características


Hematología(aumento:400 veces)

1. Neutrófilo en banda
2. Neutrófilo segmentado
NEUTRÓFILO 3. Eritrocito
4. Neutrófilo en segmentación
De acuerdo a la forma de su núcleo se les
puede clasificar en neutrófilos en banda o
cayados y en neutrófilos segmentados.
Presentan núcleos divididos en 3 a 5 lóbulos.

Núcleo en forma de anteojo y gránulos


gruesos en el citoplasma.

EOSINÓFILO

Posee un núcleo en forma de lóbulos difícil


de distinguir a causa de los gránulos gruesos
y obscuros del citoplasma.
BASÓFILO

Núcleo redondo y grande.


El borde del citoplasma celular es
ligeramente azulado y bien definido.
LINFOCITO

Células fagocíticas con gran capacidad


bactericida.
Por la fagocitosis aumentan de tamaño.
MONOCITO

Figura 3.4: Tipos de leucocitos y sus caracterı́sticas.

Figura 3.5: Preparación de frotis sanguı́neo.


3.1 Conceptos biológicos 17

Figura 3.6: Observación y conteo de leucocitos.

Reporte. Se cuentan en una muestra vista al microscopio óptico alrededor de 100 células

para expresar los resultados a manera de porcentaje. En el lado izquierdo de la figura

3.6 se muestra un aparato similar a una máquina de escribir que utiliza el quı́mico

para realizar el conteo mientras observa al microscopio.

Los colorantes utilizados en el método de tinción descrito anteriormente se utilizan en la

mayorı́a de los laboratorios clı́nicos en México y son los que se utilizaron en este trabajo

de tesis. De acuerdo a las imágenes consultadas en diversas fuentes se puede notar que

la coloración que adquieren los leucocitos es muy similiar al ser teñidos para Recuento

Diferencial, lo cual significa que es posible utilizar distintos colorantes para la tinción de

los frotis sin afectar de forma considerable la coloración que comúnmente adquieren para

ser diferenciados.

Método automático

No existe un método único para contar células, lo cual implica que hay en el mercado

varios modelos de contadores hematológicos y cada uno de ellos realiza su función de una

forma especı́fica; sin embargo, los parámetros que miden y los resultados de sus medicio-

nes son muy similares. Como ejemplo para este estudio, se han escogido los contadores

Beckman Coulter8 por su sencillez y uso extendido; sin querer decir con ello que sean los

mejores o los únicos modelos existente para este propósito9 .

Un contador hematológico debe contar, como mı́nimo, la serie blanca (glóbulos blancos)

y la serie roja (glóbulos rojos). Es decir, el total de leucocitos y el total de eritrocitos, sin
8
empresa lı́der en el comercio de equipo de laboratorio y contadores hematológicos.
9
En los laboratorios de SESA en Tlaxcala se utilizan el sistema K-1000 [Ses, 1999].
18 3 FUNDAMENTOS

hacer distinción entre las poblaciones de células que componen a cada una de las series.

A esto se le llama CBC –Complete Blood Count–. Aparte de esta cuenta, un contador

hematológico también debe proporcionarnos la cuenta de toda la serie blanca; es decir,

diferenciación entre los componentes de la población blanca. Esto es lo que se llama el

White Blood Differential (Modo Diff, Recuento Diferencial).

La tecnologı́a VCS (Volumen, Conductividad y dispersión) es el mecanismo por el cual

los analizadores de hematologı́a COULTER realizan la diferenciación de leucocitos en 5

tipos: Neutrófilos, Linfocitos, Monocitos, Eosinófilos y Basófilos [Galénica, 2005].

Principios del método:

La muestra de sangre es mezclada con el reactivo Erythrolyse (contenido en el reactivo

Scatter Pack), lo cual produce una rápida lisis10 de los eritrocitos y reduce los restos

celulares sin alterar los leucocitos. Posterior a esta reacción se agrega el reactivo StabiLyse,

el cual actúa como preservante11 de los leucocitos a fin de que resistan en su estado casi

nativo las mediciones subsecuentes –Volumen, Conductividad y Dispersión–.

Una vez tratada la muestra es dirigida a una celda de flujo en la cual por el diseño

hidrodinámico, los leucocitos se alinean y pasan formados uno a uno y en donde se realizan

las siguientes mediciones:

El volumen celular se obtiene mediante la impedancia de baja frecuencia que pre-

senta al paso de la corriente continua.

La conductividad al aplicar radiofrecuencia12 , que da información sobre la densidad

celular.

La dispersión al hacer incidir sobre la célula una luz láser, lo que proporciona

información sobre estructura y forma de la célula.

De esta manera son realizadas las 3 determinaciones de manera simultánea. Las lecturas de

estas 3 señales análogas son enviadas al analizador para su amplificación y proceso, luego el
10
rompimiento o destrucción de las células.
11
sustancia que actúa como conservador o protector de los leucocitos.
12
porción del espectro electromagnético que se obtiene al aplicar corriente alterna a una antena
[Wikipedia Foundation, 2006].
3.2 Conceptos Estadı́sticos 19

Figura 3.7: Tecnologı́a VCS. a) Preparación de la muestra. b) Volumen. b) Conducti-


vidad. d) Dispersión. e) Pruebas simultáneas.

sistema genera 3 gráficos. DF1: Volumen vs. Dispersión, DF2: Volumen vs. Conductividad

y DF3: Volumen vs. Conductividad, en ésta última se extraen las señales de Neutrófilos

y Eosinófilos. En la Figura 3.7 tomada de [Galénica, 2005], se muestra el procedimiento

antes descrito.

El sistema caracteriza cada célula que pasa hasta completar un conteo de 8,132 células

o partı́culas que sobrepasen un cierto volumen o bien hasta que transcurran 20 segundos,

cualquiera de las 2 situaciones que ocurra primero [Beckman Coulter, 2006].

En la Figura 3.8 se muestran algunos modelos de contadores hematológicos comerciales

[Beckman Coulter, 2006].

3.2. Conceptos Estadı́sticos

Uno de los principales objetivos del análisis de imágenes por computadora consiste en

dotar a la máquina de la capacidad de reconocimiento similar a la de los seres humanos;

para esto es necesario definir un patrón, es decir, una descripción estructural o cuantitativa
20 3 FUNDAMENTOS

Figura 3.8: Contadores Hematológicos.

de un objeto o de alguna otra entidad de interés en una imagen. Las representaciones de

patrones utilizadas con más frecuencia son vectores para descripciones cuantitativas, y

cadenas o árboles para descripciones estructurales [Hair et al., 2001].

Dado que el método de solución a la problemática planteada en esta investigación

se relaciona con el análisis estadı́stico de la información objeto de este estudio, resulta

imperativo definir algunos conceptos básicos.

Definición 1 (Individuos o elementos) Personas u objetos que contienen cierta infor-

mación que se desea estudiar [Hair et al., 2001].

Definición 2 (Población) Conjunto de individuos o elementos que cumplen ciertas pro-

piedades comunes [Hair et al., 2001].

Definición 3 (Muestra) Subconjunto representativo de una población [Hair et al., 2001].

Definición 4 (Caracterı́stica) Propiedad, rasgo o cualidad de los elementos de la po-

blación. Las caracterı́sticas pueden ser cualitativas y cuantitativas [Hair et al., 2001].

Definición 5 (Varianza) Mide cuánto varı́a una variable X respecto a un valor esperado.

Si µ ≡ E[X], la varianza se define como:

var(X) = E[(X − µ)2 ] = E[X 2 ] − µ2 (3.1)

La varianza se denota por σ 2 [Alpaydm, 2004].


3.2 Conceptos Estadı́sticos 21

Definición 6 (Desviación estandar) Se denota por σ. La desviación estandar tiene la

misma unidad que X [Alpaydm, 2004]. Se define como:

p
σ= var(X) (3.2)

Definición 7 (Covarianza) Indica la relación entre dos variables aleatorias. Si la ocu-

rrencia de X hace más probable la ocurrencia de Y , la covarianza es positiva; es negativa

si las ocurrencias de X hacen menos probable las ocurrencias de Y y es 0 si no hay depen-

dencia [Alpaydm, 2004].

cov(X, Y ) = E[(X − µX )(Y − µY )] = E[XY ] − µX µY (3.3)

Algunas de sus propiedades son:

cov(X, Y ) = cov(Y, X) (3.4)

cov(X, X) = var(X) (3.5)

Definición 8 (Media o valor esperado) Es el valor promedio de X en un amplio núme-

ro de experimentos. Se denota por E[X] o µ [Alpaydm, 2004].

Considerando una observación s, un vector caracterı́stico x y una clase wi , se definen los

siguientes conceptos:

Función de masa de probabilidad discreta, FMP: P (wi )

X
P (wi ) = 1 (3.6)
i

Función de densidad de probabilidad continua, FDP: p(x)

Z
p(x)dx = 1 (3.7)
22 3 FUNDAMENTOS

Valor esperado: E(x)


Z
E(x) = xp(x)dx (3.8)

Entre las funciones de densidad de probabilidad –FDP–, la función de densidad normal

o gaussiana es la más utilizada debido a las propiedades que presenta y es útil en situaciones,

en las cuales un conjunto de patrones de una determinada clase toman valores en un rango

contı́nuo y alrededor de un patrón promedio, es decir, considera que los patrones de clases

diferentes tienen ciertos valores, pero los valores de una clase son lo más parecidos posible.

Algunas propiedades de la Distribución Normal son:

Parámetros que especifican la distribución. La función de densidad normal queda

completamente especificada por pocos parámetros. En el caso unidimensional: la

media y la varianza. En el caso multidimensional, el vector medio y la matriz de

covarianza.

Incorrelación e independencia. Dado un conjunto de patrones que siguen una distri-

bución normal, si las variables asociadas están incorrelacionadas, entonces son inde-

pendientes.

Justificación fı́sica. La suposición de normalidad es una aproximación razonable para la

mayor parte de los datos tomados de la Naturaleza. Lo cual es cierto, en particular,

para variables aleatorias que son suma de otras variables y el teorema central del

lı́mite13 puede aplicarse [Cortijo, 2001].

Cuando se analiza la distribución de más de una variable, se denomina distribución normal

multidimensional, y se expresa como:

1 −1 X
(x−µ)t Σ−1 (x−µ)
p(x) = d P 1 e 2 ∼ N (µ, ) (3.9)
(2π) |
2 | 2

donde,
13
el teorema dice que cuando se tiene un grupo numeroso de variables independientes y todas ellas siguen
el mismo modelo de distribución (cualquiera que éste sea), la suma de todas ellas se distribuye según una
distribución normal [Garcı́a and Sierra, 2001].
3.2 Conceptos Estadı́sticos 23

d =, número de dimensiones.

x = {x1 , ..., xd }, vector de entrada.

µ = E(x) = {µ1 , ..., µd }, vector de medias.


P P
= E((x − µ)(x − µ)t ), matriz de covarianza con elementos σij ,inverso −1 , y determi-
P
nante | |

σij = σji = E((xi − µi )(xj − µj )) = E(xi xj ) − µi µj

Algunas propiedades de las distribuciones gaussianas multidimensionales son:

Si las dimensiones ith y jth son estadı́sticamente o linealmente independientes, en-

tonces

E(xi xj ) = E(xi )E(xj ) y σij = 0 (3.10)

Si todas las dimensiones son estadı́sticamente o linealmente independientes, entonces


P
σij = 0, ∀i 6= j, y la matriz de covarianza posee elementos diferentes de cero en la

diagonal.

P
Si la densidad subyacente es gaussiana y es una matriz diagonal, entonces las

dimensiones son estadı́sticamente independientes, y

d
Y
p(x) = p(xi ) , p(xi ) ∼ N (µi , σii ) y σii = σi2 (3.11)
i=1

3.2.1. Métricas de similitud

Distancia de Mahalanobis

Si un conjunto de patrones siguen una distribución normal, tienden a representarse

formando un único agrupamiento de manera que el centro de este agrupamiento está de-

terminado por el vector medio, y la forma por la matriz de covarianza. En la Figura 3.9 se

muestra la función de densidad de probabilidad para una clase cuyos patrones siguen una

distribución normal.

De la ecuación 3.9 se deduce que los puntos para los cuales el valor de la densi-

dad de probabilidad constante están situados en hiperelipsoides cuya forma cuadrática


24 3 FUNDAMENTOS

Figura 3.9: Gráfica representativa de una Distribución Gaussiana

Figura 3.10: Proyección sobre el plano definido por las variables X1 y X2

P−1
(x − µ)T (x − µ) es constante. El valor de esta expresión es la Distancia de Maha-

lanobis de x a µ.

En el caso bidimensional, estas elipses pueden verse claramente en la Figura 3.10, donde

los contornos de igual densidad de probabilidad son hiperelipsoides con una distancia de

Mahalanobis a µ constante [Cortijo, 2001]. Las direcciones de los ejes principales de estos
P
hiperelipsoides están determinadas por los autovectores14 de y sus longitudes por los

autovalores15 correspondientes.

La utilidad de la Distancia de Mahalanobis como medida de similitud radica en que

es una forma de determinar la similitud entre dos variables aleatorias multidimensionales,

se diferencia con la distancia euclı́dea en que considera la correlación entre las variables
14
también llamados eigenvectores, son vectores no nulos que al ser transformados por un operador dan
lugar a un múltiplo escalar de sı́ mismos λ, con lo que no cambian su dirección [Wikipedia Foundation, 2006].
15
también llamados eigenvalores, son los escalares λ obtenidos por un eigenvector
[Wikipedia Foundation, 2006].
3.2 Conceptos Estadı́sticos 25

aleatorias. Algunas propiedades importantes que cumple la distancia de Mahalanobis para

ser una distancia son [Hair et al., 2001]:

Semipositividad. La distancia entre dos puntos de las mismas coordenadas es cero,

y si tienen coordenadas distintas es positiva, pero nunca negativa.

Simetricidad. La distancia entre los puntos a y b es la misma que entre los puntos

b y a.

Desigualdad triangular. d(a, b) ≤ d(a, c)∀a, b, c²X

3.2.2. Análisis de Componentes Principales –PCA–

También conocido en algunas áreas como transformada discreta de Karhunen-Loéve o

transformada de Hotelling. Es un método no supervisado que no utiliza la información de

salida, cuyo criterio más importante es la varianza [Alpaydm, 2004].

Esta técnica estadı́stica transforma linealmente un conjunto de variables en un con-

junto sustancialmente pequeño de variables no correlacionadas, que representan la mayor

cantidad de información del conjunto de datos original, es decir reduce la dimensión de un

conjunto de n variables a un conjunto m variables, que estan áltamente correlacionadas.

Un conjunto mucho más pequeño de variables no correlacionadas es mucho más fácil

de entender o procesar en análisis posteriores –por ejemplo con métricas– que el conjunto

grande –original– de variables correlacionadas [Solano, 2002].

PCA se fundamenta en el hallazgo de factores –componentes principales– que sucesi-

vamente demuestren la mayor parte de la varianza total. La técnica consisten en:

1. Detectar vectores no correlacionados, llamados componentes principales.

2. Ordenar los componentes principales considerando primero a aquellos con desviación

más alta, dejando al final los que poseen las desviaciones más bajas.

3. Eliminar a los componentes principales que contribuyen menos en la variación en el

conjunto de datos.
26 3 FUNDAMENTOS

De esta manera, el primer factor o componente es el que contiene una mayor parte de la

varianza, el segundo es el que tiene la mayor parte de la varianza restante y ası́ sucesiva-

mente.

Reducir el conjunto de datos facilita el proceso del clasificador, ahorra tiempo de pro-

cesamiento y reduce la demanda en los recursos de cómputo [Reyes, 2005].

De acuerdo al trabajo realizado por Alejandro Guzmán en [Guzmán, 2002], el uso de

PCA como método para segmentar imágenes tiene algunas ventajas como las siguientes:

Una mejor representación del espacio de representación de color, simplificando la

clasificación.

Una posible reducción de dimensiones fı́sicas del espacio de representación de color

(3D, 2D ó 1D).

Sintetizar información útil sobre la imagen y crear nuevos parámetros para el análisis

de la imagen.

Respecto a otras técnicas, PCA es más simple de implementar.

Considerando las ventajas de ésta técnica es posible la implementación de una segmentación

semi-automática debido a su transformación lineal, ya que manipula la información sin

distorsionarla [Guzmán, 2002].

3.3. Análisis de imágenes

Las funciones necesarias en un sistema de visión son [Awcock and R., 1996]:

Una escena bajo condiciones controladas.

Captura de una imagen.

Análisis de la imagen.

Reconocimiento de ciertos objetos dentro de ella.


3.3 Análisis de imágenes 27

Figura 3.11: Modelo de un sistema de visión.

En la Figura 3.11, tomada de [Awcock and R., 1996] se muestra un modelo genérico de los

elementos que componen un sistema de visión.

La adquisición de la imagen se refiere al proceso de trasladar los estı́mulos luminosos

recibidos por fotosensores de una cámara para su almacenamiento digital dentro de la

memoria de una computadora.

La etapa de preprocesamiento dentro del análisis de imágenes involucra al conjunto

de técnicas que permiten adquirir una imagen y manipularla para la obtención de mejores

resultados en las etapas posteriores. Dentro de las técnicas utilizadas en el preprocesamiento

se encuentra la eliminación de ruido, que consiste en aplicar un filtro que quita elementos no

deseados en la imagen. El filtro se construye analizando las propiedades de cada elemento

que forma a la región de interés en la imagen [Awcock and R., 1996].

En la parte del análisis de imágenes se trabaja con los datos obtenidos en la etapa

de preprocesamiento, es decir con imágenes que no tienen ruido o lo tienen en pequeñas

cantidades. De esta manera comienza el análisis aplicando técnicas de segmentación que

varı́an de acuerdo al objetivo del problema, en ocasiones interesa identificar texturas y en

otras, formas, color o combinaciones de éstas. Por lo tanto, antes de elegir una técnica para

segmentar, es necesario identificar las caracterı́sticas de los elementos que interesan en la

imagen.
28 3 FUNDAMENTOS

3.3.1. Segmentación

La segmentación consiste en dividir una imagen en regiones o partes que la constituyen,

y se basa en tres propiedades [de la Escalera, 2001]:

Similitud. Cada uno de los pixeles de un elemento tiene valores parecidos para alguna

propiedad.

Discontinuidad. Los objetos destacan del entorno y tienen por lo tanto bordes definidos.

Conectividad. Los pixeles pertenecientes al mismo objeto son contiguos (estan agrupa-

dos).

Las técnicas que se utilizan para lograr la segmentación se basan en la búsqueda de partes

uniformes en la imagen, o bien de partes en las que se produce algún cambio. Ası́, una vez

detectados los puntos que presentan éstas discontinuidades o bordes se debe encontrar un

camino entre el pixel P1 y el pixel Pn , lo que permite definir un camino como una secuencia

de puntos P2 , P3 , ..., Pn − 1, donde el pixel Pi+1 es vecino del pixel Pi . Una región es un

camino entre cualquier pareja de sus puntos, y todos los pixeles del camino pertenecen

a la región. De esta manera, como producto de la segmentación se tiene un conjunto de

regiones:

Ri Son las regiones que no tocan los bordes de la imagen.

R Es el conjunto unión de todas las regiones Ri .

Rc Es el conjunto complemento de R.

Esto permite definir:

Fondo. Puntos que pertenecen a Rc y son contiguos a los bordes de la imagen

Agujeros. Puntos que pertenecen a Rc y no son contiguos a los bordes de la imagen.

Al segmentar generalmente se obtienen los datos de pixel en bruto que forman parte de

una región o de su contorno y el siguiente paso es decidir si los datos de interés pertenecen
3.3 Análisis de imágenes 29

al contorno, a la región o a ambos. No obstante, el éxito en el uso de cualquier técni-

ca empleada en la etapa de segmentación de imágenes de muestras biológicas siempre se

verá afectada por factores como la calidad en la preparación de dicha muestra, de la cual

se tomará la imagen a analizar.

Otro factor importante a considerar en la segmentación, es el conjunto de condiciones

requeridas para la adquisición de la imagen, incluyendo cambios en la iluminación y niveles

de acercamiento para la captura de la imagen, entre otros.

En las imágenes a color, un pixel está constituı́do a partir de la combinación de al

menos 3 componentes (RGB). Existen diferentes formas de representación espacial para

un mismo color [Guzmán, 2002].

Realizar un estudio como el que se describe en [Guzmán, 1997] permite elegir el espacio

de color más apropiado para llevar a cabo la segmentación basada en color.

Existen muchas técnicas de segmentación [Pal and Pal, 1993] y respecto a la segmen-

tación en color se pueden distinguir dos grandes grupos:

Aquellas que trabajan directamente sobre el espacio imagen. Este conjunto de técnicas

se puede dividir en dos grandes sub-grupos que engloban la mayor parte de técnicas

utilizadas hasta antes del desarrollo de las herramientas propias a la inteligencia

artificial; la segmentación por crecimiento de regiones y la detección de contornos. La

primera utiliza un criterio de homogeneidad como parámetro para eliminar la región.

Mientras que la segmentación por detección de contornos busca fuertes variaciones

de algún parámetro dentro de la imagen utilizando operadores diferenciales16 . En

[Flores, 2001] se muestra un ejemplo de segmentación por regiones.

Aquellas que trabajan sobre el espacio de representación de color. Se fundamentan en

la teorı́a de análisis de datos para hacer la clasificación. Entre las técnicas útiles para

hacer éste análisis se encuentra el análisis de componentes principales –PCA–. En la

sección 3.2.2 se describieron algunas ventajas de esta técnica para la segmentación.

16
operadores relacionados con el cálculo de derivadas e integrales.
30 3 FUNDAMENTOS

3.3.2. Filtrado espacial

El filtrado espacial, también llamado suavización consiste en el uso de máscaras espa-

ciales para el procesamiento de las imágenes, y las máscaras se denominan filtros espaciales.

Los filtros suavizantes se utilizan para hacer que la imagen aparezca algo borrosa y para

reducir el ruido favoreciendo la eliminación de pequeños detalles de una imagen antes de

la extracción de un objeto (grande) y/o permitiendo el relleno de pequeños espacios entre

lı́neas o curvas [González and Woods, 1996]. A continuación se describe el filtro de la me-

diana, dado que se hace uso de éste durante la última etapa de la segmentación descrita

en la sección 6.1.2.

Filtro de la mediana

Consiste en reemplazar el nivel de gris por la mediana de los niveles de gris en un entorno

de este pixel. Es un método efectivo cuando la caracterı́stica que se desea preservar es la

agudeza de los bordes.

La mediana m de un conjunto de valores es tal que la mitad de los valores del conjunto

quedan por debajo de m y la otra mitad por encima. Por ejemplo, para realizar el filtrado

por la mediana en el entorno de un pixel, primero se deben extraer los valores del pixel y

de su entorno, determinar la mediana y asignar éste valor al pixel. En la Figura 3.12 se

muestra este procedimiento. Los tres pasos mostrados en dicha figura se repiten mientras

se realiza un recorrido por toda la imagen.

La función del filtrado es introducir puntos con intensidades distintas que sean más

parecidos a sus vecinos, eliminando los estrechos picos de intensidad que aparecen aislados

en el área cubierta por la máscara de filtrado.

3.4. Extracción de caracterı́sticas

El objetivo principal de un extractor de caracterı́sticas es describir un objeto para su

reconocimiento por medidas cuyos valores son muy similares para objetos de la misma
3.4 Extracción de caracterı́sticas 31

Figura 3.12: Procedimiento para implementar el Filtro de la mediana.

clase, y muy diferentes para objetos de diferentes clases. Existen caracterı́sticas que son

invariantes a transformaciones irrelevantes de la entrada, por ejemplo caracterı́sticas que

describen propiedades como figura, color y textura son invariantes a rotación, traslación y

escala [Duda, 2001].

Un gran número de transformaciones complejas surgen en torno al reconocimiento de

patrones y la mayorı́a son de dominio especı́fico. En algunos casos, variaciones en la ilumi-

nación o efectos indeseados de sombras se deben tomar en cuenta como en la segmentación,

donde la tarea de extraer caracterı́sticas constituye un problema y es dependiente del do-

minio, que es la clasificación propia que requiere del conocimiento de dicho dominio.

Sin embargo, algunas técnicas de clasificación de patrones tales como agrupamiento y

aprendizaje no supervisado, métodos estocásticos17 , redes neuronales multicapa, funciones

discriminantes lineales y técnicas no paramétricas, también se pueden utilizar en el diseño

de un extractor de caracterı́sticas y en la selección de las mismas.

El diseño de un sistema de reconocimiento de patrones requiere generalmente la re-

petición de un conjunto de actividades como la colección de datos, la selección de carac-

terı́sticas, la selección del modelo, el entrenamiento del clasificador18 y la evaluación. En

la Figura 3.13, tomada de [Duda, 2001] se muestra el ciclo de éste diseño, en principio

se colectan los datos para entrenar y probar el sistema. Las caracterı́sticas de los datos

17
relativos a la teorı́a estadı́stica de los procesos cuya evolución en el tiempo es aleatoria.
18
Un clasificador es una función que mapea una instancia no etiquetada a una etiqueta utilizando estruc-
turas de datos internas [Kohavi, 1995].
32 3 FUNDAMENTOS

Figura 3.13: Diseño de un sistema de reconocimiento de patrones.

afectan a la elección de caracterı́sticas discriminantes apropiadas y la elección de modelos

para las categorı́as distintas. El proceso de entrenamiento utiliza algunos o todos los datos

para determinar los parámetros del sistema, finalmente los resultados de la evaluación se

pueden repetir varias veces en el proceso para obtener resultados satisfactorios.

El proceso de extracción de caracterı́sticas para identificar un objeto en una escena

consiste en obtener información que permita describirlo.

Las caracterı́sticas de una imagen generalmente estan formadas por vectores que con-

tienen información especı́fica de dicha imagen. Estas caracterı́sticas pueden estar repre-

sentadas por lı́mites –propiedades externas– o por información alusiva a su representación

estructural –propiedades internas–.

En la mayorı́a de los casos, las caracterı́sticas más importantes estan relacionadas con

la forma de las regiones de interés en la imagen, y para describirla son útiles las propiedades

geométricas y los momentos [de la Escalera, 2001]. Las propiedades geométricas se relacio-
3.4 Extracción de caracterı́sticas 33

Figura 3.14: Caracterı́sticas morfológicas de una región.

nan con medidas de la región de interés, mientras que los momentos permiten obtener pro-

piedades de un objeto en términos de su área, posición y orientación [Awcock and R., 1996],

tales como la excentricidad, orientación y centro de masa.

Las caracterı́sticas morfológicas deben ser invariantes a traslación, rotación y escala.

En la Figura 3.14 se muestran algunas caracterı́sticas útiles para describir la forma de una

región.

Para describir un momento se considera la imagen de la Figura 3.15, donde la parte

izquierda representa un segmento de borde y la derecha muestra el segmento representado

como una función 1-D g(r) de una variable arbitraria r. Tratando la amplitud de g como

una variable aleatoria v y formando un histograma de amplitud p(vi ), i = 1, 2, ..., k, siendo

k el número de incrementos de amplitud discretos. Entonces el momento n-ésimo de v

respecto de su media es [González and Woods, 1996]:

k
X
µn (v) = (vi − m)n p(vi ) (3.1)
i=1

donde,
34 3 FUNDAMENTOS

Figura 3.15: Momentos.

k
X
m= vi p(vi ) (3.2)
i=1

La cantidad m es el valor medio de v y µ2 su varianza19 . Generalmente sólo se requieren

los primeros momentos para diferenciar formas claramente distintas.

Otra alternativa consiste en normalizar g(r) para que el área bajo ella sea la unidad y

tratarla como un histograma. En este caso, r es la variable aleatoria y los momentos son,

L
X
µn (v) = (ri − m)n g(ri ) (3.3)
i=1

donde,

L
X
m= ri g(ri ) (3.4)
i=1

En esta notación, L es el número de puntos en el borde y µn (r) está relacionado directa-

mente con la forma de g(r). Por ejemplo, el segundo momento µ2 (r) mide la dispersión de

los puntos de la curva con relación al valor medio de r, y el tercer momento µ3 (r) mide su

simetrı́a con relación a la media.

En la tabla 3.1 se describen algunas caracterı́sticas útiles para la descripción de la for-

ma de la región. El centro de masa en un tratamiento de sistemas de masas puntuales es

19
El subı́ndice 2 de µ, indica que se trata del segundo momento.
3.4 Extracción de caracterı́sticas 35

PROPIEDAD DESCRIPCIÓN
Área Número de pixeles que contiene la imagen
Longitud (en pixeles) del eje menor de la elipse que tiene los
Longitud de eje menor
mismos segundos momentos que la región
Longitud (en pixeles) del eje mayor de la elipse que tiene los
Longitud de eje mayor
mismos segundos momentos que la región
Caja circunscrita
Rectángulo más pequeño que puede contener la región
(Bounding Box )
Polı́gono convexo más pequeño que puede conte-
Envoltura convexa
ner la región. En la Figura 3.18, modificada de
(Convex Hull )
[Goodrich and Tamassia, 2003] se presenta un ejemplo.
Número de componentes conexas de la región menos número
Número de Euler de huecos en dicha región. En la Figura 3.17 se muestra un
ejemplo.
Diámetro del cı́rculo con la misma área que la región.
Diámetro equivalente p
D = 4Area/π
Proporción de pixeles en el convex hull que también estan
Solidez en la región.
S = Área/Área de Convex Hull
Proporción de los pixeles en el bounding box que también
Rectangularidad (extent) están en la región.
R = Área/Área de Bounding Box
Gráfica que representa la distancia del centro de masa de la
Signatura (firma) región a los puntos de su borde. En la Figura 3.16, tomada
de González, De Fu y Lee [1987] se observa un ejemplo.
Perı́metro Longitud (en pixeles) del contorno de una región.
Cuadratura del bounding box.
Elongación o razón de aspecto
S = base Bounding Box/altura de Bounding Box
Excentricidad de la elipse que tiene los mismos segundos
Excentricidad momentos que la región, es la relación entre el foco de la
elipse y su longitud de eje mayor.
Ángulo (en grados) entre el eje X y el eje mayor de la elipse
Orientación
que tiene los mismos segundos momentos que la región
Centro de masa (centroide,
Es el punto geométrico donde la resultante de las fuerzas
centro de gravedad)
gravitatorias ejercidas por todos los cuerpos del sistema se
anula. Se obtiene con
P P
x̄ = i xi /A, ȳ = i yi /A
donde, A es el área de la región
[Pajares and de la Cruz, 2002].

Tabla 3.1: Caracterı́sticas que permiten describir la forma de una región.


36 3 FUNDAMENTOS

Figura 3.16: Dos curvas de contornos sencillos y sus correspondientes firmas


de distancia-ángulo. En (a) r(θ) es constante. En (b) r(θ) = A sec(θ).

Figura 3.17: Regiones con número de Euler -2 y 0, respectivamente.

el punto donde se supone concentrada toda la masa del sistema. El centroide, el centro

de gravedad y el centro de masa pueden, bajo ciertas circunstancias, coincidir entre sı́.

En estos casos se suele utilizar los términos de manera intercambiable, aunque designan

conceptos diferentes.

El centroide es un concepto puramente geométrico mientras que los otros dos términos

(centro de gravedad y centro de masa) se relacionan con las propiedades fı́sicas de un cuer-

po. Para que el centroide coincida con el centro de masa, el objeto debe tener densidad

uniforme, o la distribución de materia a través del objeto debe tener ciertas propiedades,

tales como simetrı́a. Para que un centroide coincida con el centro de gravedad, el centroide

debe coincidir con el centro de masa y el objeto debe estar bajo la influencia de un campo

gravitatorio uniforme [Wikipedia Foundation, 2006].


3.5 Redes Neuronales 37

Figura 3.18: Convex Hull.

3.5. Redes Neuronales

A continuación se definirán algunos conceptos utilizados a lo largo de esta sección.

Definición 9 (Dato) Es un vector formado por valores que representan caracterı́sticas o

atributos de un objeto cualquiera.

Definición 10 (Clase) Conjunto de datos que poseen atributos o caracterı́sticas simila-

res.

Definición 11 (Patrón) Descripción estructural o cuantitativa de un objeto o de alguna

otra entidad de interés en una imagen.

Definición 12 (Conjunto de entrenamiento –Patrón de entrenamiento–) Patrones

usados por un clasificador (de pertenencia conocida o no a una clase) para estimar paráme-

tros de aprendizaje.

Definición 13 (Conjunto de validación –Patrón de prueba–) Patrones usados por

un clasificador (de pertenencia conocida a una clase) para probar el entrenamiento reali-

zado por un clasificador.

Definición 14 (Entrenamiento –Aprendizaje–) Proceso de usar un conjunto de en-

trenamiento para obtener funciones de decisión.


38 3 FUNDAMENTOS

Figura 3.19: De la neurona biológica a la neurona artificial.

Definición 15 (Época) Un paso completo sobre todos los patrones en el entrenamiento.

[Alpaydm, 2004].

3.5.1. Introducción

Una red neuronal artificial proporciona un método robusto para aproximar funciones

que utilicen valores reales, discretos y funciones valuadas en un vector. El aprendizaje con

redes neuronales artificiales es aplicable a problemas tales como procesamiento de imágenes

y sonido, control y optimización, predicción, entre otros [Acosta et al., ].

El modelo de una neurona artificial es una imitación del proceso fisiológico de una

neurona biológica. En la figura 3.19 [Acosta et al., ] se muestra un esquema comparativo

de las neuronas biológicas y las artificiales.

De la observación detallada de este proceso biológico se observan los siguientes análogos

con el sistema artificial:

1. Las entradas Xi .

2. Los pesos Wi .

3. θ, la función de umbral que la neurona debe sobrepasar para activarse.

Una neurona artificial es un elemento de cálculo no lineal y elemental que se organiza

como red [González and Woods, 1996]. Las señales de entrada a una neurona artificial

X1 , X2 , ..., Xn son variables continuas en lugar de pulsos discretos, como se presenta en una

neurona biológica. Cada señal de entrada pasa a través de una ganancia o peso, llamado peso

sináptico (fortaleza) de la conexión cuya función es análoga a la de la función sináptica de la


3.5 Redes Neuronales 39

Figura 3.20: Proceso básico de una red neuronal.

neurona biológica. Los pesos pueden ser positivos –excitatorios–, o negativos –inhibitorios–,

el nodo sumatorio acumula todas las señales de entradas multiplicadas por los pesos y las

pasa a la salida a través de una función de transferencia –función umbral–. La entrada

neta a cada unidad puede escribirse de la siguiente manera.

n
X −
→−→
netai = Wi Xi = X Y (3.1)
i=1

La secuencia de este proceso se muestra en la figura 3.20 [Acosta et al., ]. Una vez que se

ha calculado la activación del nodo, el valor de salida equivale a:

xi = fi (netai ) (3.2)

Donde fi representa la función de activación para esa unidad, que corresponde a la

función escogida para transformar la entrada netai en el valor de salida xi , y que depende

de las caracterı́sticas especı́ficas de la red.

Dentro de una red neuronal, las neuronas se encuentran agrupadas por capas, donde

una capa es una colección de neuronas que de acuerdo a su ubicación recibe los siguientes

nombres:

Capa de entrada: Recibe las señales de la entrada de la red.

Capas ocultas: Son capas que no tienen contacto con el medio exterior, sus elementos

pueden tener diferentes conexiones y son éstas las que determinan las diferentes
40 3 FUNDAMENTOS

Figura 3.21: Esquema básico de una neurona artificial que contiene una sóla
entrada.

topologı́as de la red.

Capa de salida: Recibe la información de la capa oculta y transmite la respuesta al

medio externo.

En la figura 3.21 se muestra una neurona de una entrada [Acosta et al., ].

De esta manera, la topologı́a de una red se define por su organización o arquitectura

interna, constituı́da por capas. Cada capa puede tener diferente número de neuronas, e

incluso distinta función de transferencia. Una función de transferencia es una función lineal

o no lineal de la salida neta de la red que determina la salida total de la red neuronal.

En la Figura 3.22, tomada de [Acosta et al., ] se muestran las funciones de transferencia

utilizadas frecuentemente con redes neuronales.

3.5.2. Tipos de Redes Neuronales

En general las redes neuronales se pueden clasificar de diversas maneras, según su

topologı́a, forma de aprendizaje (supervisado o no supervisado), tipos de funciones de acti-

vación, valores de entrada (binarios o continuos). En la figura 3.23 se muestra un esquema

de esta clasificación [Acosta et al., ]. Sin embargo, de acuerdo al trabajo de [Flores, 2001]

resulta válido considerar que la red ART2 también puede recibir entradas continuas.

Las Redes neuronales multicapa alimentadas hacia adelante se utilizan con frecuen-

cia para los problemas de reconocimiento de patrones multiclase, con independencia de

que las clases sean o no separables, y utilizando arquitecturas que constan de niveles de
3.5 Redes Neuronales 41

Figura 3.22: Funciones de transferencia de uso común.

Figura 3.23: Clasificación de las redes neuronales.


42 3 FUNDAMENTOS

perceptrones20 . En la Figura 3.24 tomada de [González and Woods, 1996], se muestra la

arquitectura de este modelo de red neuronal. La imagen ampliada muestra la estructura

básica de cada neurona de la red. El desplazamiento θ se trata como si fuese otro peso.

El número de neuronas de la primera capa A, es NA , genaralmente NA = n, donde n es

la dimensión de los patrones vectoriales que se dan como entrada. El número de neuronas

en la capa de salida Q se representa por NQ y es igual a M , es decir el número de clases que

la red es capaz de reconocer. La red reconoce a un patrón vectorial x como perteneciente a

una clase wm si la m-ésima salida de la red está activada, mientras que las restantes salidas

estan desactivadas.

Para desarrollar la regla de entrenamiento por retropropagación es preciso que se pueda

calcular la diferencial de las funciones por todos los caminos de la red, ası́ que la siguiente

función sigmoide de activación es diferenciable:

1
hj (Ij ) = (3.3)
1 + exp[−(Ij + θj )/θ0 ]

donde Ij , j = 1, 2, ..., Nj representan la entrada del elemento de activación de cada nodo de

la capa J de la red, θj es un desplazamiento, y θ0 controla la forma de la función sigmoide.

Esta arquitectura consta de numerosas capas de neuronas esructuralmente idénticas y

dispuestas de modo que la salida de cada neurona de una determinada capa alimenta las

entradas de todas las neuronas de la siguiente capa. La entrada de un nodo de cualquier

capa es la suma ponderada de las salidas de la capa anterior. Suponiendo que la capa K es

la que precede a la capa J, la entrada del elemento de activación de cada nodo de la capa

J, representada por Ij es:


Nk
X
Ij = wjk Ok (3.4)
k=1

para j = 1, 2, ..., Nj , donde Nj es el número de nodos de la capa J, NK es el número de

nodos de la capa K y wjk son los pesos que modifican las salidas Ok de los nodos de la

20
un perceptrón es una máquina de aprendizaje que al entrenarse utilizando conjuntos de entrenamiento
linealmente separables, éstos convergen a una solución en un número finito de iteraciones. Sus soluciones
toman la forma de coeficientes de hiperplanos capaces de separar correctamente las clases representadas
por los patrones del conjunto de entrenamiento [González and Woods, 1996].
3.5 Redes Neuronales 43

Figura 3.24: Modelo de red neuronal multicapa alineada hacia adelante (pro-
gresiva).
44 3 FUNDAMENTOS

capa K antes de alimentar los nodos de la capa J. Las salidas de la capa K son:

Ok = hk (Ik ) (3.5)

para k = 1, 2, ..., Nk . En la ecuación 3.4 se tiene que Ij , para j = 1, 2, ..., Nj representa la

entrada del elemento de activación del j-ésimo nodo de la capa J, con lo que I1 representa la

entrada del elemento de activación del primer (el más alto) nodo de la capa J, I2 representa

la entrada del elemento de activación del segundo nodo de la capa J, y ası́ sucesivamente.

Cada nodo de la capa J tiene Nk entradas y cada una se puede ponderar de forma distinta,

las Nk entradas del primer nodo de la capa J estan ponderadas por los coeficientes w1k , k =

1, 2, ..., Nk , y ası́ sucesivamente. Se requieren en total NJ xNk coeficientes para especificar

la ponderación de los pesos de las salidas de la capa K cuando alimentan a la capa J.

También se requieren NJ coeficientes de desplazamiento θj para especificar completamente

los nodos de la capa J.

Cuando se sustituye la 3.4 en 3.3 se obtiene la función de activación:

1
hj (Ij ) = PNk (3.6)
1 + exp[−( k=1 wjk Ok + θj )]/θ0

El principal problema del entrenamiento de una red multicapa consiste en ajustar los pesos

de las capas ocultas, ya que la salida deseada es desconodida.

3.5.3. Entrenamiento por Retropropagación

En el entrenamiento por retropropagación después de haber aplicado un patrón a la

red como estı́mulo, éste se propaga desde la primera capa a través de las capas superiores

de la red, hasta generar una salida. La señal de salida se compara con la salida deseada y

se calcula una señal de error para cada una de las salidas.

Las salidas de error se propagan hacia atrás, partiendo de la capa de salida, hacia

todas las neuronas de la capa oculta que contribuyen directamente a la salida, pero las

neuronas de la capa oculta sólo reciben una fracción de la señal total del error, basándose

aproximadamente en la contribución relativa que haya aportado cada neurona a la salida


3.5 Redes Neuronales 45

original. Este proceso se repite capa por capa, hasta que todas las neuronas de la red hayan

recibido una señal de error que describa su contribución relativa al error total. Basándose

en la señal de error percibida, se actualizan los pesos de conexión de cada neurona, para

hacer que la red converja hacia un estado que permita clasificar correctamente todos los

patrones de entrenamiento. De esta manera, a medida que se entrena la red, las neuronas de

las capas intermedias se organizan a sı́ mismas de modo que aprenden a reconocer distintas

caracterı́sticas del espacio total de entrada.

De acuerdo a la Figura 3.24, en la primera fase del método de retropropagación se

introduce un vector de entrenamiento y se permite la propagación del mismo por la red,

para calcular la salida Oj de cada nodo. Las salidas Oq de los nodos de la capa de salida

se comparan con las salidas deseadas rq con lo que se obtienen los términos de error δq .

La segunda fase consiste en volver hacia atrás por la red, pasando a cada nodo la

señal de error apropiada y realizando las correspondientes modificaciones de los pesos.

Este proceso se aplica también a los pesos correctores θj . Más adelante se describe con

detalle, el entrenamiento por retropropagación [González and Woods, 1996].

Situados en la capa de salida, el error medio cuadrático entre las respuestas deseadas rq y

las reales Oq de los nodos de la capa de salida Q, es:

NQ
1X
EQ = (rq − Qq )2 (3.7)
2
q=1

donde,NQ es el número de nodos de la capa de salida Q, y el 1/2 se usa por conveniencia

en la notación para el uso posterior de derivadas.

Para permitir el ajuste de los pesos de cada una de las capas de modo que minimice el

valor de una función de error cuya forma sea la mostrada en la ecuación 3.7, se comienza

ajustando los pesos de forma proporcional a la derivada parcial del error con respecto a

los pesos.
∂EQ
∆wqp = −α (3.8)
∂wqp

donde la capa P precede a la capa Q y α es un factor de correción positivo.

El error EQ es una función de las salidas Oq , que a su vez dependen de las entradas Iq
46 3 FUNDAMENTOS

de acuerdo a la imagen ampliada que se encuentra en la parte superior de la Figura 3.24.

Utilizando la regla de la cadena21 se evalúa la derivada parcial de EQ :

∂EQ ∂EQ ∂Iq


= (3.9)
∂wqp ∂Iq ∂wqp

De la ecuación 3.4:
Np
∂Iq ∂ X
= wqp Op = Op (3.10)
∂wqp ∂wpq
p=1

Sustituyendo las ecuaciones 3.9 y 3.10 en la ecuación 3.8, se obtiene

∂EQ
∆wqp = −α Op ∆wqp = −αδq Op (3.11)
∂Iq

donde,
∂EQ
δq = − (3.12)
∂Iq

Para poder calcular ∂EQ /∂Iq se utiliza la regla de la cadena y se puede expresar como la

variación de EQ con respecto a Oq , multiplicada por la variación de Oq con respecto a Iq .

Es decir,
∂EQ ∂EQ ∂Oq
δq = − =− (3.13)
∂Iq ∂Oq ∂Iq

De la ecuación 3.7:
∂EQ
= −(rq − Oq ) (3.14)
∂Oq

y de la ecuación 3.5:
∂Oq ∂
= hq (Iq ) = h0q (Iq ) (3.15)
∂Iq ∂Iq

Sustituyendo las ecuaciones 3.14 y 3.15 en 3.13, se obtiene

∂q = (rq − Oq )h0q (Iq ) (3.16)

que es proporcional a la magnitud del error (rq − Oq ). Sustituyendo las ecuaciones 3.12,

21 dy
La regla de la cadena dice que Si y = f (u), u = g(x), y las derivadas du y du
dx
existen ambas, entonces
dy dy du
la función compuesta definida por y = f (g(x)) tiene una derivada dada por dx = du dx
[Swokowski, 1989].
3.5 Redes Neuronales 47

3.14 en la ecuación 3.11 se obtiene:

∆wqp = α(rq − Oq )h0q (Iq )Op = αδq Op (3.17)

Cuando se introduce cualquier patrón de entrenamiento en la entrada de la red es posible

saber cuál es la salida de cada nodo rq . Ası́ se puede saber cómo se deben ajustar los

pesos que modifican los enlaces entre la última y penúltima capa de la red. De esta manera

concluye la primera fase del método de retropropagación.

Para analizar la segunda fase se comienza a analizar lo que sucede en la capa P . Al

realizar el procedimiento antes visto, se tiene:

∆wpj = α(rp − Op )h0p (Ip )Oj = αδp Oj (3.18)

donde el error es:

δp = (rp − Op )h0p (Ip ) (3.19)

En las ecuaciones anteriores 3.18 y 3.19 sólo se desconoce rp , el cual carece de importan-

cia en una capa interna, dado que no se sabe cuál serı́a la respuesta de un nodo interno

respecto a la pertenencia del patrón a una clase. Sólo se puede especificar la respuesta en

las salidas de la red, donde se realiza la clasificación definitiva del patrón. Por lo tanto,

se debe encontrar una forma de definir δp en términos de cantidades conocidas o que se

puedan observar en la red.

Considerando la ecuación 3.13, se observa que es posible escribir el término correspon-

diente al error de la capa P como:

∂EP ∂EP ∂Op


δp = − =− (3.20)
∂Ip ∂Op ∂Ip

∂Op
De acuerdo a la ecuación 3.15 el término ∂Ip es:

∂Op ∂
= hp (Ip ) = h0p (Ip ) (3.21)
∂Ip ∂hp
48 3 FUNDAMENTOS

que resulta conocido cuando se ha especificado hp , ya que es posible observar Ip . El término


∂EP
rq proviene de la derivada ∂Op , ası́ que se debe encontrar una expresión que no contenga

rp . Utilizando la regla de la cadena, se puede escribir la derivada como:

NQ NQ NP NQ NQ
∂EP X ∂EP ∂Iq X ∂EP ∂ X X ∂EP X
=− = (− ) Wqp OP = (− )wqp = δq wqp
∂Op ∂Iq ∂Op ∂Iq ∂Op ∂Iq
q=1 q=1 p=1 q=1 q=1
(3.22)

donde, la última expresión se obtiene de 3.12. Al sustituir las ecuaciones 3.21 y 3.22 en la

ecuación 3.20 se obtiene la expresión requerida δp :

NQ
X
δp = h0p (Ip ) δq wqp (3.23)
q=1

Con esta expresión, se puede calcular el factor δp , ya que todos sus términos se conocen.

Las ecuaciones 3.18 y 3.23 establecen la regla de entrenamiento para la capa P . Después

de calcular el término del error y los pesos de la capa P , se pueden usar estos resultados

para calcular el error y los pesos de la capa inmediatamente anterior a la capa P , es decir

se propaga hacia atrás el error de la red a partir del error de la capa de salida.

De esta forma al generalizar el procedimiento anterior se tiene que, para cualquier par

de capas K y J, siendo la capa K la que precede a la capa J, se deben calcular los pesos

wi,j que modifican los pesos entre ambas capas, utilizando

∆wi,j = αδj Ok (3.24)

Si la capa J es la capa de salida, δj es:

δj = (rj − Oj )h0j (Ij ) (3.25)

Si la capa J es una capa interna y P es la siguiente capa (por la derecha), entonces δj esta

dado por
NP
X
δj = h0j (Ij ) δp wjp (3.26)
p=1
3.5 Redes Neuronales 49

para j = 1, 2, ..., Nj .

Al utilizar la función de activación de la ecuación 3.6 con θ0 = 1, se obtiene

h0j (Ij ) = Oj (1 − Oj ) (3.27)

en este caso las ecuaciones 3.25 y 3.26 se expresan de la siguiente forma para la capa de

salida:

δj = (rj − Oj )Oj (1 − Oj ) (3.28)

y para las capas internas:


NP
X
δj = Oj (1 − Oj ) δP wjp (3.29)
p=1

En ambas ecuaciones j = 1, 2, ..., Nj .

Un método para minimizar la función de error medio es el Gradiente Escalado Con-

jugado que puede entrenar cualquier red neuronal cuyos pesos, entradas y funciones de

transferencia posean funciones que puedan ser derivadas. La Retropropagación es usada

para calcular derivadas de desempeño con respecto a los pesos y bias22 de las funciones. El

Gradiente Escalado Conjugado se basa en direcciones conjugadas y no realiza búsquedas

en lı́nea en cada iteración [MathWorks, 2000], el procedimiento detallado de éste método

se puede encontrar en [Mitchell, 1997]. Las condiciones de paro para este tipo de entrena-

miento son:

El número máximo de épocas (repeticiones) sea alcanzado.

La máxima cantidad de tiempo ha sido excedida.

El desempeño ha sido minimizado a la meta.

El gradiente de desempeño cae por debajo del mı́nimo..

El desempeño de la validación ha superado el número máximo de fallas de validación

desde la última vez que ocurrió el último fallo (Cuando se usa validación).
22
Es un sesgo del error, dado por δbθ (d) = E[d(X) − θ], donde d(X) es un estimador de θ, y θ es un
parámetro a evaluar [Alpaydm, 2004]. Según [Kohavi, 1995] el bias de un método para estimar un parámetro
θ está definido como el valor esperado menos el valor estimado.
50 3 FUNDAMENTOS

Es importante recalcar que no existe una técnica para determinar el número de capas

ocultas, ni el número de neuronas que debe contener cada una de ellas para un problema

especı́fico, esta elección es determinada por la experiencia del diseñador quien debe cum-

plir con las limitaciones computacionales. Además durante el proceso de entrenamiento, la

red Retropropagación tiende a desarrollar relaciones internas entre neuronas con el fin de

organizar los datos de entrenamiento en clases [González and Woods, 1996].

3.6. Técnicas de Validación

Existen diversos métodos para medir la precisión en los resultados obtenidos por un

clasificador. Uno de estos es la técnica de Ten Fold Cross Validation –TFCV–. Esta técnica

se realiza siguiendo 4 etapas:

1. Dividir el conjunto de datos en 10 partes iguales.

2. Tomar 9 partes para entrenar y una para probar.

3. Rotar los datos de tal manera que las partes elegidas para entrenar y para probar no

sean siempre las mismas.

4. Calcular la taza de error global, que es igual al promedio de las tazas de error obte-

nidas en cada partición.

Una vez concluı́das las 4 etapas de TFCV, se tiene un valor muy aproximado al ı́ndice de

reconocimiento real de la técnica usada para la clasificación [Moore, 2001].

Por otra parte, los estudios realizados por [Kohavi, 1995] indican que la técnica Ten-

fold stratified cross validation es buena para la selección de un modelo clasificador.

Si se desea hacer más eficiente el entrenamiento de una red neuronal es posible aplicar

algunas técnicas de pre y post procesamiento a los datos de entrada de la red. Algunas

técnicas útiles son:

La normalización que se realiza al dividir todos los datos de entrada entre el valor

del dato mayor.


3.6 Técnicas de Validación 51

Normalizar la media y la desviación estandar de los datos de entrenamiento, es decir

hacer que estos tengan una media=0 y desviación estándar=1.

El uso de Análisis de componentes principales.


Capı́tulo 4

Estado del Arte

Como se ha comentado en capı́tulos anteriores, el objetivo principal de este trabajo

de tesis es clasificar a leucocitos en segmentados y no segmentados utilizando como crite-

rio principal la forma de su núcleo, ası́ que en búsqueda de un método de segmentación

que permita separar al núcleo lo mejor posible para lograr una buena extracción de ca-

racterı́sticas, se han encontrado algunos trabajos relacionados con esta problemática. A

continuación se comentan algunos de ellos.

4.1. Segmentación de una imagen celular para diagnóstico

patológico

Este trabajo fue desarrollado por Dorin Comaniciu y Peter Meer [Comaniciu, 2001], en

el que se presenta un algoritmo de segmentación celular que detecta clusters en el espacio

de color Luv1 y delinea sus bordes al utilizar el procedimiento de movimiento del promedio

del gradiente ascendente2 . La segmentación se deriva al mapear los vectores de color de

la imagen y ubicarlas en un espacio especı́fico. En la Figura 4.1 se muestra un bosquejo

general de la problemática abordada en este trabajo.

Las muestras utilizadas son leucocitos digitalizados, cuyos colores son caracterizados
1
Modelo de color propuesto por la CIE que se deriva del espacio XYZ.
2
Para más información sobre este método consultar: D. Comaniciu, P. Meer, Distribution free descom-
position of multivariate data, Pattern analysis and applications, Vol.2 No. 1, pp. 22-30, 1999.
54 4 ESTADO DEL ARTE

Figura 4.1: Proceso de segmentación de imágenes celulares para diagnóstico


patológico.

Figura 4.2: Imagen de un leucocito tı́pico. La imagen segmentada se presenta en


pseudocolor.

por pocos elementos, clusters no gaussianos cuyas figuras son aisladas a partir de la imagen

que esta siendo procesada. Métodos no paramétricos tales como el análisis basado en la

moda, son particularmente convenientes para la segmentación de este tipo de datos debido

a que no definen las formas de los clusters. Algunos resultados de la segmentación producida

en este trabajo se muestran en las Figuras 4.2, 4.3 y 4.4, tomadas de [Comaniciu, 2001].

En el trabajo de Dorin Comaniciu y Peter Meer, el uso de métodos probabilı́sticos

para realizar la segmentación se tomó como elemento importante en el proceso de elección

de una técnica que permitiera conseguir buenos resultados en la segmentación efectuada

en este trabajo de tesis. Además de la posibilidad de trabajar con un espacio de color

distinto al RGB, que permitiera anular los efectos indeseados causados por los cambios de

iluminación durante la digitalización de las muestras.


4.1 Segmentación de una imagen celular para diagnóstico patológico 55

Figura 4.3: Calidad de la segmentación. a). Imágenes originales, arriba una célula
de linfoma de Mantle y las dos de abajo son especı́menes de leucemia linfocı́tica crónica.
b). Contornos. c). Células segmentadas.

Figura 4.4: Segmentación de núcleos de varias categorı́as de células. El borde


del núcleo está marcado con blanco.
56 4 ESTADO DEL ARTE

Figura 4.5: Esquema de segmentación. a). Generación de subimágenes conteniendo


células solas. b). Segmentación de núcleos y citoplasmas.

4.2. Automatización del Recuento Diferencial de la sangre

Neelam Sinha y A. G. Ramakrishnan [Sinha, 2002] utilizan una técnica para la automa-

tización del Recuento Diferencial de la sangre. La técnica recibe como entrada imágenes en

color de glóbulos blancos obtenidos de sangre periférica y determina el número de células

pertenecientes a cada clase. Este proceso incluye la segmentación, extracción de carac-

terı́sticas y clasificación. La Figura 4.5 se muestra el esquema de segmentación propuesto

[Sinha, 2002].

La segmentación se realiza en dos pasos sobre el equivalente HSV de la imagen, utili-

zando una agrupación K-Means seguida por el algoritmo EM3 . Las caracterı́sticas extraı́das

del citoplasma y núcleo segmentado, son elegidas por su aspecto visual, color y textura.

Se probaron varios clasificadores con diferentes combinaciones de caracterı́sticas. Para

entrenar a los clasificadores, se utilizó una base de datos de 50 ejemplares, 10 de cada clase.

Los datos de prueba, disjuntos del conjunto de entrenamiento, consisten de 34 elementos.

Se obtiene una clasificación del 97 % al utilizar redes neuronales. En la Figura 4.6, tomada

de [Sinha, 2002] se muestra la secuencia de procesamiento de un ejemplar.

Neelam Sinha y A. G. Ramakrishnan al utilizar métodos estadı́sticos para la segmen-

tación y hacer uso del espacio de color HSV proporcionan más evidencias acerca de que
3
–expectation-maximization –, este algoritmo primero calcula las probabilidades bayesianas posteriores
de los datos y obtiene los estimadores de parámetros actuales (paso E), y luego actualiza dichos parámetros
utilizando la media generalizada con teoremas ergódicos (paso M). Estos pasos se realizan alternadamente
hasta converger [Hen and Hwang, 2002].
4.3 Mejorado automático de detección de piel en imágenes de color 57

Figura 4.6: Secuencia de procesamiento. a. Imagen original. b. Imagen saturada. c.


Salida K-medias. d. Salida final.

la segmentación de células sanguı́neas es buena cuando se hace un estudio probabilı́stico

de la distribución del color sobre un espacio de color que maneja de forma separada la

información de la croma y la de iluminación.

Adicionalmente se comenta que el conjunto de entrenamiento se forma con igual núme-

ro de elementos de cada clase, lo que también se consideró en este trabajo de tesis al elegir

la cantidad de elementos que constituyen el conjunto de entrenamiento.

4.3. Mejorado automático de detección de piel en imágenes

de color

En este trabajo Filipe Tomaz, Tiago Candeias y Hamid Shahbazkia [Tomaz et al., 2003]

muestran una técnica de detección automática de piel. Las imágenes obtenidas se escalan

y se utiliza el espacio de color TSL debido a que los efectos ocasionados por el brillo y

los cambios de iluminación se reducen, de ésta manera la distribución de color de la piel

se puede representar con un modelo Gaussiano. También se hace uso de un filtro inicial

obtenido experimentalmente para eliminar pixeles que por sus caracterı́sticas en el modelo

RGB, no pueden pertenecer a la piel.

Como medida de similitud, se utiliza la Distancia de Mahalanobis para obtener un um-


58 4 ESTADO DEL ARTE

Figura 4.7: Esquema de la detección automática de piel en imágenes de color.

Figura 4.8: Secuencia de procesamiento. Imagen original y resultados obtenidos


después de aplicar la segmentación.

bral que permite segmentar a los elementos piel, de los no piel. De esta manera, analizando

y agrupando los elementos resultantes de este discriminador, se obtienen buenos resulta-

dos y se eliminan las áreas pequeñas que no son piel y que estan presentes en una escena

comúnmente compleja. En el estudio se incluyen personas asiáticas, caucásicas, africanas

o descendientes de éstas. El método no es restricto a orientación, tamaño o agrupación de

los elementos de interés. En la Figura 4.7 se muestra el esquema básico de segmentación

propuesto en este trabajo, mientras que los resultados al aplicar dicha técnica se muestran

en la Figura 4.8, tomada de [Tomaz et al., 2003] en la cual se observa un fondo complejo

con diferentes colores de rostros de piel.

Los pasos utilizados en la segmentación efectuada por Filipe Tomaz, Tiago Candeias

y Hamid Shahbazkia constituyeron una buena alternativa para utilizar esta técnica en el

presente trabajo de tesis. Además de confirmar, la utilidad de los métodos estadı́sticos para

el análisis del color en imágenes digitales.

4.4. Identificación automática de objetos aéreos usando Re-

des Neuronales

Mahmoud A. Abdallah, Tayib I.Samu y William A. Grissom [Abdallah et al., 1995] en

este trabajo describen el desarrollo de un sistema automático de identificación de objetos


4.4 Identificación automática de objetos aéreos usando Redes Neuronales 59

Figura 4.9: Componentes del sistema de clasificación de objetos aéreos. Adqui-


sición de caracterı́sticas y entrenamiento de la red neuronal.

Figura 4.10: Aviones utilizados en el estudio.

aéreos. En la Figura 4.9 se señalan las fases que componen a este sistema de clasificación.

Las caracterı́sticas extraı́das son representaciones gráficas de las siluetas de los 5 tipos

de objetos a clasificar, que son obtenidas con técnicas de procesamiento de imágenes y algu-

nas propiedades de la transformada de Fouriers (FFT), las 5 formas de objetos que se identi-

fican se muestran en la Figura 4.10, las imágenes fueron tomadas de [Abdallah et al., 1995].

La FFT elimina variaciones en las caracterı́sticas extraı́das tales como rotación o escala. El

entrenamiento de la red utilizada para clasificar utiliza el paradigma de Cuantización del

Vector de Aprendizaje. La clasificación de los objetos es buena no importando su rotación,

escala o traslación, obteniendo un ı́ndice de reconocimiento del 95 %.

El método utilizado por Mahmoud A. Abdallah, Tayib I.Samu y William A. Grissom

para extraer caracterı́sticas de la forma de objetos distintos, se consideró en este trabajo

de tesis puesto que los objetos que se deben reconocer se encuentran en diferentes tamaños

y posiciones. Con estas consideraciones, se extrajeron las caracterı́sticas que mejor descri-

ben a la formas nucleares de los leucocitos, que son objeto de estudio en este trabajo de

investigación.

Por otra parte también se comenta en [Abdallah et al., 1995], que el uso de las redes

neuronales resulta útil cuando se trabaja con caracterı́sticas similares a las extraı́das en el

trabajo antes descrito.


60 4 ESTADO DEL ARTE

Figura 4.11: Sistema de clasificación de células blancas sanguı́neas.

4.5. Análisis de imagen y aprendizaje supervisado en la di-

ferenciación automática de células blancas de imágenes

microscópicas

En este trabajo R. J. Katz [Katz, 2000] desarrolla un método de múltiples pasos (seg-

mentación, extracción de caracterı́sticas, uso de un clasificador) para diferenciar automáti-

camente imágenes de células blancas. En la Figura 4.11 se muestran los pasos que componen

el desarrollo de este sistema.

Primero se obtiene una imagen que contiene un núcleo celular que destaca en la es-

cena, la Figura 4.12 tomada de [Katz, 2000] muestra algunos ejemplares utilizados en su

estudio. La segmentación de la imagen en regiones de célula y no célula utiliza la detección

de bordes Canny (ver Figura 4.13 [Katz, 2000]) seguida por un algoritmo de identificación

de un cı́rculo, en la Figura 4.14 se encuentran algunos ejemplos con resultados que mues-

tran los cı́rculos obtenidos por Katz. El procedimiento para la detección de cı́rculos no es

completamente automático debido a que con el algoritmo no se obtienen buenos resultados

y la selección de la célula se realiza manualmente.


4.5 Análisis de imagen y aprendizaje supervisado en la diferenciación automática de células
blancas de imágenes microscópicas 61

Figura 4.12: Ejemplos de imágenes completas utilizadas en la investigación. De


izquierda a derecha: basófilo, eosinófilo, linfocito, neutrófilos.

Figura 4.13: Eosinófilo. Resultados de la detección de bordes Canny.

La extracción de las caracterı́sticas considera criterios como el color de la célula, ta-

maño e información morfológica nuclear. Con estos criterios se obtienen 25 caracterı́sticas

correspondientes a 206 imágenes de diferentes tipos, considerando diferente cantidad de

cada clase de célula.

Finalmente se evalúa a un conjunto de clasificadores4 con la herramienta WEKA5 uti-

lizando como referencia al clasificador ZeroR para compararlo con otros clasificadores. La

mejor clasificación se obtiene con una red neuronal entrenada con el algoritmo de retro-

propagación alcanzando un ı́ndice de error del 1.95 %.

El desempeño de los clasificadores generalmente es mejor en las clases que contienen

mayor número de instancias.

El estudio realizado por Katz concluye que la red neuronal de retropropagación resulta

ser la mejor elección como método para clasificar células sanguı́neas, y esto fue lo que con-

firmó el uso de redes neuronales en ésta tesis, además se descartó la posibilidad de formar

un conjunto de entrenamiento con diferente número de instancias para cada clase, pues

como lo dice Katz en su estudio, ésto provoca un mayor ı́ndice de reconocimiento sobre la

clase predominante.

4
OneR, ID3, C4.5, J4.8, IBk k vecinos más cercanos, Bayes simple y redes neuronales [Katz, 2000].
5
Ambiente para análisis de conocimiento que trabaja en plataforma Java y permite entrenar a un grupo
de clasificadores con un conjunto de datos comunes introducidos en un archivo [Katz, 2000].
62 4 ESTADO DEL ARTE

Figura 4.14: Ejemplos de cı́rculos ajustados manualmente. Resultados del algo-


ritmo de detección de cı́rculos.

4.6. Localización y rastreo de rostros humanos con Redes

Neuronales

H. Martin Hunke [Hunke, 1994] propone un localizador de rostros conexionista que uti-

liza el algoritmo de entrenamiento de retropropagación capaz de manipular la orientación

de la cámara y el tamaño de la imagen para almacenar el rostro de alguna persona locali-

zada cada vez que aparece ésta en una secuencia de imágenes. El sistema opera en tiempo

real y se puede adaptar rápidamente a diferentes condiciones de iluminación, diferentes

cámaras y rostros haciéndolo robusto respecto a variaciones ambientales. En la Figura 4.15

se muestra la organización del sistema [Hunke, 1994].

Como se puede observar se recibe como entrada una imagen, de la cual se obtienen

caracterı́sticas de color y movimiento que por un lado se combinan para darse como en-

trada a una red neuronal, y por otro se toman como un objeto que se da como entrada a

una cámara virtual que continúa con el proceso de rastreo. Los resultados del sistema se

observan en la Figura 4.16 [Hunke, 1994].

La técnica de segmentación utilizada consiste en hacer un mapeo del espacio RGB al


4.6 Localización y rastreo de rostros humanos con Redes Neuronales 63

Figura 4.15: Estructura del sistema de localización y rastreo de rostros huma-


nos.

espacio RG considerando que el color caracterı́stico de la piel contiene escasa o nula infor-

mación de B. En la Figura 4.17 tomada de [Hunke, 1994], se describe el procedimiento.

El ı́ndice de reconocimiento obtenido por la red es de 95.2 % cuando se entrena con

una combinación de caracterı́sticas de color y de movimiento, mientras que al entrenar con

solo caracterı́sticas de movimiento el ı́ndice de reconocimiento es de un 68 %.

La aportación que se toma del trabajo de H. Martin Hunke se relaciona con la posi-

bilidad de eliminar información de algún canal cuando se trabaja en un espacio de color

especı́fico. El análisis de color realizado por Hunke durante la segmentación es motivado

por el hecho de que la información del canal que no se considera en el análisis, no es im-

portante.

Por otro lado, el uso de la red neuronal de retropropagación utilizada en el trabajo de

Hunke confirma que ésta técnica de clasificación da buenos resultados.


64 4 ESTADO DEL ARTE

Figura 4.16: Localización de un rostro. a). Imagen original b). Imágenes en secuencia
c). Diferencia de las dos imágenes d). Conjunto de pixeles con caracterı́sticas de movi-
miento e). Aplicación del clasificador general de color de rostros –GFCC– f). Conjunto de
pixeles con caracterı́sticas de color de piel g). Objetos con caracterı́sticas de movimiento
y color de piel h). Objetos más grandes i). Rostro localizado.

Figura 4.17: Creación del clasificador de color de rostros. a). Primero se escoge
un área de interés en la imagen b). Se crea un modelo de distribución de color para el
área seleccionada c). Se umbraliza como pixeles de piel aquellos que posean valores que se
encuentren dentro de la media promedio.
4.7 Localización de rostros humanos en Tiempo Real 65

Figura 4.18: Localización de un rostro utilizando el modelo de color de piel.

4.7. Localización de rostros humanos en Tiempo Real

El trabajo de Jie Yang y Alex Waibel [Yang and Waibel, 1995] incluye un modelo es-

tocástico6 para caracterizar los colores de la piel en rostros humanos, similar al utilizado por

[Hunke, 1994]. Los resultados de la segmentación realizada por [Yang and Waibel, 1995] se

muestran en la Figura 4.18. La información que proporciona el modelo es suficiente para

detectar un rostro humano en varias poses y vistas. Además puede ser adaptado en tiempo

real para diferentes personas y condiciones de iluminación mientras la persona se mueve.

Para la detección de los rostros se utilizan tres tipos de modelos, uno para modelar el

color de la piel, otro para estimar el movimiento de la imagen y predecir la búsqueda en la

ventana, y un tercer modelo para la cámara, que se ocupa de predecir y compensar los mo-

vimientos de ésta. El control de la cámara utiliza un modelo basado en control predictivo

con un servidor basado en socket. La Figura 4.19 presenta un ejemplo del funcionamiento

completo del sistema propuesto por [Yang and Waibel, 1995].

El uso de métodos probabilı́sticos como apoyo para la segmentación similar al utilizado

por Hunke y la posibilidad de combinar caracterı́sticas para lograr una mejor clasificación

o toma de decisiones se tomó del trabajo de Jie Yang y Alex Waibel, pues finalmente se

demuestra que al tener una descripción más completa de los objetos o situaciones que son

motivo de estudio, es posible obtener buenos ı́ndices de clasificación o reconocimiento.

En la tabla 4.1 se resumen las ideas principales que se consideraron y dieron forma a

este trabajo de tesis.

Por otro lado, es importante referir algunos trabajos que también fueron útiles en el
6
Que esta determinado por el azar. Las leyes de causa-efecto no explican cómo actúa el sistema de
manera determinista, sino en función de probabilidades [Wikipedia Foundation, 2006].
66 4 ESTADO DEL ARTE

AUTOR NOMBRE DATOS CLASES TÉCNICA

Segmentación de
Dorin Imágenes de linfomas malignos,
imagen celular movimiento de la
Comaniciu y células leucemia linfocı́tica
para diagnóstico media
Peter Meer sanguı́neas crónica
patológico

linfocitos,
bayes, redes
Neelam Sinha y Automatización de Imágenes de monocitos,
neuronales.
A. G. recuento diferencial células neutrófilos,
Reconocimiento:
Ramakrishnan de la sangre sanguı́neas básofilos,
97 %
eosinófilos

piel humana de
Filipe Tomaz, Detección Imágenes de
raza asiática, distancia de
Tiago Candeias automática de piel escenas que
causásica, africana Mahalanobis y
y Hamid en imágenes en contienen piel
o descendiente de filtro de mediana
Shahbazkia color humana
éstas

Mahmoud A. Identificación Imágenes de FFT, red


Abdallah, Tayib automática de escenas que Tipo de objeto neuronal tipo
I. Samu y objetos aéreos contienen algún aéreo de un total LVQ.
William A. usando redes tipo de objeto de 5 Reconocimiento:
Grissom neuronales aéreo 95 %

Análisis de imagen
y aprendizaje Filtro de canny,
supervisado en la Tipo célula: bayes, zero, ID3,
Imágenes de
diferenciación neutrófilo, basófilo, C4.5, redes
R. J. Katz células blancas
automática de eosinófilo, linfocito, neuronales.
de la sangre
células blancas de monocito Reconocimiento:
imágenes 95.2 %
microscópicas

Localización y
Imágenes de Redes neuronales.
H. Martin rastreo de rostros
contienen piel piel humana Reconocimiento:
Hunke humanos con redes
humana 95.2 %
neuronales

Localización de Imágenes que


Jie Yang y Alex Modelo
rostros humanos en contienen piel piel humana
Waibel estocástico
tiempo real humana

Segmentación en
color con modelo
Clasificación de leucocitos
de Mahalanobis y
Marı́a del Rocı́o leucocitos Imágenes de segmentados,
red neuronal de
Ochoa Montiel utilizando visión frotis sanguı́neo leucocitos no
retropropagación.
por computadora segmentados
Reconocimiento:
99.54 %

Tabla 4.1: Principales trabajos relacionados


4.7 Localización de rostros humanos en Tiempo Real 67

Figura 4.19: Ejemplo de localización de un rostro usando una combinación de


color, geometrı́a, e información de movimiento.

desarrollo de este trabajo de tesis. Entre ellos se encuentra la investigación de J. C. Terri-

llon [Terrillon et al., 1998], quien utiliza un modelo de color de piel basado en la métrica de

Mahalanobis y realiza un análisis de forma basado en momentos invariantes para detectar

automáticamente rostros humanos en imágenes de escenas naturales bidimensionales. Para

distinguir los rostros de otros distractores se utiliza una red neuronal multicapa entrenada

con el algoritmo de retropropagación, la cual recibe como vector entrada a los momentos

invariantes que se obtienen de la región segmentada como piel. Sus resultados demuestran

la eficiencia de la combinación de la segmentación en color y los momentos invariantes usa-

dos en la detección de rostros que se encuentran en diferentes poses y rodeados de fondos

complejos.

J. C. Terrillon y Shigeru Akamatsu en [Terrillon and Akamatsu, 2000], presentan un

análisis de diferentes espacios de crominancia para la segmentación en color de rostros

humanos en escenas complejas, donde se concluye que el espacio de crominancia TSL es el

espacio que modela mejor el color de la piel humana.

Un método propuesto por [Pérez and Hague, 2002] para un sistema de razonamiento

basado en lógica difusa es capaz de elegir dinámicamente el mejor umbral para binarizar

una imagen en niveles de gris. Los resultados se prueban sobre un amplio conjunto de se-

cuencias en tiempo real de imágenes de un campo de coliflores, donde uno de los objetivos

es apoyar a un experto en la toma de decisiones, tales como el rocı́o de fertilizante, agua o


68 4 ESTADO DEL ARTE

pesticida. Además el sistema responde satisfactoriamente ante cambios en la iluminación.

En el trabajo de Daniela Mayumi y colaboradores [Ushizima et al., 2004] se presenta

un análisis de textura para el reconocimiento de leucocitos, donde la información textural

se utiliza para el cálculo de probabilidades que se utilizan como métrica para caracterizar

la organización espacial de los niveles de gris. Los resultados experimentales muestran que

los parámetros de textura son patrones especı́ficos de leucocitos, útiles en la diferenciación

de leucocitos normales y leucocitos de leucemia linfocı́tica crónica, evidenciando aspectos

de interés para el hematólogo tales como la cromatina7 nuclear y citoplásmica.

Guzmán de León [Guzmán, 2002], en un análisis de imágenes colposcópicas busca de-

tectar imágenes elementales de una manera automática o semiautomática, de tal forma

que no sea necesario que el ginecólogo colposcopista trace a mano esas regiones. El detec-

tar esas imágenes elementales permite eliminar subjetividades como localización, tamaño,

distancia, color y forma. Además resulta útil encontrar un parámetro que permita recono-

cer una patologı́a dada. El análisis de imágenes se hace con una técnica de segmentación

que trabaja sobre el espacio de representación de color, utilizando PCA para hacer una

transformación lineal que permite modelar un espacio de color exclusivo para imágenes

colsposcópicas.

Finalmente Ivón Arroyo y Agustı́n Schapira [Schapira and Arroyo, 1994] en su conta-

dor de células utilizan una técnica que permite realizar la identificación y conteo célular de

2 maneras. La primera consiste en seleccionar los objetos de interés a partir de los umbrales

de color mı́nimo y máximo que se desean en las células. La segunda forma de realizar la

identificación y conteo, se relaciona con las medidas reales que se requieren para aislar a

las células que cumplan con los parámetros dados por el usuario, las medidas se dan en

milı́metros que posteriormente se convierten a una longitud en pixeles. En este caso, el

sistema también permite seleccionar con el mouse una célula de interés para buscar a otras

células que cumplan con dichas caracterı́sticas de tamaño y color. El análisis de la imagen

se realiza con diversas operaciones con matrices.

7
Sustancia compleja constituida por ácidos nucleicos y proteı́nas, que se encuentra en el núcleo de las
células y se tiñe por los colorantes básicos de anilina.
Capı́tulo 5

Clasificación de leucocitos

Dentro de la primera sección de este capı́tulo se plantea la problemática de esta tesis,

mientras que en la segunda sección se describen los módulos que componen la metodologı́a

de solución. Los detalles de la implementación de cada módulo que constituye al método

de solución propuesto se mencionan en la sección 5.3.

5.1. Método para el reconocimiento de células sanguı́neas

Segmentadas y No Segmentadas

Las funciones involucradas en la solución a la problemática planteada en esta tesis se

basan en aplicar un procedimiento a una imagen que contiene una célula de interés, el cual

consiste en:

Extraer la región de interés, es decir la región que constituye al núcleo celular dado

que su forma determina la clase a la que pertenece la célula.

Obtener caracterı́sticas de la región etiquetada como núcleo.

Entrenar a una red neuronal con las caracterı́sticas adquiridas previamente.

La implementación de la solución propuesta en esta tesis se realizó en Matlab debido

a las caracterı́sticas de uso fácil, buen desempeño en el cálculo de operaciones matemáti-


70 5 CLASIFICACIÓN DE LEUCOCITOS

cas, manejo de funciones para el procesamiento de imágenes y entrenamiento de redes

neuronales.

5.2. Etapas en la solución del problema

La solución al problema planteado en esta tesis se compone de 5 etapas principales:

Adquisición y preprocesamiento de la imagen.

Segmentación en color.

Extracción de caracterı́sticas.

Entrenamiento de la red.

Reconocimiento de observaciones originales.

En la Figura 5.1 se muestra la organización general del método propuesto para clasificar

leucocitos. Los bloques a) y b) que aparecen con lı́neas punteadas representan dos casos

que se realizan en distintas ocasiones. Esto significa que se consideran tres métodos para

la clasificación de leucocitos y en cada uno sólo cambia el módulo de selección de carac-

terı́sticas.

En el módulo de adquisición y preprocesamiento de la imagen se obtiene una imagen

digitalizada de un campo visto en un microscopio óptico en el que se encuentra al menos

una célula de interés. En la sección 5.3.1 se presenta una descripción completa de esta

etapa. En el módulo de segmentación se utiliza el modelo propuesto por Filipe Tomaz en

[Tomaz et al., 2003], que se ha adecuado para obtener la región de interés. El procedimien-

to detallado se muestra en la sección 6.1.2.

El módulo de extracción de caracterı́sticas consta de tres procedimientos disjuntos, que

permiten obtener 3 conjuntos de caracterı́sticas, uno por cada procedimiento. En la sección

5.3.3 de este capı́tulo se muestra una descripción completa de dichos métodos.

En el módulo de Entrenamento de la red neuronal, se entrena a una red neuronal con

el algoritmo de retropropagación con los vectores de caracterı́sticas que se obtienen con


5.3 Método de clasificación de leucocitos 71

Figura 5.1: Organización general.

el método descrito en la sección 5.3.3. En la sección 5.3.4 se describe con más detalle el

proceso de éste entrenamiento.

En el módulo de Reconocimiento de las imágenes originales, se prueba a las redes

neuronales entrenadas, validando los resultados de cada entrenamiento con la técnica de

Validación cruzada en 10 particiones. En la sección 5.3.5 de este capı́tulo se discuten los

pormenores de este módulo.

5.3. Método de clasificación de leucocitos

Como se ha visto en secciones anteriores, las acciones que se realizan en cada etapa

pueden ser probadas de manera independiente.

Considerando las descripciones de los bloques que componen la solución del problema,

se describe cada etapa de este proceso en las secciones siguientes.


72 5 CLASIFICACIÓN DE LEUCOCITOS

Figura 5.2: Proceso de adquisición de la imagen.

5.3.1. Adquisición y Preprocesamiento de la imagen

La preparación y tinción de las observaciones biológicas utilizadas en este trabajo de

tesis se realizó por un experto clı́nico empleando el método Tinción de Giemsa y Azul de

metileno descrito en la sección 3.1.2, el cual permite diferenciar a los componentes celulares

por el tinte que adquieren con dichos colorantes. En la Figura 5.2 se muestra un bosquejo

general de las actividades involucradas en el proceso de adquisición y digitalización de la

imagen.

El microscopio óptico que se utilizó para las observaciones tiene 3 objetivos que poseen

diferentes grados de aumento 10x, 40x y 100x, estos números corresponden a la escala en la

que se observan los objetos a través del ocular. Para distinguir adecuadamente las imágenes

digitalizadas se utilizó el objetivo de 100X, colocando una gota de aceite de inmersión1


1
La función del aceite de inmersión es restringir el movimiento de la muestra, además de evitar el
rozamiento entre el cubre objetos y el objetivo, generalmente se utiliza cuando se observa con el objetivo
100x. Otra función del aceite de inmersión es evitar que la luz se desvı́e; lo que se pretende es que la luz
5.3 Método de clasificación de leucocitos 73

entre el portaobjetos que contiene el frotis sanguı́neo y la lente del objetivo.

La cámara utilizada para digitalizar las imágenes es una Moticam 350 diseñada espe-

cialmente para microscopios ópticos, algunas de sus caracterı́sticas son:

Resolución: 659 ∗ 494 pixeles

Rango de color: 24 bits ó 16.7 millones de colores

Sistema operativo: Windows 98/2000/M e

Formato de datos soportado: BMP, JPG, MIG

El procedimiento para adaptar la cámara al microscopio consiste en desmontar el lente

más exterior del ocular del microscopio y colocar la cámara ensamblada con los accesorios

adecuados en lugar de éste, sujetándola con tornillos de presión. En la Figura 5.3 se mues-

tra este procedimiento.

Para enfocar la imagen se mueven manualmente las perillas de los micrómetros del

microscopio hasta tener una visión clara de la imagen en el monitor. No obstante, existen

variaciones en la iluminación que no se logran controlar.

Al observar las muestras biológicas, se logra distinguir claramente el núcleo que se ca-

racteriza por tener un color morado en contraste con colores claros del citoplasma, y aún

más claros en el exterior de la célula. Esto facilita el uso de un método de segmentación

basado en color. Para evitar el excesivo costo de procesamiento computacional, cada ob-

servación se escala a un tamaño de 64X64 pixeles. En la Figura 5.4 se muestran algunos

ejemplares representativos de cada tipo de glóbulos blancos.

5.3.2. Segmentación en color

Los núcleos celulares constituyen los elementos más importantes en las observaciones

realizadas debido a su color que los diferencı́a del resto de los elemenos en la escena.

Además, la forma que presenta cada núcleo determina la clase a la que pertenece la célula.

En la Figura 5.5 se señala el núcleo de una célula perteneciente a la clase Segmentadas.


llegue concentrada hacia la muestra.
74 5 CLASIFICACIÓN DE LEUCOCITOS

Figura 5.3: Procedimiento de instalación de la cámara. Izq.- Montaje de Accesorios.


Der.- Cámara ajustada al microscopio.

Figura 5.4: Tipos de Leucocitos. Segmentados: neutrófilo y eosinófilo, No Segmenta-


dos: linfocito y monocito
5.3 Método de clasificación de leucocitos 75

Figura 5.5: Célula segmentada neutrófila.

La segmentación realizada utiliza un algoritmo propuesto por [Tomaz et al., 2003], que

se adecuó en esta tesis para separar núcleos celulares. En cada observación el núcleo puede

estar ubicado en diferentes posiciones y tener un color caracterı́stico en diferentes tonali-

dades. Al utilizar una técnica de segmentación basada en pixel, el tamaño y la orientación

de cada núcleo son irrelevantes. La Figura 5.6 presenta el procedimiento utilizado en el

proceso de segmentación de la imagen.

En la mayorı́a de las observaciones, la imagen presenta un fondo complejo y el área

que ocupa el núcleo es más pequeña que el resto de la escena. Se aplica un filtro inicial

que elimina gran parte de los pixeles que no pertenecen al núcleo. Este filtro inicial se

diseñó utilizando la información obtenida al observar los histogramas de los canales R, G,

y B de una imagen que corresponde a un recorte de núcleo de una observación. Al repetir

este procedimiento con las n observaciones, se obtienen histogramas similares. En la Figura

5.7 se muestra un ejemplo.

Como se puede ver, los valores para cada pixel que corresponden al canal G son pe-

queños. En los casos en los que la imagen es muy clara o muy obscura debido a los cambios

de iluminación producidos en el momento de su captura, se presenta un desplazamiento

pequeño a la derecha o a la izquierda, sin embargo esto no afecta significativamente los

experimentos subsecuentes.

Considerando una muestra M de tamaño n, cada observación que compone a esta mues-

tra consiste en un arreglo tridimensional X(i,j,k) correspondiente a la estructura de una

imagen, donde i = 1, 2, ..., 64, j = 1, 2, ..., 64, k = 1, 2, 3.

A partir de la información almacenada en X, para cada canal k se forma un histograma


76 5 CLASIFICACIÓN DE LEUCOCITOS

Figura 5.6: Desarrollo del proceso de segmentación.

HISTOGRAMAS DE CANALES RGB DE UN RECORTE DE NÚCLEO


150
Canal R

100

Pixeles
50

0
0 50 100 150 200 250 300

3000
Canal G

2000

1000

0 Pixeles
0 50 100 150 200 250 300

300
Canal B

200

100
Pixeles

0
0 50 100 150 200 250 300

Figura 5.7: Histogramas de los canales RGB de un recorte de núcleo de una


célula segmentada.
5.3 Método de clasificación de leucocitos 77

Figura 5.8: Diferencias entre d1 y d2 .

Hk , donde la longitud de Hk es 256 y la i-ésima posición de H contiene la ocurrencia de los

valores desde 0 para la posición Hk1 hasta 255 para la posición Hk256 . Con la información

que se tiene en Hk , se obtienen las siguientes diferencias:

d1 = Hki+1 − Hki y d2 = Hki+2 − Hki+1 (5.1)

Gráficamente, esto se puede ver en la Figura 5.8.

Para cada valor de d1 y d2 , se evalúan las siguientes condiciones, donde i = 1 . . . 256 :

V mini = i
} Si d1 < d2 ( existe un pico mı́nimo)
V maxi = 0

V mini = 0
} Si d1 > d2 ( existe un pico máximo) (5.2)
V maxi = i

V mini = 0
} Si d1 = d2 ( pues no existen picos mı́nimos ni máximos)
V maxi = 0

V mini y V maxi son vectores que contienen los ı́ndices del histograma Hk , en los cuales

existe un pico mı́nimo o máximo, respectivamente.

De esta manera son definidos umbralinf = min(V max) y umbralsup = max(V min). Se

calcula finalmente umbralinf y umbralsup de las n observaciones para obtener los umbrales
78 5 CLASIFICACIÓN DE LEUCOCITOS

a). Célula segmentada original b). Célula segmentada después de aplicar el filtro inicial

Figura 5.9: Resultados de Filtro inicial aplicado a una célula segmentada.

utilizados en el filtro inicial:

//RGB son valores que estan en el rango de 0 a 255


k=1 |B >= umbralk=3 |G <= umbralk=2 )
Si (R >= umbralinf inf sup

ES NUCLEO

En la Figura 5.9 se muestra una observación correspondiente a una célula de la clase

Segmentada antes y después de aplicar el filtro inicial.

Modelo de color para núcleos de leucocitos. Para modelar el esquema utilizado en

la segunda parte de la segmentación, las imágenes de recortes de núcleos son transformadas

al espacio de crominancia TSL, debido a que en este espacio la información del color se

encuentra en dos canales, T y S reduciendo la cantidad de información con la que se

trabaja, además como se menciona en [Terrillon et al., 2000], es recomendable trabajar en

el espacio TSL aún cuando las condiciones de iluminación varı́an, siendo efectivo cuando

se utiliza un modelo Gaussiano.

Utilizando las siguientes transformaciones, se obtiene la representación equivalente de

cada pixel en el espacio TSL, el canal L(iluminación) no se utiliza, por lo que no se muestra

la ecuación equivalente.

 0
 tan−1 ( gr 0 )
s 
 + 0.5, g 0 6= 0

 π
9
S= y T = (5.3)
5(r + g 0 2 )
02




 0, g0 = 0
5.3 Método de clasificación de leucocitos 79

donde

0 R 0 G
r = − 1/3 y g = − 1/3 (5.4)
R+G+B R+G+B

Para representar el color del núcleo, se define una matriz de covarianza CT S , que indica

la relación de los valores para los canales T y S de la imagen. Para construir la matriz de

covarianza CT S , se considera a T y S como la unión de los componentes T y S de cada

observación, es decir
l
Ti,j → Tkl y l
Si,j → Skl (5.5)

donde,

k = 642 (l − 1) + 64(i − 1) + j

l = 1...354
(5.6)
i = 1...64

j = 1...64

También se obtiene un vector de medias Vm utilizando los canales T y S de las n

observaciones.
· ¸T
Vm = Mt Ms (5.7)

Mt y Ms son escalares que se representan el promedio de los elementos de T y S, res-

pectivamente. La matriz de covarianza queda definida como

 
 σ2 T σT S 
CT S =   (5.8)
σT S σ 2 S
80 5 CLASIFICACIÓN DE LEUCOCITOS

donde,

Pl
σ2T = i=1 (Ti − Mt )2
Pl
σ2S = i=1 (Si − Ms )2 (5.9)
Pl
σT S = i=1 (Ti − Mt )(Si − Ms )

La distancia |λ2i,j | del pixel(i,j) al vector Vm se define utilizando como métrica la dis-

tancia de Mahallanobis como sigue.

|λ2i,j | = [Xi,j − Vm ]T CT−1


S [Xi,j − Vm ]
(5.10)

donde, Xi,j = pixeli,j de la imagen obtenida después de haber aplicado el filtro inicial.

Las barras verticales en |λ2i,j | indican que se trata de un valor positivo, pues como se

mencionó en la sección 3.2.1, una distancia siempre es positiva.

Umbralización. Antes de hacer una umbralización binaria con |λ2i,j |, ésta se normaliza

utilizando la ecuación utilizada por Tomaz [Tomaz et al., 2003].

λ2i,j
disM = 1 − (5.11)
cons

donde, cons = 9.

El valor de cons es obtenido experimentalmente. Después de esta normalización, se

umbraliza la región que se obtuvo al aplicar el filtro inicial, considerando como parte del

núcleo a los pixeles cuyo valor es mayor a 0.7. Los resultados de esta primera umbralización

se pueden ver en la Figura 5.10, en la que aún pueden distinguirse algunos pixeles que no

forman parte del núcleo.

Finalmente, para eliminar los pixeles aislados que aparecen en la imagen, se aplica un

filtro de mediana con una ventana de 9x9 pixeles.


5.3 Método de clasificación de leucocitos 81

Figura 5.10: Umbralización con el Modelo de Mahalanobis. a)Imagen original.


b)Imagen después de aplicar filtro inicial. c)Imagen después de aplicar modelo de Maha-
lanobis.

5.3.3. Extracción de caracterı́sticas

En el capı́tulo anterior se mencionó que la problemática abordada en esta tesis consiste

en clasificar una célula sanguı́nea en Segmentada o No Segmentada considerando su

morfologı́a nuclear. Como parte de la solución dada, se comienza por digitalizar un campo

visto a través de una cámara adaptada a un microscopio óptico y posteriormente separar

el núcleo de la imagen observada. El proceso detallado de ésta etapa se ha descrito en la

sección anterior.

Una vez concluı́da la segmentación del núcleo, el siguiente paso consiste en la extración

de caracterı́sticas para clasificar a la imagen. Por lo tanto, es preciso recordar lo visto en

el capı́tulo 3, donde se señala que las Redes neuronales reciben como entrada vectores de

caracterı́sticas que describen los ejemplos de entrenamiento y son una herramienta útil en

la clasificación de patrones. En este trabajo de tesis se utilizan las redes neuronales como

la técnica para clasificar a las regiones etiquetadas como núcleo, y catalogarlas dentro de la

clase Segmentados o No Segmentados tomando en cuenta caracterı́sticas que permitan

describir su forma. En esta sección se muestra el procedimiento para obtener los vectores

de caracterı́sticas que se dan como entrada a la red neuronal. La Figura 5.11 muestra

un esquema general que indica el procedimiento utilizado en el módulo de extraccón de

caracterı́sticas.

Extracción de caracterı́sticas estructurales

El proceso de extracción de caracterı́sticas estructurales recibe como entrada la imagen

segmentada que se obtuvo en la etapa anterior, en la cual puede existir más de una región
82 5 CLASIFICACIÓN DE LEUCOCITOS

Figura 5.11: Extracción de caracterı́sticas.

y para cada región de éstas se obtienen 12 atributos, ası́ se tienen 13 caracterı́sticas de

cada imagen.

Con el número de regiones y el área de cada región es posible tener una aproximación

de la clase a la que puede pertenecer la célula, pues una imagen que contenga más de

una región de tamaño similiar es muy probable que corresponda a una célula de la clase

Segmentada, debido a que su núcleo se encuentra fragmentado, a diferencia de las células

de la clase No Segmentada, cuyo núcleo es casi redondo y no está dividido. Sin embargo,

esta aproximación no es suficiente para ubicar a todas las células en la clase a la que

pertenecen, pues gran parte de las imágenes están formadas por sólo una región.

Las caracterı́sticas que se enlistan en la tabla 5.1 se calculan para las n observaciones.

Todas son escalares para no elevar el costo computacional involucrado en su procesamiento.

La descripción de algunas de ellas se encuentra en la sección 3.4, por lo que en esta tabla

sólo se describen aquellas que fueron deducidas a partir de las caracterı́sticas estructurales

definidas en la tabla 3.1 de dicha sección.

Para cada observación se obtiene un vector de caracterı́sticas. En la Figura 5.12 se

muestra la tabla de caracterı́sticas correspondiente a algunos datos obtenidos para la clase

Segmentados.

Extracción de caracterı́sticas estructurales con análisis de varianza

Las caracterı́sticas estructurales con análisis de varianza son caracterı́sticas elegidas

después de realizar un análisis para ambas clases de células, de la varianza de un conjunto


5.3 Método de clasificación de leucocitos 83

NÚMERO CARACTERÍSTICA
1 Número de regiones que contiene la imagen
2 Excentricidad
3 Solidez
4 Rectangularidad (Extent)
5 Longitud de Eje mayor
6 Longitud de Eje menor
7 Número de Euler
8 Orientación
9 Diámetro equivalente
10 Área del bounding box
Relación de ejes. Calculado como
11
Longitud de eje mayor/Longitud de eje menor
Diferencia de áreas. Calculado como
12
Área del Convex Hull − Área de la región
Varianza de los radios. Es la varianza de las distancias
13 euclidianas del centro de masa de la región a cada punto
que forma su perı́metro.

Tabla 5.1: Caracterı́sticas estructurales.

Figura 5.12: Almacenamiento de las caracterı́sticas estructurales.


84 5 CLASIFICACIÓN DE LEUCOCITOS

NÚMERO CARACTERÍSTICA
1 Área de la región
Elongación (razón de aspecto). Es la cuadratura del B. box.
2
Calculado como Longitud de la base/Longitud de la altura
3 Longitud de Eje mayor
4 Longitud de Eje menor
5 Relación de Ejes
6 Excentricidad
7 Orientación
8 Área del bounding box
Área vacı́a. Calculada como
9
Area del B.Box − Area de la región
10 Área del Convex Hull
11 Número de Euler
12 Diámetro equivalente
13 Solidez
14 Rectangularidad
15 Diferencia de Áreas
16 Número de regiones
17 Varianza de los radios

Tabla 5.2: Caracterı́sticas estructurales iniciales para el análisis de varianza.

de caracterı́sticas estructurales.

Las caracterı́sticas elegidas para el análisis de varianza se presentan en la tabla 5.2,

en la cual sólo se definen las caracterı́sticas que no han sido consideradas en tablas de

caracterı́sticas ya mostradas.

Las caracterı́sticas mostradas en la tabla se calculan para todas las observaciones de

cada clase y se almacenan dichos valores en un vector, de tal manera que para cada carac-

terı́stica se obtienen 2 vectores (uno para cada clase). Posteriormente se calcula la varianza

de cada vector caracterı́stico para ambas clases, con estos valores se obtiene una diferencia

(como valor absoluto).

En la tabla 5.3 se presentan los resultados obtenidos al aplicar el procedimiento an-

tes descrito. Como se puede observar, para cada caracterı́stica se muestran 3 columnas:

la primera respresenta la varianza obtenida para las células de la clase Segmentadas, la

segunda contiene la información referente a la varianza para la clase No segmentadas.

En la tercera columna se muestra la diferencia (como valor absoluto) de los valores


5.3 Método de clasificación de leucocitos 85

CARACTERÍSTICA V arianzaSeg V arianzaN oSeg Diferencia de varianzas


1. Área de la región 1.5391 2.2133 0.6742
2. Elongación 0 0 0
3. Longitud de Eje mayor 0.0017 0.0011 0.0060
4. Longitud de Eje menor 0.009 0.009 0.0003
5. Relación de Ejes 0 0 0
6. Excentricidad 0 0 0
7. Orientación 0.0264 0.0284 0.0198
8. Área del bounding box 1.6162 2.2583 0.6421
9. Área vacı́a 0.0061 0.0061 0
10. Área del Convex Hull 2.4198 2.3072 1.1266
11. Número de Euler 0 0 0
12. Diámetro equivalente 0.008 0.0009 0.0014
13. Solidez 0 0 0
14. Rectangularidad 0 0 0
15. Diferencia de Áreas 0.2299 0.1029 0.1269
16. Número de regiones 0 0 0.0001
17. Varianza de los radios 0.0010 0.0010 0

Tabla 5.3: Resultados del análisis de varianza para 17 caracterı́sticas estructu-


rales.

encontrados en la primera y segunda columna, para cada una de las 17 caracterı́sticas

consideradas.

De acuerdo a los resultados observados en la tercera columna, tenemos que el criterio

para la selección de las caracterı́sticas fue descartar a aquellos renglones cuya diferencia

entre ambas clases (tercera columna) sea mayor a 0.0001, considerando una precisión de

4 dı́gitos en la parte decimal debido a que los valores obtenidos para estas diferencias son

por naturaleza muy pequeños.

La condición propuesta para la selección de caracterı́sticas es:

Si |V arianzaSeg − V arianzaN oSeg | > 0.0001, entonces

se elige la caracterı́stica

en caso contrario

se descarta la caracterı́stica

Los resultados obtenidos con este método se observan en la tabla 5.4.


86 5 CLASIFICACIÓN DE LEUCOCITOS

NÚMERO CARACTERÍSTICA
1 Área de la región
2 Longitud de Eje mayor
3 Longitud de Eje menor
4 Orientación
5 Área del Bounding box
6 Área del Convex Hull
7 Diámetro equivalente
8 Diferencia de áreas

Tabla 5.4: Caracterı́sticas estructurales obtenidas con el análisis de varianza.

Extracción de caracterı́sticas radiales

Las caracterı́sticas radiales deben su nombre a que se derivan de la medida del centro de

masa de la región de interés a su perı́metro, lo cual se interpreta como un radio geométrico.

A continuación se definen 2 conceptos básicos para describir el procedimiento utilizado para

obtener las caracterı́sticas radiales.

Distancia radial, DR.- Distancia euclidiana del centro de masa a algún punto que forma

el perı́metro de la región.

Vector de caracterı́sticas radiales, V .- Vector que contiene las distancias radiales DR

de una región.

De acuerdo a las definiciones anteriores, para cada observación se obtiene un vector de

caracterı́sticas radiales de longitud variable, dado que dicha longitud depende de la cantidad

de puntos que forma el perı́metro de la región. En caso de recibir como entrada una imagen

que contenga más de una región, se considera sólo la región que tiene la mayor área, para

extraer sus caracterı́sticas radiales.

Sin embargo, la red neuronal recibe como entrada una matriz de caracterı́sticas que

deberá formarse a partir de los vectores de caracterı́sticas radiales, y con vectores de

diferente tamaño no es posible construir dicha matriz.

Para solucionar este problema, se propone un método para escalar los vectores sin

producir alteraciones significativas en la información que contienen, pues esta información

es un descriptor de la forma de la región.


5.3 Método de clasificación de leucocitos 87

Figura 5.13: Método para el cálculo de las caracterı́sticas radiales.

El escalamiento propuesto consiste en elegir el tamaño al cual se reducirán los vectores

de caracterı́sticas de las n observaciones, para lo cual se busca entre los n vectores de

caracterı́sticas aquel que tenga la menor longitud Lmin , este valor es usado para escalar

todos los vectores cuya longitud es mayor a Lmin . A continuación se presentan dos métodos

para realizar este escalamiento.

La Figura 5.13 muestra el método utilizado para la extracción de las caracterı́sticos

radiales. En los párrafos siguientes se describen con detalle las técnicas de escalamiento

utilizadas para ajustar los vectores de caracterı́sticas radiales a un mismo tamaño.

Escalamiento Aleatorio

En este caso para cada observación se toman aleatoriamente Lmin elementos de su

correspondiente vector V de caracterı́sticas radiales conservando el orden, para formar un

segundo vector V 0 . Dado que cada vector V 0 es de la misma longitud, se construye la tabla
88 5 CLASIFICACIÓN DE LEUCOCITOS

Figura 5.14: Almacenamiento de las caracterı́sticas radiales obtenidas aleato-


riamente.

de caracterı́sticas al colococar a los vectores V10 , V20 , V30 , ...Vn0 como renglones de dicha tabla.

Esto se muestra en la Figura 5.14

Al realizar una selección aleatoria de los elementos de V resulta un muestreo no ho-

mogéneo, pues cada vez se eligen diferentes puntos para formar el vector de caracterı́sticas

radiales.

Escalamiento con Transformación Lineal

Para obtener una selección homogenea de los elementos que forman el vector de carac-

terı́sticas radiales, se realiza un escalamiento utilizando la siguiente transformación lineal:

k Vj k
Vi0 = b ∗ ic (5.12)
Lmin

donde,

i = 1..Lmin

j = 1..n

Vi0 = vector de caracterı́sticas resultante de longitud Lmin

Finalmente se construye una tabla de caracterı́sticas similar a la que se muestra en la


5.3 Método de clasificación de leucocitos 89

Figura 5.15: Izquierda. Perı́metro de un núcleo. Centro. Puntos escogidos para for-
mar V 0 en el escalamiento aleatorio. Derecha. Puntos escogidos para formar V 0 en el
escalamiento lineal.

Figura 5.16: A la izquierda: Región nuclear de una célula segmentada. A la derecha:


Perı́metro de la región de la izquierda.

Figura 5.14, en la que cada reglón está constituı́do por los vectores V10 , V20 , V30 , ...Vn0 . En la

Figura 5.15 se muestra el perı́metro de una región y las imágenes obtenidas al realizar un

escalamiento aleatorio y un escalamiento lineal.

Propiedades de la Transformada Rápida de Fourier

En la Figura 5.16 se muestra la región nuclear de una observación y su perı́metro. Para

obtener componentes de frecuencia significativos, la función se transforma del dominio del

tiempo al dominio de la frecuencia usando la transformada rápida de Fourier. La Figura

5.17 en la parte superior representa el perı́metro mostrado en 5.16 en el dominio del tiem-

po, mientras que en la parte inferior se muestra la magnitud de dicho perı́metro después

de aplicar la FFT.

Uno de los principales objetivos en la selección de caracterı́sticas para el entrenamiento

de la red neuronal es evitar variaciones de rotación, traslación y escalamiento de las imáge-

nes. Se utilizan 2 propiedades de la transformada de Fourier para neutralizar los efectos

de rotación y escala. Estas propiedades son: multiplicación por una constante y el cambio

del tiempo al dominio de la frecuencia.

En el dominio del tiempo, rotar una función significa desplazarla; mientras que el es-
90 5 CLASIFICACIÓN DE LEUCOCITOS

Figura 5.17: Perı́metro de la región de interés. Arriba. Representación del perı́me-


tro en el dominio del tiempo. Abajo. Representación del perı́metro en el dominio de la
frecuencia, considerando solo la parte de magnitud después de aplicar la FFT

calamiento la multiplica por una constante, que es el factor de escalamiento.

Dada una función de tiempo f (t), la Transformada Rápida de Fourier esta dada por:

z[f (t)] = F (jω) (5.13)

F (jω) =| F (jω) | ejφ (5.14)

donde, | F (jω) | es la amplitud. Además si f (t) es multiplicada por una constante A,

se tiene:

z[Af (t)] = AF (jω) (5.15)

AF (jω) = A | F (jω) | ejφ (5.16)

La constante A es el factor escala que afecta la función f (t), siempre que una imagen es

capturada bajo diferentes escalas. Para nulificar el efecto de la constante A en la magnitud,

el efecto de A en la función f (t) se elimina. Esto se logra al normalizar la función f (t). La


5.3 Método de clasificación de leucocitos 91

normalización consiste en dividir Vi0 por el máximo de los elementos de Vi0 .

La propiedad de desplazamiento en el dominio de la frecuencia elimina los efectos de

rotación. Sin embargo si alguna imagen es rotada en el dominio del tiempo, resulta en un

cambio de la función f (t) por un tiempo t0 . La función f (t) se convierte en f (t−t0 ) cuando

la rotación ocurre. La FFT está dada por:

z[f (t − t0 )] =| F (jω) | ejφ .e−jφt0 (5.17)

z[f (t − t0 )] =| F (jω) | ej(φ−ωt0 ) (5.18)

Sólo el componente de fase de la transformada es afectado por la rotación, por lo tanto

la amplitud, que no se ve afectada por el movimiento resulta útil.

El centro de masa se utilizó como el punto de referencia en el cálculo de distancias

radiales para eliminar variaciones causadas por los efectos traslación.

Utilizando estas propiedades de la Transformada de Fourier, se crean los vectores de

caracterı́sticas considerando que f (t) = Vi0 . Como resultado de esta transformación se

obtiene un conjunto de números complejos y se extrae la amplitud o módulo de cada uno

de ellos para formar un nuevo vector de caracterı́sticas Di . Con este nuevo conjunto de

vectores se construye la tabla de caracterı́sticas que se muestra en la Figura 5.18.

5.3.4. Entrenamiento de la red

El entrenamiento se realiza con una red neuronal de retropropagación, la cual requiere

de un problema supervisado, ası́ la red aprende a clasificar vectores de entrada en clases

definidas por el usuario. En este caso las clases son Segmentados y No Segmentados.

El tipo de aprendizaje por retropropagación debe su nombre a que los pesos de las neu-

ronas se corrigen primero en la capa de salida, después en la segunda capa oculta si es

que existe, y al final en la primera capa oculta, es decir en la primera capa que recibe la

información directamente de la entrada. La arquitectura de la red neuronal es tal, que la

capa más interna tiene menos neuronas que las capas externas ya que por experimentación
92 5 CLASIFICACIÓN DE LEUCOCITOS

Figura 5.18: Almacenamiento de las caracterı́sticas obtenidas después de apli-


car FFT.

al aumentar el número de neuronas en las capas ocultas, los resultados no mejoran.

El entrenamiento se realiza de manera independiente con cada conjunto de caracterı́sti-

cas mostrado en las tablas de las Figuras 5.12 y 5.18. En cada caso la red neuronal tiene

m neuronas de entrada, donde m corresponde al número de caracterı́sticas o columnas de

las tablas mostradas en las figuras correspondientes. Los vectores de clases son paráme-

tros adicionales que se introducen a la función de entrenamiento. La red neuronal tiene 2

neuronas de salida que corresponden a las clases que la red es capaz de reconocer. Para

explicar la manera en que la red neuronal recibe los datos, suponga que la matriz E es la

entrada, y el vector C contiene las etiquetas de las clases a reconocer.

 
e1,1 e1,2 ..... e1,n
 
 
 e2,1 e2,2 ..... e2,n 
  · ¸
 
E=
 . . ..... . C =
 1 2 . . 2 (5.19)
 
 
 . . ..... . 
 
em,1 em,2 ..... em,n

donde, n corresponde al número de observaciones. Cada columna en la matriz de entra-

da E representa las caracterı́sticas extraı́das (en forma de vector) para una observación de
5.3 Método de clasificación de leucocitos 93

cierta clase, y la correspondiente fila en el vector C representa la clase a la que pertenece.

Los vectores de caracterı́sticas de clase se colocan de manera alternada en la matriz

Mce y se considera igual número de observaciones para ambas clases. Como son dos clases

que la red neuronal reconoce, el vector de clases CM contiene los números 1 y 2 de manera

alternada representando a cada clase. La matriz de entrada que se muestra a continuación

corresponde al conjunto de caracterı́sticas estructurales de la Figura 5.12.

 
1 1 1 . . . . . 1
 
 
 0.853 0.789 0.481 . . . . . 0.899 
 
 
 0.863 0.786 0.762 . . . . . 0.867 
 
 
 
 0.594 0.777 0.526 . . . . . 0.877 
 
 
 48.63 47.89 40.44 . . . . . 45.78 
 
 
 25.32 51.56 35.47 . . . . . 49.81 
 
 
 
Mce = 1 1 1 . . . . . 1  (5.20)
 
 
 24.69 45.89 105.8 . . . . . 48.99 
 
 
 
 33.53 56.78 33.14 . . . . . 51.78 
 
 
 1.363 1.567 0.928 . . . . . 1.678 
 
 
 1.921 1.987 1.141 . . . . . 1.874 
 
 
 
 140 134 269 . . . . . 123 
 
24.25 10.23 30.55 . . . . . 12.78

· ¸
CM = 1 2 . . 2 (5.21)

Cabe decir que el 10 % de las n observaciones se utilizan para probar la red y con el

resto se entrena. Cada vez que se prueban los datos se eligen aleatoriamente para tomar

una muestra diferente cada vez. Los datos de prueba y de entrenamiento se organizan en

matrices como se indica en la ecuación 5.19, de esta forma quedan definidas una matriz de

prueba P y una matriz de entrenamiento Mce .

El entrenamiento se detiene cuando cualquiera de las siguientes condiciones ocurre:


94 5 CLASIFICACIÓN DE LEUCOCITOS

El número máximo de épocas (repeticiones) sea alcanzado.

La máxima cantidad de tiempo ha sido excedida.

El desempeño ha sido minimizado a la meta.

Como parte de la experimentación se preprocesan las matrices de caracterı́sticas con PCA

reduciendo el número de caracterı́sticas de entrada, mejorando el ı́ndice de reconocimiento.

Después de aplicar PCA a las matrices de entrenamiento que se forman a partir de las

tablas de caracterı́sticas obtenidas, se reduce el número de caracterı́sticas y se entrena la

red. Al terminar en entrenamiento la red neuronal se prueba con la matriz de prueba P y

finalmente se comparan las etiquetas separadas de la matriz de prueba (vector CM ) con la

salida obtenida de la red neuronal. Los resultados se contabilizan utilizando una matriz de

confusión2 y se obtiene la precisión del clasificador utilizado.

5.3.5. Reconocimiento de observaciones originales

La evaluación del desempeño de la red neuronal, respecto a precisión, desempeño y

fiabilidad se realiza con la técnica de Ten Fold Cross Validation –Validación cruzada en

10 particiones–. El método consiste en tomar de las n observaciones el 90 % para entrenar

y el 10 % para probar. Este procedimiento se repite 10 veces y en cada vez se rotan los

datos para analizar diferentes conjuntos en cada caso. Como resultado de cada prueba se

obtienen un ı́ndice de reconocimiento Ri , al promediar los valores de estos Ri se obtiene

un RT que representa un ı́ndice de precisión en los resultados obtenidos.

2
Una matriz de confusion indica en su posicion (i, j) el numero de muestras de la clase j asignadas
por el clasificador a la clase i. Esta estructura permite averiguar los pares declases entre los que son mas
frecuentes los errores del clasificador.
Capı́tulo 6

Pruebas y análisis de resultados

En este capı́tulo se muestran los resultados que se obtienen al utilizar la metodologı́a

propuesta en la sección 2.4. Considerando una medida de similitud para el desarrollo del

modelo de segmentación y al menos tres técnicas que permiten la extracción de carac-

terı́sticas utilizadas como descriptores de forma, en principio se describen los resultados

obtenidos durante la etapa de adquisición de la imagen y posteriormente en la etapa de

segmentación.

Después se comenta el proceso de extracción de caracterı́sticas, que se divide en tres

partes. Mostrándose que las caracterı́sticas estructurales, no son los atributos que descri-

ben de la mejor manera a la forma de la región nuclear.

Finalmente se realiza un análisis comparativo sobre los resultados obtenidos con cada

conjunto de caracterı́sticas y se muestran los resultados obtenidos en la evaluación del

desempeño de la red neuronal.

6.1. Pruebas

6.1.1. Adquisición y preprocesamiento de la imagen

En principio se recolectan los frotis sanguı́neos que son analizados por un experto clı́ni-

co para obtener las observaciones utilizadas en esta tesis. El primer paso para obtener

estos frotis consiste en la recolección de muestras de sangre de diferentes pacientes, ca-


96 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

Figura 6.1: Recolección de muestras sanguı́neas. Izquierda. Elección del paciente.


Centro. Extracción de la sangre. Derecha. Preparación y tinción del frotis.

talogados como normales. Se toman en cuenta este tipo de pacientes con la finalidad de

disminuir la posibilidad de encontrar células anormales (anatómica y morfológicamente)

que generalmente se presentan en patologı́as como la leucemia o la anemia, además de que

la clasificación realizada en este trabajo se realiza de acuerdo a las caracterı́sticas presentes

en células normales.

Las muestras biológicas (frotis sanguı́neos teñidos para Recuento Diferencial) fueron

proporcionadas por instituciones como los Laboratorios BioDiagnostics, el Banco de san-

gre de Tlaxcala, el Hospital General de Apizaco y el Laboratorio de Citologı́a del Instituto

Mexicano del Seguro Social de Tlaxcala. En la Figura 6.1 se presentan las acciones in-

volucradas en la recolección y preparación de las muestras de sangre y que van desde la

elección del paciente, hasta la toma de la muestra y la preparación del frotis realizada por

un experto clı́nico. El procedimiento detallado para tinción de dicho frotis se comenta en

la sección 3.1.2.

A pesar de que la cantidad de frotis recolectados con esta técnica fue de más de 100,

se utilizaron 85 para la adquisición de las imágenes dado que por cada muestra se hace un

recorrido obteniendo diferentes imágenes, de tal manera que por cada frotis se digitalizan

entre 3 y 5 imágenes. La digitalización de las imágenes se realizó en las instalaciones de los

Laboratorios BioDiagnostics1 con el apoyo de un experto clı́nico 2 para el reconocimiento

de la célula.

Para digitalizar las imágenes primero se montó la cámara al microscopio, como se ob-

serva en la Figura 5.3. Para enfocar un campo en el microscopio se colocó una gota de

aceite de inmersión sobre el frotis sanguı́neo, que después es colocado sobre la base del

1
Laboratorio clı́nico particular ubicado en la Cd. de Apizaco, Tlax.
2
Q.F.B. Gonzalo Romero Tirso.
6.1 Pruebas 97

Figura 6.2: Adquisición de las observaciones. Izquierda: Gota de aceite sobre el


frotis. Centro: Colocación del frotis sobre la base del microscopio. Derecha: Campo visto
a través de la cámara.

Figura 6.3: Campos vistos al microscopio con diferentes aumentos. Izquierda:


Utilizando el objetivo de 40X. Derecha: Utilizando el objetivo de 100X.

portaobjetos acercándolo de tal manera que exista contacto fı́sico con el objetivo 100X del

microscopio. Esta secuencia de pasos se observa en la Figura 6.2.

Para la adquisición de las imágenes se trabajó con el objetivo 100X dado que se distin-

guen mejor las caracterı́sticas de la célula, en la Figura 6.3 se puede apreciar la diferencia

al enfocar un campo visto con el objetivo 40X y otro al cambiar al objetivo 100X.

Los tipos de células observadas pertenecen a 2 clases principales: Segmentados y No

Segmentados. Cada clase tiene subtipos, sin embargo la forma de su núcleo es represen-

tativa de cada una. Las células que pertenecen a la clase Segmentados se caracterizan

por tener un núcleo deforme, mientras que las células de la clase No Segmentados pre-

sentan un núcleo de forma redondeada. En la Figura 6.4, se muestran los subtipos básicos

de células Segmentadas y No Segmentadas.

En cada campo observado a través de la cámara se visualiza al menos una célula de

interés como se aprecia en la parte derecha de la Figura 6.3; de este campo se recorta

manualmente el área que encierra a la célula de interés, con lo cual se obtienen imágenes

como las que aparecen en la Figura 6.4, de este modo se adquieren 354 observaciones que

pertenecen a los tipos señalados en la Figura 6.5.

Es importante hacer notar que el tipo de célula llamado basófilo no se incluye en las
98 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

Figura 6.4: Tipos de glóbulos blancos. Arriba.- Segmentados: Neutrófilo, Eosinófilo,


Basófilo. Abajo.- No Segmentados: Linfocito y monocito.

Figura 6.5: Glóbulos blancos digitalizados.

observaciones porque es un tipo poco común y difı́cil de identificar, además de los pocos

basófilos que fueron identificados por el experto clı́nico la mayorı́a presentaron deforma-

ciones o estaban parcialmente destruı́dos; sin embargo se puede observar uno de ellos en

la parte superior derecha de la Figura 6.4. Por otra parte, debido a que en el modelo

utilizado en la etapa de segmentación se utilizan recortes de núcleo celular, de cada ob-

servación se recorta manualmente parte del núcleo correspondiente adquiriendo con esto

354 observaciones de recortes de núcleos celulares, en la Figura 6.6 se muestra un ejemplo.

Las observaciones de celulas completas y de recortes de núcleo se escalan a un tamaño de

64x64 pixeles para su procesamiento posterior.

6.1.2. Segmentación de la imagen

Utilizando las 354 observaciones de células completas y recortes de núcleos de la célula

encontrada en dicha observación se construye un modelo basado en color para segmentar

el núcleo de la imagen. Debido a que los tonos morados que presentan los núcleos permiten

diferenciar claramente a cada uno, se adecuó el modelo propuesto por [Tomaz et al., 2003]
6.1 Pruebas 99

Figura 6.6: Recorte de núcleo de una célula de la clase Segmentada.

diseñado originalmente para segmentar piel, que se describió en la sección 4.3.

Para ahorrar recursos computacionales y facilitar el proceso de segmentación se di-

señó un filtro inicial obtenido experimentalmente al observar las caracterı́sticas de color

en el espacio de color RGB pertenecientes los recortes de núcleo. Los histogramas de los

canales R, G y B correspondientes a los recortes de núcleo de algunas observaciones se

muestran en la Figura 6.7, donde se aprecia que la cantidad de color verde es pequeña en

relación al rojo y al azul. Debido a que los histogramas obtenidos para cada canal presen-

tan una curva caracterı́stica, se utilizan 5.1 y 5.2 para determinar los puntos donde dicha

curva comienza y termina de crecer. Con los umbrales obtenidos de esta manera umbralinf

y umbralsup se eliminan la mayor parte de los pixeles que no pertenecen al núcleo. Los

resultados obtenidos después de hacer esta umbralización se observan en la Figura 6.8.

El filtro inicial aplicado a las imágenes más claras produce resultados como los que se

muestran en la Figura 6.9, mientras que al aplicarse a imágenes obscuras se obtienen los

resultados mostrados en la Figura 6.10, donde como se puede observar la segmentación no

es buena, pues el núcleo se encuentra parcial o totalmente oculto.

También se hicieron pruebas a imágenes de células semi-destruı́das, no importando lo

claro u obscuro que éstas sean. Los resultados de éstas pruebas se muestran en la Figura

6.11. Un pequeño subconjunto de la clase segmentados presenta un núcleo muy dividi-

do, cuando se aplica sobre este tipo el filtro se obtienen los resultados que aparecen en la

Figura 6.12.

Después de observar los efectos de la aplicación de este primer filtro, a continuación se

muestran los resultados conseguidos durante el diseño y uso del segundo filtro, que como
100 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

Canal R Canal G Canal B


300 3000 200

Pixeles
200 2000
100
100 1000

0 0 0
0 100 200 0 100 200 0 100 200

100 200
2000
Pixeles

50 1000 100

0 0 0
0 100 200 0 100 200 0 100 200
200
300 3000
Pixeles

200 2000
100
100 1000
0 0 0
0 100 200 0 100 200 0 100 200

3000
300 200
Pixeles

200 2000

1000 100
100
0 0 0
0 100 200 0 100 200 0 100 200

Figura 6.7: Histogramas de los canales RGB de 4 tipos de recortes de núcleos.


La primera fila de histogramas corresponde a una célula Segmentada Eosinófila. La se-
gunda fila de histogramas pertenece a una célula Segmentada Neutrófila. La tercera fila
de histogramas es de una célula No Segmentada linfocı́tica. La cuarta fila es de una célula
No Segmentada Monocı́tica

se dijo en la sección 6.1.2, es creado a partir del análisis de color de recortes pertenecientes

a los 354 núcleos celulares. También es importante mencionar que para analizar las pro-

piedades de color en éstos recortes se requiere una conversión previa del espacio de color

RGB al espacio TSL, y posterior a ésta transformación se utiliza sólo la información de los

canales T y S, de tal forma que en realidad se trata de un mapeo de R3 (RGB) a R2 (TS).

El cambio entre espacios de color, se realiza de acuerdo a las transformaciones corres-

pondientes a la ecuación 5.3, y los resultados se muestran gráficamente en la Figura 6.13.

Después de esta transformación se separan los canales T y S de cada imagen y se

almacena la información de cada canal en un vector T y S, respectivamente.

Posteriormente se construye un vector V T y V S al unir los vectores T y S de los n

recortes de núcleos. Esto se observa en la Figura 6.14.

Para modelar el color de los recortes de núcleo utilizando la información de VT y VS,

se define la matriz de covarianza Cs a partir de 5.8 y se obtiene el vector de medias Vm

utilizando 5.7.
6.1 Pruebas 101

Figura 6.8: Resultados del filtro inicial. a).- Célula Segmentada Eosinófila. b).-
Célula Segmentada Neutrófila. c).- Célula No Segmentada linfocı́tica. d).- Célula No
Segmentada Monocı́tica

Figura 6.9: Resultados del filtro inicial aplicado a imágenes muy claras. a).-
Célula No Segmentada Monocı́tica. b).- Célula Segmentada Neutrófila. c) y d) Células
Segmentadas eosinófila.
102 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

Figura 6.10: Resultados del filtro inicial aplicado a imágenes obscuras. La célula
que esta en la parte superior izquierda es un neutrófilo y las demás son eosinófilos, ambas
pertenecientes a la clase segmentados.

Figura 6.11: Resultados del filtro inicial aplicado a imágenes de células semi-
destruidas. En este caso la claridad no se considera.
6.1 Pruebas 103

Figura 6.12: Resultados del filtro inicial aplicado a imágenes de células con el
núcleo muy dividido. En este caso la claridad no se considera.

Figura 6.13: Conversión del espacio de color RGB a TSL.

Figura 6.14: Unión de los vectores T y S de los n Recortes de núcleos.


104 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

A continuación se muestran los vectores VT y VS correspondientes a los recortes de

núcleos de las 354 obervaciones.

· ¸
VT = 0.3371 0.3371 0.3371 0.3375 0.3382 0.3382 0.3430 0.3477 ... 0.3481

· ¸
VS = 3.6535 3.6535 3.6535 3.6522 3.5163 3.5163 3.5452 3.5731 ... 3.5750

La matriz de covarianza Cs y el vector de medias Vm que se obtienen con los vectores

anteriores son:  
 0.0001 −0.0214 
Cs =   (6.1)
−0.0214 5.8557

· ¸T
Vm = 0.0922 22.8193 (6.2)

Para medir la similitud entre 2 pixeles,uno que pertenece a la imagen que recibe el filtro

y otro que forma parte de un recorte de núcleo y definir un umbral que clasifique al primero

de ellos como núcleo se utiliza la métrica de la Distancia de Mahalanobis |λ2i,j | definida por

la ecuación 5.10. Esta métrica es útil debido a que toma en cuenta la correlación entre las

variables multidimensionales que se consideran en este trabajo, el Tono y la Saturación. En

la Figura 6.15 se muestra la correlación que existe entre los vectores Tono T y Saturación

S.

De ésta manera |λ2i,j | esta definida como una matriz que contiene las medidas de

similitud de cada pixel pixel(i,j) de la imagen a filtrar al vector de medias Vm . Para definir el

umbral primero se normaliza el valor de |λ2i,j | utilizando 5.11. Después de esta normalización

se define el umbral para decidir si el pixel(i,j) forma parte del núcleo, es decir,

Si |λ2i,j | > 0.7 entonces pixel(i,j) = N U CLEO (6.3)

El valor de 0.7 se obtuvo por experimentación considerando que una distancia de 1.0

representa un pixel que no pertenece al núcleo.

Para eliminar los pixeles que aun permanecen de forma aislada en la imagen, se aplica
6.1 Pruebas 105

Figura 6.15: Correlación entre las variables Tono y Saturación correspondien-


tes a los vectores T y S, respectivamente. Los valores de T son normalizados.

Imagen Original Filtro inicial F. de Mahalanobis F. de la mediana

20 20 20 20

40 40 40 40

60 60 60 60
20 40 60 20 40 60 20 40 60 20 40 60

Figura 6.16: Resultados de la segmentación del núcleo de un monocito.

un filtro de mediana utilizando una ventana de 9x9 pixeles. El tamaño de la ventana se

eligió después de probar con otros tamaños y observar que este tamaño elimina la mayor

cantidad de pixeles aislados sin afectar significativamente la forma de la región filtrada.

En la figura 6.16 se muestran los resultados de la etapa de segmentación para un tipo de

célula no segmentada.

6.1.3. Extracción de caracterı́sticas

Como se ha mencionado en capı́tulos anteriores, la extracción de caracterı́sticas es muy

importante en el proceso de identificación de los objetos de interés, en este trabajo los

objetos de interés son los núcleos célulares.


106 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

El análisis que se realizó a la imagen en la sección 6.1.2, permitió extraer la región que

corresponde al núcleo de la célula sin afectar significativamente su forma.

La extracción de caracterı́sticas se realiza tomando como entrada la imagen obteni-

da en la sección anterior, sin embargo en algunos casos aun después de aplicar los filtros

señalados se obtienen imágenes que contienen más de una región etiquetada como núcleo.

En estos casos, la región que se considera para extraer las caracterı́sticas es la que presenta

una mayor área.

La cantidad de observaciones que se utilizaron para construir las matrices de carac-

terı́sticas estructurales, estructurales con análisis de varianza y radiales fue de 220; 110

para cada tipo de célula, esto es debido a que se cuenta con 232 ejemplares de la clase

Segmentados, casi el doble que para las células del tipo No segmentados cuyo número

es de 122.

Como se menciona en [Katz, 2000], para evitar un sobreentrenamiento de la red hacia

una clase especı́fica se considera igual número de ejemplares.

Los resultados contemplan 3 tipos de experimentos fundamentales. En cada caso se

trata del uso de un conjunto distinto de caracterı́sticas para describir la forma de la región

nuclear. El primer experimento esta enfocado al uso de las caracterı́sticas estructurales, el

segundo utiliza caracterı́sticas estructurales con análisis de varianza y el tercero se realiza

con las caracterı́sticas radiales, siendo éstas últimas mucho más en número que las estruc-

turales.

En el primer experimento se considera el conjunto de 13 caracterı́sticas estructurales

que se muestran en la Figura 5.12, entre las que se encuentran: número de regiones, eccen-

tricidad, solidez, extremos de la imagen, longitud del eje mayor, longitud del eje menor,

número de Euler, orientación, diámetro equivalente, área del bounding box, relación de ejes,

diferencia de áreas y varianza de los radios.

Con estos atributos, la matriz de caracterı́sticas que se obtiene es la que se muestra

en la Figura 6.17, donde el acomodo de las caracterı́sticas para cada clase se realiza de

manera intercalada denotándose como S a la clase Segmentados y como N a la clase

No Segmentados. Esta es la matriz de caracterı́sticas estructurales utilizada en el primer


6.1 Pruebas 107

Figura 6.17: Matriz de caracterı́sticas estructurales. Las columnas denotadas con


Si representan a las caracterı́sticas de células Segmentadas mientras que las que se
denotan con Ni indican a las caracterı́sticas de células No Segmentadas.

experimento.

Como prueba adicional, se obtiene un nuevo conjunto reducido de caracterı́sticas es-

tructurales al aplicar la técnica de PCA descrita en la sección 3.2.2. Después de reducir

la matriz de caracterı́sticas estructurales mostrada en la Figura 6.17, disminuyen a 8 los

atributos3 con los que se construye una nueva matriz de caracterı́sticas estructurales.

El segundo experimento esta encaminado hacia el uso de lo que en este trabajo se han

denominado caracterı́sticas estructurales con análisis de varianza, obtenidas en la sección

5.3.3. Este conjunto de 8 caracterı́sticas se muestran en la tabla 5.4 e incluye las siguien-

tes: área de la región, longitud de eje mayor, longitud de eje menor, orientación, área de

Bounding Box, área del Convex Hull, diámetro equivalente y diferencia de áreas. Con éstas

caracterı́sticas y de forma similar a como se hizo en el primer experimento, se construye la

matriz de caracterı́sticas estructurales con análisis de varianza (ver Figura 6.18).

En este caso también se aplicó PCA al conjunto de 8 caracterı́sticas estructurales con

análisis de varianza, obteniendo un nuevo conjunto de sólo 4 atributos (componentes prin-

cipales).

3
en realidad se trata de 8 componentes principales, ya que PCA al reducir no permite conocer cuáles
fueron las caracterı́sticas seleccionadas.
108 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

Figura 6.18: Matriz de caracterı́sticas estructurales con análisis de varianza.

El tercer experimento utiliza 2 conjuntos distintos de 111 caracterı́sticas radiales, dado

que para construir la matriz de caracterı́sticas es necesario tener igual número de atributos

para las 354 observaciones. El problema en el caso de las caracterı́sticas radiales, es que

existen un número distinto de caracterı́sticas para cada observación, por lo cual se utilizan

dos formas de escalar el número de atributos a el valor mı́nimo de caracterı́sticas encon-

trado en las 354 observaciones, que es de 111.

De ésta manera, al utilizar las 2 formas de escalamiento descritas en la sección 5.3.3:

escalamiento aleatorio y escalamiento con transformación lineal, se obtienen 2 conjuntos

de caracterı́sticas radiales.

Utilizando el procedimiento descrito en el primer experimento para la construcción de

la matriz se caracterı́sticas, se obtienen las matrices de caracterı́sticas radiales, una para

cada tipo de escalamiento. En la Figura 6.19 se observa la estructura de la matriz de ca-

racterı́sticas radiales, en la cual se utiliza un escalamiento con trasformación lineal.

Del mismo modo que en experimentos anteriores, se aplica PCA a las matrices de

caracterı́sticas radiales para construir nuevas matrices de caracterı́sticas reducidas. Esta

prueba permite evaluar también a cada conjunto de caracterı́sticas radiales, generadas con

distintas formas de escalamiento.

Es de esperarse que las caracterı́sticas estructurales describan de una mejor manera

la forma de las región nuclear. Sin embargo este no es el caso, como se comenta en las

secciones siguientes.
6.1 Pruebas 109

Figura 6.19: Matriz de caracterı́sticas radiales utilizando escalamiento con


transformación lineal.

6.1.4. Entrenamiento de la Red Neuronal

Para entrenar a la red neuronal con los subconjuntos de caracterı́sticas obtenidos en la

sección anterior se probaron distintas funciones para entrenamiento y funciones de trans-

ferencia, las cuales se muestran en la Figura 6.20, obteniendo un mejor desempeño con

el gradiente escalado conjugado y la función de transferencia logsig. El conjunto de carac-

terı́sticas utilizadas para esta prueba, corresponde a las caracterı́sticas estructurales con

análisis de varianza. En la tabla 5.4 se enlistan dichas caracterı́sticas .

De las 354 observaciones que se obtuvieron, se utiliza igual número de cada clase para

la experimentación, en este caso 110 de cada tipo, dejando el resto para pruebas adicio-

nales. Cabe hacer notar que las pruebas suplementarias se realizan con diferente número

de muestras para cada clase, ya que no se cuenta con igual número de muestras para cada

tipo de leucocito, además de que se trata de ejemplares no utilizados durante la fase de

entrenamiento. Las muestras utilizadas para pruebas adicionales son 134, de las cuales 122

son de la clase Segmentados y 22 de la clase No segmentados.

De las 110 observaciones obtenidas para cada clase, la red neuronal se entrena con 9/10,
110 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

Figura 6.20: Tipos de entrenamiento y funciones de transferencia.

Figura 6.21: Distribución de las observaciones para la experimentación.

es decir con 99 observaciones de cada tipo. En la Figura 6.21 se muestra la distribución del

número de observaciones que se utilizan en cada caso. Como se puede observar, se cuenta

232 observaciones para la clase de células Segmentadas, casi el doble que de células No

segmentadas. Esto se debe a que para la clase No segmentadas, se consideran dos sub-

tipos de leucocitos y uno de ellos, por naturaleza representa sólo un 5 % aproximadamente

del total de las células que forman la sangre (ver Figura 3.3, sección 3.1.1). La Figura 6.22

indica la cantidad de cada subtipo de leucocito utilizada para cada clase de célula.

En todos los experimentos los datos fueron desordenados aleatoriamente respecto de

las columnas, de tal forma que tanto los datos de entrenamiento como los de prueba no
6.1 Pruebas 111

Figura 6.22: Distribución de las observaciones por clase.

posean caracterı́sticas particulares que pudieran influir en los resultados. Además, para

validar el desempeño de la red se utilizó la técnica de Ten Fold Cross Validation –TFCV–,

tomando 10 % de las 110 observaciones de cada clase para prueba y el 90 % restante para

entrenamiento.

De esta manera, en el primer experimento con 13 caracterı́sticas estructurales la ma-

triz de caracterı́sticas es de 13x99, mientras que para las pruebas se utiliza una matriz de

13x11, es decir 99 datos para entrenamiento y 11 para prueba. Cuando se aplica reducción

con PCA se obtienen 8 componentes principales, con los cuales se entrena a la red.

Las pruebas adicionales realizadas como parte de este primer experimento se realizan

con 122 datos de la clase Segmentados y 12 datos de la clase No segmentados arrojando

un ı́ndice de reconocimiento de 81.34 % cuando se aplica PCA antes de entrenar a la red

neuronal y 76.11 % cuando no se aplica. Nótese que estos datos son totalmente distintos a

los utilizados durante el entrenamiento.

El segundo experimento hace uso de 8 caracterı́sticas estructurales con análisis de va-

rianza, de tal manera que la matriz de caracterı́sticas de entrada es de 8x99, y la de prueba

de 8x11.

De igual forma que en el primer experimento, se prueba también con otro conjunto

de caracterı́sticas que se obtienen al reducir con PCA; en este caso la reducción genera

4 componentes principales. Sin embargo, en este caso los resultados no mejoran como se

puede ver en la Figura 6.23.

Por otro lado, las pruebas realizadas con los 134 ejemplares separados en un principio
112 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

Figura 6.23: Resultados de las configuraciones utilizando diferentes observa-


ciones de células Segmentadas y No Segmentadas.

arrojan un 79.85 % cuando no se aplica PCA y un 67.16 % cuando se utiliza reducción.

En el tercer experimento se utilizan las caracterı́sticas radiales considerando una ma-

triz de caracterı́sticas de 111x99, dejando para prueba una matriz de 111x11 datos. En un

primer caso, se entrena con las caracterı́sticas que se obtuvieron al hacer un escalamiento

aleatorio, mientras que en otro caso se entrena con las caracterı́sticas generadas al realizar

un escalamiento con transformación lineal.

Las pruebas adicionales realizadas como parte de este tercer experimento para los 2

grupos de caracterı́sticas: las extraı́das con escalamiento aleatorio y las extraı́das con esca-

lamiento lineal, se realizan igualmente con 122 datos de la clase Segmentados y 12 datos

de la clase No segmentados arrojando un ı́ndice de reconocimiento de 100.00 % cuando

se aplica PCA antes de entrenar a la red neuronal y 100.00 % cuando no se aplica para

ambos grupos de caracterı́sticas.

Los resultados que se obtienen después de los entrenamientos realizados en los 3 expe-

rimentos se muestran en la Figura 6.23.

Como se puede observar, los mejores ı́ndices de reconocimiento se obtienen cuando

se utilizan como descriptores de forma a las caracterı́sticas radiales aplicando PCA antes

de entrenar la red. La gráfica del comportamiento en el entrenamiento se puede ver en la

Figura 6.24.

Es importante decir que los resultados mostrados en la Figura 6.24 corresponden al

promedio de 10 pruebas realizadas con la técnica TFCV para cada caso, además que la
6.2 Análisis de resultados 113

ENTRENAMIENTO CON CARACTERISTICAS ESTRUCTURALES


10
10
sin PCA
con PCA
5
10

ERROR
0
10

−5
10

−10
10−1
0
1100 10
2
10
4

EPOCAS

Figura 6.24: Comportamiento de entrenamiento utilizando diferentes observa-


ciones de células Segmentadas y No Segmentadas con caracterı́sticas estruc-
turales y radiales.

selección de las 110 observaciones utilizadas en los experimentos respectivos es aleatoria

para cada una de las 10 veces que se realizó la técnica de TFCV.

6.2. Análisis de resultados

Retomando el diagrama mostrado en la Figura 5.1, se pueden realizar algunos comen-

tarios para cada fase del método usado para la identificación y clasificación de leucocitos.

Los resultados obtenidos en la fase de adquisición de las muestras son satisfactorios,

dado que la calidad de las imágenes es buena para el análisis propuesto, pues en todas ellas

es posible diferenciar claramente al núcleo del resto de la escena.

La técnica de segmentación utilizada es buena. Permitió extraer los núcleos celulares sin

afectar su forma significativamente. Al utilizar la distancia de Mahalanobis como medida

de similitud, se logró calcular la diferencia del color del núcleo de un leucocito, respecto

al color promedio de los núcleos de un conjunto de 354 leucocitos utilizados en la fase de

experimentación. Por otro lado, con el uso de ésta métrica es posible considerar la correla-

ción que existe en los canales T y S, que se utilizaron para modelar el color caracterı́stico

del núcleo de los leucocitos.

Después de hacer un análisis visual de las imágenes se observó que la aplicación del filtro
114 6 PRUEBAS Y ANÁLISIS DE RESULTADOS

inicial se puede omitir, dado que al aplicar el filtro creado con el modelo de Mahalanobis

los resultados son buenos.

Como consecuencia de una buena segmentación se extrajeron caracterı́sticas que per-

miten clasificar adecuadamente a la célula como leucocito Segmentado o leucocito No

segmentado.

Respecto a la extracción y selección de caracterı́sticas, al observar los resultados obteni-

dos con los descriptores de Fourier haciendo un análisis visual de la simetrı́a en las gráficas

de los vectores caracterı́sticos, se hace notar la posibilidad de trabajar con la mitad de

los datos que constituyen los descriptores de Fourier sin afectar los resultados de forma

significativa. Por este motivo los resultados obtenidos al aplicar PCA fueron muy similares

a los obtenidos cuando no se aplicó.

Los tipos de escalamiento utilizados para el ajuste del tamaño de los vectores que

almacenan los descriptores de Fourier resultaron igualmente útiles; por una parte el esca-

lamiento lineal permite elegir de manera más equivativa los pixeles que forman el nuevo

vector reducido, mientras que con el escalamiento aleatorio se eligen de manera distribuida

a dichos pixeles.

En la extracción de caracterı́sticas estructurales resulta interesante observar que el

análisis de caracterı́sticas con análisis de varianza arroja buenos resultados, permitiendo

trabajar con un conjunto más pequeño de datos y además saber cuáles son las caracterı́sti-

cas más apropiadas para describir la forma del núcleo, lo cual no es posible cuando se usa

PCA como método de reducción.

La técnica de análisis de varianzas propuesta en este trabajo de tesis constituye una

nueva técnica de selección de caracterı́sticas, viable de probarse con un conjunto de datos

distinto al usado en este trabajo para comprobar la factibilidad de su uso, como método

de selección de caracterı́sticas.

Un detalle observado en las caracterı́sticas estructurales con análisis de varianza, es el

hecho de que al reducir con PCA y obtener sólo 4 componentes principales, disminuye el

ı́ndice de reconocimiento. En cambio en las caracterı́sticas estructurales y radiales ocurre

lo contrario, debido posiblemente a que 4 atributos son insuficientes para describir la forma
6.2 Análisis de resultados 115

de la región.

Al considerar en la fase de pruebas, a un conjunto de muestras totalmente ajeno al uti-

lizado en la fase de entrenamiento, se obtienen buenos resultados. Este hecho confirma la

veracidad en los experimentos realizados y garantiza una clasificación adecuada con nuevos

conjuntos de muestras.

Finalmente, podemos decir que el método utilizado en esta investigación es muy útil

en el análisis de especı́menes biológicos, ya que es posible hacer distinciones precisas en el

análisis de color, lo que es de gran importancia en el estudio de ciertas patologı́as.


Capı́tulo 7

Conclusiones

7.1. Conclusiones generales

El objetivo principal en este trabajo de tesis fue clasificar a dos tipos de células de

sangre humana empleando técnicas de visión por computadora. Al revisar la metodologı́a

utilizada, es posible observar que no es sencillo emular la capacidad de visión que el hu-

mano posee y mucho menos igualarla.

Por otro lado, se puede notar que los componentes de un sistema de visión varı́an de

acuerdo a la aplicación. Durante la fase de adquisición de la imagen existieron condiciones

que no se lograron controlar como las condiciones de preparación de la muestra, el área de

trabajo, la iluminación ambiental y la iluminación de la fuente.

Considerando estos inconvenientes se optó por el uso de técnicas que atenuaran los

efectos de dichas variaciones, de esta manera en la fase de segmentación se crea un modelo

de color utilizando el espacio de color TSL propuesto por [Tomaz et al., 2003], obteniendo

buenos resultados.

Además, la segmentación es casi directa, sin ser estrictamente necesario eliminar pri-

mero los elementos del fondo en la imagen. Esto es una importante contribución para el

análisis visual de leucocitos, ya que se puede aplicar el algoritmo de segmentación propues-

to en este trabajo de tesis sin necesidad de recalcular la matriz de covarianza y la distancia

de Mahalanobis, que se requiere para la umbralización de pixeles que pertenecen o no al


118 7 CONCLUSIONES

núcleo de la célula, reduciendo el tiempo de cálculo en análisis posteriores.

Como el objetivo principal fue clasificar a las células de acuerdo a su morfologı́a nuclear,

se optó por considerar caracterı́sticas que describieran lo mejor posible, la forma de dicha

región. Se pensó en principio, que al considerar como descriptores a un conjunto reducido

de caracterı́sticas estructurales se tendrı́a una buena descripción de la forma y como conse-

cuencia un buen ı́ndice de reconocimiento; sin embargo al probar con otro conjunto mayor

de caracterı́sticas que se deduce a partir del centroide y el perı́metro de la región, se logra

tener una descripción más completa de la forma de la región al usar algunas propiedades

de la FFT, alcanzando un ı́ndice de reconocimiento del 99 %.

También vale la pena mencionar que los ı́ndices de reconocimiento en el caso de las

caracterı́sticas estructurales y radiales, mejoraron al aplicar la técnica de PCA antes de

entrenar a la red neuronal. En este caso lo que se observa es que el número de épocas se re-

dujo notablemente cuando se preprocesan los datos con PCA, lo cual es de esperarse sobre

todo cuando se utilizan las caracterı́sticas radiales, dado que para obtenerlas se aplicó la

FFT y al observar la representación gráfica de dichas caracterı́sticas es notable la simetrı́a

que hay en dicha gráfica, lo cual permite suponer que es posible tomar sólo la mitad de los

datos que se observan en dicha gráfica y considerar a este conjunto como caracterı́sticas

radiales.

Finalmente se comprobó una vez más que la red neuronal de retroprogación utilizada

por [Katz, 2000] es una buena alternativa para la clasificación de células.

7.2. Trabajo a Futuro

Existe mucho trabajo que hacer con el tipo de observaciones que se manejan en este

trabajo y con la metodologı́a utilizada. A continuación se mencionan algunas propuestas:

1. Sustituir la forma empı́rica utilizada en el diseño del filtro inicial usado en la segmen-

tación, por un análisis de regiones empleando técnicas de agrupación como K-means.

2. Dado que cada célula identificada tiene más subtipos, al utilizar técnicas de segmenta-

ción basada en textura y color para aislar el citoplasma y extraer sus caracaterı́sticas,
7.2 Trabajo a Futuro 119

se puede tener una descripción más completa de la célula y esto puede ampliar el

número de clases a reconocer.

3. Agregar un módulo que permita además de identificar, contar las células visualizadas

en la escena.

4. Analizar nuevos parámetros encontrados (valores y vectores caracterı́sticos de la re-

gión segmentada) para determinar si representan un patrón especı́fico que permita

reconocer una clase.

5. La superposición temporal de regiones segmentadas de la misma clase con técnicas

de empalmamiento, puede ser útil en el análisis para determinar el tipo de la célula.

6. Implementar una segmentación semi-automática al definir un espacio de color exclusi-

vo para las imágenes de frotis sanguı́neo utilizando la técnica descrita en [Guzmán, 2002].

7. Analizar el comportamiento de la lógica difusa en el proceso de segmentación para

lograr una mejor descripción de la región de interés, pues de acuerdo a [Carron, 1995]

reporta buenos resultados.

8. Desarrollar una interfaz gráfica en la que se integran los módulos que componen este

trabajo de tesis.

9. Promover la aplicación GUI para fines educativos que trabajarı́a en tiempo real.

10. Utilizar la metodologı́a aplicada en este trabajo, como marco de referencia para el

desarrollo de aplicaciones similares que persigan la identificación de otro tipo de

objetos de interés en el área clı́nica u otras áreas.


Referencias

[Ses, 1999] (1999). Guı́a de operación y mantenimiento básico Sistema K-1000. CIBA

CORNING DIAGNOSTICS -MEXICO-, Departamento de Servicio Técnico, Zona Cen-

tro. México.

[Mot, 2004] (2004). Manual de operación de Moticam 350. Micro-optic industrial group

CO; LTD., U.S.A.

[Abdallah et al., 1995] Abdallah, M. A., Samu, T. I., and Grissom, W. A. (1995). Auto-

matic target identification using neural networks.

[Acosta et al., ] Acosta, B. M., Zuluaga, M. C. A., and Salazar, I. H. Tutorial de redes

neuronales. http://ohm.utp.edu.co/neuronales.

[Alpaydm, 2004] Alpaydm, E. (2004). Introduction to Machine Learning.

[Awcock and R., 1996] Awcock, G. J. and R., T. (1996). Applied Image Processing.

[Beckman Coulter, 2006] Beckman Coulter, I. (2006). Contadores hematológicos beckman

coulter. http://www.beckmancoulter.com.

[Bourgin, 1994] Bourgin, D. (1994). http://www.neuro.sfc.keio.ac.jp.

[Carron, 1995] Carron, T. (1995). Segmentation dı́mages coleur dans la base Treinte-

Luminance-Saturation:approche numérique et symbolique.

[Comaniciu, 2001] Comaniciu, D. (2001). Cell image segmentation for diagnostic patho-

logy. www.caip.rutgers.edu/riul/research/papers/ps/cells.ps.gz.
122 REFERENCIAS

[Cormack, 1997] Cormack, D. H. (1997). Histologı́a de HAM. México D.F.

[Cortijo, 2001] Cortijo, B. F. J. (2001). Bioestadı́stica: Métodos y Aplicaciones.

[de la Escalera, 2001] de la Escalera, H. A. (2001). Visión por computador. Fundamentos

y Métodos.

[Duda, 2001] Duda, O. R. (2001). Pattern Classification.

[Flores, 2001] Flores, P. L. (2001). Recuperación de imágenes combinando redes neuronales

y wavelets. Tesis INAOE.

[Freggiaro and Espejo, 2006] Freggiaro, L. E. and Espejo, R. (2006).

http://www.forobioquimico.com.ar.

[Galénica, 2005] Galénica (2005). http://www.galenica.cl/tecnologia_vcs.html.

[Garcı́a and Sierra, 2001] Garcı́a, L. D. and Sierra, J. L. C. (2001). Bioestadı́stica.

http://nutriserver.com/cursos.

[González and Woods, 1996] González, R. C. and Woods, R. E. (1996). Tratamiento Di-

gital de imágenes.

[Goodrich and Tamassia, 2003] Goodrich, M. T. and Tamassia, R. (2003). Data etructures

and algorithms in Java.

[Guzmán, 1997] Guzmán, D. L. A. (1997). Etude déspaces couleur pour la segmentation

et láide álánalyse. Thése Doctorale.

[Guzmán, 2002] Guzmán, D. L. A. (2002). Procesamiento digital de imágenes colposcópi-

cas.

[Hair et al., 2001] Hair, J. F., Rolph, A. E. J., and Tatham, R. L. (2001). Análisis multi-

variante.

[Hen and Hwang, 2002] Hen, H. Y. and Hwang, J.-N. (2002). Handbook of neural network

signal processing.
REFERENCIAS 123

[Hunke, 1994] Hunke, M. H. (1994). Locating and tracking of human faces with neural

networks.

[Katz, 2000] Katz, A. R. J. (2000). Image analysis and supervised learning in the automated

differentiation of white blood cells from microscopic images. Master’s thesis.

[Kohavi, 1995] Kohavi, R. (1995). A study of cross validation and bootstrap for accuracy

estimation and model selection.

[MathWorks, 2000] MathWorks, T. I. (2000). Matlab 6.0.0.88.

[Mitchell, 1997] Mitchell, T. M. (1997). Machine Learning.

[Moore, 2001] Moore, A. W. (2001). Cross validation for detecting and preventing overfit-

ting. http://www-2.cs.cmu.edu/~awm/tutorials/overfit.html.

[Oppenheim, 1998] Oppenheim (1998). Manual para técnicos de laboratorio. México D.F.

[Pajares and de la Cruz, 2002] Pajares, G. and de la Cruz, J. M. (2002). Vision por compu-

tador. Imágenes digitales y aplicaciones.

[Pal and Pal, 1993] Pal, N. R. and Pal, S. K. (1993). A review on Image Segmentation

Techniques, volume Vol. 26 No. 9.

[Pratt, 1978] Pratt, W. K. (1978). Digital Image Processing.

[Pérez and Hague, 2002] Pérez, L. G. and Hague, J. M. T. (2002). Dynamic threshold se-

lection for image segmentation of natural structures based upon a performance criterion.

[Reyes, 2005] Reyes, G. O. F. (2005). Clasificación de llantos de bebés para identificación

de hipoacusia y asfixia por medio de un sistema hı́brido (genético-neuronal). Tesis ITA.

[Sánchez, 2006] Sánchez, J. (2006). Revista creces. portal de tecnologı́a, ciencias y biologı́a.

http://www.tcb.cl.

[Schapira and Arroyo, 1994] Schapira, A. and Arroyo, I. (1994). Cells++. un contador de

células. http://www.ubp.edu.ar/investigacion/revista7/art6.html.
124 REFERENCIAS

[Sinha, 2002] Sinha, N. (2002). Blood cell segmentation using em algorithm.

[Solano, 2002] Solano, M. R. (2002). Modelado y reconocimiento de objetos usando apa-

riencia y multieigenespacios particionados. Tesis INAOE.

[Swokowski, 1989] Swokowski, E. W. (1989). Cálculo con geometrı́a analı́tica.

[Terrillon and Akamatsu, 2000] Terrillon, J. and Akamatsu, S. (2000). Comparative per-

formance of different chrominance spaces for color segmentation and detection of human

faces in complex scene images.

[Terrillon et al., 1998] Terrillon, J., David, M., and Akamatsu, S. (1998). Automatic detec-

tion of human faces in natural scene images by use of a skin color model and of invariant

moments.

[Terrillon et al., 2000] Terrillon, J., Shirazi, M., Fukamachi, H., and Akamatsu, S. (2000).

Comparative performance of different skin chrominance models and chrominance spaces

for the automatic detection of human faces in color images.

[Tomaz et al., 2003] Tomaz, F., Candeias, T., and Shahbazkia, H. (2003). Improved auto-

matic skin detection in color images.

[Urdiales, 2002] Urdiales, C. (2002). http://campusvirtual.uma.es/TRcolor.PDF.

[Ushizima et al., 2004] Ushizima, D., Da-Fontoura, L., Rizzatti, E., and Zago, M.-A.

(2004). A texture approach to leukocyte recognition.

[Webner, 2006] Webner, D. (2006). Enciclopedia médica en español.

http://www.nlm.nih.gov.

[Wikipedia Foundation, 2006] Wikipedia Foundation, I. (2006). Wikipedia enciclopedia

libre. http://es.wikipedia.org.

[Woodliff and Herrmann, 1993] Woodliff, H. J. and Herrmann, R. (1993). Hematologı́a

Clı́nica. México D.F.


REFERENCIAS 125

[Yang and Waibel, 1995] Yang, J. and Waibel, A. (1995). Tracking human faces in real

time.
Apéndice A

Espacios de color

El uso de color como descriptor para la segmentación de una imagen resulta importante

en la extracción de caracterı́sticas. A continuación se definen algunos términos empleados

en el análisis del color.

Brillo.- sensación que indica si un área es más o menos iluminada.

Tono.- sensación que indica si un área parece similar al rojo, amarillo, verde o azul, o a

una porción de dos de ellos.

Coloración.- sensación por la que un área tiene mayor o menor tono.

Luminosidad.- brillo de una zona respecto a otra blanca en la imagen.

Croma.- Coloridad de un área respecto al brillo de un blanco de referencia.

Saturación.- relación entre la coloración y el brillo.

Los parámetros psı́quicos en la percepción del color son la luminosidad, el tono, y la

saturación. Un espacio de color es un método por el que se puede especificar, crear o

visualizar cualquier color. A continuación se describen algunos espacios de color que son

importantes para la colorimetrı́a [Urdiales, 2002].


128 A ESPACIOS DE COLOR

A.1. Espacio RGB

Este espacio de color se basa en la combinación de tres señales de luminancia cromática:

el rojo, el verde y el azul (Red, Green, Blue). La manera de obtener un color especı́fico(X)

consiste en determinar qué cantidad de cada uno de ellos (R, G, B) se necesita para obte-

nerlo.

X =R+G+B (1.1)

Cuando una cámara capta una imagen en color, para cada pixel en color se tienen en

realidad tres, uno por cada componente (RGB), es decir, la longitud de onda de cada color

básico. El inconveniente de este modelo es que en sus tres valores mezcla la información

del color (tono y saturación) y la intensidad.

A.2. Espacio TSL

Los componentes fundamentales de este espacio de color son el Tinte, la Saturación y la

Luminosidad. El tinte se puede relacionar con la longitud de onda como parámetro, la lu-

minosidad habla de la energı́a del color y la saturación habla de la pureza del color, es decir

qué tan mezclado con el color blanco se encuentra dicho color. Este sistema fue propuesto

por Munsell [Pratt, 1978], como un modelo de la percepción humana del color y también

es conocido como sistema bi-cónico debido a su construcción espacial [Guzmán, 2002]. En

la Figura A.1 se muestra la organización del espacio de color propuesto por Munsell.

A.3. Espacio HSI

En este espacio caracteriza el color en términos de tono o tinte (Hue), saturación o

cromatismo (Saturation) y brillo (Intensity). Ası́, de dos fuentes de luz con el mismo

espectro, aquella que tenga mayor intensidad aparecerá más brillante. Aunque, dos objetos

de igual intensidad no siempre tienen el mismo brillo. La saturación describe la blancura

de un color. Las transformaciones matemáticas que permiten el cambio del espacio RGB
A.3 Espacio HSI 129

Figura A.1: Diagrama esquemático de los 3 ejes del sistema de color Mun-
sell.Tomado de Hall, E.L. Computer Image Processing and Recognition. Academic Press,
New York. 1979
130 A ESPACIOS DE COLOR

a HSI son las siguientes:


R+G+B
I= (1.1)
3

3(G − B)
H = arctan( ) (1.2)
(R − G) + (R − B)

min(R, G, B)
S =1− (1.3)
3

Las variaciones de este espacio de color son:

HSL (Hue Saturation Lightness)

HSV (Hue Saturation Value)

HCI (Hue Croma/Colourfulness Lightness)

HVC (Hue Value Croma)

TSD (Hue Saturation Durkness)

Las desventajas de este modelo son:

1. La no linealidad de las transformaciones realizadas, lo cual implica un elevado costo

computacional.

2. La singularidad existente en el entorno del eje definido por R=G=B (Saturación=0),

que provoca que los valores obtenidos por el tono sean inestables.

A.4. Los espacios XYZ, Luv, Lab

El espacio de color XYZ evita los coeficientes negativos obtenidos en los modelos an-

teriores para algunas coloraciones de determinada longitud de onda; que es causa de una

fuente de error importante en los cálculos colorimétricos. En el modelo XYZ, la compo-

nente Y representa la luminosidad y XZ la coloración. Este espacio es independiente del

dispositivo utilizado y generalmente se trabaja con valores normalizados entre cero y uno.

Este espacio constituye el llamado Diagrama Internacional XY, CIE o carta cromática xy.

Y una vez obtenidas las coordenadas XYZ se pueden construir diferentes espacios CIES,
A.5 Los espacios de color YIQ, YUV, YCbCr y YCC 131

como Luv y Lab en los que la información se descompone en tono, cromatismo e intensidad

del color.

Espacio Luv Este modelo se definió en 1976, con la finalidad de obtener más uniformidad

y precisión en la representación del color. Posee 3 componentes: L, u and v. El componente

L define la luminancia, mientras que u y v definen la crominancia. CIE Luv es muy utilizado

en cálculo de colores pequeños o diferencias de color, especialmente con colores aditivos. En

[Bourgin, 1994] se pueden encontrar las ecuaciones para la transformación a este espacio

de color a partir del espacio XYZ.

A.5. Los espacios de color YIQ, YUV, YCbCr y YCC

En estos espacios se trabaja con la luminancia (luminosidad) y la crominancia (color).

Estan muy relacionados con los sistemas de color para la televisión.

A.6. El espacio CMY(K)

Está formado por Cı́an, Magenta, Amarillo y Negro. Se utiliza en la impresión y fo-

tografı́as, por lo que depende del dispositivo (impresora). Para obtener los equivalentes

respectivos, se resta de las componentes el color blanco en el caso de CMY, o el negro para

CMYK.
132 A ESPACIOS DE COLOR
Apéndice B

Galerı́a de imágenes

En este apartado se ha colocado la base de datos recopilada y utilizada en este trabajo

de investigación, esperando sea útil para trabajos futuros.

Como se menciona en capı́tulos anteriores, las muestras biológicas se prepararon con

sangre de pacientes normales, es decir, se excluyeron especı́menes que presentan patologı́as

que pudieran ocasionar la presencia de formas anormales de células y de sus órganos inter-

nos, como en el caso de la leucemia.

También es posible apreciar los efectos provocados por los cambios de iluminación que

fueron imposibles de controlar en el momento de la digitalización de las muestras. Esto

debido, a los ajustes que son necesarios para enfocar a la imagen y obtener una mejor

apreciación de su composición interna.


134 B GALERÍA DE IMÁGENES

Figura B.1: Leucocitos segmentados: Eosinófilos. (Continúa)


135

Figura B.2: Leucocitos segmentados: Eosinófilos. (Continuación)


136 B GALERÍA DE IMÁGENES

Figura B.3: Leucocitos segmentados: Neutrófilos. (Continúa)


137

Figura B.4: Leucocitos segmentados: Neutrófilos. (Continuación)


138 B GALERÍA DE IMÁGENES

Figura B.5: Leucocitos no segmentados: Linfocitos. (Continúa)


139

Figura B.6: Leucocitos no segmentados: Linfocitos. (Continuación)

Figura B.7: Leucocitos no segmentados: Monocitos.


140 B GALERÍA DE IMÁGENES

Figura B.8: Casos especiales. En b1 y b2 se observan células basófilas pertenecientes


a la clase segmentados, es un tipo de célula que por su rareza fue excluı́da de las pruebas
hechas en la investigación. DOSe66-n contiene abajo un neutrófilo pequeño, arriba un
eosinófilo con el núcleo parcialmente destruido y distribuido en el citoplasma. DOSe103-
mono muestra arriba a la izquierda un eosinófilo y abajo a la derecha un monocito. En
DOSl40mono3 se observa arriba a la derecha un monocito y abajo a la izquierda un
linfocito. DOSn28linfo10 arriba a la derecha presenta un neutrófilo grande y abajo a la
izquierda un linfocito.
Apéndice C

Listado de módulos que componen


el método de clasificación

A continuación se describe el nombre y la descripción de los principales funciones

programadas en este trabajo de investigación.

En la tabla C.1 se enlistan los nombres de las principales funciones implementadas,

mientras que en el disco anexo al final de esta tesis, se encuentran los códigos adicionales

para algunas variantes de funciones contenidas en la tabla, como la función escalarIMG

que presenta dos funciones relacionadas llamadas escalarNUCLEOS y escalarCUT.


142 C LISTADO DE MÓDULOS QUE COMPONEN EL MÉTODO DE CLASIFICACIÓN

NOMBRE DESCRIPCIÓN
escalarIMG su función es escalar una imagen a un tamaño de 64x64 pixeles.
getfeatures obtiene caracterı́sticas de la región de interés
disMaha devuelve imagen filtrada con modelo de Mahalanobis
RGBtoTSL convierte imagen del espacio RGB al espacio TSL
unirfeatures construye los vectores de caracterı́sticas estructurales
filtroinicial aplica filtro inicial a la imagen recibida como entrada
getpromRGBmodif2006 determina lı́mites de crecimiento de histogramas en RGB
obtiene el número de puntos que forman el perı́metro de una
getNrad
región
muestrearRADIS realiza el escalamiento caracterı́sticas radiales
predatosNET2crossViguales entrena red neuronal con caracterı́sticas estructurales
entrena red neuronal con caracterı́sticas estructurales con
predatosNET2crossIguVAR2
análisis de varianza
FFTradis4mues entrena red neuronal con caracterı́sticas estructurales

Tabla C.1: Principales funciones programadas


Índice alfabético

Análisis, 6, 8, 12, 20, 25, 60, 68, 82, 95, 109, Microscopio, 2, 6, 12, 70, 72, 73, 81, 96

113 Modelo, 117

Muestras, 5, 73, 94, 109, 113, 133


Célula, 2

anatomı́a, 11 Núcleo, 75

fisiologı́a, 11
Patrón, 19, 22, 37, 42, 44
Citologı́a, 11
PCA, 25, 26, 29, 68, 94, 107, 108, 111, 112,
Citoplasma, 11, 12
114, 118
Color, 98, 127
Procesamiento

Distancia, 35, 68, 80, 104, 117 computacional, 73

euclı́dea, 24 imágenes, 11, 38, 59, 70

Mahalanobis, 23, 24, 57, 104, 113


Recuento Diferencial, 1, 13, 15
radial, 86, 91
Redes

Estadı́stica, 11, 25, 31 neuronales, 11

Región, 27, 28, 69, 80


Filtro, 27, 80, 99, 104, 105, 113, 118

inicial, 75, 99 Segmentación, 6, 27–30, 54, 58, 60, 62, 68,

mediana, 30 73, 75, 81, 98, 113, 118

Fourier, 8, 59, 89, 91, 114 automática, 8

semi-automática, 26
Hematologı́a, 11
Técnicas, 26, 31, 59
Leucocitos, 5, 13, 69
agrupación, 118

Membrana, 7, 11 clasificación, 31
144 ÍNDICE ALFABÉTICO

empalmamiento, 119

escalamiento, 87

segmentación, 27, 29, 118

validación, 11, 50

visión, 3, 5, 6, 117

Varianza, 20, 22, 25

You might also like