Professional Documents
Culture Documents
Banca Examinadora:
Prof. Dr. Clsio Luis Tozzi (DCA/FEEC/UNICAMP)
Prof. Dr. Jos Mario De Martino (DCA/FEEC/UNICAMP)
Prof. Dr. Roberto de Alencar Lotufo (DCA/FEEC/UNICAMP)
Prof. Dr. Jos Eduardo Cogo Castanho (DEE/FEB/UNESP)
Campinas, SP
2007
T151m
ii
iii
Resumo
Neste trabalho foi desenvolvida uma metodologia para inspeo visual e
automtica de carga de gros em vages ferrovirios que utiliza tcnicas de
processamento de imagens. A metodologia inclui trs etapas principais: a
localizao do vago na imagem utilizando a transformada de Hough, a descrio
da carga usando cor e textura, e a identificao de regies com possveis objetos
sobrepostos. A avaliao dos resultados foi feita a partir de imagens reais e
simuladas. A abordagem proposta mostrou-se adequada para os objetivos
especificados.
Palavras-chave: Segmentao de imagens, anlise de imagens, transformada de
Hough, matriz de co-ocorrncia.
Abstract
This work proposes the development of a methodology to scan visually and
automatically the grain cargo in railway cars using image processing techniques.
The methodology is composed by three main steps: the localization of the railway
car in the image using the Hough Transform, the description of the cargo using its
color and texture, and the identification of regions with possibly overlaid objects.
The assessment of the results was done through real and simulated images. The
proposed methodology proved to be adequate for the specified objectives.
Key words: Image Segmentation, Image Analysis, Hough Transform, Cooccurrence Matrix.
Agradecimentos
Gostaria de agradecer primeiramente a Deus pelas oportunidades oferecidas, e a
colaborao de vrias pessoas e instituies para minha formao pessoal e
acadmica, s quais deixo aqui minha sincera gratido e reconhecimento.
Agradeo aos meus pais Elias Jorge e Maria Albertina pelo apoio incondicional
que sempre tiveram em relao ao meu interesse em cursar um programa de
mestrado.
Ao meu orientador na graduao, Prof. Marco, pelo incentivo e confiana
depositada no prosseguimento dos meus estudos acadmicos. Serei sempre grato
pela amizade e considerao que teve por mim.
Ao meu orientador no mestrado, Prof. Clsio, tenho muito a agradecer. A
oportunidade que me foi dada em participar do seu grupo de pesquisa, a pacincia
e confiana que teve em mim desde o incio deste trabalho e, sem dvida, a
didtica nas aulas que tive o privilgio de ser seu aluno.
Aos demais docentes da FEEC, que de alguma forma puderam contribuir para o
desenvolvimento deste trabalho.
Aos meus colegas do DCA (Alex e Dennis) e do DMO (Atlio), alm de todos os
outros que tive a oportunidade de conhecer ao longo desse perodo.
Aos membros da banca examinadora, pelas crticas e sugestes apresentadas.
A UNICAMP, pelo acolhimento e infra-estrutura.
ix
Sumrio
Lista de Figuras .................................................................................................................... xv
Glossrio.............................................................................................................................xvii
Captulo 1 ............................................................................................................... 1
Introduo .......................................................................................................................... 1
1.1
1.2
Captulo 2 ............................................................................................................... 5
Conceitos Iniciais ............................................................................................................... 5
2.1
Segmentao de Imagens........................................................................................ 5
2.1.1
Limiarizao ................................................................................................... 6
2.1.2
Transformada de Hough ................................................................................. 8
2.2
Descrio de Imagens .......................................................................................... 13
2.2.1
Modelos de Cor ............................................................................................ 13
2.2.1.1
Modelo de cor RGB.............................................................................. 13
2.2.1.2
Modelo de cor YIQ............................................................................... 14
2.2.1.3
Modelo de cor HSV.............................................................................. 14
2.2.2
Descrio de Imagens Baseada em Histograma ........................................... 15
2.2.3
Descrio de Texturas .................................................................................. 17
2.2.3.1
Abordagem Estatstica.......................................................................... 19
2.2.3.1.1 Mtodo de Dependncia Espacial dos Nveis de Cinza (SGLDM).... 20
2.2.3.1.2 Mtodo do Comprimento de Seqncias de Nveis de Cinza
(GLRLM) ........................................................................................... 23
2.2.3.1.3 Mtodo da Diferena de Nveis de Cinza (GLDM) ........................... 25
2.2.3.2
Descritores Escalares............................................................................ 27
2.2.3.2.1 Mtodo de Dependncia Espacial dos Nveis de Cinza (SGLDM).... 28
2.2.3.2.2 Mtodo do Comprimento de Seqncias de Nveis de Cinza
(GLRLM) ........................................................................................... 30
2.2.3.2.3 Mtodo da Diferena de Nveis de Cinza (GLDM) ........................... 32
2.3
Reconhecimento de Imagens ................................................................................ 34
2.3.1
Classificador de Distncia Mnima............................................................... 34
2.3.2
Classificador dos K-vizinhos mais prximos ............................................... 37
2.3.3
Anlise de Agrupamento por K-mdias ....................................................... 38
Captulo 3 ............................................................................................................. 39
Metodologia Proposta para a Soluo do Problema....................................................... 39
3.1
3.2
Pr-processamento de Imagens............................................................................ 41
3.3
Segmentao de Imagens...................................................................................... 41
3.4
3.5
Captulo 4 ............................................................................................................. 67
Experimentos e Resultados............................................................................................... 67
4.1
4.2
Captulo 5 ............................................................................................................. 87
Concluso e Trabalhos Futuros ....................................................................................... 87
Referncias Bibliogrficas ................................................................................. 89
xiv
Lista de Figuras
Fig. 1.1 - Passos fundamentais em um sistema de processamento de imagens digitais [4] ... 2
Fig. 2.1 - a) Imagem em nveis de cinza; b) Imagem binarizada [6]...................................... 5
Fig. 2.2 - Imagem a ser aplicada a transformada de Hough ................................................... 9
Fig. 2.3 - Espao dos parmetros (a,b) ................................................................................. 10
Fig. 2.4 - Maior reta encontrada na imagem......................................................................... 10
Fig. 2.5 - Exemplo de coordenada polar (, ) ..................................................................... 11
Fig. 2.6 - Imagem a ser aplicada a transformada de Hough ................................................. 12
Fig. 2.7 - Espao de Hough (, )......................................................................................... 12
Fig. 2.8 - Maiores retas encontradas na imagem .................................................................. 13
Fig. 2.9 - Espao de cores RGB ........................................................................................... 14
Fig. 2.10 - Espao de cores HSV.......................................................................................... 15
Fig. 2.11 - Exemplos de texturas extradas do lbum VisTex [19] ..................................... 18
Fig. 2.12 - Representao das direes em relao a um pixel de referncia....................... 21
Fig. 2.13 - Nveis de cinza da imagem..................................................................................21
Fig. 2.14 - Modelo de matriz de co-ocorrncia .................................................................... 21
Fig. 2.15 - Matrizes de co-ocorrncia de nveis de cinza ..................................................... 22
Fig. 2.16 - Matrizes de co-ocorrncia de nveis de cinza normalizadas............................... 23
Fig. 2.17 - Nveis de cinza da imagem..................................................................................24
Fig. 2.18 - Modelo de matriz de co-ocorrncia do GLRLM ................................................ 24
Fig. 2.19 - Matrizes de co-ocorrncia do GLRLM constitudas........................................... 24
Fig. 2.20 - Nveis de cinza da imagem ................................................................................. 25
Fig. 2.21 - Comparao das matrizes de co-ocorrncia geradas pelo SGLDM com os
vetores calculados pelo GLDM ............................................................................................ 27
Fig. 2.22 - Representao do processo de classificao das amostras atravs do
Classificador de Distncia Mnima....................................................................................... 36
Fig. 2.23 - Representao do processo de classificao das amostras para K = 3 atravs do
classificador dos K-vizinhos mais prximos........................................................................ 37
Fig. 2.24 - Representao do processo de agrupamento das amostras para K = 3 atravs da
anlise de agrupamento por K-mdias.................................................................................. 38
Fig. 3.1 - Enquadramento do vago na imagem ................................................................... 40
Fig. 3.2 - Disposio da cmera em relao ao vago.......................................................... 40
Fig. 3.3 - Posicionamento das bordas do vago ................................................................... 40
Fig. 3.4 - Imagem binria ..................................................................................................... 42
Fig. 3.5 - Espao de Hough .................................................................................................. 43
Fig. 3.6 - Espao de Hough e as janelas de interesse ........................................................... 43
Fig. 3.7 - Espaos de Hough correspondentes a deteco das retas horizontais .................. 44
Fig. 3.8 - Espao de Hough responsvel pela deteco das retas verticais .......................... 45
Fig. 3.9 - Determinao de um vrtice do vago.................................................................. 46
Fig. 3.10 - Processo de transformao geomtrica do vago ............................................... 48
Fig. 3.11 - Processo de determinao do maior retngulo inscrito rea corrigida............. 49
Fig. 3.12 - Viso perspectiva de um tabuleiro de xadrez ..................................................... 50
xv
xvi
Glossrio
ASM Angular Second Moment
GLDM Gray Level Difference Method
GLDV Gray Level Difference Vector
GLRLM Gray Level Run Length Method
HALE High Altitude and Long Endurance
HSV Hue, Saturation, Value
NTSC National Television Standards Committee
RGB Reg, Green, Blue
SGLDM Spatial Gray Level Dependence Method
YIQ Luminance, In-phase, Quadrature
xvii
Captulo 1
Introduo
Nesse trabalho foram apresentados mtodos para realizar a deteco dos objetos
por meio da anlise estatstica da textura, binarizao e morfologia matemtica.
As tcnicas utilizadas em sistemas que promovem a deteco e o
reconhecimento de objetos por meio de imagens digitais pertencem a diversas
reas, como por exemplo, processamento de sinais, morfologia matemtica e
processamento de imagens. As etapas que constituem, em geral, as tarefas de um
sistema de processamento de imagens so: aquisio, pr-processamento,
segmentao, representao e descrio, reconhecimento e interpretao. De
forma complementar, a base de conhecimento realiza a insero de informaes
prvias sobre o domnio do problema. Os passos fundamentais so exibidos na
Figura 1.1.
Captulo 2
Conceitos Iniciais
a)
b)
2.1.1 Limiarizao
Uma forma de segmentar imagens por meio da similaridade entre pixels.
A limiarizao lida com a similaridade dos nveis de cinza de uma imagem. Essa
uma operao que envolve testes na funo da imagem. A limiarizao de uma
imagem pode ser definida conforme a equao 2.1.
1 se f ( x, y ) > T
g ( x, y ) =
0 se f ( x, y ) T
(2.1)
onde
(2.2)
onde
6
imagem por um nico limiar T. Esse valor atribudo manualmente com base na
anlise emprica dos nveis de cinza presentes na imagem. Diferentemente, a
binarizao automtica global estima um limiar de acordo com o histograma da
imagem, ou seja, considera a freqncia de ocorrncia dos nveis de cinza para a
determinao do valor do limiar.
Uma tcnica muito utilizada para a binarizao de imagens o mtodo de
Otsu [5]. Esse mtodo realiza o clculo para a determinao do limiar de forma
automtica e global. Primeiramente, deve-se calcular o histograma normalizado de
uma imagem representada por L nveis de cinza. O nmero de pixels de
intensidade i dado por ni e o nmero total de pixels da imagem N. Dessa
forma, o histograma de nveis de cinza normalizado dado por:
L
pi = ni / N | pi 0, pi = 1
i =1
(2.3)
0 = pi
(2.4)
i =1
L
1 =
(2.5)
i = k +1
e
k
0 = ip i / 0
(2.6)
i =1
L
1 =
ip
i = k +1
/ 1
(2.7)
0 + 1 = 1
(2.8)
02 = (i 0 ) 2 p i / 0
12 =
i =1
L
(i )
1
p i / 1
i = k +1
(2.9)
(2.10)
O melhor valor para um limiar k pode ser determinado por uma busca
seqencial, atravs de todos os valores possveis de k, a fim de localizar aquele
que minimize a varincia intra-classes. Essa varincia corresponde soma
ponderada das varincias das classes em relao a suas probabilidades de
ocorrncia conforme a equao 2.11.
W2 = 0 02 + 1 12
(2.11)
(2.12)
possam ser parametrizadas, tais como retas, crculos e elipses. Sua primeira
concepo estava baseada na localizao de retas. Algumas aplicaes so
encontradas em [10], [11], [12], [13]. Em uma imagem binria em que os pontos
so localizados por meio de coordenadas cartesianas, a equao da reta dada
por y = ax + b, onde a o coeficiente angular da reta e b o coeficiente linear da
reta. O espao (a,b), gerado pela transformada de Hough, torna possvel a
localizao das retas presentes na imagem. Esse espao determinado pelos
parmetros (a,b) atravs do clculo da equao b = y ax para cada ponto
presente na imagem.
Em termos computacionais o espao de Hough implementado por uma
matriz de acumulao, onde as linhas contm os valores discretos de b e as
colunas contm os valores discretos de a. Todas as clulas so inicializadas com
o nmero zero. Ao final do preenchimento da matriz de acumulao, cada clula
tem como valor a quantidade de pontos colineares que constituem uma reta com
inclinao (a) e interseco com o eixo y (b).
Para exemplificar, supe-se uma imagem que contenha quatro pontos com
coordenadas P1 (1,0), P2 (1,1), P3 (2,1) e P4 (4,1), conforme a Figura 2.2. A
transformada de Hough realizada a partir dessa imagem gera o espao de
acumulao representado na Figura 2.3. Atravs desse espao estabelecida a
localizao das retas presentes na imagem. A Figura 2.4 exibe a maior reta
localizada pela transformada de Hough. Os pontos que constituem essa reta so
determinados por meio do conjunto de retas do espao de Hough que se cruzam
no ponto indicado pelo crculo vermelho na Figura 2.3.
10
11
6
5
4
3
2
1
0
-1
-2
-3
-4
-5
P1
P2
P3
P4
P5
P6
P7
-90
-70
-50
-30
-10
10
30
50
70
12
2.2.1.1
O modelo de cor RGB tem como cores primrias o azul, verde e vermelho.
Esse modelo baseia-se na sensibilidade do sistema visual humano a essas trs
cores, e utiliza o sistema de coordenadas cartesianas para a especificao das
cores de acordo com a Figura 2.9. O modelo de cor RGB largamente empregado
em equipamentos emissores de luz, tais como monitores [4].
13
2.2.1.2
(2.13)
0.621 Y
R 1 0.956
G = 1 0.272 0.647 I
B 1 1.106 1.703 Q
(2.14)
2.2.1.3
15
wi x i
x=
i =1
L
(2.15)
wi
i =1
onde
so o
desvio-padro
e a varincia
que
podem
ser vistos,
1/ 2
( xi x ) 2
i =1
(2.16)
e
1
n 1
2 =
(x
i =1
x)2
(2.17)
onde
16
18
2.2.3.1
Abordagem Estatstica
20
90
135
45
A fim de exemplificar o processo do clculo de uma matriz de coocorrncia, os passos necessrios sero apresentados a seguir. Tomando-se
como exemplo a imagem exibida pela Figura 2.13, onde os nveis de cinza esto
distribudos em valores de 0 a 3, a quantidade N de nveis de cinza determina o
tamanho da matriz de co-ocorrncia (NxN) representada pela Figura 2.14.
Tambm se pode dizer que esse tipo de matriz simtrico em torno da diagonal
principal. Nesta figura, #(i,j) o nmero de vezes em que o nvel de cinza i e o
nvel de cinza j satisfazem a distncia e direo definidas por um vetor de
deslocamento = (d , ) .
Nveis de cinza dos
pixels vizinhos
Nveis de
cinza dos
pixels de
referncia
0
1
2
3
0
#(0,0)
#(1,0)
#(2,0)
#(3,0)
1
#(0,1)
#(1,1)
#(2,1)
#(3,1)
2
#(0,2)
#(1,2)
#(2,2)
#(3,2)
3
#(0,3)
#(1,3)
#(2,3)
#(3,3)
21
= (1, 0)
(2.18)
DD
= (1, 45)
(2.19)
= (1, 90)
(2.20)
DE
= (1, 135)
(2.21)
A partir dessas informaes, so determinadas as matrizes de coocorrncia, que so calculadas por meio da verificao de todas as combinaes
possveis de transio entre os nveis de cinza presentes na imagem. Na Figura
2.15, so exibidas as matrizes de co-ocorrncia geradas a partir da imagem da
Figura 2.13 e especificadas pelos vetores apresentados nas equaes 2.18, 2.19,
2.20 e 2.21.
2
2
=
0
2 0 2
2 2 0
2 2 2
0 2 2
0
VV (i, j; 1, 90 ) =
2
0 2 2
2 2 2
2 2 0
2 0 2
1
VDE (i, j; 1, 135 ) =
1
1 1 3
2 0 1
0 2 1
1 1 0
1
VDD (i, j; 1, 45 ) =
1
1 1 0
0 3 1
3 0 1
1 1 2
VH (i, j; 1, 0 )
V
Pi , j = N 1 Ni,1j
Vi, j
(2.22)
i = 0 j =0
22
onde
PH
0
0.0833
0.0833 0.0833
0
0.0833 0.0833 0.0833
=
0
0.0833 0.0833 0.0833
0.0833
0
0.0833 0.0833
PDE
0
0.0556
0.0556 0.1111
=
0.0556
0
0.1111 0.0556
PV
0
0.0833 0.0833
0.0833
0.0833 0.0833
0
0.0833
PDD
0
0.1111 0.0556 0.0556
0
0.1667 0.0556
0.0556
=
0.0556 0.1667
0
0.0556
0
0.0556 0.0556 0.1111
23
Nveis de
cinza dos
pixels de
referncia
0
1
2
3
1
#(0,1)
#(1,1)
#(2,1)
#(3,1)
2
#(0,2)
#(1,2)
#(2,2)
#(3,2)
3
#(0,3)
#(1,3)
#(2,3)
#(3,3)
4
#(0,4)
#(1,4)
#(2,4)
#(3,4)
2
=
2
1 0 0
1 0 0
1 0 0
1 0 0
2
VV (i, j; 90 ) =
2
1
1
1
1
2
VDE (i, j;135 ) =
2
0 0 0
1 0 0
1 0 0
0 0 0
4
VDD (i, j; 45 ) =
4
1 0 0
0 0 0
0 0 0
1 0 0
VH (i, j; 0 )
0
0
0
0
0
0
24
G (m, n) = G (m, n) G (m + m, n + n)
(2.23)
onde
1 = (0, d )
(2.24)
2 = (d , d )
(2.25)
3 = (d ,0)
(2.26)
4 = ( d , d )
(2.27)
25
V H (i; 1 ) = (4, 6, 0, 2 )
(2.28)
V DD (i; 2 ) = (2, 5, 2, 0)
(2.29)
VV (i; 3 ) = (4, 2, 4, 2 )
(2.30)
V DE (i; 4 ) = (2, 2, 2, 3)
(2.31)
V
Pi = N 1i
Vi
(2.32)
i =0
onde
P a probabilidade de ocorrncia de i;
(2.33)
(2.34)
(2.35)
(2.36)
N 1N 1
P (k ) = P(i, j; d , )
d
i = 0 j = 0 | i j |= k
(2.37)
onde
26
obtidos com o GLDM tambm podem ser alcanados com a utilizao do SGLDM.
Os resultados dos mtodos SGLDM e GLDM podem ser visualizados na Figura
2.21.
PH
0
0.0833
0.0833 0.0833
0
0.0833 0.0833 0.0833
=
0
0.0833 0.0833 0.0833
0.0833
0
0.0833 0.0833
PDE
0
0.0556
0.0556 0.1111
=
0.0556
0
0.1111 0.0556
PV
0
0.0833 0.0833
0.0833
0.0833 0.0833
0
0.0833
PDD
0
0.1111 0.0556 0.0556
0
0.1667 0.0556
0.0556
=
0.0556 0.1667
0
0.0556
0
0.0556 0.0556 0.1111
Fig. 2.21 - Comparao das matrizes de co-ocorrncia geradas pelo SGLDM com os vetores
calculados pelo GLDM
2.2.3.2
Descritores Escalares
27
Ng
Ng 1
=
i=0
Ng 1
=
j =0
t1 = [P(i, j )]
(2.38)
28
2) Entropia
t2 = P(i, j ) log( P(i, j ))
i
(2.39)
(2.40)
O contraste mede o grau de variao local dos nveis de cinza entre pares
de pixels. A equao 2.40 considera a diferena entre os nveis de cinza i e j para
o clculo do contraste.
4) Homogeneidade
t4 =
i
1
P(i, j )
1 + (i j ) 2
(2.41)
29
V (i, j )
Ng
Nr
Ng 1
i =0
Nr
=
j =1
Tr = V (i, j )
i
Tp
r1 =
1
Tr
V (i, j )
j2
(2.42)
30
r2 =
1
Tr
j
i
V (i, j )
(2.43)
1
r3 = V (i, j )
Tr i j
(2.44)
r4 = V (i, j )
Tr j i
(2.45)
r5 =
1
V (i, j )
Tp i j
(2.46)
31
s1 =
[P(i)]
(2.47)
i=0
s2 =
(2.48)
i=0
32
s3 =
i P(i)
2
(2.49)
i =0
O contraste mede o grau de variao local dos nveis de cinza entre pares
de pixels. A equao 2.49 considera a diferena entre nveis de cinza para o
clculo do contraste.
4) Homogeneidade
Ng 1
s4 =
P(i )
2
+1
i
i =0
(2.50)
s5 =
iP(i)
(2.51)
i =0
33
treinamento
no-supervisionado,
as
classes
das
amostras
de
34
mj =
1
Nj
(2.52)
v j
onde
j = 1, 2,..., M;
M a quantidade de classes;
d ( x, m j ) =
x m
i
2
ji
(2.53)
i =1
onde
e
d ( x, m j ) = ( x m j )( j 1 )( x m j )T
(2.54)
No qual,
N
j
1
j =
(Y ji Y j )(Y ji Y j ) T
N j 1 i =1
(2.55)
onde
35
Caracterstica 2
Caracterstica 2
Caracterstica 2
previamente estabelecidas.
Caracterstica 1
a)
Caracterstica 1
b)
Caracterstica 1
c)
36
Caracterstica 1
a)
Caracterstica 2
Caracterstica 2
Caracterstica 2
Caracterstica 1
b)
Caracterstica 1
c)
37
Caracterstica 2
Caracterstica 1
b)
Caracterstica 2
Caracterstica 2
Caracterstica 1
a)
Caracterstica 1
c)
Caracterstica 2
Caracterstica 2
Caracterstica 2
Caracterstica 1
Caracterstica 1
Caracterstica 1
f)
e)
d)
Fig. 2.24 - Representao do processo de agrupamento das amostras para K = 3 atravs da
anlise de agrupamento por K-mdias
38
Captulo 3
Metodologia Proposta para a Soluo do Problema
39
Regio Superior
Regio Inferior
Fig. 3.1 - Enquadramento do vago na imagem
40
41
acordo com o algoritmo de Otsu, descrito na seo 2.1.1. Esse algoritmo foi
escolhido devido ao baixo tempo de processamento e eficincia demonstrada na
limiarizao das amostras utilizadas para avaliao. Aproximaes para a
magnitude do gradiente, tais como os operadores de Prewitt e Sobel [4], no
foram utilizadas antes da binarizao porque, de forma geral, esses operadores
evidenciaram os trilhos ferrovirios presentes na imagem durante os testes
realizados, prejudicando a deteco das retas determinadas pelas bordas do
vago. Outro problema encontrado na utilizao desses detectores que foram
geradas bordas duplas ao redor do vago ferrovirio, prejudicando a formao de
retas contnuas e de comprimento significativo sobre as bordas do vago.
Aps a binarizao, devem ser encontradas as bordas que delimitam a
rea do vago ferrovirio. O processo ser exemplificado a comear pela Figura
3.4.
42
Janela 2
Janela 1
Janela 3
43
(a)
(b)
44
Fig. 3.8 - Espao de Hough responsvel pela deteco das retas verticais
mb = (Y Y1b ) /( X X 1b ) .
45
P(X,Y)
P1a(X1a,Y1a)
P1b(X1b,Y1b)
b
Fig. 3.9 - Determinao de um vrtice do vago
X =
ma X 1a mb X 1b Y1a + Y1b
ma mb
Y = ma X ma X 1a + Y1a
(3.1)
(3.2)
onde
x' A B
y ' = D E
w G H
C x
F y
1 1
(3.3)
46
x'
y'
,v=
da imagem corrigida. A fim de que sejam
w
w
u1 x1
u x
2 2
u 3 x 3
u 4 = x 4
v1 0
v2 0
v 0
3
v 4 0
y1
y2
y3
y4
0
0
0
0
1 0
1 0
1 0
1 0
0 x1
0 x2
0 x3
0 x4
0
0
0
0
y1
y2
y3
y4
0
0
0
0
1
1
1
1
u1 x1
u 2 x2
u 3 x3
u 4 x4
v1 x1
v2 x2
v 3 x3
v4 x4
u1 y1 A
u 2 y 2 B
u3 y3 C
u4 y4 D
v1 y1 E
v2 y2 F
v3 y 3 G
v 4 y 4 H
(3.4)
onde
x1 + x2
2
(3.5)
u3 = u 4 =
x3 + x4
2
(3.6)
vi = yi
(3.7)
47
( x2 , y 2 )
( x3 , y3 )
( x2 , y 2 )
( x3 , y3 )
(u2 , v2 )
(u3 , v3 )
( x1 , y1 )
( x4 , y 4 )
( x1 , y1 )
( x4 , y 4 )
(u1 , v1 )
(u4 , v4 )
a)
b)
c)
48
(u2 , v2 )
(u3 , v3 )
(u2 , v2 )
(u3 , v3 )
(u2 , v3 )
(u3 , v3 )
(u1 , v1 )
(u4 , v4 )
(u1 , v1 )
(u4 , v4 )
(u1 , v1 )
(u4 , v1 )
a)
b)
c)
49
xp =
xd
z
(3.8)
yp =
yd
z
(3.9)
zp = d
(3.10)
onde
50
xp a coordenada x do ponto Pp ;
yp a coordenada y do ponto Pp ;
zp a coordenada z do ponto Pp ;
51
Converter para
nveis de cinza
Binarizar
imagem
Pr-processamento
Incio
Aplicar a
transformada
de Hough para
cada janela
Identificar as
retas
adequadas de
cada janela
Localizar os
vrtices do
vago
Realizar a
transformao
geomtrica
Estabelecer a
regio de
interesse
Imagem
segmentada
Fim
52
53
w m
i
fm =
i =1
256
(3.11)
i =1
256
y s
i i
fs =
i =1
256
(3.12)
i =1
onde
54
55
Descrio da Cromaticidade
Incio
Redimensionar
imagem
Converter
espao de cores
Para os
componentes de
Matiz e
Saturao
Subdividir a
imagem
Para cada
regio
Calcular
intensidade mdia
Descritores
calculados
Fim
56
cinza. Nesse trabalho, a reduo de nveis de cinza foi de 256 para 32 nveis. Para
melhor eficcia do processo de quantizao feita a equalizao do histograma
de nveis de cinza da imagem. A quantizao se inicia a partir da determinao do
histograma acumulado normalizado da imagem. Um exemplo do processo de
quantizao apresentado nas Figuras 3.17, 3.18 e 3.19 que mostram a imagem,
o
histograma
acumulado
normalizado
histograma
quantizado,
respectivamente.
Probabilidade cumulativa
de nveis de cinza (F)
57
1 F (qk 1 )
K k + 1)
(3.13)
onde
q0 = 0;
k = 1...K;
Probabilidade cumulativa
de nveis de cinza (F)
58
1 + (i j)
i
Pk (i , j )
(3.14)
f
f med =
(k )
k =1
(3.15)
59
Descrio da Textura
Selecionar o
componente de
valor
Incio
Reduzir quantidade
de nveis de cinza
Subdividir a
imagem
Para cada
regio
Gerar matrizes de
co-ocorrncia de
nveis de cinza
Calcular o vetor
de
homogeneidades
Calcular a mdia
dos valores
encontrados
Descritores
calculados
Fim
60
f (i )
(3.16)
i =1
mn =
1 N
n =
( f n (i ) mn ) 2
N 1 i =1
1/ 2
(3.17)
onde
treinamento i.
61
Incio
Para todas as
imagens de
treinamento
Descrio
Aquisio,
Pr-processamento
e Segmentao
Descrio da
Cromaticidade
Descrio da
Textura
Calcular mdia e
desvio-padro dos
descritores para
cada regio
Prottipo
calculado
Fim
Fig. 3.21 - Fluxograma que apresenta os processos envolvidos com a fase de treinamento do
processo de classificao
62
A fase de teste, por sua vez, responsvel por analisar as imagens sem
informaes prvias a respeito da presena de objetos sobre o minrio do vago.
Nela, os descritores so calculados para cada imagem de forma que se torne
possvel compar-los com os valores obtidos na fase de treinamento. A fim de
classificar as imagens, necessrio calcular a distncia entre os valores da mdia
obtidos na fase de treinamento e os descritores da imagem de teste da seguinte
forma:
d n (t ) = (mn (t ) p n (t )) 2
(3.18)
onde
n a regio analisada;
t o componente analisado.
A partir do clculo das distncias, os limiares de aceitao so
ln (t ) = 3 n (t )
(3.19)
onde
n a regio analisada;
t o componente analisado.
O clculo dos limiares de aceitao realizado de acordo com a equao
3.19 porque se supe que os valores dos descritores das regies pertencentes s
imagens de treinamento se concentrem em torno da mdia (equao 3.16)
conforme mostrado na Figura 3.22.
63
Fig. 3.22 - Representao grfica de uma distribuio normal (gaussiana), onde 99,7% das
amostras da populao encontram-se entre 3 e + 3
64
Descrio
Incio
Fase de Treinamento da
Classificao
Descrio da
Cromaticidade
Descrio da
Textura
Classe
Fim
Fig. 3.23 - Fluxograma com nfase na fase de teste da classificao das imagens
65
Captulo 4
Experimentos e Resultados
De forma geral, pode-se dividir este trabalho em duas tarefas principais: a
delimitao da rea dos vages, efetuando as correes geomtricas necessrias;
e a identificao de objetos sobre o minrio dos vages. Os resultados alcanados
foram obtidos em um computador com as seguintes especificaes: AMD Athlon
XP 1.66 GHz, 1.25 GB de memria RAM e sistema operacional Microsoft Windows
XP. Os scripts e as funes foram desenvolvidos em MATLAB na verso 7.2 [6].
67
68
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.1 - Imagens de vages ferrovirios adquiridas em cores
69
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.2 - Imagens convertidas para nveis de cinza
70
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.3 - Imagens binrias
71
A partir das imagens binrias, as retas que passam sobre as bordas dos
vages foram localizadas com a utilizao da transformada de Hough. Essas retas
esto representadas com a cor vermelha, conforme mostrado na Figura 4.4.
Atravs da localizao das bordas dos vages, as reas de interesse foram
delimitadas e sofreram as correes geomtricas necessrias para preparar as
imagens para a etapa de descrio. As imagens resultantes do processo de
segmentao so apresentadas na Figura 4.5. A execuo dos algoritmos
envolvidos com as etapas de pr-processamento e segmentao levou
aproximadamente 4 segundos para a gerao de cada uma das imagens
resultantes. Para esse conjunto de imagens, todos os vages foram delimitados
de forma satisfatria, e posteriormente as correes geomtricas tambm foram
efetuadas com sucesso.
72
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.4 - Localizao das retas encontradas sobre as bordas dos vages
73
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.5 - Imagens resultantes da etapa de segmentao
74
75
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.6 - Conjunto de imagens utilizado para a identificao de objetos sobre o minrio dos vages
76
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.7 - Resultados do reconhecimento de imagens
77
Fase de Treinamento
Fase de Teste
Tempo (s)
200
150
100
50
0
4
12
16
20
24
28
32 34
Fig. 4.8 - Tempo de processamento utilizado pela fase de treinamento e pela fase de teste do
processo de classificao de acordo com regies de tamanhos distintos
78
16x16 pixels, j que regies deste tamanho fizeram com que uma maior
quantidade de imagens tivesse a deteco realizada corretamente.
Deteco Correta
Deteco Incorreta
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
4
12
16
20
24
28
32 34
79
80
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
Fig. 4.10 - Conjunto de imagens utilizado para a identificao de objetos sobre areia
81
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
82
Fase de Treinamento
Fase de Teste
Tempo (s)
200
150
100
50
0
12
14
16
18
20
22
24
26
28
30
32
34
Fig. 4.12 - Tempo de processamento utilizado pela fase de treinamento e pela fase de teste do
processo de classificao de acordo com regies de tamanhos distintos
83
Deteco Correta
Deteco Incorreta
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
12
16
20
24
28
32
34
Utilizao Conjunta
Matiz
Saturao
Homogeneidade
100%
80%
60%
40%
20%
0%
Deteco Correta
Deteco Incorreta
Fig. 4.14 - Quantidade de imagens detectadas corretamente e incorretamente de acordo com cada
descritor utilizado para o conjunto de imagens de minrio
84
Utilizao Conjunta
Matiz
Saturao
Homogeneidade
100%
80%
60%
40%
20%
0%
Deteco Correta
Deteco Incorreta
Fig. 4.15 - Quantidade de imagens detectadas corretamente e incorretamente de acordo com cada
descritor utilizado para o conjunto de imagens de areia
de
imagens
de
areia
os
descritores
de
matiz,
saturao
85
Captulo 5
Concluso e Trabalhos Futuros
Este trabalho descreveu uma abordagem para a inspeo de carga em
vages ferrovirios utilizando tcnicas de processamento de imagens. Ao longo do
desenvolvimento da pesquisa foram implementados, em Matlab, mtodos de
segmentao e anlise de imagens. Esses mtodos foram determinados de forma
que atendessem as caractersticas do problema envolvido de maneira satisfatria.
Os vages ferrovirios foram localizados e delimitados com a utilizao da
transformada de Hough e de transformaes geomtricas, visando-se a gerao
de resultados apropriados para a anlise das imagens. A anlise de cores e
texturas foi considerada com a finalidade de se obter resultados mais confiveis. O
tempo de processamento gasto pela metodologia foi considerado aceitvel
levando-se em considerao a linguagem de programao utilizada para a sua
implementao. Para o aprimoramento deste trabalho so sugeridos os seguintes
tpicos para trabalhos futuros:
87
88
Referncias Bibliogrficas
[1]
[2]
Paolo Mulassano, Letizia Lo Presti. Object detection on the sea surface, based on
texture analysis, IEEE International Conference on Electronics, Circuits and
Systems, pp. 855-858, 1999.
[3]
[4]
[5]
Nobuyuki Otsu. A threshold selection method from gray level histograms, IEEE
Transactions on Systems, Man and Cybernetics, vol. 9, pp.62-66, 1979.
[6]
[7]
[8]
[9]
Paul V. C. Hough. Method and means for recognizing complex patterns, Patente n
3069654, 1962.
[10]
[11]
Alexander Mitchell, Steven Mills. Finding Fencing Foils using the Hough
Transform, International Conference on Visual Information Engineering, pp. 59-64,
2005.
[12]
89
[13]
[14]
Richard O. Duda, Peter E. Hart. Use of the Hough Transformation to Detect Lines
and Curves in Pictures, Communications of the ACM, vol. 15, no. 1, 1972.
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Classification of nonhomogenous texture images by combining classifiers, IEEE International
Conference on Image Processing, 2003.
[26]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Retrieval of Non-Homogenous
Textures Based on Directionality, European Workshop on Image Analysis for
Multimedia Interactive Services, pp. 107-110, 2003.
90
[27]
[28]
[29]
[30]
[31]
Lee. H. Siew, Robert M. Hodgson, Errol J. Wood. Texture measures for carpet wear
assessment, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.
10, no. 1, pp. 92105, 1988.
[32]
[33]
[34]
[35]
[36]
[37]
[38]
[39]
Martin G. Bello, Gerald J. Dobeck. The use of texture measures in improving mine
classification performance, OCEANS Proceedings, vol. 2, pp.1103-1109, 2003.
91
[40]
[41]
[42]
[43]
Mari Partio, Bogdan Cramariuc, Moncef Gabbouj, Ari Visa. Rock texture retrieval
using gray level co-occurrence matrix, Nordic Signal Processing Symposium, 2002.
[44]
Mark A. Sheppard, Liwen Shih. Efficient Image Texture Analysis and Classification
for Prostate Ultrasound Diagnosis, IEEE Computational Systems Bioinformatics
Conference, 2005.
[45]
Leen-Kiat Soh, Costas Tsatsoulis. Texture Analysis of SAR Sea Ice Imagery Using
Gray Level Co-Occurrence Matrices, IEEE Transactions on Geoscience and Remote
Sensing, vol. 37, no. 2, 1999.
[46]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Rock Image Classification
Using Non-Homogenous Textures and Spectral Imaging, Winter School of
Computer Graphics, 2003.
[47]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Combining Classifiers in Rock
Image Classification Supervised and Unsupervised Approach, Advanced Concepts
for Intelligent Vision Systems, 2004.
[48]
[49]
[50]
[51]
92
[52]
93