Tam Bur Gabriel Dos Santos

Gabriel dos Santos Tambur
Metodologia para Inspeo Visual e

Automtica de Carga em Vages
Ferrovirios
Dissertao de Mestrado apresentada Faculdade de

Engenharia Eltrica e de Computao como parte dos
requisitos para a obteno do ttulo de Mestre em Engenharia
Eltrica. rea de concentrao: Engenharia de Computao.
Orientador: Prof. Dr. Clsio Luis Tozzi
Banca Examinadora:
Prof. Dr. Clsio Luis Tozzi (DCA/FEEC/UNICAMP)
Prof. Dr. Jos Mario De Martino (DCA/FEEC/UNICAMP)
Prof. Dr. Roberto de Alencar Lotufo (DCA/FEEC/UNICAMP)
Prof. Dr. Jos Eduardo Cogo Castanho (DEE/FEB/UNESP)
Campinas, SP
2007
FICHA CATALOGRFICA ELABORADA PELA

BIBLIOTECA DA REA DE ENGENHARIA E ARQUITETURA - BAE UNICAMP
T151m
Tambur, Gabriel dos Santos

Metodologia para inspeo visual e automtica de carga
em vages ferrovirios / Gabriel dos Santos Tambur. -Campinas, SP: [s.n.], 2007.
Orientador: Clsio Luis Tozzi
Dissertao (Mestrado) - Universidade Estadual de
Campinas, Faculdade de Engenharia Eltrica e de
Computao.
1. Anlise de imagens. 2. Processamento de imagens. 3.
Viso por computador. I. Tozzi, Clsio Luis. II.
Universidade Estadual de Campinas. Faculdade de
Engenharia Eltrica e de Computao. III. Ttulo.
Ttulo em Ingls: Methodology for visual and automatic inspection of cargo in

railway cars
Palavras-chave em Ingls: Image segmentation, Image analysis, Hough
transform, Co-occurence matrix
rea de concentrao: Engenharia de computao
Titulao: Mestre em Engenharia Eltrica
Banca examinadora: Jos Mario De Martino, Roberto de Alencar Lotufo, Jos
Eduardo Cogo Castanho
Data da defesa: 07/12/2007
Programa de Ps-Graduao: Engenharia Eltrica
ii
iii
Resumo
Neste trabalho foi desenvolvida uma metodologia para inspeo visual e
automtica de carga de gros em vages ferrovirios que utiliza tcnicas de
processamento de imagens. A metodologia inclui trs etapas principais: a
localizao do vago na imagem utilizando a transformada de Hough, a descrio
da carga usando cor e textura, e a identificao de regies com possveis objetos
sobrepostos. A avaliao dos resultados foi feita a partir de imagens reais e
simuladas. A abordagem proposta mostrou-se adequada para os objetivos
especificados.
Palavras-chave: Segmentao de imagens, anlise de imagens, transformada de
Hough, matriz de co-ocorrncia.
Abstract
This work proposes the development of a methodology to scan visually and
automatically the grain cargo in railway cars using image processing techniques.
The methodology is composed by three main steps: the localization of the railway
car in the image using the Hough Transform, the description of the cargo using its
color and texture, and the identification of regions with possibly overlaid objects.
The assessment of the results was done through real and simulated images. The
proposed methodology proved to be adequate for the specified objectives.
Key words: Image Segmentation, Image Analysis, Hough Transform, Cooccurrence Matrix.
Aos meus pais

Elias Jorge e Maria Albertina
e a minha av Filomena
vii
Agradecimentos
Gostaria de agradecer primeiramente a Deus pelas oportunidades oferecidas, e a
colaborao de vrias pessoas e instituies para minha formao pessoal e
acadmica, s quais deixo aqui minha sincera gratido e reconhecimento.
Agradeo aos meus pais Elias Jorge e Maria Albertina pelo apoio incondicional
que sempre tiveram em relao ao meu interesse em cursar um programa de
mestrado.
Ao meu orientador na graduao, Prof. Marco, pelo incentivo e confiana
depositada no prosseguimento dos meus estudos acadmicos. Serei sempre grato
pela amizade e considerao que teve por mim.
Ao meu orientador no mestrado, Prof. Clsio, tenho muito a agradecer. A
oportunidade que me foi dada em participar do seu grupo de pesquisa, a pacincia
e confiana que teve em mim desde o incio deste trabalho e, sem dvida, a
didtica nas aulas que tive o privilgio de ser seu aluno.
Aos demais docentes da FEEC, que de alguma forma puderam contribuir para o
desenvolvimento deste trabalho.
Aos meus colegas do DCA (Alex e Dennis) e do DMO (Atlio), alm de todos os
outros que tive a oportunidade de conhecer ao longo desse perodo.
Aos membros da banca examinadora, pelas crticas e sugestes apresentadas.
A UNICAMP, pelo acolhimento e infra-estrutura.
ix
A direo dos bales e o vo mecnico eram problemas insolveis.

Alberto Santos Dumont
xi
Sumrio
Lista de Figuras .................................................................................................................... xv
Glossrio.............................................................................................................................xvii
Captulo 1 ............................................................................................................... 1
Introduo .......................................................................................................................... 1
1.1
Objetivos e Tcnicas Aplicadas.............................................................................. 3
1.2
Organizao do Trabalho ...................................................................................... 4
Captulo 2 ............................................................................................................... 5
Conceitos Iniciais ............................................................................................................... 5
2.1
Segmentao de Imagens........................................................................................ 5
2.1.1
Limiarizao ................................................................................................... 6
2.1.2
Transformada de Hough ................................................................................. 8
2.2
Descrio de Imagens .......................................................................................... 13
2.2.1
Modelos de Cor ............................................................................................ 13
2.2.1.1
Modelo de cor RGB.............................................................................. 13
2.2.1.2
Modelo de cor YIQ............................................................................... 14
2.2.1.3
Modelo de cor HSV.............................................................................. 14
2.2.2
Descrio de Imagens Baseada em Histograma ........................................... 15
2.2.3
Descrio de Texturas .................................................................................. 17
2.2.3.1
Abordagem Estatstica.......................................................................... 19
2.2.3.1.1 Mtodo de Dependncia Espacial dos Nveis de Cinza (SGLDM).... 20
2.2.3.1.2 Mtodo do Comprimento de Seqncias de Nveis de Cinza
(GLRLM) ........................................................................................... 23
2.2.3.1.3 Mtodo da Diferena de Nveis de Cinza (GLDM) ........................... 25
2.2.3.2
Descritores Escalares............................................................................ 27
2.2.3.2.1 Mtodo de Dependncia Espacial dos Nveis de Cinza (SGLDM).... 28
(GLRLM) ........................................................................................... 30
2.2.3.2.3 Mtodo da Diferena de Nveis de Cinza (GLDM) ........................... 32
2.3
Reconhecimento de Imagens ................................................................................ 34
2.3.1
Classificador de Distncia Mnima............................................................... 34
2.3.2
Classificador dos K-vizinhos mais prximos ............................................... 37
2.3.3
Anlise de Agrupamento por K-mdias ....................................................... 38
Captulo 3 ............................................................................................................. 39
Metodologia Proposta para a Soluo do Problema....................................................... 39
3.1
Requisitos para Aquisio das Imagens............................................................... 39

xiii
3.2
Pr-processamento de Imagens............................................................................ 41
3.3
Segmentao de Imagens...................................................................................... 41
3.4
Descrio de Imagens .......................................................................................... 53
3.5
Reconhecimento de Imagens ................................................................................ 61
Captulo 4 ............................................................................................................. 67
Experimentos e Resultados............................................................................................... 67
4.1
Delimitao da rea dos vages .......................................................................... 67
4.2
Identificao de objetos sobre o minrio dos vages........................................... 75
Captulo 5 ............................................................................................................. 87
Concluso e Trabalhos Futuros ....................................................................................... 87
Referncias Bibliogrficas ................................................................................. 89
xiv
Lista de Figuras
Fig. 1.1 - Passos fundamentais em um sistema de processamento de imagens digitais [4] ... 2
Fig. 2.1 - a) Imagem em nveis de cinza; b) Imagem binarizada [6]...................................... 5
Fig. 2.2 - Imagem a ser aplicada a transformada de Hough ................................................... 9
Fig. 2.3 - Espao dos parmetros (a,b) ................................................................................. 10
Fig. 2.4 - Maior reta encontrada na imagem......................................................................... 10
Fig. 2.5 - Exemplo de coordenada polar (, ) ..................................................................... 11
Fig. 2.6 - Imagem a ser aplicada a transformada de Hough ................................................. 12
Fig. 2.7 - Espao de Hough (, )......................................................................................... 12
Fig. 2.8 - Maiores retas encontradas na imagem .................................................................. 13
Fig. 2.9 - Espao de cores RGB ........................................................................................... 14
Fig. 2.10 - Espao de cores HSV.......................................................................................... 15
Fig. 2.11 - Exemplos de texturas extradas do lbum VisTex [19] ..................................... 18
Fig. 2.12 - Representao das direes em relao a um pixel de referncia....................... 21
Fig. 2.13 - Nveis de cinza da imagem..................................................................................21
Fig. 2.14 - Modelo de matriz de co-ocorrncia .................................................................... 21
Fig. 2.15 - Matrizes de co-ocorrncia de nveis de cinza ..................................................... 22
Fig. 2.16 - Matrizes de co-ocorrncia de nveis de cinza normalizadas............................... 23
Fig. 2.17 - Nveis de cinza da imagem..................................................................................24
Fig. 2.18 - Modelo de matriz de co-ocorrncia do GLRLM ................................................ 24
Fig. 2.19 - Matrizes de co-ocorrncia do GLRLM constitudas........................................... 24
Fig. 2.20 - Nveis de cinza da imagem ................................................................................. 25
Fig. 2.21 - Comparao das matrizes de co-ocorrncia geradas pelo SGLDM com os
vetores calculados pelo GLDM ............................................................................................ 27
Fig. 2.22 - Representao do processo de classificao das amostras atravs do
Classificador de Distncia Mnima....................................................................................... 36
Fig. 2.23 - Representao do processo de classificao das amostras para K = 3 atravs do
classificador dos K-vizinhos mais prximos........................................................................ 37
Fig. 2.24 - Representao do processo de agrupamento das amostras para K = 3 atravs da
anlise de agrupamento por K-mdias.................................................................................. 38
Fig. 3.1 - Enquadramento do vago na imagem ................................................................... 40
Fig. 3.2 - Disposio da cmera em relao ao vago.......................................................... 40
Fig. 3.3 - Posicionamento das bordas do vago ................................................................... 40
Fig. 3.4 - Imagem binria ..................................................................................................... 42
Fig. 3.5 - Espao de Hough .................................................................................................. 43
Fig. 3.6 - Espao de Hough e as janelas de interesse ........................................................... 43
Fig. 3.7 - Espaos de Hough correspondentes a deteco das retas horizontais .................. 44
Fig. 3.8 - Espao de Hough responsvel pela deteco das retas verticais .......................... 45
Fig. 3.9 - Determinao de um vrtice do vago.................................................................. 46
Fig. 3.10 - Processo de transformao geomtrica do vago ............................................... 48
Fig. 3.11 - Processo de determinao do maior retngulo inscrito rea corrigida............. 49
Fig. 3.12 - Viso perspectiva de um tabuleiro de xadrez ..................................................... 50
xv
Fig. 3.13 - Modelo de projeo perspectiva ......................................................................... 50

Fig. 3.14 - Fluxograma com nfase na etapa de segmentao de imagens .......................... 52
Fig. 3.15 - Componentes de matiz e saturao subdivididos em regies ............................. 55
Fig. 3.16 - Fluxograma do processo de descrio da cromaticidade da imagem ................. 56
Fig. 3.17 - Imagem inicial .................................................................................................... 57
Fig. 3.18 - Histograma acumulado normalizado de uma imagem inicial............................. 57
Fig. 3.19 - Histograma acumulado normalizado aps a quantizao ................................... 58
Fig. 3.20 - Fluxograma do processo de descrio de texturas.............................................. 60
Fig. 3.21 - Fluxograma que apresenta os processos envolvidos com a fase de treinamento
do processo de classificao ................................................................................................. 62
Fig. 3.22 - Representao grfica de uma distribuio normal (gaussiana), onde 99,7% das
amostras da populao encontram-se entre 3 e + 3 ..................................................... 64
Fig. 3.23 - Fluxograma com nfase na fase de teste da classificao das imagens.............. 65
Fig. 4.1 - Imagens de vages ferrovirios adquiridas em cores ........................................... 69
Fig. 4.2 - Imagens convertidas para nveis de cinza............................................................. 70
Fig. 4.3 - Imagens binrias ................................................................................................... 71
Fig. 4.4 - Localizao das retas encontradas sobre as bordas dos vages............................ 73
Fig. 4.5 - Imagens resultantes da etapa de segmentao ...................................................... 74
Fig. 4.6 - Conjunto de imagens utilizado para a identificao de objetos sobre o minrio dos
vages ................................................................................................................................... 76
Fig. 4.7 - Resultados do reconhecimento de imagens .......................................................... 77
Fig. 4.8 - Tempo de processamento utilizado pela fase de treinamento e pela fase de teste
do processo de classificao de acordo com regies de tamanhos distintos ........................ 78
Fig. 4.9 - Quantidade de imagens detectadas corretamente e incorretamente de acordo com
a variao do tamanho das regies ....................................................................................... 79
Fig. 4.10 - Conjunto de imagens utilizado para a identificao de objetos sobre areia ....... 81
Fig. 4.11 - Imagens utilizadas na fase de teste do processo de classificao ....................... 82
Fig. 4.12 - Tempo de processamento utilizado pela fase de treinamento e pela fase de teste
do processo de classificao de acordo com regies de tamanhos distintos ........................ 83
a variao do tamanho das regies ....................................................................................... 84
cada descritor utilizado para o conjunto de imagens de minrio.......................................... 84
cada descritor utilizado para o conjunto de imagens de areia .............................................. 85
xvi
Glossrio
ASM Angular Second Moment
GLDM Gray Level Difference Method
GLDV Gray Level Difference Vector
GLRLM Gray Level Run Length Method
HALE High Altitude and Long Endurance
HSV Hue, Saturation, Value
NTSC National Television Standards Committee
RGB Reg, Green, Blue
SGLDM Spatial Gray Level Dependence Method
YIQ Luminance, In-phase, Quadrature
xvii
Captulo 1
Introduo
O monitoramento e a vigilncia de processos so de fundamental

importncia para a gesto integrada das empresas e das organizaes. O controle
do processo de descarregamento de carga de vages um exemplo que pode ser
considerado indispensvel em empresas ferrovirias.
Devido extenso que as malhas ferrovirias ocupam geograficamente,
necessrio que, em determinados locais, os vages sejam monitorados a fim de
que sejam detectados problemas relacionados sua carga. Dessa forma, o
problema que est sendo considerado neste trabalho se relaciona com a
verificao, por meio do processamento de imagens, da carga de minrio contida
nos vages de trens pertencentes a uma determinada malha ferroviria.
Trabalhos relacionados com a deteco da presena de objetos sobre
superfcies foram encontrados na literatura especializada. Uma das pesquisas,
desenvolvida por Patel [1], tem como meta detectar atravs de imagens de raios-X
objetos que possam contaminar alimentos contidos em embalagens, tais como
pedras, metais ou fragmentos de vidro. A fim de alcanar esse objetivo, foram
utilizadas tcnicas de filtragem e redes neurais artificiais. Outro trabalho correlato
foi desenvolvido por Mulassano [2], nesse trabalho, feita a deteco de objetos
sobre a superfcie do mar atravs de imagens areas capturadas por uma
plataforma HALE (High Altitude and Long Endurance). Para a deteco de objetos
nessas imagens foram utilizadas tcnicas de anlise local da textura e
limiarizao. A deteco de objetos em alimentos tambm foi examinada por
Ginesu [3] atravs de imagens trmicas de alimentos dispostos sobre uma esteira.
Nesse trabalho foram apresentados mtodos para realizar a deteco dos objetos
por meio da anlise estatstica da textura, binarizao e morfologia matemtica.
As tcnicas utilizadas em sistemas que promovem a deteco e o
reconhecimento de objetos por meio de imagens digitais pertencem a diversas
reas, como por exemplo, processamento de sinais, morfologia matemtica e
processamento de imagens. As etapas que constituem, em geral, as tarefas de um
sistema de processamento de imagens so: aquisio, pr-processamento,
segmentao, representao e descrio, reconhecimento e interpretao. De
forma complementar, a base de conhecimento realiza a insero de informaes
prvias sobre o domnio do problema. Os passos fundamentais so exibidos na
Figura 1.1.
Fig. 1.1 - Passos fundamentais em um sistema de processamento de imagens digitais [4]
Ao considerar a composio modular que constitui, de forma geral, um

sistema de processamento de imagens, entende-se que cada componente possui
uma ampla possibilidade de tcnicas de desenvolvimento. Portanto, a combinao
das tcnicas utilizadas de fundamental importncia para a obteno de
resultados satisfatrios.
1.1 Objetivos e Tcnicas Aplicadas

O objetivo deste trabalho efetuar o estudo de tcnicas de processamento
de imagens a fim de produzir uma metodologia para a deteco da presena de
objetos sobre a carga de minrio em um vago ferrovirio. As tcnicas aplicadas
para o alcance deste objetivo sero apresentadas a seguir. Inicialmente deve ser
adquirida uma imagem em cores (RGB). A etapa de pr-processamento consiste
em convert-la para nveis de cinza ao utilizar o modelo de cor YIQ. Aps a
converso, a etapa de segmentao tem o papel fundamental de separar a rea
ocupada pelo vago ferrovirio do restante da imagem. A rea de interesse,
representada pelo vago, deve ser segmentada com exatido a fim de que no
prejudique, de maneira determinante, as etapas posteriores da metodologia.
Para a segmentao da rea do vago a imagem em nveis de cinza
binarizada utilizando o algoritmo de Otsu [5]. A partir da imagem binria, a
transformada de Hough foi a tcnica escolhida para a localizao das bordas do
vago. A regio de interesse resultante do processo de segmentao composta
pelo maior retngulo inscrito rea corrigida do vago ferrovirio. A rea corrigida
determinada atravs de uma transformao geomtrica na rea delimitada pelas
bordas de forma a tornar as bordas verticais do vago paralelas.
A descrio da imagem resultante do processo de segmentao realizada
atravs de um conjunto de medidas estatsticas calculadas a partir de histogramas
e matrizes de co-ocorrncia de nveis de cinza. A rea resultante do processo de
segmentao subdividida em n regies quadradas de mesmo tamanho. O
modelo de cor utilizado na representao da rea resultante do processo de
segmentao o HSV. Esse modelo de cor foi obtido a partir do RGB. No modelo
de cor HSV as informaes acromticas das cores so representadas atravs do
componente de valor (V). A imagem que representa esse componente sofre uma
reduo da quantidade de nveis de cinza de forma a possibilitar a gerao de
matrizes de co-ocorrncia de nveis de cinza em tempo considerado aceitvel. A
partir dessas matrizes, um descritor calculado para cada uma das regies em
que a imagem foi subdividida. O clculo dos descritores das informaes
3
cromticas (Matiz e Saturao) realizado ao encontrar-se a intensidade mdia

dos pixels para cada uma das regies das imagens que representam esses
componentes. Aps o estabelecimento dos descritores, o reconhecimento das
imagens obtido atravs da distncia euclidiana entre o valor mdio do descritor
de cada regio das imagens de treinamento e os valores dos descritores
encontrados na imagem de teste.
1.2 Organizao do Trabalho

Este trabalho composto de cinco captulos, sendo que o Captulo 1 referese sua introduo.
No Captulo 2, so apresentados os conceitos que so considerados
relevantes para o entendimento deste trabalho. Inicialmente, feita uma anlise
do processo de segmentao de imagens, com foco em deteco de retas. Logo
aps, so explanadas tcnicas que envolvem a descrio de imagens. Ademais,
esse captulo dedica-se ao reconhecimento de imagens, apresentando mtodos
de classificao e de anlise de agrupamento.
No Captulo 3, a metodologia proposta para a resoluo do problema
apresentado exposta de forma a explanar as tarefas necessrias para a
obteno dos resultados desejados.
J no Captulo 4, os experimentos realizados e os resultados obtidos so
apresentados de forma a verificar-se a qualidade da metodologia proposta.
Por fim, o Captulo 5 apresenta as concluses e perspectivas deste trabalho
a respeito da implementao das tcnicas envolvidas.
Captulo 2
Conceitos Iniciais
2.1 Segmentao de Imagens

Segmentao a tarefa que realiza a subdiviso de uma imagem em partes
ou objetos dela constituintes, segundo critrios pr-estabelecidos. Em geral, a
preciso da segmentao determina, em parte, a eficincia dos procedimentos de
anlise das imagens. Porm, a quantidade de subdivises empregadas nas
imagens varia conforme a aplicao.
Entre as tcnicas de segmentao mais conhecidas destacam-se a
deteco de descontinuidades no domnio espacial e da freqncia, a limiarizao
de nveis de cinza e a segmentao baseada em regies [4]. Essas tcnicas, em
geral, buscam distinguir os objetos de interesse entre si ou distingui-los do fundo
da imagem como se pode ver na Figura 2.1.
a)
b)
Fig. 2.1 - a) Imagem em nveis de cinza; b) Imagem binarizada [6]
2.1.1 Limiarizao
Uma forma de segmentar imagens por meio da similaridade entre pixels.
A limiarizao lida com a similaridade dos nveis de cinza de uma imagem. Essa
uma operao que envolve testes na funo da imagem. A limiarizao de uma
imagem pode ser definida conforme a equao 2.1.
1 se f ( x, y ) > T
g ( x, y ) =
0 se f ( x, y ) T
(2.1)
onde
f(x,y) a funo que representa a imagem;
T o valor que determina o limiar para a segmentao;
g(x,y) a funo que representa a imagem binria resultante.

Uma das dificuldades do processo de limiarizao se encontra na
determinao do valor mais adequado para T. As tcnicas de limiarizao podem

ser divididas em operaes locais e globais. As tcnicas locais calculam limiares
locais de acordo com a vizinhana de cada pixel da imagem, enquanto as tcnicas
globais determinam um nico limiar para toda a imagem.
Em geral, as tcnicas globais exigem menos processamento para o clculo
do limiar. J as tcnicas locais so mais adequadas para imagens com grandes
variaes de intensidade. A binarizao automtica local examina cada pixel da
imagem com um valor de limiar calculado a partir de sua vizinhana. Para essa
tcnica, geralmente, necessrio especificar o tamanho da vizinhana a ser
considerada em cada janela. Um dos mtodos que promovem a binarizao de
imagens de forma automtica e local o mtodo de Niblack [7]. Esse mtodo tem
por base o clculo da mdia e do desvio-padro em cada janela, permitindo que o
valor do limiar seja nico para cada pixel da imagem. O valor do limiar calculado
da seguinte forma:
t (i, j ) = (i, j ) + (i , j )
(2.2)
onde
6
t o valor do limiar para o pixel (i,j);
o valor mdio dos nveis de cinza pertencentes janela;
um fator de ponderao aplicado ao desvio-padro;
o valor do desvio-padro dos nveis de cinza pertencentes janela.

A binarizao manual global consiste na diviso do histograma de uma
imagem por um nico limiar T. Esse valor atribudo manualmente com base na
anlise emprica dos nveis de cinza presentes na imagem. Diferentemente, a
binarizao automtica global estima um limiar de acordo com o histograma da
imagem, ou seja, considera a freqncia de ocorrncia dos nveis de cinza para a
determinao do valor do limiar.
Uma tcnica muito utilizada para a binarizao de imagens o mtodo de
Otsu [5]. Esse mtodo realiza o clculo para a determinao do limiar de forma
automtica e global. Primeiramente, deve-se calcular o histograma normalizado de
uma imagem representada por L nveis de cinza. O nmero de pixels de
intensidade i dado por ni e o nmero total de pixels da imagem N. Dessa
forma, o histograma de nveis de cinza normalizado dado por:
L
pi = ni / N | pi 0, pi = 1
i =1
(2.3)
onde pi representa a probabilidade de ocorrncia da intensidade i.

O mtodo de Otsu pressupe que haja uma diviso dos pixels da imagem
em duas classes C0 e C1 por um limiar de nvel de cinza k. As probabilidades de
ocorrncia de cada classe e as suas mdias so denotadas por:
k
0 = pi
(2.4)
i =1
L
1 =
(2.5)
i = k +1
e
k
0 = ip i / 0
(2.6)
i =1
L
1 =
ip
i = k +1
/ 1
(2.7)
Dessa forma, a soma das probabilidades de ocorrncia das classes deve

ser unitria.
0 + 1 = 1
(2.8)
Portanto, 0 0 + 11 = T , onde T o nvel de cinza mdio do histograma.

A varincia de cada classe dada por:
k
02 = (i 0 ) 2 p i / 0
12 =
i =1
L
(i )
1
p i / 1
i = k +1
(2.9)
(2.10)
O melhor valor para um limiar k pode ser determinado por uma busca
seqencial, atravs de todos os valores possveis de k, a fim de localizar aquele
que minimize a varincia intra-classes. Essa varincia corresponde soma
ponderada das varincias das classes em relao a suas probabilidades de
ocorrncia conforme a equao 2.11.
W2 = 0 02 + 1 12
(2.11)
Outra forma de encontrar o valor do limiar ideal se d por meio da

maximizao da varincia inter-classes em relao a todos os valores possveis
de k. Essa varincia representa a disperso existente entre as classes, e dada
por:
B2 = 0 ( 0 T ) 2 + 1 ( 1 T ) 2
= 01 ( 1 0 ) 2
(2.12)
Um exemplo de aplicao para o mtodo de Otsu dado em Bezerra [8].
2.1.2 Transformada de Hough

Transformadas em imagens, geralmente, se referem a operaes que
envolvem uma imagem como parmetro de entrada e utilizam suas informaes
para extrair e evidenciar dados anteriormente camuflados ou imperceptveis. A
Transformada de Hough foi elaborada, em sua forma original, por Paul Hough em
1962 [9]. Essa transformada consiste em localizar formas geomtricas que
8
possam ser parametrizadas, tais como retas, crculos e elipses. Sua primeira
concepo estava baseada na localizao de retas. Algumas aplicaes so
encontradas em [10], [11], [12], [13]. Em uma imagem binria em que os pontos
so localizados por meio de coordenadas cartesianas, a equao da reta dada
por y = ax + b, onde a o coeficiente angular da reta e b o coeficiente linear da
reta. O espao (a,b), gerado pela transformada de Hough, torna possvel a
localizao das retas presentes na imagem. Esse espao determinado pelos
parmetros (a,b) atravs do clculo da equao b = y ax para cada ponto
presente na imagem.
Em termos computacionais o espao de Hough implementado por uma
matriz de acumulao, onde as linhas contm os valores discretos de b e as
colunas contm os valores discretos de a. Todas as clulas so inicializadas com
o nmero zero. Ao final do preenchimento da matriz de acumulao, cada clula
tem como valor a quantidade de pontos colineares que constituem uma reta com
inclinao (a) e interseco com o eixo y (b).
Para exemplificar, supe-se uma imagem que contenha quatro pontos com
coordenadas P1 (1,0), P2 (1,1), P3 (2,1) e P4 (4,1), conforme a Figura 2.2. A
transformada de Hough realizada a partir dessa imagem gera o espao de
acumulao representado na Figura 2.3. Atravs desse espao estabelecida a
localizao das retas presentes na imagem. A Figura 2.4 exibe a maior reta
localizada pela transformada de Hough. Os pontos que constituem essa reta so
determinados por meio do conjunto de retas do espao de Hough que se cruzam
no ponto indicado pelo crculo vermelho na Figura 2.3.
Fig. 2.2 - Imagem a ser aplicada a transformada de Hough
Fig. 2.3 - Espao dos parmetros (a,b)
Fig. 2.4 - Maior reta encontrada na imagem
Um problema inerente a essa parametrizao a impossibilidade de

localizao de retas verticais devido necessidade de um espao de parmetros
com tamanho infinito [4]. A fim de solucionar esse problema, utilizada a
parametrizao em coordenadas polares [14]. A equao da reta na forma polar
dada por = x cos + ysen . Os parmetros utilizados para representar retas na
forma polar so e conforme pode-se ver na Figura 2.5. Nesse tipo de
parametrizao, as retas verticais so todas as que possuem o valor de igual a
zero.
10
Fig. 2.5 - Exemplo de coordenada polar (, )
Em vez de retas como no espao de Hough (a,b), nesse caso, tem-se a

formao de curvas senoidais. Dessa forma, os pontos no espao de Hough em
que houver mais cruzamentos de senides indicam as maiores retas da imagem.
Isso ocorre porque o cruzamento de senides representa a quantidade de pontos
colineares existentes em uma direo () e h uma determinada distncia da
origem (). Em termos computacionais, o espao de Hough implementado
atravs de uma matriz de acumulao, onde as linhas contm os valores discretos
de e as colunas contm os valores discretos de . Todas as clulas da matriz
so inicializadas com o nmero zero. Ao final do preenchimento da matriz de
acumulao, cada clula tem como valor a quantidade de pontos colineares que
constituem uma reta com a direo () e distncia da origem (). Para
exemplificar, supe-se que a imagem contenha sete pontos com coordenadas
euclidianas P1 (1,1), P2 (2,1), P3 (1,3), P4 (2,3), P5 (4,3), P6 (2,4) e P7 (3,4),
conforme mostrado na Figura 2.6. A partir dessa imagem, foi gerado o espao
de Hough (, ) representado pela Figura 2.7. Nesta figura os cruzamentos de
senides que representam as maiores retas presentes na imagem so
evidenciados por crculos vermelhos.
11
Fig. 2.6 - Imagem a ser aplicada a transformada de Hough
6
5
4
3
2
1
0
-1
-2
-3
-4
-5
P1
P2
P3
P4
P5
P6
P7
-90
-70
-50
-30
-10
10
30
50
70
Fig. 2.7 - Espao de Hough (, )
Na Figura 2.8, so exibidas as maiores retas localizadas pela transformada

de Hough a partir da imagem da Figura 2.6.
12
Fig. 2.8 - Maiores retas encontradas na imagem
2.2 Descrio de Imagens
2.2.1 Modelos de Cor

Cor um atributo que pode ser de grande importncia para auxiliar a
identificao e o reconhecimento de objetos atravs da sua descrio [15]. Alguns
modelos de cor utilizados para representar imagens coloridas so o RGB, YIQ e
HSV.
2.2.1.1
Modelo de cor RGB
O modelo de cor RGB tem como cores primrias o azul, verde e vermelho.
Esse modelo baseia-se na sensibilidade do sistema visual humano a essas trs
cores, e utiliza o sistema de coordenadas cartesianas para a especificao das
cores de acordo com a Figura 2.9. O modelo de cor RGB largamente empregado
em equipamentos emissores de luz, tais como monitores [4].
13
Fig. 2.9 - Espao de cores RGB
2.2.1.2
Modelo de cor YIQ
O modelo de cor YIQ utilizado na transmisso de sinais de televiso

(NTSC) nos Estados Unidos, e foi criado para permitir que a transmisso das
imagens em cores fosse compatvel com os receptores monocromticos. A
principal caracterstica desse modelo que ele separa as informaes cromticas
(I,Q) das informaes acromticas (Y) das cores. A correspondncia entre as
coordenadas YIQ e RGB dada por [6]:
0.114 R
Y 0.299 0.587
I = 0.596 0.274 0.322 G

Q 0.211 0.523 0.312 B
(2.13)
0.621 Y
R 1 0.956
G = 1 0.272 0.647 I

B 1 1.106 1.703 Q
(2.14)
2.2.1.3
Modelo de cor HSV
O modelo de cor HSV caracterizado pela separao das informaes

cromticas (H,S) das informaes acromticas das cores (V), e tambm por ter a
14
codificao das informaes cromticas em componentes de fcil compreenso.

Esse modelo, desenvolvido em 1978 [16], composto por um hexacone, como
mostrado na Figura 2.10. Atravs do hexacone, a cor decomposta em trs
componentes: matiz (Hue), saturao (Saturation) e valor (Value). O matiz se
refere ao comprimento de onda dominante de uma cor, a saturao especifica o
grau de pureza de uma cor, e o valor se refere s informaes acromticas de
uma cor. No modelo de cor RGB os componentes das cores geralmente esto
altamente correlacionados entre si [15], de forma que, caso haja variao nas
condies de iluminao de uma imagem, todos os componentes (R,G,B) so
afetados. Entretanto, no modelo de cor HSV, o componente mais afetado nesse
caso o de valor (V) porque nesse componente que as informaes
acromticas esto codificadas. O algoritmo de converso do modelo de cor RGB
para HSV dado em Smith [16].
Fig. 2.10 - Espao de cores HSV
2.2.2 Descrio de Imagens Baseada em Histograma

Histogramas consistem em uma representao global da freqncia de
ocorrncia dos nveis de cinza de uma imagem. A partir da elaborao de um
15
histograma, diversas medidas podem ser extradas para a descrio de imagens.

Elas podem ser divididas em medidas de tendncia central e medidas de
disperso. As medidas de tendncia central representam valores em torno dos
quais as amostras tendem a se agrupar. Um exemplo a intensidade mdia que
dada por:
L
wi x i
x=
i =1
L
(2.15)
wi
i =1
onde
L o nmero de nveis de cinza da imagem;
w a freqncia de ocorrncia de cada nvel de cinza;
x o valor de cada nvel de cinza.

A mediana tambm uma medida que pode ser obtida a partir de um
histograma, e corresponde ao valor que divide as amostras ordenadas pela

metade. Outra medida a moda, que consiste no valor da amostra que ocorre
com mais freqncia no histograma. As medidas de disperso representam a
variao das amostras em torno de um valor de tendncia central. Alguns
exemplos
so o
desvio-padro
e a varincia
que
podem
ser vistos,
respectivamente, pelas equaes 2.16 e 2.17.

1
n 1
1/ 2
( xi x ) 2
i =1
(2.16)
e
1
n 1
2 =
(x
i =1
x)2
(2.17)
onde
n a quantidade de pixels da imagem;
x a intensidade do nvel de cinza de cada pixel;
x o valor da intensidade mdia do histograma.
16
importante salientar que as medidas baseadas em histograma no

consideram a disposio espacial dos nveis de cinza na imagem. Caso seja
necessrio considerar a disposio espacial, devem ser utilizadas tcnicas
especficas para a descrio de texturas.
2.2.3 Descrio de Texturas

Texturas podem ser utilizadas para identificar e reconhecer objetos. Dessa
forma, uma textura assimilada como um atributo que descreve um conjunto de
intensidades. A intensidade mensurada por meio de um nico pixel, porm a
textura pode ser determinada somente a partir de uma regio.
Segundo o dicionrio Houaiss [17] uma textura definida como sendo a
aparncia fsica geral ou caracteres megascpicos ou microscpicos de uma
rocha ou de um agregado mineral, incluindo aspectos geomtricos e as relaes
mtuas entre eles, suas partculas componentes ou cristais. Entretanto, na
literatura especializada tem sido descrita de diversas maneiras. Tuceryan e Jain
[18] reuniram algumas definies de textura encontradas na literatura de viso
computacional e processamento de imagens digitais, tais como:
"A textura uma propriedade inerente a praticamente todas as superfcies:
o veio da madeira, a trama de um tecido, o desenho de uma lavoura no
campo, etc. Ela contm informaes importantes sobre a organizao
estrutural das superfcies e sua relao com o meio que as cerca.
"A regio em uma imagem tem uma textura constante se um conjunto de
estatsticas localizadas ou outras propriedades exclusivas da funo da
imagem forem constantes."
"Podemos considerar textura aquilo que constitui uma regio macroscpica.
Sua estrutura atribuda simplesmente a padres repetitivos em que os
17
elementos ou rudimentos so organizados de acordo com um padro de

posicionamento."
"A noo de textura mostra-se dependente de trs componentes: (1)
alguma 'ordem' de localizao se repete sobre uma regio considerada
grande, se comparada ao tamanho da ordem; (2) a ordem consiste no
arranjo no aleatrio de partes elementares; e (3) as partes so entidades
irregularmente uniformes que possuem aproximadamente as mesmas
dimenses em toda a rea da regio texturizada."
Essas definies demonstram que no h uma nica definio universal
para textura. Logo a seguir, na Figura 2.11, so apresentadas algumas imagens
de texturas.
Fig. 2.11 - Exemplos de texturas extradas do lbum VisTex [19]
Do ponto de vista da descrio e do reconhecimento, uma textura pode ser

caracterizada pela repetio de padres em termos de direcionalidade,
rugosidade, granularidade ou regularidade. As caractersticas extradas de uma
textura geralmente representam propriedades relevantes para a rea de aplicao
empregada. Elas so representadas por meio de atributos numricos que podem
ser utilizados isoladamente ou em conjunto, ao formar um vetor de caractersticas.
Esses atributos so importantes para que haja a comparao e a discriminao
entre texturas distintas. A escolha correta de um descritor de fundamental
18
importncia para a etapa de reconhecimento. As trs abordagens principais

utilizadas para descrever texturas so a estatstica, a estrutural e a espectral [20],
que podem ser caracterizadas da seguinte forma:
Abordagem Estatstica: a textura descrita por medidas baseadas na distribuio
espacial dos nveis de cinza. Essas medidas podem ser o contraste, a entropia, a
homogeneidade, etc.
Abordagem Estrutural: baseada no conceito de primitiva, que pode ser utilizada
na formao de padres complexos por meio de regras para compor a textura.
Abordagem Espectral: baseia-se nas propriedades do espectro de Fourier, como
picos que fornecem a direo da textura e a sua periodicidade.
Trabalhos com diversas aplicaes em que foram utilizadas abordagens
distintas para a anlise de texturas so relatados em [21], [22], [23], [24], [25], [26],
[27]. Nesse trabalho somente a abordagem estatstica ser apresentada dado que
essa abordagem funciona bem para texturas naturais mesmo no caso de texturas
pouco discernveis.
2.2.3.1
Abordagem Estatstica
Nos mtodos estatsticos a textura considera a distribuio espacial dos

nveis de cinza da imagem, da qual deriva um conjunto de medidas caractersticas
(descritores). A anlise de uma textura pode ser compreendida de diversas
maneiras. Em Julesz [28], ao abordar a percepo visual de texturas, foram
realizados estudos psicofsicos a fim de determinar os modos de discriminao
entre texturas distintas.
Os principais mtodos estatsticos utilizados para a descrio de texturas
empregam matrizes de co-ocorrncia. Os mtodos baseados em matrizes de coocorrncia que sero apresentados so o SGLDM (Mtodo de Dependncia
19
Espacial dos Nveis de Cinza), o GLRLM (Mtodo do Comprimento de Seqncias

de Nveis de Cinza) e o GLDM (Mtodo da Diferena de Nveis de Cinza). Esses
mtodos consideram o valor da intensidade de um pixel e seu relacionamento com
outros pixels de acordo com restries espaciais que permitem variaes na
direo e/ou detalhamento da anlise [29], [30], [31]. O modo com que se
adequam esses parmetros s caractersticas do problema de fundamental
importncia para o sucesso da descrio da textura [32]. Segundo estudos
realizados por Weszka [33], os mtodos baseados em matrizes de co-ocorrncia
se mostraram eficientes para a descrio de texturas ao serem comparados com
outros mtodos.
2.2.3.1.1 Mtodo de Dependncia Espacial dos Nveis de Cinza (SGLDM)

Esse mtodo baseado no clculo da matriz de co-ocorrncia de nveis de
cinza da imagem, e foi primeiramente descrito por Haralick em [34], [35]. De
acordo com Aksoy [36], a co-ocorrncia de nveis de cinza pode ser especificada
em uma matriz de freqncias relativas P(i, j; d, ), na qual, dois pixels separados
por uma distncia d na direo esto presentes na imagem, um com nvel de
cinza i e o outro com nvel de cinza j. A matriz de co-ocorrncia consiste em
considerar o relacionamento espacial dos pixels de uma imagem conforme os
seus nveis de cinza, de acordo com um vetor de deslocamento = (d , ) . A matriz
de co-ocorrncia de nveis de cinza naturalmente invariante rotao de 180
da imagem em relao a qualquer direo. Cada direo representada por um
subconjunto de pixels pertencentes vizinhana do pixel de referncia. As
direes normalmente consideradas so: horizontal, diagonal e vertical (Figura
2.12).
20
90
135
45
Fig. 2.12 - Representao das direes em relao a um pixel de referncia
A fim de exemplificar o processo do clculo de uma matriz de coocorrncia, os passos necessrios sero apresentados a seguir. Tomando-se
como exemplo a imagem exibida pela Figura 2.13, onde os nveis de cinza esto
distribudos em valores de 0 a 3, a quantidade N de nveis de cinza determina o
tamanho da matriz de co-ocorrncia (NxN) representada pela Figura 2.14.
Tambm se pode dizer que esse tipo de matriz simtrico em torno da diagonal
principal. Nesta figura, #(i,j) o nmero de vezes em que o nvel de cinza i e o
nvel de cinza j satisfazem a distncia e direo definidas por um vetor de
deslocamento = (d , ) .
Nveis de cinza dos
pixels vizinhos
Nveis de
cinza dos
pixels de
referncia
Fig. 2.13 - Nveis de cinza da imagem
0
1
2
3
0
#(0,0)
#(1,0)
#(2,0)
#(3,0)
1
#(0,1)
#(1,1)
#(2,1)
#(3,1)
2
#(0,2)
#(1,2)
#(2,2)
#(3,2)
3
#(0,3)
#(1,3)
#(2,3)
#(3,3)
Fig. 2.14 - Modelo de matriz de co-ocorrncia
Considera-se ainda que aos vetores de deslocamento, que determinam a

distncia entre um pixel de referncia e um pixel vizinho, seja atribudo o valor um
e sejam estabelecidas as direes (0, 45, 90, 135) para a anlise da coocorrncia dos nveis de cinza da imagem. Essas informaes so representadas
atravs dos seguintes vetores, onde H, DD, V e DE correspondem,
21
respectivamente, as direes horizontal, diagonal direita, vertical e diagonal

esquerda.
= (1, 0)
(2.18)
DD
= (1, 45)
(2.19)
= (1, 90)
(2.20)
DE
= (1, 135)
(2.21)
A partir dessas informaes, so determinadas as matrizes de coocorrncia, que so calculadas por meio da verificao de todas as combinaes
possveis de transio entre os nveis de cinza presentes na imagem. Na Figura
2.15, so exibidas as matrizes de co-ocorrncia geradas a partir da imagem da
Figura 2.13 e especificadas pelos vetores apresentados nas equaes 2.18, 2.19,
2.20 e 2.21.
2
2
=
0
2 0 2
2 2 0
2 2 2
0 2 2
0
VV (i, j; 1, 90 ) =
2
0 2 2
2 2 2
2 2 0
2 0 2
1
VDE (i, j; 1, 135 ) =
1
1 1 3
2 0 1
0 2 1
1 1 0
1
VDD (i, j; 1, 45 ) =
1
1 1 0
0 3 1
3 0 1
1 1 2
VH (i, j; 1, 0 )
Fig. 2.15 - Matrizes de co-ocorrncia de nveis de cinza
Os valores presentes na diagonal principal das matrizes de co-ocorrncia

de nveis de cinza sero sempre pares ou nulos, pois ela contm as transies de
nveis de cinza de mesma intensidade. Essas transies so sempre verificadas
nos dois sentidos, independentemente da direo. Por fim, para se obter os
valores dessas matrizes de maneira probabilstica, deve-se normaliz-las segundo
a equao a seguir:
V
Pi , j = N 1 Ni,1j
Vi, j
(2.22)
i = 0 j =0
22
onde
i o nmero da linha e j o nmero da coluna da matriz de co-ocorrncia;
V o valor da clula (i, j) da matriz de co-ocorrncia;
P a probabilidade de ocorrncia de (i, j);
N o nmero de linhas e colunas.

A normalizao das matrizes da Figura 2.15 apresentada na Figura 2.16.
PH
0
0.0833
0.0833 0.0833
0
0.0833 0.0833 0.0833
=
0
0.0833 0.0833 0.0833
0.0833
0
0.0833 0.0833
PDE
0.0556 0.0556 0.1667

0
0
0.0556
0.0556 0.1111
=
0.0556
0
0.1111 0.0556
0.1667 0.0556 0.0556

0
PV
0
0.0833 0.0833
0.0833
0.0833 0.0833 0.0833

0
=
0.0833 0.0833 0.0833
0
0.0833 0.0833
0
0.0833
PDD
0
0.1111 0.0556 0.0556
0
0.1667 0.0556
0.0556
=
0.0556 0.1667
0
0.0556
0
0.0556 0.0556 0.1111
Fig. 2.16 - Matrizes de co-ocorrncia de nveis de cinza normalizadas
Estudos comparativos entre mtodos distintos de anlise de textura foram

realizados em Conners [37]. Nesse trabalho, o SGLDM foi o que obteve resultados
mais satisfatrios. Trabalhos em que esse mtodo aplicado podem ser
encontrados em [38], [39], [40], [41], [42], [43], [44], [45].

(GLRLM)
O Mtodo do Comprimento de Seqncias de Nveis de Cinza [37]
baseado no clculo da quantidade de seqncias de nveis de cinza em uma
imagem. Uma seqncia de nveis de cinza o conjunto maximal de pixels
colineares que possuem o mesmo nvel de cinza em uma determinada direo. O
comprimento de uma seqncia de nveis de cinza determinado pelo tamanho
do conjunto maximal de pixels colineares que possuem o mesmo nvel de cinza
23
em uma determinada direo. Os clculos necessrios para ilustrar esse mtodo

so apresentados a seguir. Primeiramente, devem-se estabelecer as direes que
sero consideradas para a anlise dos nveis de cinza da imagem (Figura 2.17).
Nesse caso, sero empregados os ngulos 0, 45, 90 e 135. As linhas da matriz
exibida na Figura 2.18 se referem a quantidade de nveis de cinza da imagem. J
as colunas se referem aos comprimentos das seqncias de nveis de cinza que
se desejam analisar. Nessa matriz, #(i,j) a quantidade de vezes em que o nvel
de cinza i e o comprimento j de uma seqncia de nveis de cinza satisfazem uma
direo definida.
Comprimentos de
seqncias de
nveis de cinza
Nveis de
cinza dos
pixels de
referncia
0
1
2
3
1
#(0,1)
#(1,1)
#(2,1)
#(3,1)
2
#(0,2)
#(1,2)
#(2,2)
#(3,2)
3
#(0,3)
#(1,3)
#(2,3)
#(3,3)
4
#(0,4)
#(1,4)
#(2,4)
#(3,4)
Fig. 2.18 - Modelo de matriz de co-ocorrncia do GLRLM
A partir dessas informaes possvel calcular as matrizes da Figura 2.19.
2
=
2
1 0 0
1 0 0
1 0 0
1 0 0
2
VV (i, j; 90 ) =
2
1
1
1
1
2
VDE (i, j;135 ) =
2
0 0 0
1 0 0
1 0 0
0 0 0
4
VDD (i, j; 45 ) =
4
1 0 0
0 0 0
0 0 0
1 0 0
VH (i, j; 0 )
0
0
0
0
0
0
Fig. 2.19 - Matrizes de co-ocorrncia do GLRLM constitudas
24
2.2.3.1.3 Mtodo da Diferena de Nveis de Cinza (GLDM)

O Mtodo da Diferena de Nveis de Cinza [37], como o seu prprio nome
indica, extrai as caractersticas de uma textura ao determinar a diferena entre
dois nveis de cinza adjacentes de uma imagem, essa diferena pode ser
expressa atravs da equao 2.23:
G (m, n) = G (m, n) G (m + m, n + n)
(2.23)
onde
G(m,n) a funo que representa a imagem;
m e n representam o deslocamento em linhas e colunas que deve ser

realizado de acordo com a direo definida em = (m, n).
Nesse exemplo, consideram-se quatro formas possveis para o vetor :
1 = (0, d )
(2.24)
2 = (d , d )
(2.25)
3 = (d ,0)
(2.26)
4 = ( d , d )
(2.27)
onde d o valor do deslocamento entre os pixels em linhas e/ou colunas.

A fim de exemplificar o processo, utilizou-se a imagem mostrada na Figura
2.20. O valor de d ser igual a um.
Para cada direo, obtm-se os vetores de diferena entre os nveis de

cinza (GLDV) a partir da imagem da Figura 2.20, o que resulta:
25
V H (i; 1 ) = (4, 6, 0, 2 )
(2.28)
V DD (i; 2 ) = (2, 5, 2, 0)
(2.29)
VV (i; 3 ) = (4, 2, 4, 2 )
(2.30)
V DE (i; 4 ) = (2, 2, 2, 3)
(2.31)
Cada posio desses vetores representa, respectivamente, na direo i , a

quantidade de vezes que ocorreu a diferena de nveis de cinza (0, 1, 2, 3). Para a
representao desses vetores de maneira probabilstica, deve-se normaliz-los
segundo a equao 2.32.
V
Pi = N 1i
Vi
(2.32)
i =0
onde
i o nmero da coluna do vetor;
V o valor da clula i do vetor;
P a probabilidade de ocorrncia de i;
N o nmero de colunas do vetor.

O que resulta:
PH (i; 1 ) = (0.3333, 0.5, 0, 0.1666)
(2.33)
PDD (i; 2 ) = (0.2222, 0.5555, 0.2222, 0 )
(2.34)
PV (i; 3 ) = (0.3333, 0.1666, 0.3333, 0.1666 )
(2.35)
PDE (i; 4 ) = (0.2222, 0.2222, 0.2222, 0.3333)
(2.36)
Os mtodos SGLDM e GLDM podem ser relacionados pela seguinte

equao:
N 1N 1
P (k ) = P(i, j; d , )
d
i = 0 j = 0 | i j |= k
(2.37)
onde
P(i, j; d, ) a matriz de co-ocorrncia normalizada obtida pelo SGLDM;
k a diferena entre os nveis de cinza;
26
Pd a probabilidade de ocorrncia da diferena k entre os nveis de cinza (i,j)

da imagem.
O objetivo de apresentar esse relacionamento mostrar que os resultados
obtidos com o GLDM tambm podem ser alcanados com a utilizao do SGLDM.
Os resultados dos mtodos SGLDM e GLDM podem ser visualizados na Figura
2.21.
PH
0
0.0833
0.0833 0.0833
0
0.0833 0.0833 0.0833
=
0
0.0833 0.0833 0.0833
0.0833
0
0.0833 0.0833
PH (i; 1 ) = (0.3333, 0.5, 0, 0.1666)
PDE
0.0556 0.0556 0.1667

0
0
0.0556
0.0556 0.1111
=
0.0556
0
0.1111 0.0556
0.1667 0.0556 0.0556

0
PDE (i; 4 ) = (0.2222, 0.2222, 0.2222, 0.3333)
PV
0
0.0833 0.0833
0.0833
0.0833 0.0833 0.0833

0
=
0.0833 0.0833 0.0833
0
0.0833 0.0833
0
0.0833
PV (i; 3 ) = (0.3333, 0.1666, 0.3333, 0.1666 )
PDD
0
0.1111 0.0556 0.0556
0
0.1667 0.0556
0.0556
=
0.0556 0.1667
0
0.0556
0
0.0556 0.0556 0.1111
PDD (i; 2 ) = (0.2222, 0.5555, 0.2222, 0 )
Fig. 2.21 - Comparao das matrizes de co-ocorrncia geradas pelo SGLDM com os vetores
calculados pelo GLDM
2.2.3.2
Descritores Escalares
A importncia dos descritores escalares para a discriminao de texturas se

deve ao clculo de valores numricos que tem o objetivo de quantificar uma
determinada caracterstica das texturas. Os descritores escalares, que sero
apresentados, so elaborados para a aplicao nos mtodos de anlise de textura
descritos na seo 2.2.3.1. Cada um desses mtodos possui descritores que
foram desenvolvidos especificamente de acordo com as informaes provenientes
das matrizes ou vetores gerados a partir da imagem original.
27
2.2.3.2.1 Mtodo de Dependncia Espacial dos Nveis de Cinza (SGLDM)

Para o SGLDM, Haralick [34] sugeriu 14 descritores estatsticos que so
aplicados a partir de matrizes de co-ocorrncia previamente calculadas. A notao
utilizada para representar os descritores a seguinte:
P(i, j )
Clula da matriz de co-ocorrncia normalizada
Ng
Quantidade de nveis de cinza
Ng 1
=
i=0
Ng 1
=
j =0
Sero apresentados a seguir os descritores estatsticos mais comumente

utilizados.
Descritores relacionados periodicidade (ASM e Entropia)

Esses descritores medem a regularidade ou uniformidade de uma textura.
1) Segundo Momento Angular (ASM)
t1 = [P(i, j )]
(2.38)
O Segundo Momento Angular identifica a periodicidade em texturas.

Valores altos para o ASM ocorrem se a distribuio de nveis de cinza da imagem
tiver uma forma aproximadamente constante ou peridica. A matriz de coocorrncia de uma imagem pouco peridica ter uma grande quantidade de
elementos com baixos valores.
28
2) Entropia
t2 = P(i, j ) log( P(i, j ))
i
(2.39)
Essa medida estatstica mensura a no uniformidade de uma textura. O

valor de entropia grande se a textura no uniforme e, portanto, muitos
elementos da matriz de co-ocorrncia tm valor baixo. Deve-se lembrar que uma
funo logartmica no definida para valores menores ou iguais a zero, ento,
neste caso, deve-se assumir que 0 log(0) = 0 .
Descritores relacionados ao contraste (Contraste e Homogeneidade)

3) Contraste
t3 = (i j ) 2 P(i, j )
i
(2.40)
O contraste mede o grau de variao local dos nveis de cinza entre pares
de pixels. A equao 2.40 considera a diferena entre os nveis de cinza i e j para
o clculo do contraste.
4) Homogeneidade
t4 =
i
1
P(i, j )
1 + (i j ) 2
(2.41)
A homogeneidade mede o grau de variao local dos nveis de cinza entre

pares de pixels. Essa medida estatstica assume grandes valores para pequenas
diferenas entre os nveis de cinza da imagem.
29
Os outros descritores propostos por Haralick podem ser encontrados em

[34].

(GLRLM)
Para esse mtodo, so descritas medidas estatsticas que utilizam a
seguinte notao:
V (i, j )
Clula da matriz de co-ocorrncia
Ng
Quantidade de nveis de cinza
Nr
Tamanho mximo das seqncias
Ng 1
i =0
Nr
=
j =1
Tr = V (i, j )
i
Tr a quantidade total de seqncias
o nmero total de pixels da imagem
Tp
1) nfase em seqncias curtas
r1 =
1
Tr
V (i, j )
j2
(2.42)
Enfatiza as seqncias curtas de nveis de cinza da imagem. Altos valores

significam grandes quantidades de seqncias curtas.
30
2) nfase em seqncias longas
r2 =
1
Tr
j
i
V (i, j )
(2.43)
Enfatiza as seqncias longas de nveis de cinza da imagem. Altos valores

significam grandes quantidades de seqncias longas.
3) Distribuio de Nveis de Cinza
1
r3 = V (i, j )
Tr i j
(2.44)
Analisa a distribuio da quantidade de cada nvel de cinza na imagem.

4) Distribuio do Comprimento de Seqncias
r4 = V (i, j )
Tr j i
(2.45)
Analisa a distribuio da quantidade de cada comprimento de seqncias

na imagem.
5) Porcentagem de Seqncias
r5 =
1
V (i, j )
Tp i j
(2.46)
Representa a porcentagem de seqncias em relao totalidade de pixels

da imagem.
31
2.2.3.2.3 Mtodo da Diferena de Nveis de Cinza (GLDM)

Para esse mtodo, so apresentados os seguintes descritores:
Descritores relacionados periodicidade (ASM e Entropia)

1) Segundo Momento Angular (ASM)
Ng 1
s1 =
[P(i)]
(2.47)
i=0
O Segundo Momento Angular identifica a periodicidade em texturas.

Valores altos para o ASM ocorrem se a distribuio de nveis de cinza da imagem
tiver uma forma aproximadamente constante ou peridica. O vetor de diferena
entre nveis de cinza de uma imagem pouco homognea ter uma grande
quantidade de baixos valores.
2) Entropia
Ng 1
s2 =
P(i) log( P(i))
(2.48)
i=0
Essa medida estatstica mensura a no uniformidade de uma textura. O

valor de entropia grande se a textura no uniforme e, portanto, muitos
elementos do vetor de diferena entre nveis de cinza tiverem valor baixo. Deve-se
lembrar que uma funo logartmica no definida para valores menores ou iguais
a zero, ento, neste caso, deve-se assumir que 0 log(0) = 0 .
32
Descritores relacionados ao contraste (Contraste e Homogeneidade)

3) Contraste
Ng 1
s3 =
i P(i)
2
(2.49)
i =0
O contraste mede o grau de variao local dos nveis de cinza entre pares
de pixels. A equao 2.49 considera a diferena entre nveis de cinza para o
clculo do contraste.
4) Homogeneidade
Ng 1
s4 =
P(i )
2
+1
i
i =0
(2.50)
A homogeneidade mede o grau de variao local dos nveis de cinza entre

pares de pixels. Essa medida estatstica assume grandes valores para pequenas
diferenas entre nveis de cinza, presentes no vetor de diferena entre nveis de
cinza P(i).
5) Mdia
Ng 1
s5 =
iP(i)
(2.51)
i =0
Mdia aritmtica dos valores presentes no vetor de diferena entre nveis

de cinza.
33
2.3 Reconhecimento de Imagens

As tcnicas de classificao de imagens tm como objetivo atribuir a uma
imagem observada uma determinada classe de padres com o intuito de auxiliar
na tarefa de reconhecimento. A fim de realizar essa deciso, necessrio que os
descritores previamente estabelecidos extraiam caractersticas suficientemente
discriminantes entre amostras que pertenam a classes distintas. A primeira fase
em um processo de classificao o treinamento. Essa fase pode ser dividida em
duas categorias: o treinamento supervisionado e o no-supervisionado.
No treinamento supervisionado so analisadas amostras de identidades
conhecidas. Esse mtodo de treinamento necessita, primeiramente, de amostras
representativas das classes analisadas. O nmero de amostras nessa fase deve
ser suficientemente numeroso para fornecer uma representao adequada das
classes, e para levar em conta as variaes que podem ocorrer em imagens da
mesma classe. Algumas tcnicas de classificao que utilizam treinamento
supervisionado so o classificador de distncia mnima e o classificador dos Kvizinhos mais prximos.
No
treinamento
no-supervisionado,
as
classes
das
amostras
de
treinamento no so conhecidas. As tcnicas utilizadas neste caso so as de

anlise de agrupamento como a das K-mdias. Aps a fase de treinamento, em
geral, calcula-se a similaridade entre os descritores de uma imagem de teste e o
prottipo resultante do processo de treinamento para que haja de fato a
classificao dessa imagem em relao s classes existentes. Algumas
aplicaes de processos de classificao podem ser encontradas em [46], [47],
[48].
2.3.1 Classificador de Distncia Mnima

O classificador de distncia mnima um mtodo que utiliza o treinamento
supervisionado para a classificao das amostras. Esse mtodo classifica as
34
amostras desconhecidas por meio do clculo da menor distncia entre elas e o

prottipo de cada classe [49]. Os prottipos so definidos pelo valor mdio das
amostras de treinamento de cada classe, conforme a equao 2.52.
mj =
1
Nj
(2.52)
v j
onde
j = 1, 2,..., M;
M a quantidade de classes;
N o nmero de amostras v de uma determinada classe j.

Ao se tomar uma amostra de classe ainda no definida, deve-se realizar o
clculo para determin-la como sendo pertencente classe que possua o

prottipo mais prximo. Diversas medidas de similaridade podem ser utilizadas
para a determinao da distncia entre amostras de classes desconhecidas e
classes pr-estabelecidas. As mais comuns so a distncia Euclidiana (equao
2.53) e a distncia de Mahalanobis (equao 2.54):
N
d ( x, m j ) =
x m
i
2
ji
(2.53)
i =1
onde
x o vetor de caractersticas de um padro a ser reconhecido;
mj o vetor de caractersticas do prottipo da classe j;
N a quantidade de caractersticas extradas da imagem.
e
d ( x, m j ) = ( x m j )( j 1 )( x m j )T
(2.54)
No qual,
N
j
1
j =
(Y ji Y j )(Y ji Y j ) T
N j 1 i =1
(2.55)
onde
N a quantidade de amostras da classe j;
Y o vetor de caractersticas da amostra i;
35
Y o vetor com os valores mdios das amostras da classe j.
A principal distino entre os dois modos de clculo de distncia, vistos

pelas equaes 2.53 e 2.54, que a distncia Euclidiana considera somente a
centride das classes, ao passo que a distncia de Mahalanobis considera
tambm a disperso das amostras de cada classe por meio da matriz de
covarincia (equao 2.55). Posteriormente ao clculo das distncias entre a
amostra a ser classificada e as classes, essa amostra atribuda como
pertencente classe que possuir a menor distncia at ela. A seguir
apresentado graficamente o procedimento de classificao (Figura 2.22).
Na Figura 2.22(a), esto presentes as amostras de trs classes
representadas pelas cores (amarela, verde e azul) e as amostras que devem ser
atribudas a uma dessas classes podem ser vistas na cor branca. A Figura 2.22(b)
exibe em preto os prottipos das classes, alm da distncia entre cada uma das
amostras a serem classificadas e o prottipo mais prximo. Por fim, na Figura
2.22(c), todas as amostras foram classificadas em uma das trs classes
Caracterstica 2
Caracterstica 2
Caracterstica 2
previamente estabelecidas.
Caracterstica 1
a)
Caracterstica 1
b)
Caracterstica 1
c)
Fig. 2.22 - Representao do processo de classificao das amostras atravs do Classificador de

Distncia Mnima
36
2.3.2 Classificador dos K-vizinhos mais prximos

O classificador dos K-vizinhos mais prximos considera todas as amostras
de treinamento como prottipos. Inicialmente, um valor inteiro para K deve ser
escolhido. Esse valor determina a quantidade de vizinhos mais prximos que deve
ser considerada para a atribuio das amostras a uma determinada classe. Para
cada amostra a ser classificada, deve-se calcular a distncia euclidiana em
relao s amostras de treinamento. A partir desse clculo, so selecionadas as K
amostras mais prximas, e a classificao deve ser realizada atravs do rtulo das
amostras de treinamento que for mais freqente nas K amostras selecionadas. O
Caracterstica 1
a)
Caracterstica 2
Caracterstica 2
Caracterstica 2
processo descrito pode ser acompanhado atravs da Figura 2.23.
Caracterstica 1
b)
Caracterstica 1
c)
Fig. 2.23 - Representao do processo de classificao das amostras para K = 3 atravs do

classificador dos K-vizinhos mais prximos
Esse classificador costuma se tornar computacionalmente lento se a

quantidade de amostras de treinamento for muito alta, j que necessrio o
clculo de um grande nmero de distncias entre as amostras para a realizao
da tarefa de classificao.
37
2.3.3 Anlise de Agrupamento por K-mdias

Um dos mtodos que permite a realizao de treinamento nosupervisionado a anlise de agrupamento por K-mdias. Nesse tipo de anlise,
no h informaes prvias a respeito do rtulo de cada classe. Esse mtodo tem
como principais caractersticas ser iterativo e agrupar as amostras em um nmero
pr-definido de K grupos [50], [51].
O processo de agrupamento iniciado pela escolha dos centrides para os
K grupos, geralmente, de forma aleatria. Ento, calculado o centride de cada
conjunto formado atravs das amostras de treinamento que se encontram mais
perto dos K centrides iniciais. A partir das novas localizaes dos centrides, os
grupos so rearranjados de forma que os centrides sejam calculados novamente.
Esse processo deve se repetir at que haja uma convergncia, ou seja, que os
valores recalculados para os centrides permaneam inalterados. Na Figura 2.24,
so apresentadas graficamente as etapas descritas para a anlise de
agrupamento por K-mdias. Ao final do agrupamento, foram obtidos K grupos com
Caracterstica 2
Caracterstica 1
b)
Caracterstica 2
Caracterstica 2
Caracterstica 1
a)
Caracterstica 1
c)
Caracterstica 2
Caracterstica 2
Caracterstica 2
seus respectivos centrides.
Caracterstica 1
Caracterstica 1
Caracterstica 1
f)
e)
d)
Fig. 2.24 - Representao do processo de agrupamento das amostras para K = 3 atravs da
anlise de agrupamento por K-mdias
38
Captulo 3
Metodologia Proposta para a Soluo do Problema
3.1 Requisitos para Aquisio das Imagens

Os conceitos iniciais para o entendimento deste trabalho, relativos
segmentao, descrio e reconhecimento de imagens, foram explanados no
captulo 2. Com base nessas informaes, selecionou-se um conjunto de mtodos
que, de acordo com as referncias bibliogrficas e a realizao de testes de
avaliao, se mostraram mais adequados para a deteco da presena de objetos
sobre a carga de minrio em um vago ferrovirio. Para simplificao da
abordagem proposta quanto a segmentao, um conjunto de requisitos foi definido
para a aquisio das imagens. Os requisitos que devem ser atendidos para
aquisio das imagens so:
1. Captura de imagens coloridas;
2. O vago ferrovirio deve estar enquadrado na imagem, de forma que ao dividila em duas partes de mesmo tamanho (regio superior e inferior), tenham-se
as bordas horizontais localizadas em partes distintas conforme mostrado na
Figura 3.1;
39
Regio Superior
Regio Inferior
Fig. 3.1 - Enquadramento do vago na imagem
3. A cmera deve estar disposta de forma a gerar um ponto de fuga no

prolongamento superior entre as bordas verticais do vago contido na imagem
conforme mostrado na Figura 3.2;
Fig. 3.2 - Disposio da cmera em relao ao vago
4. As bordas horizontais e verticais do vago devem estar posicionadas de

acordo com as inclinaes ilustradas na Figura 3.3. Essas inclinaes foram
definidas para reduo do custo computacional no clculo da transformada de
Hough e podem ser alteradas para adequao a outras condies de aquisio
da imagem.
Fig. 3.3 - Posicionamento das bordas do vago
40
O cumprimento dos requisitos prov para a metodologia proposta o

conhecimento prvio da orientao do vago na imagem. A partir do cumprimento
dos requisitos, a metodologia proposta iniciada com o pr-processamento das
imagens, seguido das etapas de segmentao, descrio e reconhecimento.
3.2 Pr-processamento de Imagens

A etapa de pr-processamento tem como finalidade adequar as imagens
para a etapa de segmentao, ou seja, modificar os valores dos pixels para
proporcionar que as etapas subseqentes obtenham resultados satisfatrios. Aps
a aquisio de uma imagem colorida, adquirida no modelo de cor RGB, deve-se
torn-la monocromtica (nveis de cinza). A converso realizada com o auxlio
do modelo de cor YIQ, descrito na seo 2.2.1.2. Preferiu-se utilizar esse modelo
de cor para o clculo do componente acromtico (Y) porque esse modelo foi
projetado para tirar vantagem da maior sensibilidade da viso humana a
mudanas na iluminncia do que nas mudanas de matiz ou saturao. Assim, a
banda utilizada por esse modelo maior na representao de Y, e a banda mais
estreita para a representao de I e Q [4]. Primeiramente, os nveis de cinza so
encontrados de acordo com a expresso Y = 0,299R + 0,587G + 0,114 B . A partir
desse clculo, o valor resultante (Y) atribudo aos componentes do modelo de
cor RGB da seguinte forma: R=Y, G=Y, B=Y.
3.3 Segmentao de Imagens

O objetivo da etapa de segmentao determinar a rea pertencente ao
vago em relao ao restante da imagem. Inicialmente, binariza-se a imagem de
41
acordo com o algoritmo de Otsu, descrito na seo 2.1.1. Esse algoritmo foi
escolhido devido ao baixo tempo de processamento e eficincia demonstrada na
limiarizao das amostras utilizadas para avaliao. Aproximaes para a
magnitude do gradiente, tais como os operadores de Prewitt e Sobel [4], no
foram utilizadas antes da binarizao porque, de forma geral, esses operadores
evidenciaram os trilhos ferrovirios presentes na imagem durante os testes
realizados, prejudicando a deteco das retas determinadas pelas bordas do
vago. Outro problema encontrado na utilizao desses detectores que foram
geradas bordas duplas ao redor do vago ferrovirio, prejudicando a formao de
retas contnuas e de comprimento significativo sobre as bordas do vago.
Aps a binarizao, devem ser encontradas as bordas que delimitam a
rea do vago ferrovirio. O processo ser exemplificado a comear pela Figura
3.4.
Fig. 3.4 - Imagem binria
A transformada de Hough, descrita na seo 2.1.2, o mtodo empregado

para a deteco das retas determinadas pelas bordas do vago. A Figura 3.5
apresenta o espao de Hough resultante para a imagem da Figura 3.4.
42
Fig. 3.5 - Espao de Hough
Com o intuito de reduzir o tempo de processamento, em vez de realizar a

transformada de Hough para todos os valores de , somente alguns valores so
considerados. Isso ocorre devido ao pr-estabelecimento da disposio do vago
na imagem (vide requisito 3). Os intervalos que foram considerados para o ngulo
de acordo com as informaes contidas no requisito 3 englobam retas
aproximadamente verticais e horizontais. Nas retas verticais, o intervalo
empregado para foi de [-20, 20], j nas retas horizontais, os intervalos foram de
[-90, -84] e [84, 89], conforme mostrado na Figura 3.6.
Janela 2
Janela 1
Janela 3
Fig. 3.6 - Espao de Hough e as janelas de interesse
43
A seleo prvia dessas regies diminui o tempo de processamento da

transformada devido minimizao do nmero de operaes. Dessa forma, para
as retas horizontais, a transformada de Hough realizada duas vezes, uma
correspondendo janela 1 e outra correspondendo janela 3, conforme visto na
Figura 3.6. Essas janelas so utilizadas para a localizao das maiores retas
aproximadamente horizontais presentes na imagem, conforme ilustrado na
Figura 3.7.
(a)
(b)
Fig. 3.7 - Espaos de Hough correspondentes a deteco das retas horizontais
A partir dos espaos de Hough que compem as janelas 1 e 3, devem-se

encontrar as duas maiores retas pertencentes a eles, de forma que estejam
dispostas em regies distintas na imagem original (vide requisito 2). A partir das
coordenadas (, ) das duas retas encontradas, tornam-se possveis suas
representaes na imagem.
As duas retas restantes (aproximadamente verticais) so encontradas
atravs de um processo semelhante. Primeiramente, deve-se gerar o espao de
Hough correspondente Janela 2, conforme a Figura 3.8. Dessa forma, a maior
reta encontrada atravs desse espao tida como sendo uma das que se deseja
localizar. O cumprimento da restrio imposta pelo requisito 3, que obriga a
existncia de um ponto de fuga no prolongamento superior entre as bordas
verticais do vago, resulta na existncia de retas aproximadamente verticais com
valores de positivos e negativos. Sendo a origem do sistema de coordenadas no
44
canto superior esquerdo da imagem, a inclinao da primeira reta encontrada

analisada de forma que, caso ela tenha o valor de positivo, a segunda reta deve
ter o valor de negativo e estar direita da primeira. Entretanto, caso a primeira
reta encontrada tenha o valor de negativo, a segunda reta deve ter o valor de
positivo e estar esquerda da primeira.
Fig. 3.8 - Espao de Hough responsvel pela deteco das retas verticais
A partir das retas encontradas, devem ser definidos os segmentos de reta

que representam as bordas do vago. Esses segmentos so delimitados pelos
vrtices das bordas do vago. As coordenadas polares foram relacionadas com as
coordenadas cartesianas atravs da equao = x cos + ysen . Os vrtices do
vago P(X,Y), que so determinados pela interseco das retas conforme
exibido na Figura 3.9, podem ser encontrados atravs das equaes 3.1 e 3.2.
Essas equaes foram obtidas a partir das expresses ma = (Y Y1a ) /( X X 1a ) e
mb = (Y Y1b ) /( X X 1b ) .
45
P(X,Y)
P1a(X1a,Y1a)
P1b(X1b,Y1b)
b
Fig. 3.9 - Determinao de um vrtice do vago
X =
ma X 1a mb X 1b Y1a + Y1b
ma mb
Y = ma X ma X 1a + Y1a
(3.1)
(3.2)
onde
a e b so as retas que determinam o vrtice procurado;
ma e mb so os coeficientes angulares das retas a e b;
X e Y so as coordenadas do vrtice P a ser encontrado;
X1a e Y1a so as coordenadas de um ponto qualquer pertencente a reta a;
X1b e Y1b so as coordenadas de um ponto qualquer pertencente a reta b.

A prxima etapa se refere aplicao de uma transformao geomtrica
que torna as bordas verticais do vago paralelas. Essa transformao

necessria para auxiliar no processo de retangularizao da rea do vago. A
retangularizao da rea do vago realizada devido a uma anlise local por
regies que ser feita na etapa de descrio das imagens. A transformao
geomtrica determinada pela matriz de transformao de cada imagem
conforme a expresso a seguir:
x' A B
y ' = D E

w G H
C x
F y
1 1
(3.3)
46
Passando das coordenadas homogneas para as cartesianas, obtm-se as

coordenadas dos pontos u =
x'
y'
,v=
da imagem corrigida. A fim de que sejam
w
w
determinados os oito coeficientes dessa matriz de transformao, necessrio

que sejam obtidas ao menos oito equaes para a formao de um sistema linear,
conforme apresentado na equao 3.4.
u1 x1
u x
2 2
u 3 x 3

u 4 = x 4
v1 0

v2 0
v 0
3
v 4 0
y1
y2
y3
y4
0
0
0
0
1 0
1 0
1 0
1 0
0 x1
0 x2
0 x3
0 x4
0
0
0
0
y1
y2
y3
y4
0
0
0
0
1
1
1
1
u1 x1
u 2 x2
u 3 x3
u 4 x4
v1 x1
v2 x2
v 3 x3
v4 x4
u1 y1 A
u 2 y 2 B
u3 y3 C

u4 y4 D
v1 y1 E

v2 y2 F
v3 y 3 G

v 4 y 4 H
(3.4)
onde
xi a coordenada da coluna do i-simo ponto da imagem original;
yi a coordenada da linha do i-simo ponto da imagem original;
ui a coordenada da coluna do i-simo ponto da imagem corrigida;
vi a coordenada da linha do i-simo ponto da imagem corrigida;
A...H so os coeficientes da matriz a serem determinados.

Com o intuito de determinar as coordenadas dos pontos finais (ui, vi),
necessrias para o clculo dos coeficientes da matriz de transformao, deve-se

ter como base a forma trapezoidal do vago causada pela perspectiva (Figura
3.10(a)). Para isso, as coordenadas so calculadas conforme as equaes 3.5, 3.6
e 3.7.
u1 = u2 =
x1 + x2
2
(3.5)
u3 = u 4 =
x3 + x4
2
(3.6)
vi = yi
(3.7)
47
A seguir, na Figura 3.10(b), pode-se verificar o paralelismo das bordas

verticais aps a transformao geomtrica em relao a sua forma inicial. Por fim,
a Figura 3.10(c) representa a imagem corrigida com os seus vrtices nas
coordenadas estabelecidas por meio das equaes apresentadas anteriormente.
( x2 , y 2 )
( x3 , y3 )
( x2 , y 2 )
( x3 , y3 )
(u2 , v2 )
(u3 , v3 )
( x1 , y1 )
( x4 , y 4 )
( x1 , y1 )
( x4 , y 4 )
(u1 , v1 )
(u4 , v4 )
a)
b)
c)
Fig. 3.10 - Processo de transformao geomtrica do vago
A interpolao da intensidade das cores na imagem foi realizada atravs do

mtodo de interpolao bilinear, esse mtodo considera a intensidade dos pixels
vizinhos para a determinao da intensidade do pixel de referncia. Aps a
realizao dessa transformao geomtrica, o maior retngulo inscrito rea
corrigida selecionado para compor a rea final conforme mostrado na Figura
3.11. Isso necessrio caso a rea do vago no tenha se tornado
completamente retangular atravs da transformao exibida na Figura 3.10.
48
(u2 , v2 )
(u3 , v3 )
(u2 , v2 )
(u3 , v3 )
(u2 , v3 )
(u3 , v3 )
(u1 , v1 )
(u4 , v4 )
(u1 , v1 )
(u4 , v4 )
(u1 , v1 )
(u4 , v1 )
a)
b)
c)
Fig. 3.11 - Processo de determinao do maior retngulo inscrito rea corrigida
A anlise da imagem na etapa de descrio realizada de forma local

devido aos problemas de perspectiva presentes nas imagens utilizadas. Um dos
problemas causados pela perspectiva que regies mais distantes do centro de
projeo so representadas com tamanho menor do que outras regies de mesmo
tamanho que esto mais prximas do centro de projeo (Figura 3.12). A
transformao geomtrica apresentada na Figura 3.10 corrige somente problemas
de perspectiva ao longo do eixo horizontal da imagem. As correes ao longo do
eixo vertical no foram realizadas dado que, para a configurao de cmera
utilizada, a reduo de tamanho mais significativa ao longo do eixo vertical. Isto
resulta em menor detalhamento para as regies mais distantes do centro de
projeo e no possibilitam uma reamostragem de forma adequada. Apesar desse
problema, a utilizao de imagens em perspectiva se deve ao fato de que nesse
tipo de imagem possvel enquadrar o vago ferrovirio por completo sem que a
cmera esteja a uma grande distncia em relao a ele. No caso de imagens
planas, onde no existem problemas de perspectiva, a cmera deve estar
localizada a uma grande distncia do vago para que seja possvel enquadr-lo
completamente na imagem. Nesse caso, pequenos objetos sobre a carga de
minrio podem no ser representados adequadamente na imagem devido a
grande distncia entre a cmera e o vago.
49
Fig. 3.12 - Viso perspectiva de um tabuleiro de xadrez
Dado um modelo de cmera, conforme mostrado na Figura 3.13, pode-se

compreender que a reduo do tamanho das regies ocorre em funo do
aumento da profundidade (z) segundo as equaes 3.8 e 3.9.
A fim de descrever os processos que levaram aos resultados da
segmentao, apresenta-se a Figura 3.14.
Fig. 3.13 - Modelo de projeo perspectiva
xp =
xd
z
(3.8)
yp =
yd
z
(3.9)
zp = d
(3.10)
onde
Pp a projeo do ponto P no plano imagem;
50
xp a coordenada x do ponto Pp ;
yp a coordenada y do ponto Pp ;
zp a coordenada z do ponto Pp ;
d a distncia entre o centro de projeo e o plano imagem.
51
Aquisio, Pr-processamento e Segmentao

Carregar
imagem
Aquisio
Converter para
nveis de cinza
Binarizar
imagem
Pr-processamento
Incio
Aplicar a
transformada
de Hough para
cada janela
Identificar as
retas
adequadas de
cada janela
Localizar os
vrtices do
vago
Realizar a
transformao
geomtrica
Estabelecer a
regio de
interesse
Imagem
segmentada
Fim
Fig. 3.14 - Fluxograma com nfase na etapa de segmentao de imagens
52
3.4 Descrio de Imagens

A etapa de descrio realizada levando-se em considerao as
informaes das cores e das texturas das imagens monocromticas. O modelo de
cor HSV foi escolhido devido separao entre o componente acromtico e os
componentes cromticos da cor e tambm porque as informaes cromticas so
codificadas em componentes de fcil compreenso. A vantagem da utilizao
desse modelo de cor em relao ao modelo YIQ para a representao de cores,
que o HSV no prioriza o componente acromtico (V) com mais banda do que os
outros componentes. Isso permite que a anlise do matiz e da saturao seja
realizada com mais qualidade. A anlise das cores foi realizada porque cada
vago ferrovirio carrega um tipo de minrio que possui uma cor que o
caracteriza. Com base nessa informao, em alguns casos, pode-se distinguir um
objeto de um minrio comparando-se suas cores. Entretanto, tambm existem
imagens onde as cores do minrio e do objeto sobre ele so similares, neste caso,
a anlise do padro de textura das imagens pode ser mais eficaz.
Na anlise da cromaticidade so utilizados os componentes de matiz e
saturao [52]. Cada um desses componentes fornece informaes que
contribuem para a distino entre um minrio e um objeto sobre ele (seo
2.2.1.3). O processo que se segue foi desenvolvido de forma a identificar
distores nos valores de matiz e saturao de uma imagem de teste.
Inicialmente, uma imagem subdividida em n regies quadradas (Figura
3.15) de forma a considerar as suas caractersticas locais para a etapa de
descrio. O tamanho de cada regio deve ser escolhido de forma a permitir que o
menor objeto que se queira localizar ocupe uma parcela significativa de alguma
das regies nas qual a imagem foi subdividida. Ao aumentar o tamanho das
regies, a relao entre a rea do objeto e a rea da regio a qual ele pertence se
torna cada vez menor. Dessa forma, com o aumento do tamanho das regies, o
tamanho dos objetos que se desejam localizar tambm deve ser maior.
Ao se reduzir o tamanho das regies deve-se observar sua relao com o
tamanho dos gros que compem o minrio e com o tamanho dos objetos a
53
serem localizados. Conforme feita a diminuio do tamanho das regies, maior

ser o detalhamento da anlise da imagem. Entretanto, caso a textura seja
composta de gros de minrio grandes, o tamanho das regies no pode ser
demasiadamente pequeno, pois nesse caso, as intensidades dos pixels que
compem as regies no sero capazes de representar os padres de textura
adequadamente. O tamanho das regies que foi escolhido para ser utilizado nas
imagens de minrio foi 16x16 pixels. O descritor escolhido para a quantificao foi
a intensidade mdia dos pixels de cada regio tanto no componente de matiz ( f m )
quanto no componente de saturao ( f s ). Esses componentes contm,
respectivamente, 256 nveis de matiz e saturao.
256
w m
i
fm =
i =1
256
(3.11)
i =1
256
y s
i i
fs =
i =1
256
(3.12)
i =1
onde
w a freqncia de ocorrncia de cada nvel de matiz em uma determinada

regio;
y a freqncia de ocorrncia de cada nvel de saturao em uma

determinada regio;
m o valor de cada nvel de matiz;
s o valor de cada nvel de saturao.
54
Fig. 3.15 - Componentes de matiz e saturao subdivididos em regies
A escolha do descritor foi realizada com o objetivo de contribuir para a

distino entre imagens de vages que contenham somente minrio e imagens de
vages que tambm contenham objetos sobre o minrio. Dessa forma, cada
imagem possui 2n descritores associados a cromaticidade. A descrio das cores
de uma imagem atravs dos componentes de matiz e saturao apresentada
esquematicamente no fluxograma da Figura 3.16.
55
Descrio da Cromaticidade
Incio
Redimensionar
imagem
Converter
espao de cores
Para os
componentes de
Matiz e
Saturao
Subdividir a
imagem
Para cada
regio
Calcular
intensidade mdia
Descritores
calculados
Fim
Fig. 3.16 - Fluxograma do processo de descrio da cromaticidade da imagem
Na etapa de descrio, alm da anlise das cores da imagem, tambm

efetuada a anlise da textura. Essa anlise realizada atravs do componente de
valor (HSV), onde as informaes acromticas esto contidas. Inicialmente,
necessrio que a quantidade de nveis de cinza seja reduzida, a fim de que o
tempo de processamento da anlise da textura se torne vivel. Para a reduo foi
utilizado um algoritmo de quantizao baseado na equalizao dos nveis de
56
cinza. Nesse trabalho, a reduo de nveis de cinza foi de 256 para 32 nveis. Para
melhor eficcia do processo de quantizao feita a equalizao do histograma
de nveis de cinza da imagem. A quantizao se inicia a partir da determinao do
histograma acumulado normalizado da imagem. Um exemplo do processo de
quantizao apresentado nas Figuras 3.17, 3.18 e 3.19 que mostram a imagem,
o
histograma
acumulado
normalizado
histograma
quantizado,
respectivamente.
Probabilidade cumulativa
de nveis de cinza (F)
Fig. 3.17 - Imagem inicial
Nveis de cinza (x)

Fig. 3.18 - Histograma acumulado normalizado de uma imagem inicial
57
A partir do histograma, deve-se encontrar as probabilidades cumulativas

dos nveis de cinza que sero os limites dos intervalos da nova distribuio
utilizando a equao 3.13 [34].
F (qk ) = F (qk 1 ) +
1 F (qk 1 )
K k + 1)
(3.13)
onde
q0 = 0;
K a quantidade de nveis de cinza que se deseja alcanar;
k = 1...K;
F a probabilidade cumulativa dos nveis de cinza.

A descoberta dos limites dos intervalos (qk) deve ser feita por meio das
probabilidades cumulativas calculadas, F(qk). A funo de transformao

definida por Q(x) = k, se e somente se, qk 1 x < qk . Essa funo resulta em um
nvel de cinza k para todos os pixels com valor x na imagem original. A partir desta
funo de transformao, a distribuio cumulativa de uma imagem deve ter forma
Probabilidade cumulativa
de nveis de cinza (F)
semelhante exibida na Figura 3.19.
Nveis de cinza (k)

Fig. 3.19 - Histograma acumulado normalizado aps a quantizao
58
Aps o processo de quantizao, deve-se dividir a imagem em n regies. O

descritor escolhido para quantificar cada regio, foi a mdia das homogeneidades
baseadas em matrizes de co-ocorrncia de nveis de cinza (equao 2.41) para as
direes horizontal, vertical, diagonal direita e diagonal esquerda e com distncia
um. Essa escolha deveu-se considerao da distribuio espacial dos nveis de
cinza em cada regio para a identificao de padres de textura distintos e
eficincia demonstrada em trabalhos anteriores relacionados anlise de textura
[37]. Dessa forma, para cada regio da imagem foram calculadas quatro matrizes
de co-ocorrncia de nveis de cinza (uma para cada direo), onde a distncia
entre o pixel de referncia e o pixel vizinho igual a um. A partir das matrizes, o
vetor de homogeneidades foi calculado segundo:
f h (k ) =
1 + (i j)
i
Pk (i , j )
(3.14)
onde i, j so valores de nveis de cinza e Pk a matriz de co-ocorrncia

considerada.
O descritor que quantifica cada regio , ento, obtido atravs da mdia
dos valores de homogeneidade para as direes consideradas, conforme:
4
f
f med =
(k )
k =1
(3.15)
onde k representa cada uma das direes.

A mdia realizada para que o descritor encontrado seja invariante
rotao do padro de textura [34]. Na Figura 3.20, apresenta-se o processo de
descrio da textura por meio de um fluxograma.
59
Descrio da Textura
Selecionar o
componente de
valor
Incio
Reduzir quantidade
de nveis de cinza
Subdividir a
imagem
Para cada
regio
Gerar matrizes de
co-ocorrncia de
nveis de cinza
Calcular o vetor
de
homogeneidades
Calcular a mdia
dos valores
encontrados
Descritores
calculados
Fim
Fig. 3.20 - Fluxograma do processo de descrio de texturas
60
3.5 Reconhecimento de Imagens

O pr-processamento, a segmentao e a descrio de imagens so
sucedidos pela etapa de reconhecimento. Essa etapa utiliza as informaes
providas pelos descritores para realizar a classificao das imagens.
A fase de treinamento iniciada ao serem escolhidas imagens que
representem a carga do vago ferrovirio, sem a presena de objetos sobre o
minrio. Essas imagens so obtidas a fim de que forneam informaes
suficientes a respeito de valores que devem ser considerados caractersticos para
os descritores. Aps o clculo dos descritores em cada um dos trs componentes
analisados nas imagens de treinamento, foram encontrados os seus valores
mdios (mn) e de desvios-padro ( n ), conforme as equaes 3.16 e 3.17. Esses
clculos so realizados em cada uma das regies para cada um dos trs
componentes analisados de forma que se obtenham descritores caractersticos
para as regies de cada um dos componentes do modelo de cor HSV que
compem as imagens de treinamento.
N
f (i )
(3.16)
i =1
mn =
1 N
n =
( f n (i ) mn ) 2
N 1 i =1
1/ 2
(3.17)
onde
N a quantidade de imagens de treinamento;
n o nmero de uma determinada regio;
i o nmero da imagem de treinamento que est sendo analisada;
f n (i ) o valor do descritor da regio n em um dos componentes da imagem de
treinamento i.
61
Essas duas medidas estatsticas constituem o prottipo que auxilia a

classificao das imagens em uma determinada classe. A Figura 3.21 apresenta o
fluxograma da fase de treinamento.
Fase de Treinamento - Classificao
Incio
Para todas as
imagens de
treinamento
Descrio
Aquisio,
Pr-processamento
e Segmentao
Descrio da
Cromaticidade
Descrio da
Textura
Calcular mdia e
desvio-padro dos
descritores para
cada regio
Prottipo
calculado
Fim
Fig. 3.21 - Fluxograma que apresenta os processos envolvidos com a fase de treinamento do
processo de classificao
62
A fase de teste, por sua vez, responsvel por analisar as imagens sem
informaes prvias a respeito da presena de objetos sobre o minrio do vago.
Nela, os descritores so calculados para cada imagem de forma que se torne
possvel compar-los com os valores obtidos na fase de treinamento. A fim de
classificar as imagens, necessrio calcular a distncia entre os valores da mdia
obtidos na fase de treinamento e os descritores da imagem de teste da seguinte
forma:
d n (t ) = (mn (t ) p n (t )) 2
(3.18)
onde
m o valor da mdia obtido na fase de treinamento;
p o valor do descritor da imagem de teste;
n a regio analisada;
t o componente analisado.
A partir do clculo das distncias, os limiares de aceitao so
determinados em funo dos desvios-padro (equao 3.17) previamente

calculados na fase de treinamento. Os limiares so encontrados conforme:
ln (t ) = 3 n (t )
(3.19)
onde
o valor do desvio-padro obtido na fase de treinamento;
n a regio analisada;
t o componente analisado.
O clculo dos limiares de aceitao realizado de acordo com a equao
3.19 porque se supe que os valores dos descritores das regies pertencentes s
imagens de treinamento se concentrem em torno da mdia (equao 3.16)
conforme mostrado na Figura 3.22.
63
Fig. 3.22 - Representao grfica de uma distribuio normal (gaussiana), onde 99,7% das
amostras da populao encontram-se entre 3 e + 3
Caso as distncias calculadas em relao a uma determinada regio

estejam dentro dos intervalos de tolerncia estipulados pelos limiares, a regio
classificada como minrio, caso contrrio ela classificada como objeto.
Numa segunda etapa as regies classificadas como objeto so analisadas,
e regies isoladas, isto , regies que no possuem na sua vizinhana
(vizinhana-4) outra regio tambm classificada como objeto, so reclassificadas
como regies de minrio. Isso foi feito porque, de forma geral, essas regies se
referem a reas de minrio com padres de textura diferentes das demais regies
devido proximidade com as bordas do vago, rudos na imagem ou presena de
sombras, entre outros fatores. Por fim, as regies que foram classificadas como
objetos em pelo menos um dos componentes analisados so identificadas na
imagem final com o preenchimento na cor branca. Na Figura 3.23, o processo de
classificao apresentado esquematicamente atravs de um fluxograma.
64
Fase de Teste Classificao

Aquisio,
Pr-processamento
e Segmentao
Descrio
Incio
Fase de Treinamento da
Classificao
Descrio da
Cromaticidade
Descrio da
Textura
Calcular a distncia entre o

prottipo e os descritores da
imagem de teste
Decidir por meio de

limiarizao
Classe
Fim
Fig. 3.23 - Fluxograma com nfase na fase de teste da classificao das imagens
65
Captulo 4
Experimentos e Resultados
De forma geral, pode-se dividir este trabalho em duas tarefas principais: a
delimitao da rea dos vages, efetuando as correes geomtricas necessrias;
e a identificao de objetos sobre o minrio dos vages. Os resultados alcanados
foram obtidos em um computador com as seguintes especificaes: AMD Athlon
XP 1.66 GHz, 1.25 GB de memria RAM e sistema operacional Microsoft Windows
XP. Os scripts e as funes foram desenvolvidos em MATLAB na verso 7.2 [6].
4.1 Delimitao da rea dos vages

A delimitao da rea dos vages foi obtida atravs da execuo das
etapas de pr-processamento e segmentao da metodologia proposta no
captulo 3. Embora a quantidade de imagens utilizadas para avaliao seja menor
do que o desejvel para um teste mais significativo, essa quantidade foi utilizada
devido a dificuldade de obteno das imagens em ambiente de produo e a
interferncia causada na operao dos trens. Procurou-se nesse trabalho mostrar
apenas a viabilidade da abordagem e espera-se em trabalhos futuros, juntamente
com potenciais usurios, a validao da metodologia com uma quantidade maior
de imagens justificando o custo operacional para aquisio das mesmas. Na
Figura 4.1, esto dispostas as 18 imagens que foram utilizadas para a avaliao
da eficincia da delimitao da rea dos vages. Essas imagens contm vages
ferrovirios com bauxita em seu carregamento e tm tamanho da ordem de
300x400 pixels. Elas foram adquiridas respeitando os requisitos estabelecidos na
67
seo 3.1. A partir das imagens em cores, a etapa de pr-processamento realizou

a converso para nveis de cinza. A Figura 4.2 apresenta as imagens resultantes
do pr-processamento. Aps o pr-processamento, realizou-se a etapa de
segmentao de imagens. Nessa etapa, primeiramente, foi feita uma binarizao.
As imagens resultantes da binarizao esto dispostas na Figura 4.3.
68
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.1 - Imagens de vages ferrovirios adquiridas em cores
69
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.2 - Imagens convertidas para nveis de cinza
70
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.3 - Imagens binrias
71
A partir das imagens binrias, as retas que passam sobre as bordas dos
vages foram localizadas com a utilizao da transformada de Hough. Essas retas
esto representadas com a cor vermelha, conforme mostrado na Figura 4.4.
Atravs da localizao das bordas dos vages, as reas de interesse foram
delimitadas e sofreram as correes geomtricas necessrias para preparar as
imagens para a etapa de descrio. As imagens resultantes do processo de
segmentao so apresentadas na Figura 4.5. A execuo dos algoritmos
envolvidos com as etapas de pr-processamento e segmentao levou
aproximadamente 4 segundos para a gerao de cada uma das imagens
resultantes. Para esse conjunto de imagens, todos os vages foram delimitados
de forma satisfatria, e posteriormente as correes geomtricas tambm foram
efetuadas com sucesso.
72
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.4 - Localizao das retas encontradas sobre as bordas dos vages
73
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.5 - Imagens resultantes da etapa de segmentao
74
4.2 Identificao de objetos sobre o minrio dos vages

Em relao identificao de objetos sobre o minrio dos vages, foram
realizados testes com dois conjuntos de imagens. O primeiro deles caracterizado
pela presena de bauxita como sendo o carregamento dos vages ferrovirios
(Figura 4.6). Ao seu redor, esto presentes regies de sombra devido s
condies de iluminao no controlada, e em algumas regies h ocluso devido
prpria disposio do minrio no vago.
As imagens de treinamento escolhidas so as que esto dispostas na
Figura 4.6(a) - (i). Essas imagens possuem dimenses de 272x128 pixels, cada
uma dividida em 136 (17x8) regies com tamanho de 16x16 pixels. A
importncia da considerao da localizao espacial das regies para a
identificao de objetos sobre o minrio se deve aos problemas causados pela
perspectiva na imagem (seo 3.3). Dessa forma, descreve-se cada regio da
imagem tendo como base sua localizao espacial.
A quantidade de nveis de cinza utilizada nas imagens monocromticas
para a anlise das texturas foi de 32. Essa quantidade foi escolhida porque a
utilizao de menos nveis de cinza (16, 8, 4, 2) costuma gerar falsos contornos
nas imagens resultantes do processo de quantizao [4]. A quantizao foi
realizada de forma a possibilitar a execuo da metodologia em um tempo
considerado aceitvel. A distncia considerada para o deslocamento entre o pixel
de referncia e o pixel vizinho na gerao das matrizes de co-ocorrncia de nveis
de cinza foi um. Essa escolha deveu-se aos pequenos gros de minrio que
compem a textura desse conjunto de imagens. Em texturas que sejam
compostas de grandes gros de minrio, valores maiores para a distncia podem
ser utilizados.
A fase de teste do processo de classificao levou, aproximadamente, 11
segundos para processar cada uma das imagens resultantes. Todos os objetos
presentes sobre o minrio foram localizados, e nos vages em que no havia
nada alm do prprio minrio a identificao tambm foi correta, mesmo sob a
variao da luminosidade no ambiente conforme mostrado na Figura 4.7.
75
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.6 - Conjunto de imagens utilizado para a identificao de objetos sobre o minrio dos vages
76
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
Fig. 4.7 - Resultados do reconhecimento de imagens
77
Com o intuito de avaliar a relevncia do tamanho das regies em que se

subdividiram as imagens, para o tempo de processamento e a eficincia da
metodologia, foram elaborados experimentos. O primeiro deles indica a variao
do tempo de processamento utilizado pela fase de treinamento e pela fase de
teste do processo de classificao de acordo com regies de tamanhos distintos.
Os resultados desse experimento so exibidos atravs da Figura 4.8. A partir
dessa figura, percebe-se que o tempo de processamento reduz quando o tamanho
das regies aumenta. Isso ocorre porque a quantidade de matrizes de coocorrncia reduzida e o custo computacional para determinao das matrizes de
co-ocorrncia est diretamente relacionado com a quantidade de nveis de cinza
na imagem, e no com o tamanho da regio.
Fase de Treinamento
Fase de Teste
Tempo (s)
200
150
100
50
0
4
12
16
20
24
28
32 34
Tamanho de cada regio (pixels)
Fig. 4.8 - Tempo de processamento utilizado pela fase de treinamento e pela fase de teste do
processo de classificao de acordo com regies de tamanhos distintos
Por sua vez, a eficincia da deteco foi verificada ao se computar a

quantidade de imagens detectadas corretamente e incorretamente de acordo com
regies de tamanhos distintos. A metodologia de teste consistiu em avaliar a
eficincia da deteco ao considerar tamanhos distintos para cada regio das
imagens (4x4, 8x8, 12x12, 16x16, 34x34). Percebe-se, na Figura 4.9, que o
melhor tamanho encontrado para as regies nesse conjunto de imagens foi de
78
16x16 pixels, j que regies deste tamanho fizeram com que uma maior
quantidade de imagens tivesse a deteco realizada corretamente.
Quantidade de imagens (%)
Deteco Correta
Deteco Incorreta
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
4
12
16
20
24
28
32 34
Fig. 4.9 - Quantidade de imagens detectadas corretamente e incorretamente de acordo com a

variao do tamanho das regies
Os menores objetos que foram encontrados sobre o minrio dos vages

deste conjunto de imagens ocuparam 4 das 136 regies (cada uma com tamanho
de 16x16 pixels), representando aproximadamente 3% da rea total da imagem,
que tem o tamanho de 272x128 pixels. O tamanho mnimo do objeto que se
deseja localizar sobre um vago tem relao direta com o tamanho das regies
em que as imagens so divididas.
Outro conjunto de imagens que foi utilizado nos experimentos compreende
15 fotografias de areia sem regies de sombra ou ocluso que tm tamanho de
240x240 pixels. Esse conjunto composto de imagens reais com sobreposio
simulada de objetos. Cada uma das imagens foi dividida em 100 (10x10) regies
com tamanho de 24x24 pixels cada uma.
As imagens de treinamento escolhidas so as que esto dispostas na
Figura 4.10(a) - (j). A quantidade de nveis de cinza utilizada nas imagens
monocromticas para a anlise das texturas foi de 32. Essa quantidade foi
escolhida porque a utilizao de menos nveis de cinza (16, 8, 4, 2) costuma gerar
falsos contornos nas imagens resultantes do processo de quantizao [4]. A
79
quantizao foi realizada de forma a possibilitar a execuo da metodologia em

um tempo considerado aceitvel. A distncia considerada para o deslocamento
entre o pixel de referncia e o pixel vizinho na gerao das matrizes de coocorrncia de nveis de cinza foi um. Essa escolha deveu-se aos pequenos gros
de areia que compem a textura desse conjunto de imagens. Em texturas
compostas de grandes gros de areia, valores maiores para a distncia podem ser
utilizados. A fase de teste do processo de classificao levou, aproximadamente,
15 segundos para processar cada uma das imagens resultantes. Todos os objetos
presentes sobre a superfcie de areia foram localizados, e nas imagens em que
no havia nada alm da prpria areia a identificao tambm foi correta conforme
mostrado na Figura 4.11.
80
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
Fig. 4.10 - Conjunto de imagens utilizado para a identificao de objetos sobre areia
81
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
Fig. 4.11 - Imagens utilizadas na fase de teste do processo de classificao
Com o intuito de avaliar a relevncia do tamanho das regies em que se

subdividiram as imagens, para o tempo de processamento e a eficincia da
metodologia, foram elaborados experimentos. O primeiro deles indica a variao
do tempo de processamento utilizado pela fase de treinamento e pela fase de
teste do processo de classificao de acordo com regies de tamanhos distintos.
Os resultados desse experimento so exibidos atravs da Figura 4.12.
82
Fase de Treinamento
Fase de Teste
Tempo (s)
200
150
100
50
0
12
14
16
18
20
22
24
26
28
30
32
34
Fig. 4.12 - Tempo de processamento utilizado pela fase de treinamento e pela fase de teste do
processo de classificao de acordo com regies de tamanhos distintos
A eficincia da deteco foi verificada ao se computar a quantidade de

imagens detectadas corretamente e incorretamente de acordo com regies de
tamanhos distintos. A metodologia de teste consistiu em avaliar a eficincia da
deteco ao considerar tamanhos distintos para cada regio das imagens (12x12,
16x16, 20x20, 24x24, 34x34). Percebe-se, na Figura 4.13, que os melhores
tamanhos encontrados para as regies nesse conjunto de imagens foram de
20x20 e 24x24 pixels, j que regies desses tamanhos fizeram com que uma
maior quantidade de imagens tivesse a deteco realizada corretamente.
Identificou-se como melhor, o tamanho de 24x24 pixels devido ao menor tempo de
processamento gasto tanto na fase de treinamento quanto na fase de teste do
processo de classificao conforme foi mostrado na Figura 4.12.
83
Deteco Correta
Deteco Incorreta
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
12
16
20
24
28
32
34
Fig. 4.13 - Quantidade de imagens detectadas corretamente e incorretamente de acordo com a

variao do tamanho das regies
Com o auxlio dos experimentos realizados foi possvel determinar os

valores mais adequados para os parmetros utilizados. A eficincia da deteco
por descritor foi verificada ao se computar a quantidade de imagens detectadas
corretamente e incorretamente somente com a utilizao de um descritor. Os
grficos que mostram a eficincia dos descritores para cada um dos conjuntos de
imagens testados so exibidos nas Figuras 4.14 e 4.15.
Utilizao Conjunta
Matiz
Saturao
Homogeneidade
100%
80%
60%
40%
20%
0%
Deteco Correta
Deteco Incorreta
Fig. 4.14 - Quantidade de imagens detectadas corretamente e incorretamente de acordo com cada
descritor utilizado para o conjunto de imagens de minrio
84
Utilizao Conjunta
Matiz
Saturao
Homogeneidade
100%
80%
60%
40%
20%
0%
Deteco Correta
Deteco Incorreta
Fig. 4.15 - Quantidade de imagens detectadas corretamente e incorretamente de acordo com cada
descritor utilizado para o conjunto de imagens de areia
A partir desses grficos possvel perceber que o descritor mais eficiente

para o conjunto de imagens de minrio foi o matiz. Isso se deve a cor preta dos
objetos localizados sobre a carga de minrio avermelhado. J em relao ao
conjunto
de
imagens
de
areia
os
descritores
de
matiz,
saturao
homogeneidade tiveram a mesma taxa de acerto. Isso se deve a presena de

objetos com cores e texturas diferentes da areia. A importncia de se utilizar os
trs descritores conjuntamente pode ser observada no fato de que a quantidade
de imagens detectadas corretamente de 100% quando se utilizam os trs
descritores, e de 93.3% quando se utiliza somente um deles. A realizao dos
experimentos apresentados e o alcance dos resultados obtidos permitiram avaliar
a qualidade da metodologia adotada ao atingir os objetivos previamente
estabelecidos.
85
Captulo 5
Concluso e Trabalhos Futuros
Este trabalho descreveu uma abordagem para a inspeo de carga em
vages ferrovirios utilizando tcnicas de processamento de imagens. Ao longo do
desenvolvimento da pesquisa foram implementados, em Matlab, mtodos de
segmentao e anlise de imagens. Esses mtodos foram determinados de forma
que atendessem as caractersticas do problema envolvido de maneira satisfatria.
Os vages ferrovirios foram localizados e delimitados com a utilizao da
transformada de Hough e de transformaes geomtricas, visando-se a gerao
de resultados apropriados para a anlise das imagens. A anlise de cores e
texturas foi considerada com a finalidade de se obter resultados mais confiveis. O
tempo de processamento gasto pela metodologia foi considerado aceitvel
levando-se em considerao a linguagem de programao utilizada para a sua
implementao. Para o aprimoramento deste trabalho so sugeridos os seguintes
tpicos para trabalhos futuros:
Adaptao dos mtodos empregados para a aplicao em imagens planas

(sem perspectiva) obtidas com o trem em movimento;
Validao da metodologia com mais imagens de teste e com condies de

iluminao variadas;
Adaptao dos mtodos empregados para a aplicao em caminhes e

navios de carga;
87
Implementao em uma linguagem de programao mais eficiente, que

permita a reduo do tempo de processamento dos algoritmos;
Estudo de outras tcnicas a fim de alcanar resultados similares ou

superiores;
Caso no seja necessria a informao das regies onde se encontram os

objetos sobre o minrio do vago, pode-se realizar primeiramente a anlise
das cores da imagem devido ao menor tempo de processamento
demandado. Somente no caso dessa anlise no apontar problemas no
vago, realiza-se a anlise da textura. Essa uma alternativa para a
reduo do tempo de processamento nos casos onde sejam detectados
objetos sobre o minrio do vago durante a anlise das cores da imagem.
Por fim, espera-se que essa pesquisa tenha contribudo, de maneira
satisfatria, com uma metodologia de inspeo de carga em vages ferrovirios,

visando detectar automaticamente a presena de objetos sobre o minrio presente
em cada um deles.
88
Referncias Bibliogrficas
[1]
D. Patel, I. Hannah, E. R. Davies. Foreign Object Detection via Texture Analysis,

IEEE, pp. 586-588, 1994.
[2]
Paolo Mulassano, Letizia Lo Presti. Object detection on the sea surface, based on
texture analysis, IEEE International Conference on Electronics, Circuits and
Systems, pp. 855-858, 1999.
[3]
Giaime Ginesu, Daniele D. Giusto, Volker Mrgner, Peter Meinlschmidt. Detection

of foreign bodies in food by thermal image processing, IEEE Transactions on
Industrial Electronics, pp. 480-490, 2004.
[4]
Rafael C. Gonzalez, Richard E. Woods. Processamento de Imagens Digitais, Edgard

Blcher, 2000.
[5]
Nobuyuki Otsu. A threshold selection method from gray level histograms, IEEE
Transactions on Systems, Man and Cybernetics, vol. 9, pp.62-66, 1979.
[6]
Guia do Usurio da Toolbox de Processamento de Imagens do Matlab, The

MathWorks, 2006.
[7]
W. Niblack. An Introduction to Image Processing, Prentice-Hall, pp.115-116, 1986.
[8]
Cludia M. C. Bezerra. BR Braille: Programa tradutor de textos braille digitalizados

para caracteres alfanumricos em portugus, Dissertao de mestrado, Faculdade de
Engenharia Eltrica e de Computao, Universidade Estadual de Campinas, 2003.
[9]
Paul V. C. Hough. Method and means for recognizing complex patterns, Patente n
3069654, 1962.
[10]
Fbio G. Dias. Melhorias para Sistemas de Reconhecimento da Placa de

Licenciamento Veicular, Dissertao de Mestrado, Faculdade de Engenharia
Eltrica e de Computao, Universidade Estadual de Campinas, 2005.
[11]
Alexander Mitchell, Steven Mills. Finding Fencing Foils using the Hough
Transform, International Conference on Visual Information Engineering, pp. 59-64,
2005.
[12]
Stephen Se, Michael Brady. Vision-based Detection of Stair-cases, Asian

Conference on Computer Vision, vol. 1, pp. 535-540, 2000.
89
[13]
L. Vega-Alvarado, M. S. Cordova, B. Taboada, E. Galindo, G. Corkidi. Online

Sauter Diameter Measurement of Air Bubbles and Oil Drops in Stirred Bioreactors
by Using Hough Transform, International Conference on Image Analysis and
Recognition, pp. 834840, 2004.
[14]
Richard O. Duda, Peter E. Hart. Use of the Hough Transformation to Detect Lines
and Curves in Pictures, Communications of the ACM, vol. 15, no. 1, 1972.
[15]
T. S. C. Tan, J. Kittler. Colour texture analysis using colour histogram, IEE

Proceedings on Vision, Image and Signal Processing, vol. 141, no. 6, pp. 403-412,
1994.
[16]
Alvy Ray Smith. Color Gamut Transform Pairs, SIGGRAPH Conference

Proceedings, pp. 12-19, 1978.
[17]
Antonio Houaiss. Dicionrio Houaiss da Lngua Portuguesa, Objetiva, 2001.
[18]
M. Tuceryan, A. K. Jain. Texture Analysis, The Handbook of Pattern Recognition

and Computer Vision (2nd Edition), World Scientific Publishing, pp. 207-248,
1998.
[19]
Banco de Imagens VisTex. Acessado em outubro de 2006.

http://vismod.media.mit.edu/vismod/imagery/VisionTexture/
[20]
Tatiane Stein. Avaliao de descritores de textura para segmentao de imagens,

Dissertao de mestrado, Universidade Federal do Paran, 2005.
[21]
S. Arivazhagan, L. Ganesan. Texture classification using wavelet transform, Pattern

Recognition Letters, pp. 1513-1521, 2003.
[22]
Guillermo Ayala, Juan Domingo. Spatial size distributions: applications to shape

and texture analysis, IEEE Transactions on Pattern Analysis and Machine
Intelligence, pp.1430-1442, 2001.
[23]
P. Howarth, S. Rger: Robust texture features for still-image retrieval. IEE

Proceedings on Vision, Image and Signal Processing, 2005.
[24]
Mahamadou Idrissa, Marc Acheroy. Texture classification using Gabor filters,

Pattern Recognition Letters, pp. 1095-1102, 2002.
[25]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Classification of nonhomogenous texture images by combining classifiers, IEEE International
Conference on Image Processing, 2003.
[26]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Retrieval of Non-Homogenous
Textures Based on Directionality, European Workshop on Image Analysis for
Multimedia Interactive Services, pp. 107-110, 2003.
90
[27]
Maneesha Singh, Sameer Singh. Spatial Texture Analysis: A Comparative Study,

International Conference on Pattern Recognition, pp. 676-679, 2002.
[28]
Bela Julesz. Visual pattern discrimination, IRE Transactions on Information Theory

IT-8, pp. 84-92, 1962.
[29]
Christodoulos I. Christodoulou, Silas C. Michaelides, Constantinos S. Pattichis.

Multifeature Texture Analysis for the Classification of Clouds in Satellite Imagery,
IEEE Transactions on Geoscience and Remote Sensing, vol. 41, no. 11, 2003.
[30]
A. H. Mir, M. Hanmandlu, S. N. Tandon. Texture Analysis of CT Images, IEEE

Engineering in Medicine and Biology, 1995.
[31]
Lee. H. Siew, Robert M. Hodgson, Errol J. Wood. Texture measures for carpet wear
assessment, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.
10, no. 1, pp. 92105, 1988.
[32]
M. A. Shaban, Onkar Dikshit. Textural classification of high resolution digital

satellite imagery, IEEE Transactions on Computers, pp. 25902592, 1998.
[33]
Joan S. Weszka, Charles R. Dyer, Azriel Rosenfeld. A comparative study of texture

measures for terrain classification, IEEE Transactions on Systems, Man and
Cybernetics, pp. 269-285, 1976.
[34]
Robert M. Haralick, K. Shanmugan, ItsHak Dinstein. Textural Features for Image

Classification, IEEE Transactions on Systems, Man, and Cybernetics, vol. SMC-3,
no. 6, 1973.
[35]
Robert M. Haralick. Statistical and Structural Approaches to Texture, Proceedings

of the IEEE, vol. 67, pp. 786-804, 1979.
[36]
Selim Aksoy. Textural features for content-based image database retrieval,

Dissertao de mestrado, University of Washington, Seattle, Estados Unidos, 1998.
[37]
Richard W. Conners, Charles A. Harlow. A Theoretical Comparison of Texture

Algorithms, IEEE Transactions on Pattern Analysis and Machine Intelligence, pp.
204-222, 1980.
[38]
A. Baraldi, F. Parmiggiani. An Investigation of the Textural Characteristics

Associated with Gray Level Co-occurrence Matrix Statistical Parameters, IEEE
Transactions on Geoscience and Remote Sensing, vol. 33, no. 2, pp. 293-304, 1995.
[39]
Martin G. Bello, Gerald J. Dobeck. The use of texture measures in improving mine
classification performance, OCEANS Proceedings, vol. 2, pp.1103-1109, 2003.
91
[40]
Dhanashree Gadkari. Image quality analysis using GLCM, Dissertao de mestrado,

University of Pune, 2004.
[41]
Robert M. Haralick, K. Shanmugan. Computer Classification of Reservoir

Sandstones, IEEE Transactions on Geoscience Electronics, vol. GE-11, pp. 171177, 1973.
[42]
Danielle J. Marceau, Philip J. Howarth, Jean-Marie M. Dubois, Denis J. Gratton.

Evaluation of the Grey-Level Co-Occurrence Matrix Method for Land-Cover
Classification using SPOT Imagery, IEEE Transactions on Geoscience and Remote
Sensing, Vol. 28, no. 4, 1990.
[43]
Mari Partio, Bogdan Cramariuc, Moncef Gabbouj, Ari Visa. Rock texture retrieval
using gray level co-occurrence matrix, Nordic Signal Processing Symposium, 2002.
[44]
Mark A. Sheppard, Liwen Shih. Efficient Image Texture Analysis and Classification
for Prostate Ultrasound Diagnosis, IEEE Computational Systems Bioinformatics
Conference, 2005.
[45]
Leen-Kiat Soh, Costas Tsatsoulis. Texture Analysis of SAR Sea Ice Imagery Using
Gray Level Co-Occurrence Matrices, IEEE Transactions on Geoscience and Remote
Sensing, vol. 37, no. 2, 1999.
[46]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Rock Image Classification
Using Non-Homogenous Textures and Spectral Imaging, Winter School of
Computer Graphics, 2003.
[47]
Leena Lepist, Iivari Kunttu, Jorma Autio, Ari Visa. Combining Classifiers in Rock
Image Classification Supervised and Unsupervised Approach, Advanced Concepts
for Intelligent Vision Systems, 2004.
[48]
A. J. Prez, F. Lpez, J. V. Benlloch, S. Christensen. Colour and shape analysis

techniques for weed detection in cereal fields, Computers and Electronics in
Agriculture, pp. 197-212, 2000.
[49]
Aykut Akgun, A. H. Eronat, Necdet Trk. Comparing different satellite image

classification methods: An application in Ayvalick district, western Turkey, XXth
ISPRS Congress, pp. 1091-1096, 2004.
[50]
Siddheswar Ray, Rose H. Turi. Determination of number of clusters in k-means

clustering and application in colour image segmentation, 4th International
Conference on Advances in Pattern Recognition and Digital Techniques, pp. 137143, 1999.
[51]
Linda Shapiro, George Stockman. Computer Vision, Prentice Hall, 2001.
92
[52]
Funda Durupinar. Classification of Textures under Various Lighting and Viewing

Conditions, Turkish Symposium on Artificial Intelligence & Neural Networks,
2005.
93

Tam Bur Gabriel Dos Santos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tam Bur Gabriel Dos Santos

Uploaded by

Copyright:

Available Formats

Gabriel dos Santos Tambur

Metodologia para Inspeo Visual e

Dissertao de Mestrado apresentada Faculdade de

Orientador: Prof. Dr. Clsio Luis Tozzi

FICHA CATALOGRFICA ELABORADA PELA

Tambur, Gabriel dos Santos

Ttulo em Ingls: Methodology for visual and automatic inspection of cargo in

Aos meus pais

A direo dos bales e o vo mecnico eram problemas insolveis.

Objetivos e Tcnicas Aplicadas.............................................................................. 3

Organizao do Trabalho ...................................................................................... 4

Requisitos para Aquisio das Imagens............................................................... 39

Descrio de Imagens .......................................................................................... 53

Reconhecimento de Imagens ................................................................................ 61

Delimitao da rea dos vages .......................................................................... 67

Identificao de objetos sobre o minrio dos vages........................................... 75

Fig. 3.13 - Modelo de projeo perspectiva ......................................................................... 50

O monitoramento e a vigilncia de processos so de fundamental

Fig. 1.1 - Passos fundamentais em um sistema de processamento de imagens digitais [4]

Ao considerar a composio modular que constitui, de forma geral, um

1.1 Objetivos e Tcnicas Aplicadas

cromticas (Matiz e Saturao) realizado ao encontrar-se a intensidade mdia

1.2 Organizao do Trabalho

2.1 Segmentao de Imagens

Fig. 2.1 - a) Imagem em nveis de cinza; b) Imagem binarizada [6]

f(x,y) a funo que representa a imagem;

T o valor que determina o limiar para a segmentao;

g(x,y) a funo que representa a imagem binria resultante.

determinao do valor mais adequado para T. As tcnicas de limiarizao podem

t o valor do limiar para o pixel (i,j);

o valor mdio dos nveis de cinza pertencentes janela;

um fator de ponderao aplicado ao desvio-padro;

o valor do desvio-padro dos nveis de cinza pertencentes janela.

onde pi representa a probabilidade de ocorrncia da intensidade i.

Dessa forma, a soma das probabilidades de ocorrncia das classes deve

Portanto, 0 0 + 11 = T , onde T o nvel de cinza mdio do histograma.

Outra forma de encontrar o valor do limiar ideal se d por meio da

Um exemplo de aplicao para o mtodo de Otsu dado em Bezerra [8].

2.1.2 Transformada de Hough

Fig. 2.2 - Imagem a ser aplicada a transformada de Hough

Fig. 2.3 - Espao dos parmetros (a,b)

Fig. 2.4 - Maior reta encontrada na imagem

Um problema inerente a essa parametrizao a impossibilidade de

Fig. 2.5 - Exemplo de coordenada polar (, )

Em vez de retas como no espao de Hough (a,b), nesse caso, tem-se a

Fig. 2.6 - Imagem a ser aplicada a transformada de Hough

Fig. 2.7 - Espao de Hough (, )

Na Figura 2.8, so exibidas as maiores retas localizadas pela transformada

Fig. 2.8 - Maiores retas encontradas na imagem

2.2 Descrio de Imagens

2.2.1 Modelos de Cor

Modelo de cor RGB

Fig. 2.9 - Espao de cores RGB

Modelo de cor YIQ

O modelo de cor YIQ utilizado na transmisso de sinais de televiso

Modelo de cor HSV

O modelo de cor HSV caracterizado pela separao das informaes

codificao das informaes cromticas em componentes de fcil compreenso.

Fig. 2.10 - Espao de cores HSV

2.2.2 Descrio de Imagens Baseada em Histograma

histograma, diversas medidas podem ser extradas para a descrio de imagens.

L o nmero de nveis de cinza da imagem;

w a freqncia de ocorrncia de cada nvel de cinza;

x o valor de cada nvel de cinza.