You are on page 1of 65

FUNDACAO UNIVERSIDADE FEDERAL DE RONDONIA

NUCLEO DE TECNOLOGIA
DEPARTAMENTO ACADEMICO DE CIENCIAS DA COMPUTACAO

YUJI FELIPE ROQUE KURODA

ESTUDO DE EXTRATORES DE CARACTERISTICAS PARA IDENTIFICACAO E


ANALISE DE ESPECIES DE PLANTAS

PORTO VELHO
2016
FUNDACAO UNIVERSIDADE FEDERAL DE RONDONIA
NUCLEO DE TECNOLOGIA
DEPARTAMENTO ACADEMICO DE CIENCIAS DA COMPUTACAO

ESTUDO DE EXTRATORES DE CARACTERISTICAS PARA IDENTIFICACAO E


ANALISE DE ESPECIES DE PLANTAS

YUJI FELIPE ROQUE KURODA

Orientadora: Carolina Yukari Veludo Watanabe, Dra.

Monografia submetida a Fundacao Universidade


Federal de Rondonia como requisito parcial a
obtencao do ttulo de Bacharel em Informatica.

PORTO VELHO
2016
iii

Dedicatoria
Dedico este trabalho a minha famlia.
iv

AGRADECIMENTOS

Primeiramente aos meus pais e a minha famlia, pelo auxlio, compreensao e apoio durante
todo estes 4 anos de curso.
A minha orientadora, Prof. Carolina, por todo o tempo e dedicacao que foi aplicado neste
trabalho de conclusao do curso e, tambem, em toda a jornada de iniciacao cientfica.
Aos demais professores pela minha formacao academica.
Ao Departamento Academico de Ciencias da Computacao e a Fundacao Universidade Fe-
deral de Rondonia, pelo espaco e materiais cedidos para a realizacao deste projeto.
A todos que de forma direta ou indireta contriburam para a realizacao deste trabalho.
v

O maior bem do Homem e uma mente inquieta.


Isaac Asimov
vi

RESUMO

A extracao de caractersticas e um dos processos do processamento e analise de imagens,


neste processo as informacoes relativas a imagem digital sao colhidas e quantificadas em um
vetor de caractersticas. Um extrator eficiente deve ser capaz de aplicar medicoes que consigam
evidenciar caractersticas que distinguam classes com alto nvel de semelhanca. Desta forma, a
precisao de um bom extrator pode refletir na correta ou incorreta identificacao de uma especie
de planta, dentro de um sistema computacional. Varias situacoes devem ser consideradas para
a escolha e aplicacao destes extratores, visto a quantidade de informacoes selecionadas que
podem tanto trazer benefcios como prejuzos ao objetivo final. Nota-se que este estudo se
fez necessario para aprimoramentos na area computacional e auxlio em areas biologicas, onde
muitos trabalhos custam muito tempo e dedicacao de especialistas. Este trabalho apresenta
uma metodologia para extracao de caractersticas presentes em imagens de folhas utilizando
descritores baseados na forma, sendo abordados pelas redes complexas, e na cor, trabalhada
pelo histograma de imagens coloridas, da imagem. O principal objetivo do trabalho e realizar o
estudo e a aplicacao destes extratores em imagens de folhas, com a finalidade de auxiliar pro-
fissionais na area de identificacao de especies de plantas, assim como contribuir com uma nova
metodologia para o ramo de processamento digital de imagens.

Palavras-chaves: Extracao de caractersticas, redes complexas, histograma, plantas.


vii

ABSTRACT

The feature extraction is a process of processing and image analysis, this information rela-
ting to the digital image are harvested and quantitated in a feature vector. An efficient extractor
should be able to apply measures that are able to demonstrate features that differentiate classes
with a high level of similarity. Thus, the accuracy of a good extractor may reflect the correct or
incorrect identification of a plant species, within a computer system. Several situations should
be considered for the selection and application of these extractors, as the number of selected
information that can both benefit and harm to the ultimate goal. Note that this study was ne-
cessary to improve computational tasks and support biological areas where many jobs cost a
lot of time and dedication of experts. This work presents a methodology for the extraction of
features present in images of leaves using descriptors based on the shape, being approached by
complex networks, and color, crafted by colorful images histogram of the image. The main goal
is to carry out the study and application of these extractors sheets of images, in order to assist
professionals in plant species identification area, as well as contribute to a new methodology
for the imaging processing research.

Key-words: Feature extraction, complex networks, histogram, leaves.


viii

LISTA DE FIGURAS

1.1 (a) Imagem binaria, (b) Imagem em escala de cinza e (c) Imagem colorida.
Fonte: Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 (a) Imagem original e (b) Histograma da imagem. Fonte: Retirado de Gonzalez,
Woods e Eddins (2009). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Conceitos de (a) 4-vizinhanca, (b) vizinhanca diagonal e (c) 8-vizinhanca. Fonte:
Retirado de Filho e Neto (1999). . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 (a) Imagem original, (b) Imagem dilatada e (c) Imagem erodida. Foi utili-
zado um elemento estruturante de 3x3 (d). Os pixels que foram adicionados
(dilatacao) e removidos (erosao) estao destacados pela cor mais clara. Fonte:
Retirado de Amorim (2010). . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Etapas basicas de PADI. Fonte: Retirado de Esquef, Albuquerque e Albuquer-
que (2003). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Exemplo de aplicacao do algoritmo k-NN para (a) k=1 e (b) k=3. Fonte: Reti-
rado de Blomberg (2014). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.1 Crculos cromaticos do sistema RGB. Fonte: Retirado de ROCHA (2011). . . . 19


2.2 Estrutura de uma imagem RGB. Fonte: Retirado de Gonzalez, Woods e Eddins
(2009). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
ix

2.3 Exemplo de decomposicao de imagem colorida em planos: (a) Imagem original;


(b) Plano vermelho (c) Plano verde; (d) Plano azul. Fonte: Elaborado pelo autor. 21
2.4 Histogramas dos planos sobrepostos. Fonte: Elaborado pelo autor. . . . . . . . 21
2.5 (a) um exemplo de grafo e (b) sua matriz de adjacencia correspondente. Fonte:
Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.6 Exemplo de um grafo regular. Fonte: Retirado de Casanova, Backes e Bruno
(2013). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.7 (a) Exemplo de rede aleatoria e (b) distribuicao de grau. Fonte: Retirado de Bac-
kes (2010). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.8 (a) Exemplo de rede de pequeno mundo e (b) distribuicao de grau. Fonte: Reti-
rado de Backes (2010). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.9 (a) Exemplo de rede livre de escala e (b) distribuicao de grau. Fonte: Retirado
de Backes (2010). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.10 Caracterizacao de redes complexas. Fonte: Retirado de Casanova, Backes e
Bruno (2013). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.1 Observando a imagem de cima para baixo e da esquerda para a direita, de acordo
com as especificacoes fornecidas pela MEW: Acer negundo, Acer palmatum,
Acer pensylvanicum, Acer platanoides, Acer pseudoplantanus, Acer sacchari-
num, Aesculus glabra, Amelanchier canadensis, Betula alleghaniensis, Betula
nigra, Betula populifolia, Carpinus betulus, Carpinus caroliniana, Castanea
dentata, Cornus florida, Fagus grandfolia, Liriodendron tulipifera, Magnolia
macrophylla, Platanus ocidentallis, Quercus montana, Tilia americana, Ulmus
pumila e Zelkova serrata. Fonte: Elaborado pelo autor. . . . . . . . . . . . . . 32
3.2 Observando a imagem de cima para baixo e da esquerda para a direita, de acordo
com as especificacoes fornecidas pela MEW: Amelanchier canadensis, Betula
alleghaniensis, Betula nigra, Carpinus betulus, Carpinus caroliniana, Castanea
dentata, Cornus florida, Fagus grandfolia, Ulmus pumila e Zelkova serrata.
Fonte: Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3 Fluxo de tarefas realizadas. Fonte: Elaborado pelo autor. . . . . . . . . . . . . 33
3.4 Elemento estruturante utilizado no preenchimento de regiao. Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.5 Filtro Laplaciano utilizado. Fonte: Elaborado pelo autor. . . . . . . . . . . . . 37
x

3.6 (a) Imagem binarizada; (b) Contorno; (c) Rede criada com a ligacao de vertices
com distancias entre 0 e 0,1; (d) Ampliacao de (c); (e) Rede criada com a ligacao
de vertices com distancias entre 0 e 0,2; (f) Ampliacao de (e). Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.1 Comparativo atraves da tecnica Holdout, com taxa de treinamento de 50%, 75%
e 90%. Fonte: Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Comparativo entre as especies Bettula alleghaniensis e Bettula nigra. Fonte:
Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3 Comparativo entre os extratores de forma e cor e sua composicao na primeira
base de imagens utilizando a tecnica Holdout de validacao. Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Comparativo entre os extratores de forma e cor e sua composicao na segunda
base de imagens utilizando a tecnica Holdout de validacao. Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
xi

LISTA DE TABELAS E QUADROS

1.1 Exemplo de matriz de confusao. . . . . . . . . . . . . . . . . . . . . . . . . . 16

4.1 Matriz de confusao, aplicada na segunda base, utilizando o classificador K-NN,


validacao Holdout, com 90% de treinamento, e dados extrados pelo descritor
de forma basedo em redes complexas. Fonte: Elaborado pelo autor. . . . . . . . 46
xii

LISTA DE EQUACOES

Equacao 1.1 Representacao matematica de uma imagem computacional. . . . . . . . . 5


Equacao 1.2 Equacao do Histograma. . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Equacao 1.3 Equacao da 8-vizinhanca de um pixel p. . . . . . . . . . . . . . . . . . 7
Equacao 1.4 Equacao para determinar o caminho de um pixel p. . . . . . . . . . . . . 8
Equacao 1.5 Distancia Euclidiana entre dois pixels. . . . . . . . . . . . . . . . . . . . 8
Equacao 1.6 Equacao da limiarizacao. . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Equacao 2.1 Construcao da matriz de adjacencia. . . . . . . . . . . . . . . . . . . . . 23
Equacao 2.2 Equacao de determinacao do grau de um vertice. . . . . . . . . . . . . . 25
Equacao 2.3 Equacao da probabilidade de um vertice possuir determinado grau. . . . . 25
Equacao 2.4 Equacao da distribuicao de vertices. . . . . . . . . . . . . . . . . . . . . 26
Equacao 2.5 Equacao da lei da potencia. . . . . . . . . . . . . . . . . . . . . . . . . . 27
Equacao 2.6 Representacao dos graus dos nos na matriz de adjacencia. . . . . . . . . . 29
Equacao 2.7 Equacao do grau maximo. . . . . . . . . . . . . . . . . . . . . . . . . . 29
Equacao 2.8 Equacao do grau mnimo. . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Equacao 2.9 Equacao da entropia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Equacao 2.10 Equacao da energia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Equacao 2.11 Equacao da juncao de distribuicao de grau. . . . . . . . . . . . . . . . . . 30
xiii

SUMARIO

INTRODUCAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1 INTRODUCAO AO PROCESSAMENTO E ANALISE DIGITAL DE IMAGENS 4


1.1 Fundamentos da imagem digital . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 Representacao da imagem digital . . . . . . . . . . . . . . . . . . . . . 4
1.1.2 Tipos de imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.3 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.4 Propriedades de uma imagem digital . . . . . . . . . . . . . . . . . . . 7
1.1.5 Morfologia matematica . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Etapas de um sistema de processamento e analise digital de imagens . . . . . . 10
1.2.1 Aquisicao de imagens digitais . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2 Pre-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3 Segmentacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.4 Pos-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.5 Extracao de atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.6 Reconhecimento e classificacao . . . . . . . . . . . . . . . . . . . . . 14
1.3 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2 EXTRATORES DE CARACTERISTICAS ESTUDADOS 18


xiv

2.1 Extrator baseado no histograma de imagens coloridas . . . . . . . . . . . . . . 18


2.1.1 Sistema RGB - Red, Green, Blue . . . . . . . . . . . . . . . . . . . . . 19
2.1.2 Histograma de uma imagem colorida . . . . . . . . . . . . . . . . . . . 20
2.2 Extrator baseado em grafos e redes complexas . . . . . . . . . . . . . . . . . . 20
2.2.1 Teoria dos grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 Redes complexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.3 Modelos de redes complexas . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.4 Medidas das redes complexas . . . . . . . . . . . . . . . . . . . . . . 28
2.3 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3 METODOS DESENVOLVIDOS 31
3.1 Materiais utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.1 Equipamentos e softwares . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.2 Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Metodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.1 Escolha e organizacao das bases de imagens . . . . . . . . . . . . . . . 34
3.2.2 Ajuste manual da base de imagens . . . . . . . . . . . . . . . . . . . . 34
3.2.3 Segmentacao e pos-processamento . . . . . . . . . . . . . . . . . . . . 35
3.2.4 Extracao de caractersticas e criacao do vetor completo . . . . . . . . . 36
3.2.5 Classificacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4 EXPERIMENTOS, RESULTADOS E DISCUSSAO 41


4.0.1 Resultados obtidos da primeira base de imagens . . . . . . . . . . . . . 42
4.0.2 Resultados obtidos da segunda base de imagens . . . . . . . . . . . . . 45
4.1 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
CONCLUSAO E RECOMENDACOES PARA TRABALHOS FUTUROS . . . . 48
REFERENCIAS BIBLIOGRAFICAS . . . . . . . . . . . . . . . . . . . . . . . . . 49
1

INTRODUCAO

As plantas sao de extrema importancia para a vida na terra, fornecendo oxigenio, alimentacao,
combustvel, substancias medicinais, e ainda mais, auxiliam na regulacao do clima, proporcio-
nando habitats para diversos animais, entre outros.
A identificacao cientfica correta das especies e fundamental para o desenvolvimento das
ciencias basica e aplicada, bem como para garantir a integridade das transacoes comerciais de
madeiras e demais produtos vegetais retirados da floresta. Anos de trabalho cientfico com
uma planta identificada erroneamente, podem significar perda de tempo ou causar graves con-
sequencias tanto em nvel cientfico quanto no financeiro. Por exemplo, no caso de plantas me-
dicinais, deve-se ter certeza absoluta da denominacao correta da especie da qual estao sendo ex-
trados os princpios ativos e que consequentemente serao indicados para uso terapeutico (KOOY;
SULLIVAN, 2013) (LUST, 2014).
A abordagem tradicional de identificacao das especies de planta e realizada atraves dos ta-
xonomistas1 experientes que examinam as especimes e relacionam a uma taxonimia conhecida.
Este processo e complexo e consome tempo de trabalho, mesmo para especialistas experien-
tes. Alem disso, um especialista em uma especie pode ser nao ter familiaridade com outra.
Estas questoes aumentaram o interesse de pesquisadores em buscar automatizar o processo de
identificacao de especies e tarefas correlatas, sendo, tudo isso possvel, gracas ao desenvolvi-
mento de tecnologias como computadores e cameras digitais. Hoje, o processo de identificacao
1
Aquele que estuda a taxonomia, que e a parte da biologia que identifica, nomeia e classifica os seres vivos.
2

caminha para a uniao de especialistas na area, juntamente com o auxlio de novas ferramentas
e tecnologias (CHAKKARAVARTHY et al., 2016) (HASIM; HERDIYENI; DOUADY, 2016).
Do ponto de vista das ciencias exatas, a identificacao de plantas e um desafio que leva a
grandes avancos na fsica, na matematica e na computacao, e o objetivo de superar as dificulda-
des na area computacional visa facilitar o trabalho do botanico.
Dentre os desafios computacionais, estao o desenvolvimento de classificadores para identifi-
car as especies de uma especime a partir de uma imagem digital, ou seja, problemas semelhan-
tes. Tambem tem-se a necessidade de propor novos vetores de caractersticas para distinguir
diferentes categorias da planta. Por exemplo, enquanto a forma da folha pode ser suficiente
para distinguir algumas especies, outras especies podem possuir formas muito similares, mas
possuir diferente coloracao das folhas. Uma unica caracterstica ou tipo de caracterstica pode
nao ser suficiente para separar todas as categorias, tornando a proposicao de novos vetores de
caractersticas (LEE; HONG, 2013) (KADIR et al., 2013) e a selecao de caractersticas (HAZRA et
al., 2013) um desafio.
Considerando a proposicao do estudo de extratores de caractersticas para a formacao de
vetores de caractersticas (os quais serao a representacao, ou a assinatura da imagem diante
um algoritmo de classificacao), recentemente trabalhos tem proposto a modelagem de formas
e textura de imagens como uma rede complexa. Como consequencia de sua flexibilidade para
representacao e modelagem virtuais de qualquer sistema discreto, redes complexas tambem
sao potencialmente uteis na analise de forma (COSTA et al., 2007). A abordagem da maioria
dos metodos para analisar imagens e objetos usando o contorno da forma considera a forma
como uma cadeia de pontos conectados. Nesta abordagem a sequencia de pontos na fronteira
e importante, ja que e usada para extrair o descritor de forma que seja capaz de caracterizar
a forma da imagem. Na abordagem de redes complexas, Backes, Casanova e Bruno (2009)
e Casanova, Backes e Bruno (2013) propoem o uso de redes complexas para caracterizar o
contorno da imagem, considerando o contorno da forma como um conjunto de pontos e modela
este conjunto como um grafo. Dessa maneira, o metodo por eles proposto nao necessita que os
pixels sejam adjacentes e sequenciais, ja que o modelo de grafo apenas leva em consideracao
a distancia entre os elementos do contorno. Esses trabalhos aplicam o uso de redes complexas
para modelar contorno de folhas. Os vetores de caractersticas passam a ser medidas extradas
da topologia da rede.
Outra medida que tem sido muito utilizada na representacao de imagens sao as baseadas em
3

histogramas de imagens coloridas, sendo este metodo ja amplamente adotado pela comunidade
de processamento de imagem. Nesta metodologia e verificada a quantidade de cada intensidade
de cor dentro da imagem digitalizada. Esta abordagem pode ser vista nos trabalhos realizados
por Dubey e Jalal (2014) e Deokar et al. (2016). O primeiro trabalho propos um metodo de
identificacao de doencas em frutas atraves de imagens digitais e, o segundo trabalho avaliou
tecnicas de extracao de caractersticas para identificacao de folhas com doencas, tambem em
imagens digitais.
O objetivo deste trabalho foi o desenvolvimento de uma metodologia de extracao de ca-
ractersticas baseada na descricao da forma e cor das folhas, sendo a primeira realizada atraves
das redes complexas e a segunda pelo histograma de imagens coloridas. A finalidade deste es-
tudo foi, primeiramente, contribuir para futuras aplicacoes que auxiliem especialistas na area de
identificacao de plantas. Alem disso, todo o estudo e metodologia adotada neste trabalho pode
servir como base para projetos envolvendo o processamento de imagens e visao computacional
de maneira geral.
Este trabalho foi organizado em quatro captulos, na seguinte ordem:
No captulo 1 sao apresentados os conceitos basicos referentes ao processamento e analise
de imagens digitais, tais como, suas etapas e os fundamentos da imagem digital.
O captulo 2 introduz os extratores de caractersticas estudados, que sao os baseados em
redes complexas e histogramas de imagens coloridas.
No captulo 3 e apresentada a metodologia utilizada para a implementacao dos extratores
de caractersticas e aplicacao dos mesmos em bases de imagens de plantas.
Finalmente, o captulo 4 apresenta os experimentos realizados, os resultados obtidos e dis-
cussoes.
4

1 INTRODUCAO AO PROCESSAMENTO E ANALISE DIGITAL DE IMAGENS

As imagens podem ser obtidas por uma variedade de dispositivos, como as cameras, mi-
croscopios eletronicos, radares, equipamentos de ultra-som entre varios outros. A utilizacao e
producao dessas imagens tem uma vasta area de aplicacao, que podem ir desde o entretenimento
ate aplicacoes tecnologicas e medicas. A finalidade da analise de imagens, atraves da maquina
ou do ser humano, e obter informacoes uteis para a aplicacao desejada.
Normalmente, uma imagem recem adquirida necessita de realce ou que sejam realiza-
das transformacoes para que se consiga obter as informacoes desejadas. Como uma area da
eletronica/teoria dos sinais, o Processamento e Analise Digital de Imagens (PADI), necessita
que as imagens sejam representadas matematicamente, atraves de uma matriz com numeros
inteiros e, entao, poderao ser realizados processamentos digitais atraves de algoritmos com-
putacionais. Realizada a aplicacao dos algoritmos e, desta forma, possvel extrair atributos e
informacoes pertinentes.
Este captulo tem como finalidade: conceituar os fundamentos da imagem digital, as etapas
relativas ao PADI e demonstrar aplicacoes existentes na area de identificacao de plantas.

1.1 Fundamentos da imagem digital

1.1.1 Representacao da imagem digital

Trabalhar com imagens de plantas, e especificamente lidando com as folhas, pode ser um
processo trabalhoso e que requer tanto conhecimento quanto tempo, lidando com imagens digi-
tais, por outro lado, e possvel discretizar valores e assim utilizar todos os benefcios computa-
cionais, entregando resultados com tempo otimizado.
Para que se processe a imagem em um computador e necessario que esta seja caracterizada
matematicamente (SIMIONATO, 2012). Uma imagem digital (ou imagem discreta) e constituda
por um arranjo de elementos (numericos) sobre uma forma de grade regular. As unidades
desta grade sao localizadas por um conjunto de coordenadas x e y, que respectivamente
representam as colunas e as linhas.
Duas caractersticas sao importantes no conceito de representacao de imagens, sao elas a
amostragem (ou discretizacao espacial) e a quantizacao (ou discretizacao em amplitude). A
amostragem converte uma imagem analogica em uma matriz de M por N pontos, cada qual
5

denominado pixel, conforme e demonstrado na equacao 1.1 abaixo:



f (0, 0) f (0, 1) ... f (0, N 1)

f (1, N 1)

f (1, 0) f (1, 1) ...
f (x, y) =


(1.1)
: : :

f (M 1, 0) f (M 1, 2) ... f (M 1, N 1)

Quanto maior forem os valores de M e N, maior resolucao tera a imagem. A quantizacao,


por sua vez, faz com que cada pixel assuma um valor inteiro de 0 a 2N -1. Quanto maior for
n, maior sera o numero de nveis de cinza (se tratando de uma imagem monocromatica) na
imagem digitalizada (GONZALEZ; WOODS; EDDINS, 2009).

1.1.2 Tipos de imagens

Com relacao a cor, as imagens podem ser monocromaticas (escala de cinza), binarias ou
coloridas.
As imagens em escala de cinza sao aquelas em que os valores de sua matriz representam
tons de cinza, e geralmente tem alcance de [0, 255] ou de [0, 65535], que representam, respecti-
vamente, as classes de 1 byte por elemento e 2 bytes por elemento. Uma imagem binaria e um
vetor logico composto por 0s e 1s, ou seja, representado, respectivamente, pelas cores preta e
branca, na imagem (GONZALEZ; WOODS; EDDINS, 2009). Ja uma imagem colorida, como sera
melhor estudada na Secao 2.1, e geralmente representada pelo sistema RGB, sendo este modelo
utilizado pelos monitores de vdeo atuais. Neste modelo, as imagem coloridas sao formadas
pela sobreposicao de tres matrizes, que representam os nveis de intensidade dos planos: ver-
melho, verde e azul; sendo cada um destes similares a uma imagem em escala de cinza. A
Figura 1.1 apresenta exemplos de imagem binaria, em escala de cinza e colorida.

(a) (b) (c)


Figura 1.1: (a) Imagem binaria, (b) Imagem em escala de cinza e (c) Imagem colorida. Fonte: Elaborado
pelo autor.
6

1.1.3 Histograma

O histograma e uma das formas mais simples de se representar a distribuicao de valores


de uma imagem. Ao observar o histograma de uma imagem e possvel inferir sobre suas ca-
ractersticas, como a intensidade media e a distribuicao dos valores de pixels. O histograma
nao considera informacoes espaciais dos pixels, ou seja, ele nao armazena onde o mesmo esta
localizado (NETA; DUTRA; ERTHAL, 2008).
De acordo com Gonzalez, Woods e Eddins (2009), o histograma e uma funcao discreta que
pode ser representada por:

Pk (rk ) = nk /n. (1.2)

onde,

rk : k-esimo nvel de cinza.


nk : numero de pixels na imagem cujo nvel de cinza corresponde a rk .
n : numero total de pixels na imagem.
pk : resultado da funcao discreta representada por rk .

Um histograma informa se a imagem esta escura, clara ou equalizada. Por exemplo, uma
imagem com nveis de cinza variando entre 0 e 256 e considerada escura se a maioria de seus
pixels estiverem proximos a 0, como demonstra a Figura 1.2 (GONZALEZ; WOODS; EDDINS,
2009).

(a) (b)
Figura 1.2: (a) Imagem original e (b) Histograma da imagem. Fonte: Retirado de Gonzalez, Woods e Eddins
(2009).
7

1.1.4 Propriedades de uma imagem digital

E importante ter a nocao das principais relacoes que os pixels possuem em uma imagem
digital. Uma imagem digital pode ser vista como uma matriz, sendo suas linhas e colunas os
identificadores de um determinado ponto nesta imagem. Sera adotada a notacao f(x,y) para
representar a imagem digital. Para se representar um unico pixel este sera feito com letra
minuscula, como p ou q, e um conjunto de pixels por S (FILHO; NETO, 1999).

Vizinhanca

Um pixel p, de coordenadas (x, y), tem 4 vizinhos horizontais e verticais, cujas coordenadas
sao (x + 1, y), (x 1, y), (x, y + 1) e (x, y 1). Estes pixels formam a chamada 4-vizinhanca
de p, que sera designada N4 (p).
Os quatro vizinhos diagonais de p sao os pixels de coordenadas (x 1, y 1), (x 1, y + 1),
(x + 1, y 1) e (x + 1, y + 1), que constituem o conjunto Nd (p).
A 8-vizinhanca de p e definida como (FILHO; NETO, 1999):

N8 (p) = N4 (p) Nd (p). (1.3)

Varios tipos de vizinhanca podem ser visualizados na Figura 1.3.

(a) (b) (c)


Figura 1.3: Conceitos de (a) 4-vizinhanca, (b) vizinhanca diagonal e (c) 8-vizinhanca. Fonte: Retirado de Fi-
lho e Neto (1999).

Conectividade

A caracterstica de conectividade e importante pois informa se dois pixels estao conectados


e e utilizada para descobrir regioes de fronteiras. Para existir conectividade e necessario deter-
minar a adjacencia destes pixels por algum criterio e se seus nveis de cinza satisfazem a um
determinado criterio de similaridade (FILHO; NETO, 1999).
8

Adjacencia

Um pixel p e adjacente a um pixel q se eles forem conectados. Ha tantos criterios de ad-


jacencia quantos sao os criterios de conectividade. Dois subconjuntos de imagens, S1 e S2 , sao
adjacentes se algum pixel em S1 e adjacente a algum pixel em S2 (FILHO; NETO, 1999).

Caminho

Um caminho de um pixel p de coordenadas (x, y) a um pixel q de coordenadas (s, t) e


uma sequencia de pixels distintos de coordenadas: (x0 , y0 ), (x1 , y1 ), ... , (xn , yn ), onde (FILHO;
NETO, 1999):

(x0 , y0 ) = (x, y).


(xn , yn ) = (s, t).
(1.4)
(xi , yi ) e adjacente a (xi 1, yi 1).
1i n.

Onde n e denominado o comprimento do caminho.

Medicoes de distancia

Existem algumas medicoes de distancias, algumas delas sao: a distancia Euclidiana, distancia
D4 e distancia D8 . Aqui sera apresentada apenas a distancia Euclidiana, que foi a utilizada neste
trabalho. Representado por D, funcao de distancia, os pixels p e q, sao respectivamente as co-
ordenadas (x,y) e (s,t).

Distancia Euclidiana

Para esta medida de distancia, os pixels com distancia Euclidiana em relacao a (x,y) menor
ou igual a algum valor r, sao os pontos contidos em um crculo de raio r centrado em (x,y).

p
De (p, q) = (x s)2 + (y t)2 . (1.5)
9

1.1.5 Morfologia matematica

A morfologia matematica tem seu esforco no estudo de estruturas geometricas das entidades
presentes em uma imagem (FILHO; NETO, 1999). Com a utilizacao da morfologia matematica
e possvel reconstruir, pelo menos amenizar, muitas pequenas falhas, e esta foi sua principal
relevancia para este trabalho.

Elemento estruturante

Um elemento estruturante e formado por uma matriz binaria bem definida, conhecida pre-
viamente e menor que a imagem a ser processada. O seu centro percorre toda a imagem a ser
processada e a sua vizinhanca e responsavel pela operacao morfologica. E intrisicamente ne-
cessaria uma avaliacao do tamanho e da forma a ser utilizada no elemento estruturante, pois
quanto melhor definido for o elemento, mais preciso e relevante sao as informacoes adquiridas
de cada pixel (RESENDE et al., 2013).

Operacoes

As operacoes podem ser descritas em termos de manipulacao de pixels de uma determi-


nada imagem, ou seja, adicionando ou removendo pixels de uma imagem binaria de acordo
com certas regras, que depende do reconhecimento da vizinhanca. Exitem dois tipos basicos
de operacoes, sao elas: dilatacao e erosao. A Erosao tem a funcao de remover pixels de uma
imagem. Estes pixels sao retirados utilizando um elemento estruturante sobre a imagem. Ja a
Dilatacao tem por funcao a adicao de pixels em uma imagem. Estes pixels tambem sao adici-
onados passando o elemento estruturante sobre a imagem processada (RUSS, 2011). A Figura
1.4, abaixo, demonstra a transformacao de uma imagem binaria atraves destes operadores.

(a) (b) (c) (d)


Figura 1.4: (a) Imagem original, (b) Imagem dilatada e (c) Imagem erodida. Foi utilizado um elemento
estruturante de 3x3 (d). Os pixels que foram adicionados (dilatacao) e removidos (erosao) estao
destacados pela cor mais clara. Fonte: Retirado de Amorim (2010).
10

1.2 Etapas de um sistema de processamento e analise digital de imagens

O PDI, Processamento Digital de Imagens, e um conjunto de tecnicas que alteram os pixels


da imagem digital atraves da utilizacao de operacoes matematicas. A finalidade do PDI e a
otimizacao das imagens, tratando dos defeitos adquiridos na aquisicao da imagem ou ressal-
tando areas de interesse. O PDI, em geral, possui dois objetivos, que sao:

alteracao da imagem buscando a facilidade em sua vizualizacao e,

preparacao para analise atraves de processos de Analise Digital de Imagens.

A Analise Digital de Imagens (ADI) tem a funcao de extrair e tratar os dados proveni-
entes das imagens digitais. Apesar da competencia maior do ser humano em realizar tarefas
de identificacao, atraves de procedimentos de ADI, torna-se mais facilitada a realizacao de
medicoes complexas, por exemplo, auxiliando em tarefas de apoio a decisao.
Geralmente, o termo Processamento Digital de Imagem, e definido pela literatura abran-
gendo ambos os conceitos de PDI e ADI, sendo plausvel, pois estas se intercalam. Neste
trabalho sera usado o termo Processamento e Analise de Imagens (PADI) para se referir aos
dois processos.
Como o trabalho proposto sugere uma nova abordagem no segmento de extracao de carac-
tersticas/atributos de imagens, e interessante definir as etapas presentes no processamento e
analise de imagens, verificando desta forma onde se insere o objeto de estudo. Apesar disso,
para a realizacao deste trabalho diversas etapas foram realizandas com o objetivo de proporcio-
nar um resultado mais favoravel, como sera melhor abordado em cada segmento.
As principais etapas de um sistema de PADI podem ser verificadas atraves da Figura 1.5.
A estrutura visualizada na Figura 1.5 possui tres composicoes: aquisicao, PDI e ADI. Nas
laterais do fluxograma existem setas que indicam o nvel semantico dos dados. O processo
comeca com a manipulacao dos pixels da imagem, apos sao identificados os objetos desejados,
ou regioes de interesse e, por fim, sao gerados dados que serao utilizados para a classificacao e
analise em geral. A transicao e realizada passando-se da geracao de qualidade da imagem para
a sua quantificacao atraves dos dados obtidos. Cada uma destas etapas sao descritas a seguir.

1.2.1 Aquisicao de imagens digitais

A etapa de aquisicao e composta basicamente por dois elementos. O primeiro e a utilizacao


de um dispositivo fsico que seja sensvel ao espectro eletromagnetico, devendo proporcionar
11

Figura 1.5: Etapas basicas de PADI. Fonte: Retirado de Esquef, Albuquerque e Albuquerque (2003).

em sua sada um sinal eletrico proporcional ao nvel de energia adquirido. O segundo consistiria
na realizacao da digitalizacao da imagem, transformando o sinal analogico recebido para um
sinal digital (ESQUEF; ALBUQUERQUE; ALBUQUERQUE, 2003).

1.2.2 Pre-processamento

A partir do momento em que as imagens estao digitalizadas, elas se tornam representadas


matematicamente, fornecendo, a capacidade da realizacao de operacoes de seus pixels pelo
computador.
O pre-processamento e a fase em que a imagem passa por um processo de melhora em
sua qualidade. Ela tem a funcao de proporcionar uma melhor visualizacao ou segmentacao.
Os metodos de pre-processamento sao geralmente realizados com operacoes aritmeticas nas
imagens (GOMES, 2007).

1.2.3 Segmentacao

A segmentacao subdivide a imagem em regioes que a constituem ou em objetos. O nvel


desta subdivisao depende do problema a ser resolvido. A segmentacao termina quando o objeto
que e de interesse tiver sido isolado. E dito que a segmentacao e um dos processos mais com-
plexos em processamento de imagens, considerando imagens nao-triviais. A precisao obtida
na segmentacao de uma imagem pode determinar o sucesso ou fracasso nos procedimentos de
analise computacional (GONZALEZ; WOODS; EDDINS, 2009).
Existem duas ideias basicas utilizadas pelos metodos de segmentacao. A primeira delas e
12

encontrar o contorno dos objetos na imagem. A outra, e agrupar pontos que possuam carac-
tersticas semelhantes ate que o objeto seja reconstrudo. Podem ser destacadas, entao, duas
tecnicas basicas: limiarizacao e deteccao de bordas (MEDEIROS; SILVA; NOGUEIRA, 2002).

Limiarizacao de histograma

O princpio basico da limiarizacao consiste em separar a imagem original em fundo e o


objeto ou regioes de interesse. O resultado da limiarizacao e composto por objetos de cor
preta sobre um fundo branco (ou vice-versa), formando assim uma imagem binaria com duas
classes (NETA; DUTRA; ERTHAL, 2008).
A limiarizacao simples e eficaz apenas quando os objetos tem nveis de cinza bem distintos,
ou seja, regioes com intensidade uniforme resultam em picos elevados no histograma. Logo,
se os nveis de cinza dos pixels do objeto e do fundo apresentarem distintamente duas classes
na forma de dois picos, a limiarizacao e trivial, pois o objetivo e encontrar o vale entre os dois
picos, ou seja, encontrando um limiar T que separe as duas classes (NETA; DUTRA; ERTHAL,
2008).
A limiarizacao pode ser definida como:

objeto, se f (x, y) > T
g(x, y) = (1.6)
f undo, se f (x, y) T

onde,

f (x, y) : imagem de entrada.


T : valor escolhido para o limiar.
g(x, y) : imagem de sada (limiarizada).

Deteccao de bordas

A deteccao baseada em bordas envolve localizar regioes onde ocorre uma variacao abrupta
dos nveis de cinza. Podem ocorrer, entao, na forma de pontos, linhas e segmentos e, a partir
destes sao contrudos os contornos dos objetos da imagem. Algoritmos de enlace sao entao
13

utilizados para conectar os fragmentos evidenciados para gerar contornos que estejam associ-
ados a objetos presentes na imagem. A deteccao de descontinuidade e realizada por meio de
operadores de derivacao local. Os operadores mais conhecidos de derivacao sao os de Sobel,
Prewitt, Canny e Laplaciano. E passado o operador sobre a imagem, funcionando como uma
mascara (WATANABE, 2013) (GONZALEZ; WOODS; EDDINS, 2009).

1.2.4 Pos-processamento

O pos-processamento ajusta a imagem resultante da segmentacao para as etapas posteriores,


caso esta nao tenha sido adequada. Como exemplo podem ser citadas as operacoes realizadas
para separar ou unir os objetos da imagem (GOMES, 2007).

1.2.5 Extracao de atributos

A extracao de atributos ou caractersticas e a etapa em que sao extradas informacoes uteis


da imagem que foi processada. E nessa fase que e realizada a quantificacao dos dados e, entao,
estes sao enviados ao estagio de reconhecimento e classificacao (ESQUEF; ALBUQUERQUE; AL-
BUQUERQUE, 2003).
Existem, na etapa de extracao de atributos, quatro grande areas que sao comumente aborda-
das, sao elas (IGNACIO, 2015):

Morfologicas: nao se considera a intensidade dos pixels, pois se baseam em medicoes da


forma do objeto extradas da imagem binaria.

Cromaticas: extracao de caractersticas das bandas da imagem, sendo a intensidade dos


pixels relevante, baseia-se nos valores que descrevem a cor ou os tons de cinza.

Texturiais: obtidas atraves de procedimentos complexos, baseia-se na variabilidade da


intensidade dos pixels, a fim de medir a textura.

Estruturais (Contextuais): obtidas atraves da relacao com outros objetos da imagem con-
forme informacoes coletadas previamente de outros grupos.

Os metodos desenvolvidos neste trabalho foram voltados a este segmento, em especfico as


areas de extracao morfologica e cromatica, por esta razao este topico sera melhor estudado no
captulo 3.
14

1.2.6 Reconhecimento e classificacao

A fase de reconhecimento e classificacao esta estritamente relacionada com a mineracao


de dados. Segundo Hirji (1999), mineracao de dados e um campo interdisciplinar que junta
tecnicas de maquinas de conhecimentos, reconhecimento de padroes, estatsticas, banco de da-
dos e visualizacao, para conseguir extrair informacoes de grande base de dados.
Apesar da mineracao de dados fazer alusao a um processo totalmente automatico, isto se
prova falso na medida em que os resultados ainda necessitam da analise final humana. Porem,
nao resta duvida de sua contribuicao em termos de processamento dos dados, facilitando, assim,
o trabalho de especialistas, que, desta forma, podem focar suas atencoes em partes significativas
do processo (IGNACIO, 2015).
O objetivo da classificacao e a relizacao, de forma automatica, da identificacao dos objetos
segmentados da imagem. Existem basicamente dois passos para a formacao da classificacao: o
aprendizado e o reconhecimento.
O reconhecimento se utiliza das tecnicas da extracao de atributos para a formulacao de
um espaco de medidas. Estas medidas sao entao discriminadas pelo sistema de aprendizagem
escolhido a fim de obter a separacao adequada.
A aprendizagem se divide em dois metodos: supervisionados e nao-supervisionados. No
modelo supervisionado, o classificador, na fase de aprendizagem, e informado de como as
classes podem ser identificadas. Este tipo de aprendizado consiste em apresentar ao sistema
os objetos para teste com suas classes determinadas juntamente com uma funcao para se-
para-las. Ja no modelo nao-supervisionado, o classificador recebera os dados desconhecidos
e buscara aloca-los em classes diferentes. Geralmente, para este modelo as identificacoes sao
realizadas atraves do agrupamento de objetos (colecao de objetos similares entre si) no espaco
de medidas (ESQUEF; ALBUQUERQUE; ALBUQUERQUE, 2003).

Tecnicas de classificacao

Existem diversas tecnicas de classificacao que podem ser utilizadas para o reconhecimento
e classificacao, sendo relevante para este trabalho o estudo do metodo de aprendizado baseado
em instancias (instance-based learning) de classificacao. Este metodo compara novas instancias
com as do treinamento, alocadas na memoria. Desse metodo se destaca o algoritmo k-NN.
O k-NN ou K-vizinhos mais proximos (k-Nearest Neighbor), armazena os dados de treina-
mento e, quando ha um novo objeto a ser classificado, o algoritmo busca pelos k registros mais
15

proximos do registro ofertado, dada uma medida de distancia. O objeto e, entao, classificado
na classe mais comum entre os k registros mais proximos (BLOMBERG, 2014). Na Figura 1.6 e
possvel visualizar um exemplo da aplicacao do modelo k-NN para k=1 e k=3, considerando o
X o novo objeto a ser identificado.

(a) (b)
Figura 1.6: Exemplo de aplicacao do algoritmo k-NN para (a) k=1 e (b) k=3. Fonte: Retirado de Blomberg
(2014).

Tecnicas de validacao

As tecnicas de validacao se fazem necessarias para avaliar a capacidade de generalizacao


de um modelo, segundo um conjunto de dados definido. Uma tecnica geralmente utilizada com
esta finalidade e a validacao cruzada. Nesta os conjuntos de dados sao particionados em subcon-
juntos mutualmente exclusivos, sendo uma parte destinada ao treinamento e a outra para testes.
Existem variadas formas de se particionar estes dados, algumas das abordagens sao (SYED,
2011):

Holdout: divide-se o conjunto de dados em dois subconjuntos que sao mutualmente ex-
clusivos, sendo um para teste e o outro para treinamento. Depois de realizado o par-
ticionamento, e realizada a estimacao do modelo, posteriormente os dados de teste sao
aplicados e, entao, calcula-se o erro.

K-fold: divide-se o conjunto de dados em subconjuntos de tamanho k mutualmente ex-


clusivos. Utiliza-se um dos subconjuntos para teste e o restante para treinamento, este
processo se repete ate que todos os outros subconjuntos sejam utilizados para teste, de
forma cclica. No fim, calcula-se a acuracia dos erros encontrados, obtendo-se uma pre-
cisao maior da capacidade do modelo proposto.
16

Tabela 1.1: Exemplo de matriz de confusao.

Classificado como
A B C
Classe A 50 0 0
B 0 47 3
Real C 0 4 46

Fonte: Elaborada pelo autor.

Medidas de desempenho

As medidas de desempenho, ou metricas de avaliacao, surgiram para avaliar se o sistema


proposto esta recuperando as informacoes corretas e, tambem verificando se esta abstrando
informacoes erradas. Para a realizacao das medicoes e necessario observar a matriz de confusao.
Em uma matriz de confusao cada linha representa as instancias reais de uma classe, enquanto
cada coluna representa as instancias de previsao para uma classe (ou vice-versa). A Tabela 1.1
demonstra um exemplo de matriz de confusao possundo 3 classes: A, B e C. Cada classe possui
um total de 50 instancias. Neste exemplo as colunas representam a classe a qual foi classificada,
enquanto as linhas demonstram a real classe. Na coluna Classificado como: em A, todas as
instancias foram classificadas corretamente; em B, 47 instancias classificadas como B e 3 como
C e; em C, 46 instancias classificadas corretas e 4 erradas.
Da matriz de confusao podem ser retiradas as seguintes informacoes.

Verdadeiros positivos (VP): instancias que foram corretamente classificadas em sua


classe. Por exemplo, todas as instancias classificadas corretamente como sendo da classe
B, ou seja, 47 instancias.

Verdadeiros negativos (VN): todas as demais instancias que foram corretamente classi-
ficadas como nao sendo de determinada classe. Por exemplo, todas as instancias classifi-
cadas como nao sendo A, 100 instancias.

Falsos negativos (FN): instancias de uma classe que foram incorretamente classificadas
como sendo de outra classe. Por exemplo, a classe C apresentou 4 falsos negativos, que
foram instancias da classe C classificadas incorretamente como sendo de B.

Falsos positivos (FP): instancias de outra classe que foram incorretamente classificadas
como sendo desta classe. Por exemplo, a classe C apresentou 3 falsos positivos, que
foram instancias da classe B classificadas incorretamente como sendo de C.
17

1.3 Consideracoes Finais

Neste captulo foram vistos os fundamentos basicos aplicados a imagem digital, como sua
representacao matematica, tipos de imagens, a avaliacao de seu histograma e algumas de suas
propriedades mais comuns. Foi realizado um estudo que procurou englobar as etapas do proces-
samento e analise de imagens, definindo cada uma destas etapas e possibilitando a visualizacao
da area especfica a ser trabalhada, assim como, outras etapas importantes que tambem tiveram
que ser estudadas e realizadas para a conclusao deste trabalho.
No proximo captulo sao apresentados os extratores de caractersticas estudados e imple-
mentados neste trabalho.
18

2 EXTRATORES DE CARACTERISTICAS ESTUDADOS

Como visto no captulo 1, a etapa de extracao de atributos ou caractersticas e apenas um


segmento dentro do PADI (processamento e analise digital de imagens), sua funcao principal e
trabalhar com os objetos que foram evidenciados pela segmentacao da imagem digital, quan-
tificando estes dados atraves de medicoes e analises de interesse, reservando informacoes que
serao relevantes para a proxima fase (reconhecimento e classificacao). Foram apresentadas,
tambem no captulo anterior, os tipos principais, que sao as extracoes por: morfologia, cor,
textura e estrutura.
E importante a definicao de metodos de extracao de caractersticas, pois o desempenho de
um sistema de PADI esta diretamente relacionado com o conjunto de atributos escolhido. Estas
caractersticas devem proporcionar uma distincao entre objetos de classes que sao diferentes, no
caso proposto neste trabalho, conseguir diferenciar as especies de plantas, e procurar minimizar
as diferencas encontradas dentro da propria especie de objetos.
Os extratores utilizados consideraram a cor e a forma da imagem. A descricao pela forma
adquiriu informacoes, atraves do contorno segmentado do objeto, utilizando propriedades dos
grafos e redes complexas, sendo invariante a translacao, escala e rotacao. Ja a descricao pela cor
auxiliou na descricao do objeto atraves da obtencao do histograma da imagem colorida, sendo
relevante para este descritor a intensidade dos pixels da imagem.
Neste captulo sao detalhados os extratores utilizados na obtencao dos resultados apresenta-
dos neste trabalho no auxlio da identificacao de plantas.

2.1 Extrator baseado no histograma de imagens coloridas

A cor e uma das caractersticas mais utilizadas para o reconhecimento e discriminacao pela
visao humana. A abordagem da extracao de caractersticas pelo histograma da imagem e sim-
ples e tambem muito eficiente.
Para o entendimento do extrator de cor utilizado e necessario o entendimento do sistema
RGB, assim como a formacao de seu histograma.
19

2.1.1 Sistema RGB - Red, Green, Blue

Quando se trata de cor e interessante uma avaliacao de como funciona o campo de visao
humano, pois isso reflete em sua representacao.
No olho humano, em sua retina, existem dois sensores: os cones e o bastonetes; atraves
dos cones e possvel a percepcao das cores e atraves dos bastonetes os tons de cinza. A visao
humana e baseada em tres componentes de cor: vermelho (red), verde (green) e azul (blue).
Um fator importante para o entendimento da cor e a luz. A luz, ou luz visvel, refere-se as
ondas eletromagneticas visveis ao olho humano que estao includas nos comprimentos de onda
de 380 nanometros, definido como violeta, a 780 nanometros, representando a cor vermelha. A
luz esta intimamente ligada ao conceito de cor (ROCHA, 2011).
No seculo XVII, Isaac Newton, atraves de experiencias realizadas com prismas, descobriu
que a luz branca e decomposta em sete cores: vermelho, laranja, amarelo, verde, azul claro,
azul escuro e violeta. Realizando outro experimento, a fim de recompor a luz branca, verificou
que eram necessarias apenas tres cores: o vermelho, verde e azul. Newton nao sabia na epoca,
mas para obtencao da cor branca seria necessaria uma proporcao de 30% de vermelho, 59% de
verde e 11% de azul (ROCHA, 2011).
O sistema RGB, Red, Green e Blue (do ingles vermelho, verde e azul), tambem e conhecido
como sistema Cor-Luz, e trabalha com a adicao de cores, pois somando-se as cores basicas,
nas proporcoes vistas, e possvel obter a cor branca. Este sistema e normalmente empregado
em fotografias, cinema, televisao e para representacao de imagens digitais, isto acontece pela
compatibilidade com a exibicao de imagens por um computador (KOUR, 2015).
Na Figura 2.1 e vista a representacao do modelo RGB por crculos cromaticos.

Figura 2.1: Crculos cromaticos do sistema RGB. Fonte: Retirado de ROCHA (2011).

O sistema RGB na representacao computacional reside na sobreposicao de tres matrizes,


20

Figura 2.2, cada uma sendo um plano independente. A formacao de outras cores e possvel
modificando a intensidade do pixel de cada plano de cor, ou seja, modificando a quantidade
de vermelho, verde e azul que determinado pixel possuira.

Figura 2.2: Estrutura de uma imagem RGB. Fonte: Retirado de Gonzalez, Woods e Eddins (2009).

2.1.2 Histograma de uma imagem colorida

O histograma e seus conceitos basicos foram vistos na Secao 1.1.3 do captulo 1. Ressalta-se
neste topico como o histograma e realizado em imagens coloridas.
Como visto anteriormente, a imagem digital colorida se decompoe em tres planos ou di-
mensoes, aqui sera denominado pelos seguintes: plano vermelho, plano verde e plano azul.
Cada qual possui uma capacidade de armazenamento por pixel de 8 bits, pois a faixa varia en-
tre 0, sendo mais escuro, e 256, mais claro, fornecendo um aspecto de nveis de cinza de uma
imagem.
Dada uma imagem de folha colorida. Sua decomposicao sera realizada em tres planos,
conforme a Figura 2.3 demonstra.
O histograma da imagem colorida presente na Figura 2.3, pode ser visto na Figura 2.4. Os
planos vermelho, verde e azul foram sobrepostos em um unico histograma, representados pelas
cores correspondentes. A extensao horizontal se refere aos nveis de cinza (valores entre 0 e
256), enquanto a extensao vertical corresponde a quantidade de pixels (valores entre 0 e 1000).
Observa-se entao a disposicao dos pixels nos nveis de cinza de cada plano.

2.2 Extrator baseado em grafos e redes complexas

Quando se fala em teoria dos grafos e redes complexas muitos ja associam as redes de
internet, comunicacao ou redes sociais, por exemplo, porem e importante salientar que estes
21

(a) (b)

(c) (d)
Figura 2.3: Exemplo de decomposicao de imagem colorida em planos: (a) Imagem original; (b) Plano ver-
melho (c) Plano verde; (d) Plano azul. Fonte: Elaborado pelo autor.

Figura 2.4: Histogramas dos planos sobrepostos. Fonte: Elaborado pelo autor.

estao presentes em diversas areas de pesquisa: economia, ciencias sociais, biologia, logstica
dentre outras. A termologia das redes complexas que sao utilizadas para descrever as redes
de cada area de pesquisa sao basicamente as mesmas, auxiliando a compreensao por membros
de diferentes comunidades. As terminologias comuns e a forte semelhanca das redes pelas
diferentes disciplinas tem sido um instrumento importante para o crescimento do estudo das
redes complexas (STEEN, 2010).
O entendimento apropriado de redes complexas requer o estudo de algumas outras ferra-
mentas. Muitos dos conceitos absorvidos vem de um campo matematico denominado teoria
dos grafos (STEEN, 2010). Na Secao 2.2.1, a seguir, sao descritos os elementos basicos dos
grafos e suas caractersticas a fim de se obter uma visao mais apropriada das redes modernas.
Os atributos das redes complexas foram utilizados neste trabalho para a extracao de carac-
tersticas dentro da base de imagens de folhas, apos realizada a devida segmentacao, por esta
22

razao se fez necessario o estudo aprofundado destas redes. Ja a teoria dos grafos vem a ser a
base para o estudo de redes complexas.

2.2.1 Teoria dos grafos

A teoria dos grafos e uma area da matematica discreta que estuda objetos combinatorios
- grafos - que sao um bom modelo para muitos problemas em ramos da matematica, da in-
formatica e da industria. Muitos dos problemas sobre grafos tornaram-se celebres porque sao
um interessante desafio intelectual e tem importantes aplicacoes (FEOFILOFF; KOHAYAKAWA;
WAKABAYASHI, 2009).
Existem varios tipos de grafos e muitas caractersticas a serem apresentadas. Este trabalho
ira explicitar as mais relevantes e que servirao como base para o estudo de redes complexas, da
Secao posterior, que foram extradas de (RUSS, 2011), porem, mais detalhes podem ser vistos
em (DIESTEL, 2006) e em (FEOFILOFF; KOHAYAKAWA; WAKABAYASHI, 2009).

Grafos

Um grafo G = (V,E) consiste em dois conjuntos: V e E. Os elementos de V sao chamados


de vertices (ou nos). Os elementos de E sao chamados arestas. Cada aresta tem um conjunto
de um ou dois vertices associados a ele, na qual sao denominadas pontos finais (endpoints no
ingles). Uma aresta e a juncao entre dois pontos finais (HARARY, 2015).
Seguem algumas terminologias basicas aplicadas aos grafos:
Incidencia: Se um vertice v e a ponta de uma aresta e, entao v e dito incidente em e, e e e
dito incidente em v.
Adjacencia: Um vertice u e adjacente a um vertice v se eles estiverem ligados por uma
aresta.
Vizinhanca: Dois vertices adjacentes podem ser denominados vizinhos.
Arestas adjacentes: Sao duas arestas que possuem um ponto final em comum.
Dgrafo: E um grafo na qual suas arestas sao direcionadas, ou seja, existe uma orientacao
que mostra de onde esta partindo, denominado vertice divergente e, para onde esta indo, cha-
mado vertice convergente.
Grau: Nos grafos sem orientacao sao representados pelo correspondente numero de vertices
adjacentes do determinado vertice. Ja nos grafos orientados, ou dgrafos, existe a divisao de
grau em: entrada e sada. O grau de entrada de um vertice v e o numero de arestas que sao con-
23

vergentes a v e; o grau de sada deste mesmo vertice v e o numero de arestas que sao divergentes
de v.
Caminho: O caminho entre dois vertices e a sequencia de vertices e arestas que os unem.
Matriz de Adjacencia: Seja A = [aij ] uma matriz n x n, onde n e o numero de nos de um
grafo G = (V , E ) qualquer. A matriz de adjacencia A e construda da seguinte forma:

1, se i e j f orem conectados
A(x, y) = (2.1)
0, caso contrario

Uma matriz de adjacencia pode ser vista como mostra o exemplo da Figura 2.5. Ela e
responsavel por guardar informacoes sobre a adjacencia entre dois vertices, como neste caso
a rede nao possui peso, quando existir a adjacencia esta sera representada pelo valor 1 e, caso
contrario, 0.

(a) (b)
Figura 2.5: (a) um exemplo de grafo e (b) sua matriz de adjacencia correspondente. Fonte: Elaborado pelo
autor.

Grafos regulares: O modelo de grafos regulares, tambem denominados redes regulares,


por sua estrutura, serve de base para a construcao de diversos modelos de redes complexas, que
serao vistos na Secao 2.2.3. Neste modelo todos os vertices tem o mesmo numero de arestas,
ou seja, tem o mesmo grau k.
Neste modelo, constroi-se um anel de N vertices, cada um ligado a seus k vizinhos mais
proximos por arestas sem direcao. A Figura 2.6 apresenta um exemplo de grafo regular:
24

Figura 2.6: Exemplo de um grafo regular. Fonte: Retirado de Casanova, Backes e Bruno (2013).

2.2.2 Redes complexas

Uma rede e um conjunto de itens, que podem ser denominados vertices ou nos, com co-
nexoes entre eles, chamados de arestas. Sistemas sao modelados em forma de redes, que
tambem sao denominados grafos na literatura matematica, como exemplos, podem ser citadas:
a internet, as redes sociais, as redes neurais e varios outros (COHEN; HAVLIN, 2010).
De fato, na teoria das redes sao utilizados conceitos da teoria dos grafos, porem em redes
complexas, alem da teoria dos grafos, geralmente sao utilizados metodos da estatstica para
se caracterizar a estrutura de conexoes da rede e/ou sao empregados ferramentas e metodos da
mecanica estatstica para criar modelos e analisar a estrutura e a dinamica das redes (CASANOVA;
BACKES; BRUNO, 2013).
As redes complexas tiveram seu maior avanco e contribuicao atraves dos trabalhos reali-
dados por Erdos e Renyi (1960), Milgram (1967), Watts e Strogatz (1998) e Barabasi e Al-
bert (1999). Erdos e Renyi comecaram o estudo em 1960 sobre grafos aleatorios e, atraves
de metodos probabilsticos, estudaram as propriedades dos grafos em funcao do crescimento
e ligacao entre os vertices. Ja em 1998, foi realizado por Watts e Strogatz uma descoberta a
partir do estudo realizado por Milgram de 1967, que consistia em enviar cartas aleatoriamente
entre cidadaos americanos e verificar apos quantas pessoas a carta chegaria ao destinatario, foi
verificado entao que, em media, a carta passava por seis pessoas antes de chegar ao destino.
Tal resultado ficou conhecido como seis graus de separacao ou efeito pequeno-mundo. Um ano
mais tarde, em 1999, Barabasi e Albert propuseram, atraves de um artigo, um modelo generico
de construcao de redes, chamadas de redes livre de escala (BARABaSI; ALBERT, 1999) (CASA-
NOVA; BACKES; BRUNO, 2013).
A importancia das redes complexas para este trabalho foi sua utilizacao para extracao de
caractersticas por medidas estatsticas. Tais caractersticas serao apresentadas, assim como os
25

vetores resultantes da extracao destas, na Secao 3.2.4. A seguir serao explicitados os modelos
mais relevantes dentro das redes complexas.

2.2.3 Modelos de redes complexas

Uma rede formada por um conjunto de vertices e arestas e apenas um exemplo basico de
rede, pois existem muitos exemplos de redes mais complexas que isto. Como exemplo, podem
existir vertices e arestas diferentes, sendo que estes podem possuir variadas caractersticas e
propriedades associadas a eles (COHEN; HAVLIN, 2010).
Diversos modelos sao propostos na literatura, os apresentados neste trabalho sao: redes
aleatorias, redes de pequeno-mundo e redes livre de escala.

Redes aleatorias

O modelo randomico de rede, ou rede aleaoria, pode ser considerado como o modelo mais
basico de rede complexa. O estudo sistematico das redes aleatorias iniciou-se com Erdos and
Renyi (ERDOS; ReNYI, 1960) com a proposta inicial de estudar, atraves de metodos proba-
bilsticos, as propriedades dos grafos como uma funcao como o aumento das conexoes aleatorias.
O termo rede aleatoria se refere a natureza desordenada do arranjo entre as ligacoes dos dife-
rentes vertices (BOCCALETTI et al., 2006).
A rede aleatoria e definida pelo numero de vertices N e a probabilidade p de uma aresta
existir entre dois vertices. Logo, o grau esperado para cada vertice, (k), e determinado pela
seguinte equacao (BACKES, 2010):

(k ) = p(N 1). (2.2)

A medida que o tamanho da rede aumenta (N ), (k) diverge se o valor de p for fixo.
Ao inves disso, p e escolhido como uma funcao de N de modo a manter (k) fixa: p = (k)/(N-1).
A probabilidade de um vertice escolhido aleatoriamente possuir grau k e binomial (BACKES,
2010):

N 1
P (k ) = p k (1 p)N 1k . (2.3)
k
26

Para N grande e (k) fixo, a distribuicao acaba se aproximando da distribuicao de Poisson,


com o valor da media igual a (k) (BACKES, 2010):

(k )k expk
P (k )
= . (2.4)
k!

(a) (b)
Figura 2.7: (a) Exemplo de rede aleatoria e (b) distribuicao de grau. Fonte: Retirado de Backes (2010).

Redes de pequeno-mundo

Foi a partir do experimento do sociologo Stanley Milgram (MILGRAM, 1967), durante a


decada de 60, que foi possvel analisar o grau de separacao entre as pessoas. Este experimento
era condicionado a enviar uma quantidade de cartas a varios indivduos, aleatoriamente, so-
licitando o envio da carta para o destino especificado. Caso nao tivessem conhecimento do
destinatario, deveriam repassar a carta a quem acreditassem estar mais proximo. O resultado
avaliado foi que muitas das cartas haviam passado por um pequeno numero de pessoas antes de
chegar ao destino. Isto pode demonstrar que estas pessoas estavam a poucos graus de separacao
umas das outras, este efeito foi denominado como pequeno-mundo (BARBOSA, 2009).
A rede de pequeno-mundo (small-world network em ingles) foi proposta por Watts e Stro-
gatz (1998), como o nome indica, este modelo apresenta a propriedade de pequeno-mundo, ou
seja, todos os vertices podem ser alcancados por qualquer outro atraves de um numero pequeno
de arestas e apresentam um numero alto de lacos com tamanho tres, existe um alto coeficiente de
aglomeracao (CASANOVA; BACKES; BRUNO, 2013). Por exemplo, em uma rede de amizades, se
B e C sao amigos de A, existe uma grande probabilidade de B e C tambem serem amigos (COSTA
et al., 2007).
27

Para se construir uma rede de pequeno-mundo, deve-se comecar com um grafo regular
de N vertices, e cada um destes vertices e conectado aos k vizinhos mais proximos em cada
direcao, totalizando 2k conexoes, onde N >> k >> log(N ) >> 1. Apos, cada vertice e
redistribudo aleatoriamente com probabilidade p. Quando p = 0 tem-se um grafo regular, ja
quando p = 1 tem-se um grafo aleatorio. Quando se atribui a p um valor intermediario, tem-se
a formacao de uma rede com caminho pequeno medio e alto coeficiente de aglomeracao (COSTA
et al., 2007) (CASANOVA; BACKES; BRUNO, 2013).
A Figura 2.8, a seguir, mostra um exemplo de rede de pequeno-mundo e sua respectiva
distribuicao de grau:

(a) (b)
Figura 2.8: (a) Exemplo de rede de pequeno mundo e (b) distribuicao de grau. Fonte: Retirado de Backes
(2010).

Redes livres de escala

Redes com leis de potencia de distribuicao de grau tem sido o foco de muita atencao na
literatura atual. Estas sao denominadas como redes livre de escala (COHEN; HAVLIN, 2010),
propostas inicialmente por (BARABASI; BONABEAU, 2003).
Este tipo de rede possui alguns vertices altamente conectados enquanto os demais possuem
poucas conexoes. A sua distribuicao de grau segue a lei da potencia (CASANOVA; BACKES;
BRUNO, 2013):

P (k ) k . (2.5)

sendo k>0 e >0. O smbolo e denominado expoente de livre escala e determina a probabi-
28

lidade de P(k) da ocorrencia de nodos com grau k na rede.


A rede livre de escala e criada inicialmente com m0 vertices, e a cada passo de tempo, um
vertice com um numero m de arestas e adicionado a rede. Essas arestas se conectam preferen-
cialmente aos vertices da rede de maior grau, uma vez que os vertices de maior grau possuem
uma grande probabilidade de receber novas arestas (CASANOVA; BACKES; BRUNO, 2013).
A Figura 2.9 apresenta um exemplo de uma rede livre de escala e sua respectiva distribuicao
de grau:

(a) (b)
Figura 2.9: (a) Exemplo de rede livre de escala e (b) distribuicao de grau. Fonte: Retirado de Backes (2010).

2.2.4 Medidas das redes complexas

Existem diversos tipos de topologias de redes complexas, cada uma com sua modelagem e
mecanismos. Diversas medidas tem sido propostas para que se possa quantificar a estrutura das
ligacoes. A partir destas medidas e que elas podem ser analisadas, caracterizadas e classificadas.
A Figura 2.10 apresenta um exemplo (CASANOVA; BACKES; BRUNO, 2013).

Figura 2.10: Caracterizacao de redes complexas. Fonte: Retirado de Casanova, Backes e Bruno (2013).

As medidas representadas a seguir foram as utilizadas neste trabalho, extradas do trabalho


realizado por Backes, Casanova e Bruno (2009), porem existem outras que podem ser vistas
29

atraves dos trabalhos de Casanova, Backes e Bruno (2013), Cohen e Havlin (2010) e Costa et
al. (2007). Ressalta-se que estas medidas sao expressas para grafos nao-orientados.

Grau

O grau ou (ou conectividade) ki de um vertice e o numero de arestas diretamente conectadas


ao vertice, e e definido em termos de matriz de adjacencia A como:

N
X
ki = aij . (2.6)
j =1

onde N e o numero de vertices da rede e aij sao os valores da matriz de adjacencia A.


O grau e uma caracterstica importante, pois baseado no grau dos vertices, caractersticas
podem ser extradas de uma rede, duas das caractersticas mais simples sao o grau maximo:

kk = max(ki ). (2.7)

e o grau medio:

N
1 X
k = ki . (2.8)
N i=1

Juncao

Outra caracterstica interessante e encontrar a correlacao entre os graus de diferentes vertices.


A escolha mais comum e encontrar a correlacao entre dois vertices conectados por uma aresta.
Esta correlacao pode ser expressa por meio da juncao de distribuicao de grau P(ki , k 0 )i , i.e., a
probabilidade de existir uma aresta conectando um vertice i, com grau ki a outro vertice da rede,
com grau k. Em outras palavras, P(ki , k 0 )i mostra a probabilidade do vertice i ter um vizinho
com o mesmo grau.
Existem varias medidas que podem ser retiradas analisando a distribuicao de probabilidade,
como a entropia, energia e juncao de grau medio.
30

A entropia pode ser definida como:

N
X
H = P (ki , k 0 )i log2 P (ki , k 0 )i (2.9)
i=1

A energia do sistema e definida por:

N
X
E = (P (ki , k 0 )i )2 (2.10)
i=1

E a juncao de distribuicao de grau, que e a probabilidade de encontrar dois vertices ar-


bitrarios na rede com o mesmo grau, e definida por:

N
1 X
P= P (ki , k 0 )i (2.11)
N i=1

Evolucao dinamica

A evolucao dinamica e outra caracterstica importante. Na evolucao dinamica e realizada


uma analise em funcao do tempo e nao apenas de pontos isolados no espaco. Esta caracterstica
e importante pois demonstra a evolucao de certas caractersticas como forma de analisar e clas-
sificar redes.
A evolucao dinamica utiliza, neste caso, o crescimento do limiar, que e o valor a ser utilizado
como base para incio, para observar as caractersticas de grau e juncao e seus respectivos
valores ao longo do tempo.

2.3 Consideracoes Finais

Neste captulo foram descritos os extratores utilizados neste trabalho: baseado no histo-
grama de uma imagem colorida e em metricas extrados a partir de grafos e redes complexas.
No captulo 3 sera apresentada a metodologia realizada neste trabalho, com informacoes
referentes aos materiais, bases de dados e metodos desenvolvidos.
31

3 METODOS DESENVOLVIDOS

Neste captulo e apresentada a metodologia usada para extrair as caractersticas das folhas
presentes nas bases utilizadas, baseados nos metodos descritos no captulo 2. Sao apresentados
nas secoes seguintes: os materiais: equipamentos, softwares e bases de imagens utilizados
(Secao 3.1); e, o desenvolvimento dos metodos de extracao de caractersticas (Secao 3.2).

3.1 Materiais utilizados

3.1.1 Equipamentos e softwares

Para o desenvolvimento deste trabalho foi utilizado um computador com sistema opera-
cional Windows 8.1, 64 bits, processador Intel(R) Core(TM) i5, 2.6 Ghz. A implementacao
ocorreu atraves do software MATLAB versao R2013B, com licenca fornecida pela Fundacao
Universidade Federal de Rondonia e, todo o segmento de classificacao e validacao foi realizado
pelo software livre WEKA1 versao 3.6.11.

Software MATLAB

O software MATLAB e definido, segundo o proprio site2 , como um sistema utilizado para
o aprendizado de maquinas, processamento de imagens, processamento de sinais, visao com-
putacional, robotica entre outros. A plataforma deste software e otimizada para resolucao de
problemas cientficos e de engenharia. A linguagem MATLAB possui facilidade para lidar com
a matematica computacional, ajudando no trabalho com matrizes, que e a forma como as ima-
gens sao tratadas. Ele possui uma variedade de ferramentas ja construdas que possibilitam a
rapida construcao de algoritmos.

Software WEKA

O software WEKA e um software gratuto que possui licenca GNU3 e foi utilizado neste
trabalho para a realizacao da classificacao e validacao dos dados obtidos com a implementacao.
1
Site: http://www.cs.waikato.ac.nz/ml/weka/
2
http://www.mathworks.com/products/matlab/
3
A GNU - General Public License (Licenca Publica Geral) e uma licenca livre para software e outros tipos de
trabalhos.
32

Do software utilizou-se o classificador k-vizinhos mais proximos, identificado na ferramenta


como IBK e, realizam-se testes de validacao com a tecnica Holdout. Este software apresenta
os resultados com base em porcentagens de acertos e erros, alem disso, disponibiliza para a
visualizacao a matriz de confusao.

3.1.2 Base de dados

A base de dados utilizada e denominada MEW (Middle European Woods), sendo composta
por folhas nativas da regiao da Republica Checa. A versao utilizada neste trabalho, possui um
total de 200 especies, contendo entre 100 e 268 imagens de folhas distintas por cada especie,
totalizando 20758 imagens. Esta base e disponibilizada para download no referido site4 , pos-
suindo permissao para sua utilizacao com finalidade educativa. A resolucao das imagens e de
300 dpi com dimensoes variadas. Todas as imagens estao centralizadas e dispostas em um fundo
branco.

Primeira base de imagens

Das especies presentes na base MEW, foram selecionadas 23 especies para a efetuacao de
testes nesta primeira base.
Na Figura 3.1 e posvel visualizar um exemplo das especies escolhidas.

Figura 3.1: Observando a imagem de cima para baixo e da esquerda para a direita, de acordo com as
especificacoes fornecidas pela MEW: Acer negundo, Acer palmatum, Acer pensylvanicum, Acer
platanoides, Acer pseudoplantanus, Acer saccharinum, Aesculus glabra, Amelanchier canaden-
sis, Betula alleghaniensis, Betula nigra, Betula populifolia, Carpinus betulus, Carpinus carolini-
ana, Castanea dentata, Cornus florida, Fagus grandfolia, Liriodendron tulipifera, Magnolia ma-
crophylla, Platanus ocidentallis, Quercus montana, Tilia americana, Ulmus pumila e Zelkova ser-
rata. Fonte: Elaborado pelo autor.

4
MEW 2014 - Base de dados de folhas, Instituto de Informacao Teoria e Automacao CAS, Praga, Republica
Checa, http://zoi.utia.cas.cz/tree leaves
33

Segunda base de imagens

Foi organizada uma segunda base de imagens, como e mostrado na Figura 3.2, um sub-
grupo, contendo as 10 classes dentre as 23, levando em consideracao parametros subjetivos de
semelhanca de forma escolhidos pelo autor. Alem disso, foram utilizadas apenas 30 das 60 ima-
gens disponveis por classe. Isto foi feito para avaliar a capacidade dos vetores de caractersticas
gerados caracterizarem imagens com semelhancas de forma.

Figura 3.2: Observando a imagem de cima para baixo e da esquerda para a direita, de acordo com as
especificacoes fornecidas pela MEW: Amelanchier canadensis, Betula alleghaniensis, Betula ni-
gra, Carpinus betulus, Carpinus caroliniana, Castanea dentata, Cornus florida, Fagus grandfolia,
Ulmus pumila e Zelkova serrata. Fonte: Elaborado pelo autor.

3.2 Metodos

Para que o objetivo proposto por este trabalho fosse alcancado, fez-se necessaria a realizacao
de diversas tarefas que estao definidas na Figura 3.3.

Figura 3.3: Fluxo de tarefas realizadas. Fonte: Elaborado pelo autor.


34

Cada etapa, da Figura 3.3, esta definida com uma numeracao, que corresponde a sua respec-
tiva Secao neste trabalho. Sendo, entao:

3.2.1: Escolha e organizacao das bases de imagens;

3.2.2: Ajuste manual da base de imagens;

3.2.3: Segmentacao e pos-processamento;

3.2.4.1: Extracao de caractersticas por meio de histogramas de imagens coloridas;

3.2.4.2: Extracao de caractersticas por meio de redes complexas;

3.2.4.3: Criacao do vetor completo e,

3.2.5: Classificacao.

Na apresentacao de cada etapa sao descritas as informacoes sobre a realizacao da referida


etapa, seus pseudo-codigos (nas etapas que se fizeram necessarias), ferramentas e softwares,
que foram utilizados.

3.2.1 Escolha e organizacao das bases de imagens

Das 200 especies disponveis dentro da base MEW, 23 foram utilizadas para a realizacao
deste trabalho. A base disponibilizada possuia dois conjuntos de imagens de uma mesma fo-
lha com disposicoes de luminosidade diferentes, uma com a luz incidindo por cima e outra
por baixo, verificou-se que as imagens obtidas com a iluminacao advinda de baixo da folha
proporcionavam informacoes mais relevantes para este trabalho, por esta razao estas foram se-
lecionadas. Nao existe, no entanto, informacoes descritas, no site, da luminosidade, nem de
aparelhos que foram usados para a obtencao da imagem digital.
Os trabalhos realizados por Mouine, Yahiaoui e Verroust-Blondet (2012), Pham et al. (2013)
e Suk, Flusser e Novotny (2013) tambem utilizaram esta base de imagens para ajudar na
identificacao de especies de plantas.

3.2.2 Ajuste manual da base de imagens

No primeiro momento, para ajuste da base de imagens, foi realizada uma segmentacao to-
talmente manual nas imagens contidas na base de imagem, visto que na imagem outros objetos
35

tambem estavam presentes (reguas, paleta de cores, etc). Assim, estes elementos foram remo-
vidos, restando apenas a regiao de interesse, a folha, e, o fundo, sendo este formado em sua
maioria pela cor branca.

3.2.3 Segmentacao e pos-processamento

Apos a realizacao da segmentacao manual, a imagem passou por algumas transformacoes,


desta vez atraves de processamento pelo software MATLAB. As imagens foram binarizadas
para que o extrator de caractersticas de redes complexas pudesse utiliza-la, porem as imagens
coloridas tambem foram preservadas.
Na etapa de segmentacao foi utilizada a limiarizacao. O valor do limiar foi definido atraves
da analise empirca realizada na base de imagens, escolhendo, entao, um valor que poderia ser
utilizado pelas diversas classes e, que proporcionaria melhor distincao entre regiao de interesse
e fundo, de maneira geral.
No processo de pos-segmentacao foram utilizadas tecnicas de morfologia matematica. A
abertura, que utiliza as operacoes de erosao e dilatacao, respectivamente, foi utilizada para
eliminacao de areas que nao estavam conectadas com a folha, para isso, determinou-se, atraves
de testes iniciais empricos, que valores menores que 1000 pixels conectados, atraves da 4-
vizinhanca, seriam eliminados. O preenchimento de regiao, processo que se baseia na tecnica
de dilatacao, tambem foi utilizado para auxiliar na correcao de pequenas areas danificadas das
folhas, preenchendo, assim, areas vazias que possuiam um contorno. Esta tecnica foi reali-
zada com a ajuda de um elemento estruturante 3x3 de 4-vizinhanca, que pode ser visto na
Figura 3.4.

Figura 3.4: Elemento estruturante utilizado no preenchimento de regiao. Fonte: Elaborado pelo autor.

Por fim, as imagens foram redimensionadas (possundo 250 pixels de altura e largura pro-
porcional), objetivando a padronizacao, e, melhor desempenho na realizacao de tarefas compu-
tacionais. O algoritmo da segmentacao e pos-processamento e apresentado a seguir.
36

Algoritmo 1 S EGMENTAC AO E P OS - PROCESSAMENTO


Entrada: Imagem colorida
Sada: Imagem binarizada e redimensionada
1 Realizacao da binarizacao da imagem atraves do limiar informado.
2 Utilizacao das tecnicas de abertura e preenchimento de regiao, para a remocao de regioes de
nao-interesse e correcao de possveis areas danificadas.
3 Redimensionamento da imagem para fins computacionais e de padronizacao.

3.2.4 Extracao de caractersticas e criacao do vetor completo

A extracao de caractersticas foi realizada em dois segmentos. O primeiro teve por finali-
dade extrair caractersticas obtidas de histogramas de imagens digitais coloridas; e, o segundo
realizou a extracao de caractersticas da forma das imagens, utilizando o contorno obtido atraves
da deteccao de bordas.
Os processos de extracao e de criacao do vetor completo de caractersticas foram realizados
atraves do software MATLAB e os respectivos algoritmos serao apresentados a seguir.

1. Extracao de caractersticas por meio de histogramas de imagens coloridas

Nesta etapa, a imagem digital colorida foi decomposta em tres planos, vermelho, verde
e azul. Isto foi realizado porque, para cada plano, foi obtido um histograma (Equacao 1.2)
distinto, totalizando tres histogramas por imagem.
Apos a obtencao dos valores do histograma de cada plano, foi necessaria a criacao de um
vetor de caractersticas para o seu armazenamento. Neste vetor e feito o armazenamento dos
tres planos. Sendo y a quantidade de pixels de um determinado nvel de cinza, o vetor (V) do
histograma de cada plano tem a seguinte estrutura:

V =[y1 , ..., y256 ].

O descritor da imagem colorida Vrgb , e formado, entao, pela concatenacao dos vetores dos
planos vermelho, verde e azul, totalizando, entao, um vetor com 768 atributos.

Vrgb =[Vvermelho , Vverde , Vazul ].

O algoritmo desta etapa pode ser visto a seguir.


37

Algoritmo 2 E XTRAC AO DE CARACTER ISTICAS POR MEIO DE HISTOGRAMAS


Entrada: Imagem colorida
Sada: Vetor de caractersticas
1 Calculo do histograma para cada plano da imagem: vermelho, verde e azul.
2 Criacao dos vetor de caractersticas (descritor de imagem colorida) com a juncao dos histogra-
mas de todos os planos da imagem.

2. Extracao de caractersticas por meio de redes complexas

A metodologia apresentada nesta Secao foi baseada no trabalho realizado por Backes, Ca-
sanova e Bruno (2009).
Com a imagem ja binarizada, foi possvel detectar sua borda utilizando um filtro Laplaci-
ano, composto por uma matriz 3x3, que pode ser visualizada na Figura 3.5. Esta matriz tem
por finalidade calcular a intensidade de um determinado pixel, na imagem digital, em funcao
da intensidade de seus vizinhos. A matriz, entao, percorreu a imagem realizando operacoes
matematicas e, desta forma, definindo o contorno da area de interesse.

Figura 3.5: Filtro Laplaciano utilizado. Fonte: Elaborado pelo autor.

Apos a definicao do contorno, criou-se um grafo regular. Este grafo regular foi criado
verificando-se a distancia Euclidiana de cada um dos pixels do contorno em relacao aos demais.
A localizacao de um pixel pode ser entendida como a linha e coluna em que os pixels estao
localizados dentro da imagem digital. O grafo e, entao, normalizado. Esta normalizacao e feita
com a finalidade de reduzir a influencia do tamanho da rede nos descritores calculados.
O grafo foi submetido a evolucao dinamica (Secao 2.2.4). Na evolucao dinamica e realizada
uma transformacao no grafo, sendo que, apenas os vertices, ou pontos do contorno, que estao
proximos em certa distancia fazem parte da rede. A rede construda em cada avanco da evolucao
dinamica possui uma configuracao nova de conexoes. Cada configuracao de evolucao dinamica
sera denominada por este trabalho como tempo de limiar (Tl ). A Figura 3.6 apresenta uma
imagem binarizada, seu contorno e dois tempos de limiar distintos.
Em cada tempo de limiar (Tl ), metricas sao extradas da rede. Estas medidas , que estao
38

(a) (b)

(c) (d)

(e) (f)
Figura 3.6: (a) Imagem binarizada; (b) Contorno; (c) Rede criada com a ligacao de vertices com distancias
entre 0 e 0,1; (d) Ampliacao de (c); (e) Rede criada com a ligacao de vertices com distancias
entre 0 e 0,2; (f) Ampliacao de (e). Fonte: Elaborado pelo autor.

presentes na Secao 2.2.4, sao: grau maximo, grau medio, entropia, energia e grau medio de
juncao. Baseadas nestas medidas sao apresentados, a seguir, os vetores utilizados.

Descritor de grau

O vetor de caractersticas de grau e composto pelo grau maximo (kk , Equacao 2.7), e o grau
medio (k , Equacao 2.8), que sao extrados da rede complexa.
O vetor de caractersticas de grau e composto por apenas duas medidas k e kk em cada
tempo de limiar Tl , sendo representado como:

Vgrau =[kk (T0 ),k (T0 ),kk (T1 ),k (T1 ), ... ,kk (Tx ),k (Tx )].
39

Descritor de juncao de grau

O vetor de caractersticas de juncao e composto da entropia (H, Equacao 2.9), a energia (E,
Equacao 2.10) e o grau medio de juncao (P, Equacao 2.11). E composto, entao, pelas medidas
descritas em cada tempo de limiar Tl , sendo representado como:

Vjuncao de grau = [H(T0 ),E(T0 ),P (T0 ), H(T1 ),E(T1 ),P (T1 ), ... ,H(Tx ),E(Tx ),P (Tx )].

Descritor de grau e juncao

O descritor de grau e juncao e composto pela concatenacao dos dois primeiros descritores
anteriores. Portanto, o vetor de caractersticas e representado por:

Vgrau e juncao =[kk (T0 ),k (T0 )H(T0 ),E(T0 ),P (T0 ), kk (T1 ),k (T1 )H(T1 ),E(T1 ),P (T1 ), ...
,kk (Tx ),k (Tx )H(Tx ),E(Tx ),P (Tx )].

O algoritmo da extracao baseada na forma sera descrito a seguir.

Algoritmo 3 E XTRAC AO DE CARACTER ISTICAS POR MEIO DE REDES COMPLEXAS


Entrada: Imagem binarizada
Sada: Vetores de caractersticas
1 Localizacao do contorno da imagem atraves de filtro Laplaciano.
2 Criacao da matriz de distancias (grafo regular) a partir dos pontos do contorno.
3 Aplicacao da evolucao dinamica no grafo regular, formando, a cada tempo de limiar (Tl ), uma
nova rede.
4 Calculo das metricas: grau maximo, grau medio, entropia, energia e grau medio de juncao, na
rede.
5 Criacao dos vetores de caractersticas de grau, juncao de grau e, grau e juncao; com base nas
metricas obtidas.

3. Criacao do vetor completo

O vetor completo de caractersticas utilizado e uma justaposicao de dois extratores que


foram abordados neste trabalho: Vrgb e Vgrau e juncao . O resultado seria o vetor completo de carac-
tersticas (Vcompleto ), sendo composto por 833 atributos.
40

Vcompleto =[Vrgb , Vgrau e juncao ].

Este vetor, e, entao, salvo em um formato especfico a ser lido pelo software WEKA para
que este faca a classificacao (identificacao das especies de plantas).

3.2.5 Classificacao

A classificacao e a validacao foram realizadas pelo software WEKA. A classificacao foi


baseada no algoritmo de classificacao k-vizinhos mais proximos, denominado IBK pelo WEKA,
e as validacoes ocorreram pelo metodo Holdout, com treinamento variando em 50%, 75% e
90%. A matriz de confusao tambem foi utilizada, como ferramenta, para vericar, em mais
detalhes, alguns dos resultados aplicados na segunda base de imagens. As medidas utilizadas
para a analise sao referentes a taxas de acertos e erros, presentes nos resultados obtidos.

3.3 Consideracoes Finais

Neste captulo foi apresentada a metodologia necessaria para a extracao, classificacao e


avaliacao dos resultados nas bases de imagens de folhas. Alem disso, foram apresentados os
materiais e algoritmos utilizados na realizacao deste trabalho.
No captulo posterior serao apresentados os resultados obtidos atraves desta metodologia,
demonstrando se os descritores adotados neste projeto foram suficientes para resolver alguns
dos problemas propostos inicialmente.
41

4 EXPERIMENTOS, RESULTADOS E DISCUSSAO

Neste captulo sao apresentados os experimentos e resultados da aplicacao da metodologia


proposta neste trabalho em imagens de folhas.
Apos a formacao do vetor completo (Secao 3.2.4), foi possvel utilizar o software WEKA
para a realizacao da classificacao e, entao, em seguida, aplicar as tecnicas de validacao (Secao 1.2.6)
verificando se a aplicacao dos metodos estudados de extracao de caractersticas obtiveram res-
postas positivas em sua finalidade de identificacao correta das especies de plantas.
A classificacao foi realizada com base no algoritmo K-NN (Secao 1.2.6), denominado IBK
pelo software WEKA, e as validacoes realizaram-se atraves da tecnica Holdout.
Os resultados foram divididos conforme os objetivos das bases escolhidas (Secao 3.1.2). A
primeira base, que contem 23 especies distintas, foi utilizada principalmente para se testar dife-
rentes metodos de extracao de forma e confronta-los com os resultados obtidos pelo extrator de
forma baseado em redes complexas; alem disso, testes com o extrator baseado no histograma de
imagens coloridas tambem foram feitos. Ja na segunda base, que contem 10 especies de folhas,
foram realizados experimentos para analisar a capacidade do extrator de cor de suplementar
os resultados do extrator de forma, visto que estas 10 especies possuem formas semelhantes.
Supoe-se, entao, que por este fator de semelhanca, a utilizacao apenas do extrator de forma, na
segunda base, nao seria suficiente para obter bons resultados.
A apresentacao dos resultados foi dividida em duas partes. A primeira trara aos resultados
extrados da primeira base de imagens e, a segunda parte os resultados obtidos da segunda base,
sendo observadas as particularidades vistas anteriormente.
Os resultados serao mostrados ora por graficos ora por matriz de confusao (Secao 1.2.6). Por
simplicidade e convencao todos os graficos e tabelas deste captulo seguem a seguinte legenda
para suas respectivas cores:

A porcao em verde representa a taxa de acertos em porcentagem de plantas que foram


identificadas corretamente.

A porcao em vermelho representa a taxa de erros em porcentagem de plantas que foram


identificadas incorretamente.
42

4.0.1 Resultados obtidos da primeira base de imagens

Nesta base foram realizados testes comparativos entre o extrator baseado em redes comple-
xas e outros extratores de forma, que sao:

Momentos de Zernike: sao considerados descritores de forma baseados em regiao in-


variantes a transformacoes lineares e especialmente em funcao de deformacoes nas bor-
das do objeto. Estes estao sendo aplicados em uma vasta gama de aplicacoes de visao
computacional voltadas para o reconhecimento de padroes em duas e tres dimensoes e,
se mostram superiores em termos de sua robustez aos rudos apresentados na imagem,
rapida computacao e capacidade de apresentacao fiel da imagem (MAHI; ISABATEN; SE-
RIEF, 2014). Os momentos representam uma representacao estatstica dos dados da ima-
gem para o espaco de polinomios com duas variaveis, portanto o mapa do espaco de
caractersticas da imagem e linear. Assim sendo, normas Euclidianas podem ser utili-
zadas de forma eficaz como classificadores lineares. Para se computar os momentos de
uma dada imagem e necessario verificar o centro da massa do objeto (DORETTO; YAO,
2010). Ao se combinar momentos e possvel produzir momentos invariantes a rotacao,
translacao e escala do objeto. Este descritor utilizou 256 atributos.

Forma: utiliza funcoes basicas de descricoes baseadas em forma. Neste trabalho foram
utilizadas 11 caractersticas para construir o descritor Forma em funcao do objeto, sao
elas:

1. Area: retorna a area do objeto;

2. Eixo maior: retorna um escalar que especifica o comprimento, em pixels, do maior


eixo de uma elipse que possui os mesmos segundos momentos centrais de uma dada
regiao;

3. Eixo menor: assemelha-se ao maior eixo, porem, neste caso baseia-se no menor
eixo da elipse;

4. Excentricidade: retorna um escalar que especifica a excentricidade da elipse que


tem os mesmo segundos momentos da regiao. A excentricidade e a razao entre a
distancia dos focos da elipse e o seu comprimento do eixo principal;

5. Orientacao: retorna um escalar que especifica o angulo entre o eixo x e o eixo maior
da elipse que tem os mesmos segundos momentos da regiao;
43

6. Area convexa: retorna um escalar, que especifica o numero de pixels, em uma ma-
triz de elementos binarios, contendo o menor polgono convexo que pode conter a
regiao;

7. Area preenchida: retorna um escalar especificando o numero de pixels de uma ima-


gem binaria do tamanho de menor quadrado em que a imagem possa estar contida;

8. Numero Euler: retorna um escalar contendo o numero de objetos subtrando-se a


quantidade de buracos nestes objetos;

9. Solidez: retorna um escalar especificando a porcentagem dos pixels na area convexa


que tambem estao na regiao;

10. Extensao: retorna um escalar que especifica a proporcao de pixels na regiao de


pixels dentro da area delimitada;

11. Permetro: retorna o permetro do objeto.

As comparacoes realizadas foram validadas atraves da tecnica Holdout, com treinamento


variando em 50%, 75% e 90%.. Nos graficos da Figura 4.1 podem ser vistos os resultados desta
comparacao.

Figura 4.1: Comparativo atraves da tecnica Holdout, com taxa de treinamento de 50%, 75% e 90%. Fonte:
Elaborado pelo autor.

Na Figura 4.1 e notada a superioridade da taxa de acerto em identificar as especies de plan-


tas do extrator baseado em redes complexas sobre os demais. Verifica-se, tambem, que quanto
44

maior a taxa de treinamento, melhores serao os resultados obtidos, neste caso, o extrator estu-
dado neste trabalho obteve a porcentagem maxima de 75,4% de correta classificacao, enquanto
os extratores Momentos de Zernike e Forma conseguiram uma taxa de acerto maxima de 40,5%
e 40,8%, respectivamente. Com estes resultados, nota-se que, com relacao a primeira base de
imagens, o extrator estudado obtem bons resultados.
Observa-se que a taxa de erro visualizada no resultado de todos os extratores pode estar
diretamente vinculada ao fato da base abordada conter imagens com aspectos de forma seme-
lhantes. Na Figura 4.2 pode ser verificado um exemplo da semelhanca entre as especies Bettula
alleghaniensis e Bettula nigra, sendo a cor destas o maior diferencial.

(a) (b)
Figura 4.2: Comparativo entre as especies Bettula alleghaniensis e Bettula nigra. Fonte: Elaborado pelo
autor.

Visto que a coloracao da folha poderia auxiliar em sua identificacao, o extrator de cor
tambem foi testado e analisado, tanto isolado como juntamente ao extrator de forma, como
pode ser visto no grafico da Figura 4.3.

Figura 4.3: Comparativo entre os extratores de forma e cor e sua composicao na primeira base de imagens
utilizando a tecnica Holdout de validacao. Fonte: Elaborado pelo autor.

Analisando a 4.3 observa-se que os resultados do extrator baseado no histograma de ima-


gens coloridas foram otimos, revelando resultados de ate 90,5% com 90% de treinamento dos
45

dados. Isto mostra a eficicacia deste extrator na base selecionada. A uniao dos dois extrato-
res retornou uma margem de acerto de 94,9%, apresentando melhoria e, demontrando que esta
juncao certamente proporcionou benefcios para a classificacao correta de forma geral.

4.0.2 Resultados obtidos da segunda base de imagens

Como visto, anteriormente, os experimentos realizados na primeira base com o extrator


baseados em forma trouxeram bons resultados. Esta segunda base, por sua vez, tem a finalidade
de verificar a robustez dos extratores baseados em forma em especies com formas semelhantes
e, analisar, em sequencia, a capacidade do extrator baseado em cor.
Na Figura 4.4 e apresentado o resultado da aplicacao dos extratores baseados em forma e
cor na segunda base, validado pela tecnica Holdout.

Figura 4.4: Comparativo entre os extratores de forma e cor e sua composicao na segunda base de imagens
utilizando a tecnica Holdout de validacao. Fonte: Elaborado pelo autor.

Comprova-se que enquanto o extrator baseado na cor obtem bons resultados, aproximada-
mente 93% com 90% de treinamento, o baseado em redes complexas encara dificuldades em
distinguir as especies, conseguindo uma taxa de 55% tambem com 90% de treinamento dos
dados, ou seja, muitos erros de identificacao ocorreram e, isso pode ser melhor visto atraves da
matriz de confusao, apresentada na Tabela 4.1
Na matriz da Tabela 4.1 e posvel verificar que a classe que obteve a maior quantidade de
classificacoes incorretas (verifica-se pela linha da classe), atraves da marcacao em vermelho, foi
a classe b (betula alleghaniensis) com 5 classificacoes incorretas. Isto pode ter ocorrido pelo
fato desta classe possuir algumas folhas com variacoes dentro desta mesma especie, fazendo
46

Tabela 4.1: Matriz de confusao, aplicada na segunda base, utilizando o classificador K-NN, validacao Hol-
dout, com 90% de treinamento, e dados extrados pelo descritor de forma basedo em redes
complexas. Fonte: Elaborado pelo autor.

Classificado como
Classe real a b c d e f g h i j
a = Amelanchier canadensis 3 0 1 0 1 0 0 0 0 1
b = Betula alleghaniensis 0 2 1 0 0 1 0 3 0 0
c = Betula nigra 0 0 2 0 1 0 1 0 0 0
d = Carpinus betulus 1 0 1 2 0 0 0 0 0 2
e = Carpinus caroliniana 1 0 0 2 3 0 0 0 0 0
f = Castanea dentata 0 0 0 0 0 7 0 0 0 0
g = Cornus florida 0 0 0 0 0 0 4 0 0 1
h = Fagus grandfolia 0 1 0 0 0 0 1 1 0 0
i = Ulmus pumila 0 1 0 0 2 0 0 0 4 0
j = Zelkova serrata 0 1 0 0 1 0 1 0 1 5

com que estas diferencas aproximassem as caractersticas desta classe a outra distinta, sendo
classificada como tal.
Retornando a Figura 4.4 e confirmada a eficiencia do extrator baseado no histograma de
imagens coloridas aplicado a segunda base de folhas, visto que este juntamente com o extrator
de forma obtiveram uma taxa de aproximadamente 97% de acertos na classificacao com 90%
de treinamento dos dados por Holdout.
Os fatores determinantes a estes resultados estao ligados diretamente a diferenca entre a
coloracao e as pequenas variacoes da forma que os descritores conseguiram quantificar em
seus vetores. Os resultados, entao, se mostraram promissores, porem, mais testes deverao ser
realizados na tentativa de verificar a eficiencia do metodo desenvolvido na identificacao de
especies com aspectos tanto de forma como de cor semelhantes para de fato se ter um estudo
um pouco mais aprofundado dos extratores nestas situacoes. Apesar disto, o objetivo principal
deste trabalho foi alcancado, que aborda o estudo destes extratores nas bases de folhas com
finalidade de identifica-las.

4.1 Consideracoes Finais

Neste captulo foram apresentados os resultados dos experimentos realizados utilizando a


metodologia descrita no trabalho. Os resultados obtidos apos a classificacao e validacao ti-
veram um nvel de acerto elevado, demonstrando a robustez dos extratores estudados neste
trabalho. Os descritores baseados na forma da imagem tiveram algumas dificuldades para ex-
trair informacoes que diferenciassem os objetos, porem ainda assim obtiveram resultados satis-
47

fatorios. Ja o extrator baseado no histograma de imagens coloridas forneceu uma porcentagem


alta de acertos em todos os testes realizados provando ser um forte descritor. A uniao dos dois
extratores provou-se favoravel na identificacao correta das especies, podendo ser uma ferra-
menta util dentro de um sistema de visao computacional, auxiliando, desta forma, o trabalho do
especialista.
48

CONCLUSAO E RECOMENDACOES PARA TRABALHOS FUTUROS

O processamento de imagens tem se expandido e encontrado muitas areas de aplicacoes na


ultima decada, facilitando e diminuindo o tempo de trabalho em aplicacoes que exigem analise
de imagens. Alem do mais, as analises realizadas pelo computador sao mais precisas e menos
propensa a erros.
Neste trabalho foram aplicadas tecnicas de extracao de caractersticas em bases contendo
imagens de folhas de especies de plantas. Os extratores estudados buscaram quantificar informacoes
contidas na forma e na cor das imagens.
A metodologia apresentada neste trabalhou obteve resultados bem satisfatorios, resultando
em nveis de acertos excelentes que tenderam a aproximadamente 97% em um dos experimentos
realizados.

A. Principais Contribuicoes As principais contribuicoes deste trabalho foram:

Formulacao de uma metodologia envolvendo o tratamento, segmentacao, extracao de ca-


ractersticas e classificacao de uma imagem;

Estudo aprofundado dos extratores baseados em cor e forma da folha para correta identificacao
da especie;

Implementacao de algoritmos na ferramenta Matlab para a criacao dos extratores estuda-


dos.

B. Trabalhos Futuros Como extensao deste trabalho pode-se sugerir:

Aplicacao de outros tipos de extratores de caractersticas na imagem, como o de textura,


por exemplo.

Segmentacao das nervuras das folhas a fim de encontrar padroes determinantes para me-
lhoria na classificacao entre especimes de uma mesma especie de planta.
49

REFERENCIAS BIBLIOGRAFICAS

AMORIM, P. R. F. CODIGO DE VIZINHANAA APLICADO EM OPERADORES DE


MORFOLOGIA MATEMATICA. Tese (Trabalho de Graduacao), 2010.

BACKES, A. R. Estudos de metodos de analise de complexidade em imagens. Tese


(Doutorado), 2010.

BACKES, A. R.; CASANOVA, D.; BRUNO, O. M. A complex network-based approach for


boundary shape analysis. Pattern Recognition, v. 42, n. 1, p. 5467, 2009.

BARABASI, A.; BONABEAU, E. Scale-free netwroks. Scientific American, 2003.

BARABaSI, A.-L.; ALBERT, R. Emergence of scaling in random networks. science, v. 286,


n. 5439, p. 509512, 1999.

BARBOSA, N. Uma analise determinstica para os modelos epidemiologicos SIR e SEIR: uma
introducao do modelo SEIR-E via algoritmo estocastico e redes complexas. Tese (Doutorado),
2009.

BLOMBERG, L. C. Um algoritmo evolutivo para inducao de arvores de regressao robusto a


valores ausentes. Tese (Doutorado), 2014.

BOCCALETTI, S. et al. Complex networks: Structure and dynamics. Physics reports, v. 424,
n. 4, p. 175308, 2006.

CASANOVA, D.; BACKES, A. R.; BRUNO, O. M. Pattern recognition tool based on complex
network-based approach. Journal of Physics: Conference Series, v. 410, n. 1, p. 012048, 2013.

CHAKKARAVARTHY, S. S. et al. Automatic leaf vein feature extraction for first degree veins.
In: . Advances in Signal Processing and Intelligent Recognition Systems: Proceedings of
Second International Symposium on Signal Processing and Intelligent Recognition Systems
(SIRS-2015) December 16-19, 2015, Trivandrum, India. Cham: Springer International
Publishing, 2016. p. 581592.

COHEN, R.; HAVLIN, S. Complex networks: structure, robustness and function. [S.l.]:
Cambridge University Press, 2010.

COSTA, L. d. F. et al. Characterization of complex networks: A survey of measurements.


Advances in Physics, Vol. 56, n. No. 1, p. 167 242, 2007.

DEOKAR, A. et al. Plant disease identification using content based image retrieval techniques
based on android system. Plant Disease, v. 3, n. 2, 2016.

DIESTEL, R. Graph Theory. [S.l.]: Springer, 2006.

DORETTO, G.; YAO, Y. Region moments: Fast invariant descriptors for detecting small image
structures. In: . Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference
on. [S.l.]: IEEE, 2010. p. 30193026.

DUBEY, S. R.; JALAL, A. S. Adapted approach for fruit disease identification using images.
arXiv preprint arXiv:1405.4930, 2014.
50

ERDOS, P.; ReNYI, A. On the evolution of random graphs. Publ. Math. Inst. Hungar. Acad.
Sci, v. 5, p. 1761, 1960.

ESQUEF, I. A.; ALBUQUERQUE, M. P. d.; ALBUQUERQUE, M. P. d. Processamento


Digital de Imagens. 2003.

FEOFILOFF, P.; KOHAYAKAWA, Y.; WAKABAYASHI, Y. Uma Introducao Sucinta a Teoria


dos Grafos. 2009.

FILHO, O. e. M.; NETO, H. V. Processamento digital de imagens. [S.l.]: Brasport, 1999.

GOMES, O. d. F. M. Microscopia Co-Localizada: Novas Possibilidades na Caracterizacao de


Minerios. Tese (Doutorado), 2007.

GONZALEZ, R. C.; WOODS, R. E.; EDDINS, S. L. Digital image processing : using


MATLAB. [S. l.]: Gatesmark Publishing, 2009.

HARARY, F. A seminar on graph theory. [S.l.]: Courier Dover Publications, 2015.

HASIM, A.; HERDIYENI, Y.; DOUADY, S. Leaf shape recognition using centroid contour
distance. IOP Conference Series: Earth and Environmental Science, v. 31, 2016.

HAZRA, A. et al. Shape oriented feature selection for tomato plant identification. International
Journal of Computer Applications Technology and Research, v. 2, n. 4, p. 449454, 2013.

HIRJI, K. K. Discovering data mining: From concept to implementation. ACM SIGKDD


Explorations Newsletter, v. 1, n. 1, p. 4445, 1999.

IGNACIO, J. d. S. Processamento e analise digital de imagens em estudos da cinetica de


recristalizacao de ligas Al-Mg-X. Tese (Doutorado), 2015.

KADIR, A. et al. Leaf classification using shape, color, and texture features. arXiv preprint
arXiv:1401.4447, 2013.

KOOY, F. van der; SULLIVAN, S. E. The complexity of medicinal plants: The


traditional artemisia annua formulation, current status and future perspectives. Journal of
ethnopharmacology, v. 150, n. 1, p. 113, 2013.

KOUR, H. Analysis on image color model. Analysis, v. 4, n. 12, 2015.

LEE, K.-B.; HONG, K.-S. An implementation of leaf recognition system using leaf vein and
shape. International Journal of Bio-Science and Bio-Technology, v. 5, n. 2, p. 5766, 2013.

LUST, J. The Herb Book: The Most Complete Catalog of Herbs Ever Published. [S.l.]: Courier
Corporation, 2014.

MAHI, H.; ISABATEN, H.; SERIEF, C. Zernike moments and svm for shape classification in
very high resolution satellite images. 2014.

MEDEIROS, N. d. G.; SILVA, E. A. d.; NOGUEIRA, J. R. Segmentacao morfologica de


imagens utilizando o gradiente morfologico multi-escala. Revista Brasileira de Cartografia,
n. 54, 2002.

MILGRAM, S. The small world problem. Psychology today, v. 2, n. 1, p. 6067, 1967.


51

MOUINE, S.; YAHIAOUI, I.; VERROUST-BLONDET, A. Advanced shape context for


plant species identification using leaf image retrieval. In: . Proceedings of the 2nd ACM
international conference on multimedia retrieval. [S.l.]: ACM, 2012. p. 49.

NETA, S. A.; DUTRA, L. V.; ERTHAL, G. J. Limiarizacao automatica em histogramas


multimodais. Proceeedings of the 7th Brazilian Conference on Dynamics, Control and
Applications, FCT Unesp de Presidente Prudente, 2008.

PHAM, N.-H. et al. Computer aided plant identification system. In: . Computing,
Management and Telecommunications (ComManTel), 2013 International Conference on. [S.l.]:
IEEE, 2013. p. 134139.

RESENDE, D. C. O. D. et al. A influencia do elemento estruturante no processo de deteccao de


nuvens em imagens de sensoriamento remoto. Anais XVI Simposio Brasileiro de Sensoriamento
Remoto, 2013.

ROCHA, J. Cor luz, cor pigmento e os sistemas RGB e CMY. [S.l.]: Revista Belas Artes, 2011.

RUSS, J. The Image Processing Handbook, Sixth Edition. [S.l.]: CRC Press, 2011.

SIMIONATO, A. C. Representacao, acesso, uso e reuso da imagem digital. 2012.

STEEN, M. V. Graph theory and complex networks. An Introduction, p. 144, 2010.

SUK, T.; FLUSSER, J.; NOVOTNY, P. Comparison of leaf recognition by moments and
fourier descriptors. In: . Computer Analysis of Images and Patterns: 15th International
Conference, CAIP 2013, York, UK, August 27-29, 2013, Proceedings, Part I. Berlin,
Heidelberg: Springer Berlin Heidelberg, 2013. p. 221228.

SYED, A. R. A review of cross validation and adaptive model selection. 2011.

WATANABE, C. Y. V. Metodos de apoio ao diagnostico medico por imagens usando regras de


associacao e redes complexas. Tese (Tese de Doutorado), 2013.

WATTS, D. J.; STROGATZ, S. H. Collective dynamics of small-worldnetworks. nature,


v. 393, n. 6684, p. 440442, 1998.

You might also like