Professional Documents
Culture Documents
NUCLEO DE TECNOLOGIA
DEPARTAMENTO ACADEMICO DE CIENCIAS DA COMPUTACAO
PORTO VELHO
2016
FUNDACAO UNIVERSIDADE FEDERAL DE RONDONIA
NUCLEO DE TECNOLOGIA
DEPARTAMENTO ACADEMICO DE CIENCIAS DA COMPUTACAO
PORTO VELHO
2016
iii
Dedicatoria
Dedico este trabalho a minha famlia.
iv
AGRADECIMENTOS
Primeiramente aos meus pais e a minha famlia, pelo auxlio, compreensao e apoio durante
todo estes 4 anos de curso.
A minha orientadora, Prof. Carolina, por todo o tempo e dedicacao que foi aplicado neste
trabalho de conclusao do curso e, tambem, em toda a jornada de iniciacao cientfica.
Aos demais professores pela minha formacao academica.
Ao Departamento Academico de Ciencias da Computacao e a Fundacao Universidade Fe-
deral de Rondonia, pelo espaco e materiais cedidos para a realizacao deste projeto.
A todos que de forma direta ou indireta contriburam para a realizacao deste trabalho.
v
RESUMO
ABSTRACT
The feature extraction is a process of processing and image analysis, this information rela-
ting to the digital image are harvested and quantitated in a feature vector. An efficient extractor
should be able to apply measures that are able to demonstrate features that differentiate classes
with a high level of similarity. Thus, the accuracy of a good extractor may reflect the correct or
incorrect identification of a plant species, within a computer system. Several situations should
be considered for the selection and application of these extractors, as the number of selected
information that can both benefit and harm to the ultimate goal. Note that this study was ne-
cessary to improve computational tasks and support biological areas where many jobs cost a
lot of time and dedication of experts. This work presents a methodology for the extraction of
features present in images of leaves using descriptors based on the shape, being approached by
complex networks, and color, crafted by colorful images histogram of the image. The main goal
is to carry out the study and application of these extractors sheets of images, in order to assist
professionals in plant species identification area, as well as contribute to a new methodology
for the imaging processing research.
LISTA DE FIGURAS
1.1 (a) Imagem binaria, (b) Imagem em escala de cinza e (c) Imagem colorida.
Fonte: Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 (a) Imagem original e (b) Histograma da imagem. Fonte: Retirado de Gonzalez,
Woods e Eddins (2009). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Conceitos de (a) 4-vizinhanca, (b) vizinhanca diagonal e (c) 8-vizinhanca. Fonte:
Retirado de Filho e Neto (1999). . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 (a) Imagem original, (b) Imagem dilatada e (c) Imagem erodida. Foi utili-
zado um elemento estruturante de 3x3 (d). Os pixels que foram adicionados
(dilatacao) e removidos (erosao) estao destacados pela cor mais clara. Fonte:
Retirado de Amorim (2010). . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Etapas basicas de PADI. Fonte: Retirado de Esquef, Albuquerque e Albuquer-
que (2003). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Exemplo de aplicacao do algoritmo k-NN para (a) k=1 e (b) k=3. Fonte: Reti-
rado de Blomberg (2014). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.1 Observando a imagem de cima para baixo e da esquerda para a direita, de acordo
com as especificacoes fornecidas pela MEW: Acer negundo, Acer palmatum,
Acer pensylvanicum, Acer platanoides, Acer pseudoplantanus, Acer sacchari-
num, Aesculus glabra, Amelanchier canadensis, Betula alleghaniensis, Betula
nigra, Betula populifolia, Carpinus betulus, Carpinus caroliniana, Castanea
dentata, Cornus florida, Fagus grandfolia, Liriodendron tulipifera, Magnolia
macrophylla, Platanus ocidentallis, Quercus montana, Tilia americana, Ulmus
pumila e Zelkova serrata. Fonte: Elaborado pelo autor. . . . . . . . . . . . . . 32
3.2 Observando a imagem de cima para baixo e da esquerda para a direita, de acordo
com as especificacoes fornecidas pela MEW: Amelanchier canadensis, Betula
alleghaniensis, Betula nigra, Carpinus betulus, Carpinus caroliniana, Castanea
dentata, Cornus florida, Fagus grandfolia, Ulmus pumila e Zelkova serrata.
Fonte: Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3 Fluxo de tarefas realizadas. Fonte: Elaborado pelo autor. . . . . . . . . . . . . 33
3.4 Elemento estruturante utilizado no preenchimento de regiao. Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.5 Filtro Laplaciano utilizado. Fonte: Elaborado pelo autor. . . . . . . . . . . . . 37
x
3.6 (a) Imagem binarizada; (b) Contorno; (c) Rede criada com a ligacao de vertices
com distancias entre 0 e 0,1; (d) Ampliacao de (c); (e) Rede criada com a ligacao
de vertices com distancias entre 0 e 0,2; (f) Ampliacao de (e). Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.1 Comparativo atraves da tecnica Holdout, com taxa de treinamento de 50%, 75%
e 90%. Fonte: Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Comparativo entre as especies Bettula alleghaniensis e Bettula nigra. Fonte:
Elaborado pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3 Comparativo entre os extratores de forma e cor e sua composicao na primeira
base de imagens utilizando a tecnica Holdout de validacao. Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Comparativo entre os extratores de forma e cor e sua composicao na segunda
base de imagens utilizando a tecnica Holdout de validacao. Fonte: Elaborado
pelo autor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
xi
LISTA DE EQUACOES
SUMARIO
INTRODUCAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
3 METODOS DESENVOLVIDOS 31
3.1 Materiais utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.1 Equipamentos e softwares . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.2 Base de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Metodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.1 Escolha e organizacao das bases de imagens . . . . . . . . . . . . . . . 34
3.2.2 Ajuste manual da base de imagens . . . . . . . . . . . . . . . . . . . . 34
3.2.3 Segmentacao e pos-processamento . . . . . . . . . . . . . . . . . . . . 35
3.2.4 Extracao de caractersticas e criacao do vetor completo . . . . . . . . . 36
3.2.5 Classificacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
INTRODUCAO
As plantas sao de extrema importancia para a vida na terra, fornecendo oxigenio, alimentacao,
combustvel, substancias medicinais, e ainda mais, auxiliam na regulacao do clima, proporcio-
nando habitats para diversos animais, entre outros.
A identificacao cientfica correta das especies e fundamental para o desenvolvimento das
ciencias basica e aplicada, bem como para garantir a integridade das transacoes comerciais de
madeiras e demais produtos vegetais retirados da floresta. Anos de trabalho cientfico com
uma planta identificada erroneamente, podem significar perda de tempo ou causar graves con-
sequencias tanto em nvel cientfico quanto no financeiro. Por exemplo, no caso de plantas me-
dicinais, deve-se ter certeza absoluta da denominacao correta da especie da qual estao sendo ex-
trados os princpios ativos e que consequentemente serao indicados para uso terapeutico (KOOY;
SULLIVAN, 2013) (LUST, 2014).
A abordagem tradicional de identificacao das especies de planta e realizada atraves dos ta-
xonomistas1 experientes que examinam as especimes e relacionam a uma taxonimia conhecida.
Este processo e complexo e consome tempo de trabalho, mesmo para especialistas experien-
tes. Alem disso, um especialista em uma especie pode ser nao ter familiaridade com outra.
Estas questoes aumentaram o interesse de pesquisadores em buscar automatizar o processo de
identificacao de especies e tarefas correlatas, sendo, tudo isso possvel, gracas ao desenvolvi-
mento de tecnologias como computadores e cameras digitais. Hoje, o processo de identificacao
1
Aquele que estuda a taxonomia, que e a parte da biologia que identifica, nomeia e classifica os seres vivos.
2
caminha para a uniao de especialistas na area, juntamente com o auxlio de novas ferramentas
e tecnologias (CHAKKARAVARTHY et al., 2016) (HASIM; HERDIYENI; DOUADY, 2016).
Do ponto de vista das ciencias exatas, a identificacao de plantas e um desafio que leva a
grandes avancos na fsica, na matematica e na computacao, e o objetivo de superar as dificulda-
des na area computacional visa facilitar o trabalho do botanico.
Dentre os desafios computacionais, estao o desenvolvimento de classificadores para identifi-
car as especies de uma especime a partir de uma imagem digital, ou seja, problemas semelhan-
tes. Tambem tem-se a necessidade de propor novos vetores de caractersticas para distinguir
diferentes categorias da planta. Por exemplo, enquanto a forma da folha pode ser suficiente
para distinguir algumas especies, outras especies podem possuir formas muito similares, mas
possuir diferente coloracao das folhas. Uma unica caracterstica ou tipo de caracterstica pode
nao ser suficiente para separar todas as categorias, tornando a proposicao de novos vetores de
caractersticas (LEE; HONG, 2013) (KADIR et al., 2013) e a selecao de caractersticas (HAZRA et
al., 2013) um desafio.
Considerando a proposicao do estudo de extratores de caractersticas para a formacao de
vetores de caractersticas (os quais serao a representacao, ou a assinatura da imagem diante
um algoritmo de classificacao), recentemente trabalhos tem proposto a modelagem de formas
e textura de imagens como uma rede complexa. Como consequencia de sua flexibilidade para
representacao e modelagem virtuais de qualquer sistema discreto, redes complexas tambem
sao potencialmente uteis na analise de forma (COSTA et al., 2007). A abordagem da maioria
dos metodos para analisar imagens e objetos usando o contorno da forma considera a forma
como uma cadeia de pontos conectados. Nesta abordagem a sequencia de pontos na fronteira
e importante, ja que e usada para extrair o descritor de forma que seja capaz de caracterizar
a forma da imagem. Na abordagem de redes complexas, Backes, Casanova e Bruno (2009)
e Casanova, Backes e Bruno (2013) propoem o uso de redes complexas para caracterizar o
contorno da imagem, considerando o contorno da forma como um conjunto de pontos e modela
este conjunto como um grafo. Dessa maneira, o metodo por eles proposto nao necessita que os
pixels sejam adjacentes e sequenciais, ja que o modelo de grafo apenas leva em consideracao
a distancia entre os elementos do contorno. Esses trabalhos aplicam o uso de redes complexas
para modelar contorno de folhas. Os vetores de caractersticas passam a ser medidas extradas
da topologia da rede.
Outra medida que tem sido muito utilizada na representacao de imagens sao as baseadas em
3
histogramas de imagens coloridas, sendo este metodo ja amplamente adotado pela comunidade
de processamento de imagem. Nesta metodologia e verificada a quantidade de cada intensidade
de cor dentro da imagem digitalizada. Esta abordagem pode ser vista nos trabalhos realizados
por Dubey e Jalal (2014) e Deokar et al. (2016). O primeiro trabalho propos um metodo de
identificacao de doencas em frutas atraves de imagens digitais e, o segundo trabalho avaliou
tecnicas de extracao de caractersticas para identificacao de folhas com doencas, tambem em
imagens digitais.
O objetivo deste trabalho foi o desenvolvimento de uma metodologia de extracao de ca-
ractersticas baseada na descricao da forma e cor das folhas, sendo a primeira realizada atraves
das redes complexas e a segunda pelo histograma de imagens coloridas. A finalidade deste es-
tudo foi, primeiramente, contribuir para futuras aplicacoes que auxiliem especialistas na area de
identificacao de plantas. Alem disso, todo o estudo e metodologia adotada neste trabalho pode
servir como base para projetos envolvendo o processamento de imagens e visao computacional
de maneira geral.
Este trabalho foi organizado em quatro captulos, na seguinte ordem:
No captulo 1 sao apresentados os conceitos basicos referentes ao processamento e analise
de imagens digitais, tais como, suas etapas e os fundamentos da imagem digital.
O captulo 2 introduz os extratores de caractersticas estudados, que sao os baseados em
redes complexas e histogramas de imagens coloridas.
No captulo 3 e apresentada a metodologia utilizada para a implementacao dos extratores
de caractersticas e aplicacao dos mesmos em bases de imagens de plantas.
Finalmente, o captulo 4 apresenta os experimentos realizados, os resultados obtidos e dis-
cussoes.
4
As imagens podem ser obtidas por uma variedade de dispositivos, como as cameras, mi-
croscopios eletronicos, radares, equipamentos de ultra-som entre varios outros. A utilizacao e
producao dessas imagens tem uma vasta area de aplicacao, que podem ir desde o entretenimento
ate aplicacoes tecnologicas e medicas. A finalidade da analise de imagens, atraves da maquina
ou do ser humano, e obter informacoes uteis para a aplicacao desejada.
Normalmente, uma imagem recem adquirida necessita de realce ou que sejam realiza-
das transformacoes para que se consiga obter as informacoes desejadas. Como uma area da
eletronica/teoria dos sinais, o Processamento e Analise Digital de Imagens (PADI), necessita
que as imagens sejam representadas matematicamente, atraves de uma matriz com numeros
inteiros e, entao, poderao ser realizados processamentos digitais atraves de algoritmos com-
putacionais. Realizada a aplicacao dos algoritmos e, desta forma, possvel extrair atributos e
informacoes pertinentes.
Este captulo tem como finalidade: conceituar os fundamentos da imagem digital, as etapas
relativas ao PADI e demonstrar aplicacoes existentes na area de identificacao de plantas.
Trabalhar com imagens de plantas, e especificamente lidando com as folhas, pode ser um
processo trabalhoso e que requer tanto conhecimento quanto tempo, lidando com imagens digi-
tais, por outro lado, e possvel discretizar valores e assim utilizar todos os benefcios computa-
cionais, entregando resultados com tempo otimizado.
Para que se processe a imagem em um computador e necessario que esta seja caracterizada
matematicamente (SIMIONATO, 2012). Uma imagem digital (ou imagem discreta) e constituda
por um arranjo de elementos (numericos) sobre uma forma de grade regular. As unidades
desta grade sao localizadas por um conjunto de coordenadas x e y, que respectivamente
representam as colunas e as linhas.
Duas caractersticas sao importantes no conceito de representacao de imagens, sao elas a
amostragem (ou discretizacao espacial) e a quantizacao (ou discretizacao em amplitude). A
amostragem converte uma imagem analogica em uma matriz de M por N pontos, cada qual
5
Com relacao a cor, as imagens podem ser monocromaticas (escala de cinza), binarias ou
coloridas.
As imagens em escala de cinza sao aquelas em que os valores de sua matriz representam
tons de cinza, e geralmente tem alcance de [0, 255] ou de [0, 65535], que representam, respecti-
vamente, as classes de 1 byte por elemento e 2 bytes por elemento. Uma imagem binaria e um
vetor logico composto por 0s e 1s, ou seja, representado, respectivamente, pelas cores preta e
branca, na imagem (GONZALEZ; WOODS; EDDINS, 2009). Ja uma imagem colorida, como sera
melhor estudada na Secao 2.1, e geralmente representada pelo sistema RGB, sendo este modelo
utilizado pelos monitores de vdeo atuais. Neste modelo, as imagem coloridas sao formadas
pela sobreposicao de tres matrizes, que representam os nveis de intensidade dos planos: ver-
melho, verde e azul; sendo cada um destes similares a uma imagem em escala de cinza. A
Figura 1.1 apresenta exemplos de imagem binaria, em escala de cinza e colorida.
1.1.3 Histograma
onde,
Um histograma informa se a imagem esta escura, clara ou equalizada. Por exemplo, uma
imagem com nveis de cinza variando entre 0 e 256 e considerada escura se a maioria de seus
pixels estiverem proximos a 0, como demonstra a Figura 1.2 (GONZALEZ; WOODS; EDDINS,
2009).
(a) (b)
Figura 1.2: (a) Imagem original e (b) Histograma da imagem. Fonte: Retirado de Gonzalez, Woods e Eddins
(2009).
7
E importante ter a nocao das principais relacoes que os pixels possuem em uma imagem
digital. Uma imagem digital pode ser vista como uma matriz, sendo suas linhas e colunas os
identificadores de um determinado ponto nesta imagem. Sera adotada a notacao f(x,y) para
representar a imagem digital. Para se representar um unico pixel este sera feito com letra
minuscula, como p ou q, e um conjunto de pixels por S (FILHO; NETO, 1999).
Vizinhanca
Um pixel p, de coordenadas (x, y), tem 4 vizinhos horizontais e verticais, cujas coordenadas
sao (x + 1, y), (x 1, y), (x, y + 1) e (x, y 1). Estes pixels formam a chamada 4-vizinhanca
de p, que sera designada N4 (p).
Os quatro vizinhos diagonais de p sao os pixels de coordenadas (x 1, y 1), (x 1, y + 1),
(x + 1, y 1) e (x + 1, y + 1), que constituem o conjunto Nd (p).
A 8-vizinhanca de p e definida como (FILHO; NETO, 1999):
Conectividade
Adjacencia
Caminho
Medicoes de distancia
Existem algumas medicoes de distancias, algumas delas sao: a distancia Euclidiana, distancia
D4 e distancia D8 . Aqui sera apresentada apenas a distancia Euclidiana, que foi a utilizada neste
trabalho. Representado por D, funcao de distancia, os pixels p e q, sao respectivamente as co-
ordenadas (x,y) e (s,t).
Distancia Euclidiana
Para esta medida de distancia, os pixels com distancia Euclidiana em relacao a (x,y) menor
ou igual a algum valor r, sao os pontos contidos em um crculo de raio r centrado em (x,y).
p
De (p, q) = (x s)2 + (y t)2 . (1.5)
9
A morfologia matematica tem seu esforco no estudo de estruturas geometricas das entidades
presentes em uma imagem (FILHO; NETO, 1999). Com a utilizacao da morfologia matematica
e possvel reconstruir, pelo menos amenizar, muitas pequenas falhas, e esta foi sua principal
relevancia para este trabalho.
Elemento estruturante
Um elemento estruturante e formado por uma matriz binaria bem definida, conhecida pre-
viamente e menor que a imagem a ser processada. O seu centro percorre toda a imagem a ser
processada e a sua vizinhanca e responsavel pela operacao morfologica. E intrisicamente ne-
cessaria uma avaliacao do tamanho e da forma a ser utilizada no elemento estruturante, pois
quanto melhor definido for o elemento, mais preciso e relevante sao as informacoes adquiridas
de cada pixel (RESENDE et al., 2013).
Operacoes
A Analise Digital de Imagens (ADI) tem a funcao de extrair e tratar os dados proveni-
entes das imagens digitais. Apesar da competencia maior do ser humano em realizar tarefas
de identificacao, atraves de procedimentos de ADI, torna-se mais facilitada a realizacao de
medicoes complexas, por exemplo, auxiliando em tarefas de apoio a decisao.
Geralmente, o termo Processamento Digital de Imagem, e definido pela literatura abran-
gendo ambos os conceitos de PDI e ADI, sendo plausvel, pois estas se intercalam. Neste
trabalho sera usado o termo Processamento e Analise de Imagens (PADI) para se referir aos
dois processos.
Como o trabalho proposto sugere uma nova abordagem no segmento de extracao de carac-
tersticas/atributos de imagens, e interessante definir as etapas presentes no processamento e
analise de imagens, verificando desta forma onde se insere o objeto de estudo. Apesar disso,
para a realizacao deste trabalho diversas etapas foram realizandas com o objetivo de proporcio-
nar um resultado mais favoravel, como sera melhor abordado em cada segmento.
As principais etapas de um sistema de PADI podem ser verificadas atraves da Figura 1.5.
A estrutura visualizada na Figura 1.5 possui tres composicoes: aquisicao, PDI e ADI. Nas
laterais do fluxograma existem setas que indicam o nvel semantico dos dados. O processo
comeca com a manipulacao dos pixels da imagem, apos sao identificados os objetos desejados,
ou regioes de interesse e, por fim, sao gerados dados que serao utilizados para a classificacao e
analise em geral. A transicao e realizada passando-se da geracao de qualidade da imagem para
a sua quantificacao atraves dos dados obtidos. Cada uma destas etapas sao descritas a seguir.
Figura 1.5: Etapas basicas de PADI. Fonte: Retirado de Esquef, Albuquerque e Albuquerque (2003).
em sua sada um sinal eletrico proporcional ao nvel de energia adquirido. O segundo consistiria
na realizacao da digitalizacao da imagem, transformando o sinal analogico recebido para um
sinal digital (ESQUEF; ALBUQUERQUE; ALBUQUERQUE, 2003).
1.2.2 Pre-processamento
1.2.3 Segmentacao
encontrar o contorno dos objetos na imagem. A outra, e agrupar pontos que possuam carac-
tersticas semelhantes ate que o objeto seja reconstrudo. Podem ser destacadas, entao, duas
tecnicas basicas: limiarizacao e deteccao de bordas (MEDEIROS; SILVA; NOGUEIRA, 2002).
Limiarizacao de histograma
onde,
Deteccao de bordas
A deteccao baseada em bordas envolve localizar regioes onde ocorre uma variacao abrupta
dos nveis de cinza. Podem ocorrer, entao, na forma de pontos, linhas e segmentos e, a partir
destes sao contrudos os contornos dos objetos da imagem. Algoritmos de enlace sao entao
13
utilizados para conectar os fragmentos evidenciados para gerar contornos que estejam associ-
ados a objetos presentes na imagem. A deteccao de descontinuidade e realizada por meio de
operadores de derivacao local. Os operadores mais conhecidos de derivacao sao os de Sobel,
Prewitt, Canny e Laplaciano. E passado o operador sobre a imagem, funcionando como uma
mascara (WATANABE, 2013) (GONZALEZ; WOODS; EDDINS, 2009).
1.2.4 Pos-processamento
Estruturais (Contextuais): obtidas atraves da relacao com outros objetos da imagem con-
forme informacoes coletadas previamente de outros grupos.
Tecnicas de classificacao
Existem diversas tecnicas de classificacao que podem ser utilizadas para o reconhecimento
e classificacao, sendo relevante para este trabalho o estudo do metodo de aprendizado baseado
em instancias (instance-based learning) de classificacao. Este metodo compara novas instancias
com as do treinamento, alocadas na memoria. Desse metodo se destaca o algoritmo k-NN.
O k-NN ou K-vizinhos mais proximos (k-Nearest Neighbor), armazena os dados de treina-
mento e, quando ha um novo objeto a ser classificado, o algoritmo busca pelos k registros mais
15
proximos do registro ofertado, dada uma medida de distancia. O objeto e, entao, classificado
na classe mais comum entre os k registros mais proximos (BLOMBERG, 2014). Na Figura 1.6 e
possvel visualizar um exemplo da aplicacao do modelo k-NN para k=1 e k=3, considerando o
X o novo objeto a ser identificado.
(a) (b)
Figura 1.6: Exemplo de aplicacao do algoritmo k-NN para (a) k=1 e (b) k=3. Fonte: Retirado de Blomberg
(2014).
Tecnicas de validacao
Holdout: divide-se o conjunto de dados em dois subconjuntos que sao mutualmente ex-
clusivos, sendo um para teste e o outro para treinamento. Depois de realizado o par-
ticionamento, e realizada a estimacao do modelo, posteriormente os dados de teste sao
aplicados e, entao, calcula-se o erro.
Classificado como
A B C
Classe A 50 0 0
B 0 47 3
Real C 0 4 46
Medidas de desempenho
Verdadeiros negativos (VN): todas as demais instancias que foram corretamente classi-
ficadas como nao sendo de determinada classe. Por exemplo, todas as instancias classifi-
cadas como nao sendo A, 100 instancias.
Falsos negativos (FN): instancias de uma classe que foram incorretamente classificadas
como sendo de outra classe. Por exemplo, a classe C apresentou 4 falsos negativos, que
foram instancias da classe C classificadas incorretamente como sendo de B.
Falsos positivos (FP): instancias de outra classe que foram incorretamente classificadas
como sendo desta classe. Por exemplo, a classe C apresentou 3 falsos positivos, que
foram instancias da classe B classificadas incorretamente como sendo de C.
17
Neste captulo foram vistos os fundamentos basicos aplicados a imagem digital, como sua
representacao matematica, tipos de imagens, a avaliacao de seu histograma e algumas de suas
propriedades mais comuns. Foi realizado um estudo que procurou englobar as etapas do proces-
samento e analise de imagens, definindo cada uma destas etapas e possibilitando a visualizacao
da area especfica a ser trabalhada, assim como, outras etapas importantes que tambem tiveram
que ser estudadas e realizadas para a conclusao deste trabalho.
No proximo captulo sao apresentados os extratores de caractersticas estudados e imple-
mentados neste trabalho.
18
A cor e uma das caractersticas mais utilizadas para o reconhecimento e discriminacao pela
visao humana. A abordagem da extracao de caractersticas pelo histograma da imagem e sim-
ples e tambem muito eficiente.
Para o entendimento do extrator de cor utilizado e necessario o entendimento do sistema
RGB, assim como a formacao de seu histograma.
19
Quando se trata de cor e interessante uma avaliacao de como funciona o campo de visao
humano, pois isso reflete em sua representacao.
No olho humano, em sua retina, existem dois sensores: os cones e o bastonetes; atraves
dos cones e possvel a percepcao das cores e atraves dos bastonetes os tons de cinza. A visao
humana e baseada em tres componentes de cor: vermelho (red), verde (green) e azul (blue).
Um fator importante para o entendimento da cor e a luz. A luz, ou luz visvel, refere-se as
ondas eletromagneticas visveis ao olho humano que estao includas nos comprimentos de onda
de 380 nanometros, definido como violeta, a 780 nanometros, representando a cor vermelha. A
luz esta intimamente ligada ao conceito de cor (ROCHA, 2011).
No seculo XVII, Isaac Newton, atraves de experiencias realizadas com prismas, descobriu
que a luz branca e decomposta em sete cores: vermelho, laranja, amarelo, verde, azul claro,
azul escuro e violeta. Realizando outro experimento, a fim de recompor a luz branca, verificou
que eram necessarias apenas tres cores: o vermelho, verde e azul. Newton nao sabia na epoca,
mas para obtencao da cor branca seria necessaria uma proporcao de 30% de vermelho, 59% de
verde e 11% de azul (ROCHA, 2011).
O sistema RGB, Red, Green e Blue (do ingles vermelho, verde e azul), tambem e conhecido
como sistema Cor-Luz, e trabalha com a adicao de cores, pois somando-se as cores basicas,
nas proporcoes vistas, e possvel obter a cor branca. Este sistema e normalmente empregado
em fotografias, cinema, televisao e para representacao de imagens digitais, isto acontece pela
compatibilidade com a exibicao de imagens por um computador (KOUR, 2015).
Na Figura 2.1 e vista a representacao do modelo RGB por crculos cromaticos.
Figura 2.1: Crculos cromaticos do sistema RGB. Fonte: Retirado de ROCHA (2011).
Figura 2.2, cada uma sendo um plano independente. A formacao de outras cores e possvel
modificando a intensidade do pixel de cada plano de cor, ou seja, modificando a quantidade
de vermelho, verde e azul que determinado pixel possuira.
Figura 2.2: Estrutura de uma imagem RGB. Fonte: Retirado de Gonzalez, Woods e Eddins (2009).
O histograma e seus conceitos basicos foram vistos na Secao 1.1.3 do captulo 1. Ressalta-se
neste topico como o histograma e realizado em imagens coloridas.
Como visto anteriormente, a imagem digital colorida se decompoe em tres planos ou di-
mensoes, aqui sera denominado pelos seguintes: plano vermelho, plano verde e plano azul.
Cada qual possui uma capacidade de armazenamento por pixel de 8 bits, pois a faixa varia en-
tre 0, sendo mais escuro, e 256, mais claro, fornecendo um aspecto de nveis de cinza de uma
imagem.
Dada uma imagem de folha colorida. Sua decomposicao sera realizada em tres planos,
conforme a Figura 2.3 demonstra.
O histograma da imagem colorida presente na Figura 2.3, pode ser visto na Figura 2.4. Os
planos vermelho, verde e azul foram sobrepostos em um unico histograma, representados pelas
cores correspondentes. A extensao horizontal se refere aos nveis de cinza (valores entre 0 e
256), enquanto a extensao vertical corresponde a quantidade de pixels (valores entre 0 e 1000).
Observa-se entao a disposicao dos pixels nos nveis de cinza de cada plano.
Quando se fala em teoria dos grafos e redes complexas muitos ja associam as redes de
internet, comunicacao ou redes sociais, por exemplo, porem e importante salientar que estes
21
(a) (b)
(c) (d)
Figura 2.3: Exemplo de decomposicao de imagem colorida em planos: (a) Imagem original; (b) Plano ver-
melho (c) Plano verde; (d) Plano azul. Fonte: Elaborado pelo autor.
Figura 2.4: Histogramas dos planos sobrepostos. Fonte: Elaborado pelo autor.
estao presentes em diversas areas de pesquisa: economia, ciencias sociais, biologia, logstica
dentre outras. A termologia das redes complexas que sao utilizadas para descrever as redes
de cada area de pesquisa sao basicamente as mesmas, auxiliando a compreensao por membros
de diferentes comunidades. As terminologias comuns e a forte semelhanca das redes pelas
diferentes disciplinas tem sido um instrumento importante para o crescimento do estudo das
redes complexas (STEEN, 2010).
O entendimento apropriado de redes complexas requer o estudo de algumas outras ferra-
mentas. Muitos dos conceitos absorvidos vem de um campo matematico denominado teoria
dos grafos (STEEN, 2010). Na Secao 2.2.1, a seguir, sao descritos os elementos basicos dos
grafos e suas caractersticas a fim de se obter uma visao mais apropriada das redes modernas.
Os atributos das redes complexas foram utilizados neste trabalho para a extracao de carac-
tersticas dentro da base de imagens de folhas, apos realizada a devida segmentacao, por esta
22
razao se fez necessario o estudo aprofundado destas redes. Ja a teoria dos grafos vem a ser a
base para o estudo de redes complexas.
A teoria dos grafos e uma area da matematica discreta que estuda objetos combinatorios
- grafos - que sao um bom modelo para muitos problemas em ramos da matematica, da in-
formatica e da industria. Muitos dos problemas sobre grafos tornaram-se celebres porque sao
um interessante desafio intelectual e tem importantes aplicacoes (FEOFILOFF; KOHAYAKAWA;
WAKABAYASHI, 2009).
Existem varios tipos de grafos e muitas caractersticas a serem apresentadas. Este trabalho
ira explicitar as mais relevantes e que servirao como base para o estudo de redes complexas, da
Secao posterior, que foram extradas de (RUSS, 2011), porem, mais detalhes podem ser vistos
em (DIESTEL, 2006) e em (FEOFILOFF; KOHAYAKAWA; WAKABAYASHI, 2009).
Grafos
vergentes a v e; o grau de sada deste mesmo vertice v e o numero de arestas que sao divergentes
de v.
Caminho: O caminho entre dois vertices e a sequencia de vertices e arestas que os unem.
Matriz de Adjacencia: Seja A = [aij ] uma matriz n x n, onde n e o numero de nos de um
grafo G = (V , E ) qualquer. A matriz de adjacencia A e construda da seguinte forma:
1, se i e j f orem conectados
A(x, y) = (2.1)
0, caso contrario
Uma matriz de adjacencia pode ser vista como mostra o exemplo da Figura 2.5. Ela e
responsavel por guardar informacoes sobre a adjacencia entre dois vertices, como neste caso
a rede nao possui peso, quando existir a adjacencia esta sera representada pelo valor 1 e, caso
contrario, 0.
(a) (b)
Figura 2.5: (a) um exemplo de grafo e (b) sua matriz de adjacencia correspondente. Fonte: Elaborado pelo
autor.
Figura 2.6: Exemplo de um grafo regular. Fonte: Retirado de Casanova, Backes e Bruno (2013).
Uma rede e um conjunto de itens, que podem ser denominados vertices ou nos, com co-
nexoes entre eles, chamados de arestas. Sistemas sao modelados em forma de redes, que
tambem sao denominados grafos na literatura matematica, como exemplos, podem ser citadas:
a internet, as redes sociais, as redes neurais e varios outros (COHEN; HAVLIN, 2010).
De fato, na teoria das redes sao utilizados conceitos da teoria dos grafos, porem em redes
complexas, alem da teoria dos grafos, geralmente sao utilizados metodos da estatstica para
se caracterizar a estrutura de conexoes da rede e/ou sao empregados ferramentas e metodos da
mecanica estatstica para criar modelos e analisar a estrutura e a dinamica das redes (CASANOVA;
BACKES; BRUNO, 2013).
As redes complexas tiveram seu maior avanco e contribuicao atraves dos trabalhos reali-
dados por Erdos e Renyi (1960), Milgram (1967), Watts e Strogatz (1998) e Barabasi e Al-
bert (1999). Erdos e Renyi comecaram o estudo em 1960 sobre grafos aleatorios e, atraves
de metodos probabilsticos, estudaram as propriedades dos grafos em funcao do crescimento
e ligacao entre os vertices. Ja em 1998, foi realizado por Watts e Strogatz uma descoberta a
partir do estudo realizado por Milgram de 1967, que consistia em enviar cartas aleatoriamente
entre cidadaos americanos e verificar apos quantas pessoas a carta chegaria ao destinatario, foi
verificado entao que, em media, a carta passava por seis pessoas antes de chegar ao destino.
Tal resultado ficou conhecido como seis graus de separacao ou efeito pequeno-mundo. Um ano
mais tarde, em 1999, Barabasi e Albert propuseram, atraves de um artigo, um modelo generico
de construcao de redes, chamadas de redes livre de escala (BARABaSI; ALBERT, 1999) (CASA-
NOVA; BACKES; BRUNO, 2013).
A importancia das redes complexas para este trabalho foi sua utilizacao para extracao de
caractersticas por medidas estatsticas. Tais caractersticas serao apresentadas, assim como os
25
vetores resultantes da extracao destas, na Secao 3.2.4. A seguir serao explicitados os modelos
mais relevantes dentro das redes complexas.
Uma rede formada por um conjunto de vertices e arestas e apenas um exemplo basico de
rede, pois existem muitos exemplos de redes mais complexas que isto. Como exemplo, podem
existir vertices e arestas diferentes, sendo que estes podem possuir variadas caractersticas e
propriedades associadas a eles (COHEN; HAVLIN, 2010).
Diversos modelos sao propostos na literatura, os apresentados neste trabalho sao: redes
aleatorias, redes de pequeno-mundo e redes livre de escala.
Redes aleatorias
O modelo randomico de rede, ou rede aleaoria, pode ser considerado como o modelo mais
basico de rede complexa. O estudo sistematico das redes aleatorias iniciou-se com Erdos and
Renyi (ERDOS; ReNYI, 1960) com a proposta inicial de estudar, atraves de metodos proba-
bilsticos, as propriedades dos grafos como uma funcao como o aumento das conexoes aleatorias.
O termo rede aleatoria se refere a natureza desordenada do arranjo entre as ligacoes dos dife-
rentes vertices (BOCCALETTI et al., 2006).
A rede aleatoria e definida pelo numero de vertices N e a probabilidade p de uma aresta
existir entre dois vertices. Logo, o grau esperado para cada vertice, (k), e determinado pela
seguinte equacao (BACKES, 2010):
A medida que o tamanho da rede aumenta (N ), (k) diverge se o valor de p for fixo.
Ao inves disso, p e escolhido como uma funcao de N de modo a manter (k) fixa: p = (k)/(N-1).
A probabilidade de um vertice escolhido aleatoriamente possuir grau k e binomial (BACKES,
2010):
N 1
P (k ) = p k (1 p)N 1k . (2.3)
k
26
(k )k expk
P (k )
= . (2.4)
k!
(a) (b)
Figura 2.7: (a) Exemplo de rede aleatoria e (b) distribuicao de grau. Fonte: Retirado de Backes (2010).
Redes de pequeno-mundo
Para se construir uma rede de pequeno-mundo, deve-se comecar com um grafo regular
de N vertices, e cada um destes vertices e conectado aos k vizinhos mais proximos em cada
direcao, totalizando 2k conexoes, onde N >> k >> log(N ) >> 1. Apos, cada vertice e
redistribudo aleatoriamente com probabilidade p. Quando p = 0 tem-se um grafo regular, ja
quando p = 1 tem-se um grafo aleatorio. Quando se atribui a p um valor intermediario, tem-se
a formacao de uma rede com caminho pequeno medio e alto coeficiente de aglomeracao (COSTA
et al., 2007) (CASANOVA; BACKES; BRUNO, 2013).
A Figura 2.8, a seguir, mostra um exemplo de rede de pequeno-mundo e sua respectiva
distribuicao de grau:
(a) (b)
Figura 2.8: (a) Exemplo de rede de pequeno mundo e (b) distribuicao de grau. Fonte: Retirado de Backes
(2010).
Redes com leis de potencia de distribuicao de grau tem sido o foco de muita atencao na
literatura atual. Estas sao denominadas como redes livre de escala (COHEN; HAVLIN, 2010),
propostas inicialmente por (BARABASI; BONABEAU, 2003).
Este tipo de rede possui alguns vertices altamente conectados enquanto os demais possuem
poucas conexoes. A sua distribuicao de grau segue a lei da potencia (CASANOVA; BACKES;
BRUNO, 2013):
P (k ) k . (2.5)
sendo k>0 e >0. O smbolo e denominado expoente de livre escala e determina a probabi-
28
(a) (b)
Figura 2.9: (a) Exemplo de rede livre de escala e (b) distribuicao de grau. Fonte: Retirado de Backes (2010).
Existem diversos tipos de topologias de redes complexas, cada uma com sua modelagem e
mecanismos. Diversas medidas tem sido propostas para que se possa quantificar a estrutura das
ligacoes. A partir destas medidas e que elas podem ser analisadas, caracterizadas e classificadas.
A Figura 2.10 apresenta um exemplo (CASANOVA; BACKES; BRUNO, 2013).
Figura 2.10: Caracterizacao de redes complexas. Fonte: Retirado de Casanova, Backes e Bruno (2013).
atraves dos trabalhos de Casanova, Backes e Bruno (2013), Cohen e Havlin (2010) e Costa et
al. (2007). Ressalta-se que estas medidas sao expressas para grafos nao-orientados.
Grau
N
X
ki = aij . (2.6)
j =1
kk = max(ki ). (2.7)
e o grau medio:
N
1 X
k = ki . (2.8)
N i=1
Juncao
N
X
H = P (ki , k 0 )i log2 P (ki , k 0 )i (2.9)
i=1
N
X
E = (P (ki , k 0 )i )2 (2.10)
i=1
N
1 X
P= P (ki , k 0 )i (2.11)
N i=1
Evolucao dinamica
Neste captulo foram descritos os extratores utilizados neste trabalho: baseado no histo-
grama de uma imagem colorida e em metricas extrados a partir de grafos e redes complexas.
No captulo 3 sera apresentada a metodologia realizada neste trabalho, com informacoes
referentes aos materiais, bases de dados e metodos desenvolvidos.
31
3 METODOS DESENVOLVIDOS
Neste captulo e apresentada a metodologia usada para extrair as caractersticas das folhas
presentes nas bases utilizadas, baseados nos metodos descritos no captulo 2. Sao apresentados
nas secoes seguintes: os materiais: equipamentos, softwares e bases de imagens utilizados
(Secao 3.1); e, o desenvolvimento dos metodos de extracao de caractersticas (Secao 3.2).
Para o desenvolvimento deste trabalho foi utilizado um computador com sistema opera-
cional Windows 8.1, 64 bits, processador Intel(R) Core(TM) i5, 2.6 Ghz. A implementacao
ocorreu atraves do software MATLAB versao R2013B, com licenca fornecida pela Fundacao
Universidade Federal de Rondonia e, todo o segmento de classificacao e validacao foi realizado
pelo software livre WEKA1 versao 3.6.11.
Software MATLAB
O software MATLAB e definido, segundo o proprio site2 , como um sistema utilizado para
o aprendizado de maquinas, processamento de imagens, processamento de sinais, visao com-
putacional, robotica entre outros. A plataforma deste software e otimizada para resolucao de
problemas cientficos e de engenharia. A linguagem MATLAB possui facilidade para lidar com
a matematica computacional, ajudando no trabalho com matrizes, que e a forma como as ima-
gens sao tratadas. Ele possui uma variedade de ferramentas ja construdas que possibilitam a
rapida construcao de algoritmos.
Software WEKA
O software WEKA e um software gratuto que possui licenca GNU3 e foi utilizado neste
trabalho para a realizacao da classificacao e validacao dos dados obtidos com a implementacao.
1
Site: http://www.cs.waikato.ac.nz/ml/weka/
2
http://www.mathworks.com/products/matlab/
3
A GNU - General Public License (Licenca Publica Geral) e uma licenca livre para software e outros tipos de
trabalhos.
32
A base de dados utilizada e denominada MEW (Middle European Woods), sendo composta
por folhas nativas da regiao da Republica Checa. A versao utilizada neste trabalho, possui um
total de 200 especies, contendo entre 100 e 268 imagens de folhas distintas por cada especie,
totalizando 20758 imagens. Esta base e disponibilizada para download no referido site4 , pos-
suindo permissao para sua utilizacao com finalidade educativa. A resolucao das imagens e de
300 dpi com dimensoes variadas. Todas as imagens estao centralizadas e dispostas em um fundo
branco.
Das especies presentes na base MEW, foram selecionadas 23 especies para a efetuacao de
testes nesta primeira base.
Na Figura 3.1 e posvel visualizar um exemplo das especies escolhidas.
Figura 3.1: Observando a imagem de cima para baixo e da esquerda para a direita, de acordo com as
especificacoes fornecidas pela MEW: Acer negundo, Acer palmatum, Acer pensylvanicum, Acer
platanoides, Acer pseudoplantanus, Acer saccharinum, Aesculus glabra, Amelanchier canaden-
sis, Betula alleghaniensis, Betula nigra, Betula populifolia, Carpinus betulus, Carpinus carolini-
ana, Castanea dentata, Cornus florida, Fagus grandfolia, Liriodendron tulipifera, Magnolia ma-
crophylla, Platanus ocidentallis, Quercus montana, Tilia americana, Ulmus pumila e Zelkova ser-
rata. Fonte: Elaborado pelo autor.
4
MEW 2014 - Base de dados de folhas, Instituto de Informacao Teoria e Automacao CAS, Praga, Republica
Checa, http://zoi.utia.cas.cz/tree leaves
33
Foi organizada uma segunda base de imagens, como e mostrado na Figura 3.2, um sub-
grupo, contendo as 10 classes dentre as 23, levando em consideracao parametros subjetivos de
semelhanca de forma escolhidos pelo autor. Alem disso, foram utilizadas apenas 30 das 60 ima-
gens disponveis por classe. Isto foi feito para avaliar a capacidade dos vetores de caractersticas
gerados caracterizarem imagens com semelhancas de forma.
Figura 3.2: Observando a imagem de cima para baixo e da esquerda para a direita, de acordo com as
especificacoes fornecidas pela MEW: Amelanchier canadensis, Betula alleghaniensis, Betula ni-
gra, Carpinus betulus, Carpinus caroliniana, Castanea dentata, Cornus florida, Fagus grandfolia,
Ulmus pumila e Zelkova serrata. Fonte: Elaborado pelo autor.
3.2 Metodos
Para que o objetivo proposto por este trabalho fosse alcancado, fez-se necessaria a realizacao
de diversas tarefas que estao definidas na Figura 3.3.
Cada etapa, da Figura 3.3, esta definida com uma numeracao, que corresponde a sua respec-
tiva Secao neste trabalho. Sendo, entao:
3.2.5: Classificacao.
Das 200 especies disponveis dentro da base MEW, 23 foram utilizadas para a realizacao
deste trabalho. A base disponibilizada possuia dois conjuntos de imagens de uma mesma fo-
lha com disposicoes de luminosidade diferentes, uma com a luz incidindo por cima e outra
por baixo, verificou-se que as imagens obtidas com a iluminacao advinda de baixo da folha
proporcionavam informacoes mais relevantes para este trabalho, por esta razao estas foram se-
lecionadas. Nao existe, no entanto, informacoes descritas, no site, da luminosidade, nem de
aparelhos que foram usados para a obtencao da imagem digital.
Os trabalhos realizados por Mouine, Yahiaoui e Verroust-Blondet (2012), Pham et al. (2013)
e Suk, Flusser e Novotny (2013) tambem utilizaram esta base de imagens para ajudar na
identificacao de especies de plantas.
No primeiro momento, para ajuste da base de imagens, foi realizada uma segmentacao to-
talmente manual nas imagens contidas na base de imagem, visto que na imagem outros objetos
35
tambem estavam presentes (reguas, paleta de cores, etc). Assim, estes elementos foram remo-
vidos, restando apenas a regiao de interesse, a folha, e, o fundo, sendo este formado em sua
maioria pela cor branca.
Figura 3.4: Elemento estruturante utilizado no preenchimento de regiao. Fonte: Elaborado pelo autor.
Por fim, as imagens foram redimensionadas (possundo 250 pixels de altura e largura pro-
porcional), objetivando a padronizacao, e, melhor desempenho na realizacao de tarefas compu-
tacionais. O algoritmo da segmentacao e pos-processamento e apresentado a seguir.
36
A extracao de caractersticas foi realizada em dois segmentos. O primeiro teve por finali-
dade extrair caractersticas obtidas de histogramas de imagens digitais coloridas; e, o segundo
realizou a extracao de caractersticas da forma das imagens, utilizando o contorno obtido atraves
da deteccao de bordas.
Os processos de extracao e de criacao do vetor completo de caractersticas foram realizados
atraves do software MATLAB e os respectivos algoritmos serao apresentados a seguir.
Nesta etapa, a imagem digital colorida foi decomposta em tres planos, vermelho, verde
e azul. Isto foi realizado porque, para cada plano, foi obtido um histograma (Equacao 1.2)
distinto, totalizando tres histogramas por imagem.
Apos a obtencao dos valores do histograma de cada plano, foi necessaria a criacao de um
vetor de caractersticas para o seu armazenamento. Neste vetor e feito o armazenamento dos
tres planos. Sendo y a quantidade de pixels de um determinado nvel de cinza, o vetor (V) do
histograma de cada plano tem a seguinte estrutura:
O descritor da imagem colorida Vrgb , e formado, entao, pela concatenacao dos vetores dos
planos vermelho, verde e azul, totalizando, entao, um vetor com 768 atributos.
A metodologia apresentada nesta Secao foi baseada no trabalho realizado por Backes, Ca-
sanova e Bruno (2009).
Com a imagem ja binarizada, foi possvel detectar sua borda utilizando um filtro Laplaci-
ano, composto por uma matriz 3x3, que pode ser visualizada na Figura 3.5. Esta matriz tem
por finalidade calcular a intensidade de um determinado pixel, na imagem digital, em funcao
da intensidade de seus vizinhos. A matriz, entao, percorreu a imagem realizando operacoes
matematicas e, desta forma, definindo o contorno da area de interesse.
Apos a definicao do contorno, criou-se um grafo regular. Este grafo regular foi criado
verificando-se a distancia Euclidiana de cada um dos pixels do contorno em relacao aos demais.
A localizacao de um pixel pode ser entendida como a linha e coluna em que os pixels estao
localizados dentro da imagem digital. O grafo e, entao, normalizado. Esta normalizacao e feita
com a finalidade de reduzir a influencia do tamanho da rede nos descritores calculados.
O grafo foi submetido a evolucao dinamica (Secao 2.2.4). Na evolucao dinamica e realizada
uma transformacao no grafo, sendo que, apenas os vertices, ou pontos do contorno, que estao
proximos em certa distancia fazem parte da rede. A rede construda em cada avanco da evolucao
dinamica possui uma configuracao nova de conexoes. Cada configuracao de evolucao dinamica
sera denominada por este trabalho como tempo de limiar (Tl ). A Figura 3.6 apresenta uma
imagem binarizada, seu contorno e dois tempos de limiar distintos.
Em cada tempo de limiar (Tl ), metricas sao extradas da rede. Estas medidas , que estao
38
(a) (b)
(c) (d)
(e) (f)
Figura 3.6: (a) Imagem binarizada; (b) Contorno; (c) Rede criada com a ligacao de vertices com distancias
entre 0 e 0,1; (d) Ampliacao de (c); (e) Rede criada com a ligacao de vertices com distancias
entre 0 e 0,2; (f) Ampliacao de (e). Fonte: Elaborado pelo autor.
presentes na Secao 2.2.4, sao: grau maximo, grau medio, entropia, energia e grau medio de
juncao. Baseadas nestas medidas sao apresentados, a seguir, os vetores utilizados.
Descritor de grau
O vetor de caractersticas de grau e composto pelo grau maximo (kk , Equacao 2.7), e o grau
medio (k , Equacao 2.8), que sao extrados da rede complexa.
O vetor de caractersticas de grau e composto por apenas duas medidas k e kk em cada
tempo de limiar Tl , sendo representado como:
Vgrau =[kk (T0 ),k (T0 ),kk (T1 ),k (T1 ), ... ,kk (Tx ),k (Tx )].
39
O vetor de caractersticas de juncao e composto da entropia (H, Equacao 2.9), a energia (E,
Equacao 2.10) e o grau medio de juncao (P, Equacao 2.11). E composto, entao, pelas medidas
descritas em cada tempo de limiar Tl , sendo representado como:
Vjuncao de grau = [H(T0 ),E(T0 ),P (T0 ), H(T1 ),E(T1 ),P (T1 ), ... ,H(Tx ),E(Tx ),P (Tx )].
O descritor de grau e juncao e composto pela concatenacao dos dois primeiros descritores
anteriores. Portanto, o vetor de caractersticas e representado por:
Vgrau e juncao =[kk (T0 ),k (T0 )H(T0 ),E(T0 ),P (T0 ), kk (T1 ),k (T1 )H(T1 ),E(T1 ),P (T1 ), ...
,kk (Tx ),k (Tx )H(Tx ),E(Tx ),P (Tx )].
Este vetor, e, entao, salvo em um formato especfico a ser lido pelo software WEKA para
que este faca a classificacao (identificacao das especies de plantas).
3.2.5 Classificacao
Nesta base foram realizados testes comparativos entre o extrator baseado em redes comple-
xas e outros extratores de forma, que sao:
Forma: utiliza funcoes basicas de descricoes baseadas em forma. Neste trabalho foram
utilizadas 11 caractersticas para construir o descritor Forma em funcao do objeto, sao
elas:
3. Eixo menor: assemelha-se ao maior eixo, porem, neste caso baseia-se no menor
eixo da elipse;
5. Orientacao: retorna um escalar que especifica o angulo entre o eixo x e o eixo maior
da elipse que tem os mesmos segundos momentos da regiao;
43
6. Area convexa: retorna um escalar, que especifica o numero de pixels, em uma ma-
triz de elementos binarios, contendo o menor polgono convexo que pode conter a
regiao;
Figura 4.1: Comparativo atraves da tecnica Holdout, com taxa de treinamento de 50%, 75% e 90%. Fonte:
Elaborado pelo autor.
maior a taxa de treinamento, melhores serao os resultados obtidos, neste caso, o extrator estu-
dado neste trabalho obteve a porcentagem maxima de 75,4% de correta classificacao, enquanto
os extratores Momentos de Zernike e Forma conseguiram uma taxa de acerto maxima de 40,5%
e 40,8%, respectivamente. Com estes resultados, nota-se que, com relacao a primeira base de
imagens, o extrator estudado obtem bons resultados.
Observa-se que a taxa de erro visualizada no resultado de todos os extratores pode estar
diretamente vinculada ao fato da base abordada conter imagens com aspectos de forma seme-
lhantes. Na Figura 4.2 pode ser verificado um exemplo da semelhanca entre as especies Bettula
alleghaniensis e Bettula nigra, sendo a cor destas o maior diferencial.
(a) (b)
Figura 4.2: Comparativo entre as especies Bettula alleghaniensis e Bettula nigra. Fonte: Elaborado pelo
autor.
Visto que a coloracao da folha poderia auxiliar em sua identificacao, o extrator de cor
tambem foi testado e analisado, tanto isolado como juntamente ao extrator de forma, como
pode ser visto no grafico da Figura 4.3.
Figura 4.3: Comparativo entre os extratores de forma e cor e sua composicao na primeira base de imagens
utilizando a tecnica Holdout de validacao. Fonte: Elaborado pelo autor.
dados. Isto mostra a eficicacia deste extrator na base selecionada. A uniao dos dois extrato-
res retornou uma margem de acerto de 94,9%, apresentando melhoria e, demontrando que esta
juncao certamente proporcionou benefcios para a classificacao correta de forma geral.
Figura 4.4: Comparativo entre os extratores de forma e cor e sua composicao na segunda base de imagens
utilizando a tecnica Holdout de validacao. Fonte: Elaborado pelo autor.
Comprova-se que enquanto o extrator baseado na cor obtem bons resultados, aproximada-
mente 93% com 90% de treinamento, o baseado em redes complexas encara dificuldades em
distinguir as especies, conseguindo uma taxa de 55% tambem com 90% de treinamento dos
dados, ou seja, muitos erros de identificacao ocorreram e, isso pode ser melhor visto atraves da
matriz de confusao, apresentada na Tabela 4.1
Na matriz da Tabela 4.1 e posvel verificar que a classe que obteve a maior quantidade de
classificacoes incorretas (verifica-se pela linha da classe), atraves da marcacao em vermelho, foi
a classe b (betula alleghaniensis) com 5 classificacoes incorretas. Isto pode ter ocorrido pelo
fato desta classe possuir algumas folhas com variacoes dentro desta mesma especie, fazendo
46
Tabela 4.1: Matriz de confusao, aplicada na segunda base, utilizando o classificador K-NN, validacao Hol-
dout, com 90% de treinamento, e dados extrados pelo descritor de forma basedo em redes
complexas. Fonte: Elaborado pelo autor.
Classificado como
Classe real a b c d e f g h i j
a = Amelanchier canadensis 3 0 1 0 1 0 0 0 0 1
b = Betula alleghaniensis 0 2 1 0 0 1 0 3 0 0
c = Betula nigra 0 0 2 0 1 0 1 0 0 0
d = Carpinus betulus 1 0 1 2 0 0 0 0 0 2
e = Carpinus caroliniana 1 0 0 2 3 0 0 0 0 0
f = Castanea dentata 0 0 0 0 0 7 0 0 0 0
g = Cornus florida 0 0 0 0 0 0 4 0 0 1
h = Fagus grandfolia 0 1 0 0 0 0 1 1 0 0
i = Ulmus pumila 0 1 0 0 2 0 0 0 4 0
j = Zelkova serrata 0 1 0 0 1 0 1 0 1 5
com que estas diferencas aproximassem as caractersticas desta classe a outra distinta, sendo
classificada como tal.
Retornando a Figura 4.4 e confirmada a eficiencia do extrator baseado no histograma de
imagens coloridas aplicado a segunda base de folhas, visto que este juntamente com o extrator
de forma obtiveram uma taxa de aproximadamente 97% de acertos na classificacao com 90%
de treinamento dos dados por Holdout.
Os fatores determinantes a estes resultados estao ligados diretamente a diferenca entre a
coloracao e as pequenas variacoes da forma que os descritores conseguiram quantificar em
seus vetores. Os resultados, entao, se mostraram promissores, porem, mais testes deverao ser
realizados na tentativa de verificar a eficiencia do metodo desenvolvido na identificacao de
especies com aspectos tanto de forma como de cor semelhantes para de fato se ter um estudo
um pouco mais aprofundado dos extratores nestas situacoes. Apesar disto, o objetivo principal
deste trabalho foi alcancado, que aborda o estudo destes extratores nas bases de folhas com
finalidade de identifica-las.
Estudo aprofundado dos extratores baseados em cor e forma da folha para correta identificacao
da especie;
Segmentacao das nervuras das folhas a fim de encontrar padroes determinantes para me-
lhoria na classificacao entre especimes de uma mesma especie de planta.
49
REFERENCIAS BIBLIOGRAFICAS
BARBOSA, N. Uma analise determinstica para os modelos epidemiologicos SIR e SEIR: uma
introducao do modelo SEIR-E via algoritmo estocastico e redes complexas. Tese (Doutorado),
2009.
BOCCALETTI, S. et al. Complex networks: Structure and dynamics. Physics reports, v. 424,
n. 4, p. 175308, 2006.
CASANOVA, D.; BACKES, A. R.; BRUNO, O. M. Pattern recognition tool based on complex
network-based approach. Journal of Physics: Conference Series, v. 410, n. 1, p. 012048, 2013.
CHAKKARAVARTHY, S. S. et al. Automatic leaf vein feature extraction for first degree veins.
In: . Advances in Signal Processing and Intelligent Recognition Systems: Proceedings of
Second International Symposium on Signal Processing and Intelligent Recognition Systems
(SIRS-2015) December 16-19, 2015, Trivandrum, India. Cham: Springer International
Publishing, 2016. p. 581592.
COHEN, R.; HAVLIN, S. Complex networks: structure, robustness and function. [S.l.]:
Cambridge University Press, 2010.
DEOKAR, A. et al. Plant disease identification using content based image retrieval techniques
based on android system. Plant Disease, v. 3, n. 2, 2016.
DORETTO, G.; YAO, Y. Region moments: Fast invariant descriptors for detecting small image
structures. In: . Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference
on. [S.l.]: IEEE, 2010. p. 30193026.
DUBEY, S. R.; JALAL, A. S. Adapted approach for fruit disease identification using images.
arXiv preprint arXiv:1405.4930, 2014.
50
ERDOS, P.; ReNYI, A. On the evolution of random graphs. Publ. Math. Inst. Hungar. Acad.
Sci, v. 5, p. 1761, 1960.
HASIM, A.; HERDIYENI, Y.; DOUADY, S. Leaf shape recognition using centroid contour
distance. IOP Conference Series: Earth and Environmental Science, v. 31, 2016.
HAZRA, A. et al. Shape oriented feature selection for tomato plant identification. International
Journal of Computer Applications Technology and Research, v. 2, n. 4, p. 449454, 2013.
KADIR, A. et al. Leaf classification using shape, color, and texture features. arXiv preprint
arXiv:1401.4447, 2013.
LEE, K.-B.; HONG, K.-S. An implementation of leaf recognition system using leaf vein and
shape. International Journal of Bio-Science and Bio-Technology, v. 5, n. 2, p. 5766, 2013.
LUST, J. The Herb Book: The Most Complete Catalog of Herbs Ever Published. [S.l.]: Courier
Corporation, 2014.
MAHI, H.; ISABATEN, H.; SERIEF, C. Zernike moments and svm for shape classification in
very high resolution satellite images. 2014.
PHAM, N.-H. et al. Computer aided plant identification system. In: . Computing,
Management and Telecommunications (ComManTel), 2013 International Conference on. [S.l.]:
IEEE, 2013. p. 134139.
ROCHA, J. Cor luz, cor pigmento e os sistemas RGB e CMY. [S.l.]: Revista Belas Artes, 2011.
RUSS, J. The Image Processing Handbook, Sixth Edition. [S.l.]: CRC Press, 2011.
SUK, T.; FLUSSER, J.; NOVOTNY, P. Comparison of leaf recognition by moments and
fourier descriptors. In: . Computer Analysis of Images and Patterns: 15th International
Conference, CAIP 2013, York, UK, August 27-29, 2013, Proceedings, Part I. Berlin,
Heidelberg: Springer Berlin Heidelberg, 2013. p. 221228.