Professional Documents
Culture Documents
Dissertao de Mestrado
Orientador:
A999a
Banca examinadora:
AGRADECIMENTOS
Aos meus pais, por sempre terem colocado a minha educao em primeiro lugar e
por sempre terem se esforado para que eu pudesse realizar os meus objetivos. Aos meus
irmo pelo apoio, carinho, suporte e incentivo.
Aos colegas e amigos do Centro de Cincias Computacionais, por terem ajudado a
colocar em prtica as ideias e auxiliado de alguma forma na realizao do presente trabalho, dedico o meu apreo. Em especial, agradeo ao companheirismo e colaborao dos
colegas do grupo de Sistemas Computacionais e Tecnologias para Percepo.
Ao meu orientador, Prof. Dr. Ricardo Nagel Rodrigues, pela confiana em mim
depositada, pelos ensinamentos, pelo apoio e ajuda no desenvolvimento deste trabalho.
Por no ter medido esforos para, com dedicao, permitir uma argumentao clara e
concisa, tornando o trabalho mais tcnico e estimulante.
Aos professores Dra . Slvia Silva da Costa Botelho (FURG) e Dr. Ricardo Matsumura
de Arajo (UFPEL), pela disponibilidade e participao na banca de avaliao
Ao coordenador, aos professores e tcnicos do Centro de Cincias Computacionais C3 - FURG.
Migrate Company Sistemas de Informao LTDA por flexibilizar meu horrio de
trabalho, permitindo-me conciliar o trabalho com o curso de ps-graduao. CAPES
pelo apoio financeiro que permitiu que eu me dedicasse integralmente s atividades de
pesquisa.
RESUMO
ABSTRACT
STEFFENS, Cristiano Rafael. A Video Based Fire Detection System. 2015. 100 f.
Dissertao (Mestrado) Programa de Ps-Graduao em Computao. Universidade
Federal do Rio Grande, Rio Grande.
Automated fire detection is a research focus in computer vision since the early
90s. In this paper, we introduce and evaluate a new Video Fire Detection method that
aims to produce good results on steady and mobile cameras. Usually, computer vision
based fire detection algorithms are applied in scenarios with static cameras, such as
closed-circuit TV used in surveillance systems. The method we are proposing here, in
contrast, was developed so that it can be used not only in these conditions, but also for
automatic fire detection in videos obtained from mobile cameras. The use of mobile
cameras adds a lot of complexity by bringing variation in background, movement in
three axes, camera vibration and uncontrolled lighting conditions. The proposed method
uses statistical characteristics of fire like regions as input data for a Random Forests
classification model, frame-by-frame, in order to detect fire regions. These characteristics
are the color, the shape, the color skewness and dispersion measures considering pixel
value. In order to increase results given by the spatial properties,our method also uses
the flickering over a short period of time. The flickering properties are widely used as
a discriminant in the related bibliography, resulting in robust classifiers. The presented
results illustrate the applicability of the method, significantly increasing the precision and
recall metrics.
LISTA DE FIGURAS
Figura 1
Figura 2
Reflexo da luz . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Passo a passo da segmentao por Split and Merge . . . . . . . . . .
20
30
Figura 3
Figura 4
Figura 5
42
45
45
Figura 6
57
Figura 7
Figura 8
Figura 9
Figura 10
Figura 11
Figura 12
Figura 13
Figura 14
Figura 15
Figura 16
.
.
.
.
.
.
.
.
.
.
63
64
65
67
68
69
70
71
72
74
Figura 17
Figura 18
75
78
Figura 19
Figura 20
Figura 21
81
82
83
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
LISTA DE TABELAS
Tabela 1
55
Tabela 2
Tabela 3
Tabela 4
66
66
72
Tabela 5
Tabela 6
77
79
Tabela 7
Tabela 8
Tabela 9
85
86
Tabela 10
87
87
ABNT
ANN
CC
CCD
Charge-coupled Device
HMM
NP
FFT
HSV
FDDB
FDRB
OMT
RGB
ROI
Region of Interest
SIMD
SIFT
SURF
SVM
SSLT
VFD
SUMRIO
1 INTRODUO . . . . . . . . .
1.1
Objetivo . . . . . . . . . . . .
1.2
Recursos . . . . . . . . . . . .
1.3
Estrutura Do Texto . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
13
14
14
17
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
19
19
21
21
23
24
25
28
28
29
31
3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . .
3.1
Deteco de Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2
Deteco de Movimento . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1
Anlise da Oscilao no Domnio da Frequncia . . . . . . . . . . . . . .
3.2.2
Anlise da Oscilao Utilizando Fluxo ptico . . . . . . . . . . . . . . .
3.2.3
Anlise da Oscilao Utilizando Minerao de Dados . . . . . . . . . . .
3.2.4
Anlise da Oscilao com Base no Formato da Chama . . . . . . . . . . .
3.3
Deteco Baseada em Textura . . . . . . . . . . . . . . . . . . . . . . . .
34
35
40
41
43
46
47
49
. . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
52
53
56
56
57
5 AVALIAO ESTATSTICA . . . . . . . . . . . . . . . . . . . . . . . .
5.1
Classificao De Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2
Classificao da Oscilao . . . . . . . . . . . . . . . . . . . . . . . . . .
61
61
72
75
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
MTODO PROPOSTO . . . . . . . . . . . . . . . . . . . . . . . . . . .
7 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1
Casos de teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
81
TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . .
89
CONCLUSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
INTRODUO
14
1.1
Objetivo
Propr um detector de chamas com bons resultados no processamento de vdeos obtidos a partir de cmeras mveis e capaz de realizar deteco em tempo real minimizando
as taxas de falsos positivos e falsos negativos. No contexto, entende-se por deteco
o conjunto das atividades de detectar a existncia de chama na cena e apontar o local
onde ocorre. Ao final espera-se que os resultados do trabalho possam ser integrados ao
Framework CvWorks, um Framework para Viso Computacional de Alto Nvel que desenvolvido pela Universidade Federal do Rio Grande (FURG). De forma mais detalhada,
o trabalho enfatiza as seguintes questes:
Estudar os detectores utilizados em sistemas baseados em cmeras estacionrias;
Criar um dataset para deteco de fogo em vdeos com anotaes de ground truth;
Implementar alguns detectores de chama obtidos na bibliografia e verificar os resultados obtidos quando usados para deteco de imagens em vdeos de cmera
mvel;
Apresentar uma alternativa funcional para deteco e localizao de fogo a partir
de cmeras estticas;
Apresentar uma alternativa funcional para deteco e localizao de fogo a partir
de cmeras mveis;
1.2
Recursos
Dataset
15
Ferramentas de desenvolvimento
16
A OpenCV uma biblioteca Open Source de processamento de imagens com implementaes em C, C++ e Python. Ela implementa vrias funes de deteco de bordas,
reconhecimento de objetos, anlise de vdeos, fluxo ptico, descritores SIFT e SURF e
algoritmos de aprendizagem de mquina. Dentre as tcnicas de aprendizagem de mquina pode-se destacar Support Vector Machine, Redes Neurais com Back-Propagation,
K-means, K-Nearest Neighbors, Classificador Bayesiano e rvores de classificao.
Em algumas etapas, para descoberta de conhecimento utilizou-se tambm a ferramenta de minerao de dados WEKA (HALL et al., 2009). A WEKA foi utilizado para
seleo de melhores atributos e classificao utilizando rvores. A principal vantagem
de utilizar a WEKA que esta permite utilizar os mtodos de aprendizagem no dataset
e analisar os resultados obtidos com um tempo de setup mnimo. Utilizando a ferramenta possvel tambm encontrar a correlao entre os atributos. Em conjunto com a
WEKA (HALL et al., 2009) utilizou-se tambm editores de planilha e texto para prprocessamento.
Conforme citado na Sec. 1.1 os resultados deste trabalho devem ser integrados no
framework CvWorks. Trata-se de um framework de viso computacional desenvolvido
no Centro de Cincias Computacionais da Universidade Federal do Rio Grande (FURG)
que traz implementaes genricas, sendo voltado para uma ampla gama de aplicaes
independentes da representao dos objetos. O objetivo principal deste framework implementar cdigo reutilizvel, incluindo interface grfica, algoritmos de deteco de faces, tags de realidade aumentada, placas, instrumentos industriais, fogo e rastreamento de
objetos. O framework utiliza orientao a objetos e templates com o objetivo de se tornar
mais genrico e compatvel com outras bibliotecas de viso computacional.
Em nvel de aplicao o CvWorks dividido em trs partes assim definidas na arquitetura:
VisionGUI: Oferece uma interface grfica de uso geral que permite a visualizao
da sada do algoritmos de deteco e rastreamento.
C3 Scout: Voltado para aplicao em robs mveis utilizveis em ambientes externos e internos. O objetivo que o rob possa fazer uma ronda contnua, restrito
um ambiente pr-determinado, identificando ameaas e irregularidades. Nesta aplicao incluem-se funcionalidades de reconhecimento e rastreamento de pessoas,
deteco de armas, fogo e placas de automveis.
Field Vision: Voltado para a extrao de informao de plantas industriais a partir de
cmeras estticas e disponibilizao das mesmas atravs de protocolos industriais.
Esta aplicao inclui algoritmos para deteco e leitura de medidores analgicos,
status de registradores, leitura de nvel de tanque e deteco de fogo.
17
importante citar que como este no um software fechado ou voltado para uma finalidade especfica vrios fatores foram levados em considerao e impactaram nas decises
sobre o mtodo de deteco de fogo proposto. Quando trabalha-se com robs mveis e
viso ativa, como o caso da aplicao C3 Scout, torna-se impossvel fazer uma validao
utilizando como informao a variao no pixel ou na regio ao longo de uma sequncia
de frames. Tanto em cmeras acopladas a robs mveis quanto em cmeras estticas fazendo a superviso de uma planta industrial, o sistema ir se deparar com backgrounds
complexos e uma variedade de cenrios, com interao de pessoas, balanar de folhas, objetos deformveis, movimentao de equipamentos, atuadores e sinalizadores industriais.
As condies de iluminao no so controladas, o que aumenta o grau de dificuldade,
criando diferentes entradas dependendo de parmetros da cmera como balanceamento
de brancos e exposio.
1.3
Estrutura Do Texto
O captulo 1 introduz o problema da deteco de chamas baseada em vdeo, elucidando as principais dificuldades, objetivos e recursos utilizados, contextualizando assim,
o problema tratado neste trabalho.
No captulo 2 apresenta a evoluo dos sistemas de reconhecimento de objetos ao
longo dos anos e concebe uma viso geral das abordagens propostas. Faz-se um levantamento amplo das solues adotadas na tentativa de resolver o problema de viso,
considerando as subreas como representao de imagens, filtragem, deteco de bordas,
segmentao, anlise de texturas, reconhecimento de formas e objetos e da modelagem
matemtica dos principais descritores e matchers utilizados.
Na sequncia, o Captulo 3 faz a definio de termos e apresenta as tcnicas que
representam o estado da arte em sistemas VFD (Video Fire Detection). feita uma reviso
geral sobre o que o fogo e suas propriedades. Alm disso, so apresentadas as tcnicas
utilizadas na tarefa de detectar fogo usando apenas dados de vdeo. So apresentados os
trabalhos relacionados e discute-se seus resultados.
No captulo 4 apresenta-se o dataset utilizado para treinamento e avaliao dos detectores. Discute-se o processo de criao do ground truth, apresentando as caractersticas,
limitaes e convenes utilizadas. Na parte final, apresentam-se as mtricas pelas quais
os detectores so comparados.
A seguir, no captulo 5 faz-se uma detalhada avaliao sobre as propriedades e comportamento do fogo utilizando estatstica descritiva. Busca-se levantar dados para fundamentar a proposta de detector trazida no Captulo 5. Faz-se um estudo das caractersticas
que permitem que uma regio de fogo seja identificada atravs de um nico frame, avaliando apenas os dados espaciais e resultando em poucos falsos positivos.
O Captulo 6 apresenta a metodologia adotada neste trabalho, as tcnicas utilizadas
18
2.1
Fenmenos pticos
20
21
superfcie parea iluminada diretamente do seu interior. um fenmeno que ocorre por
exemplo quando a luz atravessa uma orelha humana.
Por fim, tem-se a inter-reflexo, fenmeno em que a luz refletida de um objeto atinge
outros objetos na rea circundante, iluminando-os. A inter-reflexo difusa trata especificamente da luz refletida a partir de objetos que no so brilhantes ou especulares, ou seja,
onde que a luz refletida por superfcies no-brilhantes, como o cho, paredes ou tecido,
para chegar a reas que no tem visada direta da fonte de luz. Se a superfcie difusa colorida, a luz refletida tambm colorida, resultando em colorao semelhante nos objetos
prximos.
2.2
Processamento de imagens
Nesta seco so apresentados os conceitos fundamentais sobre imagens digitais, espaos de cores, contraste, brilho, suavizao, realce e segmentao.
2.2.1
22
23
Bons detectores de bordas devem ser capazes de tratar estes tipos de rudo fornecendo
resultados confiveis. Cabe salientar que tanto as bordas quanto o rudo independente de
sinal apresentam variaes locais bruscas na intensidade dos pxeis e por este motivo a
borda definida pela conexo entre vrios pxeis que poderiam definir uma borda. Genericamente, todo detector de borda composto pelas etapas de diferenciao para avaliar
as derivadas desejadas da imagem, suavizao da imagem para remoo de rudo e etiquetagem para encontrar as bordas e aumentar a tolerncia ao rudo, suprimindo falsas
bordas.
Em relao aos tipos, a borda degrau (ou step edge) definida como um ponto onde
ocorre uma descontinuidade na escala de cinza. Para fazer sua deteco precisa-se fazer
um tratamento do rudo presente na imagem capturada e obter a derivada de primeira
ordem (onde as bordas sero indicadas pela mxima positiva ou pela mnima negativa) ou
obter a derivada de segunda ordem (onde as bordas so dados pelos pontos onde existe
passagem por zero). J para bordas linha, que so resultado da iluminao mtua entre
objetos que esto em contato, ou objetos pequenos em frente a objetos maiores, bordas
correspondem a extremos locais na imagem. Eles so localizados como cruzamentos em
zero da primeira derivada, mximas locais da laplaciana, ou ainda como mximas locais
da variao dos nveis de cinza ZIOU; TABBONE et al. (1998).
Por fim, uma juno um tipo de borda obtida quando duas ou mais bordas se encontram e pode ser localizada normalmente como pontos com alta curvatura, pontos com
grande variao na direo do gradiente ou ainda como pontos de cruzamento em zero da
laplaciana que apresentem uma alta curvatura.
Desde seu surgimento o nmero de detectores de bordas vem crescendo continuamente fazendo com que seja praticamente impossvel fazer um levantamento completo
dos algoritmos existentes. O que diferencia um detector de outro so os filtros de suavizao utilizados, os operadores de diferenciao, o processo de etiquetagem, a complexidade computacional e o modelo matemtico utilizado.
2.2.2
Os primeiros detectores de bordas baseados em gradiente ou em operadores Laplacianos, propostos a mais de 40 anos, se limitavam a operao de diferenciao. Os filtros
Sobel (SOBEL; FELDMAN, 1968) e Previtt (PREWITT, 1970) estimam o vetor de gradiente com base na operao de convoluo utilizando a mscara
1 0 1
x = a 0 a
1 0 1
para obteno das bordas em x, tendo a como um nmero real positivo (1 no caso de
Previtt e 2 para Sobel). J para deteco das bordas na direo y utilizado o seguinte
24
kernel de convoluo:
1 a 1
y = 0
0
0
1
a
1
Estas mascaras de convoluo resultam na primeira derivada parcial de uma rea de 3
x 3 pxeis. Para a estimativa Laplaciana utiliza-se a seguinte mscara:
0 1 0
= 1 4 1
0 1 0
Detector de Marr-Hildreth
25
XX
n
I(n, m)G(i n, j m)
(1)
G (x, y) = e
x2 +y 2
2 2
(2)
Depois disso aplica-se o operador Laplaciano. Na prtica, como a ordem das operaes no altera o resultado, costuma-se computar o Laplaciano da Gaussiana e depois
convolu-lo com a imagem original. O Laplaciano da Gaussiana, representado na litep
x2 + y 2 .
ratura pela sigla LoG (log of gaussian) definido pela Eq. 3, onde r =
Conforme apresentado em PARKER (2010) os resultados so significativamente afetados
variando-se os parmetros de tamanho e desvio padro da funo gaussiana. Para atender
ao ponto listado no incio desta seco que afirma que a viso do mamferos ocorre em
vrias escalas, este mtodo utiliza dois ou mais filtros LoG, combinando-os de modo que
somente sejam aceitas as bordas detectadas em mais de uma escala.
2 G =
2.2.4
r2 2 2 r2
e 2
4
(3)
Detector de Canny
26
Taxa de erros: o detector deve encontrar somente bordas e deve encontrar todas
elas. Nenhuma borda deve ser ignorada.
Localizao: a distncia entre a borda detectada e a borda real deve ser a menor
possvel.
Resultado: o detector no deve identificar vrios pxeis de borda quando apenas
uma borda existe.
Assume-se que as bordas degrau esto sujeitas a rudo branco Gaussiano. O detector
de bordas uma mscara de convoluo que suaviza o rudo e localiza a borda (CANNY,
1986). O problema maior identificar um filtro que otimiza estes trs critrios previamente estabelecidos. Segundo PARKER (2010) usualmente faz se uma aproximao
da melhor relao sinal-rudo utilizando a primeira derivada da Gaussiana. Tendo que a
Gaussiana dada pela Eq. 4 a primeira derivada dada ela Eq. 5. A gaussiana bidimensional dada pela Eq. 2.
x2
(4)
G(x) = e 22
x ( x22 )
)e 2
(5)
2
Para PARKER (2010) a melhor aproximao para o filtro timo de Canny G0 e
assim, ao convoluir a imagem de entrada com G0 obtm-se uma imagem E com as bordas realadas, mesmo que a original apresente rudo. A convoluo em duas dimenses
pode, no entanto, ter uma complexidade alta e por este motivo computa-se cada uma das
dimenses separadamente. Por fim, o filtro de Canny apresenta os seguintes passos:
G0 (x) = (
q
Ix0 (x, y)2 + Iy0 (x, y)2
27
28
2.3
Segmentao
Thresholding
A distribuio dos nveis de cinza pode ser utilizada para definir os nveis de threshold
a serem utilizados para a imagem binria. Um histograma mapeia o nmero de pxeis em
uma imagem que apresentam determinado valor de cinza como uma funo dos nveis de
cinza da imagem (FORSYTH; PONCE, 2002). Imagens reais raramente contm bordas
claras entre o foreground e o background, mas apresentam variaes graduais na escala
de cinza, resultando em picos e depresses no histograma. A tcnica de segmentao
utilizando thresholding uma das mais antigas, simples e frequentemente utilizadas (PAL;
PAL, 1993).
Objetos com valores de cinza prximos formam uma classe. O histograma de uma
imagem apresenta picos para cada um dos objetos encontrados e provavelmente um pico
maior que indica o background. Para diferenciar entre k classes de objetos necessrio
definir k thresholds, cada um definido entre dois picos. FORSYTH; PONCE (2002) re-
29
foram ainda que importante ter claro que histogramas conseguem diferenciar apenas as
classes de objetos, ignorando completamente qualquer informao espacial, o que indica
que um tabuleiro de xadrez, que tem uma distribuio caracterstica de blocos brancos
e pretos ter o mesmo histograma que uma imagem gerada aleatoriamente com cores
brancas e pretas.
2.3.2
So facilmente perceptveis as limitaes de um procedimento de segmentao atravs de um thresholding da imagem com um histograma global. Por este motivo,
desenvolveram-se algoritmos de segmentao que consideram os componentes conectados. O uso de componentes conectados adiciona a informao espacial aos dados extrados. Essa conexo entre pxeis com nveis de cinza semelhantes feita por um algoritmo
que encontra grupos de pxeis conectados atravs dos seguintes passos:
1. Varrer a imagem binria da esquerda para a direita, de cima a baixo.
2. Se existe um pxel no marcado com o valor 1 ele deve receber uma marcao.
3. Varrer recursivamente os pxeis vizinhos deste e marc-los com o mesmo valor,
caso no estejam marcados com 1.
4. O processo termina quando todos os pxeis de valor 1 so marcados.
ZHANG (1996), PAL; PAL (1993), PARKER (2010), FORSYTH; PONCE (2002)
apresentam variaes deste algoritmo buscando obter melhores resultados em termos de
custo computacional e preciso da segmentao, mas a ideia essencial mantida, embora
busque-se fugir do uso de programas recursivos e utilizar algoritmos sequenciais. Duas
abordagens principais podem ser destacadas (HOROWITZ; PAVLIDIS, 1976):
Mesclando ou bottom-up: A imagem dividida em vrias pequenas regies (eventualmente coincidindo com um nico pxel), que so ento fundidas para formar
regies maiores. Enquadram nesta categoria o trabalho de BRICE; FENNEMA
(1970) e outros que buscam digitalizar sequencialmente, da esquerda para a direita,
a forma de onda para determinar o intervalo mais longo de tal forma que uma aproximao feita de acordo com uma tolerncia previamente estabelecida.
Dividindo ou top-down: A imagem dividida sucessivamente em regies cada vez
menores at que certos critrios esto preenchidos. Na poca em que HOROWITZ;
PAVLIDIS (1976) foi publicado, poucos algoritmos utilizavam esta abordagem.
O algoritmo de Split and Merge o mais simples para crescimento de regies, ou, em
ingls region growing. Uma apresentao feita na figura 2. Neste algoritmo as regies
30
Figura 2: Passo a passo da segmentao por Split and Merge (MUBARAK, 1997)
Outro algoritmo bastante conhecido como Phagocyte Algorithm ou boundary melting. Neste algoritmo a ideia central relaxar os limites fracos entre duas regies permitindo que elas sejam mescladas. Primeiro, pares de pontos vizinhos so ligados para
formar um conjunto se tiverem o mesmo valor de cinza, ou assim chamadas, regies atmicas. Ou seja, se os pxeis tm a mesma intensidade e so 4-conectados, ento podem
ser unidos formando regies conexas. Na prxima etapa, heurstica da fagocitose, regies
menores so englobadas por regies maiores segundo o seguinte critrio: Sejam P 1 e P 2
os comprimentos das bordas de duas regies R1 e R2, respectivamente. Seja |I| o comprimento da fronteira I entre R1 e R2. Seja |W | o comprimento das partes "fracas" da
borda, por exemplo, o comprimento de W I onde a diferena absoluta entre os nveis
de cinza de R1 e R2 menor do que um certo 1 .Por este algoritmo, pode-se afirmar que
duas regies, R1 e R2 , so ligadas entre si se
|W |
>2
min(|P1 |, |P2 |)
31
3
4
De acordo com MUBARAK (1997), este mtodo produz uma segmentao aceitvel
para imagens simples com poucos objetos e pouca textura. Duas heursticas so utilizadas:
weakness e phagocyte. Se a relao entre o nmero de pontos em bordas fracas e o nmero
total de pontos na borda que separa uma regio da outra satisfaz a um threshold prdeterminado, ento essas regies so mescladas. Contudo essa heurstica tende a sobremesclar reas e por este motivo utiliza-se uma heurstica que faa um controle levando
em conta o modelo da regio resultante.
A semelhana LH entre as duas regies dada por
LH =
P (H1 )
P (H2 )
2.4
Deteco de Movimento
32
(2006) fazem uma ressalva esta abordagem afirmando que se os objetos no tiverem
textura suficiente ela pode no permitir uma deteco precisa do movimento e a posio
do objeto no estimada em tempo real. Para tratar estes problemas, foi proposta uma
tcnica que considera a diferena entre os quadros t e t 1 e t e t 2 de modo a evitar
o surgimento de fantasmas que apresentado pelas tcnicas anteriores (COLLINS et al.,
2000). Este sistema amplamente utilizado em ambientes externos com imagens de baixa
profundidade de campo.
Por outro lado, a deteco de movimento utilizando background subtraction utiliza-se
de um modelo do plano de fundo para compar-lo com o quadro atual. Estes algoritmos
resolvem os problemas apresentados pelos mtodos que utilizam frame difference e usualmente gera bons resultados na segmentao dos objetos que apresentam movimento.
Um tratamento especial necessrio para lidar com os variaes na luminncia e os objetos que iniciam ou terminam seu movimento durante a sequncia de quadros. Isto inclui
por exemplo pessoas andando e automveis que param no meio da cena. Para resolver
este problema vrias tcnicas foram propostas, dentre as quais pode-se destacar os mtodos baseados em mdia e varincia como Weighted Moving Mean, Weighted Moving
Variance, Adaptive Background Learning, Temporal Mean, Adaptive Median apresentado em MCFARLANE; SCHOFIELD (1995) e Temporal Median proposto em STAUFFER; GRIMSON (1999). Entre os mtodos baseados em mistura de gaussianas pode-se
destacar as publicaes STAUFFER; GRIMSON (1999) e BOUWMANS; EL BAF; VACHON (2008). Na literatura pode-se ainda encontrar diversas propostas que utilizam
lgica Fuzzy, redes neurais ou modelos de cor e textura para separao entre o primeiro e
segundo plano.
As mais simples fazem uma composio do backgroud utilizando uma composio
convexa dos pxeis no segundo plano no tempo t 1 e os pxeis da imagem no tempo
t. Assume-se geralmente que o segundo plano menos dinmico do que o objeto a ser
rastreado e que este distribudo de acordo com uma Gaussiana unimodal. comum
que esta modelagem do segundo plano falhe ao lidar com mudanas bruscas ou casos em
que o fundo no possa ser dado por uma funo Gaussiana unimodal. Esta premissa
considerada no mtodo Pfinder apresentado em WREN et al. (1997).
Uma das tcnicas mais populares de background subtraction e amplamente conhecida
pela sigla MoG foi proposta em STAUFFER; GRIMSON (1999). A modelagem do backgroung utilizando mistura de gaussianas em nvel de pxel tornou-se muito popular devido
sua eficincia em modelar distribuies multi-modais do segundo plano, o que ocorre
por exemplo com rvores balanando, ondas no oceano e reflexo da luz. Uma segunda
caracterstica importante que ela se adapta bem s mudanas no fundo (MIGLIORE;
MATTEUCCI; NACCARI, 2006).
Cada pxel modelado como uma mistura de gaussianas e o modelo gerado atravs
de uma aproximao. As distribuies gaussianas so ento avaliadas para determinar
33
quais apresentam a maior probabilidade de serem do background. Cada pxel classificado como parte do plano de fundo de acordo com a distribuio gaussiana que o
representa, permitindo a obteno de resultados estveis em rastreadores outdoor, onde a
confiana depende das variaes na iluminao, movimentos desordenados repetitivos e
variaes na cena STAUFFER; GRIMSON (1999).
Para este trabalho foram testados alguns destes modelos com o objetivo de suprimir os
falsos positivos remanescentes das tcnicas de classificao de fogo, utilizando segmentao por cor, frequncia de oscilao e formato do contorno. Como a pesquisa se prope a
suprimir as dificuldades com segundo plano dinmico, condies distintas de iluminao,
variao de posio e oscilao das imagens obtidas atravs de cmeras no estacionrias,
espera-se que o mtodo tenha baixa sensibilidade aos parmetros da cmera e que possa
ser facilmente incorporado em outras solues. Consideraes mais detalhadas a respeito
dos resultados atingidos quando as tcnicas de deteco de movimento foram aplicadas
sobre o dataset introduzido na Sec. 1.2.0.1 so apresentados no Cap. 7.
TRABALHOS RELACIONADOS
As tcnicas de processamento de vdeo para deteco e anlise de fogo so relativamente novas quando comparadas com outras tcnicas dentro da viso computacional.
Considerando-se o problema dentro de um contexto maior de aplicaes, seja dentro da
indstria ou mesmo em sistemas de vigilncia, fcil perceber a importncia de uma deteco rpida de incndios e outros incidentes envolvendo fogo no controlado. Existe
uma necessidade de anlise inteligente de contedo em vdeo para auxiliar vigilantes a
identificar os eventos logo que eles ocorram. Quanto antes o fogo detectado, maiores
so as chances de evitar que este se alastre, causando danos e colocando a vida de pessoas
em risco.
Nos ltimos anos, tcnicas de deteco de fogo atravs de vdeo (em ingls Video
Fire Detection - VFD) tem sido alternativas viveis ou complementos para os sistemas de
deteco de incndio convencionais, como os baseadas em sensores de fumaa, e tm se
mostrado teis para resolver vrios problemas relacionados com os sensores tradicionalmente utilizados. Sensores convencionais so geralmente limitados a ambientes fechados
por exigirem uma proximidade com o fogo, o que os torna inadequados para ambientes
como centros comerciais, aeroportos, estacionamentos ou mesmo florestas. Outra limitao dos sistemas de alarme de incndio convencionais que pode levar um longo tempo
para partculas de carbono e fumaa acionem o detector, o que os autores costumam chamar de atraso do transporte. J quando so utilizadas cmeras de vdeo para a deteco,
este atraso no ocorre pois a cmera pode identificar as chamas imediatamente (ETIN
et al., 2013).
Os primeiros estudos neste campo de pesquisa ocorreram no final da dcada de 90.
Vrias abordagens, de maior ou menor complexidade de implementao, foram propostas
com a finalidade de criar um bom detector de fogo. Inicialmente existia uma nfase maior
na deteco da chama, mas atualmente vrios trabalhos vem abordando tambm a fumaa.
A maioria dos detectores atuais funciona combinando detectores de cor e caractersticas
de borda com uma anlise temporal do formato da chama e o seu comportamento. ETIN
et al. (2013) ressalta que, no entanto, devido a variedade de formas e comportamentos
que o fogo e a fumaa podem assumir (cor, transparncia, temperatura ou cintilao)
35
muitos dos detectores considerados como estado da arte continuam apresentando falsos
positivos. Devido a estas caractersticas, aliadas a outros fatores como o rudo, sombras e
mudanas de iluminao, a deteco de fogo permanece sendo um grande desafio para os
pesquisadores.
Apesar de ser um assunto relativamente novo, a deteco de fogo baseada em vdeo
j produziu resultados promissores. No entanto no um problema completamente resolvido, assim como a maior parte dos problemas de viso computacional. O comportamento
da fumaa e das chamas de um incndio no controlado varia com a distncia e iluminao. Alm disso, diferentes cmeras podem produzir diferentes imagens e vdeos para a
mesma cena por causa de suas configuraes internas e algoritmos (ETIN et al., 2013).
3.1
Deteco de Cor
A grande maioria dos detectores de chama tem na cor uma informao primordial
para seu funcionamento. A maioria dos filtros utiliza o esquema de cor RGB, e em alguns
casos, ele combinado com HSI/HSV, como por exemplo em CHEN; HE; WANG (2010),
CHEN; WU; CHIOU (2004), GNAY et al. (2010). Isto se deve, segundo ETIN et al.
(2013) ao fato de a maioria das cmeras trabalharem com RGB e existir uma associao
espectral bvia com este espao de cor. Da mesma forma trabalha-se com a ideia de
que reas de fumaa apresentam nveis prximos em cada um dos canais de cor quando
trabalhando com o esquema de cor RGB.
A cor da chama vista pelo olho humano geralmente algo entre vermelho e amarelo.
A maioria das tcnicas de classificao de fogo com base na cor partem deste pressuposto.
CHEN; WU; CHIOU (2004) propem um modelo de classificao utilizando o espao de
cor RGB, que aplica avaliao da crominncia e medidas de desordem de forma a extrair os pxels que representam regies de chama ou fumaa. O mtodo utiliza valores de
threshold fixados empiricamente. Um pxel pode ser considerado fogo se atender as condies da Eq. 6 onde ST e RT so os limiares de saturao e vermelho. A mesma equao
foi utilizada posteriormente em CHENEBERT; BRECKON; GASZCZAK (2011) para
separar segmentar as regies pela cor e ento extrair dados da textura.
R > RT
P (x, y) = R G > B
S ((255 R) S )/R )
T
T
(6)
PHILLIPS III; SHAH; VITORIA LOBO (2002) utiliza a informao do espao de cores RGB e a variao temporal dos pixeis para a deteco do fogo. O processo realizado
em 3 etapas:
1. Criao de pares de imagens em que cada par consiste em uma imagem colorida
36
contendo chamas e uma mscara binria que aponta onde o fogo est presente. Dez
imagens so utilizadas.
2. Construo de um histograma de cor onde para cada pxel marcado como chama
uma distribuio gaussiana ( = 2) das cores adicionada. Para os pxels marcados como no fogo uma distribuio gaussiana menor ( = 1) subtrada do
histograma.
3. Threshold do histograma de forma a resultar em uma funo que recebendo os
valores RBG de um pxel retorna um valor booleano que indica se o mesmo fogo
ou no.
Como o fogo pode ser translcido e, em alguns casos, dispersar-se de forma a no ser
detectvel atravs da tcnica proposta, uma mdia das estimativas de um curto perodo de
tempo utilizada. De forma resumida, somam-se as sadas do pxel durante n frames da
sequncia e divide-se por n. Atravs do mtodo de pesquisa experimental mostrou-se possvel utilizar um n entre 3 e 7 com vdeos gravados a 30 FPS. A mdia deve ser maior que
1
para que o pxel seja considerado como fogo (PHILLIPS III; SHAH; VITORIA LOBO,
2
2002).
HORNG; PENG; CHEN (2005), por sua vez, faz uma converso de RGB para HSI
utilizando uma equao prpria, mais conveniente para o processamento, utilizando uma
escala de 1 360 para cada canal HSI. Em seguida, aplicado um mtodo de segmentao
pela cor para classificar regies com aparncia semelhante fogo, removendo posteriormente os pxels saturados ou com pouca intensidade, tais como fumaa e regies com
reflexo da luz. Como os autores no fornecem maiores detalhes sobre como os valores
de threshold foram definidos acredita-se que o fizeram de forma emprica. Depois desta
classificao, espera-se que as regies tenham sido propriamente classificadas. Contudo,
faz-se um tratamento de falsos positivos considerando principalmente dois fatores:
1. Devido reflexo das chamas alguns objetos tem a sua aparncia alterada de forma
que as caractersticas de crominncia ou luminosidade (color shift).
2. Objetos com cores semelhantes ao fogo so erroneamente classificados (falsos positivos).
Mesmo aps a classificao atravs da cor e o uso de frame subtraction para remover
objetos estticos com cor de fogo muitas regies continuam sendo classificadas erroneamente. Isto pode no ser um problema se o objetivo for apenas detectar a presena ou no
de chamas, contudo, se o objetivo for extrair dados sobre a localizao das chamas, ento
estes falsos positivos precisam ser eliminados. Ao examinar cuidadosamente o fenmeno
de color shift foi constatado que, dado que a cor alaranjada um reflexo da cor do fogo
37
na fonte, sua intensidade e saturao devem ser inferiores quelas encontradas no fogo
verdadeiro (HORNG; PENG; CHEN, 2005).
Continuando com as tcnicas de classificao baseadas em cor, (CELIK et al., 2007)
propem um modelo estatstico de cor combinado com subtrao de background para
fazer a segmentao das reas de fogo. O plano de fundo modelado como uma gaussiana
unimodal. Para gerar o modelo estatstico de cor, os autores coletaram 150 imagens da
internet e as segmentaram em reges de fogo e no-fogo. Cinco regras so aplicadas
comparando o canal de cor vermelho (R) em cada pxel com a mdia na imagem e com os
outros canais de cor. O modelo proposto utiliza ainda um limiar no canal vermelho para
eliminar falsos positivos e tratar efeitos decorrentes da variao na iluminao. Um pxel
considerado como fogo se atender todas as condies apresentadas na Eq. 7:
R > Rm
R>G>B
(7)
CELIK; DEMIREL (2009) propem o uso do color space YCbCr para deteco de
fogo a partir da cor. Este mtodo contri um modelo genrico de classificao atravs de
crominncia para os pxels contendo chama. Cada pxel normalizado conforme o valor
da intensidade. Os autores argumentam que o algoritmo proposto utiliza o espao de cor
YCbCr para separar a luminncia da crominncia de forma mais eficaz que outros espaos
de cor. O desempenho do algoritmo proposto testado em dois conjuntos de imagens, um
dos quais contm fogo. Alm disso, o modelo de cores proposto pode ser utilizado para
a deteco em tempo real de fogo em vdeos. O modelo proposto apresenta uma taxa de
falsos positivos de 31,5%.
Apesar do espao de cor RGB poder ser usado para a classificao, ele apresenta a
desvantagem de depender da iluminao. Isso significa que, se a iluminao da imagem
mudar, a classificao do pxel provavelmente falhar. Alm disso, no possvel separar
o valor de um pxel em intensidade e crominncia. A crominncia pode ser utilizada em
modelos de cor de fogo em vez de modelar a sua intensidade. Isso d a representao mais
robusta para pxels que representam chamas. Por isso necessrio converter a imagem
RGB para um espao de cor onde a separao entre a intensidade e crominncia mais
discriminante. Por causa da converso linear entre RGB e YCbCr utilizou-se YCbCr
para modelar os pxels de fogo (CELIK; DEMIREL, 2009). A converso de RGB para
YCbCr obtida atravs da Eq. 8 onde Y a luminncia e Cb e Cr so respectivamente a
crominncia azul e a crominncia vermelha:
38
Y
0.2568 0.5041 0.0979
R
16
(8)
O passo seguinte a obteno das mdias para cada canal no frame e a validao da
cor de acordo com as regras apresentadas na Eq. 9.
Y > Cb
Cr > Cb
Y > Y
mean
P (x, y) =
Cb < Cbmean
Cr > Crmean
(9)
O valor de uma constante determinada atravs da anlise de uma curva ROC sobre
um dataset de 1000 imagens, cuja segmentao do ground truth foi feita manualmente.
Para cada valor de a taxa de falsos positivos e falsos negativos foi calculada. Considerando o custo do falso negativo maior que o do falso positivo os autores obtaram por
utilizar = 40, o que garantiu uma taxa de deteco de 90% e uma taxa de falsos positivos de 40%. Todas as imagens utilizadas eram diurnas, de ambientes externos e foram
obtidas por cmeras instaladas em helicptero. (CELIK; DEMIREL, 2009)
Um modelo de segmentao por cor utilizando o color space Lab proposto em CELIK (2010). O color space Lab tem cores uniformemente distribudas (cromaticidade
uniforme). A sua distribuio perceptualmete uniforme, a luminosidade separada da
cromaticidade e muitas vezes apresentada como a representao dos contrastes cromticos naturais do ser humano. A letra L na sigla corresponte luminosidade (lightness) e
a e b correspondem aos componentes de cor, baseados no modelo no linear de coordenadas CIE XYZ, sendo que a vai de verde a vermelho e b vai de azul at amarelo onde
as duas dimenses so combinadas originando novas cores. As regras de classificao de
um pxel como fogo com base na cor conforme apresentadas por CELIK (2010) so dadas
pela Eq. 10:
L > Lm
a > a
m
P (x, y) =
(10)
b > bm
b > a
onde Lm , am e bm representam os valores correspondentes mdia de cada canal. Um
pxel considerado como fogo somente se este satisfizer todas as regras apresentadas na
equao.
39
P (x, y) =
1, if P (Lab) ,
(11)
0, else
J NGUYEN-TI; NGUYEN-PHUC; DO-HONG (2013) combinam nove regras utilizando tanto o espao de cor RGB quanto o espao de cor YCbCr com o objetivo de minimizar falsos positivos. As regras visam eliminar regies de pele humana, definir como
regies de fogo apenas as regies que so assim detectadas em ambos os espaos de cor.
Estas regies se referem pele humana e amarelo puro, ao mesmo tempo que no excluem
regies brancas que geralmente se formam no centro das chamas. Depois disso aplicado
um algoritmo de Region Growing para tolerar pxels prximos que tenham aparncia parecida mas no tenham sido classificados como fogo dentro de alguma das regras do
filtro de cor. Embora no sejam fornecidas estatsticas NGUYEN-TI; NGUYEN-PHUC;
DO-HONG (2013) afirmam que mesmo combinando as nove regras ainda provvel que
muitas regies classificadas como fogo no correspondam exatamente a fogo. Por este
motivo so combinadas tcnicas de Frame Subtraction e Region Growing e acompanham
a oscilao com base na variao horizontal e vertical das regies classificadas.
40
3.2
Deteco de Movimento
seguro afirmar que a cor no pode, por si s, classificar uma determinada regio da
imagem como fogo ou no, pois existe uma enorme variao na cor, densidade, quantidade de luz gerada pelo fogo, condies de iluminao do ambiente ou mesmo elementos
do background que podem influenciar na cor capturada pela cmera e nos resultados da
converso de um color space para outro. Por este motivo, a maioria dos VFDs utiliza
tambm outras caractersticas como o formato da chama, textura, movimento e relaes
espaciais.
Para determinar se o movimento decorrente de uma chama ou fumaa necessria uma anlise de uma sequncia de quadros. Usualmente, considerando que trabalhase com cmeras estacionrias, utilizam-se tcnicas background subtraction. Este o
caso de GNAY et al. (2010), CHEN; HE; WANG (2010), citettoreyin2005wavelet e
JIAO; WEIR; YAN (2011). Outros trabalhos como GMEZ-RODRGUEZ et al. (2002),
GOMEZ-RODRIGUEZ; ARRUE; OLLERO (2003) e KOLESOV et al. (2010) buscam
abordar o problema do movimento utilizando fluxo ptico ou anlise temporal como em
LEE; HAN (2007).
ETIN et al. (2013) afirma que muitas das abordagens iniciais baseavam-se apenas
na deteco de cor e movimento, mas esta abordagem usualmente resulta em falsos positivos. Uma anlise mais aprofundada necessria para atingir resultados mais acurados.
41
amplamente aceita a ideia de que o fogo oscila entre 1 e 10 Hertz e que isto independe do material que est queimando. Isto que permite que filtros no domnio da
frequncia sejam utilizados para distinguir fogo de objetos em movimento presentes na
cena. Os mtodos baseados nesta caracterstica utilizam o comportamento do pxel ao
longo do tempo. Esta premissa no valida para os primeiros instantes, quando o fogo
est iniciando e apresenta um comportamento completamente aleatrio. Neste estgio inicial impossvel perceber uma oscilao constante na frequncia. Para a fumaa tambm
no possvel obter resultados precisos baseados apenas na frequncia (ETIN et al.,
2013).
HAMINS; YANG; KASHIWAGI (1992) apresenta um estudo experimental realizado
com o objetivo de estudar a liberao de calor, dimetro das chamas e a frequncia de
pulsao do fogo considerando vrios combustveis gasosos e lquidos. No processo foram usados vdeos gravados a 30FPS. A frequncia de pulsao foi determinada a partir
da contagem do nmero de frames necessrios para que o vrtex completasse 50 ciclos.
Este processo foi repetido em diversas partes do vdeo para estimar a mdia e o desvio
padro da frequncia de pulsao. O experimento demonstrou ainda que a frequncia
fracamente correlacionada com a velocidade de liberao do combustvel, variando no
mximo 1,5 Hz.
A frequncia de oscilao utilizada para diferenciar chamas de outras fontes de luz
em movimento atravs da realizao de uma anlise de frequncia. No entanto, de acordo
com o teorema da amostragem de NyquistShannon, a frequncia de amostragem de um
sinal deve ser maior do que duas vezes a frequncia do sinal. Infelizmente, a taxa de
captura de vdeo , em geral, a 25 Hz (25FPS) na maioria dos sistemas de vigilncia. Esta
amostragem s pode revelar variaes de at 12,5 Hz, e no pode cumprir a exigncia de
amostragem. Alm disso, a transformao de sinais do domnio de tempo para o domnio
da frequncia custosa e afeta a eficincia do algoritmo de deteco (CHEN; HE; WANG,
2010).
TREYIN et al. (2006) utilizam a anlise no domnio da frequncia para acompanhar
o comportamento do valor no pxel dentro da regio que foi inicialmente classificada
como chama com base na cor e movimento. Neste caso, os autores fazem uma ressalva
afirmando que para funcionar adequadamente o vdeo deve ser capturado em no mnimo
42
20 FPS. Sabe-se contudo que quando ocorre undersampling existe um efeito de aliasing,
o que sugere que com um devido tratamento ainda seja possvel fazer a filtragem no
domnio da frequncia. Para a filtragem aplicou-se o filtro sobre o canal vermelho do
color scheme RGB. Um filtro de dois estgios que filtra as altas frequncias. Se o pxel
pertencer ao contorno da chama ento seu valor oscilar vrias vezes. Se for apenas um
objeto qualquer ento espera-se que apenas um pico seja gerado. O nmero de passagens
por zero durante alguns segundos (no especificado no paper) utilizado para classificar
os pxels utilizando um threshold qualquer.
natural que exista uma associao entre fogo e fumaa pois a presena do segundo
geralmente um indicativo de que o primeiro tambm est presente, mesmo que em
uma regio fora do campo de viso da cmera. TOREYIN et al. (2005) afirmam que a
oscilao/pulsao do fogo induz nas bordas da fumaa uma oscilao entre 1 e 3 Hertz.
Nos testes foram utilizados vdeos gravados 5 frames por segundo e utiliza-se um banco
de filtros de frequncia sobre os canais de cor YUV que permite pegar frequncias entre
0.625 e 2.5Hz.
A figura 3 apresenta o filtro de dois estgios utilizado. Xn [k, l] representa a variao
dos descritores de Fourier entre o frame n e n + 1. A decomposio em dois canais
constitui-se de um filtro passa-alta (-0.25, 0.5, -0.25) e um filtro passa baixa (0.25, 0.5,
0.25). Se o pxel apresenta alta frequncia de e en devem ser diferentes de zero. Pelo
contrrio, se o frame n permanece estvel com relao ao frame n + 1 ento estes sinais
devem ser prximos zero. A taxa de cruzamentos por zero de dn e en durante alguns
segundos utilizada para caracterizar as regies de fogo. Se este nmero for maior que
um threshold predeterminado (TOREYIN et al., 2005).
Figura 3: Filtro passa banda de dois estgios utilizado em ZHANG et al. (2008) e TREYIN et al. (2006). HPF e LPF representam respectivamente filtros passa-alta e passabaixa.
Na ltima etapa, a convexidade com o formato de regies de fumaa verificada.
A fumaa de um fogo no controlado se expande no tempo resultando em regies com
bordas convexas. Os limites das regies que contm "pxels candidatos"so verificados
quanto sua convexidade ao longo de linhas verticais e horizontais. Na implementao
foram utilizadas cinco linhas horizontais e cinco linhas verticais. A anlise consiste em
verificar se os pxels em cada uma das linhas pertencem regio em movimento ou no.
Pelo menos trs pxels consecutivos nas linhas que se cruzam nas regies movimento
43
Fluxo tico refere-se ao problema de estimar um vetor de distncia que mostre o deslocamento de um ponto em uma sequncia de imagens. Na formulao do problema de
fluxo ptico assume-se que um ponto, definido por (x1 , y1 ) de uma imagem obtida no
instante t deve ter um correspondente no instante t + 1. O deslocamento local, assumidamente pequeno, permite estimar o deslocamento do objeto observado nos frames
subsequentes (CYGANEK; SIEBERT, 2011).
As duas abordagens mais usuais para o problema do fluxo ptico so dadas por
HORN; SCHUNCK (1981) e LUCAS; KANADE et al. (1981). O algoritmo de HornSchunck o mais simples e embasa-se na ideia de que o brilho de um objeto sempre
constante (Brightness Constancy Assumption), fazendo com que seu movimento possa ser
identificado diretamente pelo valor do pxel. Assim, o gradiente de intensidade utilizado
para encontrar a melhor correspondncia entre dois pxels. J o mtodo de Lucas-Kanade
utiliza descritores Eigenvalue para encontrar a correspondncia entre caractersticas da
imagem e determinar o deslocamento.
Para deteco de fogo, KOLESOV et al. (2010) prope o uso de fluxo ptico OMT
(Optimal Mass Transport) como um descritor de baixo nvel. O processo de deteco
tratado como um problema de classificao Bayesiana onde as entradas so compostas
pelas velocidades OMT e pela cor no espao RGB. O classificador implementado como
uma rede neural de 1 camada oculta, sendo que os resultados apresentam a possibilidade
de cada pxel ser de fogo ou fumaa.
O problema de transporte de massa foi inicialmente formulado por Gaspar Monge em 1781, e focado em encontrar um caminho timo, no sentido de reduzir o custo do transporte, de transportar um volume fixo
de terra de um ponto para outro. Uma formulao moderna para este
problema foi proposta no trabalho de Kantorovich em 1947, sendo por
este motivo tambm conhecido como problema de MongeKantorovich
44
As abordagens que partem do pressuposto de que o brilho dos objetos constante entre
os quadros no so adequadas para a deteco de fogo e fumaa. Este pressuposto vlido
para objetos rgidos com uma superfcie Lambertiana, mas falha para materiais lquidos
ou gasosos. Na viso computacional, estes materiais devem ser modelados por texturas
dinmicas. As texturas dinmicas tpicas de fumaa e fogo possuem dinmica intrnseca
e, portanto, no podem ser capturadas de forma confivel utilizando fluxo ptico na sua
forma tradicional. Deve-se levar em conta tambm que a regio de fogo/fumaa tende a
apresentar um fluxo muito mais rpido do que a rea em torno dele (KOLESOV et al.,
2010).
KOLESOV et al. (2010) buscam criar um modelo de fluxo que represente melhor o
comportamento de fogo e fumaa baseando-se nos atributos fsicos deste processo:
Um atributo simples que fogo e fumaa tendem a conservar intensidade tomada como uma massa generalizada e mover a massa de uma
forma otimizada. Assim, uma restrio matemtica apropriada no a
preservao da intensidade, mas sim da conservao de massa ou conservao brilho (KOLESOV et al., 2010).
45
Figura 4: Mtodo de deteco de fogo proposto por MUELLER et al. (2013). A nfase
do trabalho est na extrao de caractersticas combinando transporte timo de massa e
magnitude e variao na direo das reas saturadas, criando um vetor 4D que utilizado
como entrada em uma rede neural.
na Fig. 5 uma varincia alta sugere que movimento em vrias direes (fogo), ao passo
que uma varincia pequena induz um movimento uni-direcional (objeto rgido).
Sobre a variao direcional das reas saturadas, MUELLER et al. (2013) defendem
que o mtodo proposto capaz de diferenciar o movimento das bordas da chama das
bordas de objetos rgidos presentes na cena e que apresentem movimento, ao quantificar
a varincia da direo do fluxo dos pxels em movimento. Conforme pode ser observado
na Fig. 5, uma varincia alta sugere que existe movimento em vrias direes (fogo), ao
passo que uma varincia pequena induz um movimento uni-direcional (objeto rgido).
(a)
(b)
Figura 5: Histograma normalizado das direes do fluxo ptico utilizando NSD conforme
apresentadas em MUELLER et al. (2013). Os dados foram obtidos a partir de dois vdeos,
ambos apresentando regies onde o brilho do objeto provoca saturao da imagem. Naturalmente o componente u corresponde ao deslocamento no eixo x e o componente v
corresponde ao deslocamento do pxel no ponto y.
46
com resoluo 240x360 pxels. De cada um dos 263 cenrios (169 contendo fogo e 94 sem fogo), 10 quadros consecutivos so rotulados como
ground truth fornecendo um banco de dados de teste de 2630 frames.
Note-se que os cenrios de fogo so escolhidos de forma a serem provveis falsos positivos, ou seja, apresentam movimento e/ou objetos com
cor de fogo, como carros, pessoas, folhas vermelhas e luzes. Uma rede
neural foi treinada em quadros de 20 desses vdeos que no so utilizados nos testes. O resultado do teste mostra que fogo detectado de
forma confivel usando fluxo ptico. A taxa de falsos positivos de
3,19% e a taxa de falsos negativos de 3,55%. Visto que apenas as caractersticas do fluxo ptico so exploradas considera-se que o mtodo
vivel para aplicao em grandes bases de dados (MUELLER et al.,
2013).
Em uma anlise qualitativa, 4 cenrios geraram erros de classificao produzindo falsos negativos (MUELLER et al., 2013):
Rudo estruturado no vdeo, apresentando linhas horizontais faz com que o movimento do fogo no seja capturado de forma adequada;
Distoro da cor do fogo pela cmera faz com que a estimativa de transporte de
massa falhe.
reas de chama muito pequena no geram movimento suficiente para serem detectadas atravs do mtodo.
Ocluso parcial do fogo, onde algum dos lados do fogo est oculto faz com que a
variao das direes do movimento no possam ser estimadas, levando o mtodo
a produzir falsos negativos.
Embora apresentem algumas limitaes claras, pode-se considerar que a deteco da
oscilao do fogo utilizando fluxo ptico representa uma alternativa promissora. Esta
abordagem relativamente nova e portanto existem poucos trabalhos publicados. Alm
dos trabalhos de MUELLER et al. (2013) e KOLESOV et al. (2010), que focam especificamente em deteco de chamas, CHUNYU et al. (2010) propem o uso de fluxo ptico
conforme apresentado em LUCAS; KANADE et al. (1981) para a deteco de regies de
fumaa. Em linhas gerais, o mtodo propem encontrar as regies de movimento utilizando fluxo ptico, fazer uma classificao baseada em oscilao e cor no color space
RGB utilizando uma rede neural e disparar um alarme caso fumaa seja detectada.
3.2.3
47
LI; WU (2012) e LI; WU (2011) utilizam o algoritmo de minerao de padres sequenciais PrefixSpan para identificar as sequncias mais comuns que pixeis de fogo assumem durante 8 frames. Para criar o que os autores chamam de "fire rules", os autores
coletaram diversos vdeos da internet, segmentando manualmente as regies que apresentam fogo. No sentido de reduzir as possveis regras e diminuir o espao de busca o valor
de cada pxel dividido por 8, fazendo com que os possveis valores para cada canal de
cor RGB passem de 28 para 25 , antes de ser utilizado para a minerao de sequncias
comuns reas de chamas. Mais detalhes sobre o funcionamento do algoritmo PrefixSpan
podem ser obtidos em PEI et al. (2001).
Assumindo que existem sequncias que ocorrem com frequncia um histrico de cada
pxel gerado e verifica-se se ele satisfaz as "fire rules" que foram anteriormente mineradas. Cabe salientar que uma vez minerados os padres o algoritmo PrefixSpan no mais
utilizado. Embora os dados estatsticos apresentados sejam incompletos e no apresentem por exemplo a taxa de falsos positivos e falsos negativos, LI; WU (2012) asseguram
que os resultados so melhores que os atingidos pelo detector proposto por CELIK et al.
(2007). impossvel reproduzir o experimento apresentado visto que os resultados podem variar dependendo dos dados utilizados para a minerao das sequencias, os quais
no so disponibilizados publicamente.
3.2.4
Aps uma validao dos pxels com colorao de chama possvel extrair regies e
determinar as caractersticas destas regies de forma a verificar se elas representam ou
no fogo. YAMAGISHI; YAMAGUCHI (2000) transformam a imagem de entrada de
RGB para HSV e verificam se a cor satisfaz as cores de chama. Os valores de H, S e V
so definidos atravs do mtodo experimental. Os dados de regies que apresentam cor
de fogo so ento projetados em um plano HS (Matiz e Saturao) e a varincia de H na
regio calculada. A regio que apresentar a maior varincia utilizada e uma elipse que
48
melhor acomoda a regio criada. Utilizando como base o maior eixo da elipse a regio
normalizada para um tamanho previamente estipulado. Argumenta-se que isso permite
detectar chamas mesmo que o tamanho da regio em chamas varie significativamente de
uma fonte para outra.
Quando uma regio apresenta colorao de fogo durante vrios quadros consecutivos
utilizada para encontrar o centro de massa das chamas e ento desenhar um crculo utilizando com o raio o maior eixo da elipse. As regies com colorao de fogo conectadas
a este crculo so ento extradas, sendo sua rea utilizada como parmetro para anlise
da oscilao. A distncia entre cada um dos pontos do contorno para o centro de massa
extrada durante vrios frames consecutivos gerando uma matriz que ento convertida para o domnio da frequencia atravs da transformada de Fourier, obtendo dados de
amplitude e fase. Desta forma, consegue-se separar fogo de outras fontes artificiais de
luz (YAMAGISHI; YAMAGUCHI, 2000).
Em caso de fogo, o componente de frequncia tende a se concentrar no
canto superior esquerdo (rea de baixa frequncia). J em caso de luz
artificial existe uma tendncia de a distribuio ser uniforme. (YAMAGISHI; YAMAGUCHI, 2000)
No entanto, devido a uma srie de condies que podem afetar diretamente o comportamento do fogo (YAMAGISHI; YAMAGUCHI, 2000) afirmam que impossvel atravs
deste mtodo fazer uma classificao precisa, optando ento por treinar e classificar as regies utilizando uma rede neural de trs camadas, que tem como entrada um vetor de
tamanho n n que correspondem a cortes de 10 x 10 na matriz bidimensional produzida
com a flutuao dos contornos. As possveis sadas do classificador so: fogo e no-fogo.
Outra proposta de deteco de fogo baseada no formato da regio classificada como
apresentando cor de fogo apresentada em ZHOU et al. (2010). O primeiro passo neste
caso a classificao de cor no color space RGB utilizando limiares estabelecidos a partir
de resultados experimentais. Para remover regies pequenas so utilizados os operadores
de eroso e dilatao. A partir disso, a classificao pode ser definida em quatro etapas:
Converter a imagem de entrada anteriormente classificada para uma em tons de
cinza e outra binria;
Executar operaes de dilatao e eroso para suavizar as imagens;
Remover regies pequenas preenchendo as com os mesmos valores da regio maior
onde esto englobados;
Classificar as regies como chama ou no chama com base nos contornos obtidos
atravs do detector de Canny utilizando os ltimos 20 frames.
A partir dos dados do contorno a regio classificada como fogo quando satisfizer a
regra 12 (ZHOU et al., 2010):
49
PS > PST
F = PC > PCT
P > P
R
(12)
RT
3.3
Alm das abordagens que utilizam o movimento para melhorar a classificao dada
pela cor, trabalhos recentes como CHENEBERT; BRECKON; GASZCZAK (2011) e
BORGES; IZQUIERDO (2010) passaram a utilizar tambm informaes de textura para
conseguir uma classificao utilizando apenas um frame do vdeo, ou uma imagem esttica. Este tipo de abordagem mostra-se mais adequado para cenrios onde cmeras no
estacionrias so utilizadas.
BORGES; IZQUIERDO (2010), trabalharam em um detector para a classificao de
vdeos de telejornais e noticirios, que foram previamente manipulados. Embora estabilizados, estes vdeos criam uma srie de dificuldades que no existem em vdeos estacionrios, como o movimento da cmera, cortes de cena e trepidao. Considerando que o
nico objetivo detectar a presena ou no de fogo no vdeo como um todo, os autores
afirmam ter atingido uma taxa de 0,68% de falsos positivos e nenhum falso negativo. Para
atingir este resultado, utilizam uma soluo que extrai dados de cor, posio do fogo na
imagem, formato da chama e textura, e um algoritmo de aprendizagem de mquina:
O mtodo proposto analisa as mudanas quadro a quadro utilizando caractersticas de baixo nvel para descrever as regies de fogo. Estas caractersticas so a cor, a rea, a granularidade da superfcie, a rugosidade
do contorno e a assimetria das regies de fogo. Devido oscilao e as
caractersticas aleatrias do fogo estas caractersticas so discriminantes importantes. O comportamento de cada uma destas caractersticas
avaliado e os resultados so ento combinados de acordo com um classificador Bayesiano de forma a obter uma deteco robusta. Alm disso,
informaes previamente conhecidas do fogo so utilizadas para melhorar os resultados da classificao. (BORGES; IZQUIERDO, 2010)
50
(13)
51
tipo de cmera utilizada e os objetivos especficos do trabalho afetam diretamente as tcnicas propostas. Pode-se ainda afirmar que a evoluo dos algoritmos de aprendizagem
de mquina permitiu que novas solues explorassem uma quantidade maior de caractersticas do fogo. Por outro lado, fica claro que a parte de gerao de descritores foi pouco
explorada ou no foi capaz de gerar bons resultados.
A existncia de um ground truth e de mtricas padronizadas fundamental para permitir a avaliao dos algoritmos e a evoluo das tcnicas de viso computacional. Apesar
de haver uma quantidade significativa de trabalhos publicados na rea, difcil comparar
e reproduzir os resultados de diferentes detectores de fogo. Neste sentido, fez-se necessria a criao de um dataset contemplando vdeos e anotaes, e tambm um esquema
de avaliao que se adaptassem aos trabalhos que so considerados o estado da arte neste
campo de pesquisa. Alm disto, acredita-se que a existncia de um dataset permita uma
evoluo natural dos algoritmos VFD representando para esta rea o mesmo que os datasets de reconhecimento de face, como os apresentados por BERG et al. (2004) e JAIN;
LEARNED-MILLER (2010), e os datasets de segmentao e reconnecimento de objetos,
como os apresentados em RUSSELL et al. (2008), XIAO et al. (2010), FEI-FEI; FERGUS; PERONA (2007), DENG et al. (2009) e SCHROFF; CRIMINISI; ZISSERMAN
(2011), representaram para as suas respectivas reas.
A utilizao de datasets proprietrios representa uma barreira avaliao independente dos algoritmos. Em um cenrio ideal na cincia, as partes interessadas precisam
ser capazes de reproduzir os resultados alegados, validando-os com o ground truth e avaliando os resultados. No entanto, durante o decorrer deste trabalho, no foi possvel
encontrar nenhum dataset pblico voltado para a avaliao de sistemas de deteco de
fogo baseados em vdeos de cmeras no-estacionrias.
Os vdeos utilizados em BORGES; IZQUIERDO (2010), pertencentes rede de emissoras de televiso alem Deutsche Welle GmbH., no so disponibilizados publicamente.
J CHENEBERT; BRECKON; GASZCZAK (2011) no fazem qualquer referncia aos
vdeos que foram utilizados para os testes. Quanto aos datasets utilizados para avaliao
de sistemas estacionrios como os apresentados em ELIK; OZKARAMANLI; DEMIREL (2007), CHEN; HE; WANG (2010), CELIK (2010), KOLESOV et al. (2010), LABATI et al. (2013) e ZHOU et al. (2010) so incompletos no sentido de no trazerem as
informaes de ground truth, caracterizando-se assim, como uma coleo de vdeos sem
qualquer informao adicional. A falta de informaes essenciais, como a contagem de
frames que representam fogo e no fogo, faz com que no seja possvel calcular mtricas
53
como a acurcia, especificidade, fall-out, taxa de falsos negativos, taxa de falsos positivos
e outras estatsticas relevantes.
De fato, a inexistncia de dados de ground truth e a falta de padronizao para avaliar
a sada dos algoritmos de deteco de chamas resulta em uma situao onde os resultados
so muito dependentes daquilo que os autores consideram como uma deteco correta.
Neste sentido, uma das contribuies deste trabalho a criao de um dataset novo, composto por 20 vdeos e suas respectivas anotaes. Os vdeos utilizados apresentam uma
variedade de dificuldades, incluindo ocluso, variao de escala, vibrao de cmera e diferentes caractersticas de brilho e contraste, de forma a se aproximar das condies que
os sistemas de deteco de fogo encontraro em situaes reais. Uma segunda contribuio neste sentido a apresentao de um esquema de avaliao completo, composto dos
seguintes artefatos:
Um algoritmo para encontrar a correspondncia entre a sada do detector de fogo e
as anotaes do ground truth.
Dois mtodos para a avaliao dos resultados atingidos pelo detector quando utilizado no dataset: um para verificar somente a classificao frame-a-frame e outro
que leva em considerao a posio da chama na imagem;
O cdigo-fonte e bibliotecas que implementam os mtodos propostos.
Alm de oferecer uma maneira de comparar diretamente as sadas de diferentes algoritmos, acredita-se que a existncia de um dataset aberto possa, em um futuro prximo,
permitir que outros pesquisadores utilizem abordagens baseadas em aprendizagem de mquina. Uma vez que o processo de avaliao automatizado e os artefatos de software
liberados simplificam a criao de dados de treinamento, os pesquisadores podem direcionar seus esforos no desenvolvimento de tcnicas e algoritmos mais avanados para
resolver o problema da deteco de fogo baseado em vdeo.
4.1
Dataset
54
55
URL
http://youtu.be/v6QVTIAUsf0
http://youtu.be/IQu_C7MRPUU
http://youtu.be/8DZWKaWEB6o
http://youtu.be/XnbVBMwP9fM
http://youtu.be/aIGTyBCMFb4
http://youtu.be/3C9t4J0BWa4
http://youtu.be/RhGYj9asHhI
http://youtu.be/WY89eGi834Y
http://youtu.be/aIGTyANMFb4
http://youtu.be/6uL1Y2W0jcI
http://youtu.be/MitnyQ4d_4g
http://youtu.be/G43DTnX8o0U
http://youtu.be/q6MZV88AvXo
http://youtu.be/Ij9EYxLW1Vs
http://youtu.be/pnOIP3f7Rww
https://youtu.be/UOHFTMLJ0TY
https://youtu.be/GVP6EQ4E7a8
https://youtu.be/5MQ_gD4MwEw
56
Artefatos de Software
57
4.2
Metodologia de Avaliao
Um dos principais desafios ao comparar diferentes sistemas de deteco de fogo baseados em vdeo a falta de um acordo sobre a sada esperada. Os resultados apresentados
em diferentes trabalhos so, neste sentido, muito dependentes da definio de deteco
correta que os autores consideram. Por este motivo, so propostas trs diferentes formas
58
de avaliao:
1. Frame-a-frame: onde o problema da deteco torna-se um anlogo do problema de
classificao binria, e cada frame possui uma classe que indica a existncia, ou
no, de fogo.
2. Baseada em localizao: onde so levadas em conta informaes de localizao da
chama na imagem, de forma semelhante ao que ocorre atualmente com os detectores de face e objetos.
3. Baseada em tempo: onde leva-se em considerao o tempo que o detector demora
para detectar a existncia de fogo.
Na avaliao frame-a-frame, cada frame uma instncia. Esta a abordagem utilizada com maior frequncia para avaliar os sistemas de deteco de chamas. Embora os
autores no explorem todo o potencial desta abordagem, pode-se afirmar que a mesma j
foi utilizada anteriormente em CELIK; DEMIREL (2009), ELIK; OZKARAMANLI;
DEMIREL (2007) and CHENEBERT; BRECKON; GASZCZAK (2011), onde o Recall
foi renomeado para taxa de deteco e a preciso foi renomeada para taxa de alarme falso.
Ao considerar um frame inteiro como fogo ou no-fogo, possvel calcular todas as mtricas que seriam calculadas para um classificador binrio. Estas mtricas incluem a taxa
de positivos verdadeiros T P R 1 , taxa de negativos verdadeiros SP C 2 , valor preditivo
positivo P P V 3 , valor preditivo negativo N P V 4 , taxa de falsos positivos F P R 5 , taxa
de falsa descoberta F DR 6 e a taxa de falsos negativos F N R 7 . As equaes correspondentes so apresentadas nas Eq. 14, 15, 16, 17, 18, 19 e 20, em que P e N representam
respectivamente a contagem de instncias positivas e negativas presentes no dataset, TP
e TN representam o nmero de verdadeiros positivos e verdadeiros negativos e FP e FN
representam os falsos positivos e falsos negativos.
TPR =
TP
P
(14)
SP C =
TN
N
(15)
TP
TP + FP
(16)
PPV =
1
TPR do ingls True Positive Rate, tambm conhecida como Recall, Sensibilidade ou Hit Rate.
TNR do ingls True Negative Rate, tambm conhecida como Especificidade.
3
PPV do ingls Positive Predictive Value, tambm conhecida como Preciso.
4
NPV do ingls Negative Prediction Value.
5
FPR do ingls False Positive Rate, tambm conhecida como Fall-Out.
6
FDR do ingls False Discovery Rate.
7
FNR do ingls False Negative Rate, tambm conhecida como Miss Rate.
2
59
TN
TN + FN
(17)
FP
N
(18)
F DR =
FP
FP + TP
(19)
F NR =
FN
FN + TP
(20)
NP V =
FPR =
Ao avaliar o problema da deteco de fogo como uma classificao binria framea-frame, possvel tambm calcular a acurcia ACC (Eq. 21), F1 Score (Eq. 22) e o
coeficiente de correlao de Matthews M CC (Eq. 23). Embora no tenha sido encontrado
um caso anterior onde estas mtricas tenham sido utilizadas, acredita-se que possam vir
a melhorar a avaliao da qualidade dos detectores, visto que, levam em conta tanto a
preciso quanto o recall, balanceando as taxas de falsos positivos e negativos.
ACC =
F1 =
TP + TN
P +N
2 PPV TPR
PPV + TPR
TP TN FP FN
M CC = p
(TP + FP )(TP + FN )(TN + FP )(TN + FN )
(21)
(22)
(23)
60
Si =
di gti
di
(24)
Uma vez que a abordagem baseada em localizao no permite a contagem dos valores
negativos no ground truth, somente podem ser calculadas as mtricas que independem dos
dados negativos. Utilizando apenas os dados positivos e considerando que, por definio,
a preciso a razo entre o total de instncias recuperadas corretamente em relao ou
total de instncias recuperadas, possvel calcul-la atravs da equao Eq. 25. J o
recall, que indica a quantidade de instncias relevantes que so recuperadas, pode ser
calculada, nesta abordagem, atravs da Eq. 26. D representa o nmero total de deteces,
enquanto G representa o total de anotaes presentes na parte do dataset que foi utilizada
para a avaliao. Por fim, pode-se calcular a similaridade mdia S atravs da Eq. 27
que fornece um ndice no discretizado da exatido que o detector atinge ao apontar a
localizao do fogo na imagem.
TP
D
(25)
GT FN
GT
(26)
LP P V =
LT P R =
S=
X Si
(27)
n
Outra informao fundamental para avaliar a qualidade de um sistema detector de
fogo o intervalo de tempo entre a deteco do fogo e a primeira vez que este aparece
nas anotaes do ground truth. A latncia Lt dada pela Eq. 28, em que min(di ) o
ndice do frame em que a primeira deteco ocorre e min(gtj ) o ndice do frame em
que aparece no ground truth. Usualmente, os detectores de fogo apresentam uma latncia
intrnseca devido ao uso de informaes de pulsao do fogo. Esta mtrica foi proposta
em YIN; MAKRIS; VELASTIN (2007) para avaliao de rastreadores de objetos, onde
os autores preferem o termo Critrio de Sobreposio Temporal.
Lt = min(di ) min(gtj )
(28)
Atravs do dataset e das mtricas de avaliao propostas, juntamente com os artefatos de software disponibilizados em https://github.com/steffensbola/furg-fire-dataset,
permite-se que os desenvolvedores possam avaliar de forma precisa os mtodos de deteco de fogo. Espera-se desta forma que os vdeos e anotaes de ground truth possam
representar para a deteco de fogo o que outros datasets representaram para reas como
deteco de face, deteco de objetos e segmentao, levando os seus resultados a nveis
em que possam ser aplicados na vida real.
AVALIAO ESTATSTICA
A avaliao estatstica permite criar uma descrio quantitativa dos dados observados. Atravs da tabulao dos dados, sumarizao, observao de medidas estatsticas
e grficos, busca-se entender as principais propriedades que caracterizam o fogo, bem
como, encontrar suporte para a proposio de um novo sistema de deteco de chamas.
Segundo GIL (2010), embora no se deva considerar os resultados estatsticos como uma
verdade absoluta, o mtodo estatstico se caracteriza por ter um razovel grau de preciso
e probabilidade de acerto, fazendo-se adequada para os objetivos deste trabalho.
A maioria dos sistemas VFD propostos anteriormente so estritamente voltados
para a deteco de chamas utilizando cmeras estacionrias. Muitos deles, como
GMEZ-RODRGUEZ et al. (2002), GOMEZ-RODRIGUEZ; ARRUE; OLLERO
(2003), ZHANG et al. (2008), CELIK; DEMIREL (2009), GNAY et al. (2009), TO STIPANICEV;
(2009), CHUNYU
REYIN; CETIN (2009), KRSTINIC;
JAKOVCEVI
C
et al. (2010), CELIK (2010), GNAY et al. (2010), ZHAO et al. (2011), LABATI et al.
(2013) so claramente voltados para a deteco de incndio em florestas e grandes ambientes abertos. Os trabalhos que mais se aproximam dos objetivos deste so BORGES;
IZQUIERDO (2010) e CHENEBERT; BRECKON; GASZCZAK (2011). Por este motivo, a maior parte das tcnicas que so apresentadas voltada deteco de fumaa,
deixando a deteco de chamas como uma tarefa secundria sob a alegao de que a presena de fumaa sempre antecede a presena de fogo, devido a ocluso gerada pela copa
das rvores. Tambm por serem voltadas ambientes abertos, a presena do sol, a tonalidade do cu e outros elementos naturais afetam como a cor percebida na cmera,
levando possivelmente a desvios da tonalidade real da chama.
5.1
Classificao De Cor
Considerando que grande parte da deteco do fogo passa necessariamente pela classificao do pxel com base na cor, buscou-se encontrar o melhor mtodo ao utilizar-se
tanto de referncias apresentadas no Cap. 3, quanto ao apresentar-se uma nova proposta
utilizando como estatstica descritiva e algoritmos de escolha de atributos, aplicada em
62
63
Figura 7: Segmentao manual das regies de chama para minerao de dados e anlise
estatstica. Todos os pxels contidos nas regies em azul so considerados como fogo e
todos os pxels marcados nas regies em amarelo so consideradas como no fogo. As
regies que no pertencem a nenhum retngulo no so utilizadas.
Atravs das estatsticas possvel obter um resumo das caractersticas e fazer algumas
inferncias sobre os dados. Combinando as informaes apresentadas na Fig. 8 com as
tabelas 2 e 3 pode-se verificar que, em regies de chama, o canal azul B tende a assumir
valores baixos, ao passo que, o canal verde G tende a acompanhar em menor grau o
crescimento do canal vermelho R. Pode-se atribuir esta caracterstica ao associar este
comportamento diretamente com o espectro de frequncia, dado que B representa ondas
curtas, G representa ondas mdias e R representa ondas longas. A maior parte das regies
de chama apresenta vermelho com intensidade alta, sendo que os valores abaixo de 120
no so representativos. Uma baixa intensidade da cor vemelha est associada a regies
de no fogo.
Assim como ocorre com o canal R, comum tambm a saturao do canal G nas
regies que apresentam chama, conforme observado na Fig. 8.c. A saturao do canal B
vista na Fig. 8.e, embora menos comum, est relacionada com a cor branca que ocorre
no centro da chama, onde o brilho mais alto. A maior parte dos pxels apresenta valores
baixos de azul. J nas regies onde no ocorre chama, Fig. 8.e, o azul est mais bem
distribudo. A Tab. 2 mostra que as mdias para R,G e B so respectivamente 93,15,
165,69 e 237,08 enquanto as medianas so 78, 161 e 252 fazendo com que exista uma
assimetria negativa no canal R e uma assimetria prxima a zero no canal G. Observando
a Fig. 8.a e 8.c pode-se afirmar que isto se deve, em grande parte, aos valores prximos aos
nveis de saturao nestes canais, que elevam a mdia e fazem com que a cauda esquerda
seja mais longa.
Considerando que o color space RGB pode ser representado por um cubo, onde cada
um dos seus componentes representa um eixo, buscou-se encontrar a distncia entre a
64
cor que representa o fogo e a cor que no representa fogo. No canal B ocorre a menor
diferena entre as duas mdias, 19,18. J para G a diferena entre as mdias apresentada
51,76, aumentando para 127,92 no canal R. A distncia euclidiana entre regies de
chama e regies ordinrias de 139,32. Finalizando a anlise estatstica do espao de cor
RGB, o desvio-padro do canal R um pouco mais da metade do canal G. A medida do
desvio padro neste caso indica a disperso das intensidades dos pxels amostrados. A
partir destes dados, pode se concluir que o fator discriminante na classificao por cor
o vermelho.
(a)
(b)
(c)
(d)
(e)
(f)
Figura 8: Histogramas de regies de fogo para o color space RGB. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
Analisando as estatsticas obtidas com relao ao color space HSV pode-se notar
claramente que a mdia e a mediana no canal H so muito prximas, alm de apresentar
um desvio padro pequeno. Observando os histogramas apresentados na Fig. 10a e 10b
e os graficos das Fig. 11a e 11b possvel verificar que grande parte dos pxels podem
ser classificados como chama ou no-chama utilizando como limiar superior o valor 50
no canal H. Embora existam instncias que apresentem valores acima disso, pode-se
(a)
(b)
(c)
(d)
(e)
(f)
Figura 9: Boxplot de regies de fogo para o color space RGB. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
Tabela 2: Estatsticas de cor nas regies de fogo. Os cabealhos correspondem respectivamente aos color spaces RGB, HSV, Lab e YCbCr.
B
G
R
H
S
V
L
a
b
Y
Cb
Cr
Mdia
93,15 165,69 237,08 32,39 162,44 200,78 156,53 147,38 170,47 146,63 166,02 85,74
Desvio Padro
59,31 58,78 30,50 24,59 38,86 66,92 60,68 20,25 18,99 59,98
21,25 21,87
78
161
252
26
162
233
161
151
174
148
169
85
Mediana
Distoro ou obliquidade 1,25
-0,03
-2,22 3,07
0,16
-1,22
-0,33
-0,29
-0,11
-0,19
-0,37 -0,21
0,77
0,24
-1,47 0,78
0,03
-1,44
-0,22
-0,54
-0,56
-0,07
-0,42 0,10
Assimetria de Pearson
Mnimo
0
0
35
0
32
15
10
109
114
14
117
30
Mximo
255
255
255
358
255
255
250
188
212
246
213
139
Amplitude
255
255
220
358
223
240
240
79
98
232
96
109
44,09 51,22 22,08 18,77 31,14 54,87 51,36 17,81 15,94 51,24
17,91 18,24
Desvio Mdio
Amplitude Inter-quartil
56
105
21
34
54
91
95
39
31
97
33
35
Tabela 3: Estatsticas de cor nas regies consideradas como no fogo. Os cabealhos correspondem respectivamente aos color spaces RGB, HSV,
Lab e YCbCr.
B
G
R
H
S
V
L
a
b
Y
Cb
Cr
Mdia
112,33 113,92 109,16 130,18 76,20 131,05 120,48 127,87 128,73 112,56 125,54 128,18
Desvio Padro
63,59 57,39 65,11 97,62 59,31 61,98 58,14
9,12 19,91 57,96 14,91
20,20
Mediana
99
105
103
100
59
122
115
128
132
103
127
125
Distoro
0,59
0,65
0,54
0,41 1,13
0,29
0,44
0,49
-1,22
0,67
-1,18
1,50
Assimetria de Pearson
0,63
0,47
0,28
0,93 0,87
0,44
0,28
-0,04
-0,49
0,49
-0,29
0,47
Mnimo
0
0
0
0
0
6
1
98
65
2
72
53
Mximo
255
255
255
358
255
255
255
185
198
255
200
194
Amplitude
255
255
255
358
255
249
254
87
133
253
128
141
Desvio Mdio
52,81 45,54 53,57 87,52 46,38 51,79 46,28
6,38 13,37 46,10 10,08
13,15
Amplitude Inter-quartil
95
74
94
172
70
95
76
9
16
75
13
14
66
67
(a)
(b)
(c)
(d)
(e)
(f)
Figura 10: Histogramas de regies de fogo para o color space HSV. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
68
(a)
(b)
(c)
(d)
(e)
(f)
Figura 11: Boxplot de regies de fogo para o color space HSV. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
69
(a)
(b)
(c)
(d)
(e)
(f)
Figura 12: Histogramas de regies de fogo para o color space Lab. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
representa uma diferena de apenas 34,08. O desvio padro no entanto de 59,98, fazendo
com que dificilmente o valor de H possa ser utilizado na deciso. Nota-se tambm que
existe um abrandamento da assimetria, isso implica dizer que dificilmente poder ser til
para a extrao de texturas. J os componentes de crominncia apresentados aqui so
melhores descritores que os apresentados no color space Lab.
Existe uma diferena de 42,44 entre as mdias para pxels de fogo e no fogo. Conforme pode ser observado na Tabela 2, para Cb o desvio padro para as regies de fogo
de 21,87 fazendo deste um bom descritor, pois apresenta uma distncia significativa entre as cores. J para os valores de Cr nota-se que no histograma da Fig. 14 existe uma
grande rea de interseco, mas como os dados ficam bastante compactados e apresentam
um desvio padro baixo, existe a possibilidade desses fatores auxiliarem na classificao
dos pxels.
Concluda esta anlise baseada na estatstica descritiva e conhecimento especfico sobre o comportamento das regies de chama, utilizou-se tambm a ferramenta de mine-
70
(a)
(b)
(c)
(d)
(e)
(f)
Figura 13: Boxplot de regies de fogo para o color space Lab. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
rao de dados WEKA apresentada em (HALL et al., 2009) para fazer a escolha dos
melhores atributos dentro dos espaos de cor acima apresentados. A principal vantagem
da utilizao da ferramenta que ela permite a aplicao de classificadores, agrupadores
e tcnicas de aprendizagem de mquina sobre um dataset com um setup time mnimo.
Para a seleo dos melhores atributos, utilizou-se o algoritmo proposto por HALL
(1999), que avalia o valor de um subconjunto de atributos considerando a capacidade que
cada atributo tem de individualmente predizer a classificao correta, assim como a redundncia entre os atributos. Atributos que apresentam uma alta correlao com a classe
e uma pequena intercorrelao so os selecionados. Este algoritmo, combinado com um
mtodo guloso, conhecido como Best First, mostrou que os atributos que, individualmente, oferecem a melhor representao de chama, e por isso mais discriminantes, so o
canal b do color space Lab, H do HSV, Cb do YCrCb. Vale notar, no entanto, que existe
uma correlao alta entre os canais b e Cb conforme j visto nos histogramas. Os clculos
da correlao com base nos valores de pxel extrados, mostram que Lab e YCbCr so
muito prximos, apontando uma correlao de 0,997 entre L e Y , 0,915 entre a e Cr e 0,988 entre b e Cb. Desta forma, no existe um ganho de informao significativo quando
Lab e YCbCr so utilizados em conjunto.
Como os resultados da classificao utilizando um mtodo guloso no permitiram
atingir uma concluso sobre qual color space que permite a melhor classificao, utilizou-
71
(a)
(b)
(c)
(d)
(e)
(f)
Figura 14: Histogramas de regies de fogo para o color space YCbCr. A coluna da
esquerda (a,c,e) representa os valores do canal para regies que apresentam fogo. A
coluna da direita (b,d,f) representa os valores do canal para regies que no apresentam
fogo.
se tambm a Anlise dos Componentes Principais (PCA). Com PCA um nmero grande
de variveis independentes pode ser reduzido sistematicamente de forma a resultar em um
conjunto coerente. PCA uma tcnica estatstica que utiliza uma transformao ortogonal
para converter um conjunto de observaes de variveis possivelmente correlacionadas a
um conjunto de valores de variveis linearmente descorrelacionadas chamadas componentes principais (DUNTEMAN, 1989).
Ao contrrio do que acontece quando considera-se apenas a capacidade individual de
classificao para cada varivel, os resultados da anlise utilizando PCA apontam que as
melhores caractersticas (canais de cor) esto nos color spaces RGB e HSV. Por ordem
de classificao, os atributos selecionados foram R, G, B, H e S. Estas informaes
foram consideradas posteriormente para a criao dos classificadores com base na cor
apresentados no Cap. 6.
72
(a)
(b)
(c)
(d)
(e)
(f)
Figura 15: Boxplot de regies de fogo para o color space RGB. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
Tabela 4: Oscilao dos pxels no tempo
R
G
B
Estatstica
F
NF
F
NF
F
NF
Mdias
19,27
3,71 18,98 2,79 19,27 3,71
Mnimo
0,93
0,22 1,12 0,00
0,94 0,00
76,63 24,00 45,47 12,57 76,63 24,00
Mximo
Mediana
19,48
2,60 19,06 2,10 19,48 2,60
Desvio Padro 11,57
3,36 7,74 2,36 11,57 3,36
5.2
Classificao da Oscilao
Conforme introduzido no Cap. 3, a pulsao e oscilao da chama outra caracterstica amplamente utilizada para sistemas baseados em cmeras estticas. No sentido de
obter mais informaes sobre o comportamento da chama foram realizados experimentos
considerando a oscilao do valor no pxel nos ltimos 20 frames. Para este teste, apenas
o espao de cor RGB foi utilizado.
A Tabela 4 sumariza os dados para oscilao dos pxels em cada um dos canais RGB
para regies de fogo e no fogo. Foram utilizados para esta estatstica dados de 295 pxels
que representam regies onde ocorre chama e dados de 806 pxels de regies sem chamas.
Nas regies sem chamas foram includas, alm de reas praticamente estticas, reas onde
73
74
(a)
(b)
(c)
(d)
(e)
(f)
Figura 16: Histogramas de oscilao do valor de pxel no tempo color space RGB. A
coluna da esquerda (a,c,e) apresenta os valores de desvio padro do pxel nos canais R, G
e B para regies que apresentam fogo. A coluna da direita (b,d,f) representa os valores do
canal para regies que no apresentam fogo.
MTODO PROPOSTO
Figura 17: Fluxograma do mtodo proposto: depois de passar por uma classificao dos
pxels com base na cor, os contornos so extrados e as regies so verificadas quanto
varincia e assimetria. Em seguida, uma anlise da sequencia de frames realizada,
consistindo essencialmente de filtros temporais no domnio da frequncia para vdeos de
cmeras estticas e da computao de deteces subsequentes para vdeos de cmeras
mveis.
76
Com a utilizao da Anlise dos Componentes Principais foi possvel identificar que
as variveis mais discriminantes na classificao so os canais de cor R, G, B, H e S dos
color spaces RGB e HSV. Os valores de cada um dos canais destes color spaces foram
utilizadas como entrada para a criao de um modelo de classificao utilizando Random
Forest. Random Forests so uma combinao de classificadores de rvores, tal que cada
uma das rvores dependa dos valores de um conjunto de instncias amostrados de forma
independente e com a mesma distribuio para cada uma das rvores treinadas. A taxa de
erros converge ao passo em que o nmero de rvores na floresta aumenta. A acurcia da
floresta depende de quo acurada cada uma das rvores que a compe e da correlao
entre elas. A sada do classificador obtida atravs de votao, onde a classe dada pela
moda BREIMAN (2001).
No Random Forests cada rvore da floresta treinada utilizando os mesmos parmetros, mas com subconjuntos de instncias diferentes. Estes subconjuntos so criados
utilizando a tcnica de bootstrap, onde, para cada subconjunto so selecionados cerca de
2
das instncias originais. Estas instncias so selecionadas com substituio, o que faz
3
com que algumas instncias sejam selecionadas mais de uma vez e algumas delas no
sejam utilizadas. A parte remanescente da amostra original, cerca de 13 dos dados que no
so includos no subconjunto de treinamento, utilizada posteriormente para a avaliao
do erro. A taxa de erros obtida atravs desta tcnica conhecida por OOB (out-of-bag).
Utilizando subconjuntos diferentes de instncias vrias rvores so criadas seguindo
a mesma abordagem proposta por BREIMAN et al. (1984). Cada n de deciso pode
utilizar um ou mais atributos, que podem ser selecionados seguindo duas abordagens. Na
primeira abordagem a escolha dos atributos do n completamente aleatria. Na segunda
abordagem leva-se em considerao a correlao linear entre os atributos. Cada n selecionado utilizando o ganho de informao considerando o indice Gini. Na prtica os
resultados mostram que a quantidade de atributos selecionados por n no est diretamente relacionada com os resultados obtidos. Utilizando 1 ou 2 atributos por rvore
possvel construir uma floresta com preciso alta. Ao final, a classificao atribuda
instncia testada dada por votao (BREIMAN, 2001).
No modelo de classificao dos pxels pela cor construdo para este trabalho, tem-se
como atributos os valores de cor em cada pxel. O atributo classe binrio, onde 0 e 1
indicam se a cor medida no pxel corresponde ou no a fogo. Os parmetros do algoritmo
de classificao utilizados so apresentados na Tabela 5. Para a criao do modelo foram
utilizados aproximadamente 1.870.000 instncias de treinamento, onde buscou-se fazer
uma separao 50/50 entre as classes.
Para o teste do classificador de pxels com base na cor utilizou-se um segundo conjunto de dados com aproximadamente 534.000 instncias. Do total de instncias utilizadas para teste, 86.39% foram classificadas corretamente, sendo que a taxa de falsos
positivos ficou em 12.99% e a taxa de falsos negativos ficou em 0.61%. Esses valores so
77
aceitveis dado que a classificao pela cor s a primeira etapa de um fluxo em cascata
e que a taxa de falsos negativos insignificante. A classificao com base na cor serve
como um pr-processamento para permitir a extrao de dados mais precisos, dado que as
caractersticas do fogo muitas vezes impedem a segmentao em regies de forma direta.
Aps a classificao individial dos pxels, obtem-se uma imagem binria sobre a qual
aplica-se o detector de bordas de Canny. Desta forma possvel extrair contornos (Fig.
18b) para as regies com colorao de fogo encontradas. Para cada contorno so extrados
dados sobre a rea, forma e proporo (altura/largura). Cada contorno corresponde a uma
regio sobre as quais so extrados os seguintes dados estatsticos:
Mediana por canal RGB;
Media por canal RGB;
Desvio Padro por canal RGB;
Assimetria de Pearson por canal RGB;
Aceitando a ideia de que uma regio de fogo raramente apresentar um formato de
alguma forma geomtrica, utilizou-se para a verificao da irregularidade do contorno a
mesma abordagem utilizada por BORGES; IZQUIERDO (2010), onde a relao entre
o permetro do contorno e o permetro do fecho convexo (Convex Hull) so utilizados
como medida de rugosidade. A rugosidade da borda definida atravs da equao 29
onde 2PS o permetro da borda e 2PCHS o permetro do fecho convexo. Para calcular
(29)
78
filtros Gabor e bancos de filtros Schmid, que foram inicialmente apresentados em SCHMID (2001). Uma avaliao experimental, no entanto, demostrou que estes descritores
eram incapazes de fornecer informaes adequadas, uma vez que uma das propriedades
da chama a falta de escala, podendo apresentar tamanhos muito diferentes na imagem.
Para representar esta caracterstica visualmente perceptvel, utilizou-se de uma abordagem que divide a rea de chama resultante da classificao dos pxels em 9 subreas,
conforme apresentado na Fig. 18c. Depois de obter um retngulo, que define a regio
de interesse englobando os pxels conectados de fogo, esta regio dividida em subreas,
numeradas de 1 a 9 a partir do canto superior esquerdo. O valor de cada sub-regio
calculado utilizando o valor em escala de cinza conforme a Eq. 30, em que R a mdia
da regio, e ri a mdia em cada uma das sub-regies. Pxeis que no apresentam cor de
fogo so desconsiderados e no influenciam o clculo da mdia.
vi = R ri
(a)
(b)
(30)
(c)
Figura 18: Distribuio das regies de chama: Imagem original (a), sada da segmentao
de cor (b), definio das regies de interesse (c) e separao das regies em sub-regies
para extrao das mdias (d).
Os dados de rea, proporo e irregularidade do contorno, combinados com as informaes estatsticas da regio, so ento processadas atravs de um segundo classificador
Random Forests completando a avaliao dos dados do frame e retornando quais das regies selecionadas realmente representam fogo. Para o treinamento desta rvore foram
extradas cerca de 22.090 instncias, das quais 6.709 descrevem regies de chama e as
13.381 restantes descrevem regies que apresentam cor de chama mas so falsos positivos
resultantes da etapa anterior (classificao pxel-a-pxel com base na cor). Os parmetros
utilizados para a gerao do modelo de classificao das regies so apresentados na Tabela 6. Para evitar sobreajuste (overfitting) utilizou-se a preciso e o nmero de nveis da
rvore como critrio de poda.
Para imagens obtidas a partir de cmeras mveis, como no possvel fazer uma
avaliao da oscilao do pxel ao longo do tempo, utilizando por exemplo frequncia e
varincia, estas informaes so suficientes para reportar a deteco. parametrizvel a
79
contagem mnima de frames sequenciais para que a deteco seja dada como definitiva.
Avalia-se tambm se a regio apresentou alguma alterao no valor do pxel, de forma a
suprimir falsos positivos causados por lmpadas, nvoa ou fumaa presentes na imagem.
J para cmeras estticas, o processo pode ser levado adiante, melhorando a preciso
atravs de um filtro temporal.
Na avaliao temporal utilizada a varincia do pxel nos ltimos 3 frames. O objetivo
aqui identificar as regies de borda do fogo dado que comum os valores de pxel
no centro da chama serem saturados no apresentando assim varincia alguma. Utilizase para isto o canal R do color space RGB, medindo a distncia em relao s medias
apresentadas na Tabela 4, 19.27 para regies de chama e 3.71 para regies de no chama.
A mdia entre estes valores 11.49. Uma imagem binria gerada atravs da Eq. 31,
onde P o desvio padro no pxel.
1, se 11.49
P
P (x, y) =
0, caso contrrio
(31)
A sada produzida pode ser utilizada dentro de uma arquitetura maior, para construir
sistemas de deteco e extino automtica de fogo. Da mesma forma, os resultados gerados podem ser armazenados para reviso futura e inspeo humana sem exigir deslocamento at o local. O mtodo proposto foi implementado no framework CvWork utilizando
a linguagem de programao C++ com as bibliotecas OpenCv e Boost. A implementao
de protocolos de comunicao industrial, leitura de sensores analgicos, integrao com
sistemas de supervisrio e controle, reconhecimento de faces e outros objetos foge ao
escopo deste trabalho, mas , conforme introduzido anteriormente parte do framework.
RESULTADOS
A primeira etapa do trabalho realizado consistiu em revisar a bibliografia e implementar parcial ou completamente os algoritmos propostos de forma a verificar os resultados
gerados e como os mesmos so impactados por uma situao de cmera no esttica.
previsvel que alguns mtodos previamente propostos falhem devido s condies para
os quais foram desenvolvidos. A validao dos classificadores feita para este trabalho
no pode, no entanto, ser generalizada de forma a diminuir os trabalhos citados, servindo
apenas como referncia na busca da soluo para um problema novo. Da mesma forma,
alguns dos trabalhos citados anteriormente no Cap. 3, pecam ao omitir detalhes, impedindo assim a implementao completa do detector para fins de comparao.
A Fig. 19 apresenta um resultado comparativo da primeira parte do processo de classificao. Ao separar os pxeis que apresentam cor de fogo dos que no apresentam cor
de fogo, nota-se que o mtodo proposto (f) visivelmente melhor que as tcnicas propostas por CHEN; WU; CHIOU (2004) (b), CELIK et al. (2007) (c), CELIK; DEMIREL
(2009) (d), CELIK (2010) (e), suprimindo a maior parte dos falsos positivos. J a Fig. 20
apresenta a utilizao dos mesmos classificadores em uma imagem que apresenta fogo.
Novamente, nota-se que a segmentao realizada apresenta resultados superiores, removendo, por exemplo, as regies com laranja constante, como a que ocorre nos coletes
utilizados pela equipe de resgate. Da mesma forma, as regies de fumaa tambm foram
suprimidas.
Os resultados da classificao pela cor so de extrema importncia dentro da proposta
apresentada, pois a partir destes que feita a extrao e processamento das outras caractersticas avaliadas. Uma segmentao ruim acaba prejudicando a extrao das estatsticas
por regio e consequentemente todo o restante do processo. O mtodo proposto como um
todo, foi testado utilizando o dataset introduzido no Cap. 4. Este dataset composto por
vdeos de cmeras no estticas, sendo que a maioria deles apresenta deslocamento nos
trs eixos. As anotaes do vdeo foram feitas quadro a quadro, na forma de retngulos
que contornam toda a rea que apresenta chama.
Para validar o mtodo proposto os resultados foram comparados com o mtodo de deteco de chamas em vdeo no estacionrio, apresentado em CHENEBERT; BRECKON;
81
(a)
(b)
(c)
(d)
(e)
(f)
Figura 19: Comparativo de segmentao de cor em imagens sem fogo obtida por CHEN;
WU; CHIOU (2004) (b), CELIK et al. (2007) (c), CELIK; DEMIREL (2009) (d), CELIK
(2010) (e) e pelo mtodo proposto (f).
GASZCZAK (2011). Este, conforme apresentado na Sec. 3.3 , tambm, um mtodo que
divide a deteco em duas etapas. Na primeira delas, utiliza uma equao com limiares
fixos nos espaos de cor RGB e HSV. Na segunda etapa, utilizando descritores de textura
como histogramas e dados de energia, entropia, contraste, homogeneidade e correlao
GLMC em 4 direes, um classificador de rvore treinado e utilizado. Desta forma,
foram utilizados os mesmos dados para o treinamento e avaliao de ambos os classificadores.
7.1
Casos de teste
Dois casos de teste foram criados para avaliar a capacidade de classificao e generalizao do sistema proposto. No primeiro caso, para cada um dos vdeos do dataset,
82
(a)
(b)
(c)
(d)
(e)
(f)
Figura 20: Comparativo de segmentao de cor em imagens com fogo obtida por CHEN;
WU; CHIOU (2004) (b), CELIK et al. (2007) (c), CELIK; DEMIREL (2009) (d), CELIK
(2010) (e) e pelo mtodo proposto (f).
os primeiros 300 frames (aproximadamente 31 do total) foram utilizados para gerar os dados de treinamento. A parte remanescente de cada um destes vdeos foi utilizada para os
testes. J para a criao do segundo caso de teste, 2 vdeos, foram completamente separados e no utilizados no processo de treinamento. Os mesmos modelos de classificao
gerados para o caso de teste I foram utilizados para classificar os vdeos do caso de teste
II.
83
Os dados de treinamento para a classificao das regies utilizando textura so gerados a partir da sada do classificador de pxeis utilizando a cor. Para o treinamento, os
dados foram gerados automaticamente levando em conta a interseco das regies detectadas com os retngulos de ground-truth. Como instncias positivas considerou-se que as
regies que representam fogo, utilizadas para o treinamento deveriam ter uma interseco
mnima de 0.8. J as regies que apresentam uma interseco menor ou igual a 0.1 foram
consideradas como instncias negativas pra o treinamento. Regies que no satisfazem
nenhuma dessas condies no foram utilizadas. O desbalanceamento entre as instncias
de fogo e no-fogo, foi tratado utilizando a tcnica de bootstrap, onde as instncias so
selecionadas aleatoriamente com substituio.
O comparativo entre os resultados atingidos utilizando os mtodos de ZHOU et al.
(2010), CELIK (2010), CHENEBERT; BRECKON; GASZCZAK (2011) e o mtodo proposto, para o caso de teste I, pode ser visto na Tab. 7, que apresenta a avaliao quadro a
quadro, e na Tab. 8, que apresenta os resultados considerando a localizao das deteces.
Estes dados levam em considerao que pode existir uma relao de 1-N entre as deteces e as anotaes do ground truth (ver Fig. 21). No total, 18691 frames, originados de
13 vdeos distintos, foram testados. Destes, 8095 frames contm anotaes sobre regies
de fogo no ground truth e 10596 no contm anotaes. Entende-se que, conforme as
mtricas de avaliao propostas, o resultado um falso positivo quando existe uma deteco, mas no existe nenhuma anotao de ground truth para o frame correspondente.
Entende-se por falso negativo a situao em que existe uma anotao feita por um humano
que aponta a regio de fogo, mas o detector no aponta tal regio.
84
(2010), no pde ser implementado para fins de comparao pois existem parmetros do
classificador Bayesiano que no foram explicitados no artigo e os dados de treinamento
no so publicamente disponveis. O mtodo de CHENEBERT; BRECKON; GASZCZAK (2011) foi utilizado na avaliao, sendo superado pelo mtodo proposto em todas as
mtricas avaliadas.
Na avaliao quadro a quadro, utilizando exatamente as mesmas amostras para ambos
os mtodos, o detector proposto resultou em 122 falsos positivos e 1.365 falsos negativos.
J o detector proposto por Chenebert resultou em 1.685 falsos positivos e 2.243 falsos
negativos. Assim, o Recall, ou sensibilidade, que a mtrica que indica a capacidade do
modelo para classificar instncias de uma determinada classe mostra que o percentual de
frames corretamente classificados como fogo 14,93 maior. J a especificidade, que
dada pela taxa de negativos reais, 17,47% maior. Da mesma forma, a preciso indica
que a probabilidade de as deteces reportadas pelo mtodo proposto serem corretas
26,54% maior que aquela atingida por CHENEBERT; BRECKON; GASZCZAK (2011),
passando de 0,776 para 0,982. Com relao ao valor preditivo negativo, que , neste caso,
o equivalente da preciso aplicado somente aos frames que no contm fogo, pode-se
afirmar que a melhora de 10,77% aumentando de 0,798 para 0,884.
Em relao ao fall-out, que calculado dividindo-se o nmero de falsos positivos pelo
total de instncias negativas no dataset, nota-se que existe uma reduo de 15,90% para
1,20%. A taxa de falsa descoberta exibe valores parecidos em decorrncia da distribuio
dos dados de teste (43% fogo/56% no fogo). J a taxa de falsos negativos apresentou
uma queda de 0,277 para 0,168, o que representa uma melhora de 21,29%.
A acurcia, que obtida ao dividir a soma dos positivos verdadeiros e negativos verdadeiros pelo total de frames testados, mostrou que o mtodo proposto classificou corretamente 92% das instncias testadas enquanto no mtodo proposto em CHENEBERT;
BRECKON; GASZCZAK (2011) 79% das instncias foram corretamente classificadas.
Isso representa uma reduo de 13% no nmero de frames classificados erroneamente. A
acurcia, embora seja amplamente utilizada na avaliao de modelos de classificao, no
pode no fornecer uma representao precisa do classificador e no leva em considerao
a matriz de confuso. Em outras palavras, isto significa que impossvel, utilizando
apenas a acurcia, avaliar a qualidade de um detector de fogo. Por este motivo, foram
calculadas tambm as mtricas F1 Score e coeficiente de correlao de Matthews.
A F-measure foi proposta em CHINCHOR (1992), como uma mtrica para combinar
preciso e recall em uma nica medida atravs da mdia harmnica. Quando utiliza-se a
preciso e o recall com o mesmo peso, esta medida recebe o nome de F1 Score. Considerando esta mtrica, o mtodo proposto melhora os resultados em 20,16% passando de
0,749 para 0,900. J o coeficiente de correlao de Matthews, apresentado inicialmente
em MATTHEWS (1975), tambm uma mtrica balanceada de avaliao das predies
dadas por um classificador binrio, preparado para lidar com o desbalanceamento das ins-
85
Tabela 7: Resultados do mtodo proposto na avaliao frame a frame. A coluna A apresenta os resultados de CELIK (2010), a coluna B apresenta os resultados de ZHOU et al.
(2010) e a coluna C apresenta os resultados de CHENEBERT; BRECKON; GASZCZAK
(2011). Todos os mtodos foram avaliados utilizando os mesmos dados de teste.
Mtrica
A
B
C Proposto
Recall (TPR)
0,434 0,843 0,723
0,831
0,241 0,187 0,841
0,988
Especificidade (SPC)
Preciso (PPV)
0,434 0,442 0,776
0,982
0,571 0,610 0,798
0,884
Valor preditivo negativo (NPV)
0,758 0,812 0,159
0,012
Fall-out (FPR)
Taxa de falsa descoberta (FDR)
0,565 0,557 0,224
0,018
0,236 0,156 0,277
0,168
Miss Rate (FNR)
Acurcia (ACC)
0,467 0,471 0,790
0,920
F1 Score
0,553 0,580 0,749
0,900
Coeficiente de correlao de Matthews (MCC) 0,005 0,041 0,569
0,843
86
87
Tabela 9: Resultados do mtodo proposto na avaliao frame a frame para o caso de teste
II. A coluna A apresenta os resultados CHENEBERT; BRECKON; GASZCZAK (2011).
Os mtodos foram avaliados utilizando os mesmos dados.
Mtrica
A Proposto
Recall (TPR)
0,990
0,966
0,724
0,842
Especificidade (SPC)
Preciso (PPV)
0,857
0,910
0,979
0,937
Valor preditivo negativo (NPV)
Fall-out (FPR)
0,275
0,157
Taxa de falsa descoberta (FDR)
0,142
0,089
Miss Rate (FNR)
0,009
0,033
0,890
0,919
Acurcia (ACC)
F1 Score
0,919
0,937
Coeficiente de correlao de Matthews (MCC) 0,773
0,827
88
TRABALHOS FUTUROS
90
desejvel.
Devido a falta de critrios objetivos para definir a rea da regio de fogo, uma das
propostas futuras que o dataset seja anotado por uma segunda pessoa, utilizando ento
as estatsticas de concordncia para melhorar a consistncia das anotaes de groundtruth. J no campo de pesquisa da aprendizagem de mquina, o problema de deteco de
fogo pode ser tambm abordado utilizando tcnicas de deep learning, como redes neurais
profundas ou redes neurais profundas convolucionais.
CONCLUSO
92
sentadas pelos outros mtodos estudados. Os prximos passos, apresentados com maiores
detalhes no Cap. 8, esto primariamente relacionados com a otimizao em nvel de cdigo e a integrao completa com o framework CvWorks.
93
REFERNCIAS
94
CELIK, T.; DEMIREL, H. Fire detection in video sequences using a generic color model.
Fire Safety Journal, [S.l.], v.44, n.2, p.147158, 2009.
CELIK, T.; DEMIREL, H.; OZKARAMANLI, H.; UYGUROGLU, M. Fire detection
using statistical color model in video sequences. Journal of Visual Communication and
Image Representation, [S.l.], v.18, n.2, p.176185, 2007.
ELIK, T.; OZKARAMANLI, H.; DEMIREL, H. Fire and smoke detection without sensors: image processing-based approach. In: EUROPEAN SIGNAL PROCESSING CONFERENCE, EUSIPCO, 15., 2007. Anais. . . [S.l.: s.n.], 2007. p.147158.
ETIN, A. E.; DIMITROPOULOS, K.; GOUVERNEUR, B.; GRAMMALIDIS, N.; GNAY, O.; HABIBOGLU, Y. H.; TREYIN, B. U.; VERSTOCKT, S. Video fire detection
Review. Digital Signal Processing, [S.l.], v.23, n.6, p.18271843, 2013.
CHEN, J.; HE, Y.; WANG, J. Multi-feature fusion based fast video flame detection. Building and Environment, [S.l.], v.45, n.5, p.11131122, 2010.
CHEN, T.-H.; WU, P.-H.; CHIOU, Y.-C. An early fire-detection method based on image
processing. In: IMAGE PROCESSING, 2004. ICIP04. 2004 INTERNATIONAL CONFERENCE ON, 2004. Anais. . . [S.l.: s.n.], 2004. v.3, p.17071710.
CHENEBERT, A.; BRECKON, T. P.; GASZCZAK, A. A non-temporal texture driven
approach to real-time fire detection. In: IMAGE PROCESSING (ICIP), 2011 18TH IEEE
INTERNATIONAL CONFERENCE ON, 2011. Anais. . . [S.l.: s.n.], 2011. p.17411744.
CHINCHOR, N. MUC-4 Evaluation Metrics. In: CONFERENCE ON MESSAGE UNDERSTANDING, 4., 1992, Stroudsburg, PA, USA. Proceedings. . . Association for Computational Linguistics, 1992. p.2229. (MUC4 92).
CHUNYU, Y.; JUN, F.; JINJUN, W.; YONGMING, Z. Video fire smoke detection using
motion and color features. Fire technology, [S.l.], v.46, n.3, p.651663, 2010.
COLLINS, R. T.; LIPTON, A.; KANADE, T.; FUJIYOSHI, H.; DUGGINS, D.; TSIN, Y.;
TOLLIVER, D.; ENOMOTO, N.; HASEGAWA, O.; BURT, P. et al. A system for video
surveillance and monitoring. [S.l.]: Carnegie Mellon University, the Robotics Institute
Pittsburg, 2000. v.2.
CUMANI, A. Edge detection in multispectral images. CVGIP: Graphical models and
image processing, [S.l.], v.53, n.1, p.4051, 1991.
CYGANEK, B.; SIEBERT, J. P. An introduction to 3D computer vision techniques
and algorithms. [S.l.]: John Wiley & Sons, 2011.
95
DENG, J.; DONG, W.; SOCHER, R.; LI, L.-J.; LI, K.; FEI-FEI, L. Imagenet: a largescale hierarchical image database. In: COMPUTER VISION AND PATTERN RECOGNITION, 2009. CVPR 2009. IEEE CONFERENCE ON, 2009. Anais. . . [S.l.: s.n.], 2009.
p.248255.
DUNTEMAN, G. H. Principal Components Analysis. [S.l.]: SAGE Publications, 1989.
n.No 69. (A Sage Publications).
FEI-FEI, L.; FERGUS, R.; PERONA, P. Learning generative visual models from few
training examples: an incremental bayesian approach tested on 101 object categories.
Computer Vision and Image Understanding, [S.l.], v.106, n.1, p.5970, 2007.
FORSYTH, D. A.; PONCE, J. Computer Vision: a modern approach. [S.l.]: Prentice
Hall Professional Technical Reference, 2002.
GIL, A. C. Mtodos e tcnicas de pesquisa social. In: Mtodos e tcnicas de pesquisa
social. [S.l.]: Atlas, 2010.
GOMEZ-RODRIGUEZ, F.; ARRUE, B.; OLLERO, A. Smoke monitoring and measurement using image processing: application to forest fires. In: AEROSENSE 2003, 2003.
Anais. . . [S.l.: s.n.], 2003. p.404411.
GMEZ-RODRGUEZ, F.; PASCUAL-PEA, S.; ARRUE, B.; OLLERO, A.; VIEGAS, D. et al. Smoke detection using image processing. In: FOREST FIRE RESEARCH AND WILDLAND FIRE SAFETY: PROCEEDINGS OF IV INTERNATIONAL
CONFERENCE ON FOREST FIRE RESEARCH 2002 WILDLAND FIRE SAFETY
SUMMIT, LUSO, COIMBRA, PORTUGAL, 18-23 NOVEMBER 2002., 2002. Anais. . .
[S.l.: s.n.], 2002.
GNAY, O.; TASDEMIR,
K.; UGUR
TREYIN, B.; ENIS ETIN, A. Video based
wildfire detection at night. Fire Safety Journal, [S.l.], v.44, n.6, p.860868, 2009.
HALL, M. A. Correlation-based feature selection for machine learning. 1999. Tese
(Doutorado em Cincia da Computao) The University of Waikato.
HALL, M.; FRANK, E.; HOLMES, G.; PFAHRINGER, B.; REUTEMANN, P.; WITTEN, I. H. The WEKA data mining software: an update. ACM SIGKDD Explorations
Newsletter, [S.l.], v.11, n.1, p.1018, 2009.
HAMINS, A.; YANG, J.; KASHIWAGI, T. An experimental investigation of the pulsation
frequency of flames. In: SYMPOSIUM (INTERNATIONAL) ON COMBUSTION, 1992.
Anais. . . [S.l.: s.n.], 1992. v.24, n.1, p.16951702.
96
97
LABATI, D.; GENOVESE, A.; PIURI, V.; SCOTTI, F. Wildfire smoke detection using
computational intelligence techniques enhanced with synthetic smoke plume generation.
IEEE Transactions on Systems, Man, and Cybernetics: Systems, [S.l.], v.43, n.4,
p.10031012, 2013.
LEE, B.; HAN, D. Real-time fire detection using camera sequence image in tunnel environment. In: Advanced Intelligent Computing Theories and Applications. With Aspects of Theoretical and Methodological Issues. [S.l.]: Springer, 2007. p.12091220.
LI, Y.-C.; WU, W.-C. Visual Fire Detection Based on Data Mining Technique. International Conference on Robot, Vision and Signal Processing, Los Alamitos, CA, USA,
v.0, p.328331, 2011.
LI, Y.-C.; WU, W.-C. Sequential Pattern Technology for Visual Fire Detection. Environments, [S.l.], v.9, p.13, 2012.
LUCAS, B. D.; KANADE, T. et al. An iterative image registration technique with an
application to stereo vision. In: IJCAI, 1981. Anais. . . [S.l.: s.n.], 1981. v.81, p.674679.
MARBACH, G.; LOEPFE, M.; BRUPBACHER, T. An image processing technique for
fire detection in video images. Fire safety journal, [S.l.], v.41, n.4, p.285289, 2006.
MARR, D.; HILDRETH, E. Theory of edge detection. Proceedings of the Royal Society
of London. Series B. Biological Sciences, [S.l.], v.207, n.1167, p.187217, 1980.
MATTHEWS, B. W. Comparison of the predicted and observed secondary structure of
T4 phage lysozyme. Biochimica et Biophysica Acta (BBA)-Protein Structure, [S.l.],
v.405, n.2, p.442451, 1975.
MCFARLANE, N. J.; SCHOFIELD, C. P. Segmentation and tracking of piglets in images. Machine Vision and Applications, [S.l.], v.8, n.3, p.187193, 1995.
MIGLIORE, D. A.; MATTEUCCI, M.; NACCARI, M. A revaluation of frame difference in fast and robust motion detection. In: ACM INTERNATIONAL WORKSHOP
ON VIDEO SURVEILLANCE AND SENSOR NETWORKS, 4., 2006. Proceedings. . .
[S.l.: s.n.], 2006. p.215218.
MUBARAK, S. Fundamentals of Computer Vision. University of Central Florida. Orlando, Florida, USA, [S.l.], 1997.
MUELLER, M.; KARASEV, P.; KOLESOV, I.; TANNENBAUM, A. Optical Flow Estimation for Flame Detection in Videos. Image Processing, IEEE Transactions on, [S.l.],
v.22, n.7, p.27862797, 2013.
98
99
SHIDIK, G. F.; ADNAN, F. N.; SUPRIYANTO, C.; PRAMUNENDAR, R. A.; ANDONO, P. N. Multi Color Feature, Background Subtraction and Time Frame Selection
for Fire Detection. Jurnal Informatika, [S.l.], 2014.
SOBEL, I.; FELDMAN, G. A 3x3 isotropic gradient operator for image processing. a
talk at the Stanford Artificial Project in, [S.l.], p.271272, 1968.
STAUFFER, C.; GRIMSON, W. E. L. Adaptive background mixture models for realtime tracking. In: COMPUTER VISION AND PATTERN RECOGNITION, 1999. IEEE
COMPUTER SOCIETY CONFERENCE ON., 1999. Anais. . . [S.l.: s.n.], 1999. v.2.
TOREYIN, B. U.; CETIN, A. E. Wildfire detection using LMS based active learning.
In: ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2009. ICASSP 2009. IEEE
INTERNATIONAL CONFERENCE ON, 2009. Anais. . . [S.l.: s.n.], 2009. p.14611464.
TOREYIN, B. U.; DEDEOGLU, Y.; CETIN, A. E. Contour based smoke detection in
video using wavelets. In: EUROPEAN SIGNAL PROCESSING CONFERENCE, 2006.
Anais. . . [S.l.: s.n.], 2006. p.123128.
TOREYIN, B. U.; DEDEOGLU, Y.; CETIN, A. E. et al. Wavelet based real-time smoke
detection in video. In: EUROPEAN SIGNAL PROCESSING CONFERENCE, 2005.
Anais. . . [S.l.: s.n.], 2005. p.48.
100