You are on page 1of 5

04-07 de Julho - FCT/UNESP - P.

Prudente

VI Workshop de Viso Computacional

Classicao de Leveduras para o Controle Microbiano em Processos de Produo de Etanol


Lia N. B. Quinta, Jaime H. F. S. Queiroz, Kleber P. Souza, Hemerson Pistori e Marney P. Cereda INOVISAO/Biotecnologia Aplicada Agroindstria Universidade Catlica Dom Bosco Av. Tamandar, 6000, Jardim Seminrio 79117-900 Campo Grande - MS (lianaraq, jaime.cpp, kleber.padovani)@gmail.com, (pistori, cereda)@ucdb.br Resumo
Uma das mais importantes etapas na produo de etanol a fermentao, que acontece por ao de leveduras (fermento) sobre o caldo de cana diludo com gua. A produtividade de uma usina de lcool pode ser signicativamente incrementada a partir de um controle regular de leveduras e bactrias durante o processo. Esse controle geralmente realizado a partir da identicao e contagem, em imagens microscpicas, de leveduras inviveis e viveis. Este artigo apresenta experimentos com algumas tcnicas de viso computacional com o intuito de automatizar esse processo de identicao e contagem de leveduras. Nos experimentos com o algoritmo de casamento de modelos (template matching) 75% das leveduras (viveis e inviveis) foram reconhecidas. J com as leveduras reconhecidas, experimentos usando a extrao usando atributos de cor foram aplicados com o intuito de reconhecer leveduras viveis e inviveis, os resultados apontaram uma porcentagem de acerto de at 98%. de vrios fatores. Uma das principais caractersticas que reduz o rendimento da fermentao a grande concentrao de acar no caldo. Por isso, esse caldo geralmente diludo em gua, produzindo o mosto. No processo de colheita at a extrao do caldo, a canade-acar exposta contaminao por bactrias. Devido essa contaminao necessrio realizar o controle dos microorganismos presentes no mosto, a partir da anlise visual de amostras coletadas periodicamente. Para auxiliar na contagem das leveduras, a amostra misturada com gua e tratada com corante metileno azul, que colore em azul as leveduras inviveis. Uma levedura considerada invivel quando no desempenha mais seu papel na fermentao alcolica. Posteriormente, a amostra transferida para uma placa em forma retangular e analisada atravs do microscpio. Nessa anlise, realiza-se a contagem visual de leveduras e bactrias [1]. Atravs de clculos estatsticos, a quantidade de leveduras e bactrias por litro estimada. Ao constatar que o nmero de bactrias est alto, o especialista pode realizar o tratamento desses microorganismos, a m de control-los, j que eles representam os contaminantes do mosto. Esse tratamento pode ser realizado atravs da insero de antibiticos no mosto, por exemplo. O projeto BioViC tem como objetivo oferecer s usinas de lcool um conjunto de ferramentas para facilitar e otimizar a realizao do controle microbiano e inclui um mdulo de viso computacional responsvel pela contagem automtica de microorganismos. Neste artigo, so relatados resultados com algumas tcnicas de viso computacional com o objetivo de realizar a contagem de leveduras. Foram aplicadas tcnicas de extrao de atributos de cor e reconhecimento de padres atravs de casamento de modelos. No casamento de modelos a medida euclidiana foi usada. Os experimentos com casamento de modelos ainda so exploratrios e buscaram identicar alguns parmetros iniciais para otimizao da tcnica para aplicao neste problema. Nos experimentos com atributos de cor houve a ex-

1. Introduo
Com uma preocupao recorrente em relao ao meio ambiente e com o m das fontes de energia no renovveis, como o petrleo, a procura por fontes alternativas de energia tornou o etanol um produto bastante requisitado. O Brasil encontrou nesse setor uma importante fonte de desenvolvimento e crescimento nanceiro sem se descuidar das questes ambientais [6]. Para a produo do etanol, a cana-de-acar passa pelo processo de moagem, quando o caldo extrado. Aps outras operaes, ocorre a fermentao desse caldo com adio de fermento biolgico de leveduras da espcie Saccharomyces cerevisae. A eccia da fermentao depende

90

04-07 de Julho - FCT/UNESP - P. Prudente

VI Workshop de Viso Computacional

trao de atributos pixel a pixel e os resultados foram usados como treinamento para algoritmos de aprendizagem de mquina, que foram testados em um conjunto de imagens independente. Nas prximas duas sees so apresentadas as tcnicas de reconhecimento de padres e extrao de atributos usadas nesse trabalho. A quarta seo apresenta os experimentos realizados, resultados e anlise. Por m, a ltima seo apresenta as consideraes nais.

4. Experimentos, resultados e anlise


Para a realizao dos experimentos foi aplicada a tcnica de casamento de padres. Com os padres encontrados, tcnicas de extrao de atributos de cor foram aplicadas para discriminar as classes viveis e inviveis.

4.1. Casamento de modelos


Como analisado anteriormente a tcnica de casamento de modelos pode realizar o casamento das leveduras (templates) capturados nas imagens do projeto. Para medir a semelhana entre as classes foi aplicada a distncia euclidiana. Os modelos originais foram capturados de maneira manual, desse modo a dimenso desses modelos no estavam uniformes. Ao aplicar as medidas de similaridade, houve a necessidade de estabelecer um limiar usado como referncia para o resultado obtido das medidas de similaridade. Para denir esse limiar as leveduras da mesma classe foram comparadas entre si. Para essa comparao a dimenso das leveduras deveriam ser iguais. Por isso, os modelos foram redimensionados. Como no era conhecida a dimenso que seria mais interessante para o problema, foram estabelecidas trs dimenses. Esses valores foram obtidos com a ordenao dos modelos de forma crescente. Com as dimenses ordenadas, foram capturadas a menor, maior e mdia dimenso. Com esses valores os grupos foram criados e redimensionados. Com o maior e menor valor das distncias obtidas com a comparao das amostras, o limiar foi estimado capturando uma porcentagem da diferena entre os resultados mximos e mnimos. Para esses experimentos foram capturadas 35 amostras de leveduras. Quando um modelo comparado a uma imagem, este realiza uma varredura nas imagens variando um pixel no eixo X e um pixel no eixo Y . Os valores do deslocamento dos eixos foram estimados experimentalmente. Ao analisar uma imagem, a cada posio dessa imagem, um modelo com as dimenses do modelo original extrado. O modelo extrado possui as mesmas dimenses do modelo original. Com as duas imagens calculada a medida de similaridade entre eles. Os experimentos foram realizados com as imagens em tons de cinza e com modelos de cores RGB. O limiar foi usado como referncia para os experimentos com uma imagem real, ou seja, sem marcaes. Se o valor obtido da comparao entre os dois modelos atuais apresentassem resultado dentro do limiar proposto, eram considerados como pertencentes classe em questo. O mesmo raciocnio foi seguido para os experimentos usando modelos com componentes RGB. A distino diz respeito ao clculo de trs diferenas e trs limiares para cada modelo, j que foram analisados trs componentes, sendo eles o R, G

2. Reconhecimento de padres
O reconhecimento de padres refere-se etapa de identicao de objetos citados anteriormente. Por exemplo, neste trabalho, estima-se realizar o reconhecimento de duas classes: leveduras viveis e inviveis. Por isso, necessrio aplicar algoritmos que realizam a tarefa de reconhecer as classes desses objetos [4]. Dentre as tcnicas de reconhecimento de padres, encontra-se o casamento de modelos, que foi utilizado neste trabalho. De forma geral, no casamento de modelos realizada uma busca na imagem por ocorrncias de um determinado objeto representado por um modelo qualquer. Diversos tipos de modelos e medidas de similaridade para comparao entre trechos da imagem e estes modelos podem ser utilizados. Na sua forma mais simples, testada neste trabalho, o modelo formado por um conjunto xo de exemplos de imagens do objeto a ser buscado, em diferentes escalas e rotaes. Uma janela de varredura, nos tamanhos dos exemplos de objetos que formam o modelo, percorre toda a imagem e para cada posio calculado um valor de similaridade entre a janela e os exemplos. Um limiar de similaridade, denido empiricamente, utilizado para determinar em que posies da imagem os objetos de interesse ocorrem. A medida de similaridade utilizada neste trabalho foi a distncia euclidiana [2].

3. Extrao de atributos de cor


A extrao de atributos visa obter informaes relacionadas com objetos presentes em uma imagem que facilitem a caracterizao daqueles que pertencem a uma mesma classe. Por exemplo, os valores obtidos pela extrao de atributos para caracterizar a classe das leveduras viveis dever ser diferente dos obtidos para caracterizar a classe das leveduras inviveis. Desse modo, ser possvel discriminar mais facilmente as duas classes. Os modelos de cores utilizados para a fase de extrao de atributos neste trabalho foram baseados em tons de cinza, RGB e HSB [5][8][9].

91

04-07 de Julho - FCT/UNESP - P. Prudente

VI Workshop de Viso Computacional

e B. Por exemplo, o componente R(red) do modelo de cor RGB do modelo original foi comparado com o componente R do novo modelo criado da imagem a ser analisada. Experimentalmente a porcentagem escolhida para denir o limiar de leveduras foi de 60%.

4.2. Extrao de atributos de cor


Como mencionado anteriormente, nas amostras de leveduras adicionado o corante azul de metileno. Com a insero desse corante as leveduras so diferenciadas por cor. Analisando essa informao, experimentos foram realizados com algoritmos de extrao de atributos simples, baseado em cores e tons de cinza e aprendizagem de mquina. Para os experimentos, foram usadas nove imagens. Dessas nove imagens, foram obtidas amostras das classes vivel e invivel. Dessas amostras, foram extrados os tons de cinza, os componentes HSB e RGB de cada pixel. Com as informaes extradas, foi criado um arquivo arff (Attribute-Relation File Format) que armazena as informaes obtidas e as relaciona com classes as quais elas pertencem. O arquivo arff um tipo de extenso que reconhecido pelo software Weka (Waikato Environment for Knowledge Analysis). O Weka possui um conjunto de algoritmos de aprendizagem de mquina, sendo que alguns desses foram utilizados nesse trabalho. Como para este problema foi possvel a obteno de informao sobre a classicao dos objetos de interesse na imagem, foram utilizados algoritmos de aprendizagem supervisionada. Para os experimentos, foram utilizados os algoritmos K2 [3] e o C4.5 [7], com os parmetros default, ou seja, com as conguraes originais dos algoritmos, sem variaes de parmetros. O primeiro induz modelos baseados em Redes Bayesianas e o segundo em rvores de Deciso. Foram utilizadas quatro imagens para o treinamento e cinco para os testes. Foram extradas amostras das classes vivel e invivel. Com essas amostras foram extradas informaes em relao tonalidade dos pixels utilizando os modelos propostos neste trabalho. No treinamento, os algoritmos de aprendizagem foram treinados com as informaes contidas no arff. Finalizado o treinamento, foram extradas caractersticas das imagens de teste. As caractersticas extradas seguiram a mesma metodologia da extrao das imagens de treinamento. Foram extradas informaes pixel a pixel das imagens de teste e essas informaes foram inseridas nos algoritmos de aprendizagem e classicadas de acordo com a classe pertencente. Nos experimentos, foram utilizadas 50498 amostras de inviveis e 75737 amostras de viveis. Nas imagens usadas para o treinamento, foi observado que as leveduras inviveis conseguiram ser segmentadas em maior quantidade quando comparadas s leveduras viveis. Tambm foi constatado

que os mtodos de segmentao usando os componentes RGB e HSB apresentaram dados semelhantes em relao matriz de confuso. Como mencionado anteriormente, as amostras foram classicadas pelos dois algoritmos mencionados. Na etapa de classicao, as amostras tinham que ser classicadas nas classes corretas, porm foram detectados alguns erros na classicao dessas amostras. Por exemplo, na Tabela 1 a segunda coluna refere-se classe das leveduras inviveis e a terceira classe das leveduras viveis. Na segunda coluna e na segunda linha esto as classicaes corretas para a classe inviveis e na terceira coluna e segunda linha esto o nmero de leveduras classicadas incorretamente, ou seja, classicadas como viveis. O mesmo raciocnio realizado para as outras Tabelas. As Tabelas 1, 2 e 3 apresentam os resultados obtidos com o algoritmo C4.5 e K2. Nos experimentos utilizando informaes sobre o tom de cinza dos pixels, foi detectado uma maior confuso em relao classicao dos atributos, como mostra a Tabela 3. Como apenas uma informao sobre o pixel das imagens analisada, esse tipo de confuso torna-se ainda maior, visto que nesse modelo o nmero de variaes de tonalidades inferior quando comparados aos outros modelos propostos neste trabalho. Mtodo de Aprendizagem C4.5 C4.5 K2 K2 a 50314 2026 34952 5138 b 184 73711 15546 70599 classe a=invivel b=vivel a=invivel b=vivel

Tabela 1. Matriz de confuso resultante da segmentao por componente RGB com o algoritmo C4.5 e K2

Mtodo de Aprendizagem C4.5 C4.5 K2 K2

a 50310 1927 40873 2287

b 188 73810 9625 73450

classe a=invivel b=vivel a=invivel b=vivel

Tabela 2. Matriz de confuso resultante da segmentao por componente HSB com o algoritmo C4.5 e K2

A porcentagem de acerto foi fornecida pelo Weka assim como a matriz de confuso. Essa porcentagem refere-se ao

92

04-07 de Julho - FCT/UNESP - P. Prudente

VI Workshop de Viso Computacional

Mtodo de Aprendizagem C4.5 C4.5 K2 K2

a 32708 4550 33508 5545

b 17790 71187 16990 70192

classe a=invivel b=vivel a=invivel b=vivel

Tabela 3. Matriz de confuso resultante da segmentao por tons de cinza com o algoritmo C4.5

( a)

(b))

Figura 1. (a) Imagem original, (b) Classicao de leveduras viveis. Mtodo de segmentao TDC RGB HSB C4.5 82,30% 98,25% 98,32% K2 82,14% 83,61% 90,56%

Tabela 4. Porcentagem de acerto dos mtodos utilizados.

nmero de amostras classicadas corretamente pelos dois algoritmos usados nesse experimento para os modelos de cor HSB, RGB e tons de cinza (TDC). A Tabela 4 apresenta a porcentagem de acerto obtida atravs dos algoritmos de aprendizagem de mquina resultante dos experimento de cada componentes HSB, RGB e tons de cinza. Com esses resultados, foi observado que o algoritmo C4.5 apresentou uma melhor porcentagem de acerto. Ao realizar a comparao dos resultados dos mtodos RGB e HSB, observa-se que, nos diferentes tipos de dados apresentados, os componentes HSB apresentam melhor resultado. Esses experimentos foram realizados utilizando validao cruzada com dez dobras. Nos experimentos, estavam contidos dados obtidos das amostras das classes presentes nas imagens de treinamento. O resultado do casamento de padres com a extrao de atributos de cor apresenta a classicao de algumas leveduras e a presena de alguns falsos/positivos e falsos/negativos, as Figuras 1 e 2 (b) ilustram as imagens aps a classicao. A Figura 1 (b) mostra uma imagem com o reconhecimento de leveduras viveis. Os crculos vermelhos so leveduras que no foram classicadas e os quadrados pretos so das clulas marcadas corretamente. A Figura 2 (b) mostra o reconhecimento de leveduras inviveis, seguindo a mesma legenda usada para as leveduras viveis.

( a)

( b)

Figura 2. (a) Imagem original, (b) Classicao de leveduras inviveis.

imentos, obteve-se melhor resultado com o modelo de cor HSB e algoritmo de aprendizagem de mquina C4.5, com a porcentagem de acerto de 98, 32%. J com os modelos encontrados no primeiro experimento foram aplicadaa as tcnicas de extrao de atributos de cor. A classicao baseada em cores apresentou resultado superior a 80% de acerto. Com esses experimentos observouse que a unio das tcnicas de casamento de modelos e extrao de atributos de cor foram consideradas satisfatrias na distino de leveduras. Como trabalhos futuros pretende-se expandir o nmero de tcnicas qua trabalham com o algoritmo de casamento de modelos, j que uma simples tcnica aplicada trouxe uma boa distino de classes, outra meta futura ser a classicao de bactrias.

Referncias
[1] S. R. C. Antonini. Mtodos de anlises e monitoramento microbiolgico em laboratrio de destilaria. Apostila para o curso de treinamento ministrado nas unidades de IguatemiPR, no perodo de 19 a 21 de fevereiro de 2004, e de IvatPR, no perodo de 16 a 18 de fevereiro de 2004, pertencentes Usina de Acar Santa Terezinha Ltda., 2004.

5. Concluso
O algoritmos de casamento de modelos apresentou uma taxa de acerto de 75%. Com os modelos de cores e os algoritmos de aprendizagem de mquina utilizados nos exper-

93

04-07 de Julho - FCT/UNESP - P. Prudente

VI Workshop de Viso Computacional

[2] R. O. Borges, R. A. A. Silva, and S. S. Castro. Utilizao da classicao por distncia euclidiana no mapeamento dos focos de arenizao no setor sul da alta bacia do rio araguaia. In XIII Simpsio Brasileiro de Sensoriamento Remoto, 2007. [3] G. F. Cooper and T. Dietterich. A bayesian method for the induction of probabilistic networks from data. In Machine Learning, pages 309347, 1992. [4] L. L. e S. K. Mitra. Color image segmentation: A state-of-theart survey, 2001. [5] R. C. Gonzalez and R. E. Woods. Processamento de Imagens Digitais. primeira edition, 2000. [6] M. A. Guadagnini and M. S. S. Almeida. Fontes alternativas de energia uma viso geral. Ps Graduao Executiva em Meio Ambiente, 09 agosto de 2005 / 01 agosto de 2006, 14a Turma, COPPE/UFRJ., 2006. [7] J. R. Quinlan. Improved use of continuous attributes in C4.5. Journal of Articial Intelligence Research, 4:7790, 1996. [8] R. C. B. Rodrigues and R. H. R. Viana. Mquinas de vetores de suporte aplicadas classicao de defeitos em couro bovino. Qualicao de Bacharel em Engenharia de Computao na Universidade Catlica Dom Bosco Campo Grande - MS - Brasil, 2007. [9] J. A. Silva and W. N. Gonalves. Modelos ocultos de markov aplicados na identicao de comportamento de animais. Qualicao de Bacharel em Engenharia de Computao na Universidade Catlica Dom Bosco Campo Grande - MS Brasil, 2007.

94

You might also like