Professional Documents
Culture Documents
Mauro Henrique Lima de Boni1 , Adson Ferreira da Rocha2 ,Iwens Gervsio Sene Junior3 Coordenao de Informtica Instituto Federal de Educao, Cincia e Tecnologia do Tocantins (IFTO) Campus Palmas Faculdade de Engenharia Eltrica Universidade de Braslia (UNB) Campus Gama Instituto de Informtica Universidade Federal de Gois (UFG)
mauro@ifto.edu.br, adsonr@unb.br, iwens@inf.ufg.br
Resumo. O objetivo deste trabalho apresentar as redes bayesianas aplicadas Sndrome Pulmonar Obstrutiva Crnica - DPOC, bem como discutir sobre sua implementao. construda uma rede que busca modelar o conhecimento mdico baseado em evidncias como fatores de risco e sintomas. A contribuio maior deste artigo discutir aspectos da implementao da rede a partir do conhecimento do especialista. Ao final ser possvel concluir se uma pessoa est ou no com a doena
Abstract. The aim of this paper is to present the Bayesian networks applied to Chronic Obstructive Pulmonary Syndrome - COPD and discuss its implementation. It built a network that aims to model medical knowledge based on evidence as risk factors and symptoms. The largest contribution of this paper is an automated fashion and with the specialist knowledge to conclude whether a person is or is not suffering from COPD.
1. Introduo
Os softwares so ferramentas que contribuem em diversas reas, pois sua concepo envolve a modelagem de atividades e conhecimentos. Esses modelos podem ser usados como mecanismos capazes de participar da disseminao das informaes que o bem mais importante da sociedade do conhecimento. Do ponto de vista de softwares que modelam o conhecimento mdico eles podem fazer com que o paciente torne-se um indivduo capaz de ter participao ativa no processo, pois de posse de informaes e acesso ao conhecimento possvel melhorar a preveno de doenas, evitando assim que ele venha a sofrer com elas. A DPOC, ou Doena Pulmonar Obstrutiva Crnica, uma doena caracterizada por desenvolvimento progressivo de limitao ao fluxo areo que no totalmente reversvel [Jardim et al. 2009]. A limitao do fluxo areo est associada inalao de gases e partculas nocivas. Poucos conhecem a doena e a forma mais eficaz de combate-la est na conscientizao das pessoas sobre os fatores de risco, informando-as sobre a mudana de hbitos e tornando-as pessoas menos suscetveis doena. A Rede Bayesiana, um mecanismo usado para modelar o conhecimento mdico por meio de um grafo direcionado, onde cada nodo deste grafo tem uma relao de causa e efeito
(sintomas e doenas), o que para um profissional da rea de sade fcil de ser entendido, uma vez que o seu conhecimento que deve ser modelado . Elas so usadas quando o conhecimento incerto deve ser modelado. Este trabalho tem como objetivo apresentar as redes bayesianas, bem como discutir sobre sua implementao. construda uma rede simples que busca modelar o conhecimento mdico para, baseado em evidncias como fatores de risco e sintomas, concluir se uma pessoa pode estar ou no sofrendo da Sndrome Pulmonar Obstrutiva Crnica - DPOC.. Sua estrutura a seguinte: A seo 2 faz uma introduo sobre Rede Bayesiana. A seo 3 apresentar a DPOC, seus fatores de risco e seus sintomas. Na seo 4 apresentada a modelagem da rede para aplicao proposta, mostrando aspectos importantes sobre sua implementao . No final, na seo 5, ha indicaes sobre estudos futuros.
2. Redes Bayesianas
Uma rede Bayesiana, para um conjunto de variveis X = {X1 , . . . , Xn } consiste em : uma estrutura grfica em rede G em um conjunto de distribuies de probabilidades locais associadas a cada varivel P r. Essa estrutura grfica tem forma de um grafo direcionado acclico. Os ns contidos em G tem uma correspondncia de um-para-um com as variveis Assim, a partir dessa definio temos a seguinte equao: , B = (P r, G). (1)
A estrutura grfica G tem a forma de um grafo direcionado acclico, com ns V (G) = {V1 , . . . , Vn }, n 1 e arcos A(G) V (G) V (G). Cada n Vi em G representa uma varivel randmica que tem um conjunto finito de valores. Os arcos no dgrafo modelam as influncias probabilsticas entre as variveis. Podemos dizer, grosso modo, que um arco Vi Vj entre dois ns Vi e Vj indica que h influncia entre as variveis Vi e Vj ; a ausncia de um arco significa que uma varivel no influencia a outra diretamente. Podemos fazer uma definio mais formal: a varivel Vi dependente de seus pais, mas independente de qualquer n no-descendente de seus pais. O grafo gerado pode ser assim formalizado: G = (V (G), A(G)) (2)
Associado a estrutura grfica de uma Rede Bayesiana est uma distribuio de probabilidade conjunta P r que representado de forma fatorada. Para cada varivel Vi no grafo est determinado um conjunto de distribuies condicionais; cada uma destas distribuies descreve o efeito de uma combinao especfica dos valores dos pais (Vi ) de Vi , na distribuio probabilstica de Vi . Esses conjuntos de distribuies, definem uma nica distribuio, definido pela seguinte equao :
n i=1
P r(V1 , . . . , Vn ) =
P r(Vi |(Vi ))
(3)
1. Evidncia - Evidncias so novas informaes disponveis que surgem em um dado evento. Essa nova informao faz com que uma mudana nos estados de uma varivel ocorra e isso inicia o processo de propagao das probabilidades. Quando um nodo qualquer X est um estado especfico ex, onde ex pertence a E e E um conjunto finito que representa os estados de X, escrevemos que X = ex. Essa situao chamada de instanciao ou tambm hard evidence, como encontrado em [Korb and Nicholson 2004]. 2. Inferncia - Dada uma ou mais evidncias, as probabilidades da rede deve ser calculadas. Esse processo chamado de Inferncia. o calculo das probabilidades de um valor de uma varivel, far com que seja criado um fluxo de informao que percorrer toda a rede. Esse fluxo no limitado pela direo dos arcos. Essa a tarefa mais comum que se deseja fazer com uma Rede Bayesiana. Tambm podemos chamar a inferncia por propagao de probabilidades.
3. DPOC
A DPOC (Doena Pulmonar Obstrutiva Crnica) agrupa duas enfermidades diferentes: bronquite crnica e enfisema. Os mdicos utilizam esta sigla porque a maioria dos pacientes apresenta combinao das duas doenas. Em ambas, acontece uma inflamao crnica. Na bronquite, a inflamao se d nos brnquios e causa grande produo de muco. No enfisema, os alvolos (parte final do pulmo onde ocorre a passagem de oxignio para o sangue) se inflamam, causando destruio do tecido e formao de pequenas bolhas. O diagnstico realizado a partir do quadro clnico, das alteraes na radiografia de trax e durante as provas de funo pulmonar (espirometria, exame do sopro), habitualmente aps a 5 dcada de vida. Os dois fatores de risco mais comuns so o tabagismo (responsvel por 80% a 90% de todas as mortes relacionadas com a DPOC) e a deficincia de alfa1-antitripsina. Foi observado que a incidncia de DPOC se eleva de 19,7% em homens que nunca tinham fumado para 87,7% em fumantes de mais de dois maos de cigarro/dia. Dito de outra forma, o perigo de desenvolver DPOC em um grupo de fumantes de dois maos de cigarros/dia aproximadamente 4,5 vezes maior que para os no-fumantes. A exposio repetida ao cigarro resulta em inflamao crnica, alm de tosse produtiva. O fumo devido s substncias irritantes que contm, provoca hiperplasia e metaplasia do epitlio, ruptura dos septos alveolares, proliferao fibrtica e espessamento das paredes arteriolares. Tais alteraes so proporcionais ao nmero de cigarros dirios e ao tempo de tabagismo. Como segunda causa bem reconhecida de enfisema, a deficincia de alfa1-antitripsina, algumas vezes denominada enfisema gentico, uma condio caracterizada por uma quantidade deficiente da protena alfa1-antitripsina, a qual pode acarretar o incio precoce do enfisema e que uma condio gentica autossmica codominante. Sob circunstncias normais de uma quantidade adequada de alfa1-antitripsina, a elastase dos neutrfilos neutralizada de modo a no digerir a elastina pulmonar (protena estrutural). No entanto, em face de uma deficincia severa de alfa1-antitripsina, a elastase dos neutrfilos pode no ser controlada e provocar a ruptura da elastina e acarretar a dissoluo das paredes alveolares. A poluio do ar pode desempenhar um papel, do mesmo modo que fatores hereditrios, os quais so claramente importantes na deficincia de alfa1-antitripsina.
Doena Representa a doena, no caso DPOC. Poderia, conforme o caso, serem vrios nodos. Sintomas Variveis que representam o estado geral de sade do paciente, onde ele pode relatar o que ele est sentindo ou o que est acontecendo com ele Baseado nas informaes que foram mostradas na seo 3 e em [Jardim et al. 2009], os seguintes nodos foram criados: Fatores de Risco Fumante, idade, exposio poluio, fumante a quanto tempo. Doenas DPOC. Sintomas Sente falta de ar, tosse com catarro. 2. Estrutura - A estrutura ou topologia de uma rede representa relacionamentos qualitativos entre as variveis. Em particular, dois nodos de um grafo s podem estar conectados diretamente somente se um afeta o outro, com arcos indicando a direo do efeito. Quando estamos falando sobre a estrutura da rede til empregarmos a seguinte notao: um nodo pai de um outro nodo, se existir um arco a partir do anterior at o posterior. 3. Probabilidades Condicionais - Elas quantificam as relaes entre os nodos conectados. Isto feito pela especificao de uma distribuio de probabilidade condicional para cada nodo, observando todas as possveis combinaes dos valores dos seus nodos pais. Cada combinao dessas recebe o nome de instanciao do conjunto de pais. Para cada instanciao distinta, necessrio especificar a probabilidade que o nodo filho ter. Assim, se um nodo possuir vrios pais, ou se esses pais puderem ter um nmero elevado de valores, a tabela de probabilidade condicional, do ingls conditional probability table - CPT ser muito grande. Os nodos fumante, idade e exposio poluio so nodos que tm dois estados em cada um. So nodos binrios e que no possuem pais. Suas tabelas so construdas de maneira simples, pois no h dependncia de outros dados. Basta apenas informar qual a chance de uma pessoa ser fumante ou no, por exemplo. As demais variveis devem ser analisadas de uma forma um pouco diferente pois como so variveis que possuem pais, os valores de seus estados so obtidos por meio da aplicao de probabilidades condicionais para cada caso condicional dos
ns pais. O nodo DPOC tem uma CPT composta de 24 linhas, pois os nodos fumante a quanto tempo, idade, exposio a poluio, tem respetivamente 2, 2 e 6 estados.
Referncias
Junior, G. (2005). Voz sobre ip segurana de transmisses.