Tese RedeBayesMedicina

Umestudodocomportamentode
RedesBayesianasnoprognsticoda
sobrevivncianocancrodaprstata

Ana Cristina Lopes Sarabando

2010

Mestrado de Informtica Mdica
Faculdade de Cincias | Faculdade de Medicina
Universidade do Porto

Orientador: Prof. Doutora Ins de Castro Dutra, DCC/FCUP & CRACS,
Universidade do Porto
Co-orientador: Doutor Nuno Afonso Gomes Costa Maia, Hospital Infante
D. Pedro, Servio de Urologia

3
Agradecimentos

Agradeo Prof. Doutora Ins de Castro Dutra por todos os conselhos, crticas
construtivas e sugestes que, em ltima instncia levaram este trabalho a bom porto e
ao Doutor Nuno Maia pela sua infindvel disponibilidade e preocupao.

Agradeo tambm ao meu marido, Paulo Miguel de Jesus Dias, pelo constante apoio e
partilha de conhecimento da rea da informtica e programao.

Agradeo a Dr. Cludia Camila Dias, do Servio de Bioestatstica e Informtica
Mdica da Faculdade de Medicina da Universidade do Porto, pelo apoio e interesse
demonstrado em colaborar no esclarecimento de dvidas na rea de Bioestatstica e
Redes Bayesianas.

Agradeo minha Chefe de Servio, Enf urea Simes pelo apoio sempre prestado e
pela flexibilidade para me permitir terminar esta dissertao

Por ltimo, agradeo aos meus pais e a todos os meus amigos pelo imensurvel apoio
que me proporcionaram ao longo de toda a minha carreira acadmica.

4
Sumrio

Esta dissertao faz um estudo da aplicao de redes bayesianas ao prognstico da
sobrevivncia no cancro de prstata.
Com o auxlio de um mdico especialista em cancro de prstata, construmos uma
rede bayesiana a partir de dados clnicos de doentes. Aplicamos esta rede a um
conjunto de dados de doentes, disponveis no endereo
http://lib.stat.cmu.edu/S/Harrell/data/descriptions/prostate.html (Andrews and
Herzberg 1985), com o objectivo de estudar e avaliar a qualidade desta rede
construda manualmente. A seguir, utilizamos algumas ferramentas de gerao de
redes bayesianas a fim de comparar a qualidade destas redes geradas automaticamente
com a rede gerada manualmente. Os resultados mostram que as redes geradas
automaticamente comportam-se to bem ou melhor que a rede construda
manualmente, alm de apresentarem relaes causais no existentes na rede gerada
manualmente.
Neste trabalho utilizamos software tais como o SPSS, o WEKA, o GeNIe, o Mini-
TUBA e o Aleph/SAYU na construo das redes manual e automticas.
Fizemos um intenso estudo do estado da arte com o intuito de estabelecer uma base
slida para o trabalho. Foram procurados os mtodos j existentes para prognstico
em doentes com cancro da prstata e observados os seus resultados, com o intuito de
construir um instrumento til e com resultados viveis para a rea mdica em questo.
A mortalidade de doentes com cancro est a aumentar em todo o mundo e
necessrio aproveitar os dados disponveis para melhorar os cuidados de sade e
possivelmente reduzir a taxa de mortalidade por cancro.
No tendo ainda sido desenvolvidos muitos estudos nesta rea, pode considerar-se
que este trabalho apresenta um impulso ao estudo e aplicao das redes bayesianas
estticas e dinmicas na rea mdica e conduz, em ltima instncia a um instrumento
que consideramos til para o prognstico de doenas como o cancro da prstata.

5
Abstract
This thesis aims to study the use of bayesian networks in the prognostic of survival in
prostate cancer.
With the help of a doctor, specialist in prostate cancer, we built a bayesian network
based on clinical data from real patients. We applied the resulting network to a
dataset, available at http://lib.stat.cmu.edu/S/Harrell/data/descriptions/prostate.html
(Andrews and Herzberg 1985), to study and evaluate the quality of this manually built
network. We also used several software tools to generate other bayesian networks in
order to compare the results of these automatically generated networks with the
manual one. Results shows that automatically generated networks behave as well or
even better that the manually built one. They also present causal relations that are not
available in the manually generated network.
In this work, we used several software applications, such as SPSS, WEKA, GeNIe,
Mini-TUBA and Aleph/SAYU to build automatic and manual bayesian networks.
We also provide an extensive state of the art to provide a good starting point. We
searched the already existing method used in prostate cancer and analysed their
results. Our objective is to build a tool with viable results that may be used in this
specific medical area in the future.
With the increase in the mortality of cancer patients, it seems important to use all the
available data to improve healthcare and even reduce the cancer mortality rates.
Despite the lack of studies in this field, this work is a good step in the study and
development of static and dynamic bayesian networks in the medical field and
provides a useful tool for the prognostic of diseases such as prostate cancer.

6
Prembulo
Atul Gawande, cirurgio americano no Hospital de Boston e Professor na Faculdade
de Medicina em Harvard, conta-nos: Um dia, um cirurgio cardaco, responsvel
pela rea dos cuidados coronrios, entrou no seu gabinete com 2240
electrocardiogramas (ECG). Ele demorou uma semana a examin-los e separar
aqueles em que achava que o doente estava a ter um ataque cardaco na altura do
registo. (Gawande 2002).
Um ECG uma verdadeira aventura para um estudante de medicina, e a sua
interpretao s melhora com a prtica. Uma avaliao humana, mesmo de um
especialista, falha com alguma facilidade.
Surge ento a possibilidade de que um computador possa auxiliar a tarefa do ser
humano, de forma a baixar a taxa de erros e optimizar a sua interveno. Um sistema
computacional pode ajudar um profissional da rea da sade de diversas formas.
Neste trabalho, vamos concentrar-nos no apoio deciso clnica utilizando tcnicas
de Inteligncia Artificial, mais especificamente, em mtodos de aprendizagem de
mquina baseados em classificadores bayesianos ou probabilsticos.
Em 1990, William Baxt descreveu como uma rede neuronal artificial pode tomar
decises clnicas. O computador pode aprender com a experincia, tal como o ser
humano. Na histria de Gawande, o computador venceu o cardiologista ao classificar
melhor 20% a mais de ECGs.
Na medicina os erros mdicos so inaceitveis, uma radiografia tem que ser bem
interpretado, a dose de uma medicao no pode falhar, e nada sobre cada doente
pode ser esquecido como alergias ou patologias associadas. Um cirurgio deve ser
perfeito, no desperdiando tempo, movimentos ou gota de sangue.
Esta perfeio mdica difcil de atingir, e s a rotina e a repetio podem ajudar.
Com a repetio muitas funes mentais tornam-se automticas e necessitam de
menos esforo.
Muitos mdicos podem considerar que cada doente um caso diferente e que no h
nada melhor para obter um diagnstico do que a avaliao humana. Mas ser mesmo
assim? Quando um doente entra na urgncia com uma dor abdominal e um cirurgio
7
tenta descartar a hiptese de apendicite aguda, ele no segue uma lista de
procedimentos semelhante a todos os doentes?
Um algoritmo pode facilmente aproximar-se de um julgamento humano a fazer
prognsticos ou diagnsticos. Pode-se ento concluir que o ser humano em conjunto
com o computador obtero claramente melhores resultados. Muitos estudiosos
consideram que no, porm Paul Meehl, David Faust e Robin Dawes que estudaram
diversas comparaes de diagnsticos matemticos e julgamento humano,
constataram que a estatstica venceu ou equiparou-se ao julgamento humano em todos
os seus estudos (Dawes, Faust et al. 1989; Meehl 1996).

8
9
ndice
Organizao da tese .....................................................................................................15
1 Introduo ............................................................................................................17
2 Estado de arte.......................................................................................................19
2.1 Redes Bayesianas.........................................................................................19
2.2 Escolha do problema mdico.......................................................................23
2.3 Utilizao das redes bayesianas para o prognstico de sobrevivncia no
cancro da prstata ....................................................................................................24
3 Material e Mtodos ..............................................................................................27
3.1 O software open source.............................................................................28
3.1.1 GeNIe...................................................................................................28
3.1.2 WEKA..................................................................................................28
3.1.3 Mini-TUBA..........................................................................................29
3.1.4 Aleph e SAYU.....................................................................................31
4 Modelo Qualitativo da rede Bayesiana................................................................33
4.1 Processo para criao do modelo da rede ....................................................33
4.2 A escolha das variveis................................................................................33
4.3 As variveis..................................................................................................35
4.3.1 Idade.....................................................................................................35
4.3.2 Peso......................................................................................................36
4.3.3 Histria familiar de cancro...................................................................36
4.3.4 International Prostate Symptom Score ................................................37
4.3.5 Presso arterial .....................................................................................37
4.3.6 Hemoglobina........................................................................................37
4.3.7 Ndulos hipoecognicos ......................................................................38
4.3.8 Prostate Specific-Antigen (PSA)..........................................................38
4.3.9 Estadio Clnico.....................................................................................39
4.3.10 Gleason Stage ......................................................................................39
4.3.11 Penetrao da cpsula prosttica..........................................................39
4.3.12 Envolvimento das vesculas seminais..................................................40
4.3.13 Envolvimento linftico.........................................................................40
4.3.14 Doubling time PSA..............................................................................40
10
4.3.15 Tamanho da prstata............................................................................41
4.3.16 Metstases sseas.................................................................................41
4.3.17 Status aps 5 anos da cirurgia..............................................................42
4.4 Limitaes na escolha das variveis ............................................................42
4.5 Mtodos para a estruturao da rede............................................................42
4.6 Evoluo dos modelos construdos..............................................................43
4.7 Concluso.....................................................................................................44
5 Modelos Quantitativos .........................................................................................45
5.1 Gesto dos atributos.....................................................................................45
5.2 Necessidade de discretizao das variveis contnuas.................................48
5.3 Missing values .............................................................................................50
5.4 Modelo I - Modelo construdo manualmente...............................................51
5.4.1 Probabilidades marginais .....................................................................51
5.4.2 Probabilidades condicionais.................................................................52
5.4.3 Modelo final da rede - GeNIe ..............................................................53
5.4.4 Determinao da exactido da rede .....................................................54
5.5 Modelo II - WEKA Machine Learning algorithms in Java ......................55
5.5.1 Aprendizagem da estrutura da rede......................................................55
5.5.2 As redes finais......................................................................................56
5.5.3 Interpretao do resultado....................................................................59
5.5.4 Concluses ...........................................................................................60
5.6 Modelo III mini-TUBA.............................................................................62
5.7 Configuraes de uma rede bayesiana dinmica no mini-TUBA................62
5.7.1 Gesto das variveis.............................................................................62
5.7.2 ndice de Markov .................................................................................65
5.7.3 Discretizao........................................................................................65
5.7.4 Algoritmo de aprendizagem.................................................................66
5.7.5 Redes....................................................................................................66
5.7.6 Resultados e concluses.......................................................................70
5.8 Modelo IV Redes bayesianas e regras ......................................................71
6 Concluses ...........................................................................................................75
7 Trabalho futuro ....................................................................................................79
Anexo I Sub-redes que se conservam no Top10 das redes bayesianas dinmicas
calculadas no mini-Tuba..............................................................................................81
11
Referncias...................................................................................................................83

12
ndice de figuras
Figura 1: DBN para cirurgia cardaca desenvolvida atravs de modelos em rvore
locais (Verduijn, Peek et al. 2007)...............................................................................26
Figura 2: mini-TUBA workflow (Xiang, Minter et al. 2007)......................................30
Figura 3: mini-TUBA na Web (Xiang, Minter et al. 2007) .........................................31
Figura 4: Modelo final da rede.....................................................................................44
Figura 5: Matriz representativa dos valores de cada atributo para cada doente
("scatterplot" obtido com o software WEKA) .............................................................47
Figura 6: Aspecto final da rede construda no GeNIe..................................................53
Figura 7: Opes de configurao do algoritmo BayesNet .........................................55
Figura 8: Rede A obtida no WEKA (dados discretizados com o filtro
weka.filters.unsupervised.attribute.Discretize)............................................................57
Figura 9: Rede B obtida no WEKA (dados discretizados em intervalos com
significado mdico)......................................................................................................58
Figura 10: Rede Bayesiana com Markov lag 2 e sem discretizao das variveis (rede
1 do Top10)..................................................................................................................67
Figura 11: Score atribuido s 10 melhores redes (Top10)...........................................67
Figura 12: Rede Bayesiana com Markov lag 2 e com discretizao das variveis por
binning .........................................................................................................................68
Figura 14: Rede Bayesiana com Markov lag 2 e com dados discretizados em
intervalos com significado mdico ..............................................................................69
Figure 16: Regras utilizadas na rede TAN final em um dos folds ...............................72
Figure 17: Regra encontrada durante a construo da rede .........................................73
Figure 18: Sub-rede que se conserva nas 10 melhores redes com as seguintes
configuraes: Markov lag 2 e sem discretizao das variveis (Figura10) ...............81
configuraes: Markov lag 2 e com discretizao das variveis por binning (Figura10)
......................................................................................................................................81
13
configuraes: Markov lag 2 e com dados discretizados em intervalos com significado
mdico..........................................................................................................................82

14
ndice de tabelas

Tabela 1: Variveis ......................................................................................................35
Tabela 2: Atributos seleccionados da base de dados ...................................................46
Tabela 3: Intervalos de discretizao. A justificao para a escolha destes intervalos
est descrita aquando a apresentao de cada varivel (Subseco 4.4.). ...................49
Tabela 4: Estatistica da aplicao do algoritmo EM....................................................50
Tabela 5: Probabilidades marginais para Presso Arterial Sistlica (sbp) ..................51
Tabela 6: Probabilidades marginais para Presso Arterial Diastlica (dbp)................52
Tabela 7: Probabilidades marginais para Idade ...........................................................52
Tabela 8: Probabilidades marginais para Peso.............................................................52
Tabela 9: Sumrio da cross-validation rede A.............................................................57
Tabela 10: Resultado da cross-validation rede B.........................................................58
Tabela 11: Aspecto da base de dados utilizada no mini-TUBA com representao de 9
dos 502 doentes............................................................................................................64
Tabela 12: Probabilidades condicionais do n Status..................................................67
Table 15: Score da melhor rede TAN encontrada por fold..........................................72

15
Organizao da tese

Este documento encontra-se estruturado da seguinte forma:
No captulo 1 contextualizamos o nosso trabalho, definimos os seus objectivos e
introduzimos o problema a ser abordado.
No Captulo 2 feito o estudo do estado da arte no que concerne a redes bayesianas e
a sua aplicao no prognstico de doenas. feita uma descrio das redes
bayesianas estticas e dinmicas.
O captulo 3 apresenta uma descrio das ferramentas utilizadas neste trabalho.
O captulo 4 descreve o processo de modelagem qualitativa e o trabalho efectuado
com a base de dados para poder aplicar o algoritmo de redes Bayesianas. No mesmo
captulo descrevemos o processo de modelagem quantitativa com apoio do software
GeNIe, com apoio do software WEKA, com apoio do software Aleph e com apoio do
software mini-TUBA.
No Capitulo 5 apresentamos o problema mdico e a rede inicial construda
manualmente.
No Capitulo 6 apresentamos uma avaliao das redes sob os pontos de vista
quantitativo e qualitativo.
O Captulo 7 dedicado s concluses onde so debatidos os pontos-chave do
trabalho bem como analisadas as reais potencialidades da aplicao de redes
bayesianas ao prognstico de sobrevivncia no cancro da prstata. So ainda
debatidas perspectivas futuras para sistemas deste gnero no ltimo captulo.
16
17
1 Introduo

Em 2001, (Sim, Gorman et al. 2001) referem que os Sistemas de Apoio Deciso
Clnica (SADC) melhoram a qualidade dos cuidados de sade substancialmente. Os
mesmos concluem que os SADC so pouco utilizados na prtica clnica diria dos
profissionais de sade ou que os resultados que advm dos SADC no so aplicados.
Esta tendncia tem vindo a alterar-se devido grande variedade de reas clnicas que
so abrangidas pelos SADC e nova posio adoptada pelos profissionais de sade na
utilizao de sistemas informticos na prtica clnica.
A quantidade de dados mdicos guardados digitalmente tem vindo a crescer de forma
exponencial. A organizao e seleco destes dados uma necessidade, o que
incentiva a procura de formas rpidas e lgicas de o fazer. Actualmente recorre-se a
sistemas que agem racionalmente (de raciocnio probabilstico, estatstico ou tcnicas
de optimizao) na gesto de dados mdicos, para resolver problemas de diversas
reas como diagnstico ou prognstico. Alguns destes sistemas empregam mtodos
de aprendizagem de mquina (do ingls machine learning) para aprender algum
modelo para os dados.
A aplicao de machine learning ao diagnstico e deteco de tumores malignos
frequente, principalmente no tratamento de imagem mdica e na rea celular.
Existem trs focos de preocupao nesta rea: prever a susceptibilidade de
desenvolver cancro, prever a possibilidade de um cancro tratado recidivar, e prever a
capacidade de sobrevivncia. O ltimo foco, o que vamos explorar neste trabalho,
procura prever um resultado (outcome) como esperana de vida, sobrevivncia,
progresso da doena e sensibilidade teraputica, aps o diagnstico da doena.
Para fazer esta previso, utilizamos redes bayesianas. Estas so muito utilizadas e
populares por serem classificadores probabilsticos. Dado um conjunto de
observaes, que no contexto deste trabalho, so os dados clnicos de cada doente, o
que uma rede bayesiana permite fazer atribuir uma probabilidade a um determinado
doente de ter ou no esperana de vida, dada a sua informao clnica.
18
Considerando os valores dos dados clnicos de doentes, construmos uma rede causal,
com o auxlio de um especialista em cancro de prstata, utilizando a ferramenta
GeNie (GeNIe Visited 2010), especifica para construo e teste de redes bayesianas e
que possui uma interface grfica para o desenho da rede. Alm de avaliar esta rede,
tambm utilizamos ferramentas para gerao automtica de redes bayesianas: WEKA
(Mark, Eibe et al. 2009), MiniTUBA (Xiang, Minter et al. 2007), e SAYU (Srinivasan
2001; Davis, Burnside et al. 2005).
Utilizmos o conjunto de dados disponvel em
Herzberg 1985) como fonte para treino dos modelos de rede e para teste da nossa
rede.
Houve vrios aspectos a contemplar na aplicao das ferramentas ao conjunto de
dados, pois este necessitou de vrios processos de tratamento dos dados para cada
ferramenta.
Os resultados mostram que para o problema mdico em questo, as redes geradas
automaticamente comportam-se to bem ou melhor que a rede construda
manualmente, alm de apurarem relaes causais no existentes na rede gerada
automaticamente.
Resumindo, podemos dizer que redes bayesianas so um mtodo simples, mas
poderoso de auxiliar o prognstico de doentes com cancro da prstata, permitindo
melhorar as escolhas do tratamento para cada caso especfico. Detalhou-se a evoluo
do cancro da prstata em vrios doentes, permitindo melhorar o tratamento de futuros
casos.

19
2 Estado de arte
2.1 Redes Bayesianas

Na Medicina encontramos diferentes situaes que englobam lidar com um grande
leque de informao, informao essa que necessita de uma avaliao rigorosa para se
poder atingir os objectivos pretendidos, sejam eles a gesto de um servio ou uma
deciso teraputica. Os sistemas de apoio deciso clnica permitem agrupar toda a
informao existente e retirar dela informao pertinente. As redes bayesianas so
modelos que integram sistemas de apoio deciso clnica e permitem capturar
informao e lidar com situaes de incerteza. Estas so teis em situaes de
incerteza, pois determinam uma probabilidade de um certo acontecimento dependente
das variveis e das suas relaes. A representao grfica das relaes de causalidade
das variveis do sistema permite uma visualizao simplificada do sistema.
Uma rede Bayesiana pode ser definida como uma rede probabilstica. constituda
por uma estrutura grfica e uma distribuio de probabilidades a ela associada.
Matematicamente podemos definir como B = (Pc,G) onde G um grafo acclico
direccionado e Pc as probabilidades condicionais associadas a cada varivel
probabilstica representada em um n do grafo. O grafo um grafo acclico com ns e
arcos.
Ao referirmo-nos ao Markov Blanket de um n X, estamos a designar o n X, os
seus pais, os seus filhos e os outros pais dos seus ns filhos.
Cada n representa uma varivel que toma um valor dentro de um intervalo finito e
cada arco representa uma relao probabilstica entre as variveis. Para cada varivel
do grafo esto definidas as probabilidades condicionais. Cada uma destas
probabilidades descreve o efeito de uma combinao especfica de valores.
Uma probabilidade condicional (Pc) a probabilidade de determinado evento X
ocorrer sabendo que ocorreu o evento Y, representado matematicamente por Pc(X|Y).
O Teorema de Bayes relaciona as probabilidades dos dois acontecimentos X e Y com
as suas probabilidades condicionais mtuas, isto :
20

) (
) (
) ( ) (
Y P
X P
X Y P Y X P = (Teorema de Bayes)

Os grafos no s permitem ao utilizador perceber quais as variveis que influenciam
outras variveis, como tambm so o suporte para o clculo computacional das
probabilidades condicionais que so necessrias para os resultados ou aprendizagem.
A leitura e interpretao dos grafos so bastante intuitivas e torna fcil a interpretao
dos resultados, o que significa que, ao contrrio de outros mtodos tais como as redes
neuronais que so consideradas caixas negras, as redes bayesianas permitem uma
clara interpretao semntica dos modelos.
As redes bayesianas permitem-nos obter resultados com um bom intervalo de
confiana mesmo quando trabalhamos com grande quantidade de informao. So
tambm modelos muito robustos que permitem pequenas alteraes sem afectar a sua
performance.
Outra vantagem das redes bayesianas, que explorada neste trabalho, o facto de
permitir conjugar o conhecimento cientfico com os dados estatsticos de uma forma
simples.
Normalmente, as redes bayesianas no representam eventos temporais, somente factos
ocorridos em uma determinada data. Porm para alguns problemas pode ser
importante representar mudanas de valores de uma varivel ao longo do tempo. Isto
particularmente importante em ambientes mdicos, onde o doente acompanhado e
pode ter seu quadro clnico alterado ao longo do tempo.
J existem alguns sistemas desenvolvidos que permitem a introduo de informao
colhida em diferentes momentos temporais. Estes modelos denominam-se de Redes
Bayesianas Dinmicas (DBNs). Em 2007, Marion Verduijn et al publicaram uma
aplicao para prognstico de situaes em doentes sujeitos cirurgia cardaca
ProCarSur, utilizando DBNs (Verduijn, Rosseel et al. 2007). Esta aplicao lida com
um vasto leque de variveis e com vrios valores para a mesma varivel, valores estes
que so registados em diferentes momentos temporais. Neste exemplo consideraram-
se os seguintes momentos: colheita de dados no pr-operatrio, dados durante a
21
cirurgia, dados das primeiras 24h na Unidade de Cuidados Intensivos ps-cirrgicos e
dados de todo o internamento ps-operatrio.
As Redes Bayesianas Dinmicas representam um poderoso mtodo de modelo
probabilstico para identificar padres causais ou aparentes em bases de dados
temporais.
A utilizao de DBNs permite ao investigador identificar parmetros significativos e
relaes entre eles. Elas so particularmente teis quando h um grande nmero de
variveis e as suas relaes so complexas, pois como j foi referido, uma das
vantagens das redes bayesianas o facto de obterem bons resultados mesmo lidando
com grande nmero de dados.
Nas DBN podemos obter uma corrente causal de variveis, isto , uma sequncia de
eventos necessrios para produzir um determinado resultado. Com outras tcnicas de
machine learning dificilmente se obtm estas correntes causais.
As DBN tambm podem incluir conhecimento mdico do especialista pois possvel
forar ou ignorar relaes entre as variveis.
Redes Bayesianas Dinmicas so, assim como as redes bayesianas estticas, um tipo
de modelo de prognstico. Os modelos de prognstico, em sade, so ferramentas
que prevem o resultado de uma doena ou do tratamento dessa mesma doena
(Verduijn, Peek et al. 2007) num perodo de tempo futuro. As DBNs permitem-nos,
alm de prever o resultado, visualizar a influncia das variveis nesse mesmo
resultado ao longo do tempo, prevendo o resultado individual de uma aco.
Fornecendo-lhe dados especficos de alguns doentes podem obter um possvel
resultado de um acto mdico ou de uma doena no futuro, mas para tal necessitamos
de informao acerca do ciclo da doena do doente e das opes tomadas para
tratamentos ao longo do processo.
Segundo vrios autores (Kononenko 1993; Chickering, Heckerman et al. 1997;
Ghahramani 1998; Lahdesmaki and Shmulevich 2008; van Gerven, Taal et al. 2008)
as DBNs trazem vantagens quando comparadas com outros mtodos como os
processos de deciso de Markov, redes neuronais, ou rvores de deciso, que
permitem tambm a construo de modelos de prognstico em medicina. Alguns
destes modelos (em especial as redes neuronais) funcionam como caixas pretas, isto
22
, no permitem ao utilizador saber como atingiram uma determinada concluso de
prognstico.
Em relao aos outros modelos, as DBNs podem ser usadas para representar
conhecimento mdico descrito em causas e efeitos que obtm dos dados,
conhecimentos de especialistas, e/ou literatura. Nestas redes no so feitas suposies
restritivas acerca da interaco entre variveis. (Ghahramani 1998; van Gerven, Taal
et al. 2008).
As DBNs representam um mtodo poderoso para identificar possveis padres
causais em conjuntos de dados heterogneos e complexos, com tolerncia para grande
variabilidade de dados e no linearidade. Segundo Van Gerven (2008), pelas suas
vantagens, por ser uma generalizao do processo de deciso de Markov e por no
restringir as relaes entre as variveis, as DBNs permitem resolver algumas das
limitaes actuais dos modelos de prognstico (van Gerven, Taal et al. 2008).
Os mesmos autores elucidam-nos sobre os passos necessrios de forma a obter um
modelo de prognstico satisfatrio de Redes Bayesianas Dinmicas. Este modelo
permite obter uma rede de relaes entre variveis que emergem ao longo do tempo
escolhido para o caso em estudo. (Verduijn, Peek et al. 2007) apresentam um modelo
de aprendizagem da rede.
A aprendizagem uma das caractersticas que define os sistemas baseados em
inteligncia artificial. difcil definir aprendizagem pelo que a maioria dos artigos
concorda que uma caracterstica dos sistemas adaptativos que so capazes de
melhorar o seu comportamento em funo da sua experincia passada, por exemplo,
resolver problemas semelhantes. A aprendizagem da rede um processo que permite
a optimizao do modelo atravs da descoberta de novos padres a partir de novos
dados, mais extensos e complexos.
O desenvolvimento de redes bayesianas Dinmicas e a aprendizagem destas mesmas
redes remonta a 1997, com Chickering et al, mas sem aplicao a dados em concreto,
apenas a viso matemtica dos mtodos. (Chickering, Heckerman et al. 1997;
Ghahramani 1998).
A aprendizagem em redes bayesianas inicia-se sobre um modelo pr-existente
elaborado por conhecimento prvio de especialistas, pelos dados ou ambos (prior
knowledge). Este conhecimento prvio representado na forma de uma distribuio
23
de probabilidade numa estrutura do modelo e parmetros. Esta representao
melhorada utilizando novos dados de forma a obter uma nova distribuio de
probabilidade sobre a estrutura do modelo e os parmetros.
Existem tambm mtodos de aprendizagem dos parmetros e da estrutura da rede
bayesiana e mtodos de aprendizagem atravs de dados incompletos.
A aprendizagem uma combinao de prior knowledge com novos dados e obtm
melhorias no conhecimento (melhora as probabilidades da estrutura de uma rede
bayesiana pr-existente). Segundo Cruz obter sucesso com a aprendizagem do modelo
nem sempre garantido. Em qualquer mtodo utilizado importante existir um bom
conhecimento do problema e das limitaes dos dados disponveis assim como das
hipteses e limitaes do algoritmo aplicado. (Cruz and Wishart 2007)

2.2 Escolha do problema mdico
O cancro a causa lder de morte no mundo e o nmero total de casos est, de forma
global, a aumentar. O nmero global de mortes por cancro previsto aumentar 45%
de 2007 at 2030 (de 7.9 milhes para 11.5 milhes de mortes), influenciado em parte
por um aumento e envelhecimento da populao global (WHO visited 2010).
Quem vive diariamente num servio de sade apercebe-se deste aumento exponencial
de casos que surgem para tratamento de cancro, seja cirrgico, farmacolgico,
curativo ou paliativo. Os casos aumentam, a variabilidade grande entre cada caso,
mas a doena comea a ser uma ameaa cada vez mais estudada e previsvel.
Vrios cancros poderiam ser problemas propostos e aplicados, mas a escolha do
problema levou em considerao aspectos prticos e de utilidade. Esta foi feita a
partir de consideraes sobre a praticidade de se construir um sistema especialista
modelando o problema e tambm sobre os possveis benefcios que um sistema traria
rea mdica envolvida. Os critrios adoptados so descritos a seguir:
a) Nvel de complexidade do problema mdico
A obteno de informao mdica um tema muito complexo que coloca em causa
diversos problemas como a segurana da informao, a confidencialidade, etc. Quanto
mais complexo for o problema mdico, mais difcil seria disponibilizarem uma base
de dados com informao de doentes. Como j foi referido neste trabalho, o cancro
24
a causa lder de morte no mundo e o nmero total de casos est, de forma global, a
aumentar, influenciado em parte por um aumento e envelhecimento da populao
global.
Os casos aumentam, a variabilidade grande entre cada caso e a doena comea a ser
uma ameaa cada vez mais estudada e previsvel, pelo que este tema seria pertinente e
de maior facilidade em encontrar informao.
b) Possvel benefcio que o sistema de deciso traria ao problema
Este item considerou os possveis benefcios em termos financeiros e de ganhos em
sade com um sistema de apoio deciso clnica. Os ganhos em sade podem-se
referir a anos de vida, melhora de qualidade de vida, ou ganhos monetrios obtidos
com a escolha de melhores procedimentos mdicos.
c) Disponibilidade do mdico especialista que auxiliou na construo do sistema
Foi necessrio contactar com um mdico especialista com interesse em conhecer
sistemas de apoio deciso clnica e que mostrasse disponibilidade e abertura para
auxiliar durante a construo do sistema.

2.3 Utilizao das redes bayesianas para o prognstico de
sobrevivncia no cancro da prstata
A aplicao de mtodos de tratamentos de dados e de machine learning no cancro no
novidade. As primeiras aplicaes foram no apoio deteco e diagnstico e
iniciaram-se h aproximadamente 25 anos (finais da dcada de 80) no diagnstico de
cancro da mama e do sistema digestivo (Graham, Paplanus et al. 1990; Wolberg,
Street et al. 1994).
Kononenko em 1993 refere a aplicao de sistemas de aprendizagem de rvores de
deciso e do classificador Naive Bayes em problemas de diagnstico (localizao de
tumores primrios, recorrncia do cancro da mama, tumores da tiride e
reumatologia) (Kononenko 1993).
O objectivo de obter prognsticos no cancro diferente do objectivo da deteco e
diagnstico. No prognstico medicamente til saber informaes dos riscos a que o
25
doente pode estar sujeito, conhecer a probabilidade de recorrncia do cancro e qual a
probabilidade de sobrevivncia de um doente ao longo do tempo.
Os modelos de prognstico podem prever doenas e seus tratamentos. So
importantes para ajudar no tratamento da grande quantidade de dados que surgem
actualmente de doentes que sofreram de cancro e que ao longo da doena viveram
diferentes tratamentos e diferentes respostas obtendo de diferentes formas e tempos o
mesmo resultado, a morte. A morte um importante resultado pois o fim clnico do
processo de cuidar.
Como j foi referido, existem alguns sistemas desenvolvidos para aplicao de DBNs
em dados mdicos, como por exemplo o ProCarSur (doentes sujeitos a cirurgia
cardaca) (Verduijn, Rosseel et al. 2007). Em 2007 Zuoshuang Xiang et al
desenvolvem tambm o mini-TUBA, um sistema de modelao na internet que
permite a investigadores clnicos e biomdicos obterem inferncias clnicas e
antecipaes utilizando DBNs com dados temporais (Xiang, Minter et al. 2007).
Utilizando o ProCarSur, Verduijn et al obtm uma DBN de dados clnicos de doentes
sujeitos a cirurgia cardaca usando um mtodo de aprendizagem da rede a partir de
modelos locais. Ele considera que se deve determinar um Markov Blanket apropriado
para cada varivel, permitindo assim seleccionar o melhor subgrupo em
caractersticas preditivas para cada varivel. Atravs dos modelos locais possvel
representar a probabilidade de distribuio de cada varivel determinando quais os
seus pais na rede. A rede final obtida atravs dos dados por uma estratgia de busca
local (Verduijn, Peek et al. 2007).
A rede final obtida por Verduijn et al para cirurgia cardaca desenvolvida atravs de
modelos locais uma rede bayesiana que no permite aprendizagem (Figura 1). A
aprendizagem desta rede aplicada na sua elaborao, isto , a rede no surge
somente de prior knowledge nem somente de dados, mas de uma combinao dos
dois.
A Figura 1 mostra um exemplo de DBN para cirurgia cardaca, onde cada nvel
corresponde aos diferentes tempos de recolha de dados dos doentes em causa e mostra
quais as variveis medidas em cada momento.
26

Figura 1: DBN para cirurgia cardaca desenvolvida atravs de modelos em rvore locais (Verduijn, Peek et
al. 2007)

Perante a pesquisa efectuada, tornou-se evidente a utilidade de machine learning de
forma a permitir aos computadores aprender atravs de exemplos passados e a
detectar padres em grandes quantidades de dados complexos. Esta aplicao no
prognstico do cancro no recente na rea de diagnstico, mas recente e ainda
pouco explorada na previso da sobrevivncia.
importante contribuir para auxiliar o mdico na tomada de deciso no que respeita
ao tratamento do cancro tendo em conta os resultados que advm de tais decises.
Se existirem opes com probabilidades para os diferentes resultados que podem
surgir consoante o tratamento escolhido e as caractersticas do caso clnico, o mdico
mais facilmente utiliza o seu conhecimento cientfico em decises ponderadas
matematicamente.
As redes bayesianas so alvo de vrios estudos e artigos publicados. So as que
apresentam mais vantagens como modelos de prognstico apesar de a maioria dos
estudos na previso da sobrevivncia do cancro aplicarem como mtodo de machine
learning as redes neuronais artificiais (ANNs) (Cruz and Wishart 2007).
27
3 Material e Mtodos
A pesquisa bibliogrfica efectuada para o desenvolvimento deste trabalho incidiu
sobre os seguintes termos: dynamic bayesian networks, prognostic, cancer, learning
Bayesian networks.
A pesquisa foi efectuada nas seguintes bases de dados: Medline, PubMed, Google
Scholar, Scopus e ScienceDirect (editora Elsevier).
Os artigos encontrados foram filtrados por tema (incluindo s os da rea da sade,
bioinformtica e/ou medicina). Os termos em questo incluam: dynamic bayesian
networks, prognostic and cancer, learning Bayesian networks, machine
learning and cancer prediction.
A relevncia de cada artigo foi discutida tendo em conta os ttulos e os resumos.
Foram identificados alguns artigos que tenham utilizado mtodos de redes bayesianas
dinmicas e dados na rea da sade (moleculares, clnicos, histolgicos,
epidemiolgicos). Foram seleccionados tambm os que determinam prognstico no
cancro.
No Scopus em particular foram encontrados 14 artigos aps a filtragem. Desses 14, 8
so relacionados com gentica, 4 so tentativas matemticas de melhorar uma rede
bayesiana dinmica e 2 so aplicaes de redes bayesianas dinmicas com dados
mdicos em situaes de diagnstico/prognstico.
Esta pesquisa demonstrou que ainda h muita investigao a desenvolver na aplicao
de redes bayesianas Dinmicas na rea da sade. Em artigos de 1995 inicia-se a
abordagem de assuntos sobre modelos de prognstico na rea da sade, mas sem
aplicaes clnicas ou aplicaes de redes bayesianas. Os artigos encontrados nesta
filtragem iniciam-se em 2005 at aos dias de hoje (2010).
Alguns artigos utilizados para o desenvolvimento deste trabalho e aprofundamento de
alguns temas, foram seleccionados tendo em conta as referncias bibliogrficas de
outros artigos.

28
3.1 O software open source
Neste trabalho, optamos por utilizar apenas ferramentas livres e open source. Desta
forma, o software apresentado nesta seco pertence a esta classe.
3.1.1 GeNIe
GeNIe a interface grfica para o SMILE.
SMILE (Structural Modeling, Interface, and Learning Engine) uma biblioteca de
classes de C++ que implementa mtodos grficos de decises. A sua interface grfica
o GeNIe, um ambiente de desenvolvimento amigvel para grficos de modelos de
deciso.
Ambos foram desenvolvidos no Laboratrio de Sistemas de Deciso na Universidade
de Pittsburgh, disponveis para a comunidade desde Julho de 1998.
GeNIe um software que pode ser utilizado para criar modelos de deciso intuitivos
utilizando uma interface grfica de click-and-drop.

3.1.2 WEKA
WEKA um software disponvel online (tambm open source), desenvolvido na
Universidade de Waikato na Nova Zelndia. Este software permite implementar
diversos algoritmos sobre bases de dados, assim como possui diversas ferramentas
que permitem transformar a base de dados (por exemplo, discretizar as variveis
contnuas, funo que foi utilizada e descrita no Captulo 5.2).
Neste estudo pretendeu-se explorar a aplicao dos classificadores de redes
bayesianas, e vrios esto implementados no WEKA. Aplicaram-se estes
classificadores sobre a base de dados utilizada em todo este trabalho.
Todos os algoritmos de redes bayesianas implementados no WEKA assumem que a
base de dados cumpre os seguintes requisitos: todas as variveis so discretas e finitas
e no existem valores em falta. No final obtiveram-se duas redes pois utilizaram-se os
dados discretizados pelos dois processos descritos no Captulo 5.2.
A aprendizagem de uma rede bayesiana implica naturalmente dois passos: primeiro
aprender a estrutura da rede e depois as tabelas de probabilidades.

29
3.1.3 Mini-TUBA
MiniTUBA (medical inference by network integration of temporal data using
Bayesian analysis) uma ferramenta disponvel na Web que permite a investigadores
clnicos e/ou biomdicos obterem uma anlise bayesiana dinmica utilizando bases de
dados temporais. Com o MiniTUBA possvel explorar a forma como dados mdicos
recolhidos ao longo do tempo podem ser utilizados em inferncia estatstica.
Foi desenvolvido por Z.Xiang et al, Center for Computational Medicine and Biology,
University of Michigan, Ann Arbor, MI, EUA.
Os utilizadores so capazes de actualizarem a base de dados continuamente e
melhorar os resultados. Mini-TUBA oferece prognsticos e sugestes de intervenes
baseado num processo automtico de aprendizagem utilizando todos os dados
disponveis.
A utilizao do mini-TUBA permite obter uma DBN a partir de dados inseridos pelo
utilizador, configurada consoante os resultados que se pretende obter (definindo os
parmetros da rede bayesiana). Esta DBN permite ao utilizador obter inferncias
sobre a contribuio de uma interveno sobre um caso especfico.
A Figura 2 ilustra o processo de aprendizagem das redes bayesianas dinmicas
utilizadas no mini-TUBA. O software permite ao utilizador fazer login (com um login
geral ou pedindo autorizao para ter uma conta privada) de forma a disponibilizar a
introduo de novos dados para um novo estudo, ou a alterar os parmetros de um
estudo j existente de forma a calcular nova rede. Toda a informao introduzida pelo
utilizador fica guardada numa base de dados MySQL que lida pelo software de
forma a realizar uma anlise bayesiana. Os resultados so apresentados na pgina do
estudo do utilizador, permitindo a qualquer momento alterar os dados ou os
parmetros de clculo.
30

Figura 2: mini-TUBA workflow (Xiang, Minter et al. 2007)

A vantagem desta aplicao consiste na facilidade em conseguir uma aprendizagem
da rede, bastando para tal introduzir mais dados na base de dados. A dificuldade surge
com grande quantidade de dados, pois o clculo da rede de um projecto mini-TUBA,
no mximo de dados que ele permite, pode demorar at 144 h (o que representa um
investimento computacional significante). Outra desvantagem que a aprendizagem
da rede implica o clculo de uma nova rede. Por outro lado este sistema permite
facilidade de acesso mesma (disponvel na Web, ver exemplo de interface na Figura
3) e a possibilidade de aplicao do software em qualquer base de dados introduzida
pelo utilizador.

31

Figura 3: mini-TUBA na Web (Xiang, Minter et al. 2007)

3.1.4 Aleph e SAYU
As ferramentas apresentadas nas seces 3.1.1, 3.1.2 e 3.1.3 so consideradas de
aprendizagem proposicional. Nesta seco apresentamos uma ferramenta de
aprendizagem estatstica relacional que combina regras de primeira ordem com redes
bayesianas. Para a aprendizagem das regras utilizamos o sistema Aleph (Srinivasan
2001) e para a integrao das regras numa rede bayesiana utilizamos o sistema SAYU
(Davis, Burnside et al. 2005). Aleph foi desenvolvido em Prolog por Ashwin
Srinivasan, na Universidade de Oxford, Inglaterra. SAYU foi desenvolvido por Davis
et al, na Universidade de Wisconsin, Madison, EUA.
Dados um conjunto de exemplos positivos e negativos e suas descries em uma
linguagem de primeira ordem, e uma linguagem de restries, Aleph busca encontrar
o melhor modelo para os exemplos atravs da construo de regras de primeira
ordem. SAYU (Score As You Use) utiliza estas regras para construir uma rede
bayesiana. Em outras palavras, SAYU avalia cada regra de acordo com sua
contribuio probabilstica na rede construda utilizando esta regra como varivel.
32
33
4 Modelo Qualitativo da rede Bayesiana
4.1 Processo para criao do modelo da rede
Para a criao do modelo estrutural da rede, em conjunto com o especialista da rea,
foram necessrias diversas reunies que permitissem a partilha de conhecimento
mdico.
Nestas reunies, procurou-se identificar quais as informaes relevantes, relativas ao
problema mdico, que poderiam ser representadas como variveis na rede.
Esta informao cedida pelo especialista foi cruzada com fontes bibliogrficas e
foram encontradas as variveis relevantes assim como as relaes entre elas.
A estrutura obtida inicialmente necessitou de diversos ajustes que foram realizados ao
longo das reunies com o especialista.

4.2 A escolha das variveis
A escolha das variveis foi realizada tendo em conta trs diferentes momentos
temporais do desenvolver da doena, que se iniciam com a colheita de dados do
doente e terminam 5 anos depois da cirurgia de Prostatectomia Radical (PR). Esta
diviso temporal veio facilitar a seleco das variveis de uma forma mais
organizada, permitindo tambm a sua posterior utilizao em modelos de redes
bayesianas dinmicas.
Os trs momentos temporais so:
(1) o momento da colheita de dados do doente
(2) quando se obtm os resultados dos exames auxiliares de diagnstico
realizados
(3) 5 anos aps cirurgia de prostatectomia radical
As variveis de cada momento foram obtidas de uma forma criteriosa. Inicialmente o
especialista props as que achava relevante derivado da sua experincia mdica, e
posteriormente foi confrontado com a opinio de autores de forma a completar o seu
raciocnio clnico.
34
Joseph A. Cruz (Cruz and Wishart 2007) refere algumas variveis que diversos
autores consideram pertinentes no prognstico do cancro (em geral) como a histria
familiar, a idade, a dieta, o peso, hbitos de vida de risco (fumador ou alcolico),
exposio a ambientes carcinognicos, etc. Colozza et al refere tambm a importncia
de conjugar estes dados familiares com dados clnicos como resultados de exames ou
dados moleculares, pois o avano da tecnologia tem-nos permitido obter cada vez
mais pormenores de cada doena e de cada doente particularmente (Colozza, Cardoso
et al. 2005).
Na rea especfica do cancro da prstata, (Revett, Magalhes et al. 2006) consideram
que factores como a dieta, a hereditariedade, factores ambientais que afectam as
hormonas masculinas observados em estudos epidemiolgicos, podem ser a causa da
doena. Os mesmos autores consideram dois factores importantes para a deteco
precoce do cancro da prstata: o toque rectal e os valores do Prostate Specific-Antigen
(PSA), por outro lado colocam a idade como um importante factor de incidncia. No
seu artigo, (Revett, Magalhes et al. 2006), obtm um conjunto de variveis que
consideram relevantes como causadoras do cancro da prstata, atravs da investigao
de um conjunto de dados mdicos com informao clnica de doentes com cancro da
prstata, utilizando mtodos de machine learning.
Alan W. Partin et al (Partin, Mangold et al. 2001) surgem com as Partins Tables,
tabelas que permitem predizer o estadio patolgico da doena atravs da conjugao
de variveis clnicas pr-operatrias tais como o valor do PSA, Gleason Stage e o
estadio clnico. Os resultados obtidos com a utilizao destas tabelas podem facilitar a
deciso teraputica para um determinado doente.
Os dados obtidos a partir da realizao de biopsia prosttica transrectal ecoguiada
tambm so factores determinantes de deciso teraputica. Um relatrio completo
deste exame pode conter os seguintes dados: valor de PSA, volume da prstata,
aspecto das vesculas seminais, presena de ndulos hipoecognicos e localizao e
em termos histolgicos o Gleason Score e a presena ou ausncia de penetrao da
cpsula.
A conjugao do conhecimento extrado nestas pesquisas com a experincia do
especialista permitiu-nos obter as variveis finais que se podem ver na Tabela 1.

35
Tabela 1: Variveis
Nome da varivel Abreviatura
Idade idade
Peso wt
Histria familiar de cancro hx_familiar_ca
International Prostate Symptom
Score
IPSS
Presso arterial sistlica sbp
Presso arterial diastlica dbp
Hemoglobina hemoglobina
Ndulos hipoecognicos nodulos_hipoecogenicos
Prostate specific-antigen PSA
Estadio Clnico estadio_clinico
Gleason Stage (ouu Gleason Score) gleason_stage
Penetrao da cpsula prosttica penetrao_capsula
Envolvimento das vesiculas
seminais
env_vesiculas_sem
Envolvimento linftico env_linfatico
Doubling time PSA doubling_time_psa
Tamanho da prstata volume_prostata
Metstases sseas metastases_osseas
Status aps 5 anos da cirurgia sobrevivncia_5anos

4.3 As variveis
4.3.1 Idade
Refere-se idade do doente no momento em que realizada a colheita de dados
iniciais, na primeira consulta mdica de Urologia. A idade medida em anos e a
escala utilizada neste estudo a seguinte:
<= 40
41-50
36
51-60
61-70
71-80
81-90
>90
A utilizao desta escala com intervalos de 10 anos foi propositada. Existem diversos
estudos que comprovam que a idade avanada influncia o prognstico do cancro da
prstata, assim, esta diviso permite tirar concluses mais pormenorizadas.

4.3.2 Peso
Refere-se ao peso do doente no momento em que realizada a colheita de dados
iniciais, na primeira consulta de Urologia. O peso medido em Kilogramas (Kg) e a
escala utilizada neste estudo a seguinte:
<=80
80-88
>88
A utilizao desta escala foi baseada no ndice de Massa Corporal (IMC). Uma
pessoa com peso superior a 88 kg e uma estatura mdia (considerando uma estatura
mdia de 1,70 m), considerada pelo IMC no limite para obesidade de grau I.

4.3.3 Histria familiar de cancro
Diversos estudos apoiam a teoria de que a presena de cancro em outros membros da
famlia um elevado factor de risco (gentico) para a pessoa vir a desenvolver cancro.
A escala utilizada neste estudo a ausncia ou presena de casos de cancro na
famlia.

37
4.3.4 International Prostate Symptom Score
International Prostate Symptom Score um questionrio que foi desenvolvido e
validado pelo comit multidisciplinar da Associao Americana de Urologia para
poder classificar o risco de aumento do volume prosttico atravs dos sintomas do
doente (Barry, Fowler et al. 1992).
O questionrio tem 7 perguntas que envolve a frequncia urinria, nocturia, fraco
jacto urinrio, intermitncia, hesitao, incompleto esvaziamento da bexiga e urgncia
urinria. A escala a seguinte:
0-7 Ligeiramente sintomtico
8-19 Moderadamente sintomtico
20-35 Severamente sintomtico

4.3.5 Presso arterial
A presso arterial foi dividida em duas variveis, presso arterial sistlica e presso
arterial diastlica. Esta diviso permite detectar mais facilmente uma presso arterial
alta, pois basta uma delas estar acima do valor considerado normal. Outro motivo para
esta diviso prende-se com o facto de esta varivel estar assim apresentada no
conjunto de dados utilizado neste estudo. A presso arterial medida em mmHg e a
escala utilizada a seguinte:
Presso arterial sistlica:
<14
>=14 Presso arterial alta
Presso arterial diastlica:
<9
>=9 Presso arterial alta

4.3.6 Hemoglobina
A hemoglobina medida atravs de anlises clnicas efectuadas ao doente. Esta
varivel surge em diferentes tempos desde que o doente tem a primeira consulta at 5
anos aps a cirurgia de prostatectomia radical, pois em diversos momentos so
38
realizadas anlises clnicas ao doente. Os momentos pertinentes para este estudo so:
as primeiras anlises efectuadas, as ps-cirurgicas e as finais (5 anos aps cirurgia).
Os valores de hemoglobina so medidos em gr/dl e a escala utilizada neste estudo a
seguinte:
<12,5
12,5-18
>=18
A utilizao desta escala justifica-se porque, segundo estudos laboratoriais, os valores
normais de hemoglobina numa pessoa saudvel se situam entre os 12,5 gr/dl e os 18
gr/dl.

4.3.7 Ndulos hipoecognicos
A presena de ndulos hipoecognicos na prstata est relacionado com a presena de
cancro da prstata, mas no especfico. A ecografia prosttica muito sensvel na
deteco destes ndulos, e como tal obtm bastantes resultados falsos positivos. A
probabilidade de encontrar cancro da prstata em doentes com ndulos
hipoecognicos detectados na ecografia varia de 15% a 37% (Pontes, Ohe et al.
1984).

4.3.8 Prostate Specific-Antigen (PSA)
O PSA uma protena produzida pela glndula prosttica. O seu valor medido
atravs de anlises ao sangue. Nveis altos de PSA no sangue esto directamente
relacionados com alteraes prostticas, que podem ser benignas ou malignas (cancro
da prstata).
Os valores de PSA so medidos em ng/ml e a escala utilizada neste estudo a
seguinte:
< = 4
> 4
39
A utilizao desta escala baseada no estudo efectuado por Thompson et al., que
verifica a maior probabilidade de incidncia de cancro da prstata em homens com
valores de PSA >4 ng/ml (Thompson, Pauler et al. 2004).

4.3.9 Estadio Clnico
A determinao do estadio clnico envolve observao clnica, toque rectal e estudos
auxiliares de diagnostico (como por exemplo a Eco, a TAC, a RM, a cintigrafia ssea,
). Atravs destes exames determina-se os estadios clnicos T1, T2, T3 e T4, sendo o
T1 o menos agressivo e o T4 o mais agressivo (j com doena disseminada).

4.3.10 Gleason Stage
O Gleason Stage determinado pelo patologista, na observao microscpica dos
fragmentos de tecido retirados durante a realizao de uma biopsia prosttica. Estes
fragmentos de glndula prosttica so examinados e o seu padro histolgico
classificado consoante os dois tipos de clulas presentes em maior quantidade. A
escala de Gleason varia de 1 a 5 consoante a arquitectura estrutural das clulas
glandulares que estaria dependente de maior ou menor grau de diferenciao celular e
a sua estrutura tecidular. O Gleason Stage ou score resulta da soma dos dois principais
padres encontrados. Esta escala para o cancro da prstata foi desenvolvida pelos Dr.
Gleason e Mellinger em 1974 como um mtodo para prever o comportamento do
cancro da prstata (Gleason and Mellinger 1974).

4.3.11 Penetrao da cpsula prosttica
Esta varivel poder ser inferida no momento da realizao de exames auxiliares de
diagnstico como a ecografia prosttica ou ressonncia magntica plvica mas
apenas confirmada pelo estudo histolgico de pea de prostatectomia radical.
A escala utilizada para este estudo a presena ou ausncia de penetrao de clulas
tumorais na cpsula prosttica.

40
4.3.12 Envolvimento das vesculas seminais
As vesculas seminais so duas glndulas adjacentes prstata e que produzem o
liquido seminal. Quando as clulas tumorais atingem as vesculas seminais significa
cancro da prstata localmente avanado e doena mais agressiva com maior
probabilidade de metastizao distncia.
A escala utilizada para este estudo a presena ou ausncia de envolvimento das
vesculas seminais no cancro da prstata.

4.3.13 Envolvimento linftico
semelhana do envolvimento das vesculas seminais, a presena de clulas tumorais
nos gnglios linfticos ilacos, sinal de mau prognstico por indicar doena j
metastizada.
A escala utilizada para este estudo a presena ou ausncia de envolvimento dos
gnglios ilacos no cancro da prstata.

4.3.14 Doubling time PSA
PSA doubling time (PSADT) o tempo que os valores de PSA demoram at atingir o
dobro. calculado com a frmula:
)) log( ) (log(
) 2 log(
A B
dT
PSADT
=
onde A e B so as medidas iniciais e finais de PSA e dT o tempo entre as duas
medidas.
O PSADT aps prostatectomia radical est directamente relacionado com a
mortalidade especfica por cancro da prstata. A escala de discretizao foi
seleccionada tendo em conta a diviso efectuada em outros estudos realizados (Teeter,
Presti et al. 2009). O doubling time PSA medido em meses e a escala a seguinte:
<3
3-8,9
9-14,9
41
> 15

4.3.15 Tamanho da prstata
Uma prstata com um volume superior a 20 gr, significa uma prstata de volume,
contudo anormal. Ser um aumento benigno (hiperplasia benigna da prstata). Apenas
nos casos de doena avanada localmente o volume da prstata poder ser
maioritariamente resultante do crescimento maligno. A determinao do volume da
prstata utiliza normalmente a frmula da elipse da prstata:

) _ _ _ _ (
2
al cefalocaud dimetro posterior anterior dimetro transverso dimetro Vp =

Esta a frmula mais usada em urologia para determinar o volume aproximado da
prstata. O tamanho da prstata medido em gramas (gr) e a escala utilizada a
seguinte:
<20
>=20

4.3.16 Metstases sseas
O local mais comum de disseminao do cancro da prstata o osso. A presena ou
no de metstases sseas no momento do diagnstico um elemento fundamental na
deciso do tratamento.
As metstases sseas so um factor de mau prognstico. Dos doentes com cancro da
prstata que desenvolvem metstase, 50% morrem num prazo de 30 meses. Num
estudo verificou-se que na autpsia de doentes que morreram de cancro da prstata
avanado, as metstases sseas estavam presentes em 80% a 90% dos casos.
A escala utilizada para este estudo a presena ou ausncia de metstases sseas.

42
4.3.17 Status aps 5 anos da cirurgia
Esta varivel o outcome do nosso conjunto de variveis. Um dos objectivos deste
estudo procurar relaes entre as variveis e de que forma estas mesmas influenciam
a mortalidade por cancro da prstata cinco anos aps prostatectomia radical.
A escala utilizada para este estudo consistiu no estado de doente morto ou vivo, cinco
anos aps a cirurgia.

4.4 Limitaes na escolha das variveis
Algumas variveis que foram consideradas pertinentes no puderam ser includas.
Estas variveis esto relacionadas com alteraes genticas que podero ser
indicativas de doentes que sofrem de cancro da prstata e tm que ser sujeitos a uma
prostatectomia radical. Como referia Colozza et al (Colozza, Cardoso et al. 2005), o
avano tecnolgico j nos permite obter dados mais aprofundados das doenas. Era
importante para este estudo englobar a investigao gentica e poder acrescentar
parmetros como alteraes cromossmicas, o que no foi possvel pois no h ainda
investigao suficiente neste campo, nem dados disponveis para utilizao em
estudos posteriores.

4.5 Mtodos para a estruturao da rede
A estruturao da rede, visando obter um modelo que melhor representasse o cancro
da prstata e a sua projeco no doente, e que fosse de fcil compreenso, foi feita
atravs dos seguintes mtodos:
Insero ou remoo de arcos de forma a representar as relaes causais
existentes entre as variveis no problema mdico.
Fuso de ns, isto , ns mais especficos foram trocados por ns mais
genricos.
Diviso de ns. O processo oposto fuso de ns, isto , ns genricos foram
trocados por ns mais especficos.
43
Remoo de ns por serem desnecessrios ou de difcil arranjo no restante da
rede (ns livres na rede).
Insero de ns que no haviam sido considerados anteriormente.
Nenhuma varivel foi considerada mais importante do que outra e a estrutura final da
rede foi aquela que representasse de forma mais clara e de fcil compreenso a real
relao entre as variveis.

4.6 Evoluo dos modelos construdos
A construo da estrutura da rede foi feita manualmente e de forma iterativa, exigindo
diversas reunies at se obter uma rede final. Para um melhor resultado foi necessrio
conjugar os dados do conhecimento mdico com a bibliografia cientfica.
O principal objectivo deste modelo pr-seleccionar as variveis significativas numa
rede que possa avaliar o prognstico de doentes com cancro da prstata sujeitos a
prostatectomia radical, e posteriormente relacion-las entre si.
A partir de sesses de esclarecimento com o mdico especialista, foram realizadas
algumas alteraes, assim como a conexo dos ns da rede.
Neste modelo, os ns da rede foram divididos em 3 momentos temporais diferentes.
Esta diviso no altera em nada as relaes entre as variveis nem o resultado final da
rede, mas vem facilitar a construo de uma rede dinmica numa fase posterior deste
estudo.
1 Momento: entrevista com o doente na primeira consulta (fase pr-diagnstico)
2 Momento: aps se obter os resultados dos exames auxiliares de diagnstico (fase
ps-diagnstico)
3 Momento: aps o doente ter sido sujeito a prostatectomia radical e se obter o
resultado de alguns exames realizados no ps-operatrio (fase ps-operatrio).
A estrutura final da rede visvel na Figura 4.

44

Figura 4: Modelo final da rede

4.7 Concluso
Os atributos presentes nesta rede so os que melhor identificam um doente com
cancro da prstata. Se pudssemos ter disponvel uma base de dados com valores para
estes atributos, e de preferncia recolhidos ao longo de 5 anos aps o diagnstico da
doena, seria o ideal para poder obter uma rede bayesiana (esttica ou dinmica) que
nos fornecesse informao relevante para o tratamento destes doentes.
Infelizmente neste trabalho isso no foi possvel, e para podermos continuar com o
seu desenvolvimento utilizmos uma base de dados disponvel em
Herzberg 1985), que descrevemos no captulo seguinte.
As relaes entre as variveis foram escolhidas pelo especialista tendo em conta a sua
experincia, e so posteriormente comparadas com as obtidas nas redes bayesianas
construdas mais frente neste trabalho.
45
5 Modelos Quantitativos

Para uma utilizao deste modelo em processos de inferncia, de forma a permitir
obter probabilidades de ocorrncia de certos fenmenos, foi necessrio trabalhar a
base de dados que contm informao de 502 doentes a quem foi diagnosticado
cancro da prstata. Esta base de dados est disponvel para estudos no repositrio
Herzberg 1985).
Esta base de dados inicialmente continha 18 atributos, incluindo o atributo de deciso
(outcome), com 27 valores em falta (missing values). Esta foi adaptada tendo em
conta a sua aplicao.
Foram retirados do modelo final da rede (Figura 4) os atributos que no estavam
presentes na base de dados e foram retirados da base de dados os atributos que no
estavam presentes na rede. Esta reduo de atributos torna a base de dados mais fcil
de trabalhar e d nfase s caractersticas de classificao dos dados.
O modelo necessita da aplicao das regras que os algoritmos de Redes Bayesianas
impem. Para tal, o conjunto de dados mdicos utilizado na construo da rede deve
obedecer a algumas particularidades que so: todas as variveis devem ser discretas e
finitas e no devem existir valores em falta (missing values).

5.1 Gesto dos atributos
Para a construo dos modelos quantitativos seleccionamos da base de dados 11 dos
18 atributos que ela contm. Como j referimos atrs, s utilizmos os atributos da
base de dados que tambm esto presentes na seleco feita para o modelo final da
rede (Figura 4).
As variveis que foram utilizadas nas Redes Bayesianas obtidas neste estudo so as
que esto apresentadas na Tabela 2.

46

Tabela 2: Atributos seleccionados da base de dados
Nome da varivel Abreviatura
Idade age
Peso wt
Histria familiar de cancro hx
Presso arterial sistlica sbp
Presso arterial diastlica dbp
Hemoglobina Hg
Estadio Clnico stage
Doubling time PSA dtime
Tamanho da prstata size
Metstases sseas bm
Status aps 5 anos da cirurgia status

Na Figura 5 podemos observar uma distribuio matricial dos valores da base de
dados dispostos por atributo e por doente. Esta figura permite uma visualizao dos
dados e a sua distribuio dos valores sem necessidade de recorrer extensa base de
dados de 502 doentes, que que aumentaria demasiado o nmero de pginas desta
dissertao.
Nesta Figura, cada ponto significa um exemplo e cada cor corresponde ao valor do
atributo classe, que no nosso caso, pode ser dead ou alive. Cada quadrado apresenta
um cruzamento de um par de atributos e como os exemplos se distribuem atravs
destes atributos pelos valores da classe. Alm de mostrar a relao entre os atributos
dos 502 pacientes, esta figura ilustra que no trivial extrair um padro baseado num
nico atributo ou conjunto de atributos que possa ser indicativo de sobrevivncia ou
no.
O outcome Status que pode ter o valor dead (= 0) ou alive (=1) possui 354 doentes
mortos e 148 vivos.

47

Figura 5: Matriz representativa dos valores de cada atributo para cada doente ("scatterplot" obtido com o
software WEKA)

48
5.2 Necessidade de discretizao das variveis contnuas
Os algoritmos utilizados em sistemas de aprendizagem de mquina, normalmente
fazem a sua prpria discretizao interna no caso dos atributos com valores
numricos. Como existe um padro de referncia clnico para vrios destes atributos
como descrito na sub-seco 4.4., fizemos um primeiro filtro para transformar todos
os atributos numricos nos intervalos clnicos apropriados.
Mantivemos contudo os dados originais com o intuito de observar se os
classificadores gerados produziam outro tipo de intervalo. Este estudo pode ser
importante para uma posterior reviso dos intervalos clnicos actualmente empregues
como padro de referncia.
Foram utilizados dois processos de discretizao das variveis. No primeiro processo
foram escolhidos os intervalos baseados em conhecimento cientfico, para que possa
representar da melhor forma a realidade, permitindo assim resultados mais reais e
uma melhor interpretao dos resultados na rea mdica (intervalos na Tabela 3).
O segundo processo para a discretizao das variveis foi utilizar um filtro para
discretizao no WEKA. Atravs da aplicao do filtro
weka.filters.unsupervised.attribute.Discretize, discretizou-se um grupo de atributos
numricos da base de dados em atributos nominais. Esta discretizao realizada
atravs de binning simples (neste trabalho optou-se por agrupar em 5 intervalos).

49

Tabela 3: Intervalos de discretizao. A justificao para a escolha destes intervalos est descrita aquando a
apresentao de cada varivel (Subseco 4.4.).
Varivel Intervalo de discretizao
Idade (age) <= 40
41-50
51-60
61-70
71-80
81-90
>90
Peso (wt) <=80
80-88
>88
Histria familiar (Hx) Sim
No
Presso arterial sistlica (Sbp) <14
>=14
Presso arterial diastlica (Dbp) <9
>=9
Hemoglobina (Hg) <12,5
12,5-18
>=18
Estadio clinico (Stage) 1
2
3
4
Tamanho da prostata (Size) <20
>=20
Metastases osseas (bm) Sim
No
Doubling Time (dtime) <3
3-8,9
9-14,9
> 15
Status Dead
Alive
50

5.3 Missing values
Os valores em falta na base de dados podiam comprometer o resultado que viramos a
obter nas diferentes redes (esttica e dinmica).
Para podermos construir uma rede bayesiana, foi necessrio preencher os valores em
falta das variveis que utilizmos, pois um dos critrios para uma rede bayesiana
que no devem existir missing values.
Poderamos ter utilizado vrias alternativas para o preenchimento destes dados, mas
segundo Howell (Howell 1999), Expectation/Maximization (EM) o algoritmo
referido como o mais importante na literatura recente. Para tal utilizmos este
algoritmo atravs do software SPSS e foi possvel reestimar os parmetros em falta na
base de dados.
O SPSS permite efectuar uma anlise da base de dados em relao aos dados em falta,
conseguindo um diagnstico da situao em anlise (Tabela 4), permitindo-nos obter
alguns resultados estatsticos como o nmero de amostras (N) em cada varivel, a
mdia dos seus valores e o desvio padro. Tambm nos indica o nmero de valores
em falta em cada varivel que foram introduzidos utilizando o algoritmo EM.

Tabela 4: Estatistica da aplicao do algoritmo EM
Faltas
N Mdia Desvio padro contagem Percentagem
age 501 71,46 7,081 1 20
wt 500 99,03 13,436 2 40
sz 499 14,69 12,338 3 60

51
5.4 Modelo I - Modelo construdo manualmente
Para obter uma rede final neste modelo, utilizou-se a rede construda manualmente
pelo especialista.
O passo seguinte criao da estrutura de uma Rede Bayesiana a especificao das
suas probabilidades. Essas probabilidades podem ser obtidas de duas maneiras: a
partir de estudos de especialidade ou inferindo de uma base de dados. possvel
tambm a combinao das duas alternativas. O objectivo final sempre obter as
probabilidades que melhor correspondam realidade do problema modelado pela
Rede Bayesiana.
Para a quantificao da Rede Bayesiana do modelo final obtido, foi utilizada a
inferncia atravs da base de dados.
A estrutura inicial da rede obtida a partir de estudos de especialidade foi usada como
ponto de partida para a construo das tabelas de probabilidades. Foi necessrio
construir uma tabela para cada n, com campos para preenchimento das
probabilidades correspondentes combinao das categorias de todos os pais. O
preenchimento das tabelas fez-se utilizando o programa Excel por inferncia da base
de dados utilizada neste estudo.

5.4.1 Probabilidades marginais
As probabilidades marginais so as mais simples de se obter e correspondem a ns
sem pais. Estas probabilidades correspondem prevalncia da doena na populao
em questo, isto , nos 502 doentes com cancro da prstata.
As tabelas 5 a 8, representam as probabilidades marginais da rede.
A primeira e segunda linha da tabela representam as categorias do n, e a terceira a
sua prevalncia para cada categoria

Tabela 5: Probabilidades marginais para Presso Arterial Sistlica (sbp)
Sim no
P(sbp>=14) P(sbp<14)
52
63.3% 36.7%

Tabela 6: Probabilidades marginais para Presso Arterial Diastlica (dbp)
Sim no
P(dbp>=9) P(dbp<9)
35.5% 64.5%

Tabela 7: Probabilidades marginais para Idade
P(id<=40) P(41>id>50) P(51>id>60)
0.0% 1.0% 9.6%
P(61>id>70) P(71>id>80) P(81>id>90) P(id>91)
19.7% 65.9% 3.8% 0.0%

Tabela 8: Probabilidades marginais para Peso
normal acima obeso
P(wt<=80) P(80<wt<=88) P(wt>88)
6.8% 14.1% 79.1%

5.4.2 Probabilidades condicionais
Uma distribuio de probabilidade condicional refere-se probabilidade de ocorrer
um evento A sabendo que ocorreu um outro evento B, e representa-se por P(A|B). Os
ns da rede que tm pais, tm probabilidades condicionais em relao aos respectivos
pais.
Temos sempre presente uma combinao de distribuies de probabilidades associada
a uma estrutura grfica de uma Rede Bayesiana. Para cada varivel (Vi) no grfico
especificado um conjunto de distribuies de probabilidades condicionais P(Vi|(Vi))
sendo (Vi) os pais de Vi; cada uma destas distribuies descreve o efeito conjunto de
uma especfica combinao de valores para os pais de cada varivel Vi, na
distribuio de probabilidades, sobre os valores de Vi.
53
Uma das grandes dificuldades na aplicao prtica de redes bayesianas (quando
calculadas manualmente) o excessivo nmero de probabilidade necessrio para a
quantificao de uma rede. Quanto maior o nmero de pais de um n, mais complexa
e extensa a tabela de probabilidades condicionais. Os clculos foram efectuados
tendo em conta:
)) ( (
)) ( (
) ( (
i
i i
i i
V P
V V P
V V P

= se 0 )) ( ( >
i
V P

O teorema de Bayes diz que:

)) ( (
) ( ) ) ( (
) ( (
i
i i i
i i
V P
V P V V P
V V P

= se 0 )) ( ( >
i
V P

5.4.3 Modelo final da rede - GeNIe
O modelo final da rede foi construdo no GeNIe, software disponvel online
gratuitamente. Foram desenhados os ns da rede (pas e filhos) com as mesmas
relaes da rede construda manualmente em conjunto com o especialista. Em cada n
possvel introduzir as tabelas de probabilidades marginais e condicionais. Podemos
ver o aspecto final da rede na Figura 6.

Figura 6: Aspecto final da rede construda no GeNIe
54
5.4.4 Determinao da exactido da rede

Foram realizadas diversas tentativas de forma a podermos testar os 502 casos de
doentes na rede da Figura 6, mas em nenhum software conseguimos introduzir a rede
no formato que o GeNIe nos oferece.
A nica forma que encontrmos foi de testar manualmente no GeNIe caso a caso.
Foram escolhidos aleatoriamente 10 doentes da base de dados e foram testados no
GeNIe. Em 10 doentes, 7 foram correctamente classificados. Logo podemos
considerar que a rede manual apresenta uma exactido de 70%, com pouca segurana
pois uma amostra de 10 doentes num total de 502, uma amostra pouco significativa.

55
5.5 Modelo II - WEKA Machine Learning algorithms in Java

5.5.1 Aprendizagem da estrutura da rede
A aprendizagem de uma rede bayesiana implica naturalmente dois passos: primeiro
aprender a estrutura da rede e depois as tabelas de probabilidades.
O primeiro passo apresenta diversas formas de resoluo no Weka. Neste trabalho
utilizmos a tcnica de cross-validation (com 10 folds), pois permite prever o
comportamento da rede no futuro (com outros dados) atravs da avaliao da
exactido da classificao obtida.
Para obtermos a estrutura da rede utilizamos o classificador BayesNet, indicado no
Weka como: weka.classifiers.bayes.BayesNet. Este algoritmo tem algumas opes
que podemos configurar (Figura 7).

Figura 7: Opes de configurao do algoritmo BayesNet
BIFFile Podemos colocar o nome de um ficheiro no formato BIF XML. A rede
bayesiana gerada pelos dados pode ser comparada com a rede bayesiana representada
no formato BIF XML. As estatsticas calculadas so o nmero de ligaes extra e em
falta.
debug Se colocado TRUE, o classificador pode fornecer informao adicional
estimator O algoritmo escolhido encontra as tabelas de probabilidades condicionais
da rede bayesiana
56
searchAlgorithm Selecciona o mtodo usado para encontrar a estrutura da rede
useADTree Quando TRUE, o tempo de aprendizagem da rede diminui. Quando
FALSE, o algoritmo para a aprendizagem estrutura da rede fica mais lento e funciona
com menos memria. Por defeito ADTree TRUE.
Existem vrios mtodos para encontrar a estrutura de uma rede bayesiana, e no weka
estes algoritmos esto divididos por reas: local score metric, conditional
independence tests, global score metrics e fixed structure. Para cada uma destas reas
podem ser implementados diferentes algoritmos como por exemplo: hill climbing,
simulated annealing e tabu search.
O algoritmo que pretendemos usar neste trabalho para obter a estrutura da rede o
TAN (Tree Augmented Naive Bayes), pois o que nos permite obter uma rede com
uma estrutura de melhor visualizao das relaes entre variveis. A rede (ou rvore
como denominada neste algoritmo) formada atravs do clculo da rvore de
extenso de peso mnimo utilizando o algoritmo Chow-Liu (Chow and Liu 1968).
Obtemos assim um grafo dirigido acclico; isto , para qualquer vrtice x, no h
nenhuma ligao dirigida comeando e acabando em x.
Na configurao das outras opes, manteve-se as que vm por defeito.

5.5.2 As redes finais
A primeira rede (rede A) resulta dos dados discretizados pelo filtro do WEKA
weka.filters.unsupervised.attribute.Discretize, a segunda (rede B) dos dados
dicretizados nos intervalos com significado mdico.
O texto que segue as imagens o resultado obtido em cada uma das redes.

57

Figura 8: Rede A obtida no WEKA (dados discretizados com o filtro
weka.filters.unsupervised.attribute.Discretize)

Tabela 9: Sumrio da cross-validation rede A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
=== Stratified cross-validation ===
=== Summary ===

Correctly Classified Instances 441 87.8486 %
Incorrectly Classified Instances 61 12.1514 %
Kappa statistic 0.7161
Mean absolute error 0.1536
Root mean squared error 0.2856
Relative absolute error 36.9069 %
Root relative squared error 62.6427 %
Coverage of cases (0.95 level) 99.8008 %
Mean rel. region size (0.95 level) 69.9203 %
Total Number of Instances 502

=== Detailed Accuracy By Class ===

TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0.893 0.155 0.932 0.893 0.912 0.951 dead
0.845 0.107 0.767 0.845 0.804 0.951 alive
58
20
21
22
23
24
25
26
Weighted Avg. 0.878 0.141 0.883 0.878 0.88 0.951

=== Confusion Matrix ===

a b <-- classified as
316 38 | a = dead
23 125 | b = alive

Figura 9: Rede B obtida no WEKA (dados discretizados em intervalos com significado mdico)

Tabela 10: Resultado da cross-validation rede B
1
2
3
4
5
6
7
8
9
10
=== Stratified cross-validation ===
=== Summary ===

Correctly Classified Instances 358 71.3147 %
Incorrectly Classified Instances 144 28.6853 %
Kappa statistic 0.273
Mean absolute error 0.3349
Root mean squared error 0.4204
Relative absolute error 80.4763 %
Root relative squared error 92.2058 %
59
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Coverage of cases (0.95 level) 99.8008 %
Mean rel. region size (0.95 level) 87.4502 %
Total Number of Instances 502

=== Detailed Accuracy By Class ===

TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0.426 0.167 0.516 0.426 0.467 0.755 alive
0.833 0.574 0.776 0.833 0.804 0.755 dead
Weighted Avg. 0.713 0.454 0.7 0.713 0.704 0.755

=== Confusion Matrix ===

a b <-- classified as
63 85 | a = alive
59 295 | b = dead

5.5.3 Interpretao do resultado
Rede A com resultados na Tabela 9
As linhas 4 e 5 indicam a performance do classificador com os dados de treino
(treinamos o algoritmo com os dados e depois verificamo-lo com os prprios dados
treinados cross-validation).
A linha 4 significa que dos 502 doentes, 441 foram correctamente classificados, o que
d uma accuracy de 87,8%.
A linha 5 significa que dos 502 doentes, 61 foram mal classificados.
As linhas 6 a 12 indicam probabilidades de erro e valores mdios.
As linhas 17 a 20 significam a probabilidade de doentes bem classificados em cada
classe do status (dead ou alive).
As linhas 24 a 26 mostram uma matriz de confuso que indica quantas instncias de
cada classe foram classificadas de forma correcta e incorrecta. Se houve 100% de
classificao correcta podemos esperar uma matriz de confuso onde todo elemento
da diagonal secundria igual a zero.
60
O resultado de validao cruzada (os dados de treino so misturados e reamostrados
para classificao com a rede criada, a experincia repetida 10 vezes) mostrado
entre as linhas 4 e 26 da Tabela 9.

Rede B com resultados na Tabela 10
As linhas 4 e 5 indicam a performance do classificador com os dados de treino
(treinamos o algoritmo com os dados e depois verificamo-lo com os prprios dados de
treino cross-validation).
A linha 4 significa que dos 502 doentes, 358 foram correctamente classificados, o que
d uma accuracy de 71.3%.
A linha 5 significa que dos 502 doentes, 144 foram mal classificados.
As linhas 6 a 12 indicam probabilidades de erro e valores mdios.
As linhas 17 a 20 significam a probabilidade de doentes bem classificados em cada
classe do status (dead ou alive).
As linhas 24 a 26 mostram uma matriz de confuso que indica quantas instncias de
cada classe foram classificadas de forma correcta e incorrecta. Se houve 100% de
classificao correcta podemos esperar uma matriz de confuso onde todo elemento
da diagonal secundria igual a zero.
O resultado de validao cruzada (dados de treino so misturados e reamostrados para
classificao com a rede criada, a experincia repetida 10 vezes) mostrado entre as
linhas 4 e 26 da Tabela 10.

5.5.4 Concluses
A primeira rede (Figura 8) que resulta dos dados discretizados pelo filtro do Weka
apresenta uma melhor exactido (87,8%), o que significa que classificou
correctamente um maior nmero de casos. Este resultados indica-nos que utilizando o
filtro de discretizao do Weka obtemos melhores resultados de classificao na rede
bayesiana. A grande desvantagem que pode surgir ao trabalharmos com intervalos
definidos livremente pelo Weka que surge uma maior dificuldade da parte do
mdico em interpretar os resultados. Pode surgir uma situao em que o resultado
61
obtido no seja conclusivo pois o intervalo pode abranger valores que misturem
situaes clnicas.
A segunda rede (Figura 9) que resulta dos dados dicretizados nos intervalos com
significado mdico, apresenta uma exactido mais baixa (71,3%), mas com uma taxa
de acerto razovel.
Ambos classificadores apresentam taxas relativamente altas de falsos positivos e
negativos, devendo portanto ser utilizados apenas como indicadores fracos de
sobrevida.
Em comparao com a rede manual obtida no GeNIe (nesta ltima obtivemos uma
exactido de 70%), consideramos as redes obtidas no Weka como de maior confiana.
Em relao topologia das redes, ambas as redes se aproximam da rede construda
manualmente pelo especialista (Figura 6). Como semelhana nas duas verificamos
que o outcome status tem relao directa de pai-filho com as variveis hx, size e hg.
Ambas distinguem as variveis sbp, dbp e wt, mas na rede manual estas so
relacionadas com hx e nas redes do Weka com bm. Isto pode trazer ao especialista a
curiosidade de verificar esta relao de bm com sbp, dbp e wt.
62
5.6 Modelo III mini-TUBA
Utilizmos o miniTUBA para estudar relaes causais entre um conjunto de variveis
clnicas dos doentes com cancro da prstata (variveis na Tabela 2), durante um
perodo de 5 anos no final dos quais utilizamos a sobrevivncia como outcome.
Xiang et al (Xiang, Minter et al. 2007), ao disponibilizarem um software que pudesse
responder dvida de como uma interveno mdica ou um tratamento pode
influenciar a resposta de um doente ao longo do tempo, trouxeram uma mais-valia
comunidade cientfica. No seu artigo, Xiang et al demonstram como as redes
bayesianas dinmicas representam uma alternativa promissora para analisar dados
clnicos.
As DBNs apresentam-se de forma semelhante s redes bayesianas simples, num
grfico acclico.
E de forma semelhante, os grficos no s permitem ao utilizador perceber quais as
variveis que influenciam outras variveis, como so o suporte para o clculo
computacional das probabilidades condicionais que so necessrias para os resultados
ou aprendizagem. A diferena reside na questo tempo, pois uma varivel num
determinado tempo t1 influencia as variveis ligadas a si graficamente num tempo t2.
As redes bayesianas dinmicas permitem tambm ciclos temporais entre as variveis,
permitindo ao utilizador interpretar as ligaes como causas temporais. Desta forma a
interpretao das relaes entre as variveis fornece mais informao clnica
relevante.

5.7 Configuraes de uma rede bayesiana dinmica no mini-
TUBA
5.7.1 Gesto das variveis
Para podermos obter uma rede final utilizando o software mini-TUBA, foi necessrio
ajustar a base de dados. Numa rede dinmica, onde podemos obter relaes entre as
variveis ao longo do tempo, necessrio termos valores para essas mesmas variveis
em tempos distintos. Portanto foi necessrio acrescentar nossa base de dados mais 2
tempos clnicos, que foram os tempos escolhidos pelo especialista na construo do
63
modelo qualitativo como os indicados para recolha de dados com significncia em
doentes com cancro da prstata. Esses momentos so:
1 Momento (time_point 0): entrevista com o doente na primeira consulta (fase pr-
diagnstico)
2 Momento (time_point 1): aps se obter os resultados dos exames auxiliares de
diagnstico (fase ps-diagnstico)
3 Momento (time_point 2): aps o doente ser sujeito a prostatectomia radical e aps
se obter o resultado de alguns exames realizados no ps-operatrio (fase ps-
operatrio)
Ao criar estes 3 momentos, na base de dados surgiram missing values e o seu
preenchimento foi aleatrio (em variveis como Hemoglobina ou Tenso Arterial) ou
recorrendo a macros no software Microsoft Office Excel para o preenchimento dos
valores lgicos (em variveis como a Idade ou Status).
Podemos ver o exemplo de uma macro usada para preenchimento do valor idade:

Sub Altera_Idade()
For i = 2 To 1510

Cells(i + 1, 3) = Cells(i , 3)+2
Cells(i + 2, 3) = Cells(i , 3) +3
i = i + 3

Next i
End Sub

Obtivemos uma base de dados com o aspecto que podemos ver na Tabela 11 onde a 1
coluna identifica o nmero do doente, a 2 coluna o momento em que foram
recolhidos os dados dessa linha e da 3 13 colunas temos as variveis. A 13 coluna
o outcome. Cada conjunto de 3 linhas representa um doente e toda a informao
recolhida sobre ele nos 3 momentos temporais.

64
Tabela 11: Aspecto da base de dados utilizada no mini-TUBA com representao de 9 dos 502 doentes

Experimental_Unit_ID Time_Point age wt hx sbp dbp hg stage sz bm dtime status
1 0 75 76 0 15 9 13.8 3 0 0 0 1
1 1 77 76 0 15 9 13.8 3 0 0 0 1
1 2 80 68 0 15 9 13.8 4 2 0 60 1
2 0 54 116 0 13 7 14.6 3 0 0 0 1
2 1 56 116 0 13 7 12.6 3 0 0 0 1
2 2 59 108 0 13 7 12.6 4 42 0 1 0
3 0 69 102 1 14 8 13.4 3 0 0 0 1
3 1 71 102 1 14 8 11.4 3 0 0 0 1
3 2 74 94 1 14 8 11.4 4 3 0 40 0
4 0 75 94 1 14 7 17.6 3 0 0 0 1
4 1 75 94 1 14 7 15.6 3 0 0 0 1
4 2 80 86 1 14 7 15.6 4 4 0 20 0
5 0 67 99 0 17 10 13.4 3 0 0 0 1
5 1 67 99 0 17 10 13.4 3 0 0 0 1
5 2 72 91 0 17 10 13.4 4 34 0 60 1
6 0 71 98 0 19 10 15.1 3 0 0 0 1
6 1 71 98 0 19 10 13.1 3 0 0 0 1
6 2 76 90 0 19 10 13.1 4 10 0 24 0
7 0 75 100 0 14 10 13 3 0 0 0 1
7 1 75 100 0 14 10 11 3 0 0 0 1
7 2 80 92 0 14 10 11 4 13 0 46 0
8 0 73 114 1 17 11 12.6 3 0 0 0 1
8 1 73 114 1 17 11 12.6 3 0 0 0 1
8 2 78 106 1 17 11 12.6 4 3 0 60 1
9 0 60 110 0 12 8 14.6 3 0 0 0 1
9 1 60 110 0 12 8 14.6 3 0 0 0 1
9 2 65 102 0 12 8 14.6 4 4 0 60 1
65
5.7.2 ndice de Markov
O ndice de Markov uma das condies que podemos alterar antes do clculo da
rede dinmica. O ndice de Markov permite seleccionar o tempo entre as vrias
medies das variveis, permitindo assim explorar diferentes relaes causais ao
longo de diferentes escalas de tempo. O ndice de markov define-se por o intervalo de
tempo entre o comeo de um evento e o seu efeito. Por exemplo, se seleccionarmos
Markov lag=1, a rede que obtemos d-nos as relaes entre as variveis aps 1
tempo de intervalo. Este tempo pode ser considerado 1 minuto, 1 semana, 1 ano, etc.,
consoante a forma como foi realizada a colheita dos dados. Se seleccionarmos
Markov lag=2 significa 2 tempos entre as variveis relacionadas entre si. O que
significa que as relaes que surgem na rede bayesiana so aps ter ocorrido 2
intervalos temporais (2 anos ou 2 meses, etc) entre o n pai e o n filho.
No nosso caso especfico, a base de dados que utilizmos tem uma escala temporal no
total de 5 anos e cada varivel foi colhida de 2,5 em 2,5 anos. O objectivo relacionar
as variveis aps os 5 anos, isto , poder verificar a influncia das variveis na
sobrevivncia aps 5 anos, logo o Markov lag que nos interessa de 2 pois
pretendemos saltar dois tempos.

5.7.3 Discretizao
Como para o clculo das redes simples, foram utilizados dois processos de
discretizao das variveis. No primeiro processo foram escolhidos os intervalos
baseados em conhecimento cientfico (discretizao em intervalos com significado
mdico, os mesmos das redes simples Tabela 3) e o segundo processo para a
discretizao das variveis foi utilizar um processo para discretizao do mini-TUBA:
discretizao por intervalos. Escolhemos o mesmo nmero de intervalos que na
primeira discretizao, com intervalo de valores para cada diviso igual, mas o
nmero de valores em cada diviso depende dos valores de cada varivel (clculo
automtico pelo mini-TUBA).
O mini-TUBA tambm permite o clculo de uma rede bayesiana dinmica sem
discretizao dos dados.

66
5.7.4 Algoritmo de aprendizagem
Foi seleccionado o simulated annealing em detrimento do greedy learning, por
nenhum motivo especfico, simplesmente porque o que est por defeito.

5.7.5 Redes
O miniTuba ao efectuar os clculos do seu algoritmo de forma a obtermos uma rede
bayesiana dinmica, baseia-se na base de dados introduzidos e nas configuraes
escolhidas pelo utilizador. O resultado apresentado na forma de 10 redes bayesianas
que o software denomina de Top10 networks. Estas 10 redes so as que apresentam
melhores resultados calculadas atravs do algoritmo de simulated annealing. A 1 rede
do Top10 considerada a que apresenta melhor probablidade de estar correcta, em
relao s outras 9.
O grfico de Score Distribution of Top Ten Networks mostra-nos a probabilidade
relativa de cada rede e a probabilidade de a rede n1 como a rede correcta dentro do
Top10 (Figuras 11,13, e 15)

As figuras 10, 12, e 14 mostram-nos as redes n1 obtidas com diferentes
configuraes: Markov lag 2 anos e com diferentes discretizaes.

A Figura 10 representa as relaes entre as variveis com intervalo temporal de 5
anos. Por exemplo, o tamanho da prstata (sz) medido na primeira colheita de dados
influencia o valor da hemoglobina (hg) do doente aps 5 anos.
A Figura 11 apresenta o Score Distribution of Top Ten Networks que nos diz que a
rede da Figura 10 obteve uma probabilidade de 0.10 de ser a melhor rede entre as
outras 9.
A Tabela 12 apresenta-nos as probabilidades condicionais do Status que tem como
nico pai o n Hx (Histria Familiar).
Podemos fazer a mesma leitura para a Figuras 12 e 13 Tabela 13 e Figuras 14 e 15
Tabela 14.

67

Figura 10: Rede Bayesiana com Markov lag 2 e sem discretizao das variveis (rede 1 do Top10)

Figura 11: Score atribuido s 10 melhores redes (Top10)

Tabela 12: Probabilidades condicionais do n Status
Time t Time t+2
hx status 0 1
0 0 0.5000 0.5000
1 0 0.5000 0.5000
0 1 0.6289 0.3711
1 1 0.8047 0.1953
68

Figura 12: Rede Bayesiana com Markov lag 2 e com discretizao das variveis por binning


Time t Time t+2
hx status < 0.500 > 0.500
< 0.500 < 0.500 0.5000 0.5000
> 0.500 < 0.500 0.5000 0.5000
< 0.500 > 0.500 0.6289 0.3711
> 0.500 > 0.500 0.8047 0.1953
69

Figura 14: Rede Bayesiana com Markov lag 2 e com dados discretizados em intervalos com significado
mdico


Time t Time t+2
hx status < 0.500 > 0.500
< 0.500 < 0.500 0.5000 0.5000
> 0.500 < 0.500 0.5000 0.5000
< 0.500 > 0.500 0.6289 0.3711
> 0.500 > 0.500 0.8047 0.1953
70

5.7.6 Resultados e concluses
Ao fazer o clculo de uma rede bayesiana dinmica, o mini-Tuba apresenta como
resultados as 10 melhores redes para a base de dados introduzida e a sub-rede que se
conserva nas 10 melhores redes (sub-redes em anexo).
Ao compararmos as sub-redes conservadas nas trs redes bayesianas com Markov lag
=2 (com discretizao dos dados diferente entre as trs) verificamos que a que
mantm mais ligaes semelhantes nas 10 melhores redes a rede bayesiana dinmica
em que no foi realizada qualquer discretizao dos dados, seguindo-se a rede com
discretizao por binning. Por este motivo podemos concluir que a rede que menos
varia no clculo das melhores 10 redes a rede sem discretizao (Figura 10), que
permite maior estabilidade nas relaes das variveis, seguindo-se a rede com
discretizao por binning (Figura 12).
As duas redes com discretizao dos dados (Figura 12 e 14) so muito semelhantes
relativamente topologia. Podemos concluir que a discretizao dos dados em
intervalos de significncia mdica s poder trazer vantagens se a discretizao pelo
software criar intervalos que no misturem diferentes situaes clnicas (como
hipotenso e hipertenso, por exemplo).
Ainda em relao topologia podemos referenciar a relao do outcome status
directamente com: hx, sbp, dbp e stage nas trs redes dinmicas. Em comparao com
a rede manual evidenciamos a relao com hx, que a que se mantm. Podemos
concluir que a varivel hx pode ter uma relao importante em termos mdicos com o
status.
Se formos comparar a probabilidade de cada rede bayesiana dinmica ser a melhor
(na Figura Score Distribution of Top Ten Networks), podemos observar que todas
possuem probabilidades muito baixas (entre 10% e 13%), o que significa pouca
exactido nos resultados apresentados. Mas mesmo em resultados baixo podemos
verificar que, assim como nas redes bayesianas simples, parece que optando pela
discretizao automtica realizada pelos programas informticos (permitir liberdade
ao software para organizar os dados) conseguimos obter resultados com maior
exactido.
71
5.8 Modelo IV Redes bayesianas e regras
Programao Lgica Indutiva (Inductive Logic Programming, ILP) uma tcnica
popular para aprendizagem relacional. Difere de outras tcnicas de aprendizagem em
pelo menos 2 aspectos: (1) prov ao utilizador uma explicao sobre o conceito que
foi aprendido e sobre a classificao de novos exemplos, pois utiliza uma linguagem
de primeira ordem para representar o classificador, (2) a linguagem baseada em
primeira ordem permite que se definam conceitos que relacionam informao entre
indivduos. Por exemplo, num banco de dados com informaes sobre exames de
doentes, possvel relacionar informao relacional entre exames de um mesmo
doente.
A tarefa bsica de ILP (Lavrac and Dzeroski 1994) , dado um conjunto de exemplos
(observaes), que podem ser positivos ou negativos, e suas caractersticas (atributos,
background knowledge) e um conjunto de restries representadas atravs de uma
linguagem lgica de primeira ordem, encontrar um modelo, tambm descrito em uma
linguagem lgica de primeira ordem, de forma que este modelo represente o maior
nmero possvel de exemplos positivos e o menor nmero possvel de negativos.
A cada passo da construo do classificador em ILP, precisamos calcular a qualidade
de uma determinada regra aprendida. Normalmente, a qualidade de uma regra
medida atravs de mtricas tipo accuracy, m-estimate etc. Mas podemos tambm
calcular a qualidade de uma regra atravs de sua contribuio quando adicionada a
uma rede bayesiana. Em outras palavras, a cada gerao de uma nova regra,
adicionamos esta regra a uma rede bayesiana e calculamos se a adio desta regra
maximiza a verossimilhana (likelihood) do classificador bayesiano. Se melhorar, esta
regra passa a fazer parte da rede. Se a regra no melhorar a qualidade do classificador,
esta descartada e uma nova regra gerada. O mtodo utilizado neste trabalho, que
constri o classificador a medida em que se aprende novas regras, gera uma rede
bayesiana da classe TAN (Transition Augmented Network), onde cada n pode ser
descendente de no mximo 2 outros ns (Davis, Burnside et al. 2005). Como
mencionado anteriormente, redes TAN so muito populares porque permitem
representar ligaes mais complexas entre variveis e no tm uma complexidade
muito alta para sua construo.
72
Em nosso experimento, utilizamos o sistema ILP Aleph para gerar as regras e um
programa externo, escrito em Java por Davis, para construir a rede bayesiana TAN.
Em nossa metodologia utilizamos validao cruzada com 5 folds (5-fold cross-
validation) com uma validao cruzada interna de 4 folds para aprender os parmetros
da rede. Utilizamos os 502 exemplos do banco de dados UCI sobre cncer de prstata
e obtivemos os resultados por fold conforme pode ser visto na Tabela 16.

Table 15: Score da melhor rede TAN encontrada por fold
Fold Score
1 68,5
2 71,8
3 67,6
4 67,2
5 68,7
Mdia 68,76

As probabilidades encontradas por este mtodo no esto muito distantes das
encontradas pelos outros mtodos puramente probabilsticos estudados nas outras
seces. Porm temos a vantagem adicional de saber quais so os atributos mais
importantes, em forma de regras, que melhoram a probabilidade de classificao.
Como exemplo, mostramos, na Figura 14, as regras que foram consideradas
relevantes para a construo da melhor rede TAN em um dos folds.

mal i gnant ( A) : - bm( A, no) .
mal i gnant ( A) : - dt i me( A, ' >=15' ) .
mal i gnant ( A) : - hx( A, no) .
mal i gnant ( A) : - wei ght ( A, ' >88' ) , dbp( A, ' <9' ) .

Figure 16: Regras utilizadas na rede TAN final em um dos folds
73

Os atributos bm, dtime, hx e uma combinao de peso com dbp mostraram-se
relevantes neste "fold" para a construo da melhor rede.
Na Figura 15, apresentamos uma das regras utilizadas durante o treino para construir a
rede final. Esta regra nos diz que a presso diastlica menor do que 9 e o doubling
time of PSA menor do que 3 so razoavelmente indicativos de morte em doentes com
cancro da prstata. Estas caractersticas esto ausentes, neste fold, em todos os
doentes que sobreviveram e aparecem em 21 dos doentes que no sobreviveram. A
probabilidade desta regra de 70,9%.

mal i gnant ( A) : - dbp( A, ' <9' ) , dt i me( A, ' <3' ) .
Figure 17: Regra encontrada durante a construo da rede

Outras regras semelhantes foram encontradas em cada fold. Estas regras podem ser
examinadas pelos especialistas, juntamente com as probabilidades de acerto/erro
dadas pela rede bayesiana construda para auxiliar o processo de deciso clnica.
Neste processo, o mdico especialista pode orientar o doente A, por exemplo, fazer
uma biopsia ou algum outro exame complementar.
A observao das regras pode fornecer ao especialista relaes entre variveis (e os
intervalos de valores) que podem parecer medicamente incongruentes mas que trazem
informao nova e a investigar em mais pormenor.

74
75
6 Concluses

Nesta dissertao foram exploradas as aplicaes de algoritmos de redes bayesianas a
uma base de dados mdica, de forma a obter prognsticos em doentes com cancro da
prstata. Mais concretamente, foram criadas redes em que os dados sofreram
diferentes processamentos de discretizao e redes bayesianas estticas e dinmicas,
para comparao de exactido e resultados. Foram explorados alguns programas
informticos que permitem trabalhar bases de dados e observada a sua prestao.
A opo pela utilizao do GeNIe, do Weka e do mini-TUBA enquanto software de
data-mining revelou-se adequada dado que facilitou em grande parte todas as anlises
efectuadas no contexto deste trabalho. A utilizao do Aleph e do SAYU no foi
complexa, porm, como no apresentam interfaces amigveis e grficas, tornou o
processo mais trabalhoso.
O estudo feito atravs de diferentes programas informticos permitiu constatar que os
resultados podem ser concordantes mas apresentam variaes na tabela de
probabilidades condicionais consoante lidamos com uma rede manual, esttica ou
dinmica. Apesar de concordantes, a exactido conseguida nas redes varia, e aquela
que apresenta resultados com uma melhor confiana a rede obtida no Weka com
discretizao automtica, utilizando o algoritmo do software (87,9%). As redes
dinmicas apresentam resultados mais interessantes em termos mdicos mas uma
baixa probabilidade de ser a melhor rede.
Este estudo permitiu tirar concluses mdicas acerca do prognstico de doentes com
cancro da Prstata. E como possibilidade de interpretao mdica nas diferentes
redes, deixamos um exemplo:
Se fizermos uma leitura do Status de um doente sujeito a cirurgia da prstata aps 5
anos e compararmos com a existncia ou no de histria familiar de cancro da
Prstata, podemos concluir:
Rede manual (foi utilizado o GeNIe para ler as tabelas de probabilidades
condicionais):
Se o doente tem histria familiar de cancro da Prstata, a probabilidade de
estar morto ao fim de 5 anos do diagnstico de 75%. Se o doente no tem
76
histria familiar de cancro da Prstata a probabilidade de estar morto ao fim
de 5 anos do diagnstico de 66%.
Se compararmos com a Rede Bayesiana esttica (foi utilizado o WEKA para ler as
tabelas de probabilidades condicionais):
Se o doente tem histria familiar de cancro da Prstata, a probabilidade de
estar morto ao fim de 5 anos do diagnstico de 56% para um estadio do
tumor 2 ou 3 e de 40% para um estadio do tumor 4. Se o doente no tem
histria familiar de cancro da Prstata a probabilidade de estar morto ao fim
de 5 anos do diagnstico de 44% para um estadio do tumor 2 ou 3 e de 60%
para um estadio do tumor 4.
Rede Bayesiana com regras:
A melhor rede obtida com SAYU ressalta como atributos mais relevantes o
bm, o dtime, o hx e uma combinao de peso com presso diastlica. Esta rede
tem uma probabilidade mdia de aproximadamente 70% de prever casos de
sobrevivncia ou no, atravs dos atributos mencionados.
Redes Bayesianas Dinmicas:
Rede 1 (Figura 10): Se o doente tem histria familiar de cancro da Prstata, a
probabilidade de estar morto ao fim de 5 anos do diagnstico de 80%. Se o
doente no tem histria familiar de cancro da Prstata a probabilidade de estar
morto ao fim de 5 anos do diagnstico de 63%.
Rede 2 (Figura 12): Exactamente os mesmos resultados do que na rede 1
Rede 3 (Figura 14): Exactamente os mesmos resultados do que na rede 1
Como podemos verificar, a histria familiar de cancro da prstata pode influenciar o
prognstico do doente, mas no condio para que esse prognstico seja a morte.
Esta leitura possvel de fazer para vrias variveis e permite ao mdico tirar
importantes concluses.

Importa ainda referir que devido grande dificuldade em ter disponvel uma base de
dados com a informao necessria para o clculo das redes, esta mesma base de
dados teve que ser alterada para o clculo das redes dinmica, logo os resultados no
77
so adequados para uma interpretao mdica rigorosa. Este facto revelou-se como o
maior entrave ao desenvolvimento de um sistema de apoio deciso clnica assente,
principalmente, em redes bayesianas dinmicas.
Verificou-se que a melhor tcnica para discretizao dos dados deixar liberdade aos
programas (software) para o fazerem, mas trazendo a desvantagem de que pode
dificultar a interpretao mdica dos resultados quando os intervalos dos valores
sobrepuserem diferentes situaes clnicas. Este trabalho permite abrir uma nova
janela de investigao, pois coloca em causa os intervalos de valores utilizados como
valores padro na rea mdica, considerando que pode ser importante uma reviso dos
mesmos.
De um modo sucinto, pode afirmar-se que este trabalho apresenta uma critica
construtiva das potencialidades das redes bayesianas em geral e que estas podem ser
um instrumento de mais-valia para o suporte deciso clnica no prognostico de
sobrevivncia em doentes com cancro da prstata, assim como para comparao com
outras tabelas de prognstico j existentes (desenvolvidas atravs de outras tcnicas
de inferncia que no as redes bayesianas).

78
79
7 Trabalho futuro
O crescimento desmesurado de casos de cancro e com o aumento exponencial de
mortes tem preocupado as populaes e as grandes autoridades e coordenadoras da
sade para as naes unidas (World Health Organization).
O aproveitamento das grandes bases de dados e dos sistemas de informao em sade
para uma melhoria dos cuidados um trunfo que emerge na actualidade.
O desenvolvimento de uma aplicao que permita apoio s decises clnicas por
forma a, num futuro, podermos reduzir o numero de mortes por cancro ou aumentar a
esperana de vida dos doentes (que deriva da escolha do tratamento a que o doente
sujeito), uma mais valia dos sistemas de informao em sade que deve ser
explorada.
As bases de dados informatizadas, com informao de doentes com cancro sujeitos a
tratamentos so fundamentais para a evoluo do conhecimento cientfico, e o
tratamento destes dados e a sua aplicao no apoio deciso clnica necessrio.
As DBNs so um mtodo de prognstico estudado e desenvolvido (Ghahramani
1998; Verduijn, Peek et al. 2007; van Gerven, Taal et al. 2008), mas no aplicado no
contexto de prognstico do cancro. A aplicao numa base de dados deste contexto
pode trazer grandes vantagens para a deciso mdica e para os doentes.
O objectivo, no futuro, desenvolver uma aplicao que utilize uma DBN desenhada
para apoiar as decises mdicas no tratamento do cancro, mas que permita
aprendizagem da rede atravs da introduo de novos dados pelo profissional de
sade. Esta aprendizagem realizada individualmente em cada meio hospitalar permite
que cada aplicao esteja orientada para a sua realidade, aproximando mais os
resultados da sua realidade especfica.
H ainda muito trabalho a ser realizado, sendo os mais importantes: (1) a integrao
de ferramentas deste tipo na rotina mdica, (2) melhoramento dos algoritmos de
aprendizagem das redes, (3) desenvolvimento de algoritmos para o refinamento de
redes previamente criadas. Uma das limitaes deste trabalho foi a no existncia de
uma ferramenta que, dada uma rede j criada, construsse uma nova rede com base na
80
j existente. A construo de tal ferramenta no um processo trivial e estava fora do
escopo desta dissertao.
81
Anexo I Sub-redes que se conservam no Top10 das
redes bayesianas dinmicas calculadas no mini-Tuba

Figure 18: Sub-rede que se conserva nas 10 melhores redes com as seguintes configuraes: Markov lag 2 e
sem discretizao das variveis (Figura10)

com discretizao das variveis por binning (Figura10)
82

com dados discretizados em intervalos com significado mdico

83
Referncias
Andrews, D. and A. Herzberg (1985). Data : a collection of problems from many
fields for the student and research worker, New York, Springer-Verlag.
Barry, M. J., F. J. Fowler, et al. (1992). "The American-Urological-Association
Symptom Index for Benign Prostatic Hyperplasia." Journal of Urology 148(5):
1549-1557.
Chickering, D., D. Heckerman, et al. (1997). A Bayesian Approach to Learning
Bayesian Networks with Local Structure. In Proceedings of Thirteenth
Conference on Uncertainty in Artificial Intelligence, Providence, RI.
Chow, C. K. and C. N. Liu (1968). "Approximating Discrete Probability Distributions
with Dependence Trees." Ieee Transactions on Information Theory It14(3):
462-+.
Colozza, M., F. Cardoso, et al. (2005). "Bringing molecular prognosis and prediction
to the clinic." Clin Breast Cancer 6: 61-76.
Cruz, J. A. and D. S. Wishart (2007). "Applications of machine learning in cancer
prediction and prognosis." Cancer Inform 2: 59-77.
Davis, J., E. Burnside, et al. (2005). Learning Bayesian networks of rules with SAYU.
Proceedings of the 4th international workshop on Multi-relational mining.
Chicago, Illinois, ACM: 13-13.
Dawes, R. M., D. Faust, et al. (1989). "Clinical versus actuarial judgment." Science
243(4899): 1668-1674.
Gawande, A. (2002). Complications: A surgeon's notes on an imperfect science, New
York: Holt.
GeNIe (Visited 2010). "http://genie.sis.pitt.edu/."
Ghahramani, Z. (1998). Learning Dynamic Bayesian Networks. Adaptive Processing
of Sequences and Data Structures, International Summer School on Neural
Networks, "E.R. Caianiello"-Tutorial Lectures, Springer-Verlag.
Gleason, D. F. and G. T. Mellinger (1974). "Prediction of prognosis for prostatic
adenocarcinoma by combined histological grading and clinical staging." J
Urol 111(1): 58-64.
Graham, A. R., S. H. Paplanus, et al. (1990). "A Diagnostic Expert System for
Colonic Lesions." American Journal of Clinical Pathology 94(4): S15-S18.
Howell, D. (1999). Fundamental Statistics for the Behavioral Sciences, Duxbury
Press.
Kononenko, I. (1993). "Inductive and Bayesian Learning in Medical Diagnosis."
Applied Artificial Intelligence 7(4): 317-337.
Lahdesmaki, H. and I. Shmulevich (2008). "Learning the structure of dynamic
Bayesian networks from time series and steady state measurements." Machine
Learning 71(2-3): 185-217.
Lavrac, N. and S. Dzeroski (1994). Inductive Logic Programming: Techniques and
Applications. . New York, Ellis Horwood.
Mark, H., F. Eibe, et al. (2009). "The WEKA data mining software: an update."
SIGKDD Explor. Newsl. 11(1): 10-18.
Meehl, P. E. (1996). Clinical versus statistical prediction: A theoretical analysis and a
review of the evidence, Northvale, NJ: Jason Aronson. (Original work
published 1954).
84
Partin, A. W., L. A. Mangold, et al. (2001). "Contemporary update of prostate cancer
staging nomograms (Partin Tables) for the new millennium." Urology 58(6):
843-848.
Pontes, J. E., H. Ohe, et al. (1984). "Transrectal ultrasonography of the prostate."
Cancer 53(6): 1369-1372.
Revett, K., P. S. Magalhes, et al. (2006). Data mining a prostate cancer dataset using
rough sets, IEEE CS Press.
Sim, I., P. Gorman, et al. (2001). "Clinical decision support systems for the practice of
evidence-based medicine." Journal of the American Medical Informatics
Association 8(6): 527-534.
Srinivasan, A. (2001). The Aleph Manual.
http://web.comlab.ox.ac.uk/oucl/research/areas/machlearn/Aleph/aleph_toc.ht
ml.
Teeter, A. E., J. C. Presti, et al. (2009). "Does early prostate-specific antigen doubling
time (ePSADT) after radical prostatectomy, calculated using PSA values from
the first detectable until the first recurrence value, correlate with standard
PSADT? A report from the Shared Equal Access Regional Cancer Hospital
Database Group." Bju International 104(11): 1604-1609.
Thompson, I. M., D. K. Pauler, et al. (2004). "Prevalence of prostate cancer among
men with a prostate-specific antigen level <= 4.0 ng per milliliter." New
England Journal of Medicine 350(22): 2239-2246.
van Gerven, M. A. J., B. G. Taal, et al. (2008). "Dynamic Bayesian networks as
prognostic models for clinical patient management." Journal of Biomedical
Informatics 41(4): 515-529.
Verduijn, M., N. Peek, et al. (2007). "Prognostic Bayesian networks I: Rationale,
learning procedure, and clinical use." Journal of Biomedical Informatics 40(6):
609-618.
Verduijn, M., P. M. J. Rosseel, et al. (2007). "Prognostic Bayesian networks II: An
application in the domain of cardiac surgery." Journal of Biomedical
Informatics 40(6): 619-630.
WHO (visited 2010). World Health Organization - http://www.who.int/cancer/en/.
Wolberg, W. H., W. N. Street, et al. (1994). "Machine Learning Techniques to
Diagnose Breast-Cancer from Image-Processed Nuclear Features of Fine-
Needle Aspirates." Cancer Letters 77(2-3): 163-171.
Xiang, Z., R. M. Minter, et al. (2007). "miniTUBA: medical inference by network
integration of temporal data using Bayesian analysis." Bioinformatics 23(18):
2423-2432.

Tese RedeBayesMedicina

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tese RedeBayesMedicina

Uploaded by

Copyright:

Available Formats

Umestudodocomportamentode

You might also like