Professional Documents
Culture Documents
(1.2)
Das equaes (1.1) e (1.2), resulta:
, (1.3)
P =
P
A
i
|B
B|A
i PA
i
PB
Podemos interpretar o resultado expresso pela eq. (1.3) da seguinte forma: P(Ai) a
probabilidade de ocorrncia de um evento Ai e P(B) representa o resultado de um
experimento. A probabilidade P(Ai|B) a nossa estimativa atualizada, a qual leva em conta
o resultado do experimento mencionado. Para que obtenhamos este resultado, devemos ser
capazes de estimar a probabilidade de um resultado experimental B, dado Ai.
Para determinar P(B), vamos considerar que A s pode ser representado pelos eventos
A1, A2,..., An. Como A s pode ser representado por um evento Ai de cada vez, os eventos
Ai so mutuamente excludentes, ou seja:
, (1.4)
P = 1
i=1
N
A
i
9
e, da mesma forma:
, (1.5)
P = 1
i=1
N
A
i
|B
Somando a eq. (1.3) membro a membro sobre todos os eventos Ai e substituindo nela a eq.
(1.5), obteremos:
(1.6)
PB =
i=1
N
PB|A
i
PA
i
,
que conhecida como probabilidade total.
Dessa maneira, a eq. (1.3) pode finalmente ser escrita como:
(1.7)
que o teorema de Bayes para variveis aleatrias discretas.
PA
i
|B =
PB|A
i PA
i
i=1
N
PB|A
i PA
i
,
Da mesma forma podemos aplicar o teorema a variveis aleatrias contnuas. Neste
caso utilizaremos funes de densidade de probabilidade condicionais. Para tal
necessitamos de uma verso apropriada da eq. (1.7) na qual A e B sejam contnuas.
Para trabalhar com variveis contnuas vamos utilizar a notao X para o evento A e
a notao Y para o evento B. Neste caso, necessitaremos da densidade conjunta de X e Y e
tambm das densidades condicionais, ou seja:
(1.8)
fx, y = f
X
x|y
n
f
Y
y
n
e
(1.9)
fx, y = f
Y
y
n
|x f
X
x
a partir das quais podemos escrever:
(2.0)
f
X
x|y
n
=
f
Yy
n
|xf
Xx
f
Yy
n
10
Como uma funo de densidade de probabilidade, temos:
f
X
x|y
n
(2.1)
f
X
x|y
n
dx = 1
Substituindo a eq. (2.0) na eq. (2.1), teremos:
f
X
x|y
n
dx =
1
f
Yy
n
f
Y
y
n
|xf
X
xdx = 1
(2.2)
de onde conclumos que:
(2.3)
f
Y
y
n
=
f
Y
y
n
|xf
X
xdx
Substituindo a eq. (2.3) na eq. (2.0) teremos finalmente:
(2.4) f
f
X
x|y
n
=
f
Yy
n
|xf
Xx
Yy
n
|xf
Xxdx
que a apresentao do teorema para variveis aleatrias contnuas.
Vamos discutir a eq. (2.4) com um exemplo, tomando como base uma situao
concreta.
Desejamos estimar um parmetro x de uma distribuio de probabilidade, por
exemplo: uma taxa de falha, um tempo mdio para falhar (MTTF), uma vida caracterstica,
a resistncia mdia de uma estrutura, um parmetro de forma, etc. Como no temos certeza
do valor desse parmetro x, vamos consider-lo como uma varivel aleatria X, cuja funo
de densidade expressa a nossa incerteza a esse respeito.
f
X
x
11
Especificamente, vamos considerar a incerteza acerca de uma taxa de falha
constante (modelo exponencial). Admitindo que a nossa incerteza pode ser expressa por
meio de uma distribuio normal e representando a varivel aleatria por , teremos:
f
A
z =
1
2m o
o
exp
1
2o
o
2
z z
o
2
(2.5)
onde o a nossa melhor estimativa pontual. A varincia indica o nosso grau de incerteza.
A eq. (2.5) representa a distribuio a priori.
A densidade fy(yn/x) a probabilidade de que um experimento que pode resultar em
diversos valores distintos de Y apresentar um resultado particular yn, dado que o
parmetro tome um valor x.
Admitiremos, como exemplo, que N componentes sejam ensaiados durante um intervalo
de tempo to e que, ao final do ensaio, n tenham falhado. Vamos considerar que yn a
varivel discreta n. Admitindo ainda que os ensaios sejam independentes, a funo de
densidade necessria :
f
N
n|z =
N
n
pz
n
1 pz
Nn
(2.6)
onde p() a probabilidade de falha de um componente que opera durante um intervalo de
tempo to, que a funo verossimilhana, ou seja, no caso do modelo exponencial de falha:
(2.7)
pz = 1 e
zt
o
.
12
Deste modo, teremos:
(2.8)
f
N
n|z =
N
n
1 e
zt
o
n
expN nzt
o
Introduzindo as alteraes de variveis comentadas, a eq. (2.4) pode ser escrita como:
f
A
z|n =
1e
zto
n
expNnzt
o f
Az
1e
z
'
to
n
exp Nnz
'
t
o
f
A
z
'
dz
'
(2.9)
onde dada pela eq. (2.5) para o exemplo sob discusso. importante frisar que a
incerteza pode ser expressa por qualquer distribuio de probabilidade. A escolha vai ser
ditada por um teste de aderncia, ou atravs do uso de grfico de probabilidade.
f
A
z
A funo de densidade a nossa estimativa da incerteza de , modificada para
levar em conta os dados colhidos no ensaio, em termos do nmero de falhas. Podemos
tambm trabalhar com os prprios tempos de falha para fazer a atualizao da funo de
densidade, como veremos mais adiante.
f
A
z|n
Uma vez obtida a funo de densidade a posteriori, eq.(2.9), a qual incorpora as
evidncias do ensaio, ento podemos atualizar a nossa estimativa pontual do valor mdio da
taxa de falha:
(3.0) z
1
=
zf
A
z|ndz
De maneira anloga, podemos tambm calcular a varincia da distribuio a posteriori e
verificar, dessa forma, se obtivemos uma maior preciso com os resultados do ensaio:
(3.1)
o
1
2
=
z
2
f
A
z|ndz z
1
2
,
13
lembrando que
o
2
= EX
2
EX
2
,
onde o momento de ordem n da varivel aleatria X.
E = x X
n
n
fxdx
Antes de apresentarmos a aplicao do teorema com casos prticos de EAR e APS,
faremos uma abordagem conceitual para solidificar o entendimento da metodologia,
mostrando as nuances e limitaes da mesma.
2.2.5- Inferncia Estatstica.
Em SPOJTVOLL [4] temos uma interessante metodologia para se decidir sobre
qual o melhor estimador de um parmetro a partir da quantidade de dados disponveis.
Podemos encontrar tambm em Martz, Waller[8] no captulo 3, uma boa abordagem sobre
inferncia estatstica, onde se apresenta a tcnica de estimao pontual, a funo de
verossimilhana e o estimador de mxima verossimilhana, estimadores no tendenciosos ,
assim como a definio de intervalos de confiana para esses estimadores. O que vale
ressaltar o conceito de intervalo de confiana para um estimador de uma taxa de falha
assim como o conceito de intervalo de probabilidade, que o conceito para o teorema de
Bayes , uma vez que neste o estimador tratado como uma varivel aleatria (v.a.).
2.2.6 A inferncia bayesiana em confiabilidade.
.O famoso artigo do Reverendo Thomas Bayes (1702-1761) foi publicado em 1763
e fundamenta a base da metodologia denominada Inferncia estatstica bayesiana. Devido
sua importncia o artigo foi novamente publicado em 1958. Devido a sensibilidade e
dificuldades com alguns mtodos de inferncias estatsticas , os seguintes fatores tm
contribudo para o recente ressurgimento desta metodologia: algumas solues de
inferncias estatsticas baseiam-se em suposies que carecem de convenientes solues
14
matemticas, difcil desenvolver um plano de amostragem que fornea um bom resultado
mediante um alto nvel especfico de qualidade dos dados se na prtica no se consegue
obter este nvel, o surgimento de computadores cada vez mais velozes para clculos e o
interesse em modelos mais eficientes de anlise de dados que conseguem incorporar dados
subjetivos e objetivos. A incluso de dados subjetivos pode ser efetuada pela metodologia
bayesiana (8), pelo fato da mesma poder explicitar o modo como ela incorpora estes dados.
2.2.7- Inferncia pela teoria da amostragem versus inferncia bayesiana.
Existem diferenas entre a teoria da amostragem e mtodos de inferncia
bayesiana. Tomemos como exemplo um estudo sobre a vida til de componentes
eletrnicos em determinadas condies de operao. Para este estudo, vamos assumir que
as observaes so independentes e exponencialmente distribudas com uma vida mdia .
A distribuio conjunta de probabilidade de um experimento amostral de n observaes
Y= (Y1,....., Yn) ser ento:
(3.2)
f =
1
ex
1
0
y
i
, 0
i
< y/0
0
n
p
i=1
n
< y ,
e estamos interessados em fazer inferncias sobre dados os n valores disponveis.
2.2.7.1-Inferncias baseadas na teoria da amostragem
Na abordagem usada na teoria da amostragem a vida mdia desconhecida
assumida como uma constante fixa. Um estimador pontual (Y), que uma funo de um
grupo de dados Y , escolhido por algum mtodo, tal como: Mxima Verossimilhana,
mnimos quadrados, ou mtodos dos momentos. Por exemplo, os estimadores de mxima
verossimilhana e pelo mtodo dos momentos de so:.
= (Y) =
i=1
n Y
i
n
15
Ao imaginarmos a amplitude de todas as possibilidades hipotticas dos vetores de dados
Y1,Y2,... que poderiam ser gerados pela eq. (3.2), para um dado valor de , obteramos a
distribuio amostral correspondente de (Y).
Por exemplo, a distribuio amostral de U=2n / uma distribuio do qui quadrado de
parmetro 2n com uma f.d.p dada por:
(3.3)
2
I
2
fu =
1
n
n
u
n1
exp
u
, 0 < u < .
Um intervalo de confiana para o estimador de poderia ser calculado para se obter uma
idia de como o valor (Y) esta afastado do valor real , que gerou as n observaes. Por
exemplo o Intervalo de Confiana Total (ICT), 100(1-) %, do estimador para dado por
1001 ,%ICT para 0 :
2nO
_
1,/2
2
2n
;
2nO
_
,/2
2
2n
(3.4)
No caso de amostragens repetitivas onde os intervalos de confiana so computados para
cada amostra, os intervalos de confiana computados poderiam incluir o valor real de em
100(1- )% das amostras. Lembrando que o intervalo de confiana no pode ser
interpretado como uma afirmao probabilstica sobre , posto que no uma v.a.. Por
exemplo,podemos obter um intervalo de confiana do tempo mdio entre falhas (MTTF) de
um evento iniciador de uma APS de uma usina nuclear a partir da combinao dos
intervalos de confiana dos MTTFs de seus componentes . Uma vez que a confiana no
uma probabilidade relativa a , os mtodos para combin-los no so to bem definidos
como no caso de probabilidades.
A teoria da inferncia por amostragem conduz a exemplos indutivos (Fig.2) , por
exemplo, o valor final superior do ICT da eq.(3.3) o maior valor que pode assumir sem
a observao do estimador (Y) com uma probabilidade menor que /2 disto acontecer, de
16
acordo com a eq.(3.4). Uma afirmao similar, pode ser feita para o valor final inferior do
ICT.
Modelo amostral
assumido
Inferncia
Estatstica
Raciocnio
Indutivo
Dados Amostrais
Figura 1: Inferncia baseada na teoria da amostragem
2.2.7.2- A inferncia Bayesiana.
O raciocnio da metodologia bayesiana muito mais direto, dedutivo. Para
atingir esta abordagem direta, a vida mdia de assumida como uma v.a. com uma f.d.p.
a priori g().
Esta distribuio expressa o estado de conhecimento ou ignorncia sobre antes da amostra
ser analisada.
Dada a distribuio a priori um modelo de probabilidade f(y ) e o valor de y, o
teorema de Bayes usado para calcular a f.d.p posterior g( y) de , dado o valor de y.
Para exemplificarmos, vamos supor que a distribuio a prior de dita uniforme num
intervalo 1 at 2 , onde 0< 1< 2 < , ou seja,
g() = 1 , 0< 1 2 < . (3.5)
1 2
17
Acredita-se a priori que um valor do intervalo especificado (1 , 2). Usando o teorema
de Bayes , a partir da eq. (3.2) e da eq. (3.5), a distribuio posterior resultante calculada
como:
1 2 , n >1, (3.6)
0 I n y n
g0/y =
y
i
n1
exp
y
i
/0
n
1,
i
/01 I 1,
y
i
/02
,
onde o somatrio de yi vai de 1 a n e onde (a,z) a funo gama incompleta definida
como
(3.7)
= y ex a > 0 Ia, z
a
z
a1
pydy,
Argumentos dedutivos so usados com a distribuio posteriori para se fazer uma
inferncia bayesiana sobre . Como exemplo, uma estimador pontual para a mdia da
distribuio posterior da eq. (3.7) dada por :
E(/y) = n>2.
I y y
y
i
In2,
y
i
/0
1
In2,
y
i
/0
2
n1,
i
/0
1
In1,
i
/0
2
g =
2
0
0/yd0
,
e (3.9)
,
g0/yd0 =
2
A f.d.p. a priori na anlise baeysiana geralmente incorpora noes subjetivas uma
vez que a freqncia dos valores de raramente conhecida. a distribuio que
representa o grau de conhecimento de antes que os dados y sejam obtidos.
18
Uma distino da inferncia bayesiana o fato de que ela torna explcito o uso da
informao a priori na anlise. Isto contrasta com a abordagem da teoria da amostragem
na qual esta informao considerada somente de maneira informal.
A Figura 3 retrata a metodologia da inferncia bayesiana. O processo comea com
um modelo amostral validado. Uma f.d.p. a priori postulada para estes parmetros
desconhecidos no modelo amostral e a inferncia bayesiana aplicada, os dados da amostra
e a f.d.p. a priori so ento combinados pelo teorema, o raciocnio indutivo usado em
conjunto com o resultado da distribuio posteriori para produzir a inferncia desejada
sobre os parmetros assumidos no modelo amostral.
Dados Amostrais
Modelo a Priori
assumido
Teorema de
Bayes
Raciocnio
Dedutivo
Inferncia
Estatstica
Modelo amostral
assumido
Fig. 2 Inferncia Bayesiana
Podemos apresentar mais duas diferenas distintas entre a teoria da amostragem e a
abordagem bayesiana. A primeira que a inferncia estatstica baseada na teoria da
amostragem usualmente mais restritiva pelo fato do uso exclusivo dos dados da amostra.
O uso da experincia passada quantificada pela distribuio a priori produz uma inferncia
19
mais informativa nos casos em que a mesma realmente reflete a variao do parmetro. Isto
quer dizer que um alto grau de acerto desta inferncia depende da qualidade dos dados
incorporados pela distribuio a priori. A segunda que a metodologia bayesiana
normalmente requer um espao amostral menor para atingir a mesma qualidade dos
resultados obtidos pela teoria da amostragem. Em muitos casos esta a grande motivao
prtica para o uso da metodologia bayesiana e conseqentemente da informao a priori.
2.2.8- A distribuio a Priori.
Considere-se por exemplo um problema de inferncia estatstica no qual as
observaes so tomadas de um f.d.p., f(x ), onde um parmetro com um valor
desconhecido. Ento assumimos que o valor desconhecido de deve pertencer a um
espao amostral . O problema tentar determinar, baseado em informaes da f.d.p. de
f(x ), onde esta o provvel valor de no espao amostral paramtrico . Em vrios casos,
depois de vrias informaes disponveis provenientes de f(x ), o experimento ou
estatstica ser capaz de resumir sua prvia informao ou conhecimento sobre onde em
o valor de provvel de ocorrer a partir da construo de uma distribuio de
probabilidade de em . Em outras palavras, antes que qualquer dado experimental seja
coletado ou observado, o experimento ou experincia passada do analista o levar a
acreditar que mais provvel de estar em determinadas regies de do que em outras.
Podemos assumir que a verossimilhana relativa das diferentes regies pode ser expressa
em termos de uma distribuio de probabilidade em . Esta chamada de distribuio a
prior de , porque ela representa a verossimilhana relativa de que o verdadeiro valor de
se encontra em cada regio de antes de serem observados quaisquer valores de f(x ).
20
Esta pode ser uma limitao da aplicao do teorema de Bayes, da escolha correta
desta f.d.p. depender o resultado da inferncia estatstica bayesiana. A distribuio a priori
reflete uma informao importante a respeito dos valores possveis da taxa de falha antes
de termos obtido a nossa prpria evidncia experimental.
Para a maior parte dos dispositivos usados na rea nuclear para elaborao de uma
APS ou na indstria de processo para elaborao de um EAR, no existe uma fonte de
dados num formato ideal para representar a distribuio a prior no Teorema de Bayes. Em
geral, as fontes de dados disponveis no especificam as circunstncias em que a falha
ocorreu, nem o ambiente para qual os dados por elas fornecidos se aplicam. Portanto, a
maioria destas fontes adota uma famlia de distribuies para representar a distribuio de
taxa de falha e fornece, para cada modo de falha, os percentuais que definem um intervalo
de confiana de 90% sobre esta distribuio (ICT). Em outras palavras, estabelecem valores
mximo e mnimo para a variao de taxa de falhas e ajustam uma distribuio entre
valores extremos. Tais distribuies so interpretadas como curvas representativas da
populao, ou seja, curvas da variabilidade populacional [10 ]. Esta variabilidade de taxa de
falhas devida, dentre outros fatores, a diferentes fabricantes, diferentes modelos,
diferentes condies de operao, de manuteno, de ambiente operacional e s diferenas
devidas flutuao randmica inerente entre componentes idnticos.
Se todo o nosso conhecimento acerca de um dispositivo resumir-se informao de
que ele um membro da populao, ento adotamos a curva de variabilidade populacional
como distribuio a priori, porm, na maioria dos casos dispomos de algumas informaes,
baseadas no projeto do dispositivo, em experincias em aplicaes similares, no julgamento
21
de peritos e no nosso prprio conhecimento a respeito do dispositivo. Estas informaes
adicionais, usadas conjuntamente com a variabilidade populacional (fontes de dados
genricos), auxiliam na escolha de uma distribuio a prior adequada.
Os dados podem ser genricos, especficos , objetivos e subjetivos. Quando o dado
representativo da populao, o classificamos como genrico, se o dado proveniente do
dispositivo que estamos analisando, constitui um dado especfico, quando obtido a partir
experincias ou de expresses analticas comprovadas experimentalmente, classificado
como objetivo, caso o dado seja proveniente da opinio de especialistas, ele classificado
como subjetivo.
2.2.8.1- Fontes de dados genricos:
a) Reactor Satety Study WASH 1400, Apndice III [11]
Este relatrio contm dados de falhas de dispositivos mecnicos, estimativas da freqncia
de ocorrncia de eventos iniciadores e dados referentes a falhas de modo comum. Grande
parte destes dados foi obtida a partir da opinio de especialistas, que forneceram valores
mximos e mnimos recomendados para a taxa de falha. Neste estudo admitiu-se que as
incertezas, referentes s taxas de falha dos dispositivos esto distribudas lognormalmente
e os valores mnimos, recomendados e os mximos foram adotados como sendo,
respectivamente, os percentis 5%, 50% e 95% de uma distribuio lognormal.
b) NREP- National Reliability Evaluation Program Procedure Guide- Apndice C [12]:
Os dados de falhas foram obtidos a partir de especialistas e do guia IREP (NUREP/CR-
2728). Para cada modo de falha foi atribudo um valor nominal da taxa de falha e um erro
relacionado aos valores superior e inferior de um intervalo de 80%.
22
O valor nominal foi multiplicado e dividido pelo fator de erro, obtendo-se, respectivamente,
os extremos superior e inferior para o intervalo de variao da taxa de falha. Uma
distribuio loguniforme foi ajustada entre os valores extremos sendo calculado, ento, o
valor mdio desta distribuio, conforme [12].
c) OREDA- Offshore Reliability Data Bank [5].
Resume informaes de taxas de falhas de dispositivos, de plataformas martimas do Mar
de Norte e do Mar Adritico, utilizados em instalaes de processos de explorao e
produo de petrleo. A metodologia usada descarta informaes do incio e do final de
vida til, evidenciando perodos onde as taxas de falha so relativamente constantes. Os
modos de falha possuem um intervalo de confiana total de 90% usando procedimentos
adequados de estimao das taxas de falha [4]. Utiliza uma f.d.p. do tipo gama para os
parmetros com taxa de falha de comportamento contnuo, no fazendo referncias
especficas de f.d.p. sobre estimadores de taxa de falha do tipo falha na demanda.
d) AIChE-CCPS Data Bank [9]
O banco de dados foi formado a partir de dados genricos disponveis de confiabilidade e
de taxas de falha de componentes, incluindo estudos de confiabilidade, trabalhos de
pesquisa publicados e bancos de dados de confiabilidade e relatrios governamentais que
contm informaes ligadas a processos qumicos, nucleares, plataformas martimas de
petrleo e indstrias de petrleo ao redor do mundo.
Utiliza uma f.d.p. lognormal com intervalo de confiana total de 90% para o
registro dos dados, recomendando o uso de uma f.d.p exponencial para tratamentos futuros
do modo de falha dos componentes.
23
2.2.8.2- Uso da opinio de especialistas. (Distribuies a priori no informativas)
No caso de no dispormos de informaes genricas, suficientes para escolhermos
a distribuio a priori, podemos usar a opinio de especialistas. Deste modo, a quantidade
de dados disponveis pode ser ampliada atravs da quantificao destas opinies. Esta
quantificao deve ser efetuada atravs de procedimentos de avaliao apropriados.
A avaliao subjetiva exige que o especialista atribua um valor de probabilidade
para o seu grau de crena a respeito do evento analisado. Isto, por sua vez, exige que o
especialista tenha a habilidade de formular sua prpria opinio e atribuir um valor de
probabilidade a este grau de crena associado com a sua opinio. A avaliao subjetiva
depende ento do grau de conhecimento do especialista e do procedimento usado para
avaliar tal conhecimento. O contedo depende de quem sabe o que e o quanto sabe, ou seja,
depende da experincia tcnica do especialista em fazer julgamentos no tendenciosos. O
procedimento usado para efetuar a avaliao subjetiva pode afetar significativamente a
qualidade da informao obtida [14].
Os especialistas tendem , freqentemente, a superestimar o grau de certeza de suas
estimativas, sendo que fornecem um julgamento melhor se a definio do evento
considerado incluir a descrio precisa dos modos e das circunstncias da falha. Portanto,
deve-se usar um procedimento estruturado de entrevistas e tcnicas adequadas para reduzir
as tendncias na quantificao do julgamento subjetivo.
Uma metodologia interessante para obteno e uso de informaes oriundas de
especialistas o mtodo DELPHI [15], onde se combina o conhecimento de um grupo de
especialistas a partir de: questionrios formulados e comentados pelos prprios
especialistas, a garantia do anonimato das informaes e em alguns casos dos prprios
24
especialistas, possibilidade de ajustar um ponto de vista baseado no resumo do resultado
do grupo e a realizao de dois a cinco ciclos iterativos.
Geralmente o uso de informaes de especialistas leva a uma limitada informao a
priori do parmetro de interesse, ou seja a informao no substancial em comparao
com a informao que se esperava a partir da amostra de dados. Isto leva a acreditar que h
um conjunto de valores cujos elementos tm igual probabilidade de representar o
verdadeiro valor do parmetro em questo.
O mtodo mais empregado, em tal caso, selecionar como a priori uma distribuio
que localmente uniforme, isto , aproximadamente distribuda uniformemente no
intervalo de interesse. Contudo, h outros modos de se definir distribuies a priori no
informativas e uma definio mais geral, inclusive com exemplos prticos, pode ser
encontrada em MARTZ & WALLER [8].
2.2.8.3- Distribuies a Priori conjugadas
Algumas distribuies de probabilidade quando so usadas como a priori so mais
convenientes que outras, quando a amostra obtida de determinadas funes de
verossimilhana. Em tais casos, tem-se o que se chama de a priori conjugadas, isto , a
distribuio posterior da mesma famlia da priori. Isto simplifica a anlise, pois permite
obtermos a distribuio poterior analiticamente.
Como exemplo podemos afirmar [16] que caso a evidncia experimental obtida seja
do tipo temporal, com funo verossimilhana calculada atravs da distribuio de Poisson,
e a distribuio a piori pertena famlia de distribuies gama, a distribuio posterior
ser tambm uma distribuio gama. Da mesma forma podemos afirmar, para uma
verossimilhana binomial e uma priori beta temos uma posteriori beta. Um outro grupo de
25
conjugadas a famlia da distribuio exponencial que so as distribuies: normal,
lognormal, binomial, Poisson, e a prpria exponencial [7].
2.2.9- A funo posterior
Suponhamos agora que as n varveis aleatrias X1,......,Xn de uma amostragem
aleatria de uma distribuio para qual a funo de densidade de probabilidade (f.d.p) ou a
funo de probabilidade(f.p.) f(x ). Suponhamos tambm que o valor do parmetro
desconhecido e que a f.d.p ou f.p. a prior de (). Para simplificarmos, devemos
assumir que o espao paramtrico qualquer intervalo de um conjunto de nmeros reais,
e que () a f.d.p a priori mas do que uma f.p., em . Do mesmo modo assumiremos
f(x ) como uma f.d.p em .
Desde que as varveis aleatrias X1,......, Xn de uma amostragem aleatria de uma
distribuio para qual a f.d.p f(x ) a sua f.d.p conjunta f(X1,......, Xn ) ser dada pela
equao :
f(X1,......, Xn ) = f( x1 )..... f( Xn ). (4.0)
Se usarmos a notao vetorial x = (x1,......,Xn) ento a distribuio conjunta na eq. (4.0)
pode ser escrita simplesmente como fn(x ).
Desde que o parmetro por si s agora considerado como pertencente a uma
distribuio para a qual a f.d.p. (), a conjunta ajuntada fn(x ) pode ser considerada a
f.d.p condicional de X1,......, Xn para uma dado valor de . Se multiplicarmos esta f.d.p.
condicional pela f.d.p (), obteremos uma f.d.p dimensional (n+1) de X1,......, Xn e na
forma de fn(x ) (). A f.d.p. marginal conjunta de X1,......, Xn pode agora ser obtida pela
integrao desta conjunta f.d.p em todos os valores de . Entretanto, a f.d.p. condicional n-
dimensional conjunta gn(x) de X1,......, Xn pode ser escrita na forma:
g
n
x =
O
f
n
x|00d0
(4.1)
26
Alm disso, a condicional f.d.p. de fornece X1 = x1,.....,Xn = xn, a qual podemos denotar
por ( x) que dever ser igual f.d.p conjunta de X1,......, Xn. Por isso temos:
para (4.2)
=
f
0|x
n
x|00
g
n
x
A distribuio de probabilidade em representada pela f.d.p. condicional da eq (4.2)
ento denominada de distribuio posteriori de , porque esta a distribuio de depois
dos valores X1,......, Xn serem observados. Similarmente, a f.d.p. condicional de na eq. (4.2)
chamada de f.d.p. posterior de . Podemos dizer que a f.d.p anterior () representa a
verossimilhana relativa , antes dos valores X1,......, Xn terem sido observados, que o valor
real de se encontra em cada varivel regio de . Isto quer dizer que a f.d.p. ( x)
representa esta verossimilhana relativa depois que os valores X1 = x1,.....,Xn = xn, foram
observados.
2.2.10- A Funo Verossimilhana.
A funo verossimilhana de um parmetro a funo que associa a cada
pertencente ao espao o valor p(x/ ). Assim .
0 l0; x = px|0 l0, x : O R
+
A funo verossimilhana associa para um valor fixo de x a probabilidade de ser
observado x a cada valor de . Assim , quanto maior o valor de l , maiores as chances de
encontrarmos o verdadeiro valor de relativo ao evento fixado. Portanto ao fixarmos um
valor de x e variarmos os valores de observamos a plausibilidade ( verossimilhana ) de
cada um dos valores de .
Para melhor entendimento, supondo que dispomos de uma amostra aleatria x=
(x1,...,xn) de uma f.d.p. de poisson com parmetro . Ento, a funo de verossimilhana de
a densidade conjunta de todas as observaes, dado o parmetro , ou seja,
27
onde:
l = f
i =
x !
=
x x =
i=1
n
x
i
n
0; x
i=1
n
x |0
i=1
n
0
x
i
e
0
i
0
nx
e
n0
i=1
n
i
!
A partir da definio anteriormente efetuada a respeito da funo posterior,
podemos afirmar que o denominador do membro direito da eq. (4.2) simplesmente a
integral do numerador sobre todos os possveis valores de . No caso em que todos os
possveis valores x1,....., xn. no dependam de , podemos resumi-los como uma constante,
quando o membro direito da eq. (4.2) considerado uma f.d.p de . Podemos entretanto
substituir a eq. 4.2 com a seguinte relao:
(4.3)
f 0|x
n
x|00
O smbolo de proporcionalidade usado aqui para indicar que o membro
esquerdo s igual ao direito a partir de uma constante, cujo valor pode depender dos
valores observados x1,....., xn., mas no depende de . A constante apropriada para a qual
ser possvel a igualdade dos dois lados na relao da eq. 4.3, pode ser determinada
usando o fato de que
Agora vamos aplicar uma experincia de campo a partir de dados retirados de notas
de reparo de um sistema integrado de manuteno (Dados fornecidos pela Bayer S/A a
partir de dados de um sistema de gerenciamento de manuteno SAP mdulo PM).
32
Neste experimento, aps acompanhamento de modo de falha de vlvulas com
acionamento automtico modelo CAMFLEX II e sua malha de acionamento, obtivemos
que aps 43758 solicitaes num perodo de observao trs anos, foram evidenciadas
apenas 6 falhas.
Adotaremos para esta evidencia de campo, que nos permite especializar os dados,
uma funo verossimilhana, como uma f.d.p. binomial, dado a caracterstica do modo de
falha da vlvula, com N=43758 (nmero de demandas) ; n=6 (nmero de falhas) ;
ento temos:
(4.6) f
Y
y
n
|x =
N
n
pz
n
1 pz
Nn
Para um baixo valor de podemos ter uma aproximao da distribuio binomial
por uma distribuio tipo Poisson (12), assumindo uma evidencia de n falhas num tempo
de operao T.
f
Y
y
n
|x = expz T
zT
n
n!
(4.7)
assumindo T = N (12), fica ento :
(4.8)
f
Y
y
n
|x = expz N
zN
n
n!
substituindo os valores de n e T em (4.8) temos:
(4.9)
f
Y
y
n
|x = exp z 43758
z43758
6
6!
O novo valor de aps a evidencia de campo ser, , tal que: f
X
x|y
n
(5.0)
f
X
x|y
n
=
f
Yy
n
|xf
Xx
f
Yy
n
|xf
Xxdx
efetuando as substituies de (4.5) e (4.9) em (5.0) temos:
33
f
X
x|y
n
=
1
2m z0.46722
exp
1
20.46722
2
ln
z
1. 423310
3
2
exp z43758
z43758
6
6!
0.0
1
2m z0.46722
exp
1
20.46722
2
ln
z
1. 423310
3
2
exp z43758
z43758
6
6!
dz
(5.1)
resolvendo a integral do denominador da eq.(5.1) :
expz 43758
z43758
6
6!
1
2m z0.46722
exp
1
20.467 22
2
ln
z
1. 423 310
3
2
dz
=
= 2,7932 x 10E-05
como uma funo de densidade de probabilidade, temos que : f
X
x|y
n
= 1, ( condio de normalizao), aplicando a eq.(5.1) temos:
0
f
X
x|y
n
1
2m z0.467222. 793 210
5
exp
1
20.467 22
2
ln
z
1. 423 310
3
2
expz 43758
z43758
6
6!
dz
= 0.99999 , ou seja , estamos atendendo a condio de normalizao.
A nova taxa de falha vem ento da mdia da f.d.p. a Posteriori de :
1 = (5.2) z
0
f
X
x|y
n
dz
substituindo nossos valores em (5.2) teremos:
z
1
2m z0.467222. 793 210
5
exp
1
20.467 22
2
ln
z
1. 423 310
3
2
expz 43758
z43758
6
6!
dz
34
= 3,0226x10E-04 , ou seja, v1 = 3,0226x10E-04 que comparado com o valor anterior
genrico = 2,2 x 10E-03, reflete a realidade do complexo industrial com melhores
programas de manuteno, padres de projeto e condies operacionais.
A Figura 3, mostra a comparao grfica das curvas das f.d.p. a priori e posterior do
nosso exemplo .
0.00625 0.005 0.00375 0.0025 0.00125
6250
5000
3750
2500
1250
0
Distribuio a priori
Distribuio
posterior
y y
f(Fd)
x x
Falha por demanda (Fd)
Figura 3: Grficos das fdps antes da evidencia da planta (priori) e depois (posterior)
35
Podemos ainda observar que a curva da distribuio posteriori nos apresenta uma
baixa disperso em torno da mdia, o que demonstra que a nossa evidncia (funo
verossimilhana) suficiente forte para a especializao da taxa de falha.
A freqncia anual do evento com o novo valor de v1 fica ento:
tv1 = 2,2 x 10E-05 x 4.4 = 9,68x10E-05, contra a evidencia anterior de 7,14x10E-04.
Continuando o nosso exemplo de EAR, para ilustrar melhor a influncia dessa nova
freqncia de ocorrncia do cenrio de vazamento anteriormente descrito mostramos a
seguir as curvas obtidas a partir de uma simulao computacional efetuada com o software
RISKAN, da empresa SERENO Sistemas Ltda.
O clculo do risco efetuado pelo software , sendo que este um produto entre o
risco de fatalidades ligado conseqncia do cenrio em estudo e a freqncia anual de
ocorrncia do mesmo. O clculo do risco de fatalidades da conseqncia pode ser feito por
uma srie de equaes de probit [20]. Essas equaes transformam uma varivel fsica,
exposio a uma nuvem txica de um produto, por exemplo, em uma probabilidade de
fatalidade.
No Brasil os rgos governamentais especializados em controle do meio ambiente
tais como: FEEMA , CETESB, FEPAM, CRA e outros, possuem critrios de aceitabilidade
de riscos, onde o risco individual, ou seja, o risco que um indivduo da comunidade vizinha
a uma instalao industrial pode estar exposto, deve ser inferior a 1,0 x 10E-05, para que a
instalao seja aceita sem restries.
Com as mesmas condies de conseqncia, os resultados do clculo do risco, em
forma de curvas de isorisco, com freqncias anuais antes (priori) e depois (posterior) da
36
especializao dos dados pela metodologia bayesiana, foram traadas em um mapa de uma
instalao industrial, conforme as Figuras 4 e 5.
Podemos perceber que a curva de risco correspondente a 10E-05 (hachuriada) com a
freqncia a priori (Figura 4) fora da fronteira da instalao industrial com a comunidade
ao redor da mesma, ou seja, inaceitvel, e a curva com a freqncia posterior (Figura 5)
totalmente dentro da instalao industrial, ou seja, aceitvel.
origem
100.00 m
Escala:
Legenda:
Curvas de isorisco:
1,00 e-08/ano Fronteira da instalao industrial
com a comunidade ao redor.
1,00 e-06/ano
1,00 e-05/ano
Figura 4: Curvas do risco individual, antes (priori) da especializao
da taxa de falha, pela inferncia bayesiana.
37
origem
Legenda:
Curvas de isorisco:
1,00 e-08/ano (risco individual) Fronteira da instalao industrial
com a comunidade ao redor.
1,00 e-06/ano (risco individual)
1,00 e-05/ano (risco individual)
Figura 5: Curvas de risco individual, aps (posterior)especializao
da taxa de falha, pela inferncia bayesiana.
38
3.3- Aplicao a uma APS.
Para exemplificar o uso da metodologia bayesiana em plantas nucleares, mostraremos
como a mesma abordada no relatrio de APS da usina nuclear de Angra 1, emitido em
dezembro de 2001 [21].
As estimativas das freqncias de ocorrncia dos eventos iniciadores da APS, foram
obtidas a partir da incorporao aos dados genricos de outras usinas nucleares similares,
dados estes retirados do apndice D do NUREG/CR 3862 [22] e tambm mostrados na
tabela 2-11 da referencia [23], dos dados especficos da usina . A tabela apresentada no
apndice 2 reproduz ento os dados genricos considerados para a APS de Angra 1.
A metodologia usada foi a mesma discutida no NUREG/CR-1110 [24] e na
referncia [25] que a seguir apresentamos com alguns comentrios no final.
O teorema de Bayes se apresenta, como j vimos, da seguinte forma
PA|B =
PB|APA
PB
Podemos assumir a funo verossimilhana pode ser dada pela distribuio de Poisson.
neste caso teramos:
PB|A =
p
t
e
pt
k!
onde:
p = probabilidade do evento iniciador, assumido constante
K = nmero de ocorrncias
t = perodo de tempo
39
A distribuio anterior, assumida com uma distribuio gama, pode ser descrita por sua
mdia e varincia, como segue:
m
a
=
k
t
- mdia da distribuio anterior
Va =
k
t
2
- varincia da distribuio anterior
Um modo de expressar a varincia da distribuio anterior :
Va = m
a
2
e
o
ln
2
1
Onde o desvio padro logartmico, e dado por :
o
ln
o
ln
=
lnFE
1.645
Se a mdia e o fator de erro so fornecidos para a distribuio anterior,
em vez de k e t, como ocorre freqentemente, a informao da distribuio anterior aparece
na forma de uma distribuio lognormal. Ela pode ser convertida em uma distribuio gama
com parmetros e pelo uso das seguintes expresses:
( ( m
a
) FE)
o =
m
aln
2
V
aln
[ =
V
aln
m
aln
onde: = mdia da lognormal
m
aln
= varincia da lognormal
V
aln
Como a mdia da lognormal igual mdia da distribuio gama, combinando-se estes
parmetros com o nmero de ocorrncia (n) e o perodo de tempo (m) dos novos dados,
obtm-se as seguintes equaes para a mdia e a varincia da distribuio posterior:
40
m
A/B
=
o+n
[+m
V
A/B
=
o+n
[+m
2
O fator de erro da distribuio posterior dado por:
FE
A/B
= e
1.645o
A/B
onde,
o
A/B
= ln
V
A/B
m
A/B
2
+ 1
1
2
A Tabela do apndice 3 apresenta o resultado da atualizao bayesiana efetuada a partir
destas consideraes anteriores.
As aproximaes anteriormente descritas das fdps, ou seja, assumir uma fdp gama
com sendo representativa de uma Poisson ou de uma lognormal nem sempre possvel,
existem restries de alguns parmetros tais como: fatores de forma, mdias e varincias.
A no observncia destas restries pode levar a erros.
O uso da metodologia anteriormente apresentada no exemplo usado para o EAR de
uma planta de processo qumico, elimina este risco, uma vez que a comparao grfica das
fdps a priori e a postrerior, permite avaliar diretamente este erro.
41
CAPTULO 4
Concluses e Recomendaes
4.0- Concluses e recomendaes.
Na aplicao da inferncia bayesiana para o caso de um EAR podemos observar
claramente a influncia da especializao dos dados com uso dos dados de uma instalao
industrial, mudando a curva de isorisco de aceitabilidade de risco individual em cerca de
250 a 300 m a partir do evento iniciador do risco. Isto significa que, pelo critrio usado por
orgos ambientais (FEEMA,CETESB e outros) uma instalao anteriormente rejeitada,
perfeitamente aceitvel sem restries.
Entretanto nem sempre os dados das instalaes so disponveis ou possveis de
serem usados, estima-se que um nmero limitado de instalaes tenha um tratamento
adequado dos dados de falha de seus componentes. Neste caso o resultado ideal vem do uso
das evidencias disponveis na planta combinados com os dados genricos disponveis.
Todavia, como j vimos sempre que tivermos dados relevantes da instalao devemos us-
lo ao invs de usarmos a dados genricos. Deve ser ressaltado tambm o caso de que zero
falha na planta, em um dado intervalo de tempo, no significa que no vai haver falha, e a
a inferncia com dados genricos ou de outras plantas ir ajudar consideravelmente o
analista a quantificar o risco.
Podemos afirmar que uma das grandes vantagens da inferncia bayesiana o fato de
mesmo com um espao amostral pequeno, disponvel da planta, possvel aproveitar esta
experincia e especializarmos os dados. O grfico da fdp a priori e a posterior , traados na
mesma escala na Figura 3, uma maneira interessante de se verificar o comportamento da
disperso dos dados em torno do valor esperado da taxa de falha (varincia), principalmente
42
na distribuio posterior afetada pela verossimilhana. Com esta comparao, podemos
afirmar se os dados de nossa instalao (nossa verossimilhana) so suficientes ou no.
O uso da metodologia bayesiana requer o uso de mtodos numricos, para soluo
de integrais, porm, com o seu equacionamento a partir de fdps conhecidas, podemos
demonstrar que com uso de programas de clculo como MAPLE para Windows, usados
em microcomputadores, suficiente para se obter os resultados, no necessitando de
programao em linguagem computacional especfica tipo FORTRAN ou similar. Para o
exemplo de EAR usado neste trabalho, tanto para o clculo numrico quanto para a
simulao computacional com uso do software RISKAN, foi utilizado um computador
porttil (notebook) IBM-Thinkpad (modelo 26453EP), com processador Intel- Pentium II
e130 Kb de memria RAM, com sistema operacional Windows 2000.
Algumas aproximaes de fdps em substituio a outras, para facilitar o uso da
metodologia devem ser corretamente efetuadas, pois existem limitaes de alguns
parmetros que podem permitir ou no aproximao, a no-observncia destas condies
pode levar a erros. Esta possibilidade de erro no compromete a metodologia, posto que
algumas referncias(8) e(10), usadas neste trabalho, apresentam estas restries com
exemplos suficientes.
Recomenda-se fortemente que se introduza com urgncia nos manuais de referncia
para elaborao de EARs, usados pelos orgos ambientais, critrios que permitam a
especializao de dados de falha utilizando a inferncia bayesiana, para as instalaes em
estudo. Quanto ao caso de APS de centrais nucleares tambm recomendvel detalhar mais
as restries de aproximaes efetuadas para as f.d.p.s utilizadas de modo a se evitar
erros que possam influenciar nas especializaes efetuadas.
43
A principal recomendao fica para as indstrias de processo em geral, para terem
um correto tratamento das suas taxas de falha, construindo bancos de dados consistentes e
homogneos que possuam um tratamento estatstico adequado com f.d.ps definidas, de
modo a permitirem uma coerente especializao dos dados. O banco de dados deve ter
tambm boas condies de serem auditados, com boa rastreabilidade. Sugere-se para isso
sistemas integrados ao gerenciamento da instalao, como por exemplo o sistema SAP ou
similar, particularmente ao mdulo PM (gerenciamento de manuteno) do mesmo. Com
isto aproveitam-se rotinas j efetuadas, evitando-se criar mais trabalho para a mesma mo
de obra existente, o que muitas vezes pode acabar inviabilizando a criao e a alimentao
constante de informaes no banco de dados. Uma simples abertura de ordem de
manuteno ou teste peridico, ao ser encerrada, pode gerar a informao de que tanto
precisamos para a especializao dos dados. Obviamente que devemos gastar esta energia
para os pontos que tenham maior potencial de danos, para se definir os equipamentos ou
componentes aos quais vamos aplicar a metodologia, podemos partir de anlises de
segurana qualitativas do tipo anlise preliminar de perigos(APP), desvios operacionais
( HAZOP) ou a escolha de eventos iniciadores indicados por orgos reguladores de centrais
nucleares com por exemplo o NUREG [12].
Quanto ao caso de uso em APS de plantas nucleares, ao invs de se usar
aproximao de fdps, para se obter uma fdp posterior conjugada da priori, recomenda-se
usar o clculo direto, conforme o exemplo do EAR de uma indstria de processo, e depois
comparar-se graficamente a traagem das curvas priori e posteriori.
44
Referncias:
1- GIBELLI, S.M.O., MELO, P.F.F., OLIVEIRA, L.F.S., Anlise de Segurana
de Sistemas por rvore de falhas, PEN-112, COPPE/UFRJ, Janeiro,1982.
2- AIChE Guidelines for Chemical Process Quantitative Risk Analysis, Center
for Chemcial Process Safety of the American Institutr of Chemicals Enginerrs, .
New York.,USA, 1989.
3- MIL-HDBK 217F, Reliability Prediction of eletronic Equipament. U.S.
Department of Defense Military Standardization Handbook ,1991.
4- SPJOTVOLL, E., Estimation of failure rate from reliability data bases. In
society of Reliability Engineers Symposium ,(1985: Trodheim)
5- OREDA-2002,. Offshore Reliability Data,. prepared by SINTEF and market
by DNV.
6- AMARAL NETTO, J.D., Metodologia Bayesiana para especializao e
atualizao de dados de falhas de centrais nucleares., M.Sc. (Tese), PEN-
COPPE/UFRJ, 1981.
7- SANTOS, A. M., Uma abordagem Bayesiana para Estimar Taxas de Falha.
M.Sc. (Dissertao), Instituto de Matemtica/UFRJ, 1996.
8- MARTZ, WALLER., Bayesian Reliability Analysis. 2, ed. Flrida : Krieger
Publishing Company , 1991. 744p
9- AIChE, Guidelines for Process Equipament Reliability Data with Data
Tables, Center for Chemical Process Safety (CCPS) of the American Institute
of Chemical Engineers, New York,USA, 1989
45
10- APOSTOLAKIS, G., et all, Data Specialization for Plant Specific Risk
Studies, Nuclear Engineering and Design, 56, North-Holland Publishing
Company (1980), pg. 321-329.
11- USNRC (U.S. Nuclear Regulatory Comission), Reactor Safety Study
An assessment of Accident Risks in U.S. Commercial Nuclear Power Plants,
WASH- 1400, Apndice III- Failure Data, NUREG-751014, 1975.
12-National Reliability Evaluation Program Procedure Guide, Suported by
PAPAZOGLOU, I.A., Apendice C, NUREG/CR-2815, BNL-NUREG 51559,
(1982).
13-MOSLEH, A., APOSTOLAKIS, G., Models for the use of Expert Opinions,
Workshop on Low-Probability, High-Consequency Risk Analisys, Arlington,
Virginia, 1982.
14-LINSTONE, H.A. and TUROFF, M., The Delphi Method: Techniques and
Apliccations Reading, 1975.
15- DeGROOT, M.H.,Probability and Statistics- 2
nd
Ed. Carnegie-Mellon
University, Addison-Wesley Publishing Company, New York (1986).
16-NELSON,W.B. Applied Life Data Analisys, John Willey & Sons, New York
1982.
17-HENLEY, E.J. e KUMAMOTO, H. Reliability Engineering and Risk
Assessment., Prentice-Hall, Englewood Clifs. New Jersey, 1981
18-LEWIS, E.E.. Introduction to Reliability Engineering. 2
nd
,ed, New York,John
Wiley & Sons, Inc.. 1994, 435p. .
46
19- TNO- the Nettherlands Organization. Methods for Determining and Processing
Probabilities- Red Book. CPR 12E, 1997.
20- ELETROBRAS TERMONUCLEAR S/A. Anlise Probabilstica de Segurana
da usina nuclear de Angra 1, seo 2 , caderno deeventos iniciadores, Reviso 1,
Dezembro de 2001.
21-NUREG/CR 3862, U.S. Nuclear Regulatory Commission. Development of
Transient Initiating Event Frequencies for use in Probabilistic Risk Assessments.
Maio1985
22-Probabilistic Safety Assessment for Point Beach NPP, Units 1&2 Initianting
Event Notebook. Revision 0. Wiscosin Public Service Co, May 1993.
23-NUREG/CR-1110. U.S. Nuclear Regulatory Commission ,Bayesian Analisys of
Component Failure. November 1979.
24-INPO/FGR-363.Isntitute of Nuclear Power Operations, B.LOGAN. A, laymans
Guide to Probabilistic Risk Assessments
.
47
Apndice 1: Taxa de falha de vlvula automtica, acionada remotamente por atuador
pressurizado com ar, a partir de sinal de instrumento de controle do processo,AIChE [9].
48
49
Apndice 2: dados genricos considerados para a APS de Angra 1.
49
50
50
Apendice 3: Resultado da atualizao Bayesiana dos eventos iniciadores da APS de Angra I
a partir de dados genricos de usinas nucleares similares.