Professional Documents
Culture Documents
O passo inicial de qualquer anlise estatstica consiste em uma descrio dos dados atravs de anlise descritiva (tabelas, medidas e grficos). Como a presena de censura invalida esse tipo de tratamento aos dados de sobrevivncia, o principal componente da anlise descritiva a funo de sobrevivncia. Dessa forma, o procedimento inicial encontrar uma estimativa para a funo de sobrevivncia e, a partir dela, estimar as quantidades de interesse. Mtodos no paramtricos para estimao da funo de sobrevivncia so fceis de entender e aplicar. Eles so menos eficientes que os mtodos paramtricos quando os tempos de sobrevivncia seguem uma distribuio terica e mais eficientes quando nenhuma distribuio terica apropriada conhecida. Na abordagem no paramtrica, a estimao realizada sem que se faa nenhuma suposio sobre a distribuio de probabilidade do tempo de sobrevivncia e assim no possui parmetros a serem estimados. Iremos considerar dois estimadores no paramtricos: A tabela de vida e o estimador de Kaplan e Meier
TABELA DE VIDA
As tabelas de vida so usadas pelas companhias de seguros desde o sculo XVII. So procedimentos que mostram a estrutura do tempo de sobrevivncia para grupos homogneos de indivduos quando esses tempos so submetidos a censura. Para construo da tabela de vida necessrio dividir o eixo do tempo em um certo nmero de intervalos. Suponha que o eixo do tempo seja dividido em s intervalos, ou seja, Ij=[tj-1,tj), para j=1,2,...,s em que t0=0 e ts=. Sejam: dj = nmero de falhas no intervalo [tj-1,tj), cj = nmero de censuras em [tj-1,tj) e nj = nmero de observaes sob risco (no falhou e no foi censurado) em tj-1.
TABELA DE VIDA
o
1)
q j = P(T [t j 1, t j ) | T t j 1)
importante citar que o nmero de censuras dividido por dois pois observaes para as quais a censura ocorreu no intervalo [tj-1,tj) so tratadas como se estivessem sob risco durante a metade do intervalo considerado.
2) 3)
j Podemos construir estimadores para S(t) a partir de q Suponha que em um grupo tenhamos n pacientes no instante t=t0. Desses, aproximadamente n ( q 0 ) no chegaro a t=t1 sem a ocorrncia do evento de interesse.
0 ) Em consequncia, ao final do primeiro perodo ainda estaro sob risco n (1 q
4) 5)
TABELA DE VIDA
6)
0 ) que chegam ao final desse perodo, n(1 q 0 )(1 q 1) Analogamente, dos n(1 q chegaro ao final do terceiro perodo. Assim,
(t ) = (1 q 0 )( 1) S 1q 2
7)
(t ) = (1 q 0 ) (1 q 1 ) ... (1 q j ) = (1 q i 1 ) S j
i =1
0 = 0 com j=1,...,s e q
INTERPRETANDO: A funo de sobrevivncia a probabilidade de uma observao no falhar at o tempo tj. Considere, por exemplo, que a probabilidade de um paciente sobreviver aos primeiros dois anos de um estudo igual a probabilidade dele sobreviver ao primeiro ano e ento sobreviver a mais um ano. A representao grfica da funo de sobrevivncia, chamada curva de sobrevivncia, uma funo escada, com valor constante em cada intervalo de tempo.
EXEMPLO 1: Construa a tabela de vida para o grupo controle. Compare o resultado com o do grupo esteride.
ESTIMADOR DE KAPLANKAPLAN-MEIER
O estimador de Kaplan-Meier, tambm chamado estimador produtolimite, foi proposto por Kaplan e Meier em 1958 e sem dvida o mais utilizado em estudos clnicos. A expresso estimador produto refere-se ao fato de que a probabilidade de sobrevida at a data especificada estimada considerando-se que a sobrevivncia at cada tempo independente da sobrevivncia at outros tempos, e, em consequncia, a probabilidade de se chegar at o tempo t o produto da probabilidade de se chegar at cada um dos tempos anteriores. O estimador de Kaplan-Meier considera tantos intervalos de tempo quantos forem o nmero de falhas distintas e os limites dos intervalos so os prprios tempos de falha da amostra. O estimador de Kaplan-Meier apresenta a forma do estimador tabela de vida, mas utiliza um estimador ligeiramente diferente para qj.
ESTIMADOR DE KAPLANKAPLAN-MEIER
Suponha que existam n pacientes no estudo e k(n) falhas distintas nos tempos t1<t2<...<tk. Seja dj o nmero de falhas no tempo tj e nj o nmero de observaes sob risco at o tempo tj (exclusive), ou seja, os indivduos que no falharam e no foram censurados at o instante imediatamente anterior a tj. O estimador de Kaplan-Meier , ento, definido como:
EXEMPLO 1:
GRUPO CONTROLE: 1+,2+,3,3,3+, 5+, 5+, 16+, 16+, 16+, 16+, 16+, 16+, 16+, 16+ GRUPO ESTERIDE: 1,1,1,1+,4+,5,7,8,10,10+,12+,16+,16+,16+
EXEMPLO 1:
o
Todos os indivduos estavam vivos em t=0 e se mantm at a primeira morte que ocorre em t=1 semana. Ento a estimativa de S(t) deve ser 1 neste intervalo compreendido entre 0 e 1 semana. No valor correspondente a 1 semana , a estimativa deve cair devido a trs mortes que ocorrem neste tempo. No segundo intervalo, existem ento 14 indivduos que estavam sob risco antes de t=1 e 3 morrem. Desta forma, a estimativa da probabilidade condicional de morte neste intervalo 3/14 e a probabilidade de sobreviver 1-3/14. ( t ) uma funo escada (6) = S (5) , pois S Observe, por exemplo, que S com saltos somente nos tempos de falha. A curva de sobrevivncia construda mantendo o valor estimado da funo de sobrevivncia constante entre os tempos de falha. Quando o maior tempo observado na amostra corresponder a uma (t ) = 0 . censura, o grfico no atinge o valor S
EXEMPLO 1:
ESTIMADOR DE KAPLANKAPLAN-MEIER
Este estimador est sujeito variaes que devem ser descritas em termos de estimaes intervalares. Para a construo de intervalos de confiana necessrio uma (t ) . estimativa da varincia de S A expresso para a varincia assinttica do estimador de Kaplan-Meier dada por
(t )) = [ S (t )] 2 ( S var
j :t j < t
dj n j (n j d j )
(t ) , para t fixo, tem distribuio assinttica normal, segue que Como S um intervalo aproximado para S(t) com (1-)% de confiana dado por
ESTIMADOR DE KAPLANKAPLAN-MEIER
o
Quando a funo de sobrevivncia estimada prxima de zero ou um, este tipo de intervalo, simtrico, inapropriado pois pode conduzir os limites de confiana para valores fora do intervalo [0,1]. Uma soluo utilizar uma transformao para S(t) e construir um intervalo assimtrico, como por exemplo
ESTIMADOR DE KAPLANKAPLAN-MEIER
o
Os estimadores tabela de vida e Kaplan-Meier so em geral similares. A grande diferena est no nmero de intervalos utilizados. A estimativa obtida pelo estimador de Kaplan-Meier baseada, frequentemente, em um nmero maior de intervalos. natural esperar que quanto maior o nmero de intervalos, melhor ser a aproximao para a verdadeira distribuio do tempo de falha. Para o mecanismo de censura do tipo aleatrio, as estimativas por Kaplan-Meier e Tabela de vida sero prximas mas no necessariamente coincidentes. Neste caso, alguns estudos mostram a superioridade do estimador de Kaplan-Meier.
A partir da curva de Kaplan-Meier possvel obter estimativas de algumas quantidades de interesse, tais como tempo mediano e percentis. Como a curva de sobrevivncia uma funo escada, as estimativas mais adequadas so obtidas por meio de interpolao linear.
(6) : Para obter S
Esta forma usualmente gera uma melhor representao da distribuio contnua do tempo de falha.
De forma anloga pode-se obter estimativas de outros percentis da distribuio dos tempos de vida. Outra quantidade que pode ser de interesse o tempo mdio de vida. Uma estimativa pode ser obtida calculando-se a rea (integral) sob a curva de Kaplan-Meier estimada. Como esta curva uma funo escada, esta integral simplesmente a soma de reas de retngulos.
Em que t1<...<tk so os k tempos distintos e ordenados de falha. Tal estimativa deve ser evitada se o maior tempo observado for censurado. Uma alternativa usar a mediana ao invs do tempo mdio de vida.
No R
Kapla-Meir: ekm<-survfit(Surv(tempo, censura)) summary (ekm)
tempo <- c(16, 18, 21, 21, 22, 25, 29, 35, 37,39, 40, 50, 52, 54, 60, 80, 80, 81, 83, 84, 85)
censura <- c(1,1,0,1,1,0,1,1,1,1,1,0,1,1,1,0,1,0,1,1,0) y<- Surv(tempo,censura) ekm<-survfit(y~1) ekm summary(ekm) plot(ekm, xlab="tempo",ylab="S(t) estimada")
tempo<- c(1,2,3,3,3,5,5,16,16,16,16,16,16,16,16,1,1,1,1,4,5,7,8,10,10,12,16,16,16) cens<-c(0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,0,0,1,1,1,1,0,0,0,0,0) grupos<-c(rep(1,15),rep(2,14)) ekm<- survfit(Surv(tempos,cens)~grupos) summary(ekm) plot(ekm, lty=c(2,1), xlab="Tempo (semanas)",ylab="S(t) estimada") legend(1,0.3,lty=c(2,1),c("Controle","Esteroide"),lwd=1, bty="n")
O problema de comparao de distribuies de sobrevivncia surge com frequncia em estudos de sobrevivncia. Por exemplo, pode ser de interesse comparar dois tratamentos para uma determinada doena. Um caminho simples a observao do grfico das funes de sobrevivncia estimadas. Contudo esse grfico fornece apenas uma idia aproximada da diferena entre essas distribuies. Ele no revela se as diferenas so significativas. Para comparar as curvas de sobrevivncia mais formalmente, podemos recorrer a TESTES DE HIPTESES.
o 1) 2)
N(t) o nmero total de eventos observados. Rk(t) o nmero de pessoas em risco no estrato k. R(t) o nmero total de pessoas em risco no estudo no tempo t. Calcula-se a estatstica de teste:
3)
OBSERVAO: Quando apenas dois estratos esto sendo comparados, a estatstica log-rank calculada utilizando-se os dados de apenas um dos estratos. O resultado do teste para um estrato se estende ao outro estrato por simetria. A generalizao do teste de log-rank para mais de dois estratos no complicada.
No R
A varincia da estatstica de Peto igual a varincia do log-rank, onde a cada tempo se pondera pelo quadrado da funo de sobrevida. No R
survdiff(Surv(tempos,censura)~grupos,rho=1) EXEMPLO: Dados de Hepatite survdiff(Surv(tempo,cens)~grupos,rho=1)
o o