Professional Documents
Culture Documents
RESUMEN
Se establece el probtema de estimacin no paramtrica de funciones de
supervivencia a partir de datos parcialmente censurados por la derecha en
un contexto bayesiano, usando tcnicas bayesianas paramtricas. Se obtiene
un estimador considerando como distribucin a priori un proceso de Dirichlet y se estudian sus propiedades asintticas desde un punto de vista
bayesiano.
f'c^luhrcl.^^ c^lu^}c^: Esiimacin bayesiana no pararntrica, datos censurados,
procesos de Dirichlet, funcin de supervivencia.
1.
1NTROC?UC'C'lON
Sean
T,,..,, T
f^
S, (t) = P(^' > t), ^',,..., Y,,. Se supone, adems, que las variables aleatarias T, son
independientes de las Y,. C onviene hacer notar que el estadstco, en la prctica,
dispone unicamente de los datos ( Z, ^S) =(Z,, cS, ; i= 1,..., n}, donde Z, = min { T,, Y, },
, = I(T, < Y,); r= 1,..., n. S ^, = 0, e1 dato es censurado, y si ^S; = l, se trata de una
m uerte.
En algunas ocasiones parece apropiado considerar que las variables aleatorias Z y^d
san independientes. Esto es, que el tiempo observado de muerte o censura es independiente de que la a^bservacin sea censurada o no. Este tipo de modelo, denominado de
azar proporcional, queda caracterizada por la existencia de un [3 E R+ _[0, ^} tal que
S, (t) - S, (t^; Y t^ R^.
En esie trabajo, usando un modelo de azar proporcional, se obtiene un estimador de
la funcin de supervivencia S^ (t}, a partir de datos parcialmente censurados, bajo la
condicin de que se distribuya se^,n un proceso de Dirichlet.
En lo que sigue se supone al lector familiarizado con los conceptos de funcin de
supervivencia, funcin de supervivencia aleatoria y medida de probabilidad aleatoria
{Ferguson (1979), Garca { 1983), Quesada y Vivar { I 984)).
En relacin con la hiptesis que hacemos a lo largo del trabajo, acerca de la
independencia entre las T; y las Y,, conviene matizar la siguiente: Sean S,, S, funciones
de supervivencia aleatorias con distribuciones P, y P, respectivamente. Consideremos
los vectores aleatorios (T,,..., T) e(Y,,..., Y,,,) que toman valores en R+ y R+'respectivamente. Para poder decir que (T,,..., T) e{Y^,..., Y,,,) son muestras aleatorias simples
independientes de poblaciones con supervivencias S, y S^ respectivamente, definimos la
distribucin de probabilidad conjunta P^ de (T,,..., T), (Y,,..., Y,,,), S,, S^ del siguiente
modo:
D^Jinc^ic.^rt 4
(1)
11
Pf x P,
11
r - 1
S^ ( t^)
11
S^ (ti',) ),
donde
D^ c^ {b^ ^^ /^^
x i3Rjr^ ^^),
.
j - I
f3^,,.,^ es la cr--lgebra de Borel en [4,1 ], t,,..., t , t^,,..., ti^,Y, E R+, Ir, (S,, S,) es 1 si
(S^, S^) est en D y es 0 en caso contrario.
La expresin (1) determina una probabilidad P_^ en (R+ x R+' x[0,1 ]^+ x[0,1 ]^-*, (13+ x
[3*' x t3^^{^ 1^ x Bk^r} ^^) ), 13+ denota la clase de los cilindros de Borel en R+ y
la probabilidad producto en ([0,1 ]R^ x[0,1 ]K+, (I3X^^^ 1^ x LiR^11 j^ ))
P, x P, es
ME T()lj() [)t^ f-:STIM:IC 1{)ti E3Ati F^^I.AtiA UE: F^li'.`VC-l()tiE:S DE ^l;F'E-:[tLrl^'f.ti('Ifl t'()ti [)A-T()St E'`ri^E Ft.A[)()S
__ _ _
__. _ _ - .. . .. _ _
_
_
_
_
____
_
__
rt
Pj (T; > t;, Y, > y;; i= I,... ,n; .1=1 ,...,m/S,, S^} =
`
i}
ii)
J-j
^-1
Si (t^)
.n
;-1
S^ (_v;)
S^ (r i) ^
i=1
?.
Dada una muestra (Z,, ^5,),..., (Zn, bn), consideramos un tiempo fijo t y la siguiente
..,
part>tcion de S^ : A,_{ w E S2 1 T( w)< Y( w) y T( K^ )< t,(muerte antes de t), A,
_ { ^^^ E S2 1 Y ( u^ } < T ( K^ ) y Y ( w ) < t } (censura antes de t ) , A _^ _ { w E S2 / T ( ^ti} )
< Y ( ^^^ ) y T ( w^ ) > t } (muerte despus de t ) , A 4 = { ^^^ E S^ / Y ( >^^ ) < T ( n^ ) y
Y( ^^^) > t} ( censura despus de t).
E1 vector aleatorio v(t} _(v, ( t), v, ( t), ti^_^ (t), v.^ (t) }, donde v, (t} representa eI
nmero de muertos que hay en la muestra de tamao n antes de t, v, (t) el nmero de
el nmero de censurados despus de t, sigue una
muertos despus de
t y v4 (t)
distribucin multinomial de parmetros (rr; p, (t), p^ (t), p^ ( t), p,^ (t) ) , siendo p; (t) _
P (A;).
En trminos de las funciones de s^.pervivencia S, {t) y S^ (t), estas probabilidades
aleatorias toman los valores:
p^ (t) _ -
p,^ (i) _ -
^ S^ (.Y)
<
a+l
s^ ( t)^^' Y p4 ( t) =
a+l
S^ (t)t^+^
N uestro problema desde el punto de vista paramtrico es el de considerar a cualquiera de las p, (t) como un parmetro aleatorio de una distribucin multinomial, con una
distribucin a priori dada a partir de las distribuciones marginales de los procesos Sf (t)
y S, (t) y obtener e estimador Bayes bajo prdida cuadrtica del parmetro variable
aleataria S^ (t) a t 1'^jo. Dicho estimador ser la media a posteriori E(S f(t) / v{t) )
T^vrema 1
Dada la muestra observable (^ ^, ^ f),..., (^,,, f^) relativa a las variables T e Y y
supuesto que la funcin de supervivencia de T, Sr (t), es un proceso de Dirichlet, el
estimador Bayes bajo prdida cuadriica de S1 (t} a t fijo en un modelo de azar
proporcional, es
.. ^
.^--^, r r ^
^ n--t^( t )
^ ,., , ,W . ., ,.. ^, . .,
..
S, (t) _
,r-^, rl^
. n-u(t)
^- ^ 1
^^,
donde
. ,_
r { + (B + 1) (n--j) )
DE^m^^s^trucicirt
A t fijo, S^ (t) es una variable aleatoria, S, que se distribuye segn una Beta
(-- (t), a), siendo la distribucin de ^r ( t), supuesto que S toma el valor s, una
Multinomial
1 -- .5^3
(n.,
+1
+ 1)
( 1 - .SJ,i
,
.^,J.3 + 1
B+ 1
B+ t
^,J.^ + !
,
B+1
B+
Por tanto
n^
v,! v,!
v^! vd!
^1'r-v ^
B+ 1
^y^--ti_;
I3 + 1
, Consecuentemente
M-TC)[^O [^E ES^T IMA(`1O!'v H:11"E-.^1,^1tiA [)E Fl.'!tiC'IONFS DE sl'F'E:R^'IYE-:ti(^[ i C^Oti U:^ iOti (^E.titil R^^Cx)^
_
_ _ _.
__
_
_ __
_
^^
^
.S, (t) = E (S/V (t) _ ^^) _
^^^
r^^
ti^ 1 + v,^^ ^
^,,
r^^
^
^^
^ ^^+V^^
J
.I
S (t) =- a(t)
representa
n- ^,
lim S^ (t) _
lo
^^- ^,
J = (1
h)
n -u
n-u
J
/ (f3 + 1) (n - .) )
{ ^ {.v) =
^ _t
i r (-^) )
I^)
3.
^_.st^At^is^^^^c^^A t^s^,^tic>^_.^
Hemos obtenido para cada t^ R fijo, un estimador S^ (t) de la funcin de supervivencia S, (t), el caso de que existiese azar proporcional. En este apartado afirmamos que
al variar t, S f(t) es una funcin de supervivencia determinstica en el modelo de azar
proporcional.
Tevrema 3
Dada la muestra observable (z^, ^S^),..., {^,,, S) relativa a las variables aleatorias T e Y,
y supuesto que la funcin de supervivencia de T, S^ (t), sea un proceso de Dirichlet, el
estimador ^ ^ (t) en ei modelo de azar proporcional, al variar t, es una funcin de
supervivencia determinstica.
4.
1
B+ 1
(3
Li+ 1
k
n
a
Li+l
^_ k
n-k
Mf^ f()C:x) C^f. f_4T-1^411( I(lti fi.^1,1 f ti[ ^ti^i C)E^. F-l'tit^lOtiES t)F Sl'PFR^'1^'f-:tiC^l ^^ f<)^ DAT()^ c E!^iSC R.1^()^i
__
_
_
__
1 E
1^
n! S
t ^r:
n
t ^f = eX p (-- ( B+ 1
' ^
! S
( r)
l r)
` ^
1 (S
1J
} n
^
i=1
i=!
i_1
i^/
A (t^) },
0= t < t, <
S1 (t) =
I1
A(t,) _
, se verifiear
(n--i+l ) r,)
i=1
M(B+ 1)
M, ( (n - 1) (B + 1) )
M-r (B+ 1)
12
ESTADiSTfCA ESPAOLA
r ( a } r ( a - ^ (t) + a)
y como M, (a) =
I'( - a (t) ) r ( + a)
se sigue que
P (Z > t I 13) =
En cuanto a P (^ = r, 1 C3)
r ()
^
r (+ (C^ + 1) n) ^=^
Li
a+ 1
^(t,)+(B+ 1)(n-j})
se tiene
) ^ - ^, ( a+1 1 )^,
BIBLIOGRAFA
FERGUSON, T. S. y PHADtA, E. G. (1979): "Ba^^esian nvnpararnetric estirrtativn hased on censored
data ". Ann. Statist. 1, I 63-18b.
QUESAaA, V., GAR^fA, A. y WvAR, A. (19$3): "Moelo de supervivencia cun a: ar proporcic^nal
Ramma exponencial c^n muestras c^ensuradas ". Estad. Espaola, vol. 99.
QUESAA, V. y VtvAtt, A. (1984): "Estimacin puramtrica en modelos no pararrctricus hayesianos
de supervivencia ". Estadistica Espar^ola, n. 1 Q3.
QUESAO^A, V., MORALES. D, y PAROO L. (1985): "Fslimacin paramtrica hayesiana no paramtrica
de funciones de supervivencia con observaciones parcialmente censuradas "' Presentando en la
revista Trabajos de Estadistica,
ti1f I()[)ti [)f k^[ Iti1 ^c I()\ fi ^l [ ti[ ^\ ^ I)E F l\( 1()\E ^[)f til ['f ft i` f\( i^( c3\ C)^ Il)^ ( f\^t K^1(x)^ ^
.
SUMMARY
A BAYESIAN EST[MATION METHOD C}F SURVi` ^/AL
FUNCTIONS WITH CENSORED DATA ^
The problern of nonpararnetric estimaton of a survival function based
on a partially censored on the right sample is established in a bayesian
context, using parametric bayesian techniques. An estimate is obtained
considering Dirichlet processes, and its asymptotic properties are studied
from a bayesian point of view.
K^y^ words: Bayesian nonparametric estimation, Censored data, Dirichlet
process, Survival function.
AMS, 1980. Subject classif cation: Primary 62010, Secundary fi2G99.