Professional Documents
Culture Documents
Dissertao apresentada ao Instituto de Cincias Matemticas e de Computao - ICMC-USP, como parte dos requisitos para obteno do ttulo de Mestre em Cincias Cincias de Computao e Matemtica Computacional. VERSO REVISADA
Dissertao apresentada ao Instituto de Cincias Matemticas e de Computao - ICMC-USP, como parte dos requisitos para obteno do ttulo de Mestre em Cincias Cincias de Computao e Matemtica Computacional. VERSO REVISADA
Agradecimentos
Primeiramente, agradeo minha me Vilma, minha av Olita e ao meu tio Alexandre por sempre me apoiarem e incentivarem. Ao meu orientador, Dorival Leo, por ter acreditado em mim e por estar presente em cada etapa deste trabalho. Agradeo ainda pela pacincia e incentivo na elaborao e conduo deste trabalho. Minha eterna gratido e admirao. Aos professores de estatstica do ICMC-USP pelos ensinamentos e por toda ateno que me deram. Em especial professora Cibele Russo, membro da banca do
exame de qualicao, agradeo pelas diretrizes e sugestes. Aos professores e funcionrios do ICMC pela minha formao prossional, pessoal e pelo excelente convvio. Em especial ao Roberto pelo apoio e carinho, ao Bruno e Naiara pelos preciosos momentos de distrao e Patrcia, que mesmo distncia est todo dia presente. A todos meus amigos do curso de ps graduao em estatstica: Alessandra, Aline, Hiroshi, Gilberto, Joo Luiz, Jos Augusto, Jos Flores Delgado, Matheus e Willian, por toda ajuda que me deram e pelos momentos compartilhados ao longo destes anos. s minhas queridas companheiras de casa Nayara e Ludmila e aos demais amigos que, independentemente da distncia acompanham-me nesta jornada. No citarei nomes, pois esta lista seria muito extensa para ser colocada aqui. Alm disso, no correrei o risco de acabar esquecendo de algum. A todas as pessoas que no foram mencionadas, mas que de alguma maneira contriburam para viabilizar este trabalho.
Resumo
O objetivo deste trabalho estudar a performance de alguns mtodos de comparaes mltiplas (MCMs) que ajustam o valor-p quando as estatsticas empregadas nos testes so a log-rank e a Cramr-von Mises, ambas no paramtricas e com estrutura de dependncia. A vantagem dos MCMs que ajustam o valor-p que eles controlam as taxas de erro tipo I e tipo II para cada hiptese, a m de atingir um poder estatstico elevado, mantendo a taxa de erro da famlia dos testes (FWER) menor ou igual ao nvel de signicncia escolhido. Trabalhamos com o procedimento clssico de Bonferroni e com outros mtodos vistos como seu melhoramento, com especial ateno a certos procedimentos derivados do mtodo de Simes que permitem realizar inferncias sob as hipteses individuais. Foi vericado
teoricamente que a estatstica log-rank pertence classe multivariada totalmente positiva de ordem 2 (MTP2 ), uma vez que o mtodo de Simes garante o controle da FWER quando as estatsticas dependentes assumem esta condio. O controle da FWER empregando a estatstica de Cramr-von Mises foi observado apenas por meio de simulaes. Os MCMs foram analisados atravs de estudos computacionais em modelos discretos e contnuos sob censura com foco no problema de comparar um tratamento versus controle.
Palavras-chave:
Abstract
The aim of this work is to study the performance of some Multiple Comparison Methods (MCMs) that adjust the p-value when the log-rank-type and Cramr-von Mises statistics are used, both nonparametric and with dependency structure. The advantage of these
methods is that they control the error rates of type I and type II for each hypothesis in order to achieve high statistical power while keeping the Family Wise Error Rate (FWER) lower or equal than a given signicance level. The classical Bonferroni procedure is used as well as others seen as its improvement, with special attention to certain procedures derived from Simes' method for making inferences on individual hypothesis. It is theoretically
proved that the weighted Log-Rank statistics belongs to the multivariate totally positive of order 2 (MTP2 ) class, which is needed in order to apply Simes' method, that guarantees control of the FWER of dependent statistics in this case. The control of the FWER
when the Cramr-von Mises statistics is used is only veried by means of computational simulations. The MCMs are also analyzed by means of computational experiments with discrete and continuous data under censoring with focus on the problem of comparisons of treatment versus a control.
Keywords:
Sumrio
1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Organizao dos captulos . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
5
7
7 9 9 9 12 12 14 14 16 17 22 23 23 25
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Mtodos fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Procedimentos de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 2.3.2 Bonferroni Clssico . . . . . . . . . . . . . . . . . . . . . . . . . . . Procedimento de Bonferroni de rejeio sequencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 2.5
Mtodo de Simes
Mtodo de Simes para testes individuais 2.5.1 2.5.2 2.5.3 Mtodo de Hochberg
. . . . . . . . . . . . . . . . . . . . . . . . . .
Sumrio
ii
26
26 27 29 29 31 34
4 Estudo de simulao . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Dados discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 4.1.2 4.2 Controle da FWER . . . . . . . . . . . . . . . . . . . . . . . . . . . Poder dos testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
38 38 42 53 53 55
61 63 70
Captulo 1 Introduo
Testes simultneos de vrias hipteses nulas, conhecidos simplesmente como testes mltiplos, so um dos problemas mais comuns de inferncia em diversas anlises estatsticas. Por exemplo, em pesquisas farmacuticas sobre a eccia de uma droga experimental, a avaliao estatstica sobre a superioridade da droga em relao aos medicamentos existentes ou sobre o placebo geralmente realizada por meio de uma formulao de testes mltiplos. O principal desao dos testes mltiplos est em assegurar que a taxa de erro Tipo I, que rejeitar erroneamente a hiptese nula e, por conseguinte, chegar a uma inferncia falso positiva, seja mantido ao nvel estabelecido pelo investigador. Pesquisas biomdicas, por exemplo, geralmente utilizam projetos experimentais complexos. Dessa forma, a m de economizar recursos, como dinheiro, tempo do investigador ou unidades experimentais (humanos, animais, tecidos ou clulas), vrias hipteses acabam sendo testadas a partir de uma nica experincia, o que aumenta o risco de fazer inferncias estatsticas falsas. No pior dos casos, se de uma inferncia errnea aumenta
de Comparaes Mltiplas (MCMs), que so procedimentos estatsticos designados a minimizar estes erros. A bibliograa sobre este assunto extensa, podemos destacar como referncias fundamentais os livros Hochberg & Tamhane (1987), Hsu (1996) e Lehmann & Romano (2005), que trazem quase todas as tcnicas e conceitos empregados nesta rea da inferncia mltipla.
1.
Introduo
Na literatura de testes mltiplos diferentes taxas de erros foram analisadas, sendo as principais denominadas como: taxa de erro por comparao (per-comparison error rate (PCE)), denida como a proporo esperada do erro tipo I; taxa de erro por famlia (error rate per family (PFE)), exibida como o nmero de erros esperados na famlia; taxa de erros da famlia dos testes (family-wise error rate (FWER)), que representa a probabilidade de uma ou mais rejeies falsas na famlia de inferncias; e ainda a false
discovery rate (FDR), que indicada quando temos um nmero bem elevado de hipteses
a serem testadas, e denida pelo valor esperado da razo entre o nmero de rejeies falsas e o nmero total de rejeies. Neste trabalho, as discusses sero voltadas para os MCMs que controlam a FWER, que entre outras razes, segundo Hochberg & Tamhane (1987), nos permite calibrar uniformemente procedimentos diferentes para um referencial comum, e assim, comparar as suas caractersticas operacionais de maneira justa. Um dos precursores dos MCMs foi Fisher (1935), que introduziu duas categorias distintas: procedimentos de uma etapa (single-step ), que abrange a importante classe
referida como procedimentos de testes simultneos (simultaneous test procedures ); e procedimentos de etapas mltiplas (stepwise ), que posteriormente foram classicadas em ascendente (stepup ) e descendente (stepdown ). O primeiro mtodo proposto por Fisher o famoso teste da diferena mnima signicativa (least signicant dierence (LSD) test ), que pode ser visto como um procedimento de duas etapas, em que a hiptese nula testada preliminarmente por um teste
F.
J o segundo mtodo dado por Fisher apresenta etapa nica e popularmente conhecido como procedimento de Bonferroni. Ambos procedimentos controlam a FWER, o LSD
no sentido fraco (somente quando todas as hipteses nulas na famlia so verdadeiras) e Bonferroni no sentido forte (para qualquer combinao de hipteses verdadeiras e falsas). No entanto, frequentemente o LSD exibe maior poder e uma das razes disto o fato de apresentar mais de uma etapa. As comparaes mltiplas na anlise de varincia (ANOVA) uma rea em que as inferncias simultneas tm uma longa histria. O procedimento clssico e mais utilizado neste contexto foi proposto por Tukey (1953). Tal mtodo compara todos os possveis
pares de mdias a m de encontrar quais delas diferem signicativamente uma das outras, e baseado na distribuio da amplitude Studentizada. Para dados balanceados, o teste de
1.
Introduo
Tukey o mtodo de uma etapa mais poderoso para comparaes de mdias duas a duas. Quando o interesse est na comparao de vrios tratamentos com um controle, o teste que merece destaque na ANOVA foi proposto por Dunnett (1955), e bem semelhante ao teste t usual. Marcus et al. (1976) propuseram uma tcnica geral para a construo de procedimentos descendentes: os mtodos fechados (closure method ). Os procedimentos resultantes deste mtodo so a base para a construo de muitas estratgias de comparaes que veremos neste trabalho, eles controlam a FWER no sentido forte e chamado na literatura de procedimentos de testes fechados (closed testing procedures ). O mtodo de Bonferroni clssico tem presena marcante na inferncia simultnea, pode ser aplicado em qualquer situao de testes mltiplos e como dito anteriormente, controla a FWER no sentido forte, porm o preo desta generalidade a falta de poder. Diante disto, a m de amenizar esta situao, tem surgido na literatura diversos
procedimentos denominados como melhoramentos de Bonferroni, j que um MCM ideal aquele que controla a FWER e tem capacidade para detectar casos em que a hiptese nula falsa. Estas tcnicas geralmente apresentam etapas mltiplas e so propostas para ajustar o valor-p oriundo das estatsticas dos testes. A vantagem dos MCMs que ajustam o valor-p que eles controlam as taxas de erro tipo I e tipo II para cada hiptese com o propsito de atingir um poder estatstico elevado, mantendo a FWER menor ou igual ao nvel de signicncia escolhido. Um dos primeiros aprimoramentos do mtodo clssico foi dado por Holm (1979), que props um mtodo descendente atravs do procedimento dos testes fechados, que cou conhecido como procedimento de Bonferroni de rejeio sequencial (sequentially rejective bonferroni procedure ) ou procedimento de Holm. Esta estratgia exibe maior poder quando comparado ao mtodo tradicional de Bonferroni e controla a FWER no sentido forte. Uma das modicaes mais importantes do procedimento de Bonferroni e que daremos grande ateno neste trabalho foi dado por Simes (1986). Tal mtodo testa a hiptese nula global
H0 =
n i=1
Hi ,
que a combinao de
hipteses individuais, a um
dos testes. Simes provou que seu procedimento controla a FWER quando as estatsticas dos testes so independentes e conjecturou via simulao que este controle se mantm
1.
Introduo
Evidenciamos este
mtodo pelo fato dele apresentar maior poder em relao a Bonferroni, principalmente quando estatsticas altamente correlacionadas esto envolvidas. Como Simes (1986) no justicou teoricamente o controle da FWER para estatsticas dependentes, Sarkar & Chang (1997) mostraram que para distribuies multivariadas que exibem um certo tipo de dependncia positiva o mtodo de Simes controla efetivamente a FWER. Posteriormente, Sarkar (1998) provou analiticamente que o mtodo de Simes controla a FWER para uma classe ainda mais geral de distribuies multivariadas com dependncia positiva, caracterizadas pela condio multivariada totalmente positiva de ordem 2 (MTP2 ) e tambm para algumas misturas de MTP2 . Simes (1986) tambm deixou em aberto o problema de realizar inferncias simultneas sob as hipteses individuais. Diante disto, Hochberg (1988) sugeriu um mtodo bem simples de rejeio sequencial do tipo ascendente. Hommel (1988) tambm estendeu o procedimento de Simes para inferncias individuais, e subsequentemente, Hommel (1989) mostrou que este procedimento, embora seja mais complicado e difcil de ser interpretado, mais poderoso que a estratgia formulada por Hochberg. A m de melhorar o procedimento de Hochberg, Rom (1990) props uma modicao que requer o clculo dos pontos crticos atravs de um algoritmo recursivo, e foi mostrado que tal procedimento apresenta uma pequena vantagem em relao ao mtodo original. Recentemente, Rom (2013)
forneceu uma modicao que mantm a simplicidade do procedimento de Hochberg enquanto apresenta um ganho de poder, que pode ser moderado em algumas situaes, podendo atingir nveis bem elevados quando muitas das hipteses testadas so falsas. Neste trabalho o principal objetivo aplicar os procedimentos de Bonferroni, Holm, Hochberg, Hommel e o mtodo recente proposto por Rom (2013) em modelos discretos sob censura aleatria, j que a anlise estatstica para estes dados tem grande importncia em inmeras reas. Um exemplo tpico visto na educao quando queremos analisar o nmero de semestres at a ocorrncia da evaso dos alunos de graduao de uma universidade. Quando analisamos dados ao longo do tempo como estes, um problema frequente que alguns dados aparecem somente em certos perodos, ou seja, esto sujeitos censura. Dessa forma, quando o evento de interesse a ocorrncia da evaso devemos considerar os eventos de censura, que neste caso podem ser a transferncia, a migrao,
1.
Introduo
o falecimento ou a concluso do curso. Em vrias circunstncias, procedimentos estatsticos baseados em distribuies contnuas ou mistas no podem ser aplicados diretamente em dados puramente discretos, devido falta de informao necessria para validar os resultados assintticos. Um
problema encontrado na literatura est no desenvolvimento de mtodos de testes no paramtricos para modelos discretos na presena de censura que seja consistente em uma grande classe de hipteses alternativas. importantes para testar Um dos mtodos no paramtricos mais
H0
testes no paramtrico mais indicados para comparar duas ou mais populaes com dados sujeitos censura, contudo apresenta a desvantagem de no exibir um bom poder ao lidar com funes intensidade no proporcionais. Dessa maneira, trabalhamos tambm com a estatstica de Cramr-von Mises, que foi analisada em Leo & Ohashi (2011) e considerada ideal para modelos puramente discretos sob censura. Vericamos teoricamente que a estatstica log-rank satisfaz a condio MTP2 . O controle da FWER ao empregar as extenses do mtodo de Simes na estatstica Cramrvon Mises foi averiguado apenas por recursos computacionais. Ainda por meio de estudos de simulaes comparamos a performance dos mtodos de Bonferroni, Holm, Hochberg, Hommel e Rom em relao ao ganho de poder realizando os testes com as estatsticas
discreta, mas tambm realizamos uma pequena anlise com dados contnuos. Focamos no problema de comparar um tratamento versus controle.
1.1
O foco do Captulo
de comparaes mltiplas e apresentar detalhadamente o procedimento de Simes e suas principais extenses para testes individuais. No Captulo
trabalhamos e apresentamos as estatsticas dos testes empregadas: log-rank e Cramr-von Mises. Mostramos ainda que a estatstica log-rank satisfaz a condio MTP2 para a
1.
Introduo
O Captulo
R (R Development Core Team, 2011), com o objetivo de analisar o desempenho do mtodo de Simes e suas extenses para testes individuais, quanto ao controle da FWER e ao ganho de poder ao realizar os testes com as as estatsticas log-rank e Cramr-von Mises. Por m, o captulo futuros.
apresentamos o mtodo de Simes e algumas de suas extenses para realizar inferncias sob as hipteses nulas individuais.
2.1
Introduo
Em pesquisas mdicas, educacionais ou agrcolas, uma ferramenta comum para a anlise dos dados um teste de homogeneidade das populaes (tratamentos ou grupos); e quando a hiptese nula que carrega a informao de que todas as populaes so iguais rejeitada, no obtemos inferncias sobre diversas comparaes detalhadas entre as populaes que podem ser de interesse do investigador, por exemplo, comparaes dois a dois entre os grupos, comparaes de vrios tratamentos com um controle (ou referncia), ou ainda comparaes entre todos os subconjuntos dos grupos. neste contexto que
surgem os Testes Mltiplos, em especial as Comparaes Mltiplas, j que nossa ateno neste trabalho est voltada s comparaes. Quando realizamos testes de hipteses podemos cometer dois possveis erros na tomada de deciso: o erro tipo I, que ocorre quando a hiptese nula
H0
rejeitada
2.
H0
desejvel realizar os testes de uma maneira que as probabilidades dos dois tipos de erro sejam mnimas, porm quando temos um nmero grande de hipteses a serem testadas simultaneamente nos deparamos com o problema da multiplicidade, que se refere ao crescimento da probabilidade do erro tipo I com o aumento do nmero de testes. Para ilustrar numericamente este fato vejamos o exemplo a seguir, em que foi calculada a probabilidade de ao menos uma rejeio falsa quando todas as hipteses verdadeiras e as estatsticas dos testes so independentes. Considerando o nvel de signicncia
H1 , . . . , Hn
so
= 0, 05
P {ao
=1
i=1
{1 P (rejeio
falsa)}
= 1 (1 )n .
10
0, 40;
se forem executados
20
na sequncia mostra o comportamento do NSC medida que aumentamos o nmero de testes realizados.
20
40 Nmero de testes
60
80
FIGURA 2.1:
Comportamento do NSC.
diante deste problema que os MCMs foram formulados, para levar em conta e controlar adequadamente o nvel de signicncia conjunto, isto , garantir que a probabilidade de ao menos uma rejeio falsa no aumente com o nmero de testes envolvidos.
2.
2.2
Conceitos principais
2.2.1
mltiplas, garantindo uma correo simultnea para um conjunto de inferncias e chegar a uma deciso global correta, introduzimos o conceito de famlia, que pode ser denida como qualquer coleo de hipteses que esto submetidas a testes comuns, em que os erros conjuntos so controlados. Por exemplo, num teste laboratorial de amostras de sangue, uma famlia pode ser denida como todos os ensaios realizados em um dia, ou aqueles realizados em um dia por um determinado testador. Por outro lado, os testes realizados pela manh e tarde podem ser considerados como famlias distintas, e assim por diante. Em suma, a escolha dos testes que sero tratados como uma famlia depender da situao (Lehmann & Romano, 2005). Todos os MCMs discutidos neste trabalho so denidos em termos de uma famlia nita de hipteses. Como nosso enfoque no est na realizao de um nmero muito extenso de testes e temos como objetivo chegar a uma deciso nal satisfatria, fundamental que todas as inferncias simultneas sejam corretas, assim necessrio que os MCMs controlem a taxa de erro da famlia de testes (family-wise error rate ), que denotaremos a partir de agora como FWER. Esta taxa representa a probabilidade de cometermos ao menos uma rejeio falsa na famlia. Portanto, uma vez que a famlia de testes foi denida, queremos que FWER
2.2.2
tornou-se o ponto de partida para muitos que utilizam anlise estatstica; e na inferncia simultnea isto no diferente, j que um valor-p fornece informaes acerca se o teste de hiptese signicativo ou no, e ainda indica o quanto signicativo o resultado ,
2.
10
visto que, quanto menor o valor-p maiores as evidncias contra a hiptese nula. Testes estatsticos da interseco de um nmero de hipteses nulas com base em seus valores-p correspondentes so um problema comum na prtica. Por exemplo,
na avaliao da superioridade de uma droga nova em relao a uma droga existente ou placebo, estudos mltiplos so frequentemente utilizados para investigar diferentes aspectos dos efeitos das drogas. Transmitir resultados dos estudos individuais tornou-se uma prtica comum na pesquisa farmacutica. Assim, para obter uma concluso, por
exemplo, se existe ou no ao menos uma dose ou grupo de pacientes para os quais a nova droga mais eciente do que seu concorrente, muitas vezes conveniente utilizar apenas os valores-p correspondentes s comparaes individuais (Sarkar & Chang, 1997). Diante disto, na sequncia relatamos algumas propriedades do valor-p que so fundamentais para a teoria dos MCMs que tratamos neste trabalho. A tomada de deciso em um teste de hiptese baseada no valor de uma certa varivel aleatria
X,
com distribuio
pertencente classe
P = {P , }, H
em que
o parmetro de interesse e
a classe das
hipteses nulas e de
por
H K =P
H K = . x
que
H,
H. ,
estas
Variando valores de
S S
se
<.
(2.1)
Sob essa situao, conseguimos determinar o menor nvel de signicncia, valor-p, denido matematicamente por
p = p(X ) = inf { : X S } .
Lema 2.1
Suponhamos que
tenha distribuio de
probabilidade
para algum
e a hiptese nula
estabelece
H .
Assumimos
2.
11
(i) Se
sup P {X S } ,
H
para todo
0 < < 1,
(2.2)
ento a distribuio de
sobre
satisfaz
P {p u} u
(ii) Se, para
para todo
0 u 1.
H , P {X S } =
para todo
0 < < 1,
(2.3)
ento,
P {p u} = u
ou seja,
para todo
0 u 1;
Demonstrao. (i) Se
H ,
{X Sv },
o que implica em
P {p u} P {X Sv }.
v u+
lim P {p u} lim+ P {X Sv } ,
v u
P { p u } u . {X Su }
implica que
{p u},
temos
P {p u} P {X Su } .
Logo, desde que (2.3) mantida, conclumos que
P {p u} u.
(i)
P {p u} = u.
A maioria dos MCMs que controlam a FWER no sentido forte so denotados a partir dos valores-p, as hipteses geralmente so ordenadas de acordo com seus nveis descritivos e ento estes valores so ajustados (corrigidos). O valor-p ajustado para uma hiptese especca dentro de um conjunto de hipteses o menor nvel de signicncia global em que a hiptese particular seria rejeitada. Um valor-p ajustado poder ser
comparado diretamente com qualquer nvel de signicncia ajustado for menor ou igual a
escolhido:
se o valor-p
2.
12
2.2.3
minando se o teste que parece ser mais signicativo pode ser rejeitado ou no. Se cada teste individual representado por um valor-p, o mtodo descendente descrito da seguinte maneira. Consideramos as constantes
1 2 . . . s .
Sejam
(2.4)
Se
as hipteses
H(1) , . . . , H(r) ,
p1 , . . . , p r ,
so
p(n) < n .
so rejeitadas se
mas
p(r) < r .
Os mtodos de Holm e de Hochberg que veremos adiante so exemplos de procedimentos descendentes e ascendentes, respectivamente.
2.2.4
Mtodos fechados
O mtodo proposto por Holm (1979), bem como o mtodo ainda mais poderoso
dado por Hommel (1988), que veremos na sequncia deste captulo, so baseados no princpio dos testes fechados de Marcus et al. (1976), que segundo Hochberg & Tamhane (1987) podem ser vistos como mtodos gerais para construo de procedimentos de testes descendentes. A verso deste procedimento que daremos a seguir pode ser vista em
2.
13
H1 , . . . , Hn
uma coleo de
HI = {Hi : i I },
para todo
I Q,
Suponhamos
HI
TI . TJ
Para um dado
, HI
rejeitado se cada
HJ
rejeitado ao nvel
pela estatstica
correspondente, em que
J Q
J I. HI
A probabilidade de uma ou mais rejeies falsas quando testamos todas menor ou igual a
as hipteses
Demonstrao. Seja
seja Se
{Hi , i I }
HI = {Hi : i I },
em que
{1, 2, . . . , n}. A
como o
I = . B
Denimos
Hi
rejeitada e
o evento em que
HI
O procedimento de testes fechados rejeita uma hiptese somente se, todas as hipteses que implicam
Hi
verdadeira se, e
Hi ,
em particular
HI ,
so testadas ao nvel
Hi
Assim,
podemos tomar
A = A B,
FWER
ento sob
HI
(2.5)
= P {A} = P {A B } = P {B }P {A|B } . P {B } HI ,
quando
HI
verdadeira.
Como a
(2.5)
se mantm em qualquer
HI ={Hi :
i = 1, 2, . . . , n}.
ao nvel
n1
Hi .
2.
14
Para ilustrar o PTF podemos analisar o diagrama a seguir, em que consideramos as hipteses
H1 , H2 , H3
H4
e tomamos
HI
H1234 H123 , H124 , H134 , H234 , H23 , H24 , H34 , H14 , H13 H12 H1 , H2 , H3 , H4
H1
H2
seja signicante, no rejeitada pelo PTF, pois nem todas interseces so signicantes.
HJ ,
{2} J {1, 2, 3, 4}
Como visto em Wright (1992) o procedimento de teste fechado pode ser modicado de modo a gerar um valor-p ajustado para cada valor-p no ajustado da estatstica se
HI .
pI
TI
para testar
HI .
A hiptese
HI
rejeitada somente
pJ ,
para todo
HJ , pJ .
tal que
J I.
HJ
deve
Hi
seria necessrio conduzir o teste e obter o valor-p no ajustado O nmero total de testes que devem ser
n n i=1 i
= 2n 1.
2.3
Procedimentos de Bonferroni
2.3.1
Bonferroni Clssico
A desigualdade de Bonferroni frequentemente utilizada na realizao de testes
mltiplos a m de denir um limite superior sobre o nvel de signicncia conjunto (Miller, 1981).
T1 , . . . , Tn
um conjunto de
p1 , . . . , p n
2.
15
H0 =
n i=1
Hi
Hi
pi
com
i = 1, . . . , n.
preferidos
Cada
Geralmente, os
so todos iguais a
/n,
O mtodo de Bonferroni controla a FWER. A vericao deste argumento est na sequncia e segue quase que imediatamente da desigualdade de Bonferroni. Consideramos
pi wi
P {p u} u
u (0, 1)
qualquer
P wi .
pi
seja uniforme em
(0, 1)
sempre que
Hi
verdadeira.
Teorema 2.2
Se para cada
i = 1, . . . , n,
as hipteses
Hi
so rejeitadas quando
pi /n, .
H1 , . . . , Hn
Hi
com
iI
|I |
I.
FWER
= P {rejeitar =
iI
qualquer
Hi
com
i I}
iI
P {rejeitar Hi }
P pi n
i I
|I | /n . n
Como vemos, este procedimento clssico controla satisfatoriamente a FWER. Todavia, em algumas situaes bastante conservativo, isto , o valor da FWER real s vezes muito menor que o nvel
estabelecido.
O mtodo de Bonferroni um exemplo de teste de etapa nica que tem como caracterstica marcante o fato de poder ser aplicado em qualquer situao de inferncias simultneas. Contudo, nos mtodos de uma etapa o controle da FWER tem a consequncia de que quanto maior o nmero de hipteses na famlia, menor o poder para testar as hipteses individuais. Procedimentos de etapas mltiplas superam esta desvantagem, e por isso que os MCMs vistos como melhoramentos do mtodo clssico de Bonferroni apresentam mais de uma etapa.
2.
16
2.3.2
como procedimento de Bonferroni de rejeio sequencial ou procedimento de Holm. Este mtodo denido por meio dos valores-p,
p1 , . . . , p n ,
dos
testes individuais.
p(1) , . . . , p(n)
H(1) , . . . , H(n)
Passo 1.
Se
p1 > /n,
as hipteses
H1 , . . . , Hn
no so rejeitadas e o procedimento
termina. Se nvel
p1 /n,
rejeitamos
H(1)
n1
hipteses testadas ao
Passo 2. Se
no rejeitamos
H2 , . . . , Hs
e paramos. Se
p1 /n
H(2)
alm de
H(1)
m2
hipteses ao nvel
Hi
quando
j = 1, . . . , i.
O teorema dado na sequncia mostra que o mtodo de Holm controla a FWER ao nvel
Esta denio de
associaes livres tem o objetivo de salientar que todos os subconjuntos de hipteses nulas poderiam aparecer como conjunto de hipteses verdadeiras. Pode haver situaes em que nem todos os subconjuntos so permitidos por algum motivo, por exemplo, em situaes em que a verdade de duas hipteses implica a verdade ou a falsidade de uma terceira hiptese. importante ser observado que um nvel de signicncia mltiplo
para algumas combinaes restritas impe menos condies no procedimento de teste em relao ao nvel de signicncia mltiplo em associaes livres, ou seja, um procedimento de teste com nvel mltiplo
para
Teorema 2.3 (Lehmann & Romano (2005)). No procedimento de Holm a FWER menor
2.
17
ou igual a
. Hi
com
Demonstrao. Suponha
i I j
Assim,
P wi
i I.
Seja
pj = min pi .
i I
Note que
j n | I | + 1.
min pi / |I |
i I
iI
P {pi / |I |}
i I
/ |I | .
Em quase todas as situaes o procedimento de Holm tem probabilidade estritamente maior de rejeitar uma hiptese falsa em relao ao procedimento clssico de Bonferroni. O ganho de poder obtido usando o procedimento de Holm ao invs O ganho pequeno se todas as
hipteses forem quase verdadeiras, mas pode ser considervel se as hipteses forem completamente falsas (Holm, 1979).
2.4
Mtodo de Simes
Entre os procedimentos vistos como melhoramentos do mtodo clssico de Bonferroni, um dos que recebeu bastante ateno ao longo dos anos e que damos grande importncia neste trabalho foi proposto por Simes (1986). Consideremos um conjunto de
que para cada hiptese individual temos uma estatstica do teste apropriada, tal que os
2.
18
hipteses nulas so
p1 , . . . , p n .
O mtodo formulado
H0 =
n i=1
Hi
a um nvel
H0
se
p(i) i/n
para ao menos um
i,
em que
p(1) , . . . , p(n)
so
Devido regio de rejeio do mtodo de Simes conter a regio de rejeio do mtodo de Bonferroni, este procedimento modicado claramente mais poderoso que o mtodo clssico. Tambm foi observado via simulao em Simes (1986), que esta
melhoria do poder bastante signicante quando as estatsticas dos testes so altamente correlacionadas. Em relao FWER, foi provado que o procedimento modicado mantm o controle a um nvel independentes.
mantm quando as estatsticas so dependentes com algumas distribuies especcas: o valor absoluto da normal multivariada e um certo tipo de distribuio gama multivariada. Sarkar (1998) provou analiticamente que a conjectura de Simes verdadeira para uma classe geral de distribuies multivariadas com dependncia positiva, caracterizada pela condio multivariada totalmente positiva de ordem 2 (MTP2 ), e para algumas misturas de MTP2. A denio e algumas propriedades do conceito MTP2 esto na
sequncia e podem ser vistos detalhados em Karlin & Rinott (1980). Seja
X =
n i=1
Xi
Xi , i = 1, . . . , n,
para qualquer
x, y X ,
es-
x y
funo
f : X [0, )
n = 2)
se
n-dimensional,
densidade MTP2 .
Resultado 2.1.
Se
f1 (x)
f 2 ( x)
so ambas MTP2 em
X,
ento
f1 (x)f2 (x)
MTP2 .
2.
19
Resultado 2.2.
Se
f (x)
MTP2 em
X,
ento
...
f ( x)
i=m+1
dxi
MTP2 em
m i=1
Xi .
Agora, enunciamos de maneira anloga a Sarkar (1998) o teorema que leva prova da conjectura de Simes.
Teorema 2.4.
MTP2 ,
Sejam
X(1) . . . X(n)
e
X = (X1 , . . . , Xn ),
Fi
Xi .
(i) Para
a1 , . . . , an ,
xados
n
P X(1) a1 , . . . , X(n) an
se
1 1 n
Fi (an ),
i=1
(2.6)
Fi (aj )/j
no decrescente em
j = 1, . . . , n
para todo
i = 1, . . . , n.
(ii) Para
b1 , . . . , bn ,
xados
n
P X(1) b1 , . . . , X(n) bn
se
1 n
Fi (a1 ),
i=1
(2.7)
i (bnj +1 )/j F
no decrescente em
j = 1, . . . , n
para todo
i = 1, . . . , n,
em que
(x) = F
1 F (x).
Observao 2.1.
e que, para cada
Xi, s
i = 1, . . . , n ,
o valor-p aleatrio
pi
correspondente a
Hi
baseado em
um teste unilateral esquerda ou direita em para um teste unilateral esquerda e como termos de
Xi .
Desde que
pi
denido como
F (Xi )
(Xi ) F
pi ,
as desigualdades
(2.6)
(2.7)
so equivalentes a
P p(i) ci , i = 1, . . . , n 1 cn ,
em que
so tais que
ci /i
no decrescente em
i = 1, . . . , n.
Denindo
i,
2.
20
Karlin & Rinott (1980) deram uma lista de distribuies que satisfazem a condio
(MTP2 )
distribuies que satisfazem uma outra condio que pode ser vista em Sarkar & Chang (1997). Esta condio ser a chave para mostrar que o mtodo de Simes controla a FWER quando a estatstica envolvida nos testes a log-rank. Vamos descrever essas distribuies em termos das estatsticas dos testes, Sejam
X1 , . . . , X n .
X1 , . . . , X n ,
Z,
com
Xi |Z = z f (xi , z ), i = 1, . . . , n, Z.
A densidade conjunta de
em que
f ( xi , z )
TP2 em
(xi , y ),
g (z )
a densidade de
X1 , . . . , X n
f (xi , z )g (z )dz,
i=1
(2.8)
(2.1
2.2).
Sarkar & Chang (1997) provaram que o mtodo de Simes controla a FWER quando as estatsticas tm densidade conjunta da forma
(2.8).
aparecem muitas vezes em testes mltiplos. Por exemplo, a distribuio normal padro multivariada equicorrelacionada, o valor absoluto da
multivariada central, a
mul-
tivariada central e o valor absoluto da normal padro multivariada equicorrelacionada. Este ltimo exemplo est detalhado adiante, mas para entend-lo precisamos da prxima observao que pode ser vista em Curnow & Dunnett (1962).
Observao 2.2.
conjunta por
Sejam
X1 , . . . , X n , n ij ,
coecientes de correlao
f (t1 , . . . , tn ).
todo
i}
(2.9)
...
(2.9)
ij = i j ,
para
i=j
1 n+1
i 1.
Xi 's
2.
21
Y1 , . . . , Yn , Z,
de modo que
Xi = (1 )1/2 Yi + 1/2 Z
(2.10)
ij = > 0, i =
temos a estrutura
de correlao anterior satisfeita, uma vez que esta ocorre quando como os
Dessa forma,
temos que
Fn (xi , {}) =
P
n
Yi <
f (z )dz
(2.11)
=
i=1
(z )dz,
em que
()
()
N (0, 1).
Assim, a
densidade conjunta de
{ Xi }
i=1
1 (1 )1/2
xi 1/2 z (1 )1/2
(z )dz.
(2.12)
Exemplo 2.1
quando as estatsticas dos testes tm esta distribuio. Primeiramente suponha que temos independentes com
n+1
N (i , 2 ),
com mdia
2,
i = 1, . . . , n.
H : n H 0 i=1 i H 0 : n i=1 Hi
em que,
N (0 , 2 )
e amostras de tamanho
m1
n populaes.
2.
22
Hi
contra
i H m0 m1 (m0 + m1 )
1/2
i X 0 ) (X Xi =
para
, i = 0, . . . , n.
(2.13)
i = 1, . . . , n,
em que
i X
A distribuio
H0
= m1 /(m1 + m0 ).
para mostrar que a densidade de probabilidade tem a forma essa distribuio depende de perda de generalidade que
(2.8).
{Xi }
como
como em
(2.10),
Y0 = z , Xi2, s
so i.i.d
(1 )12
em que
z 2 1
, m
graus de
2 m ()
, e Y02 2 1
grau de liberdade.
valor absoluto da normal multivariada equicorrelacionada com mdia zero, varincia um e correlao
0
com de
i=1
2xi f 1
x2 z i , 1 1 12 ()
em
, x
e
g (z )dz g (z )
(2.14)
f (x, )
em
representando a densidade
2 1
z.
f (x, ),
com
x, 0,
(x, )
(Karlin,
que quando as estatsticas do teste tm como distribuio o valor absoluto da normal multivariada equicorrelacionada, a conjectura de Simes vlida.
2.5
Nesta seo enunciamos os mtodos propostos por Hochberg (1988), Hommel (1988) e Rom (2013) que podem ser vistos como extenses do mtodo de Simes para realizar inferncias em hipteses individuais uma vez que a hiptese global
H0
rejeitada.
2.
23
2.5.1
Mtodo de Hochberg
O procedimento de etapas mltiplas proposto por Hochberg (1988) pode ser inter-
pretado como uma verso do tipo ascendente do procedimento de Bonferroni. Enquanto o procedimento de Holm inicia o teste analisando o menor valor-p, o mtodo de Hochberg inicia o teste observando o valor-p menos signicativo. Este mtodo fundamentado
no princpio dos testes fechados (Marcus et al., 1976), o que intensica o controle da FWER no sentido forte. Deve ser assumido neste procedimento que a coleo de hipteses satisfaa a condio de combinaes livres (Seo 2.3.2). Sejam teses
p(1) , . . . , p(n) ,
os valores-p ordenados de
H1 , . . . , Hn .
Passo 1.
Se
p(n) ,
Hi
com
i = 1, . . . , n
so rejeitadas e
2.
Passo 2. Se
. . . Passo
n.
Se
p(1) /n,
rejeitamos
Hi , i = 1,
e paramos.
Em diversas situaes o mtodo de Hochberg mais poderoso em relao ao mtodo de Holm. Contudo, por se tratar de uma extenso do mtodo de Simes, para
garantir o controle efetivo da FWER as estatsticas dos testes precisam ser independentes ou terem distribuio MTP2 (ou certas misturas de MTP2 ).
2.5.2
Mtodo de Hommel
O procedimento proposto por Hommel (1988) testa as hipteses individuais
Hi
TI
mtodo so mais trabalhosos em relao ao mtodo de Hochberg, porm o procedimento de testes fechados no precisa ser feito por completo. (1989) mostrou que o seguinte caminho suciente. Para algum
xado, Hommel
Seja
o nmero de hipteses no
2.
24
para todo
k = 1, . . . , i}, Hi
Hi (i = 1, . . . , n)
pi /j . HI
distribuio MTP2 (ou certas misturas delas). O clculo dos valores-p ajustados para o procedimento de Hommel mais simples de entender referindo-se diretamente ao procedimento de testes fechados, que quando realizado completamente exigiria que, para cada hiptese
Hi ,
Hi .
por Hommel ento o maior desses valores-p do teste de Simes. necessrio testar cada subconjunto. Para subconjuntos contendo
hipteses,
(m 1)
valores-p alm de
pi .
m que contm
Hi .
contendo
Hi .
Na sequncia ilustramos o algoritmo extrado de Wright (1992) que calcula o valor-p ajustado pelo mtodo de Hommel. Seja
p(i)
b(i)
bi = p i
para todo
i;
cmin .
bi < cmin ,
ento temos
bi = cmin .
i (n m),
2.
25
ci = min(cmin , mpi ).
ento temos
bi < ci ,
bi = ci .
2.5.3
Mtodo de Rom
O recente mtodo proposto por Rom (2013) uma modicao simples do mtodo
de Hochberg para realizar inferncias sob as hipteses individuais. Consideramos o problema clssico de testar com
hipteses individuais,
H1 , . . . , Hn ,
p1 , . . . , p n ,
condio de combinaes livres dada por Holm (1979) (Seo 2.3.2) e que os valores-p correspondentes sejam independentes. Sejam
p(1) , . . . , p(n)
Passo 1. Se
p(n) ,
Hn
retida
Passo 2. Se
p(n1) 3/2, qualquer hiptese com valor-p menor ou igual a /2 rejeitada; H(n1)
retida e seguimos para o Passo 3.
caso contrrio,
Passo 3. Se
p(n2) 4/6, qualquer hiptese com valor-p menor ou igual a /3 rejeitada, H(n2)
retida e seguimos para o prximo passo, de acordo com o nvel
Ci = (i + 1)/(2i),
Passo n.
com
i = 2, . . . , n.
p(1)
comparado com
/n.
Rom (2013) mostrou atravs do princpio dos testes fechados que seu procedimento controla a FWER no sentido forte. Via simulao, foi vericado ainda que este
procedimento tem uma ganho de poder maior em relao ao mtodo de Hochberg e se comporta de maneira menos conservativa.
log-rank e
3.1
Introduo
Anlises estatsticas para dados discretos tm grande importncia em diversas reas tais como economia, medicina, educao e engenharia. Por exemplo, em economia do trabalho, quando queremos analisar a durao do desemprego, os dados disponveis esto em meses completos ou em dias, e assim, a varivel resposta um valor inteiro. Na rea de nanas, a durao de uma srie de retornos positivos usualmente analisada por perodos inteiros, como
ou
evaso e o tempo de concluso de um curso de graduao so medidos em semestres. Quando observamos dados ao longo do tempo, uma situao frequente a ocorrncia de alguns dados somente em determinados perodos, isto , sujeitos censura. Para ilustramos isto, uma situao geral de censura direita pode ser descrita se considerarmos
p p W1 , . . . , Wn p
np
itens em
p = 1, . . . , J .
Seja
hp
n
a funo intensidade da
p-sima
populao.
p {Wm }mp=1
26
3.
27
p {Cm }mp=1 .
p Cm ,
tambm
p Wm .
p p p }, , Cm = min{Wm Xm
com
p p = Wmp }, =1 1 { Xm m
p m
indicando se a varivel
p Wm
censurada ou no.
Em um grande nmero de aplicaes de extrema importncia testar a homogeneidade de populaes na presena de censura. O problema est no desenvolvimento de mtodos no paramtricos para testar a hiptese nula
H0 = h1 ( ) = . . . = hJ ( );
em que
X,
o domnio que codica, por exemplo, o tempo de vida em um problema O teste precisa ser consistente para uma grande classe de
Diante disto, realizamos neste trabalho os testes com as estatsticas log-rank e Cramr-von Mises. Esta escolha est fundamentada no fato de que a estatstica log-rank um dos mtodos no paramtricos mais utilizados para testar
H0
Contudo, esta estatstica apresenta a desvantagem de no exibir um poder ao lidar com funes intensidades no proporcionais. Dessa forma, executamos tambm testes com
a estatstica Cramr-von Mises, que como pode ser visto em Leo & Ohashi (2011), considerada ideal para modelos puramente discretos sob censura.
3.2
Introduzimos nesta seo a notao bsica e alguns fundamentos de inferncia para o modelo discreto com censura utilizado neste trabalho. Maiores detalhes deste
assunto podem ser vistos em Fleming & Harrington (1991) e em Leo & Ohashi (2011). Consideramos naturais. Seja
(, F , P)
um espao de probabilidade e
i = P[Y = i]
(Y )
na
i-sima
i=0
i = 1.
3.
28
N,
J 1
e escrevemos
J = {1, . . . , J }. nq
Denotamos
n := (n1 , . . . , nJ ) NJ
NJ :=
max{n1 , . . . , nJ }.
populao, com e
Denimos como
q J.
Para um dado
p J,
seja
(W p , C p )
Wp
Cp
e
respectivamente e seja
Xp
X p := W p C p = min{W p , C p }.
Para qualquer populao
p J,
p p p p )} , Cn {(W1 , C1 ), . . . , (Wn p p
da
(W p , C p ),
tal que
1 np < .
P[C p = 0] = P[W p =
0] = 0
para qualquer
p J.
p p p Xm := min{Wm , Cm },
p p Vm (i) := 1 1{Xm i}
e o processos de contagem
para
m = 1, . . . , np
i 0.
p-sima
amostra
np
np p Rm (i)
e
np C,p Rm (i),
e
R (i) :=
m=1
np
C,np
(i) :=
m=1
np
(i) :=
m=1
p Vm (i);
i 0.
Nesta congurao discreta, pode ser visto em Leo & Ohashi (2011) que a funo intensidade
hp
e o estimador de Kaplan-Meier
np h
hp (j ) :=
P[W p = j ] , P[W p j ]
j 0,
3.
29
3.3
3.3.1
Estatstica log-rank
Nesta seo vamos estender a estatstica log-rank ponderada proposta por Fle-
(i) :=
k=1
V nk (i);
i 0,
i,
e para um certo
(q, q1 ) J 2
1,
denotamos
nq Un (n q1
, ) :=
1 n
1/2
u(n , )
V nq ( )V nq1 ( ) Vn ( )
(3.1)
u(n ; )
dade para um valor real de uma funo limitada e satisfaz certos pressupostos de mensurabilidade (Leo & Ohashi, 2011). Exemplos concretos de pesos so os processos ponderados de Harrington & Fleming (1982) e Tarone & Ware (1977) dados respectivamente por
Vn ( ) n
R( 1) V n ( 1)
j =0
Rn (j ) 1 V n (j ) (, ) (3.1)
, n NJ , 1,
de modo que
K.
q J,
denimos
Aq := {(x, y ) J J ; x = y, x =
q, q = q, 1 x < y J }
Para
e para
k = r,
denimos
n NJ
1,
seja
(n , ) Q
(n , )]rk := [Q
2 ( ), k,n
se se
k=r k = r,
n (k, r, ),
3.
30
em que
q 2 |Unqq1 (n , )|2 nq nq1 ( )] + |Unq1 (n , )| h nq ( )[1 h nq ( )] 1 ( )[1 h h V nq1 ( ) V nq ( )
2 ( ) := q,n
q1 =q
+ 2
(q1 ,q2 )Aq
e
n (k, r, ) :=
q2 =r
nk nr Un (n , )Un (n , ) q1 q1 q1 A(k,r) nk (n Un q1 q1 =k
nq1
( )
q1 ( )] q1 ( )[1 h h
nr (n , ) , )Un k
V nk ( )
nk nr (n , ) (n , )Un Un r q2
V nr ( )
se
r=k
em
J.
du = sup
: min q ( ) > 0 ,
q J
(3.2)
du n = sup
Podemos vericar que e
: min V nq ( ) > 0 , n NJ .
q J
(3.3)
u du n d
em probabilidade com Se
n ,
tal que
1 du
du n
para cada
n NJ .
q J,
ponderada proposta por Fleming & Harrington (1991) podemos introduzir a seguinte estatstica linear geral para
J -amostras.
j nq nq ( ) h nq1 ( )] Un (n , )[h q1 =1 q1 =q j 1/2
LRq (n , j ) := 1 n
=
=1
u(n , )V
nq
Rnq ( ) Rn ( ) . ( ) V nq ( ) Vn ( ) K.
Sob
Proposio 3.1.
Assumimos que
pertence classe
H0 ,
o vetor aleatrio
(3.4)
3.
31
n , du ), tal que a matriz de covarincia (du ) pode ser estimada com consistncia por ( n
em que
i
n , i) := (
=1
(n , ), i 1. Q
LR
(3.4)
nula.
LR
sequncia
(3.5)
LR0
da seguinte
u T u 1 u J X 2 (n , du n ) := LR0 (n , dn ) 0 (n , dn ) LR0 (n , dn ), n N ,
(3.6)
em que
0 (n , )
dado por
n , ) (
(3.6)
J 1
graus de
1 n , du ( n )
LRq (i) =
=1 q1 =q
nq nq ( ) h nq1 ( ) = Un (n , ) h q1
i nq Un q1 =1 q1 =q
3.3.2
MTP2 . Alguns conceitos e resultados empregados na demonstrao podem ser encontrados no Apndice A.
3.
32
J 1
populaes com
Hq : hq ( ) = hJ ( ),
e para qualquer
q = 1, . . . , J 1.
X nq (i) =
=1
, q = 1, . . . , J 1,
2 =1 q ( )
com
X nq (i)
tem
como distribuio assinttica o valor absoluto de uma normal padro. Suponhamos que as vveis assintticos,
p1 , . . . , pJ 1 ,
Teorema 3.1.
1, . . . , J 1}
H0 ,
Demonstrao. De acordo com o Exemplo 2.1, suciente mostrar que o vetor aleatrio
{X nq (i) : q = 1, . . . , J 1}
tem como distribuio assinttica o valor absoluto de uma Para isto, aplicamos alguns argumentos que Consideramos agora o
n nq m,q ( ) = Un (n , ) J
q = 1, . . . , J 1,
e para qualquer
a RJ 1 , 0
and
n n n m ( ) = a1 m, 1 ( ) + . . . + aJ 1 m,J 1 ( ),
m = 1, . . . NJ .
3.
33
NJ m=1
n n E | m ( ) |2 | Gm 1 = NJ
J 1 NJ k=1 m=1
n n | ak |2 E | m,k ( ) |2 | Gm 1 +
2
1r<kJ 1 m=1
Sabemos ainda que
n n n ( ) | Gm ( )m,k ar ak E m,r 1 = T1 (n , ) + T2 (n , ),
1.
J 1
T1 (n , )
k=1
1. ar ak
T2 (n , ) = 2
1r<kJ 1
nr nk Un ( )Un ( ) nJ J J nJ ( ) h ( ) 1h n J V ( )
em probabilidade.
2
1r<kJ 1
Se considerarmos os processos ponderados de Tarone e Ware ou de Harrington e Fleming, podemos concluir de algumas expresses dadas no Apndice (equaes A.3, A.4 e A.8) que, sob
H0 ,
as constantes
q J q,J ( ) = q,J ( ) = ( )
k,r J ( ) = ( )
para todo
so independentes
k, r, J .
Assim, sob
H0 : h1 ( ), . . . , hJ ( ) = h( ),
= 1, . . . , i,
o vetor
NJ n m=1 m,q (
) : q = 1, . . . , J 1} (i) =
k=1
dado por
operador de covarincia
J 1
(i), a
J 1
2
J 1
ar ak ( )h( ) [1 h( )] .
Desde que
1}
tem como distribuio assinttica o valor absoluto de uma normal multivariada com
coeciente de correlao
3.
34
3.3.3
Xp
Consideramos aqui as primeiras categorias observadas pela seguinte sequncia de tempos de parada
(3.7)
Rn (i) :=
J k=1
Rnk (i)
i.
dn d
em probabilidade com
tal que
(3.8)
du n
J 1
CV M (n
, dn , du n
) :=
k=dn q =1
2 (k )LR2 (n , k ), (q,n) q
n NJ .
(3.9)
H0
tal que, e
q (i) = 0
para cada
p J.
du
pelas sequncias de quadrado somvel de nmeros reais. para possivelmente innitas categorias
(3.9)
(du )
Y0 (d , du ) :
e autovalores
{sq ; s 1, q = 1, . . . , J 1}
J 1
sq < .
s=1 q =1
A distribuio assinttica desta estatstica no livre de distribuio devido presena inerente de saltos persistentes sobre
N.
Na verdade, depende de
{sq ; s 1, q =
1, . . . , J 1},
que por sua vez depende dos dados. A m de proporcionar um teste vivel,
3.
35
L(dn , du n ) =
{dl n n NJ
n du n ; R ( ) > 0}
e
L(n ).
Para um dado
, denimos
u 0 (dl Y n , dn )a
como uma sequncia real, em que as
(J 1)L(n )-simas
0 (d , du ) Y n n
R(J 1)L(n
a seguir
0 (d , du )a, a Y n n
=
j L(dn ,du ) n
0 (j ) 0 (j )M 0 (j )aj , aj M
RJ 1
+
{ <j : ,j L(dn ,du n )}
0 (j ) 0 (j )M 0 (j )aj , aj M 0 (j ) 0 (j )M 0 (j )aj , aj M
{j< : ,j L(dn ,du n )}
RJ 1
RJ 1 ,
em que
. Portanto,
0 (d , du ) : Y n n
Teorema 3.2.
tivamente por classe
Sejam
(d , du , dn , du n )
K.
Ento, sob
CV M (n
, dn , du n
)
s=1 q =1
sq 2 sq
em distribuio com
n ,
tal que
{sq ; s 1, q = 1, . . . , J 1}
Se
Y0 (d , du ).
Xq
qJ
temos que
J 1 2 1A(n ) sq sq 1
(n ) :=
s=1 q =1
sq 2 sq ,
s=1 q =1
(3.10)
em distribuio com
n ,
em que
{ sq ; s s L(n ), q = 1, . . . , J 1}
so os
3.
36
0 (d , du ) Y n n
0 (d , du ) A(n ) := {Y n n
de modo que
no negativo},
P(A(n )) 1
com
n . p
para testar a hiptese
H0
dado por
P[(n ) >
CV M (n , dn , du n )|H0 ].
A lei de aproximao
(n )
aleatrias independentes e portanto, h algoritmos disponveis para avaliar o valor-p que podem ser vistos em Duchesne & Lafaye De Micheaux (2010).
= 0, 05.
Para averiguar o controle da FWER dos cinco MCMs escolhidos foram considerados nas simulaes diferentes tamanhos de amostras (TA): e
300.
a primeira utilizada como referncia (controle), resultando em nove hipteses a serem testadas simultaneamente. A m de detectar minunciosamente as diferenas de comportamento entre os procedimentos de Bonferroni, Holm, Hochberg e Rom, avaliamos o poder de duas maneiras distintas. Na primeira estimativa do poder foram geradas
10
populaes de distribuio
37
4.
Estudo de simulao
38
vamente
X (1) , . . . , X (9) P ()
e
X (10) P ( + )
X (1) , . . . , X (9) E ()
em que
X (10) E ( + ),
iniciou com algum valor maior que zero e foi sendo incrementado at o poder
100%.
A segunda estimativa do poder foi calculada por meio da razo entre o nmero de diferenas signicativas detectadas pelo MCM e o nmero total de inferncias. Consideramos os casos em que foram testadas
3, 5
10
situao criamos todas as conguraes de hipteses falsas, ou seja, quando testamos hipteses, analisamos os casos de para os testes que envolveram
10
hipteses.
Na primeira seo deste captulo expomos as anlises realizadas com dados discretos e na segunda seo est apresentado o estudo feito com dados contnuos.
4.1
Dados discretos
Para os estudos de simulaes realizados com dados discretos foram geradas amostras aleatrias de distribuio Poisson e trs cenrios distintos em relao censura foram analisados: no primeiro caso aproximadamente no segundo caso
40%
20%
4.1.1
Controle da FWER
Uma vez que dados discretos empregados nas estatsticas log-rank e Cramr-
von Mises no necessita de um tempo computacional muito grande, xamos o nmero de iteraes em
100.000
comportamento entre os MCMs em relao ao controle da FWER. Em cada caso geramos uma amostra aleatria de
10
4.
Estudo de simulao
39
Criamos dos
11 (40%
13 (20%
Os valores e o comportamento da FWER em funo dos diferentes tamanhos de amostras (TA) das cinco estratgias de comparaes mltiplas empregadas nos testes das estatsticas log-rank e Cramr-von Mises dos trs cenrios de censura escolhidos esto ilustrados na sequncia atravs das Tabelas e
4.1, 4.2
4.3
4.1, 4.2
4.3.
FWER dos
TABELA 4.1:
11.
TA=250 0,04799 0,04799 0,04801 0,04823 0,04902 TA=300 0,04902 0,04902 0,04903 0,04928 0,05001
log-rank
TA=150 0,04799 0,04799 0,04801 0,04822 0,04904 TA=200 0,04832 0,04832 0,04834 0,04857 0,04926
Estatstica Cramr-von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,05093 0,05093 0,05096 0,05122 0,05206 TA=50 0,04917 0,04917 0,04918 0,04949 0,05044 TA=100 0,04941 0,04941 0,04943 0,04967 0,05046 TA=150 0,04736 0,04736 0,04736 0,04766 0,04853 TA=200 0,04985 0,04985 0,04985 0,05015 0,05097 TA=250 0,04880 0,04880 0,04881 0,04903 0,05078 TA=300 0,04951 0,04951 0,04952 0,04981 0,05065
Logrank
Cramrvon Mises
0.054
0.054
Bonf
Bonf
q
0.052
Rom
0.052
Rom
FWER
FWER
0.050
0.050
q q
q q q q
0.048
q q q q
q q
0.048
0.046
50
100
150
200
250
300
0.046
50
100
150
200
250
300
Tamanho da amostra
Tamanho da amostra
11.
4.
Estudo de simulao
40
TABELA 4.2:
FWER dos
13.
TA=250 0,04902 0,04902 0,04902 0,04921 0,05008 TA=300 0,04964 0,04964 0,04965 0,04989 0,05002
log-rank
TA=150 0,04993 0,04993 0,04994 0,05113 0,05021 TA=200 0,04970 0,04970 0,04975 0,05003 0,05100
Estatstica Cramr von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,05021 0,05021 0,05025 0,05051 0,05159 TA=50 0,05099 0,05099 0,05103 0,05127 0,05220 TA=100 0,04872 0,04872 0,04877 0,04907 0,05013 TA=150 0,04984 0,04984 0,04984 0,05004 0,05089 TA=200 0,04826 0,04286 0,04829 0,04855 0,04936 TA=250 0,04884 0,04884 0,04885 0,04910 0,04988 TA=300 0,04858 0,04858 0,04859 0,04884 0,04955
Logrank
Cramrvon Mises
0.056
0.054
Bonf
q
Bonf
q
0.054
0.052
Rom
0.052
FWER
FWER
0.050
q q
q q
0.050
q q q q q q q
0.048
0.048
0.046
50
100
150
200
250
300
0.046
50
100
150
200
250
300
Tamanho da amostra
Tamanho da amostra
13.
4.
Estudo de simulao
41
TABELA 4.3:
FWER dos
log-rank
TA=150 0,04924 0,04924 0,04925 0,04948 0,05013 TA=200 0,04902 0,04902 0,04903 0,04918 0,04984 TA=250 0,04845 0,04845 0,04845 0,04865 0,04942 TA=300 0,04840 0,04840 0,04842 0,04864 0,04946
Estatstica Cramr von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04744 0,04744 0,04746 0,04778 0,04875 TA=50 0,04929 0,04929 0,04933 0,04962 0,05042 TA=100 0,05006 0,05006 0,05007 0,05034 0,05126 TA=150 0,04840 0,04840 0,04842 0,04862 0,04937 TA=200 0,04855 0,04855 0,04856 0,04887 0,04956 TA=250 0,04871 0,04871 0,04876 0,04897 0,04984 TA=300 0,04851 0,04851 0,04855 0,04878 0,04953
Logrank
Cramrvon Mises
0.054
0.054
Bonf
Bonf
q
0.052
Rom
0.052
Rom
FWER
FWER
0.050
0.050
q q
0.048
0.048
q q q
q q
0.046
50
100
150
200
250
300
0.046
50
100
150
200
250
300
Tamanho da amostra
Tamanho da amostra
cenrios de censura trabalhados nos testes das duas estatsticas envolvidas, o procedimento de Rom apresentou os maiores valores para a FWER, que por um lado bom, pois rearma o fato argumentado em Rom (2013) de que este mtodo pouco conservativo; porm em certos casos de amostras pequenas ele apresentou uma taxa de erro elevada com respeito aos demais procedimentos. No cenrio de censura igual a (Figura
11,
que equivale a
40%
4.1),
4.
Estudo de simulao
42
5%
com TA igual a
300.
J no
emprego da estatstica Cramr-von Mises, observamos maiores alteraes, principalmente com amostras de tamanho em relao s demais. Pela Figura para TA
4.2,
13,
30
50
o valor prximo a
5%
4.3)
para TA pequenas. J no teste da estatstica de Cramr-von Mises os valores pequenos para FWER s ocorrem para TA nvel nominal adotado.
30,
5%,
4.1.2
10000
100
de
10
X (10) P (10 + ),
e
assumiu os valores
0, 3; 0, 5; 1; 1, 5; 2; 2, 5; 3; 3, 5; 4; 4, 5
5.
Nas Tabelas
As Figuras
4.4, 4.5
4.6
funo poder dos cinco MCMs empregados nas estatsticas log-rank e Cramr-von Mises.
4.
Estudo de simulao
43
censura xada em
log-rank
Hochberg 0,0136 0,0309 0,1561 0,4264 0,7026 0,9018 0,9705 0,9950 0,9990 0,9998 1,0000
11.
Rom 0,0574 0,0776 0,1980 0,4561 0,7196 0,9081 0,9723 0,9952 0,9991 0,9998 1,0000
Estatstica
Bonferroni 0,0136 0,0308 0,1557 0,4256 0,7015 0,9015 0,9704 0,9950 0,9990 0,9998 1,0000
Holm 0,0136 0,0308 0,1560 0,4264 0,7024 0,9017 0,9705 0,9950 0,9990 0,9998 1,0000
Hommel 0,0136 0,0311 0,1565 0,4267 0,7039 0,9021 0,9706 0,9950 0,9991 0,9998 1,0000
Bonferroni 0,0145 0,0376 0,1920 0,4944 0,7922 0,9015 0,9900 0,9982 0,9999 1,0000 1,0000
Holm 0,0146 0,0376 0,1924 0,4950 0,7930 0,9017 0,9901 0,9982 0,9999 1,0000 1,0000
Hochberg 0,0146 0,0376 0,1925 0,4950 0,7931 0,9018 0,9901 0,9982 0,9999 1,0000 1,0000
Hommel 0,0147 0,0377 0,1930 0,4957 0,7939 0,9021 0,9901 0,9982 0,9999 1,0000 1,0000
Rom 0,0580 0,0825 0,2312 0,5213 0,8040 0,9081 0,9910 0,9984 0,9999 1,0000 1,0000
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
q
q
q
q
0.8
0.8
q
q
q
q
0.6
Poder do teste
Poder
0.6
q
q
0.4
Bonf
q
0.4
q
q
Bonf
q
0.2
0.2
q
q
q
q
0.0
0.0
q q
q q
q
q
q
q
FIGURA 4.4: Grcos da funo poder dos 5 MCMs com censura xada em 11.
4.
Estudo de simulao
44
censura xada em
log-rank
Hochberg 0,0159 0,0438 0,2094 0,5416 0,8292 0,9676 0,9966 0,9997 1,0000
13.
Rom 0,0650 0,0851 0,2493 0,5672 0,8386 0,9697 0,9968 0,9997 1,0000
Estatstica
Bonferroni 0,0158 0,0436 0,2087 0,5409 0,8288 0,9675 0,9966 0,9997 1,0000
Holm 0,0159 0,0437 0,2094 0,5416 0,8291 0,9676 0,9966 0,9997 1,0000
Hommel 0,0159 0,0439 0,2098 0,5423 0,8297 0,9676 0,9967 0,9997 1,0000
Bonferroni 0,0170 0,0439 0,2254 0,5754 0,8668 0,9781 0,9985 0,9999 1,0000
Holm 0,0170 0,0441 0,2259 0,5764 0,8673 0,9782 0,9985 0,9999 1,0000
Hochberg 0,0170 0,0441 0,2260 0,5764 0,8673 0,9783 0,9985 0,9999 1,0000
Hommel 0,0170 0,0443 0,2263 0,5767 0,8675 0,9785 0,9985 0,9999 1,0000
Rom 0,0617 0,0906 0,2655 0,5991 0,8743 0,9796 0,9985 0,9999 1,0000
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
0.8
0.6
Poder do teste
Poder do teste
0.6
0.8
q
q
q
q
q
q
0.4
Bonf
q
0.4
Bonf
q
0.2
0.2
q
q
0.0
0.0
q
q
q
q
q
q
q
q
FIGURA 4.5: Grcos da funo poder dos 5 MCMs com censura xada em 13.
4.
Estudo de simulao
45
Estatstica
Bonferroni 0,0159 0,0378 0,2410 0,6141 0,8951 0,9870 0,9990 1,0000 1,0000
Holm 0,0162 0,0379 0,2414 0,6144 0,8954 0,9870 0,9990 1,0000 1,0000
Bonferroni 0,0170 0,0430 0,2392 0,6290 0,9057 0,9889 0,9995 0,9999 1,0000
Holm 0,0170 0,0432 0,2397 0,6297 0,9060 0,9889 0,9996 0,9999 1,0000
Hochberg 0,0170 0,0432 0,2398 0,6299 0,9060 0,9889 0,9996 0,9999 1,0000
Hommel 0,0170 0,0433 0,2403 0,6311 0,9065 0,9889 0,9996 0,9999 1,0000
Rom 0,0600 0,0873 0,2800 0,6491 0,9117 0,9897 0,9997 0,9999 1,0000
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
q
q
0.8
0.8
0.6
Poder
0.4
Poder
Bonf
q
0.4
0.6
q
q
Bonf
q
0.2
0.2
q
q
q
q
0.0
0.0
q
q
q
q
q
q
q
q
FIGURA 4.6: Grcos da funo poder dos 5 MCMs com dados sem censura.
Pelas Figuras
4.4, 4.5
4.6
Holm, Hochberg, Hommel e Rom apresentam praticamente o mesmo poder, exceto para valores bem pequenos de
4.
Estudo de simulao
46
11 (Tabela 4.4),
1 quando
assumiu os valores
igual a
100%
com
= 3, 5
na estatstica log-rank e
=4
A segunda avaliao do poder foi tambm realizada nos trs cenrios de censura escolhidos. Mantivemos o nmero de iteraes em
10000 4, 6
100.
11
populaes de distribuio
Poisson e sempre a primeira populao foi tomada como referncia. As expresses dadas na sequncia ilustram a maneira como foram geradas as hipteses variando o nmero de hipteses falsas:
X (4) P ( + ),
X (3) , X (4) P ( + ),
= 10 5
e
= 2.
10
testes simultneos.
As Tabelas
4.12
cinco MCMs empregados nas estatsticas log-rank e Cramr-von Mises para as diferentes conguraes de censura adotadas. Nas Figuras
4.12 3, 5
esto e
ilustrados o comportamento do poder das estratgias quando foram testadas hipteses em funo do nmero de hipteses falsas.
10
4.
Estudo de simulao
47
TABELA 4.7:
Poder dos
11.
Estratgia Holm 0,2944 0,5867 0,9013 0,1641 0,3271 0,5014 0,6865 0,8922 0,0751 0,1459 0,2190 0,2945 0,3731 0,4572 0,5400 0,6336 0,7334 0,8505 Hochberg 0,2956 0,5893 0,9067 0,1642 0,3277 0,5040 0,6918 0,9023 0,0751 0,1459 0,2190 0,2948 0,3739 0,4585 0,5433 0,6387 0,7427 0,8738 Hommel 0,2959 0,5898 0,9069 0,1646 0,3286 0,5061 0,6944 0,9029 0,0753 0,1463 0,2199 0,2965 0,3766 0,4626 0,5494 0,6470 0,7518 0,8789 Rom 0,2962 0,5900 0,9070 0,1650 0,3294 0,5070 0,6953 0,9032 0,0756 0,1471 0,2213 0,2989 0,3796 0,4668 0,5544 0,6517 0,7558 0,8808
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
0.8
0.8
0.8
q q q
q q
0.6
0.6
q q
0.6
Poder
Poder
q q
Poder
0.4
0.4
0.4
q q
q q
q q
q q
0.2
0.2
q q
0.2
q q
q q
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.7:
11.
4.
Estudo de simulao
48
5 MCMs empregados na estatstica Cramr-von Mises em funo falsas, censura xada em 11.
Estratgia Bonferroni 0,3057 0,5958 0,8873 0,1792 0,3459 0,5149 0,6805 0,8475 0,0836 0,1602 0,2382 0,3171 0,3937 0,4728 0,5502 0,6288 0,7077 0,7840 Holm 0,3118 0,6225 0,9439 0,1812 0,3559 0,5409 0,7354 0,9371 0,0841 0,1628 0,2449 0,3296 0,4148 0,5057 0,5984 0,6988 0,8050 0,9195 Hochberg 0,3125 0,6253 0,9467 0,1814 0,3566 0,5427 0,7384 0,9425 0,0841 0,1628 0,2450 0,3298 0,4151 0,5068 0,6001 0,7025 0,8118 0,9330 Hommel 0,3128 0,6257 0,9467 0,1816 0,3574 0,5440 0,7394 0,9427 0,0842 0,1631 0,2457 0,3309 0,4168 0,5093 0,6036 0,7072 0,8161 0,9349 Rom 0,3129 0,6259 0,9468 0,1820 0,3580 0,5446 0,7398 0,9428 0,0845 0,1638 0,2467 0,3324 0,4189 0,5120 0,6062 0,7096 0,8178 0,9355
1 2 3 4 5
10
1 2 3 4 5 6 7 8 9 10
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
0.8
0.8
0.8
q q
0.6
0.6
0.6
q
q
q q
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q
q q q
0.2
0.2
0.2
q q
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.8:
11.
4.
Estudo de simulao
49
TABELA 4.9:
Nmero de hipteses 3
Poder dos
13.
Estratgia Holm 0,3230 0,6424 0,9630 0,18478 0,36756 0,5583 0,7557 0,9551 0,0883 0,1722 0,2591 0,3458 0,4361 0,5280 0,6268 0,7244 0,8334 0,9466 Hochberg 0,3237 0,6436 0,9650 0,18486 0,36814 0,5594 0,7574 0,9585 0,0884 0,1723 0,2592 0,3460 0,4366 0,5287 0,6279 0,7271 0,8382 0,9548 Hommel 0,3240 0,6438 0,9650 0,18518 0,36878 0,5601 0,7581 0,9588 0,0885 0,1726 0,2596 0,3468 0,4379 0,5304 0,6303 0,7300 0,8407 0,9556 Rom 0,3241 0,6438 0,9650 0,1856 0,36922 0,5605 0,7583 0,9588 0,0887 0,1730 0,2605 0,3481 0,4394 0,5325 0,6320 0,7317 0,8419 0,9558
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
0.8
0.8
q q q q
q q
0.8
q q
0.6
0.6
q q
0.6
Poder
Poder
Poder
q q
q
q
0.4
0.4
q q
0.4
q
q q q
q q
q
q q q
0.2
0.2
0.2
q q
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.9:
13.
4.
Estudo de simulao
50
TABELA 4.10:
Nmero de hipteses 3
Poder dos
13.
Hommel 0,3321 0,6526 0,9759 0,1929 0,3787 0,5734 0,7720 0,9729 0,0914 0,1794 0,2687 0,3597 0,4530 0,5483 0,6470 0,7515 0,8590 0,9706 Rom 0,3322 0,6528 0,9759 0,1931 0,3791 0,5735 0,7721 0,9729 0,0915 0,1798 0,2694 0,3606 0,4539 0,5495 0,6486 0,7526 0,8597 0,9707
Estratgia Hochberg 0,3321 0,6525 0,9759 0,1928 0,3783 0,5729 0,7716 0,9728 0,0913 0,1792 0,2684 0,3592 0,4519 0,5471 0,6453 0,7496 0,8573 0,9703
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q q q
q q
0.8
q q
0.6
0.6
q q q q
Poder
Poder
Poder
0.6
q q
0.4
0.4
q q
0.4
q q q q
q q
q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.10:
13.
4.
Estudo de simulao
51
TABELA 4.11:
Nmero de hipteses 3
Poder dos
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q
0.8
q q
q q
q q
0.6
0.6
q
q
0.6
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.11:
MCMs
4.
Estudo de simulao
52
TABELA 4.12:
Nmero de hipteses 3
Poder dos
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q
0.8
q q
q q
q q
0.6
0.6
q q
0.6
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.12:
MCMs
4.12;
e das Figuras
4.10, 4.11
4.12;
de Bonferroni apresenta o menor poder em todos os cenrios de censura investigados nos testes das duas estatsticas. J os outros quatro procedimentos apresentaram praticamente
4.
Estudo de simulao
53
o mesmo comportamento. Um fato importante a ser notado que nos testes da estatstica de Cramrvon Mises os cinco procedimentos apresentaram maior poder em relao aos testes da estatstica log-rank. No que diz respeito censura, os testes realizados com dados sem censura apresentaram maior poder em relao aos dados com censura xada em
13,
que
por sua vez apresentaram maior poder em relao aos dados com censura xada em
11.
4.2
Dados contnuos
Para as simulaes realizadas com dados contnuos foram geradas amostras aleatrias de distribuio exponencial. Devido ao elevado custo computacional empregando nos testes as estatsticas log-rank e Cramr-von Mises foi analisado apenas o cenrio em que aproximadamente
36%
4.2.1
Controle da FWER
Para averiguar o controle da FWER das cinco estratgias de comparaes ml-
200, 250
300;
de tamanho
30, 50
100
Realizamos
10000
10
com parmetros
1 , . . . , 10 = 0, 01, sendo a primeira populao adotada como referncia. 100, o que equivale a aproximadamente 36% dos dados censurados.
mostra os valores da FWER das estratgias de Bonferroni, Holm,
4.13
Hochberg, Hommel e Rom aplicados na estatstica log-rank para os diferentes tamanhos de amostras escolhidos. Na Figura
4.13
4.
Estudo de simulao
54
TABELA 4.13: FWER para os cinco MCMs empregados nos testes da estatstica log-rank em funo dos diferentes TA com censura xada em
Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,03870 0,03870 0,03870 0,03880 0,03990 TA=50 0,04200 0,04200 0,04200 0,04200 0,04320 TA=100 0,05030 0,05030 0,05030 0,05050 0,05120
100.
TA=200 0,04890 0,04890 0,04890 0,04910 0,04990 TA=250 0,04900 0,04900 0,04910 0,04940 0,04990 TA=300 0,04978 0,04978 0,04985 0,04998 0,05002
Logrank
0.050
q q
FWER
0.045
0.040
q
50
100
150
200
250
300
Tamanho da amostra
FIGURA 4.13:
MCMs empregados na
estatstica log-rank.
Pela Figura
4.13
30
50
os cinco
300
5%, 5%
enquanto os outros mostraram-se ainda um pouco conservativos atingindo a taxa de apenas com TA igual a Na Tabela
300.
e na Figura
4.14
4.14
FWER dos cinco procedimentos aplicados na estatstica Cramr-von Mises para amostras de tamanho
30, 50
100.
4.
Estudo de simulao
55
TABELA 4.14: FWER para os cinco MCMs empregados nos testes da estatstica Cramrvon Mises em funo dos diferentes tamanhos de amostras (TA) com censura xada em
100.
Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04620 0,04620 0,04620 0,04640 0,04720 TA=50 0,04830 0,04830 0,04830 0,04840 0,04950 TA=100 0,04540 0,04540 0,04540 0,04570 0,04630
Cramrvon Mises
0.050
0.045
FWER
0.040 30
40
50
60
70
80
90
100
Tamanho da amostra
FIGURA 4.14:
MCMs empregados na
Pela Figura
4.14
notamos que os
30 e 100,
50
5%.
estratgia de Rom foi a menos conservativa. Quando comparado aos testes realizados com a estatstica log-rank, a estatstica de Cramr apresentou resultados menos conservativos para TA
30
50.
4.2.2
captulo.
10.000
4.
Estudo de simulao
56
tamanho
50. 10
populaes de distribuio
X (10) E (0, 01 + ),
a censura foi
xada em
100
Na Tabela
4.15
e na Figura
4.15
.
Estatstica
log-rank
Hommel 0,0400 0,0738 0,1917 0,3645 0,5485 0,7085 0,8330 0,9090 0,9529 0,9781 0,9921 0,9958 0,9978 Rom 0,0756 0,1097 0,2246 0,3940 0,5679 0,7224 0,8395 0,9135 0,9556 0,9791 0,9926 0,9961 0,9978
0,002 0,004 0,006 0,008 0,010 0,012 0,014 0,016 0,018 0,020 0,022 0,024 0,026
Bonferroni 0,0397 0,0735 0,1906 0,3628 0,5468 0,7074 0,8318 0,9084 0,9524 0,9776 0,9921 0,9958 0,9978
Holm 0,0397 0,0737 0,1910 0,3634 0,5474 0,7081 0,8326 0,9087 0,9525 0,9777 0,9921 0,9958 0,9978
Hochberg 0,0399 0,0737 0,1910 0,3635 0,5475 0,7081 0,8326 0,9088 0,9526 0,9777 0,9921 0,9958 0,9978
0,002 0,004 0,006 0,008 0,010 0,012 0,014 0,016 0,018 0,020 0,022 0,024 0,026
Bonferroni 0,0315 0,0599 0,1621 0,2853 0,4552 0,6116 0,7381 0,8433 0,8985 0,9418 0,9667 0,9827 0,9898
Holm 0,0318 0,0601 0,1629 0,2856 0,4559 0,6120 0,7385 0,8438 0,8987 0,9419 0,9667 0,9828 0,9899
Hochberg 0,0318 0,0601 0,1632 0,2856 0,4559 0,6122 0,7386 0,8439 0,8987 0,9419 0,9667 0,9828 0,9899
Hommel 0,0319 0,0602 0,1634 0,2867 0,4565 0,6128 0,7396 0,8444 0,8990 0,9423 0,9668 0,9829 0,9899
Rom 0,0703 0,1008 0,2014 0,3201 0,4836 0,6338 0,7542 0,8521 0,9048 0,9459 0,9686 0,9834 0,9990
4.
Estudo de simulao
57
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
0.8
0.8
q
q
q
q
q
q
q
q
0.6
0.6
q
q
Poder
Poder
q
q
q
q
0.4
q
q
Bonf
q
0.4
q
q
Bonf
q
0.2
q
q
q
q
0.0
0.000
0.005
0.010
0.015
0.020
0.0
q
q
q
q
q
q
q
q
0.000
0.005
0.010
0.015
0.020
FIGURA 4.15:
4.15
e da Figura
4.15
apresenta o poder um pouco maior que os demais, principalmente quando pequenos. medida que
assume valores
bem prximos.
apresentam maior poder quando comparado estatstica Cramr-von Mises. Na segunda investigao do poder trabalhamos com as conguraes em que foram geradas
4, 6
11
3, 5
10
testes
X (4) E ( + ),
X (3) , X (4) E ( + ),
= 0, 01
= 0, 015. 5
e
10
hipteses.
4.16
4.
Estudo de simulao
58
4.17
3, 5
10
hipteses em funo
TABELA 4.16:
Nmero de hipteses 3
Poder dos
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q q q
q q
0.8
q q
0.6
0.6
q
q q q
Poder
Poder
Poder
0.6
q q
0.4
0.4
q q
0.4
q q q q
q q
q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.16:
4.
Estudo de simulao
59
TABELA 4.17:
Nmero de hipteses 3
Poder dos
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
0.8
0.8
q
q
0.8
q q
0.6
0.6
0.6
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q
q q q
0.2
0.2
0.2
q q
q
q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.17:
4.17
4.16
4.16
4.17
estratgias. No geral, os procedimentos de Holm, Hochberg, Hommel e Rom apresentaram poder bem semelhantes entre si. Vale notar ainda que os testes empregados com a
4.
Estudo de simulao
60
estatstica log-rank resultou em maior poder quando comparado estatstica de Cramrvon Mises.
possvel concluir o mesmo argumento. Por meio dos estudos de simulao vericamos que em alguns casos os mtodos mostraram-se conservativos e em outros extrapolaram um pouco o nvel nominal de
5%.
Todavia, para tamanhos de amostras grande, o controle da FWER foi satisfatrio nos testes das duas estatsticas, tanto para dados contnuos como discretos. Dos cinco MCMs
61
5.
62
empregados o que se mostrou menos conservativo e que chegou mais prximo de procedimento de Rom.
5%
foi o
Mediante a avaliao do poder o que se pode conrmar claramente que o procedimento de Bonferroni apresenta menor poder em relao aos demais nos cenrios analisados. Entre os procedimentos de Holm, Hochberg, Hommel e Rom no foi notada uma diferena importante. Como propostas de trabalhos futuros, listamos os seguinte itens:
Analisar outros problemas de comparaes mltiplas, como por exemplo, testes dois a dois;
Estudar os mtodos de comparaes mltiplas que controlam a false discovery rate (FDR);
k -FWER,
p p )j =1 , (Wjp , Cj
para
p J.
F = {Fi ; i 0}
Fi :=
np ;pJ
Fi p ,
i 0.
p J,
p p Vm (j ) := (V1p (j ), . . . , Vm (j )),
p p Rp m (j ) := (R1 (j ), . . . , Rm (j )),
Introduzimos agora uma outra ltragem que ser a base para nossos resultados assintticos. sequncia. Esta famlia de ltragem cuidadosamente escolhida como descrito na
j 1
n NJ ,
denimos a ltragem
G n (j ) =
63
A.
64
n {Gm (j ); 0 m NJ }
para qualquer
0 m NJ 1
em que denimos
Rn (0) = Rn (0) q1 = q
C,p Rp = 0. 0 = R0
em
n = (n1 , . . . , nJ ) NJ ,
seja
Unqq1 (n , .) =
{Unqq1 (n , i); i 1}
satisfazendo os
seguintes pressupostos:
(M1) (M2)
Para cada
n G0 (i)-mensurvel
para cada
i 1;
Existe
>0
2+
nq1
2+
=0
i 1;
e
(M3)
Para qualquer
q2 {q, q1 }
1
n
q2 q,q ( ) 1
tal que
n .
e
(M4)
Para qualquer
q2 J (q2 = q, q2 = q1 )
n n
q q ( ) 1 ,q2
tal que
n 3 J , r=k
precisamos introduzir outro par de
A m de tratar o caso geral, com pressupostos no processo ponderado previsvel em relao ltragem
U.
Dado
em
J , seja U
um processo ponderado
A.
65
(H1)
Para qualquer
q1 = k
1,
k,r q ( ) 1
tal que
nr nk (n , ) (n , )Un Un q1 q1
V nq1 ( )
em probabilidade com
k,r q ( ) 1
n .
e
(H2)
Para qualquer
q1 = k
1,
k,r q ( ) 1
tal que
nk nr Un (n , )Un (n , ) q1 q1
V nq1 ( )
em probabilidade com
k,r ( ) q 1
n .
(M1-
Lema A.1.
M4).
qJ
1,
n
(A.1)
q1 =q
1{V nq1 ( )>0} Unqq1 (n , )1 1{V nq ( )>0} Unqq1 (n , )1 nq Y nq1 ( ) Y ( ) V nq ( ) V nq1 ( ) N (0, 2 q ( ))
com
n .
A varincia assinttica
2 q( )
2 q( ) =
q1 =q
(A.2)
+
q1 =q
+ 2
q1 ,q2 Aq q1 q q,q , q,q 1 1
q q 1 ,q2
em
(M3)
(M4).
Para qualquer par
Proposio A.1.
aq,q1
tais que
q1 = q
Seja
em
J,
nq Un (n q1
, )=
J i=1
ni
nq1 nq
f
j =0
Rn (j ) V n (j )
V nq1 ( )V nq ( ) Vn ( )
A.
66
nq (n Un q1
, )=
J i=1
ni
nq1 nq
(M1-M4).
Vn ( )
J i=1
ni
V nq1 ( )V nq ( ) Vn ( )
satisfazem os pressupostos
1
Se
e, para
n =
J i=1
ni .
O pressuposto
(M1)
bvio.
> 0,
e o fato de que
Vn ( )
a soma
2+
n nq1
1+/2
/2 nq f V n ( )n1
2+
0
para qualquer dado
com
n ,
q = q1 J
em
J.
(M2) satisfeito.
Para um
q = q1
n
em
e qualquer
q2 {q, q1 },
temos que
|Unqq1 (n , )|2 V n ( ) V nq1 ( ) V nq ( ) n nq2 f 1 1 = 1 1{V nq ( )>0} . {V ( )>0} V nq2 ( ) n Vn ( ) nq nq1 q3 J (q3 = q, q3 = q1 ),
n
(A.3)
Se
escrevemos que
Vn ( ) n
n nq nq3 n V ( ) nq nq1
1/2
V nq3 ( )V nq ( ) nq nq3
V nq1 ( ) 1 1 n V n ( ) {V
( )>0} . (A.4)
As identidades (A.3) e (A.4) nos permite usar novamente a condio de crescimento, a continuidade de
(M3)
(M4)
satisfaa os pressupostos
(M1-
A.
67
M4).
i 0
q1 =q
i 0
N 0,
2 q( )
com
n ,
i
para cada
i 1.
Alm disso,
2 ( ) q,n
=1 =1
2 q( )
(A.5)
em probabilidade com
n ,
para cada
i 1.
Observao A.1.
Para um dado
NJ
Zq ( ) := lim
n m,q ( ); m=1
1.
(A.6)
Estabelecemos ainda
Wq (i) :=
=1
Zq ( ),
i 1.
(A.7)
Observao A.2.
Nesse caso,
Quando
J = 2, qJ
as frmulas no Teorema A.1 cam muito simples. e a varincia assinttica no Lemma A.1 torna-se
Aq =
para cada
1.
Alm disso, e
|Unqq1 (n , )|2 nq |Unqq1 (n , )|2 nq 2 nq nq1 ( )], q,n ( ) = h ( )[1 h ( )] + h 1 ( )[1 h nq1 n q V ( ) V ( )
para cada
1.
Assumimos que um processo ponderado Dessa forma, para cada
NJ n m, 1( m=1 NJ
Lema A.2.
M4)
and
satisfaa os pressupostos
(M1-
(H1-H2).
1, N 0 , Q( )
), . . . ,
m=1
n m,J ( )
A.
68
fracamente com
n ,
Q( )
denido por
Q( )a, a
RJ
=
k=1
2 a2 k k ( ) + 2 1r<kJ
ar ak (k, r, )
para cada
a RJ .
Para qualquer para
Proposio A.2.
aq,q1
tais que
q1 = q
em
J,
(M1-M4)
(H1-H2).
Fixamos
(H1-H2).
1,
n=
J i=1
ni .
Se
q1 = k J ,
2
escrevemos
nk nr Un (n , )Un (n , ) q1 q1
V nq1 ( )
f V n ( )n1
n nr n V ( ) nk
1/2
Para um dado
(A.8)
r=k
em
q1 = k
podemos escrever
nk nr Un (n , )Un (n , ) q1 k
V nk ( )
1 1{V nk ( )>0} =
f V n ( )n1
2 V nk (
) V nr ( ) nk V n ( )
n nq1 V n ( ) nr
1/2
(A.9)
(H1) e (H2).
Como os argumentos para o caso Harrington and Fleming so inteiramente anlogos, conclumos a prova.
A.
69
i 1,
NJ n m, 1( i NJ
), . . . ,
=1 m=1
n m,J ( ) N 0 , (i) i) = (
i =1
(A.10)
=1 m=1
n .
( ) Q
i) (i) (
( ) Q
( )a, a Q
RJ
=
k=1
2 a2 k k ( ) + 2
1r<kJ
(k, r, ) ar ak
para cada
a RJ .
1; i 1.
Ao repetir os mesmos argumentos como na prova do Teorema A.1, fcil vericar que
um
F-vetor
i Z
m Z
so
RJ
para cada
i = m.
Sob essas
Referncias
Curnow, R. & Dunnett, C. (1962). The numerical evaluation of certain multivariate normal integrals. The Annals of Mathematical Statistics ,
33(2), 571579.
Duchesne, P. & Lafaye De Micheaux, P. (2010). Computing the distribution of quadratic forms: Further comparisons between the Liu-Tang-Zhang approximation and exact methods. Computational Statistics e Data Analysis ,
54(4), 858862.
Dunnett, C. & Sobel, M. (1955). Approximations to the probability integral and certain percentage points of a multivariate analogue of student's t-distribution.
42(1), 258260.
Biometrika ,
50(272),
Society ,
98(1), 3982.
Fleming, T. & Harrington, D. (1991). Counting processes and survival analysis , volume 8. Wiley Online Library. Harrington, D. & Fleming, T. (1982). survival data. Biometrika , A class of rank test procedures for censored
69(3), 553566.
Biometrika ,
75(4), 800802.
Hochberg, Y. & Tamhane, A. (1987). Multiple Comparison Procedure . John Wiley, New York. Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian
Journal of Statistics ,
Hommel, G. (1986).
6(2), 6570.
Metrika ,
33(1), 321336.
Hommel, G. (1988). A stagewise rejective multiple test procedure based on a modied bonferroni test. Biometrika ,
75(2), 383386.
76(3), 624625.
70
Referncias
71
Hsu, J. (1996). Multiple Comparison: Theory and methods . Chapman and Hall,London. Karlin, S. (1968). Total positivity , volume 1. Stanford University Press. Karlin, S. & Rinott, Y. (1980). Classes of orderings of measures and related correlation inequalities. i. multivariate totally positive distributions.
Analysis ,
10(4), 467498.
Journal of Multivariate
Leo, D. & Ohashi, A. (2011). On the discrete Cramr-von Mises statistics under random censorship. "Submitted to the Annal of Statistics ". Lehmann, E. E. L. & Romano, J. P. (2005). Science+ Business Media. Marcus, R., Eric, P. & Gabriel, K. (1976). On closed testing procedures with special
Springer
63(3), 655660.
Miller, R. G. (1981). Simultaneous Statistical Inference . Springer-Verlag, New York. R Development Core Team (2011).
77(3), 663665.
66(1), 189196.
Sarkar, S. (1998). Some probability inequalities for ordered MTP2 random variables: A proof of the Simes conjecture. The Annals of Statistics ,
26(2), 494504.
Sarkar, S. & Chang, C. (1997). The Simes method for multiple hypothesis testing with positively dependent test statistics.
92(440), 16011608.
Biometrika ,
73(3), 751754.
64(1), 156160.
Tukey, J. W. (1953). The problem of multiple comparisons. The Colected Works of Jonh
W. Tukey: Multiple Comparisons, Volume III , (1999), Edited by H. Braun, CRC Press,
Boca Ranton, Florida. Wright, S. (1992). 10051013. Adjusted p-values for simultaneous inference.
Biometrics ,
48(4),