Daiane Revisada

Comparaes mltiplas para dados censurados
Daiane de Souza Santos
SERVIO DE PS-GRADUAO DO ICMC-USP
Data de Depsito: Assinatura:________________________ ______
Orientador: Prof. Dr. Dorival Leo Pinto Jnior
Dissertao apresentada ao Instituto de Cincias Matemticas e de Computao - ICMC-USP, como parte dos requisitos para obteno do ttulo de Mestre em Cincias Cincias de Computao e Matemtica Computacional. VERSO REVISADA
USP So Carlos Junho de 2013

SERVIO DE PS-GRADUAO DO ICMC-USP
Data de Depsito: Assinatura:________________________ ______
Orientador: Prof. Dr. Dorival Leo Pinto Jnior
Dissertao apresentada ao Instituto de Cincias Matemticas e de Computao - ICMC-USP, como parte dos requisitos para obteno do ttulo de Mestre em Cincias Cincias de Computao e Matemtica Computacional. VERSO REVISADA
USP So Carlos Junho de 2013
Agradecimentos
Primeiramente, agradeo minha me Vilma, minha av Olita e ao meu tio Alexandre por sempre me apoiarem e incentivarem. Ao meu orientador, Dorival Leo, por ter acreditado em mim e por estar presente em cada etapa deste trabalho. Agradeo ainda pela pacincia e incentivo na elaborao e conduo deste trabalho. Minha eterna gratido e admirao. Aos professores de estatstica do ICMC-USP pelos ensinamentos e por toda ateno que me deram. Em especial professora Cibele Russo, membro da banca do
exame de qualicao, agradeo pelas diretrizes e sugestes. Aos professores e funcionrios do ICMC pela minha formao prossional, pessoal e pelo excelente convvio. Em especial ao Roberto pelo apoio e carinho, ao Bruno e Naiara pelos preciosos momentos de distrao e Patrcia, que mesmo distncia est todo dia presente. A todos meus amigos do curso de ps graduao em estatstica: Alessandra, Aline, Hiroshi, Gilberto, Joo Luiz, Jos Augusto, Jos Flores Delgado, Matheus e Willian, por toda ajuda que me deram e pelos momentos compartilhados ao longo destes anos. s minhas queridas companheiras de casa Nayara e Ludmila e aos demais amigos que, independentemente da distncia acompanham-me nesta jornada. No citarei nomes, pois esta lista seria muito extensa para ser colocada aqui. Alm disso, no correrei o risco de acabar esquecendo de algum. A todas as pessoas que no foram mencionadas, mas que de alguma maneira contriburam para viabilizar este trabalho.
Resumo
O objetivo deste trabalho estudar a performance de alguns mtodos de comparaes mltiplas (MCMs) que ajustam o valor-p quando as estatsticas empregadas nos testes so a log-rank e a Cramr-von Mises, ambas no paramtricas e com estrutura de dependncia. A vantagem dos MCMs que ajustam o valor-p que eles controlam as taxas de erro tipo I e tipo II para cada hiptese, a m de atingir um poder estatstico elevado, mantendo a taxa de erro da famlia dos testes (FWER) menor ou igual ao nvel de signicncia escolhido. Trabalhamos com o procedimento clssico de Bonferroni e com outros mtodos vistos como seu melhoramento, com especial ateno a certos procedimentos derivados do mtodo de Simes que permitem realizar inferncias sob as hipteses individuais. Foi vericado
teoricamente que a estatstica log-rank pertence classe multivariada totalmente positiva de ordem 2 (MTP2 ), uma vez que o mtodo de Simes garante o controle da FWER quando as estatsticas dependentes assumem esta condio. O controle da FWER empregando a estatstica de Cramr-von Mises foi observado apenas por meio de simulaes. Os MCMs foram analisados atravs de estudos computacionais em modelos discretos e contnuos sob censura com foco no problema de comparar um tratamento versus controle.
Palavras-chave:
Mtodos de comparaes mltiplas, controle da FWER, melhoramentos
do mtodo de Bonferroni, mtodo de Simes, estatsticas dependentes, dados censurados.
Abstract
The aim of this work is to study the performance of some Multiple Comparison Methods (MCMs) that adjust the p-value when the log-rank-type and Cramr-von Mises statistics are used, both nonparametric and with dependency structure. The advantage of these
methods is that they control the error rates of type I and type II for each hypothesis in order to achieve high statistical power while keeping the Family Wise Error Rate (FWER) lower or equal than a given signicance level. The classical Bonferroni procedure is used as well as others seen as its improvement, with special attention to certain procedures derived from Simes' method for making inferences on individual hypothesis. It is theoretically
proved that the weighted Log-Rank statistics belongs to the multivariate totally positive of order 2 (MTP2 ) class, which is needed in order to apply Simes' method, that guarantees control of the FWER of dependent statistics in this case. The control of the FWER
when the Cramr-von Mises statistics is used is only veried by means of computational simulations. The MCMs are also analyzed by means of computational experiments with discrete and continuous data under censoring with focus on the problem of comparisons of treatment versus a control.
Keywords:
Multiple comparison methods, FWER control, improved Bonferroni method,
Simes' method, dependent statistics, censoring data.
Sumrio
1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Organizao dos captulos . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
5
2 Testes Mltiplos e MCMs . . . . . . . . . . . . . . . . . . . . . . . . . .

2.1 2.2 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conceitos principais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 2.2.2 2.2.3 2.2.4 2.3 Taxa de erros da famlia dos testes - FWER Valor descritivo do teste . . . . . . . . . . . . .
7
7 9 9 9 12 12 14 14 16 17 22 23 23 25
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Procedimentos stepup e stepdown
Mtodos fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Procedimentos de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 2.3.2 Bonferroni Clssico . . . . . . . . . . . . . . . . . . . . . . . . . . . Procedimento de Bonferroni de rejeio sequencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 2.5
Mtodo de Simes
Mtodo de Simes para testes individuais 2.5.1 2.5.2 2.5.3 Mtodo de Hochberg
. . . . . . . . . . . . . . . . . . . . . . . . . .
Mtodo de Hommel . . . . . . . . . . . . . . . . . . . . . . . . . . . Mtodo de Rom . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Sumrio
ii
3 Modelo e Estatsticas dos Testes . . . . . . . . . . . . . . . . . . . . . .

3.1 3.2 3.3 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modelo para os dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Estatsticas dos Testes 3.3.1 3.3.2 3.3.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
26 27 29 29 31 34
Estatstica log-rank . . . . . . . . . . . . . . . . . . . . . . . . . . . Condio MTP2 para a estatstica log-Rank . . . . . . . . . . . . .
Estatstica de Cramr-von Mises . . . . . . . . . . . . . . . . . . . .
4 Estudo de simulao . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Dados discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 4.1.2 4.2 Controle da FWER . . . . . . . . . . . . . . . . . . . . . . . . . . . Poder dos testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
38 38 42 53 53 55
Dados contnuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 4.2.2 Controle da FWER . . . . . . . . . . . . . . . . . . . . . . . . . . . Poder dos testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 Concluso e propostas futuras . . . . . . . . . . . . . . . . . . . . . . . A Propriedades e resultados assintticos . . . . . . . . . . . . . . . . . . . Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61 63 70
Captulo 1 Introduo
Testes simultneos de vrias hipteses nulas, conhecidos simplesmente como testes mltiplos, so um dos problemas mais comuns de inferncia em diversas anlises estatsticas. Por exemplo, em pesquisas farmacuticas sobre a eccia de uma droga experimental, a avaliao estatstica sobre a superioridade da droga em relao aos medicamentos existentes ou sobre o placebo geralmente realizada por meio de uma formulao de testes mltiplos. O principal desao dos testes mltiplos est em assegurar que a taxa de erro Tipo I, que rejeitar erroneamente a hiptese nula e, por conseguinte, chegar a uma inferncia falso positiva, seja mantido ao nvel estabelecido pelo investigador. Pesquisas biomdicas, por exemplo, geralmente utilizam projetos experimentais complexos. Dessa forma, a m de economizar recursos, como dinheiro, tempo do investigador ou unidades experimentais (humanos, animais, tecidos ou clulas), vrias hipteses acabam sendo testadas a partir de uma nica experincia, o que aumenta o risco de fazer inferncias estatsticas falsas. No pior dos casos, se de uma inferncia errnea aumenta
hipteses independentes so testadas, o risco
vezes. neste contexto que surgem os Mtodos
de Comparaes Mltiplas (MCMs), que so procedimentos estatsticos designados a minimizar estes erros. A bibliograa sobre este assunto extensa, podemos destacar como referncias fundamentais os livros Hochberg & Tamhane (1987), Hsu (1996) e Lehmann & Romano (2005), que trazem quase todas as tcnicas e conceitos empregados nesta rea da inferncia mltipla.
1.
Introduo
Na literatura de testes mltiplos diferentes taxas de erros foram analisadas, sendo as principais denominadas como: taxa de erro por comparao (per-comparison error rate (PCE)), denida como a proporo esperada do erro tipo I; taxa de erro por famlia (error rate per family (PFE)), exibida como o nmero de erros esperados na famlia; taxa de erros da famlia dos testes (family-wise error rate (FWER)), que representa a probabilidade de uma ou mais rejeies falsas na famlia de inferncias; e ainda a false
discovery rate (FDR), que indicada quando temos um nmero bem elevado de hipteses
a serem testadas, e denida pelo valor esperado da razo entre o nmero de rejeies falsas e o nmero total de rejeies. Neste trabalho, as discusses sero voltadas para os MCMs que controlam a FWER, que entre outras razes, segundo Hochberg & Tamhane (1987), nos permite calibrar uniformemente procedimentos diferentes para um referencial comum, e assim, comparar as suas caractersticas operacionais de maneira justa. Um dos precursores dos MCMs foi Fisher (1935), que introduziu duas categorias distintas: procedimentos de uma etapa (single-step ), que abrange a importante classe
referida como procedimentos de testes simultneos (simultaneous test procedures ); e procedimentos de etapas mltiplas (stepwise ), que posteriormente foram classicadas em ascendente (stepup ) e descendente (stepdown ). O primeiro mtodo proposto por Fisher o famoso teste da diferena mnima signicativa (least signicant dierence (LSD) test ), que pode ser visto como um procedimento de duas etapas, em que a hiptese nula testada preliminarmente por um teste
F.
J o segundo mtodo dado por Fisher apresenta etapa nica e popularmente conhecido como procedimento de Bonferroni. Ambos procedimentos controlam a FWER, o LSD
no sentido fraco (somente quando todas as hipteses nulas na famlia so verdadeiras) e Bonferroni no sentido forte (para qualquer combinao de hipteses verdadeiras e falsas). No entanto, frequentemente o LSD exibe maior poder e uma das razes disto o fato de apresentar mais de uma etapa. As comparaes mltiplas na anlise de varincia (ANOVA) uma rea em que as inferncias simultneas tm uma longa histria. O procedimento clssico e mais utilizado neste contexto foi proposto por Tukey (1953). Tal mtodo compara todos os possveis
pares de mdias a m de encontrar quais delas diferem signicativamente uma das outras, e baseado na distribuio da amplitude Studentizada. Para dados balanceados, o teste de
1.
Introduo
Tukey o mtodo de uma etapa mais poderoso para comparaes de mdias duas a duas. Quando o interesse est na comparao de vrios tratamentos com um controle, o teste que merece destaque na ANOVA foi proposto por Dunnett (1955), e bem semelhante ao teste t usual. Marcus et al. (1976) propuseram uma tcnica geral para a construo de procedimentos descendentes: os mtodos fechados (closure method ). Os procedimentos resultantes deste mtodo so a base para a construo de muitas estratgias de comparaes que veremos neste trabalho, eles controlam a FWER no sentido forte e chamado na literatura de procedimentos de testes fechados (closed testing procedures ). O mtodo de Bonferroni clssico tem presena marcante na inferncia simultnea, pode ser aplicado em qualquer situao de testes mltiplos e como dito anteriormente, controla a FWER no sentido forte, porm o preo desta generalidade a falta de poder. Diante disto, a m de amenizar esta situao, tem surgido na literatura diversos
procedimentos denominados como melhoramentos de Bonferroni, j que um MCM ideal aquele que controla a FWER e tem capacidade para detectar casos em que a hiptese nula falsa. Estas tcnicas geralmente apresentam etapas mltiplas e so propostas para ajustar o valor-p oriundo das estatsticas dos testes. A vantagem dos MCMs que ajustam o valor-p que eles controlam as taxas de erro tipo I e tipo II para cada hiptese com o propsito de atingir um poder estatstico elevado, mantendo a FWER menor ou igual ao nvel de signicncia escolhido. Um dos primeiros aprimoramentos do mtodo clssico foi dado por Holm (1979), que props um mtodo descendente atravs do procedimento dos testes fechados, que cou conhecido como procedimento de Bonferroni de rejeio sequencial (sequentially rejective bonferroni procedure ) ou procedimento de Holm. Esta estratgia exibe maior poder quando comparado ao mtodo tradicional de Bonferroni e controla a FWER no sentido forte. Uma das modicaes mais importantes do procedimento de Bonferroni e que daremos grande ateno neste trabalho foi dado por Simes (1986). Tal mtodo testa a hiptese nula global
H0 =
n i=1
Hi ,
que a combinao de
hipteses individuais, a um
nvel de signicncia mltiplo
pr-estabelecido em termos dos valores-p das estatsticas
dos testes. Simes provou que seu procedimento controla a FWER quando as estatsticas dos testes so independentes e conjecturou via simulao que este controle se mantm
1.
Introduo
para algumas variedades de estatsticas multivariadas dependentes.
Evidenciamos este
mtodo pelo fato dele apresentar maior poder em relao a Bonferroni, principalmente quando estatsticas altamente correlacionadas esto envolvidas. Como Simes (1986) no justicou teoricamente o controle da FWER para estatsticas dependentes, Sarkar & Chang (1997) mostraram que para distribuies multivariadas que exibem um certo tipo de dependncia positiva o mtodo de Simes controla efetivamente a FWER. Posteriormente, Sarkar (1998) provou analiticamente que o mtodo de Simes controla a FWER para uma classe ainda mais geral de distribuies multivariadas com dependncia positiva, caracterizadas pela condio multivariada totalmente positiva de ordem 2 (MTP2 ) e tambm para algumas misturas de MTP2 . Simes (1986) tambm deixou em aberto o problema de realizar inferncias simultneas sob as hipteses individuais. Diante disto, Hochberg (1988) sugeriu um mtodo bem simples de rejeio sequencial do tipo ascendente. Hommel (1988) tambm estendeu o procedimento de Simes para inferncias individuais, e subsequentemente, Hommel (1989) mostrou que este procedimento, embora seja mais complicado e difcil de ser interpretado, mais poderoso que a estratgia formulada por Hochberg. A m de melhorar o procedimento de Hochberg, Rom (1990) props uma modicao que requer o clculo dos pontos crticos atravs de um algoritmo recursivo, e foi mostrado que tal procedimento apresenta uma pequena vantagem em relao ao mtodo original. Recentemente, Rom (2013)
forneceu uma modicao que mantm a simplicidade do procedimento de Hochberg enquanto apresenta um ganho de poder, que pode ser moderado em algumas situaes, podendo atingir nveis bem elevados quando muitas das hipteses testadas so falsas. Neste trabalho o principal objetivo aplicar os procedimentos de Bonferroni, Holm, Hochberg, Hommel e o mtodo recente proposto por Rom (2013) em modelos discretos sob censura aleatria, j que a anlise estatstica para estes dados tem grande importncia em inmeras reas. Um exemplo tpico visto na educao quando queremos analisar o nmero de semestres at a ocorrncia da evaso dos alunos de graduao de uma universidade. Quando analisamos dados ao longo do tempo como estes, um problema frequente que alguns dados aparecem somente em certos perodos, ou seja, esto sujeitos censura. Dessa forma, quando o evento de interesse a ocorrncia da evaso devemos considerar os eventos de censura, que neste caso podem ser a transferncia, a migrao,
1.
Introduo
o falecimento ou a concluso do curso. Em vrias circunstncias, procedimentos estatsticos baseados em distribuies contnuas ou mistas no podem ser aplicados diretamente em dados puramente discretos, devido falta de informao necessria para validar os resultados assintticos. Um
problema encontrado na literatura est no desenvolvimento de mtodos de testes no paramtricos para modelos discretos na presena de censura que seja consistente em uma grande classe de hipteses alternativas. importantes para testar Um dos mtodos no paramtricos mais
H0
sob censura aleatria o teste de log-rank. De fato, um dos
testes no paramtrico mais indicados para comparar duas ou mais populaes com dados sujeitos censura, contudo apresenta a desvantagem de no exibir um bom poder ao lidar com funes intensidade no proporcionais. Dessa maneira, trabalhamos tambm com a estatstica de Cramr-von Mises, que foi analisada em Leo & Ohashi (2011) e considerada ideal para modelos puramente discretos sob censura. Vericamos teoricamente que a estatstica log-rank satisfaz a condio MTP2 . O controle da FWER ao empregar as extenses do mtodo de Simes na estatstica Cramrvon Mises foi averiguado apenas por recursos computacionais. Ainda por meio de estudos de simulaes comparamos a performance dos mtodos de Bonferroni, Holm, Hochberg, Hommel e Rom em relao ao ganho de poder realizando os testes com as estatsticas
log-rank e Cramr-von Mises.
Priorizamos nos estudos dados gerados de distribuio
discreta, mas tambm realizamos uma pequena anlise com dados contnuos. Focamos no problema de comparar um tratamento versus controle.
1.1
Organizao dos captulos
O foco do Captulo
destacar os principais conceitos empregados na teoria
de comparaes mltiplas e apresentar detalhadamente o procedimento de Simes e suas principais extenses para testes individuais. No Captulo
introduzimos o modelo discreto sob censura aleatria com o qual
trabalhamos e apresentamos as estatsticas dos testes empregadas: log-rank e Cramr-von Mises. Mostramos ainda que a estatstica log-rank satisfaz a condio MTP2 para a
aplicao do mtodo de Simes.
1.
Introduo
O Captulo
4 traz um estudo de simulao que realizamos utilizando a linguagem
R (R Development Core Team, 2011), com o objetivo de analisar o desempenho do mtodo de Simes e suas extenses para testes individuais, quanto ao controle da FWER e ao ganho de poder ao realizar os testes com as as estatsticas log-rank e Cramr-von Mises. Por m, o captulo futuros.
apresenta as concluses dos resultados obtidos e propostas de trabalhos
Captulo 2 Testes Mltiplos e MCMs

Neste captulo exploramos os conceitos mais importantes envolvidos na teoria de testes mltiplos, principalmente no que diz respeito aos MCMs que controlam a FWER no sentido forte e que so descritos por meio dos valores-p oriundos das estatsticas dos testes. Relatamos as modicaes mais relevantes do mtodo clssico de Bonferroni,
apresentamos o mtodo de Simes e algumas de suas extenses para realizar inferncias sob as hipteses nulas individuais.
2.1
Introduo
Em pesquisas mdicas, educacionais ou agrcolas, uma ferramenta comum para a anlise dos dados um teste de homogeneidade das populaes (tratamentos ou grupos); e quando a hiptese nula que carrega a informao de que todas as populaes so iguais rejeitada, no obtemos inferncias sobre diversas comparaes detalhadas entre as populaes que podem ser de interesse do investigador, por exemplo, comparaes dois a dois entre os grupos, comparaes de vrios tratamentos com um controle (ou referncia), ou ainda comparaes entre todos os subconjuntos dos grupos. neste contexto que
surgem os Testes Mltiplos, em especial as Comparaes Mltiplas, j que nossa ateno neste trabalho est voltada s comparaes. Quando realizamos testes de hipteses podemos cometer dois possveis erros na tomada de deciso: o erro tipo I, que ocorre quando a hiptese nula
H0
rejeitada
2.
Testes Mltiplos e MCMs
erroneamente e o erro tipo II, que ocorre ao no rejeitarmos
H0
quando esta falsa.
desejvel realizar os testes de uma maneira que as probabilidades dos dois tipos de erro sejam mnimas, porm quando temos um nmero grande de hipteses a serem testadas simultaneamente nos deparamos com o problema da multiplicidade, que se refere ao crescimento da probabilidade do erro tipo I com o aumento do nmero de testes. Para ilustrar numericamente este fato vejamos o exemplo a seguir, em que foi calculada a probabilidade de ao menos uma rejeio falsa quando todas as hipteses verdadeiras e as estatsticas dos testes so independentes. Considerando o nvel de signicncia
H1 , . . . , Hn
so
= 0, 05
para cada teste individual, temos
que o nvel de signicncia conjunto (NSC) dado por
P {ao
menos uma rejeio falsa}
=1
i=1
{1 P (rejeio
falsa)}
= 1 (1 )n .
Dessa forma, se executarmos
10
testes de hipteses, a probabilidade de rejeitarmos pelo
menos uma hiptese verdadeira aumenta para
0, 40;
se forem executados
20
testes, a probabilidade O grco
0, 62 e se forem realizados 50 testes, a probabilidade chega a 0, 92.
na sequncia mostra o comportamento do NSC medida que aumentamos o nmero de testes realizados.
Nvel de significncia conjunto

1.0 NSC 0.2 0 0.4 0.6 0.8
20
40 Nmero de testes
60
80
FIGURA 2.1:
Comportamento do NSC.
diante deste problema que os MCMs foram formulados, para levar em conta e controlar adequadamente o nvel de signicncia conjunto, isto , garantir que a probabilidade de ao menos uma rejeio falsa no aumente com o nmero de testes envolvidos.
2.
2.2
Conceitos principais
2.2.1
Taxa de erros da famlia dos testes - FWER

Para proporcionarmos uma abordagem objetiva para o problema de inferncias
mltiplas, garantindo uma correo simultnea para um conjunto de inferncias e chegar a uma deciso global correta, introduzimos o conceito de famlia, que pode ser denida como qualquer coleo de hipteses que esto submetidas a testes comuns, em que os erros conjuntos so controlados. Por exemplo, num teste laboratorial de amostras de sangue, uma famlia pode ser denida como todos os ensaios realizados em um dia, ou aqueles realizados em um dia por um determinado testador. Por outro lado, os testes realizados pela manh e tarde podem ser considerados como famlias distintas, e assim por diante. Em suma, a escolha dos testes que sero tratados como uma famlia depender da situao (Lehmann & Romano, 2005). Todos os MCMs discutidos neste trabalho so denidos em termos de uma famlia nita de hipteses. Como nosso enfoque no est na realizao de um nmero muito extenso de testes e temos como objetivo chegar a uma deciso nal satisfatria, fundamental que todas as inferncias simultneas sejam corretas, assim necessrio que os MCMs controlem a taxa de erro da famlia de testes (family-wise error rate ), que denotaremos a partir de agora como FWER. Esta taxa representa a probabilidade de cometermos ao menos uma rejeio falsa na famlia. Portanto, uma vez que a famlia de testes foi denida, queremos que FWER
para todas as possveis colees de hipteses verdadeiras e falsas.
2.2.2
Valor descritivo do teste

Sem dvida o valor descritivo do teste, conhecido popularmente como valor-p,
tornou-se o ponto de partida para muitos que utilizam anlise estatstica; e na inferncia simultnea isto no diferente, j que um valor-p fornece informaes acerca se o teste de hiptese signicativo ou no, e ainda indica o quanto signicativo o resultado ,
2.
10
visto que, quanto menor o valor-p maiores as evidncias contra a hiptese nula. Testes estatsticos da interseco de um nmero de hipteses nulas com base em seus valores-p correspondentes so um problema comum na prtica. Por exemplo,
na avaliao da superioridade de uma droga nova em relao a uma droga existente ou placebo, estudos mltiplos so frequentemente utilizados para investigar diferentes aspectos dos efeitos das drogas. Transmitir resultados dos estudos individuais tornou-se uma prtica comum na pesquisa farmacutica. Assim, para obter uma concluso, por
exemplo, se existe ou no ao menos uma dose ou grupo de pacientes para os quais a nova droga mais eciente do que seu concorrente, muitas vezes conveniente utilizar apenas os valores-p correspondentes s comparaes individuais (Sarkar & Chang, 1997). Diante disto, na sequncia relatamos algumas propriedades do valor-p que so fundamentais para a teoria dos MCMs que tratamos neste trabalho. A tomada de deciso em um teste de hiptese baseada no valor de uma certa varivel aleatria
X,
com distribuio
pertencente classe
P = {P , }, H
em que
o parmetro de interesse e
o espao paramtrico. Denimos como
a classe das
hipteses nulas e de
a classe das hipteses alternativas, e os subconjuntos correspondentes respectivamente, tais que
por
H K =P
H K = . x
que
Um procedimento de teste no aleatorizado atribui a cada possvel valor
pode assumir a deciso de rejeitar ou no rejeitar
H,
e assim, divide o espao amostral
em duas regies complementares: regio de aceitao e regio de rejeio de Consideremos
H. ,
estas
uma regio de rejeio de nvel
Variando valores de
regies podem ser encaixadas no sentido que
S S
se
<.
(2.1)
Sob essa situao, conseguimos determinar o menor nvel de signicncia, valor-p, denido matematicamente por
p = p(X ) = inf { : X S } .
Lema 2.1
(Lehmann & Romano (2005))
Suponhamos que
tenha distribuio de
probabilidade
para algum
e a hiptese nula
estabelece
H .
Assumimos
que as regies de rejeio sejam encaixantes como em (2.1.
2.
11
(i) Se
sup P {X S } ,
H
para todo
0 < < 1,
(2.2)
ento a distribuio de
sobre
satisfaz
P {p u} u
(ii) Se, para
para todo
0 u 1.
H , P {X S } =
para todo
0 < < 1,
(2.3)
ento,
P {p u} = u
ou seja,
para todo
0 u 1;
tem distribuio uniforme
(0, 1). v > u , {p u}
Demonstrao. (i) Se
H ,
pela denio de valor-p, para todo Dessa forma,
{X Sv },
o que implica em
P {p u} P {X Sv }.
v u+
lim P {p u} lim+ P {X Sv } ,
v u
e desde que vale (2.2), temos que
P { p u } u . {X Su }
implica que
(ii) Novamente pela denio do valor-p, desde que o evento
{p u},
temos
P {p u} P {X Su } .
Logo, desde que (2.3) mantida, conclumos que
P {p u} u.
Portanto, pelo resultado obtido em
(i)
P {p u} = u.
A maioria dos MCMs que controlam a FWER no sentido forte so denotados a partir dos valores-p, as hipteses geralmente so ordenadas de acordo com seus nveis descritivos e ento estes valores so ajustados (corrigidos). O valor-p ajustado para uma hiptese especca dentro de um conjunto de hipteses o menor nvel de signicncia global em que a hiptese particular seria rejeitada. Um valor-p ajustado poder ser
comparado diretamente com qualquer nvel de signicncia ajustado for menor ou igual a
escolhido:
se o valor-p
a hiptese ser rejeitada (Wright, 1992).
2.
12
2.2.3
Procedimentos stepup e stepdown

Os MCMs de etapas mltiplas (stepwise ) podem ser classicados em ascendentes
(stepup ) ou descendentes (stepdown ).
Um procedimento descendente iniciado deter-
minando se o teste que parece ser mais signicativo pode ser rejeitado ou no. Se cada teste individual representado por um valor-p, o mtodo descendente descrito da seguinte maneira. Consideramos as constantes
1 2 . . . s .
Sejam
(2.4)
p(1) , . . . , p(r) , a ordenao de p1 , . . . , pr . r = 1, . . . , n,
Se
p(1) 1 , nenhuma hiptese rejeitada.

associadas a
Caso contrrio, para rejeitadas se,
as hipteses
H(1) , . . . , H(r) ,
p1 , . . . , p r ,
so
p(1) < 1 , . . . , p(r) < r .

Em suma, o procedimento descendente inicia-se com o valor-p mais signicativo e segue rejeitando as hipteses contanto que seus valores-p sejam pequenos. Em contrapartida, um procedimento ascendente inicia-se avaliando o valor-p menos signicativo. Para o conjunto de constantes dado em (2.4), todas as hipteses so rejeitadas se
p(n) < n .
Caso contrrio, para
r = n, n 1, . . . , 1, as hipteses H(1) , . . . , H(r)
so rejeitadas se
p(n) n , . . . , p(r+1) r+1
mas
p(r) < r .
Os mtodos de Holm e de Hochberg que veremos adiante so exemplos de procedimentos descendentes e ascendentes, respectivamente.
2.2.4
Mtodos fechados
O mtodo proposto por Holm (1979), bem como o mtodo ainda mais poderoso
dado por Hommel (1988), que veremos na sequncia deste captulo, so baseados no princpio dos testes fechados de Marcus et al. (1976), que segundo Hochberg & Tamhane (1987) podem ser vistos como mtodos gerais para construo de procedimentos de testes descendentes. A verso deste procedimento que daremos a seguir pode ser vista em
2.
13
Hommel (1986, 1988). Seja
H1 , . . . , Hn
uma coleo de
hipteses. Denimos todas as possveis com-
binaes dos subconjuntos destas hipteses como em que
HI = {Hi : i I },
para todo
I Q,
o conjunto de todos subconjuntos no vazios de {1,2,. . . ,n}.
Suponhamos
que para cada
HI
existe um teste baseado numa estatstica
TI . TJ
Para um dado
, HI
rejeitado se cada
HJ
rejeitado ao nvel
pela estatstica
correspondente, em que
J Q
J I. HI
A probabilidade de uma ou mais rejeies falsas quando testamos todas menor ou igual a
as hipteses
como mostra o prximo teorema.
Teorema 2.1 (Marcus et al. (1976)).

a FWER no sentido forte ao nvel
O procedimento de testes fechados (PTF) controla
Demonstrao. Seja
seja Se
{Hi , i I }
uma coleo qualquer de hipteses nulas verdadeiras e
HI = {Hi : i I },
em que
algum subconjunto desconhecido de
{1, 2, . . . , n}. A
como o
vazio, no pode haver erro tipo I, ento consideramos
I = . B
Denimos
evento em que ao menos uma hiptese verdadeira rejeitada.
Hi
rejeitada e
o evento em que
HI
O procedimento de testes fechados rejeita uma hiptese somente se, todas as hipteses que implicam
Hi
verdadeira se, e
Hi ,
em particular
HI ,
so testadas ao nvel
e so rejeitadas; e desde que o teste de
Hi
tambm seja signicante ao nvel
Assim,
podemos tomar
A = A B,
FWER
ento sob
HI
(2.5)
= P {A} = P {A B } = P {B }P {A|B } . P {B } HI ,
quando
A ltima desigualdade segue desde que desigualdade
HI
verdadeira.
Como a
(2.5)
se mantm em qualquer
o teorema est provado.
Para aplicar o PTF podemos inicialmente comear com o teste global
HI ={Hi :
i = 1, 2, . . . , n}.
ao nvel
Se este teste rejeitado ao nvel
, o procedimento de teste ainda continua
para cada subconjunto com
n1
hipteses. Enquanto as hipteses continuam
sendo rejeitadas ao nvel hipteses individuais
o teste continua at atingir subconjuntos de tamanho um: as
Hi .
2.
14
Para ilustrar o PTF podemos analisar o diagrama a seguir, em que consideramos as hipteses
H1 , H2 , H3
H4
e tomamos
HI
como uma hiptese signicante.
H1234 H123 , H124 , H134 , H234 , H23 , H24 , H34 , H14 , H13 H12 H1 , H2 , H3 , H4
Diante desta situao, observamos que apenas a hiptese com
H1
rejeitada pelo PTF. Embora
H2
seja signicante, no rejeitada pelo PTF, pois nem todas interseces so signicantes.
HJ ,
{2} J {1, 2, 3, 4}
Como visto em Wright (1992) o procedimento de teste fechado pode ser modicado de modo a gerar um valor-p ajustado para cada valor-p no ajustado da estatstica se
HI .
Isto feito tomando como
pI
TI
para testar
HI .
A hiptese
HI
rejeitada somente
pJ ,
para todo
HJ , pJ .
tal que
J I.
Portanto, o valor-p ajustado para
HJ
deve
ser o maior dos valores hiptese individual
No caso geral, a m de obter um valor-p ajustado para cada
Hi
seria necessrio conduzir o teste e obter o valor-p no ajustado O nmero total de testes que devem ser
para cada possvel subconjunto de hipteses. realizados portanto
n n i=1 i
= 2n 1.
Felizmente, em certos casos existem atalhos
para isto, tal como o procedimento de Holm que veremos adiante.
2.3
Procedimentos de Bonferroni
2.3.1
Bonferroni Clssico
A desigualdade de Bonferroni frequentemente utilizada na realizao de testes
mltiplos a m de denir um limite superior sobre o nvel de signicncia conjunto (Miller, 1981).
O uso desta desigualdade na teoria dos testes mltiplos usualmente
chamada de procedimento de Bonferroni. Seja e
T1 , . . . , Tn
um conjunto de
n estatsticas para testar as hipteses H1 , . . . , Hn
p1 , . . . , p n
os valores-p correspondentes a estas estatsticas. Pelo procedimento clssico
2.
15
de Bonferroni, a hiptese nula
H0 =
n i=1
Hi
rejeitada se qualquer valor-p menor que
. Alm disso, a hiptese
Hi
especca rejeitada para cada
pi
com
i = 1, . . . , n.
preferidos
Cada
escolhido de modo que sua soma seja igual a
Geralmente, os
so todos iguais a
/n,
mas alocaes diferentes podem ser utilizadas.
O mtodo de Bonferroni controla a FWER. A vericao deste argumento est na sequncia e segue quase que imediatamente da desigualdade de Bonferroni. Consideramos
pi wi
o valor-p para testar de
Hi , tal que cada hiptese Hi
pode ser vista como um subconjunto para qualquer
Assumimos especicamente que
P {p u} u
u (0, 1)
qualquer
P wi .
Notemos que no necessrio que a distribuio de
pi
seja uniforme em
(0, 1)
sempre que
Hi
verdadeira.
Teorema 2.2
(Lehmann & Romano (2005))
Se para cada
i = 1, . . . , n,
as hipteses
Hi
so rejeitadas quando
pi /n, .
ento a FWER para os testes mltiplos de
H1 , . . . , Hn
se mantm menor ou igual a
Demonstrao. Suponhamos que as hipteses

denotando a cardinalidade de
Hi
com
iI
sejam verdadeiras, com
|I |
I.
Da desigualdade de Bonferroni temos que,
FWER
= P {rejeitar =
iI
qualquer
Hi
com
i I}
iI
P {rejeitar Hi }
P pi n
i I
|I | /n . n
Como vemos, este procedimento clssico controla satisfatoriamente a FWER. Todavia, em algumas situaes bastante conservativo, isto , o valor da FWER real s vezes muito menor que o nvel
estabelecido.
O mtodo de Bonferroni um exemplo de teste de etapa nica que tem como caracterstica marcante o fato de poder ser aplicado em qualquer situao de inferncias simultneas. Contudo, nos mtodos de uma etapa o controle da FWER tem a consequncia de que quanto maior o nmero de hipteses na famlia, menor o poder para testar as hipteses individuais. Procedimentos de etapas mltiplas superam esta desvantagem, e por isso que os MCMs vistos como melhoramentos do mtodo clssico de Bonferroni apresentam mais de uma etapa.
2.
16
2.3.2
Procedimento de Bonferroni de rejeio sequencial

Holm (1979) props um mtodo descendente que cou conhecido na literatura
como procedimento de Bonferroni de rejeio sequencial ou procedimento de Holm. Este mtodo denido por meio dos valores-p,
p1 , . . . , p n ,
dos
testes individuais.
Consideramos estes nveis descritivos dos teses ordenados denotados por e
p(1) , . . . , p(n)
H(1) , . . . , H(n)
as hipteses associadas. Dessa forma, o procedimento de Holm pode ser
denido atravs das seguintes etapas:
Passo 1.
Se
p1 > /n,
as hipteses
H1 , . . . , Hn
no so rejeitadas e o procedimento
termina. Se nvel
p1 /n,
rejeitamos
H(1)
e o teste continua com
n1
hipteses testadas ao
/(n 1); p1 /n,

mas
Passo 2. Se
p2 > /(n 1),

rejeitamos
no rejeitamos
H2 , . . . , Hs
e paramos. Se
p1 /n
p2 /(n 1), /(n 2);
H(2)
alm de
H(1)
e o teste continua com
m2
hipteses ao nvel
Em suma, o procedimento continua desta maneira rejeitando
Hi
quando
p(j ) /(n j + 1),

para todo
j = 1, . . . , i.
O teorema dado na sequncia mostra que o mtodo de Holm controla a FWER ao nvel
em associaes livres (free combinations ) das hipteses.
Esta denio de
associaes livres tem o objetivo de salientar que todos os subconjuntos de hipteses nulas poderiam aparecer como conjunto de hipteses verdadeiras. Pode haver situaes em que nem todos os subconjuntos so permitidos por algum motivo, por exemplo, em situaes em que a verdade de duas hipteses implica a verdade ou a falsidade de uma terceira hiptese. importante ser observado que um nvel de signicncia mltiplo
para algumas combinaes restritas impe menos condies no procedimento de teste em relao ao nvel de signicncia mltiplo em associaes livres, ou seja, um procedimento de teste com nvel mltiplo
em combinaes livres mantm o nvel mltiplo
para
qualquer tipo de combinaes restritas.
Teorema 2.3 (Lehmann & Romano (2005)). No procedimento de Holm a FWER menor
2.
17
ou igual a
. Hi
com
Demonstrao. Suponha
i I j
o conjunto das hipteses verdadeiras.
Assim,
P wi
se, e somente se,
i I.
Seja
o menor ndice satisfazendo
pj = min pi .
i I
Note que
j n | I | + 1.
O procedimento de Holm comete uma rejeio falsa se
p(1) /n, p(2) /(n 1), . . . , p(j ) /(n j + 1),

implicando que
min pi = p(j ) /(n j + 1) |I | .

iI
Logo, pela desigualdade de Bonferroni, a probabilidade de uma rejeio falsa dada por
min pi / |I |
i I
iI
P {pi / |I |}
i I
/ |I | .
Em quase todas as situaes o procedimento de Holm tem probabilidade estritamente maior de rejeitar uma hiptese falsa em relao ao procedimento clssico de Bonferroni. O ganho de poder obtido usando o procedimento de Holm ao invs O ganho pequeno se todas as
de Bonferroni depende muito da hiptese alternativa.
hipteses forem quase verdadeiras, mas pode ser considervel se as hipteses forem completamente falsas (Holm, 1979).
2.4
Mtodo de Simes
Entre os procedimentos vistos como melhoramentos do mtodo clssico de Bonferroni, um dos que recebeu bastante ateno ao longo dos anos e que damos grande importncia neste trabalho foi proposto por Simes (1986). Consideremos um conjunto de
n hipteses nulas, Hi (i = 1, . . . , n), e suponhamos
que para cada hiptese individual temos uma estatstica do teste apropriada, tal que os
2.
18
valores-p oriundos dos testes das
hipteses nulas so
p1 , . . . , p n .
O mtodo formulado
por Simes tem o propsito de testar a hiptese nula global de signicncia
H0 =
n i=1
Hi
a um nvel
pr-estabelecido, em termos dos valores-p das estatsticas do teste,
sugerindo a rejeio de os valores-p ordenados.
H0
se
p(i) i/n
para ao menos um
i,
em que
p(1) , . . . , p(n)
so
Devido regio de rejeio do mtodo de Simes conter a regio de rejeio do mtodo de Bonferroni, este procedimento modicado claramente mais poderoso que o mtodo clssico. Tambm foi observado via simulao em Simes (1986), que esta
melhoria do poder bastante signicante quando as estatsticas dos testes so altamente correlacionadas. Em relao FWER, foi provado que o procedimento modicado mantm o controle a um nvel independentes.
pr-estabelecido apenas quando as estatsticas do teste so
Contudo, Simes (1986) conjecturou via simulao que este controle se
mantm quando as estatsticas so dependentes com algumas distribuies especcas: o valor absoluto da normal multivariada e um certo tipo de distribuio gama multivariada. Sarkar (1998) provou analiticamente que a conjectura de Simes verdadeira para uma classe geral de distribuies multivariadas com dependncia positiva, caracterizada pela condio multivariada totalmente positiva de ordem 2 (MTP2 ), e para algumas misturas de MTP2. A denio e algumas propriedades do conceito MTP2 esto na
sequncia e podem ser vistos detalhados em Karlin & Rinott (1980). Seja
X =
n i=1
Xi
um produto de espaos totalmente ordenados
Xi , i = 1, . . . , n,
com a ordenao parcial denida da seguinte maneira: crevemos para
para qualquer
x, y X ,
es-
x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) satisfazem xi yi em Xi , i = 1, . . . , n. Consideramos x y = (max(x1 , y1 ), . . . , max(xn , yn )) e x y =

se
x y
(min(x1 , y1 ), . . . , min(xn , yn )).
Denio 2.1. Uma para todo x, y X ,
funo
f : X [0, )
dita ser MTP2 (TP2 quando
n = 2)
se
f (x y)f (x y) f (x)f (y).

Um vetor
n-dimensional,
X = (X1 , . . . , Xn ), ou sua distribuio chamado MTP2 se sua
densidade MTP2 .
Resultado 2.1.
Se
f1 (x)
f 2 ( x)
so ambas MTP2 em
X,
ento
f1 (x)f2 (x)
MTP2 .
2.
19
Resultado 2.2.
Se
f (x)
MTP2 em
X,
ento
...
f ( x)
i=m+1
dxi
MTP2 em
m i=1
Xi .
Agora, enunciamos de maneira anloga a Sarkar (1998) o teorema que leva prova da conjectura de Simes.
Teorema 2.4.
MTP2 ,
Sejam
X(1) . . . X(n)
e
as componentes ordenadas de um vetor aleatrio
X = (X1 , . . . , Xn ),
Fi
a funo de distribuio acumulada marginal de
Xi .
Ento, temos as seguintes armaes.
(i) Para
a1 , . . . , an ,
xados
n
P X(1) a1 , . . . , X(n) an
se
1 1 n
Fi (an ),
i=1
(2.6)
Fi (aj )/j
no decrescente em
j = 1, . . . , n
para todo
i = 1, . . . , n.
(ii) Para
b1 , . . . , bn ,
xados
n
P X(1) b1 , . . . , X(n) bn
se
1 n
Fi (a1 ),
i=1
(2.7)
i (bnj +1 )/j F
no decrescente em
j = 1, . . . , n
para todo
i = 1, . . . , n,
em que
(x) = F
1 F (x).
Observao 2.1.
e que, para cada
Suponhamos agora que
Xi, s
tm uma distribuio marginal comum
i = 1, . . . , n ,
o valor-p aleatrio
pi
correspondente a
Hi
baseado em
um teste unilateral esquerda ou direita em para um teste unilateral esquerda e como termos de
Xi .
Desde que
pi
denido como
F (Xi )
(Xi ) F
para um teste unilateral direita, em
pi ,
as desigualdades
(2.6)
(2.7)
so equivalentes a
P p(i) ci , i = 1, . . . , n 1 cn ,
em que
0 < c1 . . . cn < 1 ci = i/n

para todo
so tais que
ci /i
no decrescente em
i = 1, . . . , n.
Denindo
i,
conclumos a prova da conjectura de Simes.
2.
20
Karlin & Rinott (1980) deram uma lista de distribuies que satisfazem a condio
(MTP2 )
sob a hiptese nula. No entanto, vamos considerar uma subclasse dessas
distribuies que satisfazem uma outra condio que pode ser vista em Sarkar & Chang (1997). Esta condio ser a chave para mostrar que o mtodo de Simes controla a FWER quando a estatstica envolvida nos testes a log-rank. Vamos descrever essas distribuies em termos das estatsticas dos testes, Sejam
X1 , . . . , X n .
X1 , . . . , X n ,
variveis aleatrias contnuas que, sob as hipteses nulas so
condicionalmente i.i.d. dada uma v.a.
Z,
com
Xi |Z = z f (xi , z ), i = 1, . . . , n, Z.
A densidade conjunta de
em que
f ( xi , z )
TP2 em
(xi , y ),
g (z )
a densidade de
X1 , . . . , X n
sob a hiptese nula, que da forma
f (xi , z )g (z )dz,
i=1
(2.8)
MTP2 . Este fato segue dos Resultados
(2.1
2.2).
Sarkar & Chang (1997) provaram que o mtodo de Simes controla a FWER quando as estatsticas tm densidade conjunta da forma
(2.8).
Distribuies como estas
aparecem muitas vezes em testes mltiplos. Por exemplo, a distribuio normal padro multivariada equicorrelacionada, o valor absoluto da
multivariada central, a
mul-
tivariada central e o valor absoluto da normal padro multivariada equicorrelacionada. Este ltimo exemplo est detalhado adiante, mas para entend-lo precisamos da prxima observao que pode ser vista em Curnow & Dunnett (1962).
Observao 2.2.
conjunta por
Sejam
X1 , . . . , X n , n ij ,
variveis aleatrias normais padronizadas com
coecientes de correlao
e denotamos a funo densidade de probabilidade (f.d.p)
f (t1 , . . . , tn ).
A funo de distribuio acumulada (f.d.a) denida como
Fn (xi , {ij }) = P {Xi < xi ; para

x1 x2 xn
todo
i}
(2.9)
Em algumas situaes a integral
...

f (t1 , t2 , . . . , tn )dt1 dt2 . . . dtn .
(2.9)
pode ser reduzida a uma integral simples, por
exemplo, quando a matriz de correlao tem a estrutura
ij = i j ,
para
i=j
1 n+1
i 1.
Dessa maneira, as variveis
Xi 's
podem ser representadas em termos de
2.
21
variveis normais padronizadas independentes
Y1 , . . . , Yn , Z,
de modo que
Xi = (1 )1/2 Yi + 1/2 Z
para i=1,2,. . . ,n.
(2.10)
Como mencionado em Dunnett & Sobel (1955), quando
ij = > 0, i =
temos a estrutura
de correlao anterior satisfeita, uma vez que esta ocorre quando como os
Dessa forma,
Xi 's so mutualmente independentes e utilizando a representao dada em (2.10),
temos que
Fn (xi , {}) =

P
n
Yi <
(xi 1/2 z ) (1 )1/2 xi 1/2 z (1 )1/2
f (z )dz
(2.11)
=
i=1
(z )dz,
em que
()
()
representam respectivamente a f.d.a e a f.d.p da
N (0, 1).
Assim, a
densidade conjunta de
{ Xi }
i=1
1 (1 )1/2
xi 1/2 z (1 )1/2
(z )dz.
(2.12)
Exemplo 2.1
(Sarkar & Chang (1997))
A f.d.p da distribuio do valor absoluto da
normal multivariada equicorrelacionada satisfaz
(2.8), ento a conjectura de Simes vlida
quando as estatsticas dos testes tm esta distribuio. Primeiramente suponha que temos independentes com
n+1
populaes com distribuio normal
N (i , 2 ),
com mdia
desconhecida e varincia conhecida dada por
2,
i = 1, . . . , n.
Queremos testar as hipteses
H : n H 0 i=1 i H 0 : n i=1 Hi
em que,
i : i = 0 para ao menos um i, com base em amostras Hi : i = 0 para todo i e H m0

de populaes
independentes, uma de tamanho para cada uma das outras
N (0 , 2 )
e amostras de tamanho
m1
n populaes.
Vamos o considerar o valor absoluto da seguinte
2.
22
estatstica do teste para avaliar
Hi
contra
i H m0 m1 (m0 + m1 )
1/2
i X 0 ) (X Xi =
para
, i = 0, . . . , n.
(2.13)
i = 1, . . . , n,
em que
i X
a i-sima mdia amostral com
A distribuio
de probabilidade conjunta desta estatstica sob
H0
o valor absoluto da normal multiva-
riada equicorrelacionada com mdia zero, varincia um e correlao Embora
= m1 /(m1 + m0 ).
seja conhecido neste exemplo, nenhum valor especco realmente necessrio
para mostrar que a densidade de probabilidade tem a forma essa distribuio depende de perda de generalidade que
(2.8).
Alm disso, como
somente atravs do seu valor absoluto, podemos supor sem

no negativo. Dessa maneira, usando a representao de
{Xi }
como
como em
(2.10),
pode ser notado que condicionalmente, dado
Y0 = z , Xi2, s
so i.i.d
(1 )12
em que
z 2 1
, m
graus de
2 m ()
denota uma varivel aleatria qui-quadrada no central com
liberdade e parmetro de no centralidade qui-quadrada central com
, e Y02 2 1
representa uma varivel aleatria
grau de liberdade.
Dessa forma, a densidade conjunta do
valor absoluto da normal multivariada equicorrelacionada com mdia zero, varincia um e correlao
0
com de
i=1
2xi f 1
x2 z i , 1 1 12 ()
em
, x
e
g (z )dz g (z )
(2.14)
f (x, )
em
representando a densidade de Como
representando a densidade
2 1
z.
f (x, ),
com
x, 0,
conhecida por ser TP2 em
(x, )
(Karlin,
1968), conclumos que a densidade (2.14) da forma (2.8).
Com esse exemplo, vemos
que quando as estatsticas do teste tm como distribuio o valor absoluto da normal multivariada equicorrelacionada, a conjectura de Simes vlida.
2.5
Mtodo de Simes para testes individuais
Nesta seo enunciamos os mtodos propostos por Hochberg (1988), Hommel (1988) e Rom (2013) que podem ser vistos como extenses do mtodo de Simes para realizar inferncias em hipteses individuais uma vez que a hiptese global
H0
rejeitada.
2.
23
2.5.1
Mtodo de Hochberg
O procedimento de etapas mltiplas proposto por Hochberg (1988) pode ser inter-
pretado como uma verso do tipo ascendente do procedimento de Bonferroni. Enquanto o procedimento de Holm inicia o teste analisando o menor valor-p, o mtodo de Hochberg inicia o teste observando o valor-p menos signicativo. Este mtodo fundamentado
no princpio dos testes fechados (Marcus et al., 1976), o que intensica o controle da FWER no sentido forte. Deve ser assumido neste procedimento que a coleo de hipteses satisfaa a condio de combinaes livres (Seo 2.3.2). Sejam teses
p(1) , . . . , p(n) ,
os valores-p ordenados de
estatsticas para testar as hip-
H1 , . . . , Hn .
Esta simples extenso do mtodo de Simes pode ser ilustrada sucinta-
mente atravs das seguintes etapas:
Passo 1.
Se
p(n) ,
ento todas as hipteses
Hi
com
i = 1, . . . , n
so rejeitadas e
paramos; caso contrrio seguimos para o Passo
2.
Passo 2. Se
p(n1) /2, ento todas as hipteses H(i) , com i = 1, . . . , n 1 so rejeitadas 3.
e paramos; caso contrrio avanamos para o Passo
. . . Passo
n.
Se
p(1) /n,
rejeitamos
Hi , i = 1,
e paramos.
Em diversas situaes o mtodo de Hochberg mais poderoso em relao ao mtodo de Holm. Contudo, por se tratar de uma extenso do mtodo de Simes, para
garantir o controle efetivo da FWER as estatsticas dos testes precisam ser independentes ou terem distribuio MTP2 (ou certas misturas de MTP2 ).
2.5.2
Mtodo de Hommel
O procedimento proposto por Hommel (1988) testa as hipteses individuais
Hi
por meio do teste de Simes como
TI
no procedimento dos testes fechados. Os clculos deste
mtodo so mais trabalhosos em relao ao mtodo de Hochberg, porm o procedimento de testes fechados no precisa ser feito por completo. (1989) mostrou que o seguinte caminho suciente. Para algum
xado, Hommel
Seja
o nmero de hipteses no
2.
24
maior subconjunto de hipteses para o qual o teste de Simes no signicativo. Ou seja,
j = max{i {1, . . . , n} : P(ni+k) > k/i

Se o mximo no existir, todos rejeitada quando
para todo
k = 1, . . . , i}, Hi
Hi (i = 1, . . . , n)
so rejeitados; caso contrrio,
pi /j . HI
Este procedimento controla o nvel mltiplo
desde que cada
teste de Simes para
tem um nvel de signicncia
Por se tratar de uma extenso
de Simes, este controle mantido se as
estatsticas so independentes ou apresentam
distribuio MTP2 (ou certas misturas delas). O clculo dos valores-p ajustados para o procedimento de Hommel mais simples de entender referindo-se diretamente ao procedimento de testes fechados, que quando realizado completamente exigiria que, para cada hiptese
Hi ,
o valor-p do teste de Simes
possa ser obtido para cada subconjunto de hipteses contendo
Hi .
O valor-p ajustado No entanto, no das
por Hommel ento o maior desses valores-p do teste de Simes. necessrio testar cada subconjunto. Para subconjuntos contendo
hipteses,
suciente testar o nico subconjunto contendo os maiores
(m 1)
valores-p alm de
pi .
Isto poderia ser chamado de subconjunto menos signicativo de tamanho
m que contm
Hi .
Claramente, se o teste de Simes signicativo ao nvel
para esse subconjunto, ser
signicativo ao nvel maior destes
para todos os outros subconjuntos de tamanho
contendo
Hi .
valores-p de Simes o valor-p ajustado de Hommel.
Na sequncia ilustramos o algoritmo extrado de Wright (1992) que calcula o valor-p ajustado pelo mtodo de Hommel. Seja
p(i)
os valores-p sem ajustes ordenados e
b(i)
o valor-p ajustado pelo mtodo de Hommel.
Passo 1. Inicialmente dena Passo 2. Para cada Passo 2a. Para
bi = p i
para todo
i;
m = n, (n 1), . . . , 2 i > (n m),
(nesta ordem), faa o seguinte:
(i) Calcule o valor
ci = (mpi )/(m + i n). ci

dados acima; e denote por
(ii) Encontre o menor dos valores (iii) Se
cmin .
bi < cmin ,
ento temos
bi = cmin .
Passo 2b. Para
i (n m),
2.
25
(i) Seja (ii) Se
ci = min(cmin , mpi ).
ento temos
bi < ci ,
bi = ci .
2.5.3
Mtodo de Rom
O recente mtodo proposto por Rom (2013) uma modicao simples do mtodo
de Hochberg para realizar inferncias sob as hipteses individuais. Consideramos o problema clssico de testar com
hipteses individuais,
H1 , . . . , Hn ,
p1 , . . . , p n ,
os valores-p correspondentes. Assumimos que as hipteses satisfazem a
condio de combinaes livres dada por Holm (1979) (Seo 2.3.2) e que os valores-p correspondentes sejam independentes. Sejam
p(1) , . . . , p(n)
os valores-p ordenados. Este
mtodo pode ser descrito atravs das seguintes etapas:
Passo 1. Se
p(n) ,
ento todas as hipteses so rejeitadas; caso contrrio,
Hn
retida
e seguimos para o Passo 2.
Passo 2. Se
p(n1) 3/2, qualquer hiptese com valor-p menor ou igual a /2 rejeitada; H(n1)
retida e seguimos para o Passo 3.
caso contrrio,
Passo 3. Se
p(n2) 4/6, qualquer hiptese com valor-p menor ou igual a /3 rejeitada, H(n2)
retida e seguimos para o prximo passo, de acordo com o nvel
caso contrrio crtico
Ci = (i + 1)/(2i),
Passo n.
com
i = 2, . . . , n.
p(1)
comparado com
/n.
Rom (2013) mostrou atravs do princpio dos testes fechados que seu procedimento controla a FWER no sentido forte. Via simulao, foi vericado ainda que este
procedimento tem uma ganho de poder maior em relao ao mtodo de Hochberg e se comporta de maneira menos conservativa.
Captulo 3 Modelo e Estatsticas dos Testes

Neste captulo apresentamos o modelo discreto com censura aleatria que utilizamos neste trabalho e as estatsticas que foram empregadas nos testes:
log-rank e
Cramr-von Mises. Introduzimos ainda algumas notaes e propriedades importantes.
3.1
Introduo
Anlises estatsticas para dados discretos tm grande importncia em diversas reas tais como economia, medicina, educao e engenharia. Por exemplo, em economia do trabalho, quando queremos analisar a durao do desemprego, os dados disponveis esto em meses completos ou em dias, e assim, a varivel resposta um valor inteiro. Na rea de nanas, a durao de uma srie de retornos positivos usualmente analisada por perodos inteiros, como
ou
perodos. O mesmo ocorre na educao, o momento da
evaso e o tempo de concluso de um curso de graduao so medidos em semestres. Quando observamos dados ao longo do tempo, uma situao frequente a ocorrncia de alguns dados somente em determinados perodos, isto , sujeitos censura. Para ilustramos isto, uma situao geral de censura direita pode ser descrita se considerarmos
p p W1 , . . . , Wn p
variveis aleatrias positivas independentes representando tempos
de sobrevivncia ou tempos de ocorrncia de algum evento de interesse de uma populao, com
np
itens em
p = 1, . . . , J .
Seja
hp
n
a funo intensidade da
p-sima
populao.
Uma situao tpica ocorre quando
p {Wm }mp=1
so censuradas direita pelas variveis
26
3.
Modelo e Estatsticas dos Testes
27
aleatrias positivas e independentes, so assumidas independentes de observar que
p {Cm }mp=1 .
Estas variveis de censura,
p Cm ,
tambm
p Wm .
Dessa forma, nesse modelo geral de censura podemos
p p p }, , Cm = min{Wm Xm
com
p p = Wmp }, =1 1 { Xm m
p m
indicando se a varivel
p Wm
censurada ou no.
Em um grande nmero de aplicaes de extrema importncia testar a homogeneidade de populaes na presena de censura. O problema est no desenvolvimento de mtodos no paramtricos para testar a hiptese nula
H0 = h1 ( ) = . . . = hJ ( );
em que
X,
o domnio que codica, por exemplo, o tempo de vida em um problema O teste precisa ser consistente para uma grande classe de
de anlise de sobrevivncia. hipteses alternativas.
Diante disto, realizamos neste trabalho os testes com as estatsticas log-rank e Cramr-von Mises. Esta escolha est fundamentada no fato de que a estatstica log-rank um dos mtodos no paramtricos mais utilizados para testar
H0
sob censura aleatria.
Contudo, esta estatstica apresenta a desvantagem de no exibir um poder ao lidar com funes intensidades no proporcionais. Dessa forma, executamos tambm testes com
a estatstica Cramr-von Mises, que como pode ser visto em Leo & Ohashi (2011), considerada ideal para modelos puramente discretos sob censura.
3.2
Modelo para os dados
Introduzimos nesta seo a notao bsica e alguns fundamentos de inferncia para o modelo discreto com censura utilizado neste trabalho. Maiores detalhes deste
assunto podem ser vistos em Fleming & Harrington (1991) e em Leo & Ohashi (2011). Consideramos naturais. Seja
(, F , P)
um espao de probabilidade e
o conjunto dos nmeros denotando a
uma varivel aleatria com valores em
i = P[Y = i]
probabilidade de falha da varivel resposta
(Y )
na
i-sima
i=0
categoria. Assumindo que as Assim, vemos que
categorias so mutuamente exclusivas, temos que
i = 1.
3.
28
uma varivel aleatria discreta. Sejam
duas variveis aleatrias discretas independentes com valores em
N,
descrevendo respectivamente os eventos de interesse e de censura. Fixamos um nmero natural
J 1
e escrevemos
J = {1, . . . , J }. nq
Denotamos
n := (n1 , . . . , nJ ) NJ
NJ :=
max{n1 , . . . , nJ }.
populao, com e
Denimos como
o tamanho da amostra aleatria correspondente
q J.
Para um dado
p J,
seja
(W p , C p )
uma populao, tal que
Wp
Cp
e
so variveis aleatrias discretas independentes que podem ser interpretadas como
respectivamente e seja
Xp
uma varivel aleatria discreta denida por
X p := W p C p = min{W p , C p }.
Para qualquer populao
p J,
tomamos as amostras aleatrias
p p p p )} , Cn {(W1 , C1 ), . . . , (Wn p p
da
(W p , C p ),
tal que
1 np < .
Assumimos ainda que
P[C p = 0] = P[W p =
0] = 0
para qualquer
p J.
Assim, podemos introduzir
p p p Xm := min{Wm , Cm },
p p Vm (i) := 1 1{Xm i}
e o processos de contagem
p p p p Rm (i) := 1 1{Xm i,Xm =Wm }
C,p p p p , Rm (i) := 1 1{Xm i,Xm =Cm }
para
m = 1, . . . , np
i 0.
Os processos de contagem associados
p-sima
amostra
aleatria so dados por
np
np p Rm (i)
e
np C,p Rm (i),
e
R (i) :=
m=1
np
C,np
(i) :=
m=1
np
(i) :=
m=1
p Vm (i);
i 0.
Nesta congurao discreta, pode ser visto em Leo & Ohashi (2011) que a funo intensidade
hp
e o estimador de Kaplan-Meier
np h
so dados respectivamente por
hp (j ) :=
P[W p = j ] , P[W p j ]
j 0,
Rnp (i) np (i) = h 1 1{V np (i)>0} ; i 1. V np (i)
3.
29
3.3
Estatsticas dos Testes
3.3.1
Estatstica log-rank
Nesta seo vamos estender a estatstica log-rank ponderada proposta por Fle-
ming & Harrington (1991) para comparar arbitrria.
populaes discretas na presena de censura
Primeiramente vamos introduzir alguns objetos e denies bsicas. Seja
(i) :=
k=1
V nk (i);
i 0,
o nmero total de risco na categoria
i,
e para um certo
(q, q1 ) J 2
1,
denotamos
nq Un (n q1
, ) :=
1 n
1/2
u(n , )
V nq ( )V nq1 ( ) Vn ( )
(3.1)
em que assumimos que o processo ponderado
u(n ; )
limitado, converge em probabili-
dade para um valor real de uma funo limitada e satisfaz certos pressupostos de mensurabilidade (Leo & Ohashi, 2011). Exemplos concretos de pesos so os processos ponderados de Harrington & Fleming (1982) e Tarone & Ware (1977) dados respectivamente por
Vn ( ) n
R( 1) V n ( 1)
j =0
Rn (j ) 1 V n (j ) (, ) (3.1)
, n NJ , 1,
de modo que
uma funo contnua limitada e
so constantes positivas. Denopor
taremos a classe de processos ponderados da forma Na sequncia, para um dado
K.
q J,
denimos
Aq := {(x, y ) J J ; x = y, x =
q, q = q, 1 x < y J }
Para
e para
k = r,
denimos
A(k, r) := {q1 J ; q1 = k, q1 = r}. J J

dada por
n NJ
1,
seja
(n , ) Q
uma matriz quadrada simtrica
(n , )]rk := [Q
2 ( ), k,n
se se
k=r k = r,
n (k, r, ),
3.
30
em que
q 2 |Unqq1 (n , )|2 nq nq1 ( )] + |Unq1 (n , )| h nq ( )[1 h nq ( )] 1 ( )[1 h h V nq1 ( ) V nq ( )
2 ( ) := q,n
q1 =q
+ 2
(q1 ,q2 )Aq
e
Unqq1 (n , )Unqq2 (n , ) nq nq ( )], q J , h ( )[1 h V nq ( )
n (k, r, ) :=
q2 =r
nk nr Un (n , )Un (n , ) q1 q1 q1 A(k,r) nk (n Un q1 q1 =k
nq1
( )
q1 ( )] q1 ( )[1 h h
nr (n , ) , )Un k
V nk ( )
nk nr (n , ) (n , )Un Un r q2
k ( )[1 h k ( )] h r ( )[1 h r ( )], h
V nr ( )
se
r=k
em
J.
Consideramos agora os seguintes limitantes das categorias
du = sup
: min q ( ) > 0 ,
q J
(3.2)
du n = sup
Podemos vericar que e
: min V nq ( ) > 0 , n NJ .
q J
(3.3)
u du n d
em probabilidade com Se
n ,
tal que
1 du
du n
para cada
n NJ .
q J,
ento inspirados pela estatstica log-rank
ponderada proposta por Fleming & Harrington (1991) podemos introduzir a seguinte estatstica linear geral para
J -amostras.
j nq nq ( ) h nq1 ( )] Un (n , )[h q1 =1 q1 =q j 1/2
LRq (n , j ) := 1 n
=
=1
u(n , )V
nq
Rnq ( ) Rn ( ) . ( ) V nq ( ) Vn ( ) K.
Sob
Proposio 3.1.
Assumimos que
pertence classe
H0 ,
o vetor aleatrio
u u T LR(n , du n ) := (LR1 (n , dn ), . . . , LRJ (n , dn ))
(3.4)
3.
31
converge em distribuio para uma varivel Gaussiana multivariada
N (0, (du )) com n
n , du ), tal que a matriz de covarincia (du ) pode ser estimada com consistncia por ( n
em que
i
n , i) := (
=1
(n , ), i 1. Q
Similarmente ao caso contnuo, a soma dos componentes do vetor aleatrio em
LR
(3.4)
nula.
Assim, consideramos o vetor
LR
sem o ltimo componente como na
sequncia
u u T LR0 (n , du n ) := (LR1 (n , dn ), . . . , LRJ 1 (n , dn ))

Dessa forma, denimos a estatstica log-rank ponderada associada a maneira
(3.5)
LR0
da seguinte
u T u 1 u J X 2 (n , du n ) := LR0 (n , dn ) 0 (n , dn ) LR0 (n , dn ), n N ,
(3.6)
em que
0 (n , )
dado por
n , ) (
mas sem a ltima linha e coluna. Pode ser vericado
que a estatstica liberdade, em que
(3.6)
tem distribuio assinttica qui-quadrada com a inversa usual.
J 1
graus de
1 n , du ( n )
A funo poder pode ser obtida atravs da seguinte expresso
LRq (i) =
=1 q1 =q
nq nq ( ) h nq1 ( ) = Un (n , ) h q1
i nq Un q1 =1 q1 =q
1{V nq1 ( )>0} Y nq ( )1 1{V nq ( )>0} Y nq1 ( )1 + n V nq ( ) V q1 ( )

i nq Un [hq ( ) hq1 ( )] . q1 =1 q1 =q
3.3.2
Condio MTP2 para a estatstica log-Rank

Nesta seo vericamos que a estatstica log-rank ponderada satisfaz a condio
MTP2 . Alguns conceitos e resultados empregados na demonstrao podem ser encontrados no Apndice A.
3.
32
Neste trabalho focamos no problema de MCMs de testar
J 1
populaes com
uma populao controle ou referncia. Consideramos a hiptese nula
Hq : hq ( ) = hJ ( ),
e para qualquer
q = 1, . . . , J 1.
Para cada hiptese individual construmos a estatstica
log-rank ponderada correspondente em valor absoluto,

i nq nJ ( ) nq ( ) h (n , ) h UnJ i
X nq (i) =
=1
, q = 1, . . . , J 1,
2 =1 q ( )
com
nq nJ |Un (n , )|2 nq |UnJ (n , )|2 nJ q nJ 2 ( ) 1h nq ( ) h ( ) 1h ( ) + q ( ) = h V nJ ( ) V nq ( )

q UnJ
representando os processos ponderados. Da Observao A.2 segue que
X nq (i)
tem
como distribuio assinttica o valor absoluto de uma normal padro. Suponhamos que as vveis assintticos,
J 1 hipteses nulas, H1 , . . . , HJ 1 , tenham valores-p obserbaseados em
p1 , . . . , pJ 1 ,
X n1 (i), . . . , X nJ 1 (i). {X nq (i) : q =
Teorema 3.1.
1, . . . , J 1}
Sob a hiptese nula
H0 ,
a distribuio conjunta limitada de
satisfaz a condio MTP2 .
Demonstrao. De acordo com o Exemplo 2.1, suciente mostrar que o vetor aleatrio
{X nq (i) : q = 1, . . . , J 1}
tem como distribuio assinttica o valor absoluto de uma Para isto, aplicamos alguns argumentos que Consideramos agora o
normal multivariada equicorrelacionada.
podem ser vistos no Apndice A (Lema A.2 e o Teorema A.2).
martingale array diference

q J Ym ( ) Ym ( ) , n n V q( ) V J( )
n nq m,q ( ) = Un (n , ) J
q = 1, . . . , J 1,
e para qualquer
a RJ 1 , 0
and
n n n m ( ) = a1 m, 1 ( ) + . . . + aJ 1 m,J 1 ( ),
m = 1, . . . NJ .
3.
33
Ento, temos que
NJ m=1
n n E | m ( ) |2 | Gm 1 = NJ
J 1 NJ k=1 m=1
n n | ak |2 E | m,k ( ) |2 | Gm 1 +
2
1r<kJ 1 m=1
Sabemos ainda que
n n n ( ) | Gm ( )m,k ar ak E m,r 1 = T1 (n , ) + T2 (n , ),
1.
J 1
T1 (n , )
k=1
q J ak q,J ( )hq ( )[1 hq ( )] + q,J ( )hJ ( )[1 hJ ( )] ,
em probabilidade, para qualquer
1. ar ak
Alm disso, pode ser vericado que
T2 (n , ) = 2
1r<kJ 1
nr nk Un ( )Un ( ) nJ J J nJ ( ) h ( ) 1h n J V ( )
em probabilidade.
2
1r<kJ 1
k,r ar ak J ( )hnJ ( ) [1 hnJ ( )] ,
Se considerarmos os processos ponderados de Tarone e Ware ou de Harrington e Fleming, podemos concluir de algumas expresses dadas no Apndice (equaes A.3, A.4 e A.8) que, sob
H0 ,
as constantes
q J q,J ( ) = q,J ( ) = ( )
k,r J ( ) = ( )
para todo
so independentes
dos ndices aleatrio
k, r, J .
Assim, sob
H0 : h1 ( ), . . . , hJ ( ) = h( ),
= 1, . . . , i,
o vetor
NJ n m=1 m,q (
) : q = 1, . . . , J 1} (i) =
k=1
dado por
tem distribuio assinttica com mdia zero e
operador de covarincia
J 1
(i), a
J 1
ak {( )h( )[1 h( )] + ( )h( )[1 h( )]} + ar ak ( )h( ) [1 h( )] =

1r<kJ 1
2
J 1
ak {2( )h( )[1 h( )]} + 2

k=1 1r<kJ 1
ar ak ( )h( ) [1 h( )] .
Desde que
2 ( ) uma estimador consistente da varincia, aplicamos os mesmos argumen q {X nq (i) : q = 1, . . . , J
tos da prova do Teorema A.2 para obtermos que o vetor aleatrio
1}
tem como distribuio assinttica o valor absoluto de uma normal multivariada com
coeciente de correlao
( )h( )[1 h( )] =1 ( h( )[1 h( )])

=1
3.
34
3.3.3
Estatstica de Cramr-von Mises

Introduzimos agora a estatstica de Cramr-von Mises para o modelo discreto ge-
ral induzido por
Xp
sob censura arbitrria direita para innitamente muitas categorias.
Consideramos aqui as primeiras categorias observadas pela seguinte sequncia de tempos de parada
dn := inf { : Rn ( ) > 0},

tal que
(3.7)
Rn (i) :=
J k=1
Rnk (i)
o nmero total de eventos de interesse para a categoria
i.
Podemos ver que
dn d
em probabilidade com
tal que
d := inf { : b1 h1 ( ) + . . . + bJ hJ ( ) > 0}.
(3.8)
Diante disto, a estatstica de Cramr-von Mises denida por
du n
J 1
CV M (n
, dn , du n
) :=
k=dn q =1
2 (k )LR2 (n , k ), (q,n) q
n NJ .
(3.9)
Em algumas situaes fundamental testar
H0
para categorias possivelmente
innitas, pois no sabemos a priori a existncia de categorias maiores que
tal que, e
q (i) = 0
para cada
p J.
Dessa maneira, necessrio assumir que
du
portanto, somos forados a trabalhar num espao
de dimenso innita constitudo A estatstica dada em
pelas sequncias de quadrado somvel de nmeros reais. para possivelmente innitas categorias
(3.9)
(du )
foi totalmente baseada na construo
de um processo Gaussiano adequado, com valores no
e com operador de covarincia que satisfazem
Y0 (d , du ) :
e autovalores
{sq ; s 1, q = 1, . . . , J 1}
J 1
sq < .
s=1 q =1
A distribuio assinttica desta estatstica no livre de distribuio devido presena inerente de saltos persistentes sobre
N.
Na verdade, depende de
{sq ; s 1, q =
1, . . . , J 1},
que por sua vez depende dos dados. A m de proporcionar um teste vivel,
construmos um estimador do operador
Y0 (d , du ) que pode ser obtido da maneira que est
3.
35
na sequncia. Introduzimos o conjunto aleatrio de categorias observveis
L(dn , du n ) =
{dl n n NJ
n du n ; R ( ) > 0}
e
e denotamos sua cardinalidade por
L(n ).
Para um dado
, denimos
u 0 (dl Y n , dn )a
como uma sequncia real, em que as
(J 1)L(n )-simas
coordenadas so dadas por
0 (dn , du Y n )(a1 , . . . , a(J 1)L(n ) ),

e
0 (d , du ) Y n n
o operador autoadjunto denido pela forma quadrtica sobre
R(J 1)L(n
a seguir
0 (d , du )a, a Y n n
=
j L(dn ,du ) n
0 (j ) 0 (j )M 0 (j )aj , aj M
RJ 1
+
{ <j : ,j L(dn ,du n )}
0 (j ) 0 (j )M 0 (j )aj , aj M 0 (j ) 0 (j )M 0 (j )aj , aj M
{j< : ,j L(dn ,du n )}
RJ 1
RJ 1 ,
em que
1,n , . . . , J 1,n ()) e a R(J 1)L(n 0 () := diag( M
. Portanto,
0 (d , du ) : Y n n
um sequncia bem denida de operadores autoadjunto de postos nito.
Teorema 3.2.
tivamente por classe
Sejam
(d , du , dn , du n )
as categorias e tempos de paradas denidos respecpertena
(3.8), (3.2), (3.7) e (3.3), e assumimos que o processo ponderado U H0

J 1
K.
Ento, sob
CV M (n
, dn , du n
)
s=1 q =1
sq 2 sq
em distribuio com
n ,
tal que
{sq ; s 1, q = 1, . . . , J 1}
Se
so os autovalores do operador de covarincia
Y0 (d , du ).
Xq
quadrado integrvel, para cada

L(n ) J 1
qJ
temos que
J 1 2 1A(n ) sq sq 1
(n ) :=
s=1 q =1
sq 2 sq ,
s=1 q =1
(3.10)
em distribuio com
n ,
em que
{ sq ; s s L(n ), q = 1, . . . , J 1}
so os
3.
36
autovalores do estimador da covarincia
0 (d , du ) Y n n
0 (d , du ) A(n ) := {Y n n
de modo que
no negativo},
P(A(n )) 1
com
n . p
para testar a hiptese
Notamos de (3.10) que o valor
H0
dado por
P[(n ) >
CV M (n , dn , du n )|H0 ].
A lei de aproximao
(n )
uma soma ponderada de variveis
aleatrias independentes e portanto, h algoritmos disponveis para avaliar o valor-p que podem ser vistos em Duchesne & Lafaye De Micheaux (2010).
Captulo 4 Estudo de simulao

Neste captulo realizamos um estudo de simulao com o objetivo de comparar o comportamento dos procedimentos de Bonferroni, Holm, Hochberg, Hommel e Rom, em relao ao controle da FWER e ao ganho de poder quando as estatsticas envolvidas nos testes so a log-rank e a Cramr-von Mises. Focamos no problema de comparar uma populao com uma populao referncia (tratamento versus controle). Trabalhamos com dados censurados provenientes de amostras aleatrias de distribuies discretas (Poisson) e contnuas (exponencial), mas enfatizamos o estudo com dados discretos, com os quais foram analisados trs cenrios distintos em relao censura. Toda a implementao foi desenvolvida em linguagem R (R Development Core Team, 2011) e para todas as circunstncias tratadas neste captulo adotamos o nvel de signicncia mltiplo
= 0, 05.
Para averiguar o controle da FWER dos cinco MCMs escolhidos foram considerados nas simulaes diferentes tamanhos de amostras (TA): e
30, 50, 100, 150, 200, 250
300.
Em todos os casos foram geradas dez populaes da distribuio escolhida, sendo
a primeira utilizada como referncia (controle), resultando em nove hipteses a serem testadas simultaneamente. A m de detectar minunciosamente as diferenas de comportamento entre os procedimentos de Bonferroni, Holm, Hochberg e Rom, avaliamos o poder de duas maneiras distintas. Na primeira estimativa do poder foram geradas
10
populaes de distribuio
Poisson (dados discretos) e exponencial (dados contnuos) da seguinte maneira, respecti-
37
4.
Estudo de simulao
38
vamente
X (1) , . . . , X (9) P ()
e
X (10) P ( + )
X (1) , . . . , X (9) E ()
em que
X (10) E ( + ),
iniciou com algum valor maior que zero e foi sendo incrementado at o poder
atingir a taxa de tivemos
100%.
A primeira populao foi denida como referncia, de modo que
hipteses sendo testadas, sendo uma hiptese falsa.
A segunda estimativa do poder foi calculada por meio da razo entre o nmero de diferenas signicativas detectadas pelo MCM e o nmero total de inferncias. Consideramos os casos em que foram testadas
3, 5
10
hipteses simultaneamente. Em cada
situao criamos todas as conguraes de hipteses falsas, ou seja, quando testamos hipteses, analisamos os casos de para os testes que envolveram
1, 2 e 3 hipteses falsas presentes, e assim sucessivamente

e
10
hipteses.
Na primeira seo deste captulo expomos as anlises realizadas com dados discretos e na segunda seo est apresentado o estudo feito com dados contnuos.
4.1
Dados discretos
Para os estudos de simulaes realizados com dados discretos foram geradas amostras aleatrias de distribuio Poisson e trs cenrios distintos em relao censura foram analisados: no primeiro caso aproximadamente no segundo caso
40%
dos dados foram censurados;
20%
e por m observamos o caso sem censura.
4.1.1
Controle da FWER
Uma vez que dados discretos empregados nas estatsticas log-rank e Cramr-
von Mises no necessita de um tempo computacional muito grande, xamos o nmero de iteraes em
100.000
para podermos detectar da melhor maneira as diferenas de
comportamento entre os MCMs em relao ao controle da FWER. Em cada caso geramos uma amostra aleatria de
10
populaes com distribuio Poisson com parmetros
4.
Estudo de simulao
39
1 , . . . , 10 = 10, sendo a primeira populao denida como controle (referncia).

as situaes em que a censura foi xada em dados censurados) e o caso sem censura.
Criamos dos
11 (40%
dos dados censurados),
13 (20%
Os valores e o comportamento da FWER em funo dos diferentes tamanhos de amostras (TA) das cinco estratgias de comparaes mltiplas empregadas nos testes das estatsticas log-rank e Cramr-von Mises dos trs cenrios de censura escolhidos esto ilustrados na sequncia atravs das Tabelas e
4.1, 4.2
4.3
e por meio das Figuras
4.1, 4.2
4.3.
FWER dos
TABELA 4.1:
MCMs empregados nos testes das estatsticas log-rank e
Cramr-von Mises para diferentes TA com censura xada em

Estatstica Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04782 0,04782 0,04783 0,04813 0,04906 TA=50 0,04823 0,04823 0,04823 0,04846 0,04923 TA=100 0,04837 0,04837 0,04838 0,04864 0,04958
11.
TA=250 0,04799 0,04799 0,04801 0,04823 0,04902 TA=300 0,04902 0,04902 0,04903 0,04928 0,05001
log-rank
TA=150 0,04799 0,04799 0,04801 0,04822 0,04904 TA=200 0,04832 0,04832 0,04834 0,04857 0,04926
Estatstica Cramr-von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,05093 0,05093 0,05096 0,05122 0,05206 TA=50 0,04917 0,04917 0,04918 0,04949 0,05044 TA=100 0,04941 0,04941 0,04943 0,04967 0,05046 TA=150 0,04736 0,04736 0,04736 0,04766 0,04853 TA=200 0,04985 0,04985 0,04985 0,05015 0,05097 TA=250 0,04880 0,04880 0,04881 0,04903 0,05078 TA=300 0,04951 0,04951 0,04952 0,04981 0,05065
Logrank
Cramrvon Mises
0.054
Holm Hoch Hommel
0.054
Bonf
Bonf
q
Holm Hoch Hommel
0.052
Rom
0.052
Rom
FWER
FWER
0.050
0.050
q q
q q q q
0.048
q q q q
q q
0.048
0.046
50
100
150
200
250
300
0.046
50
100
150
200
250
300
Tamanho da amostra
Tamanho da amostra
FIGURA 4.1: Grcos do comportamento da FWER com censura xada em
11.
4.
Estudo de simulao
40
TABELA 4.2:
FWER dos
Cramr-von Mises para diferentes TA com censura xada em

13.
TA=250 0,04902 0,04902 0,04902 0,04921 0,05008 TA=300 0,04964 0,04964 0,04965 0,04989 0,05002
log-rank
TA=150 0,04993 0,04993 0,04994 0,05113 0,05021 TA=200 0,04970 0,04970 0,04975 0,05003 0,05100
Estatstica Cramr von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,05021 0,05021 0,05025 0,05051 0,05159 TA=50 0,05099 0,05099 0,05103 0,05127 0,05220 TA=100 0,04872 0,04872 0,04877 0,04907 0,05013 TA=150 0,04984 0,04984 0,04984 0,05004 0,05089 TA=200 0,04826 0,04286 0,04829 0,04855 0,04936 TA=250 0,04884 0,04884 0,04885 0,04910 0,04988 TA=300 0,04858 0,04858 0,04859 0,04884 0,04955
Logrank
Cramrvon Mises
0.056
Holm Hoch Hommel Rom
0.054
Bonf
q
Bonf
q
Holm Hoch Hommel
0.054
0.052
Rom
0.052
FWER
FWER
0.050
q q
q q
0.050
q q q q q q q
0.048
0.048
0.046
50
100
150
200
250
300
0.046
50
100
150
200
250
300
Tamanho da amostra
Tamanho da amostra
FIGURA 4.2: Grcos do comportamento da FWER com censura xada em
13.
4.
Estudo de simulao
41
TABELA 4.3:
FWER dos
Cramr-von Mises para diferentes TA com dados sem censura.

log-rank
TA=150 0,04924 0,04924 0,04925 0,04948 0,05013 TA=200 0,04902 0,04902 0,04903 0,04918 0,04984 TA=250 0,04845 0,04845 0,04845 0,04865 0,04942 TA=300 0,04840 0,04840 0,04842 0,04864 0,04946
Estatstica Cramr von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04744 0,04744 0,04746 0,04778 0,04875 TA=50 0,04929 0,04929 0,04933 0,04962 0,05042 TA=100 0,05006 0,05006 0,05007 0,05034 0,05126 TA=150 0,04840 0,04840 0,04842 0,04862 0,04937 TA=200 0,04855 0,04855 0,04856 0,04887 0,04956 TA=250 0,04871 0,04871 0,04876 0,04897 0,04984 TA=300 0,04851 0,04851 0,04855 0,04878 0,04953
Logrank
Cramrvon Mises
0.054
Holm Hoch Hommel
0.054
Bonf
Bonf
q
Holm Hoch Hommel
0.052
Rom
0.052
Rom
FWER
FWER
0.050
0.050
q q
0.048
0.048
q q q
q q
0.046
50
100
150
200
250
300
0.046
50
100
150
200
250
300
Tamanho da amostra
Tamanho da amostra
FIGURA 4.3: Grcos do comportamento da FWER para dados sem censura.
Podemos observar por das meio das Figuras
4.1, 4.2 e 4.3,
que em quase todos os
cenrios de censura trabalhados nos testes das duas estatsticas envolvidas, o procedimento de Rom apresentou os maiores valores para a FWER, que por um lado bom, pois rearma o fato argumentado em Rom (2013) de que este mtodo pouco conservativo; porm em certos casos de amostras pequenas ele apresentou uma taxa de erro elevada com respeito aos demais procedimentos. No cenrio de censura igual a (Figura
11,
que equivale a
40%
dos dados censurados
4.1),
os mtodos aplicados na estatstica log-rank tiveram um comportamento
4.
Estudo de simulao
42
quase sem oscilaes e atingiram o valor bem prximo a
5%
com TA igual a
300.
J no
emprego da estatstica Cramr-von Mises, observamos maiores alteraes, principalmente com amostras de tamanho em relao s demais. Pela Figura para TA
150, em que as 5 estratgias apresentaram taxas de erro menores
4.2,
que ilustra o cenrio da censura xada em
13,
podemos ver que
30
50
os cinco procedimentos apresentaram taxas altas, mas foram atingindo
o valor prximo a
5%
conforme os TA foram aumentando.
Na situao analisada sem presena de censura (Figura testes da estatstica log-rank os
4.3)
notamos que nos
5 procedimentos apresentaram-se de maneira conservativa
para TA pequenas. J no teste da estatstica de Cramr-von Mises os valores pequenos para FWER s ocorrem para TA nvel nominal adotado.
30,
depois as taxas foram mantidas prximas a
5%,
4.1.2
Poder dos testes

Na primeira estimativa do poder dos cinco MCMs empregados, o nmero de
iteraes foi xado em
10000
e em cada caso foram geradas amostras de tamanho
100
de
10
populaes de distribuio Poisson com parmetros
X (1) , . . . , X (9) P (10)

tal que
X (10) P (10 + ),
e
assumiu os valores
0, 3; 0, 5; 1; 1, 5; 2; 2, 5; 3; 3, 5; 4; 4, 5
5.
Averiguamos o poder considerando os trs cenrios de censura mencionados: censura igual a
11, 13 e o caso sem censura. .
Nas Tabelas
4.4, 4.5 e 4.6 esto os valores do

e
poder em funo do incremento de
As Figuras
4.4, 4.5
4.6
trazem os grcos com a
funo poder dos cinco MCMs empregados nas estatsticas log-rank e Cramr-von Mises.
4.
Estudo de simulao
43
TABELA 4.4: Poder dos
MCMs empregados nas estatsticas log-rank e Cramr-von
Mises em funo do incremento de
censura xada em
log-rank
Hochberg 0,0136 0,0309 0,1561 0,4264 0,7026 0,9018 0,9705 0,9950 0,9990 0,9998 1,0000
11.
Rom 0,0574 0,0776 0,1980 0,4561 0,7196 0,9081 0,9723 0,9952 0,9991 0,9998 1,0000
Estatstica
0,3 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Bonferroni 0,0136 0,0308 0,1557 0,4256 0,7015 0,9015 0,9704 0,9950 0,9990 0,9998 1,0000
Holm 0,0136 0,0308 0,1560 0,4264 0,7024 0,9017 0,9705 0,9950 0,9990 0,9998 1,0000
Hommel 0,0136 0,0311 0,1565 0,4267 0,7039 0,9021 0,9706 0,9950 0,9991 0,9998 1,0000
Estatstica Cramr-von Mises
0,3 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Bonferroni 0,0145 0,0376 0,1920 0,4944 0,7922 0,9015 0,9900 0,9982 0,9999 1,0000 1,0000
Holm 0,0146 0,0376 0,1924 0,4950 0,7930 0,9017 0,9901 0,9982 0,9999 1,0000 1,0000
Hochberg 0,0146 0,0376 0,1925 0,4950 0,7931 0,9018 0,9901 0,9982 0,9999 1,0000 1,0000
Hommel 0,0147 0,0377 0,1930 0,4957 0,7939 0,9021 0,9901 0,9982 0,9999 1,0000 1,0000
Rom 0,0580 0,0825 0,2312 0,5213 0,8040 0,9081 0,9910 0,9984 0,9999 1,0000 1,0000
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
q
q
q
q
0.8
0.8
q
q
q
q
0.6
Poder do teste
Poder
0.6
q
q
0.4
Bonf
q
0.4
q
q
Bonf
q
0.2
0.2
q
q
q
q
0.0
0.0
q q
q q
q
q
q
q
FIGURA 4.4: Grcos da funo poder dos 5 MCMs com censura xada em 11.
4.
Estudo de simulao
44
censura xada em
log-rank
Hochberg 0,0159 0,0438 0,2094 0,5416 0,8292 0,9676 0,9966 0,9997 1,0000
13.
Rom 0,0650 0,0851 0,2493 0,5672 0,8386 0,9697 0,9968 0,9997 1,0000
Estatstica
0,3 0,5 1 1,5 2 2,5 3 3,5 4
Bonferroni 0,0158 0,0436 0,2087 0,5409 0,8288 0,9675 0,9966 0,9997 1,0000
Holm 0,0159 0,0437 0,2094 0,5416 0,8291 0,9676 0,9966 0,9997 1,0000
Hommel 0,0159 0,0439 0,2098 0,5423 0,8297 0,9676 0,9967 0,9997 1,0000
0,3 0,5 1 1,5 2 2,5 3 3,5 4
Bonferroni 0,0170 0,0439 0,2254 0,5754 0,8668 0,9781 0,9985 0,9999 1,0000
Holm 0,0170 0,0441 0,2259 0,5764 0,8673 0,9782 0,9985 0,9999 1,0000
Hochberg 0,0170 0,0441 0,2260 0,5764 0,8673 0,9783 0,9985 0,9999 1,0000
Hommel 0,0170 0,0443 0,2263 0,5767 0,8675 0,9785 0,9985 0,9999 1,0000
Rom 0,0617 0,0906 0,2655 0,5991 0,8743 0,9796 0,9985 0,9999 1,0000
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
0.8
0.6
Poder do teste
Poder do teste
0.6
0.8
q
q
q
q
q
q
0.4
Bonf
q
0.4
Bonf
q
0.2
0.2
q
q
0.0
0.0
q
q
q
q
q
q
q
q
FIGURA 4.5: Grcos da funo poder dos 5 MCMs com censura xada em 13.
4.
Estudo de simulao
45
dados sem censura.

log-rank
Hommel 0,0163 0,0382 0,2417 0,6149 0,8957 0,9870 0,9990 1,0000 1,0000 Rom 0,0635 0,0855 0,2807 0,6347 0,9016 0,9880 0,9992 1,0000 1,0000 Hochberg 0,0162 0,0380 0,2415 0,6144 0,8955 0,9870 0,9990 1,0000 1,0000
Estatstica
0,3 0,5 1 1,5 2 2,5 3 3,5 4
Bonferroni 0,0159 0,0378 0,2410 0,6141 0,8951 0,9870 0,9990 1,0000 1,0000
Holm 0,0162 0,0379 0,2414 0,6144 0,8954 0,9870 0,9990 1,0000 1,0000
0,3 0,5 1 1,5 2 2,5 3 3,5 4
Bonferroni 0,0170 0,0430 0,2392 0,6290 0,9057 0,9889 0,9995 0,9999 1,0000
Holm 0,0170 0,0432 0,2397 0,6297 0,9060 0,9889 0,9996 0,9999 1,0000
Hochberg 0,0170 0,0432 0,2398 0,6299 0,9060 0,9889 0,9996 0,9999 1,0000
Hommel 0,0170 0,0433 0,2403 0,6311 0,9065 0,9889 0,9996 0,9999 1,0000
Rom 0,0600 0,0873 0,2800 0,6491 0,9117 0,9897 0,9997 0,9999 1,0000
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
q
q
0.8
0.8
0.6
Poder
0.4
Poder
Bonf
q
0.4
0.6
q
q
Bonf
q
0.2
0.2
q
q
q
q
0.0
0.0
q
q
q
q
q
q
q
q
FIGURA 4.6: Grcos da funo poder dos 5 MCMs com dados sem censura.
Pelas Figuras
4.4, 4.5
4.6
notrio o fato de que os mtodos de Bonferroni,
Holm, Hochberg, Hommel e Rom apresentam praticamente o mesmo poder, exceto para valores bem pequenos de
, em que o mtodo de Rom apresenta superioridade em relao
4.
Estudo de simulao
46
aos demais. Na situao de censura igual a para exatamente
11 (Tabela 4.4),
o poder das estratgias convergiu
1 quando
assumiu os valores
4, 5 e 5 nos testes das estatsticas log-rank 13

(Tabela 4.5) esta
e Cramr-von Mises, respectivamente. No cenrio de censura igual a convergncia ocorreu com
igual a
para as duas estatsticas. J no caso sem censura
(Tabela 4.6), o poder dos testes atingiu na estatstica Cramr-von Mises.
100%
com
= 3, 5
na estatstica log-rank e
=4
A segunda avaliao do poder foi tambm realizada nos trs cenrios de censura escolhidos. Mantivemos o nmero de iteraes em
10000 4, 6
e tamanhos de amostras igual a e
100.
Exploramos as situaes em que foram geradas
11
Poisson e sempre a primeira populao foi tomada como referncia. As expresses dadas na sequncia ilustram a maneira como foram geradas as hipteses variando o nmero de hipteses falsas:
4 populaes para testarmos trs
X (1) , X (2) , X (3) P () X (1) , X (2) P () X (1) P ()

em que realizar e e
X (4) P ( + ),
X (3) , X (4) P ( + ),
X (2) , X (3) , X (4) P ( + ),
= 10 5
e
= 2.
De modo anlogo foram geradas as demais populaes para
10
testes simultneos.
As Tabelas
4.7, 4.8, 4.9, 4.10, 4.11
4.12
apresentam os valores do poder dos
cinco MCMs empregados nas estatsticas log-rank e Cramr-von Mises para as diferentes conguraes de censura adotadas. Nas Figuras
4.7, 4.8, 4.9, 4.10, 4.11
4.12 3, 5
esto e
ilustrados o comportamento do poder das estratgias quando foram testadas hipteses em funo do nmero de hipteses falsas.
10
4.
Estudo de simulao
47
TABELA 4.7:
Poder dos
MCMs empregados na estatstica log-rank em funo do
nmero de hipteses falsas, censura xada em

Nmero de hipteses 3 Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10 Bonferroni 0,2889 0,5552 0,8277 0,1622 0,3159 0,4715 0,6253 0,7802 0,0746 0,1436 0,2119 0,2819 0,3514 0,4226 0,4881 0,5589 0,6272 0,7001
11.
Estratgia Holm 0,2944 0,5867 0,9013 0,1641 0,3271 0,5014 0,6865 0,8922 0,0751 0,1459 0,2190 0,2945 0,3731 0,4572 0,5400 0,6336 0,7334 0,8505 Hochberg 0,2956 0,5893 0,9067 0,1642 0,3277 0,5040 0,6918 0,9023 0,0751 0,1459 0,2190 0,2948 0,3739 0,4585 0,5433 0,6387 0,7427 0,8738 Hommel 0,2959 0,5898 0,9069 0,1646 0,3286 0,5061 0,6944 0,9029 0,0753 0,1463 0,2199 0,2965 0,3766 0,4626 0,5494 0,6470 0,7518 0,8789 Rom 0,2962 0,5900 0,9070 0,1650 0,3294 0,5070 0,6953 0,9032 0,0756 0,1471 0,2213 0,2989 0,3796 0,4668 0,5544 0,6517 0,7558 0,8808
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
0.8
0.8
0.8
q q q
q q
0.6
0.6
q q
0.6
Poder
Poder
q q
Poder
0.4
0.4
0.4
q q
q q
Bonf Holm Hoch Hommel Rom
q q
q q
0.2
0.2
q q
0.2
q q
q q
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.7:
Grcos do poder em funo do n
de hipteses falsas dos 5 MCMs
empregados na estatstica log-rank com censura xada em
11.
4.
Estudo de simulao
48
TABELA 4.8: Poder dos do nmero de hipteses

Nmero de hipteses 3
5 MCMs empregados na estatstica Cramr-von Mises em funo falsas, censura xada em 11.
Estratgia Bonferroni 0,3057 0,5958 0,8873 0,1792 0,3459 0,5149 0,6805 0,8475 0,0836 0,1602 0,2382 0,3171 0,3937 0,4728 0,5502 0,6288 0,7077 0,7840 Holm 0,3118 0,6225 0,9439 0,1812 0,3559 0,5409 0,7354 0,9371 0,0841 0,1628 0,2449 0,3296 0,4148 0,5057 0,5984 0,6988 0,8050 0,9195 Hochberg 0,3125 0,6253 0,9467 0,1814 0,3566 0,5427 0,7384 0,9425 0,0841 0,1628 0,2450 0,3298 0,4151 0,5068 0,6001 0,7025 0,8118 0,9330 Hommel 0,3128 0,6257 0,9467 0,1816 0,3574 0,5440 0,7394 0,9427 0,0842 0,1631 0,2457 0,3309 0,4168 0,5093 0,6036 0,7072 0,8161 0,9349 Rom 0,3129 0,6259 0,9468 0,1820 0,3580 0,5446 0,7398 0,9428 0,0845 0,1638 0,2467 0,3324 0,4189 0,5120 0,6062 0,7096 0,8178 0,9355
Nmero de hipteses falsas 1 2 3
1 2 3 4 5
10
1 2 3 4 5 6 7 8 9 10
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
0.8
0.8
0.8
q q
0.6
0.6
0.6
q
q
q q
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q
q q q
0.2
0.2
0.2
q q
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.8:
empregados na estatstica Cramr-von Mises com censura xada em
11.
4.
Estudo de simulao
49
TABELA 4.9:
Nmero de hipteses 3
Poder dos
nmero de hipteses falsas, censura xada em

Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10 Bonferroni 0,3168 0,6181 0,9172 0,1829 0,35856 0,5348 0,7103 0,8787 0,0878 0,1696 0,2531 0,3340 0,4160 0,4980 0,5823 0,6618 0,7453 0,8253
13.
Estratgia Holm 0,3230 0,6424 0,9630 0,18478 0,36756 0,5583 0,7557 0,9551 0,0883 0,1722 0,2591 0,3458 0,4361 0,5280 0,6268 0,7244 0,8334 0,9466 Hochberg 0,3237 0,6436 0,9650 0,18486 0,36814 0,5594 0,7574 0,9585 0,0884 0,1723 0,2592 0,3460 0,4366 0,5287 0,6279 0,7271 0,8382 0,9548 Hommel 0,3240 0,6438 0,9650 0,18518 0,36878 0,5601 0,7581 0,9588 0,0885 0,1726 0,2596 0,3468 0,4379 0,5304 0,6303 0,7300 0,8407 0,9556 Rom 0,3241 0,6438 0,9650 0,1856 0,36922 0,5605 0,7583 0,9588 0,0887 0,1730 0,2605 0,3481 0,4394 0,5325 0,6320 0,7317 0,8419 0,9558
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
0.8
0.8
q q q q
q q
0.8
q q
0.6
0.6
q q
0.6
Poder
Poder
Poder
q q
q
q
0.4
0.4
q q
0.4
q
q q q
q q
q
q q q
0.2
0.2
0.2
q q
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.9:
empregados na estatstica log-rank com censura xada em
13.
4.
Estudo de simulao
50
TABELA 4.10:
Nmero de hipteses 3
Poder dos
MCMs empregados na estatstica Cramr-von Mises em
funo do nmero de hipteses falsas, censura xada em

Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10 Bonferroni 0,3242 0,6276 0,9375 0,1903 0,3693 0,5515 0,7293 0,9103 0,0907 0,1770 0,2628 0,3484 0,4346 0,5191 0,6049 0,6925 0,7766 0,8650 Holm 0,3316 0,6517 0,9747 0,1925 0,3780 0,5721 0,7700 0,9710 0,0912 0,1791 0,2683 0,3591 0,4517 0,5464 0,6440 0,7478 0,8540 0,9661
13.
Hommel 0,3321 0,6526 0,9759 0,1929 0,3787 0,5734 0,7720 0,9729 0,0914 0,1794 0,2687 0,3597 0,4530 0,5483 0,6470 0,7515 0,8590 0,9706 Rom 0,3322 0,6528 0,9759 0,1931 0,3791 0,5735 0,7721 0,9729 0,0915 0,1798 0,2694 0,3606 0,4539 0,5495 0,6486 0,7526 0,8597 0,9707
Estratgia Hochberg 0,3321 0,6525 0,9759 0,1928 0,3783 0,5729 0,7716 0,9728 0,0913 0,1792 0,2684 0,3592 0,4519 0,5471 0,6453 0,7496 0,8573 0,9703
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q q q
q q
0.8
q q
0.6
0.6
q q q q
Poder
Poder
Poder
0.6
q q
0.4
0.4
q q
0.4
q q q q
q q
q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.10:
empregados na estatstica Cramr-von Mises com censura xada em
13.
4.
Estudo de simulao
51
TABELA 4.11:
Nmero de hipteses 3
Poder dos

nmero de hipteses falsas, dados sem censura.

Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10
3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q
0.8
q q
q q
q q
0.6
0.6
q
q
0.6
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.11:
de hipteses falsas dos
MCMs
empregados na estatstica log-rank com dados sem censura.
4.
Estudo de simulao
52
TABELA 4.12:
Nmero de hipteses 3
Poder dos

funo do nmero de hipteses falsas, dados sem censura.

3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q
0.8
q q
q q
q q
0.6
0.6
q q
0.6
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.12:
de hipteses falsas dos
MCMs
empregados na estatstica Cramr-von Mises com dados sem censura.
Por meio das Tabelas
4.7, 4.8, 4.9, 4.10, 4.11
4.12;
e das Figuras
4.7, 4.8, 4.9,
4.10, 4.11
4.12;
ca claro o que j bastante armado na literatura: o procedimento
de Bonferroni apresenta o menor poder em todos os cenrios de censura investigados nos testes das duas estatsticas. J os outros quatro procedimentos apresentaram praticamente
4.
Estudo de simulao
53
o mesmo comportamento. Um fato importante a ser notado que nos testes da estatstica de Cramrvon Mises os cinco procedimentos apresentaram maior poder em relao aos testes da estatstica log-rank. No que diz respeito censura, os testes realizados com dados sem censura apresentaram maior poder em relao aos dados com censura xada em
13,
que
por sua vez apresentaram maior poder em relao aos dados com censura xada em
11.
4.2
Dados contnuos
Para as simulaes realizadas com dados contnuos foram geradas amostras aleatrias de distribuio exponencial. Devido ao elevado custo computacional empregando nos testes as estatsticas log-rank e Cramr-von Mises foi analisado apenas o cenrio em que aproximadamente
36%
dos dados gerados foram censurados.
4.2.1
Controle da FWER
Para averiguar o controle da FWER das cinco estratgias de comparaes ml-
tiplas aplicadas na estatstica log-rank tomamos amostras de tamanho
30, 50, 100, 150,
200, 250
300;
e para a estatstica Cramr-von Mises trabalhamos apenas com amostras e
de tamanho
30, 50
100
devido ao altssimo tempo computacional gasto.
Realizamos
10000
iteraes e em cada caso foram geradas
10
populaes de distribuio exponencial
com parmetros
1 , . . . , 10 = 0, 01, sendo a primeira populao adotada como referncia. 100, o que equivale a aproximadamente 36% dos dados censurados.
mostra os valores da FWER das estratgias de Bonferroni, Holm,
Fixamos a censura em A Tabela
4.13
Hochberg, Hommel e Rom aplicados na estatstica log-rank para os diferentes tamanhos de amostras escolhidos. Na Figura
4.13
apresentamos o grco com o comportamento da
FWER em funo do TA para esta mesma estatstica.
4.
Estudo de simulao
54
TABELA 4.13: FWER para os cinco MCMs empregados nos testes da estatstica log-rank em funo dos diferentes TA com censura xada em
Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,03870 0,03870 0,03870 0,03880 0,03990 TA=50 0,04200 0,04200 0,04200 0,04200 0,04320 TA=100 0,05030 0,05030 0,05030 0,05050 0,05120
100.
TA=200 0,04890 0,04890 0,04890 0,04910 0,04990 TA=250 0,04900 0,04900 0,04910 0,04940 0,04990 TA=300 0,04978 0,04978 0,04985 0,04998 0,05002
TA=150 0,04900 0,04900 0,04900 0,04900 0,04980
Logrank
0.050
q q
FWER
0.045
0.040
q
50
100
150
200
250
300
Tamanho da amostra
FIGURA 4.13:
Grco do comportamento da FWER dos
MCMs empregados na
estatstica log-rank.
Pela Figura
4.13
observamos que com amostras de tamanhos
30
50
os cinco
mtodos mostraram-se bastante conservativos nos testes da estatstica log-rank. Com TA
150, 200, 250
300
o Mtodo de Rom chegou bem prximo ao nvel nominal de
5%, 5%
enquanto os outros mostraram-se ainda um pouco conservativos atingindo a taxa de apenas com TA igual a Na Tabela
300.
e na Figura
4.14
4.14
esto listados os valores e o comportamento da
FWER dos cinco procedimentos aplicados na estatstica Cramr-von Mises para amostras de tamanho
30, 50
100.
4.
Estudo de simulao
55
TABELA 4.14: FWER para os cinco MCMs empregados nos testes da estatstica Cramrvon Mises em funo dos diferentes tamanhos de amostras (TA) com censura xada em
100.
Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04620 0,04620 0,04620 0,04640 0,04720 TA=50 0,04830 0,04830 0,04830 0,04840 0,04950 TA=100 0,04540 0,04540 0,04540 0,04570 0,04630
Cramrvon Mises
0.050
0.045
FWER
0.040 30
40
50
60
70
80
90
100
Tamanho da amostra
FIGURA 4.14:
Grco do comportamento da FWER dos
MCMs empregados na
estatstica Cramr-von Mises.
Pela Figura
4.14
notamos que os
procedimentos apresentaram-se conservativos
nos testes da estatstica Cramr-von Mises com amostras de TA amostra de tamanho
30 e 100,
entretanto com Novamente a
50
a FWER chegou prximo ao nvel nominal de
5%.
estratgia de Rom foi a menos conservativa. Quando comparado aos testes realizados com a estatstica log-rank, a estatstica de Cramr apresentou resultados menos conservativos para TA
30
50.
4.2.2
Poder dos testes

Para estimar o poder procedemos das duas maneiras citadas no incio deste
captulo.
Realizamos em cada estudo
10.000
iteraes e trabalhamos com amostras de
4.
Estudo de simulao
56
tamanho
50. 10
Para a primeira avaliao do poder foram geradas exponencial com parmetros
X (1) , . . . , X (9) E (0, 01)

em que
X (10) E (0, 01 + ),
a censura foi
assumiu a sequncia de valores
0, 002; 0, 004; . . . ; 0, 0024; 0, 0026,
xada em
100
e a primeira populao foi tomada como controle.
Na Tabela
4.15
e na Figura
4.15
esto apresentados o poder dos cinco mtodos
analisados nas estatsticas log-rank e Cramr-von Mises em funo do incremento de
.
Estatstica
log-rank
Hommel 0,0400 0,0738 0,1917 0,3645 0,5485 0,7085 0,8330 0,9090 0,9529 0,9781 0,9921 0,9958 0,9978 Rom 0,0756 0,1097 0,2246 0,3940 0,5679 0,7224 0,8395 0,9135 0,9556 0,9791 0,9926 0,9961 0,9978
0,002 0,004 0,006 0,008 0,010 0,012 0,014 0,016 0,018 0,020 0,022 0,024 0,026
Bonferroni 0,0397 0,0735 0,1906 0,3628 0,5468 0,7074 0,8318 0,9084 0,9524 0,9776 0,9921 0,9958 0,9978
Holm 0,0397 0,0737 0,1910 0,3634 0,5474 0,7081 0,8326 0,9087 0,9525 0,9777 0,9921 0,9958 0,9978
Hochberg 0,0399 0,0737 0,1910 0,3635 0,5475 0,7081 0,8326 0,9088 0,9526 0,9777 0,9921 0,9958 0,9978
0,002 0,004 0,006 0,008 0,010 0,012 0,014 0,016 0,018 0,020 0,022 0,024 0,026
Bonferroni 0,0315 0,0599 0,1621 0,2853 0,4552 0,6116 0,7381 0,8433 0,8985 0,9418 0,9667 0,9827 0,9898
Holm 0,0318 0,0601 0,1629 0,2856 0,4559 0,6120 0,7385 0,8438 0,8987 0,9419 0,9667 0,9828 0,9899
Hochberg 0,0318 0,0601 0,1632 0,2856 0,4559 0,6122 0,7386 0,8439 0,8987 0,9419 0,9667 0,9828 0,9899
Hommel 0,0319 0,0602 0,1634 0,2867 0,4565 0,6128 0,7396 0,8444 0,8990 0,9423 0,9668 0,9829 0,9899
Rom 0,0703 0,1008 0,2014 0,3201 0,4836 0,6338 0,7542 0,8521 0,9048 0,9459 0,9686 0,9834 0,9990
4.
Estudo de simulao
57
Logrank
1.0
Cramrvon Mises
q
q
q
q
q
q
q
q
q
q
1.0
q
q
q
q
q
q
q
q
q
q
0.8
0.8
q
q
q
q
q
q
q
q
0.6
0.6
q
q
Poder
Poder
q
q
q
q
0.4
q
q
Bonf
q
0.4
Holm 0.2 Hoch Hommel Rom
q
q
Bonf
q
0.2
q
q
q
q
0.0
0.000
0.005
0.010
0.015
0.020
0.0
q
q
q
q
q
q
q
q
0.000
0.005
0.010
0.015
0.020
FIGURA 4.15:
empregados na estatstica log-rank.
Por meio da Tabela
4.15
e da Figura
4.15
podemos ver que o mtodo de Rom
apresenta o poder um pouco maior que os demais, principalmente quando pequenos. medida que
assume valores
incrementado, o poder dos cinco procedimentos cam
bem prximos.
Observamos ainda que os testes executados com a estatstica log-rank
apresentam maior poder quando comparado estatstica Cramr-von Mises. Na segunda investigao do poder trabalhamos com as conguraes em que foram geradas
4, 6
11
populaes para executar respectivamente
3, 5
10
testes
de hipteses simultaneamente. como foram geradas hipteses falsas:
As expresses dadas na sequncia ilustram a maneira
populaes para testarmos trs hipteses alternando o nmero de
X (1) , X (2) , X (3) E () X (1) , X (2) E () X (1) E ()

em que mantivemos e e
X (4) E ( + ),
X (3) , X (4) E ( + ),
X (2) , X (3) , X (4) E ( + ),

De maneira anloga foram criadas as demais
= 0, 01
= 0, 015. 5
e
populaes para realizar os testes com As Tabelas
10
hipteses.
4.16 e 4.17 relatam o poder dos 5 procedimentos dos testes realizados

Nas Figuras
com as estatsticas log-rank e Cramr-von Mises, respectivamente.
4.16
4.
Estudo de simulao
58
4.17
esto os grcos desse poder quando foram testadas
3, 5
10
hipteses em funo
do nmero de hipteses falsas envolvidas nos teses.
TABELA 4.16:
Nmero de hipteses 3
Poder dos

nmero de hipteses falsas.

3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
q q
q q
0.8
0.8
q q q q
q q
0.8
q q
0.6
0.6
q
q q q
Poder
Poder
Poder
0.6
q q
0.4
0.4
q q
0.4
q q q q
q q
q
q q
q q
0.2
0.2
0.2
q q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.16:
empregados na estatstica log-rank.
4.
Estudo de simulao
59
TABELA 4.17:
Nmero de hipteses 3
Poder dos

funo do nmero de hipteses falsas.

3 hipteses
1.0 1.0
5 hipteses
1.0
10 hipteses
q q
q q
0.8
0.8
q
q
0.8
q q
0.6
0.6
0.6
q q
Poder
Poder
Poder
q q
0.4
0.4
q q
0.4
q q
q q
q q
q q
q
q q q
0.2
0.2
0.2
q q
q
q
0.0
0.0
2 Hipteses falsas
3 Hipteses falsas
0.0
6 Hipteses falsas
10
FIGURA 4.17:
empregados na estatstica Cramr-von Mises.
Observamos novamente pelas Tabelas e
4.17
4.16
e por meio das Figuras
4.16
4.17
que o procedimento de Bonferroni apresenta poder inferior em relao s demais
estratgias. No geral, os procedimentos de Holm, Hochberg, Hommel e Rom apresentaram poder bem semelhantes entre si. Vale notar ainda que os testes empregados com a
4.
Estudo de simulao
60
estatstica log-rank resultou em maior poder quando comparado estatstica de Cramrvon Mises.
Captulo 5 Concluso e propostas futuras

Nesta dissertao analisamos o desempenho no que diz respeito ao controle da FWER e ao ganho de poder dos procedimentos de comparaes mltiplas de Bonferroni clssico e de certos mtodos denominados na literatura como seus melhoramentos, dentre eles, o procedimento de Holm, conhecido tambm como mtodo de Bonferroni de rejeio sequencial; e trs procedimentos derivados do mtodo de Simes para realizar inferncias sob as hipteses individuais: Hochberg, Hommel e a recente estratgia proposta por Rom (2013). Focamos no problema de comparao mltipla de testar um tratamento versus controle empregando nos testes as estatsticas log-rank e Cramr-von Mises, ambas com estrutura de dependncia. Enfatizamos ainda o trabalho com dados discretos na presena de censura, visto que na rea de comparaes mltiplas tem se falado pouco desses tipos de dados. Vericamos que a estatstica log-rank pertence classe multivariada totalmente positiva de ordem 2 (MTP2 ), fato indispensvel para garantir o controle da FWER ao empregar o mtodo de Simes. Para a estatstica de Cramr-von Mises ainda no foi
possvel concluir o mesmo argumento. Por meio dos estudos de simulao vericamos que em alguns casos os mtodos mostraram-se conservativos e em outros extrapolaram um pouco o nvel nominal de
5%.
Todavia, para tamanhos de amostras grande, o controle da FWER foi satisfatrio nos testes das duas estatsticas, tanto para dados contnuos como discretos. Dos cinco MCMs
61
5.
Concluso e propostas futuras
62
empregados o que se mostrou menos conservativo e que chegou mais prximo de procedimento de Rom.
5%
foi o
Mediante a avaliao do poder o que se pode conrmar claramente que o procedimento de Bonferroni apresenta menor poder em relao aos demais nos cenrios analisados. Entre os procedimentos de Holm, Hochberg, Hommel e Rom no foi notada uma diferena importante. Como propostas de trabalhos futuros, listamos os seguinte itens:
Vericar teoricamente se a estatstica de Cramr-von Mises satisfaz a condio (MTP2 );
Analisar outros problemas de comparaes mltiplas, como por exemplo, testes dois a dois;
Estudar os mtodos de comparaes mltiplas que controlam a false discovery rate (FDR);
Analisar alguns mtodos que controlam a da FWER usual. literatura.
k -FWER,
que uma verso generalizada
uma taxa de erro que tem sido introduzida recentemente na
Apndice A Propriedades e resultados assintticos

Neste apndice apresentamos alguns resultados que foram utilizados na demonstrao de que a estatstica log-rank ponderada satisfaz a condio MTP2 . Analisamos o caso de qualquer
amostras aleatrias independentes
p p )j =1 , (Wjp , Cj
para
p J.
A m de manter o controle do comportamento martingale limitante em
diferentes amostras introduzimos a ltragem
F = {Fi ; i 0}
gerada por toda informao
disponvel em cada categoria da seguinte maneira
Fi :=
np ;pJ
Fi p ,
i 0.
Por simplicao, fazemos uso da seguinte notao. Para um dado
p J,
p p Vm (j ) := (V1p (j ), . . . , Vm (j )),
p p Rp m (j ) := (R1 (j ), . . . , Rm (j )),
C,p C,p RC,p m (j ) := (R1 (j ), . . . , Rm (j )), 1 m NJ ; j 1.
Introduzimos agora uma outra ltragem que ser a base para nossos resultados assintticos. sequncia. Esta famlia de ltragem cuidadosamente escolhida como descrito na
Para uma dada categoria
j 1
n NJ ,
denimos a ltragem
G n (j ) =
63
A.
Propriedades e resultados assintticos
64
n {Gm (j ); 0 m NJ }
ao longo das amostras da seguinte maneira
p p C,p n (j ) := {(V np (j ), Rn (j 1), Vm Gm +1 (j ), Rm (j ), Rm (j )), p J },
para qualquer
0 m NJ 1
p C,p n GN (j ) := {(V np (j ), Rn (j 1), VN (j ), Rp NJ (j ), RNJ (j )), p J }, J J
em que denimos
Rn (0) = Rn (0) q1 = q
C,p Rp = 0. 0 = R0
Para qualquer par
em
n = (n1 , . . . , nJ ) NJ ,
seja
Unqq1 (n , .) =
{Unqq1 (n , i); i 1}
um processo previsvel em relao ltragem
satisfazendo os
seguintes pressupostos:
(M1) (M2)
Para cada
(nq , nq1 ) N2 , Unqq1 (n , i)

tal que
n G0 (i)-mensurvel
para cada
i 1;
Existe
>0
Unqq1 (n , i) lim nq n V nq (i)

em probabilidade para cada
2+
nq1
Unqq1 (n , i) V nq1 (i)
2+
=0
i 1;
e
(M3)
Para qualquer
q2 {q, q1 }
1
n
existe uma constante
q2 q,q ( ) 1
tal que
|Unqq1 (n , )|2 q2 q,q ( ) 1 nq2 V ( )

n .
e
(M4)
Para qualquer
q2 J (q2 = q, q2 = q1 )
n n
q q ( ) 1 ,q2
tal que
Unqq1 (n , )Unqq2 (n , ) q q ( ) 1 ,q2 V nq ( )

n 3 J , r=k
precisamos introduzir outro par de
A m de tratar o caso geral, com pressupostos no processo ponderado previsvel em relao ltragem
U.
Dado
em
J , seja U
um processo ponderado
que satisfaa os seguintes pressupostos:
A.
65
(H1)
Para qualquer
q1 = k
1,
k,r q ( ) 1
tal que
nr nk (n , ) (n , )Un Un q1 q1
V nq1 ( )
k,r q ( ) 1
n .
e
(H2)
Para qualquer
q1 = k
1,
k,r q ( ) 1
tal que
nk nr Un (n , )Un (n , ) q1 q1
V nq1 ( )
k,r ( ) q 1
n .
(M1-
Lema A.1.
M4).
Assumimos que os processos ponderados satisfaam os pressupostos
Assim, para cada

n
qJ
1,
n
(A.1)
q1 =q
1{V nq1 ( )>0} Unqq1 (n , )1 1{V nq ( )>0} Unqq1 (n , )1 nq Y nq1 ( ) Y ( ) V nq ( ) V nq1 ( ) N (0, 2 q ( ))
com
converge em distribuio para dada por
n .
A varincia assinttica
2 q( )
2 q( ) =
q1 =q
q1 q,q ( )hq1 ( )[1 hq1 ( )] 1
(A.2)
+
q1 =q
q q,q ( )hq ( )[1 hq ( )] 1
+ 2
q1 ,q2 Aq q1 q q,q , q,q 1 1
q q ( )hq ( )[1 hq ( )], 1 ,q2
tal que a famlia de funes
q q 1 ,q2
em
(A.2) so dadas respectivamente em
(M3)
(M4).
Para qualquer par
Proposio A.1.
aq,q1
tais que
q1 = q
Seja
em
J,
assumimos que existem constantes
limnq ,nq1 nq1 /nq = aq,q1 .
uma funo contnua no negativa. Ento,
os processos ponderados de Harrington e Fleming

1/2
nq Un (n q1
, )=
J i=1
ni
nq1 nq
f
j =0
Rn (j ) V n (j )
V nq1 ( )V nq ( ) Vn ( )
A.
66
e os processos ponderados de Tarone e Ware

1/2
nq (n Un q1
, )=
J i=1
ni
nq1 nq
(M1-M4).
Vn ( )
J i=1
ni
V nq1 ( )V nq ( ) Vn ( )
satisfazem os pressupostos
Demonstrao. Precisamos apenas vericar os argumentos para a classe Tarone e Ware,

pois os argumentos para Harrington e Fleming so anlogos. abreviar a notao, escrevemos Fixamos
1
Se
e, para
n =
J i=1
ni .
O pressuposto
(M1)
bvio.
> 0,
usando a condio de crescimento, a continuidade de
e o fato de que
Vn ( )
a soma
de distribuies binomiais independentes pata obter a seguinte estimativa
1{V nq (i)>0} Unqq1 (n , i)1 nq V nq (i)
2+
n nq1
1+/2
/2 nq f V n ( )n1
2+
0
para qualquer dado
com
n ,
q = q1 J
em
J.
Isto mostra que o pressuposto
(M2) satisfeito.
Para um
q = q1
n
em
e qualquer
q2 {q, q1 },
temos que
|Unqq1 (n , )|2 V n ( ) V nq1 ( ) V nq ( ) n nq2 f 1 1 = 1 1{V nq ( )>0} . {V ( )>0} V nq2 ( ) n Vn ( ) nq nq1 q3 J (q3 = q, q3 = q1 ),
n
(A.3)
Se
escrevemos que
Unqq1 (n , )Unqq2 (n , ) 1 1{V nq ( )>0} = V nq ( )
Vn ( ) n
n nq nq3 n V ( ) nq nq1
1/2
V nq3 ( )V nq ( ) nq nq3
V nq1 ( ) 1 1 n V n ( ) {V
( )>0} . (A.4)
As identidades (A.3) e (A.4) nos permite usar novamente a condio de crescimento, a continuidade de
e a propriedade binomial para obter os pressupostos
(M3)
(M4)
para concluir a prova.
Teorema A.1. Assumimos que um processo ponderado U
satisfaa os pressupostos
(M1-
A.
67
M4).
Assim, temos que

n n
i 0
q1 =q
Unqq1 ( ) 1 1{V nq ( )>0} dY nq ( ) V nq ( )

i =1
i 0
Unqq1 ( ) 1 1{V nq1 ( )>0} dY nq1 ( ) V nq1 ( )
converge fracamente para
N 0,
2 q( )
com
n ,
i
para cada
i 1.
Alm disso,
2 ( ) q,n
=1 =1
2 q( )
(A.5)
n ,
para cada
i 1.
Observao A.1.
Para um dado
q J , denotamos por Zq () o limite fraco da expresso
(A.1) no Lema A.1 do seguinte modo
NJ
Zq ( ) := lim
n m,q ( ); m=1
1.
(A.6)
Estabelecemos ainda
Wq (i) :=
=1
Zq ( ),
i 1.
(A.7)
Observao A.2.
Nesse caso,
Quando
J = 2, qJ
as frmulas no Teorema A.1 cam muito simples. e a varincia assinttica no Lemma A.1 torna-se
Aq =
para cada
q1 q q q q1 q1 2 q ( ) = q,q1 ( )h ( )[1 h ( )] + q,q1 ( )h ( )[1 h ( )],
1.
Alm disso, e
2 ( ) 2 ( ) em probabilidade com n , em que para um dado q J q,n q
|Unqq1 (n , )|2 nq |Unqq1 (n , )|2 nq 2 nq nq1 ( )], q,n ( ) = h ( )[1 h ( )] + h 1 ( )[1 h nq1 n q V ( ) V ( )
para cada
1.
Assumimos que um processo ponderado Dessa forma, para cada
NJ n m, 1( m=1 NJ
Lema A.2.
M4)
and
satisfaa os pressupostos
(M1-
(H1-H2).
1, N 0 , Q( )
), . . . ,
m=1
n m,J ( )
A.
68
fracamente com
n ,
de modo que o operador de covarincia

J
Q( )
denido por
Q( )a, a
RJ
=
k=1
2 a2 k k ( ) + 2 1r<kJ
ar ak (k, r, )
para cada
a RJ .
Para qualquer para
Proposio A.2.
aq,q1
tais que
q1 = q
em
J,
assumimos que existem constantes
limnq ,nq1 nq1 /nq = aq,q1 .
Assim, os processos ponderados Harrington e
Fleming, e Tarone e Ware satisfazem as suposies
(M1-M4)
(H1-H2).
Fixamos
Demonstrao. Pela proposio A.1, s precisamos vericar

para sntese de notao, denotamos
(H1-H2).
1,
n=
J i=1
ni .
Se
q1 = k J ,
2
escrevemos
nk nr Un (n , )Un (n , ) q1 q1
V nq1 ( )
1 1{V nq1 ( )>0} =
f V n ( )n1
n nr n V ( ) nk
1/2
Para um dado
V nk ( ) V nr ( ) V nq1 ( ) 1 1{V nq1 ( )>0} V n ( ) nr nq1
(A.8)
r=k
em
q1 = k
podemos escrever
nk nr Un (n , )Un (n , ) q1 k
V nk ( )
1 1{V nk ( )>0} =
f V n ( )n1
2 V nk (
) V nr ( ) nk V n ( )
n nq1 V n ( ) nr
1/2
V nq1 ( ) 1 1{V nk ( )>0} . nq1
(A.9)
As expresses (A.8) e (A.9) nos permitem usar a condio de crescimento, a continuidade de
e a propriedade binomial para obtermos os pressupostos
(H1) e (H2).
Como os argumentos para o caso Harrington and Fleming so inteiramente anlogos, conclumos a prova.
Teorema A.2. Assumimos que um processo ponderado U satisfaz (M1-M4) e (H1-H2).
A.
69
Dessa forma, para cada

i
i 1,
NJ n m, 1( i NJ
), . . . ,
=1 m=1
n m,J ( ) N 0 , (i) i) = (
i =1
(A.10)
=1 m=1
fracamente com que
n .
Alm disso, se denotamos
( ) Q
podemos concluir denido por
i) (i) (
em probabilidade, em que o operador de covarincia

J
( ) Q
( )a, a Q
RJ
=
k=1
2 a2 k k ( ) + 2
1r<kJ
(k, r, ) ar ak
para cada
a RJ .
Demonstrao. A prova uma consequncia imediata do Lema A.2, em que podemos

aplicar os mesmos argumentos do Teorema A.1. Observao A.1 (A.6 e A.7), consideramos De fato, na notao introduzida na
( ) = (Z1 ( ), . . . , ZJ ( ), Z (i) = (W1 (i), . . . , WJ (i)), W
1; i 1.
Ao repetir os mesmos argumentos como na prova do Teorema A.1, fcil vericar que
um
F-vetor
martingale com incrementos independentes, isto ,
i Z
m Z
so
variveis aleatrias independentes com valores em
RJ
para cada
i = m.
Sob essas
condies, atravs do Lema A.2 conclumos a convergncia (A.10).
Referncias
Curnow, R. & Dunnett, C. (1962). The numerical evaluation of certain multivariate normal integrals. The Annals of Mathematical Statistics ,
33(2), 571579.
Duchesne, P. & Lafaye De Micheaux, P. (2010). Computing the distribution of quadratic forms: Further comparisons between the Liu-Tang-Zhang approximation and exact methods. Computational Statistics e Data Analysis ,
54(4), 858862.
Dunnett, C. & Sobel, M. (1955). Approximations to the probability integral and certain percentage points of a multivariate analogue of student's t-distribution.
42(1), 258260.
Biometrika ,
Dunnett, C. W. (1955). treatments with a control. 10961121. Fisher, R. (1935).
A multiple comparison procedure for comparing several
Journal of the American Statistical Association ,
50(272),
Society ,
98(1), 3982.
The logic of inductive inference.
Journal of the Royal Statistical
Fleming, T. & Harrington, D. (1991). Counting processes and survival analysis , volume 8. Wiley Online Library. Harrington, D. & Fleming, T. (1982). survival data. Biometrika , A class of rank test procedures for censored
69(3), 553566.
Hochberg, Y. (1988). A sharper bonferroni procedure for multiple tests of signicance.
Biometrika ,
75(4), 800802.
Hochberg, Y. & Tamhane, A. (1987). Multiple Comparison Procedure . John Wiley, New York. Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian
Journal of Statistics ,
Hommel, G. (1986).
6(2), 6570.
Metrika ,
33(1), 321336.
Multiple test procedures for arbitrary dependence structures.
Hommel, G. (1988). A stagewise rejective multiple test procedure based on a modied bonferroni test. Biometrika ,
75(2), 383386.
Hommel, G. (1989). A comparison of two modied bonferroni procedures. Biometrika ,
76(3), 624625.
70
Referncias
71
Hsu, J. (1996). Multiple Comparison: Theory and methods . Chapman and Hall,London. Karlin, S. (1968). Total positivity , volume 1. Stanford University Press. Karlin, S. & Rinott, Y. (1980). Classes of orderings of measures and related correlation inequalities. i. multivariate totally positive distributions.
Analysis ,
10(4), 467498.
Journal of Multivariate
Leo, D. & Ohashi, A. (2011). On the discrete Cramr-von Mises statistics under random censorship. "Submitted to the Annal of Statistics ". Lehmann, E. E. L. & Romano, J. P. (2005). Science+ Business Media. Marcus, R., Eric, P. & Gabriel, K. (1976). On closed testing procedures with special
Testing statistical hypotheses .
Springer
reference to ordered analysis of variance. Biometrika ,
63(3), 655660.
Miller, R. G. (1981). Simultaneous Statistical Inference . Springer-Verlag, New York. R Development Core Team (2011).
R: A language and environment for statistical
computing . R Foundation for Statistical Computing, Vienna, Austria.

Rom, D. (1990). A sequentially rejective test procedure based on a modied bonferroni inequality. Biometrika , Rom, D. (2013).
77(3), 663665.
An improved Hochberg procedure for multiple tests of signicance.
British Journal of Mathematical and Statistical Psychology ,
66(1), 189196.
Sarkar, S. (1998). Some probability inequalities for ordered MTP2 random variables: A proof of the Simes conjecture. The Annals of Statistics ,
26(2), 494504.
Sarkar, S. & Chang, C. (1997). The Simes method for multiple hypothesis testing with positively dependent test statistics.
92(440), 16011608.
Biometrika ,
Journal of the American Statistical Association ,
Simes, R. (1986). An improved Bonferroni procedure for multiple tests of signicance.
73(3), 751754.
Tarone, R. & Ware, J. (1977). distributions. Biometrika ,
64(1), 156160.
On distribution-free tests for equality of survival
Tukey, J. W. (1953). The problem of multiple comparisons. The Colected Works of Jonh
W. Tukey: Multiple Comparisons, Volume III , (1999), Edited by H. Braun, CRC Press,
Boca Ranton, Florida. Wright, S. (1992). 10051013. Adjusted p-values for simultaneous inference.
Biometrics ,
48(4),

Daiane Revisada

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Daiane Revisada

Uploaded by

Copyright:

Available Formats

Comparaes mltiplas para dados censurados

Daiane de Souza Santos

SERVIO DE PS-GRADUAO DO ICMC-USP

Data de Depsito: Assinatura:________________________ ______

Comparaes mltiplas para dados censurados

Daiane de Souza Santos

Orientador: Prof. Dr. Dorival Leo Pinto Jnior

USP So Carlos Junho de 2013

Comparaes mltiplas para dados censurados

SERVIO DE PS-GRADUAO DO ICMC-USP

Data de Depsito: Assinatura:________________________ ______

Comparaes mltiplas para dados censurados

Daiane de Souza Santos

Orientador: Prof. Dr. Dorival Leo Pinto Jnior

USP So Carlos Junho de 2013

Mtodos de comparaes mltiplas, controle da FWER, melhoramentos

do mtodo de Bonferroni, mtodo de Simes, estatsticas dependentes, dados censurados.

Multiple comparison methods, FWER control, improved Bonferroni method,

Simes' method, dependent statistics, censoring data.

2 Testes Mltiplos e MCMs . . . . . . . . . . . . . . . . . . . . . . . . . .

Procedimentos stepup e stepdown

Mtodo de Hommel . . . . . . . . . . . . . . . . . . . . . . . . . . . Mtodo de Rom . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 Modelo e Estatsticas dos Testes . . . . . . . . . . . . . . . . . . . . . .

Estatstica log-rank . . . . . . . . . . . . . . . . . . . . . . . . . . . Condio MTP2 para a estatstica log-Rank . . . . . . . . . . . . .

Estatstica de Cramr-von Mises . . . . . . . . . . . . . . . . . . . .

Dados contnuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 4.2.2 Controle da FWER . . . . . . . . . . . . . . . . . . . . . . . . . . . Poder dos testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 Concluso e propostas futuras . . . . . . . . . . . . . . . . . . . . . . . A Propriedades e resultados assintticos . . . . . . . . . . . . . . . . . . . Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

hipteses independentes so testadas, o risco

vezes. neste contexto que surgem os Mtodos

nvel de signicncia mltiplo

pr-estabelecido em termos dos valores-p das estatsticas

para algumas variedades de estatsticas multivariadas dependentes.

sob censura aleatria o teste de log-rank. De fato, um dos

log-rank e Cramr-von Mises.

Priorizamos nos estudos dados gerados de distribuio

Organizao dos captulos

destacar os principais conceitos empregados na teoria

introduzimos o modelo discreto sob censura aleatria com o qual

aplicao do mtodo de Simes.

4 traz um estudo de simulao que realizamos utilizando a linguagem

apresenta as concluses dos resultados obtidos e propostas de trabalhos

Captulo 2 Testes Mltiplos e MCMs

Testes Mltiplos e MCMs

erroneamente e o erro tipo II, que ocorre ao no rejeitarmos

quando esta falsa.

para cada teste individual, temos

que o nvel de signicncia conjunto (NSC) dado por

menos uma rejeio falsa}

Dessa forma, se executarmos

testes de hipteses, a probabilidade de rejeitarmos pelo

menos uma hiptese verdadeira aumenta para

testes, a probabilidade O grco

0, 62 e se forem realizados 50 testes, a probabilidade chega a 0, 92.

Nvel de significncia conjunto

Testes Mltiplos e MCMs

Taxa de erros da famlia dos testes - FWER

para todas as possveis colees de hipteses verdadeiras e falsas.

Valor descritivo do teste

Testes Mltiplos e MCMs

o espao paramtrico. Denimos como

a classe das hipteses alternativas, e os subconjuntos correspondentes respectivamente, tais que

Um procedimento de teste no aleatorizado atribui a cada possvel valor

pode assumir a deciso de rejeitar ou no rejeitar

Data de Depsito: Assinatura:__________________

Data de Depsito: Assinatura:__________________

nvel de signicncia mltiplo

que o nvel de signicncia conjunto (NSC) dado por

testes, a probabilidade O grco

o espao paramtrico. Denimos como

pela denio de valor-p, para todo Dessa forma,

(ii) Novamente pela denio do valor-p, desde que o evento

hipteses. Denimos todas as possveis com-

tambm seja signicante ao nvel

como uma hiptese signicante.

No caso geral, a m de obter um valor-p ajustado para cada

especca rejeitada para cada