You are on page 1of 81

Comparaes mltiplas para dados censurados

Daiane de Souza Santos

SERVIO DE PS-GRADUAO DO ICMC-USP

Data de Depsito: Assinatura:________________________ ______

Comparaes mltiplas para dados censurados

Daiane de Souza Santos

Orientador: Prof. Dr. Dorival Leo Pinto Jnior

Dissertao apresentada ao Instituto de Cincias Matemticas e de Computao - ICMC-USP, como parte dos requisitos para obteno do ttulo de Mestre em Cincias Cincias de Computao e Matemtica Computacional. VERSO REVISADA

USP So Carlos Junho de 2013

Comparaes mltiplas para dados censurados


Daiane de Souza Santos

SERVIO DE PS-GRADUAO DO ICMC-USP

Data de Depsito: Assinatura:________________________ ______

Comparaes mltiplas para dados censurados

Daiane de Souza Santos

Orientador: Prof. Dr. Dorival Leo Pinto Jnior

Dissertao apresentada ao Instituto de Cincias Matemticas e de Computao - ICMC-USP, como parte dos requisitos para obteno do ttulo de Mestre em Cincias Cincias de Computao e Matemtica Computacional. VERSO REVISADA

USP So Carlos Junho de 2013

Agradecimentos
Primeiramente, agradeo minha me Vilma, minha av Olita e ao meu tio Alexandre por sempre me apoiarem e incentivarem. Ao meu orientador, Dorival Leo, por ter acreditado em mim e por estar presente em cada etapa deste trabalho. Agradeo ainda pela pacincia e incentivo na elaborao e conduo deste trabalho. Minha eterna gratido e admirao. Aos professores de estatstica do ICMC-USP pelos ensinamentos e por toda ateno que me deram. Em especial professora Cibele Russo, membro da banca do

exame de qualicao, agradeo pelas diretrizes e sugestes. Aos professores e funcionrios do ICMC pela minha formao prossional, pessoal e pelo excelente convvio. Em especial ao Roberto pelo apoio e carinho, ao Bruno e Naiara pelos preciosos momentos de distrao e Patrcia, que mesmo distncia est todo dia presente. A todos meus amigos do curso de ps graduao em estatstica: Alessandra, Aline, Hiroshi, Gilberto, Joo Luiz, Jos Augusto, Jos Flores Delgado, Matheus e Willian, por toda ajuda que me deram e pelos momentos compartilhados ao longo destes anos. s minhas queridas companheiras de casa Nayara e Ludmila e aos demais amigos que, independentemente da distncia acompanham-me nesta jornada. No citarei nomes, pois esta lista seria muito extensa para ser colocada aqui. Alm disso, no correrei o risco de acabar esquecendo de algum. A todas as pessoas que no foram mencionadas, mas que de alguma maneira contriburam para viabilizar este trabalho.

Resumo
O objetivo deste trabalho estudar a performance de alguns mtodos de comparaes mltiplas (MCMs) que ajustam o valor-p quando as estatsticas empregadas nos testes so a log-rank e a Cramr-von Mises, ambas no paramtricas e com estrutura de dependncia. A vantagem dos MCMs que ajustam o valor-p que eles controlam as taxas de erro tipo I e tipo II para cada hiptese, a m de atingir um poder estatstico elevado, mantendo a taxa de erro da famlia dos testes (FWER) menor ou igual ao nvel de signicncia escolhido. Trabalhamos com o procedimento clssico de Bonferroni e com outros mtodos vistos como seu melhoramento, com especial ateno a certos procedimentos derivados do mtodo de Simes que permitem realizar inferncias sob as hipteses individuais. Foi vericado

teoricamente que a estatstica log-rank pertence classe multivariada totalmente positiva de ordem 2 (MTP2 ), uma vez que o mtodo de Simes garante o controle da FWER quando as estatsticas dependentes assumem esta condio. O controle da FWER empregando a estatstica de Cramr-von Mises foi observado apenas por meio de simulaes. Os MCMs foram analisados atravs de estudos computacionais em modelos discretos e contnuos sob censura com foco no problema de comparar um tratamento versus controle.

Palavras-chave:

Mtodos de comparaes mltiplas, controle da FWER, melhoramentos

do mtodo de Bonferroni, mtodo de Simes, estatsticas dependentes, dados censurados.

Abstract
The aim of this work is to study the performance of some Multiple Comparison Methods (MCMs) that adjust the p-value when the log-rank-type and Cramr-von Mises statistics are used, both nonparametric and with dependency structure. The advantage of these

methods is that they control the error rates of type I and type II for each hypothesis in order to achieve high statistical power while keeping the Family Wise Error Rate (FWER) lower or equal than a given signicance level. The classical Bonferroni procedure is used as well as others seen as its improvement, with special attention to certain procedures derived from Simes' method for making inferences on individual hypothesis. It is theoretically

proved that the weighted Log-Rank statistics belongs to the multivariate totally positive of order 2 (MTP2 ) class, which is needed in order to apply Simes' method, that guarantees control of the FWER of dependent statistics in this case. The control of the FWER

when the Cramr-von Mises statistics is used is only veried by means of computational simulations. The MCMs are also analyzed by means of computational experiments with discrete and continuous data under censoring with focus on the problem of comparisons of treatment versus a control.

Keywords:

Multiple comparison methods, FWER control, improved Bonferroni method,

Simes' method, dependent statistics, censoring data.

Sumrio
1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Organizao dos captulos . . . . . . . . . . . . . . . . . . . . . . . . . . .

1
5

2 Testes Mltiplos e MCMs . . . . . . . . . . . . . . . . . . . . . . . . . .


2.1 2.2 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conceitos principais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 2.2.2 2.2.3 2.2.4 2.3 Taxa de erros da famlia dos testes - FWER Valor descritivo do teste . . . . . . . . . . . . .

7
7 9 9 9 12 12 14 14 16 17 22 23 23 25

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Procedimentos stepup e stepdown

Mtodos fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Procedimentos de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 2.3.2 Bonferroni Clssico . . . . . . . . . . . . . . . . . . . . . . . . . . . Procedimento de Bonferroni de rejeio sequencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.4 2.5

Mtodo de Simes

Mtodo de Simes para testes individuais 2.5.1 2.5.2 2.5.3 Mtodo de Hochberg

. . . . . . . . . . . . . . . . . . . . . . . . . .

Mtodo de Hommel . . . . . . . . . . . . . . . . . . . . . . . . . . . Mtodo de Rom . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Sumrio

ii

3 Modelo e Estatsticas dos Testes . . . . . . . . . . . . . . . . . . . . . .


3.1 3.2 3.3 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modelo para os dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Estatsticas dos Testes 3.3.1 3.3.2 3.3.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

26
26 27 29 29 31 34

Estatstica log-rank . . . . . . . . . . . . . . . . . . . . . . . . . . . Condio MTP2 para a estatstica log-Rank . . . . . . . . . . . . .

Estatstica de Cramr-von Mises . . . . . . . . . . . . . . . . . . . .

4 Estudo de simulao . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Dados discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 4.1.2 4.2 Controle da FWER . . . . . . . . . . . . . . . . . . . . . . . . . . . Poder dos testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37
38 38 42 53 53 55

Dados contnuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 4.2.2 Controle da FWER . . . . . . . . . . . . . . . . . . . . . . . . . . . Poder dos testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 Concluso e propostas futuras . . . . . . . . . . . . . . . . . . . . . . . A Propriedades e resultados assintticos . . . . . . . . . . . . . . . . . . . Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61 63 70

Captulo 1 Introduo
Testes simultneos de vrias hipteses nulas, conhecidos simplesmente como testes mltiplos, so um dos problemas mais comuns de inferncia em diversas anlises estatsticas. Por exemplo, em pesquisas farmacuticas sobre a eccia de uma droga experimental, a avaliao estatstica sobre a superioridade da droga em relao aos medicamentos existentes ou sobre o placebo geralmente realizada por meio de uma formulao de testes mltiplos. O principal desao dos testes mltiplos est em assegurar que a taxa de erro Tipo I, que rejeitar erroneamente a hiptese nula e, por conseguinte, chegar a uma inferncia falso positiva, seja mantido ao nvel estabelecido pelo investigador. Pesquisas biomdicas, por exemplo, geralmente utilizam projetos experimentais complexos. Dessa forma, a m de economizar recursos, como dinheiro, tempo do investigador ou unidades experimentais (humanos, animais, tecidos ou clulas), vrias hipteses acabam sendo testadas a partir de uma nica experincia, o que aumenta o risco de fazer inferncias estatsticas falsas. No pior dos casos, se de uma inferncia errnea aumenta

hipteses independentes so testadas, o risco

vezes. neste contexto que surgem os Mtodos

de Comparaes Mltiplas (MCMs), que so procedimentos estatsticos designados a minimizar estes erros. A bibliograa sobre este assunto extensa, podemos destacar como referncias fundamentais os livros Hochberg & Tamhane (1987), Hsu (1996) e Lehmann & Romano (2005), que trazem quase todas as tcnicas e conceitos empregados nesta rea da inferncia mltipla.

1.

Introduo

Na literatura de testes mltiplos diferentes taxas de erros foram analisadas, sendo as principais denominadas como: taxa de erro por comparao (per-comparison error rate (PCE)), denida como a proporo esperada do erro tipo I; taxa de erro por famlia (error rate per family (PFE)), exibida como o nmero de erros esperados na famlia; taxa de erros da famlia dos testes (family-wise error rate (FWER)), que representa a probabilidade de uma ou mais rejeies falsas na famlia de inferncias; e ainda a false

discovery rate (FDR), que indicada quando temos um nmero bem elevado de hipteses
a serem testadas, e denida pelo valor esperado da razo entre o nmero de rejeies falsas e o nmero total de rejeies. Neste trabalho, as discusses sero voltadas para os MCMs que controlam a FWER, que entre outras razes, segundo Hochberg & Tamhane (1987), nos permite calibrar uniformemente procedimentos diferentes para um referencial comum, e assim, comparar as suas caractersticas operacionais de maneira justa. Um dos precursores dos MCMs foi Fisher (1935), que introduziu duas categorias distintas: procedimentos de uma etapa (single-step ), que abrange a importante classe

referida como procedimentos de testes simultneos (simultaneous test procedures ); e procedimentos de etapas mltiplas (stepwise ), que posteriormente foram classicadas em ascendente (stepup ) e descendente (stepdown ). O primeiro mtodo proposto por Fisher o famoso teste da diferena mnima signicativa (least signicant dierence (LSD) test ), que pode ser visto como um procedimento de duas etapas, em que a hiptese nula testada preliminarmente por um teste

F.

J o segundo mtodo dado por Fisher apresenta etapa nica e popularmente conhecido como procedimento de Bonferroni. Ambos procedimentos controlam a FWER, o LSD

no sentido fraco (somente quando todas as hipteses nulas na famlia so verdadeiras) e Bonferroni no sentido forte (para qualquer combinao de hipteses verdadeiras e falsas). No entanto, frequentemente o LSD exibe maior poder e uma das razes disto o fato de apresentar mais de uma etapa. As comparaes mltiplas na anlise de varincia (ANOVA) uma rea em que as inferncias simultneas tm uma longa histria. O procedimento clssico e mais utilizado neste contexto foi proposto por Tukey (1953). Tal mtodo compara todos os possveis

pares de mdias a m de encontrar quais delas diferem signicativamente uma das outras, e baseado na distribuio da amplitude Studentizada. Para dados balanceados, o teste de

1.

Introduo

Tukey o mtodo de uma etapa mais poderoso para comparaes de mdias duas a duas. Quando o interesse est na comparao de vrios tratamentos com um controle, o teste que merece destaque na ANOVA foi proposto por Dunnett (1955), e bem semelhante ao teste t usual. Marcus et al. (1976) propuseram uma tcnica geral para a construo de procedimentos descendentes: os mtodos fechados (closure method ). Os procedimentos resultantes deste mtodo so a base para a construo de muitas estratgias de comparaes que veremos neste trabalho, eles controlam a FWER no sentido forte e chamado na literatura de procedimentos de testes fechados (closed testing procedures ). O mtodo de Bonferroni clssico tem presena marcante na inferncia simultnea, pode ser aplicado em qualquer situao de testes mltiplos e como dito anteriormente, controla a FWER no sentido forte, porm o preo desta generalidade a falta de poder. Diante disto, a m de amenizar esta situao, tem surgido na literatura diversos

procedimentos denominados como melhoramentos de Bonferroni, j que um MCM ideal aquele que controla a FWER e tem capacidade para detectar casos em que a hiptese nula falsa. Estas tcnicas geralmente apresentam etapas mltiplas e so propostas para ajustar o valor-p oriundo das estatsticas dos testes. A vantagem dos MCMs que ajustam o valor-p que eles controlam as taxas de erro tipo I e tipo II para cada hiptese com o propsito de atingir um poder estatstico elevado, mantendo a FWER menor ou igual ao nvel de signicncia escolhido. Um dos primeiros aprimoramentos do mtodo clssico foi dado por Holm (1979), que props um mtodo descendente atravs do procedimento dos testes fechados, que cou conhecido como procedimento de Bonferroni de rejeio sequencial (sequentially rejective bonferroni procedure ) ou procedimento de Holm. Esta estratgia exibe maior poder quando comparado ao mtodo tradicional de Bonferroni e controla a FWER no sentido forte. Uma das modicaes mais importantes do procedimento de Bonferroni e que daremos grande ateno neste trabalho foi dado por Simes (1986). Tal mtodo testa a hiptese nula global

H0 =

n i=1

Hi ,

que a combinao de

hipteses individuais, a um

nvel de signicncia mltiplo

pr-estabelecido em termos dos valores-p das estatsticas

dos testes. Simes provou que seu procedimento controla a FWER quando as estatsticas dos testes so independentes e conjecturou via simulao que este controle se mantm

1.

Introduo

para algumas variedades de estatsticas multivariadas dependentes.

Evidenciamos este

mtodo pelo fato dele apresentar maior poder em relao a Bonferroni, principalmente quando estatsticas altamente correlacionadas esto envolvidas. Como Simes (1986) no justicou teoricamente o controle da FWER para estatsticas dependentes, Sarkar & Chang (1997) mostraram que para distribuies multivariadas que exibem um certo tipo de dependncia positiva o mtodo de Simes controla efetivamente a FWER. Posteriormente, Sarkar (1998) provou analiticamente que o mtodo de Simes controla a FWER para uma classe ainda mais geral de distribuies multivariadas com dependncia positiva, caracterizadas pela condio multivariada totalmente positiva de ordem 2 (MTP2 ) e tambm para algumas misturas de MTP2 . Simes (1986) tambm deixou em aberto o problema de realizar inferncias simultneas sob as hipteses individuais. Diante disto, Hochberg (1988) sugeriu um mtodo bem simples de rejeio sequencial do tipo ascendente. Hommel (1988) tambm estendeu o procedimento de Simes para inferncias individuais, e subsequentemente, Hommel (1989) mostrou que este procedimento, embora seja mais complicado e difcil de ser interpretado, mais poderoso que a estratgia formulada por Hochberg. A m de melhorar o procedimento de Hochberg, Rom (1990) props uma modicao que requer o clculo dos pontos crticos atravs de um algoritmo recursivo, e foi mostrado que tal procedimento apresenta uma pequena vantagem em relao ao mtodo original. Recentemente, Rom (2013)

forneceu uma modicao que mantm a simplicidade do procedimento de Hochberg enquanto apresenta um ganho de poder, que pode ser moderado em algumas situaes, podendo atingir nveis bem elevados quando muitas das hipteses testadas so falsas. Neste trabalho o principal objetivo aplicar os procedimentos de Bonferroni, Holm, Hochberg, Hommel e o mtodo recente proposto por Rom (2013) em modelos discretos sob censura aleatria, j que a anlise estatstica para estes dados tem grande importncia em inmeras reas. Um exemplo tpico visto na educao quando queremos analisar o nmero de semestres at a ocorrncia da evaso dos alunos de graduao de uma universidade. Quando analisamos dados ao longo do tempo como estes, um problema frequente que alguns dados aparecem somente em certos perodos, ou seja, esto sujeitos censura. Dessa forma, quando o evento de interesse a ocorrncia da evaso devemos considerar os eventos de censura, que neste caso podem ser a transferncia, a migrao,

1.

Introduo

o falecimento ou a concluso do curso. Em vrias circunstncias, procedimentos estatsticos baseados em distribuies contnuas ou mistas no podem ser aplicados diretamente em dados puramente discretos, devido falta de informao necessria para validar os resultados assintticos. Um

problema encontrado na literatura est no desenvolvimento de mtodos de testes no paramtricos para modelos discretos na presena de censura que seja consistente em uma grande classe de hipteses alternativas. importantes para testar Um dos mtodos no paramtricos mais

H0

sob censura aleatria o teste de log-rank. De fato, um dos

testes no paramtrico mais indicados para comparar duas ou mais populaes com dados sujeitos censura, contudo apresenta a desvantagem de no exibir um bom poder ao lidar com funes intensidade no proporcionais. Dessa maneira, trabalhamos tambm com a estatstica de Cramr-von Mises, que foi analisada em Leo & Ohashi (2011) e considerada ideal para modelos puramente discretos sob censura. Vericamos teoricamente que a estatstica log-rank satisfaz a condio MTP2 . O controle da FWER ao empregar as extenses do mtodo de Simes na estatstica Cramrvon Mises foi averiguado apenas por recursos computacionais. Ainda por meio de estudos de simulaes comparamos a performance dos mtodos de Bonferroni, Holm, Hochberg, Hommel e Rom em relao ao ganho de poder realizando os testes com as estatsticas

log-rank e Cramr-von Mises.

Priorizamos nos estudos dados gerados de distribuio

discreta, mas tambm realizamos uma pequena anlise com dados contnuos. Focamos no problema de comparar um tratamento versus controle.

1.1

Organizao dos captulos

O foco do Captulo

destacar os principais conceitos empregados na teoria

de comparaes mltiplas e apresentar detalhadamente o procedimento de Simes e suas principais extenses para testes individuais. No Captulo

introduzimos o modelo discreto sob censura aleatria com o qual

trabalhamos e apresentamos as estatsticas dos testes empregadas: log-rank e Cramr-von Mises. Mostramos ainda que a estatstica log-rank satisfaz a condio MTP2 para a

aplicao do mtodo de Simes.

1.

Introduo

O Captulo

4 traz um estudo de simulao que realizamos utilizando a linguagem

R (R Development Core Team, 2011), com o objetivo de analisar o desempenho do mtodo de Simes e suas extenses para testes individuais, quanto ao controle da FWER e ao ganho de poder ao realizar os testes com as as estatsticas log-rank e Cramr-von Mises. Por m, o captulo futuros.

apresenta as concluses dos resultados obtidos e propostas de trabalhos

Captulo 2 Testes Mltiplos e MCMs


Neste captulo exploramos os conceitos mais importantes envolvidos na teoria de testes mltiplos, principalmente no que diz respeito aos MCMs que controlam a FWER no sentido forte e que so descritos por meio dos valores-p oriundos das estatsticas dos testes. Relatamos as modicaes mais relevantes do mtodo clssico de Bonferroni,

apresentamos o mtodo de Simes e algumas de suas extenses para realizar inferncias sob as hipteses nulas individuais.

2.1

Introduo

Em pesquisas mdicas, educacionais ou agrcolas, uma ferramenta comum para a anlise dos dados um teste de homogeneidade das populaes (tratamentos ou grupos); e quando a hiptese nula que carrega a informao de que todas as populaes so iguais rejeitada, no obtemos inferncias sobre diversas comparaes detalhadas entre as populaes que podem ser de interesse do investigador, por exemplo, comparaes dois a dois entre os grupos, comparaes de vrios tratamentos com um controle (ou referncia), ou ainda comparaes entre todos os subconjuntos dos grupos. neste contexto que

surgem os Testes Mltiplos, em especial as Comparaes Mltiplas, j que nossa ateno neste trabalho est voltada s comparaes. Quando realizamos testes de hipteses podemos cometer dois possveis erros na tomada de deciso: o erro tipo I, que ocorre quando a hiptese nula

H0

rejeitada

2.

Testes Mltiplos e MCMs

erroneamente e o erro tipo II, que ocorre ao no rejeitarmos

H0

quando esta falsa.

desejvel realizar os testes de uma maneira que as probabilidades dos dois tipos de erro sejam mnimas, porm quando temos um nmero grande de hipteses a serem testadas simultaneamente nos deparamos com o problema da multiplicidade, que se refere ao crescimento da probabilidade do erro tipo I com o aumento do nmero de testes. Para ilustrar numericamente este fato vejamos o exemplo a seguir, em que foi calculada a probabilidade de ao menos uma rejeio falsa quando todas as hipteses verdadeiras e as estatsticas dos testes so independentes. Considerando o nvel de signicncia

H1 , . . . , Hn

so

= 0, 05

para cada teste individual, temos

que o nvel de signicncia conjunto (NSC) dado por

P {ao

menos uma rejeio falsa}

=1
i=1

{1 P (rejeio

falsa)}

= 1 (1 )n .

Dessa forma, se executarmos

10

testes de hipteses, a probabilidade de rejeitarmos pelo

menos uma hiptese verdadeira aumenta para

0, 40;

se forem executados

20

testes, a probabilidade O grco

0, 62 e se forem realizados 50 testes, a probabilidade chega a 0, 92.

na sequncia mostra o comportamento do NSC medida que aumentamos o nmero de testes realizados.

Nvel de significncia conjunto


1.0 NSC 0.2 0 0.4 0.6 0.8

20

40 Nmero de testes

60

80

FIGURA 2.1:

Comportamento do NSC.

diante deste problema que os MCMs foram formulados, para levar em conta e controlar adequadamente o nvel de signicncia conjunto, isto , garantir que a probabilidade de ao menos uma rejeio falsa no aumente com o nmero de testes envolvidos.

2.

Testes Mltiplos e MCMs

2.2

Conceitos principais

2.2.1

Taxa de erros da famlia dos testes - FWER


Para proporcionarmos uma abordagem objetiva para o problema de inferncias

mltiplas, garantindo uma correo simultnea para um conjunto de inferncias e chegar a uma deciso global correta, introduzimos o conceito de famlia, que pode ser denida como qualquer coleo de hipteses que esto submetidas a testes comuns, em que os erros conjuntos so controlados. Por exemplo, num teste laboratorial de amostras de sangue, uma famlia pode ser denida como todos os ensaios realizados em um dia, ou aqueles realizados em um dia por um determinado testador. Por outro lado, os testes realizados pela manh e tarde podem ser considerados como famlias distintas, e assim por diante. Em suma, a escolha dos testes que sero tratados como uma famlia depender da situao (Lehmann & Romano, 2005). Todos os MCMs discutidos neste trabalho so denidos em termos de uma famlia nita de hipteses. Como nosso enfoque no est na realizao de um nmero muito extenso de testes e temos como objetivo chegar a uma deciso nal satisfatria, fundamental que todas as inferncias simultneas sejam corretas, assim necessrio que os MCMs controlem a taxa de erro da famlia de testes (family-wise error rate ), que denotaremos a partir de agora como FWER. Esta taxa representa a probabilidade de cometermos ao menos uma rejeio falsa na famlia. Portanto, uma vez que a famlia de testes foi denida, queremos que FWER

para todas as possveis colees de hipteses verdadeiras e falsas.

2.2.2

Valor descritivo do teste


Sem dvida o valor descritivo do teste, conhecido popularmente como valor-p,

tornou-se o ponto de partida para muitos que utilizam anlise estatstica; e na inferncia simultnea isto no diferente, j que um valor-p fornece informaes acerca se o teste de hiptese signicativo ou no, e ainda indica o quanto signicativo o resultado ,

2.

Testes Mltiplos e MCMs

10

visto que, quanto menor o valor-p maiores as evidncias contra a hiptese nula. Testes estatsticos da interseco de um nmero de hipteses nulas com base em seus valores-p correspondentes so um problema comum na prtica. Por exemplo,

na avaliao da superioridade de uma droga nova em relao a uma droga existente ou placebo, estudos mltiplos so frequentemente utilizados para investigar diferentes aspectos dos efeitos das drogas. Transmitir resultados dos estudos individuais tornou-se uma prtica comum na pesquisa farmacutica. Assim, para obter uma concluso, por

exemplo, se existe ou no ao menos uma dose ou grupo de pacientes para os quais a nova droga mais eciente do que seu concorrente, muitas vezes conveniente utilizar apenas os valores-p correspondentes s comparaes individuais (Sarkar & Chang, 1997). Diante disto, na sequncia relatamos algumas propriedades do valor-p que so fundamentais para a teoria dos MCMs que tratamos neste trabalho. A tomada de deciso em um teste de hiptese baseada no valor de uma certa varivel aleatria

X,

com distribuio

pertencente classe

P = {P , }, H

em que

o parmetro de interesse e

o espao paramtrico. Denimos como

a classe das

hipteses nulas e de

a classe das hipteses alternativas, e os subconjuntos correspondentes respectivamente, tais que

por

H K =P

H K = . x
que

Um procedimento de teste no aleatorizado atribui a cada possvel valor

pode assumir a deciso de rejeitar ou no rejeitar

H,

e assim, divide o espao amostral

em duas regies complementares: regio de aceitao e regio de rejeio de Consideremos

H. ,
estas

uma regio de rejeio de nvel

Variando valores de

regies podem ser encaixadas no sentido que

S S

se

<.

(2.1)

Sob essa situao, conseguimos determinar o menor nvel de signicncia, valor-p, denido matematicamente por

p = p(X ) = inf { : X S } .

Lema 2.1

(Lehmann & Romano (2005))

Suponhamos que

tenha distribuio de

probabilidade

para algum

e a hiptese nula

estabelece

H .

Assumimos

que as regies de rejeio sejam encaixantes como em (2.1.

2.

Testes Mltiplos e MCMs

11

(i) Se

sup P {X S } ,
H

para todo

0 < < 1,

(2.2)

ento a distribuio de

sobre

satisfaz

P {p u} u
(ii) Se, para

para todo

0 u 1.

H , P {X S } =
para todo

0 < < 1,

(2.3)

ento,

P {p u} = u
ou seja,

para todo

0 u 1;

tem distribuio uniforme

(0, 1). v > u , {p u}

Demonstrao. (i) Se

H ,

pela denio de valor-p, para todo Dessa forma,

{X Sv },

o que implica em

P {p u} P {X Sv }.

v u+

lim P {p u} lim+ P {X Sv } ,
v u

e desde que vale (2.2), temos que

P { p u } u . {X Su }
implica que

(ii) Novamente pela denio do valor-p, desde que o evento

{p u},

temos

P {p u} P {X Su } .
Logo, desde que (2.3) mantida, conclumos que

P {p u} u.

Portanto, pelo resultado obtido em

(i)

P {p u} = u.

A maioria dos MCMs que controlam a FWER no sentido forte so denotados a partir dos valores-p, as hipteses geralmente so ordenadas de acordo com seus nveis descritivos e ento estes valores so ajustados (corrigidos). O valor-p ajustado para uma hiptese especca dentro de um conjunto de hipteses o menor nvel de signicncia global em que a hiptese particular seria rejeitada. Um valor-p ajustado poder ser

comparado diretamente com qualquer nvel de signicncia ajustado for menor ou igual a

escolhido:

se o valor-p

a hiptese ser rejeitada (Wright, 1992).

2.

Testes Mltiplos e MCMs

12

2.2.3

Procedimentos stepup e stepdown


Os MCMs de etapas mltiplas (stepwise ) podem ser classicados em ascendentes

(stepup ) ou descendentes (stepdown ).

Um procedimento descendente iniciado deter-

minando se o teste que parece ser mais signicativo pode ser rejeitado ou no. Se cada teste individual representado por um valor-p, o mtodo descendente descrito da seguinte maneira. Consideramos as constantes

1 2 . . . s .
Sejam

(2.4)

p(1) , . . . , p(r) , a ordenao de p1 , . . . , pr . r = 1, . . . , n,

Se

p(1) 1 , nenhuma hiptese rejeitada.


associadas a

Caso contrrio, para rejeitadas se,

as hipteses

H(1) , . . . , H(r) ,

p1 , . . . , p r ,

so

p(1) < 1 , . . . , p(r) < r .


Em suma, o procedimento descendente inicia-se com o valor-p mais signicativo e segue rejeitando as hipteses contanto que seus valores-p sejam pequenos. Em contrapartida, um procedimento ascendente inicia-se avaliando o valor-p menos signicativo. Para o conjunto de constantes dado em (2.4), todas as hipteses so rejeitadas se

p(n) < n .

Caso contrrio, para

r = n, n 1, . . . , 1, as hipteses H(1) , . . . , H(r)

so rejeitadas se

p(n) n , . . . , p(r+1) r+1

mas

p(r) < r .

Os mtodos de Holm e de Hochberg que veremos adiante so exemplos de procedimentos descendentes e ascendentes, respectivamente.

2.2.4

Mtodos fechados
O mtodo proposto por Holm (1979), bem como o mtodo ainda mais poderoso

dado por Hommel (1988), que veremos na sequncia deste captulo, so baseados no princpio dos testes fechados de Marcus et al. (1976), que segundo Hochberg & Tamhane (1987) podem ser vistos como mtodos gerais para construo de procedimentos de testes descendentes. A verso deste procedimento que daremos a seguir pode ser vista em

2.

Testes Mltiplos e MCMs

13

Hommel (1986, 1988). Seja

H1 , . . . , Hn

uma coleo de

hipteses. Denimos todas as possveis com-

binaes dos subconjuntos destas hipteses como em que

HI = {Hi : i I },

para todo

I Q,

o conjunto de todos subconjuntos no vazios de {1,2,. . . ,n}.

Suponhamos

que para cada

HI

existe um teste baseado numa estatstica

TI . TJ

Para um dado

, HI

rejeitado se cada

HJ

rejeitado ao nvel

pela estatstica

correspondente, em que

J Q

J I. HI

A probabilidade de uma ou mais rejeies falsas quando testamos todas menor ou igual a

as hipteses

como mostra o prximo teorema.

Teorema 2.1 (Marcus et al. (1976)).


a FWER no sentido forte ao nvel

O procedimento de testes fechados (PTF) controla

Demonstrao. Seja
seja Se

{Hi , i I }

uma coleo qualquer de hipteses nulas verdadeiras e

HI = {Hi : i I },

em que

algum subconjunto desconhecido de

{1, 2, . . . , n}. A
como o

vazio, no pode haver erro tipo I, ento consideramos

I = . B

Denimos

evento em que ao menos uma hiptese verdadeira rejeitada.

Hi

rejeitada e

o evento em que

HI

O procedimento de testes fechados rejeita uma hiptese somente se, todas as hipteses que implicam

Hi

verdadeira se, e

Hi ,

em particular

HI ,

so testadas ao nvel

e so rejeitadas; e desde que o teste de

Hi

tambm seja signicante ao nvel

Assim,

podemos tomar

A = A B,
FWER

ento sob

HI
(2.5)

= P {A} = P {A B } = P {B }P {A|B } . P {B } HI ,
quando

A ltima desigualdade segue desde que desigualdade

HI

verdadeira.

Como a

(2.5)

se mantm em qualquer

o teorema est provado.

Para aplicar o PTF podemos inicialmente comear com o teste global

HI ={Hi :

i = 1, 2, . . . , n}.
ao nvel

Se este teste rejeitado ao nvel

, o procedimento de teste ainda continua

para cada subconjunto com

n1

hipteses. Enquanto as hipteses continuam

sendo rejeitadas ao nvel hipteses individuais

o teste continua at atingir subconjuntos de tamanho um: as

Hi .

2.

Testes Mltiplos e MCMs

14

Para ilustrar o PTF podemos analisar o diagrama a seguir, em que consideramos as hipteses

H1 , H2 , H3

H4

e tomamos

HI

como uma hiptese signicante.

H1234 H123 , H124 , H134 , H234 , H23 , H24 , H34 , H14 , H13 H12 H1 , H2 , H3 , H4

Diante desta situao, observamos que apenas a hiptese com

H1

rejeitada pelo PTF. Embora

H2

seja signicante, no rejeitada pelo PTF, pois nem todas interseces so signicantes.

HJ ,

{2} J {1, 2, 3, 4}

Como visto em Wright (1992) o procedimento de teste fechado pode ser modicado de modo a gerar um valor-p ajustado para cada valor-p no ajustado da estatstica se

HI .

Isto feito tomando como

pI

TI

para testar

HI .

A hiptese

HI

rejeitada somente

pJ ,

para todo

HJ , pJ .

tal que

J I.

Portanto, o valor-p ajustado para

HJ

deve

ser o maior dos valores hiptese individual

No caso geral, a m de obter um valor-p ajustado para cada

Hi

seria necessrio conduzir o teste e obter o valor-p no ajustado O nmero total de testes que devem ser

para cada possvel subconjunto de hipteses. realizados portanto

n n i=1 i

= 2n 1.

Felizmente, em certos casos existem atalhos

para isto, tal como o procedimento de Holm que veremos adiante.

2.3

Procedimentos de Bonferroni

2.3.1

Bonferroni Clssico
A desigualdade de Bonferroni frequentemente utilizada na realizao de testes

mltiplos a m de denir um limite superior sobre o nvel de signicncia conjunto (Miller, 1981).

O uso desta desigualdade na teoria dos testes mltiplos usualmente

chamada de procedimento de Bonferroni. Seja e

T1 , . . . , Tn

um conjunto de

n estatsticas para testar as hipteses H1 , . . . , Hn

p1 , . . . , p n

os valores-p correspondentes a estas estatsticas. Pelo procedimento clssico

2.

Testes Mltiplos e MCMs

15

de Bonferroni, a hiptese nula

H0 =

n i=1

Hi

rejeitada se qualquer valor-p menor que

. Alm disso, a hiptese

Hi

especca rejeitada para cada

pi

com

i = 1, . . . , n.
preferidos

Cada

escolhido de modo que sua soma seja igual a

Geralmente, os

so todos iguais a

/n,

mas alocaes diferentes podem ser utilizadas.

O mtodo de Bonferroni controla a FWER. A vericao deste argumento est na sequncia e segue quase que imediatamente da desigualdade de Bonferroni. Consideramos

pi wi

o valor-p para testar de

Hi , tal que cada hiptese Hi

pode ser vista como um subconjunto para qualquer

Assumimos especicamente que

P {p u} u

u (0, 1)

qualquer

P wi .

Notemos que no necessrio que a distribuio de

pi

seja uniforme em

(0, 1)

sempre que

Hi

verdadeira.

Teorema 2.2

(Lehmann & Romano (2005))

Se para cada

i = 1, . . . , n,

as hipteses

Hi

so rejeitadas quando

pi /n, .

ento a FWER para os testes mltiplos de

H1 , . . . , Hn

se mantm menor ou igual a

Demonstrao. Suponhamos que as hipteses


denotando a cardinalidade de

Hi

com

iI

sejam verdadeiras, com

|I |

I.

Da desigualdade de Bonferroni temos que,

FWER

= P {rejeitar =
iI

qualquer

Hi

com

i I}
iI

P {rejeitar Hi }

P pi n

i I

|I | /n . n

Como vemos, este procedimento clssico controla satisfatoriamente a FWER. Todavia, em algumas situaes bastante conservativo, isto , o valor da FWER real s vezes muito menor que o nvel

estabelecido.

O mtodo de Bonferroni um exemplo de teste de etapa nica que tem como caracterstica marcante o fato de poder ser aplicado em qualquer situao de inferncias simultneas. Contudo, nos mtodos de uma etapa o controle da FWER tem a consequncia de que quanto maior o nmero de hipteses na famlia, menor o poder para testar as hipteses individuais. Procedimentos de etapas mltiplas superam esta desvantagem, e por isso que os MCMs vistos como melhoramentos do mtodo clssico de Bonferroni apresentam mais de uma etapa.

2.

Testes Mltiplos e MCMs

16

2.3.2

Procedimento de Bonferroni de rejeio sequencial


Holm (1979) props um mtodo descendente que cou conhecido na literatura

como procedimento de Bonferroni de rejeio sequencial ou procedimento de Holm. Este mtodo denido por meio dos valores-p,

p1 , . . . , p n ,

dos

testes individuais.

Consideramos estes nveis descritivos dos teses ordenados denotados por e

p(1) , . . . , p(n)

H(1) , . . . , H(n)

as hipteses associadas. Dessa forma, o procedimento de Holm pode ser

denido atravs das seguintes etapas:

Passo 1.

Se

p1 > /n,

as hipteses

H1 , . . . , Hn

no so rejeitadas e o procedimento

termina. Se nvel

p1 /n,

rejeitamos

H(1)

e o teste continua com

n1

hipteses testadas ao

/(n 1); p1 /n,


mas

Passo 2. Se

p2 > /(n 1),


rejeitamos

no rejeitamos

H2 , . . . , Hs

e paramos. Se

p1 /n

p2 /(n 1), /(n 2);

H(2)

alm de

H(1)

e o teste continua com

m2

hipteses ao nvel

Em suma, o procedimento continua desta maneira rejeitando

Hi

quando

p(j ) /(n j + 1),


para todo

j = 1, . . . , i.

O teorema dado na sequncia mostra que o mtodo de Holm controla a FWER ao nvel

em associaes livres (free combinations ) das hipteses.

Esta denio de

associaes livres tem o objetivo de salientar que todos os subconjuntos de hipteses nulas poderiam aparecer como conjunto de hipteses verdadeiras. Pode haver situaes em que nem todos os subconjuntos so permitidos por algum motivo, por exemplo, em situaes em que a verdade de duas hipteses implica a verdade ou a falsidade de uma terceira hiptese. importante ser observado que um nvel de signicncia mltiplo

para algumas combinaes restritas impe menos condies no procedimento de teste em relao ao nvel de signicncia mltiplo em associaes livres, ou seja, um procedimento de teste com nvel mltiplo

em combinaes livres mantm o nvel mltiplo

para

qualquer tipo de combinaes restritas.

Teorema 2.3 (Lehmann & Romano (2005)). No procedimento de Holm a FWER menor

2.

Testes Mltiplos e MCMs

17

ou igual a

. Hi
com

Demonstrao. Suponha

i I j

o conjunto das hipteses verdadeiras.

Assim,

P wi

se, e somente se,

i I.

Seja

o menor ndice satisfazendo

pj = min pi .
i I
Note que

j n | I | + 1.

O procedimento de Holm comete uma rejeio falsa se

p(1) /n, p(2) /(n 1), . . . , p(j ) /(n j + 1),


implicando que

min pi = p(j ) /(n j + 1) |I | .


iI
Logo, pela desigualdade de Bonferroni, a probabilidade de uma rejeio falsa dada por

min pi / |I |
i I

iI

P {pi / |I |}
i I

/ |I | .

Em quase todas as situaes o procedimento de Holm tem probabilidade estritamente maior de rejeitar uma hiptese falsa em relao ao procedimento clssico de Bonferroni. O ganho de poder obtido usando o procedimento de Holm ao invs O ganho pequeno se todas as

de Bonferroni depende muito da hiptese alternativa.

hipteses forem quase verdadeiras, mas pode ser considervel se as hipteses forem completamente falsas (Holm, 1979).

2.4

Mtodo de Simes

Entre os procedimentos vistos como melhoramentos do mtodo clssico de Bonferroni, um dos que recebeu bastante ateno ao longo dos anos e que damos grande importncia neste trabalho foi proposto por Simes (1986). Consideremos um conjunto de

n hipteses nulas, Hi (i = 1, . . . , n), e suponhamos

que para cada hiptese individual temos uma estatstica do teste apropriada, tal que os

2.

Testes Mltiplos e MCMs

18

valores-p oriundos dos testes das

hipteses nulas so

p1 , . . . , p n .

O mtodo formulado

por Simes tem o propsito de testar a hiptese nula global de signicncia

H0 =

n i=1

Hi

a um nvel

pr-estabelecido, em termos dos valores-p das estatsticas do teste,

sugerindo a rejeio de os valores-p ordenados.

H0

se

p(i) i/n

para ao menos um

i,

em que

p(1) , . . . , p(n)

so

Devido regio de rejeio do mtodo de Simes conter a regio de rejeio do mtodo de Bonferroni, este procedimento modicado claramente mais poderoso que o mtodo clssico. Tambm foi observado via simulao em Simes (1986), que esta

melhoria do poder bastante signicante quando as estatsticas dos testes so altamente correlacionadas. Em relao FWER, foi provado que o procedimento modicado mantm o controle a um nvel independentes.

pr-estabelecido apenas quando as estatsticas do teste so

Contudo, Simes (1986) conjecturou via simulao que este controle se

mantm quando as estatsticas so dependentes com algumas distribuies especcas: o valor absoluto da normal multivariada e um certo tipo de distribuio gama multivariada. Sarkar (1998) provou analiticamente que a conjectura de Simes verdadeira para uma classe geral de distribuies multivariadas com dependncia positiva, caracterizada pela condio multivariada totalmente positiva de ordem 2 (MTP2 ), e para algumas misturas de MTP2. A denio e algumas propriedades do conceito MTP2 esto na

sequncia e podem ser vistos detalhados em Karlin & Rinott (1980). Seja

X =

n i=1

Xi

um produto de espaos totalmente ordenados

Xi , i = 1, . . . , n,

com a ordenao parcial denida da seguinte maneira: crevemos para

para qualquer

x, y X ,

es-

x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) satisfazem xi yi em Xi , i = 1, . . . , n. Consideramos x y = (max(x1 , y1 ), . . . , max(xn , yn )) e x y =


se

x y

(min(x1 , y1 ), . . . , min(xn , yn )).

Denio 2.1. Uma para todo x, y X ,

funo

f : X [0, )

dita ser MTP2 (TP2 quando

n = 2)

se

f (x y)f (x y) f (x)f (y).


Um vetor

n-dimensional,

X = (X1 , . . . , Xn ), ou sua distribuio chamado MTP2 se sua

densidade MTP2 .

Resultado 2.1.

Se

f1 (x)

f 2 ( x)

so ambas MTP2 em

X,

ento

f1 (x)f2 (x)

MTP2 .

2.

Testes Mltiplos e MCMs

19

Resultado 2.2.

Se

f (x)

MTP2 em

X,

ento

...

f ( x)
i=m+1

dxi

MTP2 em

m i=1

Xi .

Agora, enunciamos de maneira anloga a Sarkar (1998) o teorema que leva prova da conjectura de Simes.

Teorema 2.4.
MTP2 ,

Sejam

X(1) . . . X(n)
e

as componentes ordenadas de um vetor aleatrio

X = (X1 , . . . , Xn ),

Fi

a funo de distribuio acumulada marginal de

Xi .

Ento, temos as seguintes armaes.

(i) Para

a1 , . . . , an ,

xados
n

P X(1) a1 , . . . , X(n) an
se

1 1 n

Fi (an ),
i=1

(2.6)

Fi (aj )/j

no decrescente em

j = 1, . . . , n

para todo

i = 1, . . . , n.

(ii) Para

b1 , . . . , bn ,

xados
n

P X(1) b1 , . . . , X(n) bn
se

1 n

Fi (a1 ),
i=1

(2.7)

i (bnj +1 )/j F

no decrescente em

j = 1, . . . , n

para todo

i = 1, . . . , n,

em que

(x) = F

1 F (x).

Observao 2.1.
e que, para cada

Suponhamos agora que

Xi, s

tm uma distribuio marginal comum

i = 1, . . . , n ,

o valor-p aleatrio

pi

correspondente a

Hi

baseado em

um teste unilateral esquerda ou direita em para um teste unilateral esquerda e como termos de

Xi .

Desde que

pi

denido como

F (Xi )

(Xi ) F

para um teste unilateral direita, em

pi ,

as desigualdades

(2.6)

(2.7)

so equivalentes a

P p(i) ci , i = 1, . . . , n 1 cn ,
em que

0 < c1 . . . cn < 1 ci = i/n


para todo

so tais que

ci /i

no decrescente em

i = 1, . . . , n.

Denindo

i,

conclumos a prova da conjectura de Simes.

2.

Testes Mltiplos e MCMs

20

Karlin & Rinott (1980) deram uma lista de distribuies que satisfazem a condio

(MTP2 )

sob a hiptese nula. No entanto, vamos considerar uma subclasse dessas

distribuies que satisfazem uma outra condio que pode ser vista em Sarkar & Chang (1997). Esta condio ser a chave para mostrar que o mtodo de Simes controla a FWER quando a estatstica envolvida nos testes a log-rank. Vamos descrever essas distribuies em termos das estatsticas dos testes, Sejam

X1 , . . . , X n .

X1 , . . . , X n ,

variveis aleatrias contnuas que, sob as hipteses nulas so

condicionalmente i.i.d. dada uma v.a.

Z,

com

Xi |Z = z f (xi , z ), i = 1, . . . , n, Z.
A densidade conjunta de

em que

f ( xi , z )

TP2 em

(xi , y ),

g (z )

a densidade de

X1 , . . . , X n

sob a hiptese nula, que da forma

f (xi , z )g (z )dz,
i=1

(2.8)

MTP2 . Este fato segue dos Resultados

(2.1

2.2).

Sarkar & Chang (1997) provaram que o mtodo de Simes controla a FWER quando as estatsticas tm densidade conjunta da forma

(2.8).

Distribuies como estas

aparecem muitas vezes em testes mltiplos. Por exemplo, a distribuio normal padro multivariada equicorrelacionada, o valor absoluto da

multivariada central, a

mul-

tivariada central e o valor absoluto da normal padro multivariada equicorrelacionada. Este ltimo exemplo est detalhado adiante, mas para entend-lo precisamos da prxima observao que pode ser vista em Curnow & Dunnett (1962).

Observao 2.2.
conjunta por

Sejam

X1 , . . . , X n , n ij ,

variveis aleatrias normais padronizadas com

coecientes de correlao

e denotamos a funo densidade de probabilidade (f.d.p)

f (t1 , . . . , tn ).

A funo de distribuio acumulada (f.d.a) denida como

Fn (xi , {ij }) = P {Xi < xi ; para


x1 x2 xn

todo

i}
(2.9)

Em algumas situaes a integral

...

f (t1 , t2 , . . . , tn )dt1 dt2 . . . dtn .

(2.9)

pode ser reduzida a uma integral simples, por

exemplo, quando a matriz de correlao tem a estrutura

ij = i j ,

para

i=j

1 n+1

i 1.

Dessa maneira, as variveis

Xi 's

podem ser representadas em termos de

2.

Testes Mltiplos e MCMs

21

variveis normais padronizadas independentes

Y1 , . . . , Yn , Z,

de modo que

Xi = (1 )1/2 Yi + 1/2 Z

para i=1,2,. . . ,n.

(2.10)

Como mencionado em Dunnett & Sobel (1955), quando

ij = > 0, i =

temos a estrutura

de correlao anterior satisfeita, uma vez que esta ocorre quando como os

Dessa forma,

Xi 's so mutualmente independentes e utilizando a representao dada em (2.10),

temos que

Fn (xi , {}) =

P
n

Yi <

(xi 1/2 z ) (1 )1/2 xi 1/2 z (1 )1/2

f (z )dz
(2.11)

=
i=1

(z )dz,

em que

()

()

representam respectivamente a f.d.a e a f.d.p da

N (0, 1).

Assim, a

densidade conjunta de

{ Xi }

i=1

1 (1 )1/2

xi 1/2 z (1 )1/2

(z )dz.

(2.12)

Exemplo 2.1

(Sarkar & Chang (1997))

A f.d.p da distribuio do valor absoluto da

normal multivariada equicorrelacionada satisfaz

(2.8), ento a conjectura de Simes vlida

quando as estatsticas dos testes tm esta distribuio. Primeiramente suponha que temos independentes com

n+1

populaes com distribuio normal

N (i , 2 ),

com mdia

desconhecida e varincia conhecida dada por

2,

i = 1, . . . , n.

Queremos testar as hipteses

H : n H 0 i=1 i H 0 : n i=1 Hi
em que,

i : i = 0 para ao menos um i, com base em amostras Hi : i = 0 para todo i e H m0


de populaes

independentes, uma de tamanho para cada uma das outras

N (0 , 2 )

e amostras de tamanho

m1

n populaes.

Vamos o considerar o valor absoluto da seguinte

2.

Testes Mltiplos e MCMs

22

estatstica do teste para avaliar

Hi

contra

i H m0 m1 (m0 + m1 )
1/2

i X 0 ) (X Xi =
para

, i = 0, . . . , n.

(2.13)

i = 1, . . . , n,

em que

i X

a i-sima mdia amostral com

A distribuio

de probabilidade conjunta desta estatstica sob

H0

o valor absoluto da normal multiva-

riada equicorrelacionada com mdia zero, varincia um e correlao Embora

= m1 /(m1 + m0 ).

seja conhecido neste exemplo, nenhum valor especco realmente necessrio

para mostrar que a densidade de probabilidade tem a forma essa distribuio depende de perda de generalidade que

(2.8).

Alm disso, como

somente atravs do seu valor absoluto, podemos supor sem


no negativo. Dessa maneira, usando a representao de

{Xi }
como

como em

(2.10),

pode ser notado que condicionalmente, dado

Y0 = z , Xi2, s

so i.i.d

(1 )12
em que

z 2 1

, m
graus de

2 m ()

denota uma varivel aleatria qui-quadrada no central com

liberdade e parmetro de no centralidade qui-quadrada central com

, e Y02 2 1

representa uma varivel aleatria

grau de liberdade.

Dessa forma, a densidade conjunta do

valor absoluto da normal multivariada equicorrelacionada com mdia zero, varincia um e correlao

0
com de

i=1

2xi f 1

x2 z i , 1 1 12 ()
em

, x
e

g (z )dz g (z )

(2.14)

f (x, )
em

representando a densidade de Como

representando a densidade

2 1

z.

f (x, ),

com

x, 0,

conhecida por ser TP2 em

(x, )

(Karlin,

1968), conclumos que a densidade (2.14) da forma (2.8).

Com esse exemplo, vemos

que quando as estatsticas do teste tm como distribuio o valor absoluto da normal multivariada equicorrelacionada, a conjectura de Simes vlida.

2.5

Mtodo de Simes para testes individuais

Nesta seo enunciamos os mtodos propostos por Hochberg (1988), Hommel (1988) e Rom (2013) que podem ser vistos como extenses do mtodo de Simes para realizar inferncias em hipteses individuais uma vez que a hiptese global

H0

rejeitada.

2.

Testes Mltiplos e MCMs

23

2.5.1

Mtodo de Hochberg
O procedimento de etapas mltiplas proposto por Hochberg (1988) pode ser inter-

pretado como uma verso do tipo ascendente do procedimento de Bonferroni. Enquanto o procedimento de Holm inicia o teste analisando o menor valor-p, o mtodo de Hochberg inicia o teste observando o valor-p menos signicativo. Este mtodo fundamentado

no princpio dos testes fechados (Marcus et al., 1976), o que intensica o controle da FWER no sentido forte. Deve ser assumido neste procedimento que a coleo de hipteses satisfaa a condio de combinaes livres (Seo 2.3.2). Sejam teses

p(1) , . . . , p(n) ,

os valores-p ordenados de

estatsticas para testar as hip-

H1 , . . . , Hn .

Esta simples extenso do mtodo de Simes pode ser ilustrada sucinta-

mente atravs das seguintes etapas:

Passo 1.

Se

p(n) ,

ento todas as hipteses

Hi

com

i = 1, . . . , n

so rejeitadas e

paramos; caso contrrio seguimos para o Passo

2.

Passo 2. Se

p(n1) /2, ento todas as hipteses H(i) , com i = 1, . . . , n 1 so rejeitadas 3.

e paramos; caso contrrio avanamos para o Passo

. . . Passo

n.

Se

p(1) /n,

rejeitamos

Hi , i = 1,

e paramos.

Em diversas situaes o mtodo de Hochberg mais poderoso em relao ao mtodo de Holm. Contudo, por se tratar de uma extenso do mtodo de Simes, para

garantir o controle efetivo da FWER as estatsticas dos testes precisam ser independentes ou terem distribuio MTP2 (ou certas misturas de MTP2 ).

2.5.2

Mtodo de Hommel
O procedimento proposto por Hommel (1988) testa as hipteses individuais

Hi

por meio do teste de Simes como

TI

no procedimento dos testes fechados. Os clculos deste

mtodo so mais trabalhosos em relao ao mtodo de Hochberg, porm o procedimento de testes fechados no precisa ser feito por completo. (1989) mostrou que o seguinte caminho suciente. Para algum

xado, Hommel

Seja

o nmero de hipteses no

2.

Testes Mltiplos e MCMs

24

maior subconjunto de hipteses para o qual o teste de Simes no signicativo. Ou seja,

j = max{i {1, . . . , n} : P(ni+k) > k/i


Se o mximo no existir, todos rejeitada quando

para todo

k = 1, . . . , i}, Hi

Hi (i = 1, . . . , n)

so rejeitados; caso contrrio,

pi /j . HI

Este procedimento controla o nvel mltiplo

desde que cada

teste de Simes para

tem um nvel de signicncia

Por se tratar de uma extenso

de Simes, este controle mantido se as

estatsticas so independentes ou apresentam

distribuio MTP2 (ou certas misturas delas). O clculo dos valores-p ajustados para o procedimento de Hommel mais simples de entender referindo-se diretamente ao procedimento de testes fechados, que quando realizado completamente exigiria que, para cada hiptese

Hi ,

o valor-p do teste de Simes

possa ser obtido para cada subconjunto de hipteses contendo

Hi .

O valor-p ajustado No entanto, no das

por Hommel ento o maior desses valores-p do teste de Simes. necessrio testar cada subconjunto. Para subconjuntos contendo

hipteses,

suciente testar o nico subconjunto contendo os maiores

(m 1)

valores-p alm de

pi .

Isto poderia ser chamado de subconjunto menos signicativo de tamanho

m que contm

Hi .

Claramente, se o teste de Simes signicativo ao nvel

para esse subconjunto, ser

signicativo ao nvel maior destes

para todos os outros subconjuntos de tamanho

contendo

Hi .

valores-p de Simes o valor-p ajustado de Hommel.

Na sequncia ilustramos o algoritmo extrado de Wright (1992) que calcula o valor-p ajustado pelo mtodo de Hommel. Seja

p(i)

os valores-p sem ajustes ordenados e

b(i)

o valor-p ajustado pelo mtodo de Hommel.

Passo 1. Inicialmente dena Passo 2. Para cada Passo 2a. Para

bi = p i

para todo

i;

m = n, (n 1), . . . , 2 i > (n m),

(nesta ordem), faa o seguinte:

(i) Calcule o valor

ci = (mpi )/(m + i n). ci


dados acima; e denote por

(ii) Encontre o menor dos valores (iii) Se

cmin .

bi < cmin ,

ento temos

bi = cmin .

Passo 2b. Para

i (n m),

2.

Testes Mltiplos e MCMs

25

(i) Seja (ii) Se

ci = min(cmin , mpi ).
ento temos

bi < ci ,

bi = ci .

2.5.3

Mtodo de Rom
O recente mtodo proposto por Rom (2013) uma modicao simples do mtodo

de Hochberg para realizar inferncias sob as hipteses individuais. Consideramos o problema clssico de testar com

hipteses individuais,

H1 , . . . , Hn ,

p1 , . . . , p n ,

os valores-p correspondentes. Assumimos que as hipteses satisfazem a

condio de combinaes livres dada por Holm (1979) (Seo 2.3.2) e que os valores-p correspondentes sejam independentes. Sejam

p(1) , . . . , p(n)

os valores-p ordenados. Este

mtodo pode ser descrito atravs das seguintes etapas:

Passo 1. Se

p(n) ,

ento todas as hipteses so rejeitadas; caso contrrio,

Hn

retida

e seguimos para o Passo 2.

Passo 2. Se

p(n1) 3/2, qualquer hiptese com valor-p menor ou igual a /2 rejeitada; H(n1)
retida e seguimos para o Passo 3.

caso contrrio,

Passo 3. Se

p(n2) 4/6, qualquer hiptese com valor-p menor ou igual a /3 rejeitada, H(n2)
retida e seguimos para o prximo passo, de acordo com o nvel

caso contrrio crtico

Ci = (i + 1)/(2i),
Passo n.

com

i = 2, . . . , n.

p(1)

comparado com

/n.

Rom (2013) mostrou atravs do princpio dos testes fechados que seu procedimento controla a FWER no sentido forte. Via simulao, foi vericado ainda que este

procedimento tem uma ganho de poder maior em relao ao mtodo de Hochberg e se comporta de maneira menos conservativa.

Captulo 3 Modelo e Estatsticas dos Testes


Neste captulo apresentamos o modelo discreto com censura aleatria que utilizamos neste trabalho e as estatsticas que foram empregadas nos testes:

log-rank e

Cramr-von Mises. Introduzimos ainda algumas notaes e propriedades importantes.

3.1

Introduo

Anlises estatsticas para dados discretos tm grande importncia em diversas reas tais como economia, medicina, educao e engenharia. Por exemplo, em economia do trabalho, quando queremos analisar a durao do desemprego, os dados disponveis esto em meses completos ou em dias, e assim, a varivel resposta um valor inteiro. Na rea de nanas, a durao de uma srie de retornos positivos usualmente analisada por perodos inteiros, como

ou

perodos. O mesmo ocorre na educao, o momento da

evaso e o tempo de concluso de um curso de graduao so medidos em semestres. Quando observamos dados ao longo do tempo, uma situao frequente a ocorrncia de alguns dados somente em determinados perodos, isto , sujeitos censura. Para ilustramos isto, uma situao geral de censura direita pode ser descrita se considerarmos

p p W1 , . . . , Wn p

variveis aleatrias positivas independentes representando tempos

de sobrevivncia ou tempos de ocorrncia de algum evento de interesse de uma populao, com

np

itens em

p = 1, . . . , J .

Seja

hp
n

a funo intensidade da

p-sima

populao.

Uma situao tpica ocorre quando

p {Wm }mp=1

so censuradas direita pelas variveis

26

3.

Modelo e Estatsticas dos Testes

27

aleatrias positivas e independentes, so assumidas independentes de observar que

p {Cm }mp=1 .

Estas variveis de censura,

p Cm ,

tambm

p Wm .

Dessa forma, nesse modelo geral de censura podemos

p p p }, , Cm = min{Wm Xm
com

p p = Wmp }, =1 1 { Xm m

p m

indicando se a varivel

p Wm

censurada ou no.

Em um grande nmero de aplicaes de extrema importncia testar a homogeneidade de populaes na presena de censura. O problema est no desenvolvimento de mtodos no paramtricos para testar a hiptese nula

H0 = h1 ( ) = . . . = hJ ( );
em que

X,

o domnio que codica, por exemplo, o tempo de vida em um problema O teste precisa ser consistente para uma grande classe de

de anlise de sobrevivncia. hipteses alternativas.

Diante disto, realizamos neste trabalho os testes com as estatsticas log-rank e Cramr-von Mises. Esta escolha est fundamentada no fato de que a estatstica log-rank um dos mtodos no paramtricos mais utilizados para testar

H0

sob censura aleatria.

Contudo, esta estatstica apresenta a desvantagem de no exibir um poder ao lidar com funes intensidades no proporcionais. Dessa forma, executamos tambm testes com

a estatstica Cramr-von Mises, que como pode ser visto em Leo & Ohashi (2011), considerada ideal para modelos puramente discretos sob censura.

3.2

Modelo para os dados

Introduzimos nesta seo a notao bsica e alguns fundamentos de inferncia para o modelo discreto com censura utilizado neste trabalho. Maiores detalhes deste

assunto podem ser vistos em Fleming & Harrington (1991) e em Leo & Ohashi (2011). Consideramos naturais. Seja

(, F , P)

um espao de probabilidade e

o conjunto dos nmeros denotando a

uma varivel aleatria com valores em

i = P[Y = i]

probabilidade de falha da varivel resposta

(Y )

na

i-sima
i=0

categoria. Assumindo que as Assim, vemos que

categorias so mutuamente exclusivas, temos que

i = 1.

3.

Modelo e Estatsticas dos Testes

28

uma varivel aleatria discreta. Sejam

duas variveis aleatrias discretas independentes com valores em

N,

descrevendo respectivamente os eventos de interesse e de censura. Fixamos um nmero natural

J 1

e escrevemos

J = {1, . . . , J }. nq

Denotamos

n := (n1 , . . . , nJ ) NJ

NJ :=

max{n1 , . . . , nJ }.
populao, com e

Denimos como

o tamanho da amostra aleatria correspondente

q J.

Para um dado

p J,

seja

(W p , C p )

uma populao, tal que

Wp

Cp
e

so variveis aleatrias discretas independentes que podem ser interpretadas como

respectivamente e seja

Xp

uma varivel aleatria discreta denida por

X p := W p C p = min{W p , C p }.
Para qualquer populao

p J,

tomamos as amostras aleatrias

p p p p )} , Cn {(W1 , C1 ), . . . , (Wn p p

da

(W p , C p ),

tal que

1 np < .

Assumimos ainda que

P[C p = 0] = P[W p =

0] = 0

para qualquer

p J.

Assim, podemos introduzir

p p p Xm := min{Wm , Cm },

p p Vm (i) := 1 1{Xm i}

e o processos de contagem

p p p p Rm (i) := 1 1{Xm i,Xm =Wm }

C,p p p p , Rm (i) := 1 1{Xm i,Xm =Cm }

para

m = 1, . . . , np

i 0.

Os processos de contagem associados

p-sima

amostra

aleatria so dados por

np

np p Rm (i)
e

np C,p Rm (i),
e

R (i) :=
m=1

np

C,np

(i) :=
m=1

np

(i) :=
m=1

p Vm (i);

i 0.

Nesta congurao discreta, pode ser visto em Leo & Ohashi (2011) que a funo intensidade

hp

e o estimador de Kaplan-Meier

np h

so dados respectivamente por

hp (j ) :=

P[W p = j ] , P[W p j ]

j 0,

Rnp (i) np (i) = h 1 1{V np (i)>0} ; i 1. V np (i)

3.

Modelo e Estatsticas dos Testes

29

3.3

Estatsticas dos Testes

3.3.1

Estatstica log-rank
Nesta seo vamos estender a estatstica log-rank ponderada proposta por Fle-

ming & Harrington (1991) para comparar arbitrria.

populaes discretas na presena de censura

Primeiramente vamos introduzir alguns objetos e denies bsicas. Seja

(i) :=
k=1

V nk (i);

i 0,

o nmero total de risco na categoria

i,

e para um certo

(q, q1 ) J 2

1,

denotamos

nq Un (n q1

, ) :=

1 n

1/2

u(n , )

V nq ( )V nq1 ( ) Vn ( )

(3.1)

em que assumimos que o processo ponderado

u(n ; )

limitado, converge em probabili-

dade para um valor real de uma funo limitada e satisfaz certos pressupostos de mensurabilidade (Leo & Ohashi, 2011). Exemplos concretos de pesos so os processos ponderados de Harrington & Fleming (1982) e Tarone & Ware (1977) dados respectivamente por

Vn ( ) n

R( 1) V n ( 1)

j =0

Rn (j ) 1 V n (j ) (, ) (3.1)

, n NJ , 1,

de modo que

uma funo contnua limitada e

so constantes positivas. Denopor

taremos a classe de processos ponderados da forma Na sequncia, para um dado

K.

q J,

denimos

Aq := {(x, y ) J J ; x = y, x =

q, q = q, 1 x < y J }
Para

e para

k = r,

denimos

A(k, r) := {q1 J ; q1 = k, q1 = r}. J J


dada por

n NJ

1,

seja

(n , ) Q

uma matriz quadrada simtrica

(n , )]rk := [Q

2 ( ), k,n

se se

k=r k = r,

n (k, r, ),

3.

Modelo e Estatsticas dos Testes

30

em que
q 2 |Unqq1 (n , )|2 nq nq1 ( )] + |Unq1 (n , )| h nq ( )[1 h nq ( )] 1 ( )[1 h h V nq1 ( ) V nq ( )

2 ( ) := q,n
q1 =q

+ 2
(q1 ,q2 )Aq
e

Unqq1 (n , )Unqq2 (n , ) nq nq ( )], q J , h ( )[1 h V nq ( )

n (k, r, ) :=
q2 =r

nk nr Un (n , )Un (n , ) q1 q1 q1 A(k,r) nk (n Un q1 q1 =k

nq1

( )

q1 ( )] q1 ( )[1 h h

nr (n , ) , )Un k

V nk ( )
nk nr (n , ) (n , )Un Un r q2

k ( )[1 h k ( )] h r ( )[1 h r ( )], h

V nr ( )

se

r=k

em

J.

Consideramos agora os seguintes limitantes das categorias

du = sup

: min q ( ) > 0 ,
q J

(3.2)

du n = sup
Podemos vericar que e

: min V nq ( ) > 0 , n NJ .
q J

(3.3)

u du n d

em probabilidade com Se

n ,

tal que

1 du

du n

para cada

n NJ .

q J,

ento inspirados pela estatstica log-rank

ponderada proposta por Fleming & Harrington (1991) podemos introduzir a seguinte estatstica linear geral para

J -amostras.
j nq nq ( ) h nq1 ( )] Un (n , )[h q1 =1 q1 =q j 1/2

LRq (n , j ) := 1 n

=
=1

u(n , )V

nq

Rnq ( ) Rn ( ) . ( ) V nq ( ) Vn ( ) K.
Sob

Proposio 3.1.

Assumimos que

pertence classe

H0 ,

o vetor aleatrio

u u T LR(n , du n ) := (LR1 (n , dn ), . . . , LRJ (n , dn ))

(3.4)

3.

Modelo e Estatsticas dos Testes

31

converge em distribuio para uma varivel Gaussiana multivariada

N (0, (du )) com n

n , du ), tal que a matriz de covarincia (du ) pode ser estimada com consistncia por ( n
em que
i

n , i) := (
=1

(n , ), i 1. Q

Similarmente ao caso contnuo, a soma dos componentes do vetor aleatrio em

LR

(3.4)

nula.

Assim, consideramos o vetor

LR

sem o ltimo componente como na

sequncia

u u T LR0 (n , du n ) := (LR1 (n , dn ), . . . , LRJ 1 (n , dn ))


Dessa forma, denimos a estatstica log-rank ponderada associada a maneira

(3.5)

LR0

da seguinte

u T u 1 u J X 2 (n , du n ) := LR0 (n , dn ) 0 (n , dn ) LR0 (n , dn ), n N ,

(3.6)

em que

0 (n , )

dado por

n , ) (

mas sem a ltima linha e coluna. Pode ser vericado

que a estatstica liberdade, em que

(3.6)

tem distribuio assinttica qui-quadrada com a inversa usual.

J 1

graus de

1 n , du ( n )

A funo poder pode ser obtida atravs da seguinte expresso

LRq (i) =
=1 q1 =q

nq nq ( ) h nq1 ( ) = Un (n , ) h q1

i nq Un q1 =1 q1 =q

1{V nq1 ( )>0} Y nq ( )1 1{V nq ( )>0} Y nq1 ( )1 + n V nq ( ) V q1 ( )


i nq Un [hq ( ) hq1 ( )] . q1 =1 q1 =q

3.3.2

Condio MTP2 para a estatstica log-Rank


Nesta seo vericamos que a estatstica log-rank ponderada satisfaz a condio

MTP2 . Alguns conceitos e resultados empregados na demonstrao podem ser encontrados no Apndice A.

3.

Modelo e Estatsticas dos Testes

32

Neste trabalho focamos no problema de MCMs de testar

J 1

populaes com

uma populao controle ou referncia. Consideramos a hiptese nula

Hq : hq ( ) = hJ ( ),
e para qualquer

q = 1, . . . , J 1.

Para cada hiptese individual construmos a estatstica

log-rank ponderada correspondente em valor absoluto,


i nq nJ ( ) nq ( ) h (n , ) h UnJ i

X nq (i) =

=1

, q = 1, . . . , J 1,

2 =1 q ( )

com

nq nJ |Un (n , )|2 nq |UnJ (n , )|2 nJ q nJ 2 ( ) 1h nq ( ) h ( ) 1h ( ) + q ( ) = h V nJ ( ) V nq ( )


q UnJ

representando os processos ponderados. Da Observao A.2 segue que

X nq (i)

tem

como distribuio assinttica o valor absoluto de uma normal padro. Suponhamos que as vveis assintticos,

J 1 hipteses nulas, H1 , . . . , HJ 1 , tenham valores-p obserbaseados em

p1 , . . . , pJ 1 ,

X n1 (i), . . . , X nJ 1 (i). {X nq (i) : q =

Teorema 3.1.
1, . . . , J 1}

Sob a hiptese nula

H0 ,

a distribuio conjunta limitada de

satisfaz a condio MTP2 .

Demonstrao. De acordo com o Exemplo 2.1, suciente mostrar que o vetor aleatrio

{X nq (i) : q = 1, . . . , J 1}

tem como distribuio assinttica o valor absoluto de uma Para isto, aplicamos alguns argumentos que Consideramos agora o

normal multivariada equicorrelacionada.

podem ser vistos no Apndice A (Lema A.2 e o Teorema A.2).

martingale array diference


q J Ym ( ) Ym ( ) , n n V q( ) V J( )

n nq m,q ( ) = Un (n , ) J

q = 1, . . . , J 1,

e para qualquer

a RJ 1 , 0
and

n n n m ( ) = a1 m, 1 ( ) + . . . + aJ 1 m,J 1 ( ),

m = 1, . . . NJ .

3.

Modelo e Estatsticas dos Testes

33

Ento, temos que

NJ m=1

n n E | m ( ) |2 | Gm 1 = NJ

J 1 NJ k=1 m=1

n n | ak |2 E | m,k ( ) |2 | Gm 1 +

2
1r<kJ 1 m=1
Sabemos ainda que

n n n ( ) | Gm ( )m,k ar ak E m,r 1 = T1 (n , ) + T2 (n , ),

1.

J 1

T1 (n , )
k=1

q J ak q,J ( )hq ( )[1 hq ( )] + q,J ( )hJ ( )[1 hJ ( )] ,

em probabilidade, para qualquer

1. ar ak

Alm disso, pode ser vericado que

T2 (n , ) = 2
1r<kJ 1

nr nk Un ( )Un ( ) nJ J J nJ ( ) h ( ) 1h n J V ( )
em probabilidade.

2
1r<kJ 1

k,r ar ak J ( )hnJ ( ) [1 hnJ ( )] ,

Se considerarmos os processos ponderados de Tarone e Ware ou de Harrington e Fleming, podemos concluir de algumas expresses dadas no Apndice (equaes A.3, A.4 e A.8) que, sob

H0 ,

as constantes

q J q,J ( ) = q,J ( ) = ( )

k,r J ( ) = ( )
para todo

so independentes

dos ndices aleatrio

k, r, J .

Assim, sob

H0 : h1 ( ), . . . , hJ ( ) = h( ),

= 1, . . . , i,

o vetor

NJ n m=1 m,q (

) : q = 1, . . . , J 1} (i) =
k=1
dado por

tem distribuio assinttica com mdia zero e

operador de covarincia

J 1

(i), a

J 1

ak {( )h( )[1 h( )] + ( )h( )[1 h( )]} + ar ak ( )h( ) [1 h( )] =


1r<kJ 1

2
J 1

ak {2( )h( )[1 h( )]} + 2


k=1 1r<kJ 1

ar ak ( )h( ) [1 h( )] .

Desde que

2 ( ) uma estimador consistente da varincia, aplicamos os mesmos argumen q {X nq (i) : q = 1, . . . , J

tos da prova do Teorema A.2 para obtermos que o vetor aleatrio

1}

tem como distribuio assinttica o valor absoluto de uma normal multivariada com

coeciente de correlao

( )h( )[1 h( )] =1 ( h( )[1 h( )])


=1

3.

Modelo e Estatsticas dos Testes

34

3.3.3

Estatstica de Cramr-von Mises


Introduzimos agora a estatstica de Cramr-von Mises para o modelo discreto ge-

ral induzido por

Xp

sob censura arbitrria direita para innitamente muitas categorias.

Consideramos aqui as primeiras categorias observadas pela seguinte sequncia de tempos de parada

dn := inf { : Rn ( ) > 0},


tal que

(3.7)

Rn (i) :=

J k=1

Rnk (i)

o nmero total de eventos de interesse para a categoria

i.

Podemos ver que

dn d

em probabilidade com

tal que

d := inf { : b1 h1 ( ) + . . . + bJ hJ ( ) > 0}.

(3.8)

Diante disto, a estatstica de Cramr-von Mises denida por

du n

J 1

CV M (n

, dn , du n

) :=
k=dn q =1

2 (k )LR2 (n , k ), (q,n) q

n NJ .

(3.9)

Em algumas situaes fundamental testar

H0

para categorias possivelmente

innitas, pois no sabemos a priori a existncia de categorias maiores que

tal que, e

q (i) = 0

para cada

p J.

Dessa maneira, necessrio assumir que

du

portanto, somos forados a trabalhar num espao

de dimenso innita constitudo A estatstica dada em

pelas sequncias de quadrado somvel de nmeros reais. para possivelmente innitas categorias

(3.9)

(du )

foi totalmente baseada na construo

de um processo Gaussiano adequado, com valores no

e com operador de covarincia que satisfazem

Y0 (d , du ) :

e autovalores

{sq ; s 1, q = 1, . . . , J 1}
J 1

sq < .
s=1 q =1

A distribuio assinttica desta estatstica no livre de distribuio devido presena inerente de saltos persistentes sobre

N.

Na verdade, depende de

{sq ; s 1, q =

1, . . . , J 1},

que por sua vez depende dos dados. A m de proporcionar um teste vivel,

construmos um estimador do operador

Y0 (d , du ) que pode ser obtido da maneira que est

3.

Modelo e Estatsticas dos Testes

35

na sequncia. Introduzimos o conjunto aleatrio de categorias observveis

L(dn , du n ) =

{dl n n NJ

n du n ; R ( ) > 0}
e

e denotamos sua cardinalidade por

L(n ).

Para um dado

, denimos

u 0 (dl Y n , dn )a
como uma sequncia real, em que as

(J 1)L(n )-simas

coordenadas so dadas por

0 (dn , du Y n )(a1 , . . . , a(J 1)L(n ) ),


e

0 (d , du ) Y n n

o operador autoadjunto denido pela forma quadrtica sobre

R(J 1)L(n

a seguir

0 (d , du )a, a Y n n

=
j L(dn ,du ) n

0 (j ) 0 (j )M 0 (j )aj , aj M

RJ 1

+
{ <j : ,j L(dn ,du n )}

0 (j ) 0 (j )M 0 (j )aj , aj M 0 (j ) 0 (j )M 0 (j )aj , aj M
{j< : ,j L(dn ,du n )}

RJ 1

RJ 1 ,

em que

1,n , . . . , J 1,n ()) e a R(J 1)L(n 0 () := diag( M

. Portanto,

0 (d , du ) : Y n n

um sequncia bem denida de operadores autoadjunto de postos nito.

Teorema 3.2.
tivamente por classe

Sejam

(d , du , dn , du n )

as categorias e tempos de paradas denidos respecpertena

(3.8), (3.2), (3.7) e (3.3), e assumimos que o processo ponderado U H0


J 1

K.

Ento, sob

CV M (n

, dn , du n

)
s=1 q =1

sq 2 sq

em distribuio com

n ,

tal que

{sq ; s 1, q = 1, . . . , J 1}
Se

so os autovalores do operador de covarincia

Y0 (d , du ).

Xq

quadrado integrvel, para cada


L(n ) J 1

qJ

temos que

J 1 2 1A(n ) sq sq 1

(n ) :=
s=1 q =1

sq 2 sq ,
s=1 q =1

(3.10)

em distribuio com

n ,

em que

{ sq ; s s L(n ), q = 1, . . . , J 1}

so os

3.

Modelo e Estatsticas dos Testes

36

autovalores do estimador da covarincia

0 (d , du ) Y n n

0 (d , du ) A(n ) := {Y n n
de modo que

no negativo},

P(A(n )) 1

com

n . p
para testar a hiptese

Notamos de (3.10) que o valor

H0

dado por

P[(n ) >

CV M (n , dn , du n )|H0 ].

A lei de aproximao

(n )

uma soma ponderada de variveis

aleatrias independentes e portanto, h algoritmos disponveis para avaliar o valor-p que podem ser vistos em Duchesne & Lafaye De Micheaux (2010).

Captulo 4 Estudo de simulao


Neste captulo realizamos um estudo de simulao com o objetivo de comparar o comportamento dos procedimentos de Bonferroni, Holm, Hochberg, Hommel e Rom, em relao ao controle da FWER e ao ganho de poder quando as estatsticas envolvidas nos testes so a log-rank e a Cramr-von Mises. Focamos no problema de comparar uma populao com uma populao referncia (tratamento versus controle). Trabalhamos com dados censurados provenientes de amostras aleatrias de distribuies discretas (Poisson) e contnuas (exponencial), mas enfatizamos o estudo com dados discretos, com os quais foram analisados trs cenrios distintos em relao censura. Toda a implementao foi desenvolvida em linguagem R (R Development Core Team, 2011) e para todas as circunstncias tratadas neste captulo adotamos o nvel de signicncia mltiplo

= 0, 05.

Para averiguar o controle da FWER dos cinco MCMs escolhidos foram considerados nas simulaes diferentes tamanhos de amostras (TA): e

30, 50, 100, 150, 200, 250

300.

Em todos os casos foram geradas dez populaes da distribuio escolhida, sendo

a primeira utilizada como referncia (controle), resultando em nove hipteses a serem testadas simultaneamente. A m de detectar minunciosamente as diferenas de comportamento entre os procedimentos de Bonferroni, Holm, Hochberg e Rom, avaliamos o poder de duas maneiras distintas. Na primeira estimativa do poder foram geradas

10

populaes de distribuio

Poisson (dados discretos) e exponencial (dados contnuos) da seguinte maneira, respecti-

37

4.

Estudo de simulao

38

vamente

X (1) , . . . , X (9) P ()
e

X (10) P ( + )

X (1) , . . . , X (9) E ()
em que

X (10) E ( + ),

iniciou com algum valor maior que zero e foi sendo incrementado at o poder

atingir a taxa de tivemos

100%.

A primeira populao foi denida como referncia, de modo que

hipteses sendo testadas, sendo uma hiptese falsa.

A segunda estimativa do poder foi calculada por meio da razo entre o nmero de diferenas signicativas detectadas pelo MCM e o nmero total de inferncias. Consideramos os casos em que foram testadas

3, 5

10

hipteses simultaneamente. Em cada

situao criamos todas as conguraes de hipteses falsas, ou seja, quando testamos hipteses, analisamos os casos de para os testes que envolveram

1, 2 e 3 hipteses falsas presentes, e assim sucessivamente


e

10

hipteses.

Na primeira seo deste captulo expomos as anlises realizadas com dados discretos e na segunda seo est apresentado o estudo feito com dados contnuos.

4.1

Dados discretos

Para os estudos de simulaes realizados com dados discretos foram geradas amostras aleatrias de distribuio Poisson e trs cenrios distintos em relao censura foram analisados: no primeiro caso aproximadamente no segundo caso

40%

dos dados foram censurados;

20%

e por m observamos o caso sem censura.

4.1.1

Controle da FWER
Uma vez que dados discretos empregados nas estatsticas log-rank e Cramr-

von Mises no necessita de um tempo computacional muito grande, xamos o nmero de iteraes em

100.000

para podermos detectar da melhor maneira as diferenas de

comportamento entre os MCMs em relao ao controle da FWER. Em cada caso geramos uma amostra aleatria de

10

populaes com distribuio Poisson com parmetros

4.

Estudo de simulao

39

1 , . . . , 10 = 10, sendo a primeira populao denida como controle (referncia).


as situaes em que a censura foi xada em dados censurados) e o caso sem censura.

Criamos dos

11 (40%

dos dados censurados),

13 (20%

Os valores e o comportamento da FWER em funo dos diferentes tamanhos de amostras (TA) das cinco estratgias de comparaes mltiplas empregadas nos testes das estatsticas log-rank e Cramr-von Mises dos trs cenrios de censura escolhidos esto ilustrados na sequncia atravs das Tabelas e

4.1, 4.2

4.3

e por meio das Figuras

4.1, 4.2

4.3.
FWER dos

TABELA 4.1:

MCMs empregados nos testes das estatsticas log-rank e

Cramr-von Mises para diferentes TA com censura xada em


Estatstica Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04782 0,04782 0,04783 0,04813 0,04906 TA=50 0,04823 0,04823 0,04823 0,04846 0,04923 TA=100 0,04837 0,04837 0,04838 0,04864 0,04958

11.
TA=250 0,04799 0,04799 0,04801 0,04823 0,04902 TA=300 0,04902 0,04902 0,04903 0,04928 0,05001

log-rank
TA=150 0,04799 0,04799 0,04801 0,04822 0,04904 TA=200 0,04832 0,04832 0,04834 0,04857 0,04926

Estatstica Cramr-von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,05093 0,05093 0,05096 0,05122 0,05206 TA=50 0,04917 0,04917 0,04918 0,04949 0,05044 TA=100 0,04941 0,04941 0,04943 0,04967 0,05046 TA=150 0,04736 0,04736 0,04736 0,04766 0,04853 TA=200 0,04985 0,04985 0,04985 0,05015 0,05097 TA=250 0,04880 0,04880 0,04881 0,04903 0,05078 TA=300 0,04951 0,04951 0,04952 0,04981 0,05065

Logrank

Cramrvon Mises

0.054

Holm Hoch Hommel

0.054

Bonf

Bonf
q

Holm Hoch Hommel

0.052

Rom

0.052

Rom

FWER

FWER

0.050

0.050

q q

q q q q

0.048

q q q q

q q

0.048

0.046

50

100

150

200

250

300

0.046

50

100

150

200

250

300

Tamanho da amostra

Tamanho da amostra

FIGURA 4.1: Grcos do comportamento da FWER com censura xada em

11.

4.

Estudo de simulao

40

TABELA 4.2:

FWER dos

MCMs empregados nos testes das estatsticas log-rank e

Cramr-von Mises para diferentes TA com censura xada em


Estatstica Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,05500 0,05500 0,05500 0,05532 0,05643 TA=50 0,05080 0,05080 0,05082 0,05117 0,05221 TA=100 0,05100 0,05100 0,05102 0,05128 0,05222

13.
TA=250 0,04902 0,04902 0,04902 0,04921 0,05008 TA=300 0,04964 0,04964 0,04965 0,04989 0,05002

log-rank
TA=150 0,04993 0,04993 0,04994 0,05113 0,05021 TA=200 0,04970 0,04970 0,04975 0,05003 0,05100

Estatstica Cramr von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,05021 0,05021 0,05025 0,05051 0,05159 TA=50 0,05099 0,05099 0,05103 0,05127 0,05220 TA=100 0,04872 0,04872 0,04877 0,04907 0,05013 TA=150 0,04984 0,04984 0,04984 0,05004 0,05089 TA=200 0,04826 0,04286 0,04829 0,04855 0,04936 TA=250 0,04884 0,04884 0,04885 0,04910 0,04988 TA=300 0,04858 0,04858 0,04859 0,04884 0,04955

Logrank

Cramrvon Mises

0.056

Holm Hoch Hommel Rom

0.054

Bonf
q

Bonf
q

Holm Hoch Hommel

0.054

0.052

Rom

0.052

FWER

FWER

0.050

q q

q q

0.050

q q q q q q q

0.048

0.048

0.046

50

100

150

200

250

300

0.046

50

100

150

200

250

300

Tamanho da amostra

Tamanho da amostra

FIGURA 4.2: Grcos do comportamento da FWER com censura xada em

13.

4.

Estudo de simulao

41

TABELA 4.3:

FWER dos

MCMs empregados nos testes das estatsticas log-rank e

Cramr-von Mises para diferentes TA com dados sem censura.


Estatstica Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04516 0,04516 0,04517 0,04541 0,04630 TA=50 0,04711 0,04711 0,04711 0,04735 0,04818 TA=100 0,04793 0,04793 0,04794 0,04814 0,04902

log-rank
TA=150 0,04924 0,04924 0,04925 0,04948 0,05013 TA=200 0,04902 0,04902 0,04903 0,04918 0,04984 TA=250 0,04845 0,04845 0,04845 0,04865 0,04942 TA=300 0,04840 0,04840 0,04842 0,04864 0,04946

Estatstica Cramr von Mises Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04744 0,04744 0,04746 0,04778 0,04875 TA=50 0,04929 0,04929 0,04933 0,04962 0,05042 TA=100 0,05006 0,05006 0,05007 0,05034 0,05126 TA=150 0,04840 0,04840 0,04842 0,04862 0,04937 TA=200 0,04855 0,04855 0,04856 0,04887 0,04956 TA=250 0,04871 0,04871 0,04876 0,04897 0,04984 TA=300 0,04851 0,04851 0,04855 0,04878 0,04953

Logrank

Cramrvon Mises

0.054

Holm Hoch Hommel

0.054

Bonf

Bonf
q

Holm Hoch Hommel

0.052

Rom

0.052

Rom

FWER

FWER

0.050

0.050

q q

0.048

0.048

q q q

q q

0.046

50

100

150

200

250

300

0.046

50

100

150

200

250

300

Tamanho da amostra

Tamanho da amostra

FIGURA 4.3: Grcos do comportamento da FWER para dados sem censura.

Podemos observar por das meio das Figuras

4.1, 4.2 e 4.3,

que em quase todos os

cenrios de censura trabalhados nos testes das duas estatsticas envolvidas, o procedimento de Rom apresentou os maiores valores para a FWER, que por um lado bom, pois rearma o fato argumentado em Rom (2013) de que este mtodo pouco conservativo; porm em certos casos de amostras pequenas ele apresentou uma taxa de erro elevada com respeito aos demais procedimentos. No cenrio de censura igual a (Figura

11,

que equivale a

40%

dos dados censurados

4.1),

os mtodos aplicados na estatstica log-rank tiveram um comportamento

4.

Estudo de simulao

42

quase sem oscilaes e atingiram o valor bem prximo a

5%

com TA igual a

300.

J no

emprego da estatstica Cramr-von Mises, observamos maiores alteraes, principalmente com amostras de tamanho em relao s demais. Pela Figura para TA

150, em que as 5 estratgias apresentaram taxas de erro menores

4.2,

que ilustra o cenrio da censura xada em

13,

podemos ver que

30

50

os cinco procedimentos apresentaram taxas altas, mas foram atingindo

o valor prximo a

5%

conforme os TA foram aumentando.

Na situao analisada sem presena de censura (Figura testes da estatstica log-rank os

4.3)

notamos que nos

5 procedimentos apresentaram-se de maneira conservativa

para TA pequenas. J no teste da estatstica de Cramr-von Mises os valores pequenos para FWER s ocorrem para TA nvel nominal adotado.

30,

depois as taxas foram mantidas prximas a

5%,

4.1.2

Poder dos testes


Na primeira estimativa do poder dos cinco MCMs empregados, o nmero de

iteraes foi xado em

10000

e em cada caso foram geradas amostras de tamanho

100

de

10

populaes de distribuio Poisson com parmetros

X (1) , . . . , X (9) P (10)


tal que

X (10) P (10 + ),
e

assumiu os valores

0, 3; 0, 5; 1; 1, 5; 2; 2, 5; 3; 3, 5; 4; 4, 5

5.

Averiguamos o poder considerando os trs cenrios de censura mencionados: censura igual a

11, 13 e o caso sem censura. .

Nas Tabelas

4.4, 4.5 e 4.6 esto os valores do


e

poder em funo do incremento de

As Figuras

4.4, 4.5

4.6

trazem os grcos com a

funo poder dos cinco MCMs empregados nas estatsticas log-rank e Cramr-von Mises.

4.

Estudo de simulao

43

TABELA 4.4: Poder dos

MCMs empregados nas estatsticas log-rank e Cramr-von

Mises em funo do incremento de

censura xada em
log-rank
Hochberg 0,0136 0,0309 0,1561 0,4264 0,7026 0,9018 0,9705 0,9950 0,9990 0,9998 1,0000

11.
Rom 0,0574 0,0776 0,1980 0,4561 0,7196 0,9081 0,9723 0,9952 0,9991 0,9998 1,0000

Estatstica

0,3 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

Bonferroni 0,0136 0,0308 0,1557 0,4256 0,7015 0,9015 0,9704 0,9950 0,9990 0,9998 1,0000

Holm 0,0136 0,0308 0,1560 0,4264 0,7024 0,9017 0,9705 0,9950 0,9990 0,9998 1,0000

Hommel 0,0136 0,0311 0,1565 0,4267 0,7039 0,9021 0,9706 0,9950 0,9991 0,9998 1,0000

Estatstica Cramr-von Mises

0,3 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

Bonferroni 0,0145 0,0376 0,1920 0,4944 0,7922 0,9015 0,9900 0,9982 0,9999 1,0000 1,0000

Holm 0,0146 0,0376 0,1924 0,4950 0,7930 0,9017 0,9901 0,9982 0,9999 1,0000 1,0000

Hochberg 0,0146 0,0376 0,1925 0,4950 0,7931 0,9018 0,9901 0,9982 0,9999 1,0000 1,0000

Hommel 0,0147 0,0377 0,1930 0,4957 0,7939 0,9021 0,9901 0,9982 0,9999 1,0000 1,0000

Rom 0,0580 0,0825 0,2312 0,5213 0,8040 0,9081 0,9910 0,9984 0,9999 1,0000 1,0000

Logrank
1.0

Cramrvon Mises
q
q

q
q

q
q

q
q

q
q

1.0

q
q

q
q

q
q

q
q

q
q

q
q

q
q

0.8

0.8

q
q

q
q

0.6

Poder do teste

Poder

0.6

q
q

0.4

Bonf
q

0.4

q
q

Bonf
q

Holm Hoch Hommel Rom

Holm Hoch Hommel Rom

0.2

0.2

q
q

q
q

0.0

0.0

q q
q q

q
q

q
q

FIGURA 4.4: Grcos da funo poder dos 5 MCMs com censura xada em 11.

4.

Estudo de simulao

44

TABELA 4.5: Poder dos

MCMs empregados nas estatsticas log-rank e Cramr-von

Mises em funo do incremento de

censura xada em
log-rank
Hochberg 0,0159 0,0438 0,2094 0,5416 0,8292 0,9676 0,9966 0,9997 1,0000

13.
Rom 0,0650 0,0851 0,2493 0,5672 0,8386 0,9697 0,9968 0,9997 1,0000

Estatstica

0,3 0,5 1 1,5 2 2,5 3 3,5 4

Bonferroni 0,0158 0,0436 0,2087 0,5409 0,8288 0,9675 0,9966 0,9997 1,0000

Holm 0,0159 0,0437 0,2094 0,5416 0,8291 0,9676 0,9966 0,9997 1,0000

Hommel 0,0159 0,0439 0,2098 0,5423 0,8297 0,9676 0,9967 0,9997 1,0000

Estatstica Cramr-von Mises

0,3 0,5 1 1,5 2 2,5 3 3,5 4

Bonferroni 0,0170 0,0439 0,2254 0,5754 0,8668 0,9781 0,9985 0,9999 1,0000

Holm 0,0170 0,0441 0,2259 0,5764 0,8673 0,9782 0,9985 0,9999 1,0000

Hochberg 0,0170 0,0441 0,2260 0,5764 0,8673 0,9783 0,9985 0,9999 1,0000

Hommel 0,0170 0,0443 0,2263 0,5767 0,8675 0,9785 0,9985 0,9999 1,0000

Rom 0,0617 0,0906 0,2655 0,5991 0,8743 0,9796 0,9985 0,9999 1,0000

Logrank
1.0

Cramrvon Mises
q
q

q
q

q
q

q
q

1.0

q
q

q
q

q
q

q
q

q
q

0.8

0.6

Poder do teste

Poder do teste

0.6

0.8

q
q

q
q

q
q

0.4

Bonf
q

0.4

Bonf
q

Holm Hoch Hommel Rom

Holm Hoch Hommel Rom

0.2

0.2

q
q

0.0

0.0

q
q

q
q

q
q

q
q

FIGURA 4.5: Grcos da funo poder dos 5 MCMs com censura xada em 13.

4.

Estudo de simulao

45

TABELA 4.6: Poder dos

MCMs empregados nas estatsticas log-rank e Cramr-von

Mises em funo do incremento de

dados sem censura.


log-rank
Hommel 0,0163 0,0382 0,2417 0,6149 0,8957 0,9870 0,9990 1,0000 1,0000 Rom 0,0635 0,0855 0,2807 0,6347 0,9016 0,9880 0,9992 1,0000 1,0000 Hochberg 0,0162 0,0380 0,2415 0,6144 0,8955 0,9870 0,9990 1,0000 1,0000

Estatstica

0,3 0,5 1 1,5 2 2,5 3 3,5 4

Bonferroni 0,0159 0,0378 0,2410 0,6141 0,8951 0,9870 0,9990 1,0000 1,0000

Holm 0,0162 0,0379 0,2414 0,6144 0,8954 0,9870 0,9990 1,0000 1,0000

Estatstica Cramr-von Mises

0,3 0,5 1 1,5 2 2,5 3 3,5 4

Bonferroni 0,0170 0,0430 0,2392 0,6290 0,9057 0,9889 0,9995 0,9999 1,0000

Holm 0,0170 0,0432 0,2397 0,6297 0,9060 0,9889 0,9996 0,9999 1,0000

Hochberg 0,0170 0,0432 0,2398 0,6299 0,9060 0,9889 0,9996 0,9999 1,0000

Hommel 0,0170 0,0433 0,2403 0,6311 0,9065 0,9889 0,9996 0,9999 1,0000

Rom 0,0600 0,0873 0,2800 0,6491 0,9117 0,9897 0,9997 0,9999 1,0000

Logrank
1.0

Cramrvon Mises
q
q

q
q

q
q

q
q

1.0

q
q

q
q

q
q

q
q

q
q

q
q

0.8

0.8

0.6

Poder

0.4

Poder

Bonf
q

0.4

0.6

q
q

Bonf
q

Holm Hoch Hommel Rom

Holm Hoch Hommel Rom

0.2

0.2

q
q

q
q

0.0

0.0

q
q

q
q

q
q

q
q

FIGURA 4.6: Grcos da funo poder dos 5 MCMs com dados sem censura.

Pelas Figuras

4.4, 4.5

4.6

notrio o fato de que os mtodos de Bonferroni,

Holm, Hochberg, Hommel e Rom apresentam praticamente o mesmo poder, exceto para valores bem pequenos de

, em que o mtodo de Rom apresenta superioridade em relao

4.

Estudo de simulao

46

aos demais. Na situao de censura igual a para exatamente

11 (Tabela 4.4),

o poder das estratgias convergiu

1 quando

assumiu os valores

4, 5 e 5 nos testes das estatsticas log-rank 13


(Tabela 4.5) esta

e Cramr-von Mises, respectivamente. No cenrio de censura igual a convergncia ocorreu com

igual a

para as duas estatsticas. J no caso sem censura

(Tabela 4.6), o poder dos testes atingiu na estatstica Cramr-von Mises.

100%

com

= 3, 5

na estatstica log-rank e

=4

A segunda avaliao do poder foi tambm realizada nos trs cenrios de censura escolhidos. Mantivemos o nmero de iteraes em

10000 4, 6

e tamanhos de amostras igual a e

100.

Exploramos as situaes em que foram geradas

11

populaes de distribuio

Poisson e sempre a primeira populao foi tomada como referncia. As expresses dadas na sequncia ilustram a maneira como foram geradas as hipteses variando o nmero de hipteses falsas:

4 populaes para testarmos trs

X (1) , X (2) , X (3) P () X (1) , X (2) P () X (1) P ()


em que realizar e e

X (4) P ( + ),

X (3) , X (4) P ( + ),

X (2) , X (3) , X (4) P ( + ),

= 10 5
e

= 2.

De modo anlogo foram geradas as demais populaes para

10

testes simultneos.

As Tabelas

4.7, 4.8, 4.9, 4.10, 4.11

4.12

apresentam os valores do poder dos

cinco MCMs empregados nas estatsticas log-rank e Cramr-von Mises para as diferentes conguraes de censura adotadas. Nas Figuras

4.7, 4.8, 4.9, 4.10, 4.11

4.12 3, 5

esto e

ilustrados o comportamento do poder das estratgias quando foram testadas hipteses em funo do nmero de hipteses falsas.

10

4.

Estudo de simulao

47

TABELA 4.7:

Poder dos

MCMs empregados na estatstica log-rank em funo do

nmero de hipteses falsas, censura xada em


Nmero de hipteses 3 Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10 Bonferroni 0,2889 0,5552 0,8277 0,1622 0,3159 0,4715 0,6253 0,7802 0,0746 0,1436 0,2119 0,2819 0,3514 0,4226 0,4881 0,5589 0,6272 0,7001

11.
Estratgia Holm 0,2944 0,5867 0,9013 0,1641 0,3271 0,5014 0,6865 0,8922 0,0751 0,1459 0,2190 0,2945 0,3731 0,4572 0,5400 0,6336 0,7334 0,8505 Hochberg 0,2956 0,5893 0,9067 0,1642 0,3277 0,5040 0,6918 0,9023 0,0751 0,1459 0,2190 0,2948 0,3739 0,4585 0,5433 0,6387 0,7427 0,8738 Hommel 0,2959 0,5898 0,9069 0,1646 0,3286 0,5061 0,6944 0,9029 0,0753 0,1463 0,2199 0,2965 0,3766 0,4626 0,5494 0,6470 0,7518 0,8789 Rom 0,2962 0,5900 0,9070 0,1650 0,3294 0,5070 0,6953 0,9032 0,0756 0,1471 0,2213 0,2989 0,3796 0,4668 0,5544 0,6517 0,7558 0,8808

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

0.8

0.8

0.8

q q q
q q

0.6

0.6

q q

0.6

Poder

Poder

q q

Poder

0.4

0.4

0.4

q q

q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q q

0.2

0.2

q q

0.2

q q

Bonf Holm Hoch Hommel Rom

q q

q q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.7:

Grcos do poder em funo do n

de hipteses falsas dos 5 MCMs

empregados na estatstica log-rank com censura xada em

11.

4.

Estudo de simulao

48

TABELA 4.8: Poder dos do nmero de hipteses


Nmero de hipteses 3

5 MCMs empregados na estatstica Cramr-von Mises em funo falsas, censura xada em 11.
Estratgia Bonferroni 0,3057 0,5958 0,8873 0,1792 0,3459 0,5149 0,6805 0,8475 0,0836 0,1602 0,2382 0,3171 0,3937 0,4728 0,5502 0,6288 0,7077 0,7840 Holm 0,3118 0,6225 0,9439 0,1812 0,3559 0,5409 0,7354 0,9371 0,0841 0,1628 0,2449 0,3296 0,4148 0,5057 0,5984 0,6988 0,8050 0,9195 Hochberg 0,3125 0,6253 0,9467 0,1814 0,3566 0,5427 0,7384 0,9425 0,0841 0,1628 0,2450 0,3298 0,4151 0,5068 0,6001 0,7025 0,8118 0,9330 Hommel 0,3128 0,6257 0,9467 0,1816 0,3574 0,5440 0,7394 0,9427 0,0842 0,1631 0,2457 0,3309 0,4168 0,5093 0,6036 0,7072 0,8161 0,9349 Rom 0,3129 0,6259 0,9468 0,1820 0,3580 0,5446 0,7398 0,9428 0,0845 0,1638 0,2467 0,3324 0,4189 0,5120 0,6062 0,7096 0,8178 0,9355

Nmero de hipteses falsas 1 2 3

1 2 3 4 5

10

1 2 3 4 5 6 7 8 9 10

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

q q

0.8

0.8

0.8

q q

0.6

0.6

0.6

q
q

q q

q q

Poder

Poder

Poder

q q

0.4

0.4

q q

0.4

q q

q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q q

q
q q q

Bonf Holm Hoch Hommel Rom

0.2

0.2

0.2

q q

q q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.8:

Grcos do poder em funo do n

de hipteses falsas dos 5 MCMs

empregados na estatstica Cramr-von Mises com censura xada em

11.

4.

Estudo de simulao

49

TABELA 4.9:
Nmero de hipteses 3

Poder dos

MCMs empregados na estatstica log-rank em funo do

nmero de hipteses falsas, censura xada em


Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10 Bonferroni 0,3168 0,6181 0,9172 0,1829 0,35856 0,5348 0,7103 0,8787 0,0878 0,1696 0,2531 0,3340 0,4160 0,4980 0,5823 0,6618 0,7453 0,8253

13.
Estratgia Holm 0,3230 0,6424 0,9630 0,18478 0,36756 0,5583 0,7557 0,9551 0,0883 0,1722 0,2591 0,3458 0,4361 0,5280 0,6268 0,7244 0,8334 0,9466 Hochberg 0,3237 0,6436 0,9650 0,18486 0,36814 0,5594 0,7574 0,9585 0,0884 0,1723 0,2592 0,3460 0,4366 0,5287 0,6279 0,7271 0,8382 0,9548 Hommel 0,3240 0,6438 0,9650 0,18518 0,36878 0,5601 0,7581 0,9588 0,0885 0,1726 0,2596 0,3468 0,4379 0,5304 0,6303 0,7300 0,8407 0,9556 Rom 0,3241 0,6438 0,9650 0,1856 0,36922 0,5605 0,7583 0,9588 0,0887 0,1730 0,2605 0,3481 0,4394 0,5325 0,6320 0,7317 0,8419 0,9558

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

q q

0.8

0.8

q q q q

q q

0.8

q q

0.6

0.6

q q

0.6

Poder

Poder

Poder

q q

q
q

0.4

0.4

q q

0.4

q
q q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q
q q q

Bonf Holm Hoch Hommel Rom

0.2

0.2

0.2

q q

q q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.9:

Grcos do poder em funo do n

de hipteses falsas dos 5 MCMs

empregados na estatstica log-rank com censura xada em

13.

4.

Estudo de simulao

50

TABELA 4.10:
Nmero de hipteses 3

Poder dos

MCMs empregados na estatstica Cramr-von Mises em

funo do nmero de hipteses falsas, censura xada em


Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10 Bonferroni 0,3242 0,6276 0,9375 0,1903 0,3693 0,5515 0,7293 0,9103 0,0907 0,1770 0,2628 0,3484 0,4346 0,5191 0,6049 0,6925 0,7766 0,8650 Holm 0,3316 0,6517 0,9747 0,1925 0,3780 0,5721 0,7700 0,9710 0,0912 0,1791 0,2683 0,3591 0,4517 0,5464 0,6440 0,7478 0,8540 0,9661

13.
Hommel 0,3321 0,6526 0,9759 0,1929 0,3787 0,5734 0,7720 0,9729 0,0914 0,1794 0,2687 0,3597 0,4530 0,5483 0,6470 0,7515 0,8590 0,9706 Rom 0,3322 0,6528 0,9759 0,1931 0,3791 0,5735 0,7721 0,9729 0,0915 0,1798 0,2694 0,3606 0,4539 0,5495 0,6486 0,7526 0,8597 0,9707

Estratgia Hochberg 0,3321 0,6525 0,9759 0,1928 0,3783 0,5729 0,7716 0,9728 0,0913 0,1792 0,2684 0,3592 0,4519 0,5471 0,6453 0,7496 0,8573 0,9703

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

q q

q q

q q

0.8

0.8

q q q q

q q

0.8

q q

0.6

0.6

q q q q

Poder

Poder

Poder

0.6

q q

0.4

0.4

q q

0.4

q q q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q
q q

q q

Bonf Holm Hoch Hommel Rom

0.2

0.2

0.2
q q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.10:

Grcos do poder em funo do n

de hipteses falsas dos 5 MCMs

empregados na estatstica Cramr-von Mises com censura xada em

13.

4.

Estudo de simulao

51

TABELA 4.11:
Nmero de hipteses 3

Poder dos

MCMs empregados na estatstica log-rank em funo do


Estratgia Bonferroni 0,3292 0,6401 0,9499 0,1938 0,3778 0,5600 0,7449 0,9268 0,0931 0,1823 0,2685 0,3588 0,4463 0,5337 0,6208 0,7118 0,8011 0,8886 Holm 0,3353 0,6595 0,9799 0,1959 0,3858 0,5790 0,7802 0,9789 0,0937 0,1844 0,2737 0,3684 0,4624 0,5583 0,6566 0,7609 0,8667 0,9754 Hochberg 0,3356 0,6604 0,9806 0,1960 0,3860 0,5795 0,7810 0,9803 0,0937 0,1845 0,2737 0,3685 0,4626 0,5587 0,6574 0,7622 0,8696 0,9787 Hommel 0,3356 0,6604 0,9806 0,1961 0,3866 0,5799 0,7813 0,9803 0,0938 0,1846 0,2742 0,3690 0,4632 0,5597 0,6587 0,7635 0,8707 0,9789 Rom 0,3357 0,6604 0,9806 0,1964 0,3869 0,5802 0,7814 0,9803 0,0940 0,1850 0,2748 0,3698 0,4642 0,5608 0,6596 0,7642 0,8709 0,9789

nmero de hipteses falsas, dados sem censura.


Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

q q

q q

q q

0.8

0.8

q q

0.8

q q

q q

q q

0.6

0.6

q
q

0.6

q q

Poder

Poder

Poder

q q

0.4

0.4

q q

0.4

q q

q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q q

q q

Bonf Holm Hoch Hommel Rom

0.2

0.2

0.2
q q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.11:

Grcos do poder em funo do n

de hipteses falsas dos

MCMs

empregados na estatstica log-rank com dados sem censura.

4.

Estudo de simulao

52

TABELA 4.12:
Nmero de hipteses 3

Poder dos

MCMs empregados na estatstica Cramr-von Mises em


Estratgia Bonferroni 0,3304 0,6427 0,9575 0,1953 0,3788 0,5662 0,7504 0,9344 0,0945 0,1833 0,2730 0,3653 0,4509 0,5403 0,6316 0,7215 0,8093 0,8990 Holm 0,3364 0,6629 0,9838 0,1972 0,3872 0,5837 0,7840 0,9835 0,0951 0,1853 0,2785 0,3716 0,4668 0,5631 0,6647 0,7666 0,8734 0,9802 Hochberg 0,3370 0,6634 0,9844 0,1973 0,3873 0,5843 0,7849 0,9835 0,0951 0,1854 0,2786 0,3717 0,4670 0,5634 0,6654 0,7676 0,8752 0,9823 Hommel 0,3370 0,6635 0,9844 0,1974 0,3876 0,5846 0,7850 0,9835 0,0951 0,1855 0,2790 0,3721 0,4675 0,5643 0,6667 0,7687 0,8760 0,9824 Rom 0,3370 0,6635 0,9844 0,1976 0,3878 0,5849 0,7851 0,9835 0,0954 0,1858 0,2796 0,3728 0,4682 0,5653 0,6676 0,7695 0,8762 0,9824

funo do nmero de hipteses falsas, dados sem censura.


Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

q q

q q

q q

0.8

0.8

q q

0.8

q q

q q

q q

0.6

0.6

q q

0.6

q q

Poder

Poder

Poder

q q

0.4

0.4

q q

0.4

q q

q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q q

q q

Bonf Holm Hoch Hommel Rom

0.2

0.2

0.2
q q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.12:

Grcos do poder em funo do n

de hipteses falsas dos

MCMs

empregados na estatstica Cramr-von Mises com dados sem censura.

Por meio das Tabelas

4.7, 4.8, 4.9, 4.10, 4.11

4.12;

e das Figuras

4.7, 4.8, 4.9,

4.10, 4.11

4.12;

ca claro o que j bastante armado na literatura: o procedimento

de Bonferroni apresenta o menor poder em todos os cenrios de censura investigados nos testes das duas estatsticas. J os outros quatro procedimentos apresentaram praticamente

4.

Estudo de simulao

53

o mesmo comportamento. Um fato importante a ser notado que nos testes da estatstica de Cramrvon Mises os cinco procedimentos apresentaram maior poder em relao aos testes da estatstica log-rank. No que diz respeito censura, os testes realizados com dados sem censura apresentaram maior poder em relao aos dados com censura xada em

13,

que

por sua vez apresentaram maior poder em relao aos dados com censura xada em

11.

4.2

Dados contnuos

Para as simulaes realizadas com dados contnuos foram geradas amostras aleatrias de distribuio exponencial. Devido ao elevado custo computacional empregando nos testes as estatsticas log-rank e Cramr-von Mises foi analisado apenas o cenrio em que aproximadamente

36%

dos dados gerados foram censurados.

4.2.1

Controle da FWER
Para averiguar o controle da FWER das cinco estratgias de comparaes ml-

tiplas aplicadas na estatstica log-rank tomamos amostras de tamanho

30, 50, 100, 150,

200, 250

300;

e para a estatstica Cramr-von Mises trabalhamos apenas com amostras e

de tamanho

30, 50

100

devido ao altssimo tempo computacional gasto.

Realizamos

10000

iteraes e em cada caso foram geradas

10

populaes de distribuio exponencial

com parmetros

1 , . . . , 10 = 0, 01, sendo a primeira populao adotada como referncia. 100, o que equivale a aproximadamente 36% dos dados censurados.
mostra os valores da FWER das estratgias de Bonferroni, Holm,

Fixamos a censura em A Tabela

4.13

Hochberg, Hommel e Rom aplicados na estatstica log-rank para os diferentes tamanhos de amostras escolhidos. Na Figura

4.13

apresentamos o grco com o comportamento da

FWER em funo do TA para esta mesma estatstica.

4.

Estudo de simulao

54

TABELA 4.13: FWER para os cinco MCMs empregados nos testes da estatstica log-rank em funo dos diferentes TA com censura xada em
Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,03870 0,03870 0,03870 0,03880 0,03990 TA=50 0,04200 0,04200 0,04200 0,04200 0,04320 TA=100 0,05030 0,05030 0,05030 0,05050 0,05120

100.
TA=200 0,04890 0,04890 0,04890 0,04910 0,04990 TA=250 0,04900 0,04900 0,04910 0,04940 0,04990 TA=300 0,04978 0,04978 0,04985 0,04998 0,05002

TA=150 0,04900 0,04900 0,04900 0,04900 0,04980

Logrank

0.050

q q

FWER

0.045

Bonf Holm Hoch Hommel Rom

0.040
q

50

100

150

200

250

300

Tamanho da amostra

FIGURA 4.13:

Grco do comportamento da FWER dos

MCMs empregados na

estatstica log-rank.

Pela Figura

4.13

observamos que com amostras de tamanhos

30

50

os cinco

mtodos mostraram-se bastante conservativos nos testes da estatstica log-rank. Com TA

150, 200, 250

300

o Mtodo de Rom chegou bem prximo ao nvel nominal de

5%, 5%

enquanto os outros mostraram-se ainda um pouco conservativos atingindo a taxa de apenas com TA igual a Na Tabela

300.
e na Figura

4.14

4.14

esto listados os valores e o comportamento da

FWER dos cinco procedimentos aplicados na estatstica Cramr-von Mises para amostras de tamanho

30, 50

100.

4.

Estudo de simulao

55

TABELA 4.14: FWER para os cinco MCMs empregados nos testes da estatstica Cramrvon Mises em funo dos diferentes tamanhos de amostras (TA) com censura xada em

100.
Estratgia Bonferroni Holm Hochberg Hommel Rom TA=30 0,04620 0,04620 0,04620 0,04640 0,04720 TA=50 0,04830 0,04830 0,04830 0,04840 0,04950 TA=100 0,04540 0,04540 0,04540 0,04570 0,04630

Cramrvon Mises

0.050

0.045

FWER

Bonf Holm Hoch Hommel Rom

0.040 30

40

50

60

70

80

90

100

Tamanho da amostra

FIGURA 4.14:

Grco do comportamento da FWER dos

MCMs empregados na

estatstica Cramr-von Mises.

Pela Figura

4.14

notamos que os

procedimentos apresentaram-se conservativos

nos testes da estatstica Cramr-von Mises com amostras de TA amostra de tamanho

30 e 100,

entretanto com Novamente a

50

a FWER chegou prximo ao nvel nominal de

5%.

estratgia de Rom foi a menos conservativa. Quando comparado aos testes realizados com a estatstica log-rank, a estatstica de Cramr apresentou resultados menos conservativos para TA

30

50.

4.2.2

Poder dos testes


Para estimar o poder procedemos das duas maneiras citadas no incio deste

captulo.

Realizamos em cada estudo

10.000

iteraes e trabalhamos com amostras de

4.

Estudo de simulao

56

tamanho

50. 10
populaes de distribuio

Para a primeira avaliao do poder foram geradas exponencial com parmetros

X (1) , . . . , X (9) E (0, 01)


em que

X (10) E (0, 01 + ),
a censura foi

assumiu a sequncia de valores

0, 002; 0, 004; . . . ; 0, 0024; 0, 0026,

xada em

100

e a primeira populao foi tomada como controle.

Na Tabela

4.15

e na Figura

4.15

esto apresentados o poder dos cinco mtodos

analisados nas estatsticas log-rank e Cramr-von Mises em funo do incremento de

TABELA 4.15: Poder dos

MCMs empregados nas estatsticas log-rank e Cramr-von

Mises em funo do incremento de

.
Estatstica

log-rank
Hommel 0,0400 0,0738 0,1917 0,3645 0,5485 0,7085 0,8330 0,9090 0,9529 0,9781 0,9921 0,9958 0,9978 Rom 0,0756 0,1097 0,2246 0,3940 0,5679 0,7224 0,8395 0,9135 0,9556 0,9791 0,9926 0,9961 0,9978

0,002 0,004 0,006 0,008 0,010 0,012 0,014 0,016 0,018 0,020 0,022 0,024 0,026

Bonferroni 0,0397 0,0735 0,1906 0,3628 0,5468 0,7074 0,8318 0,9084 0,9524 0,9776 0,9921 0,9958 0,9978

Holm 0,0397 0,0737 0,1910 0,3634 0,5474 0,7081 0,8326 0,9087 0,9525 0,9777 0,9921 0,9958 0,9978

Hochberg 0,0399 0,0737 0,1910 0,3635 0,5475 0,7081 0,8326 0,9088 0,9526 0,9777 0,9921 0,9958 0,9978

Estatstica Cramr-von Mises

0,002 0,004 0,006 0,008 0,010 0,012 0,014 0,016 0,018 0,020 0,022 0,024 0,026

Bonferroni 0,0315 0,0599 0,1621 0,2853 0,4552 0,6116 0,7381 0,8433 0,8985 0,9418 0,9667 0,9827 0,9898

Holm 0,0318 0,0601 0,1629 0,2856 0,4559 0,6120 0,7385 0,8438 0,8987 0,9419 0,9667 0,9828 0,9899

Hochberg 0,0318 0,0601 0,1632 0,2856 0,4559 0,6122 0,7386 0,8439 0,8987 0,9419 0,9667 0,9828 0,9899

Hommel 0,0319 0,0602 0,1634 0,2867 0,4565 0,6128 0,7396 0,8444 0,8990 0,9423 0,9668 0,9829 0,9899

Rom 0,0703 0,1008 0,2014 0,3201 0,4836 0,6338 0,7542 0,8521 0,9048 0,9459 0,9686 0,9834 0,9990

4.

Estudo de simulao

57

Logrank
1.0

Cramrvon Mises
q
q

q
q

q
q

q
q

q
q

1.0

q
q

q
q

q
q

q
q

q
q

0.8

0.8

q
q

q
q

q
q

q
q

0.6

0.6

q
q

Poder

Poder

q
q

q
q

0.4

q
q

Bonf
q

0.4

Holm 0.2 Hoch Hommel Rom

q
q

Bonf
q

Holm Hoch Hommel Rom

0.2

q
q

q
q

0.0

0.000

0.005

0.010

0.015

0.020

0.0

q
q

q
q

q
q

q
q

0.000

0.005

0.010

0.015

0.020

FIGURA 4.15:

Grcos do poder em funo do n

de hipteses falsas dos 5 MCMs

empregados na estatstica log-rank.

Por meio da Tabela

4.15

e da Figura

4.15

podemos ver que o mtodo de Rom

apresenta o poder um pouco maior que os demais, principalmente quando pequenos. medida que

assume valores

incrementado, o poder dos cinco procedimentos cam

bem prximos.

Observamos ainda que os testes executados com a estatstica log-rank

apresentam maior poder quando comparado estatstica Cramr-von Mises. Na segunda investigao do poder trabalhamos com as conguraes em que foram geradas

4, 6

11

populaes para executar respectivamente

3, 5

10

testes

de hipteses simultaneamente. como foram geradas hipteses falsas:

As expresses dadas na sequncia ilustram a maneira

populaes para testarmos trs hipteses alternando o nmero de

X (1) , X (2) , X (3) E () X (1) , X (2) E () X (1) E ()


em que mantivemos e e

X (4) E ( + ),

X (3) , X (4) E ( + ),

X (2) , X (3) , X (4) E ( + ),


De maneira anloga foram criadas as demais

= 0, 01

= 0, 015. 5
e

populaes para realizar os testes com As Tabelas

10

hipteses.

4.16 e 4.17 relatam o poder dos 5 procedimentos dos testes realizados


Nas Figuras

com as estatsticas log-rank e Cramr-von Mises, respectivamente.

4.16

4.

Estudo de simulao

58

4.17

esto os grcos desse poder quando foram testadas

3, 5

10

hipteses em funo

do nmero de hipteses falsas envolvidas nos teses.

TABELA 4.16:
Nmero de hipteses 3

Poder dos

MCMs empregados na estatstica log-rank em funo do


Estratgia Bonferroni 0,3245 0,6342 0,9439 0,1900 0,3723 0,5526 0,7317 0,9160 0,0905 0,1767 0,2625 0,3491 0,4343 0,5219 0,6086 0,6950 0,7810 0,8672 Holm 0,3301 0,6540 0,9796 0,1923 0,3807 0,5741 0,7738 0,9770 0,0910 0,1788 0,2686 0,3601 0,4535 0,5502 0,6489 0,7529 0,8621 0,9719 Hochberg 0,3306 0,6552 0,9803 0,1923 0,3811 0,5753 0,7749 0,9791 0,0910 0,1788 0,2689 0,3602 0,4537 0,5506 0,6501 0,7549 0,8651 0,9758 Hommel 0,3307 0,6552 0,9803 0,1925 0,3816 0,5759 0,7755 0,9791 0,0910 0,1790 0,2690 0,3612 0,4548 0,5522 0,6519 0,7571 0,8666 0,9761 Rom 0,3307 0,6552 0,9803 0,1927 0,3818 0,5762 0,7757 0,9791 0,0912 0,1794 0,2698 0,3621 0,4558 0,5535 0,6532 0,7581 0,8670 0,9762

nmero de hipteses falsas.


Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

q q

q q

q q

0.8

0.8

q q q q

q q

0.8

q q

0.6

0.6

q
q q q

Poder

Poder

Poder

0.6

q q

0.4

0.4

q q

0.4

q q q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q
q q

q q

Bonf Holm Hoch Hommel Rom

0.2

0.2

0.2
q q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.16:

Grcos do poder em funo do n

de hipteses falsas dos 5 MCMs

empregados na estatstica log-rank.

4.

Estudo de simulao

59

TABELA 4.17:
Nmero de hipteses 3

Poder dos

MCMs empregados na estatstica Cramr-von Mises em


Estratgia Bonferroni 0,3080 0,6015 0,8942 0,1789 0,3468 0,5145 0,6832 0,8512 0,0823 0,1584 0,2359 0,3159 0,3914 0,4710 0,5483 0,6259 0,7030 0,7783 Holm 0,3142 0,6303 0,9529 0,1811 0,3569 0,5425 0,7403 0,9449 0,0829 0,1610 0,2431 0,3298 0,4152 0,5066 0,6024 0,7019 0,8089 0,9271 Hochberg 0,3152 0,6325 0,9560 0,1813 0,3575 0,5441 0,7433 0,9503 0,0829 0,1610 0,2433 0,3301 0,4158 0,5078 0,6047 0,7057 0,8166 0,9411 Hommel 0,3155 0,6327 0,9560 0,1817 0,3582 0,5456 0,7443 0,9507 0,0829 0,1612 0,2442 0,3313 0,4180 0,5111 0,6087 0,7109 0,8215 0,9427 Rom 0,3157 0,6328 0,9561 0,1820 0,3588 0,5461 0,7446 0,9508 0,0834 0,1619 0,2456 0,3331 0,4205 0,5141 0,6116 0,7134 0,8233 0,9432

funo do nmero de hipteses falsas.


Nmero de hipteses falsas 1 2 3 5 1 2 3 4 5 10 1 2 3 4 5 6 7 8 9 10

3 hipteses
1.0 1.0

5 hipteses
1.0

10 hipteses

q q

q q

0.8

0.8

q
q

0.8

q q

0.6

0.6

0.6

q q

Poder

Poder

Poder

q q

0.4

0.4

q q

0.4

q q

q q

Bonf Holm Hoch Hommel Rom

q q

Bonf Holm Hoch Hommel Rom

q q

q
q q q

Bonf Holm Hoch Hommel Rom

0.2

0.2

0.2

q q

q
q

0.0

0.0

2 Hipteses falsas

3 Hipteses falsas

0.0

6 Hipteses falsas

10

FIGURA 4.17:

Grcos do poder em funo do n

de hipteses falsas dos 5 MCMs

empregados na estatstica Cramr-von Mises.

Observamos novamente pelas Tabelas e

4.17

4.16

e por meio das Figuras

4.16

4.17

que o procedimento de Bonferroni apresenta poder inferior em relao s demais

estratgias. No geral, os procedimentos de Holm, Hochberg, Hommel e Rom apresentaram poder bem semelhantes entre si. Vale notar ainda que os testes empregados com a

4.

Estudo de simulao

60

estatstica log-rank resultou em maior poder quando comparado estatstica de Cramrvon Mises.

Captulo 5 Concluso e propostas futuras


Nesta dissertao analisamos o desempenho no que diz respeito ao controle da FWER e ao ganho de poder dos procedimentos de comparaes mltiplas de Bonferroni clssico e de certos mtodos denominados na literatura como seus melhoramentos, dentre eles, o procedimento de Holm, conhecido tambm como mtodo de Bonferroni de rejeio sequencial; e trs procedimentos derivados do mtodo de Simes para realizar inferncias sob as hipteses individuais: Hochberg, Hommel e a recente estratgia proposta por Rom (2013). Focamos no problema de comparao mltipla de testar um tratamento versus controle empregando nos testes as estatsticas log-rank e Cramr-von Mises, ambas com estrutura de dependncia. Enfatizamos ainda o trabalho com dados discretos na presena de censura, visto que na rea de comparaes mltiplas tem se falado pouco desses tipos de dados. Vericamos que a estatstica log-rank pertence classe multivariada totalmente positiva de ordem 2 (MTP2 ), fato indispensvel para garantir o controle da FWER ao empregar o mtodo de Simes. Para a estatstica de Cramr-von Mises ainda no foi

possvel concluir o mesmo argumento. Por meio dos estudos de simulao vericamos que em alguns casos os mtodos mostraram-se conservativos e em outros extrapolaram um pouco o nvel nominal de

5%.

Todavia, para tamanhos de amostras grande, o controle da FWER foi satisfatrio nos testes das duas estatsticas, tanto para dados contnuos como discretos. Dos cinco MCMs

61

5.

Concluso e propostas futuras

62

empregados o que se mostrou menos conservativo e que chegou mais prximo de procedimento de Rom.

5%

foi o

Mediante a avaliao do poder o que se pode conrmar claramente que o procedimento de Bonferroni apresenta menor poder em relao aos demais nos cenrios analisados. Entre os procedimentos de Holm, Hochberg, Hommel e Rom no foi notada uma diferena importante. Como propostas de trabalhos futuros, listamos os seguinte itens:

Vericar teoricamente se a estatstica de Cramr-von Mises satisfaz a condio (MTP2 );

Analisar outros problemas de comparaes mltiplas, como por exemplo, testes dois a dois;

Estudar os mtodos de comparaes mltiplas que controlam a false discovery rate (FDR);

Analisar alguns mtodos que controlam a da FWER usual. literatura.

k -FWER,

que uma verso generalizada

uma taxa de erro que tem sido introduzida recentemente na

Apndice A Propriedades e resultados assintticos


Neste apndice apresentamos alguns resultados que foram utilizados na demonstrao de que a estatstica log-rank ponderada satisfaz a condio MTP2 . Analisamos o caso de qualquer

amostras aleatrias independentes

p p )j =1 , (Wjp , Cj

para

p J.

A m de manter o controle do comportamento martingale limitante em

diferentes amostras introduzimos a ltragem

F = {Fi ; i 0}

gerada por toda informao

disponvel em cada categoria da seguinte maneira

Fi :=
np ;pJ

Fi p ,

i 0.

Por simplicao, fazemos uso da seguinte notao. Para um dado

p J,

p p Vm (j ) := (V1p (j ), . . . , Vm (j )),

p p Rp m (j ) := (R1 (j ), . . . , Rm (j )),

C,p C,p RC,p m (j ) := (R1 (j ), . . . , Rm (j )), 1 m NJ ; j 1.

Introduzimos agora uma outra ltragem que ser a base para nossos resultados assintticos. sequncia. Esta famlia de ltragem cuidadosamente escolhida como descrito na

Para uma dada categoria

j 1

n NJ ,

denimos a ltragem

G n (j ) =

63

A.

Propriedades e resultados assintticos

64

n {Gm (j ); 0 m NJ }

ao longo das amostras da seguinte maneira

p p C,p n (j ) := {(V np (j ), Rn (j 1), Vm Gm +1 (j ), Rm (j ), Rm (j )), p J },

para qualquer

0 m NJ 1

p C,p n GN (j ) := {(V np (j ), Rn (j 1), VN (j ), Rp NJ (j ), RNJ (j )), p J }, J J

em que denimos

Rn (0) = Rn (0) q1 = q

C,p Rp = 0. 0 = R0

Para qualquer par

em

n = (n1 , . . . , nJ ) NJ ,

seja

Unqq1 (n , .) =

{Unqq1 (n , i); i 1}

um processo previsvel em relao ltragem

satisfazendo os

seguintes pressupostos:

(M1) (M2)

Para cada

(nq , nq1 ) N2 , Unqq1 (n , i)


tal que

n G0 (i)-mensurvel

para cada

i 1;

Existe

>0

Unqq1 (n , i) lim nq n V nq (i)


em probabilidade para cada

2+

nq1

Unqq1 (n , i) V nq1 (i)

2+

=0

i 1;
e

(M3)

Para qualquer

q2 {q, q1 }

1
n

existe uma constante

q2 q,q ( ) 1

tal que

|Unqq1 (n , )|2 q2 q,q ( ) 1 nq2 V ( )


em probabilidade com

n .
e

(M4)

Para qualquer

q2 J (q2 = q, q2 = q1 )
n n

existe uma constante

q q ( ) 1 ,q2

tal que

Unqq1 (n , )Unqq2 (n , ) q q ( ) 1 ,q2 V nq ( )


em probabilidade com

n 3 J , r=k
precisamos introduzir outro par de

A m de tratar o caso geral, com pressupostos no processo ponderado previsvel em relao ltragem

U.

Dado

em

J , seja U

um processo ponderado

que satisfaa os seguintes pressupostos:

A.

Propriedades e resultados assintticos

65

(H1)

Para qualquer

q1 = k

1,

existe uma constante

k,r q ( ) 1

tal que

nr nk (n , ) (n , )Un Un q1 q1

V nq1 ( )
em probabilidade com

k,r q ( ) 1

n .
e

(H2)

Para qualquer

q1 = k

1,

existe uma constante

k,r q ( ) 1

tal que

nk nr Un (n , )Un (n , ) q1 q1

V nq1 ( )
em probabilidade com

k,r ( ) q 1

n .
(M1-

Lema A.1.
M4).

Assumimos que os processos ponderados satisfaam os pressupostos

Assim, para cada


n

qJ

1,
n
(A.1)

q1 =q

1{V nq1 ( )>0} Unqq1 (n , )1 1{V nq ( )>0} Unqq1 (n , )1 nq Y nq1 ( ) Y ( ) V nq ( ) V nq1 ( ) N (0, 2 q ( ))
com

converge em distribuio para dada por

n .

A varincia assinttica

2 q( )

2 q( ) =
q1 =q

q1 q,q ( )hq1 ( )[1 hq1 ( )] 1

(A.2)

+
q1 =q

q q,q ( )hq ( )[1 hq ( )] 1

+ 2
q1 ,q2 Aq q1 q q,q , q,q 1 1

q q ( )hq ( )[1 hq ( )], 1 ,q2

tal que a famlia de funes

q q 1 ,q2

em

(A.2) so dadas respectivamente em

(M3)

(M4).
Para qualquer par

Proposio A.1.
aq,q1
tais que

q1 = q
Seja

em

J,

assumimos que existem constantes

limnq ,nq1 nq1 /nq = aq,q1 .

uma funo contnua no negativa. Ento,

os processos ponderados de Harrington e Fleming


1/2

nq Un (n q1

, )=

J i=1

ni

nq1 nq

f
j =0

Rn (j ) V n (j )

V nq1 ( )V nq ( ) Vn ( )

A.

Propriedades e resultados assintticos

66

e os processos ponderados de Tarone e Ware


1/2

nq (n Un q1

, )=

J i=1

ni

nq1 nq
(M1-M4).

Vn ( )
J i=1

ni

V nq1 ( )V nq ( ) Vn ( )

satisfazem os pressupostos

Demonstrao. Precisamos apenas vericar os argumentos para a classe Tarone e Ware,


pois os argumentos para Harrington e Fleming so anlogos. abreviar a notao, escrevemos Fixamos

1
Se

e, para

n =

J i=1

ni .

O pressuposto

(M1)

bvio.

> 0,

usando a condio de crescimento, a continuidade de

e o fato de que

Vn ( )

a soma

de distribuies binomiais independentes pata obter a seguinte estimativa

1{V nq (i)>0} Unqq1 (n , i)1 nq V nq (i)

2+

n nq1

1+/2

/2 nq f V n ( )n1

2+

0
para qualquer dado

com

n ,

q = q1 J

em

J.

Isto mostra que o pressuposto

(M2) satisfeito.

Para um

q = q1
n

em

e qualquer

q2 {q, q1 },

temos que

|Unqq1 (n , )|2 V n ( ) V nq1 ( ) V nq ( ) n nq2 f 1 1 = 1 1{V nq ( )>0} . {V ( )>0} V nq2 ( ) n Vn ( ) nq nq1 q3 J (q3 = q, q3 = q1 ),
n

(A.3)

Se

escrevemos que

Unqq1 (n , )Unqq2 (n , ) 1 1{V nq ( )>0} = V nq ( )

Vn ( ) n

n nq nq3 n V ( ) nq nq1

1/2

V nq3 ( )V nq ( ) nq nq3

V nq1 ( ) 1 1 n V n ( ) {V

( )>0} . (A.4)

As identidades (A.3) e (A.4) nos permite usar novamente a condio de crescimento, a continuidade de

e a propriedade binomial para obter os pressupostos

(M3)

(M4)

para concluir a prova.

Teorema A.1. Assumimos que um processo ponderado U

satisfaa os pressupostos

(M1-

A.

Propriedades e resultados assintticos

67

M4).

Assim, temos que


n n

i 0

q1 =q

Unqq1 ( ) 1 1{V nq ( )>0} dY nq ( ) V nq ( )


i =1

i 0

Unqq1 ( ) 1 1{V nq1 ( )>0} dY nq1 ( ) V nq1 ( )

converge fracamente para

N 0,

2 q( )

com

n ,
i

para cada

i 1.

Alm disso,

2 ( ) q,n
=1 =1

2 q( )

(A.5)

em probabilidade com

n ,

para cada

i 1.

Observao A.1.

Para um dado

q J , denotamos por Zq () o limite fraco da expresso

(A.1) no Lema A.1 do seguinte modo

NJ

Zq ( ) := lim

n m,q ( ); m=1

1.

(A.6)

Estabelecemos ainda

Wq (i) :=
=1

Zq ( ),

i 1.

(A.7)

Observao A.2.
Nesse caso,

Quando

J = 2, qJ

as frmulas no Teorema A.1 cam muito simples. e a varincia assinttica no Lemma A.1 torna-se

Aq =

para cada

q1 q q q q1 q1 2 q ( ) = q,q1 ( )h ( )[1 h ( )] + q,q1 ( )h ( )[1 h ( )],

1.

Alm disso, e

2 ( ) 2 ( ) em probabilidade com n , em que para um dado q J q,n q

|Unqq1 (n , )|2 nq |Unqq1 (n , )|2 nq 2 nq nq1 ( )], q,n ( ) = h ( )[1 h ( )] + h 1 ( )[1 h nq1 n q V ( ) V ( )
para cada

1.
Assumimos que um processo ponderado Dessa forma, para cada
NJ n m, 1( m=1 NJ

Lema A.2.
M4)
and

satisfaa os pressupostos

(M1-

(H1-H2).

1, N 0 , Q( )

), . . . ,
m=1

n m,J ( )

A.

Propriedades e resultados assintticos

68

fracamente com

n ,

de modo que o operador de covarincia


J

Q( )

denido por

Q( )a, a

RJ

=
k=1

2 a2 k k ( ) + 2 1r<kJ

ar ak (k, r, )

para cada

a RJ .
Para qualquer para

Proposio A.2.
aq,q1
tais que

q1 = q

em

J,

assumimos que existem constantes

limnq ,nq1 nq1 /nq = aq,q1 .

Assim, os processos ponderados Harrington e

Fleming, e Tarone e Ware satisfazem as suposies

(M1-M4)

(H1-H2).
Fixamos

Demonstrao. Pela proposio A.1, s precisamos vericar


para sntese de notao, denotamos

(H1-H2).

1,

n=

J i=1

ni .

Se

q1 = k J ,
2

escrevemos

nk nr Un (n , )Un (n , ) q1 q1

V nq1 ( )

1 1{V nq1 ( )>0} =

f V n ( )n1

n nr n V ( ) nk

1/2

Para um dado

V nk ( ) V nr ( ) V nq1 ( ) 1 1{V nq1 ( )>0} V n ( ) nr nq1

(A.8)

r=k

em

q1 = k

podemos escrever

nk nr Un (n , )Un (n , ) q1 k

V nk ( )

1 1{V nk ( )>0} =

f V n ( )n1

2 V nk (

) V nr ( ) nk V n ( )

n nq1 V n ( ) nr

1/2

V nq1 ( ) 1 1{V nk ( )>0} . nq1

(A.9)

As expresses (A.8) e (A.9) nos permitem usar a condio de crescimento, a continuidade de

e a propriedade binomial para obtermos os pressupostos

(H1) e (H2).

Como os argumentos para o caso Harrington and Fleming so inteiramente anlogos, conclumos a prova.

Teorema A.2. Assumimos que um processo ponderado U satisfaz (M1-M4) e (H1-H2).

A.

Propriedades e resultados assintticos

69

Dessa forma, para cada


i

i 1,
NJ n m, 1( i NJ

), . . . ,
=1 m=1

n m,J ( ) N 0 , (i) i) = (
i =1

(A.10)

=1 m=1

fracamente com que

n .

Alm disso, se denotamos

( ) Q

podemos concluir denido por

i) (i) (

em probabilidade, em que o operador de covarincia


J

( ) Q

( )a, a Q

RJ

=
k=1

2 a2 k k ( ) + 2
1r<kJ

(k, r, ) ar ak

para cada

a RJ .

Demonstrao. A prova uma consequncia imediata do Lema A.2, em que podemos


aplicar os mesmos argumentos do Teorema A.1. Observao A.1 (A.6 e A.7), consideramos De fato, na notao introduzida na

( ) = (Z1 ( ), . . . , ZJ ( ), Z (i) = (W1 (i), . . . , WJ (i)), W

1; i 1.

Ao repetir os mesmos argumentos como na prova do Teorema A.1, fcil vericar que

um

F-vetor

martingale com incrementos independentes, isto ,

i Z

m Z

so

variveis aleatrias independentes com valores em

RJ

para cada

i = m.

Sob essas

condies, atravs do Lema A.2 conclumos a convergncia (A.10).

Referncias
Curnow, R. & Dunnett, C. (1962). The numerical evaluation of certain multivariate normal integrals. The Annals of Mathematical Statistics ,

33(2), 571579.

Duchesne, P. & Lafaye De Micheaux, P. (2010). Computing the distribution of quadratic forms: Further comparisons between the Liu-Tang-Zhang approximation and exact methods. Computational Statistics e Data Analysis ,

54(4), 858862.

Dunnett, C. & Sobel, M. (1955). Approximations to the probability integral and certain percentage points of a multivariate analogue of student's t-distribution.

42(1), 258260.

Biometrika ,

Dunnett, C. W. (1955). treatments with a control. 10961121. Fisher, R. (1935).

A multiple comparison procedure for comparing several

Journal of the American Statistical Association ,

50(272),

Society ,

98(1), 3982.

The logic of inductive inference.

Journal of the Royal Statistical

Fleming, T. & Harrington, D. (1991). Counting processes and survival analysis , volume 8. Wiley Online Library. Harrington, D. & Fleming, T. (1982). survival data. Biometrika , A class of rank test procedures for censored

69(3), 553566.

Hochberg, Y. (1988). A sharper bonferroni procedure for multiple tests of signicance.

Biometrika ,

75(4), 800802.

Hochberg, Y. & Tamhane, A. (1987). Multiple Comparison Procedure . John Wiley, New York. Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scandinavian

Journal of Statistics ,
Hommel, G. (1986).

6(2), 6570.

Metrika ,

33(1), 321336.

Multiple test procedures for arbitrary dependence structures.

Hommel, G. (1988). A stagewise rejective multiple test procedure based on a modied bonferroni test. Biometrika ,

75(2), 383386.

Hommel, G. (1989). A comparison of two modied bonferroni procedures. Biometrika ,

76(3), 624625.

70

Referncias

71

Hsu, J. (1996). Multiple Comparison: Theory and methods . Chapman and Hall,London. Karlin, S. (1968). Total positivity , volume 1. Stanford University Press. Karlin, S. & Rinott, Y. (1980). Classes of orderings of measures and related correlation inequalities. i. multivariate totally positive distributions.

Analysis ,

10(4), 467498.

Journal of Multivariate

Leo, D. & Ohashi, A. (2011). On the discrete Cramr-von Mises statistics under random censorship. "Submitted to the Annal of Statistics ". Lehmann, E. E. L. & Romano, J. P. (2005). Science+ Business Media. Marcus, R., Eric, P. & Gabriel, K. (1976). On closed testing procedures with special

Testing statistical hypotheses .

Springer

reference to ordered analysis of variance. Biometrika ,

63(3), 655660.

Miller, R. G. (1981). Simultaneous Statistical Inference . Springer-Verlag, New York. R Development Core Team (2011).

R: A language and environment for statistical

computing . R Foundation for Statistical Computing, Vienna, Austria.


Rom, D. (1990). A sequentially rejective test procedure based on a modied bonferroni inequality. Biometrika , Rom, D. (2013).

77(3), 663665.

An improved Hochberg procedure for multiple tests of signicance.

British Journal of Mathematical and Statistical Psychology ,

66(1), 189196.

Sarkar, S. (1998). Some probability inequalities for ordered MTP2 random variables: A proof of the Simes conjecture. The Annals of Statistics ,

26(2), 494504.

Sarkar, S. & Chang, C. (1997). The Simes method for multiple hypothesis testing with positively dependent test statistics.

92(440), 16011608.
Biometrika ,

Journal of the American Statistical Association ,

Simes, R. (1986). An improved Bonferroni procedure for multiple tests of signicance.

73(3), 751754.

Tarone, R. & Ware, J. (1977). distributions. Biometrika ,

64(1), 156160.

On distribution-free tests for equality of survival

Tukey, J. W. (1953). The problem of multiple comparisons. The Colected Works of Jonh

W. Tukey: Multiple Comparisons, Volume III , (1999), Edited by H. Braun, CRC Press,
Boca Ranton, Florida. Wright, S. (1992). 10051013. Adjusted p-values for simultaneous inference.

Biometrics ,

48(4),

You might also like