You are on page 1of 18

Universidade de So Paulo Instituto de Matemtica e Estatstica

LISTA IV
2010

QUESTO 1 a) Valores esperados sob a hiptese de independncia entre hiper-homocisteinemia e doena arterial coronariana DAC Hiper-homocisteinemia No Sim No 177*82/217 = 66,88 40*82/217 = 15,12 Sim 177*135/217 = 110,12 40*135/217 = 24,88

Se , (p-valor) Como o p-valor pequeno (consideramos razovel aqui afirmar que um p-valor menor que 0,05 seja pequeno), ento h evidncias para dizer que h proporcionalmente mais pacientes com DAC no grupo com hiper-homocisteinemia. Para dizer se a hiper-homocisteinemia fator de risco para DAC precisamos, antes de mais nada, saber como o experimento foi conduzido. Se for um estudo prospectivo ou um retrospectivo sem nenhum tipo de vis (de seleo, de informao, de memria, etc.), h evidncias para considerar que pacientes com hiper-homocisteinemia tm maior probabilidade de desenvolver DAC, ou seja, hiper-homocisteinemia seria um fator de risco. b) DAC Hiper-homocisteinemia No Sim No 73/177 = 0.4124 9/40 = 0.2250 Sim 104/177 = 0.5876 31/40 = 0.7750

Razo de chances = (0.7750/0.2250)/(0.5876/0.4124) = 2.4174 A razo de chances igual a 2.4174 significa que um indivduo portador de hiperhomocisteinemia tem 2.4174 vezes mais chances de desenvolver DAC do que um que no possua o fator de risco.

QUESTO 2

| |

| |

| |

| |

A importncia prtica desse resultado que, caso o interesse de um pesquisador seja avaliar a razo de chances, ele ento pode coletar a sua amostra de duas maneiras. A primeira buscando indivduos expostos e no-expostos ao fator (que se quer ver se ) de risco e avaliando se ficaram doentes ou no. A segunda buscando indivduos adoecidos e noadoecidos e perguntar / avaliar se foram expostos ao fator de risco. Isso interessante, pois, tendo dois mtodos que permitem que o pesquisador atinja seu objetivo, ele poder optar pelo melhor, em que melhor pode ser, por exemplo, o mais barato e/ou mais fcil de se amostrar.

QUESTO 3

Sejam = mdia da concentrao urinria de aldosterona no grupo com dieta com baixo teor de sal = mdia da concentrao urinria de aldosterona no grupo com dieta com mdio teor de sal = mdia da concentrao urinria de aldosterona no grupo com dieta com alto teor de sal Queremos testar H: = =

Para isso, vamos fazer uma anlise de varincia (ANOVA). Porm, para que possamos utilizar esse modelo, precisamos verificar se as varincias so aproximadamente iguais e se os resduos tm distribuio normal. A independncia entre as observaes tambm necessria, mas isso j supomos pelo modo como o experimento foi realizado. Para cada grupo calculamos a varincia amostral:

Podemos considerar (com um grau razovel de tolerncia) que as varincias sejam prximas entre si. Quantis empricos dos resduos studentizados x Quantis tericos (Normal (0,1))
2.50 2.00 1.50

Quantis empricos

1.00 0.50 0.00 -3 -2 -1 -0.50 -1.00 -1.50 -2.00 -2.50 0 1 2 3 Grfico QxQ

Quantis tericos

Vemos que os pontos esto todos muito prximos da reta x=y (a reta do grfico a que melhor ajusta os pontos; no x=y, mas est muito perto disso). Com isso, podemos considerar que os resduos de fato tenham distribuio normal. A hiptese H mencionada acima dever ser rejeitada se em que ( ) , em que

Seja

Como , rejeitamos H, ou seja, conclumos que h evidncias de que as mdias dos trs grupos no so todas iguais entre si. Concluses sem jargo estatstico: Foi realizado um teste estatstico para verificar se h relao entre ingesto de sal e presso arterial. Para isso, compararam-se as mdias dos nveis de aldosterona na urina em trs grupos de 15 indivduos cada. Um dos grupos teve uma dieta com baixo teor de sal, outro ingeriu nveis mdios de sal, e o ltimo recebeu nveis de sal elevados. Conclumos que h evidncias para considerar que a concentrao urinria de aldosterona diferente entre os trs grupos. Ou seja, a quantidade de sal ingerida tem efeito sobre a aldosterona. Provavelmente, portanto, os nveis de sal da dieta de um indivduo podem interferir nos nveis de sua presso.

QUESTO 4

i) Atravs das mdias de cada grupo, podemos analisar qual apresenta o menor tempo mdio (amostral) de recuperao, em dias, em todos os nveis dos tratamentos, o que pode indicar o comportamento da recuperao na populao em que foi retirada essa amostra. Dessa forma, notamos que a combinao do nvel baixa (Substncia A) com o nvel alta (Substncia B), produziu o menor tempo mdio de recuperao. Ao analisarmos os desvios padres de cada combinao, verificamos que esta mesma combinao obteve um dos menores desvios-padro, o que evidencia a preciso da mdia.

baixa baixa media 12,075 5,45

Mdias media 8,875 8,925

alta 4,575 9,125

ii) Os fatores so : Dose da substncia A, com dois nveis (baixa e mdia) e Dose da substncia B, com trs nveis (baixa, mdia e alta).

com

que so as restries de identificabilidade. independentes = efeito do nvel i do fator dose da substncia A = efeito do nvel j do fator dose da substncia B = interao do nvel i do fator dose da substncia A com o nvel j do fator dose da substncia B = tempo mdio para desaparecimento dos sintomas independentemente de fator.

iii)

Grfico de perfis mdios

Atravs do grfico dos perfis mdios, podemos notar que para o nvel mdio do fator Dose da substncia B a mdia (amostral) praticamente a mesma, independentemente do nvel do fator Dose da substncia A, o que no se observa para as outras combinaes de nveis. Como, ao mudarmos de nvel no fator Dose da substncia B, a distncia entre as mdias para os nveis do fator Dose da substncia A no se preserva, podemos concluir que h interao entre os fatores, dada a falta de paralelismo evidente. iv) Como, pela tabela de anlise de varincia obtivemos um valor-p para a interao entre os fatores muito pequeno ( ), temos que a interao significativa, no sendo correto afirmar que existe ou no diferena no tempo mdio para o desaparecimento dos sintomas entre as doses baixa e mdia da substncia, pois no se pode analisar o efeito de um fator com a presena de interao.

v)

QxQ
1.200 1.000 0.800 0.600 0.400 0.200 0.000 -0.5 0 -0.200 -0.400 -0.600 -0.800

-2.5

-2

-1.5

-1

0.5

1.5

2.5

Grfico de Disperso
16 14 12 tempo em dias 10 8 6 4 2 0 0 1 2 3 4 5 6 7

1 = Subst. A baixa / Subst. B baixa 2 = Subst. A baixa / Subst. B mdia 3 = Subst. A baixa / Subst. B alta 4 = Subst. A mdia / Subst. B baixa 5 = Subst. A mdia / Subst. B mdia 6 = Subst. A mdia / Subst. B alta

Como os resduos foram studentizados, para que pudssemos utilizar o modelo, precisaramos que os pontos se ajustassem bem reta x=y, o que no o caso, pois no s os pontos no se ajustam reta (temos uma distribuio com caudas mais pesadas que a normal), mas tambm a reta tem coeficiente angular < 1. No podemos dizer tambm que as varincias so iguais em todos os grupos pois, pela anlise do grfico de disperso, o grupo baixa/baixa tem uma varincia maior que os demais grupos, sugerindo ento heterocedasticidade. Como o estudo considerou diferentes indivduos para aplicar os tratamentos, razovel supor que a independncia entre as unidades amostrais e, por conseguinte, seus erros aleatrios vlida. ( a nica suposio do modelo que satisfeita.) Portanto as suposies no foram satisfeitas no podendo ser realizado o modelo proposto.

QUESTO 5 i) Efeitos principais e interaes com dois nveis (gerado pelo RExcel)

Como os grficos de perfis de mdia apresentam retas aproximadamente paralelas, podemos dizer que no h interao entre os fatores. Para os dois tipos de arco, dentes de posio lateral tm maior dimetro que os de posio central. Para as duas posies, dentes com arco direito tm dimetro maior que os com arco esquerdo. Atravs da interpretao dos boxplots, podemos dizer que dentes com arco direito (D) tm dimetro maior (no que se refere aos quantis) do que aqueles com arco esquerdo (E). Quanto posio, os dentes laterais (L) tm dimetro maior do que os centrais (C).

A seguir mostramos os histogramas para diferentes fatores e nveis. O primeiro histograma abaixo refere-se distribuio do dimetro para toda a amostra independentemente dos fatores e nveis. Os demais histogramas dizem respeito a cada combinao de nveis dos fatores. Podemos ver que os indivduos sujeitos a cada uma dessas

combinaes apresentam resultados distintos, o que pode sugerir distribuies diferentes.

Posio central e arco direito

Posio central e arco esquerdo

Posio lateral e arco direito

Posio lateral e arco esquerdo

Medidas-resumo: Posicao Arco C:15 D:15 Mesiodistal Min. :4.774 1st Qu.:5.178 Median :5.613 Mean :5.512 3rd Qu.:5.762 Max. :6.474 SD :0.447 Mesiodistal Min. :4.677 1st Qu.:5.053 Median :5.201 Mean :5.285 3rd Qu.:5.487 Max. :5.963 SD :0.379 Mesiodistal Min. :5.187 1st Qu.:5.769 Median :6.068 Mean :6.063 3rd Qu.:6.372 Max. :6.681 SD :0.427 Mesiodistal Min. :5.526 1st Qu.:5.786 Median :5.884 Mean :5.946 3rd Qu.:6.081 Max. :6.590 SD :0.271

Posicao Arco C:15 E:15

Posicao Arco L:15 D:15

Posicao Arco L:15 E:15

Podemos notar que as mdias so mais prximas para cada nvel do fator posio, independentemente do nvel do fator. Com exceo do ltimo subgrupo, podemos dizer que os desvios-padro so prximos. ii) Os grficos de perfis mdios do item i sugerem que no h interao devido ao aparente paralelismo dos segmentos de reta que unem as mdias, o que se confirma pelo p-valor (referente ao produto Pos*Arc) grande . iii) Modelo especificado: com

que so as restries de identificabilidade. independentes = efeito do nvel i do fator posio = efeito do nvel j do fator arco = interao do nvel i do fator posio com o nvel j do fator arco = mdia geral do dimetro mesiodistal em mm de incisivos iv)

QxQ - quantis tericos (N (0, 1)) vs quantis empricos (erros studentizados)


3 2 Quantis tericos 1 0 -2 -1 -1 -2 -3 Quantis empricos 0 1 2 3

-3

Pelos grficos acima, vemos que h evidncia de que os erros tm distribuio (aproximadamente) normal e as varincias de cada nvel de cada fator so prximas entre si. Alm disso, pela forma como o experimento foi conduzido, supomos que as observaes sejam todas independentes. Portanto, conclumos que as suposies do modelo esto satisfeitas. v) Como o p-valor relativo ao produto Pos*Arc grande, conclumos que no h interao entre a posio e o arco do dente, ou melhor, no rejeitamos a hiptese de que no h interao. Assim, podemos avaliar os efeitos de cada fator sobre o dimetro mesiodistal. Como o p-valor relativo posio muito baixo, optamos por rejeitar a hiptese de que no haja efeito da posio sobre o dimetro, ou seja, conclumos que h efeito. Em contrapartida, o pvalor referente ao fator arco moderado. Se considerarmos , por exemplo, um nvel de significncia de 0,1, optaremos por rejeitar a hiptese de que no h efeito do fator arco sobre o dimetro mesiodistal, isto , consideramos (ao nvel de significncia de 10%) que h efeito. vi) O modelo do item 3 em uma forma mais geral seria:

Como estimador da mdia geral, teramos: para os efeitos tomamos

As mdias do i-simo nvel do fator A e do j-simo nvel do fator B podem ser facilmente estabelecidas:

Ento, estimadores pontuais para

so definidos por

Sabemos que Vamos assumir as restries

equivale ao Temos, ento, que

do item iii]

E conclumos

Assim, obtemos

em que r o tamanho de cada subgrupo de cada combinao de nveis de diferentes fatores (o modelo aqui pressupe que todos os subgrupos tenham o mesmo nmero de indivduos).

Como T tem distribuio t de Student com ab(r-1) graus de liberdade, o intervalo de confiana com coeficiente de confiana para a mdia do i-simo nvel do fator A definido por

em que com Analogamente,

representa o quantil graus de liberdade.

da distribuio t-Student

com probabilidade

[Baseado no texto contido em http://www.portalaction.com.br/content/24estima%C3%A7%C3%A3o-dos-par%C3%A2metros-do-modelo] No nosso caso, temos: a=2 b=2 r = 15

Portanto, os intervalos de confiana para


] ( )

so:
( ) [

Para Para i=1: Para i=2: Para j=1: Para j=2:

, por exemplo, temos: ] ] ] ]

] ] ] ]

You might also like