SPSS o Essencial

ESTATSTICA COMPUTACIONAL USO DO SPSS (STATISTICAL PACKAGE FOR THE SOCIAL SCIENCES): O ESSENCIAL
Paulo R. Margotto www.paulomargotto.com.br pmargotto@gmail.com

Professor do Curso de Medicina da Escola Superior de Cincias da Sade (ESCS)/SES/DF I- INTRODUO II- COMO CRIAR UM COMANDO DE DADOS III- ESTATSTICAS DESCRITIVAS -tipo de variveis IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS V- ESTATSTICA ANALTICA -teste de hipteses -tamanho da amostra V-1-Teste t de Student V-2- Anlise de Varincia V-3- Qui-quadrado V-4- Risco Relativo e Odds Ratio VI- CORRELAO E REGRESO LINEAR SIMPLES VII- REGRESSO LOGSTICA BINRIA VIII-TESTES NO PARAMTRICOS -teste de Kolmogorov-Smirnov e Shapiro-Wilk para testar normalidade VIII-1-Teste Binomial VIII-2-Teste U de Mann- Whitney VIII-3-Teste T de Wilcoxon VIII-4- Teste de Kruskal-Wallis VIII-5-Teste de Friedman VIII-6-Coeficiente de correlao de Spearman VIII-7-Teste de McNemar IX-CURVA DE KAPLAN-MEIER X-CURVA ROC XI-ESTATSTICA k: XII-REFERNCIAS BIBILIOGRFICAS Braslia, 01 janeiro de 2012
ESCOLA SUPERIOR DE CINCIAS DA SADE SECRETARIA DE ESTADO DE SADE DO DISTRITO FEDERAL
ESTATSTICA COMPUTACIONAL USO DO SPSS (STATISTICAL PACKAGE FOR THE SOCIAL SCIENCES): O ESSENCIAL
(utilizamos os conceitos de Wagner MB, Motta VT e Dornelles C em SPSS-Passo a Passo, Editora da Universidade de Caxias do Sul, 2004., com exemplo na base de dados do estudo de Margotto PR e cl, ainda no publcado sobre Uso do Corticosteride Pr-natal na Maternidade do Hospital Regional da Asa Sul)
Torture os nmeros e eles admitiro qualquer coisa

Paulo R. Margotto Professor do Curso de Medicina DA Escola superior de Cincias da Sade (ESCS)/SES/DF O SPPS um programa que executa anlises estatsticas , desde as simples estatsticas descritivas (mdia, desvio-padro e tabelas de frequencias) a mtodos avanados (anlise de variancia, modelos de regresso multivaravel e outros). O programa pode gerar tabelas e grficos que resumem os dados.
I- INTRODUO
Como iniciar o SPSS Ao clicar no programa (SPSS for Windows) ser aberta a janela SPSS for Windows, contendo no centro, a Caixa de Dilogo (Fig.1)
Fig. 1-Janela SPSS for Windows com a Caixa de Dilogos

2
A partir desta caixa de dilogos, escolha o que voc deseja fazer e clicar em [OK]. -run the tutorial: iniciar o tutorial -type in data: digitar os dados, criando assim um novo arquivo de dados -run na existing query: importar dados a partir de uma base de dados -open an existing data source: abrir um arquivo de dados j existentes -open another type of file: abrir outro tipo de arquivo Com o melhor conhecimento do programa podemos usar um maior nmero de opes que esto disponveis por meio de acesso s janelas e aos menus do SPSS. Na barra de tarefas do SPSS encontram-se os seguintes menus: File: comanda todo o gerenciamento de arquivos (criar, abrir, ler, salvar e imprimir arquivos) Edit: utilizado para copiar ou colar informaes, bem como apagar as informaes das clulas; a opo option permite configurar as sadas do output (tamanho da fonte, bordas das tabelas, definio do padro dos tipos de variveis) View: possibilita a visualizao ou no de barras de ferramentas ( Toolbars) e barra de estado (Status Bar) nas janelas; ativa e desativa linhas de grade; mostra os tipos de fontes utilizadas; estabelece a apresentao de rtulos de variveis e valores (variable and value labels) Data: permite a definio de variveis, ordenar os dados segundo algum critrio escolhido, inserir ou retirar observaes ou variveis, unir arquivos (merge files), criar subgrupos para anlise (split file), selecionar casos especficos (select cases). As mudanas so temporrias, a no ser que sejam salvas Transform: cria novas variveis a partir das existentes, modifica dados e variveis por meio de clculos. As mudanas so temporrias a no ser que sejam salvas. Analyze: aqui encontramos os diversos procedimentos estatsticos realizados pelo SPSS (regresso, anlises descritivas, testes de comparao). A cada nova verso do SPSS novos testes so agregados, aumentando o alcance do SPSS. Graphs: usado para criar e modificar grficos; h vrias opes de grficos, como barra, linha, coluna, torta, histograma, disperso, etc, devendo ser escolhido aquele que melhor representa os dados e as variveis em estudo. Um duplo clique no mouse sobre o objeto abrir a janela Chart Editor, onde possvel modificar as fontes, cores, escalas e tamanho dos diversos elementos do grfico. Utilities: permite a obteno de informaes sobre as variveis e o banco de dados (opo variables) Window: mostra as janelas que esto em execuo no SPSS Help: contem uma janela de ajuda que contem informaes como usar o SPSS
Mostra denominaes
Vai at o caso
Descreve variveis
Insere casos
Insere dados
aos valores de uma

atribudas
II - COMO CRIAR UM BANCO DE DADOS

No SPSS os dados podem ser tanto digitados no teclado como lidos de um arquivo externo. O formato do SPSS *.sav.Os dados no SPSS so digitados diretamente na janela Editor de Dados (Data Editor), como numa planilha eletrnica .Assim possvel criar um arquivo no SPSS (*.sav) (Figura 2) As variveis podem ser quantitativas (altura, peso), categricas (sexo), de data 9tipo calendrio) ou alfanumricas (letra).
Fig.2. Janela Editor de Dados (Data Editor) Ao se criar um banco de dados, o primeiro passo definir as variveis, no Variable view (visualizao das variveis). Na coluna Nome ( Name), criar um nome para a varivel com o mximo de 8 caracteres. Em Type definir se numrica, especificando o nmero de casos decimais(Decimals). Se a varivel for categrica, especificar o nmero de caracteres que compem o nome de cada categoria (Width). Na coluna Label (rtulo da varivel), voc pode digitar o nome completo da varivel e ser este nome que vai aparecer na janela de output (resultados). Em Values podem ser criados rtulos para as variveis. Os valores Missing (valores omissos) podem ser representados por vazios na hora da digitao. Align determina o alinhamento da informao dentro da clula. A coluna Measure classifica a varivel em escalar, ordinal ou nominal (veja resumo na Tabela 1)).
Tabela 1. Opes nas definies das variveis (Wagner MB e cl, 2004) Lembrar que cada coluna representa uma varivel e cada linha uma observao ou um caso.
Seja o exemplo: digitar na primeira coluna o nome das variveis que esto apresentadas na Tabela 2
Sexo: (1)feminino; (2) masculino; peso em kg; altura em cm; glicemia em mg% Tabela 2.Dados de cinco sujeitos de um estudo (Wagner MB e cl, 2004
Aps digitar cada varivel, pressionar Enter e o SPSS automaticamente assume o tipo de varivel. No final, a tela Data Editor na opo Variable View, dever ficar como na Figura 3.
Figura 3. Visualizao da tela do Data Editor na opo Variable View para as variveis do Exemplo 1 (Tabela 1) A seguir, ir para o Data Editor na opo Data View para inserir os dados da Tabela 2. As informaes devem ser digitadas conforme apresentadas na Figura 4.
Fig. 4.Opo Data View da janela Data Editor com os nomes das variveis no cabealho e os dados do exemplo da Tabela 2
possvel corrigir os dados depois de inseridos na tabela, assim como apagar clulas. possvel tambm inserir novos casos: escolher Data>Insert Cases, assim como inserir novas variveis: escolher Data>Insert Variable. Dependendo do interesse do pesquisador, novas variveis podem ser criadas a partir das j existentes.Para isto, basta ir ao menu Transform e escolha o comando compute. Suponhamos que queiramos inserir presso arterial (PA)(Figura 5);
Fig. 5. Seleo do comando Compute Aps ter terminado a insero dos dados, salvar o arquivo clicando em File >Save as...Escolha o diretrio no qual o arquivo deve ficar, nomeando-o. Veja na Figura 6.
Figura 6.Caixa de dilogo Save Data As
III- ESTATSTICAS DESCRITIVAS

Os dados referem-se a variveis que por sua vez podem ser qualitativas e quantitativas. Varivel toda caracterstica ou condio que pode ser mensurada ou observada.
Varivel qualitativa: -nominal: diferentes categorias sem valores numricos. Os dados podem ser distribudos em categorias mutuamente exclusivas. Exemplo: Sexo - permite distinguir duas categorias, masculina e feminina; cor, causa de morte, grupo sangneo. -ordinal: os dados podem ser distribudos em categorias mutuamente exclusivas que tm ordenao natural. Exemplo: grau de instruo (as pessoas podem ser distribudas em categorias mutuamente exclusivas, na seguinte ordem: primrio, 2 ano e superior), aparncia, status social, estgio da doena Varivel quantitativa ou contnua: os dados so expressos por nmeros. Exemplo: idade, estatura, peso corporal. -Discretas( associao entre valores e nmeros inteiros): idade em anos completos -Contnua (pode assumir qualquer valor no subconjunto de nmeros reais): peso A Estatstica Descritiva encarrega-se do levantamento, organizao, classificao e descrio dos dados em tabelas, grficos ou outros recursos visuais, alm de parmetros representativos destes dados. Uma vez criada a base de dados, passamos agora a utilizar os procedimentos estatsticos. Nestes exerccios vamos usar o arquivo corticosteride pre-natal.sav. Na janela SPSS DATA Editor. Selecionar File>Open>Data. Aps localizar o arquivo, clicar em [Abrir]. No menu Analyze>Descriptive Statistics, encontram-se os comandos Frequencies, Descriptive, Explores e Crosstabs. III-1- Comando Frequencies Este comando serve para obter tabelas de freqncias, tanto para variveis categricas quanto quantitativas. Tambm podem ser obtidas estatsticas descritivas clssicas, como mdia, desvio-padro, mnimo, mximo e outras. No menu, escolha Analyze>Descriptive Statistics>Frequencies e teremos (Figura 7):
Fig. 7.Construo de Tabelas de Freqncias (observem a caixa de dilogo de Frequencies)

7
Na caixa de dilogo de Frequencies, selecione as variveis uso de corticide, uso do O 2 com 36 semanas de idade gestacional ps-concepo e tipo de parto e movam-nas para a caixa Variable(s), clicando no boto []. importante que a opo Dispaly frequency tables esteja marcada para a obteno da tabela de freqncias. Em seguida, pressionar [OK]. Vejam que as variveis que enviamos para a direita, desaparece na esquerda. Ao mover a varivel da esquerda para a direita, selecione-a e pressione []. Na janela Ouput Viewer vamos ter uma tabela de freqncias para as variveis selecionadas (Figura 8)
Frequencies
Frequency Table
Figura 8-Resultado da tabela de freqncias para as variveis solicitadas Observem que temos 219 recm-nascidos estudados, dos quais 52,5% das suas mes receberam corticosteride pr-natal; 9,6% apresentaram dependncia de O2 com 36 semanas de idade ps-concepo; o nascimento por cesariana ocorreu em 60,3%. Para obter as estatsticas descritivas do comando Frequencies, selecionar as variveis quantitativas peso, idade gestacional, altura e permetro ceflico de vida e mova-as para a esquerda (que a caixa Variable(s). pressionando no boto [] (Figura 9).
Fig. 9. Seleo das variveis
A seguir pressionar[Statistics]: na caixa de dilogo Frequencies: Statistics escolha Quartiles (quartis), Mean (mdia), Std Desviation (devio-padro), Minimum (mnimo), Mximum (mximo) e S.E. mean (erro-padro mdia) e pressione [Continue] para voltar a caixa de dilogo Frequencies (Figura 10).
Fig.10. Caixa de dilogo Frequencies:Statistics Pressione [OK] e na janela output viewer vamos ter:, teremos (Figura 11 ).
Figura 11.Janela de Output Viewer com os resultados do comando Frequencies para as variveis peso, idade gestacional, estatura e permetro ceflico. Observem que houve 1 caso omisso para a estatura e 1 para o permetro ceflico.. Para identificar a simetria da varivel, h as seguintes formas -relao entre mdia e desvio-padro: na imensa maioria dos casos, as variveis simtricas que seguem a distribuio normal, o desvio padro menor do que a metade da mdia (dp<mdia/2) -mdia e mediana muito prximas ou diferena no mximo de uns 20% uma em relao a outra para a varivel simtrica -Testes de normalidade: Kolmogorov-Smirnov e Shapiro-Wilk (veja adiante) O aparecimento de resultados muito pequenos ou muito grandes, o SPSS chamada notao cientfica. Por exemplo, um erro-padro da mdia ( Std. Error of Mean) apresentado como 9.729E-03, est no formato de notao cientfica: E-03 representa 10-3; assim o valor passa a ser 9,729 x103.
9
3-2- Comando Descriptive Este comando mais usado para variveis quantitativas. No menu escolha Analyze>Descriptive Statistics>Descriptives (Figura 12)
Fig.12. Passos para o Comando Descriptive Na caixa de dilogo do comando Descriptives, selecionar as variveis peso estatura e mov-las para a esquerda (caixa Variabe(s), tal como feito no comando Frequencies (Figura 13)
Figura 13. Caixa de dilogo para seleo de variveis no comando Descriptive
10
A seguir pressionar [0ptions] e selecionar as estatsticas e as opes desejadas. Neste comando j esto selecionadas previamente as estatsticas Mean (mdia), Std .Desviation (desvio padro), Minimum (mnimo) e Mximum (mximo). Este comando permite classificar os resultados segundo critrios de ordem de seleo, como ordem crescente de mdias (Ascending means) (Figura 14).
Fig.14.Estatstica do Comando Descriptive
A seguir, pressionar [Continue] e em seguida, [OK]. Os resultados vo aparecer da seguinte forma no Output viewer (Figura 15)
Fig. 15. Output viewer do comando Descriptives 3-3-Comando Explore Este comando apresenta maiores opes de estatsticas descritivas, alm de dispor de testes estatsticos para normalidade e grficos especiais. utilizado exclusivamente com variveis quantitativas e permite comparar tipo de dados entre dois ou mais grupos. Podemos obter: -medidas de tendncia central:mdia, moda, mediana -medidas de disperso: desvio-padro, varincia, amplitude e quartis -outliers: anlise de valores discrepantes -testes especficos para avaliar a normalidade (Kolmogorov-Smirnov e Shapiro-Wilk -boxplot -medidas descritivas adicionais, como assimetria, curtose e outras Como usar este comando: no menu Analyze Descriptive>Statistics>Explore
11
Exemplo: Na caixa de dilogo Explore, escolha a varivel que se pretende explorar, colocando-a na lista de variveis dependentes (Dependent List). Na varivel classificatria (Factor List) coloca-se, geralmente, uma varivel categrica. No nosso exemplo, vamos explorar a varivel idade gestacional com o uso de corticosteride pr-natal (Figura 16)
Fig.16.Caixa de dilogo para seleo de variveis no comando Explore Na opo Display, selecionar Both (ambos), para se obter tanto as medidas de sntese como os grficos. Pressionar [Statistics] para abrir a caixa Explore: Statistics e escolha as opes de medidas numricas de sntese (Fig.17).
Fig.17. Caixa de dilogo Statistics A seguir, pressione [Continue] para retornar a caixa anterior. De volta caixa Explore, clicar no boto [Plots] para abri a caixa Explore:Plots e selecionar Boxplot: Factor levels togheter (os boxplot estaro juntos no mesmo grfico), Histogram (histograma ou grfico de barras) e Normality plots with test (grficos e testes para normalidade da dependente) (Figura 18)
Fig.18.Caixa de dilogo Plots
12
Prosseguindo, pressionar o boto [Continue] para voltar caixa Explore. Nesta caixa, clicar no boto [Continue]. Os resultados da anlise surgiro na janela Output Viewer (Figuras 19). O comando Explorer produz uma tabela chamada Case Processem Somar que contm os casos vlidos e omissos includos na anlise para a varivel Apgar trs no 5 minuto estratificada por uso de corticosteride.
Fig.19. Output viewer do comando Explore Observem que a Tabela Descriptives produz para cada um dos estratos da varivel classificatria (idade gestacional) uma lista de estatsticas descritivas: mdia, intervalo de confiana de 95% para a mdia, mdia aparada em 5% (mdia recalculada excluindo os 5% mais extremos, ou seja, 2,5% inferiores e 2,5% superiores), o erro-padro da mdia, coeficientes de assimetria e de curtose, que nos possibilita avaliar como os valores se distribuem. Na Figura 20 temos a tabela Percentiis que mostra diferentes percentis para a varivel idade gestacional nos dois grupos (que usou e o que no usou corticosteride pr-natal), segundo dois mtodos distintos: weights average e Tukeys Hinges.
Fig.20. Output viewer do comando Explore
13
Tambm podemos obter o Extreme Value (valores extremos) para cada grupo (os 5 maiores e os 5 menores) A tabela Test of Normality mostra o resultado de dois testes de normalidade: KolmogorovSmirnov e o Shapiro-Wilk. Os dois testes testam a hiptese de que os dados apresentam uma distribuio normal. No caso de amostras menores (<50 casos), o teste Shapiro-Wilk mais poderoso. Um valor abaixo da significncia indica um desvio na distribuio dos dados em relao Curva Normal (de preferncia deve estar abaixo de 0,05 ou mesmo 0,01) (Figura 21)
Fig.21. Output viewer do comando Explore Observem que a varivel idade gestacional no segue uma distribuio normal (p=0.0001). Tambm podemos obter o Extreme Value (valores extremos) para cada maiores e os 5 menores). grupo (os 5
O comando Explore produz ainda uma sequncia de grficos, como o histograma (equivale representao grfica de uma tabela de freqncias) e o boxplot (caixa de bigodes). Quanto ao boxplot: a representao em forma de grficos dos quartis da distribuio; apresenta, de forma compacta, diversas informaes sobre um conjunto de dados. A caixa formada pela mediana (linha central) e pelos quartis inferior e superior (percentis 25 e 75), que so obtidos pelos mtodos Tukeys Hinges. A mediana d uma estimativa de tendncia central; a altura das caixas (percentil 75percentil 25 a amplitude interquartil (interquatile range) e estima a variabilidade dos dados. A presena ou no de simetria dada pela posio da mediana (central ou mais prxima dos quartis). As linhas verticais que saem da caixa so conhecidas como whiskers (bigodes de gato em ingls). Nas sries assimtricas, os dados mximos e mnimos distanciam-se das hinges de Tukey (percentil 75-percentil 25), sendo os seus valores assinalados separadamente no boxplot com um pequeno crculo (outlines) e os valores que se distanciam substancialmente so considerados extremos (extremes) e so assinalados com um asterisco (Figura 22).
Fig.22. Grfico Boxplot de idade gestacional e uso de corticosteride pr-natal
14
No observamos nenhum valor discrepante e extremo. Ao se detectar estes valores, podemos retornar ao Data Editor para consultar o caso assinalado. 3-4- Comando Crosstabs Este comando est relacionado diretamente com a obteno de testes estatsticos (qui-quadrado e exato de Fischer) e de medidas de fora de associao, que sero estudados mais adiante (Estatstica Analtica). Antes, vejamos a Manipulao e Criao de Novas Variveis
IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS

O SPSS disponibiliza o menu Transform para reclassificar variveis (categoria 1 e 2) e para transformar uma varivel (por exemplo comprimento em metros para cm) ou criar nova varivel a partir das existentes (por exemplo, a partir do peso, obter o ndice ponderal, que o peso/comprimento ao cubo).(Figura 23)
Fig.23. Menu Transform em detalhe
15
Compute: realiza clculos; o SPSS disponibiliza mais de 70 funes matemticas (raiz quadrada, logaritmo, coseno, etc) Recode: reclassifica variveis, tanto quantitativas como categricas Visual Bander: permite a criao de novas variveis com base no agrupamento de valores contnuos de variveis existentes em categorias distintas) Count: possibilita contar quantas vezes determinado valor aparece Rank Cases: classifica as observaes em ordem crescente ou decrescente, obtendo assim os ranks (postos) Automatic recode: transforma automaticamente valores descontnuos e afastados entre si em uma srie de valores numricos inteiros e contguos. til para transformar uma varivel alfanumrica (string) em uma varivel numrica para poder ser utilizada em anlises estatsticas que requerem categorias numricas Create time series: cria variveis novas baseado em funes de variveis numricas de sries temporais Replace missing values: permite substituir os dados omissos (missing) por valores numricos vlidos a serem usados em anlises estatsticas. Indicado quando a proporo de omissos pequena (<10%) e quando a varivel quantitativa. Randon Number Seed: gera nmeros pseudo-aleatrios, sendo possvel, assim, determinar o ponto de partida para a gerao automtica destes nmeros pelo SPSS.
COMANDO COMPUTE|: Vamos criar uma varivel a partir da existente, como: Calcular o ndice ponderal (IP= peso/altura3). -Na janela Data Editor, escolha: Transform> Compute e surgir( Figura 24):
Fig.24. Seleo do comando Compute

16
No campo Target Variable (Varivel destino), escrever o nome da varivel que ser transformada. No exemplo ser criada a varivel IP (ndice ponderal). Digitar IP no campo Target Variable; clicar a seguir na opo Type&Label e adicionar o rtulo (label) ndice ponderal. Observe que o SPSS assume tratar-se de uma varivel numrica com duas casas decimais. A seguir, desloque para o campo Numeric Expression as variveis envolvidas, usando [], adicionando as operaes matemticas necessrias.; para a exponenciao use asterisco duplo multiplicado 3 vezes por ela mesma, como na Figura 25.
Fig.25. Definio da expresso numrica da nova varivel IP
Pressione [OK] e o resultado aparece imediatamente na janela Data Editor, como mostrado na Figura 26:
Fig.26. Resultado do clculo da nova varivel IP Havendo valores omissos em peso ou em altura, o SPSS coloca um . (ponto). Output Viewer: uma vez executado um procedimento no SPSS, os resultados so apresentados no Output Viewer, que um visualizador de resultados, estando colocados na ordem
17
em que foram realizados. Voc pode copiar selecionando copy e cole onde for necessrio.
a tabela clicando o boto direito do mouse e
Voc tambm pode manipular tabelas, como por exemplo, traduz-las. Para isto, basta ativar o Pivot Table Editor, clicando o boto direito do mouse na tabela e assim, a tabela fica pronta para ser editada na prpria janela Pivot Table Editor. Possibilita tambm uma viso e edio de uma tabela larga e longa (Figura 27). Veja o exemplo a seguir:
Fig.27. Como ativar o Pivot Table Object
Uma vez pressionado Open, teremos (Figura 28)
Fig28. Tabela a ser editada no Pivot Table Como usar os Comandos Split e Select: Estes comandos permitem obter resultados das anlises divididas em categorias, como sexo masculino e feminino.
18
Comando Split -Split: vejamos a estratificao da anlise usando uma varivel categrica, por exemplo, sexo. Selecionar Data>Split>File (Figura 29).
Fig.29. Passos para o uso do Split Uma vez aberta a caixa de dilogo Split File, marcar Compare groups e colocar a varivel sexo na caixa Groups Based on e clicar [OK] (Figura 30).
Fig.30. Caixa de dilogo Split File
19
Selecionar agora Analyze>Descriptive Statistics. Descritives...Options (Mean, Std Desviation, Minimum e Maximum)....variveis peso e estatura (Figura 31). Observem que os resultados na janela Output Viewer vo aparecer agrupados pela varivel sexo.
Fig.31. Caixa de dilogo Descriptives Clicar em [OK] e no Output Viewer (Figura 32), vai aparecer
Fig.32. Resultados do comando Split File>Compare groups Se no Split File voc marcar Organize output by groups, vamos ter os resultados de um grupo e de outro grupo (Figura 33).
Fig.33. Caixa de dilogo Split Fire Veja o resultado no Output Viewer (Figura 34).
20
Fig.34. Resultados do comando Split File>Organize output by group
Para retornar condio anterior, ou seja, anlises no agrupadas, selecione Data>Split File e marcar Analyze all cases, do not reate grous e clicar [OK] (Figura 35).
Fig.35. Caixa de dilogo Split File
21
Comando Select Este comando seleciona apenas uma categoria especfica dos casos de um arquivo de dados. Escolher Data Select Cases, selecione a categoria a ser analisada, por exemplo, da varivel categrica sexo, sero selecionados somente os casos do sexo masculino (Figura 36)
Fig.36. Menu Data>Select Cases Na caixa de dilogo Select Case, marcar IF conditions is satisfied e clicar em [IF] (Figura 37).
Fig.37. Caixa de dilogo Select Cases

22
Agora, selecione a varivel sexo e usando os sinais no centro da caixa de dilogo, digite a expresso condicional, clicando no centro da caixa de dilogo (Figura 38)
Fig.38. Caixa de dilogo Select Cases: IF Clicar [Continue] e em seguida [OK]. No Data Editor, os casos sexo=2 (feminino) aparecem com um trao sobre o nmero indicador do caso na margem numerada. Estes casos sero excludos da anlise (Figura 39).
Fig.39. Janela Data Editor com os casos no selecionados assinalados (observem a seta) Ao utilizar o comando Select, o SPSS cria automaticamente uma varivel chamada filter4, na ltima coluna e aparece tambm na barra de ferramentas.
23
Para restaurar os dados do arquivo, escolher Data>Select Case... All cases e clicar [OK] (Figura 40).
Fig. 40. Caixa de dilogo Select Cases Assim, os dados originais do arquivo voltam ao estado anterior, sendo usada toda a amostra para a anlise. No fazendo isto, voc pode salvar os seus dados modificados do original. Ento, para evitar, salvar sempre para outro arquivo ou voc poder vir a perder o banco de dados original.
V-ESTATSTICA ANALTICA
A Estatstica Analtica trabalha com os dados de forma a estabelecer hipteses, procede a sua comprovao e no final, elabora concluses cientficas Teste de Hiptese e Tamanho da Amostra para melhor compreenso da significncia estatstica Teste de Hipteses Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo examinado apenas parte desta populao (amostra). Este processo chama-se de inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos. Para a compreenso de um teste estatstico preciso que entendamos o que vem a ser Hiptese Nula (H0) e Hiptese Alternativa (H1). Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo com certos critrios, ser ou no rejeitada. Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena entre os grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do fenmeno ou resultado observado. Hiptese Alternativa ou experimental (H1): aquela que afirma que h diferena entre os grupos estudados. O principal objetivo de testar uma hiptese responder seguinte questo: dadas duas amostras, so elas realmente diferentes ou pertencem a uma mesma
24
populao, ou em outras palavras, as diferenas encontradas entre duas ou mais amostras so verdadeiras ou podem ser explicadas pelo acaso. O processo de testar hiptese consiste em seis etapas: 1. 2. 3. 4. 5. Estabelecer a H1 ( se l ag 1) Estabelecer a H0 ( se l ag zero) Determinar o tamanho da amostra Colher os dados Realizar teste estatstico para verificar a probabilidade de que a H0 seja verdadeira
6. Rejeitar ou no a H0 Ao afastar a hiptese nula, estamos afirmando a validez da hiptese alternativa. Todo experimento realizado para testar uma hiptese. O pesquisador formula uma hiptese, observa, analisa e em seguida conclui. Aps observar, o pesquisador descreve e mede. Jamais atribuindo juzos de valor ao que est sendo visto, o pesquisador pode decidir erroneamente e rejeitar a hiptese nula sendo ela verdadeira (Erro tipo I). Assim, o pesquisador aceita como verdade uma diferena que na realidade no existe e que na verdade, se deve variabilidade das amostras. Quando a hiptese H 0 falsa e o pesquisador no a rejeita, dizemos que ele cometeu um Erro tipo II, significando que existia, de fato, uma diferena que no foi reconhecida. Assim:
Erro tipo I: rejeita a H0 sendo verdadeira (fato obtido por azar: rara ocorrncia estatstica): erro alfa Erro tipo II : aceita a H0 sendo falsa (erro mais freqente):erro beta
A probabilidade (p) de rejeitar a H 0 quando a H0 verdadeira, o que chamamos de nvel de significncia do teste . O estatstico no sabe quando rejeita a H0, se est ou no cometendo erro, mas sabe a probabilidade de cometer este tipo de erro. Se a probabilidade for suficientemente pequena (<= 5%), a deciso de rejeitar a H 0 est bem fundamentada. O nvel de significncia representado pela letra grega (l-se alfa). O nvel de significncia o nome com que se designa a probabilidade . Vejamos o exemplo: Feito um experimento com duas drogas (A, B), o pesquisador pergunta se a droga A cura tanto quanto a droga B. O estatstico v a pergunta do pesquisador como duas hipteses: a) H0: a proporo de pacientes curados com a droga A igual proporo de pacientes curados com a droga B b) H1: a proporo de pacientes curados com a droga A diferente da proporo de pacientes curados com a droga B.
25
Feitas as hipteses, o estatstico estabelece o nvel de significncia do teste. O nvel de significncia seria a probabilidade (p) de afirmar que uma das drogas determina maior proporo de curas, quando na verdade, a proporo de pacientes curados a mesma, seja a droga A ou B. usual manter o nvel de significncia de 1% e 5%; um de 5% (0.05) significa que cometemos um erro (tipo I) de 5% em rejeitar a H0 (sendo verdadeira) e aceitar H1 (1 em cada 20 se comete o Erro tipo I ao rejeitar a H0). Um de 1% (0,01), significa que ao rejeitar a H0 e aceitar a H1, o risco de estarmos errando, ou seja, cometendo um erro tipo I de 1%. O nvel de significncia representa a mxima probabilidade de tolerar um erro tipo I. O erro tipo I ocorre quando se acredita que existe um efeito verdadeiro na populao e de fato no h. Usando o critrio de Fisher, a probabilidade de erro 0.05 (ou 5%) quando no existe efeito na populao. Segundo Fisher devemos somente acreditar que o resultado verdadeiro quando tivermos 95% de confiana de que ele ou quando houver somente 5% de chance de que os resultados possam ocorrer ao acaso. O oposto o erro tipo II que ocorre quando acredita-se que no exista um efeito na populao, mas na realidade ele existe. O ideal que a probabilidade deste erro seja bem pequena (se existe um efeito na populao importante que possamos detect-lo). Cohen sugere que a probabilidade mxima aceitvel para um erro tipo II seria 0,2 (20%), definvel como beta (). Se tomarmos 100 amostras de dados da populao na qual um efeito existe, vamos falhar em detectar este efeito em 20 destas amostras (perderamos 1 em 5 dos efeitos verdadeiros). Portanto, para fazer um erro tipo I no deve haver efeito na populao, enquanto para fazer um erro tipo II vale o contrrio, ou seja, deve haver um efeito que perdemos. A probabilidade de cometer um erro tipo I diminui medida que a aumenta probabilidade de cometer um erro tipo II. Assim: Os erros ocorrem ao testar hipteses por diferentes motivos: Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto menores forem; numa amostra maior, estas diferenas se diluiriam). Erro tipo II: amostras pequenas grande quantidade de amostras
Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa, considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente 10 20%. Tamanho da Amostra conveniente planejar o tamanho da amostra para que se possa ter amostras grandes o suficiente para detectar diferenas importantes. Por outro lado, amostras exageradamente grande alm de elevar o custo do estudo, podem tornar diferenas irrelevantes em estatisticamente significativas. Para determinar o tamanho da amostra preciso estabelecer qual a diferena deve ser considerada significativa. Esta uma deciso arbitrria do pesquisador, baseada na experincia, na literatura e/ou na relevncia clnica. Para determinar o tamanho da amostra, deve-se considerar o nvel de significncia adequado: quanto de probabilidade aceitvel para que H0 seja verdadeira.
26
Geralmente considera-se uma probabilidade menor ou igual a 5% como adequada (p 0,05). Poder do teste: a probabilidade que um determinado teste ir encontrar um efeito assumindo que um j existia; lembrem-se que corresponde probabilidade de falha em detectar um efeito que realmente existe (erro tipo I). Assim, a probabilidade de detectar um efeito, se um existe, deve ser o oposto da probabilidade de no detectar aquele efeito, isto , 1-. Como j vimos, Cohen sugere que deveramos esperar uma probabilidade de 0.2 na falha em detectar um efeito verdadeiro e assim, o nvel corresponde do poder recomendado por ele que foi de 1.0-0.2=0.8. Portanto o objetivo alcanar um poder de 0,8 ou 80% de probabilidade de detectar um efeito se ele realmente existe. Por exemplo, um poder de 80% significa que, se de fato houver alguma diferena, haver uma probabilidade de 80% de detect-la. Uma vez conhecido o valor de alfa e beta, podemos usar pesquisas anteriores ou experimentos similares para estimar o tamanho do efeito que se espera detectar com um experimento. Assim, podemos usar esse tanto de efeito estimado para calcular quantos participantes necessitamos para detectar este efeito, com base nos valores de alfa e beta que escolhemos. Os clculos exatos so volumosos, devendo ser usados programas de computador. Entre estes, citamos o G*Power (grtis) e o nQuery Adviser (pago), o disponvel no Epiinfo e no Laboratrio der Epidemiologia e Estatstica. Utilizando o site Lee - Laboratrio de Epidemiologia e Estatstica, clicar em Pesquisa e entrar a seguinte caixa:
Clicar Clculo de tamanho de amostra
27
Prosseguindo com o exemplo, vamos clicar em Estudo de coorte (estudo de coorte: comparao entre um grupo exposto a um fator de risco e outro grupo no exposto. Visa verificar se indivduos expostos ao fator de risco desenvolvem a doena em questo, em maior ou menor proporo, do que um grupo de indivduos no expostos) e teremos:
28
Explicaes:
Proporo de casos entre os expostos: equivale proporo de pessoas expostas ao fator de risco que desenvolveram a doena
Proporo de casos entre os no expostos: equivale proporo de pessoas que no foram expostas ao fator de risco, mas que desenvolveram a doena Risco relativo: proporo de pessoas expostas ao fator de risco que desenvolveram a doena sobre a proporo de pessoas no expostas que desenvolveram a doena. Vale 1 se as pessoas expostas e no expostas desenvolveram a doena na mesma proporo. Nvel de significncia: indica a probabilidade de cometer um erro do tipo I, ou seja, rejeitar a hiptese nula quando esta for verdadeira. Em outras palavras, a chance de dizer que existe diferena entre as propores quando na realidade elas so iguais. Poder do teste: indica a probabilidade de deciso correta baseada na hiptese alternativa. Geralmente interpretado como a chance de detectar uma real diferena entre as propores, ou seja, detectar a diferena se ela realmente existir. Teste de hiptese: teste monocaudal: teste cuja hiptese alternativa uma desigualdade. Em estudos de coorte o teste monocaudal equivale ao teste em que o interesse saber se o risco relativo maior ou menor que 1, ou seja, se a proporo de doentes maior (ou menor) entre os expostos ao fator de risco. teste bicaudal: teste cujo objetivo testar apenas se as propores so iguais ou diferentes e no estabelecer qual delas maior ou menor. Em estudos de coorte o teste bicaudal equivale ao teste em que o interesse saber somente se o risco relativo diferente de 1, ou seja, se a chance de doena entre expostos e no expostos ao fator de risco a mesma ou no.
29
Para calcularmos a mostra esperando uma incidncia de 10% de hemorragia intraventricular no grupo com corticosteride e 20% no grupo sem corticosteride, fazemos:
Clicar em envia e teremos:
Portanto, em um estudo de coorte de gestantes que usaram e no usaram corticosteride no pr-natal, com um nvel de significncia de 5%, com um poder do teste de 75%, para detectar uma diferena de proporo de 10% e 20% entre os grupos,
30
expostos e no expostos a corticoterapia, POSSIVELMENTE necessitaramos de 135 mes para cada grupo, num total de 270 gestantes. No entanto, devemos ter em mente o que cita os autores do Laboratrio de Epidemiologia e Estatstica citam: importante ressaltar que os clculos feitos aqui devem servir apenas como orientao para o planejamento do estudo e no serem tomados como deciso final. Para fins prticos, segundo Cohen: participantes para detectar efeito mdio (r=0.3), so necessrios 85 e para efeito grande (r=0,5), so necessrios 28; para efeito pequeno (r-0,1), precisamos de 783. Amostras grandes: n > 100 Amostras mdias: n > 30 Amostras pequenas: n < 30 Amostras muito pequenas: n < 12 Lembrar que: quanto menor a diferena a ser detectada, maior dever ser o tamanho da amostra; quando menor o nvel de significncia (p), maior deve ser o tamanho da amostra. A etapa seguinte consiste na coleta de dados, lembrando que maus dados levam igualmente a ms concluses. Segundo Field, procedimentos estatsticos so uma forma de processar nmeros e, portanto, se voc colocar baboseiras em uma anlise, mesmo assim obter concluses com significado estatstico, mas que provavelmente no tero sentido emprico (prtico). A estatstica no uma forma milagrosa, apenas um recurso. Na determinao da verdade. Na anlise estatstica no existe um substituto para o pensamento emprico. Uma vez obtidos os dados, faz-se a anlise estatstica aplicando-se testes escolhidos em funo do tipo de dados disponveis. -
V-1-Teste t de Student
Este teste usado para avaliar a hiptese de que duas mdias so iguais ou no. O valor do t calculado (tc) tanto maior quanto maior for a diferenas entre as mdias. O nome deste teste refere-o ao pseudnimo usado por W.L. Gosset, uma vez que a companhia na qual trabalhava (Guinnes Brewing Company) no permitiu publicar sua pesquisa usando seu prprio nome e assim publicou com o nome Student. importante para a aplicao do Teste t que a varivel em estudo tenha distribuio normal ou aproximadamente normal. O SPSS pode executar trs aplicaes do teste t em mdias: para uma amostra, amostras independentes e amostras emparelhadas. -para uma amostra: o objetivo verificar se a diferena entre o valor mdio, que representamos por X obtido em uma amostra difere ou no significativamente da populao referncia. Ou seja, testar se Ho: o = X onde o a mdia da populao onde a amostra foi retirada. No se conhece o desvio padro () )da populao. No menu SPSS, abrir os comandos File>Open>Data... e na e na caixa de dilogo selecionar o arquivo corticosteride pr-natal.sav. importante verificar se a
31
distribuio dos dados segue uma distribuio normal (teste de Kolmogorov-Smirnov e Shapiro-Wilk). Na janela Data Editor, selecionar Analyze>Compare means>One Sample T-test (Figura 41).
Fig.41. Menu Analyze>Compare Mean>One-Sample T-test -selecionar altura como Test Variable(s). -Em Test Value escreva o valor de 50 cm (parmetro de referncia) (Figura 42).
Fig42. Caixa de dilogo One-Sample T-test -Clicar em [OK] e teremos na tela do Output Viewer (Figura 43). T-test
Fig.43. Resultados da janela Output Viewer

32
Interpretao: Na tabela One-Sample temos o valor do teste t (-40,627) e a significncia do teste (Sig. 0,0000 (p<0,001) que permite rejeitar a hiptese nula (H o) para o nvel de significncia de alfa<=0,05. Podemos ento dizer que a amostra de 218 recm-nascidos estudados vem de uma populao cuja mdia diferente (neste caso menor) do que 50 cm. -amostras independentes: sero comparadas duas mdias; as variveis devem ter distribuio normal. -Selecionar Analyze>Compare Means>Independent-Samples T-test (Figura 44).
Figura 44. Menu Analyze>Compare Means>Independent-Samples T-test -Selecionar Estatura como Test Variable (s) -Selecionar a varivel que vai definir o s grupos de casos (ex. sexo) como Grouping Variable (varivel de agrupamento) (Figura 45).
Fig.45. Caixa de dilogo Independent-Sample T-test -Clicar em [Define Groups] para definirmos grupos (Figura 46)
Fig.46. Caixa de dilogo Independent Sample T-test
33
-Digite os valores correspondentes usados para a varivel sexo: 1 e 2 -Clique em [Continue] (Figura 47)
Fig.47. Caixa de dilogo Independent Sample T-test -Clicar em [OK]. Na tela de sada do Output Viewer ser mostrado (Figura 48):
Group Statistics
Fig.48. Resultado do Test t para amostras independentes Na tabela Independent Samples test, temos os resultados do teste estatstico escolhido, calculado de duas formas distintas: -Equal variances assumed (assumindo igualdade de varincias) -Equal variances not assumed (assumindo que as varincias so desiguais) Para decidirmos sobre quais destes resultados vamos utilizar, o SPSS disponibiliza o teste de Levene que testa a hiptese de igualdade das varincias.
34
Se a significncia do teste for <=0.05: rejeita-se a igualdade das varincias; se a significncia do teste for >0.05, as varincias so iguais No nosso exemplo, a significncia do teste de Levene foi 0,75 e assim usamos o teste t para varincias iguais (Equal variances assumed). Neste caso, o valor do teste a ser interpretado ser t=-1,568. Como a significncia maior que 0.05, no rejeitamos a hiptese nula, ou seja, no h uma diferena estaticamente significativa entre as mdias de estatura dos RN submetidos corticoterapia pr-natal em relao aos RN no submetidos corticoterapia pr-natal. Para determinar se existe diferena entre pesos nos dois grupos, usamos o teste no paramtrico de Mann-Whitney (veja adiante), uma vez que o peso ao nascer no segue os pressupostos da distribuio normal, como determinado pelo teste de Normalidade Kolmogorov-Smirnov -Test t para amostras emparelhadas s vezes os pesquisadores estudam os efeitos de um tratamento comparando-se: -pares de indivduos (um gmeo recebe um tratamento e o outro, no). -dois lados de um mesmo indivduo (aplicao de um tratamento para a preveno de cries em um lado da arcada dentria e o outro lado sem tratamentocontrole). -mesmo indivduo duas vezes (presso arterial antes e aps o tratamento em um mesmo indivduo; diferena entre o peso mdio dos indivduos antes e depois da dieta). -diferenas entre as mdias das hemoglobinas antes e depois da cirurgia Ou seja: medidas feitas em dois pontos distintos no tempo Ao usar o SPSS, temos que ter a certeza de que os dados foram digitados no formato de duas variveis diferentes para cada caso. No nosso banco de dados no temos amostras emparelhadas, ou seja, no temos varivel de cada indivduo medida antes de depois de uma interveno. Citando o exemplo de Wagner e cl: a diferena entre as mdias de hemoglobina antes e depois da cirurgia atribuda ao acaso? Importante: como so amostras emparelhadas, necessrio que os dados sejam digitados no formato de duas variveis diferentes para cada caso, como hb1 e hb2 (pr-operatrio e ps-operatrio). -Selecione Analyze>Compare Means>Paired-Simples T-test (Figura 49)
Fig. 49: Menu Analyze>Compare Means>Paired-Simples T-test
35
-Selecione as duas variveis emparelhadas e coloquem-nas no Paired Variables(s) (Figura 50)
Fig.50. Caixa de dilogo Paired-Samples T-test Clicar [OK] a seguir A tabela do Output Viewer mostrar (Figura 51)
Fig. 51. Resultado do teste t para amostras emparelhadas A tabela Paired Samples Correlations mostra o valor do coeficiente de correlao de Pearson (vide adiante), assim como o valor da significncia para o coeficiente. Devido s duas variveis representarem o mesmo grupo medido em momentos diferentes (ou dois grupos emparelhados), o valor do coeficiente de correlao de Pearson dever ser alto e o valor de significncia dever ser inferior a 0,05. A tabela Paired Samples Test mostra diversas estatsticas, como mdia da diferena entre os pares, desvio padro, erro padro da mdia, o valor do teste t, o nmero dos graus de liberdade (df) e o valor da significncia do teste. A hiptese de que no h diferena entre as hemoglobinas no pr e ps-operatrio (H o) rejeitada, pois o teste de significncia (2-tailed) <0,05) (Figura 52) Paired Samples Test
36
Fig. 52 Resultado do teste t para amostras emparelhadas
V-2. Anlise de Varincia, Teste F ou Teste de Tukey

At o presente momento discutimos formas de comparar dois grupos de pacientes ou duas amostras. Muitas vezes torna-se necessrio comparar mdias de mais de duas populaes. Suponhamos que queiramos testar quatro drogas diferentes ao mesmo tempo (quatro diurticos diferentes A, B, C, D) e que desejamos avaliar o efeito de cada uma das drogas sobre o dbito urinrio em 16 voluntrios. Para sabermos se os grupos so significativamente diferentes uns dos outros, se algum dos diurticos testados tem um efeito diurtico importante, utilizando o teste t, podemos comparar os grupos dois a dois, por meio de 6 testes t separados, o que poder revelar uma diferena significativa entre os diurticos. Alm da perda de tempo com este procedimento, poderamos estar incorrendo num erro tipo I, pois ao aceitar 5% de erro em cada uma das 6 anlises separadas, haveria uma chance de 30% ( 6 x 5%) de encontrar, por mero acaso, uma diferena estatisticamente significativa. O uso da anlise da varincia (ANOVA: abreviao proposta por Tukey para Analysis of Variance) indicar a probabilidade de que a hiptese nula seja verdadeira, ou seja, probabilidade de que nenhuma diferena existe entre quaisquer dos grupos. Se a hiptese nula (H0) for rejeitada, ser o indcio de que h diferena de potncia em algum dos diurticos testados. Para localizar o diurtico envolvido, ser necessrio um teste ANOVA de comparao de pares. Os testes de ANOVA se apiam na hiptese de que se os grupos so semelhantes, a varincia em cada um ( dentro) dos grupos semelhante quela entre os grupos; o que estes fazem comparar a variabilidade das mdias de todas as amostras com a variabilidade dentro das amostras. Assim, o teste precisa determinar a variabilidade dentro de cada amostra, bem como a variabilidade que existe entre mdias das amostras. Ao fazermos isto, geramos uma estatstica chamada F, cuja frmula : F = estimao da varincia ENTRE os grupos estimao da varincia DENTRO dos grupos F: distribuio F de R.A Fischer; o F observado ao F crtico, rechaa a hiptese nula de que no h diferena entre as varincias. Lembrem-se sempre que:
37
H0 (hiptese nula): no h diferena entre os grupos H1 (hiptese experimental): h diferena entre os grupos
Com relao ao tipo de dados a ser introduzido no SPSS, a varivel dependente dever ser quantitativa. A varivel independente (conhecida como Factor no comando One-Way ANOVA-ANOVA com um fator: nico critrio de classificao), dever ser numrica discreta (ou seja, nmeros inteiros) na definio das categorias a serem comparadas. As amostras devem ter uma distribuio normal (gaussiana); tambm assume a igualdade de varincia entre os grupos das amostras a serem comparadas (o teste de Levene verifica a homogeneidade de varincias). Procedimento de anlise: Na janela Data Editor do SPSS, escolha: Analyze>Compare Means> One-Way ANOVA (Figura 53)
Fig. 53.Menu Analyze>Compare Means> One-Way ANOVA Na caixa de dilogo One-Way ANOVA, colocar idade gestacional como Dependente List e Apgar como Factor. A seguir, clicar em [Options] (Figura 54)
Fig.54. Caixa de dilogo One-Way ANOVA
38
Na caixa de dilogo One-Way ANOVA Options, selecionar Descriptives, Homogeneity of variances, Means plot e Exclude cases analysis by analysis e em seguida, clicar em [Continue] para voltar janela anterior e finalize clicando em [ OK] (Figura 62)
Fig.55. Caixa de dilogo One-Way ANOVA: Options Na janela Output Viewer, vai aparecer (Figura 56):
Fig. 56. Resultados do comando One-Way-ANOVA Como interpretar? Esta primeira tabela mostra resultados de estatsticas descritivas, como j vimos (nmero de observaes, mdia, desvio-padro, etc para cada grupo e para o total de observaes. A segunda tabela do Output Viewer mostra os resultados do teste de Levene (Figura 57):
Test of Homogeneity of Variances Idade Gestacional Levene Statistic 1,390 df1 8 df2 209 Sig. ,203
Fig. 57. Resultados do comando One-Way-ANOVA
39
Como o valor de sig. >0,05, aceita-se H o, que mostra a igualdade de varincias entre os 10 grupos. A ltima tabela corresponde tpica tabela de apresentao do teste de ANOVA (Figura 58).
ANOVA Idade Gestacional Sum of Squares 211,110 933,501 1144,612 df 8 209 217 Mean Square 26,389 4,467 F 5,908 Sig. ,000
Between Groups Within Groups Total
Fig.58. Resultados do comando One-Way-ANOVA Nesta tabela vemos o nome da varivel dependente (Idade Gestacional), a soma dos quadrados (Sum of Squares), quadrado mdios (Mean Square), Valor do teste de F (F), a significncia (Sig) que representa a probabilidade de afastar (F obtido superior ou igual ao F crtico) ou aceitar a Ho (F obtido inferior ao F crtico). Consulte Margotto, Entendendo Bioestatstica Bsica (www.paulomargotto.com.br em Entendendo Bioestatstica Bsica). F crtico o valor de F encontrado nas tabelas dos valores de F. A variao total dividida em dois componentes: 1-Between Groups (entre os grupos): significa variao das mdias dos quatro grupos em torno da mdia geral para 95 observaes) 2-Within groups (dentro dos grupos): representa a variao das observaes individuais em torno da mdia do respectivo grupo Valores de significncia baixos indicam diferenas entre as mdias dos grupos. Como a significncia foi 0,000 (valor de p<0,05), indica que h , pelo menos, uma diferena entre os grupos analisados. Assim, rejeitamos a hiptese nula (a variabilidade ENTRE os grupos foi suficientemente grande face variabilidade DENTRO dos grupos). Portanto, podemos dizer que a idade gestacional mdia no igual entre os 10 grupos de Apgar no 5 minuto. No grfico das mdias para os 10 grupos de Apgar no 5 minuto, o grupo 3 (menor idade gestacional) destaca-se dos demais grupos (Figura 59).
Fig.59. Grfico das mdias para os 10 grupos de Apgar no 5 minuto. O grupo 3 destaca-se dos demais. Testes de comparaes de mltiplas mdias
40
Na anlise de varincia, quando a diferena entre os grupos no significante, no necessrio nenhum outro teste mais. No entanto havendo diferena significante pelo F-teste, isto no quer dizer que todos os grupos difiram entre si. A ANOVA informa somente se h ou no diferena estatisticamente significativa entre dois ou mais grupos, mas no informa quais os grupos envolvidos . Vejam que aplicando a ANOVA no exemplo que estamos estudando, as mdias dos 10 grupos no so estatisticamente iguais. Mas qual ou quais so as mdias diferentes entre si? Para identificar os grupos, deve-se realizar uma comparao entre os pares - pair wise comparision test - que ir comparar cada grupo com cada um dos outros. Para saber onde est a diferena, so necessrios testes de comparaes mltiplas de mdias (Post Hoc). , pois comparam todos os grupos dois a dois. Um dos testes mais utilizados o Teste de Tukey. Como anteriormente, escolha na janela Data Editor do SPSS Analyze>Compare>Means>One-Way ANOVA. Na caixa de dilogo One-Way ANOVA, alm das opes que foram escolhidas no procedimento anterior, clicar n em [Post Hoc].Veja na figura 60.
Fig.60. Caixa de dilogo do comando One-Way ANOVA Na caixa de dilogo One-Way ANOVA: Pos Hoc, selecionar a opo Tukey e clicar no boto [Continue] para voltar janela e em seguida, clicar [OK] (Figura 61).
Fig.61. Caixa de dilogo do comando One-Way ANOVA: Post Hoc Multiple Comparisons
41
Alm das tabelas anteriores, surgira a tabela Post Hoc Multiple comparisons, onde se encontram as comparaes entre as mdias dos dois grupos (Figura 62).
Fig.62. Resultados do comando One-Way ANOVA
42
-As diferenas significativas so mostradas com asteriscos (*). -A coluna Sig mostra a significncia estatstica (p) para a diferena entre as mdias das amostras (significante se p<0,05). -A prxima coluna mostra os limites dos intervalos de confiana de 95% para as diferenas entre as mdias das amostras. Interpretao:Vejam que o Grupo 3 apresentou diferena significativa em relao aos grupos 4,7 9 e 10, mas no em relao aos grupos 1 e 8. Obtendo o grfico Boxplot como j vimos anteriormente (obtido com o comando Explore,) d uma melhor viso do que o Means Plot, a distribuio da idade gestacional no grupos de Apgar ao 5 minuto (Figura 63).Vejam:
Fig. 63.Grfico Boxplot de idade gestacional e Apgar no 5 Para verificar a existncia de diferenas estatisticamente significativas entre mdias de mais de duas amostras ou medidas relacionadas (trs medidas feitas nos mesmos indivduos, uma antes, uma durante e outra depois de uma determinada interveno ou tratamento (medias feitas em trs pontos distintos no tempo), usamos o teste conhecido como Anlise de Varincia para Medidas Repetidas ou ANOVA para Medidas Repetidas. No SPSS: Analyze>General Linear Model>Repeated Measures. No exemplificaremos por no dispor, no momento, de uma base de dados para esta anlise.
V-3.Qui-quadrado
A estatstica do qui-quadrado (Chi-square) adequada para variveis qualitativas, com duas ou mais categorias, ou seja dados nominais (aqueles distribudos em categorias nominais sem qualquer ordem, como sexo, raa, via de
43
parto,cor dos cabelos). A prova do qui-quadrado (X2) utilizada para comprovar se existem diferenas estatisticamente significativas entre duas distribuies: mede o grau de discrepncia entre um conjunto de freqncias observadas e um conjunto de freqncias esperadas; o seu valor ser zero quando no houver diferena entre os nmeros observados e os esperados. O qui-quadrado quantifica a associao entre variveis qualitativas, comparando as diferenas entre os valores observados e os esperados. Quanto maior for o valor da estatstica X2, maior ser o grau de associao existente entre as duas variveis. O qui-quadrado tambm pode ser usado para variveis quantitativas, uma vez que possvel criar categorias para estas variveis, como, durao da internao, categorizadas nas classes at 2 dias e mais de 2 dias. Na aplicao do qui-quadrado, as freqncias tericas para cada casinha devem ser iguais ou superiores a 5. Os principais testes so o Teste Qui-quadrado para uma amostra e o Quiquadrado de independncia. Todas as frequncias esperadas devem ser maiores que 1 e no mximo 20% das frequncias esperadas podem ser menores que 5.A amostra total deve ser maior que 20. Teste Qui-quadrado para uma amostra Nesta amostra que estamos trabalhando (uso de corticosteride pr-natal na Maternidade do Hospital Regional da Asa Sul), as mes so igualmente distribudas quanto ao tipo de parto, hipertenso, sexo e gemelaridade? Para isto fazemos: Analyze >Nonparametric Test>Legacy dialogs>Chi-Square (figura 64)(SPSS-18)
Fig.64. Analyze >Nonparametric Test>Legacy dialogs>Chi-Square Em Test Variable List, selecione as variveis em estudo. Em Expexted Values marque All categories equal (figura 65)
Fig.65. Chi-Square test
44
Clicar em OK e a sada do SPSS mostrar (figura 66)
Fig. 66. Sada do SPSS Podemos observa em Test Statistics que as propores de mes no so iguais quanto ao tipo de parto (p<0,002) e gemelaridade (p<0,001). No entanto, so iguais para hipertenso materna e sexo dos recm-nascidos. Observem que para cada categoria da varivel, o nmero de casos observados (Observed N), o nmero de casos esperados se as propores fossem iguais (Expected N) e a diferena entre eles (Resdual).Observem tambm que teste qui-quadrado compara as freqncias observadas com as frequncias esperadas, considerando que a hiptese nula seja verdadeira.
45
Teste Qui-quadrado de independncia Este verifica a existncia de associao estatisticamente significante entre duas variveis categricas, medidas em escala nominal ou ordinal. No havendo associao,dizemos que as variveis so independentes. Como obter o qui-quadrado no SPSS: Analyze> Descritives> Crosstabs (Figura 67)
Fig.67. Menu Analyze> Descritives> Crosstabs Na caixa de dilogo Crosstabs, selecionar uso sexo nas Row (s) (linhas) e uso de corticosteride nas Column(s) (colunas) (Figura 65)
Fig.68. Caixa de dilogo do Crosstabs
Clicar em Cells e selecionar em Counts: Observed e em Percentages: Row (Figura 69)
46
Fig.69.Caixa de dilogo Crosstabs: Cell Display Clicar [Continue] Selecionar [Statistics] e selecionar Chi-Square, pressionar [Continue] (Figura 70)
Fig.70. Caixa de dilogo do Crosstabs:Statistics
Clicar [OK] No Output Viewer sero mostradas a seguintes tabelas (Figura 71).
47
Fig.71. Resultados do teste do qui-quadrado utilizando o Crosstabs para o uso de corticosteride pr-natal e sexo. Entendendo melhor o resultado do Qui-quadrado -Pearson Chi-Square: o valor calculado do teste (value=,0191), os graus de liberdade (df=1) e a significncia ou valor-p (0,662). Este o resultado que normalmente se utiliza ao realizar o teste do qui-quadrado. -Continuity corection: uma correo no valor do qui-quadrado, utilizado no caso de amostras pequenas (uma das clulas da tabela com n<5 ou n<20); tem o objetivo de superestimar a significncia do teste. usado somente nas tabela 2 x 2 -Likehood ratio: constitui um teste alternativo ao qui-quadrado na verificao da associao entre duas variveis medidas em escala nominal.Quando as amostras so grandes,o seu resultado prximo ao qui-quadrado. -Fishers Exact Test: o teste exato deFisher usado quando a amostra muito pequena para permitir a utilizado do qui-quadrado (quando alguma freqncia esperada<1 ou mais de 20% das frequncias esperadas <5 ou amostra total<20) -Linear by-Linear Association: um teste para a verificao da existncia de relao linear entre duas variveis medidas em escala ordinal. No apropriado para variveis que foram medidas em escala nominal. Podemos observar que no existe relao entre o uso de corticosteride no prnatal e sexo dos recm-nascidos, pois o valor do X2 pequeno (veja que o valor de p -asymp.sig- maior que 0,05). Assim, so variveis independentes.
48
V-4- Risco Relativo e Odds Ratio

O Risco Relativo (RR) e Odds Ratio (OD) so medidas de fora de associao (medidas de efeito), ou seja, medem a associao da varivel de desfecho com a varivel de exposio: quanto da probabilidade de ocorrncia da varivel dependente deve-se sua relao com a varivel independente. Os termos associao e efeito referem-se ao fato de que uma varivel teria uma relao ou exerceria um efeito sobre outra varivel. Como os resultados so decorrentes de uma razo, o valor de nulidade para esses de 1 (um). Selecionar Analyze>Descriptives Statistics>Crosstabs Na caixa de dilogo do Crosstabs, selecionar PNIU (pneumonia) nas Column(s) (coluna (s), e uso do corticosteride pr-natal nas Row (s) (linhas). Clicar em [Cells] e selecionar Counts: Observed e Percentages: Row (Figura 72)
Fig.72. Caixa de dilogo Crosstabs: Statistics
Clicar [Continue]
Na caixa de dilogo Crosstabs, pressionar [Statistics]. Na caixa Crosstabs: Statistics assinalar Chi-Square e Risk. Pressionar [Continue] (Figura 70)
49
Fig.73. Caixa de dilogo Crosstabs:Statistics Clicar [OK] No Output viewer teremos as tabelas. (Figura 74)
Fig.74.Resultados do X2
50
Interpretao: observamos que a pneumonia ocorreu significativamente menos nos RN cujas mes receberam corticosteride pr-natal (OR: 0,31, com intervalo de confiana de 0,12-0,77)ou seja, houve diminuio da pneumonia intra-uterina em 69% (1-0,31=0,69 x 100= 69%) nos RN expostos ao corticosteride pr-natal em relao aos RN no expostos e a estimativa da variabilidade foi de 23% a 88% (1-0,77=0,23 x 100=23% e 1-0,12=0,88 x 100= 88%). Esta associao significativa por no conter a unidade no intervalo de confiana. Observe da significncia no Pearson Chi-Square em Asymp.Sig (2-sided) que foi de 0,009 O Risco Relativo (RR) a medida da fora da associao entre a exposio e o evento (resultado). A razo das chances (odds ratio - OR) definida como a probabilidade de que um evento ocorra dividido pela probabilidade de que ele no ocorra, ou seja o quociente entre a quantidade de eventos e a quantidade livre de eventos (o mesmo modo que o RR avalia-se a variabilidade amostral da OR atravs do clculo do intervalo de confiana e a interpretao a mesma do RR, ou seja, se o intervalo de confiana da OR contiver a unidade, significa ausncia de associao). A OR pode ser estimada em estudo tipo coorte (populao seguida da causa para o efeito) e em estudo tipo caso- controle (populao seguida do efeito para causa). J o RR s pode estimado em estudos tipo coorte e no em estudos tipo caso-controle, porque este tipo de estudo no permite estimativa da taxa populacional do evento nos grupos estudados. Quando o RR ou a OR igual a 1, significa que no h efeito com o tratamento, ou seja, o efeito do tratamento o mesmo nos dois grupos. Se o RR/OR < 1, significa que o risco do evento menor no grupo tratado que no controle. A variabilidade amostral do estudo pode ser avaliada atravs de testes de significncia ou via intervalo de confiana. Aqui daremos preferncia segunda abordagem. Para um dado nvel de significncia (p<= 0,05), o intervalo de confiana representa o intervalo onde deve estar o parmetro, ou seja, o risco relativo verdadeiro. Se o valor 1, que se refere nulidade da associao, no estiver contido no intervalo, temos uma confiana que na populao de onde nossa amostra foi extrada, o RR diferente de 1, sendo, portanto significativo o achado da amostra. Para a realizao dos clculos do risco relativo e o intervalo de 95% de confiana, assim como o seu significado, consulte www.paulomargotto.com.br, em Entendendo Bioestatstica e Exerccio da Medicina Baseado em Evidncias. O intervalo de confiana mostra o limite dentro do qual existe a certeza do verdadeiro efeito do tratamento; estima a magnitude da associao e informa a variabilidade da estimativa, atravs dos limites inferior e superior. A seguir, planilhas para o clculo do Risco Relativo, Odds Ratio e Teste Diagnstico( Braile DM e Godoy MF). Clicar duas vezes nas figuras e elas transformam-se em planilhas! Vejamos um exemplo: Uso de drogas na Sala de Parto e Uso do corticosteride pr-natal
51
Clculos estatsticos bsicos relacionados ao Risco Relativo

( Braile, DM & Godoy, MF) ** verso 1999 **
EVE NTO
Gr.Estudo Gr.Controle
Ateno:
Digitar apenas nas caselas verdes
Todos os clculos so feitos automaticamente
sim 150 130

280
no 122 180
302
272 310 582
IC 95%
Taxa de eventos no G. Estudo (EER) = a/(a+b) Taxa de eventos no Gr.Controle (CER) = c/(c+d) Risco relativo (RR)=EER / CER Reduo do risco relativo (RRR) = (CER-EER)/CER Reduo do risco absoluto (ARR) =CER-EER Nmero Necessrio p/tratamento(NNT)=(100/ARR)
55,1 % 41,9 % 1,32 0,32 13,2 % 8
49,2 36,4 1,11 0,56 21,3 19
61,1 47,4 1,56 0,11 5,1 5
Observao: Valores em Vermelho so valores negativos

Clculo de ODDS RATIO e Intervalo de Confiana 95% (DPP Braile Biomdica)
Evento Presente Ausente TOTAL Estudo 30 40 70

Digite APENAS nas caselas de cor laranja e NUNCA nas caselas azuis. Grupo Controle 50 40 90
TOTAL
ODDS RATIO= IC 95% = 0,60 0,32
80
80
160
1,13
Utilize apenas as caselas de cor laranja para digitar os dados.
Juntamente com o resultado da odds ratio temos o intervalo de confiana. Interpretao: houve diminuio do uso de drogas na sala de parto em 48% (10,52=0,48 x 100) no grupo do corticosteride, porm no foi significativo, pois no intervalo de confiana contem a unidade. Voc pode tambm usar este site para realizar clculos estatsticos em Testes Diagnsticos, obtendo a sensibilidade, especificidade, valor preditivo positivo e o valor preditivo negativo, alm de poder obter a Estatstica Kappa, descrita por Cohen, o chamado ndice Kappa para avaliar o grau de acerto do procedimento, ou seja, para avaliar o quanto o resultado do procedimento escapa do azar. Temos usado a seguinte escala de interpretao: 0,75 - 1: muito bom; 0,4< 0,74: regular a bom; 0,35: ruim (o diagnstico no explicado pelo procedimento e sim pelo azar em 95% das vezes). .Outros usam:
52
(<0,20=pobre;0,21-0,40=fraca;0,41-0,60=moderada; 0,61-0,80=boa;>0,80=muito boa)
Clculos estatsticos bsicos para Testes Diagnsticos (verso 1999)

( Braile, DM & Godoy, MF)
Padro Ouro
+
Ateno:
Digitar apenas nas caselas verdes Todos os clculos so feitos automaticamente
Teste diagnstico
21 30 51 51 74 125
+ -
30 44 74
IC 95%
% Sensibilidade = a/(a+c) % Especificidade = d/(b+d) % Probabilidade pr-teste = (a+c)/(a+b+c+d) % Valor preditivo positivo = a/(a+b) % Valor preditivo negativo =d/(c+d) % Acurcia = (a+d)/(a+b+c+d) ODDS pr-teste= prob prteste/(1-prob prteste) Likelihood ratio para teste posit=sensib/(100-especif) Likelihood ratio para teste negat=(100-sensib)/especif Estatstica Kappa (grau de concordncia corrigido)
(<0,20=pobre;0,21-0,40=fraca;0,41-0,60=moderada; 0,61-0,80=boa;>0,80=muito boa)
40,5 58,8 59,2 58,8 40,5 48,0 1,451 1,0 1,0 -0,01
% % % % % %
29,4 45,3 50,6 45,3 29,4 39,2
51,7 72,3 67,8 72,3 51,7 56,8
-0,18
0,16
importante conhecer o intervalo de confiana a 95% do ndice Kappa para dar-lhe mais peso ao resultado achado. A significncia dar-se- pela ausncia da unidade no intervalo de confiana. No item XI, discutimos a realizao da Estatstica k no SPSS na avaliao intra e entreobservadores.
VI-CORRELAO E REGRESSO LINEAR SIMPLES

O termo correlao descreve a associao entre duas variveis numricas (quantitativas); quantifica a fora da associao entre estas duas variveis. Uma correlao expressa uma medida do relacionamento linear entre variveis. No exemplo, peso e altura, em quanto aumenta o peso medida que a estatura aumenta? O comportamento conjunto de duas variveis quantitativas pode ser observado atravs de um grfico denominado Diagrama de Disperso e medido atravs do Coeficiente de correlao. Diagrama de Disperso: Na representao grfica, importante sempre colocar no eixo das abscissas (horizontal) a varivel independente ou explanatria ou preditora (X) e no eixo das ordenadas (vertical), a varivel dependente ou desfecho. A correlao quantifica quo bem X e Y variam em conjunto Correlao linear de Pearson O coeficiente de correlao (r de Pearson) expressa quantitativamente as relaes entre duas variveis. um nmero puro, usado para classificar a correlao em: r = 1: perfeita; r = 0,80 - <1: muito alta; r = 0.60 - <0,80: alta; r = 0.40 - <60:
53
moderada; r = 0,20 - <0.40: baixa; r = 0 - <0.20 muito baixa; r = 0: nula forte. O coeficiente de correlao um ndice de magnitude na qual se associam duas variveis. Antes de se realizar uma anlise de correlao, devemos fazer um grfico de disperso (Scatterplot) para a verificao do comportamento das variveis. No menu Graphs, selecionar Scatter (Figura 75).
Fig.75. Menu Graphs>Scatter
Na caixa de dilogo com representaes grficas para Scatterplot, escolher Simple (Figura 76).
Fig.76 Caixa de dilogo Scatterplot Na janela Simple Scatterplot, colocar no Y Axis (eixo Y) a varivel peso e no X Axis (eixo X) a varivel altura e clicar [OK] (Figura 77).
54
Fig.77. Caixa de dilogo Simple Scatterplot Na janela Output Viewer vai aparecer a seguinte figura (Figura 78)
Fig.78. Resultado do Scatterplot para as variveis peso e estatura
55
Dando um clik duplo com o mouse sobre o grfico, ser aberta a janela Chart Editor, podendo assim ser editado o grfico. Selecionar Elements e Ft Line at total (Figura 79).
Fig.79. Janela Chart Editor Assim ser possvel a colocao da reta de regresso representando a associao linear entre as duas variveis(Figura 80).
Reta de Regresso
r2
Fig.80. Scatterplot com a reta de regresso, representando a associao linear entre as duas variveis
56
Observem que no canto direto do grfico aparece o R sq Linear, representa o coeficiente de Pearson ao quadrado (r2) (veja mais adiante)
que
Aps a avaliao do Scatterplot, solicita-se a anlise de correlao propriamente dita: Analyze>Correlate>Bivariate e ser aberta a caixa de dilogo Bivariate Correlations (Figura 81).
Fig.81. Menu Analyze>Correlate>Bivariate
Selecionar peso e estatura e transferir para a caixa V ariables. As opes Pearson e Two-tailed so selecionadas como padro (Figura 82)
Fig.82.Caixa de dilogo Bivariate Correlations onde se obtm o coeficiente de correlao de Pearson A seguir, clicar [OK]. Na janela do Output Viewer ser apresentada uma matriz simtrica com o coeficiente de correlao de Pearson, alm do valor da significncia e o nmero de casos vlidos (Correlations) (Figura 83)
57
Fig. 83.Resultado do clculo do coeficiente de correlao linear de Pearson com a sua significncia Assim, vemos que h uma correlao significativa (veja o Sig. (2-tailed:<0.05) entre estatura e peso 0,44. Correlao Parcial A correlao parcial consiste na relao existente entre duas variveis, eliminando a influncia de outras. No exemplo anterior, vamos controlar a idade gestacional. Analyze>Correlate>Partial (Figura 84)
Fig.84.Menu Analyze>Corelate>Partial Na caixa de dilogo Partial Correlations, escolhemos controlar (Controlling for) a idade gestacional. Clicar em [OK] (Figura 84).
58
Fig.84. Caixa de dilogo Partial Correlations A janela do Output Viewer mostrar (Figura 85):
Fig.85. Output da anlise de Partial Correlations Podemos ver que a correlao entre a estatura e o peso continua significativa (p<0,001) e a correlao de 0,39. O r 2 (coeficiente de determinao) de 0,15 (a estatura explica a variabilidade do peso do RN em 15%, quando controlamos a idade gestacional). Regresso linear simples Como vimos, a correlao indica o grau de associao entre duas variveis, ao passo que a regresso diz respeito capacidade de prever um valor baseado no conhecimento do outro (de prever Y dado que X seja conhecido). A regresso tem como objetivo quantificar o efeito do X sobre o Y. A essncia da anlise de regresso a previso de algum tipo de sada (resultado) a partir de uma (regresso simples) ou mais variveis previsoras (regresso mltipla). O conceito de regresso deve-se a Galton e consiste em aproximar uma linha reta (reta de regresso) de uma nuvem de pontos de um diagrama de disperso, ou seja, representa mediante uma reta a nuvem de pontos. O mtodo dos mnimos quadrados uma forma de encontrar a linha que melhor se ajusta aos dados (linha que passe entre ou o mais prximo possvel do maior nmero de pontos de dados). Esta linha de melhor ajuste ou aderncia chamada de linha de regresso. O conceito de linearidade refere-se ao fato de que a relao entre duas variveis possa ser representada mediante uma funo linear, ou seja, o incremento de uma varivel produz o mesmo na outra varivel, de forma linear e constante
59
Como j citamos, quando a anlise de regresso linear envolve somente uma varivel explanatria (X), a tcnica denominada Regresso Linear Simples. Quando so envolvidas duas ou mais variveis explicativas, emprega-se a expresso Regresso Linear Mltipla. A seguir vamos realizar uma regresso simples com peso como varivel dependente e a estatura como varivel independente (a que explica). Analyze>Regression>Linear. Vai aparecer a caixa de dilogo de regresso linear. Escolha o peso como varivel dependente e a estatura como varivel independente (Figura 86).
Fig.86. Caixa de dilogo Linear Regression Clicar em [Statistics] e selecionar Estimates, Model Fit, R squared chance e Descriptives (Figura 87).
Fig.87. Caixa de dilogo Linear Regression: Statistics Clicar [Continue] e em seguida, [OK]. Na janela do Output Viewer ser mostrado (Figura 88).
60
Fig.88.Output viewer da anlise de regresso linear simples Como j descrevemos existe uma correlao entre peso e estatura (r=0.44), ou seja certa proporo da variabilidade do peso pode ser explicada pelo estatura. No havendo correlao entre duas variveis, dizemos que elas so variveis independentes. Na tabela Model Summary, vemos o r Squared (r2) igual a 0,193. O r2 conhecido como coeficiente de determinao (deve ser interpretado como a proporo da variao total que explicada) e estima que 19,3% (0,19) da variabilidade do peso explicada pela estatura (tal como mostramos o grfico com a reta de regresso obtida no Chart Editor, selecionando Elements e Ft Line at total(consulte a Figura 77). J o Coeficiente de Alienao calculado 1- r2, sendo interpretado como a proporo da variabilidade de Y que no explicada pela variabilidade de X. No presente exemplo, 80,7% do peso no explicada pela estatura do recm-nascido. Observando a tabela ANOVA vemos a significncia da razo F (p<0.0001), indicando que o modelo de regresso (estatura) prev o peso bastante bem. No entanto a ANOVA no informa a contribuio individual das variveis no modelo (neste caso,
61
como s h uma varivel no modelo, podemos inferior que esta varivel um bom previsor). Vamos agora interpretar a tabela Coeficients (os parmetros bo e b1 so conhecidos como coeficientes de regresso): na equao de regresso bo representa o intercepto y, ou seja, ponto onde a linha corta o eixo Y (Consulte Margotto PR:Correlao em Entendendo Bioestatstica Bsica www.paulomargotto.com.br ) e este o valor B na tabela. Podemos tambm ver o valor b1 da tabela e este valor representa o gradiente (inclinao) da linha de regresso. O seu valor 38,572. Este valor representa a mudana da varivel de sada para cada alterao de uma unidade no previsor. Assim, se a varivel previsora (estatura) aumentada em uma unidade , o modelo prev um aumento de 38,572g no peso. Para que a varivel previsora tenha um impacto significativo na habilidade de prever o resultado, este b deve ser diferente de zero e grande,quando comparado ao erro padro. Para estes dois valores, as probabilidade (teste t) so de 0,000 e assim podemos afirmar que a estatura tem uma contribuio significativa (p<0.001) para prever o peso ao nascer. Portanto, a Equao da reta fica: Peso ao nascer = bo (-251,117) +b1(38,572) x Estatura ao nascer Exemplo:RN com estatura de 38,52cm,a previso do peso :1235g REGRESSO MLTIPLA Havendo vrios previsores, estaremos realizando uma Regresso Mltipla (esta uma extenso lgica dos princpios da regresso linear simples quando h vrios previsores). Os princpios bsicos so os mesmos da regresso simples, isto , procurase encontrar uma combinao linear de previsores que se correlacionam de forma mxima com a varivel de sada. Para maiores informaes, sugiro consultar Andy Field-Descobrindo a Estatstica usando o SPSS, 2009. J a Regresso Logstica, que veremos a seguir, uma regresso mltipla, mas com uma varivel de sada categrica dicotmica (dependente) e variveis previsoras (explicativas ou independentes) contnuas ou categricas. Assim podemos prever a qual de duas categorias provvel que esta varivel pertena, dada certas informaes. Quando a varivel de sada dicotmica (como sim/no), no podemos usar a regresso linear a despeito da semelhana entre a regresso linear e a logstica. Para uma regresso linear ser vlida, os dados observados devem ter uma relacionamento linear. Quando a varivel de sada dicotmica, esta hiptese normalmente violada. Atravs de uma transformao logartmica voc pode contornar este problema, mantendo a forma do relacionamento linear enquanto o prprio relacionamento em si no linear.
VII - REGRESO LOGSTICA BINRIA: Noes bsicas

A regresso logstica vem sendo utilizada em diversas reas. Este mtodo, tal como as regresses linear e mltipla, estuda a relao entre uma varivel resposta e uma ou mais variveis independentes. A diferena entre estas tcnicas de regresso se deve ao fato de que na regresso logstica as variveis dependentes esto dispostas em categorias (sim/no/alto/baixo/bom/ruim), enquanto na regresso linear estas variveis so contnuas. A resposta na regresso logstica expressa por meio de uma probabilidade de ocorrncia, enquanto na regresso simples, obtm-se um valor numrico. Portanto, a regresso logstica apresenta-se como um mtodo na determinao da probabilidade de ocorrncia dos valores preditos de uma varivel dicotmica. Na regresso logstica as variveis independentes podem ser tanto fatores
62
quanto covariantes (dados contnuos) e as variveis dependentes podero estar dispostas em duas ou mais categorias. Assim, temos a Regresso Logstica Binria (duas Categorias), Ordinria e Nominal. A escolha de qual mtodo a ser utilizado depende do nmero de categorias e das caractersticas da varivel resposta. Veja a tabela 3, a seguir:
Tabela 3: Tipos de varivel resposta (Penha RN, 2002)
Uma varivel binria aquela que aceita apenas dois nveis de resposta, como sim ou no. J uma varivel ordinria segue uma ordenao natural das coisas, como pequeno, mdio e grande ou classificao como ruim, bom ou excelente. A varivel nominal tem mais de trs nveis sem nenhuma ordenao (objeto azul, preto, amarelo e vermelho ou na previso do tempo, ensolarado, nublado, chuvoso). Em resumo, a regresso logstica uma regresso mltipla, mas com uma varivel de sada categrica dicotmica e variveis previsoras contnuas ou categricas. No exemplo a seguir vamos realizar uma Regresso Logstica Binria utilizando o SPSS. No exemplo, a varivel resposta ser a ocorrncia de Apgar<= 3 no 5 minuto (sim ou no), caracterizando uma varivel binria. As variveis independentes escolhidas foram aquelas que se associaram individualmente ao Apgar <=3 no 5 minuto: corticide, hipertenso materna, tipo de parto e pr-natal. Analyze>Regression>Binary Logistic (Figura 89)
Fig.89. Menu Analyze>Regression>Binary Logistic Na caixa de dilogo Logistic Regression, selecionamos apgar5minmenor3 (Apgar <=3: sim e >3: no no 5 minuto) como varivel dependente (binria),que varivel de sada e corticosteride pr-natal (cortico), hipertenso, parto e pr-natal em Covariates (covariveis), que sero as variveis previsoras. Clicar em Options e selecionar Cl for exp(B(Figura 90).
63
Fig. 90. Caixa de dilogo principal da regresso logstica Como na regresso mltipla, existem vrios mtodos diferentes que podem ser utilizados na regresso logstica. Selecionar o mtodo clicando na seta que aponta para baixo prximo ao quadro denominado em [Method]. O mtodo padro de conduzir esta regresso o enter, o mesmo da entrada forada da regresso mltipla em que todas as covariveis so colocadas no mesmo modelo de regresso em um nico bloco e as estimativas dos parmetros so calculadas para cada bloco. Sendo assim, optamos por Enter (Figura 91).
Fig.91. Mtodos de regresso Neste nosso exemplo, existem 3 variveis independentes (previsoras) categricas que so o parto (cesrea ou normal), hipertenso (sim ou no) e corticosteride (sim ou no). Uma das qualidades da regresso logstica que ela aceita previsores categricos. Assim, necessrio indicar ao SPSS quais variveis so categricas, clicando em [Categorical] na caixa de dilogo da regresso logstica para ativar uma nova caixa de dilogo Define Categorical Variables e envie para a direita a varivel categrica cortico, como est na Figura 92.A seguir pressione [Continue].
64
Fig.92. Definindo as variveis categricas na regresso logstica Retornando a Caixa de dilogo principal da regresso logstica, pressionar [Save] e selecionar toas as opes disponveis, como mostra a Figura 93. O exame dos resduos extremamente importante para verificar a qualidade do ajuste do modelo aos dados observados.
Fig 93. Caixa de dilogo para a determinao de resduos de regresso. A seguir, na caixa de dilogo principal da regresso logstica, clicar em [Options]. (Figura 94). Em geral as opes padres so suficientes. Nesta caixa de dilogo voc pode solicitar ao SPSS que apresente um intervalo de confiana para a estatstica exp b. Voc tambm pode solicitar a estatstica de aderncia de HosmerLemeshow que pode ser utilizada para avaliar quo bem o modelo escolhido se ajusta aos dados, comparando as freqncias observadas e as esperadas. Pressionar [ Continue] para retornar a caixa de dilogo principal da regresso logstica.
65
Fig. 94. Caixa de dilogo para as opes da regresso logstica Pressionar [Continue] para retornar a caixa de dilogo principal da regresso logstica e seguir, clicar em [OK]) e o Output Viewer mostrar (Figuras 95). -codificao da varivel dependente codificao das variveis previsoras
Fig.95. Output viewer da regresso logstica A ltima linha desta tabela apresenta a estatstica qui-quadrado dos resduos como 14,019 que significante (p<0,05) ( chamada de Overal Statistics-estatstica global). Esta estatstica informa que os coeficientes para as variveis que no esto no modelo so significativamente diferentes de zero, ou seja, que a adio de uma ou mais destas variveis ao modelo ir afetar significativamente o seu modelo de previso; se o p fosse >0.05, isto significaria que nenhuma das variveis excludas do modelo contribuiria de forma significativa para o poder preditivo do modelo e assim, a anlise terminaria neste estgio.
66
A coluna Score mostra o valor da estatstica do escore eficiente de Roa. Observem que a hipertenso, seguida pelo corticosteride e o tipo de parto apresentam maior escore eficiente de Roa significativos. Estimativa dos coeficientes dos previsores includos no modelo: fornece os coeficientes e estatsticas para as variveis que foram includas no modelo (figura 96):
Fig.96.Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
Uma estatstica importante a estatstica de Wald que tem uma distribuio quiquadrado e nos informa se o coeficiente b para um dado previsor difere significativamente de zero. Se isto ocorrer, podemos dizer que o previsor est contribuindo de modo significativo para a previso da sada. Assim , com relao a estes dados, podemos dizer que o uso do corticosteride pr-natal um previsor significativo para a no ocorrncia de Apgar <= 3 e que a hipertenso materna representa um fator de risco. A exp b(Exp (b) interpretada como uma mudana nas chances: se o valor for maior que 1, ele indica que medida que o previsor aumenta, aumentam as chances de uma sada ocorrer; j um valor menor que 1, indica que medida que o previsor aumenta, as chances de uma sada ocorrer diminuem. Neste exemplo, podemos afirmar que as chances do RN cuja me recebeu esteride pr-natal de apresentar um Apgar < =3 reduziu em 57,3% (Exp (B) de 0,427: 1- 0,427=0,573 x 100= 57,3%) em relao ao RN no exposto ao esteride pr-natal. J a hipertenso materna constituiu um fator de risco, aumentando em 2,3 vezes mais o risco de do RN cuja me teve hipertenso de apresentar um Apgar <= 3 em relao ao RN cuja me no teve hipertenso. Observe que no intervalo de confiana de ambas variveis previsora includas no modelo NO contm a unidade). Vejamos a interpretao de outro exemplo: Regresso logstica para a Sepse. As variveis individualmente associadas significativamente com a sepse ( corticoide, Apgar no 1 minuto, Apgar no 5 minuto, reanimao, uso do CFR, necessidade de intubao, uso de drogas para a reanimao, Apgar <=3 no 5 minuto ) entraram no modelo de regresso logstica. Aps realizar os passos anteriormente explicados, obtemos as estimativas dos coeficientes dos previsores includos no modelo (Figura 97)
Fig.97. Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
Como interpretar: A regresso logstica binria apresenta-se um mtodo para determinar a probabilidade de ocorrncia dos valores preditos de uma varivel
67
dicotmica. A apresentao tem como componentes chaves o P-value, o valor dos coeficientes e as odds ratio (Exp (B). A interpretao dos resultados est focalizada nestes componentes. Assim, vejam que as duas variveis que permaneceram no modelo foram o corticosteride pr-natal (Exp(B) de 0,545 (Odds ratio ajustada), que traduz uma diminuio da sepse nos RN expostos ao esteride pr-natal de 46% (1-0,545=0,46 x100=46%) e a Intubao que constituiu um fator de risco (aumento de 2,78 vezes a sepse nos RN intubados em relao aos no intubados). Veja outro exemplo da aplicao da regresso logstica: o estudo de Whelan B et al avaliaram o sdio srico como um fator de risco para a mortalidade intrahospitalar em pacientes grave admisso. A Odds ratio para a morte dentro de 30 dias da admisso foi de 4,07 (IC a 95%%: 2,95-5,63) quando o paciente apresentava hipernatremia e 3,36 (IC a 95% de 2,59-4,36) quando apresentava hiponatremia. A regresso logstica foi usada para calcular a Odds ratio ajustada: fatores que foram includos neste ajuste foram o escore de severidade da doena, permanncia na UTI, efeito da idade, sexo, transfuso de sangue e sepse. Aps o ajuste, para hipernatremia, a Odds ratio (ajustada) para a morte passou para 1,41 (Intervalo de confiana de 0,972,07: no alcanou a significncia, pois no intervalo de confiana contm a unidade) e a Odds ratio (ajustada) para hiponatremia passou para 2,00 (Intervalo de confiana a 95% de 1,44-2,77, ou seja, foi menor, porm continuou significativa, pois no intervalo de confiana no contm a unidade). Assim, o sdio srico um poderoso marcador inicial para a mortalidade, mas a mortalidade no grupo hipernatrmico primariamente um fator de severidade da doena. J para a hiponatremia o aumento da mortalidade independente de outras variveis. Portanto, os dados deste estudo nos informam que o sdio srico na admisso um importante determinante da mortalidade intrahospitalar em todos os pacientes. O sdio na admisso pode ser usado para estratificar os pacientes que vo necessitar de uma terapia mais agressiva e maior monitorizao e em particular a hiponatremia que necessita de tratamento cuidadoso para evitar um excesso de mortalidade que independentemente associada com anormalidade deste distrbio. Quanto multicolinearidade, apenas a ttulo de informao: a multicolinearidade existe quando observamos uma forte correlao entre dois ou mais previsores (variveis explicativas) em um modelo de regresso; este fato dificulta a avaliao da importncia individual de um previsor (se ambos previsores so altamente correlacionados e cada um responsvel por uma varincia similar dos resultados, como vamos poder dizer qual entre as duas variveis a mais importante ? Na verdade no podemos dizer, pois o modelo pode incluir qualquer uma delas de forma intercambivel. Na regresso mltipla, o SPSS produz vrios diagnsticos de colinearidade, entre eles o VIF (Fator de Inflao da Varincia). O FIV indica se um previsor tem um relacionamento linear forte com outro(s) previsor (es): um valor acima de 10 leva-nos a preocupao. Tal preocupao da colinearidade com a regresso mltipla, ocorre tambm com a regresso logstica, sendo ento essencial testar a colinearidade numa anlise de regresso logstica. Como o SPSS no tem opo para fazer um diagnstico de colinearidade na regresso logstica, podemos obter estatsticas tais como as de tolerncia (Valor menor que 0,1 indica um problema srio de colinearidade) e VIF simplesmente executando uma anlise de regresso linear utilizando as mesmas variveis de sada e os mesmos previsores. Em Analyze >Regression>Linear. Clicar em Statistics e depois selecione Colinearity diagnostics (diagnstico de colinearidade) e desmarque todas as opes padres e clicar em [Continue] para volta caixa de regresso linear e pressionar [OK]. No Output viewer (sada do SPSS), vamos ter a Tolerance (tolerncia) e a VIF. (Consultem as Figuras 98, 99 e 100).Vejamos um exemplo: aps identificar as variveis
68
associadas individualmente com o bito, realizamos uma regresso logstica e no modelo, as variveis que persistiram foram a ventilao mecnica e o tipo de parto (tanto a ventilao mecnica como o parto normal aumentaram significativamente o bito:OR de 5,63, com IC a 95% de 2,37-13,37 e OR de 2,22 com IC a 95% de 1,024,85). Vejamos a colinearidade da regresso logstica que realizamos entre Ventilao Mecnica e Tipo de Parto
Fig. 98: Caixa de dilogo para a regresso linear para os dados de bito
Fig. 99: Caixa de dilogo para a Statistics da regresso linear selecionando Colinearity diagnostics
Fig.100: Output viewer do diagnstico de colinearidade para os dados do bito

Como podemos observar podemos concluir com segurana que no existe colinearidade entre as variveis previsoras, uma vez que a tolerncia ( Tolerance) e o Fator de Inflao da Varincia (VIF) das variveis previsoras so >0,1 e <10, respectivamente. Assim, o segundo previsor tem uma probabilidade maior de ser responsvel por uma varincia dos resultados do que quando existia um nico previsor.
69
VIII- TESTES NO PARAMTRICOS Os estatsticos escolhem um teste paramtrico (a maioria dos testes de hipteses vistos anteriormente) quando esto seguros de que a distribuio normal no foi violada e testes no paramtricos porque no esto seguros de que a distribuio normal foi encontrada (estes ltimos no so to eficientes quanto aos paramtricos para detectar diferenas na populao). Estes testes no requerem a estimao da varincia e da mdia da populao. So testes que podem ser usados tanto para variveis nominais como para variveis ordinais ou quantitativa Entre os testes no paramtricos, vamos comentar sobre os mais usados -Teste do Qui-quadrado (j estudado) -Teste Binomial -Teste U de Mann-Whitney -Teste de Wilcoxon -Teste de McNemar -Teste de Kruskal-Wallis -Teste de Friedman O Teste de Kolmogorov-Smirnov, como j comentamos, avalia a normalidade de variveis quantitativas, como exemplo, o peso, permetro ceflico e estatura Analyze>Nonparametric Test e realizamos como j comentamos anteriormente (Figura 98) e selecionar 1.Sample K-S (Figura 101).
Fig.101. Menu Analyze>Nonparametric Test
Fig.102. Caixa de dilogo One-Sample Kolmogorov-Smirnov Test Clicar em [OK] e o Output viewer mostrar (Figura 103).
70
Fig. 103. Output viewer do One-Sample Kolmogorov-Smirnov Test Como podemos ver, as varivel estatura e permetro ceflico (PC) mostraram-se com caractersticas de variveis que seguem a distribuio normal (p=0,29 e 010), o que no ocorreu com a varivel peso (p<0.05). Toda vez que o teste de Kolmogorov-Smirnov apresentar p <0.05, significa fuga de normalidade.
VIII-1-Teste Binomial
Este teste usado para testar propores em uma varivel dicotmica (sim/no, doente/no doente/parto normal/sexo masculino, etc). Testa se a proporo de uma das respostas igual ou diferente a uma determinada proporo ou para testar se as propores das duas categorias de resposta so iguais ou diferentes (por exemplo,percentual de uso de corticosteride pr-natal= percentual de no uso, ou percentual de parto normal igual ao percentual de cesariana). No exemplo a seguir, usando a base de dados Uso de Corticosteride Pr-Natal na Maternidade do Hospital Regional da Asa Sul, vamos testar se o percentual de parto normal igual a 50% (hiptese nula) ou diferente de 50% (hiptese alternativa). Selecionar Analyze>NonparametricTest>Legacy >Legacy Dialogs(SPSS 18).Veja na figura 104.
Fig.104. >NonparametricTest>Legacy >Legacy Dialogs A seguir, selecione a varivel que estamos testando, Tipo de Parto, coloque na caixa de dilogo Test Variable List (figura 105).
71
Fig.105. Caixa de dilogo Binomial Test Clicar em OK e a sada do SPSS mostrar (figura 106).
Fig.106. Resultados do Teste Binomial (Binomial Test)
Interpretao: o resultado do Teste Binomial neste caso indica que o percentual do

de ocorrncia de parto normal diferente de 50% (p=0.003) e assim, aceitamos a hiptese alternativa. Neste resultado observamos: o nmero (N) de casos de cesariana (132) e de parto normal (87%); a proporo observada ( Observed Prop) para cesariana (60%) e parto normal (40%), a proporo a ser testada ( Test Prop) que 50% e a significncia ou valor-p (p-0.003).
VIII-2-Teste U de Mann-Whitney
Usado para a comparao de variveis ordinais ou quantitativas entre dois grupos independentes,quando a distribuio no simtrica (normal), ou seja quando h ruptura dos pressupostos paramtricos; corresponde ao teste t de Student para amostras independentes. Quando a amostra tiver mais de 20 observaes, a estatstica U tende a uma distribuio normal; no Output Viewer ser apresentado o resultado da estatstica z, alm do resultado do teste U, mas a significncia pelo valor p, ser a mesma. Selecionar Analyze>Nomparametric Test>2 Independent Samples (Figura 107)
72
Fig.107.Menu Analyze>Nomparametric Test>2 Independent Samples Vamos utilizar as variveis peso e uso do corticosteride pr-natal para calcular o teste de Mann-Whitney. Na caixa de dilogo Two-Independent-Samples Test, selecionar as variveis peso em Test Variable List e uso do corticosteride pr-natal com Grouping Variable. Pressionar Define Groups e definir Group 1 como 1 e Group 2 como 2. Neste exemplo estamos usando uma varivel quantitativa que no tem a distribuio gaussiana (NORMAL) que o peso (veja anteriormente o Teste de Kolmogorov-Smirnov) e vamos comparar com os RN cujas mes receberam corticosteride pr-natal (cortico-1) e mes que no receberam corticosteride pr-natal (cortico-2) (Figura 108)
Fig.108. Caixa de dilogo Two-Independent-Samples Test Clicar em [OK] e o Output viewer mostrar (Figura 109)
73
Fig. 109. Output viewer do teste U de Mann-Whitney O teste de Mann-Whitney cria um ranking (ordenao) de todos os casos (independente do grupo) e depois compara estes ranking entre cada grupo. Observamos o rank mdio e a soma dos rankings de cada grupo (havendo diferena significativa entre os grupos, espera-se que os rankings mdios sejam bem diferentes). Em Test Statistics, podemos observar que no h diferena entre os pesos dos RN das mes que receberam corticosteride pr-natal e dos RN cujas mes no receberam (p>0.05).
VIII-3- Teste T de Wilcoxon

Este teste substitui o teste t de Student para amostras emparelhadas, quando os dados so medidos em escala ordinal ou quando no seguem a distribuio normal. Baseia-se nos postos (ranks) das diferenas intrapares. Como na nossa base de dados no temos amostras emparelhadas, vamos dar o exemplo de Wagner MB e cl; hemoglobina no pr-operatrio e hemoglobina no ps-operatrio. Na caixa de dilogo Two-Related-Samples Test>2 Related Samples (Figura 110)
Fig.110. Caixa de dilogo Two-Related-Samples Test
74
Na caixa de dilogo Two-Related-Samples Tests, selecionar o par de variveis a ser comparado, colocando-os na lista de pares de variveis (Test Pair(s) List). Em Test List, escolher o teste de Wilcoxon (Figura 111).
Fig.111. Caixa de dilogo Two-Related-Samples Test, de onde pode ser obtido o teste de Wilcoxon Clicar em [OK] e o Output viewer mostrar (Figura 112).
Fig. 112. Resultado do Teste de Wilcoxon.

75
Nos resultados observamos que o Teste de Wilcoxon calcula as diferenas entre os valores das duas variveis e cria um ranking (ordenao) destas diferenas, classificando-as em diferenas negativas, positivas e empates (ties). A seguir, mostra a mdia e a soma dos rankings das diferenas negativas e positivas. Observem que h 82 diferenas negativas (o valor da hemoglobina no ps-operatrio foi menor do que no pr-operatrio),13 positivas (o valor da hemoglobina no ps-operatrio foi maior do que no pr-operatrio) e em 5 casos, houve empate, ou seja,os valores da hemoglobina pr e ps-operatrio foram iguais. Em Test Statistics, temos os resultados da estatstica de teste (Z):considerando o nvel de significncia (p<0.001), podemos afirmar que a hemoglobina do ps-operatrio significantemente menor que a hemoglobina do properatrio
VIII-4-Teste H de Kruskal-Wallis
Este teste uma alternativa no paramtrica para a anlise de varincia de um critrio de classificao (One-Way ANOVA). Pode ser usado para comparar vrias amostras independentes. Ao ser usado 2 grupos para comparao, os resultados so os mesmos dos teste de U de Mann-Whitney. Como ocorre no teste F de uma NOVA paramtrica, um valor significativo de F no indica onde se encontra a diferena, devendo ser realizado o teste de Tukey. J no teste H de Kruskal-Wallis, para identificar a diferena, deve ser realizado o teste de Dunn, no disponvel no SPSS. Selecionar Analyze>Nonparametrics Test>K Independent Samples (Figura 113)
Fig.113. Menu Analyze>Nonparametrics Test>K Independent Samples Na caixa de dilogo Test for Several Independent Samples, selecionar as variveis a testar (idade gestacional, Apgar no 5 minuto e peso, variveis assimtricas, como demonstrado pelo teste de Kolmogorov-Smirnov) em Test Variable List. Selecionar a varivel que define os grupos em Grouping Variable. Pressionar Define Range e indicar os cdigos dos grupos (Figura 114).
76
Fig. 114. Caixa de dilogo Test for Several Independent Samples de onde se obtm o teste H de Kruskal-Wallis Na janela do Output Viewer, vamos ter (Figura 115):
Fig. 115. Resultado do teste H de Kruskal-Wallis Inicialmente vemos o nmero de casos e o ranking (ordenao) mdio dcada grupo.No havendo diferena significativa entre si,espera-se que os rankings mdios sejam prximos. Podemos observar que no h diferena significativa entre a idade gestacional e o peso ao nascer dos RN de mes que receberam corticosteride em relao aos RN das mes que no receberam, o que NO ocorre com o Apgar no 5 minuto (os RN das mes que receberam corticosteride no pr-natal tiveram significativamente maior Apgar no 5 minuto).
77
VI-5- Teste de Friedman

Este teste uma extenso do teste de Wilcoxon; usado para o caso de diversas amostras emparelhadas, quando os dados so medidos em escala ordinal ou tem distribuio assimtrica. Ao usar 2 grupos, os resultados so semelhantes ao teste de T de Wilcoxon. Como no nosso arquivo no temos dados para esta situao especfica, vamos usar o exemplo de Wagner MB e cl: Hb antes e aps a cirurgia. Veremos a semelhana, ao examinar os resultados na janela do Output viewer, com o teste T de Wilcoxon. Analyze>Nonparametrics Test>K Related Samples (Figura 116)
Fig.116. Menu Analyze>Nonparametrics Test>K Related Samples Na caixa de dilogo Test for several Related Samples, adicionar as variveis hb1 e hb2 (Figura 117)
Fig.117. Caixa de dilogo Test for several Related Samples, de onde se obtm o teste de Friedman Clicar em [OK] e a janela do Output Viewer mostrar (Figura 118)
78
Fig.118. Resultado do teste de Friedman Observamos haver diferenas significativas nos nveis de hemoglobina no psoperatrio (menor) do que no pr-operatrio. Podemos observar as semelhanas dos dois testes, Wilcoxon e Friedman.
VIII-6- Coeficiente de correlao de Spearman

Este coeficiente o substituto do coeficiente de Pearson, sendo empregado quando as variveis quantitativas forem assimtricas. Exige que as variveis tenham sido medidas em escala ordinal. Apresenta a mesma amplitude no resultado do coeficiente de Pearson, variando de -1 (correlao negativa perfeita) a + 1 (correlao positiva perfeita), passando por zero (ausncia de correlao). A interpretao semelhante ao coeficiente de Pearson, porm o coeficiente de Spearman indica a correlao entre os postos e no entre os valores efetivamente medidos. Para exemplificar, vamos fazer uma correlao entre peso ao nascer e idade gestacional Analyze>Correlate>Bivariate (Figura 119)
Fig.119. Menu Analyze>Correlate>Bivariate
79
Na caixa de dilogo Bivariate Correlations, colocar as variveis em estudo, peso e idade gestacional (apresentam distribuio assimtrica como comprovamos com o teste de Komogorov-Smirnov) e marcar Spearman em Correlation Coefficients (Figura 120)
Fig. 120. Caixa de dilogo Bivariate Correlations, de onde se obtm o coeficiente de Spearman Pode-se obter estatstica descritiva se for pressionado [Options] e marcado means and stardard desviation, na caixa de dilogo Bivariate Correlations (Figura 121).
Fig.121. Caixa de dilogo Bivariate Correlations: Options Na janela Output Viewer, vamos observar (Figura 122 e 123).
Fig.122. Resultado do coeficiente de Spearman entre peso e altura.
Fig.123. Resultado do coeficiente de Spearman entre peso e altura.
80
O coeficiente de correlao de Spearman entre idade gestacional e o peso foi de 0,22, uma correlao fraca. Outros coeficientes de correlao no paramtricos podem ser obtidos no SPSS, como os coeficientes propostos por Kendall (tau-veja adiante), Goodman-Kruskal (gamma) e Somers (d). Estes coeficientes no so encontrados no menu de testes no paramtricos. Os coeficientes de Spearman e Kendal, alm do paramtrico Pearson, so encontrados em Analyze>Correlate Bivariate. J os demais podem ser encontrados dentro das opes (Statistics) do comando Crosstabs (Analyze>Descriptive Crosstabs).
VIII-7- Teste de McNemar

Este teste utilizado para verificar as diferenas entre duas amostras relacionadas, porm a varivel testada deve ser dicotmica, como sim/no; presena/ausncia. O teste verifica a existncia de diferenas entre propores para amostras relacionadas. Este teste til quando tivermos dados nominais em vez de ordinais Em Analyze>Nonparametrics Test>Legacy Dialogs>Related Samples (SPSS 18) (figura 124).
Fig.124. Analyze>Nonparametrics Test>Related Samples Para exemplificar a realizao deste teste no SPSS, usamos usar o arquivo ambiente.sav, retirado do site da MEDBOOK-Editora Cientfica Ltda, 2009 (www.medbookeditora.com.br, do livro SPSS-Anlise de Dados Biomdicos. Mota,VT e Oliveira FP Este arquivo apresenta resultados da aplicao de dois questionrios com 92 pais de crianas adolescentes asmticos, um aplicado antes e outro, 100 dias aps a realizao de um programa de esclarecimento de adoo de medidas que visam controlar o ambiente. Foi perguntado aos pais se havia conhecimento das medidas de controle ambiental e eles aplicavam-nas.
81
A pergunta : podemos concluir (hiptese alternativa, a H 1) ou no (hiptese nula ou H0) que a realizao do programa aumentou o conhecimento dos pais em relao s medidas de controle ambiental? Na caixa de dilogo Two-Related-Samples Test, selecionar as variveis de teste (Test Pair(s) List)-Conhecem-Momento 1[Antes] e Conhecem-Momento 2 [Depois]. Em Test type marque McNemar e desmarque Wilcoxon (figura 125).
Fig.125. Caixa de dilogo Two-Related-SamplesTest Clicar OK e a sada do SPSS mostrar (figura 126):
Fig.126.Resultado do Teste McNemar Interpretao (NRM-Consultoria Estatstica Ltda, Porto Alegre):Na parte inicial do Teste de McNemar, 33 pais (27+6) conheciam as medidas antes do programa e 59 pais (27+32) passaram a conhecer as medidas aps o programa. Em Test Statistics dos
82
resultados, temos o nmero total de casos pesquisados (N), o valor calculado do teste, que baseado na distribuio do Qui-quadrado ( Chi-Square=16,447) e a significncia do valor-p (p<0.001). Assim, afastamos a hiptese nula e aceitamos a hiptese alternativa, que nos mostra que o programa de incentivo adoo de medidas de controle ambiental aumentou o percentual dos pais com o conhecimento destas medidas. Este percentual que era de 33% (33/92) antes do programa, passou para 64% (59/92) depois do programa. O Teste de McNemar tambm pode ser realizado de outra forma: Analyze>Descriptive Statistics>Crosstab>Statistics, marcando a opo McNemar. IX- CURVA DE KAPLAN-MEIER Muitos estudos, em medicina, so planejados para determinar se uma droga, tratamento ou procedimento novo tem melhor desempenho do que outro normalmente usado, ou seja, so feitas avaliaes dos efeitos de curto prazo. No entanto tambm importante a avaliao dos resultados a longo prazo, incluindo a morbimortalidade. Nos estudos de avaliao das taxas de sobrevivncia entre pacientes submetidos a certos tratamentos ou a certos procedimentos, o resultado ser binrio-sobrevivncia ou morte do paciente e o objetivo ser estimar o intervalo de tempo que os pacientes sobrevivem com tipos especficos de tratamento ou em condies especficas. Na anlise de sobrevivncia, a varivel dependente (resultado) sempre o tempo at a ocorrncia de determinado evento (j na anlise estatstica clssica, a varivel dependente a ocorrncia de determinado evento, como cura, desenvolvimento da doena, efeito colateral). Vejam assim que na anlise de sobrevivncia compara-se a rapidez com que os participantes desenvolvem determinado evento, ao contrrio de comparar as percentagens de doentes que desenvolvem o evento, ao fim de um determinado perodo de tempo. O evento final da anlise de sobrevivncia pode no ser somente a morte, podendo ser outro evento, como recidiva, progresso da doena, efeito colateral. Quando se fala em tempo de sobrevida na anlise de sobrevivncia no significa que seja necessariamente o tempo at a morte e sim o tempo at a ocorrncia de determinado evento. Assim, devido diferena do tipo de varivel dependente usada, todos os mtodos estatsticos que usamos normalmente na anlise clssica, no podem ser usados quando realizamos anlise de sobrevivncia, devido diferena do tipo de varivel dependente que utilizada. A anlise clssica e a de sobrevivncia tem mtodos prprios (consulte a tabela 4)
83
Tabela 4. Tcnicas estatsticas usadas na anlise clssica e na anlise de sobrevivncia (Botelho F et al) Nos estudos de seguimento, principalmente aqueles de longa durao, os pacientes que no atingem o tempo total de seguimento previsto, so excludos. J na anlise de sobrevivncia, os dados destes pacientes so aproveitados na anlise final, mesmo que no desenvolvam o evento em estudo. Quando isto ocorre, designa-se o indivduo como censurado. Portanto, a anlise de sobrevivncia permite usar a informao de todos os participantes at o momento em que desenvolveram o evento ou foram censurados, constituindo uma tcnica ideal para analisar respostas binrias (ter ou no ter o evento) em estudos longitudinais que se caracterizam por tempo de seguimento diferente entre os indivduos e perdas de segmento. Como feita a anlise dos dados na anlise de sobrevivncia/aparecimento de eventos? O mtodo de Kaplan-Meier consiste em dividir o tempo de seguimento em intervalos, cujos limites correspondem ao tempo de seguimento em que houve eventos. Este mtodo calcula a sobrevivncia cada vez que um paciente morre, o mtodo mais usado. Observem a Curva de Kaplan-Meier do estudo de Been JV et al sobre o Papel da corioamnionite na resposta ao surfactante nos recm-nascidos pr-termos (Chorioamnionitis Alters the Response to Surfactant in Preterm Infants . J Pediatr 2010;156:10-5) (Figura 127).
84
Fig. 127. Curvas de Kaplan-Meier analisando o tempo at a extubao aps primeira dose (A) e segunda (B) dose de surfactante exgeno para os grupos com base na histologia da placenta Observamos pela Curva de Kaplan-Meier apresentada, que com 12 horas aps o uso da primeira dose do surfactante pulmonar exgeno, no havia diferena entre os 3 grupos estudados (corioamnionite fetal, corioamnionite sem envolvimento fetal e sem corioamnionite) quanto ao tempo de extubao, o que no ocorreu com 24, 36 e 48 horas de vida, em que se observa o prolongamento do tempo de extubao com a gravidade da corioamnionite, ou seja, aquela com envolvimento fetal (com 486 horas, aqueles com grave corioamnionite, 85% estavam intubados, versus 60% daqueles aqueles com corioamnionite menos grave ou ausncia de corioamnionite) (p<0,047, determinado pela estatstica do logrank de Cox-Mantel-veja adiante). Vejam ento que esta anlise de Kaplan-Meier permite avaliar corretamente o ritmo em que os eventos vo ocorrendo nos diferentes grupos em estudo. Dos grficos com as curvas de Kaplan-Meier pode-se estimar diretamente o percentual de evento ao final de qualquer intervalo temporal, Para isto, trace uma linha vertical ao nvel temporal que se pretende apurar o nvel de ocorrncia de evento, que no nosso caso a extubao. Vejam que no exemplo anterior, com 42 horas aps o uso do surfactante exgeno, 65% dos RN nos grupos com corioamnionite leve e sem corioamnionite estavam intubados, versus 85% dos RN com histria de mes com corioamnionite severa. Para avaliar a significncia estatstica procedemos tal como na anlise clssica, analisando o valor de p ou o intervalo de confiana. Para o clculo deste p, o teste de significncia mais utilizado o Logrank test (tambm conhecido por estatstica do logrank de Mantel, estatstica do logrank de Cox-Mantel). Este teste compara o nmero de eventos observados em cada grupo com o nmero de eventos que seria esperado com base no nmero de eventos dos dois grupos combinados, ou seja, no importa a que grupo pertence o indivduo. Um teste do qui-quadrado aproximado usado para testar a significncia de uma expresso matemtica envolvendo o nmero de eventos esperados e observados. Para a determinao de um efeito independente de um fator, temos que realizar uma anlise multivariada, que no caso de anlise de sobrevida geralmente implica na
85
utilizao da Regresso de Cox; uma tcnica estatstica que utilizada para determinar a relao entre sobrevivncia e vrias variveis independentes exploratrias; fornece uma estimativa do tratamento sobre a taxa de sobrevivncia, aps o ajuste da varivel exploratria. Esta regresso permite obter resultados ajustados para possveis variveis de confundimento. No estudo assinalado anteriormente a respeito da alterao da resposta ao surfactante nos RN cujas mes tiveram corioamnionite com envolvimento fetal, os autores tambm realizaram uma anlise de regresso de Cox para anlise multivariada para identificar se a idade gestacional poderia explicar a menor chance de extubao aps corioamnionite. A regresso de Cox foi realizada com ajuste para a idade gestacional e peso. Os autores evidenciaram assim, que os RN do grupo corioamnionite com comprometimento fetal teve significativamente menor probabilidade de extubao 48 horas aps o uso da primeira dose surfactante exgeno (hazard rate-HR- de 0,12 com intervalo de confiana de 0,01-0,06 p=0,46), demonstrando um efeito independente da corioamnionite no prolongamento da intubao destes RN com corioamnionite grave (Figura 128).
Fig. 128. Regresso de Cox estimando o tempo de extubao aps a segunda dose de surfactante exgeno, ajustado para a idade gestacional e peso nos grupos de acordo com a histologia da placenta, p <0,05 HC+F VS HC-
86
Podemos observar que o tamanho da amostra diminui ao longo do tempo de observao e assim, as estimativas nos perodos finais de observao (parte direita da curva) so bastante imprecisas. Tambm vale a pena ressaltar que a censura dos participantes (aqueles que no completaram o estudo ou porque abandonaram o estudo, ou foram perdidos no seguimento). no est relacionada com o seu prognstico e que semelhante para os participantes recrutados no incio e no fim do estudo. Quando o nmero total de censurados antes do trmino do estudo pequeno, evidentemente o vis de seguimento ser pequeno.
Anlise de Sobrevivncia usando o SPSS para Windows, usando o mtodo de Kaplan-Meier e obteno de Curvas de Sobrevivncia e compar-las mediante a realizao do teste logrank Para fazer este tipo de estudo necessrio que se defina a data de incio (diagnstico da doena, internao no hospital, incio do tratamento) e a data de finalizao do seguimento (determinado pelo investigador), para que se possa calcular posteriormente os tempos de sobrevivncia (data do incio do seguimento at a data do ltimo contato) dos pacientes. No seguimento, pode ser que os pacientes ou morram, continuem com vida na data da finalizao do estudo ou so perdidos (casos censurados, como discutido anteriormente). O mtodo de Kaplan-Meier um mtodo no paramtrico, sendo o nico que supe que os indivduos censurados comportaram do mesmo modo dos indivduos seguidos at que ocorra o evento. Para cada perodo de tempo se calcula a probabilidade de sobreviver. O tempo de seguimento uma varivel quantitativa (expressa em dias, meses, anos) e expressa a diferena entre as datas de incio e de finalizao do estudo. O estado do paciente ao final do seguimento uma varivel categrica dicotmica (1: evento que pode ser morte, recada, etc e 0: no ocorreu evento, casos censurados ou apresentaram um evento aps o trmino do estudo). Vejamos como proceder no SPSS-18 (vamos usar uma base de dados de Aguayo Canela M e Lora Monge E, do Hospital Universitrio Virgem Macarena, Sevilla, com informao de 56 pacientes com cncer coloretal, includos no seguimento (data de entrada ou inicial) no momento de ser submetidos radioterapia pr-operatria e seguidos at o seu falecimento. Da mesma base de dados, vamos calcular o teste estatstico logrank para comparar duas curvas de sobrevivncia (dois grupos de pacientes, um grupo que recebeu menos de 5000 rads e outro grupo que recebeu >=5000 rads no pr-operatrio). H diferenas na sobrevivncia de ambos os grupos ou a dose de radioterapia pr-operatria influenciou significativamente na sobrevivncia destes pacientes? Analyze>Survival e selecionar Kaplan-Meier (Figura 129)
87
Fig.129. Menu Analyse>Survival>Kaplan-Meier E ser aberto uma nova caixa de dilogo (Kaplan-Meyer) (Figura 130)
Fig. 130 Caixa de dilogo Kaplan-Meier
88
Selecionar a varivel que mede o tempo de seguimento e coloc-la em Time (Tempo). Em Status (Estado) colocar a varivel categrica dicotmica que define o estado individual durante o seguimento; esta varivel tem duas opes: valor censurado/valor morte ou outro evento que se avalia). O programa pede para definir o evento (Define Event), devendo especificar o valor que mostra o resultado que se avalia (neste caso, o valor 1=morte) (Figuras 131 e 132).
Fig. 131. Caixa de dilogo Kaplan-Meier
Fig. 132. Kaplan-Meier:Define Event
89
A seguir, clicar em Options e marcar Survival table(s) (tabela(s) de sobrevivncia) e Mean and median survival (mdia e mediana de sobrevivncia) e Quartilies (Figura 133). Em Plots, marcar Survival (sobrevivncia) para gerar a Curva de Kaplan-Meier
Fig. 133- Kaplan-Meier : Options A seguir, clicar em [OK] e o Output Viewer (sada do SPSS), mostrar uma tabela (Tabela 5-reproduo parcial) que contm na primeira coluna da esquerda ( Time) o tempo durante o qual diferentes indivduos esto em seguimento, ordenados por tempos crescentes. A segunda coluna (Status) indica se tem produzido o efeito avaliado ou no (morte, censurado). A coluna seguinte (Cumulative survival) a sobrevivncia acumulada, ou a proporo de casos para os quais no ocorreu o evento em cada tempo. A coluna seguinte (Standard Error) o erro padro correspondente a estimao pontual de Kaplan-Meier em cada tempo. A quinta coluna ( Cumulative events) contem os eventos acumulados, isto , os que morreram at este tempo. A ltima coluna ( Number remaining) o nmero de pessoas que permanecem em cada momento sem que haja ocorrido com eles o evento final ou o desenlace avaliado e representa os indivduos que esto em risco no prximo perodo.
90
Tabela 5 Tabela de sobrevivncia O SPSS tambm informa o nmero total de pacientes avaliados (Number of cases), o nmero de censurados (Censored) e o nmero de eventos ocorridos ( Events). Vamos observar os valores do tempo de sobrevivncia (Survival Time) e a mediana (Median) da sobrevivncia (o tempo em que 50% dos pacientes seguem sem apresentar o evento), com os seus correspondentes erros padres (Standard Error) e os intervalos de confiana a 95% (95% Confidence Interval) (Figura 134)
91
Fig. 134. Mdias e mediana da sobrevivncia e percentis. A seguir o programa mostra a Curva de Sobrevivncia de Kaplan-Meyer (Figura 135).
Fig.135. Curva de Sobrevivncia (Curva de Kaplan-Meier).
Observamos que na ordenada, fica a Sobrevivncia Acumulada ( Cum Survival) em termos de probabilidade (entre 0 e 1) e no eixo da abscissa, o tempo de
92
sobrevivncia. Este grfico pode ser editado clicando sobre ele com o boto esquerdo do mouse (Editar). Assim, podemos responder a seguinte pergunta: quantos pacientes com cncer coloretal sobrevivem mais de dois anos?. Traando uma linha vertical no tempo de 25 meses, vamos observar que a sobrevivncia seriam aproximadamente 75% (Figura 136)
Fig.136. Curva de Kaplan-Meier editada.
Passos para comparar duas ou mais curvas de sobrevivncia.
A seguir, vamos comparar duas ou mais curvas de sobrevivncia. A hiptese nula que os grupos que se compararam tem uma sobrevivncia igual, sendo o teste de hiptese mais empregado, como j vimos o logrank test que leva em conta as diferenas de sobrevivncia entre os grupos em todos os pontos que dura o seguimento. No exemplo a seguir, usando a mesma base de dados do exemplo anterior, vamos responder a pergunta: a sobrevivncia foi diferente entre os que receberam o tratamento radioterpico com menos de 5000 rads e os que 5000 ou mais rads? Ou o
93
mesmo, h diferena significativa na sobrevivncia entre os que receberam menos e mais radioterapia pr-operatria? Na caixa de dilogo Kaplan-Meier (figura 130), selecionamos a varivel que vai separar os grupos de pacientes e colocar em Factor uma varivel categrica (no presente exemplo, vamos colocar a varivel dose de radioterapia pr-operatria.). (Figura 137).
Fig. 137. Caixa de dilogo Kaplan-Meier Clicar em Compare Factor... (Comparar Fator...), selecionar o estatstico Logrank e logo se ativar a opo Pooled trend factor levels (Combinada sobre os estratos) (Figura 138)
Fig. 138. Kaplan-Meier: Compare Factor Levels
94
Clicar em [Continue] e em [OK] e o Output Viewer mostrar (Figura 139 e 140).
Fig. 139. Resultado do teste estatstico Logrank, mostrando no haver diferena entre os grupos (p<0.102).
Fig. 140. Curva de sobrevivncia de Kaplan-Meier de ambos os grupos Interpretao: como podemos observar o valor do estatstico logrank foi de 2,67, com 1 grau de liberdade (neste exemplo se compararam dois grupos) e o valor p associado foi de 0,10, o que NO nos permiti afastar a hiptese nula, isto , NO H DIFERENA ESTATISTICAMENTE SIGNIFICATIVA NA SOBREVIVNCIA ENTRE OS DOIS GRUPOS. Observando as curvas de sobrevivncia de ambos os grupos (Figura 140), o grupo de maior dose de radioterapia parece sobreviver mais, porm o estatstico logrank no alcana valor crtico que nos permite afastar a hiptese nula.
95
X- CURVA ROC Muitos exames dos nossos pacientes tem valores medidos numa escala numrica e assim a sensibilidade e a especificidade dependem de onde se coloca o ponto de corte (cut off) entre os resultados positivos e negativos. Uma forma mais eficiente de demonstrar a relao normalmente antagnica entre a sensibilidade e a especificidade dos exames que apresentam resultados contnuos so as Curvas de Caractersticas de Operao do Receptor (Curvas ROCReceiver Operating Characteristic). A Curva ROC uma ferramenta poderosa para medir e especificar problemas no desempenho do diagnstico em medicina por permitir estudar a variao da sensibilidade e especificidade para diferentes valores de corte. A Curvas ROC foram desenvolvidas no campo das comunicaes como uma forma de demonstrar as relaes entre sinal-rudo. Interpretando o sinal como os verdadeiros positivos (sensibilidade) e o rudo, os falsos positivos (1-especificidade), podemos entender como este conceito pode ser aplicado em medicina. A Curva ROC um grfico de sensibilidade (ou taxa de verdadeiros positivos) versus taxa de falsos positivos (Figura 141)
Fig.141.Curva de Caracterstica de Operao do Receptor (Curva ROC)
96
A linha diagonal pontilhada corresponde a um teste que positivo ou negativo, aleatoriamente. A Curva ROC Permite evidenciar os valores para os quais existe maior otimizao da sensibilidade em funo da especificidade que corresponde ao ponto em que se encontra mais prxima do canto superior esquerdo do diagrama, uma vez que o ndice de positivos verdadeiro 1 e o de falsos positivos zero. A medida que um critrio para o teste positivo torna-se mais rigoroso, o ponto da curva correspondente a sensibilidade e a especificidade (ponto A) movimenta-se para baixo e para a esquerda (sensibilidade menor e especificidade maior). Se adotar um critrio menos evidente, para identificar os positivos, o ponto da curva (ponto B) movimenta-se para cima e para a direita (sensibilidade maior, especificidade menor). A Curva ROC permite comparar dois ou mais exames diagnsticos e constitui uma das maiores virtudes das curvas ROC. No exemplo (Figura 142) a seguir, o Teste A- tem melhor acurcia que o teste B (teste invlido: os seus resultados no so melhores do que os da chance). O ponto 1confere maior valor de sensibilidade e especificidade; o ponto 2 confere maior sensibilidade, porem menor especificidade e j o ponto 3, maior especificidade, porm, menor sensibilidade
Falso- positivo (1-especificidade) Fig.142 Curva ROC (diferentes pontos de cortes) O exemplo a seguir (Figura 136) de Maulik et al que compararam 4 ndices correspondentes nos traados Doppler da artria umbilical, no que se refere a uma preciso para prever a evoluo perinatal desfavorvel. Podemos observas que 3 ndices so praticamente semelhantes , mas um deles, o IP (ndice de pulsatilidade) era muito menos preciso.
97
Fig. 142. Curvas de caractersticas de operao do receptor para os ndices Doppler da artria umbilical. Os pontos de dados so os valores medidos dos ndices. IR: ndice de resistncia; D/A: relao diastlica mdia; IP: ndice de pulsatilidade (Maulik et al). A Curva ROC descrimina entre dois estados, onde cada ponto da curva representa um compromisso diferente entre a sensibilidade e o falso positivo que pode ser definido pela adoo de um diferente valor do ponto de corte de anormalidade. Assim, podemos ter diferentes correspondncias na curva. Um critrio restrito (paciente positivo quando a evidncia da doena muito forte) aquele que traduz uma pequena frao de falsos positivos e tambm uma pequena frao de verdadeiros positivos (canto inferior esquerdo da Curva ROC. O uso de critrios menos restritos, conduzem a maiores fraes de ambos os tipos (pontos colocados no canto direito da curva (Figura 143)
98
S e n s i b i l i d a
1-especificidade (falsos positivos)
Fig.143. Curva ROC para uma dada capacidade de discriminao, com a variao do ponto de corte (critrio de deciso) (Braga ACS, 2003) O valor do ponto de corte definido com um valor que pode ser selecionado arbitrariamente pelo pesquisador entre os valores possveis para a varivel de deciso, acima do qual o paciente classificado como positivo (teste positivo, paciente com a doena) e abaixo do qual classificado como negativo (teste de diagnstico negativo, ausncia de doena). Para cada ponto de corte so calculados valores de sensibilidade e especificidade, que podem ento serem dispostos no grfico. Um classificador perfeito corresponderia a uma linha horizontal no topo do grfico, porm esta dificilmente ser alcanada. Na prtica, curvas consideradas boas estaro entre a linha diagonal e a linha perfeita, onde quanto maior a distncia da linha diagonal, melhor o sistema. A linha diagonal indica uma classificao aleatria, ou seja, um sistema que aleatoriamente seleciona sadas como positivas ou negativas, como jogar uma moeda para cima e esperar cara ou coroa. Finalmente, a partir de uma curva ROC, devemos poder selecionar o melhor limiar de corte para obtermos o melhor desempenho possvel. Para a determinao se duas ou mais Curvas ROC so significativamente diferentes, a avaliao feita atravs da determinao da rea sob a curva, usando uma modificao do teste da soma de ordens de Wilcoxon para esta comparao. Assim
99
possvel quantificar a exatido de um teste diagnstico (proporcional rea sob a curva), alm da possibilidade de comparar testes diagnsticos. Como realizar a Curva ROC pelo SPSS Vamos usar o exemplo disponvel no programa SPSS 18: hivassay. Um laboratrio farmacutico est desenvolvendo um teste rpido para deteco de infeco pelo HIV. O atraso na obteno de resultados de testes tradicional reduz a sua eficcia, porque muitos pacientes no retornam para saber os resultados. O desafio desenvolver um teste que fornea resultados em 10 a 15 minutos e to preciso quanto os testes tradicionais. Os resultados do ensaio so oito tons de vermelho, com tons mais profundos, indicando maior probabilidade de infeco. O teste rpido, mas preciso? Para ajudar a responder esta pergunta, um ensaio laboratorial foi realizado em 2.000 amostras de sangue, metade dos quais estavam infectadas com o HIV e metade, no. Os resultados esto em hivassay.sav. Vamos usar a Curva ROC para determinar em que tom de vermelho o mdico deve assumir que o paciente HIV-positivo. Em Analyse escolha Roc Curve (Figura 144) e ser aberta a caixa de dilogo Roc Curve (Figura 145)
Fig.144. Analyse>ROC Curve
100
Fig. 145.Caixa de dilogo ROC Curve Na caixa de dilogo ROC Curve, selecione assay result como Test variai e em State variabele, selecione actual satate e o tipo 1, como seu valor positivo. No Display, selecione With diagonal reference line, Standard error and confidence interval e Coordinate points of the ROC (Figura 146)
Fig.146.Caixa de dilogo ROC Curve
101
A seguir, clicar em [ OK] e teremos a Curva ROC, que um ndice visual da preciso do ensaio (Figura 147)
Fig.147 Curva ROC A Curva est difcil de visualizar porque est muito prximo ao eixo vertical, ou seja, maior sensibilidade na deteco dos pacientes com HIV positivo e com baixo falso positivo. O conhecimento da rea sob a curva possibilita quantificar exatido de um teste diagnstico (proporcional rea sob a curva), alm de possibilitar a comparao de testes diagnsticos. A rea sob a curva ROC constitui um dos ndices mais usados para sumarizar a qualidade da curva. A rea sob a curva ROC uma medida do desempenho de um teste (ndice de exatido do teste). Um teste totalmente incapaz de discriminar indivduos doentes e no doentes, teria uma rea sob a curva de 0.5 (seria a hiptese nula).Acima de 0,70 considerado desempenho satisfatrio. Vejam o clculo da rea sob curva do presente exemplo (Figura 148)
102
Area Under the Curve (rea sob a Curva) Test Result Variable(s):Assay result Asymptotic 95% Confidence Interval
Area ,996
Std. Error
Asymptotic Sig.b Lower Bound Upper Bound ,000 ,994
,001
,999
Figura 148. Clculo da rea sob a curva A rea sob a curva um resumo estatstico til para a determinao da acurcia do teste. A seguir, precisamos escolher um critrio especfico um critrio especfico em que as amostras de sangue so classificadas e estimar a sensibilidade e a especificidade do ensaio nesse critrio. Vejam as coordenadas da curva para comparar diferentes pontos de corte (Figura 149). Coordinates of the Curve Test Result Variable(s):Assay result A varivel resultado do teste (s) Positive if Greater Than Sensitivit or Equal Toa y ,00 1,50 2,50 3,50 4,50 5,50 6,50 7,50 9,00 1,000 ,997 ,995 ,993 ,988 ,978 ,973 ,965 ,000
1Specificity 1,000 ,058 ,040 ,024 ,017 ,015 ,012 ,003 ,000
103
Fig.149. Coordenadas da Curva ROC: A varivel resultado do (s) teste(s)
Esta tabela relata a sensibilidade e 1- especificidade para cada ponto de corte possvel para a classificao positiva. A sensibilidade a proporo de amostras de HIV-positivos com os resultados do teste maior que o corte e 1-especificidade a proporo de amostras de HIV-negativo com os resultados do teste maior que o de corte. No ponto de corte 0 equivalente a assumir que todos so HIV-positivos. No ponto de corte 9 equivalente a assumir que todos HIV-negativos. Vejam assim, que ambos os extremos so insatisfatrios, o desafio escolher um corte que devidamente equilibrar as necessidades de sensibilidade e especificidade. Por exemplo, considere o ponto de corte 5.5. Usando este ponto de corte vamos ter uma sensibilidade de 0,978 e 1-especificidade de 0,015. Assim, aproximadamente 97,8% de todas as amostras do HIV-positivos seriam corretamente identificadas como tal, e 1,5% de todas as amostras do HIV-negativo poderiam ser incorretamente identificadas como positivas. Se usarmos o ponto de corte 2,52, 99,5% de todas as amostras do HIV-positivos seriam corretamente identificados como tal e 4,0% de todas as amostras de HIVnegativo poderiam ser incorretamente identificadas como positivas. A escolha do ponto de corte ser decidida pela necessidade de aumentar a sensibilidade ou a especificidade e vai depender do pesquisador. Devemos notar que os valores desta tabela representam as melhores orientaes para os quais devemos considerar os pontos de cortes. Esta tabela no inclui as estimativas de erro, portanto,
104
no h garantia da exatido da sensibilidade ou especificidade para um dado ponto de corte na tabela. O uso da Curva ROC possibilitou-nos avaliar a acurcia deste teste. A rea sob a curva mostrou que a utilizao do teste melhor do que a chance, mas, alm disto, as. coordenadas da curva foi muito til porque forneceu algumas orientaes para determinar qual o melhor ponto de corte para a determinao os resultados do teste positivo e negativo. Vejamos agora, exemplo de estudos com o uso da Curva ROC na neonatologia, comparando ndices Prognsticos CRIB (clinical risk index for babies), CRIB II e SNAPPE-II (score for neonatal acute physiology-perinatal extension). Parry G et al desenvolveram o CRIB-II para RN de 32 semanas aps 1 hora de admisso na UTI sendo excluda a FiO2 uma vez que esta no representa uma medida fisiolgica verdadeira por ser determinada pelo cuidador. Assim, o CRIB II foi calculado a partir de 5 itens: sexo, peso ao nascer, idade gestacional, pior base excess e temperatura na admisso A rea sob a curva ROC para morte ou graves anormalidades cerebrais foi de 0,82, de 0,79 pra o CRIB, 0,80 para a idade gestacional e 0,77 para o peso ao nascer . Portanto, o CRIB II mostrou maior acurcia em relao ao CRIB, a idade gestacional e o peso ao nascer para a morte ou graves anormalidades cerebrais. Gagliardi I et al, comparando CRIB, CRIB-II e SNAPE-II, relataram maior grau de descriminao para o CRIB e CRIB II em relao ao SNAPPE-II (rea sob a Curva ROC de 0,90 e 0,91 versus 0,84-p <0,0004). Vejamos a Curva ROC deste estudo (Fig. 150)
Fig. 150. Curva ROC para o CRIB, CRIB II e SNAPPE-PE. A rea sob a curva foi: CRIB, 0,903; CRIB-II, 0,907; SNAPPE-II, 0,837.
105
Observem que as Curva do CRIB e CRIB-II esto mais prximas do canto superior esquerdo do diagrama, o que confere maior rea sob a curva e, portanto, maior poder de discriminao em relao ao SNAPPE-II. XI NDICE DE CONCORDNCIA INTRA E ENTRE-OBSERVADORES Estatstica k / Coeficiente (tau) de Kendall O ndice de concordncia intra e entre-observadores constitui uma medida utilizada para analisar o acordo entre dois intervalos de observao (intraobservadores) e entre avaliadores (entre-observadores) na atribuio de categorias de uma varivel categrica. Em ingls este procedimento geralmente designado por interjudge reliability ou interobserver reliability. uma importante medida para determinar o quo bem funciona uma aplicao de alguma medio. A medida estatstica de confiabilidade o kappa de Cohen, descrito em 1960. O kappa uma medida de concordncia intra e entre-observador e mede o grau de concordncia alm do que seria esperado to somente pelo acaso e varia geralmente de 0-1 (embora os nmeros negativos sejam possveis) onde um grande nmero significa maior confiabilidade, valores prximos ou menores que zero sugerem que o acrdo atribuvel ao acaso. Como interpetar o kappa: O Kappa varia de +1 a -1 +1: significa que os dois observadores concordaram perfeitamente. Eles classificaram a todos exatamente da mesma forma 0: significa que no existe nenhuma relao entre as classificaes dos dois observadores, acima da concordncia de acasos que seriam esperadas. -1 significa que os dois observadores classificaram exatamente o oposto. Se um observador diz SIM, o outro sempre diz NO A magnitude da Estatstica k uma medida de concordncia bastante mais significativa do que a sua prpria significncia estatstica. O erro padro da estatstica k permite-nos estimar a sua significncia estatstica e tambm o seu intervalo de confiana de 95%. (Pinto et al). Por exemplo, um ndice kappa de 0,77 com erro padro de 0,03, o seu intervalo de confiana ser: multiplique 0,03 por 1,96=0,058 que semelhante a 0,06 e agora subtraia e some ao ndice kappa e teremos: 0,77 -0,06=0,71 e 0,77 + 0,06=0,82 e o intervalo de confiana ser: 0,71-0,82). significativo por no conter a unidade) (Fescina, 23/6/1988). Segundo Pinto, a sua interpretao considerada sempre subjetiva e se d por comparao dos valores obtidos s faixas de valores para verificao da concordncia. Vamos fornecer dois guias para o uso do ndice kappa em epidemiologia e medicina(tabelas 4 e 5)
Nigel Paneth: kappa > 0,80 : considerado excelente. kappa 0,60 0,80 : considerado bom. kappa 0,40 0,60 : considerado regular. kappa < 0,40 : considerado ruim 106
Tabela 5. ndice kappa Landis & Koch, 1977: Valores de Concordncia-ndice Kappa
Tabela 6. ndice kappa A tabela 5 considerada por demais otimista por alguns autores. Como regra, valores de kappa 0,40-0,59 so considerados moderados, 60-0,79 substancial, e 0,80 excepcional. A maioria dos estatsticos prefere que os valores kappa sejam maiores que 0,6 e na maioria das vezes, superiores a 0,7, antes de reivindicar um bom nvel deconcordncia. importante que se conhea a prevalncia da patologia em estudo na avaliao da concordncia entre-observadores. O valor de k depende da prevalncia da patologia em estudo. Uma grande prevalncia resulta num alto nvel de concordncia esperada pelo acaso, o que resultar num valor de k mais baixo. Por sua vez, uma patologia de baixa prevalncia dar origem valores de k mais altos. Assim, possvel cometer erro ao se basear neste ndice na comparao de dois estudos com prevalncias distintas (Pinto et al). Vejamos exemplos: 1-Variabilidade interobservadores na graduao do tempo de enchimento capilar por enfermeiras e assistentes de enfermeiras . Estudo realizado por Brabrand et al, em 2010 na Dinamarca. O tempo de enchimento capilar influenciado por muitos fatores. Estudos anteriores de variablidade interobservadores envolveram muitos pacientes, mas poucos observadores. O objetivo do estudo foi determinar como um grande grupo de enfermeiras (9) e assistentes de enfermeiras (37) graduariam o etempo de enchimento capilar.O ndice kappa para o valor de normalidade foi de 0,56 e entre classes, 0,62. Os autores consideraram que houve somente um regular acrdo para o valor exato do tempo de enchimento capilar, assim como para a normalidade. Os autores acreditam que o tempo de enchimento capilar deveria ser usado com cuidado na prtica clnica. 2- Avaliao nutricional (descrio da concordncia entre os avaliadores) , do estudo de Beghetto et al. Quando avaliada a concordncia entre o observador de referncia e o segundo observador, considerando-se 4 categorias para o percentual de perda de peso, segundo os autores, foi identificada moderada concordncia entre os observadores (kappa = 0,74; IC95%: 0,63-0,85; p<0,001) e plena concordncia nas duas categorias que agruparam pacientes que perderam > 5% do peso corporal em 6 meses. Considerando-se a classificao do IMC tambm em 4 categorias , foi identificada excelente concordncia entre os observadores (kappa = 0,98; IC95%: 0,95-1,0; p<0,001), quando somente um paciente foi classificado de modo discordante (classificado como eutrfico pelo avaliador de referncia e como sobrepeso pelo avaliador 2). Em relao Avaliao Nutricional subjetiva global (ANSG), avaliada em 3 categorias, foi obtida discreta concordncia entre os observadores (kappa = 0,46; IC95%: 0,31-0,60; p<0,001).
107
3-Concordncia entre avaliadores, na seleo inicial de artigos em estudo de reviso sistemtica com ou sem metanlise (estudo de Oliveira et al). Os autores usaram como exemplo dados da fase inicial do estudo Suplementao de vitamina A em lactantes: reviso sistemtica. Estes constituem o resultado da leitura, realizada por dois avaliadores, de resumos de artigos selecionados, criteriosamente, em bases bibliogrficas eletrnicas. Para cada resumo, foram respondidas as questes: O estudo envolve mulheres no ps-parto?; Trata-se de um estudo com suplementao de vitamina A?; O estudo ensaio clnico?; seguidas da deciso (incluso/excluso) do trabalho. Os dados foram inseridos em planilha Excel, com dupla digitao e uso de procedimento de validao. Utilizou-se o ndice de concordncia kappa para os aspectos: populao, interveno, tipo de estudo e deciso. Foram identificados 2.553 trabalhos. Os ndices de concordncia kappa foram, quanto adequao da populao de estudo: k=0,46; do tipo de interveno: k=0,59; do tipo de estudo: k=0,59 e, sobre a deciso pela incluso/excluso: k=0,44. Com base nas concordncias razovel (tipo de estudo e interveno) e ruim (populao de estudo) observadas entre avaliadores, enfatiza-se a necessidade da leitura inicial dos trabalhos por pelo menos dois avaliadores. Para os casos discordantes, foram realizadas reunies de consenso na busca de diferenas de interpretao entre os avaliadores, visando a diminuio da chance de excluso um artigo que deveria ser includo 4-Do estudo de Jodas et al a respeito da concordncia intra e entre-observadores na deteco das fraturas da face por meio da tomografia computadorizada de pacientes vtimas de traumatismos faciais. Na figura 151, esto os valores dos ndices kappa para cada observador, com uma mdia geral de 0,472 (concordncia moderada). Analisando a concordncia em diferentes regies, os autores relataram que as fraturas observadas nas regies de etmide, corpo mandibular, parede anterior de seio frontal e esfenide, apresentaram ndice de concordncia excelente; as regies de maxila, cndilo mandibular e pirmide nasal, ndice de concordncia substancial; para as regies de parede medial de rbita, parassnfise e ngulo mandibular, soalho e parede lateral de rbitas, ndice de concordncia moderada; para a regio de arco zigomtico, ndice de concordncia considervel; para regio fronto-zigomtica, ndice de concordncia ligeira; para as regies de palato duro, snfise, ramo e processo coronide de mandbula, ndice de concordncia pobre.
108
Fig.151. ndice de Concordncia Kappa (k) entre-observadores (Jodas et al) -Corte LMD e cl analisaram a concordncia entre-observadores em exames de Papanicolaou (Anlise da Concordncia Interobservadores em Exames de Papanicolaou): Embora o exame de Papanicolaou seja um mtodo altamente confivel, ele possui algumas limitaes e tem recebido muita crtica com relao alta taxa de falsos-negativos. A variabilidade interobservadores descreve a falta de reprodutibilidade entre dois ou mais observadores e serve para identificar se os observadores requerem aprimoramento. Para isto, quarenta e sete esfregaos citolgicos crvico-vaginais corados pelo mtodo de Papanicolaou, previamente analisados e classificados segundo o Sistema Bethesda de 2001, foram reescrutinados por sete observadores. Desses, apresentaram um maior grau de concordncia entre os observadores segundo o ndice kappa (0,902 e 0,84, respectivamente) os diagnsticos de negativo para malignidade e de leso intra-epitelial escamosa de baixo grau e, apresentaram um fraco grau de concordncia com ndices de 0,378, 0,321 e 0,135, para o carcinoma de clulas escamosas, as clulas escamosas atpicas de significado indeterminado e clulas escamosas atpicas, no excluindo leso de alto grau, respectivamente. COMO OBTEMOS O CLCULO DO NDICE KAPPA NO SPSS: Vamos usar a base de dados de Tatiane Melo de Oliveira (Anlise psicofsica da escala multidimensional de dor Neonatal Pain, Agitation and Sedation Scale (N-PASS). Os escores da escala N-PASS foram pontuados por 2 observadores (identificados na base de dados como MV e T) 3 min antes (antes), imediatamente aps o procedimento doloroso (durante) e 3 min aps (depois). Este estudo foi apresentado na Residncia Mdica em Pediatria do HRAS como trabalho de concluso de curso, disponvel em www.paulomargotto.com.br (Monografias-2011). importante que saibamos que no SPSS ele s calculado em tabelas 2 x 2, ou seja para comparar dois avaliadores e que apenas atribuam uma classificao dicotmica aos objetos em causa. Para avaliar a concordncia entre dois avaliadores em uma escala ordinal, o coeficiente usado o (tau) de Kendall (mede a associao entre duas variveis medidas por postos). Por exemplo: dois mdicos neonatologistas avaliam o Apgar de seis recm-nascidos. A H0 (hiptese nula) que no h concordncia entre a avaliao deste dois mdicos ou seja coeficiente de correlao de Kendall- de Kendall=0 . A H1(hiptese alternativa) informa que h concordncia entre os mdicos, ou seja de
109
Kendall 0 O nvel de significncia 0,05. Aps a anlise dos valores inseridos, digamos que o de Kendall seja igual a 0,78 (p<0,05). Assim, rejeita-se a hiptese nula e se aceita a H1 que diz que h concordncia entre os mdicos na avaliao do Apgar destes 6 recm-nascidos. Segundo Alvarez, o Kendalltau-b leva em conta os empates; j o Kendalltau-c ignora os empates. Para avaliao de vrios conjuntos de postos dos mesmos indivduos, cujas variveis so medidas em escala ordinal, usado o Kendall coefficient of concordance W. Por exemplo, testar o grau de correlao entre o nvel de desempenho de 3 acadmicos de medicina (6 Srie) e as respectivas avaliaes foram realizadas por 3 professores. A H0 diz que no h concordncia entre os 3 professores, ou seja o Coeficiente de Kendall W = 0 e a H1 diz que h concordncia entre os trs professores, ou seja o Coeficiente de Kendall W 0. O nvel de significncia 0,05. Aps a anlise dos resultados, o coeficiente de Kendall W foi de 0,798 (p<0,05) e assim, aceita-se a hiptese alternativa, ou seja, h concordncia entre os avaliadores. Para a anlise de dois avaliares numa classificao dicotmica: Analyse> Descriptive Statistics e escolha Crosstabs (figura 152).
Fig.152. Analyse> Descriptive Statistics e Crosstabs Em Row selecione da base de dados Npass avaliao total antes MV (observador 1) e em Column selecione Npassavaliao total antes T (observador 2) (figura 153) e em Statistics, marque kappa(figura 154).
110
Fig.153.Crosstabs
Fig.154. Crosstab stastistics Aperte continue e OK e a via de sada do SPSS mostrar o valor kappa (figura 155)
111
Fig.155. Resultado do ndice kappa Interpretao: a correlao entre os observadores antes (kappa de 0,16), durante (kappa 0,28) e depois (0,21) foi ruim, apesar da significncia (como j citado anteriormente, a magnitude da estatstica k uma medida de concordncia bastante mais significativa do que a sua prpria significncia estatstica) A autora explica este achado devido grande subjetividade dos componentes presentes das escalas que avaliam a dor. A melhor concordncia ocorreu no momento durante, pois no momento da presena da dor no to dependente de fatores externos para ser identificada. Diversas pesquisas vem sendo desenvolvidas para se encontrar um padro-ouro de avaliao da dor neonatal. Finalizando, segundo Field A, os procedimentos estatsticos so uma forma de processar nmeros e, portanto, se voc colocar baboseiras em uma anlise mesmo assim obter concluses que tem significado estatstico, mais que provavelmente no tero sentido prtico. Existe uma tentao de ver a estatstica como uma forma milagrosa de determinar a verdade, mas a estatstica somente um recurso. Se voc entra com lixo, voc vai obter lixo. Na anlise estatstica no existe um substituto para o pensamento emprico. A significncia estatstica no implica em importncia clnica (ignorar este fato um dos erros mais freqentes na rea mdica).Tenha sempre isto em mente.
112
REFERNCIAS 1- Wagner MB, Mota VT, Dornelles CC. SPSS Passo a Passo, Educs, Caxias do Sul, 2004 2- Field A. Descobrindo a Estatstica usando o SPSS, Artmed,2 Edio Porto Alegre, 2009 3-Filho Doria U. Introduo a Bioestatstica (Para simples mortais), Negcio Editora, So Paulo, 2 Edio,1999 4-Arango HG.Bioestatstica Terica e Computacional, Guanabara Koogan, Rio de Janeiro,2001 5- Vieira S. Introduo Bioestatstica, Editora Campus, 2 Edio, Rio de Janeiro, 1991 6-Sounis E. Bioestatstica.Princpios fundamentais, metodologia estatstica, Aplicao s Cincias Biolgicas,Livraria Atheneu 7-Bisquerra R, Sarriera JC, Martinez G. Introduo Estatstica. Enfoque Informtico com o Pacote Estatstico SPSS, Artmed, Porto Alegre, 2004
113
8. Margotto PR. Entendendo Bioestatstica Bsica. Boletim Informativo Peditrico (Enfoque Perinatal), No65, Ano 22, Braslia, p.6-108, 2002. Disponvel em www.paulomargotto.com.br, em Entendendo Bioestatstica Bsica (Acessado em 30 de outubro de 2009) 9-Margotto PR. Como exercer a Medicina/Neonatologia baseado em evidncias. In. Margotto PR. Assistncia ao Recm-Nascido de Risco, Hospital Anchieta, 3 Edio, Braslia, no prelo. Disponvel em www.paulomargotto.com.br em Exerccio da Medicina Baseado em Evidncia (Acessado em 20 de outubro de 2009) 10-Penha RN. Um estudo sobre regresso logstica binria. Universidade de Itajub, Instituto de Engenharia Mecnica, Departamento de Produo. Disponvel em UM ESTUDO SOBRE REGRESSO LOGSTICA BINRIA Renata Neves Penha ... (Acessado em 30 de novembro de 2009) 11.Batistela G C, Rodrigues AS, Bononi JTCM. Estudo sobre a evaso escolar usando regresso logstica: anlise dos alunos do Curso de Administrao da Fundao Educacional de Ituverava. Tkhne Lgos, Botucatu, SP, v.1, n.1, p.53-66, out.2009. Disponvel em ESTUDO SOBRE A EVASO ESCOLAR USANDO REGRESSO LOGSTICA: ANLISE ... 12- Programas desenvolvidos na Braile Biomdica S/A. Disponvel em Estatistica (Acessado em 30 de dezembro de 2009) 13-NRM Consultoria Estatstica Ltda. Curso de Estatstica com a Utilizao do SPSS, ESCS, 2009 14.Whelan B, Bennett K et al. Serum sodium as a risk factor for in-hospital mortality in acute unselected general medical patients. QJ Med 2009;102:175-182 15-Silva AP. Curso Bsico de Estatstica utilizando o SPSS. ESCS, julho de 2006 16-Laboratrio de Epidemiologia e Estatstica. Lee - Laboratrio de Epidemiologia e Estatstica (Acessado em 21 de abril de 2010) 17-Botelho F, Silva C, Cruz F. Epidemiologia explicada-anlise de sobrevivncia. Acta Urolgica 2009;26:4:33-38. Disponvel em Epidemiologia explicada Anlise de Sobrevivncia (acessado em 14 de maio de 2010) 18-Aguayo Canela M, Lora Monge E. Cmo hacer paso a paso um anlisis de supervivncia com SPSS para Windows. Fabis (Fundacion Andaluza Beturia para La investigation em salud). Disponvel em Cmo hacer paso a paso un Anlisis de Supervivencia con SPSS ... (acessado em 15 de maio de 2010) 19-Dawson B, Trapp RG. Anlise dos temas de pesquisa sobre sobrevivncia. In. Dawson B, Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3 Edio, 2003, p.187-205 20-Bee JV, Rours IG et al. Chorioamnionitis alters the response to surfactant in preterm infants. J Pediatr 2010;156:10-5 21-Martinez EZ, Lozada-Neto F, Pereira BB. Cadernos Sade Coletiva, Rio de Janeiro 2003;11:7-31 (disponvel em [PDF] A curva ROC para testes diagnsticos 22- Braga ACS. Curvas ROC: Aspectos funcionais e aplicaes. Tese de Doutorado, Universidade do Minho, dezembro de 2003, Portugal 23- Dawson B, Trapp RG. Mtodos da medicina baseada em evidncias. In. Dawson B, Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3 Edio, 2003, p.233-249 24- Maulik D, Yarlagadda P, Youngblood JP, Ciston P. Comparative efficacy of umbilical arterial Doppler ndices for predicting adverse perinatal outcome. Am J Obstet Gynecol 1991;164:1434-1440
114
21-Parry G, Tucker J et al. CRIB II: an update of the clinical risk index for babies score. Lancet 361:1789, 2003 22- Gagliardi L, Cavazza A, et al. Assessing mortality risk in very low birthweight infants: a comparison of CRIB, CRIB-II, and SNAPPE-II. Arch Dis Child Fetal Neonatal Ed. 89:F419, 2004
23-Nigel Panet. Validao, integridade e monitoramento das doenas. Disponvel em: Apresentao do PowerPoint - fosjc.unesp.br. Visualizao rpida . Acesso 24/11/2011
24- Pinto JS, Lopes JM, Oliveira JV, Amaro JP, Costa LD. Mtodos para estimao de reprodutibilidade de medidas [home Page]. Porto Portugal: Faculdade de Medicina do Porto; 2008. D i s p o n v e l e m : ndices::Estatstica Kappa. Acesso em 23/11/2011 25- Jodas CRP, Rapoport A, de Souza RP et al. Anlise da concordncia intra e interobservadores na deteco das fraturas da face por meio da tomografia computadorizada. Rev Bras Cir Cabea Pescoo 2009; 38 26 33. Disponvel em: ArtigoOriginal. Acesso em 20/11/2011 26- Mariur Gomes Beghetto, MG, Luft VC, Mello ED, Polanczyk CA. Avaliao nutricional: descrio da concordncia entre avaliadores. Rev Bras Epidemiol 2007; 10: 506-16. Disponvel em: PDF] Avaliao nutricional: descrio da concordncia entre avaliadores ... Acesso em 18/11/2011 27- Oliveira NS, de Oliveira JM, Bergamaschi DP. Concordncia entre avaliadores na seleo de artigos em revises sistemticas. Rev Bras Epidemiol 2006; : 309-15. Disponvel em: PDF] Concordncia entre avaliadores na seleo de artigos em revises ... Acesso em 21/11/2011 28- Interrater reliability (Kappa) using SPSS . Acesso em 18/11/2011 29- Ludbrook J. Statistical techniques for comparing measurers and methods of measurement: a critical review. Clin Exp Pharmacol Physiol. 2002 ;29:527-36 30-Oliveira TM. Anlise psicofsica da escala multidimensional de dor Neonatal Pain, Agitation and Sedation Scale (N-PASS). Monografia apresentada ao Programa de Residncia Mdica em Pediatria do Hospital Regional da Asa Sul HRAS SES/DF. Disponvel em www.paulomargotto.com.br em Monografias-2011. Acesso em 24/11/2011 31-Fescina. H. Tecnologias perinatales. Centro Latinoamericano de Perinatologia y Desarrollo Humano (CLAP). Pub Cient CLAP No 1166, 1988 10- Laboratrio de Epidemiologia e Estatstica. Lee - Anlise de Concordncia Kappa. Acesso em 20/11/2011 32-Braband M, Hosbond S, Folkestad L. Capillary refill time: a study of interobserver reliability among nurses and nurse assistants. Eur J Emerg Med 2010, May 27 33- Ajuda do BioEstat 3.0 Ayres , Jr.Aires M, Ayres DL, dos Santos AAS. BioEstat, Belm,
Par, 2007. Acesso em 18/12/2011
34- [PDF] Tema 3 Tablas lvarez MMR. UNIVERSIDAD DE JAN. Material del curso Anlisis de datos procedentes de investigaciones mediante programas informticos. Acesso em 15/12/2011 35- Anlise da Concordncia Interobservadores em Exames de ...Corte MD, Gonalves JC, Silva CS et al. Anlise da concordncia interobservadores em exames de Papanicolaou.NewLab, Edio 80, 2007 36.NRM Consultoria Estatstica Ltda. Curso de Estatstica com a utilizao do SPSS,Porto Alegre, 2010 37.Motta VT Oliveira FPF. SPSS-Anlise de dados biomdicos, Editora Cientfica Ltda, 2009 (arquivos retirados do site www.medbooeditora.com.br). Acesso em, 31/12/2011
115
Torture os nmeros e eles admitiro qualquer coisa Nota: este texto ser continuamente revisado e ampliado medida quer for sendo discutido com os estudantes do 6 Ano da Escola Superior de Cincias da Sade (ESCS) /SES/DF (Faculdade de Medicina da Secretaria de Estado de Sade do Distrito Federal). Pesquisado, digitado, revisado por Paulo R. Margotto www.paulomargotto.com.br pmargotto@gmail.com.br Braslia, 01 de janeiro de 2012
116

SPSS o Essencial

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SPSS o Essencial

Uploaded by

Copyright:

Available Formats

ESTATSTICA COMPUTACIONAL USO DO SPSS (STATISTICAL PACKAGE FOR THE SOCIAL SCIENCES): O ESSENCIAL

Paulo R. Margotto www.paulomargotto.com.br pmargotto@gmail.com

ESCOLA SUPERIOR DE CINCIAS DA SADE SECRETARIA DE ESTADO DE SADE DO DISTRITO FEDERAL

Torture os nmeros e eles admitiro qualquer coisa

Fig. 1-Janela SPSS for Windows com a Caixa de Dilogos

aos valores de uma

II - COMO CRIAR UM BANCO DE DADOS

Figura 6.Caixa de dilogo Save Data As

III- ESTATSTICAS DESCRITIVAS

Fig. 7.Construo de Tabelas de Freqncias (observem a caixa de dilogo de Frequencies)

Fig. 9. Seleo das variveis

Figura 13. Caixa de dilogo para seleo de variveis no comando Descriptive

Fig.14.Estatstica do Comando Descriptive

Fig.18.Caixa de dilogo Plots

Fig.20. Output viewer do comando Explore

Fig.22. Grfico Boxplot de idade gestacional e uso de corticosteride pr-natal

IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS

Fig.23. Menu Transform em detalhe

Fig.24. Seleo do comando Compute

Fig.25. Definio da expresso numrica da nova varivel IP

a tabela clicando o boto direito do mouse e

Fig.27. Como ativar o Pivot Table Object

Uma vez pressionado Open, teremos (Figura 28)

Fig.30. Caixa de dilogo Split File

Fig.34. Resultados do comando Split File>Organize output by group

Fig.35. Caixa de dilogo Split File

Fig.37. Caixa de dilogo Select Cases

Clicar Clculo de tamanho de amostra

Clicar em envia e teremos:

Fig.43. Resultados da janela Output Viewer

Fig.46. Caixa de dilogo Independent Sample T-test

Fig. 49: Menu Analyze>Compare Means>Paired-Simples T-test

-Selecione as duas variveis emparelhadas e coloquem-nas no Paired Variables(s) (Figura 50)

Fig. 52 Resultado do teste t para amostras emparelhadas

V-2. Anlise de Varincia, Teste F ou Teste de Tukey

Fig.54. Caixa de dilogo One-Way ANOVA

Fig. 57. Resultados do comando One-Way-ANOVA

Between Groups Within Groups Total

Fig.62. Resultados do comando One-Way ANOVA

Fig.65. Chi-Square test

Clicar em OK e a sada do SPSS mostrar (figura 66)

Fig.68. Caixa de dilogo do Crosstabs

Clicar em Cells e selecionar em Counts: Observed e em Percentages: Row (Figura 69)

Fig.70. Caixa de dilogo do Crosstabs:Statistics

V-4- Risco Relativo e Odds Ratio

Fig.72. Caixa de dilogo Crosstabs: Statistics

Clculos estatsticos bsicos relacionados ao Risco Relativo

sim 150 130

272 310 582

55,1 % 41,9 % 1,32 0,32 13,2 % 8

49,2 36,4 1,11 0,56 21,3 19

61,1 47,4 1,56 0,11 5,1 5

Observao: Valores em Vermelho so valores negativos

Evento Presente Ausente TOTAL Estudo 30 40 70

Utilize apenas as caselas de cor laranja para digitar os dados.

(<0,20=pobre;0,21-0,40=fraca;0,41-0,60=moderada; 0,61-0,80=boa;>0,80=muito boa)

Clculos estatsticos bsicos para Testes Diagnsticos (verso 1999)

29,4 45,3 50,6 45,3 29,4 39,2

51,7 72,3 67,8 72,3 51,7 56,8

VI-CORRELAO E REGRESSO LINEAR SIMPLES

Fig.75. Menu Graphs>Scatter

Fig.78. Resultado do Scatterplot para as variveis peso e estatura

Fig.81. Menu Analyze>Correlate>Bivariate