You are on page 1of 14

Introduo Bioestatstica

Marcelo Azevedo Costa Depto. Estatstica UFMG http://www.est.ufmg.br/~azevedo/

Avaliaes
3 Provas de 30 pontos cada 1a Prova: 16/09 (M2) 18/09 (N2) 2a Prova: 21/10 (M2) 23/10 (N2) 3a Prova: 25/11 (M2) 27/11 (N2) Listas de exerccios: 10 pontos Bibliografia: Introduo Bioestatstica Mdica
Jos Francisco Soares, Arminda Lucia Siqueira

Princpios de Bioestatstica
Marcello Pagano & Kimberlee Gauvreau

Noes de Probabilidade e Estatstica


Marcos Nascimento Magalhes Antnio Carlos Pedroso de Lima

Introduo
Convencionou-se chamar de Bioestatstica o conjunto de mtodos estatsticos usados no tratamento da variabilidade nas cincias mdicas e biolgicas. A Bioestatstica fornece mtodos para se tomar decises timas na presena de incerteza, estabelecendo faixas de confiana para a eficcia dos tratamentos e verificando a influncia de fatores de risco no aparecimento de doenas.

Definies
Descritiva: anlise inicial dos dados (informal) Estatstica Probabilidade: teoria matemtica Inferncia: extrapolao (populao) Populao: conjunto de todos os indivduos de interesse Amostra: subconjunto da populao o mais parecido possvel com a respectiva populao sem reposio Amostra com reposio

Definies
Varivel: caracterstica de interesse
Qualitativa varivel Quantitativa Nominal : ex. [sim, no], [A, B, C] Ordinal : ex. [quente, morno, frio] Discreta Contnua

Frequncia absoluta: contagem da ocorrncia de valores de varivel Frequncia relativa:

f =

nmero de ocorrncia de um determinad o valor nmero total de ocorrncias

Definies
Variveis quantitativas discretas podem ser vistas como resultantes de contages, assumindo assim, em geral, valores inteiros. Variveis quantitativas contnuas assumem valores em intervalos dos nmeros reais e, geralmente, so provenientes de uma mensurao.

Estatstica Descritiva
Descobrindo o bvio?
O que parece ser simplesmente uma foto de gros de caf, porm no . Existe a face de um homem entre os gros. Segundo dizem, se voc conseguir encontrar o homem em 3 segundos ou menos a sua parte direita do crebro mais desenvolvida do que a maioria.

Interpretando Grficos

Descrio e Apresentao de Dados (Estatstica Descritiva)


Exemplo: Em 1969 foi realizado um estudo na populao de Honolulu. Para 7.683 indivduos foram pesquisadas as seguintes variveis: nvel educacional, peso (kg), altura (cm), idade (anos), glicemia (mg/dL), colesterol srico (mg/dL) e presso sistlica (mmHg). Cada indivduo foi classificado quanto ao hbito

Base de Dados
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 EDUCATIONA L LEVEL W EIGHT (KG) HEIGHT (CM) 2 1 1 2 2 4 1 3 5 2 4 1 1 2 3 4 3 5 1 4 1 3 70 60 62 66 70 59 47 66 56 62 68 65 56 80 66 91 71 66 73 59 64 55 165 162 150 165 162 165 160 170 155 167 165 166 157 161 160 170 170 152 159 161 162 161 AGE 61 52 52 51 51 53 61 48 54 48 49 48 55 49 50 52 48 59 59 52 52 52 SMOKING STATUS 1 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 1

PHISICAL ACTIVITY AT HOME 1 2 1 1 1 2 1 1 2 1 2 1 2 1 2 2 1 2 2 1 1 1

BLOOD GLUCOSE 107 145 237 91 185 106 177 120 116 105 109 186 257 218 164 158 117 130 132 138 131 88

SERUM CHOLESTERO L 199 267 272 166 239 189 238 223 279 190 240 209 210 171 255 232 147 268 231 199 255 199

SYSTOLIC BLOOD PRESSURE 102 138 190 122 128 112 128 116 134 104 116 152 134 132 130 118 136 108 108 128 118 134

Introduo aos Grficos


Grficos
Disco Barras (varivel versus frequncia) Histograma (polgono de frequncia)

Histograma (original): varivel versus densidade. Possui rea total igual a 1.


Retngulos contguos com rea igual frequncia relativa (densidade de frequncia). As densidade de cada faixa podem ser obtidas dividindo-se a frequncia relativa pela amplitude da faixa.

Tabela de Frequncia
Varivel valor 1 valor 2
M

ni

fi

fac

valor p Total

n=

fac = frequncias acumuladas

x A B C Total

ni 38 20 42 100

fi 0,38 0,20 0,42

fac 0,38 0,58 1,00

Educational Level
Histogram of EDUCATIONAL LEVEL
35 30 25 Frequency 20 15 10 5 0 1 2 3 EDUCATIONAL LEVEL 4 5

Education Level Mdia Erro padro Mediana Modo Desvio padro Varincia da amostra Curtose Assimetria Intervalo Mnimo Mximo Soma Contagem 2.47 0.124279743 2 2 1.242797431 1.544545455 -0.487335589 0.617576359 4 1 5 247 100

Pie Chart of EDUCATIONAL LEVEL 5 10; 10.0% 4 9; 9.0% Category 1 2 3 4 5

1 25; 25.0%

3 24; 24.0% 2 32; 32.0%

Grfico de Densidade
Histogram of EDUCATIONAL LEVEL
0.35 0.30 0.25 Density 0.20 0.15 0.10 0.05 0.00 1 2 3 EDUCATIONA L LEVEL 4 5

Weight (Kg)
Weight (kg)
Histogram of WEIGHT (KG)
25 20

15

10

Mdia Erro padro Mediana Modo Desvio padro Varincia da amostra Curtose Assimetria Intervalo Mnimo Mximo Soma Contagem
48 54 60 66 72 WEIGHT (KG) 78 84 90
90

64.22 0.861004816 62.5 61 8.610048159 74.13292929 0.217713019 0.560906421 44 47 91 6422 100

Frequency

0
Boxplot of WEIGHT (KG)

80 WEIGHT (KG)

70

60

50

Frequncia Acumulada - Weight (kg)


25 20
Freqncia

Histograma - Weight (kg )


120.00% 100.00% 80.00% 60.00%

15 10 5 0
47 69 .6 64 .2 60 .8 55 .4 51

Bloco 47 51.4 55.8 60.2 64.6 69 73.4 77.8 82.2 86.6 Mais

Freqncia % cumulativo 1 1.00% 3 4.00% 11 15.00% 22 37.00% 16 53.00% 20 73.00% 14 87.00% 6 93.00% 4 97.00% 2 99.00% 1 100.00%

40.00% 20.00% 0.00%

Bloco

s ai M .6 86 .2 82 .8 77 .4 73

Freqncia

% cumulativo

Medidas de Posio (Tendncia Central)


1. Mdia (amostral) Sejam x1, x2, ..., xn observaes da varivel X
n

x
x=
i =1

n x
ou na forma:

i i

x=

i =1

=
i =1

ni xi n

2. Mediana md: o valor que ocupa a posio central dos dados ordenados tambm representada como: 1. Moda mo: o valor mais frequente. exemplo, seja a sequncia: {98, 102, 100, 99, 97, 100, 96, 95, 99, 100}

~ x

Mdia versus Mediana


x

Mdia Mediana

amostra

Medidas de Disperso
1. Amplitude: a diferena entre o maior e o menor valor do conjunto de dados. 2. Varincia (amostral)

1 n 2 1 n = ( xi x ) = x 2 x i n i =1 n i =1
2

1 n S = (xi x ) n 1 i =1
2

3. Desvio Padro

= 2

dp = var

Percentis e Quartis
Percentil: o percentil de ordem 100p de um conjunto de valores dispostos em ordem crescente um valor tal que (100p)% das observaes esto nele ou abaixo dele e, 100(1-p)% esto nele ou acima dele. Quartis: os percentis de ordem 25, 50 e 75 so chamados quartis. Representam-se por Q1, Q2 (mediana) e Q3. OBS: Q1 deixa pelo menos 25% dos dados abaixo e pelo menos 75% dos dados acima dele

10

BoxPlot
um grfico que apresenta simultaneamente vrias caractersticas de dados: locao, disperso, simetria e presena de observaes discrepantes (outliers)
Q 1 1, 5 (Q 3 Q 1 )
Q1 3 (Q3 Q1 )

Q 3 + 1, 5 (Q 3 Q 1 )

Q1

~ x

Q3

Q1 + 3 (Q3 Q1 )

*
Intervalo de valores extremos menor ponto observado no intervalo maior ponto observado no intervalo Intervalo de valores extremos

x
Provveis Outliers

Provveis Outliers

[Q1 1.5 (Q3 Q1 ); Q1 ]

[Q3 ; Q3 +1.5 (Q3 Q1 )]

BoxPlot

x1 x 2 L

x 10

11

Comparao de Grupos
Boxplot of sem trat.; com trat.
30 30

Boxplot of sem trat.; com trat.

25

25

20 20 Data Data sem trat. com trat. 15

15

10 10 5 5

0 sem trat. com trat.

Droga 1

Droga 2

Causas do aparecimento de outliers


Leitura, anotao ou transcrio incorreta dos dados. Erro na execuo do experimento ou na tomada da medida. Mudanas no controlveis nas condies experimentais ou dos pacientes. Caractersticas inerente varivel estudada (por exemplo, grande instabilidade do que est sendo medido)

12

Exerccios
Foram feitas medidas em operrios da construo civil a respeito da taxa de hemoglobina no sangue (gramas/cm3) A partir do histograma gerado obtenha: a) A mediana (Q2) b) Os quartis (Q1 e Q3)
Histogram of x
0.30
25

Histogram of x

0.25

20

0.20 Density
Percent 15

0.15

10

0.10
5

0.05

0.00 11.2 12.0 12.8 13.6 x 14.4 15.2 16.0 16.8

0 11.2 12.0 12.8 13.6 x 14.4 15.2 16.0 16.8

Histograma (Exerccio)
Histogram of x
0.30

23.33%
0.25

20%
0.20 Density

20%

0.15

0.10

10% 6.67%

10% 6.67% 3.33%

0.05

0.00 11.2 12.0 12.8 13.6 x 14.4 15.2 16.0 16.8

13

Altura os alunos de Bioestatstica


Boxplot of altura
2.3 2.2 2.1 2.0 altura 1.9 1.8 1.7 1.6 1.5

Altura os alunos de Bioestatstica (b)


Boxplot of altura
1.90

1.85

1.80

altura

1.75

1.70

1.65

1.60

14

You might also like