You are on page 1of 39

Estatstica Descritiva

(II)

Arquivo PULSE do Minitab


Refere-se a um experimento feito por
alunos. Cada um deles registrou sua
altura, peso, sexo, hbito de fumar e nvel
de atividade fsica. Depois, todos eles
jogaram moedas e aqueles que tiraram
CARA fizeram corrida estacionria por
1 minuto,
minuto registrando a pulsao antes de
correr e a pulsao depois de correr. Os
demais registraram a pulsao aps 1
minuto, mesmo sem ter corrido.

Informaes do arquivo PULSE


MTB > INFO
Information of the worksheet
Column
C1
C2
C3
C4
C5
C6
C7
C8

Count
92
92
92
92
92
92
92
92

Name
Pulse1
Pulse2
Ran
Smokes
Sex
Height
Weight
Activity

1- fez corrida
1- fuma

2- no fez corrida

2- no fuma

1- masculino 2- feminino

0- no tem 1- leve
2- moderada 3- intensa

Planilha (parcial)
Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity
1
2
3
4
5
6
7
8

64
58
62
66
64
74
84
68

88
70
76
78
80
84
84
72

1
1
1
1
1
1
1
1

2
2
1
1
2
2
2
2

1
1
1
1
1
1
1
1

66,00
72,00
73,50
73,00
69,00
73,00
72,00
74,00

140
145
160
190
155
165
150
190

2
2
3
1
2
1
3
2

Ran

Variveis qualitativas

Smokes

Nominal

Sex
Activity

Variveis quantitativas

Pulse 1

Ordinal

Discreta

Pulse 2
Height
Weight

Contnua

Variveis Quantitativas
Medidas de posio
Mdia (x)
Mediana (md)
Quartis (Q1, Q3)
Mximo (mx)
Mnimo (min)

Medidas de disperso
Varincia (s2)
Desvio padro (s)
Intervalo-interquartil (Q3 Q1)
Coeficiente de variao (CV)

Variveis quantitativas no arquivo PULSE


MTB > DESCRIBE C1 C2 C6 C7
Descriptive Statistics
Variable
Pulse1
Pulse2
Height
Weight
Variable
Pulse1
Pulse2
Height
Weight

Mean

Median

92
92
92
92

72,87
80,00
68,72
145,15

71
76
69
145

Min

Max

Q1

48
50
61
95

100
140
75
215

64
68
66
125

Tr Mean

72,61
78,85
68,78
144,52
Q3

80,0
87,0
72,0
156,5

StDev

11,01
17,09
3,66
23,74

SE Mean

1,15
1,78
0,38
2,48

Descrevendo a pulsao em repouso segundo o sexo


MTB > DESCRIBE C1;
SUBC> BY C5.
Variable Sex N
Pulse1
1 57
2 35
Variable Sex
Pulse1
1
2

Mean Median TrMean


70,42
70
70,27
76,86
78
76,65

Min
48
58

Max
92
100

Q1
63
66

Q3
75
86

StDev SE Mean
9,95
1,32
11,62
1,96

Os dados tambm podem ser resumidos


construindo-se uma tabela de distribuio
de freqncias .
Distribuio de freqncias de uma varivel
uma lista dos valores individuais ou dos
intervalos de valores que a varivel pode
assumir, com as respectivas freqncias de
ocorrncia.

No arquivo PULSE

MTB > tally c1

No h perda
de informao

Summary Statistics for Discrete Variables


Pulse1 Count Percent
48
1
1,09
54
2
2,17
58
3
3,26
60
4
4,35
61
1
1,09
62
9
9,78
64
4
4,35
66
5
5,43
68
11
11,96
70
6
6,52
72
6
6,52
74
5
5,43
76
5
5,43
78
5
5,43
80
3
3,26
82
3
3,26
84
4
4,35
86
1
1,09
87
1
1,09
88
3
3,26
90
4
4,35
92
2
2,17
94
1
1,09
96
2
2,17
100
1
1,09
N=
92

Alternativa: construir intervalos de classe


Classe de pulsao
48 |54 |60 |66 |72 |78 |84 |90 |96 |-

54
60
66
72
78
84
90
96
102

frequncia
1
5
18
22
16
11
9
7
3

Informaes mais
resumidas

Perda de informao

Exemplo 2:

Construir
contnua
Varivel: altura ( height)
intervalos
Distribuio de freqncia para altura ( arquivode classe
PULSE)

Classes de altura f
60,25 |- 61,75
61,75 |- 63,25
63,25 |- 64,75
64,75 |- 66,25
66,25 |- 67,75
67,75 |- 69,25
69,25 |- 70,75
70,75 |- 72,25
72,25 |- 73,75
73,75 |- 75,25
Total

fr
1
10
2
13
7
20
7
15
9
8
92

0,011
0,109
0,022
0,141
0,076
0,217
0,076
0,163
0,098
0,087
1

Variveis Quantitativas
Grficos
Dotplot

Boxplot
Histograma

DOTPLOT
Arquivo PULSE Dotplot da pulsao em
repouso (PULSE1)
MTB > DOTPLOT C1
.
.
:
:
:
:
. : : : . . .
. : : : : : : : : : : . . :
. :
.
:
: :.: : : : : : : : : : : : ..: : : . :
.
---+---------+---------+---------+---------+---------+50
60
70
80
90
100

Pulse1

Arquivo PULSE Dotplot da pulsao em repouso


(PULSE1) segundo Sexo (SEX)
MTB > DotPlot 'Pulse1' ;
SUBC> Same;
SUBC> By 'Sex'.
:
Sex 1
:
: :
.
. : . . : : : : .
.
.
:
: : : : : : : : : : . . . :
. : :
--+---------+---------+---------+---------+---------+-

Sex 2

.
.
:
. ..: . : :
:
: : : : : ..: .
. :
.
--+---------+---------+---------+---------+---------+50
60
70
80
90
100
Pulse1

Boxplot
Representa os dados atravs de um
retngulo construdo com os quartis e
fornece informaes sobre os valores
extremos.

Construo

LS=Q3+1,5(Q3-Q1)

Mximo

Q3
Mediana

Q1

75%
50%

25%

Mnimo
LI=Q1-1,5(Q3-Q1)
Mximo o maior valor menor que LS;
Mnimo o menor valor maior que LI.

Exemplo: Tempo de sobrevivncia (dias)


Dados ordenados (n=36)
md = 41,5 Q1 = 30,25
18 21

21

23

23

25

27

29

30

31

32

32

32

34

35

36

38

41

42

42

43

44

45

46

46

47

48

50 54

56

57

58

60 61

Q3 = 49,5
120

*
*

100

80

98 116
60

Observaes discrepantes?

40

20

LI = Q1 - 1,5(Q3 - Q1) =1,38


LS = Q3 + 1,5(Q3 - Q1) =78,38

Arquivo PULSE Boxplot da pulsao em repouso


(PULSE1)
MTB > BOXPLOT C1

Alguns Comentrios:
no h observaes discrepantes;

a distribuio dos valores aproximadamente simtrica.

Arquivo PULSE Boxplots da pulsao em repouso

(PULSE1)
PULSE1 por sexo (SEX)
SEX
MTB > BOXPLOT C1*C5

Alguns Comentrios:
no h observaes discrepantes;

as medidas de posio so maiores para o sexo feminino;


no h fortes evidncias de assimetria nos dois grupos.

Histograma
Agrupar os dados em intervalos de classes
(distribuio de freqncias)
Bases iguais
Construir um retngulo para cada classe, com base
igual ao tamanho da classe e altura proporcional
freqncia da classe (f).
Bases diferentes
Construir um retngulo para cada classe, com base igual
ao tamanho da classe e rea do retngulo igual a
freqncia relativa da classe(fr). A altura ser dada por
h = fr/base (densidade de freqncia).

Arquivo PULSE Histograma da altura (Height)


Distribuio de freqncia
para altura (arquivo PULSE)
60,25 61,75
61,75 63,25
63,25 64,75
64,75 66,25
66,25 67,75
67,75 69,25
69,25 70,75
70,75 72,25
72,25 73,75
73,75 75,25
Total

fr
1
10
2
13
7
20
7
15
9
8
92

0,011
0,109
0,022
0,141
0,076
0,217
0,076
0,163
0,098
0,087
1

20

Frequency

Classe de altura f

MTB > HIST C6

10

0
61,0 62,5 64,0 65,5 67,0 68,5 70,0 71,5 73,0 74,5

Height

Exemplo:
Exemplo Classes desiguais
h
0,10

Vacinao Infantil
Classes (meses)

0,08

fr

0 |- 3

140

0,28

0,093

3 |- 12

100

0,20

0,022

12 |-24

80

0,16

0,013

24 |-60

180

0,36

0,010

Total

500

1,00

0,06
0,04
0,02

12

24

60

12

24

60

Forma da Distribuio

Variveis Qualitativas
Os dados podem ser resumidos construindose uma tabela de distribuio de freqncias,
que quantifica a freqncia das distintas
categorias.
Variveis qualitativas no arquivo PULSE
Ran
Smokes
Sex
Activity

Variveis qualitativas no arquivo PULSE


MTB > Tally 'Sex' 'Smokes' 'Activity';
SUBC> Counts;
SUBC> Percents.
Summary Statistics for Discrete Variables
Sex
1
2
N=

Count
57
35
92

Percent
61,96
38,04

Activity
0
1
2
3
N=

Smokes
1
2
N=

Count Percent
1
1,09
9
9,78
61
66,30
21
22,83
92

Count
28
64
92

Percent
30,43
69,57

Podemos tambm construir tabelas de freqncias


conjuntas (tabelas de contingncia), relacionando
duas variveis qualitativas.
Exemplo 1:
1 H indcios de associao entre Sexo e
Hbito de fumar?
Sexo
Masculino
Feminino
Total

Hbito de Fumar
Fuma No Fuma
20
37
8
27
28
64

Total
57
35
92

Qual o significado dos valores desta tabela?


Como concluir?

MTB > Table 'Sex' 'Smokes';


SUBC> Counts.
Rows: Sex

1
2
All

Columns: Smokes
1

All

20
8
28

37
27
64

57
35
92

Verificar associao atravs da:


- porcentagem segundo as colunas, ou
- porcentagem segundo as linhas.
Sexo
Masculino
Feminino
Total

Hbito de Fumar
Fuma No Fuma
Total
71,43%
57,81%
61,96%
28,57%
42,19%
38,04%
100%
100%
100%

Qual o significado dos valores desta tabela?


Como concluir?

MTB > Table 'Sex' 'Smokes';


SUBC>
ColPercents.
(RowPercents/TotPercents)
Rows: Sex

Columns: Smokes
1

1
2
All

71,43
28,57
100,00

2
57,81
42,19
100,00

All
61,96
38,04
100,00

MTB > Table 'Sex' 'Smokes';


SUBC> Counts;
SUBC> RowPercents.
Rows: Sex

Columns: Smokes
1
2
All
1
20
37
57
35,09
64,91
100,00
2
8
27
35
22,86
77,14
100,00
All
28
64
92
30,43
69,57
100,00
Cell Contents Count - % of Row

Exemplo 2: Dentre os que correram, qual a


porcentagem de mulheres?
MTB > Table 'Ran' 'Sex';
SUBC> Counts;
SUBC> RowPercents.
Rows: Ran
1
2
All

Columns: Sex
1
2
All
24
11
35
68,57
31,43
100,00
33
24
57
57,89
42,11
100,00
57
35
92
61,96
38,04
100,00

Resposta: 31,43%

Variveis Qualitativas
Grficos
Grfico de setores
Grfico de barras

Grfico de setores
Um crculo dividido em tantos setores
quantas forem as categorias da varivel.
A rea de cada setor proporcional
freqncia da categoria

Arquivo PULSE Grfico de setores para


a varivel Ran
MTB > %Pie c3.
Pie Chart of Ran

1 (35; 38,0%)

2 (57; 62,0%)

Arquivo PULSE Grfico de setores para


a varivel Activity

Grfico de barras
Sobre um eixo, so representados
retngulos, um para cada categoria da
varivel. A altura do retngulo
proporcional freqncia da categoria

Arquivo PULSE Grfico de barras para a


varivel RAN
MTB > Chart C3
60

Count of Ran

50
40
30
20
10
0
1

Ran

Arquivo PULSE Grfico de barras para a


varivel Activity
MTB > Chart C8

60

Count of Activity

50
40
30
20
10
0
0

Activity

You might also like