You are on page 1of 15

NOÇÕES DE ESTATÍSTICA (RESUMO)

Frequentemente assistindo à televisão, lendo jornais ou revistas, nos


deparamos com gráficos, tabelas que nos dão muitas informações, como
índices de inflação, consumo de água, taxa de desemprego, taxa de
mortalidade infantil.
A todas essas informações devemos inicialmente colher dados, em
seguida organizá-los e analisá-los.
Para chegarmos ao resultado desejado utilizamos a Estatística.

A estatística pode ser entendida como sendo um campo da matemática


aplicada que tem por objetivo: coletar, organizar, descrever, analisar e
interpretar dados.

POPULAÇÃO

É o conjunto de objetos, de indivíduos ou de ocorrência na


observação de grupos.

Exemplos:

• Conjunto de estudantes do ensino fundamental de uma escola.


• Conjunto de pessoas que moram num condomínio fechado.

AMOSTRA

É uma parte dessa população; isto é, um subconjunto do universo


estudado.

FREQÜÊNCIA ABSOLUTA

Freqüência absoluta de uma variável é dada pelo número de vezes


que essa variável aparece no conjunto considerado.

FREQÜÊNCIA RELATIVA

É a razão entre a freqüência absoluta e o número total de elementos


do conjunto.
A freqüência relativa é dada em porcentagem.
FREQÜÊNCIA ABSOLUTA ACUMULADA

A freqüência absoluta acumulada é obtida adicionando-se a cada


freqüência absoluta os valores das freqüências anteriores.

Exemplo:

A tabela mostra a distribuição das idades dos jogadores de um time


de futebol.

Número de Idade Freqüência Freqüência absoluta Freqüência


jogadores (em anos) absoluta acumulada relativa
4 18 4 4 14 %
6 20 6 10 20 %
3 21 3 13 10 %
7 23 7 20 24 %
2 24 2 22 6%
8 25 8 30 26 %
TOTAL 30 30 100 %

GRÁFICOS

Podemos representar graficamente a distribuição de freqüências de


um levantamento estatístico.

As representações gráficas mais utilizadas são:

Gráfico de segmentos.

É representado pela união dos segmentos de reta.

200

150
Norte Gráficos de setores
100 Oeste
Leste
50

0
1° 2° 3° 4°
Trim Trim Trim Trim 1° Trim
2° Trim
3° Trim
4° Trim
Gráficos de barras Gráficos de colunas

100
4° Trim
80
3° Trim Norte
60 Leste
Oeste
Oeste
2° Trim Leste 40
Norte
1° Trim 20

0 50 100
0
1° Trim 2° Trim 3° Trim 4° Trim

DISTRIBUIÇÃO DE FREQÜÊNCIAS
COM DADOS AGUPADOS

Observando-se as “mesadas” dos alunos da Turma A do colégio X,


foram obtidos os seguintes valores em reais:

800 500 700 400 200


400 800 200 800 200
400 700 400 800 700
500 700 300 900 1000

Com esses dados, vamos construir uma tabela de freqüências


absoluta e relativa.

Para determinarmos a distribuição absoluta, organizaremos as


mesadas em ordem crescente (rol).

200 200 200 300 400


400 400 400 500 500
700 700 700 700 800
800 800 800 900 1000

Observamos que a menor mesada é de 200 reais e a maior é 1 000


reais.

A variação de mesadas é 1 000 – 200 = 800.

Esse valor é chamado de amplitude total.

Podemos agrupar esses valores em intervalos de classe (são


intervalos de variação dos dados observados) da seguinte forma:
Como a menor mesada é de 200 reais e a maior é de 1 000 reais,
podemos agrupá-los em intervalos de amplitude 200, ou seja:

200 ├── 400 4 alunos


400 ├── 600 6 alunos
600 ├── 800 4 alunos
800 ├──┤1000 6 alunos

Nesse caso, 200 é o limite inferior e 1 000 é o limite superior da


classe.

A diferença entre o limite superior e o limite inferior é igual à


amplitude da classe.

No intervalo 400 ├── 600, por exemplo, podemos determinar o ponto


médio do intervalo.

(400 + 600) ÷ 2 = 500.

Assim, podemos construir a tabela de freqüência com classes.

Mesadas (reais) Freqüência Freqüência Freqüência Freqüência


absoluta absoluta relativa relativa
acumulada acumulada

200 ├── 400 4 4 20 % 20 %

400 ├── 600 6 10 30 % 50 %

600 ├── 800 4 14 20 % 70 %

800 ├──┤1 000 6 20 30 % 100 %

20 100 %

REPRESENTAÇÃO GRÁFICA DE UMA


DISTRIBUIÇÃO DE FREQÜÊNCIAS

Uma distribuição de freqüências, ao ser representada graficamente,


tem por objetivo fornecer informações analíticas de uma maneira mais
rápida. A sua representação gráfica se faz através do histograma, ou
polígono de freqüência.
HISTOGRAMA

É formado por um conjunto de retângulos justapostos, onde no eixo


das abscissas temos os intervalos de classes e no eixo das ordenadas, as
freqüências.

Exemplo:

Consideremos a tabela que representa as médias de 100 alunos do 3º


ano do ensino médio do Colégio Alfa, em Matemática.

Classes fi fa
0 ├── 2 40 40
2 ├── 4 30 70
4 ├── 6 10 80
6 ├── 8 15 95
8 ├── 10 5 100
Fonte: Secretaria do Colégio

fi: freqüência absoluta.


fa: freqüência acumulada.

POLÍGONO DE FREQÜÊNCIA

È o gráfico em linha, sendo as freqüências marcadas sobre


perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos
intervalos de classe.
MEDIDAS DE TENDÊNCIA CENTRAL (OU DE POSIÇÃO)

As medidas de posição nos mostram a localização dos elementos da


amostra quando esta é disposta em rol.

MÉDIA ARITMÉTICA ( X )

Considerando um grupo de 20 pessoas com 22, 20, 21, 24 e 20 anos,


observamos que:

22 + 20 + 21 + 24 + 20 107
x= = = 21,4
5 5

Calcular a média aritmética ponderada de um aluno que obteve no


bimestre 8,0 (peso 2), 7,0 na pesquisa (peso 3), 9,0 no debate (peso 1) e
5,0 no trabalho de equipe (peso 2).

8x2 + 7x3 + 9x1 + 5x2 56


x= = =7
8 8

LEMBRETE: SOMATÓRIO

Exemplo:

1) Calcular o somatório ∑ n² .
n =1

Resolução:
5

∑ n²
n =1
= 1² + 2² + 3² + 4² + 5² = 55
ATENÇÃO !

Usa-se também o símbolo de somatório para representar média aritmética.

1. Para valores discretos:


n

∑ xi
x= i =1

n
Exemplo:

1) As alturas dos jogadores de um time de basquete são 1,98 m; 2,02 m;


2,08 m; 1,92 m e 1,95 m. Qual é a média de altura desse time?

Resolução:
5

∑ xi 1,98 + 2,02 + 2,08 + 1,92 + 1,95


x= i =1
= = 1,99 m
5 5

2 . Para valores agrupados em classes.

Quando os dados estão agrupados, aceita-se, por convenção, que


as freqüências se distribuem uniformemente ao longo da classe e que,
portanto, o ponto médio da classe é o valor representativo do
conjunto.
Nesse caso, a média é calculada partindo-se do ponto médio da
classe.
n

∑ fi.xi
x= i =1
n

∑ fi
i =1

Onde: fi: freqüência da classe.


xi: ponto médio da classe.
Exemplo:
Consideremos a tabela que representa as notas de 45 alunos do
3º Colegial em Física, no Colégio Alfa.

Classes Xi fi n
0 ├── 2
2 ├── 4
1
3
3
9
∑ fi.xi
4 ├── 6 5 10
x= i =1
n
6 ├── 8
8 ├── 10
7
9
15
8
∑ fii =1

3.1+ 9.3+10.5+15.7+ 8.9


x= = 5,71
45

MODA ( Mo)

Define-se como moda de uma série de números ao valor que ocorre


com a maior freqüência.

Exemplo:
15, 17, 15, 18, 17, 16, 18, 17, 14, 17, 15

Mo = 17.

ATENÇÃO:

Amodal: Distribuição que não tem moda.

Exemplo:
4, 8, 7, 13, 12, 21

Bimodal: Distribuição que apresenta duas ou mais modas.

Exemplo:
1, 3, 3, 3, 4, 4, 4, 5, 6, 7, 7, 8,

Mo = 3 e 4

Distribuições com intervalos de classe:

A classe de maior freqüência é a classe modal.

Moda bruta é a média aritmética dos extremos da classe modal.


Exemplo:

Consideremos a tabela que representa as notas de 45 alunos do


3º Colegial em Física, no Colégio Alfa.

Classes Xi fi
0 ├── 2 1 3
2 ├── 4 3 9 Classe modal: 6├── 8
4 ├── 6 5 10 Moda bruta: (6 + 8) ÷ 2 = 7
6 ├── 8 7 15
8├── 10 9 8

MEDIANA (Md)

Considerando-se um conjunto de dados dispostos em ordem


crescente, define-se como mediana ao valor que ocupa a posição central.

1. O número de dados é ímpar:

Exemplo:
3, 4, 4, 2, 5, 3, 4, 6, 5 (9 elementos)

A posição ocupada pela mediana é :

2k + 1 = 9 ⇒ k = 4.

Posição: k + 1 ⇒ k = 5.

Colocando em ordem crescente: 2, 3, 3, 4, , 4, 5, 5, 6

Md = 4.

2. O número de termos é par:

Neste caso a mediana será a média entre os valores centrais.

Exemplo:
2, 3, 3, 4, 4, 5, 5, 5, 6, 6.

Md = (4 + 5) ÷ 2

Md = 4,5
Aplicações:

01) Foi analisada uma amostra com 10 latas de um determinado refrigerante


e registrados os volumes em mililitros dos líquidos dessas latas, obtendo-
se os valores:
298, 300, 302, 303, 299, 301, 297, 300, 300, 300

Calcular a média, a moda e a mediana dessa amostra.

Resolução:

Ordem crescente: 297, 298, 299, 300, 300, 300, 300, 301, 302, 303

Média Aritmética.
297 + 298 + 299 + 4.300 + 301 + 302 + 303 3000
x= = = 300
10 10

Mediana.
Md: (300 + 300) ÷ 2 = 300.

Moda.
Mo: 300.

02) (UFBA) De acordo com o Boletim do Serviço de Meteorologia de 07 de


junho de 2000, o quadro abaixo representa a temperatura máxima, em
graus Celsius, registrada em Fernando de Noronha e nas capitais da
Região Nordeste do Brasil.

Aracaju Fernando de Fortaleza João Pessoa Maceió


Noronha
27ºC 30ºC 31ºC 30ºC 27ºC
Natal Recife Salvador São Luís Teresina

30ºC 30ºC 26ºC 32ºC 32ºC

Com base nessas informações, pode-se afirmar:

(01) O gráfico ao lado


representa a distribuição de
freqüência das temperaturas.
(02) A freqüência relativa da temperatura de 31ºC é igual a 10%.

(04) Representando-se a freqüência relativa por meio de um gráfico de


setores, a região correspondente à temperatura de 27ºC tem ângulo de 36º.

(08) A média aritmética das temperaturas indicadas no quadro corresponde a


29,5ºC.

(16) A mediana das temperaturas registradas é igual à temperatura modal.

(32) A amplitude das temperaturas é de 32 ºC.

Resolução:

(01) Verdadeira. Freqüência é o número de vezes que ocorre cada


observação. Logo, podemos resumir o quadro acima na seguinte
tabela:
Temperatura Freqüência
26ºC 1 (Salvador)
27ºC 2 (Aracaju e Maceió)
30ºC 4 (Fernando de Noronha, João Pessoa, Natal e
Recife)
31ºC 1 (Fortaleza)
32ºC 2 (São Luís e Teresina)
Total de observações 10
(02) Verdadeira. Freqüência relativa é a razão entre a freqüência e o
número total de observações (10). Para a temperatura de 31ºC,
temos 1/10, ou seja, 10%.

(04) Falsa. A freqüência relativa, para a temperatura de 27ºC, é 2/10, isto


é, 20%. Para determinar o ângulo da região corresponde à
temperatura de 27ºC usaremos a seguinte regra de três:

100  360
⇒ x = 72.
20  x

(08) Verdadeira. Temos: (26 + 2.27 + 4.30 + 31 + 2.32) ÷ 10 = 29,5


A média aritmética das temperaturas é igual a 29,5ºC

(16) Verdadeira.

A mediana (Md):
26 27 27 30 30 30 30 31 32 32

(Md) = (30 + 30) ÷ 2 = 30

Md = 30ºC

A temperatura modal (Mo) é a mais freqüente entre os valores


observados.

Mo = 30ºC (4 observações)
(32) Falsa. A amplitude (A): 32 – 6 = 6

A amplitude das temperaturas é 6ºC.

MEDIDAS DE DISPERSÃO

As medidas de dispersão indicam o quanto os dados se apresentam dispersos


em torno da região central.

Consideremos os conjuntos

A = {6, 6, 6, 6, 6, 6, 6},
B = {3, 4, 5, 6, 7, 8, 9},
C = {1, 2, 3, 6, 9, 10, 11}

As médias aritméticas dos elementos desses conjuntos são iguais a 6.


Entretanto nota-se que a dispersão dos elementos de A em relação à média
(valores mais ou menos espalhados em relação à média) é nula. A dispersão dos
elementos de C é maior que a dispersão B, isto é, B é mais homogêneo que C.

As principais medidas de dispersão são:

DESVIO (Di)

O desvio é definido como sendo a medida do grau de dispersão de cada valor


da variável em relação à média.

Exemplo:
Seja o conjunto B = {3, 4, 5, 6, 7, 8, 9}

42
x= =6
7
D1 = 3 – 6 = – 3 D2 = 4 – 6 = – 2 D3 = 5 – 6 = – 1
D4 = 6 – 6 = 0 D5 = 7 – 6 = 1 D6 = 8 – 6 = 1
D7 = 9 – 6 = 3

VARIÂNCIA

Define-se por variância como sendo a média aritmética dos quadrados dos
desvios.
n

∑ (xi − x )²
V= i =1
n
No exemplo anterior:

(−3)² + (−2)² + (−1)² + (0)² + 1² + 2² + 3²


v= =4
7

DESVIO PADRÃO

O desvio padrão é definido com sendo a raiz quadrada da variância.

Dp = V.

Exemplo:

Vamos comparar o desvio padrão dos Conjuntos B e C.

B = {3, 4, 5, 6, 7, 8, 9},

C = {1, 2, 3, 6, 9, 10, 11}

Conjunto B

V = 4 (exemplo anterior)

Dp = 4=2

Conjunto C

42
x= =6
7

(1 − 6)² + (2 − 6)² + (3 − 6)² + (6 − 6)² + (9 − 6)² + 10 − 6)² + (11 − 6)²


V= = 14,29
7

Dp = 14,29 = 3,78

Comparando o desvio padrão de B (2,00) com o de C (3,78) nota-se


que o conjunto B é mais homogêneo em relação à média.

O conjunto B é menos disperso que o conjunto C.


Aplicações:

01) Numa pequena ilha, há 100 pessoas que trabalham na única empresa ali
existente. Seus salários (em moeda local) têm a seguinte distribuição de
freqüências:

Salários Freqüência
$ 50,00 30
$ 100,00 60
$ 150,00 10

Qual o desvio padrão dos salários?

Resolução:

Média aritmética:

x = (30.50 + 60.100 + 10. 150) ÷ 100 = 90.

Variância: [30.(50 – 90)2 + 60.(100 – 90)2 + 10.(150 – 90)2] ÷ 100 = 900.

Desvio padrão:

Dp = 900 = 30
O desvio padrão dos salários é $ 30,00

03) Dois jogadores de futebol de times diferentes marcaram os seguintes


números de gols em 5 partidas seguidas:

Partida Jogador A Jogador B


1 0 3
2 1 3
3 2 2
4 6 4
5 6 3

Qual dos jogadores teve o desempenho mais regular?

Resolução:

Média aritmética:

Jogador A:
x = (0 + 1 + 2 + 6 + 6) ÷ 5 = 3

Jogador B:

x = (3 + 3 +2 + 4 + 3) ÷ 5 = 3
Variância:

Jogador A:

V = [(0 – 3)2 + (1 – 3)2 + (2 – 3)2 +(6 – 3)2 + (6 – 3)2] ÷ 5 = 6,4

Jogador B:

V = [(3 – 3)2 + (3 – 3)2 + (2 – 3)2 + (4 – 3)2 + (3 – 3)2] ÷ 5 = 0,4

Desvio Padrão:

Jogador A:

Dp = 6,4 = 2,53

Jogador B:

Dp = 0,4 = 0,63

O jogador B teve o desempenho mais regular.

You might also like