You are on page 1of 51

______________________________________________________________________________________________________________

Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM


Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
1
APOSTILA DE ESTATSTICA DESCRITIVA

1. APRESENTAO DOS DADOS
1.1 - O que Estatstica e suas Divises
Para muitos a Estatstica no passa de conjuntos de tabelas de dados numricos. Mas ser
que a estatstica s isso? A Estatstica originou-se com a coleta e construo de tabelas de dados
para o governo. A situao evoluiu e esta coleta de dados representa somente um dos aspectos da
Estatstica. Hoje em dia podemos adotar a seguinte definio para a Estatstica: A Estatstica uma
cincia (ou mtodo) baseada na Teoria das Probabilidades, cujo objetivo principal nos
auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de
informaes numricas.


A coleta, o processamento, a interpretao e a apresentao de dados numricos pertencem
todos ao domnio da estatstica.
Essas atribuies compreendem o clculo de pontos num campeonato, a coleta de dados
sobre nascimentos e mortes, a avaliao da eficincia de produtos comerciais e a previso do tempo.
A informao estatstica apresentada constantemente no rdio e na televiso. Nosso interesse por
fatos estatsticos suscitado por jornais.
A palavra estatstica usada em vrios sentidos. Pode referir-se no s simples tabulao
de informaes numricas, como a relatrios de transaes na bolsa de valores, como ao corpo de
tcnicas utilizadas para processar ou analisar dados.
A palavra estatstico tambm empregada em vrios sentidos. O termo pode aplicar-se
tanto aos que apenas coletam informaes como aos que preparam anlises ou interpretaes;
designa, ainda, os estudiosos que elaboraram a teoria matemtica sobre a qual se fundamenta a
estatstica.


Divises da Estatstica

A Teoria Estatstica moderna se divide em dois grandes campos:
Estatstica Descritiva - consiste num conjunto de mtodos que ensinam a reduzir uma
quantidade de dados bastante numerosa por um nmero pequeno de medidas,
substitutas e representantes daquela massa de dados. A estatstica descritiva vai
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
2
resumi-los atravs do uso de certas medidas snteses, que tornem possvel a
interpretao de resultados, No sentido mais amplo, suas funes so:
- coleta de dados;
- organizao e classificao destes dados;
- apresentao atravs de grficos e tabelas;
- clculos de medidas (estatsticas), que permitem descrever resumidamente os
fenmenos.
Estatstica Indutiva - consiste em inferir (deduzir ou tirar concluses a respeito das)
propriedades de um universo a partir de uma amostra. O processo de generalizao,
que caracterstico do mtodo indutivo, est associado a uma margem de incerteza.
A medida da incerteza tratada mediante tcnicas e mtodos que se fundamentam na
Teoria das Probabilidades.

Exemplos de utilizao: Pesquisas na Educao, Pesquisa de Mercado, Pesquisa de
opinio pblica, Ensaios de medicamentos e em praticamente todo experimento.
A inferncia estatstica procura com base nos dados amostrais tirar concluses sobre a
populao.

O esquema a seguir tente sintetizar as etapas de uma pesquisa estatstica:

Fig. 1.1 Etapas de uma pesquisa estatstica




______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
3
1.2 - Populao e Amostra

Populao - Conjunto de indivduos, objetos ou informaes que apresentam pelo menos
uma caracterstica comum, cujo comportamento interessa-nos analisar. Ou, em outras palavras,
conjunto de todas as medidas, observaes relativas ao estudo de determinado fenmeno.

Deseja-se conhecer o perfil scio-econmico dos pais dos alunos de uma escola.
Populao ou universo: todos os pais dos alunos
Caractersticas: perfil scio-econmico

Deseja-se conhecer o consumo de energia eltrica em MWh nas residncias da cidade de Barbacena
no ano de 2004.
Populao ou universo: todos as residncias que estavam ligadas a rede eltrica em Barbacena, em 2004.
Caractersticas: X = consumo anual de energia eltrica em MWh.

iii) Deseja-se saber se nas indstrias situadas no Estado de Minas Gerais, em 2004, existia algum
tipo de controle ambiental.
Populao ou universo: indstrias situadas no Estado de Minas Gerais em 2004.
Caracterstica: X = existncia ou no de algum tipo de controle ambiental na indstria.

iv) Estudo sobre a precipitao pluviomtrica na Regio Sudeste no ano 2004.
Populao ou universo: rea referente Regio Sudeste.
Caracterstica: X = precipitao pluviomtrica.

Populaes finitas e infinitas: Quanto ao nmero de elementos, as populaes podem ser
classificadas em finita ou infinita, dependendo do nmero de elementos que a compe.

Exemplos :
i) Populao finita: empresas do Plo Petroqumico de Camaari.
ii) Populao infinita: as presses atmosfricas ocorridas nos diversos pontos do Continente em
determinado momento.

Em geral, como os universos so grandes, investigar todos os elementos populacionais para determinarmos a
caracterstica necessita muito tempo, e/ou o custo elevado, e/ou o processo de investigao leva a destruio do
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
4
elemento observado, ou, como no caso de populaes infinitas, impossvel observar a totalidade da populao. Assim,
estudar parte da populao constitui-se um aspecto fundamental da Estatstica.

Amostra: qualquer subconjunto da populao.

A Estatstica ocupa-se fundamentalmente das propriedades das populaes cujas
caractersticas so passveis de representao numrica como resultado de medies e contagens.
Essas caractersticas da populao so normalmente chamadas de variveis.


1.3 - Tipos de Variveis

A caracterstica que nos interessa analisar recebe o nome de varivel. As caractersticas ou
variveis podem ser divididas em dois tipos: qualitativas e quantitativas.



NOMINAL (SEXO, COR DOS OLHOS...)

QUALITATIVA

ORDINAL (CLASSE SOCIAL, GRAU DE INSTRUO...)



CONTNUA (PESO, ALTURA...)

QUANTITATIVA

DISCRETA (NMERO DE FILHOS, NMERO DE CARROS...)




Variveis qualitativas - quando o resultado da observao apresentado na forma de
qualidade ou atributo. Exemplos: sexo; estado civil; grau de escolaridade; etc.

Variveis quantitativas - quando o resultado da observao um nmero, decorrente de
um processo de mensurao ou contagem. Exemplos: nmero de filhos; salrio mensal; altura; peso;
idade; tamanho da famlia; etc. Para resumir as informaes levantadas durante uma pesquisa
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
5
usaremos a tcnica e a representao mais apropriada, a depender do tipo de varivel que estamos
analisando.


Fig. 1.2 Natureza dos dados



1.4 - A Estatstica em Pesquisas

A utilizao da Estatstica em pesquisas pode ser ilustrada pela equao:

Estatstica = Matemtica + Portugus


Os fatos sociais e humanos s podem ser estudados atravs da construo de conceitos
expressos em determinada lngua. O pesquisador dever estabelecer uma srie de variveis
aleatrias, definidas em Portugus, que devem ser adequadas a obteno de respostas aos seus
objetivos de estudo. Obtendo no campo os dados de uma amostra, o pesquisador dever realizar os
clculos da estatstica descritiva, que lhe traro concluses acerca desta, bem como os clculos da
estatstica indutiva, que lhe mostraro at que ponto tais concluses amostrais so vlidas tambm
para a populao pesquisada. As concluses estatsticas necessitaro de palavras em Portugus para
se transformarem em concluses acerca do objeto de estudo, no mbito da populao delimitada
pelo pesquisador e de acordo com o quadro conceptual anteriormente definido.
Natureza dos Dados
Ex: nmero de habitantes de uma cidade
Contagens
Discreta
Ex: renda per capita de uma cidade
Medidas
Contnua
Quantitativas
Ex: grau de escolaridade
Atributos / categorias
Qualitativas
Variveis
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
6
O diagrama ao lado ilustra o
processo de pesquisa estatstica, com
suas interconexes matemtica x
portugus.
A importncia da construo
de um quadro conceptual est em
que o conhecimento terico do
pesquisador sobre o objeto de estudo
e seu mtodo filosfico de obteno
do conhecimento no pode ser
substitudo pela anlise estatstica.
Ao contrrio, tal
conhecimento deve servir para en-
quadrar a anlise estatstica dentro
de uma caracterizao mais
abrangente da realidade, de forma a
que esta esclarea situaes e
reforce ou negue argumentaes
sobre as relaes de causalidade
intrnsecas ao objeto de estudo.
O perigo para o pesquisador a
substituio de seu mtodo especfico de
obteno de conhecimento por uma
caricatura do mtodo estatstico.
Quando isso ocorre em pesquisas
ditas quantitativas, as variveis aleatrias so impostas como sendo os conceitos em estudo e procura-se estabelecer
concluses e relaes estatsticas entre tais variveis como sendo as concluses e as relaes existentes acerca dos
conceitos.
Ocorre que as variveis aleatrias no so os conceitos em si, mas representaes estatsticas de aspectos
desses conceitos. Em conseqncia, todo processo de substituio de conceitos por variveis definidas de modo mais ou
menos arbitrrios retira a abrangncia do mtodo de pesquisa e o reduz ao mtodo estrutural-funcionalista.
Justamente para evitar tais perigos que insistimos tanto em discutir a relao entre mtodo filosfico, o
mtodo cientfico e o mtodo estatstico. Justamente por isso, um dos principais objetivos de nosso curso habilitar
os futuros profissionais ao dialogo com os estatsticos, necessrio para o projeto, realizao e anlise de pesquisas que
envolvam tcnicas estatsticas.
Delimitao, pelo pesquisador,
da populao a ser estudada
Definio, pelo pesquisador,
do objeto e dos objetivos de
pesquisa
Para cada uma das variveis
aleatrias em estudo:
- Estimao da mdia populacional.
- Clculo da margem de erro
e nvel de confiana para a mdia
populacional.
- Testes de Hipteses
Amostra

Estatstica
Indutiva
Concluses sobre
a Populao
Teoria da
Amostragem
Estatstica
Descritiva
Concluses
sobre
a Amostra

Definio do tamanho, do perfil e do
processo de escolha dos elementos da
amostra

Clculo da distribuio de
frequncias e das estatsticas mdia,
mediana, moda, desvio padro e
desvio padro da mdia da amostra
para as variveis aleatrias, tanto as
que representam o perfil da amostra
como as que representam as
respostas s questes fechadas.

Definio, pelo pesquisador,
das
variveis aleatrias
populacionais
que sero estudadas
Obteno em campo de conjuntos de
valores amostrais para cada uma das
variveis aleatrios em estudo
Variveis
Aleatrias
Populao
Objetos e
Objetivos de
Pesquisa
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
7
Assim, uma vez definidos os principais conceitos de estatstica, voltemos a examinar agora de uma forma mais
aprofundada, como o mtodo dessa cincia se enquadra na teoria mais geral de construo do conhecimento humano.
Seja X uma varivel aleatria que representa uma caracterstica em estudo de certa po-
pulao. Queremos estudar o comportamento dessa caracterstica, mas no podemos, por razes de
economia, obter os valores populacionais de X. Contornamos essa dificuldade retirando uma
amostra representativa da populao e obtemos um certo nmero de valores amostrais de X. Cal-
culamos, atravs dos valores amostrais, as estatsticas descritivas de X.
O mtodo estatstico materialista, pois parte de fatos materiais (estatsticas descritivas da amostra) para
estabelecer teorias (modelos probabilsticos) e no ao contrrio. E dialtico pois trabalha com o movimento das
idias, ao contrrio de supor que as idias so algo esttico. Uma vez estabelecidas as idias que representam a
realidade material (modelos probabilsticos), o mtodo estatstico realiza transformaes nessas idias (clculos de
probabilidade) que possibilitam a previso de futuros comportamentos materiais. E se os comportamentos previstos no
ocorrem, os modelos so criticados e substitudos por outros mais adequados, permitindo a evoluo da cincia.
Permitindo que se chegue a concluses acerca do todo a partir do estudo de uma frao
desse todo, a Estatstica torna economicamente possvel uma srie de estudos que no o seriam sem
ela. Fundamentalmente nisso que reside sua importncia perante a construo do conhecimento
humano, como ferramenta disposio das diversas cincias.
importante o estudante compreender perfeitamente a metodologia estatstica pois tal
compreenso lhe servir no apenas para a realizao de estudos e pesquisas prprios, mas tambm
para desmascarar toda uma srie de manipulaes que se utilizam da Estatstica para impingir
populao, como verdadeiras, concluses falsas.
De fato, a importncia de qualquer cidado compreender o mtodo estatstico est na razo
direta da necessidade de explicarmos, com palavras simples e compreensveis grande maioria do
povo brasileiro, o quo mentirosas e a servio de quem tais pesquisas estatsticas esto.

1.5 - Usos e Abusos da Estatstica

As aplicaes da estatstica se desenvolveram de tal forma que, hoje, praticamente todo campo de estudo se
beneficia da utilizao de mtodos estatsticos. O estudo da estatstica torna o leitor mais crtico em sua anlise de
informaes, e menos sujeito a afirmaes enganosas, como as que se acham comumente associadas a pesquisas,
grficos e mdias. importante reconhecer dados estatsticos distorcidos e interpretar inteligentemente dados que se
apresentam sem distoro.
No de hoje que ocorrem abusos com a estatstica. Alguns dos que abusam da estatstica o
fazem simplesmente por descuido ou ignorncia; outros, porm, tm objetivos pessoais,
pretendendo suprimir dados desfavorveis enquanto do nfase aos dados que lhes so favorveis.
Existem diversas maneiras como os dados podem ser distorcidos:
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
8
- pequenas amostras;
- nmeros precisos;
- estimativas por suposio;
- porcentagens distorcidas;
- cifras parciais;
- distores deliberadas;
- perguntas tendenciosas;
- grficos enganosos;
- presso do pesquisador;
- ms amostras.


O Que Podemos Concluir desta Pesquisa?

O programa de televiso ABC-Nightline realizou uma pesquisa em que solicitava a opinio
dos espectadores sobre a permanncia, ou no, da sede das Naes Unidas nos EUA. Para
responder, os espectadores deviam pagar 50 centavos (americanos) para fazer uma chamada
telefnica. Dos 186.000 que responderam, 67% disseram que a sede da ONU devia sair dos EUA.
Com base nesses resultados amostrais, o que podemos concluir sobre a opinio da populao
americana, sobre a permanncia ou no da sede da ONU nos EUA?


1.6 - Planejamento de Experimentos

Os estudos que utilizam mtodos estatsticos vo desde os que so bem concebidos e executados, dando
resultados confiveis, aos que so concebidos deficientemente e mal executados, levando a concluses enganosas e sem
qualquer valor real.
Todo problema estatstico envolve:
Uma clara definio dos objetivos da experincia e da populao associada.
Projeto de experincia (procedimento amostral).
Coleta e anlise de dados.
Procedimento a tomar, a fim de realizar inferncias acerca da populao, tomando-se como base as
informaes contidas na amostra.
Proviso de uma medida da confiabilidade de uma inferncia a ser realizada.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
9

extremamente importante notar que os passos que conduzem soluo de um problema
estatstico so seqenciais; isto , deve-se identificar a populao de interesse e planejar como
coletar os dados antes de obt-los e analis-los.
Dados coletados de forma descuidada podem ser to inteis que nenhum processamento estatstico
consegue salv-los.

As amostragens efetuadas a partir de projetos pouco significativos freqentemente produzem dados de pouco ou
nenhum valor. Por isso, aps realizada uma inferncia, deve-se analis-la com olho crtico, nunca se esquecendo de
obter uma medida acerca da sua confiabilidade.

Fig. 1.3 Divises da Estatstica e suas inter-relaes

1.7 - Amostragem

O conhecimento de fatos que afetam a convivncia scio-econmica numa comunidade
influi sempre na tomada de deciso de um indivduo em todos os aspectos de sua vida e de sua
famlia. Quando um indivduo escolhe um mecnico para fazer reviso de seu carro, um mdico
para uma consulta, um dentista para fazer um tratamento dentrio especfico ou mesmo um
restaurante para jantar, alguma informao ele utiliza para nortear sua escolha. Percebe-se, portanto
que as pessoas utilizam no dia a dia resultados de amostragens que so realizadas quase sempre,
imperceptivelmente.
Populao
caractersticas
Amostra
Tcnicas de Amostragem
Anlise
Descritiva
Concluses
sobre as
caractersticas
da populao
Informaes contidas
nos dados
Inferncia
Estatstica
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
10
Quando o comrcio e a indstria se baseiam em levantamentos por amostragem para decidir
sobre os investimentos a serem feitos e em seus empreendimentos geralmente obtm sucesso. A
pesquisa de mercado fundamental.
Para que um levantamento por amostragem tenha sucesso, importante que se conhea
profundamente a populao. A amostragem apresenta vrias vantagens em relao ao censo: custo
reduzido, maior rapidez, maior amplitude e maior exatido. O sucesso de um levantamento por
amostragem est na dependncia direta do seu adequado planejamento.
Um dos erros mais graves consiste em uma forma inadequada de coleta de dados. Vamos
descrever ento os mtodos mais comuns de amostragem.
1.7.1 - Amostragem Aleatria Simples: os elementos de uma populao so escolhidos de tal forma
que cada um deles tenha igual chance de figurar na amostra. Este tipo de amostragem
recomendado para estudo de populaes homogneas. As amostras aleatrias podem ser escolhidas
por diversos mtodos, inclusive a utilizao de tabelas de nmeros aleatrios e de computadores
para gerar nmeros aleatrios.







Fig. 1.4 Amostragem Aleatria Simples

1.7.2 - Amostragem Aleatria Estratificada: quando a populao for heterognea no se deve usar a
amostra aleatria simples devido baixa preciso das estimativas obtidas. Nesta situao, deve-se
subdividir a populao em, no mnimo, duas subpopulaes (ou estratos) que compartilham das
mesmas caractersticas (como sexo) e, em seguida, extrair uma amostra de cada estrato. Costuma-se
usar a amostragem estratificada para reduzir a variao nos resultados.






______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
11

Fig. 1.5 Amostragem Aleatria Estratificada

1.7.3 - Amostragem Sistemtica: uma variao da amostragem aleatria simples. Sua aplicao
exige que a populao esteja devidamente ordenada. Nesta situao, escolhe-se um ponto de
partida, e seleciona-se cada k
simo
elemento (como por exemplo cada 10 elemento) da populao.
Apresenta as seguintes vantagens em relao a amostragem aleatria simples:
- maior simplicidade no processo de seleo dos elementos, pois definido o primeiro elemento
da amostra, os demais j estaro definidos;
- distribuio mais uniforme na populao podendo levar a uma maior representatividade.






Fig. 1.6 Amostragem Sistemtica

1.7.4 - Amostragem por Conglomerado: utilizada quando a populao muito dispersa. Neste caso,
divide-se a populao em sees (ou conglomerados); em seguida escolhe-se algumas sees e,
finalmente, toma-se todos os elementos das sees escolhidas. Este mtodo muito mais rpido e
menos dispendioso. extremamente usada pelo governo e por organizaes particulares de
pesquisa.





Fig. 1.7 Amostragem por Conglomerado



1.7.5 - Amostragem por Convenincia: utiliza-se de resultados de fcil acesso ou que j esto
disponveis. Apresentam-se bastante tendenciosos.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
12
No importa quo bem planejemos e executemos o processo de coleta de amostras, h
sempre a possibilidade de um erro nos resultados. Um erro amostral a diferena entre um
resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuaes
amostrais aleatrias.

Se extrairmos uma amostra cuidadosamente, de forma que ela represente a populao,
podemos aplicar os mtodos acima para analisar o erro amostral, mas devemos ter o mximo
cuidado em minimizar os erros no-amostrais.

1.8 - Apresentao Grfica de Dados

Aps a apurao, h a necessidade de dispor os dados e os resultados obtidos a partir deles
em uma forma ordenada e resumida, a fim de auxiliar o pesquisador na anlise e facilitar a
compreenso das concluses apresentadas ao leitor. Os dados e os resultados so ento apresentados
na forma de tabelas.
Uma tabela possui elementos essenciais, tais como:
Ttulo obrigatrio. Deve ser colocado na parte superior da tabela.
Corpo da tabela o conjunto de linhas e colunas onde se encontram as informaes sobre o fato
observado.
Cabealho a parte superior da tabela, onde se especifica o contedo de cada coluna.
Coluna indicadora a parte da tabela em que se especifica o contedo de cada linha.
Fonte a indicao da entidade responsvel pelo fornecimento ou elaborao dos dados.
colocado no fim da tabela.











______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
13
Tab. 1.1: Ranking das torcidas no futebol brasileiro
Clubes Porcentagem de torcedores (%)
Flamengo 15
Corinthians 11
So Paulo 7
Palmeiras 6
Vasco 5
Cruzeiro 4
Grmio 4
Atltico-MG 3
Santos 3
Botafogo 2
Fluminense 2
Internacional 2
Fonte: Rede Globo, 06 de jan. de 2004
Os dados estatsticos, apresentados em tabelas, tambm podem ser expostos em grficos.
Desde que no haja necessidade de grande preciso, os grficos do, melhor do que as tabelas, viso
de tendncias e ajudam a interpretar um fenmeno.
Tabelas, grficos e medidas podem ser utilizados para descrever ou explorar um conjunto de
dados, ou comparar dois ou mais conjuntos.
Grfico de Barras: usado para apresentar sries cronolgicas, geogrficas e categricas. mais
comum a apresentao das barras em posio vertical, conforme representado na Fig. 1.8.
No entanto, as barras em posio horizontal facilitam a identificao das categorias,
principalmente nos casos em que essas categorias tm nomes muito longos.
Grfico de Barras Vertical: facilidade de identificao das categorias, conforme representado na
Fig. 1.9.
Fonte: Rede Globo, 06 de jan. de 2004 Fonte: Rede Globo, 06 de jan. de 2004
Fig. 1.8 Grfico de barras Fig. 1.9 Grfico de barras vertical
Ranking de torcidas
0
2
4
6
8
10
12
14
16
F
l
a
m
e
n
g
o
C
o
r
i
n
t
h
i
a
n
s
S

o

P
a
u
l
o
P
a
l
m
e
i
r
a
s
V
a
s
c
o
C
r
u
z
e
i
r
o
G
r

m
i
o
A
t
l

t
i
c
o
-
M
G
S
a
n
t
o
s
B
o
t
a
f
o
g
o
F
l
u
m
i
n
e
n
s
e
I
n
t
e
r
n
a
c
i
o
n
a
l
P
o
r
c
e
n
t
a
g
e
m

d
e

t
o
r
c
e
d
o
r
e
s
Ranking das torcidas
0 5 10 15 20
Flamengo
Corinthians
So Paulo
Palmeiras
Vasco
Cruzeiro
Grmio
Atltico-MG
Santos
Botafogo
Fluminense
Internacional
Porcentagem de torcedores
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
14

Grfico de Setores: usado para comparar propores, conforme representado pela Fig. 1.10.
Grfico de Linhas: usado para apresentar sries cronolgicas, conforme representado pela Fig. 1.11.
Fonte: no identificada Fonte: Revista Veja, 14 de jan. de 2004

Fig. 1.10 Grfico de setor Fig. 1.11 Grfico de linhas
Grficos Comparativos: so desenhados dois grficos, lado a lado, para melhor estabelecer a
comparao de um fenmeno, conforme representado na Fig. 1.12.

Fonte: Folha de So Paulo, 12 de jan. de 2004
Fig. 1.12 Grfico comparativo

Atravs das tabelas e grficos, o educador est capacitado a entender o complexo
educacional (matrcula, escolarizao, aprovao, repetncia, evaso, ...), ver a evoluo dos
fenmenos relevantes, decidir sobre as prioridades, programar e executar seu planejamento.
Os dados tambm podem ser estudados pela distribuio de freqncia, histograma e
polgono de freqncia.


Consumo de refrigerantes
38%
26%
18%
10%
8%
Coca-Cola
Guaran
Antrtica
Fanta
Sprite
Outros
Os brasileiros de frias no exterior
4,2
2,9 2,9
2,3
1,7
1,9
0
1
2
3
4
5
1 2 3 4 5 6
Ano
M
i
l
h

e
s

d
e

v
i
a
j
a
n
t
e
s
As universidades e o cumprimento da LDB
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
70,00%
80,00%
90,00%
100,00%
1 2 3
Situao das Instituies
P
o
r
c
e
n
t
a
g
e
m
Privadas
Pblicas
Total
Situaes das Instituies:
1 Com ao menos 1/3 do corpo docente
trabalhando em regime integral.
2 - Com ao menos 1/3 do corpo docente
com ttulo de mestre ou doutor
3 Tm menos de trs cursos de ps-
graduao recomendados pela Capes
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
15
1.9 - Exerccios

1. Identifique cada nmero como discreto ou contnuo:
a) Cada cigarro tem 16,13mg de alcatro.
b) O altmetro de um avio da VARIG indica uma altitude de 21.359 ps.
c) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas assinam a revista X.
d) De 1000 consumidores pesquisados, 930 reconheceram a marca da Coca-Cola.

2. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo
contactar por telefone 1500 consumidores. Por que razo incorreta a utilizao de listas
telefnicas como populao para fornecer a amostra?


3. Um relatrio patrocinado pela Florida Citrus Comission concluiu que os nveis de colesterol
podem ser reduzidos mediante ingesto de produtos ctricos. Por que razo a concluso
poderia ser suspeita?
4. Identifique o tipo de amostragem utilizado:
a) Um psiclogo de uma Universidade seleciona 12 homens e 12 mulheres de cada uma
das quatro turmas de ingls.
b) Um cabo eleitoral escreve o nome de cada vereador da cidade, em cartes separados,
mistura-se e extrai 3 nomes.
c) Um pesquisador mdico da USP entrevista todos os portadores de leucemia em cada
um dos 20 hospitais selecionados aleatoriamente.
d) A empresa Sony seleciona cada 200 CD de sua linha de produo e faz um teste de
qualidade rigoroso.
e) Um professor seleciona 15% de mulheres e 15% de homens de uma turma para
responder a uma pergunta.
f) A supervisora escolhe dentre os 28 professores, 3 para representar a escola em um
evento na cidade.

5. Uma populao se encontra dividida em trs estratos, com tamanhos, respectivamente, A =
80, B = 120 e C = 60. Ao se realizar uma amostragem estratificada proporcional, 12
elementos da amostra foram retirados do primeiro estrato. Qual o nmero de elementos da
amostra?
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
16
6. Uma amostragem entre os moradores de uma cidade realizada da seguinte forma: em cada
bairro, sorteia-se um certo nmero de quarteires proporcional rea do bairro; de cada
quarteiro, so sorteadas cinco residncias, cujos moradores so entrevistados.
a) Essa amostra ser representativa da populao ou poder apresentar algum vcio?
b) Que tipo de amostragem foram usados no procedimento? Justifique.

7. Discuta sobre o planejamento de um experimento enfatizando a importncia dos mtodos de
boa amostragem.

8. (ENEM/98) Uma pesquisa de opinio foi realizada para avaliar os nveis de audincia de
alguns canais de televiso, entre 20h e 21h, durante uma determinada noite. Os resultados
obtidos esto representados no grfico de barras abaixo.










Fig. 1.13 - N de residncias ligadas em um determinado canal de TV, entre 20h e 21h, durante uma noite.

I) O nmero de residncias atingidas nessa pesquisa foi aproximadamente de:
a) 100 b) 135 c) 150 d) 200 e) 220
II) A porcentagem de entrevistados que declararam estar assistindo ao canal B aproximadamente:
a) 15% b) 20% c) 22% d) 27% e) 30%





N de residncias
100

80

60


40

20


0 A B C D nenhum
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
17
9. O quadro abaixo apresenta o nmero de novos casos de AIDS notificados anualmente no
Brasil no perodo considerado:









Fig. 1.14 - Nmero de novos casos de AIDS notificados anualmente no Brasil

As informaes contidas no grfico permitem concluir corretamente que, no perodo
considerado:
a) a partir de 1997, certamente caiu o nmero de novos casos de aidticos;
b) o nmero aproximado de aidticos no pas, em 1997, era de 112.000;
c) a maior taxa de variao no nmero de aidticos ocorreu em 1996;
d) a maior taxa de variao no nmero de aidticos ocorreu em 1992;
e) o nmero mximo de aidticos ocorreu em 1996.

10. No grfico de colunas dos resultados do Proeb 2000 e do SAEB 99 para o 1 Ano do Ciclo
Intermedirio (4 Srie) do Ensino Fundamental, CORRETO afirmar que:
a) O rendimento em Matemtica foi inferior ao de Portugus no Proeb 2000.
b) O rendimento em Portugus foi superior ao de Matemtica no SAEB 99 MG.
c) O rendimento em Matemtica foi superior ao de Portugus em todas as fases.
d) O rendimento em Portugus foi superior ao de Matemtica em todos os programas de
avaliaes.
20.000

18.000


16.000

14.000


12.000

10.000
1991 1992 1993 1994 1995 1996 1997
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
18

11. Os empregados na Eletronics Associates esto num sistema de horrio flexvel: eles podem
comear seu dia de trabalho s 7h, 7h30, 8h ou 9h. Os seguintes dados representam uma
amostra do horrio de incio escolhido pelos empregados:
7h 8h30 9h 8h 7h30 7h30 8h30 8h30 7h30 7h
8h30 8h30 8h 8h 7h30 8h30 7h 9h 8h30 8h
Construa uma tabela para representar os dados acima.
(Adaptado do livro Estatstica Aplicada Administrao e Economia, de David R. Anderson et al. Ed.
Pioneira, 2002).

12. Faa um grfico de barras e um de pizza para representar os dados do exerccio 11.

13. Imagine que foi obtida a opinio de 1000 pessoas a respeito da liberao de determinado
filme para exibio em televiso. Dessas 1000 pessoas, 432 mostravam-se favorveis, 322
eram contrrias, 122 no quiseram declarar opinio e as restantes disseram no ter opinio
formada. Mostre esses dados numa tabela.

14. Faa um grfico de setores levando em conta os dados do exerccio 13.

15. Faa um grfico de barras para apresentar os valores de densidade demogrfica, segundo a
regio.



Resultados do Proeb 2000 e do SAEB 99 para o 1 Ano do Ciclo Intermedirio (4
Srie) do Ensino Fundamental
155
160
165
170
175
180
185
190
195
200
205
Portugus Matemtica
Proeb 2000 - Regular
SAEB 99 - MG Estadual
SAEB 99 - MG
SAEB 99 - Brasil
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
19
Tab. 1.2: Densidade Demogrfica no Brasil, segundo a regio,
de acordo com o censo de 1980
Regio Densidade (hab./km
2
)
Norte 1,65
Nordeste 22,57
Sudeste 56,31
Sul 33,86
Centro-Oeste 4,01
FONTE: IBGE (1984)
16. Construa um grfico de linhas para mostrar que, na Escola de 1 Grau D. Pedro II, a taxa
de evaso escolar (porcentagem de alunos que abandonaram a escola) foi 12,1; 11,3; 10,7;
15,0; 14,7 e 10,1 em 1980, 1981, 1982, 1983, 1984 e 1985, respectivamente.
17. Os principais mercados emissores de turista para o Brasil em 1998 esto relacionados na
tabela abaixo. Obtenha o grfico em: a) barra; b) barra vertical

Tab. 1.3: Principais mercados emissores de turistas para o Brasil (1998)

Fonte: Embratur

18. Aberta e fechada so dois tipos de questes de uma pesquisa. Uma questo aberta permite
uma resposta livre, enquanto uma questo fechada apenas uma resposta fixa. Quais so as
vantagens e desvantagens das questes abertas? E das fechadas? Que tipo mais fcil de
analisar com processos estatsticos formais?

19. Elaborar uma questo(es) aberta(s) ou fechada(s) sobre o tema: Importncia da Pesquisa de
Mercado.
Pases Turistas (%)
Argentina 31
Estados Unidos 11
Paraguai 9
Uruguai 7
Alemanha 5
Itlia 4
Chile 3
Bolvia 3
Frana 3
Portugal 2
Inglaterra 2
Outros 20
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
20

2. REPRESENTAO GRFICA E DISTRIBUIO DE FREQNCIA

2.1 Introduo
Ao estudarmos grandes conjuntos de dados, conveniente organiz-los e resumi-los,
construindo uma tabela de freqncias. A ttulo de ilustrao, considere o exemplo a seguir, de
dados brutos, relativo ao tempo de parada (em minutos) de uma mquina para manuteno (Tab.
2.1).
A construo de uma distribuio de freqncia consiste na elaborao de classes a partir de
intervalos, fixando um nmero adequado de classes.

Tab. 2.1 - Tempo de parada (em minutos) de uma mquina para manuteno
7 3 4 9 5
8 5 3 8 7
9 3 1 9 9
5 7 7 10 3
4 8 8 8 7
8 8 9 3 8
6 10 7 7 9
9 9 7 8 1
O primeiro procedimento a ser tomado para a elaborao de uma distribuio de freqncias
de uma varivel contnua consiste na ordenao dos dados (rol), para permitir uma melhor
manipulao (Tab. 2.2).

Tab. 2.2 - Tempo de parada (em minutos) de uma mquina para manuteno
1 4 7 8 9
1 5 7 8 9
3 5 7 8 9
3 5 7 8 9
3 6 7 8 9
3 7 8 8 9
3 7 8 9 10
4 7 8 9 10

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
21
2.2 Distribuio de Freqncias
A preciso de medida corresponde ao menor valor detectvel pelo instrumento ou
procedimento de medida empregado. No exemplo dos tempos de parada, a preciso de medida Ax
= 1. Deve-se atentar que os valores presentes no conjunto de dados no so exatos, mas carregam
alguma inexatido devido preciso de medida. Assim, um valor de 5 no representa
necessariamente uma nota de exatamente 5, mas sim uma nota que pode estar acontecendo em
qualquer ponto entre 4,5 e 5,5.
A elaborao de uma distribuio de freqncia para variveis contnuas requer a
apresentao de alguns conceitos:

1 Amplitude: corresponde diferena entre o maior e o menor valor de um conjunto de dados. Em
geral, simbolizada por A.

2 - Amplitude de Classe: consiste na diferena entre o limite superior e o limite inferior de uma
classe em uma distribuio de freqncia. Ser aqui simbolizada por c.

A seguir, temos o algoritmo para obteno de uma distribuio de freqncia relativa uma
varivel contnua.

Passo 1 Escolhe-se um nmero de classes k. importante que a distribuio conte com um
nmero adequado de classes. Se esse nmero for escasso, os dados originais ficaro to
comprimidos que pouca informao poder ser extrada desta tabela. Se, por outro lado, forem
utilizadas muitas classes, haver algumas com freqncia nula ou muito pequena, apresentando uma
distribuio irregular e prejudicial interpretao do fenmeno.
Para determinar o nmero de classes h diversos mtodos. Veremos dois deles:

(1) k = 5, para n s 25 e , para n > 25.

(2) Frmula de Sturges: k = 1 + 3,3 log n, onde n o tamanho da amostra.

Ex: Se n = 49 teramos:
(1) k = 7
(2) k = 1 + 3,3 log 49 = 6,58 ~ 7
n k =
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
22

Mesmo tendo outros critrios de determinao do nmero de classes, o que se deve ter em
mente que a escolha depender, sobretudo da natureza dos dados e da unidade de medida em que
eles se encontram, e no somente de regras muitas vezes arbitrrias e pouco flexveis. Para facilitar
a anlise conveniente que se mantenham os intervalos de classe sempre constantes.

Passo 2 Calcula-se a amplitude total A dos dados: A = MVO mvo onde MVO: maior valor
observado e mvo: menor valor observado;

Passo 3 Calcula-se a amplitude de classe c, atravs de: fazendo o arredondamento igual ao
nmero de casas decimais dos dados.


Passo 4 O limite inferior LI
1
da 1 classe obtido por: LI
1
= mvo - Ax/2

Passo 5 - O limite superior LS
1
da 1 classe obtido por: LS
1
= LI
1
+ c
sendo que LS
1
= LI
2
e assim, sucessivamente soma-se ao valor do limite inferior da primeira
classe a amplitude de classe e obtm-se o limite superior, sendo o limite superior da primeira classe
o inferior da segunda;

Passo 6 Construdas as classes, so contados quantos dados esto em cada classe (freqncias
absolutas de cada classe);
Obs: a freqncia absoluta (f
a
) o nmero de repeties de um valor individual ou de uma classe
de valores da varivel.

Passo 7 - So calculadas as freqncias relativas e percentuais de cada classe.
Obs: a freqncia relativa (f
r
) representa a proporo de observaes de um valor individual ou de
uma classe, em relao ao nmero total de observaes. Trata-se, portanto, de um nmero relativo.
Obs: a freqncia percentual (f
p
) o produto da freqncia relativa por 100, tendo como resultado
uma porcentagem.




c LI LS + =
1 1

k
x A
c
+
=

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
23
2.3 Histograma e Polgono de Freqncias

Com o conceito de densidade de freqncia, pode-se apresentar as duas principais
representaes grficas: o histograma e o polgono de freqncia.
Histogramas so retngulos cujas bases so proporcionais as amplitudes de classes e as reas
proporcionais as freqncias das classes. Todas as classes devem ter a mesma amplitude.
Polgono de freqncia so grficos de linhas unindo os pontos mdios das classes no topo
dos retngulos.
Vamos exemplificar os processos acima descritos atravs do exemplo do tempo de parada
(em minutos) de uma mquina para manuteno.
No exemplo, temos:
Passo 1: Escolhe-se, por exemplo, k = 1 + 3,3 log 40 = 6,28 ~ 6 classes;

Passo 2: A = 10 1 = 9;

Passo 3: c = (9 + 1) / 6 = 1,67 => 2;

Passo 4: LI
1
= 1 1 / 2 = 0,5;

Passo 5: LS
1
= LI
2
= 0,5 + 2 = 2,5
LS
2
= LI
3
= 2,5 + 2 = 4,5
LS
3
= LI
4
= 4,5 + 2 = 6,5
LS
4
= LI
5
= 6,5 + 2 = 8,5
LS
5
= 8,5 + 2 = 10,5

Tab. 2.3 - Distribuio de freqncias relativas ao tempo de parada (em minutos) de uma mquina para
manuteno
Classes F
A
F
R
F
P

(0,5 2,5] 2 0,050 5,0%
(2,5 4,5] 7 0,175 17,5%
(4,5 6,5] 4 0,100 10,0%
(6,5 8,5] 17 0,425 42,5%
(8,510,5] 10 0,250 25,0%
Totais 40 1,000 100,0%
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
24














Fig. 2.1 - Histograma e Polgono de Freqncia

2.4 - Exemplo de Dados com Tabelas de Freqncia

Considere o exemplo a seguir, relativo mdia da quantidade de cerveja vendida, em caixas
por dia, durante o carnaval, por 201 bares de uma determinada cidade (Tab. 2.4).
O primeiro procedimento a ser tomado para a elaborao de uma distribuio de freqncias
de uma varivel contnua consiste na ordenao dos dados, para permitir uma melhor manipulao
(Tab. 2.5).
A preciso de medida corresponde ao menor valor detectvel pelo instrumento ou
procedimento de medida empregado. No exemplo, a preciso de medida Ax = 0,1.













f
r


0,425



0,250

0,175


0,100
0,050

0 0,5 2,5 4,5 6,5 8,5 10,5 tempo

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
25
Tab. 2.4 Mdia da quantidade de cerveja vendida, em caixas por dia, durante o carnaval, por 201 bares de uma
determinada cidade.
_______________________________________________________________________________________________
24,7 25,8 23,6 18,6 20,7 22,4 22,4 21,4 19,2 18,2 21,2 20,0 17,8
17,5 19,7 23,7 15,3 13,6 20,7 17,0 15,7 15,1 13,8 11,1 14,7 17,6
16,2 13,4 13,2 14,1 13,1 20,1 19,8 16,8 12,0 11,9 15,0 14,1 14,4
6,9 26,6 24,6 22,2 22,8 24,0 30,6 33,0 23,0 20,9 19,5 21,2 20,4
23,3 27,1 21,6 20,4 25,5 19,6 26,2 21,6 14,3 17,9 15,4 12,6 13,2
13,3 12,8 10,4 11,5 10,3 10,6 14,1 13,8 27,5 25,4 26,6 28,5 25,9
25,2 26,3 24,7 24,1 23,3 22,7 19,0 22,8 22,3 23,7 21,0 19,3 21,2
19,7 16,7 19,3 18,9 19,7 22,6 25,2 30,4 22,6 15,3 17,9 21,6 21,0
25,1 21,3 26,2 23,8 24,6 27,3 18,9 18,8 14,6 14,1 21,0 23,7 17,3
24,4 17,3 18,6 19,9 19,5 15,3 20,8 18,9 20,3 18,0 16,9 20,5 19,7
12,8 21,1 21,0 22,7 15,0 15,1 13,3 17,7 5,3 14,5 19,3 15,8 16,7
9,7 14,1 19,5 14,3 17,0 27,5 19,0 22,9 18,0 16,7 18,5 12,9 18,2
14,3 18,6 17,2 18,6 16,4 18,8 12,6 13,7 10,7 17,5 16,2 15,1 13,9
11,8 17,8 17,0 15,7 15,3 22,4 14,1 20,4 19,6 20,1 26,6 33,8 20,0
22,2 20,4 25,8 17,7 15,0 19,2 12,7 22,7 19,0 13,5 15,4 14,5 18,5
21,0 32,7 21,8 23,6 16,8 14,1


Tab. 2.5 Dados ordenados, relativos mdia da quantidade de cerveja vendida, em caixas por dia, durante o carnaval,
por 201 bares de uma determinada cidade.
5,3 6,9 9,7 10,3 10,4 10,6 10,7 11,1 11,5 11,8 11,9 12,0 12,6
12,6 12,7 12,8 12,8 12,9 13,1 13,2 13,2 13,3 13,3 13,4 13,5 13,6
13,7 13,8 13,8 13,9 14,1 14,1 14,1 14,1 14,1 14,1 14,1 14,3 14,3
14,3 14,4 14,5 14,5 14,6 14,7 15,0 15,0 15,0 15,1 15,1 15,1 15,3
15,3 15,3 15,3 15,4 15,4 15,7 15,7 15,8 16,2 16,2 16,4 16,7 16,7
16,7 16,8 16,8 16,9 17,0 17,0 17,0 17,2 17,3 17,3 17,5 17,5 17,6
17,7 17,7 17,8 17,8 17,9 17,9 18,0 18,0 18,2 18,2 18,5 18,5 18,6
18,6 18,6 18,6 18,8 18,8 18,9 18,9 18,9 19,0 19,0 19,0 19,2 19,2
19,3 19,3 19,3 19,5 19,5 19,5 19,6 19,6 19,7 19,7 19,7 19,7 19,8
19,9 20,0 20,0 20,1 20,1 20,3 20,4 20,4 20,4 20,4 20,5 20,7 20,7
20,8 20,9 21,0 21,0 21,0 21,0 21,0 21,1 21,2 21,2 21,2 21,3 21,4
21,6 21,6 21,6 21,8 22,2 22,2 22,3 22,4 22,4 22,4 22,6 22,6 22,7
22,7 22,7 22,8 22,8 22,9 23,0 23,3 23,3 23,6 23,6 23,7 23,7 23,7
23,8 24,0 24,1 24,4 24,6 24,6 24,7 24,7 25,1 25,2 25,2 25,4 25,5
25,8 25,8 25,9 26,2 26,2 26,3 26,6 26,6 26,6 27,1 27,3 27,5 27,5
28,5 30,4 30,6 32,7 33,0 33,8

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
26
Para o exemplo, temos:

Passo 1: Escolhe-se, por exemplo, k = 1 + 3,3 log 201 = 8,60 ~ 10 classes;

Passo 2: A = 33,8 5,3 = 28,5;

Passo 3: c = (28,5 + 0,1) / 10 = 2,86 => 2,9;

Passo 4: LI
1
= 5,3 0,1 / 2 = 5,25;

Passo 5: LS
1
= LI
2
= 5,25 + 2,9 = 8,15
LS
2
= LI
3
= 8,15 + 2,9 = 11,05 e assim por diante.

Tab. 2.6 - Distribuio de freqncias, relativa mdia da quantidade de cerveja vendida, em caixas por dia, durante o
carnaval, por 201 bares de uma determinada cidade

CLASSES fa fr fp
[5,25; 8,15) 2 0,0100 1,00
[8,15; 11,05) 5 0,0249 2,49
[11,05; 13,95) 23 0,1144 11,44
[13,95; 16,85) 38 0,1891 18,91
[16,85; 19,75) 48 0,2388 23,88
[19,75; 22,65) 37 0,1841 18,41
[22,65; 25,55) 29 0,1443 14,43
[25,55; 28,45) 13 0,0646 6,43
[28,45; 31,35) 3 0,0149 1,49
[31,35; 34,25) 3 0,0149 1,49
TOTAIS 201 1,0000 100,00


Na Fig. 2.2 est representado o histograma e o polgono de freqncia.



______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
27
Figura 2.2 - Histograma e Polgono de Freqncia da distribuio de freqncia relativa, da
quantidade de cerveja vendida, em caixas por dia, durante o carnaval, por 201 bares de uma
determinada cidade.

















2.5 - Exerccios:
1) Construa uma tabela de freqncias (p
m
, fa, f
r
, f
p
e f
ac
), histograma e polgono de freqncia da
renda familiar (em reais) de 54 funcionrios de uma empresa. Os valores foram:

2) Construa uma tabela de freqncias (fa, fr e fp), uma tabela de densidade de freqncia relativa,
o histograma e o polgono de freqncia das 20 observaes relativas ao ndice pluviomtrico em
determinados municpios do Estado de Minas Gerais. Os ndices (em milmetros de chuva) so:
144 152 159 160 160 151 157 146 154 145 141 150 142 146
142 141 141 150 143 158



80 344 416 348 166 220 262 360 204 144 332 34 140 180
105 166 204 26 120 436 125 132 90 40 220 46 154 116
182 150 65 356 316 94 86 150 270 202 202 365 79 148
446 62 236 212 60 64 114 76 48 29 514 140
fr

0,2500



0,2000



0,1500



0,1000



0,0500



0,0000 5,25 8,15 11,05 13,95 16,85 19,75 22,65 25,55 28,45 31,35 34,25

Quantidade de caixas de cerveja vendidas em mdia por dia
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
28
3) D-se abaixo a distribuio dos salrios mensais de 200 funcionrios da educao da prefeitura
de uma cidade.

Quantia (dlares) f
aparente
f
relativa
f
percentual
f
acumulada
( 0,00 200,00] 90
(200,00 400,00] 40
(400,00 600,00] 32
(600,00 800,00] 18
(800,00 1000,00] 15
(1000,00 1200,00] 5
Total 200

Complete a tabela acima. Construa o histograma e o polgono de freqncia correspondente.

4) Complete a tabela de distribuio de freqncias abaixo. Faa o histograma e o polgono de
freqncia.

Classes f
aparente
f
relativa
f
percentual
f
acumulada

1,5 3,2 4 0,08
3,2 4,9 4 8%
4,9 6,6 0,16
6,6 8,3 7 0,14
8,3 10,0 5
10,0 11,7 20%
11,7 13,4 7 0,14
13,4 15,1 10%
Totais 1,00 100%









______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
29
3. MEDIDAS DE POSIO E DISPERSO

As distribuies de freqncias e os grficos fornecem mais informaes sobre o
comportamento de uma varivel do que a prpria srie original de dados. Mas, queremos resumir
ainda mais esses dados. Com esse objetivo usaremos mtodos da Estatstica Descritiva que ensinam
a reduzir a informao contida em uma grande quantidade de dados a um pequeno nmero de
medidas, substitutas e representantes daquela massa de dados. Vamos agora estudar as principais
medidas da Estatstica Descritiva, agrupadas em medidas de posio (ou de locao ou de
localizao), medidas de disperso (ou de variabilidade).
Com base no polgono de freqncia pode-se classificar o tipo de distribuio dos dados
amostrais ou experimentais com que se est trabalhando. Esta classificao de suma importncia,
pois grande parte das anlises que sero abordadas posteriormente neste material depende da
natureza desta distribuio, sendo que a maioria requer distribuio do tipo simtrica ou
aproximadamente simtrica.

Fig. 3.1 Naturezas de uma distribuio.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
30

=
n
1 j
j
X

n
X
X
n
1 j
j

=
=

(
(
(
(
(

|
|
.
|

\
|

=

=
=
n
1 j
2
n
1 j
j
2
j
2
n
X
X
1 n
1
S

3.1 - Tcnicas de Somatrio
3.1.1 - ndices ou Notao por ndices
O smbolo X
j
(leia X ndice j) representa qualquer um dos n valores, X
1
, X
2
, ..., X
n
,
assumidos pela varivel X, na amostra ou no conjunto de dados. A letra j, usada como ndice, pode
representar qualquer um dos valores: 1, 2, ... n. Evidentemente pode ser usada qualquer outra letra
alm do j.

3.1.2 - Notao de Somatrio

O smbolo usado para representar a soma de todos os valores X
j
desde j = 1 at
j = n, ou seja, por definio:


O smbolo E a letra grega sigma, que indica soma.

3.1.3 - Exerccio


Seja a mdia aritmtica e a varincia.


Dado o conjunto de dados X = {2, 4, 5, 6, 1, 8}, calcule a sua mdia e varincia.

3.2 - Medidas de Posio ou de Tendncia Central
Uma medida de tendncia central procura sintetizar as informaes da amostra em um nico
e informativo valor. Ao examinar uma distribuio amostral simtrica ou aproximadamente
simtrica, nota-se que geralmente, eles so mais freqentes perto de um valor central e mais raro ao
afastar-se deste. A obteno deste valor central de suma importncia nos levantamentos amostrais,
seja na pesquisa ou na extenso.
n 2 1
n
1 j
j
X ... X X X + + + =
=
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
31
A medida de posio uma grandeza numrica que descreve um conjunto de dados, pela
indicao da posio do conjunto na escala de valores possveis que a varivel em questo pode
assumir. Dentre elas, sero abordadas a mdia, a mediana e a moda.
Exemplo de aplicao: (Notas)
Uma escola tinha duas turmas de mesma srie, mesmo contedo, mesmo professor, mas com
resultados diferentes. Em vista dessa situao, a escola decidiu formar um grupo de trabalho para
resolver esses problemas. Para avaliar se estavam ocorrendo problemas, o grupo decidiu retirar uma
amostra aleatria dos alunos, verificar as notas e comparar os resultados. Foi utilizada uma
estratificao, sendo ento retirada uma amostra de 80 notas da turma A e 80 da turma B. Os dados
coletados, j ordenados, esto na Tab. 3.1, a seguir.

Tab. 3.1 - Medidas das Notas de 160 alunos (dados ordenados)
TURMA A TURMA B
2,3 3,1 3,8 4,5 4,9 5,6 5,8 6,2
2,4 3,1 3,9 4,5 4,9 5,6 5,8 6,2
2,4 3,3 3,9 4,5 5,0 5,6 5,8 6,3
2,4 3,3 3,9 4,5 5,1 5,7 5,8 6,3
2,6 3,4 4,0 4,5 5,1 5,7 5,9 6,4
2,7 3,4 4,0 4,6 5,1 5,7 5,9 6,4
2,7 3,5 4,0 4,6 5,3 5,7 5,9 6,4
2,8 3,5 4,0 4,7 5,3 5,7 5,9 6,4
2,8 3,5 4,0 4,7 5,3 5,7 5,9 6,4
2,8 3,5 4,1 4,9 5,3 5,7 5,9 6,5
2,9 3,5 4,1 4,9 5,3 5,7 6,0 6,5
2,9 3,5 4,1 5,1 5,3 5,7 6,0 6,5
2,9 3,6 4,2 5,2 5,3 5,7 6,0 6,5
3,0 3,6 4,2 5,4 5,4 5,7 6,1 6,6
3,0 3,7 4,2 5,4 5,4 5,7 6,1 6,7
3,0 3,7 4,3 5,5 5,4 5,7 6,1 6,7
3,1 3,7 4,3 5,6 5,4 5,8 6,1 6,7
3,1 3,7 4,3 5,6 5,4 5,8 6,1 6,8
3,1 3,8 4,4 5,7 5,5 5,8 6,2 6,9
3,1 3,8 4,4 5,9 5,5 5,8 6,2 7,0
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
32

Ao observarmos o conjunto de dados abaixo j fazemos alguma idia sobre o
comportamento das duas turmas. Entretanto, claramente necessitamos calcular algumas medidas
que resumam a informao contida nos dados. Vamos comear tentando responder: Qual o valor
tpico da turma A? E da turma B? A primeira idia para obter um valor tpico a de calcular uma
mdia. Vamos estudar um pouco sobre os diferentes tipos de mdia.

3.2.1 - Mdia Aritmtica
A mdia a principal medida de posio, sendo utilizada quando os dados apresentam
distribuio simtrica ou aproximadamente simtrica, como acontece com a maioria das situaes
prticas. A mdia , de modo geral, a mais importante de todas as mensuraes numricas
descritivas. A mdia aritmtica de um conjunto de valores o valor obtido somando-se todos eles e
dividindo-se o total pelo nmero de valores. Deve-se diferenciar, atravs de notao apropriada a
mdia populacional da amostral.

A mdia aritmtica simples de n nmeros
n
x ,...,
2
x ,
1
x um valor x (mdia amostral) tal
que
x n
n
x ...
2
x
1
x = + + +

logo temos que,
n
n
1 i
i
x
n
n
x ...
2
x
1
x
x

=
=
+ + +
=


A mdia de todos os valores de uma populao dada por:

em que, n o tamanho da amostra, e N o tamanho da populao.

Resumindo em uma tabela as mdias aritmticas, temos:

Turma Mdia Aritmtica
A 3,8575
B 5,8725

N
x
=
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
33
Observando as mdias aritmticas das amostras observadas, parece existir diferena, em
termos mdios, entre as notas das turmas A e B.

Podemos pensar na mdia aritmtica como o valor tpico do conjunto de dados e
considerada a principal medida de tendncia central. Algumas das razes que fazem com que seja a
medida de posio mais recomendada so:

definida rigorosamente e pode ser interpretada sem ambigidades;
Leva em considerao todas as observaes efetuadas;
Calcula-se com facilidade.
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensvel a
valores extremos, isto , a valores excessivamente pequenos ou excessivamente grandes, em relao
s demais observaes do conjunto de dados. Ex: Estamos interessados em conhecer o salrio
mdio mensal de certa empresa e delimitamos uma amostra mdia de cinco setores. Temos o
seguinte conjunto de salrios mensais, para os setores, em reais: 223 - 245 - 310 - 425 - 1.500.
Podemos observar que quatro dos cinco salrios apresentam valores entre 223 e 425 reais, porm a
mdia salarial de 540,6 reais bastante distinta desse conjunto pela influncia do salrio de 1.500
que puxou o valor mdio para cima.

Para dados agrupados em distribuio de freqncia:



em que X
i
o ponto mdio da classe i e F
i
a sua freqncia.

Como exemplo, vamos verificar os dados da Tab. 2.3, referente ao tempo de parada (em
minutos) de uma mquina para manuteno. Essa tabela foi modificada, de modo a ficar os itens
que nos interessam, conforme Tab. 3.2.






n
k
1 i
i
F
i
X
X

=
=
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
34
Tab. 3.2: Distribuio de freqncias relativas tempo de parada (em minutos) de uma mquina para manuteno
Classes X
i
F
i

(0,5 2,5] 1,5 2
(2,5 4,5] 3,5 7
(4,5 6,5] 5,5 4
(6,5 8,5] 7,5 17
(8,510,5] 9,5 10
Totais 40

Para o exemplo em questo:

H uma diferena no clculo pelos dois processos. O resultado do ltimo apenas aproximado. No
entanto, o erro cometido mnimo, e, portanto deve ser desprezado.

Propriedades da mdia:
A soma algbrica dos desvios em relao mdia aritmtica nula.
A soma dos quadrados dos desvios de um conjunto de dados em relao a sua mdia um valor
mnimo.


A mdia de um conjunto de dados acrescido (ou subtrado) em cada elemento por uma constante
igual mdia original mais (ou menos) essa constante.

Em que X , a mdia do novo conjunto de dados.

Multiplicando todos os dados por uma constante a nova mdia ser igual ao produto da mdia
anterior pela constante
( )

=
=
n
1 i
i
0 X X

8 6
40
10 5 9 17 5 7 4 5 5 7 5 3 2 5 1
n
k
1 i
i
F
i
X
x ,
, , , , ,
=
+ + + +
=

=
=
( )
=
=
n
1 i
2
i
X X D
K = X ' X
X k ' X =
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
35

A mdia influenciada por valores extremos.
No pode ser mensurada em distribuies com classes indeterminadas.

3.2.2 - Moda

A moda outra medida de posio, mas diferentemente das mdias, no utiliza em seu
clculo todos os valores do conjunto de dados analisado. A moda o valor que ocorre com maior
freqncia no conjunto de dados.
Notao: m
o
= moda
Ex:
a) X = {2, 3, 3, 5, 5, 5, 6, 7} m
o
= 5
b) Y = {10, 12, 17, 21, 32} m
o
= no existe, a distribuio amodal.
c) Z = {2, 2, 5, 5, 7, 7} m
o
= no existe
d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21} A distribuio apresenta dois valores modais:
12 e 18 (distribuio bimodal).
Quando o conjunto de dados apresenta mais de uma moda damos o nome de distribuio
plurimodal. A moda uma medida mais adequada ao caso de dados agrupados. Quando a
distribuio de freqncias est organizada por classes de valores, devemos identificar a classe
modal (classe em que observamos a maior freqncia). O ponto mdio da classe modal ser o valor
estimado para a moda que denominada moda bruta.

No caso de dados agrupados a moda pode ser calculada de acordo com a seguinte expresso:

mo
2 1
1
mo o
c


LI m
+
+ =


onde: LI
mo
= limite inferior da classe modal;
c
mo
= amplitude da classe modal;
A
1
= diferena entre as freqncias da classe modal e a classe anterior;
A
2
= diferena entre as freqncias da classe modal e a classe posterior

Obs: No caso de dados no agrupados, a moda nem sempre tem utilidade com elemento
representativo ou sintetizador do conjunto.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
36
Resumindo em uma tabela as modas das notas, temos:
Turma Moda
A 4,0
B 5,5

Para o exemplo da Tab. 3.3:

Propriedades da moda:

m
o
= m
o
K (somando K a todos os dados)
m
o
= m
o
. K (multiplicando todos os dados por K)

3.2.3 - Mediana

Notao: m
d
= mediana

Chamamos de mediana o elemento do conjunto que ocupa a posio central na distribuio
ordenada (crescente ou decrescente). Isto , divide a distribuio em duas partes iguais de modo
que 50% dos valores observados so inferiores ao valor mediano e 50% superiores a esse valor.

Notao: X(i)= elemento que ocupa a i-sima posio da srie ordenada.
n =nmero de elementos da srie.

(1)
2
X X
m
2
n
2
n
d
|
.
|

\
|
+ |
.
|

\
|
+
=
1
, n par. Ex: No conjunto: 500 500 600 800 1000 50000, como o
nmero de valores 6 (par), a mediana a mdia de 600 e 800, valendo ento 700.

(2)
|
.
|

\
| +
=
2
1 n d
X m , n mpar. Ex: No conjunto de dados: 10 15 26 28 29, como o nmero de
valores 5 (mpar), a mediana o 26.

8 7 2
7 13
13
5 6 c


LI m
mo
2 1
1
mo o
, , =
+
+ =
+
+ =
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
37
A mediana uma medida de posio resistente, pois pouco afetada por mudanas de
pequena poro dos dados, ao contrrio da mdia aritmtica que sensvel a valores atpicos.
Ex: Comparao entre a mdia aritmtica e a mediana para os conjuntos de salrios (em reais)
dados.
X = { 200, 250, 250, 300, 450, 460, 510} X = 345,7; m
d
= 300.
Y = { 200, 250, 250, 300, 450, 460, 2.300} Y = 601,0; m
d
= 300.

Podemos observar que no caso do conjunto Y a mdia no sintetiza adequadamente o conjunto de
dados, pois apenas um valor superior a ela.

Exemplo de aplicao: (Notas)
As mesmas comparaes feitas para a mdia faremos para a mediana para o nosso conjunto
de dados. Resumindo em uma mesma tabela as mdias e as medianas, temos:
Turma Mdia Aritmtica Mediana
A 3,8575 3,8
B 5,8725 5,8

Para ambas as turmas, a mdia aritmtica e a mediana apresentam valores semelhantes. Isso
indica que 50% das notas da turma A esto inferior a 3,8 e 50% da turma B apresentam superior a
5,8.
No caso de dados agrupados a mediana pode ser calculada de acordo com a seguinte
expresso:

em que, F
md
: freqncia da classe mediana,
c
md
: amplitude da classe mediana,
F
A
: freqncia acumulada das classes anteriores classe mediana; e
LI
md
: limite inferior da classe mediana.


md
md
A
md d
c .
F
F
2
n
LI m
(
(
(
(


+ =
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
38
A classe mediana a classe que contm a posio n/2 (posio mediana) da distribuio de
freqncia.
Para o exemplo da Tab. 4.3:


Propriedades da mediana:
m
d
= m
d
K (somando K a todos os dados)
m
d
= m
d
. K (multiplicando todos os dados por K)
E
i
x
i
- m
d
representa um valor mnimo

Vimos que as trs principais medidas de posio - a mdia aritmtica, a mediana e a moda -
tm o mesmo objetivo: determinar um valor tpico do conjunto de dados. Surge, ento, a seguinte
questo: quando deveremos utilizar cada uma dessas medidas?
De maneira geral, a moda a menos empregada e a mais difcil de calcular
satisfatoriamente. No entanto, adequada para caracterizar situaes onde estejam em causa os
casos ou valores mais usuais. Por exemplo, em resultados de uma avaliao, o professor pode estar
interessado nas notas que mais apareceram.
Correntemente a escolha feita entre a mdia e a mediana, dependendo da natureza do
problema a estudar e de outros fatores, muitos dos quais no podem abordar-se a nvel elementar.
A mediana tem vantagem: mais resistente do que a mdia, isto , a alterao drstica de
um s valor do conjunto de dados reflete-se substancialmente no valor da mdia e pode no refletir-
se, ou refletir-se muito pouco, no valor da mediana.
A mdia tem vantagens: quando a curva de freqncias tem forma de sino, mais ou menos
simtrica, com abas decaindo rapidamente (valores errticos muito improvveis), a mdia mais
eficiente do que a mediana; a mdia uma funo linear das observaes, propriedade que tambm
pode pesar na sua adoo.
Por fim, uma vantagem da mediana e da moda em relao mdia aritmtica que esta
ltima no pode ser calculada quando ocorrem classes de freqncias com limites indefinidos
(classes abertas). Entretanto, nesta situao, a moda e a mediana podem ser encontradas sem
qualquer dificuldade.
32 7 2
17
13
2
40
5 6 c .
F
F
2
n
LI m
md
md
A
md d
, , =
(
(
(
(


+ =
(
(
(
(


+ =
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
39
Muitas vezes existem dvidas de qual medida utilizar para sintetizar os dados amostrais.
Como uma regra geral, pode-se definir qual medida mais conveniente para uma dada situao com
base na anlise do histograma ou do polgono de freqncias. Se a distribuio dos dados por
assimtrica, isto quando valores extremos predominam em uma das caudas da distribuio, deve
se preferir a mediana como medida sintetizadora. Isto se deve ao fato da mediana ser pouco sensvel
a presena de valores extremos, sendo considerada mais robusta que a mdia. O termo robusto o
termo tcnico usado para indicar esta propriedade da mediana em relao mdia aritmtica.

Relao entre mdia, mediana e moda:

= m
d
= m
o
(distribuio simtrica; assimetria nula)

> m
d
> m
o
(distribuio assimtrica direita ou positiva)

X < m
d
< m
o
(distribuio assimtrica esquerda ou negativa)

3.3 - Medidas de Variao ou de Disperso

As medidas de posio no informam sobre a variabilidade dos dados e so insuficientes
para sintetizar as informaes amostrais. As medidas de disperso servem para avaliar o grau de
variabilidade dos valores de um conjunto de dados. Estas medidas permitem estabelecer
comparaes entre fenmenos de mesma natureza ou de natureza distinta e, em geral, essa
variabilidade observada em torno de uma medida de tendncia central. Essas medidas podem ser
absolutas ou relativas.

3.3.1 - Amplitude Total (medida de disperso absoluta)

Notao: A = Amplitude Total
Definio: A amplitude total de um conjunto de nmeros a diferena entre os valores extremos do
conjunto.
Observaes:
1) A amplitude total a medida mais simples de disperso.
X
X
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
40
2) A desvantagem desta medida de disperso que leva em conta apenas os valores mnimo e
mximo do conjunto. Se ocorrer qualquer variao no interior do conjunto de dados, a
amplitude total no nos d qualquer indicao dessa mudana.
3) A amplitude total tambm sofre a influncia de um valor "atpico" (outlier) na distribuio
(um valor muito elevado ou muito baixo em relao ao conjunto).

Exemplo de aplicao: (Notas)

Vamos observar no nosso conjunto de dados as mdias aritmticas e as amplitudes totais
(ranges) para termos uma primeira idia sobre a variabilidade das notas para as diferentes turmas.

Turma Mdia aritmtica Amplitude total
A 3,8575 3,6
B 5,8725 2,1

Podemos observar que a amplitude total para a turma B menor que a da turma A.

3.3.2 - Varincia e Desvio Padro

Poderia se pensar ento em utilizar a soma dos desvios em relao mdia como medida de
disperso ou de variabilidade. No entanto, esta medida no serve devido ao fato da soma de desvios
em relao mdia ser nula, e todos os conjuntos amostrais teriam variabilidade nula.
Uma medida da variabilidade que considera todas as observaes, e que a mais utilizada na
maioria das situaes na estatstica, devido s propriedades que possui a varincia ou a sua raiz
quadrada, o desvio padro. A varincia dada pela "mdia" da soma de quadrados de desvios em
relao mdia. Numa amostra de tamanho n , deveria ser utilizado este valor (n) como divisor,
desta soma de quadrados de desvios. No entanto, devido a motivos associados a propriedades dos
estimadores e inferncia estatstica, como divisor de varincia amostral usado n-1 em lugar de n
na expresso do clculo da varincia que ser apresentada a seguir.





Simbologia

Populao: Varincia o
2
e
Desvio Padro o

Amostra: Varincia S
2
e Desvio Padro
S


______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
41

A varincia amostral dada por:


em que, n 1 denominado graus de liberdade.
A unidade da varincia igual ao quadrado da unidade dos dados originais. O desvio
padro, por sua vez, expresso na mesma unidade do conjunto de dados, sendo obtido pela extrao
da raiz quadrada da varincia, fornecida pela expresso anterior.
Para o clculo da varincia ou desvio padro amostral a partir dos dados elaborados pode-se
usar a expresso acima. No entanto, devido a usar desvio em relao mdia ao quadrado, erros de
arredondamentos so comuns de ocorrer.
Por essa razo deve-se preferir as seguintes expresses (equivalentes):

Para a obteno do desvio padro, basta extrair a raiz quadrada:




Clculo para dados agrupados em distribuies de freqncia:
Para o exemplo da Tab. 3.2:


( )
1 n
n
1 i
2
X
i
X
2
S

=

=
2
S S =
(
(
(
(
(

|
.
|

\
|

=

=
=
k
1 i
2
k
1 i
i i
2
i i
2
n
X F
X F
1 n
1
S
( )
( )
48,9205 S
40
10 9,5 17 7,5 4 5,5 7 3,5 2 1,5
9,5 10 7,5 17 5,5 4 3,5 7 1,5 2
1 40
1
S
2
2
2 2 2 2 2 2
=
(
(

+ + + +
+ + + +

=
(
(
(
(
(

|
.
|

\
|

=

=
=
n
1 i
2
n
1 i
i
2
i
2
n
X
X
1 n
1
S
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
42

Exemplo de aplicao: (Notas)

Da mesma maneira que trabalhamos com a amplitude total, vamos observar no nosso
conjunto de dados para as mdias aritmticas e os desvios padres (S) para termos uma primeira
idia sobre a variabilidade nas notas das turmas A e B.
Turma
Mdia
Aritmtica
Desvio Padro
A 3,8575 0,8706
B 5,8725 0,4802

Podemos observar que a Turma B apresenta maior mdia que a da turma A e alm disso a
sua variabilidade menor. Parece que esta turma atinge mais os objetivos, ou seja, uniformidade
nas notas (menor disperso) e notas maiores.

Observaes:
O desvio padro tem a unidade de medida igual a unidade de medida original da varivel, enquanto
que a varincia apresentar a unidade de medida elevada ao quadrado.
Ao trabalharmos com os dados de toda a populao calculamos a varincia e o desvio padro
populacional dividindo por N (tamanho da populao) e no por N-1.

Propriedades:
varincia
somando ou subtraindo uma constante aos dados a varincia no se altera;
multiplicando todos os dados por uma constante K a nova varincia ficar multiplicada por K
2
.

desvio padro
somando ou subtraindo uma constante aos dados o desvio padro no se altera;
multiplicando todos os dados por uma constante K o novo desvio padro ficar multiplicado por K.
A varincia e o desvio padro medem a variabilidade absoluta de uma amostra. Para
exemplificar este fato o exemplo a seguir bastante ilustrativo.
X = {1,2,3}; Y = {101,102,103} e Z = {1001,1002,1003}

S
x
= 1,0 S
y
= 1,0 e S
z
= 1,0
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
43
Os trs conjuntos possuem a mesma variabilidade absoluta, porm bastante intuitivo que
um desvio padro de uma unidade tem importncia diferente. fcil verificar que o desvio padro
de uma unidade mais importante no conjunto X, pois representa 50% do valor mdio.

Exemplo de Aplicao: mdia do tempo de espera dos clientes em um banco. Qual o desvio padro?
6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7
Soluo: Devemos seguir os seguintes passos:
- achar a mdia dos valores;
- subtrair a mdia de cada valor individual;
- elevar ao quadrado cada uma das diferenas obtidas;
- somar todos os quadrados obtidos;
- dividir o resultado do passo 4 por (n 1);
- extrair a raiz quadrada do resultado do passo 5.
Os resultados esto apresentados na Tab. 3.3.

Tab. 3.3 - Clculo do Desvio Padro do tempo de espera dos clientes em um banco
x x mdia (x mdia)
2

6,5 - 0,65 0,4225
6,6 - 0,55 0,3025
6,7 - 0,45 0,2025
6,8 - 0,35 0,1225
7,1 - 0,05 0,0025
7,3 0,15 0,0225
7,4 0,25 0,0625
7,7 0,55 0,3025
7,7 0,55 0,3025
7,7 0,55 0,3025
71,5 2,0450

Mdia = 71,5 / 10 = 7,15




( )
0,48 0,2272
1 10
2,0450
s = =

=

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
44
100% x
X
S
CV =

3.3.3 - Coeficiente de Variao de Pearson
O desvio padro ou varincia permitem a comparao da variabilidade entre conjuntos
numricos que possuam a mesma mdia e a mesma unidade ou grandeza. Diz-se que o desvio
padro uma medida de disperso absoluta. Nos casos em que os conjuntos referem-se a diferentes
unidades e possuam mdias amostrais diferentes, uma medida de disperso relativa, como o
coeficiente de variao (CV), necessria para se comparar variabilidade. O coeficiente de
variao refere-se a variabilidade dos dados em relao a mdia dos mesmos, sendo obtido pela
expresso seguinte.



No exemplo dos trs conjuntos apresentados anteriormente, tem-se: CV
x
= 50%; CV
y
= 1%
e CV
z
= 0,1%.
Portanto, o conjunto X apresentou uma maior variabilidade em relao aos demais.

3.4 Box-Plot
O box-plot um mtodo alternativo ao histograma para representar os dados. O box-plot
fornece informaes sobre as caractersticas de posio, assimetria, comprimento das caudas e
outliers de um conjunto de dados.
A construo de um box-plot exige que tenhamos o valor mnimo, o primeiro quartil, a
mediana, o terceiro quartil e o valor mximo. Como a mediana revela uma tendncia central, ao
passo que o quartis indicam a disperso dos dados, os box-plot tm a vantagem de no serem to
sensveis a valores extremos como outras medidas baseadas na mdia e no desvio padro. Um
dos aspectos mais convenientes do uso dos box-plot a possibilidade de comparao entre dois ou
mais conjuntos de dados.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
45

Fig. 3.2 Box-plot

3.5 Exerccios
1) Dada amostra: 2, 3, 4, 5, 7, 10, 12.
a) Qual a amplitude?
b) Determine a mdia, a mediana e a moda.c) Calcule a varincia, o desvio-padro e o coeficiente
de variao.

2) Uma turma de 20 alunos apresentou o seguinte resultado numa prova de estatstica:
2,0 3,2 4,5 4,5 4,5 4,6 4,7 4,8 5,0 5,6
6,0 6,8 7,1 7,5 7,8 8,5 8,5 9,0 9,0 9,2

a) determinar a mdia, a mediana e a moda;
b) determinar a amplitude, a varincia, o desvio padro e o coeficiente de variao;
c) fazer uma anlise dos valores encontrados.

3) Na srie 60, 90, 80, 60, 50 a moda ser:
a) 50
b) 66
c) 60
d) 90
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
46

4) Quando queremos verificar a mquina que apresentou maior nmero de falhas, utilizamos:
a) moda
b) mediana
c) mdia
d) qualquer uma das anteriores.

5) O coeficiente de variao uma medida que expressa a razo entre:
a) desvio-padro e mdia
b) mdia e desvio-padro
c) amplitude e mediana
d) desvio-padro e moda.

6) O desvio-padro de um conjunto de dados 9. A varincia ser:
a) 3
b) 18
c) 36
d) 81

7) Numa distribuio de valores iguais, o desvio-padro :
a) igual a 1
b) positivo
c) zero
d) negativo

8) Os registros da biblioteca de uma grande universidade mostram que 14 alunos do ltimo ano do
curso de Administrao consultaram os seguintes nmeros de livros durante o ano acadmico:
62 73 40 72 79 88 51 48 42 75 65 69 72 47

a) determinar a mdia, a mediana e a moda;
b) determinar a amplitude, a varincia, o desvio padro e o coeficiente de variao;
c) fazer uma anlise dos valores encontrados.

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
47
9) Em uma fbrica ou um escritrio, o tempo, no horrio de trabalho, durante o qual um mquina
no est funcionando em virtude de quebra ou falha chamado tempo parado (downtime). A
distribuio a seguir uma amostra da durao desses tempos parados de certa mquina:
tempo parado (min) F
i
x
i
F
i
. x
i
F
i
. x
i
2
(0 10] 2 5
(10 20] 15 15
(20 30] 17 25
(30 40] 13 35
(40 50] 3 45
Total 125 -

Determine:
a) a mdia
b) a mediana
c) a moda
d) a varincia
e) o desvio padro
f) o coeficiente de variao
g) o primeiro e o terceiro quartil

4. MEDIDAS DE ASSIMETRIA E CURTOSE
Como foi visto vrias medidas que sintetizem a informao da amostra foram apresentadas,
destacando-se suas vantagens e desvantagens. Foi apresentado tambm, formas grficas para
avaliao da natureza da distribuio dos dados. Neste ltimo caso por uma inspeo emprica o
pesquisador podia inferir que tipo de distribuio os dados de sua pesquisa apresentavam. Naquele
instante deu-se nfase a simetria da distribuio, ou seja, se a forma da distribuio apresentava
uma concentrao maior dos valores em torno do valor central e se medida que se afastasse em
ambas as direes deste valor, o comportamento se mantinha semelhante, reduzindo-se as
freqncias. Uma forma de se estimar o grau de assimetria ou de simetria de uma distribuio, pode
ser dada pelo coeficiente de assimetria, cuja notao para represent-lo A
s
.




s
m x
o

= As

______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
48
O coeficiente de assimetria pode ser interpretado da seguinte forma:
A
s
< 0 distribuio assimtrica esquerda;
Fig. 4.1 Distribuio assimtrica esquerda

A
s
= 0 distribuio simtrica.
Fig. 4.2 Distribuio simtrica
A
s
> 0 distribuio assimtrica direita.
Fig. .3 Distribuio assimtrica direita

Uma outra medida para verificar a natureza da distribuio, denominada de curtose. Esta
uma medida do grau de achatamento da distribuio quando comparada ao de uma distribuio
conhecida como distribuio normal, sendo denominada de distribuio mesocrtica. As
distribuies leptocrticas so mais pontudas que a distribuio normal e as distribuies
platicrticas so aquelas mais achatadas do que a normal.
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
49
y~normal(x,1)
y~normal(x,0,2)
y~normal(x,0,3)
FunodedensidadedeprobabilidadeNormal
y~normal(x;0;i), i=1,2,3
0,00
0,15
0,30
0,45
0,60
-3,50 -1,75 0,00 1,75 3,50

Fig. 4.4 Classificao quanto curtose
(x, 1) leptocrtica; (x, 0, 2) mesocrtica; (x, 0, 3) platicrtica

4.1 Distribuio Normal
Uma varivel aleatria apresenta distribuio normal se essa distribuio simtrica e
apresenta a forma de sino. Ela depende de dois parmetros: a mdia e o desvio padro.

Regra Emprica (Adaptado do livro Estatstica Aplicada Administrao e Economia, Anderson,
David R. et al, Editora Pioneira, 2002)
Para dados que tm distribuio normal, em forma de sino:
Aproximadamente 68% dos valores de dados estaro dentro de um desvio padro da mdia;
Aproximadamente 95% dos valores de dados estaro dentro de dois desvios padres da mdia;
______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
50
Quase todos os valores de dados estaro dentro de trs desvios padres da mdia.
Fig. 4.5 A regra emprica

Teorema de Chebyshev (Adaptado do livro Introduo Estatstica, Triola, Mario, Editora LTC,
1999)

A proporo (ou frao) de qualquer conjunto de dados a menos de k desvios padro a
contar da mdia sempre ao menos 1 1/k
2
, onde k um nmero positivo maior do que 1. Para k =
2 e k = 3, temos os seguintes resultados especficos:
ao menos 75% de todos os valores esto dentro de dois desvios padres da mdia;
ao menos 89% de todos os valores esto dentro de trs desvios padres da mdia.

O Teorema de Chebyshev se aplica a qualquer conjunto de dados, mas seus resultados so
aproximados.









______________________________________________________________________________________________________________
Curso de Bacharelado em Cincia e Tecnologia BC&T ICET UFVJM/CM
Disciplina: Probabilidade e Estatstica Prof. MSc. Marcos Antnio Resende Miranda.
51

BIBLIOGRAFIA RECOMENDADA


ANDERSON, David R. & SWEENEY, Dennis J. & WILLIAMS , Thomas A. Estatstica Aplicada
Administrao e Economia. Traduo da 2 edio norte-americana Luiz Srgio de Castro
Paiva; reviso tcnica Petrnio Garcia Martins.. So Paulo: Pioneira Thomson Learning, 2002.

BUSSAB, Wilton de O. & MORETTIN, Pedro A. Estatstica Bsica. 5 ed. So Paulo: Saraiva,
2003.

FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade; TOLEDO, Geraldo Luciano.
Estatstica Aplicada. So Paulo: Atlas, 1995.

FREUND, John E. & SIMON, Gary A. Estatstica Aplicada: economia, administrao e
contabilidade. Traduo Alfredo Alves de Farias. 9 ed. Porto Alegre: Bookman, 2000.

MILONE, Giuseppe; ANGELINI, Flvio. Estatatstica aplicada. So Paulo: Atlas, 1995.

OLIVEIRA, Francisco Estevam Martins de. Estatstica e Probabilidade. 2 ed. So Paulo: Atlas,
1999.

SILVA, Ermes Medeiros da; SILVA, Elio Medeiros da; GONALVES, Valter. Estatstica: para
os cursos de economia, administrao e cincias contbeis. 3 ed. So Paulo: Atlas, 1997. V.1

STEVENSON, William J. Estatstica aplicada administrao. So Paulo: Harbra, 1986.

TRIOLA, Mario F. Introduo Estatstica. Traduo de Alfredo Alves de Faria. 7 ed. Rio de
Janeiro: LTC, 1999.

You might also like