You are on page 1of 98

CB Virtual 2

Universidade Federal da Paraba


Universidade Aberta do Brasil
UFPB VIRTUAL
COORDENAO DO CURSO DE LICENCIATURA EM CINCIAS BIOLGICAS DISTNCIA
Caixa Postal 5046 Campus Universitrio - 58.051-900 Joo Pessoa
Fone: 3216-7838 e 8832-6059
Home-page: portal.virtual.ufpb.br/biologia

UFPB

Curso de Licenciatura em Cincias


Biolgicas Distncia
Coordenador

Reitor
Rafael Angel Torquemada Guerra
Rmulo Soares Polari
Coordenao de Tutoria
Pr-Reitor de Graduao

Diego Bruno Milans Lopes

Valdir Barbosa Bezerra

Coordenao Pedaggica
Isolda Ayres Viana Ramos

UFPB Virtual
Coordenao de Estgio
Coordenador
Paulo Csar Geglio
Renata Patrcia Jernymo Moreira
Edson de Figueiredo Lima Junior

Coordenao de TCC

Centro de Cincias Exatas e da Natureza

Jos Vaz Neto

Diretor
Apoio de Designer Instrucional
Antnio Jos Creo Duarte
Luizngela da Fonseca Silva
Departamento de Sistemtica e Ecologia

Artes, Design e Diagramao

Chefe

Romulo Jorge Barbosa da Silva

Juraci Alves de Melo

Apoio udio Visual


Edgard Adelino Ruiz Sibro

C569CadernosCbVirtual2/RafaelAngel
TorquemadaGuerra...[etal.].

JooPessoa:Ed.Universitria,2011.

610p.:II.
ISBN:9788577459025
EducaoaDistncia.2.Biologia
I.Guerra,RafaelAngelTorquemada.
UFPB/BCCDU:37.018.43

ESTATSTICA VITAL
Gilmara Alves Cavalcanti
UNIDADE 1
ANLISE DE DADOS ESTATSTICOS
1. Situando a Temtica
A Estatstica considerada por alguns autores como Cincia no sentido do estudo de uma
populao. considerada como mtodo quando utilizada como instrumento por outra Cincia.
A palavra estatstica frequentemente est associada imagem de aglomerao de nmeros,
dispostos em uma imensa variedade de tabelas e grficos, representando informaes to
diversas como nascimentos, mortes, taxas, populaes, rendimentos, dbitos, crditos, etc. Isto
devido ao uso comum da palavra estatstica como sinnimo de dados, como, por exemplo,
quando falamos das estatsticas de uma eleio, estatsticas da sade, estatsticas de acidente de
trnsito ou as estatsticas de acidentes de trabalho.
No sentido moderno da palavra, estatstica lida com o desenvolvimento e aplicao de
mtodos para coletar, organizar, analisar e interpretar dados de tal modo que a segurana das
concluses baseada nos dados pode ser avaliada objetivamente por meio de proposies
probabilsticas.
O propsito da estatstica no exclusivo de qualquer cincia isolada. Ao contrrio, a
estatstica fornece um conjunto de mtodos teis em toda rea cientfica onde haja a necessidade
de se coletar, organizar, analisar e interpretar dados. Estes mtodos podem ser usados to
eficazmente em farmacologia como em engenharia, biologia, em cincias sociais ou em fsica.

2. Problematizando a Temtica
Ao estudarmos fenmenos naturais, econmicos ou biolgicos tais como, a precipitao de
chuvas em uma determinada regio, a evoluo da taxa de inflao em uma regio metropolitana,
a influncia das mars no desenvolvimento de animais marinhos, etc., estamos lidando com
experimentos cujos resultados no conhecemos e desejamos saber se as hipteses que
afirmamos so verdadeiras, isto , se os fenmenos esto ocorrendo como espervamos. Para
isto, necessrio que os dados oriundos das observaes possam nos dar informaes claras e
precisas. Estes dados devem ser organizados de forma adequada para podermos fazer uma
anlise crtica e fundamentada do fenmeno.
A partir de agora voc est convidado a participar de uma experincia que consiste em
obter um conjunto de dados, represent-lo em distribuies de frequncias e apresent-lo atravs
de tabelas e grficos. Ver como algumas medidas estatsticas podem nos auxiliar nesta anlise e
como utiliz-las.

385

3. Conhecendo a Temtica
3.1. Conceitos Bsicos de Estatstica
Podemos considerar a Estatstica como um conjunto de mtodos e processos
quantitativos que serve para estudar e medir os fenmenos coletivos.
A estatstica teve acelerado seu desenvolvimento a partir do sculo XVII, atravs dos
estudos de Bernoulli, Fermat, Pascal, Laplace, Gauss, Galton, Pearson, Fisher, Poisson e outros
que estabeleceram suas caractersticas essenciais. A Estatstica tem como OBJETIVO o estudo
dos fenmenos coletivos.
A Estatstica a cincia que trata da coleta, do processamento e da disposio dos
dados.
Objetivando o estudo quantitativo e qualitativo dos dados (ou informaes), obtidos nos
vrios campos da atividade cientfica, a Estatstica manipula dois conjuntos de dados
fundamentais: a "populao" e a "amostra".
Populao (ou Universo)
o conjunto dos seres, objetos ou informaes que interessam ao estudo de um fenmeno
coletivo segundo alguma(s) caracterstica(s). , portanto, um conjunto definido de informaes
relativas a qualquer rea de interesse, podendo, quanto ao nmero de elementos, ser: finita
(tamanho N) ou infinita. Na maioria das vezes no conveniente, ou mesmo possvel, realizar o
levantamento dos dados referentes a todos os elementos de uma populao. Portanto,
analisamos parte da populao, isto , uma amostra.
Amostra
um subconjunto no vazio ou parte da populao. Duas consideraes devem ser feitas
sobre o estudo amostral dos fenmenos. Uma diz respeito aos cuidados que se deve tomar para
assegurar que a amostra seja representativa da populao. Para atender a essa exigncia, devese selecionar os elementos de forma aleatria, de modo que todo e qualquer elemento da
populao tenha a mesma chance de participar da amostra, a outra diz respeito preciso dos
dados coletados, buscando minimizar os erros que poderiam induzir a concluses equivocadas. O
nmero de elementos de uma amostra chamado o tamanho da amostra, e denotado por n.
Definio 1.1: Parmetro
Uma caracterstica numrica estabelecida para toda uma populao denominada parmetro.
So valores, geralmente desconhecidos (e que, portanto, tm de ser estimados), que representam
certas caractersticas da populao.

386

Definio 1.2: Estimador


uma caracterstica baseada em observaes amostrais e usada para indicar o valor de um
parmetro populacional desconhecido.
Definio 1.3: Estimativa
O valor numrico assumido pelo estimador numa determinada amostra denominada estimativa.
Exemplo 1.1:
No fenmeno coletivo eleio para reitor da UFPB, a populao o conjunto de todos os
eleitores habilitados na Universidade. Um parmetro a proporo de votos do candidato A. Uma
amostra pode ser um grupo de 300 eleitores selecionados em toda a UFPB. Um estimador a
proporo de votos do candidato A obtida na amostra. O valor resultante do estimador, a
proporo amostral, a estimativa.
Processos Estatsticos de Abordagem
Quando solicitados a estudar um fenmeno coletivo podemos optar entre os seguintes
processos estatsticos:
a) CENSO Avaliao direta de um parmetro, utilizando-se todos os componentes da
populao. Entre as principais caractersticas de um Censo, podemos destacar: admite
erro processual zero e tem confiabilidade 100%, caro, lento e quase sempre
desatualizado. Nem sempre vivel.
b) AMOSTRAGEM (INFERNCIA) Avaliao indireta de um parmetro, com base em um
estimador atravs do clculo das probabilidades. Entre as principais caractersticas,
podemos destacar: admite erro processual positivo e tem confiabilidade menor que
100%, barata, rpida e atualizada. sempre vivel.
Dados Estatsticos
Normalmente, no trabalho estatstico, o pesquisador se v obrigado a lidar com grande
quantidade de valores numricos resultantes de um censo ou de uma amostragem. Estes valores
numricos so chamados dados estatsticos.
No sentido da disciplina, a Estatstica ensina mtodos racionais para a obteno de
informaes a respeito de um fenmeno coletivo, alm de obter concluses vlidas para o
fenmeno e tambm permitir tomada de decises, atravs dos dados estatsticos observados.
Desta forma, a estatstica pode ser dividida em duas reas: Estatstica Descritiva e Estatstica
Inferencial.
Estatstica Descritiva
a parte da Estatstica que tem por objetivo descrever os dados observados. A Estatstica
Descritiva, na sua funo de descrio dos dados, tem as seguintes atribuies:
387

A obteno dos dados estatsticos;


A organizao dos dados;
A reduo dos dados;
A representao dos dados e
A obteno de algumas informaes que auxiliam a descrio do fenmeno
observado.

A obteno ou coleta dos dados normalmente feita atravs de um questionrio ou de


observao direta de uma populao ou amostra. A organizao dos dados consiste na
ordenao e crtica quanto correo dos valores observados, falhas humanas, omisses,
abandono de dados duvidosos, etc. A reduo dos dados envolve o entendimento e a
compreenso de grande quantidade de dados atravs de simples leitura de seus valores
individuais uma tarefa extremamente rdua e difcil mesmo para o mais experimentado
pesquisador. A representao dos dados compreende de
tcnicas para uma melhor
visualizao dos dados estatsticos, facilitando sua compreenso. Por exemplo, os grficos,
quando bem representativos, tornam-se importantes instrumentos de trabalho. ainda atributo da
Estatstica Descritiva a obteno de algumas informaes que sumarizam os dados, facilitando a
descrio dos fenmenos observados.
Estatstica Inferencial (ou Indutiva)
a parte da Estatstica que tem por objetivo obter e generalizar concluses para a
populao a partir de uma amostra. Complementando o processo descritivo, a Estatstica Indutiva
estuda parmetros a partir do uso de estimadores usando o clculo das probabilidades, elemento
este que viabiliza a Inferncia Estatstica.
Dados ou Variveis Estatsticas
As informaes ou dados caractersticos dos fenmenos ou populaes so denominados
variveis estatsticas ou simplesmente variveis. Conforme suas caractersticas particulares
podem ser classificadas da seguinte forma:
Quantitativas: So aquelas que podem ser expressas em termos numricos. Em geral
so as resultantes de medies, enumeraes ou contagens. So subdivididas em
contnuas e discretas, conforme abaixo:
o

Contnuas: So aquelas que podem assumir qualquer valor num certo intervalo de
medida, podendo ser associados ao conjunto dos nmeros reais, ou seja, um
conjunto no enumervel. Entre outras, enquadram-se nesta categoria as medidas
de tempo, comprimento, espessura, rea, volume, peso, velocidade, dosagem de
hemoglobina no sangue, concentrao de flor na gua oferecida populao, etc.
Discretas: Quando s podem assumir determinados valores num certo intervalo,
ou seja, um conjunto finito ou enumervel. Em geral, representam nmeros
inteiros resultantes de processo de contagem, como o nmero de alunos por sala,
de crditos por disciplinas, de pacientes atendidos diariamente num hospital, etc.

388

De modo geral, as medies do origem a variveis contnuas e as contagens ou


enumeraes, a variveis discretas. Designamos estas variveis por letras latinas, em geral, as
ltimas: X, Y, Z.
Qualitativas: Nem sempre os elementos de uma populao so exclusivamente
contveis. Muitas vezes, eles podem ser qualificados tambm segundo algumas de suas
caractersticas tpicas. Nesses casos, as variveis podem ser agrupadas em nominais
ou ordinais (por postos):
o

Nominais: Quando puderem ser reunidas em categorias ou espcies com idnticos


atributos. Aqui se incluem os agrupamentos por sexo, rea de estudo,
desempenho, cor, raa, nacionalidade e religio.
Ordinais: Quando os elementos forem reunidos segundo a ordem em que
aparecem dispostos numa lista ou rol. So tpicas desta forma de agrupamento,
variveis como classe social, grau de instruo, entre outras.

Em geral, uma mesma populao pode ser caracterizada por mais de um tipo de varivel. Assim,
os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser
agrupados segundo o sexo ou rea de estudo e podem ainda ser classificados segundo as notas
obtidas nas provas prestadas.
3.2. Fases do Experimento Estatstico
Em linhas gerais, podemos distinguir no mtodo estatstico as seguintes etapas:
Definio do
Problema

Planejamento

Anlise e Interpretao
dos Dados

Coleta dos
Dados

Tabelas e
Grficos

Crtica dos
Dados

Apresentao
dos Dados

3.2.1. Definio do Problema


Saber exatamente o que se pretende pesquisar, ou seja, definir corretamente o problema.
Essa primeira fase consiste na formulao correta do problema a ser estudado.
3.2.2. Planejamento
o trabalho inicial de coordenao no qual define-se a populao a ser estudada
estatisticamente, formulando-se o trabalho de pesquisa atravs da elaborao de questionrio,
entrevistas, etc.
A organizao do plano geral implica em obter respostas para uma srie tradicional de
perguntas, antes mesmo do exame das informaes disponveis sobre o assunto, perguntas que
procuram justificar a necessidade efetiva da pesquisa, a saber:
389

"quem", "o que", "sempre", "por que", "para que", "para quando".
Imaginemos, por exemplo, que o Governo do Estado tenha necessidade de obter
informaes acerca do desempenho em Biologia dos estudantes matriculados na rede pblica de
ensino.
O primeiro trabalho da equipe encarregada da pesquisa ser, evidentemente, o de obter
respostas para aquelas perguntas. Seriam ento:
* Quem deseja as informaes?
* O que devemos perguntar no questionrio?
* A pesquisa ser peridica ou ocasional? Ser executada sempre?
* Por que desejam as informaes?
* Quando dever estar concluda a pesquisa?
* Qual a poca oportuna para a aplicao dos questionrios?
* Para que desejam as informaes?
Ainda na fase do planejamento, temos:

O Exame das Informaes Disponveis: Trabalho inicial de coleta de trabalhos ou


publicaes sobre o assunto, obtendo-se relatrios sobre atividades semelhantes
ou correlatas;
A Definio do Universo: Isto , saber qual o conjunto a ser pesquisado,
distribuindo, classificando ou agrupando os elementos desse conjunto em
subpopulaes, para permitir um trabalho mais fcil, mais lgico, mais racional;
O tipo de levantamento, Censo ou Amostragem: Dever ser decidido com a
devida antecedncia e a necessria anlise das vantagens e desvantagens de um
e de outro, em virtude do custo financeiro e do prazo determinado para a concluso
do trabalho.

3.2.3. Coleta de Dados


Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do
fenmeno coletivamente tpico que se quer pesquisar, damos incio coleta dos dados
numricos necessrios sua descrio.
A coleta dos dados poder ser feita de diversas formas. A ideal aquela que maximiza os
recursos disponveis, dados os objetivos e a preciso previamente estipulados. No seu
planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestar,
a freqncia de sua ocorrncia, e outras particularidades julgadas importantes.
Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poder ser
realizada mediante respostas a questionrios previamente elaborados. Esses questionrios
podem ser enviados aos entrevistados para devoluo posterior ou podem ser aplicados pelos
prprios pesquisadores ou por entrevistadores externos ou contratados.
Os dados ou informaes representativas dos fenmenos ou problema em estudo podem
ser obtidos de duas formas: por via direta ou por via indireta.
390

Por Via Direta: Quando feita sobre elementos informativos de registro obrigatrio (Exemplo:
fichas no servio de ambulatrio, nascimentos, casamentos, bitos, matrculas de alunos etc.) ou,
ainda, quando os dados so coletados pelo prprio pesquisador atravs de entrevistas ou
questionrios. A coleta direta de dados, com relao ao fator tempo, pode ser classificada em:
1.1. Contnua: Tambm denominada registro, feita continuamente, tal como a de
nascimentos e bitos, etc. Tambm so do tipo contnuo o registro de certas doenas,
como cncer, hansenase, tuberculose e tambm algumas doenas infecciosas agudas
com finalidade de controle.
1.2. Peridica: Quando feita em intervalos constantes de tempo, como os censos (de 10 em
10 anos), os balanos de uma farmcia, etc.;
1.3. Ocasional: Quando feita extemporaneamente, a fim de atender a uma conjuntura ou a
uma emergncia, como no caso de epidemias que assolam ou dizimam seres humanos
Por Via Indireta: Quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento
de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a
pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos via coleta direta.
3.2.4. Crtica dos Dados
Os dados colhidos por qualquer via ou forma e no previamente organizados so
chamados de dados brutos. Esses dados brutos, antes de serem submetidos ao processamento
estatstico propriamente dito, devem ser "criticados", visando eliminar valores imprprios e erros
grosseiros que possam interferir nos resultados finais do estudo. A crtica externa quando visa
s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que
lhe foram feitas; interna quando se observa o material constitudo pelos dados coletados. o
caso, por exemplo, da verificao de somas de valores anotados.
3.2.5. Apurao ou Processamento dos Dados (Apresentao dos Dados)
Uma vez assegurado que os dados brutos so consistentes, devemos submet-los ao
processamento adequado aos fins pretendidos. A apurao ou processamento dos dados pode
ser manual, eletromecnica ou eletrnica. Os processos e mtodos estatsticos aos quais os
conjuntos de dados podem ser submetidos sero nosso objeto de estudo nas sees seguintes.
3.2.6. Exposio ou Apresentao dos Dados (Tabelas e Grficos)
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser
apresentados sob forma adequada (tabelas ou grficos), tornando mais fcil o exame daquilo
que est sendo objeto de tratamento estatstico. No caso particular da estatstica descritiva, o
objetivo do estudo se limita, na maioria dos casos, simples apresentao dos dados, assim
entendida a exposio organizada e resumida das informaes coletadas atravs de tabelas ou
quadros, bem como dos grficos resultantes.
3.2.7. Anlise e Interpretao dos Dados
391

Consiste em tirar concluses que auxiliem o pesquisador a resolver seu problema,


descrevendo o fenmeno atravs do clculo de medidas estatsticas. O objetivo ltimo da
Estatstica tirar concluses sobre o todo (populao) a partir de informaes fornecidas por parte
representativa do todo (amostra). Realizadas as fases anteriores (Estatstica Descritiva),
fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Inferencial, que
tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses.

:: SAIBA MAIS... ::
Sries Estatsticas: So os dados organizados em forma de tabelas. De acordo com
a poca de ocorrncia, o local e o fenmeno classificam-se, respectivamente, em:
a) Srie Temporal: Os dados so observados segundo a poca de sua ocorrncia.
b) Srie Geogrfica: Os dados so observados segundo o local onde ocorreram.
c) Srie Especificativa: Os dados so agrupados segundo a modalidade (espcie)
de ocorrncia.
d) Srie Mista ou de Dupla Entrada: Fuso de duas ou mais sries simples. Pode
ser visto como uma Tabela de Contingncia, a qual ocorre quando os elementos
da amostra ou da populao so classificados de acordo com dois fatores.

Exemplos:

SRIE TEMPORAL

SRIE ESPECIFICATIVA

Tabela 1 Populao brasileira no perodo de


1940 a 1970.
Anos

Populao

1940
1950
1960
1970

41.236.315
51.944.397
70.119.071
93.139.037

Helmintos

Fonte: Internet.

Tabela 2 Regio de origem de universitrios.


So Paulo, 2000.
Regio
Quantidade

Total

2000

7
9
22
33

Total

SRIE GEOGRFICA

240
1400
360

Percentual

Schistosoma
Enterobius
Necator
Ascaris

Fonte: Livro de Estatstica.

Urbana
Suburbana
Rural

Tabela 3 Infeces por helmintos


segundo a prevalncia mundial. Brasil,
2001.

Fonte: Livro de Estatstica.

SRIE MISTA
Tabela 4 Nmero de alunos segundo curso e
sexo. Natal, 2003.
Sexo
Curso
M
F
Biologia
Ecologia

8
1

6
3

Total

Fonte: Livro de Estatstica.

392

Entendi! Posso pensar na Estatstica como nmeros que resumem fatos e


nmeros puros dando-lhes algum significado. Ela apresenta ideias-chave que
podem no estar imediatamente aparentes ao observar dados puros. Quando
usamos a palavra dados, queremos dizer fatos ou nmeros com base nos
quais podemos tirar concluses. Isso legal! E essas tabelas? Ouvi dizer que
existem normas tcnicas para sua construo. Como so essas regras?
NORMAS TCNICAS PARA APRESENTAO TABULAR
De um modo geral tem-se a destacar em uma tabela (disposio escrita que se obtm
referindo-se a uma coleo de dados numricos a uma determinada ordem de classificao) os
seguintes elementos essenciais (obrigatrios) e complementares (no-obrigatrios):
Elementos Essenciais:
Ttulo: Indicao que precede a tabela e que contm a designao do fato observado,
o local e a poca em que foi registrado.
Cabealho: Parte superior da tabela que especifica o contedo das colunas.
Coluna Indicadora: Parte da tabela que especifica o contedo das linhas.
Corpo da tabela: Conjunto de colunas e linhas que contm as informaes sobre a
varivel em estudo.
Fonte: Entidade responsvel pela informao.
Elementos Complementares:
Notas: Informaes de natureza geral destinadas a conceituar ou esclarecer o
contedo das tabelas ou a indicar a metodologia adotada no levantamento ou na
elaborao dos dados.
Chamadas: Informaes de natureza especfica sobre determinada parte da tabela,
destinada a conceituar ou a esclarecer dados.
Sinais Convencionais: Nenhuma casa da tabela deve ficar em branco, apresentando
sempre um smbolo, a saber:
(hfen): quando o valor numrico nulo;
(reticncia): quando no se dispe de dado;
? (ponto de interrogao): quando h dvidas quanto exatido do valor numrico;
0,0: quando o valor numrico muito pequeno para ser expresso pela unidade
utilizada. Se os valores so expressos em nmeros decimais, acrescenta-se o
mesmo nmero de casas decimais ao valor zero;
x (letra x): quando o dado for omitido a fim de evitar individualizao da
informao.
As tabelas apresentadas oficialmente devem atender s normas da ABNT (resoluo 886 de
20/10/60).

393

3.3. Estatstica Descritiva


A Estatstica Descritiva a parte da estatstica que se ocupa com a coleta, crtica,
ordenao e apresentao das informaes fundamentais caracterizao e descrio do
fenmeno que se deseja estudar e interpretar. Aqui se trabalhar com alguma caracterstica
notvel do objeto de estudo, a qual ter de ser coletada de alguma forma e em algum lugar. Na
coleta das informaes deve-se considerar, preferencialmente, toda a populao; caso a obteno
de dados sobre toda a populao (censo) seja difcil ou at mesmo impossvel (dado o grande
nmero de elementos ou a sua disperso no tempo ou no espao), o estudo poder ser feito com
base numa amostra representativa.
3.3.1. Distribuies de Frequncia
Os dados numricos, aps coletados, so colocados em srie e apresentados em tabelas
ou quadros. Quando se estuda uma varivel (qualitativa ou quantitativa), o maior interesse do
pesquisador conhecer a distribuio dessa varivel atravs das possveis realizaes (valores) da
mesma. Iremos, pois, ver uma maneira de se dispor um conjunto de valores, de modo a se ter uma
boa idia global sobre esses valores, ou seja, de sua distribuio.
Uma distribuio de frequncias pode ser apresentada nas seguintes maneiras:
Distribuio de Frequncias por Valores (varivel qualitativa ou quantitativa
discreta): construda considerando-se todos os diferentes valores ou categorias,
levando em considerao suas respectivas repeties.
Distribuio de Frequncias por Intervalos ou Classes (varivel quantitativa):
Constroem-se classes de valores, levando em considerao o nmero de valores
que pertencem a cada classe e quando a variabilidade dos dados grande. A
construo de tabelas de freqncias para variveis contnuas necessita de certos
cuidados.

Exemplo 1.1: A Tabela 1 apresenta a distribuio de frequncia da varivel


PROCEDNCIA, a partir dos dados do Quadro 1.
Tabela 1 Freqncias e percentuais dos 46 estudantes de EV, segundo a
regio de procedncia. Joo Pessoa, 1997.
Percentual ( fi %)
Procedncia
No Estudantes ( Fi )
Capital
20
43,5
Interior
16
34,8
Outra Regio
10
21,7
Total
46
100,0
FONTE: Quadro 01.

394

Quadro 1 Informaes sobre sexo, curso, idade (anos), procedncia, renda familiar, nmero de
disciplinas matriculado(a), peso (kg) e altura (cm) de 46 alunos matriculados na disciplina
Estatstica Vital (EV).

ID

SEXO

CURSO

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

Fem
Masc
Fem
Fem
Masc
Fem
Fem
Masc
Fem
Masc
Fem
Masc
Masc
Fem
Fem
Fem
Fem
Fem
Fem
Masc
Masc
Masc
Masc
Fem
Masc
Masc
Masc
Masc
Fem
Masc
Masc
Fem
Masc
Fem
Masc
Fem
Fem
Masc

Fsica
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Fsica
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.

IDADE
(Anos)

19
18
18
18
18
20
20
19
19
18
18
21
18
18
18
19
19
18
23
18
21
19
19
17
18
19
17
21
18
21
21
18
21
19
18
17
19
19

PROCEDNCIA

Interior
Capital
Outra Regio
Capital
Capital
Interior
Interior
Capital
Outra Regio
Capital
Capital
Outra Regio
Interior
Interior
Capital
Capital
Capital
Capital
Outra Regio
Interior
Outra Regio
Capital
Outra Regio
Interior
Interior
Outra Regio
Interior
Interior
Interior
Outra Regio
Capital
Capital
Capital
Outra Regio
Capital
Capital
Capital
Capital
395

RENDA

NO. DISCIP.

PESO

ALTURA

FAMILIAR

MATRIC.

(kg)

(cm)

Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
No Info.
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Baixa
Mdia
No Info.
Mdia
Mdia
Mdia
Mdia
Alta
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia

6
6
6
6
6
6
6
6
3
6
6
5
6
6
6
6
7
6
6
6
6
6
6
6
6
6
6
5
5
6
6
6
5
6
6
6
6
6

47
75
61
56
80
44
52
67
48
83
53
66,5
78
46
54
56
53
57
53
76
65
78,5
104
47,5
67,5
61
68
75
58
65
67
47
69
68
53
51
63
60

156
167
169
163
178
158
158
174
167
180
163
175
180
158
160
162
160
164
160
180
171
180
183
155
175
160
169
178
154
165
178
167
179
170
166
153
168
166

39
40
41
42
43
44
45
46

Masc
Masc
Masc
Masc
Fem
Masc
Masc
Masc

Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.

18
21
18
19
18
18
22
21

Capital
Interior
Interior
Interior
Capital
Outra Regio
Interior
Interior

Mdia
Mdia
Baixa
Mdia
Mdia
Mdia
Mdia
Mdia

6
5
6
6
6
6
6
6

72
54
60
75
52
100
80
50

174
163
165
181
160
175
179
166

FONTE: Questionrio aplicado (Aula 24/03/97).

Exemplo 1.2: A Tabela 2 apresenta a distribuio de frequncia da varivel NO DE


DISCIPLINAS MATRICULADO(A), a partir dos dados do Quadro 1 (Dados Agrupados sem
Intervalos).
Tabela 2 Frequncias e percentuais do nmero de disciplinas matriculadas dos 46
estudantes de EV. Joo Pessoa, 1997.
No Disciplinas Matriculadas
Percentual ( fi %)
No Estudantes ( Fi )
(Xi)
3
1
2,2
5
5
10,9
6
39
84,8
7
1
2,2
Total
46
100,0
FONTE: Quadro 1.

CONTRUINDO UMA DISTRIBUIO DE FREQUNCIAS POR CLASSES


Regras Bsicas para Elaborao de uma Distribuio de Frequncias por Classes ou
Intervalos:
1. Colete n dados referentes varivel cuja distribuio ser analisada. aconselhvel
que n seja superior a 50 para que possa ser obtido um padro representativo da distribuio.
2. Efetua-se um ROL ESTATSTICO (organizao dos dados de forma crescente) nos
Dados Brutos (aqueles ainda no organizados numericamente).
3. Identifique o menor valor (LI ou Xmn) e o maior valor (LS ou Xmx) da amostra.
4. Calcule a AMPLITUDE TOTAL (AT) dos dados: AT = Xmx Xmn.
5. Escolhe-se convenientemente o nmero de classes k (inteiro); 5 k 15 , onde
podemos tomar:

k n ou k 1 + 3,3 log(n ) , se n 50

6. Calcule o comprimento de cada classe (h) dos dados: h =

AT
k

aconselhvel construir classes de mesma amplitude.


7. Efetua-se o AGRUPAMENTO EM CLASSES, calculando os limites de cada classe:

396

1 Classe:
Limite Inferior: LI 1 = X min

Limite Superior: LS1 = LI 1 + h

2 Classe:
Limite Inferior: LI 2 = LS1

Limite Superior: LS 2 = LI 2 + h

i-sima Classe:
Limite Inferior: LI i = LS i 1

Limite Superior: LS i = LI i + h

Continue estes clculos at que seja obtido um intervalo que contenha o maior
valor da amostra (Xmx) entre seus limites.
8. Construa a tabela de distribuio de frequncias.
Uma tabela de distribuio de frequncias (por classes ou valores) dever conter as
seguintes colunas:
Nmero de ordem de cada classe (i) ou valor.
Limites de cada classe (no caso da distribuio de frequncias por classes).
o As classes so fechadas esquerda e abertas a direita.
o As observaes iguais ao limite superior da classe (i 1), o qual igual ao limite
inferior da classe i, pertencem classe i. NOTAO: |------.

LI i + LSi
.
2

Ponto Mdio ( PMi ) da i-sima classe denotado por: PM i =

Tabulao: Contagem dos dados pertencentes a cada classe ou a quantidade de vezes


que o valor se repete.
Frequncia simples ou absoluta ( Fi ) da i-sima classe ou do i-simo valor.
o Fi = Nmero de observaes da i-sima classe (ou do i-simo valor).

o Observe que:

F = n.
i

i =1

Frequncia Relativa ( fi ) da i-sima classe (ou do i-simo valor).


o fi = Nmero de observaes da i-sima classe (ou do i-simo valor) dividido pelo
tamanho da amostra, isto , f i =

Fi
.
n
k

o Observe que a soma de todos os valores de fi deve ser igual a 1, ou seja,

= 1.

i =1

Multiplicando cada fi por 100 obtm-se o percentual da classe (ou valor)


correspondente, isto , f i % = f i 100 .

Existem outros tipos de frequncias que tambm podem ser calculadas:


o Frequncia Simples Acumulada (do tipo abaixo de): Frequncia simples
acumulada da i-sima classe ou valor:

Faci = F1 + F2 +

+ Fi

o Frequncia Relativa Acumulada: Frequncia relativa acumulada da i-sima


classe ou valor:
faci = f1 + f 2 + + f i .

397

Exemplo 1.3: Elabore uma tabela de distribuio de frequncias (dados agrupados em


intervalos) da varivel ALTURA, dos 46 estudantes de EV, usando-se os dados do Quadro 1.
Soluo:
Passo 1: Estabelecer o nmero de classes:
k 46 7
Passo 2: Amplitude Total:
AT = 183 153 = 30
h = AT / k = 30 / 7 4,3
Passo 3: Amplitude das Classes:
Passo 4: Construo da Tabela de Distribuio de Frequncias
Tabela 3 Distribuio de frequncias das alturas dos 46 estudantes de EV. Joo
Pessoa, 1997.
Altura (Xi)
NO Estudantes ( Fi )
Percentual ( fi %)
153,0 |----- 157,3
4
8,7
157,3 |----- 161,6
8
17,4
161,6 |----- 165,9
7
15,2
165,9 |----- 170,2
10
21,7
170,2 |----- 174,5
3
6,5
174,5 |----- 178,8
6
13,0
178,8 |-----| 183,1
8
17,4
Total
46
100,0
FONTE: Quadro 1.

Exemplo 1.4: Elabore uma tabela de distribuio de frequncias (dados agrupados em


intervalos) da varivel IDADE de 33 estudantes de CPE, conforme Dados Brutos abaixo:
DADOS BRUTOS
22
27
30
36

25
24
25
30

23 22 23 26 25 33 23 35
24 22 24 22 24 21 22 28
28 29 24 25 20 27 34 26
22

ROL (DADOS ORDENADOS)


20
23
25
34

Soluo:
Passo 1: Estabelecer o nmero de classes:
Passo 2: Amplitude Total:

21
24
26
35

22 22 22 22 22 22 23 23
24 24 24 24 24 25 25 25
26 27 27 28 28 29 30 30
36

k 33 6
AT = 36 20 = 16
AT 16
h=
=
2,7
k
6

Passo 3: Amplitude das Classes:

Passo 4: Construo da Tabela de Distribuio de Frequncias


Tabela 4 Distribuio de frequncias das idades de 33 estudantes de EV. Joo Pessoa,
1997.
Idade (Xi)
Fi
20,0 |----- 22,7
8
22,7 |----- 25,4
13
25,4 |----- 28,1
6
28,1 |----- 30,8
3
30,8 |----- 33,5
0
33,5 |-----| 36,2
3
Total
33
FONTE: Quadro 1.

398

:: ARREGAANDO AS MANGAS!! ::
DICA 1: Para construir a coluna indicadora (das classes) proceda da seguinte
forma: o primeiro valor do intervalo 1 o menor valor do rol, ou seja, 22. Esse o
LI (limite inferior) do primeiro intervalo. Para descobrir o seu LS (limite superior)
some a 22 o valor de h. Isto , 20 + 2,7 = 22,7. Assim, o primeiro intervalo ser:
22 |-- 22,7. Para o segundo intervalo repita o valor de 22,7 como sendo o LI do
intervalo 2. Para descobrir o seu LS some ao valor de h. Isto , 22,7 + 2,7 = 25,4.
Assim, o segundo intervalo ser: 22,7 |-- 25,4. Para o terceiro intervalo repita o
valor de 25,4 como sendo o LI do intervalo 3. Para descobrir o seu LS some ao
valor de h. Isto , 25,4 + 2,7 = 28,1. Assim, o terceiro intervalo ser: 25,4 |-- 28,1.
Faa isso sucessivamente at que se encontre o nmero de classes.
DICA 2: Para construir a coluna da Fi perceba que no primeiro intervalo: 20,0 |--22,7, o valor 20,0 incluso no intervalo (contabilizado no clculo das frequncias),
no entanto, o valor de 22,7 no ! Assim sendo, o valor de 22,7 s incluso no
intervalo seguinte. Volte ao rol e veja que existem 8 valores nesse intervalo (20 21
22 22 22 22 22 22). No segundo intervalo, 22,7 |--- 25,4, o valor 22,7
incluso no intervalo (contabilizado no clculo das frequncias), no entanto, o valor
de 25,4 no ! Assim sendo, o valor de 25,4 s incluso no intervalo seguinte.
Volte ao rol e veja que existem 13 valores nesse intervalo (23 23 23 24 24 24
24 24 24 25 25 25 25). Siga o mesmo raciocnio para os demais intervalos!

A Tabela 5, a seguir, um exemplo de como calcular os outros tipos de frequncias a partir


da Tabela 3.
Exemplo 1.5: Elabore uma tabela de distribuio de frequncias completa (dados agrupados
em intervalos) da varivel ALTURA de 46 estudantes de EV do Quadro 1.
Soluo:
Tabela 5 Distribuio de frequncias das alturas dos 46 Estudantes de EV.
Pessoa,1997.
Frequncia Frequncia Frequncia Freq. Abs. Freq. Relat.
Altura (Xi)
Absoluta
Relativa Percentual
Acum.
Acum.
( Fi )
( fi )
( fi % )
( Faci )
( faci )
153,0 |----- 157,3
4
0,087
8,7
4
0,087
157,3 |----- 161,6
8
0,174
17,4
12
0,261
161,6 |----- 165,9
7
0,152
15,2
19
0,413
165,9 |----- 170,2
10
0,217
21,7
29
0,630
170,2 |----- 174,5
3
0,065
6,5
32
0,695
174,5 |----- 178,8
6
0,130
13,0
38
0,825
178,8 |-----| 183,1
8
0,174
17,4
46
1,000
Total
46
1,000
100,0
----FONTE: Quadro 1.

399

Joo
Ponto
Mdio
( pmi )
155,15
159,45
163,75
168,05
172,35
176,65
180,95
---

:: SAIBA MAIS... ::
Frequncia Absoluta: Corresponde a contagem dos valores do rol agrupados em
cada intervalo. No se preocupe, veja a dica 2 acima!
Frequncia Relativa: Calcule essa frequncia pedindo ajuda a frequncia
absoluta da seguinte forma: divida cada valor da frequncia absoluta pelo total.
Assim, no intervalo 1 teremos, 4/46 = 0,087. No que se refere ao intervalo 2, faa
8/46 = 0,174. E assim por diante para cada intervalo! Lembre-se que a soma das
frequncias relativas igual a 1.
Frequncia Absoluta Acumulada Abaixo de: Repita o primeiro valor da
frequncia absoluta. Em seguida, some cada valor a seguir nessa mesma coluna.
Isto , 4 + 8 = 12, 12 + 7 = 19, 19 + 10 = 29, e assim por diante!

3.3.2. Representao Grfica de Distribuies de Frequncia


O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo objetivo
produzir, no investigador ou no pblico em geral, uma impresso rpida e viva do fenmeno em
estudo.
Para tornarmos possvel uma representao grfica, estabelecemos uma correspondncia
entre os termos da srie estatstica (tabela) e determinada figura geomtrica, de tal modo que
cada elemento da srie seja representado por uma figura proporcional.
Requisitos:
A representao grfica de um fenmeno deve obedecer aos seguintes requisitos primordiais:
Simplicidade Indispensvel devido necessidade de levar a uma rpida
apreenso do sentido geral do fenmeno apresentado a fim de no nos perdermos
na observao de mincias de importncia secundria;
Clareza O grfico deve possibilitar uma correta interpretao dos valores
representativos do fenmeno em estudo;
Veracidade Indispensvel qualquer comentrio, posto que, se no representa
uma realidade, perde o grfico sua finalidade.
Os principais tipos de grficos estatsticos para as distribuies de frequncias so os
diagramas, que so grficos geomtricos de, no mximo duas dimenses. Para sua construo,
em geral, fazemos uso s do sistema cartesiano. Dentre os principais tipos de diagramas,
destacamos:

400

Diagrama de Setores (Grfico de Pizza)


Funcionam dividindo seus dados em
categorias ou grupos distintos. O grfico
consiste de um crculo dividido em fatias de
pizza, cada qual representando um grupo. O
tamanho de cada fatia proporcional a
quantidade de algo em cada grupo em
comparao com os outros.
Quanto maior a fatia, maior a popularidade
relativa daquele grupo. A quantidade de algo
em cada grupo chamada de frequncia.
Dividem seu conjunto inteiro de dados em
grupos distintos. Isto , se voc somar a
frequncia de cada fatia, obter 100%.

Fonte: Quadro 1.

:: SAIBA MAIS... ::
Os grficos de setores podem ser teis se voc deseja comparar propores bsicas.
Geralmente fcil dizer primeira vista quais grupos tm uma frequncia alta em
comparao aos outros. No entanto, essa forma grfica pouco til se todas as
fatias tiverem tamanhos semelhantes, pois se torna difcil visualizar diferenas sutis
entre os tamanhos das fatias.

Diagrama de Coluna/Barras
Permitem comparar tamanhos relativos, mas
a vantagem de usar essa forma grfica que
ela permite um maior grau de preciso.
So ideais em situaes em que as
categorias tm praticamente o mesmo
tamanho, pois possvel identificar com
muito mais preciso qual a categoria tem a
frequncia mais alta. Torna-se mais fcil
enxergar as pequenas diferenas.
Cada
coluna/barra
representa
uma
determinada categoria, e o seu comprimento Fonte: Quadro 1.
indica o valor. Todas as colunas/barras tm
a mesma largura, o que facilita sua
comparao, e quanto mais longa maior o
valor.
401

:: SAIBA MAIS... ::
O grfico de colunas apresenta as categorias no eixo horizontal e a frequncia ou
porcentagem no eixo vertical. No grfico de barras os eixos so invertidos. As
categorias so mostradas no eixo vertical e a frequncia no eixo horizontal. Portanto,
as colunas so dispostas no sentido vertical e as barras no sentido horizontal. O
grfico de colunas tende a ser mais comum, mas grficos de barras so teis se os
nomes de suas categorias forem muito longos, pois do mais espao para mostrar o
nome de cada categoria.

Diagrama de Linhas Simples/Em Faixa


O diagrama de linhas simples til na representao de tabelas ou sries que evoluem ao
longo do tempo (sries temporais), possibilitando a identificao de tendncias. O diagrama de
linhas em faixa usado para comparar a evoluo de duas variveis e, ao mesmo tempo, a
evoluo de cada uma delas isoladamente.
Diagrama de Linhas em Faixa

Diagrama de Linhas Simples

Fonte: Apostila de Estatstica.

Fonte: Apostila de Estatstica.

Perceba que todas essas formas grficas esto associadas as variveis


qualitativas, ou seja, aquelas que expressam categorias. No caso das
variveis quantitativas discretas tambm podemos fazer uso de formas
grficas como diagrama de colunas/barras. No entanto, para representar as
variveis contnuas necessitamos de formas grficas especificas como o
histograma ou o polgono de frequncias.

402

Histograma
Histogramas so como grficos de colunas,
mas com duas importantes diferenas. A
primeira que a rea de cada coluna
proporcional frequncia, e a segunda que
no h espao vazio entre as colunas no
grfico.
a representao grfica de uma
distribuio de frequncias de varivel
quantitativa contnua (dados agrupados em
intervalos)
por
meio
de
retngulos
justapostos, centrados nos pontos mdios
das classes e cujas reas so proporcionais
s frequncias das classes.

Fonte: Quadro 1.

Polgono de Frequncia
outra forma de representar graficamente
uma distribuio de frequncias de varivel
quantitativa contnua (dados agrupados em
intervalos)
Corresponde a uma linha poligonal traada a
partir do ponto mdio de cada retngulo do
histograma, cuja rea total igual a do
histograma. Pode referir-se s frequncias
Fonte: Quadro 1.
absolutas ou s frequncias relativas, conforme
a escala utilizada no eixo vertical.
3.4. Medidas Estatsticas
Vimos anteriormente a sintetizao dos dados
sob a forma de tabelas, grficos e distribuies
de frequncias. Aqui, vamos aprender o clculo
de medidas que possibilitem representar um
conjunto de dados (valores de uma varivel
quantitativa, isto , informaes numricas),
relativos observao de determinado
fenmeno de forma reduzida.

403

Todos dizem que sou um aluno


mdio, mas quero mostrar que
estou acima da mdia.

Os dados quantitativos, apresentados em tabelas e grficos, constituem a informao bsica do


problema. conveniente apresentar medidas que mostrem a informao de maneira resumida.
Um conjunto de dados pode se reduzir a uma ou a algumas medidas numricas que resumem
todo o conjunto. Duas caractersticas importantes dos dados, que as medidas numricas podem
evidenciar so: o valor central do conjunto e a disperso dos nmeros.
Estes ndices estatsticos so as MEDIDAS DE POSIO e, dentre as mais importantes,
citamos as Medidas de Tendncia Central, que recebem tal denominao pelo fato dos dados
observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas
de tendncia central, destacamos:
Mdia aritmtica ou Mdia;
Moda;
Mediana.
As outras medidas de posio so as Separatrizes, que englobam:
Mediana;
Quartis;
Decis.
Percentis.
S VEZES PRECISO CHEGAR RAIZ DO PROBLEMA!
Pode ser difcil identificar padres e tendncias em uma grande quantidade de nmeros, e achar a
mdia geralmente o primeiro passo para conseguir enxergar o cenrio mais geral. Com a mdia
sua disposio, possvel rapidamente achar os valores mais representativos dos seus dados e
tirar importantes concluses. Neste captulo, vamos examinar vrias formas de calcular alguns
dos dados estatsticos mais importantes do pedao (mdia, mediana e moda) e comear a
entender como resumir dados com eficcia da forma mais concisa e til possvel.
3.4.1. Medidas de Tendncia Central
So medidas que tendem para o centro da distribuio e tem a capacidade de representla como um todo. Do o valor do ponto em torno do qual os dados se distribuem. As principais
so: Mdia Aritmtica, Mediana, Moda.
Mdia Aritmtica (ou simplesmente MDIA)
a mais importante medida de tendncia central, pois possui propriedades matemticas
convenientes.
Notao: = Mdia da populao ou mdia populacional.

X = Mdia da amostra ou mdia amostral.

404

bem provvel que j tenham lhe pedido para calcular a mdia antes. Uma forma
de achar uma mdia de um conjunto de nmeros somar todos os nmeros e, em
seguida, dividir o resultado pela quantidade de nmeros existentes.
Se voc quer aprender Estatstica ser necessrio se familiarizar com algumas
notaes estatsticas comuns. primeira vista pode parecer um pouco estranho,
mas voc vai se acostumar.

LETRAS E NMEROS
Quase todos os clculos estatsticos envolvem somar um conjunto de nmeros. Como exemplo,
se quisermos achar a idade mdia da turma, primeiro devemos somar as idades de todas as
pessoas que frequentam essa turma.
O interessante que se possa generalizar essa idia para qualquer conjunto de nmeros. Os
estatsticos resolvem essa questo usando letras para representar nmeros. Como exemplo,
podemos usar a letra X para representar as idades dos alunos da turma da seguinte forma:
Idades especficas dos
alunos da turma:
19 20 20 20 21

Idades gerais dos alunos


da turma:
X1 X2 X3 X4 X5

Cada X representa a idade de uma pessoa da turma. como identificar cada pessoa com um
nmero especfico.
Agora que temos uma forma geral de escrever as idades, podemos usar os nossos X para
represent-las nos clculos. Podemos escrever a soma das 5 idades da turma como:
Soma = X1 + X2 + X3 + X4 + X5
Mas e se no soubermos quantos nmeros temos de somar? E se no soubermos quantas
pessoas h na turma? Nesses casos no tem problema, basta chamar de n o nmero de valores.
Assim, se no soubssemos quantas pessoas havia na turma, diramos que havia n pessoas e
escreveramos a soma de todas as idades como:
Soma = X1 + X2 + X3 + X4 + X5 + ... + Xn = X ou ainda Xi
Observao: O smbolo representa o somatrio (Leia-se X como somatrio de X).
Podemos usar notao matemtica para representar a mdia. Se juntarmos todas essa
informaes podemos escrever a mdia como:

X=

X
n

405

Exemplo 1.6: Determinar a mdia do seguinte conjunto (amostra) de valores: 3, 7, 8, 10, 11.
Soluo: Perceba que, nesse caso, os dados esto em forma de rol.

X=

X
n

3 + 7 + 8 + 10 + 11
= 7,8
5

APLICAO: Suponha que o exemplo acima represente o nmero de golfinhos vistos


durante uma visita de 5 dias na localidade de Barra de Tabatinga (Litoral Sul de Natal/RN).
Ao analisar a mdia pode-se observar que existe um nmero mdio de 7,8 golfinhos na
amostra.
TRABALHANDO COM FREQUNCIAS
Ao calcular a mdia de um conjunto de nmeros, voc ir, muitas vezes, perceber que alguns dos
nmeros so repetidos. Se voc observar as idades da turma ver que na verdade temos 3
pessoas com 20 anos. muito importante no deixar de incluir a frequncia de cada nmero
quando estiver calculando a mdia. Para termos certeza de no nos esquecermos disso, podemos
inclu-la na frmula. Usamos a letra f para representar a frequncia.

X =

( X .F )
i

Lembre-se que ao tratar com freqncias devemos nos lembrar que o conjunto de nmeros
pode estar agrupado em distribuies de frequncias por valor e em classes. Assim podemos
determinar a mdia seguindo o mesmo raciocnio. Acompanhe:
Exemplo 1.7 (Distribuio de Frequncias por Valor): Determinar a mdia do seguinte conjunto
(amostra) de valores: 2, 3, 8, 8, 5, 2, 2, 2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8, 2
Soluo:

Distribuio de Frequncias por Valor


Dados Agrupados sem Intervalos
X.F
X
F
2
3
5
8

8
2
4
6
20

16
6
20
48
90

X =

( X .F ) = 90 X = 4,5
i

20

APLICAO: Suponha que o exemplo acima represente o nmero de filhotes nascidos


vivos (X) observados em uma amostra de 20 ninhos de tartarugas marinhas (F). Ao
analisar a mdia pode-se observar que existe um nmero mdio de 4,5 filhotes nascidos
vivos nessa amostra.
Lembre-se que no caso da distribuio de frequncias por classes a coluna indicadora (X)
corresponde aos intervalos. Para calcular a mdia necessrio fazer uso do ponto mdio. Ento:

406

X =

( PM .F )
i

PMi: corresponde ao ponto mdio de cada classe;


onde:

Fi: corresponde a freqncia absoluta de cada classe;


n: corresponde ao tamanho da amostra.

Exemplo 1.8 (Distribuio de Frequncias em Classes): Utilizando os dados apresentados na


Tabela 5, determine a altura mdia dos 46 estudantes de EV Perodo 97.1 Turma 01.
Soluo:
Altura (X)

Freqncia.
Absoluta ( Fi )

Ponto Mdio
PMi

PMi.Fi

153,0 |----- 157,3


157,3 |----- 161,6
161,6 |----- 165,9
165,9 |----- 170,2
170,2 |----- 174,5
174,5 |----- 178,8
178,8 |-----| 183,1

4
8
7
10
3
6
8

155,15
159,45
163,75
168,05
172,35
176,65
180,95

620,60
1275,60
1146,25
1680,50
517,05
1059,90
1447,60

Total ou

46

---

7747,50

Ento:

X=

( PM .F ) = 7747,50 = 168,42 cm
i

46

Anlise: Na amostra observada de 46 alunos da disciplina de Estatstica Vital verifica-se


uma altura mdia de 168,42 cm.
Vantagens e Desvantagens da Mdia:
uma medida de tendncia central que, por uniformizar os valores de um conjunto de dados, no
representa bem os conjuntos que revelam tendncias extremas. Ou seja, grandemente
influenciada pelos valores extremos (grandes) do conjunto. Alm disso, no pode ser
calculada para distribuies de freqncias com limites indeterminados (indefinidos).
Propriedades:

(X
n

1. A soma dos desvios tomados em relao mdia nula, isto ,

i =1

X = 0.

2. Somando-se ou subtraindo-se uma constante c a todos os valores de uma varivel, a


mdia do conjunto fica aumentada ou diminuda dessa constante, isto ,
Yi = X i c Y = X c .
3. Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante c, a
mdia do conjunto fica multiplicada ou dividida por essa constante, isto ,

Yi = X i c Y = X c ou Yi =

Xi
X
Y = , para c 0 .
c
c

407

:: SAIBA MAIS... ::
Se a mdia for enganosa devido a dados distorcidos e valores discrepantes ento
precisamos de alguma outra maneira de dizer qual o valor tpico. Isso pode ser feito
tomando o valor do meio, ou central. Esse um tipo diferente de mdia, ou medida
de posio chamada de mediana.

Mediana
Considere um conjunto de dados ordenados constitudo de n valores. A mediana o valor que
divide o conjunto em duas partes iguais (isto , em duas partes de 50% cada).
Notao: Med
Para achar a mediana da turma, alinhe todas as idades em ordem crescente (rol) e, em seguida,
escolha o valor central, da seguinte forma:
19

19

20

20

20

21

21

50

52

Este o nmero central. a mediana, 20.


E se o nmero de pessoas da turma fosse par?
19

20

20

20

21

21

50

52

Se houver nmero par de pessoas na turma, no haver nenhum nmero exatamente no meio!
Nesse caso basta tirar a mdia dos dois nmeros do meio (some-os e divida por 2), essa
a sua mediana. Neste caso, a mediana 20,5.
Se voc tiver 9 nmeros, a mediana o nmero que est na posio 5.
Se voc tiver 8 nmeros, ela a mdia dos nmeros que esto nas posies centrais: 4 e 5.
E se voc tiver n nmeros? Nesse caso, observe o quadro abaixo:
COMO ACHAR A MEDIANA EM TRS PASSOS:
Alinhe seus nmeros em ordem crescente.
Se voc tiver um nmero mpar de valores, a mediana
o valor que est no meio. Se tiver n nmeros, o
nmero do meio est na posio (n + 1)/2.
Se voc tiver um nmero par de valores, ache a
mediana somando os dois valores do meio e dividindo
por 2. Esses dois valores so os elementos que esto na
posio: (n/2) e [(n/2) + 1].

408

Exemplo 1.9: Determinar a mediana da amostra a seguir: 3, 7, 8, 10, 11.


Soluo:

Med =

n +1 5 +1 6
=
= = 30 elemento Me = 8
2
2
2

Exemplo 1.10: Determinar a mediana da amostra a seguir: 3, 7, 8, 10.


Soluo:

(n / 2) + [(n / 2) + 1] (4 / 2) + [(4 / 2) + 1] 20 + 30 7 + 8
Med =
=
=
=
= 7,5
2
2
2
2
TRABALHANDO COM DISTRIBUIO DE FREQUNCIAS EM CLASSES
No caso de dados agrupados, relembramos que uma distribuio de frequncias pode ser
representada por meio de um Histograma. Dizemos ento que a mediana ser o valor de X
(abscissa) cuja ordenada divide a rea total do Histograma em duas partes iguais.
Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe
mediana a classe que contm o elemento que est na posio (n/2) e, consequentemente, ser
esta a classe que conter a mediana.
Figura 1: Clculo da mediana para dados distribudos em classes.

Clculo da mediana:

Med = LI med

n
Facant
+ 2
Fmed

hmed

onde:
* LImed o limite inferior da classe mediana;
* Fmed a frequncia absoluta da classe
mediana;
* Facant a frequncia absoluta acumulada da
classe anterior classe mediana;
* hmed a amplitude da classe mediana;
* n o nmero de observaes.
Assim, para dados agrupados em intervalos, a mediana obtida atravs de interpolao de
acordo com a frmula dada na Figura 1.

409

Exemplo 1.11 (Distribuio de Frequncias em Classes): Determinar a altura mediana dos 46


estudantes da turma de EV, - Perodo: 97.1, conforme os dados agrupados na Tabela 5.
Soluo:
Classe mediana a classe que contm o elemento que est na posio (n/2), ou seja,
nesse caso, a classe mediana a classe que contm o elemento que est na (46/2) = 23
posio.
Logo, a classe mediana ser a 4 classe: 165,9 |----- 170,2 (Classe mediana: primeira
classe que ultrapassar 50% (n/2) ou mais das observaes).
Dica: Para encontrar a classe mediana observe a coluna da Facant perceba que no
primeiro intervalo tem 4 nmeros (assim teremos: o primeiro, o segundo, o terceiro e o
quarto). No segundo intervalo teremos 4+8 = 12 nmeros (assim teremos: do quinto at o
dcimo segundo). No terceiro intervalo teremos 12+7 = 19 nmeros (assim teremos: do
dcimo terceiro at o dcimo nono). No quarto intervalo teremos 19+10 = 29 nmeros
(assim teremos: do vigsimo at o vigsimo nono). Pronto! Nessa classe temos o 230
elemento essa a classe que contm a mediana! Portanto,
LImed = 165,9
Fmed = 10
hmed = 4,3
Facant = 19
Ento:

Med = LI med

n
Fant
+ 2
Fmed

46

19

2
4,3 = 165,9 + 1,72 = 167,62 cm .
hmed = 165,9 +

10

Propriedades da Mediana
1. A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto
de dados;
2. A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser
calculada.
Moda
Dado um conjunto ordenado de valores a moda o valor mais popular. A moda (so)
o(s) valor(es) que ocorre(m) com maior frequncia no conjunto de dados, ou seja (so) o(s)
valor(es) mais frequente(s). Ao contrrio da mdia e da mediana, a moda tem de ser um valor
existente no conjunto de dados.
As vezes os dados podem ter mais de uma moda. Se houver mais de um valor com a
frequncia mais alta, ento cada um desses valores uma moda. Acompanhe os tipos de sries
modais a seguir:

410

Tipos de Sries Modais:

Notao: Mo

Um conjunto de valores pode ser classificado quanto a moda como:


* Unimodal (uma nica moda)
* Trimodal (trs modas)
* Bimodal (duas modas)
* Polimodal (quatro modas)

* Amodal (no h moda)

Exemplo 1.12: Determine a moda dos seguintes conjuntos de dados abaixo:

a) 2, 2, 3, 3, 5, 5, 8, 8
No existe moda (ou Amodal)
b) 2, 2, 3, 5, 5, 5, 8, 8
Mo = 5 (Unimodal)
c) 2, 2, 2, 3, 3, 5, 5, 5, 8 Mo = 2 e Mo = 5 (Bimodal)
TRABALHANDO COM DISTRIBUIO DE FREQUNCIAS
(a) Clculo da Moda em uma Distribuio de Frequncias por Valor
Basta olhar o elemento que ocorre com maior frequncia, ou seja, aquele que mais se
repete.
Exemplo 1.13: Suponha o Exemplo 1.7. Nesse caso, a maior frequncia absoluta (Fi) igual a 8
e o seu elemento correspondente (X) 2. Portanto, Mo = 2. Ao analisar a moda pode-se observar
que a maioria dos ninhos apresentaram 2 filhotes nascidos vivos.
(b) Clculo da Moda em uma Distribuio de Frequncias por Classes
Em uma distribuio de frequncias em classes, denominamos classe modal a classe que possui
a maior frequncia, e, consequentemente, ser esta classe que conter a moda.
Exemplo 1.14: Utilizando os dados apresentados na Tabela 5, determine a altura modal (Moda)
para dados agrupados em intervalos, a partir da frmula de Czuber apresentada na Figura 2.
Soluo:
A classe modal ser o intervalo com maior frequncia absoluta (f). Neste caso a classe
modal ser: 165,9 |----- 170,2 (4a classe). Assim, Lmo = 165,9.
hmo = 170,2 165,9 = 4,3.
1 = fmodal fanterior = 10 7 = 3, bem como, 2 = fmodal fposterior = 10 3 = 7
Da,

1
Mo = Lmo +
1 + 2

3
hmo = 165,9 +
4,3 = 167,19 cm.
3+7

Anlise: Na amostra observada de 46 alunos da disciplina de Estatstica Vital verifica-se


que a maioria deles medem 167,19 cm.

411

Figura 2: Clculo da moda para dados distribudos em classes.


FRMULA de CZUBER (Interpretao geomtrica
atravs de Histograma):

1
hmo
Mo = Lmo +

2
1
onde:
* Lmo: Limite inferior da classe modal
* Lmo: Amplitude da classe modal

* 1 = fmodal fanterior
* 2 = fmodal fposterior

Observaes:
(i) A moda de um conjunto de dados pode no existir (Figura 3 (a)).
(ii) A moda de um conjunto de dados pode no ser nica (Figura 3 (c)).
Figura 3: Caracterizao de dados quanto moda.

Vantagens e Desvantagens da Moda


No depende de todos os valores do conjunto de dados, podendo mesmo no se alterar
com a modificao de alguns deles;
No influenciada por valores extremos (grandes) do conjunto de dados
Pode ser calculada para distribuies com limites indeterminados (indefinidos) na maioria
dos casos.

412

3.4.2. Medidas de Disperso


No se preocupe com o jantar.
Quando tiver um forno com
desvio padro mais baixo, voc
nunca mais vai queimar nada.

Nem tudo confivel, mas como saber?


As medidas de posio fazem um excelente trabalho fornecendo-lhe um valor
tpico para seu conjunto de dados, mas elas no lhe contam a histria
completa. Tudo bem, voc sabe onde est o centro dos seus dados, mas, muitas
vezes, a mdia, a mediana e a moda sozinhas no so informaes suficientes
em situaes em que voc esteja resumindo um conjunto de dados. Nesta
unidade, vamos mostrar como dar um passo a mais no seu nvel de
conhecimento de dados medida que comeamos a analisar amplitudes e
variao.
O quadro a seguir apresenta as notas de 5 avaliaes aplicadas em uma turma com 4 alunos. O
professor deseja premiar o melhor aluno com uma bolsa de estudo. A questo qual deles
escolher? Cada aluno tem a mesma mdia de pontos, X Antnio = X Joo = X Jos = X Pedro = 5 , mas h
diferenas ntidas entre cada conjunto de dados. Precisamos encontrar uma forma de medir essas
diferenas.
Alunos
Notas
Mdia
Antnio

Joo

Jos

10

Pedro

10

10

Observando-os detalhadamente, notamos que em cada grupo, os valores se distribuem


diferentemente em relao mdia. Necessitamos assim de uma medida estatstica
complementar para melhor caracterizar cada conjunto apresentado.
Podemos diferenciar cada conjunto de dados observando a forma em que os pontos se dispersam
em relao a uma medida de posio. As pontuaes de cada aluno so distribudas de forma
diferente, e, se medirmos como os pontos esto dispersos, o professor poder tomar uma deciso
mais embasada.
As medidas estatsticas responsveis pela variao ou disperso dos valores de um conjunto de
dados so as medidas de disperso ou de variabilidade, onde se destacam a amplitude total, a
varincia, o desvio padro e o coeficiente de variao. Em princpio, diremos que entre dois ou
mais conjuntos de dados, o mais disperso (ou menos homogneo) aquele que tem a maior
medida de disperso.
413

Amplitude Total
A amplitude nos diz quantos nmeros os dados abrangem, como se estivssemos medindo sua
largura. Para calcul-la tomamos o maior nmero do conjunto de dados (chamado de limite
superior LS) e, em seguida, subtramos do menor (chamado de limite inferior LI):
AT = LS LI
Notao: AT
Exemplo 1.15: Com base no exemplo anterior, a amplitude de cada aluno ,
Soluo:
* ATAntnio = 5 5 = 0
* ATJoo = 6 4 = 2

* ATJos = 10 0 = 10
* ATPedro = 10 0 = 10

As notas de Jos e Pedro tm a


mesma amplitude, mas os valores
so distribudos de forma diferente.
Ser que a amplitude realmente
mede bem a disperso dos dados?

A amplitude:
S descreve a largura dos dados e no como eles so dispersos entre os limites.
Pode medir at que ponto os valores esto dispersos, mas difcil ter uma idia real de como
os dados so distribudos.
uma excelente forma rpida de ter uma idia de como os valores so distribudos, mas um
pouco limitada.
TRABALHANDO COM A VARIABILIDADE
No queremos s medir a disperso de cada conjunto de pontos. Queremos alguma forma de
usar isso para ver se um aluno merecedor da bolsa. Em outras palavras, queremos medir a
variabilidade das notas dos alunos.
Uma maneira de fazer isso observar a distncia entre cada valor e a mdia aritmtica. Se
conseguirmos determinar um tipo de mdia para a distncia entre os valores e a mdia aritmtica,
teremos uma forma de medir a variao e a disperso. Quanto menor o resultado, mais prximos
os valores esto da mdia.
f

Pontos do Aluno 1

Os valores esto dispersos a uma boa distncia da mdia. Se o


professor escolher este aluno, ele provavelmente no conseguir
prever se o aluno se sair bem na prova. O aluno pode obter
pontuao bastante alta se estiver em um bom dia. Mas, em um
dia ruim, ele poder no tirar uma nota to alta assim, e isso
significa comprometer a bolsa.

414

Pontos do Aluno 2
Os valores para este segundo conjunto de dados esto muito
prximos da mdia e variam menos. Se o professor escolher
esse aluno, ele ter uma boa ideia de como o aluno poder se
sair bem na prova.

Ento isso significa que basta calcular a mdia da distncia entre os valores e a mdia
aritmtica!
CALCULANDO DISTNCIAS MDIAS
Suponha que voc tenha trs nmeros: 1, 2 e 9. A mdia igual a 4. O que acontece se
acharmos a mdia da distncia entre esses valores e a mdia aritmtica?
distncia = 2
2

X =4

1
distncia = 3
Distncia mdia =

9
distncia = 5

(1 a X ) + (2 a X ) + (9 a X ) 3 + 2 + (5)
=
=0
3
3

A distncia mdia entre os valores e a mdia aritmtica sempre 0, visto que as distncias
positivas e negativas se cancelam umas s outras. Como resolver esse problema? Precisamos
achar uma maneira de fazer com que todas as distncias sejam positivas!

Que tal elevarmos as distncias ao quadrado? provvel que todos os nmeros


sejam positivos.

32 + 22 + (5) 2 9 + 4 + 25
(Distncia mdia) =
=
= 12,67 (at 2 casas decimais)
3
3
2

Dessa vez, observa-se um nmero significativo, pois as distncias no se cancelam! Ao


somarmos os quadrados das distncias obtemos um resultado no-negativo, sempre. Esse
mtodo de medir a disperso chamado de varincia.
Varincia
Notao: 2 a varincia da populao ou varincia populacional
S 2 a varincia da amostra ou varincia amostral.

415

A varincia de um conjunto de dados mede a variabilidade do conjunto em termos de desvios


quadrados em relao mdia aritmtica. uma quantidade sempre no negativa e expressa em
unidades quadradas do conjunto de dados, sendo de difcil interpretao.

S2 =

(X

X)

n 1

Observao: Por se tratar de uma amostra o denominador da varincia, S2, associado a um


fator de correo: (n 1).
TRABALHANDO COM FREQUNCIAS
(a) Distribuio de Frequncias por Valor: Sejam X1, X2, ..., Xk as medidas da varivel de
interesse, realizadas para uma amostra de tamanho n extrada da populao considerada.
Definimos a varincia da amostra (S2) como:

S2 =

(X

X ).Fi

n 1

onde:
Xi o i-simo valor da varivel de interesse;
Fi a freqncia absoluta do i-simo valor;

X a mdia da amostra;
n o tamanho da amostra.

Observao: A equao acima utilizada quando nosso interesse no se restringe descrio


dos dados, mas, partindo da amostra, visamos tirar inferncias vlidas para uma respectiva
populao.
(b) Distribuio de Frequncias por Classes Sejam pm1, pm2, ..., pmk os pontos mdios das
k

classes, ocorrendo com frequncias F1, F2, ..., Fk de modo que

= n . A varincia da amostra

i =1

(S2) definida por como:

S2 =

( pm

X ).Fi

n 1

onde:
pmi o ponto mdio da i-sima classe;
Fi a frequncia absoluta da i-sima classe;

X a mdia da amostra;
n o tamanho da amostra.

:: SAIBA MAIS... ::
Os estatsticos utilizam muito a varincia para medir a disperso dos dados. Ela
til, pois utiliza cada valor para chegar ao resultado, e pode ser vista como uma
mdia do quadrado das distncias entre os valores e a mdia aritmtica. No entanto,
o que realmente deseja-se um nmero que nos d a disperso em termos da
distncia entre os valores e a mdia aritmtica, e no a distncia elevada a
quadrado.

416

O problema com a varincia que pode ser H uma maneira de corrigir isso. Basta tirar
difcil pensar em disperso em termos de a raiz quadrada da varincia. A isso
distncias elevadas ao quadrado.
chamamos de desvio-padro.
Desvio-Padro
Notao: o desvio-padro da populao ou desvio-padro populacional.
S o desvio-padro da amostra ou desvio-padro amostral.
outra medida de disperso mais comumente empregada do que a varincia, por ser expressa
na mesma unidade do conjunto de dados. Mede a "disperso absoluta" de um conjunto de
valores e obtida a partir da varincia. uma forma de dizer a que distncia os valores tpicos
esto da mdia aritmtica.
Desvio Padro =
Assim,

Varincia (Raiz quadrada da Varincia).


S = S2

Quanto menor o desvio-padro, mais prximos os valores esto da mdia aritmtica.


O menor valor que o desvio-padro pode assumir 0.
Coeficiente de Variao
uma medida que expressa a variabilidade em termos relativos, comparando o desvio-padro
com a mdia:

CV =

S
100%
X

OBS: X 0 .

Observe tambm que o coeficiente de variao adimensional e por este motivo permite a
comparao das variabilidades de diferentes conjuntos de dados.
Exemplo 1.16: Utilizando os dados apresentados na Tabela 5, determine a varincia, o desviopadro e o coeficiente de variao das alturas dos 46 estudantes de EV.
( pmi X ) 2 .Fi

Frequncia

Ponto Mdio

Absoluta (Fi )

(pmi)

153,0 |----- 157,3

155,15

(155,15 168,42)2.4 = 704,3716

157,3 |----- 161,6

159,45

(159,45 168,42)2.8 = 643,6872

161,6 |----- 165,9

163,75

(163,75 168,42)2.7 = 152,6623

165,9 |----- 170,2

10

168,05

(168,05 168,42)2.10 = 1,369

170,2 |----- 174,5

172,35

(172,35 168,42)2.3 = 46,3347

174,5 |----- 178,8

176,65

(176,65 168,42)2.6 = 406,3974

178,8 |----- 183,1

180,95

(180,95 168,42)2.8 = 1256,0072

Total ou

46

---

Altura (Xi)

417

3210,8294

Soluo:

S2 =

* Varincia:

( PM

X ) 2 . fi

n 1

* Desvio Padro: S =

3210,8294
= 71,35 cm2
46 1

S 2 = 71,35 = 8,45 cm

Anlise: Verifica-se uma variao de 8,45 cm nas alturas em torno da mdia observada.
* Coeficiente de Variao: CV =

S
8,45
.100 =
.100 = 5,02%
X
71,35

Anlise: Verifica-se uma variao relativa de 5,02% nas alturas em torno da mdia
observada.
importante expressar a variabilidade em termos relativos porque, por exemplo, um desviopadro igual a 1 pode ser muito pequeno se a magnitude dos dados da ordem de 1.000, mas
pode ser considerado muito elevado se esta magnitude for da ordem de 10.
Exemplo 1.17: Uma fbrica classifica operrios de acordo com os graus obtidos em testes de
aptido. Os dados so apresentados na distribuio de frequncia abaixo:
Notas do Teste

Fi

Faci

pmi

pmi Fi

( PM i X )

0 |----- 2
2 |----- 4
4 |----- 6
6 |----- 8
8 |----| 10

6
10
23
11
8

6
16
39
50
58

1
3
5
7
9

6
30
115
77
72

-4,17
-2,17
-0,17
1,83
3,83

Total ou

58

300

(PM

X)

(PM

X ) Fi
2

17,3889
4,7089
0,0289
3,3489
14,6689

104,3334
47,089
0,6647
36,8379
117,3512

40,149

306,2762

a) Calcule o grau mdio obtido pelos operrios;


b) O operrio que tirar nota acima de ( X + 2S ) receber um prmio. Um operrio para
receber esta meno dever ter tirado quanto?
c) Com base nos dados da tabela, a partir de que nota teremos 50% dos operrios mais
aptos?
Soluo:
a) O grau mdio dado por: X =

( PM . f ) = 300 = 5,17
58

b) A varincia para os dados agrupados dada pela frmula:

S2 =

( PM

X )2 . fi

n 1

306,2762
= 5,37
57

Desvio Padro: S = S 2 = 5,37 = 2,32


Anlise: Verifica-se uma variao de 2,32 pontos nas notas em torno da mdia observada.
Desta forma ( X + 2 S ) = 9,81. Portanto, qualquer operrio com nota maior que 9,81
receber o prmio.
418

c) A nota acima da qual esto 50% dos operrios chamada nota mediana, a qual
calculada para dados agrupados em intervalos por:

Med = LI Med

58

16
Facant
2
.2 = 4 + 26 = 4 + 1,13 = 5,13 .
.h = 4 + 2
+

Med
FMed
23
23

Observao: A varincia pode ser calculada tambm como,


2

pm
F

i
i
k
k
2
i =1

2
( pmi X ) .Fi pmi Fi

n
.
S 2 = i=1
= i=1
n 1
n 1
Comentrios sobre as principais Medidas de Tendncia Central e Disperso:
1. O conjunto de todos os possveis elementos de uma determinada pesquisa constitui uma
populao estatstica. Sua mdia a mdia populacional, usualmente representada
pela letra grega . Na grande maioria das situaes prticas, a mdia populacional
desconhecida e deve ser estimada a partir de dados amostrais. Se a amostra for extrada
de forma adequada, a mdia amostral X uma boa estimativa de .
2. Comparando a mdia e a mediana, temos que a mediana pouco sensvel presena de
valores muito altos ou muito baixos na amostra, enquanto a mdia j muito sensvel a
esta situao. Para ilustrar o sentido desta afirmao, vamos considerar os dados abaixo:
5

14

47

61

122

620

47 + 61
= 54
2
5 + 14 + 47 + 61 + 122 + 620 869
=
= 144,8 .
A mdia dada por: X =
6
6

A mediana deste conjunto de dados : Med =

Observe que a maior observao (620) exerceu uma grande influncia sobre a mdia
(somente este dado maior do que a mdia), o que ento no sintetiza de forma
adequada as informaes contidas na massa de dados. Portanto, neste exemplo, a
mediana parece ser a melhor medida para indicar a localizao dos dados.
De modo geral, quando o histograma construdo para os dados da amostra do tipo
assimtrico, devemos preferir a mediana como medida de tendncia central.
3. A amplitude, apesar de ser muito fcil de calcular, tem a desvantagem de levar em
considerao apenas os dois valores extremos (mximo e mnimo) da massa de dados,
desprezando os demais.

419

4. A varincia populacional representada por 2. Usualmente, a varincia populacional


desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extrada
de forma adequada, a varincia amostral S2 uma boa estimativa de 2.
5. As medidas X , S2 e S tomadas na amostra, denominadas ESTATSTICAS, so
estimativas dos PARMETROS POPULACIONAIS , 2, (supostos desconhecidos).

4. Avaliando o que foi construdo


Nesta unidade aprendemos a explorar dados estatsticos, onde estudamos desde a
organizao dos dados em tabelas e grficos at o clculo de medidas estatsticas importantes
que sero utilizadas nas unidades subsequentes. Convidamos vocs a resolverem a lista de
exerccio anexa a este material, tentando descobrir no seu dia a dia a utilidade para o contedo
aqui abordado. Este foi o incio da convivncia com a Estatstica. Esperamos que tenha sido
prazeroso. Procure seus tutores, use e abuse deste material.

420

UNIDADE 2
PROBABILIDADE
1. Situando a Temtica
A teoria das probabilidades o fundamento para a inferncia estatstica. O objetivo desta
parte que o aluno compreenda os conceitos mais importantes da probabilidade. O conceito de
probabilidade faz parte do dia-a-dia dos trabalhadores das reas das cincias exatas, cincias da
sade, cincias biolgicas, ecologia, engenharia, etc., uma vez que seu conceito
frequentemente usado na comunicao diria. Por exemplo, podemos dizer que uma espcie tem
30% de chance de ser extinta. Um laboratrio est 90% seguro de que um medicamento
proporcione a cura de uma doena. Um bilogo afirma que nas mars altas o peso seco das
ostras capturadas 20% maior que as capturadas em mars baixas. Um aluno tem chance de
70% de ser aprovado em uma determinada disciplina. Um professor est 95% seguro de que um
novo mtodo de ensino proporcione uma melhor compreenso pelos alunos. Um engenheiro de
produo afirma que uma nova mquina reduz em 20% o tempo de produo de um bem. Tal
como mostram os exemplos, as pessoas expressam a probabilidade em porcentagem.
Trabalhando com a probabilidade matemtica mais conveniente express-la como frao (as
porcentagens resultam da multiplicao das fraes por 100).

2. Problematizando a Temtica
O conceito de probabilidade fundamental para o estudo de situaes onde os resultados
so variveis, mesmo quando mantidas inalteradas as condies de sua realizao. Por exemplo,
jogando-se um dado, temos seis resultados possveis de cada vez; a observao do sexo dos
candidatos inscritos num concurso pblico conduz a dois resultados possveis masculino ou
feminino. Em ambos os casos, embora no sejamos capazes de afirmar de antemo que
resultado particular ocorrer, temos condies de descrever o conjunto de todos os resultados
possveis do experimento. A sua repetio continuada mostra certa regularidade nos resultados, o
que nos permite estudar o experimento, apesar da incerteza nele presente.
A VIDA CHEIA DE INCERTEZAS!
s vezes, pode ser impossvel dizer o que vai
acontecer de um minuto para o outro. Mas
certos eventos so mais provveis de ocorrer
do que outros, e a que entra em cena a
teoria da probabilidade.
A probabilidade permite prever o futuro
avaliando a probabilidade de os resultados
ocorrerem. Saber o que pode acontecer ajuda
voc a tomar decises mais embasadas.

421

Qual a probabilidade da
minha pasta ter ficado no
escritrio?

PREPARE-SE PARA A ROLETA!


Provavelmente, voc j viu pessoas jogando roleta em filmes. A
crupi gira a roleta e, em seguida, joga uma bolinha no sentido
oposto. As apostas so feitas com base onde a pessoa acha que a
bolinha vai parar. A roleta tem 38 casas em que a bolinha pode cair.
As principais so numeradas de 1 a 36, e cada casa colorida de
vermelho ou de preto. Existem duas casas extras, de cor verde, com
nmeros 0 e 00.
Voc pode fazer vrios tipos de apostas. Por exemplo, pode apostar em um determinado nmero,
se aquele nmero par ou mpar, ou na cor da casa. Lembrando que se a bolinha cair em uma
casa verde, voc perde! A roleta vai nos ajudar a navegar pelo mundo das probabilidades.
DETERMINANDO PROBABILIDADES NO JOGO DA ROLETA
Vamos tentar calcular a probabilidade de a bolinha parar no nmero 7. Veja como chegar
soluo, passo a passo.
Perguntas
1. Observe o tabuleiro da roleta. Em quantas
casas a bolinha pode cair?

Respostas
H 38 casas

2. Quantas casas existem para o nmero 7?

Apenas 1

3. Para calcular a probabilidade de obter um


7, pegue a resposta que voc deu questo
2 e divida-a pela sua resposta questo 1.

1/38 = 0,026

Concluso
A probabilidade de a
bolinha parar no nmero
7 de 0,026. No
impossvel de acontecer,
mas no muito
provvel!

Para achar a probabilidade de ganhar, pegamos o nmero de formas de ganhar a aposta e a


dividimos pelo nmero de resultados possveis, da seguinte forma:
Probabilidade = (nmero de formas de ganhar)/(nmero de resultados possveis)
Perguntas

Respostas

P(9) = ?
H 1 casa para o nmero 9 e 38 casas no total (Idem nmero 7).

1/38 = 0,026

P(Preto) = ?
H 18 casas pretas e 38 casas no total.

18/38 = 0,474

P(Verde) = ?
H 2 casas verdes e 38 casas no total.

2/38 = 0,053

P(38) = ?
Esse evento impossvel, no h nenhuma casa com nmero 38.

Que tal agora conhecer os conceitos bsicos que cercam a teoria das probabilidades mais
formalmente?

422

3. Conhecendo a Temtica
3.1. Espaos Amostrais e Eventos
Antes de passarmos definio de probabilidade necessrio fixarmos os conceitos de
experimento aleatrio, espao amostral e evento.
Experimento Aleatrio (Notao: E)
o processo da coleta dos dados relativo a um fenmeno que acusa variabilidade em seus
resultados.
Caractersticas de um Experimento Aleatrio:
1) Todo experimento aleatrio poder ser repetido indefinidamente sob condies,
essencialmente inalteradas.
2) Embora no sejamos capazes de afirmar que resultado particular ocorrer, seremos
sempre capazes de descrever o conjunto de todos os possveis resultados do experimento.
Espao Amostral (Notao: S ou (mega))
o conjunto formado por todos os possveis resultados de um experimento aleatrio.
Eventos (Notao: A, B, C, ...)
qualquer subconjunto do espao amostral.
3.1.1. Operaes entre Eventos
Combinaes de Eventos
Sejam A e B eventos em um mesmo espao amostral. Temos as definidas as seguintes
operaes entre conjuntos:

Evento Unio ( A B ) (l-se: A unio B):


O evento unio de A e B equivale ocorrncia de A ou de B ou de ambos. Contm os
elementos do espao amostral que esto em A ou em B ou em ambos.

Evento Interseo ( A B) (l-se: A interseo B):


O evento interseo de A e B equivale ocorrncia de A e de B, simultaneamente. Contm
os elementos do espao amostral que esto em A e em B.
Evento Complementar A ou AC (l-se: A evento complementar de A):
O evento complementar de A equivale no ocorrncia do evento A. Contm os
elementos do espao amostral que no esto em A.
Eventos Disjuntos ou Mutuamente Exclusivos:
Dois eventos A e B dizem-se mutuamente exclusivos ou mutuamente excludentes quando
a ocorrncia de um deles impossibilita a ocorrncia do outro. Os dois eventos no tm
nenhum elemento em comum. Exprime-se isto escrevendo: ( A B) = .
423

INTERSEO

UNIO

EVENTOS DISJUNTOS

EVENTO COMPLEMENTAR

3.2. O Conceito de Probabilidade


Definio 2.1: Uma funo P: R dita uma probabilidade se satisfaz os seguintes
axiomas:
(i) P() = 1 ;
(ii) 0 P( A) 1 ;
(iii) Sejam A e B eventos em um mesmo espao amostral. Se A e B forem mutuamente
exclusivos, ento P( A B) = P( A) + P( B) .
Vamos enunciar algumas propriedades relacionadas a P(A) que decorrem das condies acima e
que no dependem da maneira pela qual calculamos P(A).
3.2.1. Propriedade de Probabilidade
Sejam A e B eventos em um mesmo espao amostral:
1. Se o evento impossvel, ento P() = 0 ;
2. Se AC o evento complementar de A, ento P( AC ) = 1 P( A) .
3. Se A e B so dois eventos quaisquer, ento P( A B) = P( A) + P( B) P( A B) ;
4. Se o evento A B, ento P( A) P( B) .
3.2.2. Probabilidade em Espaos Amostrais Finitos
Seja um espao amostral associado a um experimento aleatrio constitudo de N
resultados igualmente provveis (equiprovveis). Seja A um evento qualquer constitudo de r
resultados possveis (0 r N ) .
A probabilidade de ocorrncia do evento A, denotada P(A), dada por:
424

P ( A) =

nmero de casos favorveis a A n( A) # ( A)


=
=
nmero de casos possveis
n( S ) # ( S )

:: SAIBA MAIS... ::
Probabilidades apenas indicam a chance de algo ocorrer, no so garantias.
importante lembrar que uma probabilidade indica apenas uma tendncia a longo
prazo. Ao jogar a roleta milhares de vezes voc esperaria que a bolinha parasse em
uma casa preta em aproximadamente 47% das vezes, e em uma casa verde em 5%
das vezes. Embora voc espere que a bolinha pare em uma casa verde com relativa
pouca freqncia, isso no significa que este evento no possa acontecer.

VAMOS APOSTAR EM UM EVENTO AINDA MAIS PROVVEL!


Em vez de apostar que a bolinha vai parar em uma casa preta, vamos apostar que ela vai parar
em uma casa preta ou vermelha.

Preto

Vermelho

18

18

No h nada em
comum. Eventos
Exclusivos.

P(Preto ou Vermelho) = P(Preto) + P(Vermelho)


P(Preto ou Vermelho) = (18/38) + (18/38) = 0,947
Ou ento, pelo complementar:
P(Preto ou Vermelho) = P(VerdeC)
P(Preto ou Vermelho) = 1 P(Verde)
P(Preto ou Vermelho) = 1 0,053 = 0,947
Ao calcular a probabilidade de a bolinha parar em uma
casa preta ou vermelha, estvamos trabalhando com dois
eventos separados. Esses dois eventos so mutuamente
exclusivos, pois impossvel que a bolinha pare em uma
casa que seja preta e vermelha.

E os eventos pretos e pares? Desta vez no so mutuamente exclusivos. possvel que a bolinha
possa parar em uma casa que seja preta e par. Os dois eventos se interceptam, ou seja, no so
exclusivos.
Se dois eventos so mutuamente exclusivos,
apenas um dos dois pode ocorrer

Preto
8

Par
10

Se dois eventos se interceptam, possvel que


eles ocorram simultaneamente.

Estamos
compartilhan
do algo.

425

Para chegar a resposta correta


precisamos subtrair a
probabilidade de se obter preta
e par (ou seja, da interseo),
para que no seja contada duas
vezes. Assim,

P(Preto ou Par) = P(Preto) + P(Par) P(Preto e Par)


P(Preto Par) = P(Preto) + P(Par) P(Preto Par)
P(Preto ou Par) = (18/38) + (18/38) (10/38) = 26/38 = 0,684
Exemplo 2.1: Em uma seleo para uma vaga de bilogo de uma grande empresa verificou-se
que dos 100 candidatos 40 tinham experincia anterior e 30 possuam curso de especializao.
Vinte dos candidatos possuam tanto experincia profissional como tambm algum curso de
especializao. Escolhendo um candidato ao acaso, qual a probabilidade de que:
a) Ele tenha experincia ou algum curso de especializao?
b) Ele no tenha experincia anterior nem curso de especializao?
Soluo:
Vamos definir os seguintes eventos:
A = {O candidato possui experincia anterior}.
B = {O candidato possui especializao}.
Dados: P(A) = 40/100 = 0,40; P(B) = 30/100 = 0,30; P(A B) = 20/100 = 0,20.
(a) Ele tenha experincia ou algum curso de especializao?
P(A B) = P(A) + P(B) P(A B) = 0,40 + 0,30 0,20 = 0,50
(b) Ele no tenha experincia anterior nem curso de especializao?
P(AC BC) = P((A B)C) = 1 P(A B) = 1 [P(A) + P(B) P(A B)]
P(AC BC) = 1 [0,40 + 0,30 0,20] = 1 0,50 = 0,50.
AS CONDIES SE APLICAM
A crupi diz que a bolinha parou em uma casa preta. Qual a probabilidade de que seja a casa
tambm seja par? Este problema um pouquinho diferente. No queremos achar a probabilidade
de se obter uma casa que seja preta e par, entre todas as casas possveis. Queremos achar a
probabilidade de que a casa seja par, uma vez que j sabamos que ela preta.
S
Preto
8

Par
10

Em outras palavras, queremos descobrir quantas


casas so pares, entre todas as casas pretas. Das
18 casas pretas, 10 delas so pares. Portanto,

8
P(Par sabendo que preta) = 10/18 = 0,556

Perceba que nessa situao a probabilidade calculada a partir de dois eventos condicionados.
Expressa a probabilidade de um evento acontecer, uma vez ocorrido outro evento. Que tal agora
conhecer os conceitos bsicos que cercam a teoria da probabilidade condicional mais
formalmente?

426

3.2.3. Probabilidade Condicional e Independncia de Eventos


Dados dois eventos A e B contidos num espao amostral S (ou ), muitas das vezes,
estamos interessados na ocorrncia de A dado que o evento B tenha ocorrido.
Para dar consistncia idia de uma probabilidade condicional, suponhamos que uma
organizao de pesquisa junto a consumidores tenha estudado os servios prestados dentro da
garantia por 200 comerciantes de pneus em uma grande cidade, obtendo os resultados resumidos
na tabela seguinte:
Vendedores
de Pneus

Bom Servio

Servio Deficiente

Com marca

64

16

80

Sem marca

42

78

120

Total

106

94

200

Dentro da Garantia

Total

Selecionado aleatoriamente um desses vendedores de pneus, constatamos que as probabilidades


de se escolher um vendedor de determinada marca (M), um vendedor que presta bons servios
dentro da garantia (BS), ou um vendedor de marca determinada e que presta bons servios dentro
da garantia (M BS) so:
P( M ) = 80 / 200 = 0,40

P( BS ) = 106 / 200 = 0,53

P( M BS ) = 64 / 200 = 0,32 .

Todas essas probabilidades foram calculadas por meio da definio clssica de probabilidade.
Como a segunda dessas probabilidades P(BS) prxima a 0,50 (50%), vejamos o que acontece
se limitamos a escolha a vendedores de uma marca determinada.
Isto reduz o espao amostral as 80 escolhas, correspondentes 1a linha da tabela (com marca).
Temos ento, que a probabilidade de se escolher um vendedor que presta bons servios (BS),
sabendo (ou dado) que a marca de pneu vendido pelo mesmo determinada ser de
P( BS | M ) = 64 / 80 = 0,80 , tendo-se uma melhora em relao a P(BS) = 0,53. Note que a
probabilidade condicional que obtivemos aqui, P ( BS | M ) = 0,80 pode escrever-se como:

P( BS | M ) =

64
80

200

200

P( M BS )
P( M ) .

Generalizando, formulamos a seguinte definio de probabilidade condicional, que se aplica a dois


eventos quaisquer A e B pertencentes a um dado espao amostral S:
Probabilidade Condicional

Se P(B) diferente de zero, ento a probabilidade condicional de A relativa a B, isto , a


probabilidade de A dado que B ocorreu denotada por:
P( A | B) =

P( A B)
,
P( B)

desde que
427

P( B) > 0 .

Como estamos tentando achar a probabilidade de A


uma vez ocorrido B, estamos interessados
apenas no conjunto de eventos onde B ocorre.

P(B)
P(A B)
Teorema da Multiplicao
O resultado a seguir, obtido a partir da definio de probabilidade condicional, fornece a
probabilidade da ocorrncia conjunta de dois eventos A e B, isto , a probabilidade P(A B):

P( A B) = P( A) P(B | A)

ou

P( A B) = P(B) P( A | B)

Dependendo da ordem de ocorrncia dos eventos.


HORA DE FAZER OUTRA APOSTA!
Antes de abandonar o jogo, a crupi lhe faz uma oferta fantstica pela sua
aposta final, o triplo ou nada. Apostando que a bolinha vai parar em uma
casa preta duas vezes seguidas, voc poder reaver todas as suas fichas.
SE OS EVENTOS SE AFETAM, ELES SO DEPENDENTES
A probabilidade de se obter preto seguido de preto um problema um pouquinho diferente da
probabilidade de se obter uma casa par, uma vez que sabamos que ela preta. Observe:
A probabilidade de se obter uma casa par afetada pelo
evento de se obter uma casa preta. J sabemos que a
bolinha parou em uma casa preta.

P(Par | Preto) = 10/18 = 0,556

Se no soubssemos que a bolinha havia parado em uma


casa preta, a probabilidade seria diferente. Para calcular
P(Par), examinamos quantas casas so pares.

P(Par) = 18/38 = 0,474

P(Par | Preto) d um resultado diferente de P(Par). O fato de sabermos que


a casa preta muda a probabilidade.
Esses dois eventos so chamados de dependentes!
SE OS EVENTOS NO SE AFETAM, ELES SO INDEPENDENTES
Nem todos os eventos so dependentes. s vezes, os eventos no sofrem nenhuma influncia um
do outro, e a probabilidade de um evento permanece a mesma independentemente de outro
evento acontecer ou no. Observe,

428

P(Preto) = 18/38 = 0,474


P(Preto | Preto) = 18/38 = 0,474
Essas duas probabilidades tm o mesmo valor! O evento de se obter uma casa preta nesse jogo
no tem nenhuma influncia sobre a probabilidade de se obter uma casa preta no prximo jogo.
Esses eventos so chamados de independentes.
Eventos independentes no so afetados uns pelos outros. Eles de maneira alguma, influenciam
as probabilidades do outro. Se um evento ocorre, a probabilidade do outro permanece exatamente
a mesma.
Voc acha que me preocupo
com seus resultados? Eles
so irrelevantes para mim.
como se voc no existisse.

Voc tambm no faz


diferena para mim. No me
importo se voc esta a ou
no. Somos independentes!

Independncia de Eventos
Dizemos que dois eventos A e B so independentes, se as probabilidades condicionais
P(A | B) = P(A) e P(B | A) = P(B). Isto equivale, a partir da regra da multiplicao, escrever a
ocorrncia simultnea de A e B como sendo:

P( A B) = P( A) P( B)

hora de calcular outra probabilidade! Qual a probabilidade de a bolinha parar em uma


casa preta duas vezes seguida? Precisamos achar:
P(Preto no jogo 1 Preto no jogo 2) = ?
Como os eventos so independentes o resultado : (18/38).(18/38) = 324/1444 = 0,224
Exemplo 2.2: Uma caixa contm 4 lmpadas boas e 2 queimadas. Retiram-se, ao acaso, 3
lmpadas sem reposio. Calcule a probabilidade dessas 3 lmpadas serem boas.
Soluo:
Seja o evento Ai = A i-sima lmpada boa, ento: A1 = A primeira lmpada boa; A2 = A
segunda lmpada boa e A3 = A terceira lmpada boa. A probabilidade dessas 3
lmpadas serem boas dada por:
P(A1 A2 A3) = P(A1) P(A2 | A1) P(A3 | A1 A2) =

429

4 3 2 1
=
6 5 4 5

Exemplo 2.3: Sejam A e B dois eventos tais que P(A) = 0,4 e P(A B) = 0,7. Seja P(B) = p. Para
que valor de p, A e B sero mutuamente exclusivos? Para que valor de p A e B sero
independentes?
Soluo:
Sabe-se de definies passadas que, A e B so mutuamente exclusivos se ( A B) = .
Logo, pelo teorema de probabilidade: P( A B) = 0 . Assim, a partir do teorema da soma
tem-se que:

P ( A B) = P ( A) + P ( B) P( A B) 0,7 = 0,4 + p + 0 p = 0,7 0,4 p = 0,3.

No

caso

de

independncia

sabe-se

que:

Se

so

independentes

P ( A B) = P ( A) P( B) = 0,4 p . Como P( A B) = P( A) + P( B) P( A B) temos que:


P( A B) = P( A) + P( B) P( A B) 0,7 = 0,4 + p 0,4p 0,7 0,4 = 0,6p p = 0,5.

4. Avaliando o que foi construdo


Nesta unidade aprendemos a lidar com um conceito muito importante da estatstica e que
est presente quase diariamente nas nossas vidas, a probabilidade. Aprendemos nesta unidade
que uma maneira de responder a pergunta qual a probabilidade de chover hoje seria observar,
em um passado recente de dias, o nmero de dias que choveu e dividi-lo pelo total de dias.
Aprendemos tambm os conceitos de probabilidade condicional e independncia de eventos. Com
isso, estamos nos preparando cada vez mais para as etapas futuras. Para voc que est conosco,
parabns!

430

UNIDADE 3
VARIVEIS ALEATRIAS E DISTRIBUIES DE PROBABILIDADE

1. Situando a Temtica
Na unidade anterior estudamos alguns fenmenos probabilsticos por meio de espaos
amostrais mais simples. No entanto, em situaes prticas mais gerais, necessrio ampliar
esses conceitos para que tenhamos modelos probabilsticos que atendam as necessidades do
problema. A definio do conceito de varivel aleatria possibilitar uma maior flexibilidade e
aplicabilidade dos conceitos de probabilidade em problemas diversos.

2. Problematizando a Temtica
Ao estudarmos fenmenos aleatrios tais como, a renda de uma populao, o desempenho
escolar de um grupo de alunos, o impacto de uma dieta no peso de animais, etc., desejamos
saber como controlar esses experimentos e tentar extrair concluses sobre as respostas obtidas.
Neste caso, usaremos uma ferramenta valiosa que so as variveis aleatrias.

:: SAIBA MAIS... ::
Eventos improvveis acontecem, mas quais so as consequncias?
At ento, examinamos como saber a probabilidade de certos eventos. O que a
probabilidade no lhe diz o impacto geral desses eventos, e o que isso significa
para voc. Sim, com certeza, voc vai s vezes tirar a sorte grande na roleta, mas
ser que realmente vale a pena o risco com todo o dinheiro que voc perde nesse
meio tempo? Neste captulo, vamos mostrar-lhe como usar a probabilidade para
prever resultados a longo prazo e tambm medir a certeza dessas previses.

3. Conhecendo a Temtica
Quando na prtica desejamos investigar algum fenmeno, estamos na realidade
interessados em estudar a distribuio de uma ou mais variveis relacionadas a este. Assim, por
exemplo, podemos estar interessados em estudar a distribuio das notas de estudantes em uma
determinada disciplina, do grau de instruo, da altura, etc.
O que pretendemos, nesta unidade, apresentar alguns modelos tericos de distribuio
de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que
permitir a soluo de um grande nmero de problemas prticos.

431

Imagine a seguinte situao:


Um jogo de frutas em um caa-nquel tem trs visores. Se todos os
visores ficarem alinhados de forma correta prepare-se para ganhar uma
cascata de dinheiro! O valor R$1,00 por jogo.
A quantia de dinheiro que voc pode ganhar parece tentadora, mas
gostaria de saber a probabilidade de obter qualquer uma dessas
combinaes antes de jogar.
Isso parece algo que podemos calcular. Veja as probabilidades de uma determinada figura
aparecer em um visor:
R$

Cereja

Limo

Outros

1,00

0,2

0,2

0,5

A probabilidade de uma
cereja aparecer 0,2.

Os trs visores so independentes um do outro, o que significa que a figura que aparece em um
dos visores no tem efeito sobre as figuras que aparecerem em qualquer um dos outros.
PODEMOS CRIAR UMA DISTRIBUIO DE PROBABILIDADE EM DECORRNCIA DE SUA
COMBINAO PARA O CAA-NQUEIS.
Veja as probabilidades das diferentes combinaes de ganhar alguma coisa no caanqueis.
Combinao
Probabilidade

Nenhuma

Cerejas

Limes

Reais/Cerejas

Reais

0,977

0,008

0,008

0,006

0,001

No queremos saber s a anlise combinatria de ganhar, queremos


saber quanto temos chance de ganhar.
As probabilidades esto atualmente escritas em termos de combinaes de
smbolos, o que dificulta ver rapidamente qual ser nosso ganho.
No precisamos escrev-las assim. Em vez de escrever anlise combinatria
em termos de figuras, podemos escrev-las em termos de quanto ganhamos
ou perdemos em cada jogo. Basta pegar a quantia que vamos ganhar para
cada combinao e subtrair a quantia que pagamos pelo jogo.
Combinao

Nenhuma

Cerejas

Limes

Reais/Cerejas

Reais

Ganho

R$1,00

R$9,00

R$4,00

R$14,00

R$19,00

0,977

0,008

0,008

0,006

0,001

Probabilidade

Essa a anlise combinatria de ganhar, um conjunto das probabilidades


para cada possvel ganho ou perda.

432

Ao deduzir as combinaes do caa-nqueis, voc calculou as combinaes de obter cada ganho


ou perda. Isto , calculou a distribuio de combinaes de uma varivel aleatria, que uma
varivel que pode assumir um conjunto de valores onde cada valor est associado a uma
combinao especfica. Nesse caso, a varivel aleatria representa a quantia que vamos ganhar
em cada jogo.
Quando queremos nos referir a uma incgnita aleatria, geralmente a representamos por uma
letra maiscula, como X ou Y.
Os valores especficos que a incgnita pode assumir so representados por letras minsculas,
como x ou y.
P(X = x) uma forma de dizer a probabilidade de que a varivel X assuma um valor especfico
x.
Combinao
X
P(X = x)

Nenhuma

Cerejas

Limes

Reais/Cerejas

Reais

14

19

0,977

0,008

0,008

0,006

0,001

A incgnita discreta. Isso significa que ela s pode assumir valores exatos!
Que tal agora conhecer os conceitos bsicos que cercam a teoria de variveis aleatrias mais
formalmente?
3.1. O Conceito de Varivel Aleatria e Variveis Aleatrias Discretas
Definio 3.1: Seja E um experimento e S (ou ) um espao amostral associado a E. Uma
funo X, que associe a cada elemento um nmero real, X(), denominada varivel
aleatria.
Observao:
1. Cada elemento de corresponder a
exatamente um valor;
2. Diferentes valores podem levar a um
mesmo valor de X;
3. Nenhum elemento poder ficar sem
valor de X.

Definio 3.2: Seja E um experimento e seu espao amostral. Seja X uma varivel aleatria
definida em e seja Rx seu contradomnio. Seja B um evento definido em relao a Rx, isto , B
Rx. Ento, define-se o evento A como:
A = { | X ( ) B} = X 1 ( B ) .
Assim, o evento A ser constitudo por todos os resultados em para os quais X() B.
Exemplo 3.1: Suponha 2 moedas lanadas e observada a sequncia de caras e coroas obtidas.
Considere o espao amostral associado a este experimento:

433

Soluo:
Espao Amostral: = {(Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co)}
Agora, defina uma varivel aleatria X = nmero de caras obtidas no lanamento de 2
moedas. Assim, temos que X = {0, 1, 2}, visto que:
X(Co, Co) = 0
X(Ca, Co) = X(Co, Ca) = 1
X(Ca, Ca) = 2.

Variveis Aleatrias Discretas


Denomina-se X uma varivel aleatria discreta se o nmero de valores possveis de X for
um conjunto de pontos finito ou infinito enumervel. Digamos RX = {x1, x2, . . . , xn , . . .}.
Definio 3.3 (Funo de Probabilidade): Seja X uma varivel aleatria discreta. A cada
possvel resultado xi de X est associado um nmero pi = P(X = xi), denominado probabilidade da
varivel aleatria X assumir o valor xi, satisfazendo as seguintes condies:
a) p i 0
para todo xi RX.
b)

= p 1 + p 2 + ... + p n + ... = 1

(a soma das probabilidades igual a 1).

Definio 3.4 (Funo de Distribuio de Probabilidade): Dada uma varivel aleatria


discreta X, definimos F(x) a funo de distribuio acumulada ou, simplesmente, funo de
distribuio (f.d) de X, dada por:
F ( xi ) = P ( X xi )

F ( x i ) = P ( X = xi )
i =1

Exemplo 3.2: Considerando o exemplo 3.1, denote a funo de probabilidade e a funo de


distribuio da varivel aleatria X.
Soluo:
Seja X = nmero de caras obtidas no lanamento de 2 moedas, temos que a varivel
aleatria X assume os seguintes valores, X = {0, 1, 2}.
Temos que,
P(Co, Co) = P(X = 0) = 1/4
P(Ca, Co) = P(Co, Ca) = P(X = 1) =2/4 ou 1/2
P(Ca, Ca) = P(X = 2) =1/4
Denotamos a funo de probabilidade de X por
xi

P(X = xi) 1/4

1/4

434

Por conseguinte, a funo de distribuio acumulada de X dada por


0

xi

F(xi) = P(X xi) 1/4 3/4

Exemplo 3.3: Um par de dados lanado. Seja X a varivel aleatria que associa a cada ponto
(d1, d2) de a soma desses nmeros, isto , X(d1, d2) = d1 + d2. Determine a funo de
probabilidade de X.
Soluo:
O espao amostral formado de 36 pares ordenados, representando as possibilidades
nos lanamentos de dois dados = {(1, 1), (1, 2), (1, 3),..., (5, 6), ..., (6, 6)}.
Ento, a varivel aleatria X = d1 + d2 assume os seguintes valores X = {2, 3, 4, ..., 12}. Por
conseguinte, a funo de probabilidade de X obtida, calculando-se:
P (X = 2) = P(d1 = 1, d2 =1) = (1/6) (1/6) = 1/36
P (X = 3) = P(d1 = 1, d2 =2) + P(d1 = 2, d2 = 1) = (1/36) + (1/36) = 2/36
..
P (X = 12) = P(d1 = 6, d2 = 6) = 1/36

Logo, a funo de probabilidade de X ser representada por


xi

10

11

12

P(X = xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

UMA VEZ CALCULADA A


Porque devo me preocupar com
distribuies de combinaes?
Tudo que quero saber quanto
vou ganhar no caa-nqueis.
possvel calcular isso?

DISTRIBUIO DE
PROBABILIDADES, VOC PODE
USAR ESSA INFORMAO PARA
DETERMINAR O RESULTADO
ESPERADO

OS VALORES ESPERADOS LHE DO UMA PREVISO DOS RESULTADOS...


Voc tem uma distribuio de probabilidade referente a quantia que poderia ganhar no caa-nqueis,
mas agora precisa saber quanto pode esperar ganhar ou perder a longo prazo. Isso pode ser feito
calculando quanto voc normalmente espera ganhar ou perder em cada jogo. Isto , voc pode
calcular o valor esperado.
O valor esperado de uma varivel aleatria X um pouco semelhante mdia aritmtica, mas para
distribuies de probabilidades. representado por E(X) ou . Seu clculo tambm semelhante.

435

Para achar o valor esperado, multiplique cada valor de x pela sua respectiva probabilidade de
ocorrncia e, em seguida some os resultados. De forma bem simples:

E(X) = [x.P(X = x)]


3.2. Valor Esperado e Varincia de uma Varivel Aleatria
Nos modelos probabilsticos que temos considerado, parmetros podem ser empregados
para caracterizar sua distribuio de probabilidade. Dada uma distribuio de probabilidade,
possvel associar certos parmetros, os quais fornecem informaes valiosas sobre tal
distribuio.
Um dos parmetros mais importantes o valor esperado (esperana ou mdia) de uma
varivel aleatria X, denotado por E(X) ou .
Definio 3.5 (Valor Esperado ou Mdia): Seja X uma varivel aleatria discreta com
possveis valores x1, x2, . . . ,xn , ... . Seja p(xi) = P (X = xi ), i = 1, 2, ..., n, ... Ento, o valor
esperado ou mdia da varivel aleatria X definido por:
Sou o valor
esperado, o irmo
gmeo da mdia.

= E ( X ) = xi p( xi ) ,
i =1

se a srie

xi p ( xi )

i =1

convergir, ou seja,

xi

i =1

p( xi ) < .

Observao: E(X) mede o valor mdio de X, sendo expressa na mesma unidade de X.


Vamos calcular o valor esperado dos ganhos no caa-nqueis. Recorda da nossa
distribuio de probabilidade?
x
P(X = x)

14

19

0,977

0,008

0,008

0,006

0,001

E(X) = ( 1 x 0,977) + (9 x 0,008) + (4 x 0,008) + (14 x 0,006) + (19 x 0,001)


E(X) = 0,77
Em outras palavras, em vrias jogadas, voc pode esperar perder R$0,77 para cada jogo. Isto
significa que, se voc jogasse 100 vezes no caa-nqueis poderia esperar perder R$77,00

436

Exemplo 3.4: Considere a varivel aleatria definida no exemplo 3.2. Obtemos a E(X) por:
Soluo:
3
1 1
1

E ( X ) = xi p( xi ) = 0 + 1 + 2 = 1
4 2
4

i =1

Isto representa que, ao lanarmos a moeda 2 vezes esperamos que, em mdia, em um


dos lanamentos aparea Cara.
... E A VARINCIA LHE DIZ SOBRE A DISPERSO DOS RESULTADOS
O valor esperado lhe diz quanto, em mdia, voc pode esperar ganhar ou perder a cada jogo. Se
voc perdesse essa quantia todas as vezes, onde estaria a graa, e quem jogaria?
S porque voc pode esperar perder a cada vez que jogar no significa que no haja uma
pequena chance de ganhar bastante dinheiro. Assim como a mdia, o valor esperado no conta a
histria por inteiro, pois a quantia que voc tem chance de ganhar em cada jogo pode variar
muito. Em sua opinio, como poderamos medir isso?
AS DISTRIBUIES DE PROBABILIDADES TM VARINCIA
O valor esperado fornece o valor tpico, ou mdio, de uma varivel, mas no lhe diz nada sobre
como os valores esto dispersos. Outro parmetro importante que caracteriza uma varivel
aleatria a varincia, denotada V(X) ou 2 . A varincia de uma varivel aleatria uma medida
que d a idia de disperso dos valores da varivel, em relao ao seu valor esperado (mdia).
Definio 3.6 (Varincia): Seja uma varivel aleatria X (discreta ou contnua) sua varincia,
denotada V(X) ou 2, definida por:
2 = V ( X ) = E ( X )2 ,

onde = E(X) a mdia de X.


Observaes:
V(X) 0 e mede a variabilidade ou disperso de X em torno da sua mdia ;
V(X) expressa em unidades quadradas (o que torna difcil a sua interpretao);
O Desvio Padro X = V ( X ) mede a disperso absoluta de X, sendo expressa na mesma
unidade da varivel aleatria X.
A definio de varincia de uma varivel aleatria (v.a.) X, pode ser re-escrita por:

2 = V ( X ) = E ( X 2 ) [E ( X )]2 ,

onde: E ( X 2 ) = xi2 p( xi ) .
i =1

437

x
x

1
2

P(X = x)

9
2

4
2

14

19

( 1) = 1

(9) = 81

(4) = 16

(14) = 196

(19) =361

0,977

0,008

0,008

0,006

0,001

Sabe-se que: E(X) = 0,77


E(X2) = (1 x 0,977) + (81 x 0,008) + (16 x 0,008) + (196 x 0,006) + (361 x 0,001)
E(X2) = (0,977) + (0,648) + (0,128) + (1,176) + (0,361) = 3,29
V(X) = E(X2) [E(X)]2 = 3,29 ( 0,77)2 = 2,6971
O desvio padro tambm pode ser encontrado: S = 2,6971 = 1,642
Isso significa que, em mdia, nossos ganhos por jogo estaro a uma distncia de 1,642
do valor esperado de 0,77.

Propriedades Importantes do Valor Esperado


Sejam X uma v.a. e c = constante, ento:
1. O valor esperado (mdia) de uma constante a prpria constante: E(c) = c.
2. Multiplicando-se uma constante por uma varivel aleatria X, sua mdia fica multiplicada
por esta constante:
E(c.X) = c. E(X).
3. Somando ou subtraindo uma constante de uma varivel aleatria X, sua mdia fica
somada ou subtrada desta constante:
E(X c) = E(X) c.
4. Sejam X e Y duas variveis aleatrias, o valor esperado da soma/subtrao de variveis
aleatrias equivale a soma/subtrao dos valores esperados de X e Y:
E(X Y) = E(X) E(Y).
5. Sejam X e Y duas variveis aleatrias independentes, temos que:
E(X.Y)=E(X).E(Y).
Propriedades Importantes da Varincia
Sejam X uma v.a. e c = constante, ento:
1. A varincia de uma constante zero: V(c) = 0.
2. Multiplicando-se uma constante por uma varivel aleatria X, sua varincia fica
multiplicada pelo quadrado da constante: V(c.X) = c2. V(X).
3. Sejam X e Y duas variveis aleatrias independentes, a varincia da soma/subtrao de
variveis aleatrias equivale a soma das varincias de X e Y: V(X Y) = V(X) + V(Y).
438

:: ARREGAANDO AS MANGAS!! ::
At agora vimos como calcular e usar as distribuies de probabilidade, mas
no seria bom se tivssemos algo mais fcil com que trabalhar ou apenas
mais rpido de calcular? A seguir vamos apresentar algumas distribuies
de probabilidade especiais que seguem padres muito bem definidos.
Continue lendo para que possamos apresent-lo a distribuio Binomial.
3.4. Experimentos Binomiais e a Distribuio Binomial
Dentre as funes de probabilidade, apresentaremos inicialmente uma distribuio discreta de
grande importncia, denominada Distribuio Binomial. Em seguida, faremos estudo de uma
distribuio contnua de grande utilizao na teoria da probabilidade, chamada a Distribuio
Normal.
Para utilizar a teoria das probabilidades no estudo de um fenmeno concreto, devemos encontrar
um modelo probabilstico adequado a tal fenmeno. Entendemos por modelo probabilstico para
uma varivel aleatria (v.a) X, uma forma especfica de funo de distribuio de probabilidade
que reflita o comportamento de X. As propriedades bsicas de um modelo probabilstico devem
ser:
Adequao: O modelo deve refletir adequadamente o mecanismo aleatrio que ocasiona
variao nas observaes;
Simplicidade: Utilizao, sempre que possvel, de hipteses simplificadoras, de modo que
o modelo se preste anlise estatstica, sem sacrifcio de adequao;
Parcimnia de Parmetros: Um nmero excessivo de parmetros prejudicaria a anlise
estatstica. Entre dois modelos que constituam aproximao adequada de um fenmeno,
devemos preferir aquele que apresente o menor nmero de parmetros.
Distribuio de Bernoulli
Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado
como sucesso ou fracasso, caso o evento que nos interessa ocorra ou no, respectivamente.
Associe p, a probabilidade de sucesso, ao evento que nos interessa e (1 p) = q, a probabilidade
de fracasso. Definimos, ento, a seguinte varivel aleatria discreta:

0, se ocorrer fracasso
.
X =
1, se ocorrer sucesso
A distribuio de probabilidade de X definida por:
xi

P(X = xi) (1 p)

Distribuio Binomial (Experimentos Binomiais)


439

Verifica-se que:
E(X) = p e V(X) = p(1 p),
que so as principais
caractersticas da varivel
aleatria X.

Um experimento binomial apresenta quatro propriedades:


O experimento consiste em uma seqncia de n ensaios idnticos e independentes;
Dois resultados so possveis em cada ensaio. Um denominado de sucesso e o outro de
fracasso;
A probabilidade de um sucesso denotada por p, e no se modifica de ensaio para ensaio.
(O mesmo se aplica probabilidade de fracasso q = (1 p));
Os ensaios so independentes;
Defina uma varivel aleatria Y como sendo o nmero de sucessos nos n ensaios.
Definio 3.8: Dizemos que uma varivel aleatria discreta X = X1 + X2 + ... + Xn, onde cada Xi
um ensaio de Bernoulli, apresenta distribuio binomial com n provas (ensaios ou tentativas) e
probabilidade p de sucesso, sendo sua funo de probabilidade definida por:

n
P ( X = k ) = p k (1 p) n k , k = 0,1, n ,
k
pois, para X = k teremos observado k sucessos, cada um com probabilidade p e
conseqentemente (n k) fracassos, cada um com probabilidade q = (1 p).
Notao: X ~ Bin(n, p) equivale a dizer que X
tem distribuio Binomial com parmetros n e p.

n!

Lembre-se que essa combinao

Propriedades:

OBS: =
k k!(n k )!
representa o nmero de ensaios (n) em
k tentativas.

E(X) = np
V(X) = npq

Exemplo 3.5: Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as
probabilidades do time A ganhar, perder ou empatar sejam as mesmas e permaneam constantes
durante as 6 partidas. Encontre a probabilidade do time A ganhar 4 vezes e calcule a esperana e
a varincia.

Soluo:
Seja X = Nmero de vezes que o time A ganha.
X ~ Bin(n, p)
X ~ Bin(6, 1/3)
Note que o time A pode ganhar, perder ou empatar, assim sendo: p = 1/3 (probabilidade de
vencer, que corresponde ao sucesso) e, q = 2/3 (perder ou empatar, que corresponde ao
fracasso). Alm disso, eles jogam entre si 6 vezes, portanto, n = 6.
Logo, a probabilidade do time A ganhar 4 vezes dada por:

6
20
P ( X = 4) = (1 / 3) 4 (1 1 / 3) 6 4 = 15 (1 / 3) 4 (2 / 3) 2 =
0,08 .
243
4
440

6
6!
6! 6.5.4! 6.5 30
OBS : =
=
=
=
=
= 15
2.1 2
4 4!(6 4)! 4!2! 4!2!
Esperana (mdia) de vitrias ser: E ( X ) = np = 6

1
=2
3

1 2 4
= .
3 3 3

Varincia: V ( X ) = npq = 6

DADOS DISCRETOS TRABALHAM COM VALORES EXATOS...


At agora estudamos distribuies de probabilidades em que os dados so discretos. Isto , os
dados so compostos de valores numricos distintos e podemos calcular a probabilidade de cada
um desses valores. Se os dados forem discretos, eles podem assumir valores exatos.
Geralmente, so dados que podem ser contados de alguma forma, tal como o nmero de balas
em um baleiro, o nmero de perguntas respondidas corretamente em um programa de competio
ou o nmero de vezes que a mar cheia durante o perodo de um ms.

GUIA RPIDO PARA A DISTRIBUIO BINOMIAL


Veja um resumo de tudo que voc precisa saber sobre distribuio Binomial:
Quando us-la?
Use a distribuio Binomial se estiver realizando um nmero fixo de tentativas independentes,
onde cada tentativa pode ter um sucesso ou fracasso, e se voc estiver interessado no nmero
de sucessos ou fracassos.
Como calcular as probabilidades?
Use, P(X = k) = nCk.pk.q(n k), onde, nCk.= n!/[k!(n k)!]. Lembrando que, p = probabilidade de
sucesso em uma tentativa, q = (1 p), n = nmero de tentativas. Essa frmula corresponde a
apresentada anteriormente:

n
P ( X = k ) = p k (1 p) nk lembrando que a combinao dada por:
k
E o valor esperado e a varincia?
E(X) = np

n
n!
=
k k!(n k )!

V(X) = npq

... MAS NEM TODOS OS DADOS NMERICOS SO DISCRETOS!


Nem sempre possvel dizer quais devem ser todos os valores de um conjunto de dados. s
vezes, os dados incluem um intervalo onde qualquer valor dentro daquele intervalo possvel.
Como exemplo, suponha que voc tivesse de medir com preciso pedaos de barbante com
comprimento variando entre 10 e 11 polegadas. Poderia haver medidas 10 polegadas, 10,1
polegadas, 10,01 polegadas, e assim por diante, j que o comprimento poderia assumir qualquer
valor dentro deste intervalo. Dados numricos como estes so chamados de contnuos.
Geralmente, so dados que so medidos de alguma forma, em vez de contados, e tudo depende
do grau de preciso da medio.
441

Marquei com meus amigos de estudar


Estatstica, s 14:00 h na biblioteca. Mas
eles sempre atrasam! No vou ficar
esperando eles chegarem por mais de 20
minutos! Qual a probabilidade de que eu
fique esperando por mais de 5 minutos?

Veja o esboo da freqncia mostrando a quantidade de tempo que Jnior passa esperando seus
amigos:
F

Os amigos de Jnior no so pontuais, eles podem chegar a qualquer hora!

Minutos
0

20

Este ponto representa quando Jnior vai embora

Este ponto representa quando Jnior chega

Entendi! Para distribuies de probabilidade


discretas, nossa preocupao a probabilidade de
obter um determinado valor; para distribuies de
probabilidade contnuas, nossa preocupao a
probabilidade de obter um determinado intervalo!

DISTRIBUIES
SITUAES

DE

PROBABILIDADE

DISCRETAS

NO

RESOLVEM

TODAS

AS

At agora estudamos distribuies de probabilidades onde poderamos especificar os valores


exatos, mas nem sempre este o caso para todos os conjuntos de dados. Alguns tipos de dados
simplesmente no se enquadram nessas distribuies de probabilidades. Vamos examinar como
funcionam as distribuies de probabilidade contnuas e introduzir voc a uma das mais
importantes distribuies de probabilidade que existem, a distribuio Normal.
3.5. Distribuio Normal
A distribuio normal a mais importante das distribuies contnuas de probabilidade.
Conhecida por alguns leitores como a curva em forma de sino, tem sua origem associada aos
erros de mensurao. sabido que, quando se efetuam repetidas mensuraes de determinada
grandeza com um aparelho equilibrado, no se chega ao resultado todas s vezes. Obtm-se, ao
contrrio, um conjunto de valores que oscilam, de modo aproximadamente simtrico, em torno do
verdadeiro valor. Construindo um histograma desses valores e o correspondente polgono de
442

freqncias, obtm-se uma poligonal aproximadamente simtrica. A distribuio normal


desempenha, no obstante, um papel preponderante na estatstica e os processos de inferncia,
nela baseados, tm larga aplicao. Muitas das variveis quantitativas analisadas em pesquisas
nas diversas reas de estudo correspondem ou se aproximam da distribuio normal.
AS FUNES DE DENSIDADE DE PROBABILIDADE PODEM SER USADAS PARA DADOS
CONTNUOS
Podemos descrever a distribuio de probabilidade de uma varivel aleatria contnua usando
uma funo de densidade de probabilidade, f(x). uma funo que voc pode usar para achar
as probabilidades de uma varivel contnua em um intervalo de valores.
Uma distribuio normal caracteriza-se por uma funo real f(x) denominada de funo
densidade de probabilidade (f.d.p) da varivel aleatria X, dado pelo modelo probabilstico abaixo
e grfico correspondente:

f ( x) =

(x )2
2
exp
, - < x < +, - < < +, > 0.
2
2
2
2

* A distribuio normal uma curva


em forma de sino.
* A curva simtrica, com a
densidade da probabilidade mais alta
no centro da curva.
* A densidade da probabilidade
diminui quanto mais voc se afasta
da mdia.
* Tanto a mdia quanto a mediana
ficam no centro e tm a densidade de
probabilidade mais alta.
* definida por dois parmetros: e
2. lhe diz onde est o centro da
curva e lhe fornece a disperso.
Propriedades da Curva Normal:
unimodal, isto , f(x) tem um ponto de mximo cuja abscissa x = . Esse ponto, situado no
meio da distribuio, aquele em que coincidem os valores da mdia, moda e mediana;
f(x) simtrica em relao mdia ;
f(x) tem dois pontos de inflexo, cujas abscissas so x = ( ) e x = ( + );
O desvio-padro dado por (a raiz quadrada positiva da varincia 2);
A rea total sob a curva normal e acima do eixo horizontal equivale a 1 (o eixo das abscissas
o eixo dos valores da varivel aleatria X);

443

f(x) tem uma assntota. A partir do topo, a curva cai gradativamente at formar as caudas que
se estendem indefinidamente, aproximando-se cada vez mais da linha base sem, entretanto,
jamais toc-la.
Fixando-se a mdia, verifica-se que o achatamento da curva est diretamente ligado ao valor
do desvio padro , ou seja, quanto maior for o desvio padro, mais achatada a curva, como
pode ser vista na figura abaixo.

Notao: X N (; 2), ou seja, X tem distribuio normal com mdia e varincia 2.


ENTO COMO FAZEMOS PARA CALCULAR AS PROBABILIDADES NORMAIS?
Assim como qualquer outra distribuio de probabilidade contnua, voc acha probabilidades
calculando a rea sobre a curva da distribuio. A curva d a densidade da probabilidade, e a
probabilidade dada pela rea entre determinados intervalos. Se, por exemplo, voc quisesse
achar a probabilidade de que uma varivel aleatria X esteja entre a e b, seria preciso achar a
rea sob a curva entre os pontos a e b.

Parece complicado? No se preocupe, mais fcil do que


voc pensa. Calcular a rea sob a curva normal seria difcil
se voc tivesse que fazer tudo isso sozinho, mas felizmente
voc tem uma mozinha de ajuda na forma das tabelas de
probabilidade. Basta calcular o intervalo da rea que voc
deseja achar e, em seguida, consultar a probabilidade
correspondente na tabela

TRS PASSOS PARA CALCULAR PROBABILIDADES NORMAIS


Pegue sua distribuio e o intervalo (voc vai precisar da mdia e do desvio-padro para
achar suas probabilidades).
Padronize (vamos mostrar como fazer isso em breve).
Consulte as probabilidades (uma vez transformada sua curva normal, voc pode consultar
probabilidade usando tabelas. Pronto, tarefa cumprida!).

444

PASSO 01: DETERMINE SUA DISTRIBUIO


= 71

2 = 20,25

A primeira coisa que precisamos fazer determinar a


distribuio dos dados, ou seja, identificar os valores da
mdia e do desvio-padro. Suponha que Jnior e seus
amigos foram pesquisados sobre as suas alturas. A altura
mdia do grupo de 71 polegadas, e a varincia de 20,25
(polegadas)2. Isso significa que, se X representa a altura
dos alunos ento, X ~ N(71; 20,25)

Tambm precisamos saber qual intervalo de valores nos dar a rea de probabilidade correta.
Necessitamos de um exemplo! Portanto, imagine que Jnior deseja achar a probabilidade de que
algum dos seus amigos seja mais alto que ele. Jnior tem 64 polegadas de altura.

fcil, Jnior quer saber se um dos seus


amigos mais alto do que ele. Por isso,
podemos calcular as probabilidades com base
na altura dele. A probabilidade de que haja
algum mais alto do que Jnior dada pela
expresso: P(X > 64). Essa probabilidade
representada graficamente pela curva ao lado.

= 71

64

PASSO 02: PADRONIZE PARA N(0; 1)


O prximo passo padronizar nossa varivel X de forma que a mdia passe a ser 0 (zero )e o
desvio-padro 1. Isso nos d uma varivel normal padronizada Z, onde Z ~ N(0; 1)
Essa padronizao se faz necessria porque as tabelas de probabilidade se concentram em dar
as probabilidades para distribuies de N(0; 1), pois seria impossvel gerar tabelas de
probabilidade para cada curva de distribuio normal. Existe um nmero infinito de valores
possveis para e 2 e, como a curva normal utiliza esses valores como parmetros para indicar o
centro e a disperso da curva, existe tambm um nmero infinito de curvas possveis para a
distribuio normal.
Para padronizar, primeiro desloque a mdia....
Vamos comear transformando nossa distribuio normal para que a mdia passe a ser 0 em vez
de 71. Para isso, deslocamos a curva para a esquerda em 71 unidades.

445

=0

= 71
Desloque para esquerda
71 unidades

Isso nos d uma nova


distribuio de:
X 71 ~ N(0; 20,25)

...em seguida, comprima a largura


Tambm precisamos ajustar a varincia. Para isso, comprimimos nossa distribuio dividindo
pelo desvio-padro. Sabemos que a varincia 20,25 e, por isso, o desvio-padro 4,5 (lembrese da Unidade 1 que o desvio-padro a raiz quadrada da varincia).
=0

Ao fazer isso obtemos:

X 71
~ N (0; 1)
4,5
Ou, Z ~N(0; 1) onde:

X 71
Z=
4,5

Comprima a distribuio
dividindo pelo desvio-padro.
Este o escore padro. De
modo geral voc pode achar
o escore padro para
qualquer varivel Normal X
usando:

Z=
=1

Agora ache Z para o valor especfico para o qual voc deseja achar a probabilidade
At agora vimos como nossa distribuio de probabilidades pode ser padronizada para ir de X ~
N(; 2) a Z ~ N(0; 1). Aquilo que mais nos interessa so as probabilidades reais. O que
precisamos fazer tomar o intervalo de valores para o qual queremos achar as probabilidades e
achar o escore padro do limite desse intervalo. Em seguida, podemos consultar a probabilidade
para o nosso escore padro usando as tabelas de probabilidade normal.
Em nosso exemplo, deseja-se calcular a probabilidade de que tenha algum amigo mais alto do
que Jnior. Precisamos achar P(X > 64). O limite desse intervalo 64 e, por isso, se calcularmos
o escore padro z de 64, poderemos us-lo para achar nossa probabilidade. Portanto,

Z=

64 71
= 1,56 (com duas casas decimais)
4,5

Ento 1,56 o escore padro de 64, usando a mdia e o desvio padro das
alturas de Jnior e seus amigos. Agora que temos essa informao podemos
passar para a etapa final, usando tabelas para consultar probabilidades.
Perceba que nos ltimos pargrafos falamos sobre distribuio normal padronizada. Que tal
pararmos um pouco agora para sermos apresentados formalmente a essa to importante
distribuio? Continue lendo e aprendendo! No se esquea que logo em seguida temos o ltimo
passo para encontrar nossa to sonhada probabilidade!

446

Distribuio Normal Padro:


O clculo direto de probabilidades envolvendo a distribuio normal no um processo
elementar. Notemos, entretanto, que a funo de densidade normal depende de dois parmetros,
e , de modo que se tabelssemos as probabilidades diretamente a partir dessa funo, seriam
necessrias tabelas de dupla entrada para cada valor particular = 0 e = 0, complicando
consideravelmente o problema. Recorre-se, por isso, a uma mudana de varivel, transformando
a varivel aleatria X na varivel aleatria Z assim definida:

Z=

Esta nova varivel chama-se varivel normal padronizada, ou reduzida, sendo sua
mdia igual a zero ( = 0) e o seu desvio padro igual um ( = 1).
Demonstrao:

X E( X )
=
=0
=


2
X V (X ) 0
=
=1
Varincia: V ( Z ) = V
=
2
2

Mdia: E ( Z ) = E

A curva normal padro conserva as mesmas propriedades listadas anteriormente.


Mediante tal transformao, basta construirmos uma nica tabela, a da normal reduzida e, atravs
dela, obtermos as probabilidades associadas a todas as distribuies N(; 2).
A utilidade notvel da tabulao pela varivel normal padronizada devida ao fato de
que, se X tiver qualquer distribuio normal N(; 2), a tabela da distribuio N(0; 1) pode ser
empregada para calcular probabilidades associadas a X, simplesmente aplicando a transformada
para a varivel Z. Conseqentemente, temos que:

b
a
b
a
P ( a X b ) = P
Z
=

,




onde (z) = P (Z z), a funo de distribuio acumulada de N(0; 1).
PASSO 03: CONSULTE A PROBABILIDADE NA SUA TABELA
Agora que temos o escore padro, podemos usar as tabelas de probabilidade para responder a
pergunta do nosso amigo Jnior e achar a nossa probabilidade. As tabelas de probabilidade
normal permitem consultar qualquer valor z e, depois, ler a probabilidade correspondente P(Z < z).

Ento como usamos?


447

Comece calculando z com 2 casas decimais. Este o valor que voc vai precisar consultar na
tabela. Para consultar a probabilidade, preciso usar a primeira coluna e a linha superior para
achar seu valor z. A primeira coluna d o valor de z com 1 casa decimal (sem arredondar) e a
linha superior d a segunda casa decimal. A probabilidade onde as duas se interceptam!
Como exemplo, se quisesse achar P(Z < 0,86), voc acharia 0,8 na primeira coluna, 0,06 na linha
superior, e encontraria uma probabilidade de 0,8051.

Acesse a plataforma MOODLE e faa o download da tabela da distribuio


normal padronizada.

Vamos voltar ao exemplo das Alturas de Jnior e seus amigos.


Relembrando, deseja-se calcular P(X > 64) = ? De acordo com o escore
padro queremos achar: P(Z > 1,56). Portanto, vamos consultar 1,56 na
tabela. Obtemos uma probabilidade de 0,0594. Em outras palavras,
P(Z < 1,56) = 0,0594.
Isso significa que: P(Z > 1,56) = 1 P(Z < 1,56) = 1 0,0594 = 0,9406.

448

:: SAIBA MAIS... ::
As tabelas de probabilidades possibilitam que voc consulte a probabilidade P(Z < z),
onde z algum valor. O problema que voc nem sempre deseja achar esse tipo de
probabilidade; s vezes, voc deseja achar a probabilidade de que uma varivel
aleatria contnua seja maior que z, isto , P(Z > z), ou ainda, esteja entre dois
valores, P(a < Z < b). Como usar as tabelas para achar a probabilidade que voc
procura?
* Achando P(Z > z): Nesse caso, diminua da probabilidade total a rea onde Z < z.
Em outras palavras, use: P(Z > z) = 1 P(Z < z).
* Achando P(a< Z < b): Nesse caso, calcule P(Z < b) e diminua a rea de P(Z < a).
Em outras palavras, use: P(a< Z < b) = P(Z < b) P(Z < a).

Exemplo 3.9: Os salrios mdios dirio dos bilogos de uma empresa so distribudos segundo
uma distribuio normal com mdia de R$ 50,00 e desvio padro de R$ 4,00. Encontre a
probabilidade de um operrio ter um salrio dirio abaixo de R$ 52,00?
Soluo:
Seja X = o salrio dirio dos funcionrios. Interesse: Encontrar P (X < 52). Assim,
52
52 50

P ( X < 52) = P Z <


= P Z <
= P ( Z < 0,50) = (0,50) = 0,6915 .
4

Pode-se afirmar que a probabilidade de um bilogo apresentar um salrio inferior a R$ 52,00


de 69,15%.

:: SAIBA MAIS... ::
Dica:
Trs importantes informaes que iro facilitar o clculo de probabilidades
envolvendo a distribuio normal padro, a partir da tabela que voc baixou na
plataforma MOODLE: (i) a tabela que voc est utilizando apresenta as
probabilidades de P(Z z0) = F(z0), ou seja, a funo de distribuio acumulada. No
entanto, esta tabela considera apenas valores positivos para Z. (ii) a rea total sob a
curva equivale a 1. Logo, a metade da curva representa probabilidade igual a 0,5; (iii)
a curva da normal simtrica. Essa propriedade ser bastante til no clculo de
probabilidades onde os valores de Z so negativos, ou seja, P(X x0) = 1 P(X +
x0).

4. Avaliando o que foi construdo


Nesta unidade aprendemos o conceito de funo de distribuio de probabilidade, o conceito de
varivel aleatria, alm dos conceitos de esperana e varincia de variveis aleatrias.
Conhecemos tambm duas distribuies importantssimas na estatstica que so as distribuies:
Binomial e Normal. Particularmente, a distribuio normal ser uma ferramenta essencial nas
unidades seguintes. Faa todos os exerccios propostos, pois eles sero de grande valia. Aguardo
voc no MOODLE!

449

UNIDADE 4
TEORIA ELEMENTAR DA AMOSTRAGEM

1. Situando a Temtica
Amostragem uma rea da Estatstica que estuda tcnicas de planejamento de pesquisa
para possibilitar inferncias sobre uma populao a partir do estudo de uma pequena parte de
seus componentes, uma amostra.

2. Problematizando a Temtica
Ao fazermos uma jarra de suco e adicionamos acar desejamos saber se a quantidade de
acar foi satisfatria. Para isto, no precisamos tomar toda a jarra de suco, uma colher basta. Da
mesma forma, ao estudarmos um fenmeno probabilstico em uma populao no precisamos
investigar toda a populao, e sim uma amostra dela. No entanto, algumas questes podem
surgir: Como obter essa amostra? Qual deve ser o tamanho dessa amostra? Esta unidade tem
como objetivo responder esta e mais algumas questes correlatas.
A ESTATSTICA TRABALHA COM DADOS, MAS DE ONDE VM OS DADOS?
Algumas vezes, fcil colher dados, tais como as idades das pessoas que
frequentam uma academia de ginstica ou os nmeros das vendas de uma
empresa fabricante de jogos. Mas e quando os dados so difceis de colher?
s vezes, difcil saber por onde comear a colher dados devido ao grande
nmero de coisas envolvidas. Neste captulo, vamos examinar como colher
dados de forma eficaz na vida real, com eficcia, preciso, economia de
tempo e dinheiro. Bem-vindo a mundo da amostragem!
COMO FUNCIONAM AS AMOSTRAGENS?
Populao

A chave para se criar uma boa amostra escolher uma


amostra que combine o mximo possvel com sua
populao. Se sua amostra for representativa, isto significa
que ela tem caractersticas semelhantes populao. E
isso, por sua vez, significa que voc pode usar sua amostra
para prever quais caractersticas a populao ter.

Amostra

Amostragem

3. Desenvolvendo a Temtica
3.1. Conceitos Bsicos
Muitas vezes faz-se necessria a coleta de dados diretamente na origem. Entretanto,
quando impossvel se observar toda a populao recorremos s tcnicas de amostragem, onde
450

nos limitamos a uma amostra da populao em estudo. Basicamente, nosso objetivo coletar
uma pequena frao da populao de modo que as informaes observadas na amostra possam
ser generalizadas para a populao. Para que esta generalizao seja possvel, os integrantes da
amostra devem ser escolhidos adequadamente.
Antes de aprofundarmos nosso discurso, vamos definir alguns termos necessrios:
Populao Objeto: a populao de interesse sobre a qual desejamos obter informaes
(Exemplo: peas produzidas em uma fbrica);
Populao de Estudo: o conjunto de indivduos de interesse especfico (Exemplo:
peas que permanecem em estoque);
Caracterstica Populacional: Aspectos da populao que interessam serem medidos ou
observados (Exemplo: dimetro da pea);
Unidade Amostral: Definida de acordo com o interesse do estudo, podendo ser uma pea,
um indivduo, uma fazenda, etc. Tal escolha deve ser feita no incio do estudo;
Estrutura Amostral ou Amostra: o conjunto de unidades amostrais (Exemplo: o
conjunto das peas selecionadas).
importante ressaltar que existem dois tipos de amostragem, a saber:
Amostragem Probabilstica: o procedimento atravs do qual existe uma probabilidade
conhecida e diferente de zero (p) para cada elemento da populao ser escolhido para
constituir a amostra;
Amostragem No-Probabilstica: Quando, no processo de seleo, no existe nenhum
mecanismo probabilstico para selecionar os indivduos da populao para constituir a
amostra.

:: ARREGAANDO AS MANGAS!! ::
Defina sua populao alvo: A primeira coisa a se deixar bem claro qual a sua
populao alvo para que voc saiba de onde est colhendo sua amostra.
Populao alvo o grupo que voc est pesquisando e para o qual deseja colher
resultados e, depende, em grande parte, da finalidade do seu estudo.
Defina as unidades amostrais: Uma vez definida a populao alvo, preciso
decidir para que tipo de objeto voc vai colher amostras.
Defina seu plano amostral: Por ltimo, voc precisa de uma lista de todas as
unidade amostrais dentro da sua populao alvo. basicamente uma lista a partir
da qual voc pode escolher sua amostra.

De acordo com a definio de amostragem probabilstica, existe


a suposio de um sorteio com regras bem determinadas, cuja
realizao s ser possvel se a populao for finita e totalmente
acessvel. Esse tipo de amostragem a melhor garantia para se
obter uma representatividade da populao pela amostra. Os
principais planos de amostragem probabilstica so:

451

1. Amostragem Aleatria (ou Casual) Simples: Neste tipo de plano, supe-se que todos os
elementos da populao tm igual probabilidade de pertencer amostra, ou
alternativamente, se todas as possveis amostras, de mesmo tamanho, tm a mesma
probabilidade de serem selecionadas. Normalmente, consideramos esse tipo de plano
amostral quando a populao homognea. Esse processo de amostragem pode ser feito
com ou sem reposio do elemento amostrado. Uma tcnica que garante esta igual
probabilidade a seleo aleatria de elementos, por exemplo, atravs de sorteio.
2. Amostragem Sistemtica: Inicia com uma escolha aleatria de um elemento da
populao e, a partir deste, usa-se um sistema de seleo para compor o restante da
amostra. Por exemplo, numa listagem de elementos da populao, sorteamos um entre os
dez primeiros da lista o 5o elemento. A partir do elemento sorteado, selecionamos um a
cada quinze elementos (o 20o, o 35o e assim por diante). Este mtodo de amostragem
pode ser utilizado quando se quer planejar um perodo de tempo para execuo da coleta
de dados ou quando se deseja cobrir um determinado perodo de tempo com a amostra
estudada. Tambm consideramos esse tipo de plano amostral quando a populao
homognea.
3. Amostragem Estratificada: Na amostragem estratificada a populao dividida em
grupos internamente homogneos (estratos) e em seguida selecionada uma amostra
aleatria de cada estrato. Este tipo de amostragem usado quando o evento estudado
numa populao tem caractersticas distintas para diferentes categorias que dividem esta
populao, ou seja, dentro de cada estrato os elementos so bastante semelhantes entre
si e, entre os estratos eles so heterogneos. Assim, a estratificao apropriada para
agrupar os elementos por sexo, faixa etria, religio, escolaridade ou em populaes
heterogneas como rendas, produes agrcolas, produes industriais, etc.
4. Amostragem por Conglomerados: A populao dividida em pequenas subpopulaes,
com elementos internamente heterogneos, chamadas conglomerados (clusters).
Seleciona-se uma amostra aleatria simples desses conglomerados, e deles selecionamse aleatoriamente os elementos que iro compor a amostra. Assim, numa pesquisa scioeconmica pode-se dividir a cidade em bairros (conglomerados), em seguida obter uma
amostra aleatria de bairros e, ento efetuar o levantamento estatstico nas residncias
dos bairros selecionados. Observe que, no caso da estratificao, indivduos sero
selecionados em cada estrato, enquanto no caso da diviso da populao em
conglomerados, selecionamos apenas parte dos conglomerados.
5. Amostragem por Estgios Mltiplos: Esta estratgia de amostragem pode ser vista
como uma combinao de dois ou mais planos amostrais. Considere por exemplo uma
populao estratificada onde o nmero de estratos muito grande. Ao invs de obter uma
amostra aleatria de cada estrato, o que poderia ser invivel devido quantidade de
estratos, o pesquisador poderia optar por selecionar aleatoriamente alguns estratos e em
seguida selecionar uma amostra de cada estrato selecionado. Neste caso, teramos uma
amostragem em dois estgios usando, nas duas vezes, a amostragem aleatria simples,
sendo que no primeiro estgio as unidades amostrais so os estratos e no segundo so as
componentes da populao.

452

importante ressaltar que certos cuidados dever ser tomados no processo de obteno de
uma amostra, ou seja, no processo de amostragem, pois muitas vezes erros grosseiros e
concluses falsas ocorrem devido a falhas nesse processo.

:: SAIBA MAIS... ::
Exemplo de Amostragem Estratificada: Podemos dividir gomas de mascar nas
diferentes cores (amarelo, verde, vermelho e cor-de-rosa). Cada cor representa um
estrato diferente. Uma vez feito isso, voc pode fazer a AAS em cada estrato para ter
certeza de que cada grupo esteja representado na sua amostra global.
Exemplo de Amostragem por Conglomerados: Gomas de mascar podem ser
vendidas em pacotes, onde cada pacote contm um nmero semelhante de gomas
de mascar com cores diferentes. Cada pacote forma um conglomerado. Retira-se
uma AAS de conglomerados e, em seguida, faz a pesquisa com tudo que est dentro
de cada um desses conglomerados selecionados.

3.2. Distribuio Amostral da Mdia e da Proporo


Na Inferncia Estatstica, o principal problema fazer uma afirmao sobre um parmetro
populacional (mdia, proporo, varincia, etc.) baseado em informaes coletadas de uma
amostra, atravs de um Estimador (mdia amostral, varincia amostral, etc.). No entanto, a
validade de nossa afirmao seria melhor compreendida se soubssemos o comportamento do
Estimador ao retirarmos todas as amostras possveis de tamanho n de uma populao de
tamanho N. Em outras palavras, estamos interessados em conhecer a distribuio amostral de
um Estimador.
VAMOS COMEAR ESTIMANDO A MDIA DA POPULAO!
Suponha o exemplo das gomas de mascar. Como podemos usar os resultados do teste do sabor
da amostra para saber o tempo mdio de durao do sabor da goma de mascar na populao
total de gomas?
* A resposta bastante intuitiva. Consideramos que a mdia de durao do
sabor das gomas de mascar na amostra seja igual a da populao. Em
outras palavras, achamos a mdia amostral e a usamos como mdia da
populao tambm.
* A mdia amostral a melhor estimativa que podemos fazer para a mdia
populacional. o valor mais provvel para a mdia da populao.
* A mdia amostral chamada de estimador pontual para a mdia
populacional.
Ento, como fazermos para achar a distribuio das mdias amostrais?
Suponha a populao de embalagens de gomas de mascar. Foram fornecidas a mdia () e a
varincia (2) da populao. Seja X = nmero de gomas de mascar em uma embalagem.
453

Cada embalagem escolhida aleatoriamente uma observao independente de X, e por isso,


cada embalagem de goma de mascar segue a mesma distribuio. Isto , se X representa o
nmero de gomas de mascar em uma embalagem escolhida aleatoriamente, ento cada X tem
um valor esperado e uma varincia 2.
Agora, vamos tomar uma amostra de n embalagens de gomas de mascar. possvel identificar o
nmero de gomas de mascar nas embalagens de X1 a Xn. Cada Xi uma observao
independente de X, o que significa que elas seguem a mesma distribuio. Cada Xi tem um valor
esperado e uma varincia 2.
A mdia de gomas de mascar nessas n embalagens representada por X . O valor de X
depende de quantas gomas de mascar existem em cada uma das n embalagens e, para calcullo, preciso somar o nmero total de gomas de mascar e dividir por n.
E(X1) =
E(X2) =

Var(X1) = 2
Var(X2) = 2

Esta a mdia amostral, o nmero mdio de


gomas de mascar nas embalagens:

...

E(Xn) =

X=

Var(Xn) =

X1 + X 2 ++ X n
n

Existem muitas possveis amostras de tamanho n que poderamos ter tomado. Cada amostra
possvel composta por n embalagens, o que significa que cada amostra composta por n
observaes independentes de X. O nmero de gomas de mascar em cada embalagem escolhida
aleatoriamente segue a mesma distribuio de todas as outras, e calculamos o nmero mdio de
gomas de mascar para cada amostra da mesma maneira.
Podemos formar uma distribuio a partir de todas as mdias amostrais de todas as
amostras possveis. Isso chamado de distribuio amostral das mdias.
3.2.1. Distribuio da Mdia Amostral
A distribuio amostral das mdias nos d uma maneira de calcular
probabilidades para a mdia de uma amostra. Para calcularmos a
probabilidade de qualquer varivel, primeiro preciso saber sobre sua
distribuio de probabilidades, isto significa que, se voc quiser calcular
probabilidades para a mdia amostral, preciso saber como so
distribudas as mdias amostrais.
A distribuio amostral da mdia X uma distribuio que mostra as probabilidades de
obter os possveis valores das mdias amostrais. Vamos supor uma populao {1, 3, 5} com N = 3
elementos e a varivel aleatria X assumido o valor do elemento na populao, com a seguinte
distribuio de probabilidade:
xi
1
P(X = xi) 1/3

3
1/3
454

5
1/3

Observe que a distribuio acima tem mdia (valor esperado) e varincia dados por:

1+ 3+ 5
(1 3) 2 + ( 3 3) 2 + (5 3) 2 8
2
=3 e Var(X) = =
= .
E(X) = =
3
3
3
Se retirarmos todas as amostras aleatrias de tamanho n = 2, com reposio, dessa populao
obtemos um total de Nn = 32 = 9 amostras com os seguintes resultados:
(1,1)

(1,3)

(1,5)

(3,1)

(3,3)

(3,5)

(5,1)

(5,3)

(5,5).

Considerando essas 9 possibilidades igualmente provveis, podemos construir a


distribuio amostral da mdia para uma amostra de tamanho 2. Para tanto, basta calcular a
mdia de cada uma dessas amostras obtendo os seguintes valores xi : 1, 2, 3, 2, 3, 4, 3, 4, 5,
respectivamente. Note que, a partir das mdias amostrais obtidas nas 9 amostras possveis,
possvel obtermos a seguinte distribuio amostral para X :
1

xi

P( X = xi ) 1/9

2/9

3/9

2/9

1/9

Ainda com respeito distribuio amostral de X , acima apresentada, observa-se que:

A sua mdia (valor esperado) igual mdia da populao, ou seja,


2 3
2 1 27
1
E( X ) = X = = 1 + 2 + 3 + 4 + 5 =
=3= ;
9 9 9
9 9
9

A sua varincia igual varincia da populao dividida pelo tamanho da amostra. Temos
2
que: V ( X ) = E ( X 2 ) E ( X ) .

1
2
3
2
1 93

.
Logo, E ( X 2 ) = 12 + 2 2 + 3 2 + 4 2 + 5 2 =
9
9
9
9
9 9

8
2
93
93
93 81 12 4
2
Assim, V ( X ) = E ( X 2 ) E ( X ) =
. Tais relaes
32 =
9=
= = = 3=
9
9
9
9 3 2
n
entre e X , e 2 e X2 , observadas no exemplo acima, podem ser generalizadas.

Usando a teoria das probabilidades possvel mostrar que os seguintes resultados gerais so
vlidos com relao distribuio amostral da mdia. Seja X uma varivel aleatria com valor
esperado E(X) = e varincia V(X) = 2 finita, isto , 0< 2 < . Seja X a mdia desta varivel
aleatria, obtida de amostra aleatria de tamanho n, selecionada com reposio. Ento, temos
que:

E( X ) = X = ;

V( X ) = X2 =

455

2
n

Alm disso, tem-se o resultado conhecido como Teorema Central do Limite: Seja X uma
varivel aleatria com valor esperado E(X) = e varincia V(X) = 2. Para n suficientemente
grande,
1 n
X = Xi
n i =1
apresenta, aproximadamente, uma distribuio normal com mdia e varincia ( 2 / n) , Logo,

2
X N ,
n

X
e Z =
N (0,1) .

A distribuio da varivel padronizada Z conhecida por Distribuio Normal Padro.


Observaes:
(1) O desvio padro de X , denotado por X = / n , chamado erro padro da mdia e
descreve a variabilidade das mdias amostrais em torno da verdadeira mdia populacional .
Assim, quanto maior o erro padro da mdia, maior ser a diferena entre parmetro e sua
estimativa X , calculada a partir da amostra. Quando n grande ( 2 / n) decresce, significando
que a mdia amostral fornecer uma estimativa mais segura para em grandes amostras.
(2) Para amostras sem reposio, de populao finita, temos a mdia X = E( X ) = e varincia

X2 = V( X ) =

2 N n

, onde N o total de elementos da populao.


.
n N 1

(3) Para valores grandes de n (n 30) a aproximao da distribuio amostral da mdia X pela
distribuio Normal considerada satisfatria.
Exemplo 4.1: Os registros de uma agncia de turismo mostram que um turista gastou, durante o
ltimo ano, em mdia = US$ 800,00, sendo o desvio padro dos gastos igual a = US$ 80,00.
Ache a probabilidade de que uma amostra de 64 turistas apresente um gasto mdio entre US$
770,00 e US$ 825,00.
Soluo:
Considere a varivel X = gastos (em US$). Embora a distribuio de X no seja conhecida,
como o tamanho da amostra n = 64 bastante grande, podemos admitir que a mdia
amostral de X segue a distribuio Normal com parmetros:

80
X = = 800 e X =
=
= 10 .
n
64
Assim temos que

770 800
X
825 800

= P( 3,0 Z 2,5) =
P(770 X 825) = P

10
10

P(Z 3,0) P(Z 2,5) = 0,9938 0,0013 = 0,9925 .


456

Se considerarmos um grande nmero de amostras, cada uma com 64 turistas, em


aproximadamente 99,25% delas o gasto mdio estaria entre US$770,00 e US$825,00.

Ufa, entendi! Veja bem, de um modo geral, voc espera que o nmero
mdio de gomas de mascar por embalagem de uma amostra seja igual ao
nmero mdio de gomas de mascar por embalagens da populao. Em
nossa situao, o nmero mdio de gomas de mascar em cada
embalagem da populao 10 e, portanto, isso o que voc espera para
a amostra tambm!
Ento, como fazermos para achar a distribuio das propores amostrais?
Continuando com a populao de gomas de mascar: foi fornecida a proporo de gomas de
mascar vermelhas na populao, e podemos represent-la por p. Em outras palavras, p = 0,25
(25% das gomas de mascar so vermelhas).
Cada caixa jumbo de gomas de mascar , na verdade, uma amostra de gomas de mascar colhida
na populao. Cada caixa contm 100 gomas de mascar; logo o tamanho da amostra 100, e
ser representado por n.
Seja a varivel aleatria X = Nmero de gomas de mascar vermelhas na amostra, ento: X ~
Bin(n; p), onde n = 100 e p = 0,25. A proporo de gomas de mascar vermelhas da amostra
depende de X. Isso significa que a proporo em si uma varivel aleatria. Podemos representla por p , onde p = x / n .
No sabemos o nmero exato de gomas de mascar vermelhas na amostra,
mas sabemos sua distribuio.
H vrias amostras possveis com tamanho n que poderamos ter colhido. Cada amostra possvel
compreenderia n gomas de mascar e o nmero de gomas de mascar vermelhas em cada uma
delas seguiria e mesma distribuio. Para cada amostra, o nmero de gomas de mascar
vermelhas distribudo conforme Bin(n; p).
Podemos formar uma distribuio a partir de todas as propores amostrais usando todas as
amostras possveis. Isso chamado de distribuio amostral de propores.
3.2.2. Distribuio Amostral da Proporo
Se o parmetro de interesse p representa uma proporo (ou percentagem) de elementos
com certa caracterstica (atributo) na populao, ento chamamos a estatstica correspondente na
amostra de proporo amostral, denotando-a por:

p = x / n , onde x = No de elementos da amostra que possuem a caracterstica de interesse.

457

Pode-se mostrar que, sob certas condies, e se n suficientemente grande, a distribuio da


proporo amostral p aproximadamente Normal, com mdia E( p ) = p, e varincia V( p ) = p.q/n
onde q =(1 p). Dessa forma, temos que:

p.q e
p p
p N p,
Z=
N (0,1) .
n

p.q
n
No caso de uma populao finita de tamanho N e uma amostra sem reposio, recomenda-se o
uso do fator de correo populacional no clculo da varincia de p , sendo expressa por:
p.q N n
.
V( p ) =
n N 1
Exemplo 4.2: Suponha que de um grande lote de produo, 10% dos itens produzidos
apresentam algum tipo de defeito. Em uma amostra aleatria de tamanho 60, obtida do lote para
inspeo de qualidade, calcule a probabilidade de ter mais de 15% dos itens defeituosos.
Soluo:

p p 0,15 0,10

P( p > 0,15) = P
>
= P( Z > 1,29) = 1 0,9015 = 0,0985 .
p.q
0,1 0,9

60
n
Se considerarmos um grande nmero de amostras, cada uma contendo 60 itens, em
aproximadamente 9,85% das amostras a proporo de itens defeituosos seria superior a
15%.
Entendi! A distribuio amostral da proporo , na verdade, uma
distribuio de probabilidade formada pelas propores de todas as
amostras possveis de tamanho n. Se soubermos como so distribudas
as propores poderemos us-la para achar as probabilidades referentes
proporo de uma determinada amostra.

4. Avaliando o que foi construdo


Nesta unidade aprendemos como coletar e determinar o tamanho de uma amostra. Agora
j temos conhecimentos bsicos para estudarmos alguns conceitos sobre de estimao de
parmetros. Portanto, programe-se. Planeje seus estudos. J h muito o que estudar sobre
distribuies amostrais.

458

UNIDADE 5
INTERVALOS DE CONFIANA E TESTES DE HIPTESES

1. Situando a Temtica
Quando estudamos fenmenos probabilsticos estudamos tambm o comportamento de
alguns parmetros relacionados a este experimento. Tais parmetros, muitas vezes, so
impossveis de serem determinados restando-nos apenas tentar estim-los da melhor forma
possvel. Os procedimentos para tal estimao, juntamente com o fato de termos certeza que
estamos obtendo uma boa estimativa para o parmetro, ser abordado nessa unidade quando
estudaremos intervalos de confiana e testes de hiptese.

2. Problematizando a Temtica
Qual a altura mdia do povo brasileiro? Qual a proporo de pessoas com nvel superior
em Joo Pessoa? A resposta para essas perguntas no so to fceis, mas para respond-las
com exatido teramos que medir todos os cidados brasileiros ou verificar quantos habitantes em
Joo Pessoa possuem nvel superior, o que impossvel. No entanto se coletarmos uma amostra
e calcularmos a mdia e a proporo, respectivamente, ser que essas estimativas esto
prximas dos verdadeiros valores populacionais (parmetros)? Outra pergunta seria a seguinte:
Se a quantidade mdia de gua ingerida por um ser humano de 10 litros por semana, os
brasileiros bebem muito ou pouca gua? Como responderamos a esta questo? A resposta para
essas questes ser vista nessa unidade.
S VEZES, AS AMOSTRAS NO DO EXATAMENTE O RESULTADO CORRETO
Voc j viu como usar estimadores pontuais para estimar o valor exato da
mdia, varincia ou proporo da populao, mas a questo como ter
certeza de que sua estimativa est totalmente correta. Afinal de contas, suas
consideraes sobre a populao dependem de apenas uma amostra, e se
sua amostra fugir regra? Neste captulo, voc vai ver outra maneira de
estimar as estatsticas de uma populao, uma maneira que leva em
conta as incertezas. Pegue suas tabelas de probabilidade e vamos mostrarlhes cada detalhe dos intervalos de confiana.
O PROBLEMA DA PRECISO
Estimadores pontuais so a melhor estimativa que podemos dar para as estatsticas de uma
populao. Voc tomar uma amostra representativa dos dados e a usa para estimar estatsticas
importantes sobre a populao tais como: a mdia, a varincia e a proporo. O problema ao
deduzir estimadores pontuais que dependemos dos resultados de uma nica amostra para
obtermos uma estimativa bastante precisa.

459

Os estimadores pontuais so de grande valor, mas podem gerar pequenos erros. Como no
estamos trabalhando com a populao inteira, estamos apenas dando uma melhor estimativa. Se
a amostra que usamos for no-tendenciosa, provvel que a estimativa seja prxima ao
verdadeiro valor da populao. A questo at que ponto prximo prximo suficiente.
Em vez de dar um valor exato como estimativa para a mdia da populao, podemos especificar
alguns intervalos com uma estimativa. Por exemplo, poderamos dizer que esperamos que o
sabor da goma de mascar dure entre 55 e 65 minutos. Assim, continuamos tendo a impresso de
que o sabor dura por aproximadamente 1 hora, mas temos uma certa margem de erro.
A questo com achar esse intervalo? Tudo depende da confiana que voc deseja que seus
resultados tenham...

3. Conhecendo a Temtica
3.1. Estimao de Parmetros
H inmeras situaes reais em que se procura determinar valores para quantidades
desconhecidas como mdias e propores. Certamente, de interesse para muitos empresrios
saber a quantia mdia gasta por um turista em sua cidade; um produtor de televiso procura
sempre saber qual o ndice de audincia de determinados programas; um engenheiro de controle
de qualidade procura determinar a proporo de itens produzidos com defeito em uma linha de
produo.
A estimao consiste em determinar um valor amostral que substitua o respectivo valor real do
parmetro populacional desconhecido.
3.1.1. Conceitos Fundamentais
Para uma melhor compreenso dos temas mais importantes desta unidade, vamos definir
alguns conceitos fundamentais dentro da inferncia estatstica:

Estimador: uma funo matemtica que leva em considerao os dados amostrais.


Como tal funo calculada baseada em uma amostra, considerada uma varivel
aleatria, caracterizada por uma distribuio de probabilidade. Assim, X =

1 n
xi , onde
n i =1

x1, x2, ... , xn so n valores amostrais, um estimador que representa a mdia populacional
(parmetro).

Estimativa: um valor particular do estimador para uma dada amostra coletada. Assim,
por exemplo, para uma dada amostra, X = 3,9kg pode ser uma estimativa para o
verdadeiro peso mdio, desconhecido, de recm-nascidos do sexo feminino em certa
localidade.

Estimao por ponto (Estimao Pontual): Chamamos de estimao pontual quando, a


partir de uma amostra, um nico valor usado para estimar um parmetro desconhecido.
460

Um estimador pontual para um parmetro populacional , geralmente representado por


. Assim, X , S2, S e p so estimadores pontuais para os parmetros , 2, e p
respectivamente, isto , = X , 2 = S2, = S e p = p = x / n , onde x = no de elementos
da amostra que possuem certa caracterstica de interesse.
Quando achamos uma estimativa pontual, ela raramente coincide com o valor real do
parmetro. Uma desvantagem do uso de estimadores pontuais que, se nenhuma informao
adicional for dada, no h maneira de decidir o quo boa a estimativa, pois no temos nenhuma
idia da sua preciso. Um procedimento mais desejvel para estimao , ento, calcular um
intervalo que tenha uma probabilidade pr-estabelecida de conter o parmetro desconhecido.
A Estimao por intervalo ou Intervalos de Confiana um mtodo de estimao onde, a
partir de uma amostra aleatria, determinamos um intervalo [T1, T2] que contm o verdadeiro
parmetro com uma probabilidade conhecida (1 ), chamada de Grau ou Nvel de Confiana,
onde (alfa) a probabilidade do intervalo no conter o verdadeiro valor do parmetro
desconhecido. Assim, se amostras aleatrias, do mesmo tamanho, so obtidas repetidamente da
mesma populao, uma certa percentagem de intervalos (nvel de confiana) incluir o parmetro
populacional desconhecido. Alm disso, veremos que a partir das estimativas intervalares
possvel inferir sobre o quo confiveis so realmente as estimativas pontuais obtidas.
3.2. Intervalos de Confiana para Mdia Populacional
Um intervalo de confiana para uma mdia especifica um intervalo de valores dentro do
qual o parmetro populacional desconhecido, neste caso a mdia, pode estar. Estes intervalos
podem ser usados, por exemplo, por um fabricante que deseja estimar sua produo mdia diria
ou um pesquisador que deseja estimar o tempo de resposta mdia, por paciente, a uma nova
droga.
De modo geral, estamos interessados em encontrar um intervalo na forma

[T1 = X 0 ; T2 = X + 0 ] = [ X 0 ] ,
onde 0 representa a semi-amplitude do intervalo de confiana, sendo chamado de Erro de
Preciso em relao a . Portanto, o objetivo encontrar 0, tal que:

P (| X |< 0 ) = 1 , que equivalente a, P ( 0 < X < + 0 ) = 1 .


Note que essa afirmao probabilstica pode ser reescrita por:

P( X 0 < < X + 0 ) = 1 .
Em breve, entenderemos a necessidade destas duas ltimas afirmaes probabilsticas.

461

3.2.1. Intervalos de Confiana para Mdia Populacional Caso 01: 2 Conhecida


Suponha que temos uma amostra aleatria de tamanho n, X1, X2, ... , Xn, de uma
populao cuja distribuio normal com mdia e varincia 2. Ento:

X =

1 n
2
xi , apresenta distribuio: X N , e Z = X N (0,1) .

n i =1
n

Sejam (1 ) um nvel de confiana qualquer, 0 < (1 ) < 1. Temos que,

P( 0 < X < + 0 ) = 1

+ 0
0
P
<Z<
=1
/ n
/ n
0
0
<Z<
P
=1

/
n
n

P( Z / 2 < Z < + Z / 2 ) = 1
onde: Z / 2 =

/2

0
0
e Z / 2 =
.
/ n
/ n

(1 )

Z/2

Logo,

0 = Z / 2

/2

Z/2

A partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra (n)
quando 0, z e so conhecidos:


n = Z / 2
0

Como, P ( 0 < X < + 0 ) = 1 P ( X 0 < < X + 0 ) = 1 , temos que

< < X + Z / 2
P X Z / 2
=1 .
n
n

Em outras palavras, isso significa que a probabilidade de que o verdadeiro valor de pertena ao
intervalo com grau de confiana igual a (1 ) :

; X + Z / 2
IC[ ; (1 )] = X Z / 2
n
n

Exemplo 5.1: Para estimar gasto mdio semanal no supermercado A, coletou-se uma amostra
aleatria de 16 consumidores, obtendo-se um gasto mdio amostral de X = US$30,00. Supondo
uma distribuio normal para a populao, com desvio padro = US$2,60, obtido de outros

462

estudos similares, calcule um intervalo de 95% de confiana para estimar o gasto mdio semanal
populacional no supermercado A.
Soluo: Dados: = 2,6; n = 16 e X = 30. Para = 5% z/2 = P( Z z / 2 ) = 1,96.
Logo, o intervalo de confiana ser, ento expresso por:

IC [; 95%] = 30 1,96

2,6
= [30 1,27] = [28,73; 31,27].
16

Observao: No IC [; 95%] = [30 1,27], o valor 1,27 a estimativa do erro para a


estimativa. Em outras palavras, h 95% de probabilidade da estimativa no diferir do
verdadeiro valor da mdia () por mais de 1,27.
Dica: Abaixo, seguem os valores mais usados de Z/2 tal que P ( Z Z / 2 ) = 1 ( / 2) :

1%

5%

Z/2

2,57

1,96 1,64

10%

3.2.2. Intervalos de Confiana para Mdia Populacional

Caso 02: 2 NO Conhecida

Quando a varincia populacional desconhecida, adota-se como estimador de 2 a


varincia amostral (S2), expressa por:
n

S2 =

(X

X )2

i =1

n 1

Agora, a estatstica:

T=

X
~ t ( n 1) ,
S/ n

ter distribuio t-Student com (n 1) graus de liberdade, e no mais a distribuio normal


padro. No entanto, podemos re-escrever a estatstica T como funo da distribuio normal
padro (Z), da seguinte forma:

T=

X
X
=
=Z .

S
S
n
n

Logo,

t ( n 1, / 2 ) = Z / 2
Substituindo Z / 2 = t( n 1, / 2 )

Z / 2 = t ( n 1, / 2 )

no intervalo de confiana do Caso 01 teremos, quando a

varincia populacional 2 desconhecida, o intervalo de confiana que contm o verdadeiro


valor da mdia populacional com probabilidade (1 ), expresso por:

S
S

IC[ ; (1 )] = X t ( n 1, / 2 )
; X + t ( n 1, / 2 )
n
n

463

Logo,

0 = t( n 1, / 2 )

S
.
n

A partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra (n)
quando 0, Z e S so conhecidos.

S
n = t( n 1, / 2 )
0

Exemplo 5.2: Um fiscal de produtos alimentcios seleciona uma amostra aleatria de 16 pacotes
de lanche marca M nas prateleiras de um supermercado. Pesa o contedo de cada pacote,
encontrando um peso mdio X = 170 g e um desvio padro S = 5 g. O peso lquido indicado em
cada pacote 180 g. Verifique se um intervalo com 90% de confiana para o peso mdio lquido
verdadeiro abrange o peso lquido especificado na embalagem. Suponha distribuio normal para
a populao.
Soluo:
Dados: n = 16, X = 170 g e S = 5 g.
Para = 10% e n = 16 t( n 1; / 2 ) = t(15; 0, 05) = 1,753 , obtido da tabela da distribuio tStudent, pois a informao que dispomos no problema diz respeito ao desvio padro
amostral.
Logo, o intervalo de confiana para o peso mdio populacional ser denotado por:
IC [; 90%] = 170 1,753 5 = [170 2,19] = [167,81; 172,19].
16

Note que o IC no abrange o peso lquido indicado na embalagem de 180g.


Exemplo 5.3: Em uma amostra de n = 9 testes de consumo, um motor experimental percorreu,
respectivamente, 16, 14, 17, 15, 15, 14, 18, 17 e 18 km com l litro de gasolina (sob condies
especficas). Supondo distribuio normal para a populao, construa um intervalo de 99% de
confiana para a distncia mdia verdadeira do novo motor, com 1 litro de gasolina.
Soluo:
Seja X = quilmetros percorridos com 1 litro de gasolina.
Dados: n = 9, X = 16 km/l e S = 1,581 km/l.
Para = 1% e n = 9 t( n 1; / 2 ) = t(8; 0, 005) = 3,355 , obtido da tabela da distribuio tStudent.
Logo, o intervalo de confiana ser denotado por:
IC [; 99%] = 16 3,355 1,581 = [16 1,77] ou [14,23; 17,77] km/l de gasolina.
9

464

Assim, podemos afirmar que com 99% de confiana, o intervalo [14,23 km/l; 17,77km/l]
contm o verdadeiro valor para a distncia percorrida pelo novo motor (em quilmetros)
com um litro de gasolina.
Exemplo 5.4: Se um pesquisador sabe que uma populao tem distribuio normal com desvio
padro =12. Considerando um nvel de confiana de 95%, encontre o tamanho de amostra
necessrio para que a mdia amostral no se afaste em mais de 2 unidades do verdadeiro valor
da mdia populacional.
Soluo:
Em nosso problema, observamos que o desvio padro populacional conhecido. Neste
caso, usamos a expresso a seguir para o clculo do tamanho de amostra:
Dados: = 12, 0 = 2 e que = 5% Z/2 = 1,96. Dessa forma,
2


12
= 1,96 139.
n = z / 2
0
2

3.3. Intervalos de Confiana para uma Proporo Populacional p


Estes intervalos podem ser usados para, por exemplo, informar sobre a proporo de
alunos evadidos na UFPB, a proporo de itens defeituosos em uma linha de produo ou a
proporo de uma populao que imune a certa enfermidade.
Seja X uma varivel aleatria, representando o nmero de sucessos em n repeties
independentes de um experimento, com dois possveis resultados (sucesso e fracasso).
Considere P(Sucesso) = p e a P(Fracasso) = q = (1 p), constantes. Dessa forma, X Bin(n, p),
onde X = E(X) = np e 2 = Var(X) = np(1 p). Para p no muito prximo de 0 ou 1 e se n
suficientemente grande (um critrio usado na prtica, usar a aproximao quando np e np(1 p)
forem maiores do que 5) temos, segundo o Teorema Central do Limite, que:
X ~ N (np , np (1 p ) ) .
Logo, p = x ~ N p, p (1 p ) , visto que:

1
p(1 p) .
1
X 1
X 1
E ( p ) = E = E ( X ) = np = p e Var ( p ) = Var = 2 Var ( X ) = 2 np (1 p ) =
n
n
n
n n
n n
n

Assim, Z =

p p
p(1 p)
n

N (0,1) .

O intervalo que estamos procurando, da forma [ p 0 ] , ser obtido por um caminho


semelhante ao adotado no caso da mdia populacional chegando-se, facilmente, a,

0 = z / 2

p (1 p )
.
n

465

Note que a partir da expresso acima tambm podemos o tamanho da amostra (n) quando 0, Z
e p so conhecidos.
No entanto, na prtica p desconhecido, sendo substitudo pela proporo amostral p .
Tal substituio encontra justificativa no fato de que se n suficientemente grande para garantir a
aproximao para Normal, a estimativa deve ser razoavelmente prxima do valor real do
parmetro. Assim, o intervalo de confiana para p, ao nvel de confiana (1 ), dado por:

IC [ p; (1 )] = p z / 2

p (1 p )
; p + z / 2
n

p (1 p )

Exemplo 5.5: Para se avaliar a taxa de desemprego em uma cidade, coletou-se uma amostra
aleatria de 1000 habitantes em idade de trabalho e observou-se que 87 eram desempregados.
Estimar a percentagem de desempregados em toda a cidade (populao) atravs de um intervalo
de 95% de confiana.
Soluo:
Dados: n = 1000. A proporo amostral de desempregados dada por:
87
p =
= 0,087 . Logo, q = (1 p ) = 0,913. Para = 5% Z/2 = 1,96.
1000
O intervalo de confiana ser,
IC [p; 95%] =

(0,087 )(0,913)

0
,
087
1
,
96

= [0,087 0,0175] = [ 0,0695; 0,1045] ou,


1000

ainda, [6,95%; 10,45%].


Exemplo 5.6: Numa pesquisa de mercado, 57 das 150 pessoas entrevistadas preliminarmente
afirmaram que seriam compradoras de certo produto a ser lanado. Essa amostra suficiente
para estimar a proporo real de futuros compradores, com um erro de 4% e confiana de 95%?
Soluo:
Dados: p = 57 = 0,38 e q = (1 p ) = 0,62; 0 = 0,04; Z/2 = 1,96.
150
Logo, de modo a similar a mdia, o tamanho da amostra para proporo calculado a
partir da seguinte expresso:
2

z
1,96
n = / 2 p (1 p ) n =
(0,38)(0,62) 566 .
0,04
0
Como apenas 150 pessoas foram entrevistadas preliminarmente, a amostra no foi
suficiente. Sendo necessrio entrevistar mais (566 150) = 416 pessoas.

466

:: SAIBA MAIS... ::
NEM TUDO O QUE LHE DIZEM ABSOLUTAMENTE CERTO
O problema como saber quando o que lhe esto dizendo no certo. Testes de
hipteses so ferramentas que usam amostras para testar se provvel ou no que
afirmaes estatsticas sejam verdadeiras. Eles so uma forma de ponderar as
evidncias e testar se resultados extremos podem ser explicados por mera
coincidncia ou se existem foras ocultas em ao. Embarque nesse passeio no
prximo tpico e vamos mostrar como usar testes de hiptese para confirmar ou
descartar suas mais profundas suspeitas!

3.3. Testes de Hipteses


Na estimao de parmetros, foram apresentados procedimentos que permitem definir
estimadores pontuais ou por intervalos de parmetros populacionais. Outro procedimento de
inferncia estatstica o Teste de Hiptese tem como objetivo principal verificar, a partir de
informaes contidas em uma amostra aleatria, se hipteses a respeito de parmetros
populacionais so ou no verdadeiras. Assim podemos estar interessados em: verificar uma
especificao de qualidade de um produto, testar uma experincia de sucesso no passado, avaliar
uma teoria ou decidir sobre suposies resultantes das observaes. Logo, atravs dos testes de
hipteses podem-se eliminar, tanto quanto possvel, falsas concluses cientficas.
3.3.1. Conceitos Fundamentais
O Teste de Hiptese se baseia numa situao experimental (amostra) e consiste na
comparao de duas hipteses chamadas Hiptese Nula e Hiptese Alternativa.
Hiptese Nula (H0) uma afirmao sobre o parmetro, supostamente verdadeira, que vai
ser posta prova e na qual o teste montado. Em geral, formula-se H0 com o objetivo de rejeitla, isto , formulamos H0 contrria ao que suspeitamos que seja verdade. Por exemplo, se um
cientista acha que uma nova droga eficaz para certo tipo de paciente, ento, por contradio,
formulamos a hiptese H0 de que a nova droga no eficaz. Portanto, para provar que o cientista
est certo, H0 teria de ser rejeitada. Dessa forma, podemos pensar que o que estamos
interessados deve ser alocado em H1 (Hiptese Alternativa). Uma possvel representao : H0:
= 0, onde qualquer parmetro.
Hiptese Alternativa (H1) Hiptese que vai ser comparada hiptese nula, isto , uma
afirmao sobre o parmetro que afirma A hiptese nula H0 falsa.
Se usamos H0: = 0 para representar a hiptese nula, ento podemos usar as seguintes
representaes para as possveis hipteses alternativas:
H1: 0.
H1: < 0.
H1: > 0.

467

3.3.2. Definio da Regra de Deciso, Erros e Nvel de Significncia


Quando testamos hipteses estatsticas, qualquer que seja a deciso tomada, estamos
sujeitos a cometer dois possveis tipos de erros:
Erro do Tipo I: Quando se rejeita a hiptese nula H0 e a mesma verdadeira.
Denotamos por a probabilidade de cometer este erro, isto ,
= P(Erro Tipo I) = P(Rejeitar H0 | H0 verdadeira).
O erro tipo I () tambm conhecido como nvel de significncia de um teste de
hipteses.
Erro do Tipo II: No se rejeita a hiptese nula H0, quando a mesma falsa.
Denotamos por a probabilidade de cometer este erro, isto ,
= P(Erro Tipo II) = P(No rejeitar H0 | H0 falsa).
O quadro abaixo resume as possibilidades das decises envolvidas em um teste de hiptese, com
as probabilidades de ocorrncias dos erros tipo I () e II ().
Quadro 1: Avaliao das Decises em um Teste de Hipteses
Situao Real
Deciso
H0 Falsa
H0 Verdadeira
No Rejeitar H0
Rejeitar H0

Deciso Correta
Erro do Tipo I ()

Erro do Tipo II ()
Deciso Correta

Devido as dificuldades de se conseguir minimizar os dois tipos de erros ao mesmo tempo,


em geral, nos preocupamos mais na possibilidade de rejeitar uma hiptese sendo ela verdadeira.
Dessa forma, teremos uma maior ateno no controle do erro do tipo I. Por exemplo, se definimos
as hipteses:
H0: Uma nova droga no eficaz para certos pacientes;
H1: Uma nova droga eficaz para certos pacientes.
A aceitao de H0, sendo esta hiptese falsa, possibilita a busca de outros
meios de tratamentos, enquanto que a rejeio de H0, sendo esta verdadeira,
exclui a possibilidade de se prosseguir com outras opes para os pacientes.
Logo, desejvel exercer um controle sobre e mant-lo pequeno. Dessa
forma, os testes de hipteses podem ser montados de maneira que, fixado o
erro do tipo I, o erro do tipo II seja minimizado aumentando-se o tamanho da
amostra.
Observao: O significado de usado nos Testes de Hipteses totalmente diferente de seu
significado na Estimao por Intervalos. Nos Testes de Hipteses, representa a probabilidade
de rejeitar uma hiptese nula suposta verdadeira, enquanto que na Estimao por Intervalos
representa a probabilidade de que os limites de confiana construdos no contenham o
verdadeiro valor do parmetro.

468

Estatstica do Teste
A deciso de rejeitar ou no a hiptese nula (H0) baseada nos dados amostrais, que so
usados para calcular o valor da Estatstica de Teste e que servir de referncia para a tomada da
deciso. Para isso, divide-se a curva da distribuio amostral da estatstica em duas regies, uma
chamada Regio Crtica (ou Regio de Rejeio de H0), e a outra Regio de No Rejeio de
H0. Temos, ento, a seguinte Regra de Deciso do teste:
Se o valor calculado da estatstica do teste pertencer regio
crtica, rejeita-se H0 em favor da hiptese alternativa; caso
contrrio, H0 no ser rejeitada em relao hiptese alternativa.
Outras definies importantes, necessrias na formulao de um problema de Testes de
Hipteses so:

Regio Crtica do Teste: a regio de rejeio de H0, isto , o conjunto de valores de


uma estatstica que determina a rejeio de H0. Rejeitamos a hiptese nula se a
estatstica de teste est na regio crtica, porque isto indica uma discrepncia
significativa entre a hiptese nula e os dados amostrais.
Valor Crtico do Teste: o valor, ou valores, que separa(m) a regio crtica (que
levam a estatstica do teste a rejeitar a hiptese nula) da regio de no rejeio de H0.

Dependendo da hiptese alternativa, temos os seguintes Tipos de Testes de Hipteses:

Teste Unilateral: Quando a regio crtica do teste localizada completamente em uma


das extremidades da curva da distribuio amostral da estatstica do teste.
o Teste Unilateral Esquerda: A regio crtica (sombreada) localiza-se no
extremo esquerdo da distribuio.
Hipteses: H0: = 0 versus H1: < 0
o Teste Unilateral Direita: A regio crtica (sombreada) localiza-se no extremo
direito da distribuio.
Hipteses: H0: = 0 versus H1: > 0
Teste Bilateral: A regio crtica (sombreada) localiza-se nas duas extremidades da
distribuio.
Hipteses: H0: = 0 versus H1: 0

A escolha entre usar um teste unilateral e um teste bilateral determinada pelos objetivos do
problema, no qual se deseja verificar uma afirmao a cerca do parmetro populacional.
3.3.3. Fases na Realizao de um Teste de Hipteses
Formular as hipteses nula (H0) e alternativa (H1);
Esta a afirmao que vamos testar.
Decidir qual estatstica de teste ser usada para julgar a hiptese nula;
469

Precisamos escolher a melhor estatstica que sirva para testar a afirmao.


Fixar o nvel de significncia ;
Precisamos fixar um nvel de significncia que seja pequeno.
Determinar a regio crtica;
Precisamos de um determinado nvel de certeza.
Usar os valores amostrais para calcular o valor da estatstica citada na fase 2;
Precisamos saber a raridade dos resultados, considerando que as afirmaes sejam verdadeiras.
Se o valor citado na fase anterior pertencer regio crtica, rejeitar H0. Caso contrrio, no
rejeitar H0.
Em seguida, vemos se ele est dentro dos limites de certeza, de modo a tomar a deciso.
3.3.4. Teste de Hipteses para a Mdia Populacional

Caso 01: 2 Conhecida

O primeiro passo num Teste de Hipteses consiste em formular a hiptese a ser testada.
No Quadro 1, podemos observar que para cada possvel hiptese existe uma regio crtica e regra
de deciso associada. No caso do teste de hipteses para mdia populacional, supondo a
varincia populacional conhecida, utilizamos a seguinte estatstica do teste:

ZC =

X 0

Note que a estatstica calculada com base nas informaes contidas na amostra.
O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir,
apresentamos os valores mais usados para Z e Z/2.

1%

5%

10%

Z
Z/2

2,33
2,57

1,64
1,96

1,28
1,64

470

Quadro 2: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia Populacional,
considerando 2 conhecido.

Hipteses

Regio Crtica
(sombreada)

Regra de Deciso
(Rejeitar H0)

H0: = 0
H1: 0

Zc -Z/2 ou Zc Z/2

H0: = 0 (*)
H1: < 0

Zc -Z

H0: = 0 (**)
H1: > 0

Z c Z

(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.
(**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no conhecimento
de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.

Exemplo 5.7: O gerente de uma indstria de carnes enlatadas tem estabelecido a seguinte
especificao: um novilho com 12 meses de vida resulta numa mdia de 250 kg de carne. A
experincia passada indica que, mesmo com uma mudana na mdia, o desvio padro permanece
ligeiramente constante, em = 18 kg. Para determinar se a especificao est sendo observada, o
gerente seleciona uma amostra aleatria com 100 novilhos e obteve uma mdia X = 253 kg de carne.
Realize um teste de hiptese para verificar se houve mudana na especificao, a um nvel de
significncia de 5%.

471

Soluo:
H0: = 250 kg versus H1: 250 kg (a especificao no est sendo observada)
Temos que = 18 kg; n = 100, X = 253 kg. Como conhecido vamos fazer uso da
varivel Normal, Z.
= 5%.
Dessa forma, a estatstica do teste dada:
2,5%

1,96

95%

Zc =

2,5%

253 250
= 1,67
18
100

Ateno: Como o teste bilateral, o valor


crtico ao nvel = 5% ser Z/2 = 1,96.

0
1,96
1,67

Deciso: Como Z/2 < Zc < Z/2 No existem evidncias para rejeitar H0. Logo, com
base nos dados amostrais e com 5% de significncia no podemos rejeitar a hiptese H0, ou
seja, no existe evidncia para afirmar que a especificao est sendo violada.
Caso 02: 2 NO Conhecida

3.3.5. Teste de Hipteses para a Mdia Populacional

Quando a varincia populacional (2) desconhecida, precisamos estim-la a partir das


informaes contidas na amostra, atravs da expresso
n

S2 =

(X

X )2

i =1

n 1

Dessa forma, a estatstica do teste para mdia populacional quando 2 desconhecida ser
expressa por:

TC =

X 0
S

, que segue uma distribuio t-Student com (n 1) graus de liberdade.

O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir, apresentamos as
regies crticas e regras de deciso para as respectivas hipteses.

472

Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia
Populacional, considerando 2 desconhecido.
Hipteses

Regio Crtica
(sombreada)

Regra de Deciso
(Rejeitar H0)

H0: = 0
H1: 0

Tc -t(n-1,/2) ou
Tc t(n-1,/2)

H0: = 0 (*)
H1: < 0

Tc -t(n-1,)

H0: = 0 (**)
H1: > 0

Tc t(n-1,)

(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.
(**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.

Exemplo 5.8: O tempo mdio necessrio para completar uma tarefa era de 15 minutos. Obtm-se
uma amostra aleatria de nove indivduos e, durante o perodo de teste, seus tempos (X) para
concluir a tarefa foram 11, 12, 15, 10, 12, 14, 15, 13 e 15. Assumindo que estes dados vm de
uma distribuio normal, teste a hiptese de que houve alterao no tempo mdio para completar
a tarefa. Use um nvel de 5% de significncia.

473

Soluo:
H0: = 15min versus H1: 15min (houve alterao no tempo mdio)
Com base nas informaes amostrais, temos que n = 9; X = 13min e S = 1,871 min.
Como o desvio-padro da populao desconhecido, , a varivel usada para a estatstica
de teste a t-Student com (n 1) graus de liberdade.

= 5%. Sendo n = 9, ser t(n 1; /2) = t(8; 0,025) = 2,306 (obtido da tabela da distribuio tStudent).
Dessa forma, a estatstica do teste dada:
2,5%

95%

Tc =

2,5%

13 15
= 3,207
1,871
9

Deciso: Como Tc < tn-1;/2, existem evidncias


3,207
para rejeitar H0. Logo, com base nos dados
amostrais e com 5% de significncia, rejeita-se a hiptese H0, ou seja, existem evidncias
para afirmar que os indivduos apresentaram um tempo mdio para executar a tarefa
diferente do que era observado anteriormente.
2,306

2,306

3.3.6. Teste de Hipteses para a uma Proporo Populacional p


Ao se fazer inferncias sobre uma proporo populacional, p, tomamos nossas com base
nas evidncias sobre seu valor amostral, p , de elementos com a caracterstica de interesse.
Pelo Teorema Central do Limite, sabe-se que, para n suficientemente grande, a proporo
amostral, p = x segue, aproximadamente, uma distribuio p ~ N p, p (1 p ) .
n
n

Dessa forma, sob a hiptese H0: p = p0, a estatstica do teste para a proporo
populacional p ser expressa por:
p p0
ZC =
p0 (1 p0 )
n
ZC ~ N(0; 1). Aps fixar o nvel de significncia do teste (), apresentamos a seguir as regies
crticas e regras de deciso para as respectivas hipteses.

474

Quadro 4: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Proporo
Populacional p.

Hipteses

Regio Crtica
(sombreada)

Regra de Deciso
(Rejeitar H0)

H0: p = p0
H1: p p0

Zc -Z/2 ou Zc Z/2

H0: p = p0 (*)
H1: p < p0

Zc -Z

H0: p = p0 (**)
H1: p > p0

Zc Z

(*) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: p = p0.
(**) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: p = p0.
Exemplo 5.9: Afirma-se que em um alqueire de mas, 10% esto estragadas. De uma amostra
aleatria de 150 mas examinadas, 30 estavam estragadas. O que voc conclui sobre a
proporo de mas estragadas em um alqueire a um nvel de 5% de significncia?

475

Soluo:
H0: p = 0,10 versus H1: p 0,10.
Com base nas informaes amostrais, temos que n = 150 e p = 30/150 = 0,20. No caso
da proporo use a varivel Z.
= 5%.
2,5%

1,96

Dessa forma, a estatstica do teste :


95%

2,5%

Zc =

1,96
4,08

0,2 0,1
= 4,08
( 0,1).( 0,9 )
150

Ateno: Como o teste bilateral o valor


crtico ao nvel = 5% ser Z/2 = 1,96.

Deciso: Como ZC > Z/2 Existem evidncias para rejeitar H0. Logo, com base nos
dados amostrais e ao nvel de 5% de significncia, podemos concluir que a porcentagem de
mas estragadas diferente de 10%.
Exemplo 5.10: De registros de vendas passadas sabe-se que 30% dos consumidores compram a
pasta dental C. Uma nova propaganda desse produto feita e, para testar sua eficcia, de uma
amostra aleatria de 1000 consumidores que viram a propaganda, 334 responderam que
compram a pasta dental C. Isso indica que a nova propaganda foi bem sucedida? Use um nvel de
5% de significncia para testar se a nova propaganda aumentou a proporo de consumidores da
pasta dental C.
Soluo:
H0: p = 0,30 versus H1: p > 0,30 (a nova propaganda aumentou as vendas da pasta C).
Com base nas informaes amostrais, temos que n = 1000 e p = 334/1000 = 0,334. No
caso da proporo use a varivel Z.

= 5%.

Dessa forma, a estatstica do teste dada:


95%

5%

1,64

Zc =

0,334 0,300
= 2,35
( 0,3).( 0,7 )
1000

Ateno: Como o teste unilateral, o valor


2,35
crtico ao nvel = 5% ser Z = 1, 64.

Deciso: Como ZC > Z Existem evidncias para rejeitar H0. Logo, com base nos dados
amostrais e ao nvel de 5% de significncia, podemos concluir a nova propaganda aumentou
a proporo de consumidores que compram a pasta dental C.

476

4. Avaliando o que foi construdo


Ao final desta unidade aprendemos duas importantes tcnicas inferenciais: intervalos de
confiana e testes de hipteses. Ambas podem ser aplicadas no processo de tomada de deciso
em inmeros problemas prticos. Pratique tais conceitos resolvendo os exerccios propostos no
MOODLE. Finalizamos essa viagem pelos Mtodos Estatsticos.

REFERNCIAS
COSTA NETO, P.L., Estatstica, Edgard Blucher, So Paulo, 1977.
FONSECA, J.S., MARTINS, G.A. & TOLEDO, G.L., Estatstica Aplicada, Editora Atlas, 2
ed., So Paulo, 1985.
GRIFFITHS, D. Use a Cabea. Estatstica, Editora Alta Books, Rio de Janeiro, 2009.
MEYER, P.L., Probabilidade: Aplicaes Estatstica, Livros Tcnicos e Cientficos,
Editora AS, Rio de Janeiro, 1983.
TRIOLA, M.F, Introduo Estatstica, Livros Tcnicos e Cientficos, 7 ed,, Rio de
Janeiro, 1999.
VIEIRA, S. Introduo Bioestatstica, Editora Campus, 1999.

477

You might also like