You are on page 1of 47

BIOESTATSTICA

Fisioterapia

A estatstica nada mais que o bom senso expresso em nmeros.


Pierre Simon, matemtico francs do sculoXVIII

1
BIOESTATSTICA
A bioestatstica a aplicao de estatstica ao campo biolgico e mdico. Ela essencial ao
planejamento, coleta, avaliao e interpretao de todos os dados obtidos em pesquisa na rea
biolgica e mdica. fundamental epidemiologia, ecologia, psicologia social e medicina
baseada em evidncia. A estatstica forma uma ferramenta chave nos negcios e na industrializao
como um todo. utilizada a fim de entender sistemas variveis, controle de processos, custos
financeiros e de qualidade e para sumarizao de dados e tambm tomada de deciso baseada em
dados. Nessas funes ela uma ferramenta chave e a nica ferramenta segura. (Wikipdia, 2014)

1 CONCEITOS FUNDAMENTAIS
A estatstica um conjunto de mtodos e processos matemticos desenvolvidos para a
coleta, classificao, apresentao, anlise e a interpretao de dados qualitativos e quantitativos,
possibilitando a tomada de decises acertadas, face s incertezas.

Estatstica descritiva
a parte da estatstica que se preocupa com a coleta, descrio e apresentao dos dados
observados, porm, sem tirar concluses mais genricas.
Exemplo: Tabelas, Grficos, mdias, mediana, desvio padro...

Estatstica inferencial ou indutiva


a parte que, baseando-se em resultados obtidos de uma amostra, procura inferir ou tirar,
concluses para o comportamento da populao, dando a preciso dos resultados e com que
probabilidade pode se confiar neles.
Exemplo: Muitas firmas mantm milhares de itens em estoque. Utilizando tcnicas de amostragem,
pode-se estimar o valor do inventrio, sem proceder contagem dos itens um a um.

Para realizar uma pesquisa que leve a fazer afirmaes sobre a populao de interesse
necessrio seguir os seguintes passos:
1. Planejamento
2. Execuo (coleta de dados)
3. Processamento de dados (banco de dados)
4. Anlise de dados
5. Interpretao, apresentao e publicao de resultados

2
1.1 POPULAO E AMOSTRA
Ao se coletar dados sobre as caractersticas de um conjunto de elementos, como por
exemplo, os brinquedos produzidos por uma indstria, os carros que passam por um determinado
farol ou as preferncias da populao sobre candidatos a uma determinada eleio, nem sempre
possvel considerar todos os elementos, ou seja, toda a populao ou universo. Considera-se, ento,
apenas uma pequena parte do todo, chamada amostra. No caso da eleio, a populao formada
por todos os cidados com direito a voto e a amostra formada pelos eleitores que sero
entrevistados.
Para se coletar uma amostra preciso usar tcnicas eficientes denominadas Tcnicas de
Amostragem que veremos mais adiante.

Definio 1: Populao: Populao estatstica a coleo completa e total dos elementos (pessoas,
medidas, itens, etc.) a serem considerados em um estudo estatstico.

Definio 2: Amostra: um subconjunto de uma populao, que dever apresentar as caractersticas


da mesma.

1.2VARIVEL
Conjunto de resultados possveis de um fenmeno, que vem a depender dos dados coletados.

Varivel qualitativa nominal


Qualitativa qualidade, nominal classificao, smbolo
No permitem classificaes. Como exemplo de varivel nominal pode-se apresentar o
gnero do indivduo, seu prprio nome, cor de pele, tipo de sangue,...etc. No possvel estabelecer
uma gradao, definindo qual o mais importante: masculino ou feminino, Joo ou Maria.

Varivel qualitativa ordinal


Ordinal ordem, relao
Permitem comparaes. Como exemplo de variveis ordinais pode-se apresentar a atribuio
do status alto, mdio ou baixo para um indivduo, escalas de intensidade: grau de escolaridade
0,1,2,3 e 4.

Varivel quantitativa discreta


Quantitativa quantidade
So aquelas resultantes de contagens e apresentadas sob a forma de nmeros inteiros.
Exemplos: nmeros de filhos de um casal, quantidades de vos feitos por uma aeronave.

Varivel quantitativa contnua


So aquelas que podem assumir qualquer valor em determinado intervalo. Exemplo: peso,
comprimento, altura e outras.

importante destacar que nem toda varivel expressa sob a forma de nmeros uma
varivel quantitativa. Exemplo: um pesquisador poderia atribuir os cdigos numricos 1
e 2 para representar homens e mulheres, assim, mesmo sob a forma de nmeros uma
varivel qualitativa.

3
1.3 ARREDONDAMENTO

De acordo com a resoluo 886/66 da Fundao IBGE, o arredondamento feito da seguinte


maneira:
Quando o primeiro algarismo aps aquele que vamos arredondar for de 0 a 4, conservamos o
algarismo a ser arredondado e desprezamos os seguintes.
Exemplo: 53,245 = 53,2; 21,438 = 21,4; 7,348456 = 7,348

Quando o primeiro algarismo aps aquele que vamos arredondar for de 6 a 9, aumentamos
uma unidade no algarismo a ser arredondado e desprezamos os seguintes.
Exemplo:42,78 = 42,8; 25,08 = 25,1; 1,2683 = 1,27

Quando o primeiro algarismo aps aquele que vamos arredondar for 5, seguido de apenas
zeros, conservamos o algarismo se ele for par ou aumentamos numa unidade se ele for
mpar, desprezando os seguintes.
Exemplo:6,250 = 6,2; 6,350 = 6,4

OBS: Se o 5 for seguido de outros algarismos dos quais, pelo menos um diferente de zero,
aumentamos uma unidade no algarismo e desprezamos os seguintes.
Exemplo: 8,3502 = 8,4; 8,4523 = 8,5

Arredondamento por falta ou excesso: E ainda, quando, ao arredondarmos uma srie de parcelas,
a soma ficar alterada, devemos fazer um novo arredondamento (por falta ou excesso), na maior
parcela do conjunto, de modo que a soma fique inalterada.
Exemplo: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100%
Arredondando para inteiro temos: 17% + 18% + 12% + 30% + 22% = 99%
Ficamos com: 17% + 18% + 12% + 31% + 22% = 100%

4
EXERCCIOS:
1 Um questionrio foi aplicado aos alunos do primeiro ano de uma escola fornecendo as seguintes
informaes:
ID: Identificao do aluno;
Turma: Turma a que o aluno foi alocado (A ou B);
Sexo: Feminino (F) ou Masculino (M);
Idade: Idade;
Alt: Altura;
Peso: Peso;
Filh: Nmero de filhos na famlia;
Fuma: Hbito de fumar (sim ou no);
Toler: Tolerncia ao cigarro: (I) Indiferente,(P) Incomoda Pouco e (M) Incomoda Muito;
Exer: Horas de atividade fsica, por semana;
Cine: Nmero de vezes que vai ao cinema por semana;
OpCine: Opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa
TV: Horas gastas assistindo TV, por semana
OpTV: Opinio da programao na TV: (R) Ruim, (M) Mdia, (B) Boa e (N) no sabe.

2 Em uma pesquisa com seres humanos, um cientista social pensou em fazer as perguntas
relacionadas a seguir. Classifique as variveis formadas a partir das respostas fornecidas s
perguntas em quantitativas (discreta ou contnua) ou qualitativas (nominal ou ordinal).
a)Qual seu nome? ____________________
b)Qual sua idade em anos? ____________________
c)Qual seu gnero? [1] Masculino ( ) [2] Feminino ( ) ____________________
d)Qual o seu CPF? ____.____.____-___ ____________________
e)Em que cidade voc nasceu? ____________________
f)quantos filhos voc tem?
g)Qual a sua renda familiar em R$: ____________________
h)Classifique as seguintes afirmaes: O presidente da repblica atual est desempenhando bem as
suas funes:
[1] Concordo totalmente [2] Concordo parcialmente [3] discordo totalmente _________________

3 Escreva cada nmero com arredondamento para dcimos:


35,32216 = 35,3 456,541 =__________ 0,0832 =_________ 5,5557 =_______

65,39 =_________ 351,567 =__________ 769,014 =_________ 12,468 =_______

13,61 =_________ 2.303,8714 =_________ 100,9999 = _________1,309 =________

23,585 =_________ 171,29401 =_________ 42,876 =_________ 103,424 =______

5
4 Escreva cada nmero com arredondamento para unidade:

35,92216 = 36 456,541 =__________ 0,0832 =_________ 5,5557 =_______

65,39 =_________ 351,567 =__________ 769,014 =_________ 12,468 =_______

13,61 =_________ 2.303,8714 =__________ 100,9999 = _________1,309 =________

23,585 =_________ 171,29401 =__________ 42,876 =_________ 103,524 =______

5 Ligue as variveis abaixo com sua possvel populao de interesse:

Variveis Populao
a-) cor dos olhos 1-) aparelhos produzidos por uma linha de montagem
b-) precipitao pluviomtrica, (1 ano) 2-) seguimentos de reta
c-) nmero de aes negociadas 3-) casais residentes em uma cidade
d-) salrios 4-) funcionrios de uma empresa
e-) tamanho 5-) estao meteorolgica de uma cidade
f-) sexo dos filhos 6-) alunos de uma escola
g-) produo de algodo 7-) bolsa de valores de uma escola
h-) comprimento 8-) pregos produzidos por uma mquina
i-) nmero de volumes 9-) propriedades agrcolas do Brasil
j-) nmero de defeitos por unidade 10-) bibliotecas da cidade de So Paulo

6 Para as situaes descritas a seguir, identifique a populao e a amostra correspondente.


a)Para avaliar a eficcia de uma campanha de vacinao no Estado de So Paulo, mes de recm-
nascidos durante o primeiro semestre de 2005, foram perguntadas a respeito da ltima vez que
vacinaram seus filhos;

b)Para verificar a audincia de um programa de TV no Brasil, indivduos foram entrevistados com


relao ao canal em que estavam sintonizados;

c)A fim de avaliar a inteno de voto para presidente do Brasil, pessoas foram entrevistadas em
cidades brasileiras.

ESTATSTICA DESCRITIVA
Os mtodos estatsticos envolvem a anlise e a interpretao de nmeros, tais como renda
anual, vendas mensais, escores de testes, nmeros de peas defeituosas, percentagem de respostas
favorveis a um questionrio, vida ativa, etc. Tais nmeros so designados por dados. Para
interpretar os dados corretamente, em geral preciso primeiro organizar e sumarizar os nmeros.
Deste modo, convm lembr-lo de que o processo de descrio de dados tambm prepara o caminho
para anlise adicional sob forma de inferncias a respeito de uma populao.

6
2 APRESENTAO TABULAR
Aps apurao, h necessidade dos dados serem dispostos de uma forma ordenada e
resumida, a fim de auxiliar o pesquisador na sua anlise e facilitar os resultados e as concluses
apresentadas ao leitor. Os dados e os resultados so ento apresentados na forma de tabelas
estatsticas. Estes, devem ter significado prprio, de modo a prescindir, quando isoladas, de
consultas ao texto.
Uma tabela estatstica deve conter o nmero, o ttulo, o corpo e o rodap (fonte, notas e
notas especficas). A elaborao de tabelas deve obedecer s normas editadas pelo Instituto
Brasileiro de Geografia e Estatstica IBGE.

a) Nmero o componente usado para identificar uma tabela no texto ou em anexos.


Determinado de acordo com a ordem em que a tabela aparece no texto, o nmero, deve ser
sempre precedido da palavra tabela.
b) Ttulo a indicao que, precedendo a tabela, colocado na parte superior da mesma. Deve
ser preciso, claro e conciso, indicando a natureza do caso estudado, (o que?), as variveis
escolhidas na anlise do fato (como?), o local (onde?) e a poca (quando?) em que o mesmo
foi observado.
c) Corpo da tabela a parte que contm o cabealho, a coluna indicadora, o conjunto de linhas
e colunas que contm os dados e informaes (casos) e os traos que delimitam o cabealho
e a finalizao da tabela.
d) Fonte o indicativo, no rodap da tabela, da entidade responsvel pela sua organizao e
fornecedora dos dados primrios.
e) Notas so colocadas no rodap da tabela para esclarecimento de ordem geral, podendo ou
no serem enumeradas.
f) Notas especficas (chamadas), tambm colocadas no rodap, servem para esclarecer
mincias em relao s casas, colunas ou linhas, sendo enumeradas em algarismos arbicos.

3 DISTRIBUIO DE FREQUNCIA

Uma distribuio de freqncia uma tabela que rene o conjunto de dados, conforme as
freqncias, ou as repeties de seus valores. Esta tabela pode representar os dados em classes ou
no, de acordo com a classificao dos dados em discretos e contnuos.

Representao Variveis Discretas


7
Neste caso, representa-se as observaes numa tabela de freqncia, no agrupados em
classes, designados de sries de magnitude por ponto. til quando a srie apresenta poucos
valores distintos.
Exemplo:As idades de um grupo de alunos so representadas por: 17,17,17,18,18,20,21,21.
Note que as idades, 17,18,20 e 21 aparecem de forma repetida, 3,2,1 e 2 vezes, respectivamente.
Sendo assim, uma maneira mais fcil de representar os dados seria atravs de uma tabela de
freqncia:
Idade Fi Fi% Fac
17 3
18 2
20 1
21 2
Total 8

Representao Variveis Contnuas


Neste caso, utiliza-se tambm a tabela de freqncias, mas sob a forma de intervalos, mesmo
que isto sacrifique algum detalhe na ordenao de valores individuais. til quando a srie
apresenta muitos valores distintos.

1 Dados brutos:
So os valores originais conforme eles foram coletados, no estando ainda prontos para anlise,
pois esto numericamente organizados ou tabelados.
Exemplo:
Pesos de um grupo de estudantes:
60,40,49,49,50,50,81,51,52,52,77,52,52,54,59,60,60,36,60,61,74,61,62,62,63,64,64,65,87,65,65,67,
68,77,61,81,61,83,90,49.

2 Rol:
uma lista, onde as observaes so dispostas em uma determinada ordem: crescente ou
decrescente. O objetivo da ordenao tornar possvel a visualizao das variaes ocorridas, uma
vez que os valores extremos so percebidos de imediato, e tambm facilitar a construo da
distribuio de freqncias.
Assim, ordenando os dados anteriores, temos:
36,40,49,49,49,50,50,51,52,52,52,52,54,59,60,60,60,60,61,61,61,61,62,62,63,64,64,65,65,65,67,68,
74,77,77,81,81,83,87,90.

3 Classe:
A determinao do nmero de classes, representado pela letra K, depende, fundamentalmente,
do nmero de elementos, estudados, representado pela letra n.
- Se n > 25: o nmero de classes de freqncia pode ser obtido mediante dois procedimentos
distintos: = ou = 1 + 3,22. () (frmula de Sturges).

4 Amplitude total ou Range (R):


a diferena entre o maior e o menor valor observado d varivel em estudo:
=
5 Amplitude da classe (h):
Como sero criadas 6 classes de freqncia, a amplitude h de cada classe ser igual a:
=

8
Classes Fi Fac Fi%

EXEMPLO
1 A tabela abaixo apresenta os coeficientes de liquidez obtidos da anlise de balano em 50
indstrias:
0,4 2,6 3,3 4,5 5,3 6,9 7,9 9,2 11,6 15,6
0,8 2,7 3,8 4,5 5,5 7,1 8,4 9,5 11,8 16,0
2,3 2,7 3,9 4,6 5,6 7,4 8,5 10,0 12,4 16,2
2,3 2,9 4,4 4,8 6,3 7,5 8,7 10,5 12,9 17,8
2,4 3,2 4,4 5,0 6,3 7,6 9,0 10,6 13,1 18,8
Forme com estes dados uma distribuio de freqncia e conclua.

9
ATIVIDADES
1Construa uma tabela de distribuio de freqncia sobre os dados referentes a safra atual em
(alqueire/ rvore) para 40 Pessegueiros em uma determinada regio de Erechim.
3,2 3,5 4,4 4,7 6 6,1 7,4 7,8 8,1 9,2 10,0 10,7 11,1 11,2
12,2 12,5 12,6 12,9 13,7 14,5 14,8 15,1 15,8 16,0 16,2 16,4 16,4 18,2
18,5 19,1 19,1 21,0 22,3 22,6 23,5 25,0 26,2 27,5 32,4 32,8

2 Tempo de atendimento (min.) aos clientes por um vendedor de uma loja de materiais de
construo. Construa uma tabela de distribuio de freqncia e conclua.
0,5 0,7 0,8 1,0 1,1 1,2 1,3 1,3 1,3 1,4 1,4 1,6 1,6 1,7 1,8 1,9 2,1 2,5 3,1 3,5

3 Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 5, 6, 6, 3.
a)construir a distribuio de freqncia;
b)determinar as freqncias relativas;
c)qual a porcentagem de elementos maiores que 5.

4 A tabela abaixo apresenta uma distribuio de freqncia das reas de 400 lotes:
rea m2 Nm lotes
300 400 14
400 500 46
500 600 58
600 700 76
700 800 68
800 900 62
900 1000 48
1000 1100 22
1100 1200 6
Soma
Com referncia a essa tabela, determine:
a)a amplitude total;
b)o limite superior da quinta classe;
c)o limite inferior da oitava classe;
d) o ponto mdio da stima classe;
10
e)a amplitude do intervalo da segunda classe;
f)a freqncia da quarta classe;
g)a freqncia relativa da sexta classe;
h)a freqncia acumulada da quinta classe;
i) o nmero de lotes cuja rea no atinge 700 m2;
j) o nmero de lotes cuja rea atinge e ultrapassa 800 m2;

5 A tabela seguinte apresenta os salrios pagos a um grupo de administradores de empresas em $


mil.
Classe Fi
2,752,80 2
2,802,85 3
2,852,90 10
2,902,95 11
2,953,00 24
3,003,05 14
3,053,10 9
3,103,15 8
3,153,20 6
3,203,25 3
Soma 90
Com base nos valores apresentados, encontre:
a) freqncia simples da quinta classe;
b)soma das freqncias;
c) o limite inferior da sexta classe;
d) o limite superior da quarta classe;
e) a amplitude de cada classe;
f)a amplitude total;
g)o ponto mdio da terceira classe;
h)o nmero de classes;
i)a freqncia cumulativa simples at a sexta classe;
j)a porcentagem de valores iguais ou maiores que 3,2.

6 Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 5, 6, 6, 3.
a)construir a distribuio de freqncia;
b)determinar as freqncias relativas;
c)determinar as freqncias acumuladas;
d)qual a amplitude amostral;
e)qual a porcentagem de elementos maiores que 5.

7 Complete os dados que faltam:


Valores Fi Fac Fi%
1 4 8
2 4
3 16
4 7 14
5 5 28
6 38
7 7 45 14
8
Soma 50

11
3. 1 CLASSIFICAO DAS SRIES ESTATSTICAS
Conforme o critrio de agrupamento as sries apresentadas nas tabelas classificam-se em quatro
tipos: temporal ou cronolgica, geogrfica, especfica ou qualitativa e distribuio de freqncia.

OBS: As sries ainda podem ser classificadas como mista ou composta. Exemplo: quando a srie
for geogrfica e temporal ou especfica e temporal...etc.

Sries histricas, cronolgicas, temporais ou marchas.

Descrevem os valores da varivel, em determinado local, discriminados segundo intervalos


de tempo variveis.

Sries Geogrficas ou de localizao

a srie em que os dados so observados segundo a localidade de ocorrncia.

Srie Especfica ou qualitativa

a srie em que os dados so observados segundo modalidades diferentes de ocorrncia.

12
Distribuio de frequncia

um mtodo de agrupamento de dados em categorias, classes ou intervalos, de tal forma


que se possa determinar o nmero ou a porcentagem de cada categoria, classes ou intervalos.

Varivel categrica: Os valores de uma varivel categrica so os rtulos para as


categorias, como homem e mulher. A distribuio de freqncia de uma varivel relaciona
ao nmero ou a percentagem de unidades observacionais que se enquadram em cada
categoria.

Variveis contnuas: A distribuio de freqncia de uma varivel contnua fornece o


nmero ou a percentagem de unidades observacionais que se enquadram em cada intervalo
de classe.

Srie Conjugada Tabela de Dupla entrada: Tambm conhecida como srie Mista, pois muitas
vezes temos necessidade de apresentar, em uma nica tabela, a variao de valores de mais de uma
varivel, isto , fazer uma conjugao de duas ou mais sries.

13
EXERCCIOS
1 Classifique as sries.

a) b)

c) d)

e) f)

h) i)

14
2 Verificou-se, em 2014, o seguinte movimento de importao de mercadorias: 9 319 906 t,
oriundas da Arbia Saudita, no valor de US$ 1 089 760 000; 7 960 090 t, dos Estados Unidos, no
valor de US$ 3 348 549 000; e 458 403 t, do Japo, no valor de US$ 1 058 433 000. Confeccione a
srie correspondente, sabendo que os dados acima foram fornecidos pelo Ministrio da Economia.

3 No primeiro semestre de 2015, a loja Industria Feminina realizou uma pesquisa com 25 pessoas
para saber qual das quatro filiais nos bairros Bom descanso (BD), Centro (Ce), Colina (Co) ou
Prainha (Pr) seria a melhor loja. Assim, o resultado do primeiro ao ltimo entrevistado foi: BD, Ce,
Co, Pr, Pr, BD, Ce, Pr, Ce, Co, Pr, BD, Co, Pr, Ce, Co, BD, Pr, Co, Ce, BD, Pr, Ce, Co, Pr.
Confeccione uma distribuio de freqncia.

4 Organize os dados em forma de uma tabela de freqncia e classifique a srie: As cores dos 20
primeiros carros que passaram em uma determinada rua foram anotadas, resultado os seguintes
dados:

5 Construa uma tabela para mostrar que, de acordo com a Pesquisa Nacional por Amostra de
Domiclios, PNAD, em 2014 havia no Brasil 73,1 milhes de pessoas com renda familiar mensal
at 330 reais (pobres e miserveis), 45 milhes de pessoas com renda familiar mensal de 330 reais
at 1300 reais (emergentes) e 13,6 milhes de pessoas com renda familiar mensal acima de 1300
reais (classe mdia e ricos). Conclua.

6 As informaes abaixo indicam o nmero de acidentes ocorridos com 70 motoristas de uma


empresa de nibus nos ltimos 5 anos:
N DE ACIDENTES 0 1 2 3 4 5 6 7
N DE MOTORISTAS 15 11 20 9 6 5 3 1
a)Determine o nmero de motoristas com menos de 1 acidente.
b)Determine o percentual de motoristas com pelo menos 3 acidentes.
c)Determine o percentual de motoristas com no mximo 2 acidentes.
d)Qual o nmero total de acidentes ocorrido no perodo? R: 152

15
4 APRESENTAO GRFICA

O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo objetivo o
de produzir, no investigador ou no pblico em geral, uma impresso mais rpida e viva do
fenmeno em estudo, j que os grficos falam mais rpido compreenso que as sries. O mtodo a
se empregar depende do tipo de grfico e do mtodo que se prope.
a.Simplicidade o grfico deve ser destitudo de detalhes de importncia secundria, assim como
de traos desnecessrios que possam levar o observador a uma anlise morosa ou com erros.
b.Clareza o grfico deve possibilitar uma correta interpretao dos valores representativos do
fenmeno em estudo.
c.Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.

REPRESENTO GRFICA DE DISTRIBUIES DE FREQUNCIA

Histograma: O histograma um dos mais simples e teis grficos empregados na estatstica.


Representa as freqncias simples ou relativas dos estudos tabulados (contados) ou agrupados em
classes.
Para dados no agrupados em classes: o histograma representa as freqncias relativas simples e
relativas de cada dado sob a forma de um segmento de reta vertical.

Tabela 1: Idade de 40 alunos Figura 1: Histograma para dados no agrupados


do Tcnico Administrativo

Para dados agrupados em classes: o histograma apresenta as freqncias das classes em colunas.
Para ilustrar a construo de um histograma para dados agrupados em classes, veja a tabela de
freqncias de idades em anos completos apresentada a abaixo.
Tabela 2: Idade de 40
Figura 2: Histograma para dados agrupados
indivduos de uma comunidade

16
Grfico em colunas: Similar ao histograma, apresenta as freqncias sob a forma de colunas
verticais. Muitas vezes, os grficos de colunas so denominados erroneamente de histogramas. So
empregados, geralmente, para apresentar as freqncias de dados categricos ou nominais.
Tabela 3: Amostra com 55 estudantes Figura 3: Diagrama de colunas
universitrios

Grfico de barras: Similar ao histograma, possuindo o objetivo de apresentar as freqncias sob


a forma de barras horizontais, separadas entre si. Os dados podem ser nominais ou quantitativos
(agrupados em classes ou no).
Para dados no agrupados em classes: O grfico de barras a baixo representa as freqncias
simples do grupo de 55 estudantes universitrios, exposto na Tabela .3.
Figura 4: Exemplo de diagrama de barras

Para dados agrupados em classes: o grfico em barras tambm pode ser usado para representar
freqncias de dados agrupados. Considere os dados apresentados na Tabela 4.
Tabela 4: Idade dos indivduos da Figura.5: Diagrama de barras para dados agrupados
comunidade Esperana em classes de frequncia

17
Grfico de setores: O grfico de setores representa freqncias relativas ou simples sob a forma
de setores de crculo. Geralmente, sua aplicao somente deve ser feita quando todos os dados
analisados correspondem ao universo de observaes. No se deve usar, por exemplo, um diagrama
de setores para representar dados distribudos ao longo do tempo, como as sries temporais.
Para elaborar o grfico, encontrando os ngulos da diviso de cada setor, basta aplicar uma
regra de trs, do tipo:
100% est para 3600
assim como
x% est para 0

Tabela 5: Distribuio de pacientes segundo estado Figura.6: Pacientes segundo estado


nutricional. IBRANUTRI, maio a novembro, 1996. nutricional. IBRANUTRI, 1996.

Grfico de Pareto: De forma similar ao grfico de colunas, tambm representa as freqncias


simples ou relativas das classes ou dos valores analisados, porm representando-os de forma
ordenada, geralmente da classe de maior freqncia para a de menor freqncia.
O grfico de Pareto pode ser empregado tanto para dados quantitativos, agrupados em
classes ou no, como para dados qualitativos (nominais ou categricos). Ver como exemplo a
Tabela 6.

Tabela 6: Falhas na produo da Indstria Figura 7 Exemplo de grfico de Pareto


Moveleira LTDA

Grfico de disperso: Tambm conhecido como grfico de disperso. O grfico de disperso mostra
a relao existente entre duas variveis numricas, como, por exemplo, custos e vendas. Sua anlise
fundamental para a compreenso de algumas tcnicas estatsticas.

18
Tabela 7: Amostra de alunos de
uma faculdade variveis idade e Figura 8: Diagrama de idade e peso
peso
Idade Peso
17 50
18 55
20 72
25 62
17 70
38 83
54 80
64 72

Grfico Polgono de freqncia simples: Um polgono de frequncia um grfico que se realiza


atravs da unio dos pontos mais altos das colunas num histograma de frequncia (que utiliza
colunas verticais para mostrar as frequncias). Os polgonos de frequncia para dados agrupados,
por sua vez, constroem-se a partir da marca de classe que coincide com o ponto mdio de cada
coluna do histograma.

Tabela 8: Distribuio de recm- Figura 9: Grfico distribuio de recm-


nascidos acometidos de sndrome de nascidos acometidos de sndrome de
desconforto respiratrio grave segundo desconforto respiratrio grave segundo peso ao
peso ao nascer (g).peso nascer (g).

Ogiva : Uma distribuio cumulativa de freqncias pode ser representada graficamente por uma
ogiva. Para constru-la representa-se os limites superiores das classes na abscissa e faz-se a altura
dos pontos proporcionais freqncia acumulada at esses limites. Estes pontos so ento unidos
por linhas retas. Ao contrrio do polgono de freqncias, a interpolao permissvel com ogivas.
Tabela 9: Distribuio de mulheres Figura 10: Distribuio de mulheres
idosas segundo a altura. idosas segundo a altura.

Grfico Linear: Tambm conhecido como diagrama Linear, representa variveis qualitativas
ordinais relativas a tempo.
19
Tabela 10: Coeficientes de mortalidade por cncer de esfago
(por 100.000 hab.). Municpio de So Paulo, 1968-1998.

Figura 11: Coeficientes de mortalidade por cncer de


esfago (por 100.000 hab.). Municpio de So Paulo,
1968-1998.

EXERCCIOS
1 (Unesp/08) O grfico mostra as marcas obtidas, em segundos, at setembro de 2007, nos recordes
mundiais e pan-americanos, em quatro modalidades esportivas: provas de 100 metros rasos,
masculino, 100 metros rasos, feminino, 100 metros nado livre, masculino, e 100 metros nado livre,
feminino.

Com base nos dados do grfico, podemos afirmar:


a)Em duas das quatro modalidades, os recordes
pan-americanos e mundiais so iguais
b)Nos 100 metros nado livre, masculino, a
diferena entre os dois recordes, pan-americano e
mundial, de exatamente 2 segundos.
c) O tempo correspondente ao recorde mundial
nos 100 metros rasos, feminino, um tero do
tempo correspondente ao recorde mundial nos
100 metros nado livre, feminino.
d) Nos 100 metros nado livre, feminino, a
mdia aritmtica entre os recordes mundial e pan-americano exatamente 53,1 segundos.
e) Nos 100 metros rasos, a mdia aritmtica entre os recordes pan-americanos masculino e feminino
exatamente 10,54 segundos.

2 (Unesp/01) O grfico indica o resultado de uma pesquisa sobre o nmero de acidentes ocorridos
com 42 motoristas de txi em uma determinada cidade, no perodo de um ano. Com base nos dados
apresentados no grfico, e considerando que quaisquer dois motoristas no esto envolvidos num
mesmo acidente, pode-se afirmar que:

20
a) cinco motoristas sofreram pelo menos quatro acidentes.
b) 30% dos motoristas sofreram exatamente dois acidentes.
c) a mdia de acidentes por motorista foi igual a trs.
d) o nmero total de acidentes ocorridos foi igual a 72.
e) trinta motoristas sofreram no mximo dois acidentes.

3 Para analisar o desempenho de seus alunos em uma prova, um professor dividiu as notas obtidas
em classes de 3 (inclusive) a 4 (exclusive), de 4 (inclusive) a 5 (exclusive), e assim por diante. Com
os resultados, ele produziu o histograma da figura acima. Analisando esse histograma, pode-se
afirmar que:

(A) a maior nota na prova foi 7.


(B) a nota mdia foi 6.
(C) 50% dos alunos obtiveram nota menor que 5.
(D) um dos alunos obteve nota maior que 9.
E) exatamente 5 alunos obtiveram nota menor que 6

4 (Unesp/00) O grfico, publicado pela revista Veja de 28/7/99, mostra como so divididos os 188
bilhes de reais do oramento da Unio entre os setores de sade, educao, previdncia e outros.
Se os 46 bilhes de reais gastos com a previdncia fossem totalmente repassados aos demais setores
de modo que 50% fossem destinados sade, 40% educao e os 10% aos outros, determine o
aumento que o setor de sade teria:

a) em reais;
b) em porcentagem, em relao sua dotao
inicial, aproximadamente.

5 . Os dados do grfico foram coletados por meio da Pesquisa Nacional por Amostra de Domiclios.
Supondo-se que, no Sudeste, 14900 estudantes foram entrevistados nessa pesquisa, quantos deles possuam telefone
mvel celular?

a) 5513
b) 6556
c) 7450
d) 8344
e) 9536

21
5 MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL
Medidas de tendncia central, como o prprio nome revela, preocupam-se com a
caracterizao e a definio do centro dos dados. Podem ser apresentados sob diferentes tipos, como
a mdia, a mediana e a moda, que so as mais usadas e os quais abordaremos a seguir. Temos ainda,
o quartil, que divide o conjunto de dados em quatro partes iguais, o decil e o percentil que dividem
o conjunto em dez e cem partes iguais, respectivamente.
A mdia, assim como as demais medidas de tendncia central, correspondem a valores que
resumem o comportamento central dos dados e podem representar um conjunto de dados. So assim
denominados, pois mostram os fenmenos pelos seus valores mdios, em torno dos quais tendem a
concentrar-se os dados.
As medidas de tendncia central caracterizam os grupos como um todo, descrevendo-os de
forma mais compacta do que as tabelas e grficos. Focalizam a ateno na posio do centro dos
dados medidos, implicando muitas vezes, em um processo de perda parcial de informaes,
dependendo daquilo que se pretende conhecer a respeito dos dados estatsticos.
A moda, a mdia aritmtica e a mediana so as mais utilizadas para resumir o conjunto de
valores representativos que se deseja estudar. Elas determinam nmeros representativos do conjunto
de dados analisados, podendo, ou no, apresentar valores coincidentes.
Vantagens e desvantagens da mdia
1. uma medida de tendncia central que, por uniformizar os valores de um conjunto de dados, no
representa bem os conjuntos que revelam tendncias extremas.
2. No necessariamente tem existncia real, isto , nem sempre um valor que faa parte do
conjunto de dados, para bem represent-lo, embora pertena obrigatoriamente ao intervalo entre o
maior e o menor valor.
3. facilmente calculada. 4. Serve para compararmos conjuntos semelhantes.
5.1 MDIA ( para dados amostrais e (mi) para dados populacionais)
Independente de se estar trabalhando com uma populao ou uma amostra, a mdia de um
conjunto definida como a soma de todos os valores observados, dividida pelo nmero total de
observaes.
MDIA ARITMTICA

Dados no agrupados (simples)............................................. .....
=

( . )
Dados agrupados ............................................................... . ... =

(. )
Dados Agrupados em classes (intervalo) ............................ ... =

Exemplo1 Dados no-agrupados: Sabendo-se que a venda diria de arroz tipo A, durante uma
semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de:

Exemplo 2 Dados agrupados: Distribuio relativa a 34 famlias com 4 filhos, varivel igual ao
nmero de filhos do sexo masculino.
N de meninos Fi
0 2
1 6
2 10
3 12
4 4
Soma

22
Exemplo 3: A seguir esto apresentados os nmeros de funcionrios de empresas que prestam
servios de limpeza. Qual a mediana dos valores apresentados.
Classes Fi
1 11 9
11 21 14
21 31 35
31 41 22
41 51 11
Soma

ATIVIDADES
1. Os salrios de quatro funcionrios das Indstrias Maquinrias Ltda. So: $ 20.000,00; $
30.000,00; $ 15.000,00; $ 10.000,00. Determine a mdia aritmtica de seus salrios.
2 Uma urna contm 100 fichas . Dez apresentam o nmero 5, trinta apresentam o nmero 10, vinte
apresentam o nmero 15 e quarenta apresentam o nmero 20. Determine a mdia aritmtica dos
nmeros apresentados nas fichas.
3 Mrio calculou a mdia aritmtica das vendas mensais da lanchonete de sua escola no primeiro
semestre deste ano. Obteve-se um valor igual a R$ 500,00. Sabendo que nos cinco primeiros meses
as vendas foram iguais a R$ 400,00, R$300,00, R$ 250,00, R$ 550,00 e R$ 700,00, calcule quais
foram as vendas no ms de junho.
4 Para ser provado em clculo, Joo precisa obter a mdia, no mnimo, igual a 7. Sabendo que suas
notas foram iguais a 5; 8 e 6, pode-se dizer que Joo foi aprovado? Os pesos das provas eram iguais
a 3; 5 e 2. (Considere uma casa aps a vrgula).
5 Abaixo temos a distribuio dos aluguis de 65 casas. Determine a mdia.
Aluguel (x 1000) Nmero de casas (Pm) (Pm). Fi
1,5 3,5 12
3,5 5,5 18
5,5 7,5 20
7,5 9,5 10
9,5 11,5 5
Soma

6 Um estudante da faculdade Bom Saber obteve as seguintes notas das seguintes matrias. Calcule a
mdia.
Matria Notas Pesos
Estatstica 7,5 4
Clculo 4,0 2
Matemtica Financeira 5,5 1
Geometria 6,0 3

23
MDIA GEOMTRICA (G)

A mdia geomtrica de um conjunto de nmeros positivos definida como o produto de todos


os membros do conjunto elevado ao inverso do nmero de membros.

MDIA GEOMTRICA SIMPLES: Com n valores x1, x2, ..., xN, a mdia geomtrica desses
valores ser:

xg n x x 1 2
xn xg n xi
ou

A letra (pi maisculo) o smbolo para indicar o produto ou tambm chamado de


produtrio dos valores da varivel. Utilize a calculadora cientfica para o clculo da mdia
geomtrica.
Exemplo: Calcular a mdia geomtrica dos conjuntos de nmeros:

a) X = {12, 55, 48} ento: x1 = 12, x2 = 55, x3 = 48 e n = 3

xg n
x x x 3 12 55 48 3 31680 x g 31,64
1 2 3

MDIA GEOMTRICA PONDERADA: A mdia geomtrica ponderada de um conjunto de


nmeros dispostos em uma tabela de freqncias por intermdio da seguinte expresso:

fi k

fi OU xg i 1 Xi
fi

xg x x () xk
i 1
fi f i fk
i 2 i 1

Exemplo: Calcular a mdia geomtrica para a distribuio de dados fictcios:


xi fi
2 4
4 2
8 2
24 1

Resolvendo:
4
xg 9 xifi 9 4 8 24 9 16 16 64 24 9 393216 4,18
4 2 2 1

i 1
2

Como clculo mais amplo da mdia geomtrica foge ao objetivo do curso, no se dar a nfase
correspondente a esse assunto.

MDIA HARMNICA (H)

A mdia harmnica de um conjunto de valores xi o inverso da mdia aritmtica dos inversos


dos valores. Podemos concluir que o inverso da mdia harmnica a mdia aritmtica dos inversos
dos valores da varivel.
24
MDIA HARMNICA SIMPLES: Dado o conjunto de n valores x1, x2 , x3 ,..., xn ; a mdia harmnica
do conjunto ser:
1 n
xh xh
n
1 n
1

i 1 xi
x
i 1 i

Exemplo: Calcular a mdia harmnica simples:

1) A 20,60,120 mmc(20,60, 120) 120


n 3 3 3 120
xh n 40
1 1 1 1 6 2 1 9
i 1 xi

20 60 120 120

MDIA HARMNICA PONDERADA: A mdia harmnica ponderada de um conjunto de


nmeros, dispostos em uma tabela de freqncias, dada pela seguinte expresso:

n
xh n
fi

i 1 xi
Exemplo: Calcular a mdia harmnica dos dados constantes do quadro:

fi
Classes xi fi xi
1 3 2 2 2/2=1,00
3 5 4 4 4/4=1,00
5 7 6 8 8/6=1,33
7 9 8 4 4/8=0,50
9 11 10 2 2/10=0,20
n 5
fi
f
i 1
i 20 n x 4,03
i 1 i

Ento temos:
_
n 20
xh 4,96
n
fi 4,03
x
i 1 i

Como clculo da mdia harmnica mais adequada para situaes em que a mdia das taxas
desejada, logo se dar a nfase correspondente a esse assunto.

25
MEDIANA (Md)
A mediana conceitualmente definida como uma medida de tendncia central cujo valor
localiza-se no centro exato da srie ordenada. Ou seja, abaixo da mediana devero estar 50% dos
elementos analisados. Acima da mediana devero estar 50% dos dados analisados.

MEDIANA SIMPLES (dados no agrupados):


Procedimento:
Se n for mpar: a mediana ser igual ao elemento central.
Se n for par: a mediana ser igual mdia aritmtica simples dos dois elementos
centrais.
Exemplo 1: Uma amostra formada por 11 pessoas respondeu a um teste que objetivava determinar
quais seriam aprovados para determinada vaga em uma multinacional. Dos candidatos, apenas 50%
deveriam ser aprovados. Sabendo-se que a mediana a nota mnima a ser atingida por aqueles que
sero aprovados, determin-la.
Notas dos candidatos: {8,3; 7,2; 9,0 ;10,0; 6,7; 8,0; 7,0; 8,5; 6,5; 3,0; 6,9}
Para encontrar a mediana, preciso ordenar os dados:
Rol: { 3,0; 6,5; 6,7; 6,9; 7,0; 7,2; 8,0; 8,3; 8,5; 9,0; 10,0}
Como o nmero de dados mpar (n = 11), o valor central representa a mediana, que a nota
mnima, ou seja, mediana igual a 7,2.

Exemplo 2: Caso o teste citado no exemplo acima tivesse sido realizado entre 12 pessoas, qual
seria a nota mnima?
Notas dos candidatos: {8,3; 7,2; 9,0 ;10,0; 6,7; 8,0; 7,0; 8,5; 6,5; 3,0; 6,9; 6,0}
Para encontrar a mediana, preciso ordenar os dados:
Rol: { 3,0; 6,0; 6,5; 6,7; 6,9; 7,0; 7,2; 8,0; 8,3; 8,5; 9,0; 10,0}
Como o nmero de dados par (n = 12), a nota mnima representada pela mediana, que,
neste caso, a mediana igual a 7,1.

MEDIANA PONDERADA (dados agrupados):


O clculo da mediana para dados agrupados feito similar queles empregados para dados
no agrupados. Porm, neste caso, aconselhvel utilizar a tabela de freqncias acumuladas, o que
facilita o trabalho, pois, basta localizar o elemento cuja freqncia acumulada superar pela primeira
vez 50% do nmero de elementos analisados.

Procedimento:
+1
1: Calcula-se a posio da mediana: = 2 2 + 1( ) = 2 ( )
Onde: =
2: A mediana ser o valor de Xi correspondente primeira

Exemplo 1:
xi Fi FAc
3 5 5
5 10 15
6 1 16
10 4 20
13 7 27
Soma 27

26
Exemplo 2:
Determinar a mediana da tabela seguinte:
xi Fi FAc
3 6 6
5 8 14
6 3 17
10 4 21
13 7 28
Soma 28

MODA
A moda pode ser conceituada como o valor que ocorre com maior freqncia na
distribuio. A moda pode no existir quando no existe um valor com maior nmero de
repeties amodal. A moda pode, ser nica, unimodal. Pode haver duas modas, bimodal, ou
tambm chamada de multimol, por haver mais que uma moda.
Exemplo:
A = {2,3,4,5,6} Mo = C = {2,2,3,4,4,5,6} Mo =
B = {4,5,5,6} Mo = D = {2,2,2,3,4,4,4,5,6,6,6} Mo =

MODA SIMPLES (dados no agrupados):


Exemplo1 : Foram coletados os nmeros de filmes locados por hora de funcionrios em trs
locadoras, denominadas R, T e V. Os dados obtidos em turno de seis horas foram:
Locadora R: {0;1;2;2;2;3}
Locadora T: {1;2;2;3;3;4}
Locadora V:{0;1;2;3;4;5}

MODA PONDERADA (dados agrupados): Para distribuies simples, a identificao da moda


facilitada pela simples observao do elemento que apresenta maior freqncia.
Exemplo2: Distribuio relativa a 34 famlias com 4 filhos, varivel igual ao nmero de filhos
do sexo masculino.
N de Fi
meninos
0 2
1 6
2 10
3 12
4 4
Soma
ATIVIDADES

1 Calcule a moda para o seguinte conjunto de dados: A={ 1;6;9;0;9;5;5;1;7;5;9} e


B={3;3;4;6;7;7;9}

2 Os nmeros de defeitos de diferentes lotes de tecidos foram iguais a: {37; 45; 52; 61;49 e 55}.
Qual a mediana destes valores?

27
3 As vendas dirias de automveis usados da Calhambeques e Carangos Ltda. nos meses de junho e
julho esto apresentadas a seguir. Para os valores fornecidos, encontre a mdia, a mediana e a moda.
Vendas em junho: {12;8;5;12;4;3;15}. Vendas em julho:{60;51;60;14;14;48}

4 As alturas de um conjunto de modelos que esto participando de um grande evento de publicidade


esto ordenadas a seguir. Aps construir a srie ordenada, pede-se identificar a mdia, a moda e a
mediana. Srie bruta: {1,70; 1,70; 1,70; 1,72; 1,75; 1,75; 1,77; 1,79 e 1,80}.

5 Os valores referentes a sinistros ocorridos e, posteriormente, pagos por uma seguradora no ms


passado foram iguais a {R$ 400,00; R$ 1 100,00; R$ 700,00; R$ 950,00 e R$ 8 800}. Calcule a
mdia e a mediana. O que pode ser dito em relao aos valores encontrados?

6 Os dados abaixo foram constatados em uma pesquisa para obter sugestes sobre a prestao de
servios de uma empresa, durante 15 dias. Dados brutos: { 3 - 5 - 6 - 5 - 4 - 6 - 5 - 7 - 5 - 5 - 6 - 5 -
6 - 5 - 4}. Pede-se : a)montar uma tabela de freqncia, b) calcular a moda, a mdia e a mediana.

7 Para cada distribuio, determine a mediana.


a)
Xi 2 3 4 5 7
Fi 3 5 8 4 2

b)
Xi 73 75 77 79 81
Fi 2 10 12 5 2

28
5.4 SEPARATRIZES
Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no
so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de
separar a srie em duas partes que apresentam o mesmo nmero de valores.
Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas
pelo nome genrico de separatrizes.
- Quartis: divide a srie em quatro partes iguais (Q1, Q2, Q3);
- Decis: divide a srie em 10 partes iguais (D1, D2, D3, D4, D5, D6, D7, D8, D9);
- Percentis: divide a srie em 100 partes iguais (P1, P2, P3, ..., P99).

1o Quartis (QK): Nos quartis, a srie dividida em quatro partes iguais. Os elementos separatrizes
da serie so Q1, Q2, e Q3.
25% 50% 75%

Q1 Q2 Q3
Q1: o primeiro quartil, corresponde separao dos primeiros 25% de elementos da serie.
Q2: o segundo quartil, coincide com a mediana (Q2 = Md).
Q3: o terceiro quartil, corresponde separao dos ltimos 25% de elementos da srie, ou
seja, os 75% dos elementos da srie.
Clculo do quartil para dados SIMPLES (no agrupados)
1 Passo: Determina-se a posio do Quartil.
Kn
PQK (onde K 1,2ou 3)
4
2 Passo: Identifica-se a posio mais prxima do rol.
3 Passo: Verifica-se quem est naquela posio.
Exemplo: Calcule Q1 e Q2 para o seguinte conjunto de valores: A4,1,8,0,11,10,7,8,6,2,9,12
Inicialmente precisamos colocar os valores em ordem (rol): A0,1,2,4,6,7,8,8,9,10,11,12
a) Vamos utilizar os passos para o clculo do 1 quartil:
1 Passo: Determina-se a posio do 1 quartil:
1 12
PQ1 3 posio do 1 quartil (25%)
4
2 Passo: Identificar a posio PQ1 =3(terceiro valor)
3 Passo: Procura-se no rol o valor do nmero que est na posio identificada.
A0,1,2,4,6,7,8,8,9,10,11,12
Terceiro valor
R: O nmero que corresponde a 25% do rol o valor 2
b) Vamos utilizar os passos para o clculo do 2 quartil:
1 Passo: Determina-se a posio do 2 quartil:
2 12
PQ 2 6 posio do 2 quartil (50%=mediana)
4
2 Passo: Identificar a posio PQ1 =6 (sexto valor)
3 Passo: Procura-se no rol o valor do nmero que est na posio identificada.
A0,1,2,4,6,7,8,8,9,10,11,12
Sexto valor

R:O nmero que corresponde a 50% do rol o valor 7

29
Clculo do quartil para dados agrupados

1 Passo: Calcula-se a posio do quartil.


K fi
PQK (onde K 1,2ou 3)
4
2 Passo: necessrio inserir a coluna da frequncia acumulada (Fac), e nela procurar o valor da
posio do quartil .
3 Passo: O Valor do quartil ser o valor da varivel que corresponde quela classe.
Exemplo: Calcular o valor do Q3 da tabela seguinte:
Tabela 1 Nmeros de acidentes /ms no
Cruzamento X em CG/07
N de acidentes / Fi Fac
mes
0 4 4
1 6 10
2 9 19
3 5 24
4 4 28
f 28
Vamos calcular o Q3
1 Passo: Determinar a posio do 3 quartil (75%)
3 28
PQ 3 21 posio do 3 quartil
4
2 Passo: Procurar na coluna da fa a posio do 21 elemento
3 Passo: A varivel que corresponde posio do 21 elemento 3 (na quarta classe).
75% da pesquisa mostrou que este cruzamento teve 3 acidentes / ms.

2o Decis (DK)
Nos decis, a srie dividida em 10 partes iguais (D1, D2, D3, ...D9).
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

D1 D2 D3 D4 D5 D6 D7 D8 D9
D1: o primeiro decil, corresponde separao dos primeiros 10 % de elementos da srie.
D5: o quinto decil, coincide com a mediana (D5 = Md).
D9: o nono decil, corresponde separao dos ltimos 10% elementos da srie.
Clculo do Decil para dados SIMPLES (no agrupados):Os passos so os mesmos para o
clculo do quartil para o rol
Exemplo: Calcular D1 e D8 do conjunto dado: A7,12,15,20,2,4,6,18,10,24
Inicialmente vamos colocar o conjunto em ordem crescente:
2 4 6 7 10 12 15 18 20 24
a) Calcular D1
1 Passo: determina-se a posio do primeiro Decil.
1 n 1 10
PD1 1 ( posio)
10 10
2 Passo: Procura-se no rol o valor do primeiro elemento;
3 passo: O valor do D1=2 que corresponde a 10% do rol
b) Calculo do D8
30
1 Passo: determina-se a posio do oitavo Decil.
8 n 8 10
PD 8 8 ( posio)
10 10
2 Passo: Procura-se no rol o valor do oitavo elemento;
3 passo: O valor do D8=18 que corresponde a 80% do rol

Clculo do Decil para dados agrupados:Os procedimentos so os mesmos utilizados para o


clculo dos quarts.
Exemplos: Calcular D3 usando a seguinte tabela:
Tabela 2 Quantidade de filhos dos funcionrios
de uma pequena empresa.
filhos Fi Fac
0 18 18
1 35 53
2 46 99
3 28 127
4 25 152
5 10 162
6 5 167
7 3 170
f 170

Clculo do D3
1 Passo: Calcula-se a posio do D3
3 f 3 170
D3 51 (posio)
10 10
2 passo: Procura-se a posio do D3 pela coluna da frequncia acumulada, o D3 est na 2
classe (Fac 53)
3 Passo: O valor da varivel na segunda classe 1 filho, que corresponde a 30% da
pesquisa.

3o Percentis (Pk):
Nos percentis, a srie divida em 100 partes iguais (P1, P2, P3, ... P99).
P1: o primeiro percentil, corresponde separao do primeiro 1% de elementos da srie.
P50: o qinquagsimo percentil, coincide com a mediana (P50 = D5 = Q2 = Md).
Para o clculo dos percentis, utilizamos tcnicas semelhantes s do clculo dos quartis e decis, mas agora
ser dividido por 100.
Clculo de Percentil para dados SIMPLES (no agrupados)

Exemplo 1: Calcular o P28 e P82 do conjunto B15,2,4,6,10,12,13,7,21,18,20


Devemos inicialmente ordenar os valores:
2 4 6 7 10 12 13 15 18 20 21

a) Clculo do P28
1 Passo: Determinar a posio do P 28 n 28 11 3,08
28
100 100
2 Passo: procura-se no rol o valor da posio do 3 elemento;
3 Passo: A varivel que corresponde posio desejada o nmero 6
b) Clculo do P82

31
1 Passo: Determinar a posio do P 82 n 28 11 9,02
28
100 100
2 Passo: procura-se no rol o valor da posio do 9 elemento;
3 Passo: A varivel que corresponde posio desejada o nmero 18
Clculo do Percentil para dados agrupados
Exemplo: Calcular P45 e P93 da tabela
Tabela 3. Nmero de quartos/chals em Bonito/MS/07
Nmero de quartos/chals Fi Fac
1 15 15
2 30 45
3 20 65
4 12 77
5 10 87
6 8 95
f i 95

a) Calcular P45
1 Passo: Determinar a posio do P 45 n 45 95 42,75
45
100 100
2 Passo: Procurar a posio do 43 elemento pela coluna da frequncia acumulada, podemos
observar que o elemento de posio 43 est na segunda classe;
3 Passo O valor da varivel que corresponde a 45% da pesquisa revelou que os pesquisados
preferem at dois quartos por chal.
b) Calcular P93
1 Passo: Determinar a posio do P93 P 93 n 93 95 88,35
93
100 100
2 Passo: Procurar a posio do 88 elemento pela coluna da frequncia acumulada, podemos
observar que o elemento de posio 88 est na sexta classe;
3 Passo O valor da varivel que corresponde a 93% da pesquisa revelou que os pesquisados
preferem at seis quartos por chal.

Exerccios
1 Considere o conjunto de valores que representa as idades de um grupo de crianas de uma
comunidade:
3,9,2,8,4,6,5,9,10,4,3,5,6,11
1.1 Qual a idade que corresponde a 25% das crianas (Q1)?
a) Q1=3
b) Q1=5
c) Q1=4
d) Q1=6

32
1.2 Qual a idade que corresponde a 70% das crianas (D7)?
a) D7=6
b) D7=8
c) D7=5
d) D7=9

1.3 Qual a idade que corresponde a 45% das crianas (P45)?


a) P45 = 4
b) P45 = 8
c) P45 = 5
d) P45 = 6

2Considere o quadro 1 que representa os valores economizados por crianas para a compra do
presente do dia das mes. Para cada um dos itens, elabore uma resposta descritiva (concluindo).
Quadro 1 Valores economizados pelas crianas
Valores Num. de fa
(R$) crianas(fi)
10 2
15 6
20 8
25 15
30 13
35 11
40 5
fi 60
2.1.Qual o valor economizado por 75% das crianas (Q3)?
a) Q3= 30
b) Q3= 40
c) Q3= 35
d) Q3= 25

2.2. Qual o valor economizado por 40% das crianas (D4)?


a) D4 = 25
b) D4 = 20
c) D4 = 35
d) D4 = 30

2.3. Qual o valor economizado por 92% das crianas (P92)?

a) P92 = 35
b) P92 = 30
c) P92 = 40
d)P92 = 38

33
6 MEDIDAS DE DISPERSO
As medidas de disperso visam descrever os dados no sentido de informar o grau de
disperso ou de afastamento dos valores observados em torno de um valor central. Elas indicam se
um conjunto homogneo (pouca ou nenhuma variabilidade) ou heterogneo (muita variabilidade).
As principais medidas de disperso absoluta so: amplitude total, varincia e desvio-padro.
E a disperso relativa o coeficiente de variao.

6.1 AMPLITUDE DE VARIAO

a diferena entre o maior e o menor valor do conjunto, sendo a mais simples das medidas
de disperso, porm de grande instabilidade, porque considera somente os valores extremos do
conjunto.
=
Exemplo:
Dada a amostra A = {1;5;11;15;4;9;11;2;3}, pode-se construir o rol {1;2;3;4;5;9;11;11;15}. O
intervalo representa a diferena entre o maior e o menor valor do rol, ou:
= 15 1 = 14
Assim, a variao mxima ser de 14%.

6.2 VARINCIA

VARINCIA
Amostral: Populacional:
( )2 ( )2
2 2
2 =
2 =
1
Exemplo:
Considere a altura das crianas (em centmetros) da Creche da Escola Criana Feliz, Turma
1: 40;45;48;52;54;62;70. Encontre a Varincia Populacional.
Xi = 40, 45, 48, 52, 54, 62, 70 = 371
Xi2 = 1600 2025 2304 2704 2916 3844 4900 = 20293

6.3 DESVIO PADRO


Observando-se a frmula original para o clculo da varincia, nota-se que uma soma de
quadrados. Dessa forma, se a unidade da varivel for, por exemplo, metro (m) teremos como
resultado metro ao quadrado (m2). Para se ter a unidade original, necessita-se definir outra medida
de disperso, que a raiz quadrada da varincia o desvio-padro. Assim:
Amostral populacional
= 2 ( ) = 2 ( )

34
6.4 COEFICIENTE DE VARIAO
O coeficiente de variao uma medida de disperso relativa, utilizada quando se deseja
comparar a variao de conjuntos de dados que apresentam diferentes unidades de medio e ou
tamanhos diferentes, pois o coeficiente de variao independe da unidade de medida dos dados. O
coeficiente de variao pode tambm ser expresso como uma porcentagem da mdia.
Amostral populacional

% = . 100 % = . 100

Exemplo:
Tomaremos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de
indivduos.
MDIA DESVIO PADRO
ESTATURAS 175 cm 5 cm
PESOS 68 kg 2 kg
Qual medida apresenta maior grau de disperso?

EXERCCIOS
1 Um fabricante de caixas de cartolina fabrica 3 tipos de caixas. Testa-se a resistncia de cada
caixa, tomando-se uma amostra de 100 caixas e determinando-se a presso necessria para romper
cada caixa. So os seguintes os resultados dos testes:

a) Que tipo de caixa apresenta a maior variao absoluta na presso de ruptura?


b) Que tipo de caixa apresenta a maior variao relativa na presso de ruptura?
c) Qual tipo de variao voc utilizaria? Justifique.

2 Uma empresa tem duas filiais, diferentes quanto s suas caractersticas funcionais. Um
levantamento sobre os salrios dos empregados dessas filiais resultou nos seguintes valores:
Filial A: XA= 400 e A = 20 Filial B: XB = 500 e B = 25
Podemos afirmar que as duas filiais apresentam a mesma disperso?

3 Em uma determinada distribuio de valores iguais, o desvio padro :


a. ( ) negativo b. ( ) positivo c. ( ) a unidade
d. ( ) zero e. ( ) nenhuma das alternativas anteriores

4 O desvio padro de um conjunto de dados 9. A varincia ser:


a)3 b)18 c)36 d)81

35
5)O coeficiente de variao dos resultados abaixo so:
Estatstica: mdia = 80 e S= 16 Histria: mdia = 20 e S = 5
a) 16% e 40% b)20% e 25% c)50% e 40% d)80% e 40%

6) Em um exame final de Matemtica, o grau mdio de um grupo de 150 alunos foi 7,8 e o desvio
padro 0,8. Em Estatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro 0,76. Em que
disciplina foi maior a disperso?

7) Na srie 60, 90, 80, 60, 50 a moda :


a. ( ) 50 b. ( ) 60 c. ( ) 66 d. ( ) 90 e. ( ) nenhuma das anteriores.

8) A estatstica que possui o mesmo nmero de valores abaixo e acima dela :


a. ( ) a moda b. ( ) a mdia c. ( ) a mediana d. ( ) o elemento mediano e. ( ) n.d.a

9) Quando desejamos verificar a questo de uma prova que apresentou maior nmero de erros,
utilizamos:
a. ( ) moda b. ( ) mdia c. ( ) mediana d. ( ) qualquer das anteriores e. ( ) n.d.a

10)A tabela abaixo representa os salrios pagos a 150 operrios da empresa P&E Ltda.

Quantos operrios ganham at 6 salrios mnimos exclusive ?


a. ( ) 50 b. ( ) 75 c. ( ) 90 d. ( ) 110 e. ( ) nenhuma das alternativas anteriores

11 Considere a seguinte distribuio de freqncias correspondente aos diferentes preos de um


determinado produto em quarenta lojas pesquisadas:
Qual a percentagem de lojas com o preo maior do que R$ 61,00 e menor do que R$ 64,00
exclusive?
a. ( ) 25%
b. ( ) 52,5 %
c. ( ) 65 %
d. ( ) 80 %
e. ( ) nenhuma das alternativas anteriores

12 Compare a homogeneidade da srie, indicando a anlise pertinente: relativa ou absoluta.


Srie Mdia aritmtica Desvio padro Coeficiente Variao (%)
A(t) 80,8 t 10,0 t 12,4
B(cm) 450,0 cm 10,0 cm 2,2
C(oC) 32,6oC 4,2 oC 12,9
D(oC) 30,0 oC 2,6 oC 8,7
E(t) 8200,0 t 700,0 t 8,5
A)Qual srie mais homognea: serie A ou srie B?
B) qual a mais homognea : a serie C ou a srie D?
C) qual a mais homognea: a srie A ou a E?

36
7 AMOSTRAGEM
A impossibilidade de observar todos os indivduos de uma populao justifica o estudo de
tcnicas de amostragem. Porm, uma amostra deve ser coletada de forma que reproduza as
caractersticas da populao a qual foi obtida.
Uma forma de garantir a representatividade de uma amostra selecionando-a de forma
aleatria. Os esquemas mais adotados esto enumerados a seguir:
Amostragem casual simples Amostragem sistemtica................Amostragem estratificada
Do ponto de vista estatstico, uma amostra deve estar constituda pelo maior nmero
possvel de observaes. A teoria de amostragem define procedimentos para calcular o tamanho de
amostra necessrio para atingir um certo grau de preciso. Em muitas situaes este tamanho de
amostra um valor que, sendo o ideal, est fora das possibilidades da pesquisa devido a diversos
fatores como tempo ou dinheiro; assim, necessrio desenvolver um estudo especfico que leve em
considerao a teoria estatstica e as possibilidades reais da pesquisa.

7.1 Amostragem casual simples

feita quando todos os elementos da populao tm a mesma chance (ou probabilidade


igual) de pertencer amostra.
Na prtica a amostragem casual simples realizada numerando-se a populao, se tiver at
80 dados, enumera-se de 01 a 80, se tiver 350 dados, enumera-se de 001 a 350 e assim por diante.
necessrio saber quantos itens sero selecionados na amostra, para isso, existe clculos
para tamanho de amostra que ser tratado no item 8.
EXEMPLO: Uma cidade turstica tem 30 hotis de trs estrelas. Pretende-se conhecer o
custo mdio da diria para apartamento de casal. Os valores populacionais consistem nos seguintes
preos dirios (em dlares):

25, 20, 35, 21, 22, 24, 25, 30, 38, 24, 20, 20, 25, 20, 19, 25, 23, 24, 28, 24,
24, 22, 28, 26, 23, 25, 22, 27, 25, 23.
Extraia uma amostra aleatria simples de tamanho 10 desta populao, SEM REPOSIO.

7.2 Amostragem sistemtica


feita quando os elementos da populao se apresentam ordenados e a retirada dos
elementos da amostra feita periodicamente.
1) Considerando N o tamanho da populao e n o tamanho da amostra, calcular o
intervalo de amostragem, chamado k, atravs da frmula k = N/n, sendo k igual ao nmero
inteiro mais prximo.
2) Sorteia-se um nmero entre um e k, chamado m, sendo 0 < m k. Esse nmero m
ser o primeiro elemento da amostra. O segundo elemento da amostra ser m+k; o terceiro
elemento ser m+k; e assim sucessivamente, de forma sistemtica.
A amostragem aleatria sistemtica til sobretudo quando no se tem uma base de dados
digital com a grelha de amostragem e apenas se dispe, por exemplo, de uma lista de telefone em
papel ou de uma lista de ruas com uma contagem de casas existentes em cada uma delas ou (como
no caso da sondagem boca da urna) quando se sabe apenas o nmero total de elementos da
populao (mas no temos nenhuma lista com a sua identificao) e dispomos de uma forma segura
e eficaz de encontrar todos esses sujeitos (como no caso da sondagem boca da urna em que os
sujeitos vo votar num local e num intervalo de tempo previamente estabelecidos e podem ser
abordados nesse momento).
37
EXEMPLO: Imagine que voc tem 500 cadastros arquivados em sua empresa e voc quer uma
amostra de 2% desses cadastros. Como voc obteria uma amostra sistemtica?
Resoluo: se voc quer uma amostra de 2% dos 500 (N) cadastros, ento voc quer uma amostra
de tamanho 10 (n).
1) (k = N/n) K=500/10=50
2) Sorteia-se um nmero entre um e 50 (inclusive), nmero do primeiro cadastro.Suponhamos que
o nmero sorteado para iniciar a amostra for 2 (m).
3) Os prximos dados sero m+k, ou seja : 02, 52, 102, 152, 202, 252, 302, 352, 402, 452.

6.3 Amostragem estratificada


Muitas vezes a populao se divide em subpopulaes ou estratos.
Por exemplo, a literatura cientfica diz-nos que existem diferenas significativas entre a
populao feminina e masculina e entre a populao rural e urbana em relao ao comportamento
religioso.
Para garantir essa representao proporcional utilizamos a amostragem aleatria
estratificada, que consiste em especificar quantos elementos da amostra sero retirados em cada
estrato. Geralmente, o nmero de elementos sorteados em cada estrato proporcional ao nmero de
elementos existente.
EXEMPLO: Numa localidade com 150 000 habitantes, 45 000 tm menos de 20 anos de idade, 75
000 tm idades entre 30 e 50 anos e 30 000 tm mais de 50 anos de idade. Extrair uma amostra de
30 habitantes desta populao pelo processo de amostragem estratificada com partilha proporcional.
1) Saber a porcentagem de cada grupo da populao.

2) Calcular a quantidade, a amostra com base nas porcentagens da populao.


3) Para cada estrato utilizar uma tcnica de amostragem (7.1 ou 7.2)

EXERXCIO
1-) Uma indstria especializada em montagem de grandes equipamentos industriais recebeu setenta
dispositivos de controle do fornecedor A e outros trinta dispositivos do fornecedor B. O aspecto
relevante, que se deseja controlar, relativo a esses dispositivos, a resistncia eltrica de certo
componente crtico. Vamos admitir que os cem dispositivos foram numerados de 1 a 100 ao darem
entrada no almoxarifado, e que os setenta primeiros foram os recebidos do fornecedor Vamos
admitir, tambm, que os valores reais da varivel de interesse (a resistncia eltrica do componente
crtico) dos cem dispositivos recebidos sejam os dados seguintes, respectivamente na ordem de
entrada no almoxarifado (l-se segundo as linhas, tal como se l um livro):
33 38 34 34 34 31 36 35 32 37 35 34 30 37 36 33 34 34 32 39
35 33 33 34 31 32 36 33 29 36 34 35 34 33 31 35 35 35 37 32
34 34 36 35 34 33 32 38 34 33 33 32 34 35 37 35 35 30 35 34
36 36 33 34 33 32 31 37 35 34 39 40 40 42 39 38 40 40 40 40
40 41 45 41 40 39 41 41 40 42 39 40 41 40 40 42 39 39 38 40
a-) Retire uma amostra simples, sem reposio, de dez dispositivos foi retirada da populao de
100 dispositivos, com auxlio da tabela de nmeros aleatrios. O processo de utilizao da tabela
foi o usual, com incio no primeiro dgito da primeira linha da referida tabela, e as amostras
subseqentes retiradas em linha. A seguir, calcule a resistncia eltrica mdia da amostra de dez
dispositivos.
b-) Suponha agora que se pensasse em fazer amostragem estratificada. Em sua opinio, seria
isso razovel, no caso? Caso afirmativo, indique como voc procederia , ainda utilizando os
nmeros aleatrios. Suponha que o numero total de dispositivos a examinar na amostra continue
sendo dez.
38
2 A Prefeitura Municipal de Santarm tem 450 moto-taxistas oficiais. Obtenha uma amostra
representativa (aleatria simples), correspondendo a 4% do total. Utilize a TNA, a partir da 2.
linha, da esquerda para a direita.
3 Uma rede de franquia possui 240 pontos, em todo territrio brasileiro. Desejando-se saber como
est o nvel de satisfao de seus franqueados, ser realizada uma pesquisa com 20 desses pontos.
Determine quais pontos sero selecionados para a amostra, sendo que o primeiro o de n. 7 e que a
tcnica utilizada a amostragem sistemtica.
4 Suponha que determinada faculdade tenha 5 cursos de graduao, assim distribudos: 175 alunos
em Administrao, 153 em Biologia, 141 em Contabilidade, 249 em Direito e 295 em Enfermagem.
Uma pesquisa ser realizada com 50 acadmicos. Determine a tcnica a ser utilizada e a quantidade
de alunos que comporo a amostra.
5 Na Escola So Leopoldo, para estudar a preferncia em relao a refrigerantes, sortearam-se 150
estudantes, entre os 1000 matriculados. Responda:
a)Qual a populao envolvida?
b)Que tipo de amostragem foi utilizado e qual a amostra considerada?
6Os turistas que procuraram uma agncia de viagens distriburam-se segundo quatro destinos,
conforme apresentado Tabela 1.
Tabela 1: Distribuio dos destinos de um grupo
de turistas de uma agncia de viagens
Destino Nmero de turistas
A 500
B 250
C 440
D 360
TOTAL 1 550
A agncia estava interessada em realizar uma pesquisa para saber o grau de satisfao desses
clientes em relao aos destinos escolhidos, mas na impossibilidade de consultar todos eles,
decidiu fazer uma amostragem de 200 elementos. Quantos seriam os turistas consultados de cada
grupo?

39
TAMANHO DE UMA AMOSTRA (n)
O erro Amostral a diferena entre um resultado amostral e o verdadeiro resultado
populacional; tais erros resultam de flutuaes amostrais aleatrias.
No podemos evitar a ocorrncia do ERRO AMOSTRAL, porm podemos limitar seu valor
atravs da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o
TAMANHO DA AMOSTRA seguem sentidos contrrios (Figura 1). Quanto maior o tamanho da
amostra, menor o erro cometido e vice-versa.
*Erro padro

*Distribuio Normal *Distribuio Student

Os valores de confiana mais utilizados e os valores de Z correspondentes podem ser


encontrados na tabela a baixo:
Tabela 1 Valores crticos associados ao grau de confiana na amostra

1 Quando 2 conhecido

1.1 Populao infinita 1.2 Populao Finita

Exemplo: Sabendo-se que o desvio padro da mdia de idades de uma populao muito grande 5
anos, e adotando o nvel de confiana de 95% e um erro amostral de 1 ano, qual deve ser o tamanho
mnimo dessa amostra?

40
2 Quando 2 desconhecido
2.1 Populao infinita 2.2 Populao Finita

Exemplo: Um dos concentrados protticos de peixe (FPC) obtido pelo mtodo experimental,
apresentou para trara, 59 teores de cinza, em %. Considerando desvio padro de 0,27, com 95% de
confiana e erro 0,1, diga se o tamanho de amostra igual a 15 suficiente para inferir sobre o teor
de cinzas.

3 Estimar proporo
3.1 Populao infinita 3.2 Populao Finita

Exemplo: Um assistente social deseja saber o tamanho da amostra (n) necessrio para determinar a
proporo da populao atendida por uma Unidade de Sade, que pertence ao municpio de
Cariacica. No foi feito um levantamento prvio da proporo amostral e, portanto, seu valor
desconhecido. Ela quer ter 90% de confiana que sua o erro mximo de estimativa (E) seja de 5%
(ou 0,05). Quantas pessoas necessitam ser entrevistadas?

ATIVIDADES
1 Um economista deseja estimar a renda mdia para o primeiro ano de trabalho de um bacharel em
direito. Quantos valores de renda devem ser tomados, se o economista deseja ter 95% de confiana
em que a mdia amostral esteja a menos de R$500,00 da verdadeira mdia populacional? Suponha
que saibamos, por um estudo prvio, que para tais rendas, = R$6250,00

2 Adote nvel de confiana de 95% , um erro amostral de 1 ano e desvio padro de 5 anos. Qual
deve ser o tamanho mnimo de uma amostra , se a populao constituda de 400 pessoas

3 Um pesquisador deseja estimar a proporo de pessoas favorveis a determinado tipo de


tratamento. Sabendo-se que, numa pesquisa preliminar, essa proporo foi de 7%, qual deve ser o

41
tamanho mnimo da amostra para que o pesquisador possa estimar a proporo verdadeira com
nvel de confiana de 95% e um erro amostra de 4%?

4 Para o exerccio anterior, suponha que no se dispusesse e nenhuma informao acerca da


proporo p, qual deveria ser o tamanho mnimo da amostra?

5 Qual deve ser o tamanho mnimo de uma amostra que ser utilizada na estimao do peso mdio
de uma populao muito grande, de pessoas adultas, sabendo-se que, por experincia, que o desvio
padro dessa populao 8kg? Adote o nvel de confiana de 99% e erro amostral 2kg.

6 Para o exerccio anterior, qual deveria ser o tamanho mnimo da amostra, se a populao fosse
constituda de 200 pessoas?

7 Um pesquisador deseja estimar a proporo de pessoas adultas, de certa regio, que usam
aparelhos auditivos. Sabe-se de uma pesquisa piloto que essa proporo 2%. Qual deve ser o
tamanho mnimo da amostra para o pesquisador estimar a proporo verdadeira com um nvel de
confiana de 95% e um erro amostral de 3%.

8 Para o exerccio anterior, suponha que no se dispusesse e nenhuma informao acerca da


proporo p, qual deveria ser o tamanho mnimo da amostra?

42
CORRELAO LINEAR SIMPLES rxy
Em pesquisas, freqentemente, procura-se verificar se existe relao entre duas ou mais
variveis, isto , saber se as alteraes sofridas por uma das variveis so acompanhadas por
alteraes nas outras. Por exemplo, peso vs. idade, consumo vs. renda, altura vs. peso, de um
indivduo.
O termo correlao significa relao em dois sentidos (co +relao), e usado em estatstica
para designar a fora que mantm unidos dois conjuntos de valores. A verificao da existncia e do
grau de relao entre as variveis o objeto de estudo da correlao.
Uma vez caracterizada esta relao, procura-se descrev-la sob forma matemtica, atravs
de uma funo. A estimao dos parmetros dessa funo matemtica o objeto da regresso.
Os pares de valores das duas variveis podero ser colocados num diagrama cartesiano
chamado diagrama de disperso. A vantagem de construir um diagrama de disperso est em que,
muitas vezes sua simples observao j nos d uma idia bastante boa de como as duas variveis se
relacionam. Uma medida do grau e do sinal da correlao usar para medida de correlao, o
coeficiente de correlao linear de Pearson, definido por:

Onde a soma dos quadrados so:

O coeficiente de correlao rxy linear um nmero puro que varia de 1 a +1 e sua


interpretao depender do valor numrico e do sinal, como segue:

TESTES DO COEFICIENTE DE CORRELAO SIGNIFICNCIA DE rxy


O coeficiente de correlao apenas uma estimativa do coeficiente de correlao
populacional e no devemos esquecer que o valor de calculado com base em de npares de dados
constituindo amostras aleatrias.
Muitas vezes os pontos da amostra podem apresentar uma correlao e, no entanto a
populao no, podemos resolver o problema aplicando um teste de hipteses para verificarmos se
o valor de coerente com o tamanho da amostra n, a um nvel de significncia , que realmente
existe correlao linear entre as variveis.

43
T calculado: T tabelado:

Exemplo: Vamos supor que 5 pessoas tenham sido questionadas, deseja-se saber se existe
correlao entre as variveis.
SUJEITO A B C D E
Frequncia escola(x) 5 8 10 12 15
Nmero de livros(y) 10 30 45 50 75

COEFICIENTE DE DETERMINAO
Indica a proporo de variao da varivel independente que explicada pela varivel dependente,
ou seja, uma ferramenta que avalia a qualidade do ajuste.

44
ATIVIDADES
Para os exerccios, calcule o coeficiente de correlao e interprete o resultado; faa o teste de
significncia para o coeficiente, ao nvel de nvel de confiana de 95% e calcule o coeficiente de
correlao.
1 Considere y tonelagem produzida de um certo material e x a rea plantada por hectares.
Y (ton) 11 14 13 20 15 24 20 27 23 33
X(rea) 10 11 11 15 14 18 20 21 20 30

2 Estudo da demanda de certo medicamento em funo de seu preo de venda, perodo de Jan a Out
X (Um.Vend.) 248 242 234 216 230 220 213 205 198 195
Y(Pre.Ven) 162 167 165 173 170 176 178 180 182 187

3 Uma cooperativa informa a relao entre a produo (kg) e a irrigao (polegadas).


X (Prod) 120 190 240 140 180 280 150 115 215 220 320
Y (Irrig) 2,5 6,5 11,0 4,0 8,5 14,0 6,0 5,0 10,0 13,5 16,0

4 Os comprimentos (cm) e larguras(cm) de 10 folhas tiradas ao acaso de determinada pastagem.


X (comp) 12 15 11 16 13 12 10 9 17 15
Y (larg) 10 14 9 13 10 12 8 7 13 14

5 Dada a tabela:
X (Num. Pacientes) 25 36 22 15 48 39 42 31 28 33
Y (grau afeco pulmes) 55 60 50 30 75 70 70 55 30 35

6 Dada a tabela:
X (peso pais) 65 63 67 64 68 62 70 66 68 67 69 71
Y (peso filhos) 68 66 68 65 69 66 68 65 71 67 68 70

45
REGRESSO
o estudo das relaes entre as variveis X eY. Interessam os casos em que a variao de
uma varivel sensivelmente dependente de outra varivel.
O problema esta em estabelecer a funo matemtica que melhor represente a relao
existente entre duas variveis.
REGRESSO LINEAR SIMPLES
Tem por objetivo descrever atravs do modelo matemtico, a relao existente entre as variveis.

Onde: a o coeficiente linear, ponto onde a reta corta o eixo da varivel y.


b o coeficiente angular, tangente do ngulo que a reta forma com a paralela do eixo x.
Assim:

Exemplo: Considere que os dados apresentados a seguir possuem correlao, onde Y o nmero de
filhos de uma famlia e X a escolaridade da me, ajuste uma equao de regresso linear. Estime o
nmero de filhos de uma famlia que apresenta escolaridade da me 4 anos.
Xi Yi XiYi Xi2 Yi2
0 3
1 3
2 5
3 4
5 6
6 7

TESTAR O COEFICIENTE DE REGRESSO LINEAR


Onde: SQTotal = Syy (n-1)gl SQregresso = b.Sxy (1)gl SQressduos =Syy b.Sxy

TESTE F : Verifica a existncia de regresso ou significncia estatstica do coeficiente d regresso.

ANOVA Anlise de varincia


Causas de variao GL SQ QM Fcalculado
Regresso

Ressduos

Total

Ftabelado = (n-2) gl, F(L, C)

Concluso: Se Fc< Ftabelado aceita-se H0 , conclui-se que no h regresso significativa.

46
ANOVA

A Anlise de Varincia (ANOVA) um procedimento utilizado para comparar trs ou mais


tratamentos. Existem muitas variaes da ANOVA devido aos diferentes tipos de experimentos que
podem ser realizados.

1 ANOVA anlise de varincia


Como j foi visto no captulo anterior, para avaliarmos a significncia do modelo de
regresso Linear como um todo, utiliza-se a anlise de varincia (ANOVA).
Exemplo: Testar o modelo de regresso dos dados de dureza em um conjunto de pistes diferentes
nveis de temperatura.

Para =0,05, obtemos que F(1; 18) =4,4138


Como F(calculado, 291,10) > F(tabelado, 4,4138) , rejeitamos com um nvel de confiana de 95% e
conclumos que a varivel explicativa tem correlao com a varivel resposta.

2 ANOVA para comparao de mdias Teste de Tuckey


Os testes de comparao de mdias servem como um complemento para o estudo da anlise
de varincia. H vrios testes de comparao de mdias, entre os quais podemos citar: teste de
Tukey, teste de Duncan, teste de Scheff, teste de Dunnet e teste de Bonferroni.
O Teste de Tukey permite testar qualquer contraste, sempre, entre duas mdias de
tratamentos, ou seja, no permite comparar grupos entre si.
O teste baseia-se na Diferena Mnima Significativa (DMS ) . A estatstica do teste dada
da seguinte forma:

Em que, q a amplitude total studentizada, tabelada ( tabela para teste Tukey) , QMRes o
quadrado mdio do resduo, e r o nmero de repeties. O valor de q depende do nmero de
tratamentos e do nmero de graus de liberdade do resduo.
EXEMPLO TESTE TUKEY EXCEL - ACTION
Fator Resistncia Fator Resistncia Fator Resistncia
15 7 25 14 35 7
15 7 25 18 35 10
15 15 25 18 35 11
15 11 25 19 35 15
15 9 25 19 35 11
20 12 30 19
20 17 30 25
20 12 30 22
20 18 30 19
20 18 30 23

47

You might also like