You are on page 1of 40

APOSTILA DE

INTRODUO ESTATSTICA
Encontre o material de estudo para seu concurso preferido em

O REI DAS APOSTILAS www.oreidasapostilas.com.br

Introduo Estatstica
?

Estatstica

uma coleo de mtodos para PLANEJAR EXPERIMENTOS, OBTER DADOS, ORGANIZ-LOS, RESUMI-LOS, ANALIS-LOS, INTERPRET-LOS e deles EXTREAIR CONCLUSES.

A estatstica uma cincia da INFORMAO.

DEFINIES IMPORTANTES

a) INDIVDUOS So os objetos descritos por um conjunto de Dados. Os indivduos podem ser: pessoas, coisas, animais etc.; b) VARIVEL qualquer caracterstica de um indivduo; c) POPULAO - a coleo completa de todos os indivduos a serem estudados; d) CENSO uma coleo de dados relativos a todos os elementos de uma populao; e) AMOSTRA uma sub-coleo de elementos extrados de uma populao;

Exemplo Nos EUA, uma pesquisa Nielsen tpica da televiso utiliza uma amostra de 4000 lares e com base nos resultados formula concluses acerca da populao de todos os 97.855.392 lares americanos.

f)

PARMETRO uma medida numrica que descreve uma caracterstica de uma populao;

g) ESTATSTICA uma medida numrica que descreve uma caracterstica de uma amostra;

Exemplo Pesquisa feita pela Bruskin-Goldring Research com 1015 pessoas escolhidas aleatoriamente, 269 (26,5%) possuam computador. Como a cifra de 26,5% se baseia em uma amostra, e no em toda a populao trata-se de uma estatstica (e no de um parmetro). Por outro lado de uma pesquisa cuja populao alvo so os alunos matriculados na disciplina de estatstica, feita com cada um desses alunos revela que 26,5% no possuem computador em casa isto um parmetro.

h) EXPERIMENTO - Conjunto de procedimentos reprodutveis que visam a obteno de informao sobre uma dada realidade. i) EXPERIMENTO DETERMINSTICO - aquele que garantidas as mesmas condies iniciais o resultado ser o mesmo.

Exemplo - Observar a temperatura de ebulio da gua em condies normais de temperatura e presso.

Exemplo - Soltar um objeto a certa altura e calcular a velocidade com que chega ao solo.

ii)

EXPERIMENTO ALEATRIO - aquele que mesmo garantindo as condies iniciais impossvel prever com certeza o resultado do mesmo.

Exemplo - O lanamento de uma moeda; Exemplo - O comportamento de um ndice financeiro como o Ibovespa (Bolsa de Valores de So Paulo);

e) VARIVEIS ALEATRIAS (VA) - So funes que associam valores numricos a resultado de experimentos aleatrios; i) VA's DISCRETAS - So aquelas que assumem um numero finito ou infinito e enumervel de valores; Praticamente podemos pensar na variveis aleatrias discretas como funes que associam resultado de experimentos aleatrios a nmeros inteiros.
?

Dica - Todas as variveis aleatrias associadas a contagem so discretas.

Exemplo: Suponha que lancemos um dado e chamemos X uma VA que assume o valor da face do dado que estiver para cima. X s pode assumir 1, 2, 3, 4, 5 ou 6. X, portanto, discreta.

Exemplo - Suponhamos agora que um estudo sobre uma populao em que estivessemos interessados em entender o perfil educacional. Suponha que num questionrio constasse o seguinte item: Escolaridade, e que as respostas possveis a esse item fossem: 0 - Analfabeto; 1 - 1 Grau Incompleto; 2 - 2 Grau incompleto; 3 - 3 Grau Incompleto; 4 - 3 Grau Completo; 5 - Ps-graduao em andamento; 6 - Ps-graduao completa. Se associarmos uma VA X a esses valore, de modo que X sp possa assumir 0, 1, 2, 3, 4, 5, ou 6 temo X como uma VA discreta.

Se num outro item do questionrio tivessemos Sexo: 0

- Masculino ou 1 - Feminino, e

associamos uma VAY, de modo que Y s pode assumir 0 ou 1, temos que Y uma VA discreta;

Exemplo: Suponha que voc um dono de restaurante. Defina X como o nmero de clientes que almoam no seu restaurante a cada dia. X pode assumir 0, 1, 2, 3, 4.... X uma VA discreta.

ii)

VA's CONTNUAS - So aquelas que assumem uma quantidade no-enumervel de valores. Para efeitos prticos aquelas que podem assumir valores num sub-conjunto dos reais.

Dica - Todas as variveis associadas medidas que dependam da preciso de um instrumento so contnuas.

Exemplo - Nos estudos astronmicos o tempo aparece em medida de bilhes de anos. Nessa escala anos, dias e horas so despresveis. Para a histria humana uma escala de anos compe um quadro suficiente. Para o dia a dia um relgio que marque hora e minutos suficiente para acertamos nossos compromissos. Para a frmula 1 os cronmetros precisam dos milsimos. Assim a durao do tempo uma medida que pode ser detalhada infinitamente, sem deixar de ser medida de tempo. Se X uma VA que mede a durao de tempo X uma VA contnua.

OBS - No caso do exemplo anterior note que h uma depend6encia da preciso do instrumento de medida.

Exemplo - Um estudo deseja entender a distribuio de alturas no Brasil. Recolhe-se uma amostra e defne-se X como a altura de um indivduo. X depende da preciso do instrumento e pode ser subdividida infinitamente, sem deixar de ser uma medida coerente de altura. X uma VA contnua.

PRINCIPAIS PARTES DA CINCIA ESTATSTICA

a) PLANEJAMENTO DE EXPERIMENTO e AMOSTRAGEM a parte da estatstica responsvel pela gerao e/ou coleta dos dados; b) ESTATSTICA DESCRITIVA a parte da estatstica responsvel pela organizao e explorao de informaes nos dados amostrais; c) INFERNCIA ESTATSTICA a parte da estatstica que a partir das informaes amostrais e utilizando TEORIA AS PROBABILIDADES faz afirmaes sobre toda a populao com um grau de certeza controlado.

Natureza dos Dados

? ?

Dados Quantitativos Consistem em nmeros que representam contagens ou medidas; Dados Qualitativos (Categricos ou Atributos) Consiste em simbolos que representam categorias.

Exemplo Dados Quantitativos Medidas de Altura; Dados Qualitativos Sexo, Escolaridade.

Os dados quantitativos podem ser divididos em duas classes:

a) Dados Discretos Resultam de um conjunto finito ou enumervel de valores (em geral dados que se expressam por nmeros inteiros); b) Dados Contnuos Resultam de um nmero no-enumervel de valores (em geral dados que se expressam por nmeros reais). OBS Quando os dados representam contagens so discretos e quando representam medies so contnuos;

Outra forma de classificao:

a) Nvel Nominal de Mensurao caraterizado por dados que consistem apenas em nomes, rtulos ou categorias. Os dados nominais no podem ser dispostos segundo um esquema ordenado.

Exemplo Respostas Sim ou No, Sexo (Dados Binrios), Marca de Automveis

OBS s vezes atribui-se nmeros a categorias (em especial quando so utilizados computadores), mas tais nmeros no tm qualquer significado para efeito de clculo. Exemplo Sexo Masculino = 1, Feminino = 0 Marca de Automvel Ferrari = 1, Mercedes = 2, Outros = 3

b) Nvel Ordinal de Mensurao Envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores dos dados no podem ser determinadas ou no tm sentido.

Exemplo Um editos classifica manuscritos de livros em: Excelentes, Bons, Maus; Numa entrevista pede-se a um consumidor ordenar trs produtos similares em 1, 2 e 3 lugar. c) Nvel Intervalar de Mensurao anlogo ao nvel ordinal, com a propriedade adicional de que podemos determinar diferenas significativas entre os dados. Todavia no existe ponto de partida, ou seja zero, inerente.

Exemplo zero);

Anos : 1000, 2000, 1776, 1944, ... (esta contagem de tempo no comeou num

Escala de Temperatura em Centgrados: 10, 20 (20 no significa que est duas vezes mais quente que 10, o zero da escala arbitrrio). OBS Entenda-se zero como ausncia da caracterstica de interesse.

d) Nvel de Razo de Mensurao o nvel de intervalo modificado de modo a incluir o ponto de partida zero inerente.

Exemplo Pesos, Durao de Tempo de um dado processo, Temperatura em Kelvin etc.

Sumrio do que foi apresentado

Nvel Nominal

Sumrio To somente categorias. Os dados no podem ser Carros: dispostos em um esquema ordenado.

Exemplo

10 Ferrari; 20 Mercedes 30 Honda

Ordinal

As categorias so ordenveis mas no podemos Carros: estabelecer diferenas, ou estas no tm sentido. 10 Compactos 20 Mdios 40 Grandes

Intervalo

Podemos determinara diferena entre valores, mas Temperatura: no h ponto de partida intrnseco. As razes no 15C tm sentido. 25C 30C (30 no duas vezes mais quente que 15)

Razo

Como intervalo, mas com um ponto de partida Peso: inerente. As razes tm sentido. 70Kg 90Kg 140Kg (140Kg duas vezes mais pesado que 70Kg)

ESTATSTICA DESCRITIVA
?

Definio um conjunto de tcnicas que visa: organizar e sumarizar a informao contida nos dados. Para este fim utiliza-se TABELAS e GRFICOS (organizao) e MEDIDAS (de centralidade e de disperso, p/ sumarizao).

TABULAO Normas para Apresentao Tabular da Estatstica Brasileira. Resoluo N 886, de 26 de outubro de 1966. (Pontos Principais)

Definies Uma tabela estatstica compe-se de elementos essenciais e elementos complementares. Os elementos essenciais de uma tabela estatstica so: o ttulo, o corpo, o cabealho e a coluna indicadora. Ttulo a indicao que precede a tabela e que contm a designao do fato observado, o local e a poca em que foi registrado. O corpo o conjunto de colunas e linhas que contm respectivamente, em ordem horizontal e vertical, as informaes sobre o fato observado. Casa o cruzamento de uma coluna com uma linha. As casas no devero ficar em branco, apresentando sempre um nmero ou um sinal convencional. Cabealho a parte superior da tabela que especifica o contedo das colunas. Coluna indicadora a parte da tabela que especifica o contedo das linha. Uma tabela pode Ter mais de uma coluna indicadora Os elementos complementares de uma tabela estatstica so: a fonte, as notas e as chamadas, e se situam de preferncia no rodap da tabela. Fonte a indicao da entidade responsvel pelo fornecimento dos dados ou pela sua elaborao. Notas: so informaes de natureza geral, destinadas a conceituar ou esclarecer o contedo das tabelas, ou a indicar a metodologia adotada na elaborao dos dados Chamadas: So informaes de natureza especfica sobre determinadas partes da tabela, destinadas a conceituar ou esclarecer dados. As chamadas so indicadas no corpo da tabela em algarismos arbicos, entre parnteses, esquerda nas casas e direita na coluna indicadora. A numerao das chamadas da tabela ser sucessiva, de cima para baixo e da esquerda para a direita. A distribuio das chamadas no rodap na tabela obedecer ordem de sua sucesso na tabela, separando-se uma das outras por ponto (.). As chamadas de uma tabela que ocupe mais de uma pgina devem figurar no rodap da tabela da ltima pgina, de acordo com a sucesso da mesma.

Sinais Convencionais

1. 2.

- (trao), quando o dado for nulo; ... (trs pontos), quando no se dispuser do dado

3.

X (letra x), quando o dado for omitido a fim de evitar a individualizao das informaes

Apresentao das Tabelas

As tabelas, excludos os ttulos, sero delimitadas, no alto e em baixo, por traos grossos, preferencialmente. Recomenda-se no delimitar as tabelas, direita e esquerda, por traos verticais.

horizontais

Ser facultativo o emprego de traos verticais para separar as colunas no corpo da tabela. Quando uma tabela, por expressa altura, tiver de ocupar mais de uma pgina, no ser delimitada na parte inferior, repetindo-se o cabealho na pgina seguinte. Neste caso, deve-se usar, no alto do cabealho ou dentro da coluna indicadora, a designao contnua ou concluso, conforme o caso.

Exemplo (Ttulo) Pessoal Docente Lotado na Universidade X Por categoria funcional e formao acadmica 1976

Categoria Funcional Formao Acadmica Graduao Especializao Aperfeioamento Mestrado Doutorado (1) Titular 10 5 1 (2) 5 (3) Adjunto 30 ... 4 3 Assistente 25 1 3 2 2 Auxiliar de Ensino 9 31 1 4 74 4 13 7 10 Total

Total

21

37

33

17

108

Fonte: Servio de Estatstica da Educao e Cultura (1) Com e sem curso de mestrado (2) Protegido pela Lei n 5.540 (3) Livres Docentes Aps a coleta dos dados e sua apurao necessta-se de mtodos de apresentao dos dados. Para tanto um dos instrumentos a TABELA. A filosofia da tabulao obedece ao seguinte critrio: mximo de esclarecimento (informao) num mnimo de esforo e tempo . Uma tabela pode ser decomposta em 3 partes: a) TTULO uma apresentao do que a tabela est tentando representar. Deve conter informaes suficientes para responder s seguintes questes: i) O QUE? (referente ao fato);

ii)

ONDE?

(referente a lugar); (referente a tempo).

iii) QUANDO

Exemplo 1 Acidentes com morte na Br 232 em 2000 O QUE? Acidentes com morte; ONDE? Br 232; QUANDO 2000.

Exemplo 2 N de acesso a disco, Servidor da Universo em 07/08/2000 O QUE? N de acesso a disco; ONDE? Servidor da Universo; QUANDO 07/08/2000.

b) CORPO composto de um conjunto de colunas e subcolunas onde so postos os dados coletados. Exemplo Previso da Populao para a Cidade de So Paulo 1984 2020 Anos 1984 1990 1995 2000 2010 2020 Fonte: XXXX c) RODAP Coloca-se todas as legendas que visam esclarecer a interpretao da tabela. Geralmente tambm no rodap que se coloca a fonte dos dados. Exemplo Sexo Tipo Maiores Menores Total 60 40 100 30 10 40 90 50 140 Homens Mulheres Total Populao(em 1000 hab.) 9439 11160 12224 13410 14910 15532

Fonte: Departamento de Relaes Industriais

SRIES ESTATSTICAS

So assim chamadas as tabelas estatsticas nas quais existe um critrio distintivo de agrupamento. So elas: a) Sries Cronolgicas; b) Sries Geogrficas; c) Sries Especficas; d) Sries Conjugadas.

1) Sries Cronolgicas (ou temporais) Neste tipo de srie o QUE (fato) e o ONDE (local) permanecem fixos, enquanto o QUANDO (tempo varia), ou seja a informao varia com a variao do tempo.

Ex: Evoluo da Demanda de Vestibulandos Brasil 1978 1982 Anos 1978 1979 1980 1981 1982 Inscritos 1.250.537 1.559.097 1.803.5674 1.735.457 1.689.249

Fonte: CODE INF/SESU/Ministrio da Educao.

OBS Aqui o QUE, Demanda de Vestibulandos, permanece fixo, bem como o ONDE, no caso o Brasil. Mas a informao muda com o tempo.

Exemplo N de Computadores Vendidos no Estado X 1 Semestre de 1986 Meses Jan Fev Mar Abr Mai Jun Fonte: XXXXXX N 25.000 26.000 340.000 350.000 190.000 220.000

2) Sries Geogrficas (ou de Localizao) Nestas sries o elemento varivel o ONDE (local) enquanto o QUE (fato) e o QUANDO (tempo) permanecem constantes.

Exemplo

Nmero de Emissoras de Rdio nas Grandes Regies do Brasil 1980 Grandes Regies Norte Nordeste Sudeste Sul Centro-Oeste Brasil Fonte: SEEC ME/IBGE. Quantidade de Rdios 43 215 517 403 85 1.263

Exemplo

Populao Brasileira Segundo as Regies 1970 Regies Norte Nordeste Sudeste Sul Centro-Oeste Brasil Fonte: IBGE Populaes 5.885.536 34.855.469 51.746.318 19.038.935 7.544.607 119.070.865

3) Sries Especficas (ou de Qualidade) So aquelas em que o ONDE (local) e o QUANDO (tempo) so fixos variando-se o QUE (fato) em subgrupos de caractersticas prprias. Exemplo

10

Matrculas no ensino 3 Grau no Brasil 1983 reas de Ensino Cincias Biolgicas e Prof. De Sade Cincias Exatas e Tecnolgicas Cincias Agrrias Cincias Humanas Letras Artes Fonte: SEEC IBGE Matrculas 180.176 334.694 38.181 761.367 94.618 24.612

Exemplo:

Corpo Docente do Ensino de 3 Grau no Brasil 1975 Especificao Titular Adjunto Assistente Colaborador Auxiliar de Ensino TOTAL Fonte: SEEC IBGE Quantidade 28.079 11.306 28.711 4.377 20.073 92.546

4) Sries Conjugadas (ou mistas) So assim classificadas as sries que combinam pelo menos duas das sries anteriores.

Exemplo:

Receita do Municpio X 1983 1986 Receita ($ 1000) Anos 83 84 85 86 Prevista 10.746.393 24.891.790 52.913.762 79.648.844 Arrecadada 10.739.487 19.374.275 60.721.847 90.757.069

Fonte: Secretaria de Economia e Finanas

11

OBS As informaes variam em dois sentidos: por ano (vertical) e por especificao do fato observado (horizontal Receita Prevista e Receita Arrecadada).

Tabela de Freqncias As tabelas de freqncias s muito importantes na estatstica. Basicamente so utilizadas para se ter uma idia quantitativa sobre a distribuio dos dados, ou seja, como os dados se manifestam. Assim como existem dois tipos de dados existem tambm dois tipos de tabelas de freqncias. 1. Tabela de freqncias para dados discretos

Neste caso a tabela de freqncias se compe basicamente de duas informaes: as possveis ocorrncia e a quantidade de vezes que cada uma ocorreu de fato.

Exemplo: Imagine que voc lana um dado 20 vezes e anota, em cada lanamento, o valor da face voltada para cima. Suponha que temos os seguintes resultados: 1 3 6 3 5 1 2 3 3 2 1 4 1 5 3 1 4 2 1 5

Para este exemplo temos a seguinte tabela de freqncias: Valores Observados (x j ) 1 2 3 4 5 6 Total OBS
? ?

Freqncia Observada (Fj ) 6 3 5 2 3 1 20

? ?

Na primeira coluna temos os primeiros valores do experimento aleatrio em questo, no nosso caso, os possveis valores das faces do dado; Na segunda coluna temos o nmero de vezes que cada face ocorreu no processo. Sendo assim l-se a tabelada seguinte forma: A face 1 ocorreu 6 vezes, a face 2 ocorreu 3 vezes, etc; A segunda coluna, coluna das freqncias, montada contando-se as ocorrncias da respectiva face da tabela de resultados do nosso experimento; A soma total da coluna das freqncias tem valor igual ao total de observaes do experimento.

Exemplo: Suponha que voc o revisor de um livro e o responsvel por encontrar os erros tipogrficos. Voc observa que o nmero mximo de erros por pgina 4. Como resultado de sua reviso voc poderia ter, para um livro de 60 pginas, a seguinte tabela de freqncias de erros:

12

N de Erros

0 1 2 3 4 Total

N de Pginas com o respectivo N de erros 30 10 5 5 10 60

2.

Tabela de freqncias para dados contnuos

Quando os dados so contnuos o mtodo de montagem da tabela de freqncias diferente. O mtodo para dados contnuos consiste no estabelecimento de classes e do nmero de ocorrncias de valores nas classes. Algumas definies importantes: ? Dados Brutos: So os dados como foram gerados, sem nenhum critrio de organizao; ? Rol: um arranjo dos dados brutos em ordem crescente ou decrescente; Exemplo: Considere uma prova feita por 25 alunos cujos resultados foram: 8,0 6,0 1,0 2,5 4,0 3,0 3,5 1,0 10,0 9,5 4,5 3,0 2,5 3,0 1,0 0,0 3,5 4,5 7,0 8,0 7,5 4,5 2,0 1,0 9,0

Da forma como esto esses dados so brutos, esto sem nenhum critrio de organizao. Um rol crescente desses dados seria

0,0 1,0 1,0 1,0 1,0


?

2,0 2,5 2,5 3,0 3,0

3,0 3,5 3,5 4,0 4,5

4,5 4,5 6,0 7,0 7,5

8,0 8,0 9,0 9,5 10,0

Limites de Classe : Uma classe um subconjunto do Rol limitada inferiormente por um nmero chamado Limite Inferior da classe e superiormente por um outro nmero chamado Limite Superior da classe.

Exemplo: Uma classe , por exemplo, o conjunto 0 |----- 3. 0 o limite inferior da classe e 3 o limite superior. O smbolo |------- indica que o limite inferior, no caso 0, contado como pertencente classe da qual limite inferior e que o limite superior, no caso 3, no contando como pertencente a essa classe. Em outras palavras para uma classe geral o seu limite inferior contado como pertencente mesma enquanto o limite superior como no pertencente.
?

Amplitude Total uma medida estatstica definida como AT = Max Min

onde: Max o valor mximo dos dados, Min o valor mnimo dos dados. No nosso exemplo: AT = 10 0 = 10

13

? ?

Ponto Mdio da Classe : a mdia aritmtica entre os limites da classe. Nmero de Classes : definido como a quantidade de classes utilizada para representar os dados. O nmero n de classes definido como sendo: n = 1 + 3,3log10(N)

onde N o nmero de dados com os quais se trabalha. OBS


? ?

Em geral n no um nmero inteiro. Neste caso n deve assumir um inteiro prximo. Ex n = 3,3 ento poderamos assumir 3 ou 4. N vale aproximadamente

N para valores de N at 50.

Para o nosso exemplo: n = 1 + 3,3log10(25) = 5,61 ? 6.


?

Amplitude de Classe : Corresponde extenso da classe, ou seja, diferena entre o limite superior e o limite inferior das classes. Na realidade na montagem da tabela temos que definir primeiro a amplitude de classe para, s ento, definirmos as classes. Para tanto usamos a seguinte expresso: AC = AT / n.

Para o nosso caso: AC = 10/6 = 1,66 OBS Podemos trabalhar tambm com amplitudes de classe mais simples, de modo a facilitar nossa operao. Neste caso aproximamos o valor para um valor de ordem superior digamos, no nosso caso, 1,7. Com estas informaes somos capazes de criar uma tabela de freqncia para nosso dados bastando, para isso, determinarmos o limite inferior da primeira classe. OBS
? ?

A exigncia sobre o limite inferior da primeira classe +e que ele seja menor ou igual ao menor valor dos dados; A exigncia sobre o limite superior da ltima classe que ele seja maior que o valor mximo dos dados.

DICA: Utilizar como limite inferior o menor valor dos dados. Finalmente para os nosso dados temos a seguinte tabela de freqncias: Classes 0,0 |-----1,7 1,7 |----- 3,4 3,4 |----- 5,1 5,1 |----- 6,8 6,8 |----- 8,5 8,5 |----10,2 Total Fj 5 6 6 1 4 3 25

OBS
?

Os nmeros da coluna de freqncias Fj so estabelecidos contando-se as quantidades de valores que caram em cada classe. Por exemplo: conta-se na classe 0,0 |----- 1,7 qualquer valor maior ou igual a 0,0 e estritamente menor que 1,7. Assim os seguintes valores so contados nessa classe: 0,0; 1,0; 1,6. Se existisse um valor 1,7 esse valor 1,7 seria contado na segunda classe 1,7 |----- 3,4.

14

As tabelas de freqncia para os dados contnuos tambm podem ser utilizadas para dados discretos. Isso ocorre quando as possibilidades de ocorrncias so muito grandes. Os valores na coluna de freqncias Fj so chamados de freqncia absoluta.

Outras colunas importantes podem ser acrescentadas s tabelas de freqncias: a. Freqncia Absoluta Acumulada (FAC ) Quando lemos os dados de freqncia absoluta somos capazes de responder pergunta: quantas observaes caram nesta classe?. No nosso caso na classe 0,0 |----- 1,7 caram 7 etc. A freqncia acumulada toma por base o limite superior da classe em questo e pergunta: at esse limite superior, quantas observaes j ocorreram?. Para o nosso caso na primeira classe temos que at 1,7 (limite superior da primeira classe) s ocorreram 5 observaes. At 3,4 (limite superior da segunda classe) ocorreram 11 observaes e assim por diante. Dessa forma teremos a seguinte tabela de freqncias:

Classes 0,0 |-----1,7 1,7 |----- 3,4 3,4 |----- 5,1 5,1 |----- 6,8 6,8 |----- 8,5 8,5 |----10,2 Total

Fj 5 6 6 1 4 3 25

FAC 5 11 17 18 22 25 25

OBS: A FAC da ltima classe tem que ser o valor total das observaes, pois o limite superior da ltima classe tem que ser maior que o maior valor dos dados.

b.

Freqncia Relativa (FREL) A freqncia relativa mostra aperticipao percentual da classe no todo dos dados. definida como a freqncia absoluta dividida pela quantidade total de observaes. Assim na classe 0,0 |-----1,7 temos como freqncia relativa 5/25 = 0,20 e assim por diante de modo que nossa tabela dada por: Classes 0,0 |-----1,7 1,7 |----- 3,4 3,4 |----- 5,1 5,1 |----- 6,8 6,8 |----- 8,5 8,5 |----10,2 Total OBS
? ?

Fj 5 6 6 1 4 3 25

FAC 5 11 17 18 22 25

FREL 0,20 0,24 0,24 0,04 0,16 0,12 1,00

A soma da coluna de freqncias relativas sempre igual a 1, que corresponde a 100%; A coluna de freqncias relativas pode ser lida como percentual.

c.

Freqncia Relativa Acumulada (FREL AC ) Obedece ao mesmo princpio da freqncia acumulada normal, s que ao invs de acumular-se a freqncia relativa. Assim:

15

Classes 0,0 |-----1,7 1,7 |----- 3,4 3,4 |----- 5,1 5,1 |----- 6,8 6,8 |----- 8,5 8,5 |----10,2 Total

Fj 5 6 6 1 4 3 25

FAC 5 11 17 18 22 25

FREL 0,20 0,24 0,24 0,04 0,16 0,12 1,00

FREL AC 0,20 0,44 0,68 0,72 0,88 1,00

Estatstica Grfica A estatstica grfica consiste na utilizao de estruturas geomtricas, cores, noes de proporo etc, para expor a informao contida nos dados. A filosofia a mesma das tabelas: o mximo de informao no mnimo de espao. 1. Grficos para Representao de Freqncias
?

Dados Discretos: Consiste em associar a cada valor ocorrido uma haste cuja a altura diretamente proporcional ao valor da freqncia do valor em questo. Exemplo: Num lanamento de um dado 20 vezes podemos ter o seguinte resultado: Valores Observados 1 2 3 4 5 6 Total Freqncias Observadas 6 3 5 2 3 1 20

Grfico para Freqncias Discretas


6 5 4 3 2 1 0 1 2 3 4 5 6

16

OBS 1. 2. 3. 4. As informaes de freqncias so representadas pelas hastes. Quanto maior a freqncia observada maior ser a haste associada; As hastes no tm espessura, so linhas verticais; No se ligam os pontos extremos superiores das hastes; Este grfico tambm pode ser utilizados para representar freqncia acumulada, relativa e relativa acumulada. Nestes caso a mudana acontece na escala do eixo y, ficando o eixo x inalterado.

Para o nosso caso temos o seguinte grfico para freqncia acumulada:

Grfico de Freqncia Acumulada


25 20 15 10 5 0 1 2 3 4 5 6

Dados Contnuos 1. Histogramas Um dos mais famosos grficos e importantes grficos em estatstica representa as freqncias, para dados contnuos, atravs de retngulos justapostos cujas reas so proporcionais s freqncias de classes. Exemplo: Voltemos ao exemplo das notas. Temos a seguinte tabela de freqncias. Classes de Notas 0,0 |----- 1,7 1,7 |----- 3,4 3,4 |----- 5,1 5,1 |----- 6,8 6,8 |----- 8,5 8,5 |----- 10,2 Total Fj 5 6 6 1 4 3 25

Para este caso temos o seguinte histograma:

17

Histograma Freqncia Absoluta


6 5 4 3 2 1 0 0,85 2,55 4,25 5,95 7,65 9,35

OBS 1. 2. 3. 4. Os retngulos tm rea proporcional freqncia; Os retngulos devem ser da mesma cor pois isso indica que representamos a mesma realidade em cada classe; No deve haver distncia entre as colunas dos histogramas; Assim como na representao de dados discretos o histograma tem tambm suas verses Acumulada, Relativa e Relativa Acumulada. O formato da verso relativa igual verso absoluta e a verso da relativa acumulada ao da acumulada, em ambos os casos variando-se apenas o eixo y.

Para o nosso caso

Classes de Notas 0,0 |----- 1,7 1,7 |----- 3,4 3,4 |----- 5,1 5,1 |----- 6,8 6,8 |----- 8,5 8,5 |----- 10,2 Total O histograma para a FAC

Fj 5 6 6 1 4 3 25

FAC 5 11 17 18 22 25

Histograma da Freqncia Absoluta Acumulada


25 20 15 10 5 0

18

2.

Polgono de Freqncias

Uma outra forma de representao de dados o polgono de freqncias. Nesta representao utiliza-se uma linha poligonal para representar a variao das freqncia das classes. Exemplo: Voltemos mais uma vez ao nosso exemplo das notas

Classes de Notas 0,0 |----- 1,7 1,7 |----- 3,4 3,4 |----- 5,1 5,1 |----- 6,8 6,8 |----- 8,5 8,5 |----- 10,2 Total

Fj 5 6 6 1 4 3 25

PM 0,85 2,55 4,25 5,95 7,65 9,35

Para desenhar o polgono de freqncias precisamos do ponto mdio das classes. A partir destas marca-se a altura correspondente freqncia e depois une-se esses pontos por uma linha poligonal. Assim temos

Polgono de Freqncias Freqncia Absoluta


6 5 4 3 2 1 0 -0,85 0,85 2,55 4,25 5,95 7,65 9,35 11,1

OBS ? O grfico consiste na ligao dos pontos cartesianos formados pelos pontos mdios das classes e as freqncias por linhas poligonais; ? Os pontos inicial e final do grfico so pontos mdios das classes que existiriam antes da primeira e depois da ltima classe real dos dados. Eles so introduzidos para manter a proporcionalidade na representao dos dados; ? Este grfico tambm pode ser utilizado para representar freqncias acumuladas. Neste caso usam-se os pontos finais da classe como referncia, ao invs dos pontos mdios. Para o nosso caso:

19

Polgono de Freqncias Freqncias Acumuladas


25 20 15 10 5 0 0 1,7 3,4 5,1 6,8 8,5 10,2

? O polgono de freqncias tambm pode ser utilizado para representar a freqncia relativa acumulada. O polgono para freqncia relativa tem a mesma forma do grfico de freqncia absoluta e o grfico de freqncia absoluta acumulada mesma forma do polgono de freqncias acumuladas. Em ambos os casos, apenas existe diferena na escala do eixo y.

2.

Grficos para Representao de Dados Diversos At agora vimos a representao grfica apenas para dados de freqncia. Outros grficos so importantes para representar outras classes de dados. a. Grficos Lineares So usados principalmente para representar sries temporais. Consiste em uma forma cartesiana simples em que os pares ordenados (x,y) representam a informao e so conectados por linhas poligonais. Exemplo: Um pesquisador est estudando a populao de um dado pas e obtm os seguintes dados: Ano 1990 1991 1992 1993 1994 Populao (em milhes) 100 108 115 125 137

O grfico linear para esses dados :

20

Grfico Linear
140 130 120 110 100 90 1990 OBS
? ? ?

1991

1992

1993

1994

O grfico linear tem o mesmo comportamento do polgono de freqncias mas serve para representar dados que no so freqncias. O grfico linear muito bom quando se que enfatizar tendncias; Mais de uma srie pode ser representada no mesmo grfico. Para tanto deve-se observar: 1. Compatibilidade dos eixos; 2. A utilizao de cores ou padres para enfatizar as linhas 3. A utilizao de legendas. Exemplo: Suponhamos uma empresa com a seguinte evoluo financeira Ano 1998 1999 2000 2001 Receita (x 1000) 100 110 120 130 Despesa (x 1000) 80 100 120 140

Grfico Linear para Dados Multivariados


150 140 130 120 110 100 90 80 70 1998 1999 2000 2001

4.

Um indicador de tendncia do grfico linear a inclinao dos seguimentos de reta que o compe. A tendncia to maior quanto maior for a inclinao dos mesmos.

b.

Grfico de Colunas ou Barras

21

Os grficos de colunas ou barras so grficos que, assim como o histograma, representam a magnitude dos dados pela rea do retngulo. Os retngulos tm um lado fixo e, portanto, a magnitude dos dados representada pela outra dimenso. Quando os retngulos esto em posio vertical diz-se que temos grfico de colunas, caso em posio horizontal diz-se que temos grficos de barras. Todas as observaes feitas para os grficos de colunas valem para os grficos de barras, respeitada a orientao particular. Em geral os grficos de barra podem representar qualquer srie , mas so particularmente importantes para sries especficas.
?

Grficos de colunas justapostas So grficos em que a base do retngulo representa uma categoria (tipos, datas etc) e que a altura do mesmo proporcional magnitude dos dados. Exemplo: Em uma universidade foi feito um levantamento sobre o nmero de alunos inscritos por curso obtendo-se: Curso Administrao Anlise de Sistemas Direito Pedagogia N alunos 50 30 70 20

Temos o seguinte grfico de colunas justapostas para o nosso exemplo

Grfico de Colunas Justapostas


80 70 60 50 40 30 20 10 0
Administrao Anlise de Sistemas Direito Pedagogia

70 50 30 20

OBS o o Os grficos de colunas justapostas podem vir com as colunas coladas ou com intervalos regulares entre elas; Pode-se colorir o grfico colocando uma cor em cada coluna ou ainda um padro de preenchimento para cada coluna. Neste caso pode ser necessria uma legenda; Todo raciocnio anterior vlido para os grficos de barras lembrando que nesse caso a base do retngulo est no eixo vertical, como abaixo

22

Grfico de Barras Justapostas


Pedagogia

20 70 30 50 0 20 40 60 80

Direito Anlise de Sistemas Administrao

c.

Grficos de Colunas para Sries Multivariadas Estes grficos so utilizados para representar dados onde para cada objeto observado existe mais de uma fonte de informao. Este grfico uma generalizao do grfico de colunas justapostas e, portanto, segue o mesmo tipo de regra de formao. Exemplo: Suponha que o MEC fez um levantamento de dados sobre o nmero de alunos nos cursos de Administrao, Direito, Pedagogia e Letras em quatro universidades de uma mesma cidade obtendo a seguinte srie:

Curso Universidade A B C D

Administrao 100 80 90 120

Direito 150 90 80 150

Pedagogia 70 30 20 80

Letras 50 40 20 60

Uma representao grfica para esses dados a seguinte

Grficos para Sries Multivariadas


160 140 120 100 80 60 40 20 0 Administrao Direito

Universidade Universidade Universidade Universidade


Pedagogia Letras

A B C D

23

OBS
?

No grfico de sries multivariasdas uma noo muito clara tem que ser a de classes distintas. Deve estar claro para o leitor onde comea e onde termina a informao sobre cada classe. Isso se consegue colocando um espao vazio separando-as. Dentro da mesma classe as colunas podem vir juntas ou separadas. Se vierem separadas a distncia entre elas deve ser visivelmente menor que o espao entre as classes, de modo que no haja confuso na leitura da informao; As colunas devem seguir a mesma ordem em cada classe. Cada coluna deve apresentar uma cor e/ou padro de preenchimento diferente, constantes em cada classe, e uma legenda deve ser associada ao grfico, de modo a facilitar a transmisso de informaes.

Medidas de Centralidade

As medidas de centralidade que vamos estudar so: ? Mdia ? Mediana ? Moda 1. Mdia 1.1. Mdia Aritmtica A mdia aritmtica definida, para dados no agrupados, ou seja que no vem organizados em uma tabela de freqncia como sendo:

X?
onde n n de observaes x j valor das vrias observaes

?
j

xj n

Exemplo: Suponha os seguintes dados: 5, 6, 10, 8, 7, 6 A mdia para esse exemplo :

5 ? 6 ? 10 ? 8 ? 7 ? 6 ? 7. 6

Quando temos dados agrupados a mdia calculada como sendo:

X?
onde

x jFj n

n n de observaes; x j valor das observaes (caso discreto) ou ponto mdio das classes (caso contnuo); Fj Freqncia absoluta das observaes (caso discreto) ou das classes (caso contnuo). Exemplo: Suponha a seguinte tabela de freqncias para dados discretos Ocorrncias 0 2 3 4 Neste caso a mdia calculada como: Fj 2 3 5 4

24

0 x2 ? 2 x3 ? 3 x5 ? 4 x 4 ? 2,64 2 ? 3? 5 ? 4
Exemplo: Suponha a seguinte tabela de freqncias para dados contnuos Classes 0 |----- 2 2 |----- 4 4 |----- 6 6 |----- 8 Fj 1 3 4 2 Ponto mdio 1 3 5 7

Neste caso a mdia dada por

1x1 ? 3 x3 ? 5 x 4 ? 7 x 2 ? 4 ,4 1? 3? 4 ? 2
1.2. Clculo Simplificado da Mdia Aritmtica Quando os valores dos dados esto separados por um valor constante (caso discreto) ou quando temos classes do mesmo tamanho (caso contnuo) e os as ocorrncias (caso discreto) ou os pontos mdios das classes (caso contnuos) so muito grandes para se usar o clculo tradicional pode se usar o mtodo simplificado de clculo que consiste nos seguintes passos:
?

Calcula-se um novo ponto de referncia definido como:

uj ?
onde

x j ? x0 h

? ?

x j valor das ocorrncias (caso discreto) ou ponto mdio (caso contnuo); x 0 valor constante escolhido arbitrariamente entre as ocorrncias (caso discreto) ou pontos mdios (caso contnuo). A idia escolh-lo o mais prximo possvel dos valores centrais; h diferena entre duas ocorrncias consecutivas (caso discreto) ou dois pontos mdios consecutivos (caso contnuo). Calcula-se mdia para os novos valores de referncia (uj ) calculados; Calcula-se a mdia procurada utilizando a seguinte expresso:

X ? hu ? x0

Exemplo: Dada a tabela de freqncias abaixo calcule a mdia Classes 20 22 24 26 |----|----|----|----22 24 26 28 Fj 2 5 4 1 Ponto mdio 21 23 25 27 uj -1 0 1 2

Para este exemplo temos: x0 = 23, h = 2 Assim

u?

? 1x 2 ? 0 x5 ? 1x 4 ? 1x 2 ? 0 ,4 10

25

X ? 0,4 x 2 ? 23 ? 23,80
1.3. Mdia Harmnica A mdia harmnica definida como

Mh ?

?
?

n Fj xj

1.4. Mdia Geomtrica A mdia geomtrica definida como

Mh ?
1.5. Relao entre as mdias

xjj

Mh ? Mg ? X
2. Mediana ( X ) A mediana a medida estatstica que deixa 50% dos valores abaixo de si e 50% acima. Temos dois processos para achar a mediana: um para dados no agrupados e outro para dados agrupados. 2.1. Mediana para dados desagrupados. ? Nmero mpar de valores Quando tivermos dados no agrupados e o nmero de observaes for mpar seguimos o seguinte processo. Ordenamos os dados em ordem crescente, Calculamos o termo de ordem

? n ? 1? ? ? , ? 2 ?

A mediana ser o valor colocado nessa posio. Exemplo: 1, 5, 2, 3, 4, 7, 5, 8, 1 Ordenando os dados: 1, 1, 2, 3, 4, 5, 5, 7, 8 O termo que queremos tem ordem [(9+1)/2] = 5 Logo
?

~ X ?4

Nmero par de valores Quando tivermos dados no agrupados e o nmero de observaes for par seguimos o seguinte processo: Ordenamos os dados em ordem crescente Calculamos a ordem

?n ? ? ? ?2 ?

A mediana ser a mdia entre o valor da ordem acima indicada e o prximo. Exemplo: 1, 3, 7, 5, 5, 4, 3, 2, 4,3 Ordenando:1, 2, 3, 3, 3, 4, 4, 5, 5, 7 Calculando a ordem (10/2) = 5 A mediana 2.2. Dados Agrupados

~ 5 ? 6 3 ? 4 X? ? ? 3,5 2 2

26

Quando tivermos dados agrupados discretos procedemos da mesma forma dos dados desagrupados, utilizando entretanto recursos provindos da tabela de freqncias. Exemplo: Suponha a seguinte tabela de freqncias

Ocorrncias 0 2 3 4

Fj 2 3 5 4

FAc 2 5 10 14

Observe que o n de observaes par (14). Neste caso como no caso anterior calcula-se o temo de ordem (n/2), que nesse caso 7 e o prximo 8. A diferena aqui que para procurar os termos utilizamos a tabela de freqncias acumuladas utilizando a seguinte regra: a primeira vez que a freqncia acumulada dos dados for maior do que a ordem procurada aquele o valor naquela ordem. Assim o 5 elemento 2 (Fac = 5) e o 6 3. Neste caso a mediana ser

~ 2? 3 X? ? 2,5 2

Se tivermos dados contnuos utilizamos o seguinte processo ? Calculamos o termo de ordem (n/2) ? Definimos em que classe est a mediana; ? Calcula-se a mediana com a frmula

~ X ? l?
onde

?n 2 ?? F ?h
ACA

FX ~

l limite inferior da classe onde est a mediana ; n nmero de observaes FACA FAC da classe anterior

FX ~ - Freqncia Absoluta da classe em que est a mediana


h Amplitude de Classe Exemplo: Considere a seguinte tabela de freqncias para dados contnuos

Classe 0 |----- 2 2 |----- 4 4 |----- 6 6 |----- 8


?

Fj 2 3 5 4

FAc 2 5 10 14

Clculo do termo de ordem (n/2) = 7 OBS Se n/2 no for inteiro considera-se o primeiro inteiro maior que o valor de n/2. Pela FAC sabemos que a mediana est na classe 4 |--- 6. OBS Para encontra a classe em que est a mediana basta achar a classe em que a FAC maior ou igual ao valor assumido para n/2. Calculando agora a mediana

~ ?7 ? 5?2 ? 4,8 X ? 4? 5
3. Moda A moda , por definio, o valor mais freqente dos dados. Assim para dados no agrupados ou para tabelas de freqncia de dados discretos basta localizar o valor de maior freqncia, e este ser a moda.

27

Exemplo: Considere os seguintes dados 1,4,5,4,3,2,5,7,1,5,5 Neste exemplo a moda Mo = 5. Exemplo: Considere a seguinte tabela de freqncias para dados discretos

Ocorrncias 0 2 3 4

Fj 2 3 5 4

Neste caso basta observarmos qual a maior freqncia e a moda ser o valor que tem esta freqncia. Nosso exemplo a maior freqncia 5 e o valor associado a ela 3 logo nossa moda Mo = 3. Caso tenhamos dados contnuos o clculo da moda um pouco mais complicado. Procedemos da seguinte forma:
? ?

Definimos qual a classe que tem maior freqncia. Esta classe chamada classe modal; Calculamos a moda com a frmula

Mo ? l ?
onde

?? 1 ?h
?1 ? ?
2

? 1 - Freqncia da classe modal menos freqncia da


da classe anterior; ? 2 - Freqncia da classe modal menos freqncia da da classe posterior; h Amplitude de Classe Exemplo: Suponha a seguinte tabela de freqncias

l limite inferior da classe modal

Classes 0 |----- 2 2 |----- 4 4 |----- 6 6 |----- 8


? ?

Fj 1 3 4 2

Localizar a classe de maior freqncia: Classe 4 |---- 6 Calculando a moda

? ? 4? 3 2 Mo ? 4 ? ? ? ?4 ? 3? ? (4 ? 2) ? ?2 ? 4 ? 3 ? 4,67 ? ?

28

Medidas de Disperso Suponha que estivssemos observando dois grupos de alunos e anotando os resultados dos mesmos em uma dada prova. Suponha ainda que os resultados fossem: Grupo 1 - 5,0 ; 5,0 ; 5,0 ; 5,0 ; 5,0 Grupo 2 - 4,0 ; 5,0 ; 8,0 ; 7,0 ; 1,0. Se calcularmos a mdia dos dois grupos vemos que ambos apresentam a mesma mdia aritmtica, 5,0, mas tambm vemos claramente que o conjunto de dados provm de grupos cujos resultados so bem diferentes. A diferena entre um grupo e outro se encontra num fato que a mdia, assim como qualquer outra medida de posio no pode perceber: a variabilidade dos dados. Para caracterizar essas diferenas os estatsticos criaram as medidas de disperso, das quais vamos estudar: ? Amplitude Total; ? Desvio mdio; ? Varincia; ? Desvio Padro; ? Coeficiente de Variao

1.

Amplitude Total (AT) uma medida muito simples, sendo definida como a diferena entre o maior e o menor valor das observaes, ou seja AT = mx - mn Exemplo: Suponha que temos o seguinte conjunto de dados 1; 2,5; 3; 1; 7; 2; 5. Para esse caso a amplitude total dada por AT = mx - mn AT = 7 - 1 = 6 OBS - Essa medida tem aplicaes muito limitadas pois s capta o que acontece com os valores extremos, sendo completamente insensvel aos valores intermedirios.

2.

Desvio Mdio (DM) Uma maneira muito interessante de perceber como os dados esto dispersos perceber como esto variando em torno da mdia. Uma forma de fazer isso com o desvio mdio. O desvio mdio definido como a mdia dos valores absolutos dos desvios em relao mdia aritmtica, ou seja:

DM ?
onde

x j ? X Fj n

x j - a j-sima ocorrncia possvel (caso discreto) ou o ponto mdio do j-simo intervalo (caso contnuo); Fj - a freqncia absoluta da j-sima ocorrncia possvel (caso discreto) ou da j-sima classe (caso contnuo);

X - a mdia aritmtica das observaes;

29

n - nmero de observaes; Exemplo: Suponha que temos a seguinte tabela de freqcias Classes Fj 0 |---- 2 1 2 |---- 4 3 4 |---- 6 2 6 |---- 8 1 Para facilitar a aplicao da expresso do desvio mdio, vamos criar algumas colunas auxiliares na nossa tabela de freqncias, de modo que nossa nova tabela dada por: Classes Fj Ponto Mdio xj 1 3 5 7 x j Fj |x j 2,86 0,86 1,14 3,14

X|

|x j -

X |Fj

0 |---- 2 2 |---- 4 4 |---- 6 6 |---- 8 Totais

1 3 2 1 7

1 9 10 7 27

2,86 2,58 2,28 3,14 10,86

As colunas auxiliares so, na verdade, organizao do processo aritmtico de clculo da medida. Observe que para montar a 5 coluna precisamos saber quanto vale a mdia aritmtica. Para tanto podemos usar as colunas 4 e 2 para calcular. Nesse caso temos

X?
Assim

27 ? 3,86 7

DM ?
2

10.86 ? 1.55 . 7

3.

Varincia (S )

Outra medida de disperso em torno da mdia a varincia que definida como

S2 ?
onde

1 ?x j ? X ?2 F j ? n?1

x j - a j-sima possvel ocorrncia (caso discreto) ou o ponto mdio da j-sima classe (caso contnuo); Fj - Freqncia Absoluta da j-sima ocorrncia possvel (caso discreto) ou da j-sima classe (caso contnuo);

X - Mdia aritmtica da amostra;


n - Nmero de observaes da amostra.

OBS ? ? fato de dividirmos por n-1 est relacionado ao fato de j termos usado a amostra para calcular a mdia Da forma como est definida a varincia se torna muito inconveniente para ser calculada. Mas desenvolvendo sua expresso chega-se a uma forma alternativa muito mais prtica

30

1 ? ?? x 2 S ? j Fj ? n?1? ?
2

??

2 x j Fj ? ? ? n ? ?

Exemplo: Retornemos ao exemplo anterior criando mais uma vez colunas auxiliares Classes 0 |----- 2 2 |----- 4 4 |----- 6 6 |----- 8 Totais Logo Fj 1 3 2 1 7 xj 1 3 5 7 x j Fj 1 9 10 7 27 xj 1 9 25 49
2

x j Fj 1 27 50 49 127

S ?
2

1? ?27 ?2 ? 127 ? ? ? ? 3,8 6? 7 ?

Algumas propriedades da Varincia (a) Varincia de dados constantes zero; 2 (b) Suponha que temos um conjunto de dados tais que a sua varincia dada por S . Suponha que por algum motivo os dados sejam multiplicados por uma constante c. 2 2 Assim a varincia do conjunto de dados multiplicado pela constante dada por c S . 2 (c) Suponha que temos um conjunto de dados cuja varincia seja S . Suponha que por algum motivo multiplica-se os dados por uma constante "a" e soma-se ao resultado uma outra constante "b". A nova varincia dos dados, depois de feitas as operaes 2 2 ser a S . Clculo simplificado da varincia. Assim como no caso da mdia tambm no caso da varincia existe um processo simplificado de clculo. Como no caso da mdia tambm dividiremos em 3 etapas: ? Define-se a seguinte transformao nos dados

zj ?
onde

x j ? x0 n

x j - observaes originais (no caso de dados desagrupados ou agrupados discretos) ou ponto mdio das classes (caso contnuo); x 0 - constante arbitrria escolhida convenientemente; h - Distancia entre as observaes (caso discreto) ou amplitude de classe (caso contnuo) Exemplo: Seja a seguinte tabela de freqncias xj 8 9 10 11 Fj 3 6 4 2

31

Vamos assumir a seguinte transformao

zj ?

x j ? 10 1

Neste caso acrescentando uma coluna para os valores transformados teramos xj 8 9 10 11 O prximo passo consiste em calcular a Fj z j 3 -2 6 -1 4 0 2 1 varincia dos dados transformados

S z2 ?

1 2 ? z j ? Z ? Fj ? n?1 2 ? z j Fj ? ? 1 ? ? 2 ?? z j F j ? ? ? n?1? n ? ? ?

Assim para o nosso exemplo acrescentamos as colunas auxiliares, em relao a z para o clculo da varincia:
2 2

xj 8 9 10 11 Totais Logo

Fj 3 6 4 2 15

zj -2 -1 0 1

z j Fj -6 -6 0 2 -10

zj 4 1 0 1

z j Fj 12 6 0 2 20

Sz ?
2

1 ? 100 ? 20 ? ? 0.95 ? 14 ? 15 ? ?

O terceiro passo consiste em calcular propriamente a varincia dos dados originais. Para tanto aplica-se a propriedade (c) da varincia pois observe-se que a transformao utilizada pode ser escrita como sendo

x j ? hz j ? x 0
Sendo assim aplicando-se a propriedade (c) temos que

S 2 ? h 2 S z2
Logo para o nosso caso temos

S 2 ? 1x 0,95 ? 0 ,95
4. Desvio Padro (S) Pelo fato de a Varincia ser uma medida que utiliza o quadrado dos desvios em relao mdia, sentiu-se a necessidade de uma medida que utilizasse a mesma unidade dos dados. Esta medida chamada desvio padro. O desvio padro definido to somente como a raiz quadrada positiva da varincia.

S?
32

S2

5.

Coeficiente de Variao (CV) uma medida relativa de disperso. Utilizada para fazer comparao da disperso de duas sries distintas em torno de suas respectivas mdias. Define-se como

CV ?

S X

Exemplo: Considere que tenhamos duas sries. A primeira com mdia 4 e desvio padro 1.5 e outra com mdia 3 e desvio padro 1.3. Neste caso temos os seguintes CV's:

1 .5 ? 0.375 4 1 .3 CV2 ? ? 0.43 3 CV1 ?


logo conclui-se que a primeira srie tem uma disperso relativa em torno da mdia maior que a segunda. Em geral CV maior ou igual a 50% considerado alto, sendo a mdia pouco representativa. Valores menores que 50% implicam CV baixo e a mdia to mais representativa quanto menor for o valor do CV.

Medidas de Assimetria, Curtose e Complementos s Medidas de Centralidade

Uma questo importante quanto descrio dos dados saber onde est a maior concentrao de valores (por exemplo se a maior concentrao se d antes ou depois da mdia). Esta questo respondida pelas medidas de assimetria. Uma outra questo que podemos responder : como se d a concentrao? Muito acentuada ou no ? Para essa pergunta utiliza-se os coeficientes de Curtose. 1. Assimetria

Diz-se que uma distribuio simtrica se obedece seguinte condio

~ X ? X ? Mo
Graficamente

Quando uma distribuio no simtrica diz-se que assimtrica. Neste caso temos duas possibilidades:

33

Assimetria Direita ou Positiva - Isso ocorre quando a maior concentrao dos dados est localizada abaixo da mdia, ou seja

~ Mo ? X ? X
Graficamente

Assimetria Esquerda ou Negativa - isso ocorre quando temos uma concentrao dos dados acima da mdia, ou seja

~ Mo ? X ? X
Graficamente

Uma medida estatstica que caracteriza a assimetria o coeficiente de Pearson que definido como

As ?
onde

X ? Mo S

X a mdia aritmtica;

Mo

a moda

S o desvio padro

Para essa medida temos o seguinte comportamento

Se As ? 0 ? Simetria Se As ? 0 ? Assimetria Esquerda Se As ? 0 ? Assimetria Direita

34

2. Curtose

A curtose uma medida de "achatamento" da distribuio. Se uma distribuio pouco achatada dizemos que Leptocrtica. Quando a distribuio tem um certo grau de achatamento dizemos que Mesocrtica. Quando muito achatada diz-se que Platicrtica.. Graficamente podemos representar como

A medida estatstica que caracteriza a Curtose

K?
Se

Q3 ? Q1 2( P90 ? P10 )

K ? 0.263 ? Mesocrtica K ? 0.263 ? Platicrtica K ? 0.263 ? Leptocrtica


Nmeros ndices

Os nmeros ndices so medidas estatsticas usadas para comparar grupos de variveis relacionadas entre si e para obter um quadro de mudanas significativas ao longo do tempo ou ao longo do espao. 1. Relativos de Preo, Quantidade e Valor

um ndice simples que compara preo, quantidade e/ou valor em dois pontos distintos do tempo.

Relativo de Preo

p 0,t ? q 0,t ? qt q0 v 0,t ?

pt p0

Relativo de Quantidade

Relativo de Valor

pt qt p0 q 0

Onde

35

p0 pt q0 qt v0 vt

- Preo n poca-base; - Preo na poca atual; - Quantidade na poca-base; - Quantidade na poca atual; - Valor na poca-base - Valor na poca atual.

Exemplo: Em 1999 uma empresa vendeu 500 unidade de um produto a um preo unitrio de $50,00. Em 2000 vendeu 800 unidade do mesmo produto ao preo unitrio $ 70,00.

p 2000 70 ? ? 1,4 ou 140% p1999 50 q 800 q 99,00 ? 2000 ? ? 1,6 ou 160% q1999 500 p q 70 x800 v 99,00 ? 2000 2000 ? ? 2,4 ou 224% p1999q1999 50 x 500 p 99,00 ?
ou seja, tivemos uma alta relativa de preos (40%), uma alta relativa de quantidade (60%) e uma alta relativa de valor (124%).

2.

Nmeros-ndice Sintticos

Na prtica os problemas envolvendo ndices de preos so mais complexos que a simples comparao dos relativos. So resultantes da necessidade de comparao de vrias sries. Para se resolver este problema criou-se um conjunto de ndices, cujos principais so: a) ndice Agregativo Simples

De preos

Ip ? Iq ?

De quantidade

? ? ? ?

pti
i p0

q ti
i q0

Onde
i p0 - o preo do produto i no ano base;

p ti - o preo do produto i no perodo atual;


i q0 - a quantidade do produto i no ano base;

q ti - a quantidade do produto i no perodo atual.


um ndice de fcil aplicao com as seguintes limitaes:
? ?

Falta de ponderao dos ndices; Falta de Homogeneidade dimensional dos diversos itens.

36

Exemplo: Suponha que para dois produtos que queremos compara tenhamos os seguintes dados: 1999 Preo Unitrio 30 40 2000 Preo Unitrio 40 45

Produto A B

Quantidade Vend. 100 150

Quantidade Vend 90 200

Para esse caso temos

Ip ?

40 ? 45 85 ? ? 1,21 ou 121% 30 ? 40 70

ou seja, por esse ndice tivemos um aumento de 21% nos preos.

Iq ?

200 ? 90 290 ? ? 1,16 ? 116% 100 ? 150 250

ou seja, por esse ndice tivemos uma aumento de 16% nas quantidades. b) ndices Mdios dos Relativos Mdia Aritmtica

P0,t ?

i p0 ,t

n
i q0 ,t

Q0 ,t
Mdia Geomtrica

? ?

P0G ,t ? Q0G ,t ?
Mdia Harmnica

? ?

i p0 ,t

i q0 ,t

P0H ,t ?

? ?

n ? pti,0 n ? qti,0

? ?

Q0H ,t ?

1 i p0 ,t n 1 i q0 ,t

onde
i p0 ,t - o relativo de preo do produto i;

37

i q0 ,t - o relativo de quantidade do produto i.

Exemplo: Voltando ao exemplo anterior temos:

P99,00 ?

40

30 ? 2

45

40 ? 1.23

Q99, 00

90 ? 200150 100 ? ? 1.12 2

G 40 45 P99 ,00 ? 30 40 ? 1.22

G Q99 ,00 ?

90

100
2

200

150 ? 1.09

H P99 ,00 ?

H Q99 ,00

? 1.22 1 1 ? 40 45 30 40 2 ? ? 1.07 1 1 ? 90 200 100 150

c) ndices Ponderados

Devido a deficincia dos ndices simples, em especial no critrio relativo a importncia de cada produto no ndice, criou-se uma seqncia de ndices ponderados, dos quais os mais importantes so: (1) ndice de Laspeyres Este ndice definido como a mdia ponderada dos relativos, sendo que a ponderao feita utilizando-se os preos ou as quantidades da poca-base. Assim temos o ndice de preos

L0,t ?
e o ndice de quantidade

? ? ? ?

i p it q0 i i p0 q0

L0,t ?
Q

i q it p0 i i q0 p0

(2) ndice de Paasche Este ndice absolutamente similar ao ndice de Paasche, com a diferena de que a ponderao feita utilizando-se a data atual. Assim o ndice de preos

38

P0,t ?
enquanto o ndice de quantidade

? ? ? ?

p ti qti
t i p0 qt

P ?
Q 0 ,t

q ti pti
t q0 p ti

Voltando ao exemplo anterior calculemos os ndices de Paasche e Laspeyres:

L99,00

? ? ? ? ? ? ? ? ?

i p i2000q1999

i i 1999 1999

40 * 100 ? 45 * 150 ? 1,194 30 * 100 ? 40 * 150 90 * 30 ? 200 * 40 ? 1,19 100 * 30 ? 150 * 40 40 * 90 ? 45 * 200 ? 1,18 30 * 90 ? 40 * 200

Q 99 ,00

i q i2000 p1999

i 1999

i 1999

P99,00

i p i2000q2000

t 1999

i 2000

Q 99 ,00

? ?

i q i2000 p2000

t 1999

i 2000

90 * 40 ? 200 * 45 ? 1,17 100 * 40 * ? 150 * 45

d) Mudana de Base

Na prtica a mudana de base de uma srie feita dividindo-se cada ndice da srie original pelo nmero-ndice correspondente nova poca bsica. Tal procedimento no 100% correto mas seu uso tem sido freqnte e com bons resultados. Exemplo. A tabela abaixo apresenta o ndice de produo industrial de 1979 a 1987, sendo o ano base 1979. Obter uma nova srie de ndices, adotando 1983 como base:

Anos ndice De Produo Industrial (1979=100)

1979 100

1980 104

1981 97

1982 112

1983 120

1984 124

1985 134

1986 125

1987 141

Soluo: O novo ndice ser obtido dividindo-se cada um dos valores da srie por 120 e multiplicando por 100 para ficar em percentual Anos ndice De Produo Industrial (1979=100) 1979 83 1980 87 1981 81 1982 93 1983 100 1984 103 1985 112 1986 104 1987 118

39

You might also like