You are on page 1of 113

SISTEMA FAESA DE EDUCAO ASSOCIAO EDUCACIONAL DE VITRIA

MATERIAL DE ESTUDO

PROBABILIDADE E

ESTATSTICA

Professora Lcia Helena Sagrillo Pimassoni

Agosto, 2013.

SUMRIO
UNIDADE I INTRODUO ..................................................................................................4 UNIDADE II DESCRIO, APRESENTAO E RESUMO DE DADOS .......................5 UNIDADE III NOES DE PROBABILIDADE.............................................................. 35 UNIDADE IV VARIVEL ALEATRIA .......................................................................... 45 UNIDADE V DISTRIBUIO DE PROBABILIDADES ................................................ 56 UNIDADE VI. DISTRIBUIES AMOSTRAIS ................................................................. 85 UNIDADE VII. INTERVALO DE CONFIANA PARA CONFIANA PARA MDIA E PROPORO .......................................................................................................................... 88 UNIDADE VIII. TESTE DE HIPTESE .............................................................................. 99

APRESENTAO DA DISCIPLINA

O Papel da Estatstica na Engenharia

Um engenheiro algum que resolve problemas de interesse da sociedade, pela aplicao eficiente de princpios cientficos.

As etapas no mtodo de engenharia so dadas a seguir: 1. Desenvolver uma descrio clara e concisa do problema. 2. Identificar, os fatores importantes que afetam esse problema ou que possam desempenhar um papel em sua soluo. 3. Propor um modelo para o problema, usando conhecimento cientfico ou de engenharia do fenmeno estudado. Estabelecer limitaes ou suposies do modelo. 4. Conduzir experimentos apropriados e coletar dados para testar ou validar o modelo-tentativa ou concluses feitas nas etapas 2 e 3. 5. Refinar o modelo, com base nos dados observados. 6. Manipular o modelo de modo a ajudar o desenvolvimento da soluo do problema. 7. Conduzir um experimento apropriado para confirmar que a soluo proposta para o problema efetiva e eficiente. 8. Tirar concluses ou fazer recomendaes baseadas na soluo do problema.

Assim,

engenheiros

tm

de

saber

como

planejar

eficientemente

os

experimentos, coletar dados, analisar e interpretar os dados e entender como os dados observados esto relacionados ao mtodo que eles propuseram para o problema sob estudo.

O campo da estatstica lida com a coleta, a apresentao, a anlise e o uso dos dados para tomar decises, resolver problemas e planejar produtos e processos. Devido a muitos aspectos da prtica de engenharia envolver o trabalho com dados, obviamente alguns conhecimentos de estatsticas so importantes para qualquer engenheiro. 3

UNIDADE I INTRODUO I.1 O Que Estatstica? um conjunto de mtodos para planejar experimentos, obter dados, organizlos, resumi-los, analis-los, interpret-los e deles extrair concluses.

I.2 A estatstica pode ser dividida em trs grupos para seu estudo: A estatstica descritiva

Compreende a organizao, o resumo e, em geral, a simplificao de informaes. A finalidade tornar as informaes mais fceis de entender, de relatar e de discutir. A teoria da probabilidade

uma ferramenta til para analisar situaes que envolvem o acaso. Ex.: Jogos de azar, deciso quanto a investimentos em determinados fundos e outros. A estatstica inferencial

- Diz respeito anlise e interpretao de dados amostrais. - um processo pelo qual podemos conhecer uma populao a partir de uma amostra desta mesma populao (no preciso comer um bolo inteiro para saber se bom). - A idia bsica efetuar determinada mensurao sobre uma parcela pequena, mas tpica, de determinada populao e utilizar essa informao para fazer inferncia sobre a populao toda.

I.3 Uso da Estatstica A estatstica no curso de Engenharia Ambiental tem como objetivo principal:

Desenvolver a habilidade na resoluo de problemas, o que inclui a capacidade de reconhecer qual tcnica se aplica determinada situao e utiliz-la eficazmente na resoluo do problema.

UNIDADE II DESCRIO, APRESENTAO E RESUMO DE DADOS

II.1 Conceitos Bsicos

a) Populao: uma coleo completa de todos os elementos (valores, pessoas, medidas, etc.) de interesse em um determinado estudo. b) Censo o estudo de toda a populao. Muito custoso e demanda muito tempo. A informao pode tornar-se obsoleta. A amostra apresenta a vantagem de ter um custo menor e demandar menos tempo. c) Amostra um subconjunto de elementos extrados da populao, uma parte representativa da populao. Muitas das vezes, por restries de custo, tempo, material, etc. adotamos apenas uma parte da populao para estudo a amostra.

d) Noes de amostragem

Experimentos aleatrios so procedimentos estmulo-resposta a que submetese um objeto em estudo que, ao serem repetidos sob as mesmas condies, no produzem as mesmas respostas. Por essa razo, o planejamento de experimentos aleatrios uma atividade necessria para se descobrir informaes fidedignas, apesar das respostas diferentes a cada repetio sobre um processo ou sistema em particular. A principal vantagem do planejamento a economia de tempo, custos e a reduo da variabilidade nos resultados, o que permite conhecer melhor o objeto estudado (Montgomery, 2001).

Para a perfeita execuo de um planejamento de experimentos essencial definir a unidade experimental (elemento do qual sero extradas as informaes) e o que ser observado (variveis). Alm disso, se forem realizadas comparaes entre grupos ou mtodos, deve-se defini-los claramente.

Etapas de um Planejamento do Experimento: 5

Definio do Problema e objetivo da pesquisa. Organizao da pesquisa Coleta dos dados Anlise estatstica do problema Concluses

Populao versus Amostra

Amostragem e Inferncia Estatstica

Inferncia Estatstica

Populao
No Sim

Plano de Amostragem
No

Amostra
Sim

A AMOSTRA DEVE SER REPRESENTATIVA DA POPULAO

Tipos de Amostragem

1. Amostragem Intencional (no probabilstica): Seleciona elementos ou amostras que consideramos serem tpicas ou representativas da populao. Amostras de gua poluda e no poluda.

2. Amostragem Probabilstica: Associa a cada elemento da populao uma chance (probabilidade) de fazer parte da amostra. Os resultados podem ser estendidos para a populao com um determinado grau de confiana.

Tipos de amostragem probabilstica

2.1 Amostragem Aleatria Simples: todo elemento tem a mesma chance de ser escolhido. Faz-se uma lista dos elementos da populao e sorteiam-se os elementos que faro parte da amostra. Pode-se utilizar a tabela de nmeros aleatrios.

2.2 Amostragem Sistemtica: os elementos da populao apresentam-se ordenados e so retirados periodicamente, ou seja, de cada k elementos, um escolhido.

2.3 Amostragem Estratificada: consiste em dividir a populao em grupos homogneos e proceder a retirada de uma amostra aleatria simples ou sistemtica dentro de cada estrato.

2.4 Amostragem por Conglomerados: aquela na qual as unidades de amostragem esto geograficamente amostras aleatrias dentro do cluster. reunidas em grupos e seleciona-se

PRIMEIRA LISTA DE EXERCCIOS

1) Identifique o tipo de amostragem (aleatria, estratificada e sistemtica) utilizada em cada um dos casos seguintes: a) Um psiclogo da Universidade Federal faz uma pesquisa sobre o nvel de agressividade dos alunos. Para o estudo o psiclogo escolheu 1000 alunos atravs de um sorteio pelo n da matrcula. b) A empresa Sony seleciona um a cada 200 CD de sua linha de produo e faz um teste de qualidade rigoroso.

c) O gerente comercial da Amrica Online testa uma nova estratgica de vendas selecionando aleatoriamente 250 consumidores com renda inferior a R$ 50.000 e 250 consumidores com renda de ao menos R$ 50.000. d) Um Programa Familiar considera 50 cidades, com caractersticas populacionais parecidas, para analisar o ponto de vista das pessoas quanto ao uso de anticoncepcionais.

2. Suponha que em uma escola se queira tomar uma amostra sistemtica de alunos do ensino fundamental. A quantidade de alunos no ensino fundamental de 2000 alunos. Considere um tamanho de amostra de 200. Explique como faria todo o levantamento da amostra.

3. Suponha que em uma populao de crianas com dengue, 540 so meninos, e 360 so meninas, considere uma amostra de 150 crianas. Obtenha uma amostra estratificada proporcional.

4. Suponha que uma populao de macacos de uma reserva florestal formada por macacos apreendidos pelo IBAMA. Da populao de macacos da reserva, 1000 esto totalmente adaptados ao ambiente natural e 350 no conseguiram se adaptar. Para realizar um estudo sobre o comportamento dos animais ser necessria uma coleta de amostra. Considere uma amostra de 150 macacos. Como seria a distribuio da amostra se fosse realizada uma amostragem estratificada proporcional ao tamanho do estrato? Explique como faria uma amostragem sistemtica para essa populao.

g) Variveis: so caractersticas que podem ser observadas (ou medidas) em cada elemento da populao, sob as mesmas condies. As variveis originam valores que tendem a exibir certo grau de variabilidade quando se fazem mensuraes repetidas. Ex.: quantidade de caf servida no copo por uma mquina, idade dos estudantes de engenharia, estado civil, etc.

Assim, Dados Estatsticos so observaes da realidade que nos cerca. Podem ser fatos ou nmeros. A tcnica estatstica depende da natureza do dado/varivel.

De acordo com sua natureza os dados podem ser classificados como: dados qualitativos ou quantitativos. Dados qualitativos (ou categricos): so aqueles nos quais as

caractersticas de um elemento so fornecidas por um nome ou por um rtulo.

Por exemplo, a cor da camisa de alunos pode ser branca, amarela, verde, vermelha, etc. O nome branca est caracterizando o elemento observado (neste caso, o aluno). Os dados qualitativos so classificados como:

Qualitativos Nominais: so dados que podem ser separados em categorias chamadas de no mensurveis, por exemplo, estado civil, tipo de acomodao, marcas de carro, estado civil, tipo de transporte, e outros.

Qualitativos Ordinais: envolvem dados que podem ser dispostos em alguma ordem. O nvel ordinal d informaes sobre comparaes relativas, mas os graus de diferena no servem para clculos. Os dados em nvel ordinal no devem, pois, ser utilizados em clculos. Ex.: Opinio em relao ao atendimento de navios por empresas de logstica. Excelente bom fraco muito fraco

Dados quantitativos: so aqueles nos quais as caractersticas do elemento observado uma quantidade. Por exemplo, saldo em conta corrente de um determinado cliente, peso, estatura, resistncia de certo material e material particulado em determinada hora. Os dados quantitativos so classificados como:

Quantitativos Discretos: assumem valores inteiros. Os dados discretos so resultantes da contagem de um nmero de itens. Resultam de um conjunto finito de valores. Ex.: n de txis que circulam na cidade de Vitria por dia, n. de pessoas dirias por nibus do sistema Transcol, n de crianas internadas porque foram expostas a poluio atmosfrica, etc.

Quantitativos Contnuos: assumem qualquer valor num intervalo de valores. So dados resultantes de medies. Resultam de um nmero infinito de valores possveis. Ex.: temperatura da cidade de Vitria, peso por caminho carregado de pedras de mrmore, quantidade de energia gasta por dia na cidade de Vitria e outros.

10

Aps os dados serem coletados eles devem ser organizados em uma planilha para que se possa realizar a anlise estatstica. Abaixo mostrado um exemplo de Planilha para organizao de dados coletados.

elemento 1 2 3 4 n

VAR 1

VAR2

VARp

II.2 Formas de organizao e apresentao de dados: Mtodos Tabulares e grficos

Ao estudarmos grandes conjuntos de dados, conveniente organiz-los e resumi-los.

Os dados qualitativos ou quantitativos discretos podem ser apresentados ou organizados das seguintes maneiras: Tabela de Freqncias Grfico de Barras/Colunas Grfico de Setores e outros.

Os dados quantitativos contnuos podem ser apresentados ou organizados em classes das seguintes maneiras: Tabela de freqncias em classes Histogramas Polgono de freqncias Curvas de freqncias e outros.

II.2.1 Tabela de Freqncias

11

uma tabela na qual numa das colunas aparecem os valores observados da varivel aleatria e nas demais colunas aparecem s freqncias de ocorrncia dos respectivos valores. Essas colunas contm as seguintes freqncias: Freqncias observadas. Freqncias acumuladas. Freqncias relativas. Freqncias relativas acumuladas.

Freqncia observada (fi) o nmero de vezes que cada valor se repete.

A Freqncia relativa (fri) fornece a relao entre a freqncia observada

de um determinado valor e o nmero total de observaes realizadas no experimento, ou seja, a frequncia observada divida pelo total de elementos. Exemplo: Suponha que foi realizado um estudo com as classes taxonmicas de algas planctnicas encontradas em 20 amostras de um corpo receptor da ETE de Jardim Camburi. O resultado foi o seguinte:
Bacillariophyceae Cyanophyceae Bacillariophyceae Cyanophyceae Bacillariophyceae Bacillariophyceae Euglenophyceae Cyanophyceae Bacillariophyceae Bacillariophyceae Cyanophyceae Bacillariophyceae Euglenophyceae Cyanophyceae Bacillariophyceae Euglenophyceae Bacillariophyceae Bacillariophyceae Euglenophyceae Bacillariophyceae

A Tabela de distribuio de freqncias ficar assim:


Classes Bacillariophyceae Cyanophyceae Euglenophyceae Total Frequncia 11 5 4 20 % 55,0 25,0 20,0 100,0

Freqncia acumulada (Fi) contabiliza as observaes at o valor

considerado. Pode ser calculada somente para variveis numricas. Exemplo: Foi coletada uma amostra de idades 20 alunos do curso de engenharia noturno. O resultado foi o seguinte:

12

NMERO DO CALADO 35 39 39 37 38 37 37 36 36 38 37 38 37 36 35 36 37 37 36 37

A freqncia do valor 37 8

No exemplo as freqncias acumuladas so as seguintes:

IDADE 35 36 37 38 39

FREQNCIA OBSERVADA 2 5 8 3 2

CLCULO 2 2+5 7+8 15 + 3 18 + 2

FREQNCIA ACUMULADA 2 7 15 18 20

Freqncia relativa acumulada (Fri) fornece a relao entre a freqncia

acumulada e o n. Total de observaes realizadas.

IDADE N DO
CALADO

FREQNCIA FREQNCIA FREQNCIA OBSERVADA ACUMULADA RELATIVA

CLCULO

FREQNCIA RELATIVA ACUMULADA

35 36 37 38 39

2 5 8 3 2

2 7 15 18 20

0,10 0,25 0,40 0,15 0,10

2 / 20 7 / 20 15 / 20 18 / 20 20 /20

0,10 0,35 0,75 0,90 1,00

II.2.2 Grfico de Barras/Colunas No eixo horizontal deve ser colocada a varivel sob estudo. No eixo vertical a freqncia (observada, acumulada ou relativa). traada, para cada valor (atributo) da varivel, uma barra com

comprimento proporcional freqncia.

13

O eixo vertical e horizontal pode ser invertido, ou seja, a varivel pode ser

colocada no eixo vertical e a freqncia no eixo horizontal (grfico de barras). Exemplo: Figura 1. Ttulo da figura.
12

10

Frequncia

2 Bacillariophyceae Cyanophyceae Euglenophyceae

Classes

II.2.3 Grfico de Setores Consta de um crculo dividido em setores, cada setor relacionado a um valor da varivel a ser representada. A abertura angular de cada setor proporcional freqncia observada para cada valor. Abaixo mostrado um exemplo do grfico de setores (pizza).

Figura 2. Classe socioeconmica.

13% A 20% B C D

40%

27%

14

II.2.4 Tabela de Freqncias para dados agrupados em classe

constituda da mesma forma que para dados no agrupados, com a diferena de que agora os valores da varivel a ser descrita passam a ser organizados por classes. O n de classes deve ficar entre 5 e 20; Se menor do que 5, aproximar para 5; Se maior do que 20, aproximar para 20.

Exemplo de dados agrupados em classe para estaturas de alunos do curso de engenharia ambiental/FAESA:

Tabela 1. Estatura de alunos do curso de engenharia ambiental*.


Estaturas (cm) 150 |-- 154 154 |-- 158 158 |-- 162 162 |-- 166 Total fi 2 3 1 2 8

*Amostra de 8 alunos da FAESA.

Dada seqncia: 1, 2, 3, 4, 5, 6, 7, 8. Podem-se representar intervalos das seguintes formas: Intervalo aberto: 1 --- 8 = 2, 3, 4, 5, 6, 7 Intervalo fechado: 1 |---| 8 = 1,2,3,4,5,6,7,8 Intervalo fechado esquerda: 1|--- 8 = 1,2,3,4,5,6,7 Intervalo fechado direita: 1 ---| 8 = 2, 3, 4, 5, 6, 7, 8

Uma tabela de freqncia em classe possui os seguintes termos: Classes: so os intervalos de variao da varivel. Denotamos por k o n de classes da distribuio. Limites de Classe: so os extremos de cada classe sendo li o limite inferior e Li o limite superior da classe i.

15

Amplitude de um intervalo de Classe: obtida pela diferena entre o limite superior e o limite inferior dessa classe.

Amplitude=Li - li
Freqncia simples ou absoluta (fi): o n de observaes contidas em cada classe. Como montar uma tabela de freqncia para dados contnuos?

1. Determinar o nmero de classes:

n , onde n o n de observaes.

Caso k no seja inteiro arredondar para o inteiro mais prximo.

2. Determinar a amplitude ou largura de cada classe: Identifica-se o maior e o menor valor do conjunto de dados, assim a largura da classe pode ser determinada por:

Amplitude da classe

Maior valor dos dados Menor valor dos dados N de classes

Exemplo: Um gerente de uma loja mandou realizar um estudo a respeito do valor das compras feitas por seus clientes. Foi colhida uma amostra aleatria de 50 compras realizadas por seus clientes e o resultado foi o seguinte:
VALORES DAS COMPRAS (R$)

315,10 328,00 152,40 169,70 232,80

129,00 228,30 186,80 199,10 242,50

174,80 238,00 149,30 213,00 262,80

202,30 289,00 180,40 215,80 274,50

218,20 252,40 208,40 221,90 296,10

224,50 270,80 219,90 229,10 235,40

236,10 142,50 161,80 239,20 246,70

249,20 175,40 195,40 259,30 265,10

269,00 204,30 211,50 271,60 281,00

284,10 219,70 220,80 293,20 302,10

1. Determinar o nmero de classes = k 2. Determinar a amplitude de cada classe

50

7,07

Amplitude da classe

Maior valor Menor valor Nmero de classes

328 129 7

28,4

29

16

OBS.: A amplitude da classe foi arredondada para cima, pois o nmero de classes j havia sido arredondado para baixo.

Para se formar as classes tomam-se o menor valor do conjunto de dados, 129, e soma ele a amplitude, 29, obtendo assim o limite superior da classe 158, os outros limites so obtidos sempre somando-se a amplitude, 29, at formar 7 classes. A freqncia observada obtida contando-se a quantidade de elementos no intervalo, ou seja, de 129 a 159 (no incluindo esse extremo) existem 4 valores, e assim sucessivamente. As outras freqncias so obtidas da mesma forma que para dados no agrupados em classe.

Classes 129 |-- 158 158 |-- 187 187 |-- 216 216 |-- 245 245 |-- 274 274 |-- 303 303 |-- 332 Total

Freqncia observada 4 6 8 14 9 7 2 50

II.2.5 Histogramas Cada classe representada por um retngulo. A base do retngulo o intervalo de classe. A altura do retngulo proporcional freqncia da classe. A rea do histograma proporcional soma das freqncias, se usarmos a

freqncia relativa a rea sob a curva vale 1.

A figura abaixo mostra um exemplo de histograma.

17

12 10 8 6 4 2 0

II.2.6 Polgono de Freqncias

Nesse grfico as classes so representadas pelos seus pontos mdios. O polgono formado pela unio, por retas, dos pontos mdios das partes

superiores de cada retngulo do histograma.

A figura abaixo mostra um exemplo de polgono de freqncia.


12

Freqncia

Freqncia

10 8 6 4 2 0

0 32

12

16

20

24

28

SEGUNDA LISTA DE EXERCCIOS 1) Classifique cada uma das variveis abaixo e indique uma forma de representao grfica: a) Tipos de doenas causadas por barulho em uma indstria. b) Ph de folhas de rvores coletadas na Avenida Vitria. c) Grau de satisfao da populao em relao implantao de uma nova indstria no Municpio de Anchieta (muito satisfeito, satisfeito, pouco satisfeito, insatisfeito). d) N de amostras de gua contaminadas em um lote coletado pela Cesan em pontos de captao.

36

18

2) Construa uma tabela de freqncias em classe para densidade numrica de cianobactrias (clulas/mL) em determinado manancial. (Faa todas as freqncias possveis para este tipo de varivel): 400 800 410 400 1700 1600 1040 420 350 700 850 720 1750 850 2400 1150 750 800 1100 350 850 1800 720 700 900

3) A fora de remoo para um conector medida em um teste de laboratrio. Dados para 40 corpos de prova so mostrados a seguir. 170 175 178 183 185 187 190 190 194 194 195 195 198 199 200 205 205 205 210 210 212 213 218 220 220 225 235 236 237 238 241 245 245 245 248 249 249 251 255 270

Monte uma distribuio de freqncias em classe. Desenhe o histograma e o polgono de frequncias.

4) Considerando a distribuio de freqncia da viscosidade para um produto qumico observado de hora em hora (amostra de 500 horas). Calcule a freqncia observada, freqncia acumulada e a freqncia relativa acumulada. Viscosidade 40 |-- 44 44 |-- 48 48 |-- 52 52 |-- 56 56 |-- 60 Total f i (%) 20 10 37 18 15 100

5) Elabore uma tabela de freqncia para organizar a varivel tipo de defeito encontrados em uma amostra de lentes fabricadas durante uma semana de produo de uma indstria: Arranho Trinca Arranho Arranho Arranho No-acabada Trinca Trinca No-acabada Trinca Arranho Arranho Trinca Arranho Arranho Trinca Trinca No-acabada Trinca No-acabada Trinca Arranho Arranho Trinca Arranho No-acabada Arranho Arranho Arranho No-acabada

Faa uma concluso quanto ao sexo dos alunos do curso de engenharia.

6) A tabela abaixo resume os intervalos de tempo (anos) de vida til de um equipamento de medio da velocidade do vento. Complete a tabela de distribuio de freqncias. Tempo 3a5 6a8 9 a 11 12 a 14 fi F 5 9 15 25 fri Fri

19

7) Complete a tabela de freqncia baseada no histograma:

0,44 0,4 0,36 0,32


Freq. Relativa

Classes

Freq. absoluta

0,28 0,24 0,2 0,16 0,12 0,08 0,04 0 2 6 10 Ponto Mdio 14 18

Freq. relativa (%)

Freq. acumulada

500 Total 500 100

II.3 Resumo de Dados

II.3.1 Medidas de Tendncia Central: Dados no organizados em tabelas de frequncias

Medidas de Tendncia Central so usadas para indicar um valor que tendem a representar melhor, um conjunto de dados.

1. A mdia aritmtica Calcula-se a mdia aritmtica determinando-se a soma dos valores do conjunto e dividindo-se esta soma pelo nmero de valores do conjunto. Se os dados so de uma amostra, a mdia denotada por

x (l-se: x barra), se os dados so

de uma populao, a mdia denotada pela letra grega (l-se: mi) .


n

Xi X
i 1

onde a letra grega o smbolo do somatrio e n o nmero de elementos da amostra.

20

Algumas propriedades da mdia aritmtica: A mdia de um conjunto de nmeros pode ser sempre calculada. Para um dado conjunto de nmeros a mdia nica. A mdia sensvel a (ou afetada por) todos os valores do conjunto. Assim se um valor se modifica, a mdia tambm se modifica.

Observe que na figura ao lado, na mdia, cada indivduo comeu um frango cada um.

2. A mdia ponderada

Ao calcularmos uma mdia, podemos cometer enganos, se ignorarmos o fato de que as grandezas em questo no tm a mesma importncia em relao ao fenmeno que est sendo estudado, por exemplo, a situao em que o professor informe classe que haver dois exames valendo cada um 30% do total de pontos do curso, e um exame final valendo 40%. O clculo da mdia deve considerar os pesos desiguais os exames.

A mdia ponderada uma mdia na qual cada valor se encontra ponderado de acordo com sua importncia no grupo total.
n

X i wi Xw
i 1 n

wi
i 1
n

Onde,
i 1 n

X i wi a soma dos produtos de cada x pelo seu peso correspondente


a soma dos pesos.

wi
i 1

21

3. A mdia geomtrica Sejam X1, X2, X3, ..., Xn. A mdia geomtrica de X definida por:

Mg

x1.x2 .x3 . ... xn

Exemplo: Calcular a mdia geomtrica dos valores 3, 6, 12, 24, 48


5

Mg
4. A moda

3 6 12 24 48

248832 12

A moda o valor que possui a maior freqncia de observao. Caso ocorra dois valores com a mesma maior freqncia de observao, teremos um processo bimodal. Caso ocorra vrios valores com freqncia maior de observao, teremos um processo multimodal. Caso todos os valores tenham a mesma freqncia de observao, teremos um processo amodal.

Algumas propriedades: Fcil de calcular; No afetada por valores extremos; Pode estar afastada do centro dos valores; No utiliza todos os valores da varivel; Nem sempre ela existe e pode existir mais de uma moda.

Exemplo: Indique a moda para os seguintes conjuntos de dados: a) 8; 10; 13; 13; 17; 29 moda = 13 b) 1; 3; 7; 9; 15; 20; 5 processo amodal, ou seja, a moda no existe c) 2; 4; 6; 2; 4; 8; 10; 12; 14; 16 moda = 2 e 4 d) 1; 1; 1; 2; 2; 2; 3; 3; 3; 4; 5; 6; 7; 8; 9; 10 moda = 1, 2 e 3

II.3.2 Medidas de Posio Relativa: Dados no organizados em tabelas de frequncias 22

As medidas de posio relativa no so afetadas pelos valores observados. Sero apresentadas as seguintes medidas: Mediana Quartis Percentis

A mediana e os quartis, e percentis so medidas fsicas de posio, no sendo influenciadas pelos valores observados.

Aps a ordenao dos valores, do menor para o maior, a mediana dividir a srie de observaes em 2 partes iguais, os quartis em 4 partes e os percentis em 100 partes.

1. Mediana

A mediana freqentemente usada para a renda anual e para dados de valores de bens, porque algumas rendas ou valores de bens extremamente elevados podem inflacionar a mdia, nestes casos a mediana a melhor medida de posio central. A mediana de um n. mpar de observaes o valor central da srie de dados e ocupa a posio (n+1)/2. A mediana de um n. par de observaes a mdia dos dois valores centrais da srie de dados. Os dois valores centrais ocupam a posio n/2 e (n/2)+1. Regra prtica para achar a posio do elemento que corresponde mediana:

Pos

n 0,5 2

Se o valor de Pos for inteiro, a mediana o elemento que ocupa a posio Pos. Se o valor de Pos no for inteiro, a mediana ser a mdia aritmtica do elemento que ocupa a posio inteira anterior e posterior a Pos. Aps a ordenao dos valores, do menor para o maior, a mediana dividir a srie de observaes em 2 partes iguais, ou seja, 50% menores valores se encontram abaixo da mediana e 50% maiores valores se encontram acima da mediana.

23

Algumas propriedades: Fcil de calcular; No afetada por valores extremos; um valor nico; No utiliza todos os valores da varivel.

Exemplo: Considere as notas: 8, 9, 0, 6, 7, 1, 5.

Ordenando-se as notas da turma tem-se: 0, 1, 5, 6, 7, 8, 9. A mediana ser igual a 6.

Exerccio: Qual a mediana para os seguintes conjuntos de dados? a) 32 54 46 42 46

b) 100 1000 1500

2000

2320 2450 2500

2580

2590 100000

c) Compare a mediana com a mdia aritmtica, qual a melhor medida?

Qual das trs medidas usar? Mdia, mediana ou moda?

Quando procuramos conhecer valores mdios: a mdia. Ex.: em controle

de qualidade, a mdia utilizada para determinar se o processo est operando ao redor de um valor esperado, o alvo. Se a varivel tiver valores extremos, a mediana mais adequada. Ex.:

salrio. A moda um valor tpico. Variveis qualitativas. Tipo de transporte mais

usado para determinado tipo de carga.

2. Quartis

25% das observaes esto esquerda do 1 quartil (Q1). 50% esto esquerda do 2 quartil (Q2) e 75% esquerda do 3 quartil

(Q3).

24

25% Q1

25% Q2

25%

25% Q3

Regra prtica para determinar o elemento que corresponde ao i-simo

quartil: Sendo n = o n. de observaes

PosQi

i n 0,5 4

Para os dados abaixo calcule o 1, 2 e 3 quartil. 5, 8, 8, 11, 11, 11, 14, 16

3. Percentis

Os i % das observaes esto a esquerda do i-simo percentil. Assim, 68%

das observaes esto esquerda (so menores) do 68 percentil e 32% direita (so maiores).

Regra prtica para se determinar o elemento correspondente ao i-simo

percentil:

PosPi

i n 0,5 100

Sendo n o n. de observaes

Exemplo: Usando os dados do exerccio anterior, calcule o 70 percentil.

II.3.3 Medidas de Variabilidade ou disperso: Dados no organizados em tabelas de frequncias

Medidas de disperso dizem respeito descrio de um grupo de valores em termos da variabilidade existente entre os itens includos dentro do grupo, ou

25

seja, essas medidas indicam se os valores esto relativamente prximos uns dos outros, ou separados.

Pequena disperso Grande disperso


1. Amplitude

A amplitude pode ser expressa pela diferena entre o maior e o menor nmero num conjunto de dados.

Amplitude = Maior valor - menor valor


Exemplos a) 1, 5, 7, 13 b) 14, 3, 17, 4, 8, 73, 36, 48 c) 1, 2, 2, 3, 5, 7, 8, 9, 10 d) 14, 3, 17, 4, 8, 73, 36, 48 Amplitude = 13-1=12 Amplitude = 73-3=70 Amplitude = 9 Amplitude = 70

2. Varincia e Desvio padro

Para melhorar o resumo dos dados, podemos apresentar uma medida de disperso destes dados, como a varincia ou desvio padro.

Considere as notas do provo de alunos de trs faculdades de Vitria:


Faculdade A B C Notas dos alunos 6 6 6 6 6 6 6 6 1 2 4 6 6 9 10 10 0 6 7 7 7 6 8 7 Mdia da Faculdade
6,0 6,0 6,0

As notas das trs faculdades apontam para a mesma nota mdia, mas as notas esto distribudas diferentemente em cada Faculdade. Comparando as notas de A com B e C, notamos que as notas de B so bem mais dispersas, indicando que B mais heterognea em termos de notas obtidas. Em C observamos um ponto discrepante dos demais, uma nota extremamente baixa, acarretando um valor para a mdia abaixo da maioria das notas da turma. 26

Algumas Propriedades: sempre um nmero positivo; se todos os valores de uma amostra forem iguais, a varincia e o desvio padro sero zero; a varincia e o desvio padro so medidas afetadas pelos valores extremos da varivel.

A varincia e o desvio padro avaliam a disperso de um conjunto de valores em relao mdia aritmtica. Para calcularmos a varincia ou o desvio padro, devemos considerar os desvios de cada valor em relao mdia. Depois construmos uma espcie de mdia destes desvios. Assim: Seja um conjunto de nmeros: x1, x2, x3, x4 ,..., xn Tomemos as diferenas de cada um em relao mdia, assim:

x1 x , x2
zero.
n

x , x3 x , ..., xn

Como temos valores positivos e negativos a soma dos desvios sempre

( xi
i 1

x) 0

Como estamos interessados nos tamanhos dos desvios e no no fato deles serem positivos e negativos trabalhamos com os desvios ao quadrado. Tomamos a mdia aritmtica dos desvios ao quadrado, obtendo a varincia. A unidade de medida da varincia equivale unidade dos dados ao quadrado. Para retornarmos a unidade original dos dados tiramos raiz quadrada da varincia obtendo assim o desvio padro.

Varincia Populacional
n

Onde
( xi )2

i 1

(mi) a mdia populacional N o tamanho da populao (sigma) o desvio padro populacional

N
Desvio Padro Populacional
n

( xi
i 1

)2

N
27

Exemplo: Notas de 8 alunos: 4, 5, 5, 6, 6, 7, 7, 8 Nota 4 5 5 6 6 7 7 8 Soma Varincia = 12/8 = 1,5 Desvio = Nota - Mdia (Desvio)2 -2 4 -1 1 -1 1 0 0 0 0 1 1 1 1 2 4 0 12

Varincia Amostral
n

( xi s
2 i 1

x)2

xi2 nx 2 n 1
Onde x a mdia amostral n o tamanho da amostra s o desvio padro amostral

n 1

Desvio Padro Amostral


n

( xi s
i 1

x)2

xi2

nx 2

n 1

n 1

Exemplo: Considere que o gerente de uma loja de um shopping da cidade realizou uma pesquisa a respeito do nmero dirio de clientes que solicitam pagamento parcelado de suas compras. Foram observados 12 dias escolhidos aleatoriamente e o resultado foi o seguinte:

14 ; 6 ; 8 ; 22 ; 18 ; 14 ; 16 ; 14 ; 24 ; 32 ; 14 e 16. Calcule a varincia e o desvio padro

Para o clculo das medidas de variabilidade temos que ter o valor da mdia aritmtica. A mdia aritmtica igual a:

14 6 8 22 18 14 16 14 24 32 14 16 16,5 12

28

i 1 2 3 4 5 6 7 8 9 10 11 12 Total

xi
14 6 8 22 18 14 16 14 24 32 14 16

xi

( xi

x)2
6,25

14-16,5 = -2,5 6-16,5 = -10,5 8-16,5 = -8,5 22-16,5 = 5,5 18-16,5 = 1,5 14-16,5 = -2,5 16-16,5 = -0,5 14-16,5 = -2,5 24-16,5 = 7,5 32-16,5 = 15,5 14-16,5 = -2,5 16-16,5 = -0,5 0

110,25 72,25 30,25 2,25 6,25 0,25 6,25 56,25 240,25 6,25 0,25 537

A Varincia ser a seguinte:

s2

537 12

44,75

O desvio padro :

44,75

6,7

3. Coeficiente de variao (cv)

O coeficiente de variao uma medida relativa da variabilidade. Ele til quando queremos comparar a variabilidade de dois conjuntos de dados que tenham diferentes desvios padres e diferentes mdias.

Para o exemplo anterior o coeficiente de variao seria:

CV

6,7 100 16,5

40,6%

CV

Desvio padro 100 Mdia

29

II.3.4 Medidas Descritivas para dados organizados em tabelas de frequncias

Quando os dados se encontram agrupados em distribuio de freqncia, os valores de x devem ser ponderados pelas respectivas freqncias absolutas. Para dados organizados em classe o ponto mdio de cada classe usado como uma aproximao de todos os valores contidos na classe. Assim na determinao das medidas de posio para dados agrupados em classe, cada classe ser representada pelo seu ponto central, ou seja, xi ser o ponto mdio da classe.

1. mdia aritmtica Calcula-se a mdia aritmtica para dados agrupados multiplicando cada ponto mdio de classe pela respectiva freqncia da classe somando-se os produtos e sendo, ento, a soma dividida pelo nmero total de observaes. Assim,
n

X i fi X
i 1 n

fi
i 1

Sendo fi a freqncia absoluta e xi o ponto mdio da classe se os valores estiverem organizados em classe. Exemplo: Considere que uma pesquisa sobre os valores das compras efetuadas em uma loja de vesturio Trinca localizada em um dos shoppings da cidade utilizou uma amostra de 480 compras, escolhidas aleatoriamente. Encontre o valor mdio de compra para as duas situaes abaixo:

a) Valores (R$) 100 145 200 350 400 Total N. de clientes 123 60 77 120 100 480

30

b)
CLASSE FREQNCIA Xi

40,00 a 100,00 100,00 a 160,00 160,00 a 220,00 220,00 a 280,00 280,00 a 340,00 340,00 a 400,00

40 55 145 130 75 35

2. A moda Classe modal a classe com a maior freqncia de observao. As mesmas observaes feitas para a moda para dados nominais continuam vlidas, isto : Processo bimodal: duas classes com a mesma freqncia de observao; Processo multimodal: vrias classes com a mesma freqncia de observao; Processo amodal: todas as classes com a mesma freqncia de observao.

Determinao de valores pontuais representativos da moda:

Frmula de King :

mod a

l mo

h fa

fp fp

Frmula de Czuber:

mod a lmo

h 2 fm

fm fa

fa fp

Considere:

lmo = limite inferior da classe modal;

= intervalo de classe;

f m = frequncia da classe modal; f a = frequncia da classe anterior classe modal; f p = frequncia da classe posterior classe modal.

31

Exemplo: Calcule a moda pelo mtodo de King:

CLASSE

FREQNCIA

Xi

40,00 a 100,00 100,00 a 160,00 160,00 a 220,00 220,00 a 280,00 280,00 a 340,00 340,00 a 400,00

40 55 145 130 75 35

3. Mediana Determinar a classe mediana atravs da posio:

Pos

n 2

Aplicar a frmula classe mediana:

Med

lmed

Pos Fant f med

4. Quartil

Qi
5. Percentil

lqi

Pos Fant ; Pos f qi

i n 4

Pi

l pi

Pos Fant ; Pos f pi

i n 100

Para o clculo da mediana, quartil e percentil considere:

= Amplitude de classe;

Fant

= Frequncia acumulada at a classe anterior que contm a

mediana ou quartil ou percentil, conforme o caso;

lmed = Limite inferior da classe que contm a mediana;

32

l qi

= Limite inferior da classe que contm o quartil;

l pi = Limite inferior da classe que contm o percentil; f qi = Freqncia da classe que contm o i-simo quartil; f pi = Freqncia da classe que contm o i-simo percentil; f med = Freqncia da classe que contm a mediana. Exemplo: Uma pesquisa sobre os gastos com energia eltrica em residncias de Cariacica revelou os seguintes resultados, consolidados na Tabela de distribuio de freqncias abaixo: $10,00 a $ 20,00 62 $ 20,00 a $ 30,00 84 $ 30,00 a $ 40,00 123 $ 40,00 a $ 50,00 93 $ 50,00 a $ 60,00 52 $ 60,00 a $ 70,00 36

Determine mdia, moda, mediana, o 3 Quartil.

6. Varincia Amostral
n

( xi s
2 i 1

x )2 fi

xi2 f i n 1

nx 2

n 1

7. Desvio Padro Amostral


n

( xi s
i 1

x )2 fi

xi2 f i n 1

nx 2

n 1

Onde x a mdia amostral n o tamanho da amostra s o desvio padro amostral fi a freqncia da classe se os dados esto agrupados em classe xi ponto mdio da classe.

Exemplo: para o exemplo anterior calcule o desvio padro amostral:

33

Valores ($) $10,00 a $ 20,00 20,00 a $ 30,00 $ 30,00 a $ 40,00 $ 40,00 a $ 50,00 $ 50,00 a $ 60,00 $ 60,00 a $ 70,00 Total

fi 62 84 123 93 52 36

TERCEIRA LISTA DE EXERCCIOS 1) Calcule a mdia, mediana, moda, o desvio padro populacional e o coeficiente de variao dos valores de contratos (R$) de uma micro empresa que presta consultorias ambientais: 102, 305, 405, 550, 760, 567, 100, 459

2) Suponha que suas notas do segundo semestre em estatstica sejam as seguintes: 5,0; 6,5 e 9,5. A primeira nota valem 15% a segunda vale 25% e a ltima vale 60%. Qual a sua nota semestral?

3) Dada s distribuies abaixo, calcule a mdia, mediana, a moda e o desvio padro amostral na letra a e desvio padro populacional na letra b. Tabela 2. Pesos (kg) Pesos fi 40 |-- 44 2 44 |-- 48 5 48 |-- 52 9 52 |-- 56 6 56 |-- 60 4 Total 26 Tabela 3. Salrios (R$) fi 500 |-- 700 8 700 |-- 900 20 900 |-- 1100 7 1100 |-- 1300 5 1300 |-- 1500 3 1500 |-- 1700 1 1700 |-- 1900 6 Total 50

Salrios

4) Os dados abaixo representam nmero borboletas de determinada espcie que serve de bioindicador da poluio atmosfrica encontradas em diversas reas poludas. 12 12 15 15 10 15 15 13 10 13 10 16 13 10 13 17 10 10 15 12 13 12 10 12

Calcule a mdia, mediana e a moda. 5) Os valores de ferro (mg/L) de 7 amostras de gua subterrneas foram os seguintes: 1,70; 1,97; 2,62; 2,30; 3,12; 2,53 e 1,95. Calcule a mdia, mediana e o terceiro quartil. Interprete os resultados.

34

6) Calcule o desvio padro amostral dos dados apresentados abaixo: Xi 0 1 2 3 4 5 6 7 Total fi 1 4 3 2 0,25 0,15 13 18 19 1,00 fri 0,05 0,15 Fi 4

Soma = 20

UNIDADE III NOES DE PROBABILIDADE

III.1 Introduo

Encontramos na natureza dois tipos de fenmenos: determinsticos e aleatrios.

Os fenmenos determinsticos so aqueles em que os resultados so sempre os mesmos, qualquer que seja o numero de ocorrncias verificadas. Se tomarmos um determinado slido, sabemos que a certa temperatura haver a passagem para o lquido. Esse exemplo caracteriza um fenmeno

determinstico.

Nos fenmenos aleatrios, os resultados no sero previsveis, mesmo que haja um grande nmero de repeties do mesmo fenmeno. Por exemplo: se considerarmos um pomar com centenas de laranjeiras, as produes de cada planta sero diferentes e no previsveis, mesmo que as condies de temperatura, humidade, solo, etc., sejam as mesmas para todas as rvores. Nos experimentos aleatrios, mesmo que as condies iniciais sejam as mesmas, os resultados finais de cada tentativa do experimento sero diferentes e no previsveis.

III. 2 Definies

35

Probabilidade uma ferramenta matemtica que tem por propsito medir a

chance. Experimento (E): refere-se a qualquer processo de observao ou medida.

Ex.: lanamento de uma moeda, taxa de inflao do prximo ms, estudo da causa de uma doena, e outros. Espao amostral (S): o conjunto de todos os resultados possveis do S: {1, 2, 3, 4, 5, 6}

experimento.Exemplo: E: lanamento de um dado.

Evento: so subconjuntos do espao amostral. So representados por

letras maisculas do nosso alfabeto, A, B, C, .... Exemplo: A: ocorrer um nmero par no lanamento de um dado. A: {2, 4, 6}

Notao para Probabilidades


P denota uma probabilidade. A, B, C, ... Denotam eventos especficos. P(A) denota a probabilidade de ocorrncia do evento A.

III. 3 Enfoques para as probabilidades

As trs abordagens frequentemente mais usadas so o Mtodo Clssico, o de freqncia relativa e o subjetivo.

O Mtodo Clssico: de atribuir probabilidade apropriado quando todos os resultados experimentais so igualmente provveis. Se h n possibilidades igualmente provveis, das quais uma deve ocorrer, e s so consideradas como favorveis ou como um sucesso, ento a probabilidade de um sucesso s/n , ou seja,
P( A) N de maneiras como A pode ocorrer N de resultados possveis no espao amostral

Exemplo 1 E: Lanamento de um dado equilibrado A: Obter a face 5 36

S = {1, 2, 3, 4, 5, 6} Ento A = {5}


P ( A) 1 6

Exemplo 2 E: Retirar uma carta de um baralho de 52 cartas B: Extrair um s Bem misturado significa que qualquer carta tem a mesma chance de ser extrada. Como h s = 4 ases entre as n = 52 cartas, a probabilidade dada por:

P( B)

s n

4 52

1 13

No mtodo da freqncia relativa a probabilidade de um evento a proporo do nmero de vezes que eventos do mesmo tipo ocorrem em longo prazo. Realize (observe) um experimento um grande nmero de vezes e conte quantas vezes o evento A ocorre. Ento P(A) estimado por:

P( A)

N de ocorrncias de A N de repeties do exp erimento

Exemplo: Os registros de uma companhia de aviao mostram que durante certo tempo 468 dentre 600 de seus jatos da linha Vitria-Rio chegaram no horrio, qual a probabilidade de que um avio daquela linha chegue no horrio?

Uma estimativa para a probabilidade desejada :

468 0,78 78% 600


Ao calcularmos a probabilidade pelo mtodo da freqncia relativa, obtemos uma aproximao no lugar de um valor exato. medida que o nmero de observaes aumenta, as aproximaes tendem a ficar mais prximas da

37

probabilidade efetiva. Esta propriedade enunciada pelo teorema conhecido como lei dos grandes nmeros. Lei dos Grandes Nmeros: Se repete-se um experimento um grande nmero de vezes a probabilidade pela freqncia relativa de um evento tende para a probabilidade terica.

Na abordagem subjetiva a probabilidade associada a um evento ir basear-se na opinio pessoal do analista sobre as chances de sua ocorrncia. Pode-se usar qualquer informao disponvel para atribuir probabilidade ao evento, tal como nossa experincia ou intuio. Exemplo: Um investidor decide aplicar em aes porque seu feeling indica que a probabilidade de ganho de 60% ao ano. III. 4 Propriedades da Probabilidade

P( A) 1 para qualquer evento A.

A probabilidade de um evento cuja ocorrncia certa igual a 1, ou seja, P(S) =1. A probabilidade de um evento impossvel 0, ou seja, P ( ) 0 .

Exemplos: A probabilidade de obter um nmero menor ou igual a 6 no lanamento de

um dado. Probabilidade de obter um nmero maior que 6 no lanamento de um dado.

- Eventos Complementares: Um evento ou conjunto de eventos complementar a outro quando, juntos, formam o espao amostral.

A A
Onde A o complementar de A.

Clculo da probabilidade usando o complemento: 38

P( A) 1 P( A )

Exemplo: Sendo A: obter a face 5 no lanamento de um dado, calcule a probabilidade do complementar de A.

III. 5 Eventos compostos

Evento composto qualquer evento que combina dois ou mais eventos simples. Ex.: Lanamento de duas moedas, retirar um S de um baralho e obter a face 6 no lanamento de um dado.

Unio de dois eventos (AUB): A unio de A e B o evento contendo todos os pontos amostrais que pertencem a A a B ou a ambos

S A B A B

Interseo de dois eventos (A B): A interseo de A e B o evento que contm os pontos amostrais que pertencem tanto a A como a B.

III. 5.1 Regra da Adio

usada quando estamos interessados em conhecer a probabilidade de que pelo menos um deles ocorra. Isto , estamos interessados na ocorrncia de A, de B ou ambos.

39

A probabilidade de ocorrer A ou B fornecida aplicando -se a regra da adio de probabilidades: P(A B) = P(A) + P(B) P(A e B)

Para o caso de eventos mutuamente excludentes (a ocorrncia de um resultado exclui o outro), ento:

P(A B) = P(A) + P(B)

Diagrama de Venn para Eventos Mutuamente Excludentes

Observe que no existe rea de intercesso entre os crculos A e B.

Exemplo de eventos mutuamente excludentes: Em um baralho, qual a probabilidade de se tirar uma carta de s ou uma de reis? Neste caso, no existe uma carta no baralho que seja s e reis ao mesmo tempo. Ento, a intercesso nula. Como existem 4 s e 4 reis no baralho (uma de cada naipe), a probabi lidade ser igual a:

4 52

4 52

8 52

Exemplo de eventos no mutuamente excludentes: Qual a probabilidade de se tirar do mesmo baralho uma carta de s ou uma de espadas? Neste caso existe uma carta que s e espadas simultaneamente. Assim sendo, existe intercesso. 40

A probabilidade ser, ento, igual a:

4 52

13 52

1 52

16 52

III. 5.2 Probabilidade Condicional a probabilidade de ocorrncia de um evento submetida ocorrncia de um outro evento.

A sua notao : P(A/B ) e se l da seguinte maneira: Probabilidade de ocorrer o evento A dado que ocorreu o evento B. Neste caso, a ocorrncia do evento B um fato. No existe incerteza a esse respeito. A incerteza est restrita ocorrncia do evento A.

Expresso formal da probabilidade condicional:

P( A / B)

P( A B) P( B) P( A B) P( A)

P( B / A)

Abordagem intuitiva da probabilidade condicional: Podemos determinar a probabilidade condicional de A dado B supondo que B j tenha ocorrido e, sob essa hiptese, calculando a probabilidade de ocorrncia do evento A.

Exemplo: Suponha que em uma sala de aula existam 14 meninas e 16 rapazes. Das 14 meninas, 6 esto vestidas com blusas brancas, enquanto que dos 16 rapazes, 10 estejam vestidos com blusas brancas.

Considere que ser realizado o seguinte experimento: ser escolhido aleatoriamente um aluno e sero feitas duas observaes: o sexo do aluno e a cor da blusa que est usando. 41

Neste caso, a probabilidade de se escolher um aluno do sexo Trinca de 14/30. O espao amostral a ser considerado neste clculo o conjunto de todos os 30 alunos existentes dentro da sala de aula. Suponha, agora, que dada a seguinte informao: o aluno sorteado est vestindo blusa branca. Nesse caso, todos os alunos que no estejam vestindo blusa branca so retirados do espao amostral.

A probabilidade condicional diminuiu o espao amostral original. O espao amostral agora constitudo somente pelos alunos, do sexo Trinca ou do sexo Arranho, que estejam usando blusa branca.

Assim, a probabilidade de se sortear um aluno do sexo Trinca dado que o aluno sorteado est usando blusa branca passa a ser igual a 6/16.

III. 5.3 Regra da Multiplicao

A multiplicao de probabilidades est relacionada com a intercesso de eventos. a probabilidade de ocorrerem os eventos A e B simultaneamente.

Forma geral:

P(A

B) = P(A) x P(B/A)

P(A

B) = P(B) x P(A/B),

A intercesso de eventos est relacionada com o conceito de independncia entre eventos. Considere os eventos A e B. Diz-se que os eventos A e B so estatisticamente independentes entre si se P(A) = P(A/B) ou P(B) = P(B/A).

42

Regra da multiplicao para eventos independentes

P(A

B) = P(A) x P(B)

No confundir eventos independentes com eventos mutuamente excludentes. Eventos mutuamente excludentes so intensamente dependentes entre si.

Exemplo: Considere uma caixa contendo 10 peas, sendo 8 boas e 2 ruins. Retira-se, aleatoriamente, duas peas. Vamos considerar dois casos: 1 caso: experimento com reposio; 2 caso: experimento sem reposio.

1 caso: Experimento com reposio

A probabilidade da 1 pea ser boa igual a 8/10. Como o experimento com reposio, a probabilidade da 2 pea ser boa ser tambm igual a 8/10 quer a 1 pea tenha sido boa ou no. Ento: P(2 pea boa) = P(2 pea boa/1 pea foi boa) Dessa forma, os eventos 1 pea boa e 2 pea boa so independentes entre si.

2 caso: Experimento sem reposio

Neste caso, a probabilidade da 2 pea ser boa vai depender da 1 pea ter sido boa ou no. Se a 1 pea foi boa, a P(2 pea boa) igual a 7/9.

Se a 1 pea foi ruim, a P(2 pea boa) igual a 8/9. Ento, a probabilidade de 2 pea boa vai depender do que ocorreu com a 1 pea. Assim, esses eventos (1 pea boa e 2 pea boa) so dependentes entre si.

43

Exemplo: Suponha que de cada 100 automveis que trafegam pelas ruas, 70 sejam de fabricao nacional e 30 sejam importados. Suponha tambm que 60% dos automveis nacionais sejam de cor clara e 40% de cor escura. Dos importados, 35% so de cor clara e 65% de cor escura. Determine a probabilidade de se escolher aleatoriamente um automvel nacional e escuro. O que se deseja calcular P(nacional Usando a forma geral da multiplicao: P(nacional escuro) = P(nacional) x P(escuro/nacional) escuro)

Aplicando os dados constantes do enunciado do problema: P(nacional escuro) = 0,70 x 0,40 = 0,28

QUARTA LISTA DE EXERCCIOS 1) Considere a experincia que consiste em pesquisar famlias com trs crianas, relao ao sexo das mesmas, segundo a ordem de nascimento. Enumerar o os eventos: a) A ocorrncia de dois filhos do sexo masculino b) A ocorrncia de pelo menos dois filho do sexo masculino c) A ocorrncia de no mximo duas crianas do sexo masculino. 2) De 500 amostras de gua de certo manancial do norte do estado, 225 esto contaminadas por mercrio e 100 com coliformes fecais. Estes dados incluem 50 amostras que possuem ambos contaminantes. Qual a probabilidade de que uma amostra escolhida aleatoriamente esteja contaminada por mercrio (A) ou por coliformes (B)? 3) Suponha que quatro cartas so escolhidas aleatoriamente e sem reposio de um baralho de 52 cartas. Qual a probabilidade de que todas as trs cartas sejam reis? 4) Suponha que quatro cartas so retiradas aleatoriamente de um baralho de 52 cartas, aps cada retirada a carta recolocada no mao e todas as cartas so embaralhadas novamente antes da seleo da prxima carta. Qual a probabilidade de que todas as trs cartas sejam reis? 5) Uma urna contm 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se 3 bolas sem reposio. Achar a probabilidade de que: a) nenhuma vermelha; b) exatamente uma vermelha; c) todas sejam da mesma cor.

6) A empresa M & tem M tem 15800 empregados, classificados de acordo com a tabela abaixo: Sexo IDADE Homens Mulheres Total < 25 anos 25 40 anos > 40 anos Total 2000 4500 1800 8300 800 2500 4200 7500 2800 7000 6000 15800

Um empregado e sorteado ao acaso, calcular a probabilidade de ser ele:

44

a) b) c) d)

um empregado com 40 anos de idade ou menos; um empregado com 40 anos de idade ou menos, e mulher; um empregado com mais de 40 anos de idade e que seja homem; uma mulher, dado que e um empregado com menos de 25 anos.

7) Em uma indstria h 10% pessoas que ganham mais de 20 salrios mnimos (s.m.), 20% que ganham entre 10 e 20 s.m. e 70% que ganham menos de 10 s.m. Trs pessoas desta industria so selecionadas. Determinar a probabilidade de que pelo menos uma ganhe menos de 10 s.m. 8) P(A) = 1/3, P(B) = 3/4 e P(AUB) = 11/12, calcular P(A/B). 9)Amostras de areia foram coletadas em duas praias, elas so classificadas em relao a satisfazer ou no as especificaes da legislao em vigor. A tabela generalizada dada como segue: obedece Praia 1 2 Sim ka a No kb b

Considere que a, b e k so inteiros positivos. Faa A denotar o evento em que uma amostra de areia seja proveniente da praia 1 e faa B denotar o evento em que uma amostra de areia obedece s especificaes. Mostre que A e B so eventos independentes. 10) Considere que para um estudo ambiental foram coletadas 20 amostras de solo, sendo que 10 foram retiradas de solos poludos: a) Se duas amostras so selecionados aleatoriamente (sem reposio), qual a probabilidade de ambas serem de solo poludo? b) Se duas amostras so selecionados aleatoriamente (com reposio), qual a probabilidade de no mnimo uma amostra ser de solo poludo?

UNIDADE IV VARIVEL ALEATRIA Varivel aleatria (v.a) uma varivel que tem um valor numrico nico, para cada resultado de um experimento.

Seja E um experimento e S o espao amostral associado ao experimento. Uma funo X, que associe a cada elemento s denominada varivel aleatria. S um nmero real X(s)

S s X X(s)

Varivel aleatria EXEMPLO:

45

E: lanamento de duas moedas X: nmero de caras obtidas nas duas moedas S = {(ca,ca),(ca,co),(co,ca),(co,co)} X = 0: corresponde ao evento (co,co) X = 1: corresponde ao evento (co,ca), (ca,co) X = 2: corresponde ao evento (ca,ca)

IV.1 VARIVEL ALEATRIA DISCRETA

Uma varivel aleatria X ser discreta se assumir valores em um conjunto finito ou infinito numervel.

IV. 1. 1 Funo de probabilidade da varivel aleatria discreta uma funo que associa a cada valor assumido pela varivel aleatria a probabilidade do evento correspondente.

Seja X uma v. a. discreta. A probabilidade da varivel aleatria X assumir um valor particular x, a funo de probabilidade X que se representa por P(X = x). A funo P(X = x) determina a distribuio de probabilidades da v.a.

Condies para uma distribuio de probabilidades

1. 2. 0

P( x) 1, onde x toma todos os valores possveis.

P( x) 1,

Exemplo: E: lanamento de duas moedas.

X: N de caras obtidas.

A distribuio de probabilidade da v. a. X dada por:

X P(x)

0 0,25

1 0, 5

2 0,25

46

O grfico de P(x) em funo de X do exemplo anterior acima :

EXEMPLO: Verifique se as seguintes funes so funes de probabilidade e determine as probabilidades requeridas: 1. x f(x) a) P(X 2) b) P(X > - 2) c) P(-1 X 1) -2 1/8 -1 2/8 0 2/8 1 2/8 2 1/8

2. f ( x)

2x 1 , x = 0, 1, 2, 3, 4. 25

a) P(X = 2) b) P(X 1) c) P(2 X < 4) d) P( X > -10)

IV. 1. 2 Mdia (ou valor esperado) e varincia de uma varivel aleatria discreta Valor esperado E(x) uma medida de tendncia da varivel aleatria x. igual mdia de um nmero infinito de observaes desta varivel.

A sua expresso matemtica a seguinte:

47

E( X )

xP( x)

tambm chamada de esperana matemtica ou mdia.

Exemplo: Considere que o valor de venda de um determinado imvel pode alcanar os valores a seguir, com as respectivas probabilidades de ocorrncia:
VALOR $180.000,00 $215.000,00 $250.000,00 $280.000,00 PROBABILIDADE 0,15 0,30 0,45 0,10

Qual o valor esperado do preo de venda deste imvel? O valor esperado ser, ento, igual a:

Ex
Ex

180.000 0,15 215.000,00 0,30 250.000,00 0,45 280.000,00 0,10


232.000,00

Isso significa que se este imvel fosse vendido um infinito n de vezes, a mdia dos seus valores de venda seria igual a $232.000,00. Uma outra interpretao seria a de que se um n infinito de imveis desse mesmo tipo fosse vendido, o valor mdio do preo de venda seria $ 232.000,00.

A varincia para uma distribuio de probabilidades dada por:


2

Px

Podendo ser reescrita como:


2

E X2

E( X )

O desvio padro (

) da varivel aleatria da v.a. discreta dado por:


2

VAR ( X )

Clculo da Varincia de X a partir do seu Valor Esperado

EXEMPLO: Considere que o nmero de reclamaes recebidas diariamente em uma determinada empresa de telefonia segue a seguinte distribuio de probabilidades:

48

N DE RECLAMAES

PROBABILIDADE

1 2 3
4

0,10 0,30 0,35 0,25

Determine a varincia do n. de reclamaes dirias.

O valor esperado do n. de reclamaes dirias ser igual a:

E X

1 0,10 2 0,30 3 0,35 4 0,25 2,75

O valor esperado do quadrado do n de reclamaes dirias ser igual a:

E X2

1 0,10 4 0,30 9 0,35 16 0,25 8,45

A varincia do n de reclamaes dirias ser igual a:


2

8, 45

2,75

0,8875

ALGUMAS PROPRIEDADES DA ESPERANA MATEMTICA

49

ALGUMAS PROPRIEDADES DA VARINCIA 1. VAR (k) = 0, k constante; 2. VAR (k . X) = k2 . VAR (X), k constante; 3. VAR aX 4. VAR X

a 2 VAR ( X )

VAR ( X ) VAR (Y ) 2 COV X , Y

VAR X

E X

E X

Definio: Covarincia entre X e Y: mede o grau de dependncia entre duas variveis X e Y.


COV X , Y E X E( X ) Y E (Y )

QUINTA LISTA DE EXERCCIOS 1. O nmero de chamadas telefnicas recebidas tem a seguinte distribuio: x f(x) 0 1/8 1 2/8 2 2/8 3 2/8 4 1/8

Determine mdia do nmero de chamadas. Resposta = 0,79 2. Um negociante espera vender um automvel at sexta-feira. A expectativa de venda na segunda-feira de 50%. Na tera-feira de 30%, na quarta-feira de 10%, na quinta-feira de 5% e na sexta-feira de 5%. Se lucro de R$ 3000,00 se vender na segunda-feira e diminui 40% a cada dia. a) Calcule o valor esperado do lucro deste negociante nesta venda. b) Calcule o desvio padro do lucro. Resposta: 2199,84 e 881,98 3. Uma seguradora paga R$ 30.000,00 em caso de acidente de carro e cobra uma taxa de R$ 1000,00. Sabendo que a probabilidade de que um carro sofra acidente de 3%. Quanto espera a seguradora ganhar por carro segurado?

50

Resposta: R$100,00 4. Um produto deve ser lanado no mercado no prximo ano. A expectativa do departamento de marketing de que o projeto seja bem sucedido de 80%. Neste caso, o retorno esperado em sua vida til de R$ 100.000,00. Se isto no acontecer, o prejuzo deve chegar a R$ 50.000,00. Calcule o lucro mdio. Resposta: 70000 5. Uma mquina de apostas tem 2 discos que funcionam independentemente um do outro. Cada disco tem 10 figuras: 4 mas, 3 bananas, 2 pras e uma laranja. Uma pessoa paga R$ 80,00 e aciona a mquina. Se aparecerem 2 mas, ganha R$ 40,00. Se aparecerem 2 bananas ganha R$ 80,00, ganha R$140,00 se aparecerem 2 pras e ganha R$ 180,00 se aparecerem duas laranjas. Se no aparecerem duas frutas iguais o jogador no tem ganho. Qual a esperana de ganho numa nica jogada? Resposta: -59,00 6. Num jogo de dados, A paga R$20,00 a B e lana 3 dados. Se sair a face 1 em um dos dados apenas, A ganha R$20,00. Se sair a face 1 em dois dados apenas, A ganha R$50,00, e se sair 1 nos trs dados dados, A ganha R$80,00. Calcular o lucro lquido mdio de A em uma jogada. (Morettim pg 47). Resposta: -9,21 7. Se uma v.a. X apresenta E(X) = 10 calcule: a) E(3X) b) E(5X-3) c) E(-5/3X + 4/3) 8. Se uma v.a. X apresenta VAR(X)=25, calcule: a) VAR(2X) b) VAR(5X-10) c) VAR(2/5X - 4)

IV.1. 3 Funo de Distribuio Acumulada (fda) da v.a. discreta


Definio: a probabilidade de varivel aleatria X assumir um valor menor ou igual a X. F(x) = P(X x) =
xi x

p ( xi )

Exemplo: Seja X a varivel aleatria nmero de caras obtidas no lanamento de 2 moedas, determine F(x) e construa o grfico de F(x).

x 0 1 2
Temos ento:

P(x) 1/4 1/2 1/4

F(x) 1/4 3/4 1

F (0)

P( X

0)

P( X

0) 1 / 4

51

F (1) F (2)

P( X P( X

1) 2)

P( X P( X

0) 0)

P( X P( X

1) 1)

3/ 4 P( X 2) 4/4

Portanto os valores para F(x) so: zero, quando: x < 0. 1/4, quando: 0 F(x) = 3/4, quando: 1 1, quando: x x < 1. x < 2. 2.

PROPRIEDADES DE F(X) 1. 0 2. F ( 3. F (
F(X ) 1 ) 0

) 1

4. F(X) descontnua nos pontos X = X0, onde P(X=x0) 0. 5. F(X) contnua a direita dos pontos X = X0, onde P(X=x0) 0. 6. P(a 7. P(a 8. P(a
X X b) b) F (b) F (a) F (b) F (a) P( X a)

b)

F (b) F (a) P( X

b)

VI. 2. VARIVEL ALEATRIA CONTNUA

Uma varivel aleatria X contnua pode assumir qualquer valor no intervalo de sua definio. EX.: medida da corrente de um fio delgado de cobre.

VI. 2. 1 Funo de Densidade de Probabilidade

52

Assim como as variveis discretas possuem suas funes de probabilidade, as variveis contnuas possuem suas funes densidade de probabilidade. A diferena entre as duas que enquanto a funo de probabilidade fornece diretamente a probabilidade da v.a. discreta assumir um determinado valor, tal no acontece com a funo de densidade. A probabilidade de uma v.a. contnua assumir um valor localizado dentro de um determinado intervalo igual rea embaixo da funo densidade, limitada pelos pontos extremos do intervalo. Assim a probabilidade de uma v. a. contnua assumir um determinado valor (probabilidade no ponto) nula, pois a rea embaixo de um ponto igual a zero. Uma funo densidade de probabilidade f(x) pode ser usada para descrever uma distribuio de probabilidades de uma varivel aleatria contnua X.

Funes de densidade so usadas na engenharia para descrever sistemas fsicos, como por exemplo, a densidade de uma carga em uma viga longa e delgada.

Definio: Para uma varivel aleatria contnua X, uma funo densidade de probabilidade (fdp) uma funo tal que:

a) f ( x) 0 para todo x;

b)

f ( x)dx 1 ;
b

c) P(a

X
.

b)
a

f ( x)dx = a rea sob f(x) para quaisquer a, b, com

a b
Obs.: * 0 * P( X * P(a
P(a x) X 0

b) 1

b)

P(a

b)

P(a

b)

P(a

b)

53

VI. 2. 2 Mdia (ou valor esperado) e varincia de uma varivel aleatria contnua

A mdia e a varincia de uma v.a. contnua so definidas de modo similar a uma v.a. discreta. A integrao substitui a soma nas definies.

Definio: Suponha que X seja uma v. a. contnua com uma funo densidade de probabilidade f(x). A mdia ou o valor esperado de X, denotado por ou E(X)

E( X )

x f ( x)dx
2

A varincia de X, denotada por

ou VAR(X),

E X2
2

E( X )

onde E ( X )

x 2 f ( x)dx

VI. 2. 3 Funo de Distribuio Acumulada (fda) da v.a. contnua

Definio: A funo de distribuio cumulativa de uma v.a. contnua X


x

F( X )

P( X

x) f (u )du

para

A funo densidade de probabilidade de uma v.a. contnua pode ser determinada a partir de uma diferenciao da funo de distribuio cumulativa. Ou seja, dada F(X), tem-se

f ( x)

dF ( X ) , desde que a derivada exista. dx

54

SEXTA LISTA DE EXERCCIOS

0 para X 0 0,1 para 0 X 0,3 para 1 X


1. (Morettim, pg 78) Seja

1 2 3 4 5

F ( x)

0,5 para 2 X 0,8 para 3 X 0,9 para 4 X 1 para X 5

a) Construir o grfico de F(x); b) Determinar a distribuio de X, E(X) e Var(X) c) Sendo Y = 3X-2, calcular E(Y) e Var (Y).

2. Verificar se

f ( x)

2 x 3 se 0 x 2 0, se x 0 ou x 2
1 (2 x 1) se 0 x 2 10 0, se x 0 ou x 2

uma fdp.

3. Verificar se

f ( x)

uma fdp.

4. Seja uma v.a. X a corrente em um fio delgado de cobre, medida em miliampres. Suponha que a faixa de X seja [0,20 mA] e considere que a funo densidade de probabilidade de X seja f ( x) 0,05 para 0 x 20 . Qual a probabilidade de que uma medida da corrente seja menor 10 miliampres? 5.Suponha que uma funo densidade de probabilidade de comprimentos de cabo computadores seja f (X) = 0,1 de 1200 a 1210 milmetros. Determine a mdia e o desvio padro do comprimento do cabo. 6. Suponha que o tamanho de uma partcula de contaminao possa ser modelado como

f ( x) 2 x

para 1 < X. Determine a mdia de X.

7. Seja X o tempo at que uma reao qumica esteja completa aproximado pela funo de distribuio cumulativa abaixo:

F(X )

0 se x 0 1 e 0, 01x , se x 0

Determine a funo densidade de probabilidade de X. Que proporo de reaes completada dentro de 200 segundos? 8. Seja X uma varivel aleatria contnua, o tempo de falha de um componente eletrnico de uma copiadora e a fdp de X, f ( x ) , foi dada:

f ( x) 2 x , para 0 < x < 1 e f ( x ) 0 , para quaisquer outros valores de x.


Determine: a) Construa a F(x) b) A probabilidade do tempo gasto ser de no mximo h, isto , P( X

1 / 4) ?

55

9. Seja f ( x)

kx se 0 x 1 . Determinar: 0 se x 0 ou x 2
1 2

a) k a fim de que f(x) seja f.d.p. b) P 0

c) E(X) d) VAR (X) e) F(X)

UNIDADE V DISTRIBUIO DE PROBABILIDADES

Na prtica as distribuies de probabilidades so usadas para resolver problemas. Os tipos de distribuies podem ser considerados modelos para descrever situaes que envolvem resultados gerados pela chance.

Existem muitos problemas parecidos, ento poucos modelos solucionam uma grande quantidade de problemas. Ex.: a jogada de moedas para o ar e n de itens defeituosos numa remessa de peas recaem sobre o mesmo modelo de probabilidade. A constatao desse fato levou o desenvolvimento de tcnicas padronizadas para a resoluo de muitos problemas diferentes.

Cada distribuio de probabilidade tem um conjunto de hipteses que devem ser verificadas para se utilizar o modelo.

O uso da distribuio de probabilidade consiste em comparar as hipteses do tipo da distribuio com as caractersticas do problema real.

Verificada a correspondncia, o problema enquadrado em uma classe de distribuio de probabilidade e resolvido sempre da mesma maneira. V.1 Distribuies Discretas de Probabilidades

As distribuies discretas envolvem variveis aleatrias relativas a dados que resultam de contagem, como o n. de ocorrncias por amostra, n. de ocorrncias por intervalo de tempo, de rea, ou distncia.

V.1.1 Distribuio Binomial

56

O termo binomial designa situaes em que os resultados de uma v.a. podem ser agrupados em duas categorias (os dados so, pois, nominais). Exemplo: em processos industriais as peas falham ou no falham; em medicina o paciente sobrevive ou morre; em marketing o consumidor reconhece um produto ou no. Definio: um experimento binomial satisfaz as seguintes condies: O experimento deve ser repetido, sob as mesmas condies um n finito de vezes (n); As repeties devem ocorrer de forma independente; Cada repetio possui dois resultados possveis: sucesso (p) e fracasso (q = 1- p); As probabilidades devem permanecer constantes para cada repetio.

Exemplo: Imagine uma mquina de confeccionar parafusos. Dos parafusos fabricados por essa mquina, 2% saem com algum tipo de defeito (esta uma caracterstica da mquina). Suponha que a produo dessa mquina lanada ininterruptamente em uma esteira, e que dessa esteira so retirados 10 parafusos. Para variveis com essa distribuio resolvemos problemas do tipo: determinar a probabilidade de se obter k sucessos em n tentativas. Seja X nmero de sucessos em n tentativas. A funo de probabilidade da varivel X dada por:

P( X
Notao: X: B (n, p).

k)

n k

p k (1 p) n k ;

n k

n! x!(n x)!

p: probabilidade de sucesso em uma das repeties; (1-p): probabilidade de fracasso em uma das n repeties; n: nmero de repeties; k: n de sucessos em n repeties, pode ser qualquer inteiro entre 0 e n, inclusive; P (X = k): a probabilidade de obter k sucessos em n repeties.

Mdia e desvio padro de uma varivel binomial: Mdia = n.p Desvio padro =

n p (1 p )

EXEMPLOS: 1. Considere que uma auditoria em uma empresa de vendas a crdito levantou que 30% dos clientes estavam com suas prestaes atrasadas. Determine a probabilidade de que,

57

em 10 clientes escolhidos aleatoriamente, 4 estejam com suas prestaes em atraso. E calcule a mdia e o desvio padro.

2. Cada amostra de ar tem 10% de chance de conter uma certa molcula rara. Considere que as amostras sejam independentes com relao presena da molcula rara. Encontre a probabilidade de que nas prximas 18 amostras, exatamente 2 contenham a molcula rara.

V. 1. 2 Distribuio de Poisson

freqentemente usada para estimar o nmero de ocorrncias sobre um intervalo de tempo ou espao. Exemplo: Nmero de defeitos por centmetro quadrado, clientes atendidos por hora, chegada de navios por dia no porto de Vitria. Propriedades do experimento de Poisson: A probabilidade de ocorrncia a mesma para quaisquer dois intervalos de igual comprimento. O nmero de ocorrncias em qualquer intervalo independente do nmero de ocorrncias em outros intervalos.

EXEMPLO 1: Suponha que em uma agncia bancria entrem, em mdia, 60 clientes por hora. Qual a probabilidade de, em 10 minutos, entrarem 4 clientes? Observe que o sucesso entrada do cliente. A probabilidade desejada a de 4 sucessos, isto , 4 entradas de clientes, dentro de um perodo de tempo de 10 minutos.

EXEMPLO 2: Suponha que uma vistoria em uma estrada constatou que, em mdia, existem 10 imperfeies no seu leito a cada 1000 metros. Qual a probabilidade de, em 100 metros, serem encontradas 2 imperfeies? Nesse caso, o sucesso encontrar uma imperfeio no leito da estrada, e o perodo ao longo do qual se deseja calcular a probabilidade, o espao de 100 metros.

Como calcular a Probabilidade: = N. mdio de sucessos no intervalo pretendido

Seja:

x = N. de sucessos pretendidos. Ento:


x

P( X

x)

e x!
58

Onde:

t
e = 2,71828 a razo de ocorrncia do sucesso e o t o perodo ao longo do qual se deseja calcular a probabilidade. No exemplo n. 1: = 60 clientes/hora = 60 clientes/60 minutos t = 10 minutos.

Ento:

60 10 10 60

P( X

10 4 e 4) 4!

10

0,0189

No exemplo n. 2: = 10 imperfeies/1000 metros t = 100 metros. Ento: =


10 100 1 1000

P( X

2)

12 e 2!

0,1839

Parmetros da distribuio de Poisson: Mdia = Desvio padro =

EXEMPLOS:

1. Contaminao um problema na fabricao de discos pticos de armazenagem. O nmero de partculas de contaminao que ocorrem em um disco tem distribuio de Poisson e o nmero mdio de partculas por centmetro quadrado de superfcie mdia 0,1. A rea do disco sob estudo 100 centmetros quadrados. Encontre a probabilidade de que 12 partculas ocorram na rea de um disco sob estudo.

2. O nmero de chamadas telefnicas que chegam a uma central freqentemente modelado como uma varivel aleatria de Poisson. Considere que, em mdia, h 10 chamadas por hora. a) Qual a probabilidade de que haja exatamente 5 chamadas em uma hora?

59

b) Qual a probabilidade de que haja 3 ou menos chamadas em uma hora? c) Qual a probabilidade de que haja exatamente 15 chamadas em duas horas? d) Qual a probabilidade de que haja exatamente 5 chamadas em 30 minutos?

V.1.3 Distribuio Binomial Negativa ou Pascal

Esta distribuio de probabilidades baseia-se nos seguintes pressupostos: 1. A experincia aleatria consiste numa sequencia de provas independentes; 2. Cada prova um processo de Bernoulli, isto , pode ocasionar um de dois resultados possveis e exclusivos (designados genericamente por sucesso, fracasso); 3. A probabilidade de cada resultado (sucesso, fracasso) mantm-se constante em cada repetio do experimento; 4. A experincia continua (isto , vo-se realizando provas sucessivas) at se obterem r 0 sucessos.

Suponha que um experimento aleatrio seja repetido independentemente at que um evento A ocorra pela r-sima vez.

Seja P(A) = p (sucesso) e P( A )

1 p (fracasso) em cada tentativa do experimento.

Seja X: Nmero de repeties necessrias para que A ocorra pela r-sima vez.

Se X = x, o evento A ocorre r-sima vez na repetio de nmero x. Logo, A ocorre (r-1) vezes nas (x-1) repeties anteriores.

P( X

x)

x 1 r p (1 p) x r , r 1

A varivel aleatria X assim definida tem distribuio de Pascal.

Mdia e Varincia de uma v.a. binomial negativa

E( X )

r p

Var ( X )

r (1 p) p2

Exemplo: A probabilidade de que um sinal de trnsito esteja aberto numa esquina de 0,20. Qual a probabilidade de que seja necessrio passar pelo local 10 vezes para encontr-lo aberto pela 4 vez? X = Nmero de passagens pela esquina.

60

r=4 p = 0,20

P( X

10)

10 1 0,20 4 (1 0,20)10 4 1

0,035232

STIMA LISTA DE EXERCCIOS 1) Se a probabilidade de ocorrncia de uma pea defeituosa de 40%, determinar a mdia e o desvio padro da distribuio de peas defeituosas de um total de 800.

2)

Os registros de uma pequena empresa de engenharia ambiental indicam que 30% das faturas expedidas so pegas aps o vencimento. De 10 faturas emitidas, qual a probabilidade de exatamente duas serem pagas com atraso?

3)

a) b) c)

Ontem, 80 % das aes mais negociadas na Bolsa de Valores Alpha caram de preo. Suponha que voc tenha uma carteira com 20 dessas aes e que as aes que perderam valor possuam distribuio binomial. Pede-se calcular: quantas aes de sua carteira voc espera que tenham cado de preo; o valor do desvio padro das aes que tem na carteira; a probabilidade de que tenham cado de preo exatamente 15 dessas aes.

4) Um lote de equipamentos novos recebido pela empresa que voc trabalha como gerente. 10 equipamentos so inspecionados. O lote rejeitado se pelo menos 2 equipamentos forem defeituosos. Sabendo-se que 1% dos equipamentos defeituoso, determinar a probabilidade de a firma rejeitar o lote.

5) Numa fita de som, h um defeito em cada 200cm. Qual a probabilidade de que: a) em 500 cm no acontea defeito? b) Em 800 cm ocorram pelo menos 3 defeitos?

6) Caminhes de lixo chegam a um aterro sanitrio a uma razo de 5 por hora. Determine a probabilidade de que durante qualquer hora: a) no chegue nenhum caminho; b) chegue mais de um caminho.

7) Uma firma recebe 720 mensagens em seu fax em 8 horas de funcionamento. Qual a probabilidade de que: a) em seis minutos receba pelo menos 4 mensagens? b) Em 4 min no receba nenhuma mensagem?

8) (NEAD) Uma indstria de refrigerantes recebe pedidos de seus vendedores por meio de fax, telefone ou internet. O nmero de pedidos que chegam por qualquer meio no horrio comercial uma varivel aleatria discreta com taxa igual a cinco pedidos por hora. Calcule a probabilidade de: a) A indstria receber apenas dois pedidos em uma hora. b) Receber seis, sete ou oito pedidos em duas horas.

9) Numa linha adutora de gua, de 60 km de extenso, ocorrem 30 vazamentos no perodo de um ms. a) Qual a probabilidade de ocorrer, durante o ms, pelo menos 3 vazamentos num certo setor de 3 km de extenso? b) A ocorrncia de 10 vazamentos em num certo setor de 3 km de extenso muito rara? Explique. 10 ) Numa linha de montagem, 10% das peas so defeituosas.Qual a probabilidade da quinta pea que se analisa ser a segunda defeituosa?

11) Qual a probabilidade de que no 25 lanamento de um dado ocorra a face 4 pela 5 vez?

61

12) Uma uran tem 10 bolas brancas e 40 pretas. a) Qual a probabilidade de que a 15 bola extrada com reposicao seja a 6 branca? b) Qual a probabilidade de que em 30 bolas retiradas com reposio ocorram no mximo 2?

V.2 Distribuies Contnuas de Probabilidades

Sero estudadas as seguintes Distribuies Contnuas de Probabilidades: - Distribuio Normal - Distribuio Exponencial - Distribuio Uniforme - Outros modelos importantes: Gama, qui-quadrado, t-Student e F-Snedecor.

V.2.1 Distribuio Normal A Distribuio Normal uma das mais importantes distribuies, se no a mais importante, da Estatstica. Ela aplicada a um grande nmero de processos aleatrios relacionados com o ser humano. Ela tambm intensamente utilizada ao longo da Estatstica Inferencial.

Caractersticas da Distribuio Normal A v.a. de distr. normal pode assumir todo e qualquer valor real, definida de a . A Distribuio Normal uma distribuio simtrica. Assim sendo, a mdia, a mediana e a moda assumem o mesmo valor. A forma assumida pela funo densidade de probabilidade Normal a de um sino. O ponto mais elevado da curva corresponde ao seu valor mdio. A curva assinttica. Cada distribuio normal fica especificada por sua mdia e seu desvio padro.

62

A rea total sob a curva 1 e a probabilidade de ocorrer um valor maior que a mdia igual a probabilidade de ocorrer um valor menor do que a mdia. O desvio padro da distribuio determinar a abertura dessa curva, assim:

Mdia Mediana Moda


Desvio padro grande

Mdia Mediana Moda Desvio padro pequeno

Em uma Distribuio Normal observa-se que: 68% das observaes so localizadas dentro de 1 desvio padro em torno da mdia; 95% das observaes so localizadas dentro de 2 desvios padro em torno da mdia; 99,7% das observaes so localizadas dentro de 3 desvios padro em torno da mdia.

63

Funo Densidade de Probabilidade

f ( x)

1 2

1 2

O clculo da probabilidade da varivel aleatria assumir um valor dentro de um determinado intervalo se dar atravs da integral da funo densidade de probabilidade ao longo do intervalo pretendido. Seria mais prtico usarmos tabelas, como j fizemos para outras distribuies. Acontece que teramos que construir infinitas tabelas, uma para cada par de valores da mdia e do desvio padro da distribuio.

Distribuio Normal Padro A soluo foi definir uma Distribuio Normal Padro. Uma Distribuio Normal Padro uma distribuio normal cuja mdia igual a zero e o desvio padro igual a 1. A Distribuio Normal Padro , ento, tabelada. A operao para se calcular uma probabilidade normal passa a ser a converso da normal qualquer, da qual desejamos calcular a probabilidade, em uma normal padro, seguida de uma consulta tabela da normal padro. A transformao de uma normal qualquer de mdia e desvio padro realizada com o auxlio de uma varivel aleatria auxiliar Z, assim calculada:

Com o valor de Z assim calculado, entra-se na tabela da distribuio normal padro. A Tabela da Distribuio Normal Padro (vide a tabela Distribuio normal padro no ANEXO I) fornece a probabilidade do valor da varivel aleatria cair dentro de um intervalo entre a mdia e o determinado valor de Z. A Tabela possui dois argumentos de entrada:

64

Na margem vertical esquerda, entra-se com a parte inteira e o 1 decimal de Z; Na margem horizontal superior entra-se com o 2 decimal de Z. No cruzamento, l-se a probabilidade.

Uso da Tabela da Normal Padro

Entre com o inteiro e 1 decimal do valor de Z


Z 0,0 0,1 0,2
. . .

Entre com o 2 decimal do valor de Z


0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00

0,01

0,02

Probabilidade para Z entre 0 e 1,14

1,0 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2
. . .

2,0 2,1
. . .

Leia, no cruzamento a Probabilidade

EXEMPLOS: 1. Um estudo dirio realizado sobre material particulado em suspenso feito em uma determinada rea da cidade nos finais de semana revelou que essa varivel aleatria normalmente distribuda com uma mdia de 98 g m 3 e um desvio padro de 20 g m3. Qual a probabilidade de se ter uma medio cujo valor seja: a) Entre 98 e 110? b) Maior do que 110? c) Entre 95 e 105? d) Menor que 110?

2. Suponha que medidas da corrente em um pedao de fio sigam a distribuio normal, com uma mdia de 10 miliampres e uma varincia de 4 (miliampres)2. Qual a probabilidade da medida exceder 13 miliampres?

65

3. Sendo X: N (50,16), determinar X tal que: a) P( X b) P( X

X ) 0,05 R.: 56,6


X ) 0,99 R.: 59,3

V. 2.2 Distribuio Exponencial aplicada para o clculo da probabilidade de intervalos de tempo ou de espao fsico entre dois eventos governados por um processo de Poisson. A varivel aleatria o intervalo de tempo ou espao entre dois eventos consecutivos. Funo Densidade de Probabilidade igual a:

f ( x)
onde = tempo (ou espao) mdio

O clculo de uma probabilidade exponencial feito da seguinte forma :

x0

P( x

x0 ) 1 e
x0

, para valores de x

xo

P( x

x0 )

, para valores de x

xo

EXEMPLO: Um banco est implementando um servio de atendimento a clientes especiais aps o trmino do expediente. O gerente da agncia fez um estudo a respeito da demanda por esses servios e constatou que, em mdia, a agncia era procurada por cerca de seis clientes por hora. Qual a probabilidade de um cliente chegar pelo menos 10 minutos aps o anterior ter chegado?

Neste caso, o perodo de tempo entre os dois eventos consecutivos de 10 minutos: 6 clientes em 1 hora ou 10 minutos entre dois clientes consecutivos. A probabilidade que se deseja calcular a de P(t 10 minutos)

66

Aplicando-se a frmula apropriada, teremos:


P( 10) e
10 10

0,3679

Veja no grfico abaixo a rea correspondente probabilidade calculada.

P(t 10 ) minutos)=0,3679

10

Qual a probabilidade um cliente chegar, no mximo, 8 minutos aps a chegada do cliente anterior? A probabilidade que se deseja calcular, neste caso, P (t ento que: 8 minutos). Tem-se

p(t 8) 1 e

8 10

0,5507

Veja no grfico abaixo a rea correspondente probabilidade calculada:

P(t 8 ) )minutos)=0,5507

Qual a probabilidade do perodo de tempo entre duas chegadas consecutivas de cliente ficar entre 5 minutos e 9 minutos? Nesse caso, a probabilidade que se deseja p ( 5 .

p(5 t

9)

p(t

9)
9 10

p(t

5)
5 10

p(5 t 9) (1 e

) (1 e

) 0,20

67

P(5 t 9) 99)=0,20

V. 2.3 Distribuio Uniforme aplicada s Variveis Aleatrias Contnuas nas quais todos os resultados localizados no intervalo de sua definio possuem a mesma probabilidade de ocorrer. O grfico apresentado a seguir mostra uma distribuio uniforme definida no intervalo de a a b.

Esta rea igual a 1

1 b-a

Funo Densidade de Probabilidade: Para valores de x tais que a

b:

f ( x)
Para outros valores:

1 b a

f ( x) 0 EXEMPLO: O valor de uma compra em uma loja de discos uma varivel

aleatria uniformemente distribuda no intervalo entre $ 10,00 e $ 35,00. Qual a probabilidade de um cliente realizar uma compra cujo valor se situe entre $ 15,00 e $ 28,00? Observem no grfico a seguir os valores envolvidos no problema.

68

Probabilidade Desejada
1 35 - 10

10

15

28

35

A probabilidade procurada ser igual :

1 35 10

28 15

0,52

V. 2.4 Distribuio log-normal

Caractersticas: 1. Aplica-se a casos em que uma transformao log-natural resulte em uma distribuio normal. 2. Como a funo logaritmo no est definida para valores menores ou iguais zero, X somente poder assumir valores maiores do que zero. 3. O formato da curva que representa a funo densidade de probabilidade apresentar assimetria esquerda. 4. O modelo apresenta um parmetro de localizao e um de escala .

Encontrado em http://www.itl.nist.gov/div898/handbook (Engineering Statistics Handbook).

69

Diz-se que uma v.a. no negativa X possui distribuio lognormal se a v.a. Y = ln(X) possui uma distribuio normal. A f.d. p. resultante de uma v.a. lognormal quando ln(X) tiver distribuio normal com parmetros e :

f ( x)

2 x 2

1 2

Ln ( x )

, para x 0.

Tenha cuidado neste caso. Os parmetros e no so a mdia e o desvio padro de X e sim da varivel Y = ln (X). A mdia e a varincia de X so:
2

E( X )
Var ( X )

x
2 x

e
e2

2
2 2

Padronizao:

Ln( x)

Exemplo: A distribuio lognormal usada como modelo para diversas propriedades de materiais. Um artigo sugere que a distribuio lognormal com = 0,375e = 0,25 um modelo plausvel para X = mdulo da elasticidade de sistemas de vigas de madeira construdos de hem-fir grau nmero 2. O valor da mdia e varincia de X so:

E( X )
Var ( X )

x
2

e
x

0 , 375

0 , 252 2

1,50
0 , 252

e2

0 , 375

e 0, 25

0,1453

A probabilidade de X estar entre 1 e 2 :

P(1

2)

P( 1,5

1,27)

0,8312

Z1

Ln(1) 0,375 0,25

1,5

Z2

Ln(2) 0,375 1,27 0,25

70

Aplicao: A partir dos dados dos tempos de reparo para as falhas do Circuito de Via Reed (equipamento utilizado em sinalizao ferroviria), fornecidos pelas equipes de manuteno corretiva, os seguintes parmetros da

distribuio log-normal foram estimados e traadas as curvas abaixo: Os parmetros: = 0,9268 e = 1,8412 foram obtidos, a partir dos dados observados dos tempos de reparo (pontos verdes), utilizando-se o mtodo da regresso linear. Logo aps, foi traada a curva em azul (curva terica da manutenibilidade do "circuito de via reed"). A curva vermelha foi obtida aps as modificaes efetuadas nos mtodos e processos de manuteno deste item.

Aps a anlise da manutenibilidade, foram identificados diversos problemas que estavam conduzindo a altos tempos de reparo, tornandose preciso modificar o sistema de manuteno. Como exemplo, de problemas identificados, podemos citar: Algumas falhas, devido ao treinamento inadequado para as equipes de manuteno, estavam conduzindo a tempos de reparo

excessivamente altos. Os procedimentos de diagnose no estavam corretos na grande maioria dos reparos.

71

O estudo para determinar a maneira precisa, como os dois parmetros da distribuio log-normal e esto relacionados com os fatores de manuteno que os determinam, permitem obter predies apuradas da distribuio dos tempos de paralisao de sistemas ou equipamentos. De importncia particular no estudo, a descoberta e avaliao do efeito preciso do desempenho da manuteno devido aos vrios fatores humanos.

A anlise dos tempos de reparo de sistemas ou equipamentos conduzem a(o): melhoramento da qualidade dos servios, aumento da

disponibilidade, diminuio dos custos de mo-de-obra e reduo dos custos de perda de produo.

Exerccios: 1. A concentrao de poluentes produzidos por indstrias qumicas conhecida por exibir comportamento que lembra uma distribuio log-normal. Isso importante quando considerarmos assuntos relacionados ao

cumprimento das regulamentaes governamentais. Suponha que assumimos que a concentrao de certo poluente, em ppm, tem distribuio log-normal com parmetros =3,2 e =1. Qual a probabilidade de que a concentrao exceda oito partes por milho? Resposta =0,8686

2. Em um estudo de Marketing, os dados referentes ao nmero de minutos dirios que 100 indivduos selecionados aleatoriamente passam em frente TV foram tabulados; aps algumas anlises chegou-se a concluso de que o Ln (X) apresentava-se como uma v.a. Y normalmente distribuda com mdia igual a 5 e desvio padro de 1,5. Qual a probabilidade de selecionarmos um indivduo que assista no mximo 95 min dirios de televiso? Qual o tempo mdio que um indivduo passa diante da TV? E o desvio padro para esta medida?

3. O tempo, em segundos, que um usurio de computador leva para ler seus e-mails distribudo como uma varivel aleatria log-normal, com parmetros
1,8 e

varincia igual a 4,0. Qual a mdia e o desvio padro da varivel tempo? Qual a 72

probabilidade de que o usurio leia seus e-mails por mais de 20 segundos? E por mais de um minuto?

V. 2.5 Distribuio Gama

Para se definir a Distribuio Gama necessrio definir inicialmente a Funo Gama, que dada por:

( )

e xx

dx , >0

A funo Gama recursiva, isto : = G(r) = (r - 1) (r - 1)

Se r um inteiro positivo, ento: = (r 1)! e

1/ 2

A distribuio gama apropriada para modelar o tempo requerido para um acontecimento de exatamente X eventos independentes que ocorrem a uma taxa constante Y. Aplica-se a distribuio gama : Tempo de retorno de mercadorias com falhas; Testes de confiabilidade; Tempo para completar uma tarefa; Tempo de atendimento num posto de informaes. Tempo para falha de um sistema

A distribuio gama importante na modelagem estatstica de problemas de fila, que trabalha com tempos em linhas de espera e tempos de servio.

Os dois parmetros da distribuio so: (PARMETRO DE FORMA); (PARMETRO DE ESCALA) Sua f.d.p pode apresentar uma grande variedade de formas, dependendo do parmetro de forma . Para valores de muito altos, a distribuio gama tende Gaussiana. O parmetro de escala , tem a funo de ESTICAR OU

73

ENCOLHER (isto escalonar) a funo para a direita ou esquerda, dependendo dos valores dos dados representados.

A distribuio Gamma serve de modelo para quantidades fsicas que s tomam valores positivos.

A f.d.p. dada por:

, x > 0 sendo e > 0

Grficos de diversas distribuies Gama so mostrados na figura abaixo:

(a) Curvas de densidade gama; (b) curvas densidade gama padro.

A mdia e a varincia da distribuio gama so respectivamente:


2 2

A distribuio gama padro tem = 1, de forma que a fdp de uma v.a. gama padro dada por:
f ( x; ) x 0 ( ) 0 caso contrrio x
1

Quando X uma v.a. gama padro, a funo de distribuio cumulativa de X,

74

F ( x; )

x 0

( )

x 0

denominada funo gama incompleta. Apresenta-se abaixo uma pequena tabulao para clculo de probabilidades:

Exemplo: Suponha que o tempo de reao X de um individuo selecionado aleatoriamente a um certo estimulo possui distribuio gama padro com = 2 segundos. Como:

P(a

b)

F (b) F (a)

Quando X contnuo,
P(3 X 5) F (5;2) F (3;2) 0,960 0,801 0,159

A probabilidade do tempo de reao ser mais de 4 segundos :


P( X 4) 1 P( X 4) 1 F (4;2) 1 0,908 0,092

funo

gama

incompleta

tambm

pode

ser usada

para

calcular

probabilidades que envolvam distribuies gama no padro. Proposio: Seja X com uma distribuio gama de parmetros e . Ento, para qualquer x > 0, a funo distribuio cumulativa de X dada por:

75

P( X

x)

F ( x; , )

Onde F(.;) a funo gama incompleta. Exemplo: Suponha que o tempo de sobrevivncia X em semanas de um camundongo macho selecionado aleatoriamente exposto a 240 rads de radiao tenha uma distribuio gama com = 8 e = 15. O tempo esperado de sobrevida E(X) = 8.15 = 120 semanas, enquanto V(X) = 8.152 = 1800 e desvio padro 42,43 semanas. A probabilidade de um camundongo sobreviver entre 60 e 120 semanas :
P(60 X 120) P( X 120) P( X 60) F (120 / 15; 8) F (60 / 15; 8) F (8; 8) F (4; 8) 0,547 0,051 0,496

Exerccios: 1. Se a v.a. x tem distribuio gama com = 2 e = 1, determine P(1,8 < X <.2,4). 2. Em uma cidade, o consumo de gua segue uma distribuio gama com = 2 e = 3. Se a capacidade diria da cidade de 9 milhes de litros de gua, qual a probabilidade de que, em qualquer dia escolhido, o suprimento de gua seja inadequado?

3. Suponha que o tempo, em horas, que se leva para consertar uma bomba de aquecimento uma v.a. com distribuio gama com parmetros = 2 e = . Qual a probabilidade de que a prxima chamada de servio precise: a) no mximo uma hora para consertar a bomba? b) pelo menos duas horas para consertar a bomba?

V. 2.6 Distribuio de Weibull

usada para modelar o tempo at uma falha. Os parmetros da distribuio permitem modelar sistemas onde o nmero de falhas aumenta com o tempo (desgaste do mancal), diminui com o tempo (alguns semicondutores) ou permanece constante. 76

A varivel aleatria X com funo densidade de probabilidade com parmetros e :


x

f ( x; , )

x 0

, para x x 0

0x

tem uma distribuio de Weibull com parmetro de escala >0 e parmetro de forma > 0. Quando =1, a distribuio de Weibull idntica distribuio exponencial.

A flexibilidade da distribuio mostrada na Figura abaixo:

77

Funo densidade de probabilidade de Weibull para valores selecionados de e .

A funo de distribuio acumulada frequentemente usada para calcular as probabilidades. O seguinte resultado pode ser obtido:

0 F ( x; , ) P( X

x 0
x

x) 1 e

x 0

A mdia e a varincia da v.a. X que tem distribuio de Weibull : 1 E( X ) 1

VAR ( X )
Onde

r
e

(r 1)! se r for um inteiro positivo.

r
1/ 2

(r 1) (r 1) de uma maneira geral.

Exemplo: O tempo de falha (em horas) de um mancal em um eixo mecnico satisfatoriamente modelado como uma v.a. de Weibull com =1/2 e = 5000 horas. Determine o tempo mdio at falhar.

E( X )

5000

1 0,5

5000 (3)

5000 2! 10000 horas

Determine a probabilidade de um mancal durar no mnimo 6000 horas.

P( X

6000) 1 F ( x)

6000 5000

0,5

1, 2

0,301

APLICAO DA DISTRIBUIO DE WEIBULL

1. Velocidade do vento: A distribuio de Weibull tem sido utilizada em inmeros estudos destinados anlise de frequncia da velocidade do vento, como no exemplo abaixo:

78

2. Taxa de falha: til para determinarmos a taxa de falha (algumas vezes chamadas de taxa de risco) e percebemos o desgaste ou deteriorao do componente. Define-se confiabilidade de um componente ou produto como a probabilidade de que ele funcionar apropriadamente por, pelo menos, um tempo determinado, sob condies experimentais especficas.

EXEMPLOS: 1. Suponha que X tem distribuio de Weibull com =0,2 e = 100 horas. Determine: a) P(X <1000) = b) P(X>5000) =

2. Suponha que a vida de um mancal de rolamento siga uma distribuio de Weibull com =0,2 e = 10000 horas. Determine a probabilidade de um mancal durar menos de 8000 horas.

3. Suponha que a vida til de um disco magntico de armazenamento exposto a gases corrosivos tem uma distribuio de Weibull com =0,5 e com de 600 horas.

79

a) Determine a probabilidade de um disco de armazenamento durar no mnimo 500 horas. b) Determine a probabilidade de um disco de armazenamento falhar antes de 400 horas.

4. Suponha que a vida til, em anos, da bateria de um aparelho auditivo uma varivel aleatria com distribuio Weibull com =2 e =1/2. a) Quanto tempo podemos esperar que a bateria dure? b) Qual a probabilidade de que a bateria esteja operando daqui a dois anos?

V. 2.7 Distribuio qui-quadrado

um caso especial do modelo Gama com =2 e =

2 com

>0 e inteiro.

A distribuio qui-quadrado assimtrica positiva, ou seja, no negativa e desviada para a direita, sendo que medida que o nmero de graus de liberdade aumenta, a distribuio se torna mais simtrica e quando k , a

distribuio qui-quadrado tende para uma distribuio normal, veja figura abaixo:

Funes densidade de probabilidade de vrias distribuies A f.d.p dada por:

80

E( X )

VAR ( X )

A distribuio qui-quadrado possui numerosas aplicaes importantes em inferncia estatstica. Em virtude de sua importncia, a distribuio quiquadrado est tabulada para diferentes valores do parmetro denominado graus de liberdade (gl). Os pontos percentuais da distribuio qui-quadrado so tabelados sendo que as reas esto na primeira linha e os graus de liberdade so dados na coluna esquerda. Por exemplo, o valor com 10 graus de liberdade tendo uma rea de 0,05 para a direita
2 0 , 05;10

que

18,31 , sendo que esse valor o ponto superior 5%

da varivel qui-quadrado, veja abaixo:

81

Exemplo: Suponha agora que X segue uma distribuio qui-quadrado com 10 graus de liberdade e P(X>2,558)=0,99 ao passo que P(Y>18,307) = 0,05.

V. 2.8 Distribuio t Student

A origem da distribuio t foi um artigo publicado em 1908 por William Sealey Gosset (1876 - 1937), qumico da cervejaria Guinness de Dublin. Ele no pode publicar o artigo com o seu verdadeiro nome da o pseudnimo.

Ela surge em quase todo trabalho estatstico sempre que se tenha que estimar o desvio padro a partir de dados amostrais.

simtrica e semelhante curva normal padro, porm com caudas mais largas, ou seja, uma t de Student pode gerar valores mais extremos que uma distr. Normal.

diferente conforme o tamanho da amostra (n) Apesar de ser simtrica, reflete a maior variabilidade esperada em pequenas amostras Tem mdia t=0 O desvio padro varia com o tamanho da amostra, mas superior a 1

Condies de utilizao Tamanho da amostra pequeno (n30). desconhecido. Populao original tem distribuio essencialmente normal.

O grfico se aproxima da normal padronizada quando que 30).

grande (maior do

82

Encontrado em: http://www.mat.ufrgs.br/~viali/estatistica Seja Z uma v.a. N(0,1) e Y uma v.a v.a,
t Z Y/
2

( ) , com Z e Y independentes. Ento, a

tem densidade dada por:

1 f ( x, ) 2 2
1

Tal varivel aleatria tem distribuio t de Student com indicaremos por X( ) sendo: E(X) = 0 e
Var ( X ) 2

graus de liberdade e a

Como essa distribuio muito utilizada na prtica existem tabelas fornecendo probabilidades relativas a ela. A tabela retorna um valor t < to)

Tem-se na tabela os graus de liberdade, isto , com o tamanho da amostra ( ou g.l.) e a probabilidade da cauda da curva. Abaixo apresentada uma parte da Tabela da Distribuio de Student (ou distribuio t) existente em arquivo ANEXO.

83

OBS.: Grau de liberdade: para um conjunto de dados correspondente ao nmero de valores que podem variar aps terem sido impostas certas restries a todos os valores. V. 2.9 Distribuio F Snedecor A distribuio F de Fisher-Snedecor, mais conhecida como distribuio F de Fisher (em honra a Ronald Fisher) ou distribuio F de Snedecor (em honra a George W. Snedecor) mede a razo entre duas chi quadrado independentes. Caractersticas: - A distribuio F no simtrica. - Os valores da distribuio F no podem ser negativos. - A forma exata da distribuio F depende do numero de graus de liberdade do numerador e o numero de graus de liberdade do denominador. Sendo U e V duas v.a. independentes, cada uma com distribuio quiquadrado, com
1

graus de liberdade, a v.a:

U / v1 V / v2

tem densidade dada por:

84

f ( w; v1 , v2 )

) / 2) v1 w( v1 2) / 2 ( 1 / 2) ( 2 / 2) v2 (1 v1w / v2 ) ( v1 ((
1 2

v2 ) / 2

O que tabelado a percentil 95% ou 99% - rea direita de cada curva (uma para cada par de valores numerador, denominador) igual a 5% e 1%.

Exemplo: Considere, W~F(5,7). Consultando a tabela em arquivo anexo P(F>3,97) = 0,05 ou ento, P(F3,97) = 0,95. Digamos que desejamos encontrar o valor de fo tal que P(F<fo) = 0,05. Assim:

0,05 P{F (5,7)

f o } P(1 / F (7,5)

f o ) P{F (7,5) 1 / f o }

Na tabela F(5,7), obtemos 1/fo=4,88 e fo = 0,205

UNIDADE VI. DISTRIBUIES AMOSTRAIS Uma das realidades da amostragem aleatria que, quando se extraem repetidas amostras da mesma populao, h tendncia da estatstica amostral variar de uma amostra para outra, e tambm em relao ao verdadeiro valor do parmetro, simplesmente em razo de fatores casuais relacionados com amostragem. Essa tendncia conhecida com variabilidade amostral. Assim quando fazemos inferncias sobre uma populao devemos considerar a variabilidade amostral.

VI.1 Distribuio Amostral da Mdia

As distribuies de probabilidade das estatsticas amostrais so chamadas de distribuies amostrais.

A mdia, bem como todas as demais estatsticas de uma amostra, so variveis aleatrias. Dessa forma, possuem distribuies de probabilidade como qualquer outra varivel aleatria. Uma distribuio amostral de mdias uma distribuio de probabilidade que mostra a variabilidade das mdias amostrais.

85

A mdia de uma distribuio amostral sempre igual mdia populacional


x

Quando a populao infinita, o desvio padro da distribuio amostral da

mdia :
x

EXEMPLO: Uma amostra aleatria de 100 observaes dos

valores das

vendas realizadas em determinada loja apresentou uma mdia igual a $ 328,40 e um desvio padro de $ 87,43. Qual o valor estimado da mdia, da varincia e do desvio padro amostrais? A mdia amostral ser igual a: a $ 328,40 O desvio padro amostral ser igual a: 87,43/10 = 8,743

Teorema do Limite Central

Informaes 1. A varivel aleatria x tem distribuio (que pode ser normal ou no), com mdia e desvio padro .

2. Amostras de tamanho n so extradas aleatoriamente dessa populao.

Concluso 1. Na medida em que o tamanho da amostra aumenta a distribuio das mdias amostrais x , tende para uma distribuio normal. 2. A mdia das mdias amostrais ser a mdia populacional . 3. O desvio padro das mdias amostrais ser
n

Regras prticas de uso comum 1. Para amostras de tamanho n>30, a distribuio das mdias amostrais pode ser aproximada satisfatoriamente por uma distribuio normal. A aproximao melhora na medida em que aumenta o tamanho da amostra n. 2. Se a prpria distribuio original tem distribuio normal, ento as mdias amostrais tero distribuio normal para qualquer tamanho amostral n. 86

EXEMPLO: Considere uma populao com altura mdia de 170 cm de altura e desvio padro de 9 cm. A. Selecionada uma mulher aleatoriamente, determine a probabilidade de sua altura estar entre 170 cm e 175 cm: B. Selecionada aleatoriamente 75 mulheres, determine a probabilidade de suas alturas terem mdia entre 170 cm e 175 cm:

VI.2 Distribuio Amostral da Proporo

A mdia (proporo ou percentagem mdia) da distribuio amostral p sempre igual proporo populacional. Isto ,
p p

Onde: p = proporo populacional


p = mdia da distribuio amostral das propores.

Quando a populao muito grande ou infinita, o desvio padro da distribuio amostral se calcula pela frmula:
p

p(1 p) n

Exemplo: Um varejista compra copos diretamente da fbrica em grandes lotes. Periodicamente o varejista inspeciona os lotes para determinar a proporo dos quebrados. Se um grande lote contm 10% de quebrados, qual a probabilidade do varejista obter uma amostra de 100 copos com 17% ou mais defeituosos? Soluo: O primeiro passo calcular o desvio padro da populao:

p(1 p) n

0,10(0,90) 100

0,03

Usando a padronizao temos:


P( p z 0,17) ? 2,33

0,17 0,10 0,03

87

Olhando na tabela normal padro temos que a probabilidade procurada 0,0099.

OITAVA LISTA DE EXERCCIOS 1) A populao das importncias das compras em certo supermercado 24 horas tem mdia de R$ 5,20 e desvio de R$ 4,10. Qual a probabilidade de um total de 100 compras o valor mdio exceder R$ 6,00?

2) A distribuio do peso de homens que viajam de avio de Vitria para So Paulo tem mdia de 163 libras e desvio padro de 18 libras, qual a probabilidade do peso mdio de 36 homens tomados aleatoriamente ser maior que 167 libras.

3) Se vamos extrair amostras de n = 100 observaes de uma populao muito grande, em que a proporo populacional 20%, qual a probabilidade das propores amostrais podemos esperar nos intervalos abaixo? (Stevenson, pag, 188) a) maior que 24% b) 16% a 24% c) 12% a 28% d) menos de 12% ou mais de 28%

UNIDADE VII. INTERVALO DE CONFIANA PARA CONFIANA PARA MDIA E PROPORO

Em muitas situaes, uma estimativa de um parmetro no fornece informao completa para um engenheiro. Por exemplo, considere um problema de condutibilidade trmica. A estimativa da condutibilidade trmica para um material em particular x = 41,924 BTU/h. ft. F. improvvel que a mdia verdadeira da condutibilidade trmica () seja exatamente igual a esse valor;

88

assim uma questo relevante aparece: quo prximo est x da mdia verdadeira?

VII.1 Alguns conceitos a) Estimao O uso da amostra nos permite inferir os parmetros da populao a partir da amostra atravs da estimao que pode ser: Estimao pontual ou Estimao intervalar.

b) Confiana X Risco Sempre que se faz uma estimao de uma varivel aleatria, existe uma probabilidade de se errar essa estimao quando comparamos o valor estimado com o valor que realmente foi observado. probabilidade de se errar a estimao d-se o nome de RISCO. O RISCO o complemento da CONFIANA. A CONFIANA vem a ser, ento, a probabilidade de se acertar a

estimao. Ento, resumindo: Confiana (1 - ) = Probabilidade de acerto na estimao; Risco ( ) = Probabilidade de erro na estimao.

c) Estimao Intervalar X Estimao Pontual Estimao pontual Maior preciso, mas menor Estimao intervalar Menor preciso, mas maior

confiana. A mdia amostral um estimador pontual, no tendencioso, da mdia populacional. A varincia amostral um estimador pontual, no tendencioso, da

confiana. A estimao intervalar obtida atravs a construo de intervalos de confiana. A amplitude do intervalo de

confiana depende da: 1. Confiana desejada: Quanto maior a confiana, maior o intervalo. Uma confiana de 0% nos leva a um ponto. Uma confiana de 100% nos

varincia populacional. O mesmo acontece com o desvio padro amostral em relao ao

desvio padro populacional.

89

ESTIMATIVAS PONTUAIS:

leva a um intervalo de 2. Variabilidade do

xi n

mdia amostral

processo:

Quanto mais varivel o processo aleatrio do qual est se fazendo a estimao, maior o intervalo de

2 sx

estimao,

para

uma

mesma

n 1

var incia amostral

confiana. 3. Quantidade de informao

(tamanho da amostra): Quantidade


x x
2

de
desvio padro amostral

informao: Quanto maior a

n 1

amostra, mais informao teremos a respeito do processo aleatrio em estudo. Dessa forma, para uma mesma confiana, quanto maior a amostra, menor ser o intervalo de estimao necessrio.

VII.2 Estimao Intervalar da Mdia Um intervalo de confiana para a mdia populacional , construdo em torno da mdia amostral, e a sua amplitude ser determinada pela quantidade de desvios padro e conforme a confiana desejada. A quantidade de desvios padro a ser usada representada pela varivel Z (valor da distribuio normal padro) ou t (valor da tabela t-Student). A quantidade de desvios padro somada/subtrada da mdia amostral chamada de erro de estimao.

1. Desvio padro da populao conhecido

90

Quando a populao aproximadamente normal e o seu desvio padro da populao conhecido usa-se da distribuio normal para determinao do

intervalo de confiana independente do tamanho da amostra:

x Z

ou

x Z

x Z

n
/2 e o erro de

Na qual Z obtido na tabela da distribuio Normal para estimao :

Exemplo: Uma loja realizou um estudo a respeito dos valores das compras realizadas pelos clientes. Sabe-se de levantamentos anteriores que o valor de uma compra realizada por um cliente uma varivel aleatria normalmente distribuda, com um desvio padro de R$ 42,00. Estime valor de compra com 95% de confiana considerando que foi utilizada uma amostra aleatria de 15 clientes e o valor da mdia amostral foi de R$ 120,00.

Nesse caso, o desvio padro da populao conhecido e igual a $ 42,00. Por outro lado, tambm se garante que a varivel valor da compra normalmente distribuda. Ento o intervalo ser:
120 1,96 42 15

120 21,26

98,74 a 141,26

Sendo que o valor de Z encontrado da seguinte forma:

Como a confiana requerida de 95%, ento /2=2,5%, ou 0,025. Entrando no miolo da Tabela da distribuio Normal com 0,475 (0,475 = 0,5

0,025), obtm-se Z = 1,96.

A representao grfica do intervalo de confiana determinado a seguinte:

91

2. Desvio padro da populao desconhecido

2.1 Amostra Grande, n

30

s x Z x n

ou

x Z

sx n

x Z

sx n

Na qual Z obtido na tabela da distribuio Normal para /2.

O erro de estimao :

sx n

Exemplo: O administrador de uma empresa ambiental est estudando o ganho com a venda de leo lubrificante usado e para tal tomou o preo ofertado por 40 empresas escolhidas aleatoriamente. O resultado obtido foi uma mdia de $ 165,00 por quinhentos litros e um desvio padro de $ 45,00. Estime, com 90% de confiana, o ganho mdio com a venda do leo usado. Como a amostra de tamanho igual a 40, poder ser usada a Distribuio Normal como distribuio das mdias amostrais. Como a confiana requerida de 90%, ento /2=5%, ou 0,05. Entrando no miolo da Tabela da distribuio Normal com 0,45 (0,45 = 0,5 0,05), obtm-se Z = 1,645. Ento, a estimao intervalar para o ganho mdio ser: 153,30 a 176,70 A representao grfica do intervalo de confiana a seguinte:

92

2.2 Amostra Pequena, n < 30

No caso de uma populao normal ou aproximadamente normal, mas com desvio padro populacional desconhecido, ser usada a Distribuio de Student para a determinao do coeficiente de confiana, que neste caso passa a ser t:

x t

sx n

ou

x t

sx n

x t

sx n

na qual t obtido na tabela da Student para /2 e n-1 graus de liberdade. Caractersticas da Distribuio de Student: parecida com a distribuio Normal; mais achatada (maior disperso) do que a normal; Varia com os graus de liberdade, isto , com o tamanho da amostra.

Abaixo apresentada uma parte da Tabela da Distribuio de Student (ou distribuio t) existente no ANEXO.

93

Exemplo: Uma loja realizou um estudo a respeito dos valores das compras realizadas pelos clientes. Estime valor de compra com 95% de confiana considerando que foi utilizada uma amostra aleatria de 15 clientes, o valor da mdia amostral foi de R$ 120,00 e desvio padro de R$ 42,00.

Nesse caso, como a amostra pequena, a populao normalmente

distribuda, mas no se conhece o desvio padro da populao; ser usada a distribuio de Student para a distribuio das mdias amostrais. Como a confiana requerida de 95%, entraremos na tabela da Student

com /2 = 0,025. Como o tamanho da amostra igual a 15, entraremos na tabela da Student O valor para t encontrado foi de 2,145. Ento a estimao : com 15 1 = 14 graus de liberdade.

120 2,145

42 15

120 23,26

96,74 a 143,26

Erro de estimao = 23,26.

A representao grfica do intervalo de confiana construdo ser a seguinte:

3. Correo para Populao Finita A correo do desvio padro feita atravs da multiplicao do seu valor pela seguinte expresso:

N n N 1

Na qual N o tamanho da populao e n o tamanho da amostra. Exemplo: Uma empresa filantrpica possui 1200 animais e a sua administrao coleta dados dirios sobre custo para manter os animais. Foi 94

tomada uma amostra de 199 animais, obtendo-se uma mdia de $ 32,00 e um desvio padro de $ 8,00. Estime com 95% de confiana o custo mdio para manter os animais.

32 1,96

8 1200 199 199 1200 1

32 1,02
30,98 a 33,02

VII.3 Estimao Intervalar Proporo Considerando P a proporo populacional e a proporo amostral, ento a estimao da proporo populacional obtida da seguinte maneira:

Z p

/2

(1 p ) p n

ou

Z p

/2

(1 p ) p n

Z p

/2

(1 p ) p n

Exemplo: O departamento de marketing de uma empresa que produz cosmticos naturais promoveu uma pesquisa para conhecer a aceitao pelo pblico feminino do seu novo creme para as mos. O resultado da pesquisa foi o seguinte: Gostaram e comprariam o produto: 2870 No gostaram e no comprariam o produto: 628

Estime com 99% de confiana a proporo de aceitao do novo produto.


igual a: A proporo amostral p

2870 3498

0,82

O valor de Z para /2 = 0,005 2,575 Ento, a estimao intervalar de P igual a:

0,82 2,575

0,82 1 0,82 3498

O intervalo ser igual, ento a:

95

0,82 0,017 0,803 P 0,837

VII.4 Clculo do Tamanho da Amostra para Amostragem Aleatria Simples

O clculo do tamanho da amostra para a estimao da mdia ser:


n0 z E
2 2

No caso do desvio padro populacional desconhecido deve-se fazer uma amostragem piloto, e se for de tamanho amostral pequeno deve-se usar:
n0 t E
2 2

tn-1 g.l; /2

Exemplo: A quantidade de chumbo em certo tipo de solo, medida por um mtodo padro, acusa em um desvio padro de 10 ppm. Qual o tamanho da amostra necessrio para se estimar a mdia de chumbo no solo com um erro de 0,5 ppm e um nvel de confiana de 95%?

n0

1,96 .10 154 0,5

O clculo do tamanho da amostra para a estimao da proporo ser:

n0

z E

1 p p

Observe que para calcular o tamanho da amostra teremos que conhecer o


. Isso, na prtica, pode ser valor estimado da proporo populacional p

conseguido atravs uma amostragem piloto. No entanto, essa prtica pode custar mais tempo e mais dinheiro. Caso no seja possvel uma amostragem piloto, deve-se usar:
= 0,5 que o valor que fornece os maiores intervalos de confiana. p

96

Exemplo: Suponha que um editor deseja fazer uma pesquisa a respeito da aceitao de uma determinada revista sobre meio ambiente. Determine o tamanho da amostra a ser utilizada nessa pesquisa, considerando que a confiana desejada seja de 97% e o erro mximo suportado seja de 1%. O valor de Z para /2 = 0,015 igual a 2,17
, usaremos 0,5 Como no se tem a estimao de p

Ento, o tamanho da amostra necessrio ser igual a:

2,172 0,5 1 0,5 0,012

n 11772,25 11773

Tamanho da Amostra para Populao Finita Para o caso de Populao Finita deve-se usar o seguinte fator de correo: Na qual N o tamanho da Populao.

n0 n 1 o N
NONA LISTA DE EXERCCIOS

1. Considere que uma empresa queira utilizar escria de aciaria, produzida em uma usina siderrgica, para pavimentao. Ser necessrio realizar um procedimento de amostragem para caracterizao fsica da escria, onde sero analisados parmetros fsicos como umidade tima. Suponha que tenha sido realizada uma amostragem piloto onde o desvio padro foi de 1,75 para umidade tima. Qual o tamanho de amostra aleatria para estimar a mdia com um erro de 0,3 e com uma confiana de 95% ?

2. Para uma amostra de 100 empresas no setor de mrmore e granito, o nmero mdio de empregados 500 com um desvio padro de 50. Considere que no ES h um total de 2000 empresas neste setor. Determinar o intervalo de confiana de 90% para estimar o nmero mdio de trabalhadores por empresa no ES.

97

3. Em certa cidade, o peso do lixo produzido por semana em residncias de classe social C foi obtido atravs de uma amostra de 10 residncias, obtendose 15 kg como mdia e 5 kg como desvio padro. Estimar o peso mdio produzido por famlias de classe C desta cidade, usando um intervalo de confiana de 95%.

4. Para uma amostra de 25 lmpadas fluorescentes, obteve-se uma vida mdia til de 7000 horas com um desvio padro de 500 horas. Construir um intervalo de confiana de 99% para a mdia da populao.

5. Uma empresa de pesquisa de mercado faz contato com uma amostra de 200 empresas de uma comunidade e verifica que uma proporo de 0,40 na amostra prefere usar biodisel em vez de qualquer outro combustvel. Construa um intervalo de 95 % para a proporo de todas as empresas que preferem usar biodisel nesta comunidade.

6. Para o exerccio anterior, suponha que, antes dos dados serem coletados, foi especificado uma confiana de 95% e um erro mximo de 0,05. Qual tamanho de amostra deveria ser coletado sem conhecimento de nenhuma estimativa a priori?

7. Em um Simpsio de Engenharia organizado pela FAESA foi coletado dados sobre de 400 alunos que cursam engenharia e encontrado que 80 de tais estudantes fazem estgios. Usando um intervalo de confiana de 90%, estimarmos a proporo de todos os estudantes que fazem estgio.

8. Para estimar a porcentagem de alunos de um curso favorveis implantao de um novo currculo escolar, tomou-se uma amostra de 1000 alunos, dos quais 250 foram favorveis. a) Fazer um intervalo de confiana para a proporo de todos os alunos do curso favorveis modificao com uma confiana de 97%. b) Qual o erro de estimao cometido em a? c) Sabendo-se que a faculdade possui 3000 alunos, quantos alunos deveriam ser selecionados considerando um erro amostral de no mximo 2,5% e 98

confiana de 95% e considerando como estimativa a priori a estimao pontual utilizado na letra (a).

UNIDADE VIII. TESTE DE HIPTESE Em estatstica uma hiptese uma alegao, ou afirmao, sobre uma propriedade de uma populao. O objetivo do teste de hiptese decidir se determinada afirmao sobre um parmetro populacional verdadeira. Sabese que em razo da variabilidade inerente a amostragem as estatsticas amostrais tendem a se aproximar, ao invs de se igualar, aos parmetros da populao. Em um teste de hiptese verificado se a diferena entre o valor alegado de um parmetro populacional e o valor da estatstica amostral pode ser atribuda ao acaso ou se a discrepncia grande o suficiente para ser encarada assim.

Testes de hipteses so largamente utilizados para reportar os resultados de pesquisas em muitos campos da cincia aplicada e da indstria, por exemplo, produtos farmacuticos exigem evidncias significativas de eficcia e segurana. Os comerciantes desejam saber se uma nova campanha de publicidade supera significativamente a anterior. Em meio ambiente importante saber se a concentrao de contaminantes atmosfricos diferente em ambientes fechados.

VIII. 1 AS HIPTESES NULA E ALTERNATIVA O primeiro passo em teste de hiptese consiste em formular duas hipteses sobre a afirmao:

A hiptese nula, H0, uma afirmao sobre o valor de um parmetro populacional, ou seja, uma afirmao que diz que o parmetro populacional tal como especificado. Deve conter a condio de igualdade. Para o caso de teste para uma mdia tem-se:

H0 :

a lg um valor

99

O complemento da Hiptese Nula a Hiptese Alternativa (H1). uma afirmao alternativa a alegao a qual existe indcios dela ser verdadeira se a hiptese nula falsa. Para o caso citado anteriormente tem-se:

H1 :
H1 :

a lg um valor
a lg um valor

H1 :

a lg um valor

Observao: 1. Mesmo quando utilizado os smbolos ou na hiptese nula o teste realizado supondo a igualdade. Devemos ter um valor fixo nico para , de modo que possamos trabalhar com uma nica distribuio com mdia especifica. 2. Se o leitor est fazendo uma pesquisa a sua afirmao deve ser formulada de maneira que se torne a hiptese alternativa.

Exemplo: A direo de um Banco deve decidir se oferece certo produto em uma determinada cidade. A implantao desse produto na agncia dessa cidade somente ser vivel se a capacidade de poupana dos seus clientes for maior que R$ 500,00 mensais. Para verificar esse fato ser realizada uma pesquisa de mercado para testar se esse valor alcanado. Formule as hipteses para esse teste:

H 0 : A mdia igual 500

H 1 : A mdia maior do que 500

Assim tem-se:

H0 :

500

H1 :

500

VIII.2 REAS DE ACEITAO E DE REJEIO medida que amostras diferentes so tomadas, os valores dos parmetros amostrais variam entre si e em relao ao valor populacional. Essas variaes podem ser devidas prpria aleatoriedade do processo, isto , so casuais, ou devido ao fato das amostras terem sido tiradas de populaes com parmetros diferentes. Um teste de hipteses avalia at aonde essas variaes so frutos 100

do prprio processo aleatrio e a partir de que ponto as variaes so reais. Teremos ento que determinar os pontos limites at os quais concordaremos com a hiptese de que as variaes so casuais e a partir dos quais as variaes so reais. Esses pontos so chamados de pontos crticos.

O intervalo ao longo do qual, as variaes so consideradas casuais chamada de rea de aceitao de H0. O complemento da rea de aceitao a rea de rejeio de H0. A visualizao grfica de uma rea de aceitao a seguinte:

rea de Aceitao da Hiptese Nula

Valor Populacional Pontos Crticos

A visualizao grfica de uma rea de Rejeio a seguinte:

rea de Rejeio da Hiptese Nula

Valor Populacional Pontos Crticos

VIII.3 OS TESTES UNILATERAL E BILATERAL

101

O interesse em detectar desvios significativos de certo parmetro pode envolver desvios em ambas as direes ou apenas numa direo. A hiptese alternativa usada para indicar qual o aspecto da variao que nos interessa. H trs casos possveis: concentrar em ambas as direes, concentrar os desvios abaixo do valor esperado ou concentrar nos desvios acima do valor esperado, assim os testes podem ser bilaterais ou unilaterais. Teste bilateral aquele em que a regio de rejeio da Hiptese Nula est localizada nas duas caudas da distribuio amostral. Teste unilateral aquele em que a regio de rejeio da Hiptese Nula est localizada apenas em uma das caudas da distribuio amostral. Um teste bilateral apresenta as seguintes Hipteses Nula e Alternativa:

H0 : H1 :

Exemplo: Uma amostra dos saldos em conta corrente de 100 clientes de uma agncia bancria indicou uma mdia de R$ 986,30 e um desvio padro de R$ 254,80. Pode-se aceitar, a um risco de 5%, que o saldo mdio em conta corrente dos clientes desta agncia seja igual a R$ 1000,00? Nesse exemplo, as Hipteses Nula e Alternativa sero as seguintes:

H0 :

1000

H1 :

1000

A representao grfica das reas de aceitao e de rejeio da Hiptese Nula para esse exemplo a seguinte:

102

(1

) 0,95

rea de Aceitao da Hiptese Nula

0,025 2
=1000 Pontos Crticos rea de Rejeio da Hiptese Nula

0,025

Pode-se ter teste unilateral com a regio de rejeio da Hiptese Nula na

cauda da direita ou na cauda da esquerda.

Teste unilateral com a regio de rejeio da Hiptese Nula na cauda da

esquerda:

H0 :

H1 :

Vamos usar o mesmo exemplo anterior, mas alterando a pergunta para: Pode se aceitar a um risco de 5% que o saldo mdio em conta corrente dos clientes dessa agncia seja menor que R$ 1000,00? Agora, as Hipteses Nula e Alternativa so as seguintes:

H0 :

1000

H1 :

1000

A representao grfica das reas de aceitao e de rejeio da Hiptese Nula desse exemplo a seguinte:

103

rea de Aceitao da Hiptese Nula

0,05

(1

) 0,95

=1000 Ponto Crtico rea de Rejeio da Hiptese Nula

Teste unilateral com a regio de rejeio da Hiptese Nula na cauda da direita:

H0 :

H1 :

Continuamos a usar o exemplo anterior, mas alterando a pergunta para: Pode se aceitar, a um risco de 5%, que o saldo mdio em conta corrente dos clientes dessa agncia seja maior que $ 1000,00?

Agora as Hipteses Nula e Alternativa so as seguintes:

H0 :

1000

H1 :

1000

A representao grfica das reas de aceitao e de rejeio da Hiptese Nula deste exemplo ser a seguinte:

(1

) 0,95

rea de Aceitao da Hiptese Nula

0,05

=1000 Ponto Crtico rea de Rejeio da Hiptese Nula

104

VIII.4 OS ERROS DO TIPO I E DE TIPO II Ao realizarmos um teste de hipteses, estamos sujeitos a cometer erros. Existem dois tipos de erros que podem ser cometidos, Erro tipo I e Erro tipo II.

1. Erro Tipo I

Quando conclui-se sobre uma hiptese, pode-se decidir erroneamente e rejeitar a hiptese nula, mesmo que ela seja verdadeira , porm se ela for verdadeira, queremos que a probabilidade de vir a cometer esse erro (erro do tipo I) seja pequena. Essa probabilidade chama-se nvel de significncia.

Exemplo: Suponha que um consumidor tenha procurado o rgo competente para reclamar que havia comprado um produto em cuja embalagem constava conter 500 gramas, e ao chegar em casa constatou haver menos do que 500 gramas dentro do invlucro. O rgo mandou ento recolher, uma amostra para analisar a queixa do consumidor.

As hipteses a serem testadas nesse caso so as seguintes:

H0 :

500

H1 :

500

Suponha que a amostra desse produto coletada, por obra do acaso, contenha somente embalagens com menos de 500 gramas, mas que na realidade a mquina empacotadora introduz 500 gramas em cada embalagem. Nesse caso, rejeitaremos a Hiptese Nula, mas na verdade os produtos contm, em mdia, 500 gramas. Teremos, assim, cometido um erro tipo I.

2. Erro Tipo II

Ocorre quando aceitamos a hiptese nula como verdadeira, sendo ela falsa.

105

Exemplo: Utilizando o mesmo exemplo anterior, suponha que a mquina empacotadora estivesse realmente com problemas e aleatoriamente

introduzindo menos de 500 gramas em muitas embalagens. Mas ao tomar a amostra, por obra do acaso, todas as embalagens coletadas possuam 500 gramas. Desta forma, a Hiptese Nula ser aceita e assim, teremos cometido um erro tipo II. Resumidamente tem-se:
O verdadeiro estado da natureza H0 verdadeira Decidimos rejeitar a Deciso hiptese nula No rejeitamos a hiptese nula Erro tipo I ( ): significncia Deciso correta (1- ): confiana H0 falsa Deciso correta (1-): poder do teste Erro tipo II ()

Assim, quando cometemos um erro do Tipo I, aceitamos uma diferena que de fato no existe. No erro do Tipo II, aceitamos que grupos so iguais enquanto que a diferena existe, ou seja, significa que existe uma diferena que no foi reconhecida. O erro do tipo I ocorre principalmente quando as amostras so pequenas, J o erro do tipo II ocorre em funo de amostras pequenas e a grande variabilidade, o que pode eliminar as chances matemticas de aparecer uma significncia estatstica.

A Confiana, Risco e Poder do Teste

A probabilidade de se aceitar a hiptese nula, sendo ela verdadeira, a

confiana do teste. A notao para a confiana : (1 - ). O complemento da confiana, isto , a probabilidade de se rejeitar a

Hiptese Nula sendo ela verdadeira, o risco. A notao para o risco : ( ). Ento, sendo o risco a probabilidade de se rejeitar a hiptese nula sendo

ela verdadeira, ento o risco a probabilidade de se cometer um erro do tipo I.

Dessa forma, temos que: confiana + risco = 1

106

O poder ou potencia de um teste estatstico (1 - ) a probabilidade de rejeitar a hiptese nula, quando no estado da natureza ela falsa, pode ser interpretado como a probabilidade de rejeitar corretamente uma hiptese nula falsa, ou a sensibilidade do teste de detectar diferenas. VIII.5 ROTEIRO PARA UM TESTE DE HIPTESES A seguir sero apresentados os passos a serem seguidos para a execuo de um Teste de Hipteses, quaisquer que seja o parmetro a ser testado.

1. Determinar de H0 e H1. 2. Determinar a distribuio a ser usada (sero usadas para o teste de mdias a distribuies Normal. As regras para a utilizao da distribuio so as mesmas utilizadas para a construo do intervalo de estimao). 3. Determinar as regies de aceitao e de rejeio. 4. Calcular a estatstica de teste. 5. Para o teste de mdia e para o de propores, a estatstica de teste ser assim calculada:

estatstica de teste

valor amostral valor em teste desvio padro

6. Determinar o valor crtico. Observar que o valor crtico delimita a regio de aceitao e, conseqentemente, a de rejeio. 7. A deciso consiste em comparar a estatstica de teste, calculada a partir da amostra, com o valor crtico, e concluir pela aceitao ou no da hiptese nula. Se a estatstica de teste cair dentro da regio de aceitao da Hiptese Nula, esta no poder ser rejeitada. Se cair dentro da regio de rejeio, a Hiptese Nula dever ser rejeitada.

VIII.6 TESTE HIPTESE CONHECIDA

PARA

MDIA

DE UMA

POPULAO

COM

VARINCIA

107

No teste de uma Mdia, onde a varincia populacional (ou o desvio padro populacional) conhecida, a determinao da estatstica de teste obtida da seguinte maneira:

X
x

n
Na qual
0

o valor a ser testado, n o tamanho da amostra, X a mdia


x

amostral e

o desvio padro da populao.

Determinao do valor crtico usando a Normal: Entrar no miolo da tabela da Normal com o valor de (0,5 - /2) para testes

bilaterais, ou com o valor de (0,5 - ) para testes unilaterais, e ler nas bordas da tabela o valor de Z. Suponha que se queira o valor crtico para um teste bilateral para uma

confiana de 95% (ou um risco de 5%, ou uma significncia de 5%). Entraremos no miolo da tabela da Normal com o valor de 0,475 (0,50 0,025) e leremos nas bordas o valor do Z crtico (1,96). Se for para um teste unilateral, entraremos no miolo da tabela com 0,45 (0,50 0,05) e leremos nas bordas o valor de 1,645 (interpolado) para Z crtico.

VIII.7 TESTE HIPTESE PARA MDIA DE UMA POPULAO COM VARINCIA DESCONHECIDA E TAMANHO DA AMOSTRA GRANDE (N 30) No teste de uma mdia com a varincia conhecida e tamanho de amostra grande, a determinao da estatstica de teste obtida da seguinte maneira:

X s n

Na qual

o valor a ser testado, n o tamanho da amostra, X a mdia

amostral e s x o desvio padro da amostra.

Exemplo: Uma amostra aleatria de 40 faturamentos semanais de uma determinada loja apresentou uma mdia amostral de $ 48.400,00 e um desvio

108

padro amostral de $ 9.870,00. Pode-se considerar que o faturamento semanal dessa loja uma varivel normalmente distribuda. Pode-se aceitar a um risco de 1% que o faturamento semanal mdio desta loja seja igual a $ 50.000,00? Nesse exemplo, as hipteses so as seguintes:

H0 : H1 :

50.000 50.000

A distribuio a ser usada ser a Normal, uma vez que a amostra maior do que 30. Nesse caso, no precisaramos fazer a suposio de que a varivel seja normalmente distribuda, uma vez que a amostra grande (mais de 30 observaes). O valor da estatstica de teste ser o seguinte:

48400 50000 9870 40

1,03

Entrando no miolo da tabela da distribuio Normal com o valor de 0,495 (0,5 0,005), encontraremos o valor de Z crtico, que igual a 2,575 (interpolando entre 0,4949 e 0,4951).Como o valor de Z de teste (1,03) caiu entre os valores - 2,575 e + 2,575, no poderemos rejeitar a hiptese nula de que o faturamento semanal mdio seja igual a $ 50.000,00

VIII.8 TESTE HIPTESE PARA MDIA DE UMA POPULAO COM VARINCIA DESCONHECIDA E TAMANHO DA AMOSTRA PEQUENO (N < 30) No teste de uma mdia para amostra pequena, a determinao da estatstica de teste obtida da seguinte maneira:

X sx n

Na qual

o valor a ser testado, n o tamanho da amostra,

mdia amostral e s x o desvio padro da amostra.

Determinao do valor crtico usando a distribuio t-Student: 109

Entrar na margem horizontal superior com /2, se o teste for bilateral, ou com , se o teste for unilateral, e na margem vertical esquerda com o n. de graus de liberdade (n 1). Ler no miolo da tabela o valor do t ( t crtico ). Com uma amostra de 20 observaes e 5% de significncia: Para um teste bilateral, entraremos na borda superior da tabela com /2 = 0,025, e na borda vertical da esquerda com gl (graus de liberdade ) = 20 1 = 19. No cruzamento, no miolo da tabela, encontraremos o valor de 2,093 para o valor de t crtico. Para um teste unilateral entraremos com = 0,05 e o mesmo n de graus de

liberdade (19) e, no miolo, no cruzamento, encontramos o valor de t crtico = 1,729.

Exemplo: Um engenheiro estuda o tempo mdio de vida das lmpadas eltricas fluorescentes. A indstria afirma que a vida mdia desse tipo de lmpada de 1120 horas. Uma amostra de 8 lmpadas extrada

recentemente apresentou a vida mdia de 1070 horas, com desvio padro de 125 horas. Testar a hiptese de que a vida mdia das lmpadas no se alterou ao nvel de 1%.

Resposta:

As hipteses a serem testadas so as seguintes:

H0 :

1120

H1 :

1120

O valor da estatstica de teste dado por:

X sx n

1070 1120 125 8

1,13

Olhando na tabela de distribuio t-student o valor da estatstica do ponto critico t7,0,005 = 3,4995.

110

Concluso: Como o valor da estatstica de teste pertence regio de aceitao da hiptese, ento no rejeita-se Ho considerando um nvel de significncia de 1%.

VIII.9 TESTE DE HIPTESE PARA PROPORO DE UMA POPULAO No teste para propores usaremos somente a distribuio Normal. O valor crtico ser calculado do mesmo modo que para a mdia.

Determinao da estatstica de teste:


Z P0 p P0 .(1 P0 ) n

= proporo amostral e P0 = valor em teste. onde p

Exerccio: Uma pesquisa de marketing a respeito da aceitao de um determinado produto realizada em uma cidade, A, mostrando os seguintes resultados: gostaram do produto: 1230 no gostaram do produto: 270 Pode-se concluir que, a 5%, a aceitao na cidade A menor do 85%? VIII.10 VALORES-P
NOS TESTES DE HIPTESES

A abordagem do valor-p tem sido amplamente utilizada na prtica. O valor p a probabilidade de que a estatstica de teste assuma um valor que , no mnimo, to extremo quanto o valor observado da estatstica quando a hiptese nula for verdadeira. Assim, o valor-p carrega muita informao sobre o peso da evidencia contra H0. Resumindo: valor-p a probabilidade da estatstica de teste assumir um valor quando a hiptese nula verdadeira. Interpretao: a deciso sobre a hiptese nula tomada comparando-se o valor-p com um valor pr-fixado (nvel de significncia), usualmente 0,05. Quando o valor-p menor que este ponto de corte, o resultado

111

estatisticamente significante (rejeita-se Ho) e, caso contrrio, ele dito no significante (no rejeita-se Ho).

No sempre fcil calcular o valor-p para um teste. No entanto, a maioria dos programas computacionais, j apresenta este valor calculado para que voc possa tomar a deciso em relao hiptese sem que haja a necessidade de olhar na tabela de distribuio de probabilidade. DCIMA LISTA DE EXERCCIOS

1) Uma agncia de empregos alega que os candidatos por ela colocados nos ltimos seis meses tm salrios maiores que $10000,00 anuais, em mdia. Um rgo governamental extraiu uma amostra de aleatria daquele grupo, encontrando um salrio mdio de $8000, com um desvio de $1000, com base em 49 empregados. Teste a afirmao da agncia ao nvel de 0,05 de significncia.

2) O salrio dos empregados das indstrias siderrgicas no ES tem distribuio normal, com mdia de 5 salrios mnimos, com desvio padro de 0,5 salrios mnimos. Uma indstria emprega 20 empregados, com salrio mdio de 4,5 s.m. Ao nvel de 5% podemos afirmar que essa indstria paga salrios inferiores mdia?

3) Uma mquina automtica que empacota o alimento A programada para colocar 100g de peso. Para verificar a preciso da mquina, uma amostra de 36 pacotes do referido alimento fornece um peso mdio de 98g e desvio padro de 6g. O que se pode concluir ao nvel de 5%?

4) Uma fbrica de cerveja distribui um tipo de cerveja sem lcool em garrafas que indicam 300 ml. O instituto de peso e medidas seleciona aleatoriamente 25 garrafas e obtm uma mdia de 295 ml com o desvio padro de 9 ml. Ao nvel de 0,01de significncia, o que se pode concluir sobre a fbrica?

112

5) Sabe-se que por experincia que 5% da produo de um determinado artigo defeituosa. Um novo empregado contratado. Ele produz 600 peas do artigo com 82 defeituosas. Ao nvel de 7%, verificar se o novo empregado produz peas com maior ndice de defeitos que o existente. 6) Um fabricante de droga medicinal afirma que ela 90% eficaz na cura de uma alergia, em um determinado perodo. Em uma amostra de 200 pacientes, a droga curou 135 pessoas. Testar ao nvel de 1% se a pretenso do fabricante legtima.

7) A quantidade de chumbo em certo tipo de solo, medida por um mtodo padro, acusa em mdia 86 partes por milho (ppm). Experimenta-se um novo mtodo em 40 espcimes de solo, obtendo-se uma mdia de 83 pp de chumbo e um desvio padro de 10 ppm. H diferena significante, ao nvel de 1% de significncia, de que o novo mtodo libere menos chumbo do solo?

8) Sabe-se que por experincia que 10% da produo de um determinado artigo defeituosa. Um novo empregado contratado. Ele produz um percentual de 9% de defeituosas. Ao nvel de 5%, verificar se o novo empregado produz peas com menor ndice de defeitos que o existente. n = 100

113

You might also like