You are on page 1of 15

Curso DSc Concurso: EPE – Analista de Pesquisa Energética

Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Parte 1
4. DISTRIBUIÇOES DISTRIBUIÇÕES
DE PROBABILIDADE DISCRETAS

• Experimento de Bernoulli
Um dos resultados é chamado
Experimento de Bernoulli é um “sucesso”, e o outro, “fracasso”.
experimento aleatório que possui
apenas dois resultados possíveis.
A probabilidade de sucesso
é designada por p.
Exemplos:
4.1 - Lançar uma moeda e Como consequência, a
observar a face voltada para cima. probabilidade de fracasso é 1-p.
4.2 - Observar se um atirador acerta o alvo. .

Exemplo 4.3 - Ao lançar 3 moedas, qual


Sejam agora n realizações independentes a probabilidade de obtermos 2 caras?
de experimentos de Bernoulli com a
mesma probabilidade de sucesso p. Façamos:
{CA} = sucesso e {CO} = fracasso.
Considere que estejamos interessados
no número de sucessos observados.
A v.a. que representa o número de sucessos
(no caso, caras) segue distribuição binomial.

1
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

• Distribuição Binomial Fórmula da Distribuição Binomial:

É a distribuição da v.a. que representa P(X = x) =   p x (1 − p) n − x, x = 0,1,..., n , 0 < p < 1.
n
o número de sucessos em n realizações x
independentes de experimentos de Bernoulli,
todos com mesma probabilidade de sucesso p.

probabilidade de x
n (número de realizações) e p (probabilidade n!
= . sucessos em n
de sucesso) são os parâmetros da distribuição. x!(n − x )! realizações.

Solução do Exemplo 4.3:


Exemplo 4.4 - Qual a probabilidade de
que um atirador acerte o alvo 3 vezes em 5
A v.a. de interesse é: X = número de caras.
tentativas, se a probabilidade dele acertar
um tiro em uma tentativa qualquer é 2/3?
X ~ Bin(3,1/2). Pede-se P(X=2).

 3  1   1 
2 1

P(X = 2) =      = 0,375.


 2  2   2 

Solução: Valor Esperado e Variância da Binomial:


A v.a. de interesse é:
X = número de acertos.
E(X) = np
Se considerarmos que as tentativas são
independentes, então: X ~ Bin(5,2/3). V(X) = np(1-p)
Daí:
3 2
 5  2   1  Exemplo 4.4 (cont.) - Calcule o valor
P(X = 3) =      = 0,3292.
 3  3   3  esperado do número de acertos do atirador.

2
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Solução:
Exemplo 4.5
A v.a. de interesse é: X = número de acertos.
Considere um exame com 20 questões de Logo: X ~ Bin(20;0,2). Daí:
múltipla escolha, cada uma com 5
 20 
P(X = 6) =  (0,2) (0,8) = 0,1091.
alternativas. Se um aluno que não estudou 6 14

nada resolve “chutar” todas as respostas,  


6
qual é a probabilidade de que acerte 30%
da prova (isto é, 6 questões)?
Qual o valor esperado do número
de questões que o aluno acerta?

• Distribuição Hipergeométrica
Em princípio, poderíamos pensar na
extração de cada bolinha como um
Exemplo 4.6 - Considere 4 extrações sem experimento de Bernoulli, e a v.a. X de
reposição de bolinhas, de uma urna que interesse (número de bolinhas azuis na
contém 8 bolinhas azuis e 5 vermelhas. amostra) seguindo distribuição binomial.
Calcule a probabilidade de que 3 sejam azuis.
Pergunta: o que nos impede de fazer isto?

De forma geral considere uma população


Resposta: (no exemplo, urna) com N elementos (no
exemplo, bolinhas), dentre os quais temos
r sucessos (no exemplo, ser azul).
A amostragem é sem reposição, o que faz
com que sucessivas extrações sejam Seja então uma amostra obtida
dependentes e as probabilidades de sem reposição, de tamanho n.
sucesso mudem a cada extração.
Qual é a probabilidade de que tenhamos
exatamente x sucessos na amostra?

3
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

A v.a. X que representa o número O número de casos possíveis é o número


de sucessos na amostra tem uma total de amostras de tamanho n que
distribuição chamada hipergeométrica, podemos obter da população, ou seja:
c/ parâmetros N, r e n.
 N
 .
Para obter a fórmula da distribuição n
hipergeométrica é só fazer: P(A) = #A/#S
(casos favoráveis sobre casos possíveis).

Fórmula da Distribuição Hipergeométrica:


O número de casos favoráveis é dado
pelo número de formas de extrair x
sucessos dentre os r possíveis e (n-x)  r  N − r 
  
fracassos dentre os N-r possíveis:  x  n − x 
P (X = x ) = .
 N
 
 r  N − r  n
  .
 x  n − x  probabilidade de, em uma amostra
de tamanho n, ter x sucessos

Solução do exemplo 4.6:


Exemplo 4.7

Seja X o número de bolinhas azuis


na amostra de tamanho 4. Então:
Considere um lote de 10 peças, das quais 4
 8 13 − 8   8  5  são defeituosas. Se extrairmos 5 peças, sem
     
 3  4 − 3   3  1  reposição, qual a probabilidade de que 2
P(X = 3) = = = 0,3916. sejam defeituosas?
13 13
   
4 4

4
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Solução: Valor Esperado e Variância


da Hipergeométrica:
Seja X o número de peças defeituosas
na amostra de tamanho 5. Então:
r
 4  6  E( X ) = n
   N
 2  5 − 2   r  r  N − n 
P(X = 2) = = 0,4762. V(X) = n  1 −  
10   N  N  N − 1 
 
5

• Aproximação da Exemplo 4.8 - Em uma eleição, suponha


Hipergeométrica pela Binomial
que 300 dos 1000 habitantes de um
município são eleitores de um candidato
Se N é muito maior do que n (N ≥ 20n),
A. Toma-se uma amostra de 10 eleitores.
a distribuição hipergeométrica pode ser
aproximada pela distribuição binomial
(cujas probabilidades são mais simples Qual a probabilidade de que exatamente 5
de calcular), com parâmetros n e p = r/N. pretendam votar no candidato A?

Solução: A probabilidade exata seria A probabilidade aproximada pode ser


calculada da seguinte forma: calculada utilizando a distribuição binomial,
com n = 10 e p = 300/1000 = 0,3.
 300 700
  
 5  5  10 
P(X = 5) = . P(X = 5) =  (0,3)5 (0,7)5 = 0,1029.
1000 5
 
 10 

Note que as combinações envolvidas Compare com o resultado exato


são bastante chatas de se calcular... (calculado no Excel: 0,1026)

5
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

• Distribuição Geométrica Fórmula da Distribuição Geométrica:


Considere realizações sucessivas e
independentes de um experimento de P(X = x ) = p(1 − p) x −1 , x = 1,2,....
Bernoulli, todos com mesma
probabilidade de sucesso p.
Exemplo 4.9 - A probabilidade de um
A v.a. que representa o número de indivíduo acertar um alvo é 2/3. Se ele
realizações necessárias até que ocorra o deve atirar até que acerte o alvo pela
primeiro sucesso segue uma distribuição primeira vez, qual a probabilidade de
chamada geométrica com parâmetro p. que sejam necessários exatamente 5 tiros?

Valor Esperado e Variância da Geométrica: • Distribuição Binomial Negativa


Considere a mesma situação considerada
na definição da distribuição geométrica:
realizações sucessivas e independentes
E(X) = 1/p
de um experimento de Bernoulli, todos
V(X) = (1-p)/p2 com mesma probabilidade de sucesso p.

A v.a. que representa o número de realizações


necessárias até que ocorra o r-ésimo sucesso
No exemplo 4.9, qual o número de tiros possui uma distribuição chamada binomial
esperado até que ocorra o primeiro acerto? negativa, com parâmetros r e p.

Fórmula da Binomial Negativa:

Exemplo 4.10 - na situação do exemplo


x − 1 r
4.9, calcule a probabilidade de que o P(X = x ) =  x −r
p (1 − p) ; x = r , r + 1,....
atirador precise de 4 tiros para acertar pela  r −1
segunda vez o alvo (ou seja, de que o
segundo acerto ocorra no quarto tiro). Notação: X ~ BNeg (r,p).

Obs - A distribuição geométrica é um caso


particular da binomial negativa, com r = 1.

6
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Solução do exemplo 4.10:


Valor Esperado e Variância
da Binomial Negativa:
Seja X o número de tiros até o segundo acerto.

X ~ BNeg (2,2/3).
E(X) = r/p
2 2 V(X) = r(1-p)/p2
 3  2   2
P(X = 4) =    1 −  = 0,1481.
 1  3   3

Exemplo 4.11 - A probabilidade de que um


tomador de empréstimo fique inadimplente é Exemplo 4.12 - Um jogador acerta
0,05. Você é o gerente de uma financeira. apenas 10% dos pênaltis que cobra.
a) Qual a probabilidade de que você conceda
8 empréstimos até tomar o primeiro calote? a) Qual a probabilidade de que ele acerte
b) Qual a probabilidade de você conceda 8 apenas uma cobrança em 5 tentativas?
empréstimos até tomar o terceiro calote?
c) Qual o valor esperado do número de b) Qual a probabilidade de que ele precise
empréstimos até tomar o terceiro calote? bater 5 pênaltis até acertar o primeiro?

R: a) 0,0349 b) 0,00203 c) 60.

Solução:
b) Seja X o número de cobranças até que o
a) Seja X o número de pênaltis que o jogador acerte a primeira. Então:
jogador acerta. Então: X ~ Geom(0,1).
X ~ Bin(5;0,1).
Pede-se:
Pede-se:
P(X = 5) = (0,1)(0,9) 4 = 0,0656.
 5
P(X = 1) =  (0,1)1 (0,9) 4 = 0,3281.
1

7
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

• Distribuição de Poisson
Fórmula:
Seja X a v.a. que representa o número de
ocorrências de um evento em um certo
λx e − λ
intervalo de tempo ou espaço. P( X = x ) = , x = 0,1,..., λ > 0.
x!
X possui uma distribuição chamada
Poisson, com parâmetro λ.
λ é a taxa de ocorrência do evento por Valor Esperado e Variância da Poisson:
unidade de tempo ou espaço, p.ex.: E(X) = λ
- acidentes por hora em uma estrada;
V(X) = λ
- incidência de uma doença por Km2.

Exemplo 4.13 - Em determinada rodovia,


• Aproximação da Binomial pela Poisson
ocorrem, em média, 3 acidentes por hora.

Supondo distribuição de Poisson,


calcule as seguintes probabilidades: Se n for grande e p for pequeno, o
número de sucessos em n realizações
independentes de experimentos de
a) De que ocorram 2 acidentes em uma hora. Bernoulli pode ser aproximado
pela distribuição de Poisson, com λ=np.
b) De que ocorram pelo menos 2 acidentes
em 20 minutos (20 minutos = 1/3 de hora).

Exemplo 4.14 - Uma companhia de Solução:


seguros de automóveis descobriu que
somente cerca de 0,005% da população Pede-se P(X=3), sendo:
está incluída em um certo tipo de sinistro X ~ Bin(20.000;0,00005).
cada ano. Se seus 20.000 segurados são
escolhidos ao acaso na população, qual é
a probabilidade aproximada de que 3 A solução aproximada pode ser obtida de
clientes venham a ser incluídos nesta forma bem mais simples, utilizando a
categoria de sinistro no próximo ano? Poisson com λ = 20.000*0,00005 = 1.

8
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

• Distribuição Uniforme

Parte 2 É a distribuição contínua


mais simples que existe.
DISTRIBUIÇÕES
CONTÍNUAS Pressupõe que as probabilidades estejam
distribuídas de maneira uniforme pelo
intervalo de variação de X (de α a β).

Fórmula da Uniforme: Cálculo de Probabilidades


Utilizando a Uniforme:
f(x) = 1/(β-α), α<x<β.

β-α
P(a≤X≤b) = (b-a)/(β α)
Parâmetros: α e β.

Notação: X ~ Unif(α,β).

• Distribuição Exponencial
Valor Esperado e Variância da Uniforme:

Distribuição definida para valores de X


estritamente positivos, usual para
representar tempo (duração, espera, etc.).
α+β
E(X) = (α β)/2
β-α
V(X) = (β α)2/12
Fórmula da Exponencial:

f ( x ) = λe− λx , x > 0; λ > 0.

9
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Parâmetro: λ.
Função Distribuição
Acumulada da Exponencial:
Notação: X ~ Expo(λ).

Valor Esperado e Variância:


≤x) = 0, x≤
F(x) = P(X≤ ≤0
λ
= 1-e x, x>0.

λ
E(X) = 1/λ
λ2
V(X) = 1/λ

Exemplo 4.15 - O tempo de espera em


Demonstração: uma fila segue distribuição exponencial.
Se um cliente espera, em média, 10 minutos
Para x≤0, F(x) = P(X≤x) = 0. para ser atendido, qual a probabilidade:
Para x>0: a) De que demore menos do que 12 minutos
para ele ser atendido? R: 1-e-1,2.
x

F( x ) = P(X ≤ x ) = ∫ λe −λx dx = b) De que demore menos do que 7 minutos


0 para ele ser atendido? R: 1-e-0,7.
x
1 − e −λx c) E entre 7 e 12 minutos? R: e-0,7-e-1,2.
λ ∫ e −λx dx = λ = 1 − e − λx .
0 λ d) De que ele espere mais do que 10 minutos
(isto é, mais do que a média E(X))? R: e-1.

Interpretação: se uma lâmpada já durou x


• Falta de Memória horas, a probabilidade dela durar mais s
horas a partir dali é a mesma que ela teria
É uma importantíssima propriedade de durar s horas a partir da sua fabricação.
da distribuição exponencial. Ela diz que:
Em outras palavras, não há desgaste.
P(X>x+s|X>x) = P(X>s).
Isto é considerado uma crítica ao uso da
exponencial para este tipo de aplicação.

10
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

• Distribuição Normal
Demonstração:

( x −µ ) 2
P(X>x+s|X>x) = 1 −
f (x) = e 2 σ2
; x ∈ ℜ; µ ∈ ℜ, σ2 > 0.
P[(X>x+s)∩(X>x)]/P(X>x) = σ 2π
P(X>x+s)/P(X>x) =
e-λ(x+s)/e-λx = e-λs Parâmetros: µ (=E(X)) e σ2 (=V(X)).
= P(X>s), C.Q.D. segue distribuição
Notação: X ~ N(µ,σ2).

• Cálculo de Probabilidades Normais


A v.a. que representa o resultado
Exemplo 4.16 - Considere que as alturas deste experimento é X ~ N(170,25).
dos alunos desta turma sigam
distribuição Normal, com média igual
a 170 cm e desvio padrão igual a 5 cm. Qual a probabilidade de que a altura
do aluno esteja entre 170 e 172,3 cm?
Seja o experimento que consiste na
seleção de um aluno qualquer e na
medição de sua altura.

Para calcular a probabilidade P(170 < X < 172,3) =


solicitada, usaremos a tabela Normal.
 170 − µ X − µ 172,3 − µ 
P < < =
 σ σ σ 
A tabela Normal fornece probabilidades
 170 − 170 172,3 − 170 
associadas a uma v.a. padronizada: P <Z< =
 5 5 
µ)/σ
Z = (X-µ σ,
= P(0 < Z < 0,46).
que possui média zero e variância 1.
P(0 < Z < 0,46) é encontrada na tabela.

11
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Tabela Normal: Resposta final do item a):

A probabilidade de que a altura de um aluno


selecionado ao acaso esteja entre 170 e
172,3 cm é 0,17724.

b) Qual a probabilidade de que a altura


do aluno esteja entre 170 e 175 cm?

Neste caso: Ilustrando na Tabela Normal:

P(170 < X < 175) =


 170 − µ X − µ 175 − µ 
P < < =
 σ σ σ 
 170 − 170 175 − 170 
P <Z< =
 5 5 
= P(0 < Z < 1).

Resposta final do item b): 0,34134. Ilustração da Simetria da Normal:

c) Qual a probabilidade de que a altura


do aluno esteja entre 165 e 170 cm?
P(-1 < Z < 0) P(0 < Z < 1)

Solução:
P(-1 < Z < 1)

Pela simetria da Normal, temos:


P(-1 < Z < 0) = P(0 < Z < 1) = 0,34134.

12
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Revisitando a figura do módulo 1:


d) Qual a probabilidade de que a altura
do aluno esteja entre 165 e 175 cm? 99,72%

Considerando µ=
Solução: do slide anterior, E(X) e σ = DP(X).
P(-1 < Z < 1) = 0,68268.

Esta é a probabilidade de X estar a no máximo


1 desvio padrão de distância da sua média.

e) Qual a probabilidade de que a altura g) Qual a probabilidade de que a altura do


do aluno esteja entre 170 e 180 cm? aluno seja maior do que 170 cm?
Solução: P(170 < X < 180) = Solução: P(X > 170) = P(Z > 0).
P(0 < Z < 2) = 0,47725. A área total sob a curva é igual a 1.
Logo, a resposta é 0,5.
f) E entre 160 e 180 cm?
h) E maior do que 175 cm? P(Z > 0)

Solução: P(160 < X < 180) =


Solução: P(X > 175) = P(Z > 1) = 0,5 -
P(-2 < Z < 2) = 2*0,47725 = 0,9545.
P(0 < Z < 1) = 0,5 - 0,34134 = 0,15866.

• Soma de Normais Independentes


i) E menor do que 175 cm?
P(Z < 0)
Considere a soma S de n v.a.`s Xi, i =
Solução: P(X < 175) = P(Z < 1) = 0,5 + 1,2,...,n, Normais e independentes,
P(0 < Z < 1) = 0,5 + 0,34134 = 0,84134. c/ médias µ e variâncias σ2. Então:

j) E menor do que 165 cm? S ~ N(nµ, nσ 2 ).

Solução: P(X < 165) = Embora a soma de v.a.`s tenha sua utilidade
P(Z < -1) = P(Z > 1) = 0,15866. prática, é a média de v.a.`s que será realmente
importante em estimação e testes de hipóteses.

13
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

• Média de Normais Independentes • Teorema Central do Limite (TCL)


Considere a média X de n v.a.`s Xi,
i = 1,2,...,n, independentes e Normais,
c/ médias µ e variâncias σ2. Então: A soma e a média de um número grande de
v.a.`s independentes, quaisquer que sejam as
σ2 suas distribuições, é aproximadamente Normal.
X ~ N(µ, ).
n

A seguir são apresentadas as demonstrações


do valor esperado e da variância de X.

• Distribuição Normal Bivariada


Importante:
1  ( x −µ X ) 2 ( y − µ Y ) 2 ( x −µ X )( y −µ Y ) 
−  + −2 ρ 
2 (1−ρ ) 
2
σ 2X σ 2Y σXσ Y 

e
f ( x , y) = , ( x, y) ∈ R 2 Se X e Y seguem distribuição Normal bivariada,
2πσX σ Y 1 − ρ 2 então se ρXY = 0, X e Y são independentes.
f(x,y)
Isto só vale neste caso! De forma geral,
como vimos no módulo 3, correlação
zero não implica em independência.

y x

• Distribuição Qui-Quadrado A distribuição qui-quadrado é tabelada, e


será importante quando falarmos de
Fórmula: inferência estatística, assim como outras
distribuições tabeladas que veremos (t e F).
υ
1 −1 −
x

f (x) = υ x 2 e 2 ; x > 0; υ > 0.


Valor Esperado e Variância da Qui-Quadrado:
2 2
π

Parâmetro: υ (graus de liberdade) E(X) = υ


υ
V(X) = 2υ
Notação: X ~ χ 2υ .

14
Curso DSc Concurso: EPE – Analista de Pesquisa Energética
Disciplina: Métodos Quantitativos Professor: Eduardo Campos

Relação entre a Qui-Quadrado e a Normal Soma de Qui-Quadrados Independentes:

Se Z ~ N(0,1), então : n n

∑ χ 2υi ~ χ 2n ⇒ ∑ Zi2 ~ χ 2n
i =1 ∑ υi i =1
Y = Z 2 ~ χ12 i =1
independentes

• Distribuição t de Student Distribuição t de Student x Normal:

Uma v.a. com distribuição t com υ graus


de liberdade é obtida da seguinte forma:

Z~N(0,1).
Z
T=
Q Q ~ χ2
υ
Notação: T ~ tυ. υ (qui-quadrado
Esta distribuição com υ g.l.), A distribuição t aproxima-se da Normal à
é tabelada. independente de Z. medida que os graus de liberdade aumentam.

• Distribuição F Relação entre a t e a F:


Uma v.a. com distribuição F com υ1
graus de liberdade no numerador e υ2 no Se T segue distribuição t de Student com υ
denominador é obtida da seguinte forma: graus de liberdade (T ~ tυ), Y = T2 segue
distribuição F com 1 e υ graus de liberdade:
Q1
υ1
F= , com Q1 ~ χ 2υ1 e Q 2 ~ χ 2υ2 ,
Q2
Notação:
υ2 Y = T 2 ~ f1, υ .
F ~ Fυ1, υ2.
sendo Q1 e Q 2 independentes.
Esta distribuição
é tabelada.

15

You might also like