Professional Documents
Culture Documents
A essncia da cincia a observao. Estatstica: A cincia que se preocupa com a organizao, descrio, anlise e interpretao dos dados experimentais. Ramo da Matemtica Aplicada. A palavra estatstica provm de Status.
Curiosidade: Em 1662, John Graunt publicou os primeiros informes estatsticos. Era sobre nascimento e mortes.
Estatstica Bsica (Anova, TH, Regresso) Sries Temporais Data Mining Six Sigma Redes Neurais Controle de Qualidade
Simulao / PO DOE /Taguchi /RSM Anlise de Sistema de Medio Estatstica Multivariada Amostragem / Pesquisa Confiabilidade
1-Estatstica
Populao e Amostra
A Populao (ou Distribuio) a coleo de todas as observaes potenciais sobre determinado fenmeno. O conjunto de dados efetivamente observados, ou extrados, constitui uma Amostra da populao. Um Censo uma coleo de dados relativos a Todos os elementos de uma populao. Um Parmetro est para a Populao assim como uma Estatstica est para a Amostra.
1-Estatstica
Tipos de Dados
(Tambm Dados Categricos ou de Atributos)
Nominal Ordinal
Ex.: Para uma populao de peas produzidas em um determinado processo, poderamos ter:
Varivel Estado: Perfeita ou defeituosa No de peas defeituosas Dimetro das peas Tipo Qualitativa Nominal Quantitativa Discreta Quantitativa Contnua
3
1-Estatstica
Aplicao: Gere sequncias de valores aleatrios que represente problemas em sua rea. O que significa o procedimento <Calc> <Set Base>?
Amostragem: Gere a sequncia 1 2 3 ...100. <Calc> <Make Patterned Data> Selecione uma amostra com 10 valores a partir das sequncias geradas anteriormente. Use <Calc> Random Data> <Sample from Column>
1-Estatstica
Aplicao: Gere uma sequncia de dados que represente um processo em sua rea e calcule as estatsticas desse conjunto de dados. Use: <Random> e <Display Descriptive Statistics>
1-Estatstica
Aritmtica Simples
+...+ x1 + x 2 + L + x n x= = n
x
i =1
Aritmtica Ponderada
x=
+...+ x1 p1 + x 2 p2 + L + x n pn
xp
=
i =1 n i
p1 + p2 + L + pn +...+
p
i =1
1-Estatstica
Chama-se Robert Pesa 78 Kg Manequim 48 85 cm de cintura Consome anualmente 8,5 Kg massa, 11,8Kg de bananas, 1,8 Kg de batatas fritas, 8,15Kg de sorvete e 35,8 Kg de carne. V TV por ano 2567 horas Recebe anualmente 585 coisas por correio (cartas e outros) Diariamente dorme 7,7 horas, gasta 21 minutos para chegar ao trabalho e trabalha 6,1 horas
1-Estatstica
Se n mpar:
~ = n + 1 termo x 2
o
Ex.:
Mediana o valor do meio de um conjunto de dados dispostos em ordem crescente ou decrescente. Inconveniente: No considera todos os valores da amostra!
8
1-Estatstica
Mdia x Mediana
Ex.:
x = 345,7 ~ x = 300
~ x = 300
= 601
1-Estatstica
Medidas de Disperso
Discuta: 1) Porque os bancos adotam fila nica? 2) Por favor, com quantos dias de antecedncia eu devo postar uma carta de aniversrio para minha me?
10
1-Estatstica
Variabilidade
A = { 3, 4, 5, 6, 7 } B = { 1, 3, 5, 7, 9 } C = { 5, 5, 5, 5 } D = { 3, 5, 5, 7 } E = { 3.5, 5, 6.5 }
Uma medida de Posio no suficiente para descrever um conjunto de dados. Os Conjuntos ao lado mostram isso! Eles possuem mesma mdia, sendo diferentes.
Algumas medidas de Variabilidade: Amplitude (H): Tem o inconveniente de levar em conta apenas os dois valores extremos: H =7-3=4 Amplitude=Range
11
1-Estatstica
Medidas de Disperso
Considerando os desvios em relao mdia, temos, para A, por exemplo: {-2, -1, 0, 1, 2} xi - x A = { 3, 4, 5, 6, 7 }
Inconveniente:
(x
i =1
x ) = x1 x = n x n x 0
i =1 i =1
Uma opo para analisar os desvios das observaes : considerar o total dos quadrados dos desvios.
(x
i =1
x ) =4 + 1 + 0 + 1 + 4 = 10
2
12
1-Estatstica
Desvio Padro
(x
S2 =
i =1
x)
S = S2
...que o Desvio Padro (DP(x)), uma medida que expressa na mesma unidade dos dados originais
13
1-Estatstica
(x
S2 =
i =1
x)
x
=
i =1
2 i
(x
x2
S =
2
i =1
x)
n1
Varincia Populacional (2 ou n 2 )
14
1-Estatstica
Exemplo
Calcular a Varincia e o Desvio Padro de X
X
5 4 3 1 2
X
Mdia = 3 Mdia = 3
(X X )
2 1 0 -2 -1
(X X )
4 1 0 4 1
X=
S= S
S2
Divide a Soma Divide a Soma por (n-1): por (n-1): = Varincia = S22 = Varincia = S = 2,5 = 2,5
S=Amplitude/4
Raiz Qadrada Raiz Qadrada da Varincia da Varincia = Desv.Pa. = S = Desv.Pa. = S = 1,58 = 1,58
15
1-Estatstica
Mdia da Populao
=
N
X
i =1
(X i ) 2
i=1
x
Mdia da Amostra
x=
N
i=1
(X i X ) 2
Desvio Padro da Amostra
s=
i=1
n -1
16
1-Estatstica
75% 50%
Q3=75 Percentil
DBP
1 04
99
D=Q3-Q1 Interquartil
Q2=Mediana (50 Percentil) Q1=25 Percentil
94
25%
Boxplot desgastante quando feito sem computador pois supe a ordenao de dados.
17
1-Estatstica
Percentis e Boxplot
Valor do meio
(n+1)/4 0
Quartis:
2.(n+1)/4
0
1-Estatstica
Percentis e Boxplot
19
1-Estatstica
Exerccio: Como conduzir uma anlise de questionrio (com escala de Likert) usando Boxplot?
Use: <Graph> <Boxplot> Likert.mtw
100
Avaliacao
50
Perg1
Perg2
Perg3
Perg4
Perg5
Perg6
Perguntas
20
1-Estatstica
21
1-Estatstica
<Marginal Plot>
22
1-Estatstica
Runchart
Abra runchart.mtw <Stat> <Quality Tools> <Run Chart> Column=Tempo na fila Subgroup Size=1
Os dados representam uma srie temporal Tal grfico til para ver a estabilidade de um processo. Control Chart Melhor!
23
1-Estatstica
Multi-Vari
Identifica Diversos tipos de variao A anlise de efeitos similar em DOE Permite identificar interaes No o mesmo que Estatstica Multivariada
TempoSinter
0,5
1,0
2,0
22,5
21,5
20,5
19,5
18,5
17,5
15
18
21
TipoMetal
24
1-Estatstica
xi x zi = s
xi -
Ex.: Dois grupos de pessoas acusam os seguintes dados: Nesses grupos h duas Grupo Peso mdio Desvio Padro pessoas que pesam A 66.5 kg 6.38 kg respectivamente, 81.2 kg e B 72.9 kg 7.75 kg 88.0 kg.
1-Estatstica
Regra 68 -- 95 -- 99
xi x zi = s
Cerca de 68% dos valores esto a menos de 1 desvio padro a contar da mdia (-1 < z < 1) Cerca de 95% dos valores esto a menos de 2 desvios padro a contar da mdia (-2 < z < 2) Cerca de 99% dos valores esto a menos de 3 desvios padro a contar da mdia (-3 < z < 3)
26
1-Estatstica
Regra 68 -- 95 -- 99
P( - 1.00 X 1.00 ) = 0.6826 P( - 1.645 X + 1.645 ) = 0.90 P( - 1.96 X + 1.96 ) = 0.95 P( - 2.00 X + 2.00 ) = 0.9545 P( - 2.57 X + 2.57 ) = 0.99 P( - 3.00 X + 3.00 ) = 0.9978
68%
95%
99.73%
1-Estatstica
28
1-Estatstica
Statdisk
1-Estatstica
30
1-Estatstica
Exerccio
Em uma populao onde as medidas tem Mdia 100 e Desvio Padro 5, determine a probabilidade de se ter uma medida: a) b) c) d) e) f) g) h) i) Entre 100 e 115 Entre 100 e 90 Superior a 110 Inferior a 95 Inferior a 105 Superior a 97 Entre 105 e 112 Entre 89 e 93 98 Dica: Crie uma coluna com os valores 100 115...98 no Minitab Crie uma coluna com os valores 0,74...0,32... no Minitab
Em uma populao onde as medidas tem Mdia 100 e Desvio Padro 5, determine os valores k tais que se tenha a probabilidade: a) b) c) P(X>k)=0,26 P(X<k)=0,32 P(k1<100<k2)=0,47 (k1 e k2 simtricos em relao a 100)
31
1-Estatstica
X : N ( ; )
1 1 T T
3
32
1-Estatstica
(z)
z=
ZBench
-3 -2 -1 0 1 2 3 z x
Z: N(0; 1)
X : N ( ; )
Qual o formato da curva acumulada?
33
-3 -2 -
+ +2 +3
1-Estatstica
104 100 z0 = =2 2
100 0 104 z0 = 2 x
( 2) = 0.9772
z
34
1-Estatstica
A tenso de ruptura (em newtons) de uma fibra sinttica representada por X e distribuda como N(800; 12). O controle de qualidade na fabricao da fibra exige uma tenso de no mnimo 772 N. Uma amostra da fibra randomicamente testada. A probabilidade de obtermos P(X 772) obtido a partir de:
x 772 800 P( X < 772 ) = P < 12 = P(Z < 2.33) = ( 2.33) = 0.01
3 = 12 =1
1-Estatstica
Gere uma sequncia de dados qualquer. Ex.: 100 valores Weibull (5,8) e faa o grfico Probability Plot
99
95 90
10%
80 70 60 50 40 30 20 10 5
Percent
25
35
45
55
Observe: Data Dados no eixo X e Espaos diferentes no eixo Y so Propositais devido aos percentis da curva Normal!
36
1-Estatstica
Testando Normalidade
Normal Distribution
50
0 20 30 40 50 60 70 80 90 1 00 10 1
Average: 70 Std Dev: 10 N of data: 500
26
36
46
56
66
76
86
96
1 06
Normal
Anderson-Darling Normality Test A-Squared: 0.418 p-value: 0.328
C1
Frequency
200
Probability
1 00
60
70
80
90
1 00
10 1
1 20
1 30
Average: 70 Std Dev: 10 N of data: 500
C2
Pos Skew
Anderson-Darling Normality Test A-Squared: 46.447 p-value: 0.000
Frequency
Probability
200
1 00
Se o Teste de Se o Teste de Normalidade Normalidade mostrar um mostrar um "valor-P" "valor-P" Menor que Menor que 0,05, ento os 0,05, ento os dados NO dados NO ESTO bem ESTO bem representados representados por uma por uma distribuio distribuio normal normal
Used With Permission AlliedSignal 1995 Dr. Steve Zinkgraf
Frequency
Probability
1 0
20
30
40
50
60
70
80
Average: 70 Std Dev: 10 N of data: 500
1 0
20
30
40
50
60
70
80
C3
Neg Skew
Anderson-Darling Normality Test A-Squared: 43.953 p-value: 0.000
37
1-Estatstica
Teste Anderson-Darling
Exerccio: Gere diferentes sequncias de dados de uma forma aleatria e teste a normalidade usando o Minitab
38
1-Estatstica
Soma de Normais
Processo A
3
X=3 s=1
7
X=7 s=2
S A +B =
2 SA
2 SB
(1) + (2)
5 = 2.23
1+ 2 = 3
Incorreto;
39
1-Estatstica
Linha A
Diferena de Normais
Linha B
-10
-5
0
X = 3
5
s = 1
X = 7 s = 2
10
15
X A B = X A - XB = 3 - 7 = - 4
SA B = SA + SB = (1) + (2) 1 2= 1
Incorreto 2 2 2 2
= 5 = 2.23
Correto
40
1-Estatstica
Pratique
O oramento de uma empresa para uma certa conta R$ 100. Variaes de 3% acima e abaixo deste valor so consideradas aceitveis, ou seja, de R$ 97 a R$ 103. Sabe-se, pela anlise de dados histricos, que a variao nesta conta obedece distribuio normal, com mdia de R$ 99 e desvio-padro de R$ 1,25. Que porcentagem de vezes o oramento encontra-se fora da faixa aceitvel?
Resp 5,55%
41
1-Estatstica
Exerccios
1.
2.
3.
Em um banco h uma norma de que nenhum cliente deve permanecer na fila por mais de 15 minutos. Se o tempo de espera normal, com mdia 9,45 minutos e desvio-padro de 2,75 minutos, em que porcentagem das vezes a norma no cumprida? O tempo que Alarico leva do seu trabalho at sua casa tem distribuio normal, com mdia 90 minutos e desvio-padro de 5 minutos. Qual a probabilidade dele levar mais do que 110 minutos no trajeto? Uma pessoa precisa pegar um trem que parte pontualmente em 20 min, podendo optar por dois trajetos para chegar estao: T1 ou T2. Sabe-se que o tempo para percorrer T1 normal com mdia 18 min e desviopadro de 5 min, e idem para T2, mas com mdia 20 min e desviopadro 2 min. Qual a melhor deciso de trajeto? Sabendo que o trem est com atraso de 3 min, qual a melhor deciso agora?
42
1-Estatstica
Estudar preciso!
1) Definina um Projeto de Melhoria de Processos abordando: Processos, Fatores Controlveis e Incontrolveis, Respostas, SIPOC, etc... Prepare uma rpida apresentao. Coloque as palavras-chave relacionadas (em Ingls). 2) Rode o Programa PQSystems e procure entender todos os 5 tpicos existentes: Central Limit Theorem Quincunx Demmnings Funnel Red Bead Experiment Dice Experiment