You are on page 1of 43

Estatstica

A essncia da cincia a observao. Estatstica: A cincia que se preocupa com a organizao, descrio, anlise e interpretao dos dados experimentais. Ramo da Matemtica Aplicada. A palavra estatstica provm de Status.

Curiosidade: Em 1662, John Graunt publicou os primeiros informes estatsticos. Era sobre nascimento e mortes.

Estatstica Bsica (Anova, TH, Regresso) Sries Temporais Data Mining Six Sigma Redes Neurais Controle de Qualidade

Simulao / PO DOE /Taguchi /RSM Anlise de Sistema de Medio Estatstica Multivariada Amostragem / Pesquisa Confiabilidade

1-Estatstica

Populao e Amostra

A Populao (ou Distribuio) a coleo de todas as observaes potenciais sobre determinado fenmeno. O conjunto de dados efetivamente observados, ou extrados, constitui uma Amostra da populao. Um Censo uma coleo de dados relativos a Todos os elementos de uma populao. Um Parmetro est para a Populao assim como uma Estatstica est para a Amostra.

1-Estatstica

Tipos de Dados
(Tambm Dados Categricos ou de Atributos)

Nominal Ordinal

Qualitativa Varivel Discreta Quantitativa Contnua


(Variveis)

Ex.: Para uma populao de peas produzidas em um determinado processo, poderamos ter:
Varivel Estado: Perfeita ou defeituosa No de peas defeituosas Dimetro das peas Tipo Qualitativa Nominal Quantitativa Discreta Quantitativa Contnua
3

Qualidade: 1a, 2a ou 3a categoria Qualitativa Ordinal

1-Estatstica

<Calc> <Random Data> Nmeros Aleatrios

Aplicao: Gere sequncias de valores aleatrios que represente problemas em sua rea. O que significa o procedimento <Calc> <Set Base>?

Amostragem: Gere a sequncia 1 2 3 ...100. <Calc> <Make Patterned Data> Selecione uma amostra com 10 valores a partir das sequncias geradas anteriormente. Use <Calc> Random Data> <Sample from Column>

1-Estatstica

<Graphical Summary> Ex.:Nmero de acessos pgina do Site da Empresa


durante os ltimos 100 dias teis.

Aplicao: Gere uma sequncia de dados que represente um processo em sua rea e calcule as estatsticas desse conjunto de dados. Use: <Random> e <Display Descriptive Statistics>

1-Estatstica

Medidas de Posio: Mdia

Aritmtica Simples

+...+ x1 + x 2 + L + x n x= = n

x
i =1

Aritmtica Ponderada

x=

+...+ x1 p1 + x 2 p2 + L + x n pn

xp
=
i =1 n i

p1 + p2 + L + pn +...+

p
i =1

Um pouco sobre arredondamento de mdias:


Tome uma decimal acima da dos dados: Ex.: 2,4 3,4 e 5,7 => mdia =3,73 Em vrias operaes, arredonde apenas o resultado final
6

1-Estatstica

Um Cidado Americano Mdio

Chama-se Robert Pesa 78 Kg Manequim 48 85 cm de cintura Consome anualmente 8,5 Kg massa, 11,8Kg de bananas, 1,8 Kg de batatas fritas, 8,15Kg de sorvete e 35,8 Kg de carne. V TV por ano 2567 horas Recebe anualmente 585 coisas por correio (cartas e outros) Diariamente dorme 7,7 horas, gasta 21 minutos para chegar ao trabalho e trabalha 6,1 horas

1-Estatstica

Medidas de Posio: Mediana

Se n mpar:

~ = n + 1 termo x 2
o

Se n par: o o n n termo + + 1 termo 2 ~ = 2 x 2

Ex.:

~ {35, 36, 37, 38, 40, 40, 41, 43 ,46} x = 40


~ = 15 + 16 = 15,5 {12, 14, 14, 15, 16, 16, 17, 20} x 2

Mediana o valor do meio de um conjunto de dados dispostos em ordem crescente ou decrescente. Inconveniente: No considera todos os valores da amostra!
8

1-Estatstica

Mdia x Mediana

Ex.:

{ 200, 250, 250, 300, 450, 460, 510 }

x = 345,7 ~ x = 300

Ambas so boas medidas de Tendncia Central. Prefira a mdia

{ 200, 250, 250, 300, 450, 460, 2300 }

~ x = 300

= 601

Devido ao Outlier 2300, a mediana melhor estatstica que a mdia.

1-Estatstica

Medidas de Disperso

Rode e Entenda o programa Interativo da PQ Systems

Discuta: 1) Porque os bancos adotam fila nica? 2) Por favor, com quantos dias de antecedncia eu devo postar uma carta de aniversrio para minha me?
10

1-Estatstica

Variabilidade

A = { 3, 4, 5, 6, 7 } B = { 1, 3, 5, 7, 9 } C = { 5, 5, 5, 5 } D = { 3, 5, 5, 7 } E = { 3.5, 5, 6.5 }

Uma medida de Posio no suficiente para descrever um conjunto de dados. Os Conjuntos ao lado mostram isso! Eles possuem mesma mdia, sendo diferentes.

Algumas medidas de Variabilidade: Amplitude (H): Tem o inconveniente de levar em conta apenas os dois valores extremos: H =7-3=4 Amplitude=Range
11

1-Estatstica

Medidas de Disperso

Considerando os desvios em relao mdia, temos, para A, por exemplo: {-2, -1, 0, 1, 2} xi - x A = { 3, 4, 5, 6, 7 }

Inconveniente:

(x
i =1

x ) = x1 x = n x n x 0
i =1 i =1

Uma opo para analisar os desvios das observaes : considerar o total dos quadrados dos desvios.

(x
i =1

x ) =4 + 1 + 0 + 1 + 4 = 10
2

12

1-Estatstica

Desvio Padro

Associando ao nmero de elementos da amostra (n), tem-se:


.

(x
S2 =
i =1

x)

...que a Varincia ( Var(x))

S = S2

...que o Desvio Padro (DP(x)), uma medida que expressa na mesma unidade dos dados originais
13

1-Estatstica

Disperso: Frmulas Alternativas

(x
S2 =
i =1

x)

x
=
i =1

2 i

(x
x2

S =
2

i =1

x)

n1

Varincia Populacional (2 ou n 2 )

Varincia Amostral n-1 est Relacionado a um problema de tendenciosidade

14

1-Estatstica

Exemplo
Calcular a Varincia e o Desvio Padro de X

X
5 4 3 1 2

X
Mdia = 3 Mdia = 3

(X X )
2 1 0 -2 -1

(X X )
4 1 0 4 1

X=

Soma dos pontos de dados Nmero dos pontos de dados

Uma Regra Prtica para conjunto de dados tpicos:

S= S

S2
Divide a Soma Divide a Soma por (n-1): por (n-1): = Varincia = S22 = Varincia = S = 2,5 = 2,5

Soma da Soma da ltima coluna ltima coluna = 10 = 10

S=Amplitude/4

Raiz Qadrada Raiz Qadrada da Varincia da Varincia = Desv.Pa. = S = Desv.Pa. = S = 1,58 = 1,58

15

1-Estatstica

Expresses para Mdia e Varincia

Mdia da Populao

=
N

X
i =1

Desvio Padro da Populao

(X i ) 2
i=1

x
Mdia da Amostra

x=
N

i=1

(X i X ) 2
Desvio Padro da Amostra

s=

i=1

n -1
16

1-Estatstica

Outra Estratgia: Percentis e Boxplot

Outlier ( fora da distncia do Q3 + 1,5D ) Observao Mxima


1 09

75% 50%

Q3=75 Percentil
DBP

1 04

99

D=Q3-Q1 Interquartil
Q2=Mediana (50 Percentil) Q1=25 Percentil

94

25%

EDA (Exploratory Data Analysis) e Mtodo dos Cinco Nmeros

Boxplot desgastante quando feito sem computador pois supe a ordenao de dados.

17

1-Estatstica

Percentis e Boxplot

Valor do meio

(n+1)/4 0

Quartis:
2.(n+1)/4
0

Q1=Quarta Observao Crescente=71.7 Q3=Quarta Observao Decrescente=150.6


3.(n+1)/4 0

Para valores no inteiros dos quartis, usa-se interpolao

Outliers: Q3+1.5D=150.6+1.5(150.6-71.7)=268.95 So outliers valores maiores que 268.95


Use Boxplot.mtw e faa o Graphical Summary
18

1-Estatstica

Percentis e Boxplot

Exerccio: <StatGame><Describing Data><BoxPlot>

19

1-Estatstica

Boxplot Stack Columns

Exerccio: Como conduzir uma anlise de questionrio (com escala de Likert) usando Boxplot?
Use: <Graph> <Boxplot> Likert.mtw
100

Use a opo <Frame> <Multiple Graph>

Avaliacao

Entenda o procedimento de empilhamento de colunas (Stack): <Manip> <Stack Columns>

50

Perg1

Perg2

Perg3

Perg4

Perg5

Perg6

Perguntas

20

1-Estatstica

Plot Exerccio no Minitab: Faa o grfico abaixo a partir da planilha grafico.mtw

21

1-Estatstica

<Marginal Plot>

Faa o grfico abaixo a partir da planilha grafico.mtw

22

1-Estatstica

Runchart

Abra runchart.mtw <Stat> <Quality Tools> <Run Chart> Column=Tempo na fila Subgroup Size=1

Os dados representam uma srie temporal Tal grfico til para ver a estabilidade de um processo. Control Chart Melhor!

23

1-Estatstica

Multi-Vari
Identifica Diversos tipos de variao A anlise de efeitos similar em DOE Permite identificar interaes No o mesmo que Estatstica Multivariada

Use Sinter.mtw <Stat> <Quality Tools>


Fora
23,5

TempoSinter
0,5
1,0
2,0

22,5

21,5

<Multi-Vari>: Response: Fora Factor1: TempoSinter Factor2: TipoMetal

20,5

19,5

18,5

17,5

15

18

21

TipoMetal
24

1-Estatstica

Escores padronizados (z)

xi x zi = s

xi -

x considera o afastamento de xi em relao mdia.

A diviso por s torna s como unidade ou padro de medida.

Ex.: Dois grupos de pessoas acusam os seguintes dados: Nesses grupos h duas Grupo Peso mdio Desvio Padro pessoas que pesam A 66.5 kg 6.38 kg respectivamente, 81.2 kg e B 72.9 kg 7.75 kg 88.0 kg.

81,2 66,5 88 72,9 em A : z A = = 2,3 e em B : z B = = 1,95 6,38 7,75


Logo, a pessoa de A revela um maior excesso relativo de peso.
25

1-Estatstica

Regra 68 -- 95 -- 99 Escores padronizados (z)

Regra 68 -- 95 -- 99

xi x zi = s

Cerca de 68% dos valores esto a menos de 1 desvio padro a contar da mdia (-1 < z < 1) Cerca de 95% dos valores esto a menos de 2 desvios padro a contar da mdia (-2 < z < 2) Cerca de 99% dos valores esto a menos de 3 desvios padro a contar da mdia (-3 < z < 3)

26

1-Estatstica

Regra 68 -- 95 -- 99
P( - 1.00 X 1.00 ) = 0.6826 P( - 1.645 X + 1.645 ) = 0.90 P( - 1.96 X + 1.96 ) = 0.95 P( - 2.00 X + 2.00 ) = 0.9545 P( - 2.57 X + 2.57 ) = 0.99 P( - 3.00 X + 3.00 ) = 0.9978
68%

Alguns intervalos simtricos que so usados freqentemente.


Probabilidade do valor da amostra

40% 30% 20% 10% 0% -4 -3 -2 -1

95%

99.73%

Nmero de Desvios Padro da Mdia


27

1-Estatstica

Distribuio Normal (ou Gaussiana)

Observe no programa Quality Gamebox o Processo de Construo de uma Distribuio Normal.

A distribuio mais importante em Estatstica (The Bell Curve)


Aplicao: Cite variveis, em sua rea de interesse, que tem uma distribuio Normal. Complete a tabela
Descrio da Varivel Mdia (estimada) Desvio Padro (estimada)

28

1-Estatstica

Statdisk

Use o programa Statdisk <Analysis> <Probability Distribution> <Normal Distribution>

Observe em <Options> os valores acumulados


29

1-Estatstica

<Calc> <Probability Distributions>

30

1-Estatstica

Exerccio

Em uma populao onde as medidas tem Mdia 100 e Desvio Padro 5, determine a probabilidade de se ter uma medida: a) b) c) d) e) f) g) h) i) Entre 100 e 115 Entre 100 e 90 Superior a 110 Inferior a 95 Inferior a 105 Superior a 97 Entre 105 e 112 Entre 89 e 93 98 Dica: Crie uma coluna com os valores 100 115...98 no Minitab Crie uma coluna com os valores 0,74...0,32... no Minitab

Em uma populao onde as medidas tem Mdia 100 e Desvio Padro 5, determine os valores k tais que se tenha a probabilidade: a) b) c) P(X>k)=0,26 P(X<k)=0,32 P(k1<100<k2)=0,47 (k1 e k2 simtricos em relao a 100)
31

1-Estatstica

Target e Upper Spec. Limit


Ponto de Inflexo

X : N ( ; )

1 1 T T

p(d) USL USL

3
32

1-Estatstica

Normal Reduzida ou Padronizada

(z)

z=

ZBench
-3 -2 -1 0 1 2 3 z x

Z: N(0; 1)
X : N ( ; )
Qual o formato da curva acumulada?
33

-3 -2 -

+ +2 +3

Tal frmula est tabelada e fornece valores acumulados

1-Estatstica

Exemplo Cumulative Probability

Suponha que X: N(100; 2) e que desejamos avaliar P(X 104).

P(x104) = 0.9772 = F(104)

104 100 z0 = =2 2
100 0 104 z0 = 2 x

( 2) = 0.9772
z
34

1-Estatstica

Exemplo Usando Normal Reduzida

A tenso de ruptura (em newtons) de uma fibra sinttica representada por X e distribuda como N(800; 12). O controle de qualidade na fabricao da fibra exige uma tenso de no mnimo 772 N. Uma amostra da fibra randomicamente testada. A probabilidade de obtermos P(X 772) obtido a partir de:

x 772 800 P( X < 772 ) = P < 12 = P(Z < 2.33) = ( 2.33) = 0.01
3 = 12 =1

P(X 772)=1 - P(X <77 2) = 0.99


772 800 x -2.33 0 z
35

1-Estatstica

Normal Probability Plot

Gere uma sequncia de dados qualquer. Ex.: 100 valores Weibull (5,8) e faa o grfico Probability Plot
99

95 90
10%

80 70 60 50 40 30 20 10 5

10 10% 20 30 50 70 80 10% 90 10% 10% 10%

Percent

25

35

45

55

Observe: Data Dados no eixo X e Espaos diferentes no eixo Y so Propositais devido aos percentis da curva Normal!
36

1-Estatstica

Testando Normalidade
Normal Distribution

3 Maneiras de Ver se Seus Dados esto Distribudos Normalmente


Normal Probability Plots
.999
1 00

.99 .95 .80 .50 .20 .05 .01 .001

50

0 20 30 40 50 60 70 80 90 1 00 10 1
Average: 70 Std Dev: 10 N of data: 500

26

36

46

56

66

76

86

96

1 06

Normal
Anderson-Darling Normality Test A-Squared: 0.418 p-value: 0.328

C1

Positive Skewed Distribution

Normal Probability Plots


300

Frequency

200

Probability

.999 .99 .95 .80 .50 .20 .05 .01 .001 60 70 80 90 1 00 10 1 1 20 1 30

1 00

60

70

80

90

1 00

10 1

1 20

1 30
Average: 70 Std Dev: 10 N of data: 500

C2

Pos Skew
Anderson-Darling Normality Test A-Squared: 46.447 p-value: 0.000

Normal Probability Plots


300

Negative Skewed Distribution


.999 .99 .95 .80

Frequency

Probability

200

.50 .20 .05 .01 .001

1 00

Se o Teste de Se o Teste de Normalidade Normalidade mostrar um mostrar um "valor-P" "valor-P" Menor que Menor que 0,05, ento os 0,05, ento os dados NO dados NO ESTO bem ESTO bem representados representados por uma por uma distribuio distribuio normal normal
Used With Permission AlliedSignal 1995 Dr. Steve Zinkgraf

Frequency

Probability

1 0

20

30

40

50

60

70

80
Average: 70 Std Dev: 10 N of data: 500

1 0

20

30

40

50

60

70

80

C3

Neg Skew
Anderson-Darling Normality Test A-Squared: 43.953 p-value: 0.000

37

1-Estatstica

Teste Anderson-Darling

A distribuio pode ser considerada Normal

Exerccio: Gere diferentes sequncias de dados de uma forma aleatria e teste a normalidade usando o Minitab
38

1-Estatstica

Soma de Normais

Processo A

Processo B Tempo Total (A+B) ?

3
X=3 s=1

7
X=7 s=2

S A +B =

2 SA

2 SB

(1) + (2)

5 = 2.23

1+ 2 = 3

Correto; Some as varincias e depois obtenha o Desvio Padro

Incorreto;

39

1-Estatstica
Linha A

Diferena de Normais

Diferena: Linha A Linha B

Linha B

-10

-5

0
X = 3

5
s = 1
X = 7 s = 2

10

15

X A B = X A - XB = 3 - 7 = - 4
SA B = SA + SB = (1) + (2) 1 2= 1
Incorreto 2 2 2 2

= 5 = 2.23

Correto

40

1-Estatstica

Pratique

O oramento de uma empresa para uma certa conta R$ 100. Variaes de 3% acima e abaixo deste valor so consideradas aceitveis, ou seja, de R$ 97 a R$ 103. Sabe-se, pela anlise de dados histricos, que a variao nesta conta obedece distribuio normal, com mdia de R$ 99 e desvio-padro de R$ 1,25. Que porcentagem de vezes o oramento encontra-se fora da faixa aceitvel?
Resp 5,55%
41

1-Estatstica

Exerccios

1.

2.

3.

Em um banco h uma norma de que nenhum cliente deve permanecer na fila por mais de 15 minutos. Se o tempo de espera normal, com mdia 9,45 minutos e desvio-padro de 2,75 minutos, em que porcentagem das vezes a norma no cumprida? O tempo que Alarico leva do seu trabalho at sua casa tem distribuio normal, com mdia 90 minutos e desvio-padro de 5 minutos. Qual a probabilidade dele levar mais do que 110 minutos no trajeto? Uma pessoa precisa pegar um trem que parte pontualmente em 20 min, podendo optar por dois trajetos para chegar estao: T1 ou T2. Sabe-se que o tempo para percorrer T1 normal com mdia 18 min e desviopadro de 5 min, e idem para T2, mas com mdia 20 min e desviopadro 2 min. Qual a melhor deciso de trajeto? Sabendo que o trem est com atraso de 3 min, qual a melhor deciso agora?

42

1-Estatstica

Estudar preciso!

1) Definina um Projeto de Melhoria de Processos abordando: Processos, Fatores Controlveis e Incontrolveis, Respostas, SIPOC, etc... Prepare uma rpida apresentao. Coloque as palavras-chave relacionadas (em Ingls). 2) Rode o Programa PQSystems e procure entender todos os 5 tpicos existentes: Central Limit Theorem Quincunx Demmnings Funnel Red Bead Experiment Dice Experiment

3) Refaa todos os exemplos do captulo 1 4) Observe os arquivos contidos no CD do curso.


43

You might also like