You are on page 1of 18

5

CONCEITOS DE ESTATÍSTICA

Grupo de Controlo e Gestão G G


C

OBJECTIVOS

Após a leccionação deste módulo, os estudantes deverão ter presente:

Noções e conceitos básicos de estatística descritiva;

Conceito de distribuição teórica;

Princípios fundamentais da distribuição normal;

Objectivo principal da inferência estatística e sua aplicabilidade.

Grupo de Controlo e Gestão G G


C

1
ESTATÍSTICA DESCRITIVA

A estatística descritiva procura resumir a informação relevante de uma massa de dados, a partir de
um conjunto de medidas e através de algumas representações gráficas.

Medidas de Localização
Parâmetros (dados referentes a uma população)
Medidas de Dispersão

Estatísticas (dados referentes a uma amostra)

População
Conjunto de elementos (finito ou infinito) que têm em comum
determinada característica. Amostra

Amostra
População
Todo o subconjunto não vazio e com menor número de elementos do que o
conjunto definido como população.

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Na estatística descritiva, a análise incide sobre as características relevantes dos elementos que
constituem as amostras e populações.

Cada característica é normalmente uma variável, já que os elementos podem ter posicionamentos diferentes relativamente
a essa determinada característica.

Variável Qualitativa

Variável Estatística Variável Quantitativa Contínua

Variável Quantitativa

Variável Quantitativa Discreta

Grupo de Controlo e Gestão G G


C

2
ESTATÍSTICA DESCRITIVA

Variáveis Qualitativas

Uma variável diz-se qualitativa quando pode ser distribuída em determinado número de categorias mutuamente exclusivas.

Arredondado
Exemplos

Oblongo
Oboval
Oval
Cor da peça, Tipo de defeito, Causa do defeito, Conformidade do componente, etc.

Forma da Folha

Variáveis Quantitativas

Uma variável diz-se quantitativa quando é mensurável, isto é, quando é expressa numericamente.

Exemplos

Comprimento da peça, Peso do componente, Espessura do material, Número de defeitos, etc.

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Discretas

Uma variável discreta assume um conjunto finito ou infinito numerável de valores.

Exemplos

Número de defeitos de uma peça, Número de colaboradores de uma empresa, Número de peças produzidas pela empresa, etc.

Variáveis Quantitativas Contínuas

Uma variável contínua assume um conjunto infinito não numerável de valores.

Exemplos

Área do componente, Volume da peça, Volume de vendas da empresa, Custo da matéria-prima, etc.

Grupo de Controlo e Gestão G G


C

3
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Discretas


Pinto e Curto (2010)

• Empresa ABC tem recebido várias reclamações;

• Reclamações relacionadas com o número de produtos defeituosos encontrados nos lotes vendidos;

• Análise de 100 lotes escolhidos aleatoriamente.

X - Número de produtos defeituosos em cada lote. Variável

A variável X é uma variável discreta, pois assume um conjunto finito


numerável de valores.

Distribuição de frequências corresponde ao conjunto formado por todos os


valores assumidos pela variável e respectivas frequências (absolutas ou
relativas).

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Discretas

Tabela (ou distribuição) de Frequências

Na tabela de frequências encontra-se registado, para cada valor da variável, as respectivas ocorrências.

xi (x1, x2, …, x8) - Valores assumidos pela variável X.

Fi - Frequências absolutas (ocorrências).

fi - Frequências relativas → fi = Fi/n

n - total de ocorrências

Pinto e Curto (2010)

Grupo de Controlo e Gestão G G


C

4
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Discretas


Pinto e Curto (2010)

Tabela (ou distribuição) de Frequências

Na tabela de frequências encontra-se registado, para cada valor da variável, as respectivas ocorrências.

F1 = 5

Da totalidade dos lotes analisados, apenas 5 não


apresentaram qualquer produto com defeito.

f1 = 0.05

5 % dos lotes analisados não apresentaram qualquer produto com


defeito.

95 % dos lotes analisados têm, pelo menos, um produto com


defeito.

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Discretas

Gráfico de barras (diagrama diferencial)

Pinto e Curto (2010)

Grupo de Controlo e Gestão G G


C

5
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

• Empresa CBA produz bobinas;

• Reclamações sugerem problemas relacionados com a resistência eléctrica das bobinas;

• Análise da resistência eléctrica de 100 bobinas escolhidas aleatoriamente.

Variável

X - Resistência eléctrica da bobina.

Gryna et al. (2007)

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

xi (x1, x2, …, x8) - Valores assumidos pela variável X.

Fi - Frequências absolutas (ocorrências).

fi - Frequências relativas → fi = Fi/n

n - total de ocorrências

Quando existe grande quantidade de informação muito variável, a distribuição de


frequências pode tornar-se demasiado grande para resumir os dados originais.

Os dados podem ser agrupados em classes.

Gryna et al. (2007)

Grupo de Controlo e Gestão G G


C

6
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Tabela (ou distribuição) de Frequências

Gryna et al. (2007)


1) Definição do número de classes

Opção 1 Opção 2

log N
Número de Classes = 1 +
log 2

(regra de Sturges) (J. Juran)

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Tabela (ou distribuição) de Frequências

Gryna et al. (2007)


1) Definição do número de classes

Opção 1 Opção 2

log N
Número de Classes = 1 +
log 2

7 classes
log 100
Número de Classes = 1 +
log 2

Número de Classes = 7.64  7 ou 8 classes

Grupo de Controlo e Gestão G G


C

7
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Tabela (ou distribuição) de Frequências

Gryna et al. (2007)


2) Calcular a amplitude das classes

Valor Máximo - Valor Mínimo


Amplitude das Classes =
Número de Classes

O valor calculado deve ser arredondado para um número conveniente (preferivelmente o número ímpar mais próximo com o
mesmo número de dígitos significativos que os dados em estudo).

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Tabela (ou distribuição) de Frequências

Gryna et al. (2007)


2) Calcular a amplitude das classes

3.46 3.27
Valor Máximo - Valor Mínimo
Amplitude das Classes =
Número de Classes
7
Resumo

3.46 - 3.27 Número de Classes - 7


Amplitude das Classes =  0.02714
7
Amplitude das Classes - 0.03

Amplitude das Classes = 0.03

Grupo de Controlo e Gestão G G


C

8
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Tabela (ou distribuição) de Frequências

Gryna et al. (2007)


3) Construir as classes, definindo as suas fronteiras

• Cada limite de classe deve ser composto por mais um dígito significativo que os dados em análise, devendo acabar em 5.

• A amplitude da classe deve ser constante ao longo de toda a distribuição de frequências.

4) Posicionar cada observação na classe apropriada e listar a frequência total para cada uma das classes

Todo este procedimento pode ser ajustado quando necessário por forma a fornecer um claro resumo dos dados e revelar o padrão
de variação subjacente.

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Tabela (ou distribuição) de Frequências

Gryna et al. (2007)

Classes 33 % das bobinas analisadas têm um valor de resistência


eléctrica situado entre 3.325 e 3.355 Ω.

86 % das bobinas analisadas têm um valor de resistência


eléctrica situado entre 3.265 e 3.385 Ω.

Agrupar os dados em classes permite condensar a informação original. Corre-se, contudo, o risco de se perder algum
detalhe.

Grupo de Controlo e Gestão G G


C

9
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Histograma

• Gráfico construído a partir da distribuição de frequências;

• Evidencia a distribuição de frequências dos valores observados de uma determinada variável;

• Destaca o centro e a quantidade de variação na amostra de dados;

• A sua simplicidade de construção e interpretação tornam-no uma ferramenta eficaz na análise elementar de dados.

Gryna et al. (2007)

Pinto e Curto (2010)

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Histograma

0.4 Histograma

Gryna et al. (2007)

Grupo de Controlo e Gestão G G


C

10
ESTATÍSTICA DESCRITIVA

Variáveis Quantitativas Contínuas

Histograma - Interpretação

Tendência Dispersão

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Medidas de Localização

Média

Medidas de Tendência Central Moda

Mediana

Média Aritmética

Média populacional
μ

Média amostral
X

Grupo de Controlo e Gestão G G


C

11
ESTATÍSTICA DESCRITIVA

Média Aritmética

Média Populacional Média Amostral

N n

 xi
i=1
 xi
μ= X = i=1
N n

xi - Observações individuais xi - Observações individuais

N - Dimensão da população n - Dimensão da amostra

Parâmetro Estimador
μ X

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Medidas de Dispersão

Variância

Medidas de Dispersão

Desvio-padrão

Variância populacional
σ2

Desvio-padrão populacional
σ
Variância amostral
s2

Desvio-padrão amostral
s

Grupo de Controlo e Gestão G G


C

12
ESTATÍSTICA DESCRITIVA

Variância

A variância corresponde à média do quadrado das variações das observações em relação ao valor médio.

Variância Populacional Variância Amostral

N n

 (xi- ) 2

2
 (xi- X ) 2

 =
2 i=1 s = i=1

N n

xi - Observações individuais xi - Observações individuais

μ - Média populacional X - Média amostral

N - Dimensão da população n - Dimensão da amostra

Parâmetro Estimador
2 s2

Grupo de Controlo e Gestão G G


C

ESTATÍSTICA DESCRITIVA

Desvio-padrão

O desvio-padrão corresponde à raiz quadrada da variância. Possuindo, em relação a esta, a vantagem de se encontrar expresso nas
mesmas unidades da variável.

Desvio-padrão Populacional Desvio-padrão Amostral

N n

 (xi- ) 2
 (xi- X ) 2

 = i=1
s= i=1

N n

xi - Observações individuais xi - Observações individuais

μ - Média populacional X - Média amostral

N - Dimensão da população n - Dimensão da amostra

Parâmetro Estimador
 s

Grupo de Controlo e Gestão G G


C

13
ESTATÍSTICA DESCRITIVA

Variância/Desvio-padrão Amostral Corrigida(o)

Quando se pretende utilizar a variância/desvio-padrão amostral para estimar a variância/desvio-padrão da população, o somatório dos
quadrados dos desvios deve ser dividido por n-1 em vez de n.

Variância Amostral Corrigida Desvio-padrão Amostral Corrigido

n n

 (xi- X ) 2
 (xi- X ) 2

s '2 = i=1
s' = i=1
n-1 n-1

xi - Observações individuais xi - Observações individuais

X - Média amostral X - Média amostral

n - Dimensão da amostra n - Dimensão da amostra

Grupo de Controlo e Gestão G G


C

DISTRIBUIÇÕES TEÓRICAS

Função Probabilidade de Distribuição Pinto e Curto (2010)

Função probabilidade de distribuição é uma fórmula matemática que relaciona os valores de uma característica com a sua probabilidade
de ocorrência na população. O conjunto destas probabilidades designa-se probabilidade de distribuição.

A curva de distribuição encontra-se relacionada com a frequência de distribuição e o respectivo histograma. Quando a amostra se
torna cada vez maior e o comprimento de cada classe cada vez menor, o histograma aproxima-se de uma curva suave.

A forma do histograma da amostra de dados fornece alguma indicação da probabilidade de distribuição da população.

Distribuições Teóricas (exemplos)

• Distribuição Normal • Distribuição t-student • Distribuição de Poisson

• Distribuição Exponencial • Distribuição Weibull • Distribuição Binomial

Grupo de Controlo e Gestão G G


C

14
DISTRIBUIÇÕES TEÓRICAS

Distribuição Normal Pinto e Curto (2010)

Diversos fenómenos da vida real obedecem, ou, pelo menos, aproximam-se, da distribuição normal.

A distribuição normal tem dois parâmetros que a caracterizam, a média (μ) e o desvio-padrão (σ).

A representação gráfica da distribuição normal corresponde a uma curva em forma de sino, simétrica em torno da média, μ.

X - Variável aleatória contínua com distribuição normal


(pode assumir qualquer valor real)

X  N (; )

Função Densidade de Probabilidade

 x  2
1 
f (x )  e 2 2
, x  ;  
 2

μ X

Grupo de Controlo e Gestão G G


C

DISTRIBUIÇÕES TEÓRICAS

Distribuição Normal
X  N (; )

P (    X    )  0.6826  68.26 %

P (  2  X    2  )  0.9546  95.46 %

P (  3  X    3 )  0.9973  99.73 %

μ - 3σ μ - 2σ μ-σ μ μ+σ μ + 2σ μ + 3σ X
68.26 %

95.46 %

99.73 %

A área total abaixo da curva, correspondente à probabilidade da variável X tomar qualquer valor real, é igual à unidade.

Grupo de Controlo e Gestão G G


C

15
DISTRIBUIÇÕES TEÓRICAS

Distribuição Normal

X  N (; ) Z  N ( 0; 1)
X
Z

-3 -2 -1 0 1 2 3

X - Variável aleatória contínua com distribuição normal Z - Variável estandardizada (reduzida, normal-padrão)

(distribuição normal de média zero e desvio padrão igual à unidade)

Grupo de Controlo e Gestão G G


C

DISTRIBUIÇÕES TEÓRICAS

Distribuição Normal
Z  N ( 0; 1) P ( 1  X  1)  0.6826  68.26 %

P ( 2  X  2 )  0.9546  95.46 %

P (  3  X  3)  0.9973  99.73 %

-3 -2 -1 0 1 2 3 X
68.26 %

95.46 %

99.73 %

É a partir das tabelas da distribuição normal estandardizada que se calculam as probabilidades pretendidas para uma qualquer variável aleatória
com distribuição normal.

Grupo de Controlo e Gestão G G


C

16
INFERÊNCIA ESTATÍSTICA

Estimação de Parâmetros Pinto e Curto (2010)

Estimação é o processo de analisar o resultado de uma amostra para prever o valor correspondente do parâmetro da população.

A dificuldade em saber se a estimativa está ou não próxima do verdadeiro valor do parâmetro é uma contrariedade na estimação de
parâmetros.

Estimação Pontual - Valor único usado para estimar o parâmetro da população.

Estimação por Intervalos - Gama de valores que inclui o verdadeiro valor do parâmetro da população.

Do ponto de vista da inferência estatística, o risco de falhar a estimação de um parâmetro é muito maior numa estimativa pontual
do que numa estimativa por intervalos.

O nível de confiança (λ) corresponde à probabilidade do valor real do parâmetro se encontrar no interior do intervalo de confiança.

Grupo de Controlo e Gestão G G


C

INFERÊNCIA ESTATÍSTICA

Estimação de Parâmetros

Característica populacional - Média (parâmetro a estimar)

População Normal; Desvio-padrão populacional conhecido

   X X - média amostral


X  N  ;   N  0 ;1
 n 
σ - desvio-padrão populacional
n
n - dimensão da amostra

    λ - nível de confiança
I    X  z1  ; X  z1  
 2 n 2 n
Z - variável estandardizada

Grupo de Controlo e Gestão G G


C

17
INFERÊNCIA ESTATÍSTICA

Estimação de Parâmetros
Se a amostra for de grandes dimensões, a aplicação
do teorema do limite central torna-se possível,
podendo assumir-se:
Característica populacional - Média (parâmetro a estimar)
 S' S' 
X 
 N  0 ;1  I    X  z 1 ; X  z 1  
S'  2 n 2 n
População Normal; Desvio-padrão populacional desconhecido n

X
t  n  1
S' X - média amostral
n
S’ - desvio-padrão amostral corrigido

n - dimensão da amostra
 S' S' 
I    X  t 1 ; X  t 1   λ - nível de confiança
 2 n 2 n
t - coeficiente da distrib. t-student, com n-1 graus de liberdade

Grupo de Controlo e Gestão G G


C

INFERÊNCIA ESTATÍSTICA

Estimação de Parâmetros

   
I    X  z 1  ; X  z 1  
 2 n 2 n
Dimensão da Amostra

Erro amostral encontra-se directamente relacionado com a amplitude do intervalo de confiança

Nível de Confiança grau de certeza de que o valor real se encontra dentro do intervalo estimado

Aumentar o nível de confiança sem aumentar o erro amostral


Aumentar dimensão da amostra (n)
Diminuir o erro amostral sem diminuir o nível de confiança

Grupo de Controlo e Gestão G G


C

18

You might also like