You are on page 1of 11

19/09/2012

1
ANÁLISE DADOS ENTRADA DA
SIMULAÇÃO
William R. dos Santos: rsantos.w@gmail.com
William dos Santos rsantos.w@gmail.com
Análise dados entrada/saída da simulação
• Objetivos da aula:
– Dados de entrada: Modelagem de dados;
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Modelagem de dados (CHWIF & MEDINA, 2010):
– Coleta: amostragem
– Tratamento: outlier, correlação
– Inferência: testes de aderência
William dos Santos rsantos.w@gmail.com
Esquema modelagem de dados
19/09/2012
2
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Coleta: determinação da variável de estudo
– Amostragem: entre 100 e 200 observações
– Análise crítica:
• Coletar dados na ordem em que ocorre o fenômeno;
• Dados
– Se existe alguma suspeita de que os dados mudam em
função do horário ou do dia da coleta, a coleta deve ser
refeita para outros horários e dias. Na modelagem de
dados, vale a regra: toda suspeita deve ser comprovada ou
descartada estatisticamente.
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Tratamento: Outlier
– Situações atípicas do fenômeno observado;
– Divisão dos dados em Quartis
– Identificar dados discrepantes
William dos Santos rsantos.w@gmail.com
Exemplo 2.1: Filas nos Caixas do
Supermercado
Um gerente de supermercado está preocupado com as
filas formadas nos caixas de pagamento durante um
dos turnos de operação. Quais seriam as variáveis de
estudo para coleta de dados? (S) ou (N).
( ) O número de prateleiras no supermercado
( ) Os tempos de atendimento nos caixas
( ) O número de clientes em fila
( ) O tempo de permanência dos clientes no supermercado
( ) Os tempos entre chegadas sucessivas de clientes nos caixas de
pagamento
N
S
N
N
S
É resultado!!
William dos Santos rsantos.w@gmail.com
Exemplo 2.1: coleta de dados
• Intervalo entre chegadas de pessoas nos caixas do supermercado (100
medidas). Tempos em minutos:
11 5 2 0 9 9 1 5 5 1
1 3 3 3 7 4 12 8 7 5
5 2 6 1 11 1 2 4 4 2
2 1 3 9 0 10 3 3 4 5
1 5 18 4 22 8 3 0 4 4
8 9 2 3 12 1 3 1 11 9
7 5 14 7 7 28 1 3 3 4
2 11 13 2 0 1 6 12 8 12
15 0 6 7 19 1 1 9 12 4
1 5 3 17 10 15 43 2 9 11
6 1 13 13 19 10 9 20 17 24
19 2 27 5 20 5 10 8 728 8
2 3 1 1 4 3 6 13 12 12
10 9 1 1 3 9 9 4 6 3
0 3 6 3 27 3 18 4 4 7
6 0 2 2 8 4 5 1 3 1
4 18 1 0 16 20 2 2 9 3
2 12 28 0 7 3 18 12 2 1
3 2 8 3 19 12 5 4 0 3
6 0 5 0 3 7 0 8 5 8
Fonte: Chwif & Medina (2010)
19/09/2012
3
William dos Santos rsantos.w@gmail.com
Medidas de posição
Média 10,44
Mediana 5
Moda 3
Mínimo 0
Máximo 728
Medidas de dispersão
Amplitude 728
Desvio padrão 51,42
Variância da amostra 2.643,81
Coeficiente de Variação 493%
Coeficiente Assimetria 13,80
O 728 é um outlier?
Exemplo 2.1: Medidas de posição e
dispersão
William dos Santos rsantos.w@gmail.com
Erro na coleta de dados. Este tipo de outlier é o mais comum, principalmente
quando o levantamento de dados é feito por meio manual.
Eventos Raros. Nada impede que situações totalmente atípicas ocorram na
nossa coleta de dados. Alguns exemplos:
Um dia de temperatura negativa no verão da cidade do Rio de Janeiro;
Um tempo de execução de um operador ser muito curto em relação aos
melhores desempenhos obtidos naquela tarefa;
Um tempo de viagem de um caminhão de entregas na cidade de São Paulo,
durante o horário de rush, ser muito menor do que fora deste horário.
Outliers ou Valores Discrepantes
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Passos para análise de outlier:
– Ordenar os dados em ordem crescente
– Dividir em 4 partes
– Calcular a amplitude interquartil (A): A = µ
3
−µ
1
– Outlier extremo, valores:
• Abaixo de µ
1
− SA
• Acima de µ
3
+ SA
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Análise de outlier:
Dados brutos
média 10,4
desvio padrão 51,4
variância 2643,81
máximo 728
mínimo 0
amplitude 728
n 200
Dados sem outlier
média 6,8
desvio padrão 6,6
variância 43,60
máximo 43
mínimo 0
amplitude 43
n 199
19/09/2012
4
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Tratamento: correlação
– Verificar se os valores da amostra são independentes e
identicamente distribuídos (i.d.d)
– Identificar possíveis curvas de aprendizado
William dos Santos rsantos.w@gmail.com
0
10
20
30
40
50
0 10 20 30 40 50
Observação
k
Obse rvação
k +1
Diagrama de dispersão dos tempos de
atendimento do exemplo de supermercado,
mostrando que não há correlação entre as
observações da amostra.
Análise de correlação
William dos Santos rsantos.w@gmail.com
10
12
14
16
18
20
10 12 14 16 18 20
Observação
k
Observação
k +1
Diagrama de dispersão de um exemplo
hipotético em que existe correlação
entre os dados que compõem a amostra.
Análise de correlação
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Correlação: Passos
– Dados na ordem em que foram coletados
– Gráfico de dispersão (x
n-1
,x
n
)
19/09/2012
5
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Tratamento: Inferência
– Inferência: identificar a distribuição de probabilidade que
representa o fenômeno
• Construção de histograma
• Testes de aderência
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Construção de histograma (regra de Sturges)
– Definir o número de classes (K):
– Definir o tamanho do intervalo (h):
– Construir tabela de frequências
– Construir o histograma
n K
10
log 3 , 3 1+ =
K
Amplitude
h =
William dos Santos rsantos.w@gmail.com
Qual o melhor modelo probabilístico ou distribuição
estatística que pode representar a amostra coletada?
Histograma h=4.8
0
20
40
60
80
100
120
4.8 14.3 23.9 33.4 43
Bloco
Freqüência
x
f (x )
1/λ
x
f ( x )
µ
x
f (x )
a b m
x
f (x )
µ =1 σ=1
µ =1 σ=0,5
Exponencial?
Normal?
Triangular?
Lognormal?
Exemplo 2.1: Inferência
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Exponencial: ¡ x = λc
-\x
– parâmetro (1/λ – média) = 6,83
¡ x = u,146c
-0,146x
0
20
40
60
80
100
120
4,8 14,3 23,9 33,4 43
Freqüência
Histograma h=4.8
19/09/2012
6
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Testes de aderência:
– Verificar estatisticamente se os dados aderem a
distribuição estatística
• Teste o qui-quadrado
• Teste Kolmogorov-Smirnov
– Confirmar ou rejeitar a hipótese
• H
0
: o modelo é adequado para representar a distribuição da
população.
• H
a
: o modelo não é adequado para representar a distribuição da
população
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Teste do qui-quadrado
– Baseado na diferença entre: as frequências das classes
observadas e das frequências teóricas (a partir do modelo
escolhido)
E
k
=
0
k-
1
k
2
1
k
K=1,2,...,K
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Passos para teste do qui-quadrado
1) Calcular a probabilidade de ocorrência de cada classe (p
k
)
2) Calcular a frequência teórica (T
k
)
3) Calcular a diferença (E
k
)
p
k
= ] λc
-\x
b
u
Jx = −c
-\b
+ c
-\u
K=1,2,...,K
I
k
= n° totol Jc obscr:oçõcs × p
k
K=1,2,...,K
E
k
=
0k-1k
2
1k
K=1,2,...,K
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Passos para teste do qui-quadrado
4) Somatória dos E
k
5) Análise do teste:
Se E ˃ E
crítico
– rejeita-se H
0
Se E ≤ E
crítico
– aceita-se H
0
19/09/2012
7
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Teste do Kolgomorov-Smirnov (KS)
– Compara a função acumulada do modelo teórico (F) com a
função probabilidade observada (S)
Ð = max F x −S(x)
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Passos para o teste KS
1) Calcular os dados observados
2) Calcular a probabilidade acumulada modelo teórico
3) Calcular a diferença máxima:
S x =
n° c:cntos ≤ x
totol Jc :olorcs obscr:oJos
F x = 1 −c
-0,146x
Ð = max Ð
csq
, Ð
dì¡
William dos Santos rsantos.w@gmail.com
Análise dados de entrada para simulação
• Passos para o teste KS
4) Análise do teste
Se D ˃ D
crítico
– rejeita-se H
0
Se D ≤ D
crítico
– aceita-se H
0
William dos Santos rsantos.w@gmail.com
Valor Critério
p-value<0,01
Evidência forte contra a hipótese de
aderência
0,01≤p-value<0,05
Evidência moderada contra a hipótese de
aderência
0,05≤p-value<0,10
Evidência potencial contra a hipótese de
aderência
0,10≤p-value
Evidência fraca ou inexistente contra a
hipótese de aderência
P-value
• Parâmetro usual nos softwares de estatística. Para o
teste do qui-quadrado no Excel, utilizar:
19/09/2012
8
William dos Santos rsantos.w@gmail.com
Resumo de distribuições de probabilidade
Distribuição Parâmetros Características Aplicabilidade
Exponencial Média
Variância alta
Cauda para direita
Grande variabilidade dos valores
Independência entre um valor e outro
Muitos valores baixos e poucos valores altos
Utilizada para representar o tempo entre chegadas sucessivas e o
tempo entre falhas sucessivas
Triangular
Menor valor,
moda e maior
valor
Simétrica ou não
Quando se conhece ou se tem um bom “chute” sobre a moda (valor
que mais ocorre), o menor valor e o maior valor que podem ocorrer
Normal
Média e desvio-
padrão
Simétrica
Forma de sino
Variabilidade controlada
pelo desvio-padrão
Quando a probabilidade de ocorrência de valores acima da média é a
mesma que valores abaixo da média
Quando o tempo de um processo pode ser considerado a soma de
diversos tempos de sub-processos
Processos manuais
Uniforme
Maior valor e
menor valor
Todos os valores no
intervalo são igualmente
prováveis de ocorrer
Quando não se tem nenhuma informação sobre o processo ou apenas
os valores limites (simulação do pior caso)
Discreta
Valores e
probabilidade de
ocorrência destes
valores
Apenas assume os valores
fornecidos pelo analista
Utilizada para a escolha de parâmetros das entidades (por exemplo:
em uma certa loja, 30% dos clientes realizam suas compras no balcão e
70% nas prateleiras)
Quando se conhecem apenas “valores intermediários” da distribuição
ou a porcentagem de ocorrência de alguns valores discretos
Fonte: Chwif & Medina (2010)
ARENA – INPUT ANALYZER
William R. dos Santos: rsantos.w@gmail.com
William dos Santos rsantos.w@gmail.com
Dados de Entrada
• Em um modelo de simulação, são inseridos dados para que
ele represente comprecisão o sistema em estudo. Alguns
dados têm valores bem determinados, como por exemplo,
distâncias, número de máquinas disponíveis e outros.
• Existem aqueles que são indeterminados, normalmente os
que envolvemtempo, pois os processos não são exatos,
podendo ter variações em torno de um valor médio. Este
valor médio, normalmente, é utilizado em simulações
estáticas. Porém, em uma simulação dinâmica temos a
possibilidade de inserir esta variação no modelo através de
distribuições estatísticas.
• O ARENA possui Input Analyzer, que trata dos dados de
entrada de forma automática.
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
• Intervalo entre chegadas de pessoas nos caixas do supermercado (100
medidas). Tempos em minutos:
11 5 2 0 9 9 1 5 5 1
1 3 3 3 7 4 12 8 7 5
5 2 6 1 11 1 2 4 4 2
2 1 3 9 0 10 3 3 4 5
1 5 18 4 22 8 3 0 4 4
8 9 2 3 12 1 3 1 11 9
7 5 14 7 7 28 1 3 3 4
2 11 13 2 0 1 6 12 8 12
15 0 6 7 19 1 1 9 12 4
1 5 3 17 10 15 43 2 9 11
6 1 13 13 19 10 9 20 17 24
19 2 27 5 20 5 10 8 728 8
2 3 1 1 4 3 6 13 12 12
10 9 1 1 3 9 9 4 6 3
0 3 6 3 27 3 18 4 4 7
6 0 2 2 8 4 5 1 3 1
4 18 1 0 16 20 2 2 9 3
2 12 28 0 7 3 18 12 2 1
3 2 8 3 19 12 5 4 0 3
6 0 5 0 3 7 0 8 5 8
19/09/2012
9
William dos Santos rsantos.w@gmail.com
Copiar os dados sem outlier para
bloco de notas
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
No Input Analyzer, escolha o menu File (Arquivo), New (Novo):
Uma janela será aberta e agora devem ser inseridos os dados.
Exemplo 2.1 no Input Analyzer
19/09/2012
10
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
File => Data File => Use Existing...
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
Options => Data Fit... => Desmarcar a opção Auto Data Translation
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
Fit => Fit All
O Input Analyzer analisa
aderência com todas as curvas
disponíveis
19/09/2012
11
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
ANÁLISE DADOS ENTRADA DA
SIMULAÇÃO
William R. dos Santos: rsantos.w@gmail.com