You are on page 1of 11

19/09/2012

1
ANLISE DADOS ENTRADA DA
SIMULAO
William R. dos Santos: rsantos.w@gmail.com
William dos Santos rsantos.w@gmail.com
Anlise dados entrada/sada da simulao
Objetivos da aula:
Dados de entrada: Modelagem de dados;
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Modelagem de dados (CHWIF & MEDINA, 2010):
Coleta: amostragem
Tratamento: outlier, correlao
Inferncia: testes de aderncia
William dos Santos rsantos.w@gmail.com
Esquema modelagem de dados
19/09/2012
2
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Coleta: determinao da varivel de estudo
Amostragem: entre 100 e 200 observaes
Anlise crtica:
Coletar dados na ordem em que ocorre o fenmeno;
Dados
Se existe alguma suspeita de que os dados mudam em
funo do horrio ou do dia da coleta, a coleta deve ser
refeita para outros horrios e dias. Na modelagem de
dados, vale a regra: toda suspeita deve ser comprovada ou
descartada estatisticamente.
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Tratamento: Outlier
Situaes atpicas do fenmeno observado;
Diviso dos dados em Quartis
Identificar dados discrepantes
William dos Santos rsantos.w@gmail.com
Exemplo 2.1: Filas nos Caixas do
Supermercado
Um gerente de supermercado est preocupado com as
filas formadas nos caixas de pagamento durante um
dos turnos de operao. Quais seriam as variveis de
estudo para coleta de dados? (S) ou (N).
( ) O nmero de prateleiras no supermercado
( ) Os tempos de atendimento nos caixas
( ) O nmero de clientes em fila
( ) O tempo de permanncia dos clientes no supermercado
( ) Os tempos entre chegadas sucessivas de clientes nos caixas de
pagamento
N
S
N
N
S
resultado!!
William dos Santos rsantos.w@gmail.com
Exemplo 2.1: coleta de dados
Intervalo entre chegadas de pessoas nos caixas do supermercado (100
medidas). Tempos em minutos:
11 5 2 0 9 9 1 5 5 1
1 3 3 3 7 4 12 8 7 5
5 2 6 1 11 1 2 4 4 2
2 1 3 9 0 10 3 3 4 5
1 5 18 4 22 8 3 0 4 4
8 9 2 3 12 1 3 1 11 9
7 5 14 7 7 28 1 3 3 4
2 11 13 2 0 1 6 12 8 12
15 0 6 7 19 1 1 9 12 4
1 5 3 17 10 15 43 2 9 11
6 1 13 13 19 10 9 20 17 24
19 2 27 5 20 5 10 8 728 8
2 3 1 1 4 3 6 13 12 12
10 9 1 1 3 9 9 4 6 3
0 3 6 3 27 3 18 4 4 7
6 0 2 2 8 4 5 1 3 1
4 18 1 0 16 20 2 2 9 3
2 12 28 0 7 3 18 12 2 1
3 2 8 3 19 12 5 4 0 3
6 0 5 0 3 7 0 8 5 8
Fonte: Chwif & Medina (2010)
19/09/2012
3
William dos Santos rsantos.w@gmail.com
Medidas de posio
Mdia 10,44
Mediana 5
Moda 3
Mnimo 0
Mximo 728
Medidas de disperso
Amplitude 728
Desvio padro 51,42
Varincia da amostra 2.643,81
Coeficiente de Variao 493%
Coeficiente Assimetria 13,80
O 728 um outlier?
Exemplo 2.1: Medidas de posio e
disperso
William dos Santos rsantos.w@gmail.com
Erro na coleta de dados. Este tipo de outlier o mais comum, principalmente
quando o levantamento de dados feito por meio manual.
Eventos Raros. Nada impede que situaes totalmente atpicas ocorram na
nossa coleta de dados. Alguns exemplos:
Um dia de temperatura negativa no vero da cidade do Rio de Janeiro;
Um tempo de execuo de um operador ser muito curto em relao aos
melhores desempenhos obtidos naquela tarefa;
Um tempo de viagem de um caminho de entregas na cidade de So Paulo,
durante o horrio de rush, ser muito menor do que fora deste horrio.
Outliers ou Valores Discrepantes
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Passos para anlise de outlier:
Ordenar os dados em ordem crescente
Dividir em 4 partes
Calcular a amplitude interquartil (A): A =
3

1
Outlier extremo, valores:
Abaixo de
1
SA
Acima de
3
+ SA
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Anlise de outlier:
Dados brutos
mdia 10,4
desvio padro 51,4
varincia 2643,81
mximo 728
mnimo 0
amplitude 728
n 200
Dados sem outlier
mdia 6,8
desvio padro 6,6
varincia 43,60
mximo 43
mnimo 0
amplitude 43
n 199
19/09/2012
4
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Tratamento: correlao
Verificar se os valores da amostra so independentes e
identicamente distribudos (i.d.d)
Identificar possveis curvas de aprendizado
William dos Santos rsantos.w@gmail.com
0
10
20
30
40
50
0 10 20 30 40 50
Observao
k
Obse rvao
k +1
Diagrama de disperso dos tempos de
atendimento do exemplo de supermercado,
mostrando que no h correlao entre as
observaes da amostra.
Anlise de correlao
William dos Santos rsantos.w@gmail.com
10
12
14
16
18
20
10 12 14 16 18 20
Observao
k
Observao
k +1
Diagrama de disperso de um exemplo
hipottico em que existe correlao
entre os dados que compem a amostra.
Anlise de correlao
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Correlao: Passos
Dados na ordem em que foram coletados
Grfico de disperso (x
n-1
,x
n
)
19/09/2012
5
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Tratamento: Inferncia
Inferncia: identificar a distribuio de probabilidade que
representa o fenmeno
Construo de histograma
Testes de aderncia
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Construo de histograma (regra de Sturges)
Definir o nmero de classes (K):
Definir o tamanho do intervalo (h):
Construir tabela de frequncias
Construir o histograma
n K
10
log 3 , 3 1+ =
K
Amplitude
h =
William dos Santos rsantos.w@gmail.com
Qual o melhor modelo probabilstico ou distribuio
estatstica que pode representar a amostra coletada?
Histograma h=4.8
0
20
40
60
80
100
120
4.8 14.3 23.9 33.4 43
Bloco
Freqncia
x
f (x )
1/
x
f ( x )

x
f (x )
a b m
x
f (x )
=1 =1
=1 =0,5
Exponencial?
Normal?
Triangular?
Lognormal?
Exemplo 2.1: Inferncia
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Exponencial: x = c
-\x
parmetro (1/ mdia) = 6,83
x = u,146c
-0,146x
0
20
40
60
80
100
120
4,8 14,3 23,9 33,4 43
Freqncia
Histograma h=4.8
19/09/2012
6
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Testes de aderncia:
Verificar estatisticamente se os dados aderem a
distribuio estatstica
Teste o qui-quadrado
Teste Kolmogorov-Smirnov
Confirmar ou rejeitar a hiptese
H
0
: o modelo adequado para representar a distribuio da
populao.
H
a
: o modelo no adequado para representar a distribuio da
populao
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Teste do qui-quadrado
Baseado na diferena entre: as frequncias das classes
observadas e das frequncias tericas (a partir do modelo
escolhido)
E
k
=
0
k-
1
k
2
1
k
K=1,2,...,K
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Passos para teste do qui-quadrado
1) Calcular a probabilidade de ocorrncia de cada classe (p
k
)
2) Calcular a frequncia terica (T
k
)
3) Calcular a diferena (E
k
)
p
k
= ] c
-\x
b
u
Jx = c
-\b
+ c
-\u
K=1,2,...,K
I
k
= n totol Jc obscr:ocs p
k
K=1,2,...,K
E
k
=
0k-1k
2
1k
K=1,2,...,K
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Passos para teste do qui-quadrado
4) Somatria dos E
k
5) Anlise do teste:
Se E E
crtico
rejeita-se H
0
Se E E
crtico
aceita-se H
0
19/09/2012
7
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Teste do Kolgomorov-Smirnov (KS)
Compara a funo acumulada do modelo terico (F) com a
funo probabilidade observada (S)
= max F x S(x)
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Passos para o teste KS
1) Calcular os dados observados
2) Calcular a probabilidade acumulada modelo terico
3) Calcular a diferena mxima:
S x =
n c:cntos x
totol Jc :olorcs obscr:oJos
F x = 1 c
-0,146x
= max
csq
,
d
William dos Santos rsantos.w@gmail.com
Anlise dados de entrada para simulao
Passos para o teste KS
4) Anlise do teste
Se D D
crtico
rejeita-se H
0
Se D D
crtico
aceita-se H
0
William dos Santos rsantos.w@gmail.com
Valor Critrio
p-value<0,01
Evidncia forte contra a hiptese de
aderncia
0,01p-value<0,05
Evidncia moderada contra a hiptese de
aderncia
0,05p-value<0,10
Evidncia potencial contra a hiptese de
aderncia
0,10p-value
Evidncia fraca ou inexistente contra a
hiptese de aderncia
P-value
Parmetro usual nos softwares de estatstica. Para o
teste do qui-quadrado no Excel, utilizar:
19/09/2012
8
William dos Santos rsantos.w@gmail.com
Resumo de distribuies de probabilidade
Distribuio Parmetros Caractersticas Aplicabilidade
Exponencial Mdia
Varincia alta
Cauda para direita
Grande variabilidade dos valores
Independncia entre um valor e outro
Muitos valores baixos e poucos valores altos
Utilizada para representar o tempo entre chegadas sucessivas e o
tempo entre falhas sucessivas
Triangular
Menor valor,
moda e maior
valor
Simtrica ou no
Quando se conhece ou se tem um bom chute sobre a moda (valor
que mais ocorre), o menor valor e o maior valor que podem ocorrer
Normal
Mdia e desvio-
padro
Simtrica
Forma de sino
Variabilidade controlada
pelo desvio-padro
Quando a probabilidade de ocorrncia de valores acima da mdia a
mesma que valores abaixo da mdia
Quando o tempo de um processo pode ser considerado a soma de
diversos tempos de sub-processos
Processos manuais
Uniforme
Maior valor e
menor valor
Todos os valores no
intervalo so igualmente
provveis de ocorrer
Quando no se tem nenhuma informao sobre o processo ou apenas
os valores limites (simulao do pior caso)
Discreta
Valores e
probabilidade de
ocorrncia destes
valores
Apenas assume os valores
fornecidos pelo analista
Utilizada para a escolha de parmetros das entidades (por exemplo:
em uma certa loja, 30% dos clientes realizam suas compras no balco e
70% nas prateleiras)
Quando se conhecem apenas valores intermedirios da distribuio
ou a porcentagem de ocorrncia de alguns valores discretos
Fonte: Chwif & Medina (2010)
ARENA INPUT ANALYZER
William R. dos Santos: rsantos.w@gmail.com
William dos Santos rsantos.w@gmail.com
Dados de Entrada
Em um modelo de simulao, so inseridos dados para que
ele represente compreciso o sistema em estudo. Alguns
dados tm valores bem determinados, como por exemplo,
distncias, nmero de mquinas disponveis e outros.
Existem aqueles que so indeterminados, normalmente os
que envolvemtempo, pois os processos no so exatos,
podendo ter variaes em torno de um valor mdio. Este
valor mdio, normalmente, utilizado em simulaes
estticas. Porm, em uma simulao dinmica temos a
possibilidade de inserir esta variao no modelo atravs de
distribuies estatsticas.
O ARENA possui Input Analyzer, que trata dos dados de
entrada de forma automtica.
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
Intervalo entre chegadas de pessoas nos caixas do supermercado (100
medidas). Tempos em minutos:
11 5 2 0 9 9 1 5 5 1
1 3 3 3 7 4 12 8 7 5
5 2 6 1 11 1 2 4 4 2
2 1 3 9 0 10 3 3 4 5
1 5 18 4 22 8 3 0 4 4
8 9 2 3 12 1 3 1 11 9
7 5 14 7 7 28 1 3 3 4
2 11 13 2 0 1 6 12 8 12
15 0 6 7 19 1 1 9 12 4
1 5 3 17 10 15 43 2 9 11
6 1 13 13 19 10 9 20 17 24
19 2 27 5 20 5 10 8 728 8
2 3 1 1 4 3 6 13 12 12
10 9 1 1 3 9 9 4 6 3
0 3 6 3 27 3 18 4 4 7
6 0 2 2 8 4 5 1 3 1
4 18 1 0 16 20 2 2 9 3
2 12 28 0 7 3 18 12 2 1
3 2 8 3 19 12 5 4 0 3
6 0 5 0 3 7 0 8 5 8
19/09/2012
9
William dos Santos rsantos.w@gmail.com
Copiar os dados sem outlier para
bloco de notas
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
No Input Analyzer, escolha o menu File (Arquivo), New (Novo):
Uma janela ser aberta e agora devem ser inseridos os dados.
Exemplo 2.1 no Input Analyzer
19/09/2012
10
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
File => Data File => Use Existing...
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
Options => Data Fit... => Desmarcar a opo Auto Data Translation
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
Fit => Fit All
O Input Analyzer analisa
aderncia com todas as curvas
disponveis
19/09/2012
11
William dos Santos rsantos.w@gmail.com
Exemplo 2.1 no Input Analyzer
ANLISE DADOS ENTRADA DA
SIMULAO
William R. dos Santos: rsantos.w@gmail.com