You are on page 1of 138

UNIVERSIDADE FEDERAL DO PARAN

MARINA VARGAS REIS DE PAULA GONALVES


SIMULAO DA MOVIMENTAO DE PEDESTRES ASSUMINDO
VARIVEIS PSICOCOMPORTAMENTAIS
CURITIBA
2014
MARINA VARGAS REIS DE PAULA GONALVES
SIMULAO DA MOVIMENTAO DE PEDESTRES ASSUMINDO
VARIVEIS PSICOCOMPORTAMENTAIS
Tese apresentada ao Programa de Ps-Graduao em
Mtodos Numricos em Engenharia, rea de Concen-
trao em Programao Matemtica, do Departamento
de Matemtica e Departamento de Engenharia de Pro-
duo, Setor de Cincias Exatas e do Departamento de
Construo Civil, Setor de Tecnologia, Universidade Fe-
deral do Paran, como parte das exigncias para a ob-
teno do ttulo de Doutor em Cincias.
Orientadora: Profa. Dra. Liliana Madalena Gramani
Coorientador: Prof. Dr. Marco Andr Argenta
Coorientador: Prof. Dr. Eloy Kaviski
CURITIBA
2014

















G635s


Gonalves, Marina Vargas Reis de Paula
Simulao da movimentao de pedestres assumindo variveis
psicocomportamentais / Marina Vargas reis de Paula Gonalves. Curitiba,
2014.
137f. : il. color. ; 30 cm.

Tese (doutorado) - Universidade Federal do Paran, Setor de Cincias
Exatas, Programa de Ps-graduao em Mtodos Numricos em
Engenharia, 2014.

Orientadora: Liliana Madalena Gramani -- Co-orientador: Marco Andr
Argenta -- Co-orientador: Eloy Kaviski.
Bibliografia: p. 131-137.

1. Trfego de Pedestres. 2. Variveis Psicocomportamentais. 3.
Inteligncia Artificial. 4 Modelagem Computacional I. Universidade Federal
do Paran. II. Gramani, Liliana Madalena. III. Argenta, Marco Andr. IV.
Kaviski, Eloy. V. Ttulo.

CDD: 511.8



Ao meu marido Marco e as nossa lhas gmeas Manuela e Laura.
AGRADECIMENTOS
Aos meus pais, Jlio e Ana Luiza, por todo o apoio sempre e incondicional aos
meus estudos e nas minhas decises de vida.
A minha irm Marcela, por podermos compartilhar experincias e com isso apren-
der sempre mais.
Ao meu marido e co-orientador, Prof. Dr. Marco Andr Argenta, pois sem seu
apoio nada teria sido realizado. Foi a minha inspirao.
As minhas lhas. Por seus sorrisos e beijinhos nas horas mais difceis.
Aos meus sogros, Jeime e Elair, por me ajudarem tantas vezes em casa, com as
meninas, quando eu precisei estudar.
Aos meus amigos Tati, Vanessinha, Guilherme, Fbio, Maiko, Lu, Vnia, Josu,
Sandro e, me perdoem os que esqueci, por me fornecerem tantos bons momentos de
discusso, de relaxamento e muitos sorrisos durante esses quatro anos.
A Profa. Dra. Liliana M. Gramani, por me orientar desde o incio da minha vida
como pesquisadora.
No poderia deixar de fora nossa eterna secretria do PPGMNE, Maristela Bandil.
Minha querida amiga.
Agradeo a CAPES pelo apoio nanceiro e a todos os funcionrios do CESEC, da
Biblioteca e at da Cantina pela ajuda, pelo espao sempre limpo, pelos cafezinhos,
em todas as ocasies.
Vrias pessoas me auxiliaram neste trabalho. A todos s posso dizer: Muito Obri-
gada!
Se enxerguei mais longe, foi por me erguer sobre os ombros de
gigantes.
Sir Isaac Newton
RESUMO
O objetivo deste trabalho o desenvolvimento de um modelo fsico-matemtico com-
putacional utilizando inteligncia articial para simulao e anlise da movimentao
de pedestres, em ambientes que podem gerar comportamentos desordenados devido
a altos nveis de estresse. Aliando Inteligncia Articial, que inclui raciocnio proba-
bilstico, aprendizagem de mquina e conceitos de robtica possvel simular o des-
locamento de pedestres assumindo variveis psicocomportamentais para que esses
agentes possam distinguir situaes virtuais impostas pelo ambiente e tomar deci-
ses. Estudos de uxo de pedestres foram empreendidos, em especial nas ltimas
trs dcadas. Entretanto, a existncia de fatores psicocomportamentais transforma
esse tipo de sistema em algo extremamente complexo. Se o organismo de um pe-
destre submetido a situaes desconfortveis ou de impotncia ocorre um aumento
na ansiedade que gera estresse. Esse estresse produz uma cadeia de reaes que
podem variar de irritabilidade, desorientao e at pnico. Essa gama de variveis
pode alterar o uxo pedonal de forma signicativa e justamente esse o maior pro-
blema quando se procura um modelo de movimentao de pedestres. A modelagem
computacional viabilizada utilizando-se linguagem de programao Python, por ser
uma linguagem de alto nvel, otimizada para o programador ou seja, de fcil imple-
mentao e aprendizado, possui vrios ambientes integrados e portvel a todos os
sistemas operacionais, alm de ter mdulos para processamento grco. O entendi-
mento da movimentao de pedestres, tendo como foco principal seu comportamento,
permite expandir a anlise para ambientes mais complexos resultando em uma ferra-
menta de auxlio em situaes com multides em diferentes ambientes. Neste tra-
balho desenvolveu-se um modelo bidimensional com visualizao tridimensional de
um ambiente genrico, simulando-se agentes inteligentes desconfortveis, represen-
tativas de comportamentos psicolgicos humanos genricos, capazes de identicar
situaes e tomar decises. Comparaes com trabalhos j constantes na literatura
sobre uxo de pedestres ilustram as discusses.
Palavras-chave: Trfego de Pedestres. Variveis Psicocomportamentais. Inteligncia
Articial. Modelagem Computacional. Agentes BDI.
ABSTRACT
The aim of this work is to develop a physical-mathematical computational model using
articial intelligence to simulate and analyze the movement of pedestrians in environ-
ments that can generate disordered behaviors due to high stress levels. Combining
Articial Intelligence, which includes probabilistic reasoning, machine learning and ro-
botics concepts it is possible to simulate the movement of pedestrians coupled with
psycho-behavioral variables so that these agents can distinguish virtual situations im-
posed by the environment and make decisions. Pedestrian ow studies have been
undertaken, especially in the last three decades. However, the existence of psycho-
behavioral factors turns such system into something extremely complex. If the or-
ganism of the pedestrian is submitted to uncomfortable or powerlessness situations,
the anxiety that creates stress increases. This stress produces a chain of reactions
that can vary from irritability, disorientation and even panic. This variation can change
signicantly the pedestrian ow and this is the biggest problem when the aim is a repre-
sentative pedestrian movement model. Computer modeling is done using the Python
programming language, because it is a high-level language, optimized for program-
mer, ie, easy implementation and learning, has several built-in environments and is
portable to all operating systems, besides having modules for graphics processing.
Understanding the movement of pedestrians, focusing mainly on their behavior, al-
lows expanding the analysis to more complex environments resulting in an auxiliary
tool in situations with crowds in different environments. In this work we developed a
two-dimensional model with three-dimensional visualization of a generic environment,
simulating uncomfortable intelligent agents, representatives of a human generic psy-
chological behavior, able to identify situations and make decisions. Comparisons with
literature papers on pedestrian ow studies illustrate the discussions.
Key-words: Pedestrian Trafc; Psycho-behavioral variables, Articial Intelligence, Com-
puter Simulation.
LISTA DE FIGURAS
FIGURA 1 GRAFOS DIRIGIDOS ACCLICOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
FIGURA 2 CONSTRUO DA CURVA BZIER CBICA. . . . . . . . . . . . . . . . . . . . 51
FIGURA 3 RECURSO DE DE CASTELJAU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
FIGURA 4 TEM-SE QUE P
0
= B
0,0
, P
1
= B
1,0
, P
2
= B
2,0
E P
3
= B
3,0
. FONTE:
WIKIMEDIA.ORG. AUTOR: PHIL TREGONING, 2007. . . . . . . . . . . . . . . 57
FIGURA 5 COMPARAO ENTRE AS DIMENSES DE PEDESTRES E CI-
LINDROS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
FIGURA 6 REPRESENTAO DO CONE DE VISO GIRANDO PELO AMBI-
ENTE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
FIGURA 7 CONE DE REVOLUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
FIGURA 8 PONTO P EM XOY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
FIGURA 9 PLANO CARTESIANO COM PONTOS A, B E C. . . . . . . . . . . . . . . . . . 61
FIGURA 10 CENTROIDES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
FIGURA 11 COLISO ENTRE CILINDROS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
FIGURA 12 COLISO ENTRE PARALELEPPEDOS E CILINDROS. . . . . . . . . . . 62
FIGURA 13 CAMINHADA DE UM ROB DE ACORDO COM A SOLUO
DE UM PF. FONTE: SEQUENTIAL MONTE CARLO METHODS IN
PRACTICE, 2001. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
FIGURA 14 CAMINHADA DE UM ROB DE ACORDO COM A SOLUO DE
UM PF. FONTE: A PARTICLE FILTER TUTORIAL FOR MOBILE RO-
BOT LOCALIZATION, 2004. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
FIGURA 15 PORTAS FICTCIAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
FIGURA 16 ESCOLHA DOS PONTOS DE CONTROLE A PARTIR DO PF. . . . . 69
FIGURA 17 FLUXOGRAMA REPRESENTATIVO PARA UM AGENTE BDI SE-
GUNDOUMI-PLAN. ADAPTADODE RENS, FERREINE POEL (2009). 70
FIGURA 18 REPRESENTAO DE UM CILINDRO PELO VPYTHON. FONTE:
DOCUMENTAO DO VPYTHON. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
FIGURA 19 REPRESENTAO DE UMA CAIXA NO VPYTHON. FONTE: DO-
CUMENTAO DO VPYTHON. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
FIGURA 20 AGENTES ACOPLADOS A SEUS CONES DE VISO, FAZENDO
A DETECO DE OBSTCULOS PARA SUAS CAMINHADAS. . . . . . 76
FIGURA 21 REPRESENTAO DE UM CONE NO VPYTHON. FONTE: DO-
CUMENTAO DO VPYTHON. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
FIGURA 22 DETECO DE CONTATO ENTRE O CONE DE VISO E AS PA-
REDES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
FIGURA 23 RASTRODE ESFERAS. FONTE: DOCUMENTAODOVPYTHON. 78
FIGURA 24 PONTOS DE CONTROLE ALINHADOS NAS PORTAS. . . . . . . . . . . 80
FIGURA 25 HIPTESE DE DOIS AGENTES DE CADA PERSONALIDADE CON-
TIDOS NO AMBIENTE DE TESTES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
FIGURA 26 VISUALIZAES DO AMBIENTE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
FIGURA 27 CHOQUES ENTRE AGENTES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
FIGURA 28 DECISO DO AGENTE RACIONAL (SALA 2) AO ENTRAR NA
PORTA D. TEMPO: 3S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
FIGURA 29 DECISODOS AGENTES RACIONAIS (SALA 1 E 2) E DOS AGEN-
TES EMOTIVO, EXPERIMENTAL E CUSTDIA (SALA 2). TEMPO:
9S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
FIGURA 30 DECISES DOS AGENTES NO TEMPO: 13S. . . . . . . . . . . . . . . . . . . . 89
FIGURA 31 DECISO DOS AGENTES NO TEMPO: 15S. . . . . . . . . . . . . . . . . . . . . 90
FIGURA 32 DECISO DOS AGENTES NO TEMPO: 19S. . . . . . . . . . . . . . . . . . . . . 90
FIGURA 33 TEMPO DE EVACUAO DAS QUATRO PERSONALIDADES. . . . 91
FIGURA 34 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-
DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
FIGURA 35 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-
TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 93
FIGURA 36 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-
SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
FIGURA 37 DISTNCIAS MDIAS PERCORRIDAS E DESVIOPADRO, PARA
CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
FIGURA 38 AMBIENTE GERAL E POSIO INICIAL DOS AGENTES. . . . . . . . 96
FIGURA 39 AMBIENTE COMPOSTO APENAS POR AGENTES RACIONAIS. 96
FIGURA 40 AMBIENTE COMPOSTO APENAS POR AGENTES EXPERIMEN-
TAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
FIGURA 41 AMBIENTE COMPOSTO APENAS POR AGENTES CUSTDIAS. 98
FIGURA 42 AMBIENTE COMPOSTO APENAS POR AGENTES EMOTIVOS. . 99
FIGURA 43 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-
TES RACIONAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
FIGURA 44 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-
DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES
RACIONAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
FIGURA 45 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-
DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
FIGURA 46 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-
TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 103
FIGURA 47 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-
SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
FIGURA 48 DISTNCIAS MDIAS PERCORRIDAS E DESVIOPADRO, PARA
CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
FIGURA 49 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-
TES EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
FIGURA 50 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-
DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES
EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
FIGURA 51 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-
DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
FIGURA 52 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-
TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 108
FIGURA 53 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-
SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
FIGURA 54 DISTNCIAS MDIAS PERCORRIDAS E DESVIOPADRO, PARA
CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
FIGURA 55 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-
TES CUSTDIAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
FIGURA 56 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-
DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES
EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
FIGURA 57 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-
DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
FIGURA 58 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-
TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 113
FIGURA 59 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-
SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
FIGURA 60 DISTNCIAS MDIAS PERCORRIDAS E DESVIOPADRO, PARA
CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
FIGURA 61 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-
TES EMOTIVOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
FIGURA 62 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-
DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES
EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
FIGURA 63 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-
DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
FIGURA 64 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-
TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 118
FIGURA 65 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-
SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
FIGURA 66 DISTNCIAS MDIAS PERCORRIDAS E DESVIOPADRO, PARA
CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
FIGURA 67 MDIA DE TEMPO DE EVACUAO DE TODAS AS SEES
ANTERIORES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
FIGURA 68 PORTAS DE SADA MAIS UTILIZADAS POR CADA PERSONALI-
DADE LEVANDO EM CONSIDERAO TODAS AS SEES ANTE-
RIORES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
FIGURA 69 QUANTIDADE DO USO DE PORTAS POR PERSONALIDADE. . . 123
FIGURA 70 VALOR MDIO DAS DISTNCIAS PERCORRIDAS POR CADA
PERSONALIDADE EM TODAS AS SIMULAES REALIZADAS. . . 123
FIGURA 71 VALOR MDIODAS VELOCIDADES DE CADA PERSONALIDADE
EM TODAS AS SIMULAES REALIZADAS. . . . . . . . . . . . . . . . . . . . . . . 124
FIGURA 72 SIMULAO COM AGENTES SEM CUSTOS. . . . . . . . . . . . . . . . . . . . 125
LISTA DE SIGLAS
HCM Highway Capacity Manual
TRB Transportation Research Board
AI Articial Intelligence
MAS Multi-Agent System
BN Bayes Network
HMMs Hidden Markov Models
MDPs Markov Decision Processes
POMDPs Partially Observable Markov Decision Processes
PDF Probability Density Function
MLLS Maximum Likelihood Laplace Smoothing
MCMC Markov chain Monte Carlo
SIS Sequential Importance Sampling
PFs Particle Filters
BDI Belief, Desire, Intention
FOV Field of Vision
UFBA Universidade Federal da Bahia
SUMRIO
1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1.2 Objetivo Especco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2 JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3 CONTRIBUIES DA TESE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.4 ORGANIZAO DO TEXTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2 REVISO BIBLIOGRFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3 FUNDAMENTAO TERICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1 INTELIGNCIA ARTIFICIAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.1 Conceitos de Inteligncia Articial - AI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2 MODELOS PROBABILSTICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.1 Mtodos ocultos de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.2 Filtro de Partculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3 PROCESSO DE MARKOV PARCIALMENTE OBSERVVEL . . . . . . . . . . . . . . . . 36
3.3.1 Descrio Matemtica do Processo de Deciso de Markov Parcialmente Ob-
servvel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.4 AGENTE BASEADO EM CRENA, DESEJO E INTENO . . . . . . . . . . . . . . . . . 39
3.4.1 Agentes BDI a partir de polticas timas de POMDPs . . . . . . . . . . . . . . . . . . . . . . 41
3.4.2 Passagem de Poltica para I-Plans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5 PLANEJAMENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.6 VARIVEIS PSICOCOMPORTAMENTAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.7 CURVAS DE BZIER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.1 Propriedades das Curvas de Bzier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.7.2 Propriedades das funes de Bernstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.7.3 Algoritmo de De Casteljau para soluo da curva de Bzier . . . . . . . . . . . . . . . . 55
3.8 INTERAES GEOMTRICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.8.1 Deteco de um ponto dentro de um cone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.8.2 Ponto de Interseco entre retas nitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.8.3 Colises entre formas geomtricas dinmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.9 PYTHON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4 MTODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.1 GERAO DE I-PLANS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.1.1 Memria curta e memria longa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.1.2 Combinando planejamento do POMDP com o Modelo de agente BDI . . . . . . 71
4.2 INTERAES ENTRE AGENTES E AMBIENTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.1 Agente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.2 Paredes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2.3 Cone de Viso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2.4 Mdulos Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.3 PASSAGEM DE UMA BZIER PARA OUTRA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.4 CUSTOS DE MOVIMENTAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.1 QUATRO PERSONALIDADES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.2 AMBIENTE COM NICA PERSONALIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2.1 Agentes Racionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.2.2 Agentes Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.2.3 Agentes Custdias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.2.4 Agentes Emotivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3 AMBIENTE DESBALANCEADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.1 Racionais em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.3.2 Experimentais em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .105
5.3.3 Custdia em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.3.4 Emotivos em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .115
5.4 PROBABILIDADES GERAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120
5.5 VALIDAO DOS RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
6 DISCUSSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
7 CONCLUSES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .129
8 SUGESTO PARA TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
17
1 INTRODUO
Um modelo uma representao simplicada de um sistema, cuja nalidade, em
geral, fazer comque umsistema complexo e de manipulao arriscada seja apresen-
tado em um formato de compreenso mais simples. Os modelos podem ser usados
tambm para representar sistemas que, em operao, possam causar alguma espcie
de dano ou prejuzo, de forma que, usando-se simulaes no causem consequncias
danosas. Em alguns casos, como situaes de movimentao de multides com altos
nveis de estresse por exemplo, os testes nem poderiam ser realizados, j que seria
considerado antitico levar pessoas a situaes de pnico e perigo sem necessidade,
tendo como soluo a utilizao de simulaes. Quando refere-se a simulao de pe-
destres, a maioria dos modelos especicada para analisar e gerar previses sobre
o comportamento global de um grupo de pedestres frente a situaes de evacuao
e interao de multides (ASHIDA et al., 2001; TEKNOMO, ; HAMAGAMI; HIRATA,
2003; LERNER et al., 2009).
Um bom modelo de uxo de pedestres precisa ser capaz de simular o comporta-
mento humano diante de diversas situaes, preservando as caractersticas essenci-
ais do mundo real, por exemplo as caractersticas comportamentais e psicolgicas dos
pedestres, de modo que os resultados da simulao gerada por este modelo sejam
iguais ou semelhantes queles do sistema original modelado.
Para a construo do modelo proposto neste trabalho, um levantamento biblio-
grco na rea de dinmica de multides, psicologia social, pnico e comportamento
coletivo ser realizado para que seja possvel utilizar variveis psicocomportamentais.
A anlise crtica e processamento destas informaes, vericando-se tendncias so-
bre a movimentao de pedestres em situaes de estresse deniro a estrutura do
modelo.
Para o processo de modelagem de agentes autnomos que seguem comporta-
mentos similares aos comportamentos humanos, ser necessrio o estabelecimento
de premissas, j que os estudos psicolgicos mostram tendncias, mas raramente
quanticam os fenmenos. Essas premissas sero traduzidas computacionalmente
emlinguagemprobabilstica, que aliadas a inteligncia articial representaro as vari-
veis psicocomportamentais que se deseja simular. Essas mesmas variveis psicocom-
portamentais sero inspiradas nos estudos da pesquisadora Angela Behrendt (2011),
que vem pesquisando h alguns anos o comportamento humano e avalia esse com-
portamento em grupos de pessoas em empresas, sendo que, recentemente (2013)
18
realizou uma avaliao comportamental sobre a necessidade de evacuao de pes-
soas em uma usina hidreltrica. Alm da pesquisa de Behrendt, outras bibliograas
conhecidas no meio cientco sobre comportamento de multides como os estudos
de Gustave Le Bon (2012), Quarantelli (1957), Turner e Killian (1972) serviro de base
para a anlise dos resultados.
A aplicao de mtodos computacionais para atingir a programao utilizada no
ser o grande alvo desta pesquisa, pois o foco so os processos de modelagem e
meios de simular situaes que ocorram num processo de evacuao.
1.1 OBJETIVOS
1.1.1 Objetivo Geral
O objetivo deste trabalho desenvolver uma modelagem computacional com vi-
sualizao tridimensional (3D), utilizando inteligncia articial atravs da gerao de
i-plans bidimensionais, que seja capaz de simular, em funo de hipteses simplica-
doras, a movimentao de pessoas em situaes de estresse, em ambientes fechados
quaisquer, de forma a contribuir com as pesquisas recentes na rea de movimentao
pedonal, inovando com a implementao de variveis psicocomportamentais.
1.1.2 Objetivo Especco
1. Desenvolver um simulador de movimentao de pedestres, levando em conside-
rao a existncia de variveis psicocomportamentais que alimentam o modelo
proposto.
2. Modelar o comportamento de agentes autnomos com nveis de estresse pe-
rante situaes de evacuao.
3. Testar a hiptese da existncia de quatro personalidades que dividem o compor-
tamento dos seres humanos.
4. Comparar os resultados obtidos utilizando-se a hiptese da existncia de qua-
tro personalidades, com as tendncia de comportamento observadas por outros
autores em multides que apresentam algum nvel de estresse.
5. Validar os resultados qualitativamente atravs das tendncias j descritas e quan-
titativamente atravs dos nmeros obtidos com relao a tempos de evacuao,
distncias percorridas e escolha de portas de sada.
19
1.2 JUSTIFICATIVA
Com o crescimento das cidades, o uxo de pedestres em ambientes como edi-
fcios, passarelas, cinemas, teatros, centros de entretenimento, etc. tem aumentado
desproporcionalmente ao espao dos ambientes por onde estes pedestres circulam.
Analogias entre trfego de veculos e pedestres so realizadas frequentemente tal
como sugere o Highway Capacity Manual
1
(ACADEMIES, 2000), sendo que a grande
maioria dos simuladores de trfego criados para representar o trfego de veculos aca-
bam sendo usados para modelar o uxo de pedestres, deixando muitas brechas com
relao a este ltimo.
Muitos trabalhos sobre dinmica de pedestres tm sido desenvolvidos nas lti-
mas dcadas (HELBING; MOLNR, 1995; DAAMEN; HOOGENDOORN; BOVY, 2005;
TOYAMA, 2006; VENUTI; BRUNO, 2007; SCHADSCHNEIDER; SEYFRIED, 2009;
PORTZ; SEYFRIED, 2010), mas o comportamento humano ainda no foi caracteri-
zado com a devida complexidade que as situaes de multides muito densas e com
altos nveis de estresse necessitam. Alm disso, essas multides muito densas, como
passeatas, peregrinaes, torcidas em jogos esportivos, podem representar compor-
tamentos caticos e turbulentos em relao a situaes cotidianas. Por estes moti-
vos, a simulao de pedestres tem se tornado ferramenta de grande importncia, que
pode explicitar e predizer catstrofes, evitando assim transtornos decorrentes do pla-
nejamento e infraestrutura inadequados, possibilitando a garantia da segurana e o
conforto dos pedestres em diversos tipos de ambientes.
O estudo de situaes que envolvem multido, quando associado simulao,
pode descrever e at prognosticar acontecimentos envolvendo a segurana pblica,
evitando assimtranstornos decorrentes do planejamento e infraestrutura inadequados,
e possibilitando descrever o comportamento humano diante de algumas situaes.
Assim, trabalhar com inteligncia articial, utilizando para isso o Python, que
uma ferramenta computacional de livre acesso e fcil manipulao, transforma este
trabalho em ferramenta de utilidade para a avaliao de espaos pblicos e privados
e movimentao de pedestres em diferentes condies.
1
O Highway Capacity Manual ( HCM) uma publicao do Transportation Research Board ( TRB),
nos Estados Unidos. O HCM tem sido uma referncia mundial para o transporte e tambm para os
estudiosos e prossionais da rea de engenharia de trfego.
20
1.3 CONTRIBUIES DA TESE
A maior contribuio deste trabalho est na metodologia de modelagem da movi-
mentao de pedestres assumindo variveis psicocomportamentais, atravs da cria-
o de uma ferramenta que simula a movimentao pedonal emsituaes de estresse,
com ambientes fechados quaisquer, acoplada com a hiptese de existncia de qua-
tro personalidades que representam o comportamento psicossocial humano de uma
forma generalizada.
1.4 ORGANIZAO DO TEXTO
O texto est organizado da seguinte forma: Captulo 2 so apresentadas as re-
ferncias bibliogrcas pertinentes ao tema. No Captulo 3 apresenta-se as teorias
utilizadas para a formulao dos agentes BDI, dos i-plans, das variveis psicocom-
portamentais e das curvas de Bzier que denem a movimentao dos agentes. No
Captulo 4 descreve-se os mtodos utilizados para a formulao da modelagem com-
putacional comvisualizao tridimensional (3D), utilizando inteligncia articial atravs
da gerao de i-plans bidimensionais. O Captulo 5 traz os resultados obtidos com a
modelagem. O Captulo 6 contm discusses sobre os resultados e as inovaes
apresentadas. O Captulo 7 traz as concluses e o Captulo 8 refere-se ao trabalhos
que podem ser desenvolvidos futuramente baseando-se nesta pesquisa.
21
2 REVISO BIBLIOGRFICA
Na dcada de trinta, surgiram na Inglaterra as primeiras tentativas de sinalizao
para pedestres. Desde os anos sessenta muitos estudos tm sido dedicados para
a determinao de um modelo matemtico que vincule a velocidade das caminha-
das com a densidade das multides. Nos anos recentes, pesquisas foram dirigidas
para o estudo de padres de uxo de multides sob situaes de emergncia (KER-
NER, 2004), e uma crescente ateno foi dedicada aos efeitos do comportamento
das multides na dinmica de estruturas no campo da engenharia civil (DAAMEN;
BOVY; HOOGENDOORN, 2002; DAAMEN; HOOGENDOORN; BOVY, 2005; LEBAC-
QUE; KHOSHYARAN, 2005). Um grande nmero de fatores podem afetar o compor-
tamento dos pedestres (idade, cultura, gnero, propsito da viagem, tipo de infra es-
trutura, direo da caminhada). Desta forma, as propriedades dos pedestres diferem
de caso para caso, consequentemente suas caractersticas especcas no podem
ser consideradas constantes no sistema.
Analisando as questes referentes ao espao fsico, pode-se perceber que, tratando-
se de meios susceptveis a um alto uxo de pessoas, comum ocorrerem aglomera-
es, principalmente em locais pblicos. Os casos de aglomerao, ou multido",
so pontuados por envolverem um alto nmero de indivduos com caractersticas dis-
tintas num mesmo ambiente. Nesses casos, alm da interao entre pedestre e meio,
tem-se tambm a interao entre pedestres. Diversas situaes so marcadas pelo
estudo do comportamento de multides, tais como a simulao de multides aplicadas
em produes cinematogrcas, jogos digitais, planejamento de construes, evacu-
ao de ambientes complexos, arquitetura, dentre outras (BICHO, 2009; DAPPER,
2007).
Em um espao fsico, o deslocamento de um pedestre descreve uma trajetria,
que pode ser interferida por questes comportamentais ou fsicas. De acordo com
Bicho (2009) a modelagem e simulao de multides caracterizadas por um alto uxo
populacional so temas de estudo em diferentes reas da cincia, pois garantem um
vasto campo aplicativo no que tange ao uxo de pedestres. Nas ltimas dcadas,
destacam-se os estudos relacionados simulao de multides, buscando responder
questes associadas desde a escolha de um caminho, at a simulao de situaes
marcadas pelo pnico (ZAMPIERI, 2006). Esse estudo encontra-se diretamente re-
lacionado ao aumento do uxo populacional em certas regies, despertando estudos
especcos para esse novo comportamento.
22
Schadschneider (2002), Burstedde (2002) e colaboradores desenvolveramem2002,
um modelo de autmato celular estocstico para simulao de dinmica de pedestres.
Este baseia-se em um autmato celular
1
estocstico bi-dimensional. O modelo per-
mite uma simulao rpida de grandes multides, reproduzindo caractersticas cole-
tivas e de auto-organizao de dinmica de pedestres, tais como formao de las,
uxos em corredores e oscilaes de uxos encontrados em portas. Entretanto, para
manter o modelo simples, os pedestres so providos apenas de uma inteligncia m-
nima para a formao de estruturas complexas e efeitos de auto-organizao obser-
vados em dinmica de pedestres, o que muitas vezes, impede que este represente
bem sistemas reais.
Toyama (2006), em sua dissertao de mestrado Uma abordagem Multiagentes
para a Dinmica de pedestres", props a anlise de um modelo que caracteriza o
comportamento macroscpico de uma multido, por meio da anlise de certas vari-
veis, tais como, genro, velocidade, conhecimento do ambiente e comportamento do
grupo. Ainda nesse trabalho, Toyama apresenta um modelo baseado em sistemas
multiagentes, propondo uma melhoria Walker para o modelo estocstico j existente
criado por Schadschneider.
Ainda no campo de simulao pedonal, o trabalho de Helbing (2000), apresenta
um modelo contnuo de pedestres baseado em foras generalizadas, caracterizado
por simplicidade e robustez em relao a variaes dos parmetros, apropriado para
situaes que envolvam pnico. Nesse trabalho h algumas observaes do fen-
meno de pnico so realizadas, tais como:
Variao e aumento da velocidade normal;
Interaes fsicas;
Ausncia de coordenao dos movimentos;
Entupimentos e aglomeraes nas sadas;
Danos estrutura fsica do ambiente;
Pisoteamentos. A caminhada (fuga) retardada por pessoas cadas ou feridas
se transformando em obstculos";
1
Um autmato celular um modelo discreto estudado na teoria da computabilidade, matemtica,
e biologia terica. Consiste de uma grelha nita e regular de clulas, cada uma podendo estar em
um nmero nito de estados, que variam de acordo com regras determinsticas. A grelha pode ser
em qualquer nmero nito de dimenses. O tempo tambm discreto, e o estado de uma clula
no tempo t uma funo do estado no tempo t 1 de um nmero nito de clulas na sua vizinhana.
Essa vizinhana corresponde a uma determinada seleo de clulas prximas (podendo eventualmente
incluir a prpria clula). Todas as clulas evoluem segundo a mesma regra para atualizao, baseada
nos valores das suas clulas vizinhas. Cada vez que as regras so aplicadas grelha completa, uma
nova gerao produzida.
23
Tendncia de comportamento de massa", ou seja, repetir o comportamento de
outras pessoas;
Inecincia ou ignorncia de sadas alternativas presentes em situaes de fuga.
Essas observaes podem ser representadas na simulao. O modelo contnuo de
Helbing considerado promissor, entretanto ainda apresenta falhas, por no ser pos-
svel representar muitas variveis comportamentais, devido diculdade de obteno
de resultados ao se resolver as equaes diferenciais parciais que o compem. Assim
os parmetros utilizados por Helbing ainda geram resultados contra-intuitivos e muito
diferentes do que ocorre na realidade.
Zampieri (2006) expe um modelo estimativo de movimento de pedestres baseado
em sintaxe espacial, medidas de desempenho e redes neurais articiais. Nesse traba-
lho destaca-se a importncia do estudo do comportamento de pedestres. Pensando
no comportamento, o autor prope um modelo baseado em redes neurais articiais,
que estabelece a relao entre o uxo de pedestres e as propriedade do espao ur-
bano.
O trabalho de Dapper (2007) apresenta um planejamento de movimento para pe-
destres utilizando campos potenciais. Armando que o comportamento de cada pe-
destre, ou agente, denido por uma alterao de seu campo potencial individual. As
alteraes dinmicas do padro podem ser alteradas em cada passo da simulao.
Assim, podem ser evitadas colises com obstculos mveis ou combinar a complexi-
dade dos movimentos. Em ambos os trabalhos, no existe o estabelecimento de um
nvel de estresse, sendo trabalhado apenas com situaes mais simples referentes ao
comportamento humano.
De acordo com Hughes (2002), o movimento dos pedestres regido por equaes
de uxo contnuo derivadas do uxo de um nico pedestre ou de mltiplos pedestres.
O autor divide o uxo de pedestres em dois tipos de regime: um regime de alta densi-
dade, tambm chamado de regime subcrtico
2
e um regime de baixa densidade, que
se denomina de supercrtico
3
. As teorias de Hughes derivam da ideia de se relaci-
onar o uxo e a densidade de pedestres atravs de um diagrama, conhecido como
diagrama fundamental. Muitos outros autores tambm consideram tal diagrama como
pea importante para a anlise do uxo de pedestres, como Fruin (1971), Tanabori-
boon (1986), Weidmann (2006), Virkler (1994), Older (1968), Sarkar (1997) e Schads-
chneider (2009). Algumas teorias tambm baseadas em equaes de uxo contnuo
se baseiam na existncia dos diagramas fundamentais (HELBING; KELTSCH; MOL-
2
Um uxo de alta densidade sempre preenche o espao (ambiente de caminhada) disponvel
3
Um regime de baixa densidade pode preencher o espao disponvel, ou se auto limitar para cada
tipo de pedestre, dependendo da localizao das fronteiras.
24
NR, 1997; HOOGENDOORN; BOVY, 1999; HOOGENDOORN, 2003).
Na dcada de 90, o governo dos EUA nanciou um dos mais intensivos estudos
sobre evacuao de pessoas em edifcios. O atentado ao edifcio World Trade Cen-
ter em 26 de fevereiro de 1993, anterior ao atentado que culminou na derrubada do
edcio, foi estudado exaustivamente por Fahy e Proulx (1995) utilizando como ferra-
mentas de pesquisa entrevistas e questionrios relacionados com o comportamento
de ocupantes selecionados (VALENTIN; ONO, 2006).
Levando em considerao as aes e comportamentos humanos, com ou sem
nveis de estresse, visto que h possibilidade de associ-los a modelos matemticos,
ou simulaes computacionais onde a obteno de resultados satisfatrios para a
anlise de multides uma realidade.
A proposta desta pesquisa a de criar uma metodologia de modelagem da mo-
vimentao de pedestres, acoplando inteligencia articial variveis psicocomporta-
mentais comhipteses simplicadoras, de forma que os resultados obtidos contribuam
para a evoluo da pesquisa em movimentao pedonal, suprindo a ainda faltante uti-
lizao da parte psicossocial humana nesse tipo de simulao.
25
3 FUNDAMENTAO TERICA
Muitas ferramentas matemticas e computacionais, alm da fundamentao pro-
posta para as variveis psicossociais, precisaro ser utilizadas. Desta forma, o emba-
samento terico necessrio para estas abordagens sero desenvolvidos neste cap-
tulo.
3.1 INTELIGNCIA ARTIFICIAL
Embora a rea de Inteligncia Articial ( AI) seja estudada academicamente desde
os anos 50, s recentemente tem gerado maior interesse pelo surgimento de aplica-
es comerciais, industriais e educacionais e no puramente acadmicas. Um fator
decisivo para o sucesso desta transio (da academia para a indstria) so os enor-
mes avanos tecnolgicos e computacionais ocorridos nas ltimas duas dcadas.
O primeiro programa computacional baseado em conhecimento, ou seja, baseado
em uma lgica de programao mais elaborada, levando em considerao o com-
portamento humano, foi escrito em 1967 por Ed Feigenbaum, em Stanford. O pro-
grama intitulado DENDRAL (Dendritic Algorithm) (BUCHANAN; FEIGENBAUM, 1978)
podia predizer as estruturas de compostos qumicos desconhecidos baseando-se em
anlises de rotinas. O programa MYCIN (SHORTLIFFE, 1976) foi desenvolvido logo
aps o DENDRAL, tambm por Feigenbaum, acompanhado de Buchanan e Edward
Shortliffe. Esse sistema especialista foi desenvolvido para identicar as bactrias cau-
sadoras de infeces graves, tais como bacteremia e meningite, e para recomendar
antibiticos, com a dose ajustada para o peso corporal do paciente. Seu nome derivou
dos mesmos antibiticos, uma vez que muitos antibiticos contm o suxo -mycin.
O sistema Mycin tambm foi utilizado para o diagnstico de doenas da coagulao
sangunea, ou seja, o MYCIN era capaz de deduzir regras (RHEINGOLD, 2012).
Desde ento, muito se tem estudado sobre AI e muitas controvrsias ocorrem em
torno deste tema, principalmente no que diz respeito a denio do termo intelign-
cia. Por essa razo, a Inteligncia Articial foi, e continua sendo, uma rea que dispe
de mltiplas interpretaes. Esse carter mltiplo levou a pesquisa e desenvolvimento
em AI a xar-se em torno de trs tipos principais de atividades (BITTENCOURT, 2006).
1. Desenvolvimento de modelos formais para a inteligncia humana, tema da cin-
cia cognitiva, tambm chamada psicologia computacional;
26
2. Desenvolvimento de aplicaes educacionais, comerciais ou industriais utilizando
tcnicas de AI;
3. Explorao e experimentao de tcnicas computacionais que apresentem po-
tencial para a simulao do comportamento inteligente, a chamada AI bsica.
Dentre essas trs atividades, este trabalho percorrer caminhos entre o segundo e
terceiro itens, tendo como respaldo conhecimentos psicolgicos referentes ao primeiro
item.
Os conceitos bsicos da AI podem ser divididos em diversos ramos que incluem:
aprendizagem de mquina, raciocnio probabilstico, robtica, processamento de lin-
guagem natural.
De acordo com Sebastian Thrun, professor de Cincia da computao na univer-
sidade de Stanford, AI a disciplina que aborda a incerteza e a gerncia no processo
de tomada de deciso em ferramentas de software (THRUN; NORVIG, 2011). Essa
denio de Thrun se encaixa na proposta desta tese.
3.1.1 Conceitos de Inteligncia Articial - AI
Muitas aplicaes e tcnicas podem ser citadas quando se fala de AI, por exem-
plo: planejamento automatizado, jogos, diagnsticos, planejamento logstico, robtica,
redes neurais, sistemas com viso computacional, aplicaes utilizando vida articial,
sistemas baseados na ideia de agentes articiais (denominados Sistemas Multiagen-
tes).
Este trabalho coloca seu foco sobre Sistemas Multiagentes ( MAS - Multi-Agent
System). Estes tm se tornado comuns para a resoluo de problemas complexos
(WOOLDRIDGE, 2002) como, telecomunicaes (SOUZA; NETTO, 2012), monitora-
o de usinas nucleares (GUIMARES, 2006), controle de trfego areo (DIB; CAR-
DOSO; WEIGANG, 2005), simulao de pedestres (TOYAMA, 2006), etc.
Os MAS formam uma subrea da AI e concentram-se no estudo de agentes aut-
nomos em um universo multiagente. Para os MAS, o termo autnomo designa o fato
de que os agentes tm uma existncia prpria, independente da existncia de outros
agentes (REIS, 2003). Usualmente, cada agente possui um conjunto de capacidades
comportamentais que denem sua competncia, um conjunto de objetivos e a auto-
nomia necessria para utilizar suas capacidades comportamentais a m de alcanar
seus objetivos. Um agente uma entidade computacional com um comportamento
autnomo que lhe permite decidir suas prprias aes (ALVARES; SICHMAN, 1997).
A deciso de qual ao deve ser executada determinada pelo agente, tendo em con-
27
siderao as mudanas que ocorrem no ambiente no qual atua e o desejo de alcanar
seus objetivos. A ideia principal em um sistema multiagente que um comporta-
mento global inteligente pode ser alcanado a partir do comportamento individual dos
agentes, ou seja, o comportamento macroscpico emerge do comportamento micros-
cpico. Dessa forma, pode-se denir um agente autnomo (ativo ou inteligente) como
um ser capaz de perceber seu ambiente por meio de sensores e agir sobre esse am-
biente atravs de atuadores. Pode-se traar um paralelo desse processo atravs de
um agente humano, onde este usa seus rgo sensitivos como sensores, e mos, per-
nas e outras partes do corpo como atuadores. Na robtica, os atuadores podem ser
as cmeras, detectores infravermelhos, etc. Em um agente de software os atuadores
so teclado, arquivos, pacotes da rede, vdeos, impressora, dentre outros.
A arquitetura de um agente ento formada dessa maneira: com sensores e atu-
adores. Os sensores detectam o ambiente avaliando as situaes e os atuadores
reagem de acordo com a tarefa que lhe foi ensinada ao encontrar determinada situ-
ao. Por exemplo: um agente humano analisa o ambiente atravs de seus olhos
(sensores) e detecta um buraco. As pernas (atuadores), precisam estar programadas
para desviar desse buraco, ou pul-lo, etc.
Uma ao de um agente inteligente composta por uma sequncia de percepes
e no apenas uma percepo por vez. A escolha da ao a ser tomada depender
da anlise dessa sequncia armazenada. Alm disso, um agente s poder ser con-
siderado inteligente se obtiver sucesso em suas aes, ou seja, o seu desempenho
necessita ser o desempenho mximo procurado ao ser programado. Exemplo: o de-
sempenho de um agente aspirador de p pode ser a quantidade de sujeira limpa,
tempo total gasto, quantidade de eletricidade consumida, quantidade de barulho ge-
rado, etc (NORVIG; RUSSELL, 2004).
Assimpode-se denir que umagente inteligente possuir armazenada uma sequn-
cia de percepes. A partir destas, ele dever selecionar uma ao que maximize seu
desempenho de acordo com as evidncias fornecidas pela sequncia e por qualquer
conhecimento interno do agente. Essa maximizao de desempenho tambm cha-
mada de desempenho timo ou otimizado.
A coleta de informaes, ou seja, explorar um ambiente desconhecido, um passo
fundamental da inteligncia. Por exemplo, analisar se o caf est quente antes de
beb-lo maximizar a resposta de saborear sem se queimar, ou ainda olhar antes de
atravessar a rua maximizar o desempenho de atravessar sem ser atropelado. Um
agente inteligente deve ser capaz de operar com sucesso em uma grande quantidade
de ambientes, dado um tempo suciente para se adaptar, pois tem a capacidade de
reconhecer e se adaptar a novas condies (FERREIRA, 2012).
28
necessrio saber que tipo de ambiente se est especicando no programa para
que esse agente possa se movimentar. Por exemplo:
Oambiente totalmente observvel, parcialmente observvel ou totalmente des-
conhecido? Analisa-se o ambiente quanto ao acesso completo do estado desse,
fornecido pelos sensores.
O ambiente discreto ou contnuo? Verica-se se as percepes e aes so
contveis e distintas.
O ambiente determinstico ou estocstico? Analisa-se se o estado do ambiente
totalmente determinado pelas aes selecionadas pelo agente ou possui aes
aleatrias.
O ambiente esttico ou dinmico? O ambiente se altera com as aes do
agente?
O ambiente episdico ou sequencial? A experincia do agente dividida em
episdios, ou considera-se um nico episdio.
Trabalha-se com um nico agente ou mltiplos agentes? Ambientes com mlti-
plos agentes necessitam de formas de comunicao.
A partir dessas denies possvel determinar uma heurstica
1
de movimenta-
o para os agentes. Referente a essa movimentao, frequentemente precisa-se
lidar com conhecimentos probabilsticos em que a base de informaes incompleta,
inexata, imparcial ou at mesmo ambgua para que o agente consiga tomar suas deci-
ses. Desta forma, ser usada neste trabalho uma juno de conhecimento simblico
(via agentes com crenas, desejos e intenes, que ser melhor explicado nas se-
es a seguir) e probabilstico, em especial, probabilidades estruturadas usando redes
bayesianas
2
. Alm disso, os agentes no tm conhecimento de todo o ambiente, ape-
nas dos espaos que podem ser detectados por seu cone de viso (ver Sec. (4.2.3)),
assim dene-se que este ser parcialmente observvel. Tambm ser um ambiente
contnuo, pois o agente tem liberdade de movimento em qualquer direo; esttico,
pois no se altera com as aes do agente; estocstico
3
pois contar com algumas
1
Dene-se procedimento heurstico como um mtodo de aproximao das solues ideais dos pro-
blemas. A heurstica assume uma soluo prxima da ideal baseada em uma funo de avaliao do
resultado.
2
Dene distribuio de probabilidade sobre grafos ou variveis aleatrias
3
Padres estocsticos so aqueles que tm origem em processos no determinsticos, com ori-
gem em eventos aleatrios. Dentro da inteligncia articial, programas estocsticos trabalham usando
mtodos probabilsticos para solucionar problemas, como em redes neurais estocsticas, otimizao
estocstica e algoritmos genticos. Um problema pode ser estocstico em si mesmo, como no plane-
jamento sob incerteza.
29
decises aleatrias e probabilsticas (o que justica o uso de redes bayesianas); epi-
sdico, pois as vrias percepes do ambiente, ao longo do tempo, vo alimentar
novos planos e de mltiplos agentes para que seja possvel representar conceitos de
movimentao em grupo.
3.2 MODELOS PROBABILSTICOS
As redes bayesianas ( BN - Bayes Network) so modelos de representao do co-
nhecimento que trabalham com o conhecimento incerto e incompleto por meio da Te-
oria da Probabilidade Bayesiana, publicada pelo matemtico Thomas Bayes em 1763.
As BN foram aperfeioadas no incio dos anos 80 para facilitar a tarefa de predio
em sistemas de inteligncia articial (PEARL, 1988). BN, tambm conhecidas como
redes de opinio, redes causais, grcos de dependncia probabilstica, so modelos
grcos para raciocnio (concluses) baseado na incerteza, onde os ns representam
as variveis (discreta ou contnua), e os arcos representam a conexo direta entre
eles (KORB; NICHOLSON, 2004). Desta forma, uma BN constituda por: um con-
junto de variveis e um conjunto de arcos ligando as variveis; cada varivel possui
um conjunto limitado de estados mutuamente exclusivos; as variveis e arcos formam
um grafo dirigido, sem ciclos
4
, como apresentado na Fig. (1).
7
5
3

8
2
9

FIGURA 1: Grafos Dirigidos Acclicos.
Pode-se tambm denir uma BN matematicamente usando uma representao
compacta de uma tabela de conjuno de probabilidades do universo do problema.
Assim, seja R uma varivel aleatria com n estados e P(R) a distribuio de probabili-
dade para estes estados.
P(R) = (a
1
, , a
n
)
4
Grafos dirigidos acclicos so aqueles onde, para qualquer vrtice v, no h nenhuma ligao diri-
gida comeando e acabando em v.
30
onde a
i
a probabilidade de R estar no estado a
i
. Se a varivel T possui m estados,
(b
1
, , b
m
), ento P(R/T) representa uma tabela nXm contendo valores P(a
i
/b
i
), como
pode ser observado no exemplo da Tab. (1).
b
1
b
2
b
m
a
1
0,07 0,05 0,08
a
2
0,04 0.04 0,05
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
a
n
0,06 0,03 0,09
TABELA 1: Tabela de Conjuno de Probabilidades
Os conceitos da Teoria das Probabilidades para o embasamento da AI podem ser
obtidos nos mais diversos livros de estatstica. Recomenda-se ver (JAMES, 1996),
(FERNANDEZ, 2011), (MAGALHES, 2011), onde possvel relembrar teorias como:
Teorema de Bayes, Teorema da Probabilidade Total, Variveis Aleatrias, Funes de
Distribuio.
As BN so parte da construo da Inteligncia Articial, pois englobam conceitos
como: Algoritmos de Filtragem (ltros de partculas e ltros de Kalman), Modelos
ocultos de Markov ( HMMs - Hidden Markov Models), Processos de deciso de Markov
( MDPs - Markov Decision Processes), Processos de Deciso de Markov Parcialmente
Observvel ( POMDPs - Partially Observable Markov Decision Processes); que so
ferramentas probabilsticas (NORVIG; RUSSELL, 2004).
O conceito de Cadeias de Markov, tambm presente nas bibliograas sugeridas
acima, uma vez que ser apresentado a seguir, ser muitas vezes citado e discutido
dentro da teoria sobre AI. Para isso, inicialmente ser denido o que so Processos
Estocsticos. Assim,
Denio 3.2.1. (NOGUEIRA, 2012) Um processo estocstico denido como uma
coleo de variveis aleatrias X(t) indexadas por um parmetro t pertencente a um
conjunto T, que pode ser tomado pelos conjunto dos inteiros no-negativos.
Um Processo Estocstico dito Processo de Markov se o estado futuro deste s
depende do estado presente, e no dos estados passados. Matematicamente pode-se
escrever
P(X(t
k+1
) x
k+1
/X(t
k
) = x
k
, X(t
k1
) = x
k1
, , X(t
1
) = x
1
, X(t
0
) = x
0
) =
= P(X (t
k+1
) x
k+1
/X(t
k
) = x
k
),
para t
0
t
1
t
k
t
k+1
= 0, 1 e toda sequncia k
0
, k
1
, , k
t1
, k
t
, k
t+1
(1)
31
As probabilidades condicionais so denominadas probabilidades de transio. As-
sim, pode-se denotar a probabilidade de transio como a probabilidade de X
n+1
5
estar
no estado j dado que X
n
est no estado i ou seja
P
n,n+1
i j
= P(X
n+1
= j/X
n
= i). (2)
A anlise de uma Cadeia de Markov caracteriza-se principalmente pelo clculo das
probabilidades de transies em n passos, portanto P
n
i j
denotado por (NOGUEIRA,
2012)
P
n
i j
= P(X
m+n
= j/X
m
= i). (3)
Podem-se representar as quantidades P
n
i j
de forma matricial. Tal notao impor-
tante, pois torna o processo mais simples de ser representado computacionalmente.
Dessa forma denota-se a matriz de Markov ou matriz de Probabilidades de Transio
da seguinte forma:
||P
n
i j
|| desde que
_

k=0
P
ik
P
n1
k j
P
0
i j
=
_
1 se i = j
0 se i = j
(4)
Proposio 3.2.1. Um Processo de Markov est completamente denido quando sua
matriz de probabilidades de transio e seu estado inicial X
0
(ou, mais genericamente,
a distribuio de probabilidade de X
0
) esto especicados. (UFPE, 2012)
Pela iterao da Eq. (4), obtm-se:
P
(n)
=PxPxP xP
n
. .
n vezes
(5)
Demonstrao. O evento de ir do estado i para o estado j em n transies pode ser
realizado por caminhos mutuamente exclusivos, indo para um estado intermedirio
k (k = 0, 1, ), na primeira transio, e ento ir do estado k ao estado j nas (n
1) transies restantes. Pela propriedade de Markov, a probabilidade da segunda
transio P
(n1)
k j
(da primeira transio , obviamente, P
ik
) (UFPE, 2012). Usando a
5
X
n
est no estado i se X
n
= i
32
Lei da Probabilidade Total:
P
(n)
i j
= P{X
n
= j|X
0
= 1} =

k=0
P{X
n
= j, X
1
= k|X
0
= i}
=

k=0
P{X
1
= k|X
0
= i} P{X
n
= j|X
0
= i, X
1
= k}
=

k=0
P
ik
P
(n1)
k j
3.2.1 Mtodos ocultos de Markov
Os Mtodos ocultos de Markov (HMM) foram descritos pela primeira vez ao nal
dos anos 60 (BAUM; PETRIE, 1966). So usados para analisar ou prever sries tem-
porais
6
. O HMM um processo estocstico no visvel (por isso o nome oculto), mas
que pode ser observado atravs de outro processo estocstico que produz a sequn-
cia de observaes. Por este motivo pode ser considerado um processo duplamente
estocstico (RABINER, 1989).
Os processos ocultos consistem de um conjunto de estados conectados por tran-
sies com probabilidades (autmato nito), enquanto os processos observveis (no
escondidos) consistem de um conjunto de sadas ou observaes, cada qual podem
ser emitidos por cada estado de acordo com alguma sada da Funo Densidade de
Probabilidade, PDF (MORITA, 1998).
Seja uma sequncia de estados que evoluem no decorrer do tempo e cada estado
depende apenas do estado anterior na rede bayesiana, ento cada estado consti-
tudo do que se chama de medida. Essa rede bayesiana o ncleo dos HMMs, e de
vrios ltros probabilsticos, como ltros de Kalman e ltros de partculas.
Pode-se dizer que os estados evoluem por uma cadeia de Markov. Isso quer dizer
que cada estado depende apenas do seu antecessor, mas o que transforma isso em
um modelo oculto de Markov o fato de existirem variveis de medida que caracte-
rizam estes estados. Logo, em vez de se observar os estados, precisa-se analisar
essas medidas. Ferramentas como mxima verossimilhana e suavizao laplaciana
podem ser usadas neste contexto.
Os HMMs so usados em duas situaes principais:
1. Predio: Espera-se prever o prximo estado, ou prever a prxima medida. As
6
Em estatstica, econometria, matemtica aplicada e processamento de sinais, uma srie temporal
uma coleo de observaes feitas sequencialmente ao longo do tempo
33
equaes para predio so baseadas em probabilidade total.
2. Estimativa de Estados: Deseja-se calcular a probabilidade de um estado interno
ou oculto, dadas as medidas. As equaes para estimar estados so baseadas
no Teorema de Bayes.
No contexto de HMMs, ltragem refere-se determinao da distribuio de uma
varivel latente em um momento especco, tendo em conta todas as observaes
at aquele momento, ou seja, faz-se uma ltragem das informaes da varivel para
analisar o que pode continuar no processo e o que deve ser retirado ou modicado.
Dentre os conceitos probabilsticos citados at o momento, a inferncia proba-
bilstica ou bayesiana ferramenta fundamental, pois descreve as incertezas sobre
quantidades invisveis de forma probabilstica, ou seja, computa a distribuio de pro-
babilidade posterior, P(A/B), para um conjunto de variveis de consulta, A, dado uma
evidencia, B.
Castilho e Gutierrez (1997) classicam os algoritmos de inferncia em trs nveis:
Exatos, Aproximados e Simblicos. Nesse trabalho os algoritmos usados so classi-
cados como Aproximados, pois esses utilizam tcnicas distintas de simulao para
chegar a valores aproximados das probabilidades. Como exemplo, podem-se citar os
algoritmos de amostragem de Gibbs (Gibbs Sampling)
7
e Mxima Verossimilhana
8
com Suavizao Laplaciana ( MLLS - Maximum Likelihood Laplace Smoothing). O
primeiro gera cada amostra baseado na congurao gerada pela amostra anterior e
atualiza a congurao atual para amostras futuras. O algoritmo de Gibbs depende
de uma congurao inicial. A estimativa do algoritmo baseada na probabilidade
da varivel fazer a transio de um estado para outro, chamada de probabilidade de
transio (FIORI; THIELE; RAMOS, 2012).
Quando estima-se a verossimilhana, utiliza-se como probabilidade o quociente
do nmero de eventos especcos sobre o nmero total de eventos do conjunto (es-
pao amostral). Porm, ao se fazer isso, pode-se chegar a falsos resultados nulos.
Para amenizar esse problema utiliza-se a suavizao laplaciana. Assim, no algoritmo
MLLS, o nmero de eventos especcos acrescido de um valor k e normalizado
adicionando-se k a toda classe (MANNING; RAGHAVAN; SCHTZE, 2008). Desta
7
O amostrador de Gibbs um algoritmo para gerar uma sequncia de amostras da distribuio con-
junta de probabilidades de duas ou mais variveis aleatrias. O propsito de tal sequncia aproximar
a distribuio conjunta, ou computar uma integral (tal como um valor esperado). A amostragem de
Gibbs um exemplo de um algoritmo Monte Carlo via cadeias de Markov.
8
A verossimilhana (likelihood) a interpretao da funo de um parmetro dado um resultado
xo, ou seja, indica qual a probabilidade de um valor de parmetro em funo do resultado observado.
Segundo Bussab e Morettin (2004) o princpio da verossimilhana arma que deve-se escolher o valor
do parmetro desconhecido que maximiza a probabilidade de obter a amostra observada, ou seja, o
valor que torna a mostra o mais provvel.
34
forma, a probabilidade que podia ser calculada da forma
P(X) =
n(eventos especcos)
n(Espao Amostral)
, (6)
passa a ser calculada por
P(X) =
n(eventos especcos) +k
n(Espao Amostral) +k(x)
, (7)
onde n(X) representa o nmero de elementos de um conjunto. Desta forma estes
dois algoritmos (Amostragem de Gibbs e MLLS) sero utilizados quando o processo
de deciso dos agentes chegarem a situaes crticas onde seja necessrio o uso de
ferramentas probabilsticas para a tomada de deciso.
Existem vrios tipos de ltros bayesianos dentro dessa categoria, sendo que os
principais so o Filtro de Kalman e o Filtro de Partculas.
Assim, o ltro de Kalman um algoritmo para realizar, de forma eciente, infe-
rncias exatas sobre um sistema dinmico linear, que um modelo Bayesiano seme-
lhante a um HMM (HO; LEE, 1964), entretanto, nesta pesquisa necessita-se que as
inferncias sejam aproximadas e que seja possvel trabalhar com distribuies alm
das gaussianas.
Thrun e Norvig (2011) aconselham o uso de ltros de partculas, tambm conhe-
cidos como Mtodos Monte Carlo via Cadeias de Markov ( MCMC), quando o assunto
AI e mais especicamente agentes inteligentes em ambientes parcialmente obser-
vveis.
3.2.2 Filtro de Partculas
A ideia do mtodo Monte Carlo escrever a integral que se deseja calcular como
um valor esperado. Seja o problema de calcular a integral de uma funo g() no
intervalo (a; b), isto :
J =
_
b
a
g()d. (8)
A Eq. (8) pode ser reescrita como:
J =
_
b
a
(ba)g()
1
ba
d = (ba)E(g()), (9)
identicando como uma varivel aleatria com distribuio uniforme U(a, b)
9
. Desta
9
uma distribuio de probabilidades contnuas onde a probabilidade de se gerar qualquer ponto em
um intervalo contido no espao amostral proporcional ao tamanho do intervalo. Alm disso, qualquer
outra distribuio contnua, na qual a funo distribuio acumulada seja invertvel, pode ser simulada
35
forma, transforma-se o problema de avaliar a integral em um problema estatstico em
que se deseja estimar uma mdia, E[g()]. Dispondo de uma amostra aleatria de
tamanho n,
1
, ,
n
da distribuio uniforme no intervalo (a; b) tem-se tambm uma
amostra de valores g(
1
), , g(
n
) da funo g() e a integral acima (9) pode ser
estimada pela mdia amostral, ou seja,

J = (ba)
1
n
n

i=1
g(
i
) (10)
e verica-se que
E(

J) =
(ba)
n
n

i=1
E(g(
i
)) = (ba)E(g()) =
_
b
a
g()d. (11)
A generalizao bem simples para o caso em que a integral a esperana
matemtica de uma funo g() onde uma funo de densidade p(), ou seja
J =
_
b
a
g()p()d = E(g()). (12)
Tendo no lugar de uma distribuio uniforme uma distribuio de valores
1
, ,
n
para p(), pode-se calcular:

J = g =
1
n
n

i=1
g(
i
). (13)
Essa simplicidade do Mtodo Monte Carlo fez com que seu desenvolvimento se
desse com a necessidade de se resolverem problemas cada vez mais complexos,
onde muitas vezes encontrar uma densidade que seja simultaneamente uma boa apro-
ximao e fcil de ser amostrada seria quase impossvel. Os conceitos de Cadeias
de Markov foram acoplados ao mtodo j existente. Essa juno deu origem ao M-
todo Monte Carlo via cadeias de Markov (MCMC) ou tambm chamada de algoritmos
sequenciais de Monte Carlo. A ideia continua a ser a de encontrar uma amostra da
distribuio e calcular estimativas amostrais de caractersticas desta distribuio. A
diferena que para o MCMC usam-se tcnicas de simulao iterativa, baseadas em
cadeias de Markov, e assim os valores gerados no so mais independentes (JUSTI-
NIANO, 2012).
O problema de ltragem um caso particular dos mtodos sequenciais de Monte
Carlo. Ele consiste na estimao de um sinal desconhecido (oculto) a partir dos dados
provenientes das observaes que, por sua vez, so uma funo aleatria dos sinais.
O estimador chamado de ltro. A amostragem por importncia sequencial ( SIS)
(BATISTA, 2011) um mtodo Monte Carlo que forma as bases para a maior parte
a partir da distribuio uniforme.
36
dos ltros sequenciais de Monte Carlo desenvolvidos nas ltimas dcadas (DOUCET;
FREITAS; GORDON, 2001). Esta aproximao sequencial conhecida por vrios
nomes como ltragem bootstrap, algoritmo de condensao, ltro de partculas ou o
prprio MCMC j citado (CUPERTINO, 2007).
Os Filtros de Partculas ( PFs - Particle Filters) so ltros que realizam estima-
o sequencial de Monte Carlo e guardam a densidade de probabilidade do estado
do sistema na forma de partculas, podendo representar um nmero muito maior de
distribuies, dispensando as condies de Gaussianidade e linearidade do modelo e
ainda possuindo adequadas condies de convergncia.
O ltro de partculas baseia-se na distribuio por importncia a qual denida
como sendo a distribuio a priori. Infelizmente o processo degenera-se quando o
tempo cresce, e no se consegue a distribuio a posteriori. Uma etapa adicional
acrescida para viabilizar o procedimento. Trata-se da amostragem com reposio
repetidas vezes. As partculas amostradas que so pouco representativas dentro da
distribuio so retiradas do processo e as partculas sobreviventes representam a
distribuio. Esta mesma distribuio usada como base para o prosseguimento do
mtodo em cada instante de tempo (AIUBE, 2005).
Thrun defende a ideia de que PF talvez seja o algoritmo que mais faz sucesso
quando o assunto AI.
Fazendo uma analogia entre a movimentao de agentes (pedestres) e a rob-
tica, escolheu-se usar ltros de partculas neste trabalho, devido aos bons resultados
obtidos por diversos autores quando refere-se a movimentao de robs (FOX et al.,
2000; REKLEITIS, 2004; RENS; FERREIN; POEL, 2009).
3.3 PROCESSO DE MARKOV PARCIALMENTE OBSERVVEL
Nas sees anteriores deixou-se claro que o espao de movimentao dos agen-
tes um ambiente parcialmente observvel. A ferramenta escolhida para solucionar
este tipo de problema, dentro da necessidade de uso de ferramentas probabilsticas,
foi o Processo de deciso de Markov parcialmente observvel (POMDP). Um ambi-
ente totalmente observvel aquele onde possvel ver todo o ambiente e tomar
decises baseando-se na resposta imediata dos sensores. A necessidade de usar
memria sensorial e de analis-la antes de tomar as decises mostra que o ambiente
parcialmente observvel.
No POMDP o agente precisa se lembrar das aes que executou e das observa-
es que percebeu ao longo do tempo e tentar usar essas informaes para tomar a
37
prxima deciso. Ao invs do agente estudar o estado atual do sistema, estuda-se
uma distribuio de probabilidade sobre os estados antes de tomar as decises.
Os POMDPs podem ser usados para modelar diversos tipos de problemas como
modelagem de comportamento em ecossistemas, diagnstico mdico (CASSANDRA;
LITTMAN; ZHANG, 1997).
3.3.1 Descrio Matemtica do Processo de Deciso de Markov Parcialmente Ob-
servvel
Um POMDP uma tupla (S, A, T, R, , O, P), onde:
a) S um conjunto de estados em que o processo pode estar;
b) A um conjunto de aes que podem ser executadas em diferentes pocas de
deciso;
c) T : S X A X S [0, 1] uma funo que d a probabilidade de o sistema passar
para um estado s

S, dado que estava no estado s S e a ao executada foi


a A;
d) R : S X A IR uma funo que d o custo (ou recompensa) por tomar uma
deciso a A quando o processo est em um estado s S;
e) o conjunto de observaes que so obtidas em cada perodo de deciso;
f) O: S X A () a funo de observao que d, para cada ao e estado resul-
tante, uma distribuio de probabilidade sobre possveis observaes (escreve-
se O(s

; a; o) para a probabilidade de se fazer a observao o, dado que o agente


tomou a ao a e acabou no estado s

);
g) P uma distribuio inicial de probabilidades sobre o conjunto de estados.
Os conjuntos S, A e sero considerados nitos. Ainda:
h) z denominado Horizonte de um POMPD, ou seja z o nmero de decises
possveis para a tomada de decises. O horizonte pode ser nito (quando h
um nmero xo de decises a tomar), innito (quando a tomada de deciso
feita repetidamente) ou indenido (semelhante ao horizonte innito, mas com
a possibilidade do processo parar se chegar a algum estado que tenha sido
marcado como nal).
38
i) so as polticas de deciso, ou regras de deciso. Uma regra de deciso para
um POMDP em uma poca de deciso k uma funo d
k
: S A, que determina
a ao a ser executada, dado o estado do sistema.
Uma poltica para umPOMDP uma sequncia de regras de deciso ={d
0
, d
1
, , d
z
}.
Normalmente se quer encontrar uma poltica que otimize um dado critrio de desem-
penho das decises (PELLEGRINI, 2006).
Alm dessas representaes, ainda necessrio denir o estado de informaes,
C
k
. Este denido como a representao do conhecimento que se tem sobre o sis-
tema no momento de se tomar uma deciso k. O estado de informaes composto
por uma distribuio de probabilidade sobre os estados nos primeiros momentos de
deciso, b
0
, e por um histrico completo de aes e observaes, desde os primeiros
momentos de observao e pode ser representado por C
k
= (b
0
, a
0
, o
0
, a
1
, o
1
, , a
k1
, o
k1
).
Dessa forma C(P) o espao de todos os estados de informao para um POMDP.
Pode-se dizer que um estado de informaes dividido em dois estados, o primeiro
representado por uma distribuio de probabilidade que representa o conhecimento
do agente sobre os estados, o segundo chamado de estado de crenas (belief). Este
representado por uma distribuio de probabilidades sobre os possveis estados do
sistema, ou seja, as crenas do agente sobre tal sistema. Para modicar um estado de
informao representado desta forma necessrio adicionar o par (a; o) com a ltima
ao e a observao resultante.
Ainda necessrio que seja criado um estimador de estados de informao, ,
para uma boa representao dos estados de informao C(P) em um POMDP. A cada
poca de deciso, o tomador de decises verica o estado de informao atual (C(P)),
a ltima ao executada e a ltima observao obtida do ambiente. A partir desses
dados, determina um novo estado de informao, que usado como entrada para
uma poltica , que determina a prxima ao a ser tomada (PELLEGRINI; WAINER,
2007).
Desta forma, o conjunto de aes planejadas (polticas) dever maximizar a funo
de recompensa (ou o retorno) acumulada ao longo do tempo ou minimizar a funo de
custo em todo o espao possvel. Uma poltica com tais caractersticas, ou seja, uma
poltica tima ser representada por

. Em episdios nitos, caso deste trabalho,


a funo de recompensa pode ser simplesmente a soma das recompensas de cada
instante de tempo, desde o instante inicial.
A representao para as funes timas podem ser dadas de diversas formas.
Desde Redes Neurais (LIN; MITCHELL, 1992), Discretizao (LOVEJOY, 1991; ROY,
2003) e Hiperplanos at Controladores (HANSEN; ZHOU, 2003) e Planos Condicio-
nais (KAELBLING; LITTMAN; CASSANDRA, 1998).
39
A escolha para a representao se d de acordo comas necessidades do trabalho.
No caso deste, mais coerente trabalhar com Controladores Estocsticos (POUPART;
BOUTILIER, 2003), devido necessidade da utilizao de distribuies de probabili-
dade para a gerao de cada ao de forma que estas possam minimizar os custos
da caminhada, fazendo com que as polticas sejam quase timas.
Com esses conceitos denidos, fez-se a escolha por uma estrutura hbrida entre
agentes BDI (Beliefs-Desires-Intentions - Crena-Desejo-Inteno) e POMDP (NAIR;
TAMBE, 2005), para caracterizar os agentes at ento citados com as necessidades
impostas por este projeto (necessidades comportamentais especcas de seres hu-
manos).
3.4 AGENTE BASEADO EM CRENA, DESEJO E INTENO
Agente BDI ummodelo losco proposto por Michael Bratman (1984). Oprprio
Bratman desenvolveu mais trabalhos nesta rea como Intention, Plans, and Practical
Reason (1987), mais recentemente Intention, Belief, and Instrumental Rationality
(BRATMAN, 2009) e um artigo intitulado Intention, Belief, Practical, Theoretical pre-
sente no livro Spheres of Reason: New Essays in the Philosophy of Normativity
(BRATMAN, 2010) dentre muitos outros. Todos na rea de inteligncia computacional.
Os agentes BDI so capazes de aes independentes e autnomas para atingir
objetivos para os quais foram projetados (PEREIRA, 2008). De maneira geral, pode-se
dizer que so agentes que decidem por si o que fazer; dada uma situao. Observa-
se, entretanto, que esta uma abordagem heurstica, onde um agente BDI constri
um plano para realizar uma determinada inteno, tenta execut-lo e, se falha, precisa
reconsiderar sua inteno ou formular outro plano e assim sucessivamente. Desta
forma, seu comportamento dado por tentativa e erro, geralmente impossibilitando
um comportamento timo se comparado aos modelos de teoria da deciso
10
. Ou-
tro fator importante que inuencia seu desempenho a dinmica do ambiente, que
pode fazer com que o agente passe mais tempo reconsiderando suas intenes do
que fazendo aes. Este balano entre o tempo que o agente passa deliberando e
o tempo que passa executando planos fundamental para um bom agente BDI. Por
outro lado, os POMDPs podem ser a abordagem ideal para problemas que se con-
centram na coordenao de sociedades de agentes e na existncia de incerteza de
10
A teoria da deciso uma cincia que trabalha com a tomada de decises racionais e consistentes
em situaes de incerteza, fornecendo um conjunto de conceitos e tcnicas para apoio do decisor.
O objetivo da Teoria da Deciso apoiar a escolha de uma ao (ou de uma estratgia) que seja
consistente com as alternativas, a informao, os valores e a lgica do decisor no momento da tomada
de deciso. O decisor o responsvel pela tomada de decises. Pode ser um nico individuo um
grupo, uma empresa ou mesmo uma nao.
40
aes e observaes em domnios do mundo real. A complexidade de se encontrar
uma poltica tima em modelos onde o espao de estados seja muito grande algumas
vezes intratvel, mas ainda parece ser uma das melhores solues para este tipo de
problema. Assim, a ideia de utilizar um algoritmo para construo de planos BDI ba-
seados em polticas timas obtidas atravs de POMDPs encaixa-se proposta deste
trabalho.
Oformalismo de um agente BDI baseia-se em ummodelo de ramicao de tempo
(EMERSON; HALPERN, 1986), no qual as variveis opinio, desejo e inteno, so
elas prprias estruturas de ramicao de tempo.
As crenas representam as informaes que o agente tem sobre o mundo e sobre
si prprio. Os desejos esto relacionados com os estados do ambiente que o agente
eventualmente deseje atingir, no entanto, os desejos no precisam obrigatoriamente
levar o agente a agir. O seja, os desejos so um conjunto de estados possveis de
onde o agente escolhe o que fazer. As intenes so caracterizadas por uma escolha
de um estado a ser atingido e por um certo grau de comprometimento a esta escolha.
Um agente BDI usa uma descrio BDI. Essa descrio denida como uma
tupla (S, A, T, B, D, I, Del, M), onde S, A e T so, respectivamente, o espao de estados,
o conjunto de aes e a funo de transio e:
a) B o conjunto de crenas, D o de desejos e I o de intenes;
b) Del o componente de deliberao;
c) M o componente de raciocnio meio-m.
Portanto considera-se que S, A e T so os mesmos para ambas as descries
(BDI e POMDP). Alm disso, considera-se que B e P representam a mesma ideia, ou
seja, identicam em que estado o agente se encontra.
Com estas equivalncias denidas, tem-se de um lado recompensas e polticas, e
de outro tem-se desejos, deliberao, raciocnio meio-m, e intenes. Na verdade,
como recompensas so meios de se determinar polticas, e desejos so um passo
para se determinar intenes, estes componentes podem ser ignorados. Finalmente
a relao que se considera com detalhes a entre polticas e intenes.
Modelos hbridos tm sido propostos para combinar as vantagens e superar as
desvantagens dos dois modelos, existindo diversas abordagens diferentes que mos-
tram a relao entre BDI e POMDP e como eles podem ser combinados para tra-
tar problemas de naturezas diversas (SIMARI; PARSONS, 2006; PARUCHURI et al.,
2006; NAIR; TAMBE, 2005). Por exemplo, um agente BDI com planos baseados em
41
POMDPs, ou um POMDP cuja poltica construda a partir de planos BDI, tm sido
apontados como solues para melhorar o desempenho de agentes BDIs ou a trata-
bilidade de modelos POMDPs, respectivamente (SIMARI; PARSONS, 2006)
3.4.1 Agentes BDI a partir de polticas timas de POMDPs
Como j foi escrito, inteno o estado que o agente se comprometeu a alcan-
ar. O termo i-plan denota uma sequncia de aes construdas para alcanar um
determinado estado, ou seja, para alcanar uma determinada inteno. Para resolver
essa questo, i-plans so relacionados compolticas, tendo como objetivo obter i-plans
atravs da soluo de um POMDP. Alguns exemplos podem ser vistos em (SIMARI;
PARSONS, 2006).
Nesta seo adota-se a notao utilizada por (SIMARI; PARSONS, 2006) pois esta
simplica a descrio BDI e POMDP para que seja possvel estabelecer relao entre
seus elementos.
Um i-plan, denotado como , possui indexao
i,s
, onde i a inteno do agente
e s seu estado atual. I-plans so sequncias de aes e
i
denota a i-sima ao em
, enquanto s

i
denota o i-simo estado que o agente planeja visitar enquanto executa
. Portanto, para um i-plan de tamanho p, o agente comea no estado s

0
e planeja
visitar os estados s

1
, s

2
, , s

p
. Se o agente precisar fazer uma reconsiderao, e uma
nova inteno for adotada o agente tambm ir precisar de um novo i-plan.
A utilidade esperada de um i-plan pode ser obtida da mesma forma que uma pol-
tica em um POMDP, estabelecendo-se um valor para cada ao em cada estado em
que executada. A diferena que em um i-plan considera-se apenas uma sequn-
cia no espao de estados e, na avaliao de uma poltica, considera-se as aes em
todos os estados. A princpio, o agente BDI ter a mesma abordagem para atravessar
o espao de estados. Selecionar uma inteno, identicar um i-plan para alcan-
ar sua inteno e executar seu i-plan at perceber que seu i-plan no ir alcanar
sua inteno ou que sua inteno no pode ser alcanada ou no a melhor inten-
o possvel. Nesse momento, o agente ir gerar um novo i-plan ou escolher uma
nova inteno e gerar um i-plan para alcan-lo e o processo ir se repetir (PEREIRA,
2008).
O resultado obtido nos trabalhos de (SIMARI; PARSONS, 2006) e (PEREIRA,
2008) o de que, dada uma poltica, que tem uma ao para cada estado, pos-
svel derivar um ou mais i-plans, determinando uma trajetria atravs do espao de
estados. Portanto, pode-se dizer que uma poltica incorpora um conjunto de i-plans.
42
3.4.2 Passagem de Poltica para I-Plans
Assume-se que uma poltica a soluo para um POMDP especicado, e que
tima (esta condio importante para os resultados que se querem obter). Entre-
tanto, de qualquer poltica possvel extrair valores de utilidade para os estados que
iro induzir , e estes podero ser usados para estabelecer i-plans.
De uma forma geral, para se atribuir valor para um i-plan necessrio que este
tenha, para cada ao adicionada ao plano, valores de custo no negativos, e que
estes valores dependam das recompensas dos estados que o agente planeja visitar.
A denio formal para um i-plan , segundo (SIMARI; PARSONS, 2006), dada
da forma a seguir:
Denio 3.4.1. Uma sequncia de aes
0
,
1
, ,
p
, chamada i-plan se as
aes
i
, com 0 i p, forem selecionadas para serem executadas uma de cada
vez, na ordem da sequncia para alcanar uma dada inteno.
Denio 3.4.2. Dado um i-plan =
0
,
1
, ,
p
, diz-se que p o tamanho de .
Denio 3.4.3. (Denio de Obedincia) Um i-plan de tamanho p obedece a uma
poltica se, e somente se, i, 1 i p :
i
=
_
s

i1
_
, onde s

i
o estado para qual o
agente est planejando chegar aps executar a ao
i
, e s

0
seu estado inicial.
Assim, um i-plan obedece a uma poltica se, e somente se, as aes prescritas
pelo i-plan so as mesmas prescritas pela poltica atravs dos estados intermedirios
do i-plan.
Denio 3.4.4. (Denio de Conformidade) Uma poltica est de acordo com um
i-plan de tamanho p se, e somente se, i, 1 i p :
i
=
_
s

i1
_
onde s

i
o estado
que resulta da execuo da ao
i
no estado s

i1
, e s

0
o estado no qual a primeira
ao executada.
Ou seja, uma poltica est de acordo com um plano, se para cada ao descrita
no plano a poltica recomenda a mesma ao.
Proposio 3.4.1. Seja <S, A, T, R, , O, P>umagente POMDP e uma poltica que
tima sob um critrio de mxima utilidade esperada. Seja < S, A, T, B, D, I, Del, M > um
agente BDI, onde M e Del so timos sob um critrio de mxima utilidade esperada.
Se o ambiente for parcialmente observvel, com S

sendo a contraparte parcialmente


observvel de S, e tambm no determinstico, isto , |T(s; a)| 1, ento i I, s

,
vlido que
i,s

obedece a .
43
Esta uma formalizao da relao entre polticas e i-plans. Esta correspondncia
vlida sob restritivas suposies, em particular se os requisitos (poltica, M e Del)
forem timos, mas garante que os i-plans gerados reetem uma poltica tima. Se
necessrio, pode-se relaxar a necessidade de um i-plan corresponder a uma poltica
tima, desta forma o i-plan criado com menos restries.
Fica realizada, desta forma, uma fundamentao terica abrangente e detalhada
das ferramentas utilizadas para a modelagem e simulao dos agentes inteligentes
deste trabalho. Todas essas ferramentas s podero ser utilizadas se for possvel
montar um planejamento adequado para a realizao das tarefas que os agentes pre-
cisaro desempenhar. Tal estratgia
11
precisar ser reformulada a cada deteco dos
sensores dos agentes. Assim, no captulo seguinte sero denidas algumas teorias
de planejamento e destas ser destacada a estratgia que abranger o hbrido de
agentes BDI e POMDPs, ou seja, os i-plans.
3.5 PLANEJAMENTO
Alguns autores como Peter Norvig
12
e Sebastian Thrun colocam o planejamento
como o ncleo da Inteligncia Articial.
Planejamento consiste em apresentar uma sequncia de aes que alcanaro
um objetivo. Para o caso de ambientes determinsticos e totalmente observveis, tc-
nicas de planejamento clssico, como algoritmos de busca, so sucientes. Entre-
tanto, em ambientes estocsticos, no determinsticos ou em ambos preciso pensar
em uma forma de relaxamento para tais algoritmos. Esse relaxamento, ou seja, esse
tipo de planejamento chamado de planejamento no-clssico.
Como j foi citado, o ambiente deste trabalho estocstico e mais especica-
mente, pode-se dizer que o ambiente possui um indeterminismo ilimitado.
Em ambientes com essa caracterstica um agente deve usar suas percepes
para descobrir o que est acontecendo enquanto o plano est sendo executado e,
possivelmente, modicar ou substituir o plano caso ocorra algo inesperado (NORVIG;
RUSSELL, 2004). Ambientes no-determinsticos obrigam os agentes a lidar com
informaes incompletas e incorretas. Incompletas pela prpria caracterstica do am-
biente e incorretas pois o ambiente no corresponde necessariamente ao modelo de
ambiente. Por exemplo: posso acreditar que ser servido ch s 15 horas, mas hoje
11
Planejamento ou Planning.
12
Peter Norvig diretor de pesquisa da Google Inc. Ele tambm membro da Associao Americana
de Inteligncia Articial e da Association for Computing Machinery. Norvig co-autor do livro Inteligncia
Articial: uma abordagem moderna. Antes de entrar no Google, ele era o chefe da Diviso de Cincias
da Computao na NASA Ames Research Center.
44
tomei suco de laranja nesse mesmo horrio.
O conhecimento correto e completo dependente da quantidade de indetermi-
naes existentes no ambiente. Se o indeterminismo limitado, as aes podero
ter efeitos imprevisveis, mas os efeitos possveis podem ser listados na classica-
o das descries de aes, ou seja, o espao amostral conhecido e enumervel.
Quando o ambiente possui indeterminismo ilimitado, o conjunto de precondies ou
efeitos possveis desconhecido ou grande demais para ser enumerado completa-
mente (NORVIG; RUSSELL, 2004). Neste caso, alguns mtodos de planejamento
podem ser adotados para suprir esta complexidade.
Alguns dos mtodos de planejamento para lidar com o indeterminismo so (NOR-
VIG; RUSSELL, 2004):
Planejamento sem sensores (sensorless planning): Tambm chamado plane-
jamento com conformao. Esse mtodo constri planos sequenciais que de-
vem ser executados sem percepo. O algoritmo de planejamento sem senso-
res deve assegurar que o plano atingir o objetivo em todas as circunstncias
possveis, independente do verdadeiro estado inicial e dos reais resultados das
aes. O planejamento sem sensores se baseia na coero ideia de que o
mundo pode ser forado a entrar em um determinado estado, mesmo quando o
planejador s tem informaes parciais a respeito do estado atual. A coero
nem sempre possvel, portanto o planejamento sem sensores frequentemente
inaplicvel.
Planejamento condicional: Essa abordagem lida com o indeterminismo limitado
construindo um plano condicional com diferentes ramicaes para as diferentes
contingncias que poderiam surgir. Da mesma maneira que no planejamento
clssico, o agente planeja primeiro e depois executa o plano que foi produzido. O
agente descobre qual parte do plano deve executar incluindo aes de deteco
no plano para testar a presena das condies apropriadas. Por exemplo, no
domnio de transporte areo, poderia ter planos como vericar se o aeroporto
de So Paulo est em operao . Nesse caso, voar para l; caso contrrio, voar
para o Rio de Janeiro;
Monitoramento e replanejamento de execuo. Na abordagem de replaneja-
mento de execuo, o agente pode usar tcnicas de planejamento clssicas
(sem sensores ou condicional) para construir um plano. Acoplado a essa abor-
dagem utiliza-se o monitoramento de execuo para julgar se o plano tem uma
previso referente situao real atual ou precisa ser revisto. O replanejamento
ocorre quando algo no funciona como esperado, assim o agente pode manipu-
lar o indeterminismo ilimitado.
45
Planejamento contnuo. Esse projetado para no nalizar o planejamento ao
longo da simulao. Assim, enquanto os outros planejadores vistos at o mo-
mento so projetados para alcanar um objetivo e depois parar, um planejador
contnuo projetado para persistir ao longo de toda a vida. Ele pode manipular
circunstncias inesperadas no ambiente, ainda que essas ocorram enquanto o
agente est no meio da construo de um plano. Ele ainda pode lidar com a
desistncia de objetivos e a criao de objetivos adicionais.
Esse dois ltimos itens sero amplamente utilizados e analisados neste trabalho.
Um agente de monitoramento de execuo capaz de monitorar a execuo de
suas aes e replanejar conforme necessrio. Os agentes deste tipo em geral imple-
mentam um dos seguintes tipos de monitoramento: de ao (considerado uma forma
mais simples) ou de plano (uma forma mais complexa). No primeiro caso, o agente,
em cada passo, verica o ambiente a m de avaliar se a prxima ao a ser execu-
tada ir funcionar. No segundo, mais complexo, uma vericao semelhante avalia
todo o restante do plano (PEREIRA; SAITO; PEDRUZZI, 2012). Um agente de repla-
nejamento sabe o que fazer quando ocorre algo inesperado, pois tem a capacidade
de chamar novamente um planejador para apresentar um novo plano que ir atingir o
objetivo. Esta checagem tem ainda a vantagem de detectar sucessos acidentais.
No caso de universos parcialmente observveis o fator complicante quando se
utiliza um monitoramento e replanejamento de execuo, que checar as precondi-
es pode envolver aes de sensoriamento, que afetam o prprio planejamento. O
agente deve focar-se, portanto, naquelas precondies que so mais importantes, tm
chance de falhar e no so demasiadamente custosas para perceber.
Um agente de planejamento contnuo, ao contrrio dos demais anteriormente
apresentados, no um simples resolvedor de problemas. um agente capaz de
persistir indenidamente no ambiente podendo receber novos objetivos e reformul-
los durante o planejamento (NORVIG; RUSSELL, 2004). O planejamento contnuo
construdo incrementalmente. A cada passo o agente checa suas percepes, resolve
falhas no seu plano e pode retornar uma ao que j esteja pronta para ser executada.
Ao perceber mudanas emsuas percepes, o agente inicia umprocesso de adap-
tao do plano, isto , um processo em que determinados tipos de falhas no plano so
identicados e corrigidos. Os tipos de correo de falhas so apresentados a seguir:
a) remoo de casualidades que no so mais garantidas;
b) extenso de uma probabilidade causal, pois uma condio pode ser promovida
por uma ao anterior sem causar conitos;
46
c) remoo de aes que tornaram-se redundantes;
d) remoo de uma ao para ser executada;
e) incluso de probabilidades para suprir uma condio que esteja aberta, podendo
envolver a criao de uma nova ao; incluso de novos objetivos e
f) remoo de objetivos que foram alcanados.
Este agente capaz de lidar com diversas diculdades do agente de replanejamento
tais como: atuar em tempo-real, detectar sucessos acidentais, formular seus prprios
objetivos e lidar com eventos inesperados que afetam planos futuros. Desta forma o
planejamento contnuo destaca-se para o uso neste trabalho por possuir caractersti-
cas que permitem modelar e simular o comportamento aproximado de raciocnio de
uma pessoa (PEREIRA; SAITO; PEDRUZZI, 2012).
3.6 VARIVEIS PSICOCOMPORTAMENTAIS
O comportamento humano real afetado por aspectos psicolgicos, biolgicos,
sociolgicos, antropolgicos, econmicos e polticos. Atravs do comportamento, a
pessoa d respostas a situaes, criadas por estmulos internos ou externos, procu-
rando satisfazer suas necessidades. A tomada de deciso e a execuo da alternativa
selecionada manifestam o comportamento do indivduo. O agente inteligente precisa
representar tais caractersticas de forma aproximada para que se possa dizer que se
tem um bom modelo (LARRAAGA, 2008).
Quando os agentes escolhem o percurso que faro para chegar a seus objetivos,
selecionam um conjunto de alternativas de um conjunto maior de possibilidades dis-
ponveis, procurando satisfazer suas necessidades de deslocamento. A seleo da
alternativa baseada em um conjunto de crenas, preferncias, averses, predisposi-
es internas, conhecimentos e julgamentos, baseados em um ser humano real, que
geram um sistema de valorao e determinam o melhor percurso a ser seguido. A
compreenso dessas preferncias, e a investigao das razes implcitas nas esco-
lhas possibilitam um planejamento do trajeto de forma mais adequada.
O primeiro trabalho que se refere ao estudo de comportamento de multides foi
publicado por Le Bon e intitulado A Study of the Popular Mind (2012). Com essa
obra introduziu-se na literatura de comportamento de pedestres a ideia de conscincia
coletiva.
No seu sentido comum a palavra multido signica uma reunio de indivduos
de qualquer nacionalidade, gnero, prosso, independente dos motivos que os tenha
47
reunido. Do ponto de vista psicolgico, a expresso multido assume um signi-
cado bastante diferente. Segundo Le Bon, sob certas circunstncias, e s nessas
circunstncias, uma aglomerao de pessoas apresenta caractersticas muito diferen-
tes daquelas dos indivduos que a compem. Os sentimentos e ideias tendem a se
generalizar fazendo com que o grupo siga em uma mesma direo, e a personalidade
consciente individual desaparece. A mente coletiva transitria, mas apresenta ca-
ractersticas muito bem denidas. Ainda de acordo com Le Bon, uma multido onde
tais caractersticas podem ser observadas considerada uma multido organizada,
ou ainda, uma multido psicolgica. Assim a multido caracterizada como um nico
bloco (ou agente) e ca sujeita lei de unidade mental das multides.
Quando a referncia o pnico, um dos precursores Quarantelli (1957), funda-
dor do Centro de Pesquisas de Desastres da Universidade de Delaware. Apesar de ter
publicado seus trabalhos mais signicativos nos anos 50, suas ideias so semelhantes
aos conceitos atuais empregados em situaes de pnico utilizados em modelagem.
O motivo para Quarantelli ter seu conceito de pnico to atual se d por ter baseado
seus trabalhos em estudos de socilogos referentes ao comportamento humano em
situaes de desastres naturais e tecnolgicos. De acordo com os socilogos pes-
quisados por Quarantelli, o pnico entendido como uma disfuno comportamental
de fuga da realidade, gerada por motivo fortuito, mas envolvendo perigo eminente.
Tambm armam que mesmo nesse estado imocional alterado, existe estruturao do
raciocnio, sendo possvel denir objetivos e aes para alcanar metas.
Em 1965 uma grande contribuio para o estudo de fugas em situaes de pnico
foi feita por Brown (1965). Seu livro intitulado Social Psychology traz explicaes so-
bre nveis de aceitao de risco em tomadas de deciso em grupo. Brown defende que
em uma vasta gama de decises, o risco moderado normalmente aceitvel individual-
mente torna-se expressivo e saliente numa discusso em grupo. Ou seja, quando o
grupo em fuga atinge certo nmero de pessoas, a tomada de decises passa ser mais
complexa e o processo de aceitao do risco passa a ser bem mais lento e exigente.
Turner e Killian (1972) defendem a teoria de normas emergentes. A teoria prope
que as multides normalmente desenvolvem padres nicos de comportamento, e
que estas normas atpicas exercem uma poderosa inuncia no comportamento cole-
tivo. O normador pode ser um indivduo (lder) ou regras pr-determinadas. Anderson
descreve que mesmo em ambientes emergentes sem um lder especco, a massa se
benecia quando as orientaes sobre a conduta que deve ser tomada em casos de
situaes de pnico j esteja denida. Assim, mensagens de voz, placas, etc facilitam
a sada dos indivduos em um ambiente catico.
Desta forma, pode-se classicar as teorias explicativas do comportamento coletivo
48
em trs tipos: teorias do contgio, de que exemplo a obra de Gustave Le Bon, basea-
das na rpida comunicao e na aceitao de uma liderana; teorias da convergncia,
baseadas na ideia de uma partilha de predisposies; e as teorias das normas emer-
gentes, que encaram o comportamento coletivo como um comportamento que emerge
em situaes especiais mas que ainda assim regulado por normas sociais.
Algumas variveis psicocomportamentais so observadas com mais frequncia
nos casos de:
Caminhada normal
1. Pedestres sentem averso em tomar desvios ou andar em sentido contrrio
ao objetivo, mesmo que este esteja congestionado. No entanto, h tambm
algumas evidncias de que os pedestres normalmente escolhem o cami-
nho mais rpido para seu prximo destino, mas no o mais curto (GANEM,
1998). Em geral, os pedestres levam em conta desvios, bem como o con-
forto de andar, minimizando assim o esforo para chegar ao seu destino
(HELBING; KELTSCH; MOLNR, 1997).
2. Os pedestres preferem andar com uma velocidade individual desejada, que
corresponde velocidade mais confortvel (que consuma menos energia)
(WEIDMANN, 1993), desde que no haja a necessidade de caminhar mais
rpido a m de alcanar o objetivo a tempo. As velocidades desejadas den-
tro de multides de pedestres so distribuies Gaussianas com um valor
mdio de cerca de 1, 34 m/s, e um desvio padro de cerca de 0, 26 m/s
(HENDERSON, 1971). No entanto, a velocidade mdia depende da situ-
ao (ULLRICH, 1967; PREDTETSCHENSKI; MILINSKI, 1971), gnero e
idade, tempo do dia, nalidade da viagem, etc (WEIDMANN; BUCHMUEL-
LER, 2006).
3. Os pedestres mantm uma certa distncia em relao a outros pedes-
tres e fronteiras (de ruas, paredes e obstculos; (BRILON; GOSSMANN;
BLANKE, 1994; BOARD, 1985). Esta distncia diminui se a demanda de
velocidade aumenta, e a densidade nessas fronteiras cresce proporcional-
mente a esse aumento de velocidade (pressa de cada indivduo).
Pnico
1. Em situaes de evacuao com pnico os agentes tendem a car mais
nervosos, ou seja, tendema desenvolver aes cegas (STEINBERG, 2005).
2. As pessoas tendem a caminhar com velocidades consideravelmente mais
altas (PREDTETSCHENSKI; MILINSKI, 1971).
49
3. Os indivduos comeam a empurrar, e as interaes entre as pessoas se
tornam de natureza fsica (HELBING; MOLNR, 1995).
4. A movimentao, em particular a passagem em gargalos, frequentemente
tornam-se descoordenadas (MINTZ, 1951).
5. As interaes fsicas em multides congestionadas podem causar presses
perigosas de at 4.500 Newtons por metro (ELLIOTT; SMITH, 1993; TUR-
NER; KILLIAN, 1972) que podem fazer com que barreiras de ao sejam
entortadas ou at derrubar paredes de tijolos.
6. A fuga retardada por pessoas cadas ou feridas que se transformam em
obstculos (HELBING; MOLNR, 1995).
7. As pessoas tendem a mostrar comportamento de rebanho, ou seja, fazer o
que outras pessoas fazem (QUARANTELLI, 1957; KEATING, 1982).
8. As sadas alternativas so muitas vezes ignoradas ou no utilizadas de
forma eciente em situaes de fuga (KEATING, 1982; ELLIOTT; SMITH,
1993).
9. o movimento dos pedestres usurios de um sistema no so necessaria-
mente em linha reta, mas aleatrios em uma faixa do terreno (BENTHORN;
FRANTZICH, 1998).
A pesquisadora Angela Behrendt
13
, vem investigando as reas cerebrais que de-
terminam caractersticas de pensamentos. Behrendt divide essas caractersticas em:
pensamento nico, especializado, situacional, interligado, iterativo, dominante, male-
vel e integral; e determina dentro dessas caractersticas o que denomina de Quatro
Identidades (BEHRENDT, 2011).
As Quatro identidades so divididas em:
1. O ser Racional - Este capaz de analisar, quanticar. lgico, crtico, realista.
Gosta de nmeros, sabe sobre dinheiro, sabe como as coisas funcionam.
2. O ser Experimental - Este infere, imagina, especula, assume riscos, impetuoso,
quebra as regras, gosta da surpresa, curioso, joga.
3. O ser Custdia - Este toma medidas preventivas. Estabelece procedimentos.
Faz as coisas. convel, oportuno. Planeja.
4. O ser Emotivo - Este sensvel aos outros. Gosta de ensinar. Gosta de tocar.
solidrio, expressivo, emotivo. Fala muito e sente.
13
Angela Behrendt professora na Universidade de Mlaga - Espanha.
50
Os agentes sero divididos em grupos, de acordo com a pesquisa de Behrendt,
considerando, que tais caractersticas podem coexistir em um mesmo agente, sendo
que tem-se como hiptese que, uma das identidades dominante. Desta forma, pode-
se classicar as possveis reaes que um agente, por exemplo, com identidade raci-
onal, teria.
Portanto, possvel citar algumas reaes provveis de cada uma das identidades,
respectivamente aos itens anteriores:
1. Analisa os fatos. Lida de forma lgica e racional.
2. Visualiza os fatos. Lida de forma intuitiva e holisticamente.
3. Organiza os fatos. Lida de forma realista e cronologicamente.
4. Sente os fatos. Lida expressivamente e interpessoalmente.
Para a modelagem dos agentes deste trabalho, usa-se como hiptese que as va-
riveis psicocomportamentais esto descritas em funo das quatro identidades com-
portamentais, denindo dessa forma: agentes Racionais, agentes Custdias, agentes
Experimentais e agentes Emotivos. Cada um desses grupos de agentes sero ali-
mentados pelas demais caractersticas referenciadas quando se trata de situaes de
estresse. Essa conveno simplicadora para as variveis psicocomportamentais ser
dada visando uma caracterizao de forma similar descrio de cada personalidade
denidas por Behrendt.
3.7 CURVAS DE BZIER
As curvas de Bzier sero utilizadas para modelar a caminhada dos agentes BDI.
A escolha por esse padro de curva se d pela semelhana observada em suas inter-
polaes e o que acontece quando pedestres se locomovem.
O conceito matemtico da Curva de Bzier foi originalmente desenvolvido pelo
francs Pierre Bzier para a indstria automobilstica, nos anos 60 (BZIER, ). A pro-
posta de Bzier foi a construo de uma ferramenta de desenho que usava o conceito
matemtico de aproximaes polinomiais, com ajustes muito suaves, para que fosse
possvel trabalhar o designe dos carros modernos sem abrir mo da agilidade compu-
tacional para a soluo de tais aproximaes (ALVES, 2013).
Com os conceitos que sero apresentados neste captulo possvel vericar que
caractersticas como a velocidade mdia de um pedestre, so preservadas quando
esse mesmo pedestre caminha sobre uma curva de Bzier. A velocidade instantnea
51
dos pedestres ca representada e dependente do raio de curvatura da Bzier, sendo
que para raios maiores, a velocidade maior e para raios menores a velocidade
menor. Alm disso, esse tipo de curva possui propriedades inerentes de diferenciabi-
lidade que lhe garantem caractersticas como: continuidade, suavidade, etc, e, desta
forma, a representao da caminhada de pedestres se d de forma adequada e similar
ao que ocorre no real.
Originalmente Bzier baseou-se em princpios geomtricos
14
, porm mais tarde,
Forrest (1990), Gordon e Riesenfeld (1974) mostraram que o resultado equivalente
base de Bernstein, ou funo de aproximao polinomial.
A curva de Bzier emprega no mnimo 2 pontos (ALVES, 2013), chamados de
pontos de controle, para sua denio, podendo chegar a n pontos. Por exemplo,
sua forma cbica denida por quatro pontos sendo: 2 pontos ncoras ou pontos
extremos e dois pontos intermedirios ou pontos de controle, que no passam pela
curva, mas denem sua forma. A linha que une um ponto de controle anterior, (P
0
), a
um outro ponto de controle na sua sequncia, (P
1
), a reta tangente a curva no ponto
de controle anterior, (P
0
), e, por isso, ela que determina a declividade da curva neste
ponto, como pode ser observado na Fig. (2).



3


2


FIGURA 2: Construo da curva Bzier cbica.
Uma curva de Bzier de grau n determinada por um conjunto de pontos de
controle P
i
, i = 0, , n, tais que estes formam um polgono caracterstico denominado
de polgono de Bzier ou polgono de controle, o qual dene por si s a tendncia da
forma de uma curva de Bzier.
A notao para a teoria das curvas Bzier ser dada da forma paramtrica, por
ser a notao que melhor se apresenta quando h necessidade de uma posterior
resoluo computacional.
A forma paramtrica permite uma descrio uniforme dos diferentes tipos de cur-
vas atravs da adoo de um intervalo xo de variao da coordenada paramtrica.
Geralmente utiliza-se o intervalo [0, 1].
14
Algoritmo de Casteljau
52
Uma curva de Bzier denida como (DIAS, 2000):
B(t) =
n

i=0
P
i
J
n,i
(t) 0 t 1 (14)
onde P
i
so os pontos de controle e J
n,i
(t) so polinmios de Bernstein, tambm cha-
mados de funes de mistura e so dados por:
J
n,i
(t) =C
i
n
t
i
(1t)
ni
(15)
com C
i
n
=
n!
i!(ni)!
. Desta forma, a equao de Bzier para um segmento de curva
paramtrica a combinao linear entre polinmios de Bernstein e os vrtices do
polgono de Bzier. O grau da funo de mistura sempre uma unidade a menos que
o nmero de pontos do polgono de denio.
A equao para a curva de Bzier pode ser expressa na forma matricial. Assim,
para n = 3 (a maioria dos projetos de modelamento utilizam uma curva de grau 3 para
denir a estrutura desejada) tem-se:
B(t) =
_
(1t)
3
3t(1t)
2
3t
2
(1t) t
3

_
P
0
P
1
P
2
P
3
_

_
(16)
Desenvolvendo e agrupando os termos do parmetro pode-se reescrever como:
B(t) =
_
t
3
t
2
t 1
_
_

_
1 3 3 1
3 6 3 0
3 3 0 0
1 0 0 0
_

_
_

_
P
0
P
1
P
2
P
3
_

_
(17)
Observa-se que as funes de Bernstein so o elemento chave para denir o com-
portamento das curvas de Bzier.
3.7.1 Propriedades das Curvas de Bzier
Duas propriedades das curvas de Bzier so fundamentais (DIAS, 2000):
1. Conhecer o comportamento da tangente curva;
2. Calcular a curvatura sobre ela.
53
Observe que a curva paramtrica cbica de Bzier interpola os pontos extremos
do conjunto de vrtices ao ser feito t = 0 e t = 1 na Eq. (14).
B(0) = P
0
B(1) = P
3
(18)
Ao diferenciar a Eq. (17) e rearranjando os termos, obtm-se:
B

(t) = 3
_
(1t)
2
2t(1t) t
2
_
_

_
(P
1
P
0
)
(P
2
P
1
)
(P
3
P
2
)
_

_
(19)
Ou seja, a tangente curva uma forma parablica, que inuenciada por vetores
formados pelos vrtices do polgono de controle. Quando t = 0 e t = 1, obtm-se da
Eq. (19) que:
B

(0) = 3(P
1
P
0
)
B

(1) = 3(P
3
P
2
)
(20)
Isso mostra que o vetor formado pelos pontos extremos e os pontos intermedirios,
P
1
e P
2
, respectivamente, (ampliados 3 vezes) denem vetores tangentes nos pontos
extremos. Desta forma, a curva de Bzier fornece o controle direto sobre os veto-
res tangentes ao pontos nos nais da curva, atravs dos pontos vizinhos aos pontos
extremos.
Diferenciando duas vezes a Eq. (17) e rearranjando os seus termos obtm-se a
segunda derivada da curva em funo dos pontos de controle, dado por
B

(t) = 6
_
(1t) t
_
_
(P
2
2P
1
+P
0
)
(P
1
2P
2
+P
3
)
_
(21)
o que mostra que a segunda derivada nos pontos extremos determinada pelos vr-
tices vizinhos consecutivos. Isto fornece o controle da continuidade de curvatura da
curva no ponto de juno, ao precisar interpolar um conjunto de pontos formado por
segmentos de curvas de Bzier.
3.7.2 Propriedades das funes de Bernstein
As funes de ajustes ou de mistura das curvas de Bzier dadas em termos das
funes de Bernstein tem um papel preponderante na forma e no controle dessas
curvas (DIAS, 2000). Assim, sero enumeradas algumas de suas propriedades e, em
alguns casos, exemplicadas.
54
1. Positividade
0 J
n,i
(t) 1, t [0, 1] (22)
2. Partio da Unidade
n

i=0
J
n,i
(t) = 1, t [0, 1] (23)
3. Recurso
J
n,i
(t) = (1t)J
n1,i
(t) +tJ
n1,i1
(t), i = 0, , n (24)
4. Simetria
J
n,ni
(t) = J
n,i
(1t) (25)
5. Funo Diferencivel
J

n,i
(t) = nJ
n1,i1
(t) J
n1,i
(t), i = 0, , n (26)
6. Propriedades Geomtricas nos Pontos Finais
De acordo com a propriedade de positividade das funes de Bernstein, obtm-
se que:
B(0) = P
0
B(1) = P
n
(27)
Usando a Eq. (26) pode-se obter:
B

(t) =
n

i=0
J

n,i
(t)P
i
= n
n

i=0
J
n1,i1
(t) J
n1,i
(t)P
i
= n
n

i=0
J
n1,i1
(t)(P
i
P
i1
)
(28)
Desta forma possvel escrever que o valor da tangente :
B

(0) = n(P
1
P
0
)
B

(1) = n(P
n
P
n1
)
(29)
Continuando essa idia tem-se:
B

(0) = n(n1)[(P
2
P
1
) (P
1
P
0
)]
B

(1) = n(n1)[(P
n
P
n1
) (P
n1
P
n2
)]
(30)
55
Desta forma, a ksima derivada nos pontos extremos dada por:
B
k
(0) =
n!
(nk)!
k

i=0
(1)
ki
C
i
k
P
i
B
k
(1) =
n!
(nk)!
k

i=0
(1)
i
C
i
k
P
ni
(31)
7. Propriedade do Contorno Convexo
A condio de positividade garante que a curva de Bzier que completamente
dentro do contorno convexo formado pelos vrtices do polgono de controle. As-
sim, pode-se armar que a curva de Bzier a soma da mdia dos pesos dos
vrtices, ponderado pelas funes de Bernstein e por isso elas so tambm
chamadas de funes peso. Assim, as curvas de Bzier caem sempre dentro
do contorno convexo dos n +1 vrtices de controle. Uma forma de visualizar,
no plano o contorno convexo formado pelos pontos de controle dado pela pas-
sagem de um elstico atravs deles formando um polgono limite de todos os
pontos.
8. Propriedade de Invarincia Geomtrica
A forma da curva de Bzier determinada somente por seus vrtices e no
h qualquer relacionamento com o sistema de coordenadas usado, como co-
mum para cuvas paramtricas em geral. A propriedade da partio da unidade
garante que a relao entre a curva e o polgono de controle seja invariante a
transformaes de sistema de coordenadas. Isso signica que as transforma-
es geomtricas de translao, rotao e escalamento, mais o cisalhamento,
inferidas curva de Bzier precisam ser aplicadas somente ao polgono de con-
trole, sem a necessidade de transformar cada ponto da curva em si.
9. Propriedade de Recurso Linear
A propriedade de recurso pode ser usada para construir uma curva J
n,i
a partir
do conhecimento dos polinmios de Bernstein de mais baixa ordem.
3.7.3 Algoritmo de De Casteljau para soluo da curva de Bzier
O Algoritmo de De Casteljau um mtodo recursivo para calcular polinmios na
forma de Bernstein ou da Curva de Bzier. Assim, as funes de recurso de Berns-
tein conduzem a gerar o algoritmo de De Casteljau para o clculo de B(t) para um
determinado valor de t (DIAS, 2000).
56
B
i,l(t)
= (1t)B
i,l1(t)
+tB
i+1,l1(t)
,
t [0, 1], i = 0, , n1, l = 1, , n
(32)
onde B
i,0
= P
i
, i = 0, , n. O ndice l determina a ordem da recurso e o ndice i a
ordem dos pontos auxiliares.
B
0,0 B
3,0
B
2,0 B
1,0
B
0,1
B
1,1
B
2,1
B
0,2
B
1,2 B
0,3
FIGURA 3: Recurso de De Casteljau.
Observa-se que a recurso dos coecientes binomiais assegura a recurso das
funes de Bernstein e por outro lado a recurso das funes de Bernstein garante a
recurso do algoritmo de De Casteljau.
Ento, seja uma curva de Bzier denida por um conjunto de pontos de controle
P
i
, i = 0, , 3, e se quer calcular um ponto sobre a curva em t =
1
3
ou seja, B(
1
3
). Neste
caso, para cada valor de l = 1, , 3, deve-se fazer:
1. Da Eq. (32) pode-se obter o conjunto de pontos da primeira recurso B
i,1
_
1
3
_
,
onde l = 1. Assim, tem-se:
B
i,1
_
1
3
_
=
_
1
1
3
_
B
i,0
+
1
3
B
i+1,0
=
_
1
1
3
_
P
i
+
1
3
P
i+1
, i = 0, , 2.
(33)
2. para B
i,2
_
1
3
_
, ou seja, l = 2, tem-se:
B
i,2
_
1
3
_
=
_
1
1
3
_
B
i,1
+
1
3
B
i+1,1
, i = 0, , 1. (34)
3. para B
i,3
_
1
3
_
, ou seja, l = 3, tem-se:
B
i,3
_
1
3
_
=
_
1
1
3
_
B
i,2
+
1
3
B
i+1,2
, i = 0. (35)
O resultado do algoritmo pode ser guardado numa matriz da forma:
_

_
B
0,0
B
1,0
B
0,1
B
2,0
B
1,1
B
0,2
B
3,0
B
2,1
B
1,2
B
0,3
_

_
57
onde a coluna 1 contm os pontos de controle inicial, e as colunas 2 a 4 representam
os elementos calculados em cada passo da recurso, gerando um algoritmo simples
que se baseia em subdiviso de retas.
Um exemplo geomtrico com alguns valores para t entre 0 e 1 pode ser visto na
Fig. (4):
(a) Ponto na curva de Bzier para
t = 0, 06
(b) Ponto na curva de Bzier para
t = 0, 22
(c) Ponto na curva de Bzier
para t = 0, 34
(d) Ponto na curva de Bzier
para t = 0, 56
(e) Ponto na curva de Bzier para
t = 0, 84
(f) Ponto na curva de Bzier para
t = 0, 98
FIGURA 4: Tem-se que P
0
= B
0,0
, P
1
= B
1,0
, P
2
= B
2,0
e P
3
= B
3,0
. FONTE: Wikimedia.org.
Autor: Phil Tregoning, 2007.
Para provar o que foi obtido no ltimo passo do algoritmo, ou seja, que o ponto
B
0,n
(t) um ponto sobre B(t) pode ser usado o mtodo indutivo. Ou seja, pela recurso
tem-se que:
B
i,n
(0) =
n

i=0
J
n,i
(t)P
i
(36)
Ao fazer n = 1, a Eq. (36) vlida pois a curva de Bzier de primeiro grau
(uma reta paramtrica) e a curva e polgono de controle so coincidentes. Assume-se
um polgono de controle com vrtices P
0
, P
1
, , P
n
. Usando a frmula recursiva (32)
obtem-se:
B
i,n1
(t) =
n1

i=0
J
n1,i
(t)P
i
=
n

i=0
J
n1,i
(t)P
i
,
pois J
n1,n
(t) = 0.
Ao assumir um outro polgono de controle, com vrtices P
1
, P
2
, , P
n
e usando
frmula recursiva (32) tem-se:
B
i,n1
(t) =
n1

i=0
J
n1,i
(t)P
i+1
=
n

i=0
J
n1,i1
(t)P
i
,
58
pois J
n1,n
(t) = 0.
Ainda, de acordo com a Eq. (36), pode-se escrever que:
B
0,n
(t) = (1t)B
0,n1
(t) +tB
1,n1
(t)
= (1t)
n

i=0
J
n1,i
(t)P
i
+t
n

i=0
J
n1,i1
(t)P
i
=
n

i=0
_
(1t)J
n1,i
(t)P
i
+tJ
n1,i1
(t)P
i
_
(37)
e pela equao de recurso dos polinmios de Bernstein pode-se escrever
B
0,n
(t) =
n

i=0
J
n,i
(t)P
i
que demonstra a Eq. (36).
Deve-se observar que o algoritmo de De Casteljau aplicado para cada parmetro
t da curva pode ser usado para gerar a prpria curva paramtrica.
Esse mtodo de fcil implementao computacional servir para gerar as curvas
de Bzier que sero, como dito anteriormente, o traado descrito pelos agentes ao
caminharem pelo ambiente.
3.8 INTERAES GEOMTRICAS
Algumas interaes geomtricas sero necessrias para que seja possvel repre-
sentar visualmente o ambiente e os agentes. Tais interaes tambm sero utilizadas
para justicar algumas mudanas de comportamento, como por exemplo, evitar obs-
tculos.
Desta forma, os agentes sero representados por cilindros, para que se tenha se-
melhana ao corpo de um pedestre, podendo denir altura e dimetro de cada cilindro.
FIGURA 5: Comparao entre as dimenses de pedestres e cilindros.
59
As paredes e pisos sero representados por paraleleppedos.
Uma importante parte das interaes geomtricas est na representao dos sen-
sores dos agentes. Deniu-se que cada agente possuir um cone de viso (FREITAS,
2014; STEMMER et al., 2005) e atravs dele identicar obstculos, paredes, portas e
outros agentes. O cone de viso ser o sensor de cada agente e este ser respons-
vel por toda a informao e observao obtida. A representao geomtrica do cone
de viso, como o prprio nome sugere, um cone, Fig. (6).
FIGURA 6: Representao do Cone de Viso girando pelo ambiente.
As interaes entre essas formas geomtricas sero, a seguir, denidas.
3.8.1 Deteco de um ponto dentro de um cone
O problema de detectar um ponto dentro de um cone pode ser resolvido de diver-
sas formas. A maneira escolhida para este trabalho se d por sua simplicidade de
programao.
Seja um cone de revoluo gerado pelo vetor u que gira ao redor do eixo das
abscissas conforme se observa na Fig. (7).
u
x
y
h
h
u
O

FIGURA 7: Cone de Revoluo


Seja um ponto P no plano cartesiano que origina o vetor OP =

k, conforme Fig. (8).


60
u
x
y
h O
k P
FIGURA 8: Ponto P em xOy
Para garantir que P est dentro do cone gerado por u necessrio vericar duas
condies:
1. Comprimento de

k deve ser menor do que comprimento de

h;
2. Angulo formado entre u e

k mais o ngulo formado entre

k e

h deve ser igual ao


ngulo formado entre u e

h.
Se tais condies forem satisfeitas, pode-se dizer que P pertence ao cone gerado
por u.
3.8.2 Ponto de Interseco entre retas nitas
Da mesma forma que nas outras interaes geomtricas, h diversas formas de
se calcular a interseco entre duas retas nitas e encontrar seu ponto de cruzamento,
se existir.
Tambm pela simplicidade de programao opta-se pela teoria a seguir.
Sejam trs pontos em um plano cartesiano, A, B e C. A soluo consiste em
determinar primeiramente se esses trs pontos podem ser listados em sentido anti-
horrio, conforme Fig. (9).
61
0
A(x
a
, y
a
)
B(x
b
, y
b
)
C(x
c
, y
c
)
x
y
FIGURA 9: Plano cartesiano com pontos A, B e C.
Para que isso seja vericado necessrio calcular a inclinao do segmento de
reta

AB e do segmento de reta

AC. Se a inclinao de

AB for menor do que a inclinao
de

AC ento os trs pontos podem ser listados em sentido anti-horrio.
Agora, sejam dois segmentos de reta

AB e

CD. Se os pontos (A,C, D) estiverem
em um sentido (horrio ou anti-horrio) diferente do sentido dos pontos (B,C, D) e o
mesmo puder ser constatado para os pontos (A, B,C) e (A, B, D), ou seja, A, B e C est
listado em um sentido oposto a A, B e D, ento pode-se armar que os segmentos de
reta

AB e

CD se interceptam.
Aps conferir a interseco, ainda necessrio calcular o ponto onde esses seg-
mentos de reta se cruzam. Sejam ainda os pontos citados: A(x
a
, y
a
), B(x
b
, y
b
), C(x
c
, y
c
)
e D(x
d
, y
d
). Para encontrar o ponto P(x, y) de interseco entre os segmentos

AB e

CD
faz-se:
P(x, y) =
_
(x
a
y
b
y
a
x
b
)(x
c
x
d
)(x
a
x
b
)(x
c
y
d
y
c
x
d
)
(x
a
x
b
)(y
c
y
d
)(y
a
y
b
)(x
c
x
d
)
,
(x
a
y
b
y
a
x
b
)(y
c
y
d
)(y
a
y
b
)(x
c
y
d
y
c
x
d
)
(x
a
x
b
)(y
c
y
d
)(y
a
y
b
)(x
c
x
d
)
_
(38)
Desta forma pode-se usar o ponto P de interseco entre os segmentos de reta

AB e

CD.
3.8.3 Colises entre formas geomtricas dinmicas
Sefor possvel dizer que as formas geomtricas que compem um plano cartesi-
ano se movimentam dentro deste e podem colidir, precisamos de uma equao que
descreva quando ocorre essa coliso. As formas geomtricas que compem nosso
ambiente so basicamente: cilindros e paraleleppedos. Para determinar suas coli-
ses necessrio conhecer seus pontos de gravidade ou centroides. Assim, conforme
62
se pode vericar na Fig. (10), cada slido geomtrico possui um centroide, C
1
e C
2
, e
a distncia desse centroide at as paredes do slido, r
1
e r
2
.
C
1
C
2
r
1 r
2
FIGURA 10: Centroides
Desta forma, para a coliso entre agentes tem-se que:
Se a distncia entre os dois centroides, d, for maior do que r
1
+r
2
, diz-se que os
slidos geomtricos no colidem.
Se r
1
+r
2
= d, ocorre coliso, conforme se observa em Fig. (11).
C
2
r
1 r
2
C
2
r
1
r
2
d
d > r
1
+r
2
d = r
1
+r
2
d C
1 C
1
FIGURA 11: Coliso entre cilindros.
J a coliso entre paredes e agentes dada em funo de dois vetores, u e v de
acordo com a Fig. (12). Tais vetores tm origem no centroide do agente e apontam
para os pontos de incio e nal da linha que passa pelo centroide da parede.

u
u
v
PAREDE
AGENTE
FIGURA 12: Coliso entre Paraleleppedos e Cilindros.
A coliso dada quando o ngulo entre esses dois vetores for maior do que
(180

tol)),
63
onde tol a a tolerncia de controle dada pelo ngulo que os vetores formam com a
linha central da parede quando a face do formato geomtrico representativo do agente
est em contato com a face do paraleleppedo representativo da parede.
3.9 PYTHON
Python uma linguagemde programao interpretada, bastante portvel, de cdigo-
fonte aberto e disponvel para todos os sistemas operacionais. Uma linguagem inter-
pretada aquela que no precisa ser compilada, ou seja, traduzida para uma lin-
guagem de mquina. A linguagem apenas lida por um outro programa, chamado
interpretador, que traduz para a mquina o que o programa deseja realizar. Apresenta
semntica dinmica, um moderno mecanismo de tratamento de erros e excees. O
Python possui uma forma eciente de acesso e reutilizao de cdigo com o uso de
mdulos, coleta de lixo automtica, recursos avanados de manipulao de textos,
listas e outras estruturas de dados, como dicionrios, por exemplo (PETTELE, 2011).
Alm disso, o Python possui uma sintaxe simples, quase como um pseudo-cdigo.
Em Python as funes so tratadas como objetos (incluindo herana mltipla),
caracterstica de linguagens de programao funcional como Lisp
15
, muito utilizada
em aplicaes de inteligncia articial (DESCONHECIDO, 2012).
Os mdulos, em Python, so colees de funes. Possui mdulos como o cgi
(para programao de pginas dinmicas), ftplib (para montagem de scripts para inte-
rao comservidores FTP), gzip (para leitura e escrita de arquivos comprimidos), math
(para utilizao de funes matemticas), re (para busca de texto com expresses re-
gulares, caracterstica da linguagem Perl), string (para operaes com strings), time
(para obteno de hora atual e converso de formatos de data), xmllib (para interpre-
tao de arquivos em formato XML). H tambm mdulos para computao cientca
e AI como por exemplo: NumPy, Scipy, VPython, Pymc, descritos a seguir.
O NumPy um conjunto de bibliotecas para Python que oferecem vrias funcio-
nalidades para manipulao de conjuntos de objetos chamados arrays. Estes, por sua
vez, podem ter qualquer nmero de dimenses. A vantagem destas extenses que
possvel processar grandes conjuntos de forma to rpida quanto os resultados das
linguagens no interpretadas de mais baixo nvel. Pode-se, por exemplo, trabalhar
com manipulao de grandes conjuntos numricos, que o caso do processamento
de imagens. Alm disso, a biblioteca NumPy possui diversas funes e operaes
sosticadas incluindo ferramentas para lgebra linear, transformadas de Fourier e fer-
15
A linguagem Lisp foi projetada primariamente para o processamento de dados simblicos. uma
linguagem formal matemtica. (MCCARTHY, 1962)
64
ramentas para gerao de nmeros aleatrios.
O SciPy um pacote da linguagem Python que implementa diversas tcnicas teis
na computao cientca. Utiliza como base o NumPy para lidar ecientemente com
grandes quantidades de nmeros, e implementa em linguagem C diversos algoritmos
numricos e simblicos para o processamento matemtico (PYSCIENTE, 2012). Entre
as capacidades do SciPy, podem-se:
1. Algoritmos Genticos
2. Estatsticas
3. Otimizao
4. Integrao numrica
5. Processamento de sinais e imagens
6. Soluo de equaes diferenciais
7. Funes especiais (Bessel, etc.)
8. Polinmios
O Vpython a ferramenta responsvel pela parte de visualizao 3D deste traba-
lho. Ou seja, o mdulo que ser utilizado chamado de Visual, que justamente o
mdulo de grcos 3D usado para a linguagem de programao Python. VPython
o nome da combinao da linguagem de programao Python, o mdulo Visual, e o
ambiente de desenvolvimento IDLE.
Por se tratar de uma programao simples e fcil de aprender muito usada para
a criao de modelos 3D interativos de sistemas fsicos (SCHERER, 2014). O Vpython
foi criado em 2000 por David Scherer, enquanto ele era um estudante de graduao
na Universidade de Carnegie Mellon. Tal mdulo permite criar e animar objetos 3D,
alm da possibilidade de navegar em uma cena 3D girando, aproximando e afastando,
usando apenas o mouse.
possvel criar objetos em qualquer escala. Por exemplo criar uma esfera com
um raio de 1E 15 m para representar um ncleo, ou uma esfera com um raio de 1E6
m para representar um planeta.
Uma curiosidade do Vpython a de que nem todos os objetos so visveis. Por
exemplo, VPython permite criar quantidades vetoriais em 3D e executar operaes ve-
toriais sobre elas. Essa ferramenta vetorial tambm foi muito utilizada neste trabalho.
65
O pyMC (FONNESBECK, 2014) um mdulo python que implementa modelos
estatsticos bayesianos e algoritmos de ltragem, incluindo cadeias de Markov Monte
Carlo. Sua exibilidade e extensibilidade torna-o aplicvel a um grande conjunto de
problemas.
PyMC fornece funcionalidades para fazer anlise Bayesiana da forma mais sim-
ples. Aqui est uma pequena lista de algumas de suas caractersticas:
Serve para modelos estatsticos bayesianos com cadeia de Markov Monte Carlo
e outros algoritmos.
Inclui um grande conjunto de distribuies estatsticas bem documentados.
Usa o Numpy para clculos numricos.
Inclui um mdulo para a modelagem de processos de Gaussianos.
Loops de amostragens podem ser pausados e ajustados manualmente, ou sal-
vos e reiniciados mais tarde.
Cria sumrios inclusive de tabelas e grcos.
Vrios diagnsticos de convergncia esto disponveis.
Incorpora facilmente mtodos personalizados e distribuies de probabilidade
incomuns.
Optou-se por desenvolver o ltro de partculas, necessrio neste trabalho, com o
pyMC, pois este permite que se faam construes estatsticas de forma eciente e se
adapta a qualquer modelo ou distribuio que seja necessria dentro de um ambiente
Python. Dessa forma no foi necessrio que se programasse o Filtro de Partculas.
66
4 MTODOS
A simulao da caminhada de pedestres ser realizada usando todas as ferramen-
tas tericas apresentadas no Cap. (3) que sero neste captulo adequadas teoria de
movimentao de pedestres em situaes de estresse.
Assim, inicialmente precisa-se relembrar que os ambientes trabalhados sero par-
cialmente observveis o que justica o uso de POMDP. Alm disso e pelo mesmo
motivo ser usado um ltro de partculas (PF). nesse momento que o mdulo pyMC,
denido na Sec. (3.9) ser exigido. O PF quem alimenta o POMDP para gerar polti-
cas quase timas, que tambm podem ser denominadas planos. Esses planos, junta-
mente com a carga de crenas, desejos e intenes referentes ao agente BDI, sero
responsveis por produzir os i-plans, que determinam a movimentao do agente no
ambiente. Essa movimentao ou percurso ser traado atravs de curvas de Bzier.
O planejamento ou poltica de um agente pode sofrer alteraes durante toda a
caminhada. Tais alteraes dependero de obstculos como portas, outros agentes
ou custos muito elevados ou baixos que acarretaro na mudana da Bzier seguida
pelos agentes.
Sabe-se que para traar uma curva de Bzier necessita-se de pontos de controle.
Esse pontos de controle, que sero chamados de pontos de controle padro, esto
inicialmente predeterminados no ambiente. Conhecidos os pontos inicial e nal, os
pontos de controle da curva de Bzier so selecionados de forma a simular um traado
para o agente que se assemelhe caminhada de um pedestre. O i-plan determinar
o conjunto de caminhos timos e consequentemente a porta ou local para onde o
agente deve seguir.
4.1 GERAO DE I-PLANS
Como j foi visto, o princpio de um processo de PF se d ao se fazer uma dis-
tribuio de partculas pelo ambiente, atravs de um conjunto de amostras aleatrias
com pesos associados (partculas), baseando-se em toda a informao disponvel, in-
cluindo as medidas atuais recebidas (seguindo as etapas de predio e atualizao)
(AIUBE, 2005). Neste trabalho, as informaes disponveis so os custos predeter-
minados para o ambiente, que so dinmicos e precisaro ser atualizados de acordo
com as tomadas de deciso do agente.
67
O pyMC um mdulo da programao Python que resolve um algoritmo sequen-
cial de Monte Carlo, ou seja, resolve um ltro de partculas. Aps algumas iteraes, o
algoritmo faz com que essas partculas se acumulem em pontos especcos de acordo
com distribuies de probabilidade que podem variar de acordo com as condies de
caminhada de cada agente. A inteno dos agentes chegar s portas das salas,
desta forma, a funo do i-plan identicar qual a melhor porta a ser usada. As Fig.
(13) e (14) representam a escolha de caminhada de um rob utilizando um PF, uma
das bases dos i-plans (FOX et al., 2000; REKLEITIS, 2004).
FIGURA 13: Caminhada de um Rob de acordo com a soluo de um PF. FONTE: Sequential
Monte Carlo Methods in Practice, 2001.
FIGURA 14: Caminhada de um Rob de acordo com a soluo de um PF. FONTE: A Particle
Filter Tutorial for Mobile Robot Localization, 2004.
Esses pontos de maior densidade de partculas iro representar, no ambiente par-
cialmente observvel, portas de salas, portas de sada e o que se designa de portas
ctcias, Fig. (15).
68
1
2
3
4
1 2
3 4
8
7
5 6
5
Agentes
Portas
Portas Fictcias
FIGURA 15: Portas Fictcias.
Tais portas ctcias so regies denidas no ambiente de forma a manter uma
caminhada coerente at a obteno do objetivo maior de cada agente, que conse-
guir encontrar uma porta de sada. As portas ctcias devem ser pr-estabelecidas de
acordo com o tipo de ambiente para que o agente no que sem caminhar, pois os
desejos do agente so sempre os de encontrar portas de sada. O ambiente criado
para testes deste trabalho, foi projetado para que fosse possvel analisar o comporta-
mento dos agentes perante corredores mais largos e mais estreitos, salas sem sada
ou com barreiras, portas estreitas ou mais largas, salas menores e maiores e dessa
forma, foi necessrio a implementao de portas ctcias para que o agente no se
perdesse durante o trajeto de sada. Assim, se o agente no visualiza portas reais
de sadas de salas, assumir como caminho tais portas ctcias. Ainda, mesmo que
o agente consiga visualizar uma porta de sada de sala, mas tambm enxergue uma
dessas portas ctcias, a escolha do melhor caminho ser calculada pelo PF atravs
do pyMC, levando em considerao custos e sua personalidade, ou seja, essa esco-
lha ser realizada pelo clculo do i-plan. Termos como agente visualizar ou agente
enxergar sero mais bem explicados na Sec. (4.2.3).
Com essas portas denidas, os outros pontos de controle para se traar a Bzier
que o agente escolher so determinados em funo da distribuio calculada pelo PF
via pyMC. Essa quantidade de pontos de controle est em funo da necessidade da
ordem da Bzier usada em cada trecho do ambiente, para que o percurso do agente
seja o mais suave possvel, ou seja, para simular de modo mais prximo ao real o
traado de uma caminhada de uma pessoa, ver Fig. (16).
69
Portas
Pontos de Controle
Agentes
Nuvem de Particulas
Pontos de Controle escolhidos
Porta Fictcia
FIGURA 16: Escolha dos Pontos de Controle a partir do PF.
A curva Bzier traada para a Fig. (16) ser de terceira ordem, ou seja, composta
por quatro pontos de controle. Ainda, a posio dos pontos das portas ctcias e das
portas de sada variam de acordo com a distribuio de partculas na regio.
Desta forma, pode-se dizer que em cada trecho do ambiente existem vrias possi-
bilidades de caminhada, ou seja, diversas possibilidades de Bziers que sero escolhi-
das em funo do PF e que podero sofrer alteraes de acordo com o planejamento
e personalidade de cada agente.
So justamente esses caminhos e seus custos, determinados pelo PF, que ali-
mentaro o POMDP e a partir disso torna-se possvel que o agente gere planos de
caminhada, ou polticas quase timas, para que consiga encontrar a sada no melhor
tempo com menores custos possveis.
Essas polticas sero reavaliadas a cada parte do trajeto de acordo com o que o
agente encontrar no seu caminho ou a cada vez que o agente no aceitar a poltica
denida para aquele pedao de trajeto. Esse novo plano gerado a cada interao e
escolhido pelo agente pesando custos e personalidade chamado de i-plan. Ou seja,
uma poltica formada por vrios outros planos menores que so gerados no decorrer
do trajeto do agente e so constantemente recalculados pelo PF.
Desta forma o esquema de movimentao dos agentes pode ser representado
pelo Fluxograma a seguir, Fig. (17):
70
Campo de Vis ao
Inten coes
Crencas
Desejos
Vazio
Vazio
POMDP
I-plan
PF
Poltica
Ac ao
Atualizar
Sim
N ao
Sim
N ao
FIGURA 17: Fluxograma representativo para um agente BDI segundo um I-plan. Adaptado de
Rens, Ferrein e Poel (2009).
Os desejos so ordenados de acordo com seus custos para um determinado ca-
minho selecionado. O custo desses desejos so calculados a partir de uma poltica
inicial determinada para cada agente que, em geral, a de seguir o caminho mais
curto at chegar a sada nal (ou sadas parciais). Assim o agente corre seu cone
de viso pelo ambiente, acessa suas crenas e dene os custos para uma pilha de
desejos ordenada do menor custo para o maior.
Com o desejo denido, necessrio vericar se as intenes so possveis. Para
isso, alimenta-se o POMDP com o desejo selecionado e esse resultado abastece o
planejador que verica se a inteno ser ou no realizada. Se sim, o I-plan est
denido e executa-se o PF. Se no, seleciona-se outro desejo e recalcula-se todos os
passos at que o plano possa ser realizado. O agente segue o I-plan gerado com a
inteno de menor custo.
A cada instante de tempo o agente corre o ambiente e pode mudar seus desejos
e intenes. Depois desse processo executada a ao recomendada pelo I-plan e
as crenas so atualizadas tanto pelo que se conhece do ambiente (cone de viso)
quanto pela ao que acabou de ser realizada.
Todo esse processo computacional, at esse ponto, no visual. Os dados so
71
armazenados em um arquivo binrio do Numpy (ver Sec. (3.9)) para que, posterior-
mente, o mdulo de visualizao escrito em Python, possa l-lo e alimentar a anima-
o tridimensional do VPython.
4.1.1 Memria curta e memria longa
A realizao dos processos probabilsticos de deciso depende da existncia de
memrias.
Deniu-se que o agente possuir uma memria longa e uma memria curta.
A memria curta abastecida pelas informaes captadas pelo agente no mo-
mento em que passa seu cone de viso pelo ambiente. Assim, o cone de viso, que
considerado um sensor, detectar a localizao de paredes, de outros agentes e
de portas reais ou ctcias e, de modo secundrio, os pontos de controle disponveis
para a gerao do traado da movimentao (Bezier). Essas informaes iro para a
memria curta que alimentar os I-plans.
Na sequncia, aps a execuo da movimentao, essas informaes da memria
curta sero transmitidas para a memria longa, que far o papel de uma biblioteca que
pode ser acessada a qualquer momento pelo agente. A importncia da memria longa
est no fato de que o agente poder vericar se j passou por determinadas portas,
se j desviou de obstculos ou mesmo se j avistou outros agentes. Ainda, servir
de histrico para se analisar o caminho tomado pelo agente e o motivo das decises
tomadas para seguir determinado traado.
Ao nal de uma ao ou movimento, as informaes da memria curta so pas-
sadas totalmente para a longa, e a primeira limpa. Deste modo, o agente poder
captar novas percepes dos ambientes por onde caminha e replanejar sempre que
necessrio. Lembrando que todas essas observaes do mundo sempre alimentaro
a memria longa.
Esse armazenamento ser feito no formato de dicionrios do Python (FOUNDA-
TION, 2014) para facilitar a identicao das aes registradas.
4.1.2 Combinando planejamento do POMDP com o Modelo de agente BDI
A combinao de planejamento do POMDP com o Modelo de agente BDI se d
atravs de um lao de controle (controlador, adaptado de Rens, Ferrein e Poel (2009))
do modelo BDI, como uma referencia, sendo modicado para acomodar o planeja-
mento das polticas POMDP.
72
Includo implicitamente nos estados de crena est um conjunto xo de comporta-
mentos e tambm um conjunto xo de funes de custo (memria longa), sendo que
esses comportamentos so os objetivos do agente em certo estado.
A ideia que cada comportamento refere-se a um nico objetivo que o agente
designado a alcanar. Cada comportamento denido por um conjunto de planos e
funes de custo que consigam fazer o agente desenvolver esse comportamento.
Cada conjunto de desejos do agente denido por trs parmetros: o primeiro
uma referncia resoluo do PF, o segundo e o terceiro fazem referncia a um
comportamento e estados possveis respectivamente. As funes de custo recebem
argumentos da soluo do PF que se referem ao plano ao qual a funo de custo est
associada.
Para cada comportamento existe apenas um plano que leva sua obteno.
Para entender o controlador, precisa-se considerar o processo de deliberao do
agente. Deliberar o procedimento que chama e recebe informaes do o campo de
viso e que opera nas intenes (memria curta).
O desejo selecionado para o comportamento aquele que consegue atingir o
objetivo. O valor do desejo estimado como o valor da poltica encontrada, gerado
pela soluo do PF.
O algoritmo testa se uma poltica factvel pode ser gerada, ou seja, se o planejador
retorna uma poltica de parada: quando toda sada de uma ao intencionada ilegal,
o algoritmo para, o que signica que o plano de entrada impossvel. Uma inteno
com o plano sendo impossvel, tambm denida como uma inteno impossvel.
A estratgia usada na deliberao trabalhar com a resposta impossvel, a qual
simplesmente excluda e os desejos so chamados e a prxima inteno ento
selecionada para ser vericada.
Quando uma ou mais intenes so vericadas, o agente segue a inteno com
maior probabilidade de ocorrncia, em funo da resposta do PF, para um dado plano
e um certo estado. Essa inteno nem sempre ser a resposta tima, pois depende
dos custos, da memria longa e da sua deliberao.
Inicialmente as intenes esto vazias, ento a deliberao chamada e as inten-
es so preenchidas. Sempre que o controlador precisar de um novo objetivo para
executar, o algoritmo chamado para gerar uma nova poltica e usar os planos para
especicar a ou as intenes ativas.
A cada cumprimento de objetivo, os desejos so reativados e o procedimento se
reinicia com a alimentao das intenes pelo campo de viso e pelas crenas do
73
agente. Ento um novo objetivo calculado, e assim por diante at que se alcance o
objetivo global que chegar a uma das portas de sada.
4.2 INTERAES ENTRE AGENTES E AMBIENTE
Alm dos clculos relacionados a Inteligncia Articial que, como j foi dito, no
so visuais, necessrio construir um ambiente onde se possa observar as decises
de cada agente e consequentemente sua caminhada at as portas de sada. Nas
sees a seguir ser denida a parte visual deste trabalho, realizada com a utilizao
do mdulo VPython (ver Sec. (3.9)).
4.2.1 Agente
Os agentes so estilizados como cilindros, pois desta forma possvel determi-
nar uma altura para esses agentes de acordo com a altura do cilindro e um dimetro
denindo o dimetro para esse cilindro. Neste trabalho sero utilizados cilindros de
mesma altura e dimetro para todos os agentes, generalizando-se o formato das pes-
soas. A distino das personalidades denidas na Sec. (3.6) ser dada por cores,
sendo que:
Azul: Racional.
Verde: Custdia.
Vermelho: Experimental.
Laranja: Emotivo.
Esses cilindros so construdos e denidos em Python utilizando o modulo VPython
da seguinte forma (SCHERER, 2014):
74
FIGURA 18: Representao de um Cilindro pelo VPython. FONTE: Documentao do
VPython.
De acordo com a Fig. (18) a varivel pos dene o centro da base do cilindro, e
consequentemente a posio do agente, a varivel axis dene a altura do cilindro e
a varivel radius dene a largura do cilindro. Pelo VPython ainda possvel atribuir
cores, opacidade
1
e material de constituio.
4.2.2 Paredes
Para a construo do ambiente de caminhada deniram-se as paredes por parale-
leppedos ou box, denidos pelo VPython, da seguinte forma (SCHERER, 2014):
1
Ausncia de luz. Que no transparente.
75
FIGURA 19: Representao de uma caixa no VPython. FONTE: Documentao do VPython.
Como se observa na Fig. (19) e diferentemente do cilindro que dene os agentes,
a varivel pos est localizada no centroide do paraleleppedo.
possvel referenciar as componentes da caixa de forma individual, denindo os
vetores para os eixos x, y, z. O comprimento (ao longo do eixo x) L, a altura (ao longo
do eixo y) H, e a largura W (ao longo do eixo z). Por este exemplo, tem-se que o
axis = (L, 0, 0), ou seja, s est denido um valor para a varivel x. Note-se que o eixo
de uma caixa como o eixo de um cilindro.
No paraleleppedo ou box tambm possvel denir cor, opacidade ou textura.
4.2.3 Cone de Viso
A ideia do campo de viso ( FOV) tem sido usada por alguns autores (FREITAS,
2014; STEMMER et al., 2005) para tentar representar como o ser humano realmente
enxerga. O Departamento de Transportes da Escola Politcnica da UFBA tem feito
vrias pesquisas nessa rea, inclusive com dados referentes a viso perifrica, dis-
tncia focal e compatibilizao com a velocidade do pedestre ou motorista.
Neste trabalho assume-se um cone de viso que, alm de simular a forma de
76
visualizao do ser humano, ser o sensor do agente. Atravs desse cone de viso
o agente poder detectar outros agentes, portas e demais obstculos, conforme Fig.
(20).
(a) Cone de viso. (b) Agentes nas portas de sada.
FIGURA 20: Agentes acoplados a seus cones de viso, fazendo a deteco de obstculos
para suas caminhadas.
Assim, a gura geomtrica que representa o cone de viso representado pelo
VPython conforme Fig. (21).
FIGURA 21: Representao de um cone no VPython. FONTE: Documentao do VPython.
Da mesma forma que os outros slidos geomtricos apresentados, o cone tambm
denido pelas variveis pos e axis e radius (SCHERER, 2014).
A varivel axis sofre alteraes quando esse cone de viso entra em contato com
a parede. Por exemplo, se um agente est posicionado perpendicularmente parede
com ordenadas positivas (+X) e seu cone de viso tem um axis = 12cm. Se esta
distncia entre o agente e a parede de 5cm tem-se que, automaticamente, esse axis
passa a valer 5.
77
FIGURA 22: Deteco de contato entre o cone de viso e as paredes.
Essa deteco de contato entre o cone e as paredes feita atravs dos axis,
Fig. (22). Se o axis da parede intercepta o axis do cone, clculo este feito atravs da
teoria de interseco entre retas nitas, Sec. (3.8.2), matematicamente o axis do cone
modicado e o agente precisar tomar decises para no colidir com o ambiente.
Neste caso, este agente assume novos pontos de controle para fazer um outro traado
de sada da sala em que se encontra seguindo as curvas de Bzier possveis para
aquela sala.
Observa-se que essa interseco entre o vetor central do cone de viso e o vetor
central que passa pelo centroide da parede faz com que o agente perca um pouco de
sua viso perifrica. Essa caracterstica pode ser observada em seres humanos em
situaes de estresse e pnico (BOURNE, 2005; KLERMAN; HIRSCHFELD; WEISS-
MAN, 1993).
4.2.4 Mdulos Adicionais
Outras caractersticas da parte visual so as linhas que marcam o traado das
curvas de Bzier, criao das janelas de visualizao e controle das mesmas e as
operaes vetoriais, aparentemente simples, mas de grande importncia em todo o
clculo computacional deste trabalho.
Todas essas caractersticas tambm so geradas a partir do VPython, juntamente
com o mdulo Numpy (SCHERER, 2014).
Assim, o rastro deixado pelo agente ao caminhar, que exatamente o traado
da curva de Bzier, feito primeiramente com a habilitao da varivel make_trail
(SCHERER, 2014).
78
Desta forma, um exemplo pode ser dado pela Eq. (39) e Fig. (23).
ball = sphere(make_trail = True, trail_type = curve

) (39)
FIGURA 23: Rastro de esferas. Fonte: Documentao do VPython.
O atributo make_trail deve ser mencionado durante a criao dos objetos em mo-
vimento, denindo para este se true ou se false, respectivamente para desenhar o
rastro ou no. J o atributo trail_type tem como padro traar curvas, mas tambm
pode ser denido que se tracem pontos. Ainda possvel denir cores para cada
rastro.
Os agentes sero representados por cilindros e estes deixaro um rastro da sua
caminhada que so as curvas de Bzier. As cores desses rastros sero as mes-
mas de seus agentes, por exemplo, um rastro azul representar a caminhada de um
agente racional e assim sucessivamente, conforme denido na Sec. (4.2.1). No m-
dulo VPython, para se denir o estilo da curva que ser traada, a partir dos cilindros,
preciso usar o objeto curve. O VPython traa curvas ligando pontos com segmentos
de retas. Se os pontos so sucientemente prximos uns dos outros a aparncia da
curva ser suave.
Um dos atributos do objeto curve o armazenamento de matrizes com as res-
pectivas posies dos pontos que formam a curva. Estes atributos so armazenados
como matrizes numpy. Por exemplo, pode-se desenhar um quadrado 2D apenas com
o objeto curve da forma a seguir:
square = curve(pos = [(0, 0), (0, 1), (1, 1), (1, 0), (0, 0)]) (40)
Ainda possvel modicar a espessura dessas curvas e denir cores de acordo
com a necessidade.
As curvas de Bzier traadas a partir dos agentes (cilindros) so denidas utili-
zando o algoritmo de De Casteljau visto na Sec. (3.7.3) e com isso possvel informar
para o objeto curve quais so os pontos que geram a curva de Bzier seguida por
cada agente.
O controle da janela em que ser apresentada a simulao no pea fundamen-
79
tal, mas pode causar maior ou menor impacto na visualizao dos resultados.
Inicialmente, h uma janela de exibio VPython chamada cena (SCHERER, 2014).
Ao criar um objeto, imediatamente uma cena tambm criada, sem a preocupao
de designar algum comando para isso. Contudo, possvel criar atributos para uma
cena que modiquem a iluminao, posio das cmeras, tamanho da cena, etc. Por
exemplo, a janela que ser utilizada neste trabalho tem a seguinte forma:
cena = display(title=Movimentacao de Agentes,
x=0, y=30, width=800, height=800, center=(0,0,0),
background=(1,1,1), forward=topo, up=(0,0,1), range=camera)
O cdigo anterior cria uma janela de exibio VPython de tamanho 800 por 800,
com seu canto superior esquerdo na posio x =0 e y =30 (y medido a partir do topo
da tela), com barra de ttulo contendo o texto Movimentacao de Agentes, centrada
na localizao (0, 0, 0), e com uma cor de fundo branca (background=(1, 1, 1)) preen-
chendo a janela. Ainda, tem-se que a cmera est apontada para o centro e localizada
atravs do vetor (0; 0, 1; 6) dado pela varivel topo (forward) e a uma distncia de 40,
dada pela varivel (range) do plano dos pisos.
O objeto vector tem propriedades dos vetores usados muito semelhantes aos ve-
tores usados na cincia ou engenharia. Ele pode ser utilizado em conjunto com o
numpy.
A representao desse objeto dada por:
vector(x, y, z) (41)
possvel acessar as coordenadas individuais de um vetor, fazer diversos tipos
de operaes, como soma, multiplicao, normalizao, calcular projeo, angulao,
sendo que todos esses comandos so nativos do VPython.
4.3 PASSAGEM DE UMA BZIER PARA OUTRA
As curvas de Bzier denidas para os agentes possuem no mnimo quatro pontos
de controle (inicial, nal e dois intermedirios) que fazem com que o traado do agente
seja desenhado de forma suave, sem bicos.
Como se pode observar na Fig. (24) cada porta possui um ponto de controle e
outros dois (dentro e fora) alinhados a esse ponto da porta, para garantir suavidade
na passagem por esses trajetos. Esses pontos, tanto o da porta quanto os de dentro
e de fora, no possuem localizao nica. Variam de acordo com a distribuio de
80
partculas calculada para o respectivo movimento pelo pyMC. Isso tambm ocorre nas
portas ctcias, pois, como so pontos de transio, precisamgarantir que a passagem
entre as curvas de Bzier seja suavizada.
1
2
4
Sala 1
Sala 2
FIGURA 24: Pontos de Controle alinhados nas portas.
Quando um agente precisa replanejar (isso pode acontecer, por exemplo, por ter
um outro agente sua frente), este tomar uma nova Bzier de acordo com a soluo
do PF.
4.4 CUSTOS DE MOVIMENTAO
A existncia de quatro personalidades que representam o comportamento psicos-
social humano de uma forma generalizada sero baseadas no trabalho da pesquisa-
dora Behrendt, conforme j foi apresentado anteriormente, Sec. (3.6).
necessrio criar uma hiptese de valores que representem cada personalidade,
para que essas possamser transcritas matematicamente e computacionalmente. Desta
forma sero adotados custos locais da caminhada dos pedestres que sero normaliza-
dos em uma escala de 0 a 1, sendo que 0 representa o custo mais baixo e 1 representa
o custo mais alto para cada localidade. A conjectura a de que custos mais baixos
demonstram decises mais tranquilas para os agentes enquanto custos mais elevados
guram decises mais estressantes.
As variveis que denem cada uma dessas personalidades sero apresentadas
assim como os custos para as atitudes das diferentes personalidades.
Agente Experimental:
81
o agente experimental um agente intuitivo e sempre optar pelo caminho
mais curto, independente do que os agentes sua volta estaro fazendo.
para esse tipo de agente, o custo de passar por portas onde j passou ser
bem pequeno, dado por Custo = 0, 3.
o custo inicial das portas para esse agente ser de Custo = 0, 1.
no segue outros agentes, escolhe seus caminhos por conta prpria.
andar por corredores extensos no lhe gerar custos.
ao enxergar paredes, continua o percurso at encontrar um desvio, ou seja,
caminhar na direo das paredes tambm lhe custar pouco, Custo = 0, 1.
retornar pelo mesmo caminho que j usou ter um custo de Custo = 0, 3.
Agente Custdia:
o agente custdia um agente preventivo e por esse motivo planejar e
replanejar sempre buscando o caminho de menor custo.
para esse tipo de agente, o custo de passar por portas onde j passou ser
alto, dado por Custo = 0, 7.
optar por portas com custo baixo.
se sua frente reconhecer um outro agente Custdia, tender a segui-lo,
pois acreditar que este conhea o caminho de sada.
o custo inicial das portas para esse agente de Custo = 0, 1.
no enxergar ser uma boa escolha andar por corredores extensos, assim
o custo para essa opo ser de Custo = 0, 4.
ao enxergar paredes, procurar mudar de sala o mais rpido possvel. Custo =
0, 7.
retornar pelo mesmo caminho que j usou ter um custo de Custo = 0, 3.
Agente Racional:
o agente racional um agente lgico e por esse motivo escolhe o caminho
onde outros agentes Custdia j obtiveram sucesso.
para esse tipo de agente, o custo de passar por portas onde j passou ser
alto, dado por Custo = 0, 6.
optar por portas com custo baixo.
se sua frente reconhecer um agente Custdia, tende a segui-lo, pois acre-
ditar que este conhea o caminho de sada.
82
o custo inicial das portas para esse agente ser de Custo = 0, 1
andar por corredores extensos no lhe gerar custos.
ao enxergar paredes, continuar o percurso at encontrar um desvio, ou
seja, caminhar na direo das paredes tambm lhe custar pouco, Custo =
0, 2.
retornar pelo mesmo caminho que j usou ter um custo de Custo = 0, 3.
Agente Emotivo:
o agente emotivo um agente solidrio e no gosta de caminhar sozinho.
Caso esteja sozinho em uma sala o custo ser de Custo = 0, 6.
para esse tipo de agente, o custo de passar por portas onde j passou ser
mediano, dado por Custo = 0, 5.
o custo das portas no inuenciar sua caminhada.
se sua frente reconhecer um agente Racional, tender a segui-lo.
andar por corredores extensos com custo baixo, Custo = 0, 1.
quando se vir perpendicular a uma parede, tentar a modicar seu caminho
procurando onde esto os outros agentes, sendo que o custo para essa
viso das paredes ser de Custo = 0, 2.
retornar pelo mesmo caminho que j usou ter um custo de Custo = 0, 3.
Hipteses de velocidades mdias genricas globais para cada personalidade:
Agentes Experimentais: 1,6 m/s
Agentes Racionais: 1,4 m/s
Agentes Custdias: 1,34 m/s
Agentes Emotivos: 1,1 m/s
Como a caracterstica geral para todos os agentes a de uma situao de eva-
cuao do ambiente em funo de um iminente perigo que no tem sua localizao
ou natureza detectados pelos agentes, estes seguiro uma equao que relaciona
custos e velocidade, sendo que a velocidade dos agentes no ambiente diretamente
proporcional aos custos, ou seja, quanto maior for o custo maior ser a sua veloci-
dade. Em outras palavras, quanto mais o agente demorar para encontrar uma sada
maior ser seu nvel de estresse. Como j foi descrito na Sec. (3.6), isso representa a
83
caracterstica psicolgica de aumentar a velocidade quando ocorre um aumento dos
nveis de estresse gerados pelo pnico.
No prximo captulo sero apresentados os resultados da aplicao desta meto-
dologia.
84
5 RESULTADOS
As imagens a seguir so representativas de cinquenta simulaes, utilizando o
mesmo ambiente de testes, idealizado para representar salas, corredores, obstculos
e portas em diferentes tamanhos e composies, sendo que as quatro identidades
sero alocadas nesse ambiente em diversas combinaes. Supe-se que seja tocado
uma sirene e os agentes comecem a evacuar o ambiente. Dessa forma, os resultados
contero uma anlise crtica referente as variveis psicocomportamentais emcasos de
agentes com algum nvel de estresse e uma anlise numrica referente a tempos de
evacuao, quantidades de portas de sada do ambiente e portas internas escolhidas,
velocidades mdias e distncias percorridas por cada personalidade.
5.1 QUATRO PERSONALIDADES
A anlise da evacuao dos agentes iniciada tendo como hiptese a existncia
de dois agentes com cada personalidade.
1
C
3
2
D
E
F
H
I
J
Sala 1
Sala 2
A
B
G
FIGURA 25: Hiptese de dois agentes de cada personalidade contidos no ambiente de testes.
Em azul tem-se os Racionais, em verde tem-se os Custdia, em laranja tem-se
85
os Emotivos e em vermelho tem-se os Experimentais, conforme Sec. (4.2.1). Dessa
forma, a planta com as posies inicias de cada agente dada pela Fig. (25).
Observa-se na Fig. (26) o percurso total da caminhada de oito agentes distri-
budos igualmente entre as quatro personalidades. Esses caminhos ilustrados so o
resultado de uma avaliao do comportamento mdio entre os agentes durante cin-
quenta simulaes, com algumas variaes entre os caminhos escolhidos e portas
usadas.
(a) Viso superior do ambiente (b) Viso isomtrica do ambiente
FIGURA 26: Visualizaes do ambiente.
Qualitativa) Para a realizao de uma anlise qualitativa, utiliza-se como amostra um vdeo
de vinte segundos representativo da resposta estatstica, gerado a partir de uma
das simulaes. Atravs da linha do tempo proporcionada por esse vdeo pode-
se observar que:
1. Incio do trajeto
A sada de todos os agentes das salas 1 e 2 se d de forma lenta, pois todos
esto ainda com custos baixos, ou seja, baixos nveis de estresse. Com
o decorrer da caminhada e quanto mais tempo esses agentes demoram
para encontrar as portas de sada do ambiente, maiores so esses custos
e consequentemente, maiores so as velocidades.
Conforme Fig. (27), retirada de um vdeo com tempo total de vinte segun-
dos, feito a partir de uma das simulaes realizada para esse caso, em
trs segundos de visualizao se observa que h alguns choques entre os
agentes nas sadas das portas. Tais choques so naturais em situaes
de estresse, segundo a bibliograa analisada (STEINBERG, 2005; PRED-
TETSCHENSKI; MILINSKI, 1971; HELBING; MOLNR, 1995).
86
FIGURA 27: Choques entre agentes.
2. Observa-se, Fig. (28), a escolha do agente Racional que saiu da sala 2, em
entrar na porta D do corredor.
87
FIGURA 28: Deciso do agente Racional (sala 2) ao entrar na porta D. Tempo: 3s.
Tal deciso provavelmente tomada porque o custo para ele tentar passar
por uma porta por onde ainda no passou pequeno.
3. De acordo com a Fig. (29), observa-se que esse mesmo agente Racional
(sala 2) se encaminha para sair pela porta 2 de sada do ambiente, pois a
sua escolha o levou a um corredor sem obstculos, o direcionando para tal
sada.
O agente Racional que saiu da sala 1 optou por testar a porta C, provavel-
mente pelo baixo custo de entrar por portas que ainda no entrou. Tam-
bm escolheu tentar passar pelo obstculo, possivelmente por ter um custo
baixo para tal atitude. Essas decises direcionam sua sada do ambiente
pela porta 1.
O agente Emotivo que saiu da sala 2, o agente Experimental que saiu da
sala 2 e o agente Custdia que saiu da sala 2, resolveram testar as portas
F, E e H, respectivamente, mas os trs avistaram um obstculo e decidiram
voltar para o corredor. Com relao ao agente Experimental, a opo se
deu por essa sala no possuir sada. J os outros dois agentes, possivel-
mente tomaram essa deciso por terem custos altos em tentar passar por
obstculos.
88
FIGURA 29: Deciso dos agentes Racionais (sala 1 e 2) e dos agentes Emotivo, Experimental
e Custdia (sala 2). Tempo: 9s.
4. O agente Custdia (sala 2), aps desistir de seguir caminho pela porta H,
volta para a porta D e est se direcionando para sair do ambiente pela
porta 1, Fig. (30). O outro agente Custdia (sala 1) testou a porta E, mas
tambm decidiu voltar em direo ao corredor, retomando sua caminhada
em direo a porta D. Possivelmente essa escolha tenha sido feita porque o
custo para um agente Custdia retornar por caminhos onde j passou no
muito alto e como essa identidade foi idealizada para que esses agentes
fossem bons planejadores, a sada do ambiente passando pela porta D,
sem obstculos, provavelmente lhe garante custos mais baixos.
89
FIGURA 30: Decises dos agentes no tempo: 13s.
O agente Emotivo que saiu da sala 1 resolveu testar a porta E, mas percebe
que a sala no tem sada e retorna ao corredor.
O agente Experimental (sala 2) que havia testado a porta E se encaminha
at a porta H, seguido pelo agente Emotivo (sala 2) que saiu da porta F. O
agente Experimental tem custos baixos para a maior parte de suas atitudes,
por esse motivo parece natural que ele teste o ambiente at encontrar a
sada. O agente Emotivo que o segue, possivelmente toma essa deciso
para no permanecer sozinho, devido ao alto custo caso contrrio.
O agente Experimental (sala 1) que testou a porta H, retornou para a porta
F. Como j foi comentado, essa personalidade tem custos baixos para testar
o ambiente.
90
FIGURA 31: Deciso dos agentes no tempo: 15s.
FIGURA 32: Deciso dos agentes no tempo: 19s.
91
5. O agente Custdia (sala 1) se direciona para a porta 2, Fig. (31). O agente
Experimental (sala 1) que retornou da porta F tambm se direciona para a
porta D, provavelmente para sair pela porta 2.
Os agentes Emotivo (sala 2) e Experimental (sala 2) que passaram pela
porta H escolhem sair pela porta J e sair do ambiente pela porta 3.
O agente Emotivo (sala 1) que retornou da sala E se direciona para a porta
H. Como decidiu permanecer sozinho durante alguns momentos do per-
curso, ter que tomar as decises para encontrar a porta de sada sem
seguir outros agentes. Esse fato faz com que seus custos aumentem e,
com isso, sua velocidade tambm ser maior.
6. O agente Emotivo (sala 1) que passou pela porta H se direciona para a
porta J para sair do ambiente pela porta 3, conforme Fig. (32).
O agente Experimental (sala 1) que retornou da porta F, decide testar a
porta D e sair do ambiente pela porta 2.
Quantitativa) Aps cinquenta simulaes, foi realizada uma anlise em cima do tempo de
evacuao de cada uma das personalidades.
FIGURA 33: Tempo de Evacuao das quatro personalidades.
Observa-se na Fig. (33), que o tempo de evacuao dos agentes Custdias
o melhor dentre as quatro personalidades, com mdia de 25,49 s. Lembrando
que o ambiente de testes para esse caso possui dois agentes de cada perso-
nalidade. Assim, esse tempo mdio representa a evacuao de cem agentes
92
Custdias (N=100). Possivelmente esse bom resultado se deva por estes se-
rem agentes planejadores e, alm disso, tm a caracterstica de seguirem outros
agentes Custdias, o que faz com que todo o grupo descubra a melhor sada
rapidamente.
Os agentes Emotivos so o segundo grupo em tempo de evacuao, com m-
dia de 25,88 s. Acredita-se que esse fato ocorra pelo fato dessa personalidade
ter custos altos ao caminhar sozinha, decidindo seguir outros grupos e saindo
rapidamente junto com eles.
O terceiro grupo em tempo de evacuao o grupo dos agentes Racionais. Essa
personalidade, assim como os agentes Custdias possui custos altos ao testar
caminhos, alm disso, quando agentes Racionais encontram agentes Custdia,
tendem a segui-los, o que pode acelerar o tempo de evacuao dessa perso-
nalidade. Um fato que deve ser observado o de que, mesmo com um tempo
mdio de evacuao maior do que o tempo mdio dos agentes Emotivos, essa
personalidade possui um desvio padro menor do que todas as outras persona-
lidades.
Os agentes Experimentais, por terem custos baixos quando testam caminhos,
provavelmente acabam demorando a encontrar as portas de sada.
Fazendo uma contagem do nmero de vezes que cada personalidade optou por
sair pelas portas 1, 2 e 3 de sada do ambiente de testes, nas cinquenta simula-
es realizadas, obteve-se os seguintes resultados de acordo com a Fig. (34):
FIGURA 34: Portas de sada do ambiente de testes mais utilizadas por cada personalidade.
93
Se for analisado todas as portas do ambiente e portas de sada, tem-se os se-
guintes resultados de acordo com a Fig. (35):
FIGURA 35: Nmero de vezes que cada porta do ambiente de testes utilizada por cada
personalidade.
Ainda, possvel obter resultados quanto a velocidade mdia dos agentes e
distncias percorridas por cada personalidade.
Desta forma, as velocidades mdias calculadas com a realizao de cinquenta
simulaes, contendo dois agentes de cada personalidade em cada simulao,
ou seja, cem agentes de cada grupo no total, so dadas de acordo com a Fig.
(36).
94
FIGURA 36: Velocidades Mdias e Desvio padro, para cada personalidade.
Observa-se que, em uma linha crescente, da velocidade mdia menor para a
maior, que tem-se os agentes Experimentais, os agentes Racionais, os agentes
Emotivos e os agentes Custdias. preciso lembrar que a velocidade pode
sofrer alteraes de acordo com os custos da caminhada. Esses mesmos custos
representam o nvel de estresse dos agentes.
FIGURA 37: Distncias Mdias percorridas e Desvio padro, para cada personalidade.
95
Verica-se, em uma linha decrescente, da maior distncia mdia percorrida para
a menor, que tem-se os agentes Emotivos, os agentes Custdias, os agentes
Experimentais e os agentes Racionais.
Relacionando as velocidades mdias, as distncias percorridas, o tempo de eva-
cuao e lembrando que cada agente possui custos para tomar uma ao, as
tendncia encontradas para esse ambiente de testes, com essas combinaes
de agentes e suas posies iniciais predenidas, foram compatveis com as hi-
pteses impostas na metodologia.
5.2 AMBIENTE COM NICA PERSONALIDADE
Nas prximas sees ser feita uma anlise crtica qualitativa das escolhas de
cada personalidade. Essa apreciao feita baseada em cinquenta simulaes de
cada um dos ambientes de testes analisados, sendo que o comportamento apresen-
tado nas guras a seguir correspondem a uma mdia estatstica representativa, ob-
servada nessas simulaes.
A realizao de simulaes em ambientes contendo um nico tipo de personali-
dade serviu de controle para a avaliao dos ambientes com mltiplas personalidades,
visto que uma situao desse tipo praticamente impossvel de ocorrer.
O ambiente e as posies iniciais de cada agente so dados de acordo com a Fig.
(38).
96
A
B
1
C
D
E
G F
H
I
J 3
2
Sala 1
Sala 2
FIGURA 38: Ambiente Geral e Posio inicial dos Agentes.
5.2.1 Agentes Racionais
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 39: Ambiente composto apenas por agentes Racionais.
O agente Racional um agente que anda com poucos custos por corredores ex-
tensos e, em contrapartida, tem um custo alto por passar por portas que j utilizou,
sendo que esse custo acrescido se encontrar obstculos. Por esse motivo, observa-
se, Fig. (39), que poucos desses agentes entraram na porta C. E ao fazerem isso,
encontraram uma parede que os zeram desistir daquela sala. O mesmo ocorre com
os agentes que optaram pela porta E.
97
J os agentes que zeram a escolha pela porta D e viram sua frente apenas um
grande corredor, sem obstculos, decidiram seguir por ele at a porta de sada.
Seguindo a mesma ideia, apenas um nico agente optou por seguir caminho ao
entrar na porta F, sendo que esse tambm encontrou uma porta de sada.
Os demais agentes seguiram pelos corredores e foram distribudos entre a porta I
e porta J, pelas quais passaram e no encontraram obstculos, o que os levou porta
de sada.
5.2.2 Agentes Experimentais
Os agentes experimentais so agentes testadores, ou seja, os custos relacionados
a entrar por uma porta e sair pela mesma porta e os custos relacionados tentativa
de passar por cantos, caso avistem paredes, so baixos. Isso ca visvel na Fig. (40)
quando se verica que, logo na porta C, dois agentes identicaram um obstculo e
mesmo assim decidiram seguir por aquele caminho. Na porta E, tambm se pode
observar que os agentes que entraram por ela testaram o caminho, chegando bem
prximo aos cantos do obstculo.
Dois agentes entraram pela porta F, sendo que o agente que resolveu testar o
canto do obstculo acabou encontrando a sada rapidamente enquanto o outro agente
desistiu ao ver o obstculo. Lembrando que, para o agente Experimental, voltar por
portas que j passou ou enfrentar obstculos tm custos baixos.
Os demais se distriburam pelas outras salas e corredores sendo que todos esses
os levavam a portas de sada com poucos custos.
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 40: Ambiente composto apenas por agentes Experimentais.
98
5.2.3 Agentes Custdias
O agente Custdia um agente planejador, parecido com o agente Racional, mas
com custos mais altos para passar por portas onde j passou, ou quando avista obs-
tculos. Tambm possui um custo mdio por permanecer em corredores ou retornar
por caminhos onde j passou. Desta forma, todos esses custos o obriga a planejar
mais do que os outros agentes.
Observa-se, Fig. (41), que apenas dois agentes optaram por entrar porta C e
logo desistiram, pois o custo de analisar o obstculo, passar por ele e depois ter que
retornar seria muito alto.
Quatro agentes foram rapidamente bem sucedidos ao escolherem a porta D. Lem-
brando que a passagem de agentes Custdias por portas que eles ainda no utiliza-
ram tem um custo baixo e, se frente deles no houver obstculos, provavelmente
optaro por esse caminho, pois retornar seria muito custoso.
Alguns agentes ainda testaram a porta E e a passagem pela parede, mas como
essa sala no tem sada, logo abandonaram o plano seguindo pelo corredor.
Trs agentes entram na porta F e seguem pelo corredor at encontrar a sada,
tambm demonstrando a capacidade de planejamento desta personalidade.
Apenas dois agentes dos dez que iniciaram a simulao demoram para encontrar
a sada, sendo que um deles opta pela porta I e o ltimo opta pela porta J.
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 41: Ambiente composto apenas por agentes Custdias.
5.2.4 Agentes Emotivos
Uma das principais caractersticas do agente Emotivo a de procurar outros agen-
tes. Tambm pode ser considerado um agente medroso, devido ao fato de lhe custar
99
quando encontra obstculos. Contudo, o fato de entrar em salas novas no lhe custa
e se isso lhe acarretar em sucesso, ou seja, no encontrar obstculos, provavelmente
seguir por esse caminho at a sada. o que se observa na Fig. (42).
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 42: Ambiente composto apenas por agentes Emotivos.
Ao testarem a porta C, porta E e porta F e encontrar obstculos, rapidamente os
agentes Emotivos desistem desse trajeto, voltando ao corredor e procurando outros
agentes e outros trajetos. Apenas um agente entrou na porta F e decidiu seguir em
frente, provavelmente por ter chegado ao canto do obstculo e identicado que frente
o corredor estaria livre. Nesse caso, como o custo de retornar alto, esse agente
resolveu manter o plano e seguir at encontrar a porta de sada.
Os demais agentes optaram:
pela porta E, que os levava sada com baixo custo, seguindo apenas pelo
corredor;
pela porta H, pois o custo de retornar era alto, sendo que a maioria deles saiu
pela porta J, ou seja, eles optaram em se manter no corredor, juntos, at passa-
rem por uma porta onde no haveria obstculos.
5.3 AMBIENTE DESBALANCEADO
Em cada um dos casos que sero analisados na sequncia, haver uma ou outra
personalidade com agentes a mais, fazendo com que o nmero total de agentes de
cada personalidade no esteja equilibrado. Desta forma, procura-se analisar tendn-
cias de comportamento quando se tem em um grupo agentes de um nico tipo em
maior nmero e vericar se tal personalidade dominar os resultados.
100
As imagens a seguir so representativas de cinquenta simulaes, utilizando o
mesmo ambiente de testes, idealizado para representar salas, corredores, obstculos
e portas em diferentes tamanhos e composies.
5.3.1 Racionais em maior nmero
Nessa seo, a distribuio das personalidades parecida com a Sec. (5.1) con-
tudo, a anlise da evacuao dos agentes iniciada tendo como hiptese a existncia,
tanto na sala 1 como na sala 2, de um agente a mais de personalidade Racional. As-
sim, dos dez agentes presentes em cada simulao, quatro so de personalidade
Racional.
A seguir ser apresentada a avaliao qualitativa, seguida pela avaliao quanti-
tativa dos resultados.
Qualitativa) Como j foi dito, o custo para um agente Racional passar por portas onde j
passou alto, isso faz com que, ao entrar em salas, esse agente tente encontrar
uma porta de sada. Esse fato pode ser observado, Fig. (43), na porta C, na
porta D e na porta J.
Observa-se tambm que os agentes Emotivos optaram em no permanecer so-
zinhos durante a maior parte do trajeto.
Os agentes Experimentais, como de costume, testaram o ambiente, voltando
por caminhos quando necessrio, como pode-se observar com o agente Expe-
rimental que entrou na porta E e retornou at a porta D e nesse caso, o agente
Emotivo o seguiu para que no houvesse acrscimo em seus custos por perma-
necer sozinho.
J os agentes Custdia, como bom planejadores e evitando obstculos, optaram
pela porta D e porta F, obtendo sucesso at a sada do ambiente.
Um agente Emotivo tentou seguir a deciso dos dois agentes Racionais que
escolheram a porta C, contudo, ao avistar o obstculo mudou seu plano e voltou
a seguir os outros agentes que estavam no corredor.
101
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 43: Ambiente composto por um nmero maior de agentes Racionais.
FIGURA 44: Tempos mdios de evacuao das quatro personalidades em um ambiente com
maior nmero de agentes Racionais.
Quantitativa) Aps cinquenta simulaes contendo dez agentes em cada uma, ou seja, cem
agentes Experimentais, Custdias e Emotivos (N=100) e duzentos agentes Raci-
onais (N=200) no total, foi realizada uma anlise quantitativa em cima do tempo
de evacuao de cada uma das personalidades. Observa-se na Fig. (44), que o
tempo de evacuao dos agentes Custdias foi melhor entre as quatro persona-
lidades, 24,92 s, possivelmente por estes serem agentes planejadores e, alm
disso, tm a caracterstica de seguir outros agentes Custdias, o que faz com
que todo o grupo descubra a melhor sada rapidamente.
102
O segundo melhor tempo mdio de Evacuao , justamente, dos agentes Ra-
cionais, 25,54 s. Acredita-se que mesmo esses estando em maior nmero e,
talvez por esse motivo, tenham seguido agentes Custdias e construdos planos
ecientes.
Na sequncia, tem-se os agentes Emotivos e acredita-se que seja pelo fato
dessa personalidade ter custos altos ao caminhar sozinha, decidindo seguir ou-
tros grupos e saindo rapidamente junto com eles.
O maior tempo mdio de evacuao cou para os agentes Experimentais que,
como j foi citado, so agentes testadores do ambiente, com custos baixos e
consequentemente, entram em um nmero maior de salas antes de sarem do
ambiente de testes.
Fazendo uma contagem do nmero de vezes que cada personalidade optou por
sair pelas portas 1, 2 e 3 de sada do ambiente de testes, nas cinquenta simula-
es realizadas, obteve-se os seguintes resultados de acordo com a Fig. (45):
FIGURA 45: Portas de sada do ambiente de testes mais utilizadas por cada personalidade.
Se for analisado todas as portas do ambiente, opcionais dos corredores e salas
e portas de sada, tem-se os seguintes resultados de acordo com a Fig. (46):
103
FIGURA 46: Nmero de vezes que cada porta do ambiente de testes utilizada por cada
personalidade.
Ainda, possvel obter resultados quanto a velocidade mdia dos agentes e
mdias de distncias percorridas por cada personalidade.
Desta forma, de acordo com a Fig. (47), as velocidades mdias calculadas com
a realizao de cinquenta simulaes, contendo dois agentes de cada persona-
lidade em cada simulao, ou seja, cem agentes de cada grupo no total, so:
104
FIGURA 47: Velocidades Mdias e Desvio padro, para cada personalidade.
Observa-se que, em uma linha crescente, da velocidade mdia menor para a
maior, que tem-se os agentes Experimentais, os agentes Racionais, os agentes
Emotivos e os agentes Custdias. preciso lembrar que a velocidade pode
sofrer alteraes de acordo com os custos da caminhada. Esses mesmos custos
representamo nvel de estresse dos agentes. Esses resultados so semelhantes
e seguem a mesma ordem dos resultados obtidos com o ambiente equilibrado
com as quatro personalidades.
105
FIGURA 48: Distncias Mdias percorridas e Desvio padro, para cada personalidade.
Verica-se, em uma linha decrescente, Fig. (48), da maior distncia mdia per-
corrida para a menor, que tem-se os agentes Experimentais, os agentes Emoti-
vos, os agentes Custdias e os agentes Racionais. Os agentes Racionais man-
tiveram a menor mdia de distncias percorridas, comparado ao ambiente de
testes equilibrado, mesmo em simulaes onde o nmero de agentes Racionais
maior do que o nmero de agentes das outras personalidades.
5.3.2 Experimentais em maior nmero
Nessa seo, a anlise da evacuao dos agentes iniciada tendo como hiptese
a existncia, tanto na sala 1 como na sala 2, de um agente a mais de personalidade
Experimental. Assim, dos dez agentes presentes em cada simulao, quatro so de
personalidade Experimental.
As anlises qualitativas e quantitativas da realizao de cinquenta simulaes re-
alizadas em um ambiente desbalanceado contendo um nmero maior de agentes Ex-
perimentais segue abaixo:
Qualitativa) Os dois agentes Custdia optarampor entrar primeiramente na porta E, mas esta
continha obstculo e o custo de tentar passar por ele , para esse agente, alto.
Desta forma, um deles optou por sair sem analisar o restante da sala e voltando
para o corredor entrou na porta F. Como este ainda no havia somado custos
106
para analisar obstculos, nessa sala ele optou por tentar passar pela barreira e
foi bem sucedido encontrando a sada. O outro agente Custdia que entrou na
porta E, aumentou seus custos analisando o obstculo. Dessa forma, ao sair da
sala, voltou pelo corredor e escolheu a porta D que no possua obstculos no
seu interior, encontrando a sada rapidamente.
O agente Experimental tambm entrou na porta E, contudo para esse tipo de
agente o custo de tentar passar por obstculos baixo.
Dos dez agentes presentes no ambiente, seis saram passando pela porta D,
sendo que os Emotivos mantiveram-se seguindo o grupo, pois sair dele muito
custoso.
Sendo agentes testadores, os Experimentais tambm obtiveram sucesso saindo
pela porta I e porta J.
Um dos agentes Racionais entrou na porta F, avistou um obstculo, o que, pos-
sivelmente lhe gerou um custo alto, e decidiu voltar ao corredor, que lhe traria
um custo menor, at encontrar a sada passando pela porta J.
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 49: Ambiente composto por um nmero maior de agentes Experimentais.
107
FIGURA 50: Tempos mdios de evacuao das quatro personalidades em um ambiente com
maior nmero de agentes Experimentais.
Quantitativa) Aps cinquenta simulaes contendo dez agentes em cada uma, ou seja, cem
agentes Racionais, Emotivos e Custdias (N=100) e duzentos agentes Expe-
rimentais (N=200) no total, foi realizada uma anlise quantitativa em cima do
tempo de evacuao de cada uma das personalidades. Observa-se na Fig. (31),
que o tempo de evacuao dos agentes Custdias foi melhor entre as quatro
personalidades, 24,69 s.
O segundo melhor tempo mdio de Evacuao a dos agentes Emotivos, 25,36
s. Possivelmente esse tempo seja decorrente da capacidade dos agentes Emo-
tivos seguir outros agentes e com isso obter bons planos de fuga.
Na sequncia, tem-se os agentes Racionais, trocando de posio em tempo
de evacuao se comparada as mdias entre o ambiente com mais agentes
Experimentais e o ambiente com mais agentes Racionais.
O maior tempo mdio de evacuao cou para os agentes Experimentais que,
como j foi citado, alm de serem agentes testadores, estavam em maior nmero
no ambiente de testes.
Fazendo uma contagem do nmero de vezes que cada personalidade optou por
sair pelas portas 1, 2 e 3 de sada do ambiente de testes, nas cinquenta simula-
es realizadas, obteve-se os seguintes resultados de acordo com a Fig. (51):
108
FIGURA 51: Portas de sada do ambiente de testes mais utilizadas por cada personalidade.
Se for analisado todas as portas do ambiente, opcionais dos corredores e salas
e portas de sada, tem-se os seguintes resultados de acordo com a Fig. (58):
FIGURA 52: Nmero de vezes que cada porta do ambiente de testes utilizada por cada
personalidade.
Ainda, possvel obter resultados quanto a velocidade mdia dos agentes e
mdias de distncias percorridas por cada personalidade.
109
Desta forma, de acordo com a Fig. (53), as velocidades mdias calculadas com
a realizao de cinquenta simulaes, contendo dois agentes de cada persona-
lidade em cada simulao, ou seja, cem agentes de cada grupo no total, so:
FIGURA 53: Velocidades Mdias e Desvio padro, para cada personalidade.
Observa-se que, em uma linha crescente, da velocidade mdia menor para a
maior, que tem-se os agentes Racionais, os agentes Custdias, os agentes Ex-
perimentais e os agentes Emotivos. preciso lembrar que a velocidade pode
sofrer alteraes de acordo com os custos da caminhada. Esses mesmos cus-
tos representam o nvel de estresse dos agentes.
110
FIGURA 54: Distncias Mdias percorridas e Desvio padro, para cada personalidade.
Verica-se, em uma linha decrescente, Fig. (54), da maior distncia mdia per-
corrida para a menor, que tem-se os agentes Experimentais, os agentes Emoti-
vos, os agentes Racionais e os agentes Custdias. Os resultados das distncias
mdias percorridas por cada personalidade so semelhantes ao ambiente onde
havia mais agentes Racionais, apenas tendo uma troca de posies entre os
agentes RAcionais e Custdias.
5.3.3 Custdia em maior nmero
Nessa seo, a anlise da evacuao dos agentes iniciada tendo como hiptese
a existncia, tanto na sala 1 como na sala 2, de um agente a mais de personalidade
Custdia. Assim, dos dez agentes presentes em cada simulao, quatro so de per-
sonalidade Custdia.
As anlises qualitativas e quantitativas da realizao de cinquenta simulaes rea-
lizadas em um ambiente desbalanceado contendo um nmero maior de agentes Cus-
tdias segue abaixo:
Qualitativa) A caracterstica de que os agentes Custdias, quando avistam outros agentes
Custdias, tendem a segui-los pode ser observada na Fig. (55) assim como
a caracterstica de que os agentes Emotivos tendem a permanecer em grupo.
Essa caracterstica de rebanho muitas vezes citada por Quarantelli (1957).
111
Nessa gura, tambm ca evidente que, observar a existncia de obstculos, em
geral, faz com que os agentes desistam do caminho e optem por outras salas.
As sadas alternativas so muitas vezes ignoradas ou no utilizadas de forma
eciente em situaes de fuga (KEATING, 1982; ELLIOTT; SMITH, 1993). Em
todas as simulaes apresentadas at o momento, independente das personali-
dades analisadas, pode-se vericar que a sada passando pela porta C quase
inutilizada. As anlises quantitativas conrmam essa tendncia.
De acordo com a Fig. (55), todos os agentes optaram por permanecer um tempo
maior nos corredores opo de entrarem em salas. Isso se deve ao fato de
que suas velocidades, em situaes de estresse, esto alteradas (PREDTETS-
CHENSKI; MILINSKI, 1971).
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 55: Ambiente composto por um nmero maior de agentes Custdias.
112
FIGURA 56: Tempos mdios de evacuao das quatro personalidades em um ambiente com
maior nmero de agentes Experimentais.
Quantitativa) Aps cinquenta simulaes contendo dez agentes em cada uma, ou seja, cem
agentes Racionais, Emotivos e Experimentais (N=100) e duzentos agentes Cus-
tdias (N=200) no total, foi realizada uma anlise quantitativa em cima do tempo
de evacuao de cada uma das personalidades. Observa-se na Fig. (56), que o
tempo de evacuao dos agentes Custdias foi melhor entre as quatro persona-
lidades, 25,15 s, mesmo esse agente estando em maior quantidade do que os
outros.
O segundo melhor tempo mdio de Evacuao a dos agentes Racionais, 25,45
s. Novamente intercalando de posio com os agentes Emotivos, que caram
com o terceiro tempo mdio de evacuao, 25,81, bem prximo dos agentes
Racionais.
O maior tempo mdio de evacuao, como j observado tambm nas outras
simulaes, cou para os agentes Experimentais, 26,68.
Fazendo uma contagem do nmero de vezes que cada personalidade optou por
sair pelas portas 1, 2 e 3 de sada do ambiente de testes, nas cinquenta simula-
es realizadas, obteve-se os seguintes resultados de acordo com a Fig. (57):
113
FIGURA 57: Portas de sada do ambiente de testes mais utilizadas por cada personalidade.
Se for analisado todas as portas do ambiente, opcionais dos corredores e salas
e portas de sada, tem-se os seguintes resultados de acordo com a Fig. (58):
FIGURA 58: Nmero de vezes que cada porta do ambiente de testes utilizada por cada
personalidade.
Ainda, possvel obter resultados quanto a velocidade mdia dos agentes e
mdias de distncias percorridas por cada personalidade.
114
Desta forma, de acordo com a Fig. (59), as velocidades mdias calculadas com
a realizao de cinquenta simulaes, contendo dois agentes de cada persona-
lidade em cada simulao, ou seja, cem agentes de cada grupo no total, so:
FIGURA 59: Velocidades Mdias e Desvio padro, para cada personalidade.
Observa-se que, em uma linha crescente, da velocidade mdia menor para a
maior, que tem-se os agentes Experimentais, os agentes Custdias, os agentes
Racionais e os agentes Emotivos. Os agentes Custdias, comparados ao am-
biente de testes onde havia mais agentes Experimentais, manteve a segunda
menor velocidade mdia. Possivelmente esse fato se deva a esses agentes se-
rem bons planejadores e desta forma seus custos no se tornam muito elevados
e por esse motivo mantm velocidades mdias mais baixas do que as de outros
agentes. preciso lembrar que a velocidade pode sofrer alteraes de acordo
com os custos da caminhada. Esses mesmos custos representam o nvel de
estresse dos agentes.
115
FIGURA 60: Distncias Mdias percorridas e Desvio padro, para cada personalidade.
Verica-se, em uma linha decrescente, Fig. (60), da maior distncia mdia per-
corrida para a menor, que tem-se os agentes Experimentais, os agentes Emoti-
vos, os agentes Racionais e os agentes Custdias. Os resultados das distncias
mdias percorridas por cada personalidade so semelhantes ao ambiente onde
havia mais agentes Racionais e ao ambiente onde havia mais agentes Experi-
mentais.
5.3.4 Emotivos em maior nmero
Nessa seo, a anlise da evacuao dos agentes iniciada tendo como hiptese
a existncia, tanto na sala 1 como na sala 2, de um agente a mais de personalidade
Emotivos. Assim, dos dez agentes presentes em cada simulao, quatro so de per-
sonalidade Custdia.
As anlises qualitativas e quantitativas da realizao de cinquenta simulaes rea-
lizadas em um ambiente desbalanceado contendo um nmero maior de agentes Emo-
tivos segue abaixo:
Qualitativa) Como j foi demonstrado nas outras sees, apenas o agente Experimental op-
tou sair pela porta C, lembrando que os custos para esse agente passar por
obstculos bem pequeno.
116
Em dois momentos, dois agentes Emotivos decidiram se separar do grupo, mas
em seguida entraram novamente nos grupos mais prximos, visto que para esse
agente custoso permanecer sozinho.
Sete dos dez agentes simulados saram passando pela porta D e pela porta F.
Estas so as portas intermedirias do ambiente, sendo que, ao se passar pela
porta D, no h mais obstculos at a sada, o que faz com que o custo para
a maioria dos agentes seja pequeno. J na porta F h um obstculo, mas os
agentes que decidem por ela, precisam analisar o custo de retornar. Se este
for maior do que o custo de passar pelo obstculo, provavelmente tomaro essa
deciso. o que ocorre na Fig. (61).
Os dois agentes que optam pela porta I tambm no acrescem muito a seus
custos, pois, como j foi escrito, andar por corredores tem custo baixo a todos.
(a) Viso superior do ambiente. (b) Viso isomtrica do ambiente.
FIGURA 61: Ambiente composto por um nmero maior de agentes Emotivos.
117
FIGURA 62: Tempos mdios de evacuao das quatro personalidades em um ambiente com
maior nmero de agentes Experimentais.
Quantitativa) Aps cinquenta simulaes contendo dez agentes em cada uma, ou seja, cem
agentes Racionais, Custdias e Experimentais (N=100) e duzentos agentes Emo-
tivos (N=200) no total, foi realizada uma anlise quantitativa em cima do tempo
de evacuao de cada uma das personalidades. Observa-se na Fig. (62), que o
tempo de evacuao dos agentes Emotivos foi melhor entre as quatro persona-
lidades, 25,44 s, mas com uma diferena de apenas um centsimo de segundo
em relao ao tempo de evacuao mdio dos agentes Custdias.
O terceiro menor tempo mdio de evacuao foi o dos agentes Racionais, 26,08.
O maior tempo mdio de evacuao, como j observado tambm nas outras
simulaes, cou para os agentes Experimentais, 27,78.
Fazendo uma contagem do nmero de vezes que cada personalidade optou por
sair pelas portas 1, 2 e 3 de sada do ambiente de testes, nas cinquenta simula-
es realizadas, obteve-se os seguintes resultados de acordo com a Fig. (63):
118
FIGURA 63: Portas de sada do ambiente de testes mais utilizadas por cada personalidade.
Se for analisado todas as portas do ambiente, opcionais dos corredores e salas
e portas de sada, tem-se os seguintes resultados de acordo com a Fig. (64):
FIGURA 64: Nmero de vezes que cada porta do ambiente de testes utilizada por cada
personalidade.
Ainda, possvel obter resultados quanto a velocidade mdia dos agentes e
mdias de distncias percorridas por cada personalidade.
119
Desta forma, de acordo com a Fig. (65), as velocidades mdias calculadas com
a realizao de cinquenta simulaes, contendo dois agentes de cada persona-
lidade em cada simulao, ou seja, cem agentes de cada grupo no total, so:
FIGURA 65: Velocidades Mdias e Desvio padro, para cada personalidade.
Observa-se que, em uma linha crescente, da velocidade mdia menor para a
maior, que tem-se os agentes Experimentais, os agentes Custdias, os agen-
tes Emotivos e os agentes Racionais. Os agentes Custdias, comparados ao
ambiente de testes onde havia mais agentes Experimentais e mais agentes
Custdias, manteve a segunda menor velocidade mdia. Os agentes Experi-
mentais mantiveram a mesma posio (primeira) se compararmos os ambientes
com mais agentes Custdias e com mais agentes Emotivos. preciso lembrar
que a velocidade pode sofrer alteraes de acordo com os custos da caminhada.
Esses mesmos custos representam o nvel de estresse dos agentes.
120
FIGURA 66: Distncias Mdias percorridas e Desvio padro, para cada personalidade.
Verica-se, em uma linha decrescente, Fig. (66), da maior distncia mdia per-
corrida para a menor, que tem-se os agentes Experimentais, os agentes Racio-
nais, os agentes Emotivos e os agentes Custdias. Todos os ambientes desba-
lanceados apresentaram mdias de distncia percorrida para os agentes Experi-
mentais bem maiores do que para todas as outras personalidade. Possivelmente
esse fato ocorra justamente pela relao entre custos e velocidade, que faz com
que o agente Experimental possa andar mais tempo pelo ambiente de testes
sem grandes penalidades e com velocidades relativamente baixas.
5.4 PROBABILIDADES GERAIS
Os grcos a seguir foram gerados levando em considerao as mdias de todas
as sees anteriores.
121
FIGURA 67: Mdia de tempo de evacuao de todas as sees anteriores.
Reunindo todas as mdias dos resultados anteriores, para as cinquenta simula-
es tendo, desta forma, seiscentos agentes de cada personalidade (N=600), foi foi
possvel realizar uma anlise em cima do tempo de evacuao de cada uma das per-
sonalidades. Observa-se na Fig. (67), que como j foi comentado e justicado, a or-
dem em tempo de evacuao manteve-se, sendo que os agentes Custdias, mesmo
em um ambiente onde eles esto em maior nmero, so os que saem do ambiente
mais rapidamente, possivelmente por sua capacidade de planejamento. Emcontrapar-
tida, os agentes Experimentais so os ltimos a evacuarem, tambm possivelmente
por testarem o ambiente um nmero maior de vezes do que as outras personalidades.
Na segunda posio, alternando poucas vezes para a terceira posio, est o agente
Emotivo, que como j foi dito, tem a tendncia de seguir outros agentes, fazendo com
que este tambm consiga bons tempos de evacuao. O agente Racional, que no o
melhor planejador, mas tambm no um testador, tem tempos mdios de evacuao
na terceira posio.
Com relao as portas de sada mais utilizadas por cada personalidade tem-se,
de acordo com a Fig. (68):
122
FIGURA 68: Portas de Sada mais utilizadas por cada personalidade levando em
considerao todas as sees anteriores.
a segunda porta de sada do ambiente, tambm j vericada nas outras anlises,
a mais utilizada por todos os agentes, possivelmente pelos baixos custos do
corredor e poucos obstculos;
assim como a porta 1 de sada do ambiente a menos utilizada, provavelmente
por existir um obstculo logo que os agentes entram por ela.
Com relao as portas intermedirias do ambiente, Fig. (69) , o que se observa
que para os agentes Custdias, a porta mais utilizada a porta D, que o leva rapida-
mente para a sada 2. O mesmo ocorre com os agentes Emotivos.
J para os agentes Racionais, a porta intermediria mais utilizada a porta H,
possivelmente pelo baixo custo desse agente para chegar at ela. A porta H o dire-
ciona para a porta I, que o leva at a porta de sada 2 ou, para a porta J, que o leva
para a porta de sada 3.
Os agentes Experimentais tambm utilizam um nmero maior de vezes a porta H,
contudo sua distribuio entre as outras portas mais equilibrada do que a distribuio
dos outros agentes, justamente pelo fato desse agente ser um agente testador do
ambiente.
123
FIGURA 69: Quantidade do uso de portas por personalidade.
Foi possvel calcular as mdias gerais para as distncias percorridas e tambm
para as velocidades, para as quatro personalidades. Assim, de acordo com as Fig.
(70) e (71) tem-se:
FIGURA 70: Valor mdio das distncias percorridas por cada personalidade em todas as
simulaes realizadas.
124
FIGURA 71: Valor mdio das velocidades de cada personalidade em todas as simulaes
realizadas.
Observa-se que o padro presente nas sees anteriores foi mantido e representa
adequadamente as hipteses adotadas na metodologia. Assim, se obteve que os
agentes Custdias, com melhores tempos de evacuao, tambm so os agentes que
percorrem as menores distncias e s perdem na velocidade mdia para os agentes
Emotivos (um pouco mais rpidos), provavelmente em funo dos custos.
A posio dos agentes Racionais e Experimentais em relao a distncia percor-
rida e velocidade mdia tambm demonstram essa relao direta dos resultados com
os custos.
5.5 VALIDAO DOS RESULTADOS
Para que a armao feita na Sec. (5.4) dizendo que, os resultados obtidos em
relao aos tempos de evacuao, velocidades mdias e distncias percorridas tm
relao direta com os custos, seja validada, foram realizadas mais cinquenta simula-
es, com o mesmo ambiente de testes, porm com agentes sem custos.
Assim, as cinquenta simulaes foram realizadas no ambiente de testes da Fig.
(25), sendo retirados todos os custos dos agentes das quatro personalidades, para
que fosse possvel comparar os resultados aos resultados j obtidos tanto na Sec.
(5.1) como na Sec. (5.4).
125
O que se obteve foi a escolha de todos os agentes, independentes das personali-
dades pela porta C e, na sequncia, saindo pela porta 1, conforme Fig. (72), ou seja,
o resultado do POMDP foi timo e todos seguiram pelo caminho mais curto.
FIGURA 72: Simulao com agentes sem custos.
Desta forma, valida-se a armao e pode-se dizer que os custos inuenciam nas
decises e nos resultados, fazendo com que as hipteses feitas para as quatro perso-
nalidades funcionemcomo um"humanizador"da simulao, pois o plano de evacuao
do agente nem sempre o plano timo. Alm disso, as tendncias e comportamentos
representados na simulao e seus resultados esto de acordo com os apresentados
pelos demais autores referenciados.
126
6 DISCUSSO
A escolha de se trabalhar com modelos de Markov deve-se ao fato desses mode-
los serem grandemente empregados para se analisar ambientes complexos, que ,
justamente o tipo de ambiente no qual pedestres circulam. Na verdade, o que torna
o ambiente complexo justamente a existncia de comportamentos e personalidades
variadas, o que faz com que os processos de deciso sejam difceis de modelar.
A proposta de se trabalhar com variveis psicocomportamentais que alimentem
um simulador numrico interessante, visto que a movimentao de pedestres s
pode ser bem representada se estas caractersticas comportamentais de pessoas re-
ais estiverem presentes no modelo, caso contrrio os resultados podem se mostrar
contraintuitivos e desconexos com o que realmente ocorre, no s em casos de eva-
cuao, mas tambm em caminhadas normais.
A hiptese de uso das variveis psicocomportamentais denidas pela pesquisa-
dora Angela Behrendt se encaixa na proposta do trabalho e foi possvel acopl-las a
outras caractersticas apresentadas por vrios autores da rea de dinmica de mul-
tides, fazendo com que a classicao das variveis psicocomportamentais usadas
para a simulao fossem inditas e representativas se comparadas classicao
feita por outros autores.
O que pode ser observado nos resultados foram algumas tendncias de cada per-
sonalidade ou grupo de agentes de mesma identidade. Alm disso, foi possvel veri-
car a formao de grupos entre personalidades diferentes, na tentativa de troca de
informaes para alcanar objetivos. Entre os grupos dos Racionais e dos Custdias,
essa caracterstica cou bem evidente, pois a maior parte deles acabaram optando
pela mesma porta de sada. Contudo, nas duas outras personalidades, a porta de
sada mais utilizada tambm teve um percentual elevado, o que representa um com-
portamento de rebanho descrito por Quarantelli (1957).
Tambm pode ser vericado que cada grupo representou caractersticas particu-
lares, como a de seguir outros agentes, ou testar vrias opes de caminhos. Essas
caractersticas estavam descritas em cada personalidade, foram bem representadas
nas simulaes e podem ser comparadas s caractersticas de multides apresenta-
das por Le Bon (2012).
Um fator que foi bem retratado foi justamente a caminhada dos agentes pelos
corredores. Benthorn (1998) diz que alguns fatores podem aumentar a atratividade de
127
uma sada e um deles a das sadas serem iluminadas ou abertas. Os corredores
deste trabalho zeram esse papel e demonstrou-se na simulao que a maioria dos
agentes preferiu seguir por eles.
Ainda segundo Benthorn, o movimento de pedestres em situaes de fuga no
necessariamente em linha reta, mas aleatrio em uma faixa de terreno. Essa caracte-
rstica cou representada pelo caminho utilizado pelos agentes durante a evacuao,
fato esse possvel pelo uso da curva de Bzier para a determinao desse caminho.
Foi possvel validar a relao entre a hiptese criada para os custos de cada per-
sonalidade com as velocidades mdias, o tempo de evacuao e as distncias percor-
ridas por cada grupo de agentes. Para tal validao comparou-se, usando o mesmo
ambiente de testes, os resultados do modelo alimentado com as quatro personalida-
des tendo os custos de movimentao pr-estabelecidos e resultados com persona-
lidades tendo todos os custos zerados. O resultado claramente indica que os custos
distorcem o resultado timo e agrega uma parcela "humana" simulao, pois permite
que os agentes cometam erros, bem ilustrado pelos resultados quantitativos.
Foi atravs da curva de Bzier que as velocidades mdias tambm caram bem
representadas, pois devido as caractersticas de suavizao da prpria Bzier em que
uma curva de raio menor possui mais pontos que uma curva de raio maior, vericava-
se que os agentes aumentavam suas velocidades ao avistarem portas ou estando
em corredores (raios maiores) e diminuam suas velocidades ao passarem por essas
portas ou fazerem curvas fechadas (raios menores). Essa caracterstica da curva
aproximou a movimentao dos agentes a uma movimentao de uma pessoa, em
relao a variabilidade de velocidade ao andar.
Outras caractersticas, fora do foco do trabalho, ainda podem ser retiradas e com-
paradas a estudos sobre comportamento de pedestres em situaes de estresse, mas
o que se pode armar em funo dos resultados obtidos que, o mtodo de mode-
lagem desenvolvido pode ser utilizado como ferramenta na anlise de ambientes que
esto sendo preparados para receber pessoas ou que necessitem de sadas de emer-
gncia para evacuao rpida de pedestres.
Para que esta anlise seja satisfatria, primeiramente necessrio fazer uma pes-
quisa comportamental na regio onde o simulador ser aplicado e identicar as per-
sonalidades existentes. Em seguida, deve-se quanticar em porcentagens cada uma
dessas personalidades identicadas. Por m essas informaes so transcritas no
formato de custos, desejos, crenas e intenes de forma que seja possvel alimentar
o simulador.
Emrelao a implementao, a deciso por se programar emPython j foi, durante
este texto, muitas vezes justicada, mas realmente por causa de sua simplicidade
128
de programao e quantidade de bibliotecas e ferramentas prontas e fceis de serem
utilizadas que se fez essa escolha. Uma dessas ferramentas foi o mdulo pyMC, que
pode ser alimentado pelos I-plans, que so a base deste trabalho, evitando esforo
adicional na programao do ltro de partculas.
Infelizmente, no foi possvel obter resultados em tempo real ou com muitos agen-
tes, devido necessidade de um alto poder de processamento e maior capacidade de
armazenamento. O tempo para gerar as cinquenta simulaes analisadas em cada
uma das conguraes apresentadas nos resultados foi de, aproximadamente, vinte
e cinco horas. O que faz com que esse tempo seja alto justamente a existncia de
interaes entre os agentes, o que, de certa forma, diculta a construo do cdigo
utilizando programao em paralelo para cada agente.
Quando geraram-se as ltimas cinquenta simulaes sem custos para os agentes,
o tempo para a obteno de resultados foi de pouco mais de duas horas, valor aqum
das simulaes anteriores, pois nesse caso o resultado timo e todos se dirigem
para o mesmo ponto sem muitas interaes entre agentes e com o ambiente. O custo
computacional complicado de ser ilustrado, pois depende da atitude dos agentes em
cada simulao, ou seja, quando se tem muitas interaes, seja pelo planejamento de
cada agente, ou pelas decises que tomam, o custo computacional tende a se elevar.
Um agente sozinho no ambiente, roda de forma relativamente rpida, pouco menos de
uma hora, com dois ou mais essa variabilidade do custo j se apresenta, podendo ser
uma simulao rpida, algumas horas, ou lenta, vrias horas, dependendo do nvel de
interao entre esses agentes.
129
7 CONCLUSES
A aplicabilidade das teorias envolvidas no problema proposto neste trabalho, seja
na rea psicocomportamental, como em toda a teoria de Inteligncia Articial con-
tendo agentes com Crenas, Desejos e Intenes (BDI), Processos de Deciso de
Markov Parcialmente Observveis (POMDP), Filtro de Partculas (PF) e I-plans, base
da metodologia empregada, com a utilizao da programao em Python, suas biblio-
tecas e mdulos, que facilitaram a obteno de resultados, tornou possvel alcanar o
objetivo principal, que era desenvolver uma modelagem computacional com visualiza-
o tridimensional (3D), utilizando inteligncia articial atravs da gerao de i-plans
bidimensionais, que seja capaz de simular, em funo de hipteses simplicadoras, a
movimentao de pessoas em situaes de estresse, em ambientes fechados quais-
quer, de forma a contribuir com as pesquisas recentes na rea de movimentao pe-
donal, inovando com a implementao de variveis psicocomportamentais para denir
o planejamento de cada agente durante a evacuao do ambiente.
Vale ressaltar que esta pesquisa iminentemente interdisciplinar, pois prope uma
conjuno da rea de cincias sociais, as reas de matemtica e sistemas inteligentes.
Todas fornecem subsdios para que o objetivo seja cumprido.
O mtodo de modelagem criado, assumindo variveis psicocomportamentais e
agentes BDI, pode ser aplicado nos mais diversos ambientes. Pode-se citar, por exem-
plo, o ramo do entretenimento, como casas de shows, estdios de futebol e salas de
cinema, que necessitam de tais simuladores para analisar suas estruturas e projeto
de evacuao e posicionamento de portas de sada, justamente por serem ambientes
que recebero muitas pessoas, com diversas personalidades e que, se no estiverem
bem preparados, podem gerar desastres.
Os resultados deste trabalho so um comeo promissor, visto que a metodologia
de resoluo do problema de movimentao apresentada na tese, simula de forma
interessante e aproximada o problema da movimentao e uxo de pedestres em
situaes de estresse elevado.
130
8 SUGESTO PARA TRABALHOS FUTUROS
Uma extenso desta linha de pesquisa para trabalhos futuros pode ser dada por:
Renar a ideia dos custos para cada uma das quatro personalidades atravs de
uma pesquisa psicocomportamental realizada especicamente para um determi-
nado grupo, onde possa se fazer comparaes;
Construir ambientes de caminhada que representem estdios de futebol, casas
noturnas, cinemas, etc, onde costumam acontecer acidentes em situaes de
estresse;
Comparar os resultados com outros simuladores existentes no mercado.
Representar os agentes com movimentos semelhantes ao do ser humano, como
o de poder dar passos, abrir os braos ou virar a cabea.
Testar outras curvas de interpolao para a caminhada dos pedestres, como
splines ou nurbs.
Simular um nmero maior de agentes para que outras caractersticas psicocom-
portamentais possam ser vericadas.
131
REFERNCIAS
ACADEMIES, T. N. Highway Capacity Manual. 3. ed. [S.l.], 2000.
AIUBE, F. A. L. Modelagem dos Preos Futuros de Commodities: Abordagem
pelo Filtro de Partculas. Tese (Doutorado) Puc-Rio, 2005.
ALVARES, L. O.; SICHMAN, J. Introduo aos sistemas multiagentes. In: Jornada de
atualizao em informtica. [S.l.]: SBC, 1997. p. 138.
ALVES, L. M. Anlise Numrica. 2013. 1 Dez.
<http://www.lucasmaximoalves.les.wordpress.com/2009/09/analise-numerica.doc>.
ASHIDA, K. et al. Pedestrians: creating agent behaviors through statistical analysisof
observation data. The Fourteenth Conference on Computer Animation. Procee-
dings, p. 8492, 2001.
BATISTA, C. S. Soluo de Equaes de Balano Populacional Usando a Tc-
nica de Transformada de Laplace e Filtro de Partculas. Tese (Doutorado) Pro-
derna/UFPA, 2011.
BAUM, L. E.; PETRIE, T. Statistical inference for probabilistic functions of nite state
markov chains. Ann Math. Stat., v. 37, p. 15541563, 1966.
BEHRENDT, A. Cooperation and thinking preferences. the importance of understan-
ding our brain. In: UNIVERSIDADE DO ALGARVE - FARO. ECCI-XII. [S.l.], 2011.
BENTHORN, L.; FRANTZICH, H. K. Fire alarm in a public building : How do people
evaluate information and choose evacuation exit? In: SHIELDS, J. (Ed.). [S.l.]: Fire-
SERT, Univ of Ulster, N Ireland, 1998. p. 213222.
BICHO, A. L. Da modelagem de plantas dinmica de multides: um modelo de
animao comportamental bio-inspirado. Tese (Doutorado) Universidade Esta-
dual de Campinas, 2009.
BITTENCOURT, G. Inteligncia Articial: Ferramentas e Teorias. Ufsc. [S.l.]: Uni-
versidade Federal de Santa Catarina, 2006.
BOARD, T. R. Highway Capacity Manual. Washington, D.C., 1985.
BON, G. L. The Crowd: A Study of the Popular Mind. 2012. 05, Mar.
<http://etext.virginia.edu/toc/modeng/public/BonCrow.html>.
BOURNE, E. J. The Anxiety and Phobia Workbook. 4. ed. [S.l.]: New Harbinger
Press, 2005.
BRATMAN, M. Two faces of intention. Philosophical Review, v. 93, n. 3, p. 375405,
1984.
132
BRATMAN, M. Intention, Plans, and Practical Reason. [S.l.]: Center for the Study of
Language and Information, 1987.
BRATMAN, M. Intention, belief, and instrumental rationality. In: Reasons for Action.
[S.l.]: Cambridge, 2009.
BRATMAN, M. Intention, belief, practical, theoretical. In: Spheres of Reason: New
Essays in the Philosophy of Normativity. [S.l.]: Oxford University Press, 2010.
BRILON, W.; GOSSMANN, M.; BLANKE, H. Verfahren fr die Berechnung der
Leistnungsfahigkeit und Qualitt des Verkehrsablaufes auf Strassen. Alemanha:
Bundesministerium fr Verkehr, 1994.
BROWN, R. Social Psychology. [S.l.]: The Free Press, New York, 1965.
BUCHANAN, B. G.; FEIGENBAUM, E. A. Dendral and meta-dendral: their applica-
tions dimension. [S.l.]: Articial Intelligence, 1978. 5-24 p.
BURSTEDDE, C. et al. Cellular automaton approach to pedestrian dynamics - applica-
tions. Pedestrian and Evacuation Dynamics, Springer, p. 8798, 2002.
BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. [S.l.: s.n.], 2004.
BZIER, P. How Renault uses numerical control for car body design and tooling, bo-
oktitle = Society of Automotive Engineers Congress, journal = SAE 68001, location =
Detroit, Mich., year = 1968. In: . [S.l.: s.n.].
CASSANDRA, A. R.; LITTMAN, M.; ZHANG, N. Incremental pruning: a simple, fast,
exact method for partially observable markov decision processes. 13th Annual Con-
ference on Uncertainty in Articial Intelligence (UAI), 1997.
CASTILHO, E.; GUTIERREZ, J. Expert Systems and Probabilistic Network Models.
[S.l.]: Springer, 1997.
CUPERTINO, A. F. Filtro de Partculas: O Algoritmo Resample-Move. Tese (Dou-
torado) UFMG, 2007.
DAAMEN, W.; BOVY, P. H. L.; HOOGENDOORN, S. P. Modelling pedestrians in trans-
fer stations. Pedestrian and Evacuation Dynamics, Springer, Berlin, p. 5973, 2002.
DAAMEN, W.; HOOGENDOORN, S. P.; BOVY, P. H. L. First-order pedestrian trafc
ow theory. Transportation Research Record, v. 1934, n. 1, p. 4352, 2005.
DAPPER, F. Planejamento de Movimento para Pedestres utilizando Campos Po-
tenciais. Dissertao (Mestrado) Universidade Federal do Rio Grande do Sul, 2007.
DESCONHECIDO, A. Tutorial bsico de Python. 2012. 18 Feb. 2012
<http://www.codigofonte.net/>.
DIAS, A. Curvas e Superfcies de Bzier. Tese (Doutorado) Universidade Federal
de Santa Catarina - UFSC, Florianpolis, 2000.
DIB, M. V. P.; CARDOSO, D. A.; WEIGANG, L. Sistema para sincronizao e geren-
ciamento de uxo de trfego areo multi-agentes. Revista Transportes, v. 13, n. 1,
2005.
133
DOUCET, A.; FREITAS, N.; GORDON, N. Sequential Monte Carlo Methods in Prac-
tice. 1a. ed. [S.l.]: Springer, 2001.
ELLIOTT, D.; SMITH, D. Football stadia disasters in the united kingdom: learning from
tragedy? Industrial and Environmental Crisis Quarterly, v. 7, p. 205229, 1993.
EMERSON, E. A.; HALPERN, J. Y. sometimes and not never revisited: on branching
versus linear time temporal logic. Journal of the ACM, v. 33, 1986.
FAHY, R. F.; PROULX, G. Evacuation of the world trade center: what went right? NFPA
Journal, p. 6067, 1995.
FERNANDEZ, P. J. Introduo Teoria das Probabilidades. 5a. ed. [S.l.]: IMPA,
2011. (Publicaes Matemticas).
FERREIRA, J. M. P. Departamento de Informtica - UEM. 2012. 2 Mar.
<http://www.din.uem.br/ jmpinhei/SI/>.
FIORI, J. P.; THIELE, R.; RAMOS, A. Z. Redes Bayesianas e inferncia aproximada.
2012. USP. 14 Feb. <http://www.lti.pcs.usp.br/pcs2059/aulas/Seminario-G7-doc.pdf>.
FONNESBECK, C. J. PYMC 2.3 documentation. 2014. 11, Fev. <http://pymc-
devs.github.io/pymc/README.html>.
FORREST, A. R. Interactive interpolation and approximation by bzier polynomials.
Computer-Aided Design, v. 22, n. 9, p. 527 537, 1990.
FOUNDATION, P. S. Python Documentation. 2014. 13 Feb.
<http://docs.python.org/2/tutorial/datastructures.html#dictionaries>.
FOX, D. et al. Particle lters for mobile robot localization. In: DOUCET, A.; FREITAS
de N.; GORDON, N. (Ed.). Sequential Monte Carlo Methods in Practice. New York:
Springer Verlag, 2000.
FREITAS, I. M. D. P. Componentes dos Sistemas de Trfego. 2014. 02, Jan.
<http://www.transportes.ufba.br/Arquivos/Prof_Ilce/Estudos_de_Trafego_Componente_dos_Sistemas_de_Trafego.doc>.
FRUIN, J. J. Designing for pedestrians. a level-of-service concept. Highway Research
Record, v. 377, p. 115, 1971.
GANEM, J. A behavioral demonstration of fermats principle. The Physics Teacher,
v. 36, n. 2, p. 7678, 1998.
GORDON, W. J.; RIESENFELD, R. F. Bernstein-bzier methods for the computer-aided
design of free-form curves and surfaces. Journal ACM, v. 21, n. 2, p. 293310, 1974.
GUIMARES, F. S. Um Sistema Multi-Agentes para Monitoramento e Aquisio
em Tempo Real. Dissertao (Mestrado) UFRGS - Instituto de Informtica, 2006.
HAMAGAMI, T.; HIRATA, H. Method of crowd simulation by using multiagent on cellu-
lar automata. Intelligent Agent Technology, IEEE / WIC / ACM International Confe-
rence on, IEEE Computer Society, Los Alamitos, CA, USA, v. 0, p. 46, 2003.
134
HANSEN, E.; ZHOU, R. Synthesis of hierarchical nite-state controllers for pomdps. In-
ternational Conference on Automated Planning and Scheduling (ICAPS. Trento-
Italy, 2003.
HELBING, D.; FARKAS, I.; VICSEK, T. Simulating dynamical features of escape panic.
Nature, v. 407, p. 487, 2000.
HELBING, D.; KELTSCH, J.; MOLNR, P. Modeling the evolution of human trail sys-
tems. Nature, v. 388, p. 47, 1997.
HELBING, D.; MOLNR, P. Social force model for pedestrian dynamics. Physical Re-
view E, American Physical Society, v. 51, n. 5, p. 42824286, maio 1995.
HENDERSON, L. F. The statistics of crowd uids. Nature, v. 229, p. 381383, 1971.
HO, Y. C.; LEE, R. C. K. A bayesian approach to problems in stochastic estimation and
control. IEEE Trans. Automat. Contr., v. 9, p. 333339, 1964.
HOOGENDOORN, S.; BOVY, P. H. L. Gas-kinetic modelling and simulation of pedes-
trian ows. Transportation Research Record, National Research Council, v. 1710,
n. 189, p. 2836, 1999.
HOOGENDOORN, S. P. Microscopic simulation of pedestrian ows. Civil Enginee-
ring, p. 111, 2003.
HUGHES, R. L. A continuum theory for the ow of pedestrians. Transportation Rese-
arch Part B: Methodological, Elsevier, v. 36, n. 6, p. 507?535, 2002.
JAMES, B. R. Probabilidade: Um Curso em Nvel Intermedirio. [S.l.]: IMPA, 1996.
JUSTINIANO, P. Introduo a Inferncia Bayesiana. 2012. 03, Mar.
<http://www.leg.ufpr.br/ paulojus/CE227/ce227/node5.html>.
KAELBLING, L. P.; LITTMAN, M.; CASSANDRA, A. R. Planning and acting in partially
observable stochastic domains. Articial Intelligence, v. 101, 1998.
KEATING, J. P. The myth of panic. Fire Journal, 1982.
KERNER, B. S. The physics of trafc. [S.l.]: Springer Verlag, 2004.
KLERMAN, G. L.; HIRSCHFELD, R. M. A.; WEISSMAN, M. M. Panic Anxiety and Its
Treatments: Report of the World Psychiatric Association Presidential Educatio-
nal Program Task Force. [S.l.: s.n.], 1993.
KORB, K. B.; NICHOLSON, A. E. Bayesian articial intelligence. [S.l.]: Chapman e
Hall/CRC Press UK, 2004.
LARRAAGA, A. M. Anlise do Padro Comportamental de Pedestres. Dissertao
(Mestrado) Universidade Federal do Rio Grande do Sul, 2008.
LEBACQUE, J. P.; KHOSHYARAN, M. M. First order trafc ow models: intersection
modeling, network modeling, applications. Proc of Mathematical Models of Trafc
Flow, 2005.
135
LERNER, A. et al. Fitting behaviors to pedestrian simulations. In: Proceedings of the
2009 ACM SIGGRAPH/Eurographics Symposium on Computer Animation. New
York, NY, USA: ACM, 2009. (SCA 09), p. 199208.
LIN, L.-J.; MITCHELL, T. M. Memory Approaches To Reinforcement Learning In
Non-Markovian Domains. [S.l.], 1992.
LOVEJOY, W. S. Computationally feasible bounds for partially observed markov deci-
sion processes. Oper. Res., INFORMS, v. 39, p. 162175, 1991.
MAGALHES, M. N. Probabilidade e Variveis Aleatrias. 3a. ed. [S.l.]: Edusp,
2011.
MANNING, C. D.; RAGHAVAN, P.; SCHTZE, H. H. Introduction to Information Re-
trieval. New York, NY, USA: Cambridge University Press, 2008.
MCCARTHY, J. Lisp 1.5 Programmers Manual. [S.l.]: Cambridge, Massachusetts:
The MIT Press, 1962.
MINTZ, A. Non-adaptive group behavior. Journal of Abnormal Psychology, v. 46,
n. 2, p. 150159, 1951.
MORITA, M.; OLIVEIRA, L.S. Introduo aos Modelos Escondidos de Markov. Te-
chnical Report (PPGIA), PUCPR: Curitiba-Paran, 1998
NAIR, R.; TAMBE, M. Hybrid bdi-pomdp framework for multiagent teaming. J. Artif.
Int. Res., AI Access Foundation, v. 23, p. 367420, April 2005.
NOGUEIRA, F. Notas de Aula. 2012. 29 Feb.
<http://www.ufjf.br/epd042/les/2009/02/cadeiaMarkov.pdf>.
NORVIG, P.; RUSSELL, S. J. Inteligncia Articial. [S.l.]: Campus, 2004.
OLDER, S. J. Movement of pedestrians on footways in shopping streets. Trafc Engi-
neering and Control, v. 10, n. 4, p. 160163, 1968.
PARUCHURI, P. et al. Multiagent Teamwork: Hybrid Approaches. 2006.
PEARL, J. Probabilistic Reasoning in Intelligent Systems. [S.l.]: Morgan Kaufmann,
1988.
PELLEGRINI, J. Processos de Deciso de Markov Limitados por Linguagem. Tese
(Doutorado) UNICAMP, 2006.
PELLEGRINI, J.; WAINER, J. Processos de deciso de markov: Um tutorial. Revista
de Informtica Terica e Aplicada, v. 14, n. 2, 2007.
PEREIRA, D. R. Construo de Planos BDI a partir de Polticas timas de
POMDPs, com Aplicao na Auto-Regulao de Trocas Sociais em Sistemas
Multiagentes. Dissertao (Mestrado) Universidade Catlica de Pelotas, Abr 2008.
PEREIRA, G.; SAITO, M.; PEDRUZZI, P. Planejamento no mundo real. 2012. 12,
Mar. <www.lti.pcs.usp.br/pcs2059/aulas/Seminario-G4-doc.pdf>. Escola Politcnica da
Universidade de So Paulo - Departamento de Engenharia de Computao e Siste-
mas Digitais.
136
PETTELE. Tutorial de Introduo ao Python. Niteri-RJ, 2011.
PORTZ, A.; SEYFRIED, A. Modeling stop-and-go waves in pedestrian dynamics. In:
Proceedings of the 8th international conference on Parallel processing and ap-
plied mathematics: Part II. Berlin, Heidelberg: Springer-Verlag, 2010. p. 561568.
POUPART, P.; BOUTILIER, C. Bounded nite state controllers. Conference on Neural
Information Processing Systems (NIPS)., 2003.
PREDTETSCHENSKI, W. M.; MILINSKI, A. I. Personenstrme in Gebuden - Bere-
chnungsmethoden fr die Projektierung. [S.l.]: Kln-Braunsfeld, 1971.
PYSCIENTE. SciPy. 2012. 18 Feb. 2012 <http://pyscience-
brasil.wikidot.com/module:scipy>.
QUARANTELLI, E. The behavior of panic participants. Sociology and social rese-
arch, v. 41, p. 187194, 1957.
RABINER, L. R. A tutorial on hidden markov models and selected applications in spe-
ech recognition. Procedings of the IEEE, v. 77, n. 2, 1989.
REIS, L. P. Coordenao em Sistemas Multi-Agente: Aplicaes na Gesto Uni-
versitria e Futebol Robtico. Tese (Doutorado) Universidade do Porto - Facul-
dade de Engenharia - FEUP, Jul 2003.
REKLEITIS, I. M. A Particle Filter Tutorial for Mobile Robot Localization TR-CIM-
04-02. Dissertao (Mestrado) Centre for Intelligent Machines, McGill University,
2004.
RENS, G.; FERREIN, A.; POEL, E. v d. A bdi agent architecture for a pomdp planner.
In: Nineth International Symposium on Logical Formalizations of Commonsense
Reasoning. Toronto, Canada: [s.n.], 2009.
RHEINGOLD, H. EXPERT SYSTEMS. 2012. 28 Feb.
<http://www.atariarchives.org/deli/>.
ROY, N. Finding Approximate POMDP solutions Through Belief Compression.
Tese (Doutorado) Robotics Institute, Carnegie Mellon University, Sep 2003.
SARKAR, A. K.; JANARDHAN, K. S. V. S. A study on pedestrian ow characteristics.
In: Proceedings of the Annual Meeting of the Transportation Research Board.
[S.l.]: Transportation Research Board, National Research Council, 1997.
SCHADSCHNEIDER, A. Cellular automaton approach to pedestrian dynamics - theory.
Pedestrian and Evacuation Dynamics, Springer, p. 7586, 2002.
SCHADSCHNEIDER, A.; SEYFRIED, A. Validation of ca models of pedestrian dyna-
mics with fundamental diagrams. Cybernetics and Systems, Taylor and Francis Ltd,
v. 40, n. 5, p. 367389, 2009.
SCHERER, D. 3d programming for ordinary mortals. VPython.org, 2014.
SHORTLIFFE, E. H. Computer-based medical consultations: MYCIN. [S.l.]: New
York: American Elsevier, 1976.
137
SIMARI, G. I.; PARSONS, S. On the relationship between mdps and the bdi architec-
ture. In: Proceedings of the fth international joint conference on Autonomous
agents and multiagent systems. [S.l.]: ACM, 2006. (AAMAS 06), p. 10411048.
SOUZA, E. E.; NETTO, M. L. Sistemas Multi-Agentes Aplicados TV a Cabo. 2012.
28 Feb. <http://www.lsi.usp.br/ lobonett/publications/>.
STEINBERG, J. G. Desenvolvimento de modelo para simulao de situaes de
evacuao de multides. Tese (Doutorado) Universidade Estadual de Campinas,
2005.
STEMMER, M. R. et al. Apostila de Sistemas de Viso. [S.l.]: Sistemas Industriais
Inteligentes, 2005.
TANABORIBOON, Y.; HWA, S. S.; CHOR, C. H. Pedestrian characteristics study in
singapore. Journal of Transportation Engineering - ASCE, v. 112, n. 3, 1986.
TEKNOMO, K. Application of microscopic pedestrian simulation model, journal = Trans-
portation Research Part F, volume = 9, pages = 15-27, year = 2006.
THRUN, S.; NORVIG, P. Introduction to Articial Intelligence - Stanford Enginee-
ring. 2011. 01 Nov. <https://www.ai-class.com/home/>.
TOYAMA, M. C. Uma abordagem multiagente para dinmica de pedestres. Disser-
tao (Mestrado) PUC-RIO - Departamento de Informtica, 2006.
TURNER, R. H.; KILLIAN, L. M. Collective behavior. [S.l.]: Prentice-Hall, 1972.
UFPE. Mtodos Matemticos 1A - Cadeias de Markov. 2012. 29 Feb.
<http://www2.ee.ufpe.br/codec/Markov.pdf>.
ULLRICH, H. Mechanische Verfahrenstechnik: Berechnung Und Projektierung.
[S.l.]: Springer-Verlag GmbH, 1967.
VALENTIN, M. V.; ONO, R. Sadas de emergncia e comportamento humano: Uma
abordagem histrica e o estado atual da arte no brasil. In: NUTAU. [S.l.: s.n.], 2006.
VENUTI, F.; BRUNO, L. An interpretative model of the pedestrian fundamental relation.
Comptes Rendus Mcanique, v. 335, n. 4, p. 194200, 2007.
VIRKLER, M. R.; ELAYADATH, S. Pedestrian speed-ow-density relationships. Trans-
portation Research Record, n. 1438, p. 5158, 1994.
WEIDMANN, U. Transporttechnik der Fubgnger. [S.l.]: ETH Zrich, 1993.
WEIDMANN, U.; BUCHMUELLER, S. Parameters of pedestrians, pedestrian trafc
and walking facilities,. ETH Zrich, 2006.
WOOLDRIDGE, M. An Introduction to MultiAgent Systems. [S.l.]: Bafns Lane:
John Wiley e Sons, 2002.
ZAMPIERI, F. L. L. Modelo Estimativo de Movimento de Pedestres baseado em
sintaxe espacial, medidas de desempenho e redes neurais articiais. Dissertao
(Mestrado) Universidade Federal do Rio Grande do Sul, 2006.

You might also like