Professional Documents
Culture Documents
Agentes Inteligentes
. Criar iluso da vida (ex. Walt Disney) . Permitir interao com usurio . Modelar comportamento e personalidade (ex. tamagotchi)
QRIO - SONY
ASIMO - HONDA
E a?
O que estes problemas tm em comum?
Grande complexidade (nmero, variedade e natureza das tarefas) No h soluo algortmica, mas existe conhecimento Modelagem do comportamento de um ser inteligente (autonomia, aprendizagem, conhecimento, etc.)
Racionalidade = capacidade de alcanar o sucesso esperado na execuo de uma tarefa. Grau de Sucesso: medida de desempenho a ser maximizada.
10
11
12
O que um agente?
Agente qualquer entidade que:
percebe seu ambiente atravs de sensores (ex. cmeras, microfone, teclado, finger, ...) age sobre ele atravs de atuadores (ex. vdeo, auto-falante, impressora, braos, ftp, ...)
Ambiente/agente
ambiente
Fsico: robs Software: softbots Realidade virtual (simulao do ambiente fsico): softbots e avatares
percepo
ao
Efetua o mapeamento:
seqncia perceptiva ao
13
Medida de Desempenho
Critrio que define o grau de sucesso de um agente na realizao de uma dada tarefa O qu avaliar, Como avaliar, Quando avaliar
Esta medida deve ser imposta do exterior M escolha da MD pode acarretar comportamento indesejado Compromissos entre objetivos mltiplos conflitantes Resta o problema de saber quando avaliar o desempenho
14
Agente Racional
Agente Racional:
Para cada seqncia perceptual possvel, o agente racional deve selecionar uma ao que ele espera que maximize sua medida de desempenho, segundo a evidncia dada pela seqncia perceptiva e os eventuais conhecimentos que tenha.
Limitaes de:
Sensores, atuadores, raciocinador (conhecimento, tempo, etc.)
16
Agente de polcia
Agente
raciocnio
Conhecimento: - leis - comportamento dos indivduos,... Objetivo: - fazer com que as leis sejam respeitadas Aes: - multar - apitar - parar, ...
percepo
execuo
Ambiente
17
Propriedades do Ambiente
totalmente observvel x parcialmente observvel determinstico x estocstico (envolve previsibilidade do prximo estado) episdico x seqencial (envolve ter ou no conseqncias futuras decorrentes da deciso atual) esttico x dinmico (envolve tempo) discreto x contnuo (aplicado a estado, tempo, aes e/ou percepes) nico agente x multiagente (envolve comunicao, cooperao, competio..)
18
Estrutura do Agente
Agente = arquitetura de HW + arquitetura de SW
Arquitetura de HW:
onde o agente vai ser implementado (dispositivo computacional, sensores e atuadores)
Arquitetura de SW:
arquitetura do agente: mdulos bsicos do programa e suas inter-relaes
19
Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
autonomia complexidade
20
Agente tabela
sensores ambiente
Tabela percepes aes . . . .
Agente
atuadores Limitaes
Mesmo para problemas simples
ex. xadrez 30^100
Nem sempre possvel, por ignorncia ou questo de tempo, construir a tabela No h autonomia nem flexibilidade
Ambientes
observvel, determinstico, episdico, esttico, discreto (e minsculo!)
21
PERCEPO [sala, estado] [A, limpo] [A, sujo] [B, limpo] [B, sujo]
22
Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
24
Agente reativo
sensores ambiente Em que condio est o mundo agora? Que ao devo escolher agora? atuadores Regras condio-ao Agente
Vantagens e desvantagens
Regras condio-ao: representao inteligvel, modular e eficiente ex. Se velocidade > 60 ento multar No pode armazenar uma seqncia perceptiva, pouca autonomia
Ambientes:
Reflexo imprescindvel em ambientes dinmicos Observvel, episdico, pequeno
25
function Agente-Reativo-Aspirador ([local, status]) return uma ao if status=Sujo then return Aspira else if local=A then return Direita else if local=B then return Esquerda
26
27
28
Arquiteturas Reativas
SENSE SENSE SENSE ACT ACT ACT
Mecanismo de coordenao
29
Mecanismo de coordenao
Coordenao Competitiva: a ao resultante num dado instante selecionada a partir de uma competio entre os comportamentos ativos (um vence). Coordenao Cooperativa: a funo de coordenao produz uma ao resultante para a qual contribuem todos os comportamentos ativos.
30
31
REACT
Arquitetura baseada em Motor Schemas
Motor Schema comportamento
Comportamentos so divididos em:
mdulo de percepo mdulo de codificao
Vetor
32
REACT
Mdulo de codificao:
Mapeamento contnuo: percepes aes Usa o Mtodo de Campos Potenciais
33
REACT
moveToGoal
obs
avoidCollision + moveToGoal
avoidCollision
34
REACT
sonares
avoidCollision
V (d ) = e ( d + S ) /T = rob obstculo
(V1, 1) (VR, R)
(V3, 3) moveToGoal
odmetros
longe
perto
35
37
Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
38
39
Regras condio-ao
Ex.: carro mudando de faixa, no trnsito (percepo parcial, precisa do modelo do mundo pra prever onde 41 esto os outros carros). 41
estado Atualiza-Estado(estado, ao, percept) regra Acha-Regra(estado, regras) ao Regra-Ao [regra] return ao
42
Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
43
Necessidade de metas/objetivos
Alm do estado interno, um agente precisa de alguma informao a respeito de metas, indicando situaes desejveis, para decidir a melhor ao a executar. Assim, pode combinar as informaes do impacto de suas aes com seus objetivos, de modo a fazer consideraes acerca do futuro (predies) e decidir melhor suas aes.
O agente poder ter que considerar longas seqncias de aes encadeadas para poder atingir sua meta busca e planejamento so subreas de IA que visam determinar a seqncia de aes que leva o agente ao objetivo.
44
Vantagens e desvantagens:
Mais complicado e ineficiente, porm mais flexvel, autnomo No trata objetivos conflitantes
Ambientes: determinstico
45
Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
46
47
estado: como o mundo era antes como o mundo evolui qual o impacto de minhas aes Funo de Utilidade Agente
Como ele ficar se fao isto? Este novo mundo melhor? Que ao devo escolher agora?
atuadores
Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
49
avoidCollision
Sonares Odmetros sensores
a b c
moveAhead moveToGoal
atuadores
REACT
51
AAREACT
Situaes (24): nmero finito, dadas por atributos Sada (8): nmero finito de ponderaes entre as aes dadas pelos comportamentos (a:AC, b:MA, c:MG)
ATRIBUTO FreeTarget BackTarget SideObstacle PESOS (a,b,c) (0, 0, 1) (1, 0, 1) (0.3, 1, 0)
DiagonalObstacle (1, 1, 0) MidleObstacle NarrowPath FrontalObstacle -------(1, 0.6, 0.4) (0.3, 1, 0) (1, 0.3, 0) (0.7, 0.5, 1)
Reforo positivo recebido quando: 1) Atingir o alvo (valor alto) 2) Valor proporcional composio entre a velocidade mdia desenvolvida pelo rob e a velocidade mdia de aproximao do alvo AR: tentativa e erro, aprendendo a melhor sada para cada situao, dada pela maximizao da soma (descontada) dos reforos recebidos.
52
Agentes em Computao
Adoo de uma nova metfora (antropomrfica e sociolgica). Extrapolao de OOP Integrao de tcnicas de IA Novas tecnologias prprias Web (ex. mobilidade) Marketing (moda)
Implementao
O gerador e o simulador de ambientes Componentes do agente (vrios tipos de conhecimento) Testar o desempenho com diferentes instncias do ambiente
54