Agentes Inteligentes

lnteligncia Artificial
Agentes Inteligentes
Problema: Auxlio a Compras na Web
Problema: Automatizao de sistemas de potncia
objetos: rios, barragens, turbinas, transformadores, linhas, ...

3
Problema: Produo de histrias interativas
. Criar iluso da vida (ex. Walt Disney) . Permitir interao com usurio . Modelar comportamento e personalidade (ex. tamagotchi)
Problema: navegao autnoma (ALVINN)

Velocidades Distncias 100km/h 140km
Usa RN associada a imagens para guiar uma van em rodovias pblicas.
Problema: explorao planetria
Problema: aspirador de p automtico
2005: 2 milhes de unidades vendidas para uso domstico
Problema: robs de estimao

AIBO - SONY
QRIO - SONY
ASIMO - HONDA
E a?
O que estes problemas tm em comum?
Grande complexidade (nmero, variedade e natureza das tarefas) No h soluo algortmica, mas existe conhecimento Modelagem do comportamento de um ser inteligente (autonomia, aprendizagem, conhecimento, etc.)
O que ser inteligente?

Ser inteligente atuar como humanos. Ser inteligente pensar como humanos. Ser inteligente pensar racionalmente. Ser inteligente atuar racionalmente.
Racionalidade = capacidade de alcanar o sucesso esperado na execuo de uma tarefa. Grau de Sucesso: medida de desempenho a ser maximizada.
10
Inteligncia Artificial (IA)

H 50 anos lida com esses problemas. Objetivo: construir (e aprender a construir) programas que, segundo critrios definidos, exibem um comportamento inteligente na realizao de uma dada tarefa.
11
Um programa de IA pode ser visto como um Agente Racional

Plano da aula
O que um Agente Racional (inteligente)? Ambientes e Arquiteturas Aplicaes Estado atual do conceito de agente
12
O que um agente?
Agente qualquer entidade que:
percebe seu ambiente atravs de sensores (ex. cmeras, microfone, teclado, finger, ...) age sobre ele atravs de atuadores (ex. vdeo, auto-falante, impressora, braos, ftp, ...)
Ambiente/agente
ambiente
Fsico: robs Software: softbots Realidade virtual (simulao do ambiente fsico): softbots e avatares
percepo
Agente sensores ?? atuadores
ao
Efetua o mapeamento:
seqncia perceptiva ao
13
Medida de Desempenho
Critrio que define o grau de sucesso de um agente na realizao de uma dada tarefa O qu avaliar, Como avaliar, Quando avaliar
Esta medida deve ser imposta do exterior M escolha da MD pode acarretar comportamento indesejado Compromissos entre objetivos mltiplos conflitantes Resta o problema de saber quando avaliar o desempenho
14
Agente Racional
Agente Racional:
Para cada seqncia perceptual possvel, o agente racional deve selecionar uma ao que ele espera que maximize sua medida de desempenho, segundo a evidncia dada pela seqncia perceptiva e os eventuais conhecimentos que tenha.
Limitaes de:
Sensores, atuadores, raciocinador (conhecimento, tempo, etc.)
Agente racional deve ser autnomo:

Ter capacidade de raciocnio, deciso e de adaptao a situaes novas, para as quais no foi fornecido todo o conhecimento necessrio com antecedncia
15
A metfora de agente decompe:

1) Problema em:
percepes, aes, objetivos e ambiente (e outros agentes)
2) Tipo de conhecimento em:

Quais so as propriedades relevantes do mundo Como o mundo evolui Como identificar os estados desejveis do mundo Como interpretar suas percepes Quais as conseqncias de suas aes no mundo Como medir o sucesso de suas aes Como avaliar seus prprios conhecimentos
16
Agente de polcia
Agente
raciocnio
Conhecimento: - leis - comportamento dos indivduos,... Objetivo: - fazer com que as leis sejam respeitadas Aes: - multar - apitar - parar, ...
percepo
execuo
Ambiente
17
Propriedades do Ambiente
totalmente observvel x parcialmente observvel determinstico x estocstico (envolve previsibilidade do prximo estado) episdico x seqencial (envolve ter ou no conseqncias futuras decorrentes da deciso atual) esttico x dinmico (envolve tempo) discreto x contnuo (aplicado a estado, tempo, aes e/ou percepes) nico agente x multiagente (envolve comunicao, cooperao, competio..)
18
Estrutura do Agente
Agente = arquitetura de HW + arquitetura de SW
Arquitetura de HW:
onde o agente vai ser implementado (dispositivo computacional, sensores e atuadores)
Arquitetura de SW:
arquitetura do agente: mdulos bsicos do programa e suas inter-relaes
19
Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
autonomia complexidade
20
Agente tabela
sensores ambiente
Tabela percepes aes . . . .
Agente
atuadores Limitaes
Mesmo para problemas simples
ex. xadrez 30^100
tabelas muito grandes
Nem sempre possvel, por ignorncia ou questo de tempo, construir a tabela No h autonomia nem flexibilidade
Ambientes
observvel, determinstico, episdico, esttico, discreto (e minsculo!)
21
PERCEPO [sala, estado] [A, limpo] [A, sujo] [B, limpo] [B, sujo]
AO Ir para a direita Aspirar Ir para a esquerda Aspirar
22
function Agente-Tabela-Aspirador (percept) return uma ao

static: percepts uma seqncia, inicialmente vazia table uma tabela de aes indexada pela seqncia perceptiva, inicialmente totalmente especificada
append percept ao final de percepts ao Lookup (percepts, table) return ao

Uso MUITO limitado (impossvel): seja P o conjunto de percepes possveis e T, o tempo de vida do agente entradas da tabela = t=1..T |P|t Como IA soluciona isso?
23
Arquiteturas
24
Agente reativo
sensores ambiente Em que condio est o mundo agora? Que ao devo escolher agora? atuadores Regras condio-ao Agente
Vantagens e desvantagens
Regras condio-ao: representao inteligvel, modular e eficiente ex. Se velocidade > 60 ento multar No pode armazenar uma seqncia perceptiva, pouca autonomia
Ambientes:
Reflexo imprescindvel em ambientes dinmicos Observvel, episdico, pequeno
25
function Agente-Reativo-Aspirador ([local, status]) return uma ao if status=Sujo then return Aspira else if local=A then return Direita else if local=B then return Esquerda
OBS: utiliza a percepo corrente e ignora a histria perceptual.
26
function Agente-Reflexo-Simples (percept) return uma ao

static: regras um conjunto de regras condio-ao
estado Interpreta-Entrada(percept) regra Acha-Regra(estado, regras) ao Regra-Ao [regra] return ao

Uso limitado: o ambiente tem que ser totalmente observvel, pois o agente s funciona apropriadamente se a regra correta for disparada, o que depende da percepo atual realizada.
27
Arquiteturas Reativas para Robs

Surgidas no final dos anos 80. Fundamentadas em estudos do comportamento animal (Etologia) baseada em comportamentos. Baseadas em processamento paralelo (vrios comportamentos simultaneamente ativos).
28
Arquiteturas Reativas
SENSE SENSE SENSE ACT ACT ACT
Mecanismo de coordenao
29
Mecanismo de coordenao
Coordenao Competitiva: a ao resultante num dado instante selecionada a partir de uma competio entre os comportamentos ativos (um vence). Coordenao Cooperativa: a funo de coordenao produz uma ao resultante para a qual contribuem todos os comportamentos ativos.
30
Estudo de Caso: REACT Comportamentos Reativos para Robs Mveis

http://www.lti.pcs.usp.br/robotics/react
31
REACT
Arquitetura baseada em Motor Schemas
Motor Schema comportamento
Comportamentos so divididos em:
mdulo de percepo mdulo de codificao
Sada do Motor Schema
Vetor
representa a ao a ser executada Magnitude velocidade, direo rotao
32
REACT
Mdulo de codificao:
Mapeamento contnuo: percepes aes Usa o Mtodo de Campos Potenciais
Coordenao dos comportamentos:

Abordagem cooperativa dos campos de fora Superposio
Alguns comportamentos na REACT:

avoidCollision moveToGoal
33
REACT
moveToGoal
obs
avoidCollision + moveToGoal
avoidCollision
34
REACT
sonares
avoidCollision
V (d ) = e ( d + S ) /T = rob obstculo
(V1, 1) (VR, R)
(V3, 3) moveToGoal
odmetros
V ( d ) = cte = rob alvo

V (d ) = e(d +S ) /T = rob alvo
longe
perto
35
Arquiteturas Reativas: Vantagens

Comportamentos reativos so normalmente simples de projetar. Paralelismo, simplicidade de comportamentos individuais e ligao direta SENSE-ACT permitem operao em tempo real. Processamento local da informao sensorial. Prototipao rpida para poucos comportamentos.
36
Arquiteturas Reativas: Problemas

Implementao de um grande conjunto de comportamentos uma tarefa difcil. Combinao de comportamentos reativos no garantem sucesso na execuo da tarefa (defensores da abordagem falam em Inteligncia emergente). Ex: pontos de campo nulo. Difcil definio de um conjunto mnimo de comportamentos reativos no caso geral.
37
Arquiteturas
38
Necessidade de um modelo (1)

Um agente puramente reativo que tenha observao parcial do ambiente pode cair em deadlocks (ex: rob parado num local de campo potencial nulo) ou loops infinitos. A forma mais efetiva de lidar com observabilidade parcial lembrar e imaginar a parte do mundo que no est observvel no momento, i.e, manter um estado interno que dependa da histria perceptual passada e reflita (ao menos em parte) aspectos no observados no estado atual.
39
Necessidade de um modelo (2)

Neste novo agente, para determinar como o mundo est num determinado momento, ele usa:
informaes perceptuais atuais (como o agente reativo) seu estado interno informaes a respeito de como o mundo evolui, independentemente de suas aes (modelo do mundo) informaes a respeito do impacto/efeito de suas prprias aes no mundo
e, com isso, atualiza seu estado interno.

40
Agente baseado em modelo

Agente sensores estado: como o mundo era antes Como est o mundo agora? ambiente condio como o mundo evolui (modelo) impacto de minhas aes
Que devo fazer agora? ao atuadores Desvantagem: pouca autonomia

no tem objetivo, no encadeia regras
Regras condio-ao
Ambientes: determinstico e pequeno

pode lidar com a observabilidade parcial
Ex.: carro mudando de faixa, no trnsito (percepo parcial, precisa do modelo do mundo pra prever onde 41 esto os outros carros). 41
function Agente-Com-Estado (percept) return uma ao

static: estado uma descrio do estado corrente do mundo regras um conjunto de regras condio-ao ao a ao mais recente, inicialmente nula
estado Atualiza-Estado(estado, ao, percept) regra Acha-Regra(estado, regras) ao Regra-Ao [regra] return ao
42
Arquiteturas
43
Necessidade de metas/objetivos
Alm do estado interno, um agente precisa de alguma informao a respeito de metas, indicando situaes desejveis, para decidir a melhor ao a executar. Assim, pode combinar as informaes do impacto de suas aes com seus objetivos, de modo a fazer consideraes acerca do futuro (predies) e decidir melhor suas aes.
O agente poder ter que considerar longas seqncias de aes encadeadas para poder atingir sua meta busca e planejamento so subreas de IA que visam determinar a seqncia de aes que leva o agente ao objetivo.
44
Agente baseado em objetivo

sensores Como est o mundo agora? ambiente Como ele ficar se fao isto? Que devo fazer agora? atuadores estado: como o mundo era antes como o mundo evolui (modelo) impacto de minhas aes Objetivos Agente
Vantagens e desvantagens:
Mais complicado e ineficiente, porm mais flexvel, autnomo No trata objetivos conflitantes
Ambientes: determinstico
45
Arquiteturas
46
Medida de desempenho mais geral: funo de utilidade

Uma funo de utilidade mapeia um estado (ou seqncia de estados) em um nmero real que descreve o grau de satisfao associado ao estado. Permite decises racionais quando h:
Objetivos conflitantes (ex: velocidade e segurana) neste caso a funo de utilidade define um compromisso adequado entre eles. Mltiplos objetivos, nenhum dos quais se tem certeza de ser atingido a funo de utilidade permite um balanceamento entre a possibilidade de sucesso com a importncia de cada objetivo.
47
Agente baseado em utilidade

sensores
estado: como o mundo era antes como o mundo evolui qual o impacto de minhas aes Funo de Utilidade Agente
Como est o mundo agora?

ambiente
Como ele ficar se fao isto? Este novo mundo melhor? Que ao devo escolher agora?
atuadores
Ambiente: sem restrio Desvantagem: no tem adaptabilidade (no aprende)

48
48
Arquiteturas
49
Agente que aprende

sensores ambiente crtico Agente avaliao, retorno mudanas elemento de conhecimento aprendizagem objetivos de aprendizagem atuadores Gerador de problemas
elemento de execuo (agente)
Ambiente: sem restrio Vantagem: tem adaptabilidade (aprende)

50
50
AAREACT Aprendizado Autnomo na REACT

Crtico: clculo dos reforos Observao da situao para o AR Elemento de aprendizado: AR
avoidCollision
Sonares Odmetros sensores
a b c
moveAhead moveToGoal
atuadores
REACT
51
AAREACT
Situaes (24): nmero finito, dadas por atributos Sada (8): nmero finito de ponderaes entre as aes dadas pelos comportamentos (a:AC, b:MA, c:MG)
ATRIBUTO FreeTarget BackTarget SideObstacle PESOS (a,b,c) (0, 0, 1) (1, 0, 1) (0.3, 1, 0)
DiagonalObstacle (1, 1, 0) MidleObstacle NarrowPath FrontalObstacle -------(1, 0.6, 0.4) (0.3, 1, 0) (1, 0.3, 0) (0.7, 0.5, 1)
Reforo positivo recebido quando: 1) Atingir o alvo (valor alto) 2) Valor proporcional composio entre a velocidade mdia desenvolvida pelo rob e a velocidade mdia de aproximao do alvo AR: tentativa e erro, aprendendo a melhor sada para cada situao, dada pela maximizao da soma (descontada) dos reforos recebidos.
52
Evoluo da noo de agente alm das fronteiras da IA....

Agentes em IA
Metodologia (metfora) para projeto de sistemas Sistemas multiagentes e robtica
Agentes em Computao
Adoo de uma nova metfora (antropomrfica e sociolgica). Extrapolao de OOP Integrao de tcnicas de IA Novas tecnologias prprias Web (ex. mobilidade) Marketing (moda)
Agentes: tcnica ou metodologia ?

53
Desenvolver agentes inteligentes

Projeto:
Modelar tarefa em termos de ambiente, percepes, aes, objetivos e utilidade Identificar o tipo de ambiente Identificar a arquitetura de agente adequada ao ambiente e tarefa
Implementao
O gerador e o simulador de ambientes Componentes do agente (vrios tipos de conhecimento) Testar o desempenho com diferentes instncias do ambiente
54

Agentes Inteligentes

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Agentes Inteligentes

Uploaded by

Copyright:

Available Formats

lnteligncia Artificial

Problema: Auxlio a Compras na Web

Problema: Automatizao de sistemas de potncia

objetos: rios, barragens, turbinas, transformadores, linhas, ...

Problema: Produo de histrias interativas

Problema: navegao autnoma (ALVINN)

Usa RN associada a imagens para guiar uma van em rodovias pblicas.

Problema: explorao planetria

Problema: aspirador de p automtico

2005: 2 milhes de unidades vendidas para uso domstico

Problema: robs de estimao

O que ser inteligente?

Inteligncia Artificial (IA)

Um programa de IA pode ser visto como um Agente Racional

Agente sensores ?? atuadores

Agente racional deve ser autnomo:

A metfora de agente decompe:

2) Tipo de conhecimento em:

tabelas muito grandes

AO Ir para a direita Aspirar Ir para a esquerda Aspirar

function Agente-Tabela-Aspirador (percept) return uma ao

append percept ao final de percepts ao Lookup (percepts, table) return ao

OBS: utiliza a percepo corrente e ignora a histria perceptual.

function Agente-Reflexo-Simples (percept) return uma ao

estado Interpreta-Entrada(percept) regra Acha-Regra(estado, regras) ao Regra-Ao [regra] return ao

Arquiteturas Reativas para Robs

Estudo de Caso: REACT Comportamentos Reativos para Robs Mveis

Sada do Motor Schema

representa a ao a ser executada Magnitude velocidade, direo rotao

Coordenao dos comportamentos:

Alguns comportamentos na REACT:

V ( d ) = cte = rob alvo

Arquiteturas Reativas: Vantagens

Arquiteturas Reativas: Problemas

Necessidade de um modelo (1)

Necessidade de um modelo (2)

e, com isso, atualiza seu estado interno.

Agente baseado em modelo

Que devo fazer agora? ao atuadores Desvantagem: pouca autonomia

Ambientes: determinstico e pequeno

function Agente-Com-Estado (percept) return uma ao

Agente baseado em objetivo

Medida de desempenho mais geral: funo de utilidade

Agente baseado em utilidade

Como est o mundo agora?

Ambiente: sem restrio Desvantagem: no tem adaptabilidade (no aprende)

Agente que aprende

elemento de execuo (agente)

Ambiente: sem restrio Vantagem: tem adaptabilidade (aprende)

AAREACT Aprendizado Autnomo na REACT

Evoluo da noo de agente alm das fronteiras da IA....

Agentes: tcnica ou metodologia ?

Desenvolver agentes inteligentes

You might also like