You are on page 1of 54

lnteligncia Artificial

Agentes Inteligentes

Problema: Auxlio a Compras na Web

Problema: Automatizao de sistemas de potncia

objetos: rios, barragens, turbinas, transformadores, linhas, ...


3

Problema: Produo de histrias interativas

. Criar iluso da vida (ex. Walt Disney) . Permitir interao com usurio . Modelar comportamento e personalidade (ex. tamagotchi)

Problema: navegao autnoma (ALVINN)


Velocidades Distncias 100km/h 140km

Usa RN associada a imagens para guiar uma van em rodovias pblicas.

Problema: explorao planetria

Problema: aspirador de p automtico

2005: 2 milhes de unidades vendidas para uso domstico

Problema: robs de estimao


AIBO - SONY

QRIO - SONY

ASIMO - HONDA

E a?
O que estes problemas tm em comum?
Grande complexidade (nmero, variedade e natureza das tarefas) No h soluo algortmica, mas existe conhecimento Modelagem do comportamento de um ser inteligente (autonomia, aprendizagem, conhecimento, etc.)

O que ser inteligente?


Ser inteligente atuar como humanos. Ser inteligente pensar como humanos. Ser inteligente pensar racionalmente. Ser inteligente atuar racionalmente.

Racionalidade = capacidade de alcanar o sucesso esperado na execuo de uma tarefa. Grau de Sucesso: medida de desempenho a ser maximizada.
10

Inteligncia Artificial (IA)


H 50 anos lida com esses problemas. Objetivo: construir (e aprender a construir) programas que, segundo critrios definidos, exibem um comportamento inteligente na realizao de uma dada tarefa.

11

Um programa de IA pode ser visto como um Agente Racional


Plano da aula
O que um Agente Racional (inteligente)? Ambientes e Arquiteturas Aplicaes Estado atual do conceito de agente

12

O que um agente?
Agente qualquer entidade que:
percebe seu ambiente atravs de sensores (ex. cmeras, microfone, teclado, finger, ...) age sobre ele atravs de atuadores (ex. vdeo, auto-falante, impressora, braos, ftp, ...)

Ambiente/agente
ambiente

Fsico: robs Software: softbots Realidade virtual (simulao do ambiente fsico): softbots e avatares

percepo

Agente sensores ?? atuadores

ao

Efetua o mapeamento:
seqncia perceptiva ao
13

Medida de Desempenho
Critrio que define o grau de sucesso de um agente na realizao de uma dada tarefa O qu avaliar, Como avaliar, Quando avaliar
Esta medida deve ser imposta do exterior M escolha da MD pode acarretar comportamento indesejado Compromissos entre objetivos mltiplos conflitantes Resta o problema de saber quando avaliar o desempenho

14

Agente Racional
Agente Racional:
Para cada seqncia perceptual possvel, o agente racional deve selecionar uma ao que ele espera que maximize sua medida de desempenho, segundo a evidncia dada pela seqncia perceptiva e os eventuais conhecimentos que tenha.

Limitaes de:
Sensores, atuadores, raciocinador (conhecimento, tempo, etc.)

Agente racional deve ser autnomo:


Ter capacidade de raciocnio, deciso e de adaptao a situaes novas, para as quais no foi fornecido todo o conhecimento necessrio com antecedncia
15

A metfora de agente decompe:


1) Problema em:
percepes, aes, objetivos e ambiente (e outros agentes)

2) Tipo de conhecimento em:


Quais so as propriedades relevantes do mundo Como o mundo evolui Como identificar os estados desejveis do mundo Como interpretar suas percepes Quais as conseqncias de suas aes no mundo Como medir o sucesso de suas aes Como avaliar seus prprios conhecimentos

16

Agente de polcia
Agente
raciocnio
Conhecimento: - leis - comportamento dos indivduos,... Objetivo: - fazer com que as leis sejam respeitadas Aes: - multar - apitar - parar, ...

percepo

execuo

Ambiente

17

Propriedades do Ambiente
totalmente observvel x parcialmente observvel determinstico x estocstico (envolve previsibilidade do prximo estado) episdico x seqencial (envolve ter ou no conseqncias futuras decorrentes da deciso atual) esttico x dinmico (envolve tempo) discreto x contnuo (aplicado a estado, tempo, aes e/ou percepes) nico agente x multiagente (envolve comunicao, cooperao, competio..)
18

Estrutura do Agente
Agente = arquitetura de HW + arquitetura de SW
Arquitetura de HW:
onde o agente vai ser implementado (dispositivo computacional, sensores e atuadores)

Arquitetura de SW:
arquitetura do agente: mdulos bsicos do programa e suas inter-relaes
19

Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz
autonomia complexidade

20

Agente tabela
sensores ambiente
Tabela percepes aes . . . .

Agente

atuadores Limitaes
Mesmo para problemas simples
ex. xadrez 30^100

tabelas muito grandes

Nem sempre possvel, por ignorncia ou questo de tempo, construir a tabela No h autonomia nem flexibilidade

Ambientes
observvel, determinstico, episdico, esttico, discreto (e minsculo!)
21

PERCEPO [sala, estado] [A, limpo] [A, sujo] [B, limpo] [B, sujo]

AO Ir para a direita Aspirar Ir para a esquerda Aspirar

22

function Agente-Tabela-Aspirador (percept) return uma ao


static: percepts uma seqncia, inicialmente vazia table uma tabela de aes indexada pela seqncia perceptiva, inicialmente totalmente especificada

append percept ao final de percepts ao Lookup (percepts, table) return ao


Uso MUITO limitado (impossvel): seja P o conjunto de percepes possveis e T, o tempo de vida do agente entradas da tabela = t=1..T |P|t Como IA soluciona isso?
23

Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz

24

Agente reativo
sensores ambiente Em que condio est o mundo agora? Que ao devo escolher agora? atuadores Regras condio-ao Agente

Vantagens e desvantagens
Regras condio-ao: representao inteligvel, modular e eficiente ex. Se velocidade > 60 ento multar No pode armazenar uma seqncia perceptiva, pouca autonomia

Ambientes:
Reflexo imprescindvel em ambientes dinmicos Observvel, episdico, pequeno
25

function Agente-Reativo-Aspirador ([local, status]) return uma ao if status=Sujo then return Aspira else if local=A then return Direita else if local=B then return Esquerda

OBS: utiliza a percepo corrente e ignora a histria perceptual.

26

function Agente-Reflexo-Simples (percept) return uma ao


static: regras um conjunto de regras condio-ao

estado Interpreta-Entrada(percept) regra Acha-Regra(estado, regras) ao Regra-Ao [regra] return ao


Uso limitado: o ambiente tem que ser totalmente observvel, pois o agente s funciona apropriadamente se a regra correta for disparada, o que depende da percepo atual realizada.

27

Arquiteturas Reativas para Robs


Surgidas no final dos anos 80. Fundamentadas em estudos do comportamento animal (Etologia) baseada em comportamentos. Baseadas em processamento paralelo (vrios comportamentos simultaneamente ativos).

28

Arquiteturas Reativas
SENSE SENSE SENSE ACT ACT ACT

Mecanismo de coordenao
29

Mecanismo de coordenao
Coordenao Competitiva: a ao resultante num dado instante selecionada a partir de uma competio entre os comportamentos ativos (um vence). Coordenao Cooperativa: a funo de coordenao produz uma ao resultante para a qual contribuem todos os comportamentos ativos.

30

Estudo de Caso: REACT Comportamentos Reativos para Robs Mveis


http://www.lti.pcs.usp.br/robotics/react

31

REACT
Arquitetura baseada em Motor Schemas
Motor Schema comportamento
Comportamentos so divididos em:
mdulo de percepo mdulo de codificao

Sada do Motor Schema

Vetor

representa a ao a ser executada Magnitude velocidade, direo rotao

32

REACT
Mdulo de codificao:
Mapeamento contnuo: percepes aes Usa o Mtodo de Campos Potenciais

Coordenao dos comportamentos:


Abordagem cooperativa dos campos de fora Superposio

Alguns comportamentos na REACT:


avoidCollision moveToGoal

33

REACT
moveToGoal

obs

avoidCollision + moveToGoal
avoidCollision
34

REACT
sonares
avoidCollision

V (d ) = e ( d + S ) /T = rob obstculo

(V1, 1) (VR, R)

(V3, 3) moveToGoal

odmetros

V ( d ) = cte = rob alvo


V (d ) = e(d +S ) /T = rob alvo

longe

perto

35

Arquiteturas Reativas: Vantagens


Comportamentos reativos so normalmente simples de projetar. Paralelismo, simplicidade de comportamentos individuais e ligao direta SENSE-ACT permitem operao em tempo real. Processamento local da informao sensorial. Prototipao rpida para poucos comportamentos.
36

Arquiteturas Reativas: Problemas


Implementao de um grande conjunto de comportamentos uma tarefa difcil. Combinao de comportamentos reativos no garantem sucesso na execuo da tarefa (defensores da abordagem falam em Inteligncia emergente). Ex: pontos de campo nulo. Difcil definio de um conjunto mnimo de comportamentos reativos no caso geral.

37

Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz

38

Necessidade de um modelo (1)


Um agente puramente reativo que tenha observao parcial do ambiente pode cair em deadlocks (ex: rob parado num local de campo potencial nulo) ou loops infinitos. A forma mais efetiva de lidar com observabilidade parcial lembrar e imaginar a parte do mundo que no est observvel no momento, i.e, manter um estado interno que dependa da histria perceptual passada e reflita (ao menos em parte) aspectos no observados no estado atual.

39

Necessidade de um modelo (2)


Neste novo agente, para determinar como o mundo est num determinado momento, ele usa:
informaes perceptuais atuais (como o agente reativo) seu estado interno informaes a respeito de como o mundo evolui, independentemente de suas aes (modelo do mundo) informaes a respeito do impacto/efeito de suas prprias aes no mundo

e, com isso, atualiza seu estado interno.


40

Agente baseado em modelo


Agente sensores estado: como o mundo era antes Como est o mundo agora? ambiente condio como o mundo evolui (modelo) impacto de minhas aes

Que devo fazer agora? ao atuadores Desvantagem: pouca autonomia


no tem objetivo, no encadeia regras

Regras condio-ao

Ambientes: determinstico e pequeno


pode lidar com a observabilidade parcial

Ex.: carro mudando de faixa, no trnsito (percepo parcial, precisa do modelo do mundo pra prever onde 41 esto os outros carros). 41

function Agente-Com-Estado (percept) return uma ao


static: estado uma descrio do estado corrente do mundo regras um conjunto de regras condio-ao ao a ao mais recente, inicialmente nula

estado Atualiza-Estado(estado, ao, percept) regra Acha-Regra(estado, regras) ao Regra-Ao [regra] return ao

42

Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz

43

Necessidade de metas/objetivos
Alm do estado interno, um agente precisa de alguma informao a respeito de metas, indicando situaes desejveis, para decidir a melhor ao a executar. Assim, pode combinar as informaes do impacto de suas aes com seus objetivos, de modo a fazer consideraes acerca do futuro (predies) e decidir melhor suas aes.
O agente poder ter que considerar longas seqncias de aes encadeadas para poder atingir sua meta busca e planejamento so subreas de IA que visam determinar a seqncia de aes que leva o agente ao objetivo.

44

Agente baseado em objetivo


sensores Como est o mundo agora? ambiente Como ele ficar se fao isto? Que devo fazer agora? atuadores estado: como o mundo era antes como o mundo evolui (modelo) impacto de minhas aes Objetivos Agente

Vantagens e desvantagens:
Mais complicado e ineficiente, porm mais flexvel, autnomo No trata objetivos conflitantes

Ambientes: determinstico
45

Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz

46

Medida de desempenho mais geral: funo de utilidade


Uma funo de utilidade mapeia um estado (ou seqncia de estados) em um nmero real que descreve o grau de satisfao associado ao estado. Permite decises racionais quando h:
Objetivos conflitantes (ex: velocidade e segurana) neste caso a funo de utilidade define um compromisso adequado entre eles. Mltiplos objetivos, nenhum dos quais se tem certeza de ser atingido a funo de utilidade permite um balanceamento entre a possibilidade de sucesso com a importncia de cada objetivo.

47

Agente baseado em utilidade


sensores

estado: como o mundo era antes como o mundo evolui qual o impacto de minhas aes Funo de Utilidade Agente

Como est o mundo agora?


ambiente

Como ele ficar se fao isto? Este novo mundo melhor? Que ao devo escolher agora?
atuadores

Ambiente: sem restrio Desvantagem: no tem adaptabilidade (no aprende)


48
48

Arquiteturas
Agente tabela Agente reativo Agente baseado em modelo Agente baseado em objetivos Agente baseado em utilidade Agente aprendiz

49

Agente que aprende


sensores ambiente crtico Agente avaliao, retorno mudanas elemento de conhecimento aprendizagem objetivos de aprendizagem atuadores Gerador de problemas

elemento de execuo (agente)

Ambiente: sem restrio Vantagem: tem adaptabilidade (aprende)


50
50

AAREACT Aprendizado Autnomo na REACT


Crtico: clculo dos reforos Observao da situao para o AR Elemento de aprendizado: AR

avoidCollision
Sonares Odmetros sensores

a b c

moveAhead moveToGoal

atuadores

REACT
51

AAREACT
Situaes (24): nmero finito, dadas por atributos Sada (8): nmero finito de ponderaes entre as aes dadas pelos comportamentos (a:AC, b:MA, c:MG)
ATRIBUTO FreeTarget BackTarget SideObstacle PESOS (a,b,c) (0, 0, 1) (1, 0, 1) (0.3, 1, 0)

DiagonalObstacle (1, 1, 0) MidleObstacle NarrowPath FrontalObstacle -------(1, 0.6, 0.4) (0.3, 1, 0) (1, 0.3, 0) (0.7, 0.5, 1)

Reforo positivo recebido quando: 1) Atingir o alvo (valor alto) 2) Valor proporcional composio entre a velocidade mdia desenvolvida pelo rob e a velocidade mdia de aproximao do alvo AR: tentativa e erro, aprendendo a melhor sada para cada situao, dada pela maximizao da soma (descontada) dos reforos recebidos.
52

Evoluo da noo de agente alm das fronteiras da IA....


Agentes em IA
Metodologia (metfora) para projeto de sistemas Sistemas multiagentes e robtica

Agentes em Computao
Adoo de uma nova metfora (antropomrfica e sociolgica). Extrapolao de OOP Integrao de tcnicas de IA Novas tecnologias prprias Web (ex. mobilidade) Marketing (moda)

Agentes: tcnica ou metodologia ?


53

Desenvolver agentes inteligentes


Projeto:
Modelar tarefa em termos de ambiente, percepes, aes, objetivos e utilidade Identificar o tipo de ambiente Identificar a arquitetura de agente adequada ao ambiente e tarefa

Implementao
O gerador e o simulador de ambientes Componentes do agente (vrios tipos de conhecimento) Testar o desempenho com diferentes instncias do ambiente

54

You might also like