Professional Documents
Culture Documents
Un agente es cualquier cosa capaz de percibir su medioambiente con la ayuda de sensores y actuar en ese medio utilizando actuadores.
Percepciones Sensores
Medio ambiente
?
Actuadores Acciones
Marzo de 2012
Cada agente puede percibir sus propias acciones (pero no siempre sus efectos)
Marzo de 2012 3
Percepcin:
Indica que el agente puede recibir entradas en cualquier instante
Secuencia de Percepciones:
Refleja el historial completo de lo que el agente ha recibido Secuencia de percepciones -> Decisin
Marzo de 2012
` `
Marzo de 2012
Acciones posibles: Moverse hacia la izquierda, derecha, Aspirar la suciedad o No hacer nada
Una Funcin: Si hay suciedad, entonces aspirar de otra forma cambiar de cuadrcula
Marzo de 2012
Secuencia de percepciones [A, Limpio] [A, Sucio] [B, Limpio] [B, Sucio]a [A, Limpio],[A, Limpio] [A, Limpio],[A, Sucio] ------[A, Limpio],[A, Limpio],[A, Limpio] [A, Limpio],[A, Limpio],[A, Sucio] ____ ____
Accin Derecha Aspirar Izquierda Aspirar Derecha Aspirar ------Derecha Aspirar ____ ____
Marzo de 2012 7
funcin AGENTE-ASPIRADORA ([localizacin, estado]) devuelve una accin si estado = Sucio entonces devolver Aspirar de otra forma, si localizacin = A entonces devolver Derecha de otra forma, si localizacin = B entonces devolver Izquierda
Marzo de 2012
Un agente racional
Es aquel que hace lo correcto (lo que permite al agente obtener el mejor desempeo).
Medidas de rendimiento
Incluye los criterios que determinan el xito en el comportamiento del agente
Marzo de 2012
` `
La medida de rendimiento que define el criterio de xito. El conocimiento del medio en el que habita acumulado por el agente. Las acciones que el agente puede llevar a cabo. La secuencia de percepciones del agente hasta el momento.
Marzo de 2012
10
En cada posible secuencia de percepciones, un agente racional deber emprender aquella accin que supuestamente maximice su medida de rendimiento, basndose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente mantiene almacenado.
Marzo de 2012
11
La <<geografa>> del medio se conoce a priori, pero la distribucin de la suciedad y la localizacin inicial del agente no se conocen. Acciones: izquierda, derecha, aspirar y NoOp Percibe correctamente su localizacin y si esta localizacin contiene suciedad
Marzo de 2012
12
Un agente omnisciente:
Conoce el resultado de su accin y acta de acuerdo a l.
Llevar a cabo acciones con la intencin de modificar percepciones futuras (Recopilacin de informacin)
Ej. Exploracin en un medio inicialmente desconocido
Marzo de 2012
13
No slo recopila informacin, sino que aprende lo mximo posible de lo que esta percibiendo Hay agentes en los que se conoce totalmente el entorno a priori. En estos casos, el agente no necesita percibir y aprender, simplemente acta de manera correcta. Estos agentes son muy frgiles:
x Ejemplo: escarabajo estercolero y la avispa cavadora
Marzo de 2012
14
Autonoma:
x Un agente carece de autonoma cuando se apoya ms en el conocimiento inicial que le proporciona su diseador que en sus propias percepciones
Un agente racional debe ser autnomo, debe aprender a determinar cmo tiene que compensar el conocimiento incompleto o parcial inicial
Marzo de 2012
15
Entornos de trabajo->problemas Agentes->soluciones. REAS (Rendimiento, Entorno, Actuadores, Sensores) Ejemplo: Taxista automtico
Marzo de 2012
16
Cualidades deseables:
` ` ` `
llegue al destino correcto, minimice el consumo de combustible; minimice el tiempo de viaje y/o costo, minimice el nmero de infracciones de trfico y de molestias a otros conductores; maximice la seguridad, la comodidad del pasajero y el beneficio.
Marzo de 2012
17
Medidas de Rendimiento Seguro, rpido, legal, viaje confortable, maximizacin del beneficio
Sensores Cmaras, sonar, velocmetro, GPS, tacmetro, visualizador de aceleracin, sensor del motor, teclado.
Marzo de 2012
18
Lo que importa no es la distincin entre un medio real y artificial, sino la complejidad de la relacin entre el comportamiento del agente, la secuencia de percepciones generada por el medio y la medida de rendimiento.
Marzo de 2012
19
Marzo de 2012
20
Marzo de 2012
21
Si los sensores proporcionan acceso al estado completo del medio en cada momento, se dice que el entorno de trabajo es otalmente observable. Si los sensores no reciben informacin de parte del sistema debido al ruido y la existencia de sensores poco exactos, se dice que el entorno de trabajo es Parcialmente observable.
Marzo de 2012
22
Si el siguiente estado del medio esta totalmente determinado por el estado actual y la accin ejecutada por el agente, entonces se dice que el entorno es Determinista, si no, es Estocstico. Si el medio el parcialmente observable entonces es comn que sea estocstico
(Taxi no puede predecir el trfico)
Si el medio es determinista, excepto para las acciones de otros agentes, entonces se dice que el medio es Estratgico.
Marzo de 2012 23
En un entorno de trabajo Episdico, la experiencia del agentes se divide en episodios atmicos. Cada episodio consiste en la percepcin del agente y la realizacin de una nica accin posterior (el sig. episodio no depende de las acciones de episodios previos) En entornos de trabajo Secuenciales la decisin presente puede afectar decisiones futuras (ajedrez)
Marzo de 2012
24
Si el entorno puede cambiar cuando el agente esta deliberando, entonces se dice que el entorno es Dinmico, de otra forma es Esttico. Si el entorno no cambia con el paso del tiempo, pero el rendimiento del agente cambia se dice que el medio es Semidinmico
Marzo de 2012
25
Marzo de 2012
26
La distincin clave est en identificar si el comportamiento de un agente B est mejor descrito por la maximizacin de una medida de rendimiento cuyo valor depende del comportamiento de un agente A. Entorno multiagente competitivo Entorno multiagente cooperativo La Comunicacin a menundo emerge como un comportamiento racional en entornos multiagente.
Marzo de 2012
27
Programa
Cumplir con la funcin del agente
Arquitectura
Puede ser una computadora sencilla o un hardware especial.
Sensores
Actuadores
Tipos bsicos de programas Agentes Reactivos simples Agentes reactivos basados en modelos Agentes basados en objetivos Agentes basados en utilidad
OBJETIVO
FUNCIN DE UTILIDAD
Proyecta un estado en un nmero real que representa el nivel de felicidad o utilidad Seleccionar la accin que lo lleve a alcanzar la mayor utilidad esperada Utilidad = media de todos los estados posibles resultantes, ponderando con la probabilidad del resultado
OBJETIVO
100%
80%
Marzo de 2012
39