Professional Documents
Culture Documents
1. Enseando a un softbot a chutar un baln 2. Integracin de sensores mediante redes neuronales 3. Modelos agroclimticos de consumo de agua
El simulador
Propiedades 1. 2. 3. 4. Realista (friccin, inercia, ruido) Animado Basado en cliente-servidor Clientes usan planicacin de rutas (seguimiento baln)
Arquitectura
Cliente
energa giros
orientacin
Escenario tpico
La tarea T depende de las coordenadas del baln y del chutador (x, y, ). El mtodo mediante el cual el chutador decide sus movimientos se denomina pol tica de chut El mtodo mediante el que elegir la lnea de direccin se denomina poltica de direccin (steering policy) Los parmetros (x, y, ) varan de forma aleatoria para generar casos diferentes El rango de variacin para la orientacin es de 70o . x e y varan de forma independiente en 40 unidades. El rudo es de 2 unidades para x e y y 2 grados para
110 170
Pasador
La tarea T
La dicultad en el aprendizaje de T depende de Los experimentos se pueden realizar con la misma velocida para la pelota, o con velocidad variable. La bola puede moverse siempre en la misma trayectoria, o en diferentes trayectorias. La portera puede estar siempre en el mismo sitio o puede moverse arriba abajo. Tanto el entrenamiento como la evaluacin se pueden realizar en el mismo sitio, o la evaluacin puede moverse a otro cuadrante. Es posible que no sea necesario aprendizaje inductivo. Si planteamos la poltica de chut cuando el chutador se encuentra en la orientacin adecuada, debera comenzar a moverse cuando la distancia de la pelota al punto de contacto es igual o menor que 110 unidades Resultado una tasa de aciertos del 60,8 %.
90
Pasador
DistanciaChutador
Acelerar
DesfaseOrientacion
x1 x
25
= 0,5
Experimento 1: conjunto de entrenamiento (II) Tenemos que x es ms o menos 37. Se generan 2990 ejemplos. Porcentaje de acierto del 19,7 %. Solo 590 ejemplos fueron instancias positivas.
Se probaron distintas conguraciones de redes neuronales sigmoidales. Se vari y el nmero de nodos ocultos. Los ejemplos de entrenamiento se etiquetaron con un 0,9 y 0,1 Los pesos wij con un valor aleatorio en [0,5, 0,5]. La red neuronal ptima se obtuvo tras 3000 epochs, con un error RMSE de 0.0386. Mejora Conforme la pelota se va acercando a una determinada distancia, la seal de la red se va incrementando hasta llegar a un pico. Una vez pasado ese pico, la seal comienza de nuevo a disminuir hasta llegar a un mnimo. Acelear cuando Output 0,6 Output P revious 0,1 Posicin inicial chutador Constante Cambiante Cambiante Cambiante Poltica de chut Simple Simple Aleatoria Regla de red de 3 nodos xito 100 60.8 19.7 96.5
DistanciaChutador
Acelerar
DesfaseOrientacion
VelocidadPelota
La velocidad se calcula con la diferencia en posicin para las 10 ltimas unidades de tiempo Ejemplos 5737. El ratio de aprendizaje ha sido esta vez de 0,001 y el nmero de epochs 4000. Poltica de chut Aciertos Red de 3 nodos de entrada 49.1 Aleatorio 16.8 Red de 4 nodos de entrada 91.5
Hipotesis inicial Dado que las entradas a la red de 4 nodos, usada en el experimento 2 son relativas a PuntoContacto, la trayectoria con la que la bola se mueve hacia el chutador no va a afectar negativamente al rendimiento de la red Test de la hiptesis lanzar la pelota con una trayectoria de 90 grados.
Punto Contacto 180 Chutador 90
-90 70
Pasador
Resultado efectividad del 96,3 %. La red de 4 entradas no solo generalizaba en diferentes reas del campo, sino que tambin generalizaba a diferentes trayectorias del baln.
180
-90
Pasador
Pasador
90 Posicion A 180 0
AnguloPelotaChutador Pasador
Integracin de sensores
Vamos a integrar sensores infrarrojos y ultrasonidos Tareas a desarrollar 1. Implementacin de modelos sensoriales tericos 2. Recopilacin de datos 3. Generacin de redes neuronales 4. Validacin de los modelos obtenidos
Sensores
Sensores de ultrasonidos (sonar) Modelo Polaroid 6500 Trabaja a frecuencias de 49.4kHz La amplitud mxima del rayo est entre 150 y 200 Medidas en un rango entre 15cm y 10mt con un error de 1 % Tipos de error Prdida de seal de eco Incertidumbre debida a la apertura angular Rebotes dobles Sensores de infrarrojos Modelo Sharp GP2D02 Usa un emisor LED y un detector de luz PSD Medidas aceptables entre 10 y 120cm Tipos de error Reectividad variable segn color del objeto Iluminacin global Error de cuanticacin Se usa un modelo terico para cada uno de los sensores
de redes neuronales. Juan A. Bot Ejemplos de aplicacion a p.20/42
Entorno de simulacin
Robot a simular
Robot holnomico 2 ruedas de direccin y dos ruedas libres 10 pares de sensores de infrarrojos y ultrasonidos
//bhost.um.es/PandaMLA
FOIL C4.5
A Host
B Host
Client A ANFIS
Communication Bus
C Host
//chost.um.es/SquirrelMLA
Resultados
Errores
Validacin
La fusin de sensores de la red la comparamos con el algoritmo de Flynn 1. 2. 3. Si la lectura del sonar es mayor que el rango mximo del sensor de infrarrojos, ignorar el sensor de infrarrojos Si la lectura del sonar produce su valor mximo, la distancia real es mayor Cuando el sensor infrarrojo presenta un cambio de no deteccin a deteccin y la lectura del snar es menor que diez pies entonces se ha detectado un objeto
Flynn
RNA
Recogida de datos
Es posible que un modelo lineal se comportara lo sucientemente aproximado como para tomarlo por bueno
Valores nulos
la tabla DIA presenta una proporcin de valores nulos considerable debida principalmente a perodos en los cuales alguna de las estaciones agroclimticas se encontraba sin funcionar (o funcionaba incorrectamente) un total de 53533 tuplas, de las cuales 30958 eran vlidas y el resto presentaban nulos Los atributos U y H r presentan menos del 8 % de valores nulos E0 tiene nulos en el 35 % de las correspondiente tuplas Posible solucin al problema: obtener la media de todos los valores vlidos, y sustituir todos los nulos por ese valor el valor de skewness del atributo es 26.001 que sugiere que la distribucin de probabilidad se aleja bastante de una normal
d(Ea , Eb ) =
i=1
Estaciones de referencia
4.3e+06 4.28e+06 4.26e+06 4.24e+06 4.22e+06 4.2e+06 4.18e+06 4.16e+06 4.14e+06 560000 Cluster AL41 Superficie Reg. Murcia Cluster JU81 Cluster CI52 Cluster MU52 Cluster CI42
580000
600000
620000
640000
660000
680000
700000
720000
Experimentos de aprendizaje
Todos los modelos obtenidos se evaluaron usando holdout con el mismo cjto. de evaluacin para todos: tuplas vlidas del ao 1998 de la tabla DIA Modelo de regresin lineal es
f cab = 0,66354E0 + 0,132150
Experimentos de aprendizaje
MLPs
Nn 1 6 11 16 21 26 31 36 41 46 TEVV 1.19238 0.31979 0.16291 0.28416 0.31988 0.15170 0.15402 0.13432 0.13423 0.15531 EEVV 1.38206 0.38314 0.24857 0.51657 0.39322 0.23556 0.23074 0.20072 0.20619 0.25566 TERV 0.411108 0.32427 0.35851 0.23810 0.22488 0.24529 0.23800 0.23934 0.23103 0.24398 EERV 0.46175 0.37386 0.38667 0.23629 0.17494 0.22742 0.24596 0.22918 0.20122 0.22562
TERV
0.22116+
0.14530 0.14291
Conclusiones
se obtienen errores similares de evaluacin con los dos conjuntos de entrenamiento:0.16419 y 0.16904 existe una diferencia apreciable entre los errores mnimos de aprendizaje, 0.12754 y 0.22116 el conjunto de tuplas reconstruidas es un 60 % ms grande que el conjunto formado solamente con tuplas vlidas la efectividad del mtodo de reconstruccin queda demostrada con las medias aritmticas en los errores para ambos grupos de experimentos: 0.31244 y 0.23441