Este artículo aunque enfocado a las competencias de RoboCup con robots reales y no simulados provee de elementos que pueden ser útiles en la medida que se vaya realizando la tesis debido a que hace mención sobre elementos interesantes empleados en su sistema de aprendizaje.
Lo más notable y relevante para mi situación encontrado en este artículo es la división de su modelo en varios módulos que permiten llevar un aprendizaje rápido sobre el ambiente y sobre ello decidir las acciones que deben tomar los robots.
Se separa en 3 módulos la arquitectura:
Lo más notable y relevante para mi situación encontrado en este artículo es la división de su modelo en varios módulos que permiten llevar un aprendizaje rápido sobre el ambiente y sobre ello decidir las acciones que deben tomar los robots.
Se separa en 3 módulos la arquitectura:
- Acción: Es la capa más baja de toda la arquitectura y se encarga de brindar al robot un aprendizaje por refuerzo sobre las acciones individuales que tiene sobre el campo y cómo influyen a su objetivo. Se le otorgan pesos a las acciones y debe elegir la que mejor resultado le otorgue.
- Estimación del estado del resto: Se encarga de deducir mediante la vista el grado en el que el resto del equipo está llegando a su objetivo.
- Aprendizaje Cooperativo/Competitivo: Obtiene los datos de los módulos anteriores para crear un estado del espacio sobre el cual se trabaja para la planeación de posibles estrategias.
Sin embargo lo más resaltable es la inclusión de una posible predicción o planeación (dependiendo del tipo de aprendizaje) incluidos en el último módulo lo que representa que es posible y factible el crear sistemas de este tipo en entornos multi agentes.
Noma, K., Takahashi, Y., & Asada, M. (2008). Cooperative/Competitive Behavior Acquisition Based on State Value Estimation of Others. Berlin: Springer.
No hay comentarios:
Publicar un comentario