Mostrar el registro sencillo del ítem
Evaluación de algoritmos de aprendizaje por refuerzo en un entorno multi-agente
dc.contributor.author | Zapata García, Andrés | |
dc.date.accessioned | 2022-10-18T18:10:26Z | |
dc.date.available | 2022-10-18T18:10:26Z | |
dc.date.issued | 2022-09 | |
dc.description.abstract | Una de las claves del aprendizaje por refuerzo es su capacidad para trabajar en esce narios donde el objetivo final depende de la toma de múltiples decisiones a lo largo del tiempo en un entorno concreto. El entorno que utilizamos en nuestro proyecto, SlimeVo lleyGym, está diseñado para poder probar y evaluar distintos tipos de algoritmos RL y permite trabajar con un único agente que se enfrenta con un modelo de referencia, o con dos que compiten entre sí. Nuestro trabajo se centra en exponer los fundamentos teóricos sobre los que basan distintos tipos de algoritmos y evaluarlos en el entorno SlimeVolleyGym. Tras detallar la metodología seguida para cada uno de nuestros experimentos, buscamos reflejar los resultados obtenidos de forma clara e intuitiva. Los algoritmos evaluados cuentan con distintos niveles de complejidad. Principalmen te, los clasificamos según la aproximación de la función valor y/o política que se utiliza. Aquellos que realizan una aproximación lineal son los que denominamos clásicos, y su implementación se detalla en el proyecto. Por otra parte, los que hacen uso de una aproxi mación no lineal los consideramos avanzados, y utilizaremos la implementación dada por la librería stable-baselines3. Además, para este último tipo de algoritmos, emplearemos la técnica denominada self-play, que se basa en la idea de aprender enfrentando el agente contra una versión anterior de sí mismo | es_ES |
dc.format | application/pdf | es_ES |
dc.language.iso | spa | es_ES |
dc.rights | Atribución-NoComercial-SinDerivadas 3.0 España | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.title.alternative | Evaluation of reinforcement learning algorithms in a multi-agent environment | es_ES |
dc.title | Evaluación de algoritmos de aprendizaje por refuerzo en un entorno multi-agente | es_ES |
dc.type | info:eu-repo/semantics/masterThesis | es_ES |
dc.subject.other | Ingeniería Telemática | es_ES |
dc.contributor.advisor | Alcaraz Espín, Juan José | |
dc.subject | Algoritmos | es_ES |
dc.subject | Algorithms | es_ES |
dc.subject | Enseñanza asistida por ordenador | es_ES |
dc.subject | Computer assisted instruction | es_ES |
dc.identifier.uri | http://hdl.handle.net/10317/11639 | |
dc.description.centro | Escuela Técnica Superior de Ingeniería de Telecomunicación | es_ES |
dc.contributor.department | Tecnologías de la Información y las Comunicaciones | es_ES |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
dc.description.university | Universidad Politécnica de Cartagena | es_ES |
dc.subject.unesco | 1206.01 Construcción de Algoritmos | es_ES |
dc.subject.unesco | 1203.10 Enseñanza Con Ayuda de Ordenador | es_ES |
Redes sociales