Evaluación de algoritmos de aprendizaje por refuerzo en un entorno multi-agente

Zapata García, Andrés

dc.contributor.author	Zapata García, Andrés
dc.date.accessioned	2022-10-18T18:10:26Z
dc.date.available	2022-10-18T18:10:26Z
dc.date.issued	2022-09
dc.description.abstract	Una de las claves del aprendizaje por refuerzo es su capacidad para trabajar en esce narios donde el objetivo final depende de la toma de múltiples decisiones a lo largo del tiempo en un entorno concreto. El entorno que utilizamos en nuestro proyecto, SlimeVo lleyGym, está diseñado para poder probar y evaluar distintos tipos de algoritmos RL y permite trabajar con un único agente que se enfrenta con un modelo de referencia, o con dos que compiten entre sí. Nuestro trabajo se centra en exponer los fundamentos teóricos sobre los que basan distintos tipos de algoritmos y evaluarlos en el entorno SlimeVolleyGym. Tras detallar la metodología seguida para cada uno de nuestros experimentos, buscamos reflejar los resultados obtenidos de forma clara e intuitiva. Los algoritmos evaluados cuentan con distintos niveles de complejidad. Principalmen te, los clasificamos según la aproximación de la función valor y/o política que se utiliza. Aquellos que realizan una aproximación lineal son los que denominamos clásicos, y su implementación se detalla en el proyecto. Por otra parte, los que hacen uso de una aproxi mación no lineal los consideramos avanzados, y utilizaremos la implementación dada por la librería stable-baselines3. Además, para este último tipo de algoritmos, emplearemos la técnica denominada self-play, que se basa en la idea de aprender enfrentando el agente contra una versión anterior de sí mismo	es_ES
dc.format	application/pdf	es_ES
dc.language.iso	spa	es_ES
dc.rights	Atribución-NoComercial-SinDerivadas 3.0 España	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	*
dc.title.alternative	Evaluation of reinforcement learning algorithms in a multi-agent environment	es_ES
dc.title	Evaluación de algoritmos de aprendizaje por refuerzo en un entorno multi-agente	es_ES
dc.type	info:eu-repo/semantics/masterThesis	es_ES
dc.subject.other	Ingeniería Telemática	es_ES
dc.contributor.advisor	Alcaraz Espín, Juan José
dc.subject	Algoritmos	es_ES
dc.subject	Algorithms	es_ES
dc.subject	Enseñanza asistida por ordenador	es_ES
dc.subject	Computer assisted instruction	es_ES
dc.identifier.uri	http://hdl.handle.net/10317/11639
dc.description.centro	Escuela Técnica Superior de Ingeniería de Telecomunicación	es_ES
dc.contributor.department	Tecnologías de la Información y las Comunicaciones	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.description.university	Universidad Politécnica de Cartagena	es_ES
dc.subject.unesco	1206.01 Construcción de Algoritmos	es_ES
dc.subject.unesco	1203.10 Enseñanza Con Ayuda de Ordenador	es_ES

Ficheros en el ítem

Nombre:: tfm-zap-eva.pdf
Tamaño:: 5.420Mb
Formato:: PDF
Descripción:: Memoria

Este ítem aparece en la(s) siguiente(s) colección(ones)

PFM/TFM-Máster en Ingeniería de Telecomunicación [76]

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España