Mostrar el registro sencillo del ítem

dc.contributor.authorZapata García, Andrés 
dc.date.accessioned2022-10-18T18:10:26Z
dc.date.available2022-10-18T18:10:26Z
dc.date.issued2022-09
dc.description.abstractUna de las claves del aprendizaje por refuerzo es su capacidad para trabajar en esce narios donde el objetivo final depende de la toma de múltiples decisiones a lo largo del tiempo en un entorno concreto. El entorno que utilizamos en nuestro proyecto, SlimeVo lleyGym, está diseñado para poder probar y evaluar distintos tipos de algoritmos RL y permite trabajar con un único agente que se enfrenta con un modelo de referencia, o con dos que compiten entre sí. Nuestro trabajo se centra en exponer los fundamentos teóricos sobre los que basan distintos tipos de algoritmos y evaluarlos en el entorno SlimeVolleyGym. Tras detallar la metodología seguida para cada uno de nuestros experimentos, buscamos reflejar los resultados obtenidos de forma clara e intuitiva. Los algoritmos evaluados cuentan con distintos niveles de complejidad. Principalmen te, los clasificamos según la aproximación de la función valor y/o política que se utiliza. Aquellos que realizan una aproximación lineal son los que denominamos clásicos, y su implementación se detalla en el proyecto. Por otra parte, los que hacen uso de una aproxi mación no lineal los consideramos avanzados, y utilizaremos la implementación dada por la librería stable-baselines3. Además, para este último tipo de algoritmos, emplearemos la técnica denominada self-play, que se basa en la idea de aprender enfrentando el agente contra una versión anterior de sí mismoes_ES
dc.formatapplication/pdfes_ES
dc.language.isospaes_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 España*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.title.alternativeEvaluation of reinforcement learning algorithms in a multi-agent environmentes_ES
dc.titleEvaluación de algoritmos de aprendizaje por refuerzo en un entorno multi-agentees_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.subject.otherIngeniería Telemáticaes_ES
dc.contributor.advisorAlcaraz Espín, Juan José 
dc.subjectAlgoritmoses_ES
dc.subjectAlgorithmses_ES
dc.subjectEnseñanza asistida por ordenadores_ES
dc.subjectComputer assisted instructiones_ES
dc.identifier.urihttp://hdl.handle.net/10317/11639
dc.description.centroEscuela Técnica Superior de Ingeniería de Telecomunicaciónes_ES
dc.contributor.departmentTecnologías de la Información y las Comunicacioneses_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.description.universityUniversidad Politécnica de Cartagenaes_ES
dc.subject.unesco1206.01 Construcción de Algoritmoses_ES
dc.subject.unesco1203.10 Enseñanza Con Ayuda de Ordenadores_ES


Ficheros en el ítem

untranslated

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Atribución-NoComercial-SinDerivadas 3.0 España
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España