Demostrador de aprendizaje reforzado en plataforma de juego
View/ Open
Identifiers
URI: http://hdl.handle.net/10317/8869Share
Metrics
Statistics
View Usage StatisticsMetadata
Show full item recordAuthor
Dimas Martínez, PedroDirector/a
Vales Alonso, JavierCenter
Escuela Técnica Superior de Ingeniería de TelecomunicaciónUniversity
Universidad Politécnica de CartagenaDepartment
Tecnologías de la Información y las ComunicacionesKnowledge Area
Ingeniería TelemáticaPublication date
2020-06-19Keywords
Inteligencia artificialArtificial intelligence
Juego
Play
Abstract
En este proyecto confeccionaremos e implementaremos un demostrador de aprendizaje máquina. Concretamente, diseñaremos dos modelos de aprendizaje por refuerzo, el primero mediante el algoritmo de Q-learning aproximado y el segundo con el algoritmo Policy-gradient. Ambos son algoritmos bastante populares en este campo debido a los buenos resultados que obtienen. Como entorno de aprendizaje, estudiaremos los resultados de los algoritmos mediante la librería de Python OpenAI Gym. Además de explicar ambos algoritmos y sus bases teóricas, explicaremos el uso de diferentes sistemas de aproximación de funciones de hipótesis. Concretamente, utilizaremos regresores lineales y árboles de decisión para el algoritmo de Q-Learning aproximado, y una red neuronal para resolver policy gradient. Para resolver el algoritmo de Q-Learning aproximado, haremos uso del entorno de OpenAI Gym Frozen lake. Este entorno se presenta como un mapa de 4x4 donde el agente deberá llegar a la meta, esquivando los agujeros ...
Collections
The following license files are associated with this item:
Social media