Demostrador de aprendizaje reforzado en plataforma de juego

Dimas Martínez, Pedro

View/Open

Memoria (5.634Mb)

Identifiers

URI: http://hdl.handle.net/10317/8869

Exportar

Seleccione...

Metrics

Director/a

Vales Alonso, Javier

Center

Escuela Técnica Superior de Ingeniería de Telecomunicación

University

Universidad Politécnica de Cartagena

Department

Tecnologías de la Información y las Comunicaciones

Knowledge Area

Ingeniería Telemática

Publication date

2020-06-19

Keywords

Inteligencia artificial
Artificial intelligence
Juego
Play

Abstract

En este proyecto confeccionaremos e implementaremos un demostrador de aprendizaje máquina. Concretamente, diseñaremos dos modelos de aprendizaje por refuerzo, el primero mediante el algoritmo de Q-learning aproximado y el segundo con el algoritmo Policy-gradient. Ambos son algoritmos bastante populares en este campo debido a los buenos resultados que obtienen. Como entorno de aprendizaje, estudiaremos los resultados de los algoritmos mediante la librería de Python OpenAI Gym. Además de explicar ambos algoritmos y sus bases teóricas, explicaremos el uso de diferentes sistemas de aproximación de funciones de hipótesis. Concretamente, utilizaremos regresores lineales y árboles de decisión para el algoritmo de Q-Learning aproximado, y una red neuronal para resolver policy gradient. Para resolver el algoritmo de Q-Learning aproximado, haremos uso del entorno de OpenAI Gym Frozen lake. Este entorno se presenta como un mapa de 4x4 donde el agente deberá llegar a la meta, esquivando los agujeros ...

Collections

PFC/TFG-Escuela Técnica Superior de Ingeniería de Telecomunicación [747]

The following license files are associated with this item:

Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España