Demostrador de aprendizaje reforzado en plataforma de juego

Dimas Martínez, Pedro

Ver/

Memoria (5.634Mb)

Identificadores

URI: http://hdl.handle.net/10317/8869

Exportar

Seleccione...

Métricas

Director/a

Vales Alonso, Javier

Escuela/Centro

Escuela Técnica Superior de Ingeniería de Telecomunicación

Universidad

Universidad Politécnica de Cartagena

Departamento

Tecnologías de la Información y las Comunicaciones

Área de conocimiento

Ingeniería Telemática

Fecha de publicación

2020-06-19

Palabras clave

Inteligencia artificial
Artificial intelligence
Juego
Play

Resumen

En este proyecto confeccionaremos e implementaremos un demostrador de aprendizaje máquina. Concretamente, diseñaremos dos modelos de aprendizaje por refuerzo, el primero mediante el algoritmo de Q-learning aproximado y el segundo con el algoritmo Policy-gradient. Ambos son algoritmos bastante populares en este campo debido a los buenos resultados que obtienen. Como entorno de aprendizaje, estudiaremos los resultados de los algoritmos mediante la librería de Python OpenAI Gym. Además de explicar ambos algoritmos y sus bases teóricas, explicaremos el uso de diferentes sistemas de aproximación de funciones de hipótesis. Concretamente, utilizaremos regresores lineales y árboles de decisión para el algoritmo de Q-Learning aproximado, y una red neuronal para resolver policy gradient. Para resolver el algoritmo de Q-Learning aproximado, haremos uso del entorno de OpenAI Gym Frozen lake. Este entorno se presenta como un mapa de 4x4 donde el agente deberá llegar a la meta, esquivando los agujeros ...

Colecciones

PFC/TFG-Escuela Técnica Superior de Ingeniería de Telecomunicación [745]

El ítem tiene asociados los siguientes ficheros de licencia:

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España