Demostrador de aprendizaje reforzado en plataforma de juego
Ver/
Identificadores
URI: http://hdl.handle.net/10317/8869Compartir
Métricas
Estadísticas
Ver Estadísticas de usoMetadatos
Mostrar el registro completo del ítemAutor
Dimas Martínez, PedroDirector/a
Vales Alonso, JavierEscuela/Centro
Escuela Técnica Superior de Ingeniería de TelecomunicaciónUniversidad
Universidad Politécnica de CartagenaDepartamento
Tecnologías de la Información y las ComunicacionesÁrea de conocimiento
Ingeniería TelemáticaFecha de publicación
2020-06-19Palabras clave
Inteligencia artificialArtificial intelligence
Juego
Play
Resumen
En este proyecto confeccionaremos e implementaremos un demostrador de aprendizaje máquina. Concretamente, diseñaremos dos modelos de aprendizaje por refuerzo, el primero mediante el algoritmo de Q-learning aproximado y el segundo con el algoritmo Policy-gradient. Ambos son algoritmos bastante populares en este campo debido a los buenos resultados que obtienen. Como entorno de aprendizaje, estudiaremos los resultados de los algoritmos mediante la librería de Python OpenAI Gym. Además de explicar ambos algoritmos y sus bases teóricas, explicaremos el uso de diferentes sistemas de aproximación de funciones de hipótesis. Concretamente, utilizaremos regresores lineales y árboles de decisión para el algoritmo de Q-Learning aproximado, y una red neuronal para resolver policy gradient. Para resolver el algoritmo de Q-Learning aproximado, haremos uso del entorno de OpenAI Gym Frozen lake. Este entorno se presenta como un mapa de 4x4 donde el agente deberá llegar a la meta, esquivando los agujeros ...
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia:
Redes sociales