TY - JOUR 
A1 - Moreno&#x20;Lorente,&#x20;Sergio
T1 - Control&#x20;of&#x20;an&#x20;anti-collision&#x20;protocol&#x20;for&#x20;RFID&#x20;with&#x20;reinforcement&#x20;learning

Y1 - 2019
UR - http:&#x2F;&#x2F;hdl.handle.net&#x2F;10317&#x2F;8096
AB - El&#x20;objetivo&#x20;general&#x20;del&#x20;TFG&#x20;es&#x20;emplear&#x20;aprendizaje&#x20;reforzado&#x20;para&#x20;controlar&#x20;de&#x20;forma&#x20;dinámica&#x20;el&#x20;número&#x20;de&#x20;slots&#x20;de&#x20;las&#x20;rondas&#x20;de&#x20;identificación&#x20;del&#x20;protocolo&#x20;anticolisión&#x20;para&#x20;RFID&#x20;especificado&#x20;en&#x20;el&#x20;standard&#x20;EPCglobal&#x20;Gen2.&#x20;Los&#x20;objetivos&#x20;específicos&#x20;son:&#x20;1.&#x20;Realizar&#x20;un&#x20;simulador&#x20;del&#x20;protocolo&#x20;anticolisión&#x20;DFSA&#x20;para&#x20;RFID&#x20;en&#x20;Python,&#x20;adaptando&#x20;un&#x20;simulador&#x20;en&#x20;Matlab&#x20;proporcionado&#x20;al&#x20;alumno.&#x20;2.&#x20;Dotar&#x20;al&#x20;simulador&#x20;de&#x20;la&#x20;interfaz&#x20;apropiada&#x20;para&#x20;emplearlo&#x20;con&#x20;implementaciones&#x20;existentes&#x20;de&#x20;algoritmos&#x20;de&#x20;aprendizaje&#x20;reforzado&#x20;en&#x20;código&#x20;abierto.&#x20;3.&#x20;Obtener&#x20;mediante&#x20;experimentación&#x20;y&#x20;ajuste&#x20;de&#x20;parámetros&#x20;una&#x20;política&#x20;capaz&#x20;de&#x20;obtener&#x20;un&#x20;rendimiento&#x20;comparable&#x20;a&#x20;una&#x20;política&#x20;de&#x20;referencia&#x20;existente.&#x20;&#x0D;&#x0A;En&#x20;este&#x20;TFG&#x20;se&#x20;pretende&#x20;emplear&#x20;algoritmos&#x20;de&#x20;aprendizaje&#x20;reforzado&#x20;para&#x20;controlar&#x20;de&#x20;forma&#x20;dinámica&#x20;un&#x20;protocolo&#x20;anticolisión&#x20;para&#x20;RFID.&#x20;En&#x20;concreto,&#x20;se&#x20;considera&#x20;el&#x20;protocolo&#x20;anticolisión&#x20;especificado&#x20;en&#x20;el&#x20;standard&#x20;EPCglobal&#x20;Gen2&#x20;[1].&#x20;Se&#x20;busca&#x20;encontrar&#x20;una&#x20;política&#x20;que&#x20;minimice&#x20;el&#x20;tiempo&#x20;esperado&#x20;de&#x20;identificación&#x20;de&#x20;un&#x20;conjunto&#x20;de&#x20;tags,&#x20;desconocido&#x20;a&#x20;priori,&#x20;controlando&#x20;en&#x20;cada&#x20;etapa&#x20;de&#x20;decisión&#x20;el&#x20;número&#x20;de&#x20;slots&#x20;de&#x20;las&#x20;rondas&#x20;de&#x20;identificación.&#x20;El&#x20;alumno&#x20;deberá&#x20;realizar&#x20;un&#x20;simulador&#x20;del&#x20;protocolo&#x20;anticolisión&#x20;DFSA&#x20;para&#x20;RFID&#x20;en&#x20;Python,&#x20;a&#x20;partir&#x20;de&#x20;un&#x20;simulador&#x20;en&#x20;Matlab&#x20;ya&#x20;existente&#x20;y&#x20;que&#x20;le&#x20;será&#x20;proporcionado.&#x20;El&#x20;simulador&#x20;en&#x20;Matlab&#x20;fue&#x20;empleado&#x20;para&#x20;la&#x20;validación&#x20;de&#x20;resultados&#x20;en&#x20;[2].&#x20;Los&#x20;detalles&#x20;del&#x20;simulador&#x20;relativos&#x20;al&#x20;efecto&#x20;captura,&#x20;el&#x20;cálculo&#x20;del&#x20;link&#x20;budget&#x20;y&#x20;el&#x20;modelo&#x20;de&#x20;la&#x20;propagación&#x20;multicamino,&#x20;están&#x20;explicados&#x20;en&#x20;[3].&#x20;Además,&#x20;el&#x20;simulador&#x20;en&#x20;Python&#x20;deberá&#x20;implementar&#x20;la&#x20;interfaz&#x20;definida&#x20;por&#x20;Open&#x20;AI&#x20;[4],&#x20;y&#x20;deberá&#x20;incluir&#x20;la&#x20;posibilidad&#x20;de&#x20;interrumpir&#x20;la&#x20;ronda&#x20;de&#x20;identificación&#x20;en&#x20;curso&#x20;[1].&#x20;Una&#x20;vez&#x20;implementado&#x20;el&#x20;simulador,&#x20;habrá&#x20;que&#x20;seleccionar&#x20;los&#x20;algoritmos&#x20;de&#x20;aprendizaje&#x20;reforzado&#x20;más&#x20;adecuados&#x20;para&#x20;el&#x20;problema&#x20;abordado&#x20;e&#x20;integrar&#x20;el&#x20;simulador&#x20;con&#x20;las&#x20;implementaciones&#x20;existentes&#x20;en&#x20;código&#x20;abierto&#x20;de&#x20;dichos&#x20;algoritmos.&#x20;A&#x20;continuación,&#x20;el&#x20;alumno&#x20;deberá&#x20;iniciar&#x20;una&#x20;fase&#x20;de&#x20;experimentación&#x20;en&#x20;la&#x20;que&#x20;deberá&#x20;ejecutar&#x20;los&#x20;algoritmos&#x20;seleccionados&#x20;y&#x20;realizar&#x20;los&#x20;ajustes&#x20;necesarios&#x20;en&#x20;el&#x20;simulador&#x20;y&#x20;en&#x20;los&#x20;parámetros&#x20;de&#x20;los&#x20;algoritmos.&#x20;El&#x20;rendimiento&#x20;de&#x20;los&#x20;algoritmos&#x20;se&#x20;comparará&#x20;con&#x20;una&#x20;política&#x20;de&#x20;referencia&#x20;descrita&#x20;en&#x20;[2],&#x20;con&#x20;un&#x20;conocimiento&#x20;a&#x20;priori&#x20;del&#x20;número&#x20;de&#x20;tags&#x20;(política&#x20;de&#x20;tipo&#x20;&quot;oracle&quot;).
KW - Ingeniería&#x20;Telemática
KW - Inteligencia&#x20;artificial
KW - Artificial&#x20;intelligence
KW - 1203.04&#x20;Inteligencia&#x20;Artificial
LA - spa
ER -