Mostrar el registro sencillo del ítem
Reconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldi
dc.contributor.author | Jiménez Andreu, Rubén | |
dc.coverage.spatial | east=-1.1556961999999657; north=38.0111896; name=30100 Espinardo, Murcia, España | es_ES |
dc.date.accessioned | 2017-11-04T11:59:25Z | |
dc.date.available | 2017-11-04T11:59:25Z | |
dc.date.issued | 2017-09-18 | |
dc.description.abstract | El objetivo del presente Proyecto Fin de Máster es presentar algunas técnicas para reconocimiento de hablante empleando redes neuronales y deep learning. Como referencia se emplean vectors y un modelo universal basado en mezclas gaussianas (GMM-UBM) como método del estado del arte. El proceso de entrenamiento es realizado con la base de datos de audiolibros LibriSpeech. Esta base también se emplea para evaluar los modelos, junto con la de Speakers in the Wild, con locuciones más próximos a situaciones reales. El software opensource Kaldi ser a la herramienta empleada para crear los modelos, junto con Python y Octave. Este proyecto se ha realizado en colaboración con la compañía de biometría de voz Biometric Vox S.L., localizada en Espinardo, Murcia. Esta empresa ofrece soluciones de reconocimiento por voz (CheckVox) y de rma biométrica de voz (FirVox). Además, ha contado con una beca de colaboración del Departamento Matemáticas Aplicada Estadística de Universidad Politécnica de Cartagena durante el curso 2015/2016. Se encuentra estructurado en ocho capí tulos. En el capítulo 1 se hace una breve introducci on a la biometría de voz, sus ventajas e inconvenientes. En el capitulo 2 se explica en qu e consiste el m etodo de los vectores y los pasos a seguir. Una descripci on general de la redes neuronales para luego explicar algunos de sus usos en reconocimiento de hablante se har a en el capítulo 3. En el capítulo 4 se expondrán las distintas formas de analizar los resultados de la biometría y en el 5 se describen detalladamente las bases de datos y el software. Para terminar, en los capíulos 6 y 7 se presentan los experimentos realizados y sus resultados, respectivamente. Por ultimo, en el capítulo 8 se exponen las conclusiones extraídas y las posibles nuevas líneas de investigación a seguir en futuros trabajos. | es_ES |
dc.format | application/pdf | es_ES |
dc.language.iso | spa | es_ES |
dc.rights | Atribución-NoComercial-SinDerivadas 3.0 España | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.title.alternative | Speaker automatic recognition through automatic learning by means of neuronal networks and using the free software Kaldi | es_ES |
dc.title | Reconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldi | es_ES |
dc.type | info:eu-repo/semantics/masterThesis | es_ES |
dc.subject.other | Matemática Aplicada | es_ES |
dc.contributor.advisor | Periago Esparza, Francisco | |
dc.contributor.advisor | Font Ruiz, Roberto Javier | |
dc.language | spa | ES_es |
dc.subject | Inteligencia artificial | es_ES |
dc.subject | Artificial intelligence | es_ES |
dc.subject | Kaldi (software) | es_ES |
dc.identifier.uri | http://hdl.handle.net/10317/6089 | |
dc.description.centro | Escuela Técnica Superior de Ingeniería Industrial | ES_es |
dc.contributor.department | Matemática Aplicada y Estadística | |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
dc.description.university | Universidad Politécnica de Cartagena | ES_es |
dc.subject.unesco | 1203.04 Inteligencia Artificial | es_ES |
Redes sociales