Show simple item record

dc.contributor.authorJiménez Andreu, Rubén 
dc.coverage.spatialeast=-1.1556961999999657; north=38.0111896; name=30100 Espinardo, Murcia, Españaes_ES
dc.date.accessioned2017-11-04T11:59:25Z
dc.date.available2017-11-04T11:59:25Z
dc.date.issued2017-09-18
dc.description.abstractEl objetivo del presente Proyecto Fin de Máster es presentar algunas técnicas para reconocimiento de hablante empleando redes neuronales y deep learning. Como referencia se emplean vectors y un modelo universal basado en mezclas gaussianas (GMM-UBM) como método del estado del arte. El proceso de entrenamiento es realizado con la base de datos de audiolibros LibriSpeech. Esta base también se emplea para evaluar los modelos, junto con la de Speakers in the Wild, con locuciones más próximos a situaciones reales. El software opensource Kaldi ser a la herramienta empleada para crear los modelos, junto con Python y Octave. Este proyecto se ha realizado en colaboración con la compañía de biometría de voz Biometric Vox S.L., localizada en Espinardo, Murcia. Esta empresa ofrece soluciones de reconocimiento por voz (CheckVox) y de rma biométrica de voz (FirVox). Además, ha contado con una beca de colaboración del Departamento Matemáticas Aplicada Estadística de Universidad Politécnica de Cartagena durante el curso 2015/2016. Se encuentra estructurado en ocho capí tulos. En el capítulo 1 se hace una breve introducci on a la biometría de voz, sus ventajas e inconvenientes. En el capitulo 2 se explica en qu e consiste el m etodo de los vectores y los pasos a seguir. Una descripci on general de la redes neuronales para luego explicar algunos de sus usos en reconocimiento de hablante se har a en el capítulo 3. En el capítulo 4 se expondrán las distintas formas de analizar los resultados de la biometría y en el 5 se describen detalladamente las bases de datos y el software. Para terminar, en los capíulos 6 y 7 se presentan los experimentos realizados y sus resultados, respectivamente. Por ultimo, en el capítulo 8 se exponen las conclusiones extraídas y las posibles nuevas líneas de investigación a seguir en futuros trabajos.es_ES
dc.formatapplication/pdfes_ES
dc.language.isospaes_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 España*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.title.alternativeSpeaker automatic recognition through automatic learning by means of neuronal networks and using the free software Kaldies_ES
dc.titleReconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldies_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.subject.otherMatemática Aplicadaes_ES
dc.contributor.advisorPeriago Esparza, Francisco 
dc.contributor.advisorFont Ruiz, Roberto Javier 
dc.languagespaES_es
dc.subjectInteligencia artificiales_ES
dc.subjectArtificial intelligencees_ES
dc.subjectKaldi (software)es_ES
dc.identifier.urihttp://hdl.handle.net/10317/6089
dc.description.centroEscuela Técnica Superior de Ingeniería IndustrialES_es
dc.contributor.departmentMatemática Aplicada y Estadística
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.description.universityUniversidad Politécnica de CartagenaES_es
dc.subject.unesco1203.04 Inteligencia Artificiales_ES


Files in this item

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-SinDerivadas 3.0 España
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España