Reconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldi

Jiménez Andreu, Rubén

dc.contributor.author	Jiménez Andreu, Rubén
dc.coverage.spatial	east=-1.1556961999999657; north=38.0111896; name=30100 Espinardo, Murcia, España	es_ES
dc.date.accessioned	2017-11-04T11:59:25Z
dc.date.available	2017-11-04T11:59:25Z
dc.date.issued	2017-09-18
dc.description.abstract	El objetivo del presente Proyecto Fin de Máster es presentar algunas técnicas para reconocimiento de hablante empleando redes neuronales y deep learning. Como referencia se emplean vectors y un modelo universal basado en mezclas gaussianas (GMM-UBM) como método del estado del arte. El proceso de entrenamiento es realizado con la base de datos de audiolibros LibriSpeech. Esta base también se emplea para evaluar los modelos, junto con la de Speakers in the Wild, con locuciones más próximos a situaciones reales. El software opensource Kaldi ser a la herramienta empleada para crear los modelos, junto con Python y Octave. Este proyecto se ha realizado en colaboración con la compañía de biometría de voz Biometric Vox S.L., localizada en Espinardo, Murcia. Esta empresa ofrece soluciones de reconocimiento por voz (CheckVox) y de rma biométrica de voz (FirVox). Además, ha contado con una beca de colaboración del Departamento Matemáticas Aplicada Estadística de Universidad Politécnica de Cartagena durante el curso 2015/2016. Se encuentra estructurado en ocho capí tulos. En el capítulo 1 se hace una breve introducci on a la biometría de voz, sus ventajas e inconvenientes. En el capitulo 2 se explica en qu e consiste el m etodo de los vectores y los pasos a seguir. Una descripci on general de la redes neuronales para luego explicar algunos de sus usos en reconocimiento de hablante se har a en el capítulo 3. En el capítulo 4 se expondrán las distintas formas de analizar los resultados de la biometría y en el 5 se describen detalladamente las bases de datos y el software. Para terminar, en los capíulos 6 y 7 se presentan los experimentos realizados y sus resultados, respectivamente. Por ultimo, en el capítulo 8 se exponen las conclusiones extraídas y las posibles nuevas líneas de investigación a seguir en futuros trabajos.	es_ES
dc.format	application/pdf	es_ES
dc.language.iso	spa	es_ES
dc.rights	Atribución-NoComercial-SinDerivadas 3.0 España	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	*
dc.title.alternative	Speaker automatic recognition through automatic learning by means of neuronal networks and using the free software Kaldi	es_ES
dc.title	Reconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldi	es_ES
dc.type	info:eu-repo/semantics/masterThesis	es_ES
dc.subject.other	Matemática Aplicada	es_ES
dc.contributor.advisor	Periago Esparza, Francisco
dc.contributor.advisor	Font Ruiz, Roberto Javier
dc.language	spa	ES_es
dc.subject	Inteligencia artificial	es_ES
dc.subject	Artificial intelligence	es_ES
dc.subject	Kaldi (software)	es_ES
dc.identifier.uri	http://hdl.handle.net/10317/6089
dc.description.centro	Escuela Técnica Superior de Ingeniería Industrial	ES_es
dc.contributor.department	Matemática Aplicada y Estadística
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
dc.description.university	Universidad Politécnica de Cartagena	ES_es
dc.subject.unesco	1203.04 Inteligencia Artificial	es_ES

Ficheros en el ítem

Nombre:: tfm-jim-rec.pdf
Tamaño:: 1.818Mb
Formato:: PDF
Descripción:: Memoria

Este ítem aparece en la(s) siguiente(s) colección(ones)

PFM/TFM-Máster en Ingeniería Industrial [107]

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España