Reconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldi
View/ Open
Identifiers
URI: http://hdl.handle.net/10317/6089Share
Metrics
Statistics
View Usage StatisticsMetadata
Show full item recordAuthor
Jiménez Andreu, RubénDirector/a
Periago Esparza, Francisco; Font Ruiz, Roberto JavierCenter
Escuela Técnica Superior de Ingeniería IndustrialUniversity
Universidad Politécnica de CartagenaDepartment
Matemática Aplicada y EstadísticaKnowledge Area
Matemática AplicadaPublication date
2017-09-18Keywords
Inteligencia artificialArtificial intelligence
Kaldi (software)
Localization
Abstract
El objetivo del presente Proyecto Fin de Máster es presentar algunas técnicas
para reconocimiento de hablante empleando redes neuronales y deep learning.
Como referencia se emplean vectors y un modelo universal basado en mezclas
gaussianas (GMM-UBM) como método del estado del arte.
El proceso de entrenamiento es realizado con la base de datos de audiolibros
LibriSpeech. Esta base también se emplea para evaluar los modelos, junto con
la de Speakers in the Wild, con locuciones más próximos a situaciones reales. El
software opensource Kaldi ser a la herramienta empleada para crear los modelos,
junto con Python y Octave.
Este proyecto se ha realizado en colaboración con la compañía de biometría
de voz Biometric Vox S.L., localizada en Espinardo, Murcia. Esta empresa ofrece
soluciones de reconocimiento por voz (CheckVox) y de rma biométrica de voz
(FirVox). Además, ha contado con una beca de colaboración del Departamento
Matemáticas Aplicada Estadística de Universidad Polit ...
Collections
The following license files are associated with this item:
Social media