Reconocimiento automático de locutor a través de aprendizaje automático mediante redes neuronales empleando el paquete de software libre Kaldi
Ver/
Identificadores
URI: http://hdl.handle.net/10317/6089Compartir
Métricas
Estadísticas
Ver Estadísticas de usoMetadatos
Mostrar el registro completo del ítemAutor
Jiménez Andreu, RubénDirector/a
Periago Esparza, Francisco; Font Ruiz, Roberto JavierEscuela/Centro
Escuela Técnica Superior de Ingeniería IndustrialUniversidad
Universidad Politécnica de CartagenaDepartamento
Matemática Aplicada y EstadísticaÁrea de conocimiento
Matemática AplicadaFecha de publicación
2017-09-18Palabras clave
Inteligencia artificialArtificial intelligence
Kaldi (software)
Localización
Resumen
El objetivo del presente Proyecto Fin de Máster es presentar algunas técnicas
para reconocimiento de hablante empleando redes neuronales y deep learning.
Como referencia se emplean vectors y un modelo universal basado en mezclas
gaussianas (GMM-UBM) como método del estado del arte.
El proceso de entrenamiento es realizado con la base de datos de audiolibros
LibriSpeech. Esta base también se emplea para evaluar los modelos, junto con
la de Speakers in the Wild, con locuciones más próximos a situaciones reales. El
software opensource Kaldi ser a la herramienta empleada para crear los modelos,
junto con Python y Octave.
Este proyecto se ha realizado en colaboración con la compañía de biometría
de voz Biometric Vox S.L., localizada en Espinardo, Murcia. Esta empresa ofrece
soluciones de reconocimiento por voz (CheckVox) y de rma biométrica de voz
(FirVox). Además, ha contado con una beca de colaboración del Departamento
Matemáticas Aplicada Estadística de Universidad Polit ...
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia:
Redes sociales