Segmentación y parametrización de transiciones del habla aplicada al reconocimiento de locutores
Identificadores
URI: http://hdl.handle.net/10317/3003Compartir
Métricas
Estadísticas
Ver Estadísticas de usoMetadatos
Mostrar el registro completo del ítemAutor
Alcaraz Sánchez, José C.Director/a
Guerrero González, AntonioEscuela/Centro
Escuela Técnica Superior de Ingeniería IndustrialUniversidad
Universidad Politécnica de CartagenaDepartamento
Ingeniería de Sistemas y AutomáticaÁrea de conocimiento
Ingeniería de Sistemas y AutomáticaFecha de publicación
2012-11-19Palabras clave
Algoritmos de segmentaciónReconocimiento de locutores
Coarticulación nasal
Resumen
Los algoritmos de segmentación del habla han utilizado tradicionalmente
criterios basados en parámetros de la señal temporal, tales como la amplitud de la
señal, el número de cruces por cero o frecuencia fundamental (pitch), y
caracterizaciones de la señal mediante el modelo Todo-Polo (o modelo LPC),
formulado en el dominio del tiempo o bien de la frecuencia.
Teniendo en cuenta las peculiaridades que se dan en la generación del habla
natural (acoplamientos, coarticulación, silencios,...), buscaremos una alternativa a
estas técnicas clásicas en métodos basados en la dinámica no lineal. Esto nos llevará
a que, necesariamente, primero centremos el estudio en la naturaleza caótica de las
señales del habla natural. En este sentido se estudiarán parámetros de la dinámica no
lineal entre los que podemos destacar la Dimensión de Correlación, que nos permitirán
concluir sobre el citado carácter caótico.
Se desarrollarán diversos algoritmos basados en técnicas no lineales (Entropía
...
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia:
Redes sociales