Segmentación y parametrización de transiciones del habla aplicada al reconocimiento de locutores

Alcaraz Sánchez, José C.

Ver/

pfc4535.pdf (1.697Mb)

Identificadores

URI: http://hdl.handle.net/10317/3003

Exportar

Seleccione...

Métricas

Director/a

Guerrero González, Antonio

Escuela/Centro

Escuela Técnica Superior de Ingeniería Industrial

Universidad

Universidad Politécnica de Cartagena

Departamento

Ingeniería de Sistemas y Automática

Área de conocimiento

Ingeniería de Sistemas y Automática

Fecha de publicación

2012-11-19

Palabras clave

Algoritmos de segmentación
Reconocimiento de locutores
Coarticulación nasal

Resumen

Los algoritmos de segmentación del habla han utilizado tradicionalmente criterios basados en parámetros de la señal temporal, tales como la amplitud de la señal, el número de cruces por cero o frecuencia fundamental (pitch), y caracterizaciones de la señal mediante el modelo Todo-Polo (o modelo LPC), formulado en el dominio del tiempo o bien de la frecuencia. Teniendo en cuenta las peculiaridades que se dan en la generación del habla natural (acoplamientos, coarticulación, silencios,...), buscaremos una alternativa a estas técnicas clásicas en métodos basados en la dinámica no lineal. Esto nos llevará a que, necesariamente, primero centremos el estudio en la naturaleza caótica de las señales del habla natural. En este sentido se estudiarán parámetros de la dinámica no lineal entre los que podemos destacar la Dimensión de Correlación, que nos permitirán concluir sobre el citado carácter caótico. Se desarrollarán diversos algoritmos basados en técnicas no lineales (Entropía ...

Colecciones

PFC/TFG-Escuela Técnica Superior de Ingeniería Industrial [1448]

El ítem tiene asociados los siguientes ficheros de licencia:

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España