Segmentación y parametrización de transiciones del habla aplicada al reconocimiento de locutores
View/ Open
Identifiers
URI: http://hdl.handle.net/10317/3003Share
Metrics
Statistics
View Usage StatisticsMetadata
Show full item recordAuthor
Alcaraz Sánchez, José C.Director/a
Guerrero González, AntonioCenter
Escuela Técnica Superior de Ingeniería IndustrialUniversity
Universidad Politécnica de CartagenaDepartment
Ingeniería de Sistemas y AutomáticaKnowledge Area
Ingeniería de Sistemas y AutomáticaPublication date
2012-11-19Keywords
Algoritmos de segmentaciónReconocimiento de locutores
Coarticulación nasal
Abstract
Los algoritmos de segmentación del habla han utilizado tradicionalmente
criterios basados en parámetros de la señal temporal, tales como la amplitud de la
señal, el número de cruces por cero o frecuencia fundamental (pitch), y
caracterizaciones de la señal mediante el modelo Todo-Polo (o modelo LPC),
formulado en el dominio del tiempo o bien de la frecuencia.
Teniendo en cuenta las peculiaridades que se dan en la generación del habla
natural (acoplamientos, coarticulación, silencios,...), buscaremos una alternativa a
estas técnicas clásicas en métodos basados en la dinámica no lineal. Esto nos llevará
a que, necesariamente, primero centremos el estudio en la naturaleza caótica de las
señales del habla natural. En este sentido se estudiarán parámetros de la dinámica no
lineal entre los que podemos destacar la Dimensión de Correlación, que nos permitirán
concluir sobre el citado carácter caótico.
Se desarrollarán diversos algoritmos basados en técnicas no lineales (Entropía
...
Collections
The following license files are associated with this item:
Social media