%0 Journal Article %A Alcaraz Sánchez, José C. %T Segmentación y parametrización de transiciones del habla aplicada al reconocimiento de locutores %D 2012 %U http://hdl.handle.net/10317/3003 %X Los algoritmos de segmentación del habla han utilizado tradicionalmente criterios basados en parámetros de la señal temporal, tales como la amplitud de la señal, el número de cruces por cero o frecuencia fundamental (pitch), y caracterizaciones de la señal mediante el modelo Todo-Polo (o modelo LPC), formulado en el dominio del tiempo o bien de la frecuencia. Teniendo en cuenta las peculiaridades que se dan en la generación del habla natural (acoplamientos, coarticulación, silencios,...), buscaremos una alternativa a estas técnicas clásicas en métodos basados en la dinámica no lineal. Esto nos llevará a que, necesariamente, primero centremos el estudio en la naturaleza caótica de las señales del habla natural. En este sentido se estudiarán parámetros de la dinámica no lineal entre los que podemos destacar la Dimensión de Correlación, que nos permitirán concluir sobre el citado carácter caótico. Se desarrollarán diversos algoritmos basados en técnicas no lineales (Entropía Aproximada, K2-Entropía y Dinámica Simbólica) para la caracterización de transiciones entre fonemas de distinta naturaleza, en concreto aquellas que presentan coarticulación nasal, que suponen por su complejidad una de las situaciones que presentan mayor dificultad para los sistemas de segmentación clásicos. La parametrización LPC, tal y como se ha podido constatar en anteriores estudios, no es adecuada para la modelización de segmentos transicionales. A tal fin, se implementará un algoritmo de parametrización ARMA basado en el método de Shanks. Teniendo en cuenta que el objetivo último de este proyecto es plantear un estudio de reconocimiento de locutores, proponemos como medida de comparación una métrica ARMA, que se calcula a partir de los coeficientes ARMA utilizando determinantes (en concreto la resultante entre dos polinomios). Finalmente, realizaremos una comparación entre la técnica clásica de Análisis Discriminante y la nueva técnica introducida, basada en la métrica ARMA, sobre una población extraída de la Base de Datos Ahumada, desarrollada por la Dirección General de la Guardia Civil. Concretamente se planteará el problema de reconocimiento de locutores trabajando con señales del habla natural en las que está presente el fenómeno de coarticulación nasal, admitiendo la hipótesis de que la coarticulación nasal representa una característica fuertemente dependiente del locutor. Todos los algoritmos serán implementados en el entorno de programación LabVIEWÒ, de la empresa National Instrument, creando una librería de funciones que podrán ser utilizadas para desarrollar aplicaciones de caracterización y segmentación automática de señales del habla y aplicaciones de reconocimiento de locutores. %K Ingeniería de Sistemas y Automática %K Algoritmos de segmentación %K Reconocimiento de locutores %K Coarticulación nasal %~ GOEDOC, SUB GOETTINGEN