Show simple item record

dc.contributor.authorAlcaraz Sánchez, José C. 
dc.date.accessioned2012-11-19T20:20:27Z
dc.date.available2012-11-19T20:20:27Z
dc.date.issued2012-11-19
dc.description.abstractLos algoritmos de segmentación del habla han utilizado tradicionalmente criterios basados en parámetros de la señal temporal, tales como la amplitud de la señal, el número de cruces por cero o frecuencia fundamental (pitch), y caracterizaciones de la señal mediante el modelo Todo-Polo (o modelo LPC), formulado en el dominio del tiempo o bien de la frecuencia. Teniendo en cuenta las peculiaridades que se dan en la generación del habla natural (acoplamientos, coarticulación, silencios,...), buscaremos una alternativa a estas técnicas clásicas en métodos basados en la dinámica no lineal. Esto nos llevará a que, necesariamente, primero centremos el estudio en la naturaleza caótica de las señales del habla natural. En este sentido se estudiarán parámetros de la dinámica no lineal entre los que podemos destacar la Dimensión de Correlación, que nos permitirán concluir sobre el citado carácter caótico. Se desarrollarán diversos algoritmos basados en técnicas no lineales (Entropía Aproximada, K2-Entropía y Dinámica Simbólica) para la caracterización de transiciones entre fonemas de distinta naturaleza, en concreto aquellas que presentan coarticulación nasal, que suponen por su complejidad una de las situaciones que presentan mayor dificultad para los sistemas de segmentación clásicos. La parametrización LPC, tal y como se ha podido constatar en anteriores estudios, no es adecuada para la modelización de segmentos transicionales. A tal fin, se implementará un algoritmo de parametrización ARMA basado en el método de Shanks. Teniendo en cuenta que el objetivo último de este proyecto es plantear un estudio de reconocimiento de locutores, proponemos como medida de comparación una métrica ARMA, que se calcula a partir de los coeficientes ARMA utilizando determinantes (en concreto la resultante entre dos polinomios). Finalmente, realizaremos una comparación entre la técnica clásica de Análisis Discriminante y la nueva técnica introducida, basada en la métrica ARMA, sobre una población extraída de la Base de Datos Ahumada, desarrollada por la Dirección General de la Guardia Civil. Concretamente se planteará el problema de reconocimiento de locutores trabajando con señales del habla natural en las que está presente el fenómeno de coarticulación nasal, admitiendo la hipótesis de que la coarticulación nasal representa una característica fuertemente dependiente del locutor. Todos los algoritmos serán implementados en el entorno de programación LabVIEWÒ, de la empresa National Instrument, creando una librería de funciones que podrán ser utilizadas para desarrollar aplicaciones de caracterización y segmentación automática de señales del habla y aplicaciones de reconocimiento de locutores.es_ES
dc.formatapplication/pdfes_ES
dc.language.isospaes_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 España*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.titleSegmentación y parametrización de transiciones del habla aplicada al reconocimiento de locutoreses_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.subject.otherIngeniería de Sistemas y Automáticaes_ES
dc.contributor.advisorGuerrero González, Antonio 
dc.subjectAlgoritmos de segmentaciónes_ES
dc.subjectReconocimiento de locutoreses_ES
dc.subjectCoarticulación nasales_ES
dc.identifier.urihttp://hdl.handle.net/10317/3003
dc.description.centroEscuela Técnica Superior de Ingeniería Industriales_ES
dc.contributor.departmentIngeniería de Sistemas y Automáticaes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.description.universityUniversidad Politécnica de Cartagenaes_ES


Files in this item

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-SinDerivadas 3.0 España
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 3.0 España