Mostrar el registro sencillo del ítem

dc.contributor.authorSánchez Morales, Adrián 
dc.date.accessioned2020-11-25T14:23:40Z
dc.date.available2020-11-25T14:23:40Z
dc.date.issued2019
dc.description.abstract[SPA] Hoy en día, prácticamente todas las aplicaciones en la industria explotan su información histórica para tomar decisiones y de esta forma realizar predicciones, optimizar procesos o simplemente monitorizar activos. Las técnicas de procesado de datos han sido ampliamente estudiadas durante los últimos años debido, entre otras cosas, al crecimiento de aplicaciones basadas en inteligencia artificial. Además, la presencia de valores desconocidos en un conjunto de datos es uno de los problemas más comunes en estas aplicaciones reales. Ésta es una de las razones por las que en la literatura se han propuesto muchas técnicas basadas en aprendizaje máquina que abordan esta tarea. En la primera parte de este trabajo, se explota la gran capacidad de representación de los Stacked Denoising Autoencoders (SDAE) para obtener un nuevo método de imputación basado en dos ideas diferentes: borrado y compensación. El primer método ha demostrado mejorar los resultados en imputación borrando artificialmente algunas características y usándolas como etiquetas en el entrenamiento de la red. Sin embargo, aunque el borrado es realmente eficiente, puede causar un desbalanceo entre la distribución de los datos de entrenamiento y test. Para solucionar esto, se propone un método de compensación basado en una ligera modificación de la función de error a optimizar. Se realizan experimentos sobre varios conjuntos de datos y se demuestra que el borrado y la compensación no sólo suponen mejoras en imputación en comparación con otras técnicas clásicas, sino también en clasificación. Después, se propone proporcionar más información a un clasificador SDAE para mejorar su rendimiento. Más específicamente, se usa la salida de un clasificador auxiliar para extender la entrada de estas máquinas, y llevar un entrenamiento capa a capa considerando la reconstrucción de la entrada y las etiquetas al mismo tiempo usando una combinación convexa. Esta red es llamada Complete MSDAE (CMSDAE). Se realizan también experimentos para apoyar la efectividad del modelo, demostrando que las máquinas resultantes ofrecen mejores resultados que los métodos estándares en todos los casos, así como reducen la sensibilidad del diseño de parámetros. Finalmente, una vez demostrado que los mencionados clasificadores CMSDAEs ofrecen unos resultados de clasificación que son mejores que los de los propios MSDAEs, se ha investigado si los CMSDAEs pueden mejorar los mecanismos de imputación de los mismos. En la parte final de este trabajo, se consideran dos métodos diferentes de imputación con CMSDAEs. La primera resulta ser un método directo en el que la salida del CMSDAE es simplemente la etiqueta del conjunto. El segundo mecanismo surge a partir de la presencia de las etiquetas en el vector de salida y usa la técnica ampliamente conocida de aprendizaje multitarea (MTL), incluyendo las observaciones como tarea secundaria. Así, los resultados experimentales demuestran que estas estructuras CMSDAE incrementan la calidad de los valores imputados, en particular, en las versiones MTL. [ENG] Nowadays, almost every industry application exploits the information of historical data to get useful insights and thus make predictions, optimize processes or simply monitorize assets. Data processing techniques have been widely studied for the last years due to the growth of artificial intelligence applications. Furthermore, missing values in a data set is one of the most common difficulties in these real applications. That is one of the reasons why many different techniques based on machine learning have been proposed in the literature to face this problem. In the first part of this work, the great representation capability of the Stacked Denoising Auto-Encoders (SDAE) is used to obtain a new method of imputating missing values based on two ideas: deletion and compensation. This method has demonstrated to improve imputation performance by artificially deleting values in the input features and using them as targets in the training process. Nevertheless, although the deletion of samples is really efficient, it may cause an imbalance between the distributions of the training and the test sets. In order to solve this issue, a compensation mechanism is also proposed based on a slight modification of the error function to be optimized. Then, experiments over several datasets show that the deletion and compensation not only involve improvements in imputation but also in classification in comparison to other classical techniques. Aterwards, we propose to provide more information to SDAE classifiers in order to increase their performance. Specifically, we use the output of an auxiliary classifier to extend the input to those machines, and carry out the layer-by-layer auto-encoding training considering the input recovering and the label errors by means of a convex combination. This network is called Complete MSDAE (CMSDAE). Extensive experiments support the effectiveness of this proposal, showing that the resulting machines offer better results than standard designs in all the cases, as well as a reduced sensitivity to the design parameters. Finally, once demonstrated that the mentioned CMSDAE classifiers offer classification results that are better than those provided by MSDAEs, it has been investigated if CMSDAEs can improve the MSDAEs imputation processes. In the final part of this work, two types of imputation mechanisms with CMSDAEs are considered. The first is a direct procedure in which the CMSDAE output is just the target. The second mechanism is suggested by the presence of the targets in the vectors to be auto-encoded, and it uses the well known Multi-Task Learning (MTL) ideas, including the observations as a secondary task. Thus, experimental results show that these CMSDAE structures increase the quality of the missing value imputations, in particular, the MTL versions.es_ES
dc.formatapplication/pdfes_ES
dc.language.isospaes_ES
dc.publisherAdrián Sánchez Moraleses_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 España*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.titleResolución de problemas de clasificación con datos incompletos mediante redes autoasociativas profundases_ES
dc.typeinfo:eu-repo/semantics/doctoralThesises_ES
dc.subject.otherTeoría de la Señal y las Comunicacioneses_ES
dc.contributor.advisorSancho Gómez, José Luis 
dc.contributor.advisorFigueiras Vidal, Anibal R. 
dc.date.submitted2020-01-31
dc.subjectInteligencia artificiales_ES
dc.subjectLenguajes algorítmicoses_ES
dc.subjectAprendizaje automáticoes_ES
dc.subjectAuto-codificadoreses_ES
dc.subjectArtificial intelligencees_ES
dc.subjectComputer program languagees_ES
dc.subjectMachine learninges_ES
dc.subjectAuto encoderses_ES
dc.identifier.urihttp://hdl.handle.net/10317/8851
dc.description.centroEscuela Internacional de Doctorado de la Universidad Politécnica de Cartagenaes_ES
dc.contributor.departmentTecnologías de la Información y las Comunicacioneses_ES
dc.identifier.doi10.31428/10317/8851
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.description.universityUniversidad Politécnica de Cartagenaes_ES
dc.subject.unesco1203.04 Inteligencia Artificiales_ES
dc.description.programadoctoradoPrograma de Doctorado en Tecnologías de la Información y las Comunicaciones por la Universidad Politécnica de Cartagenaes_ES


Ficheros en el ítem

untranslated

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Atribución-NoComercial-SinDerivadas 3.0 España
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España