TY - JOUR A1 - Zapata García, Andrés T1 - User categorization using text analysis NLP methods Y1 - 2021 UR - http://hdl.handle.net/10317/9647 AB - [El Procesado del Lenguaje Natural es una de las principales tendencias en el ámbito del aprendizaje máquina y la inteligencia artificial. Una vez que somos capaces de procesar la información a nivel computacional, lograr que una máquina comprenda el lenguaje de un humano nos abre un amplio abanico de posibilidades. Por ejemplo, nuestra tarea de clasificación de usuarios mediante el análisis de sentimientos puede ser de gran utilidad a la hora de saber cuál es la reacción de un determinado público ante un acontecimiento de interés. El objetivo del proyecto se trata de, dado un tweet redactado como entrada, poder predecir si expresa un sentimiento positivo o negativo, en función del contenido. Esta tarea, a priori sencilla para una persona, supone un desafío para un computador: existen multitud de variables dentro del lenguaje que se traducirán en millones de parámetros en nuestro problema. Basándonos en distintos modelos matemáticos, cuya base común es el uso de redes neuronales, aportaremos distintas métricas que nos ayuden a concluir qué modelo nos devuelve unos resultados más satisfactorios. Pasaremos de soluciones más tradicionales dentro del NLP como son las redes neuronales convolucionales, hasta otras más innovadoras como ELMo o BERT.[ENG]Natural Language Processing is one of the main trends in the field of machine learning and artificial intelligence. Once we are able to process information at a computational level, enabling a machine to achieve the understanding of human language opens up a range of possibilities. For instance, our task of classifying users by means of sentiment analysis might be useful figuring out the response of an audience to an event of interest. The aim of the project is to, given a tweet as input, be able to predict if the expressed sentiment is positive or negative, depending on the content. This task, which is easy for a person, entails a challenge for a computer: there are multiple variables in language which will be translated into millions of parameters in our problem. Based on several mathematical models, based on the use of neural networks, we will provide different metrics which will help to conclude what model give us the most satisfactory results. We will explore more traditional solutions in NLP, such as convolutional neural networks, and more innovative ones, as ELMo or BERT. KW - Ingeniería Telemática KW - Tecnología de la comunicación KW - Communication technology KW - 3325 Tecnología de las Telecomunicaciones LA - spa ER -