Detección de noticias falsas empleando información social de Twitter

Jesús María Fraile Hernández. (2022). Detección de noticias falsas empleando información social de Twitter Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
Fraile_Hernandez_JesusMaria_TFM.pdf Fraile Hernandez_JesusMaria_TFM.pdf application/pdf 2.14MB

Título Detección de noticias falsas empleando información social de Twitter
Autor(es) Jesús María Fraile Hernández
Resumen La exposición y propagación de noticias falsas ha ido en aumento en los últimos años debido a la rapidez en la transmisión de la información en medios digitales. Debido a la naturaleza de las redes sociales, las noticias falsas se propagan rápidamente y crean un gran daño en la sociedad. Es por ello por lo que estas plataformas están adoptando medidas (Flores, 2022) para luchar contra la desinformación. A lo largo de esta última década se han propuesto varios modelos para detectar noticias falsas mediante el análisis de caracter´ısticas ling¨u´ısticas tanto léxicas como semánticas (Horne y Adali, 2017), (Bharadwaj y Shao, 2019), (Kaliyar, Goswami, y Narang, 2021). Sin embargo, debido a la naturaleza engañosa de estas noticias, estos modelos no siempre son suficientes. Por ello la investigación actual se basa en incluir la información social de los usuarios que interactúan con la noticia (Conroy, Rubin, y Chen, 2015), (Buntain y Golbeck, 2017), (Ruchansky, Seo, y Liu, 2017) ,(Shu, Wang, y Liu, 2017). Para realizar esta tarea se han recopilado varios conjuntos de datos obteniendo las interacciones de los usuarios en las redes sociales (Potthast et al., 2018), (Shu et al., 2018). Estos conjuntos de datos con información social no se encuentran disponibles en español. Con el desarrollo de este trabajo se pretende estudiar el aporte de la información social a la hora de clasificar noticias en español. Se partirá del conjunto de noticias FakeDeS (Posadas-Durán et al., 2019) y se completará extrayendo la información de los usuarios de Twitter que hablan de dichas noticias. En un primer momento se realizará un análisis exploratorio del conjunto de noticias y del conjunto de información social. Posteriormente se propondrán varios modelos en los cuales se irán combinando diferentes caracter ísticas, tanto textuales como sociales. A continuación, se estudiará el rendimiento de los modelos propuestos y se realizará un estudio sobre la importancia de la información social en los modelos. Con este trabajo, se pretende estudiar si la información social permite aportar información útil a la hora de clasificar noticias. Para ello se ha ampliado con la información social el conjunto de noticias en español más relevante y se ha propuesto un modelo clasificador que tiene un buen rendimiento para esta tarea.
Abstract The exposure and spread of fake news has been increasing in recent years due to the rapid transmission of information on digital media. Due to the nature of social media, fake news spread quickly and create great harm in society. This is why these social media platforms are adopting measures to combat misinformation. Over the last decade, several models have been proposed to detect fake news by analysing both lexical and semantic linguistic features (Horne y Adali, 2017), (Bharadwaj y Shao, 2019), (Kaliyar, Goswami, y Narang, 2021). However, due to the misleading nature of such news, these models are not always sufficient. Therefore, the methodology of current research included the social information of users interacting with the news (Conroy, Rubin, y Chen, 2015), (Buntain y Golbeck, 2017), (Ruchansky, Seo, y Liu, 2017) ,(Shu, Wang, y Liu, 2017). To perform this task, several datasets have been collected by obtaining user interactions on the social networks (Potthast et al., 2018), (Shu et al., 2018). These datasets with social information are not available in Spanish. The aim of this work is to study the contribution of social information when classifying news in Spanish. It will start with the set of news Fake- DeS (Posadas-Dur´an et al., 2019) and it will be completed it by extracting information from Twitter users who talk about these news. At first, an exploratory analysis of the set of news and social information will be carried out. Subsequently, several models will be proposed in which different features, both textual and social, will be combined. Then, the performance of the proposed models will be studied and a study on the importance of social information in the models will be carried out. The aim of this work is to study whether social information provides useful information when classifying news. For this purpose, the most relevant set of Spanish news items has been extended with social information and a classifier model has been proposed that performs well for this task.
Notas adicionales Trabajo Final de Máster Universitario en Tecnologías del lenguaje. UNED
Materia(s) Ingeniería Informática
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos
Director/Tutor Rodrigo Yuste, Álvaro
Centeno Sánchez, Roberto
Fecha 2022-09-01
Formato application/pdf
Identificador bibliuned:master-ETSInformatica-TL-Jmfraile
http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-TL-Jmfraile
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 377 Visitas, 198 Descargas  -  Estadísticas en detalle
Creado: Fri, 13 Jan 2023, 20:09:50 CET