Identificación de lenguaje misógino a partir de minería de textos en redes sociales

Blanco Toledano, Rubén

Publicación:
Identificación de lenguaje misógino a partir de minería de textos en redes sociales

dc.contributor.author	Blanco Toledano, Rubén
dc.contributor.director	Martínez Unanue, Raquel
dc.contributor.director	Araujo Serna, M. Lourdes
dc.date.accessioned	2024-05-20T12:26:00Z
dc.date.available	2024-05-20T12:26:00Z
dc.date.issued	2021-06-01
dc.description.abstract	En este trabajo se estudia la creación de un identificador de agresividad y de mensajes de odio hacia mujeres (mensajes misóginos) a partir de datos recogidos de la red social Twitter. Se trata de una respuesta a la tarea planteada en Automatic Misogyny Identification (AMI) por IberVal 2018. El estudio se compone de dos tareas. En la Task A se crea un identificador binario para determinar si un tweet tiene o no contenido misógino. En la Task B se desarrolla una clasificación acerca del entorno de los mensajes. Por un lado se identifica el objetivo al que va dirigido el mensaje (a una persona particular o a un público general) y por otro se realiza una clasificación del tipo de misoginia en torno a cinco posibles categorías de comportamientos misóginos. Se ha utilizado un conjunto de datos en castellano y otro en inglés para realizar una comparación entre lenguas. El estudio se basa por una parte en el preprocesado de los datos y la vectorización de los textos (con métodos como Bag of Words, TF-IDF o Doc2Vec) y por otra en la búsqueda de los mejores clasificadores posibles (con modelos como Naive Bayes, Regresión Logística, Support Vector Machine, Random Forest, Red Neuronal y Combinación de modelos ).	es
dc.description.abstract	This project studies the creation of an identification method of cases of aggressiveness and hate speech towards women (misogynistic messages) from Twitter data. This is a response to the Automatic Misogyny Identification (AMI) shared task at IberEval 2018 The study is composed of two tasks. Task A is a binary classification task to determine if a tweet has misogynous content or not. Task B is a classification task to study the message environment. On the one hand, the objective is to know if the misogyny message was purposely addressed to a specific target (a particular person) or not (general people). On the other hand, the purpose is to distinguish different types of misogyny according to five possible categories. Two datasets are used in the study, one in Spanish and one in English, in order to make a comparison between languages. First of all, the study is based on the text vectorization (with Bag of Words, TF-IDF and Doc2Vec methods). Later, the objective is to search the best possible classifier algorithm (with models such as Naive Bayes, Logistic Regression, Support Vector Machine, Random Forest, Neural Network and Combination of models)	en
dc.description.version	versión final
dc.identifier.uri	https://hdl.handle.net/20.500.14468/14234
dc.language.iso	es
dc.publisher	Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
dc.relation.center	E.T.S. de Ingeniería Informática
dc.relation.degree	Máster universitario en Ingeniería y Ciencia de Datos
dc.relation.department	Inteligencia Artificial
dc.rights	info:eu-repo/semantics/openAccess
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject.keywords	minería de textos
dc.subject.keywords	vectorización de textos
dc.subject.keywords	AMI
dc.subject.keywords	Automatic Misogyny Identification
dc.subject.keywords	misoginia
dc.subject.keywords	Twitter
dc.subject.keywords	clasifiación de tweets
dc.subject.keywords	NLP
dc.subject.keywords	text mining
dc.subject.keywords	text vectorization
dc.subject.keywords	misogyny
dc.subject.keywords	tweets classification
dc.title	Identificación de lenguaje misógino a partir de minería de textos en redes sociales	es
dc.type	master thesis	en
dspace.entity.type	Publication

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: BlancoToledano_Ruben_TFM.pdf
Tamaño:: 4.25 MB
Formato:: Adobe Portable Document Format

Descargar

Colecciones

Trabajos de fin de máster (TFM)

Publicación: Identificación de lenguaje misógino a partir de minería de textos en redes sociales

Archivos

Bloque original

Colecciones

Publicación:
Identificación de lenguaje misógino a partir de minería de textos en redes sociales