Detección de lenguaje ofensivo en redes sociales

Molero Alonso, José María

Fecha

2022

Director/a

Pérez Martín, Jorge
Rodrigo Yuste, Álvaro

Derechos de acceso

info:eu-repo/semantics/openAccess

Editorial

Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial

Citas

0 citas en

Resumen

Las redes sociales son herramientas que permiten relacionarse con personas de todo el mundo de forma instantánea, compartiendo ideas, opiniones u otro tipo de información como aspectos personales de la vida del usuario. Idealmente esto debería dar lugar a charlas o debates con carácter positivo pero la sensación de anonimato y una sociedad cada vez más polarizada fomentan, en muchas personas, conductas negativas como la discriminación, acoso o, en general, el uso de lenguaje con el solo fin de causar daño o malestar en otras personas. En las redes sociales los usuarios cuentan con herramientas para evitar o reducir la exposición a este tipo de conductas pero, en muchos casos, estas herramientas no son autónomas, así que el usuario primero se ve expuesto y luego actúa denunciando los mensajes ofensivos o bloqueando usuarios con conductas negativas. Para que las redes sociales sean un lugar menos dañino se está dedicando un esfuerzo continuo para mejorar y desarrollar nuevos métodos de detección de lenguaje ofensivo o ciberacoso. Estos sistema se enfrentan a múltiples retos como tratar grandes volúmenes de datos o tratar con textos informales y con un vocabulario evoluciona muy rápido. En este trabajo se van a aplicar técnicas de procesamiento del lenguaje para desarrollar modelos de aprendizaje supervisados capaces de detectar comentarios ofensivos en redes sociales. Para obtener el mejor rendimiento en cada modelo se probarán distintos tratamiento de los textos que irán desde no aplicar ningún tratamiento hasta el truncado, eliminación y corrección de palabras. Posteriormente se entrenarán modelos de aprendizaje, empezando por modelos clásicos como clasificadores lineales o bosques aleatorios. Luego se pasarán a modelos neuronales como redes convolucionales y recurrentes y, por último, se entrenarán modelos tipo BERT que representan uno de los últimos avances en el campo del procesamiento del lenguaje natural. Tras el entrenamiento se analizarán y compararán los resultado de estos modelos y los de otros investigadores. Del trabajo realizado se obtienen algunas conclusiones: las librerías empleadas realizan por defecto un procesado de los texto que puede ser suficiente para obtener buenos resultado, por lo que no es necesario dedicar un gran esfuerzo en este tipo de tareas. La corrección de palabras puede aumentar la eficiencia de modelos que emplean incrustaciones de palabras como datos de entrada. Por último, en vista a los resultados queda patente que los modelo BERT han supuesto realmente un salto cualitativo en el campo del procesamiento del lenguaje natural.

Centro

E.T.S. de Ingeniería Informática

Departamento

Inteligencia Artificial

Handle

https://hdl.handle.net/20.500.14468/14613

Colecciones

Trabajos de fin de máster (TFM)

Página completa del ítem

Fecha

Editor/a

Director/a

Tutor/a

Coordinador/a

Prologuista

Revisor/a

Ilustrador/a

Derechos de acceso

Título de la revista

ISSN de la revista

Título del volumen

Editorial

Citas

Proyectos de investigación

Unidades organizativas

Número de la revista

Resumen

Descripción

Categorías UNESCO

Palabras clave

Citación

Centro

Departamento

Grupo de investigación

Grupo de innovación

Programa de doctorado

Cátedra

Datos de investigación relacionados

Handle

DOI

Colecciones