Detección de lenguaje ofensivo en redes sociales

Molero Alonso, José María. (2022). Detección de lenguaje ofensivo en redes sociales Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
MoleroAlonso_JoseMaria_TFM.pdf MoleroAlonso_JoseMaria_TFM.pdf application/pdf 863.80KB

Título Detección de lenguaje ofensivo en redes sociales
Autor(es) Molero Alonso, José María
Resumen Las redes sociales son herramientas que permiten relacionarse con personas de todo el mundo de forma instantánea, compartiendo ideas, opiniones u otro tipo de información como aspectos personales de la vida del usuario. Idealmente esto debería dar lugar a charlas o debates con carácter positivo pero la sensación de anonimato y una sociedad cada vez más polarizada fomentan, en muchas personas, conductas negativas como la discriminación, acoso o, en general, el uso de lenguaje con el solo fin de causar daño o malestar en otras personas. En las redes sociales los usuarios cuentan con herramientas para evitar o reducir la exposición a este tipo de conductas pero, en muchos casos, estas herramientas no son autónomas, así que el usuario primero se ve expuesto y luego actúa denunciando los mensajes ofensivos o bloqueando usuarios con conductas negativas. Para que las redes sociales sean un lugar menos dañino se está dedicando un esfuerzo continuo para mejorar y desarrollar nuevos métodos de detección de lenguaje ofensivo o ciberacoso. Estos sistema se enfrentan a múltiples retos como tratar grandes volúmenes de datos o tratar con textos informales y con un vocabulario evoluciona muy rápido. En este trabajo se van a aplicar técnicas de procesamiento del lenguaje para desarrollar modelos de aprendizaje supervisados capaces de detectar comentarios ofensivos en redes sociales. Para obtener el mejor rendimiento en cada modelo se probarán distintos tratamiento de los textos que irán desde no aplicar ningún tratamiento hasta el truncado, eliminación y corrección de palabras. Posteriormente se entrenarán modelos de aprendizaje, empezando por modelos clásicos como clasificadores lineales o bosques aleatorios. Luego se pasarán a modelos neuronales como redes convolucionales y recurrentes y, por último, se entrenarán modelos tipo BERT que representan uno de los últimos avances en el campo del procesamiento del lenguaje natural. Tras el entrenamiento se analizarán y compararán los resultado de estos modelos y los de otros investigadores. Del trabajo realizado se obtienen algunas conclusiones: las librerías empleadas realizan por defecto un procesado de los texto que puede ser suficiente para obtener buenos resultado, por lo que no es necesario dedicar un gran esfuerzo en este tipo de tareas. La corrección de palabras puede aumentar la eficiencia de modelos que emplean incrustaciones de palabras como datos de entrada. Por último, en vista a los resultados queda patente que los modelo BERT han supuesto realmente un salto cualitativo en el campo del procesamiento del lenguaje natural.
Notas adicionales Trabajo de Fin de Máster Universitario en Ingeniería y Ciencia de Datos. UNED
Materia(s) Ingeniería Informática
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Director/Tutor Pérez Martín, Jorge
Rodrigo Yuste, Álvaro
Fecha 2022
Formato application/pdf
Identificador bibliuned:master-ETSInformatica-ICD-Jmmolero
http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-ICD-Jmmolero
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 481 Visitas, 558 Descargas  -  Estadísticas en detalle
Creado: Tue, 12 Jul 2022, 21:30:59 CET