Publicación: Detección de lenguaje ofensivo en redes sociales
Cargando...
Fecha
2022
Autores
Editor/a
Director/a
Tutor/a
Coordinador/a
Prologuista
Revisor/a
Ilustrador/a
Derechos de acceso
Atribución-NoComercial-SinDerivadas 4.0 Internacional
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Resumen
Las redes sociales son herramientas que permiten relacionarse con personas de todo el mundo de forma instantánea, compartiendo ideas, opiniones u otro tipo de información como aspectos personales de la vida del usuario. Idealmente esto debería dar lugar a charlas o debates con carácter positivo pero la sensación de anonimato y una sociedad cada vez más polarizada fomentan, en muchas personas, conductas negativas como la discriminación, acoso o, en general, el uso de lenguaje con el solo fin de causar daño o malestar en otras personas. En las redes sociales los usuarios cuentan con herramientas para evitar o reducir la exposición a este tipo de conductas pero, en muchos casos, estas herramientas no son autónomas, así que el usuario primero se ve expuesto y luego actúa denunciando los mensajes ofensivos o bloqueando usuarios con conductas negativas. Para que las redes sociales sean un lugar menos dañino se está dedicando un esfuerzo continuo para mejorar y desarrollar nuevos métodos de detección de lenguaje ofensivo o ciberacoso. Estos sistema se enfrentan a múltiples retos como tratar grandes volúmenes de datos o tratar con textos informales y con un vocabulario evoluciona muy rápido. En este trabajo se van a aplicar técnicas de procesamiento del lenguaje para desarrollar modelos de aprendizaje supervisados capaces de detectar comentarios ofensivos en redes sociales. Para obtener el mejor rendimiento en cada modelo se probarán distintos tratamiento de los textos que irán desde no aplicar ningún tratamiento hasta el truncado, eliminación y corrección de palabras. Posteriormente se entrenarán modelos de aprendizaje, empezando por modelos clásicos como clasificadores lineales o bosques aleatorios. Luego se pasarán a modelos neuronales como redes convolucionales y recurrentes y, por último, se entrenarán modelos tipo BERT que representan uno de los últimos avances en el campo del procesamiento del lenguaje natural. Tras el entrenamiento se analizarán y compararán los resultado de estos modelos y los de otros investigadores. Del trabajo realizado se obtienen algunas conclusiones: las librerías empleadas realizan por defecto un procesado de los texto que puede ser suficiente para obtener buenos resultado, por lo que no es necesario dedicar un gran esfuerzo en este tipo de tareas. La corrección de palabras puede aumentar la eficiencia de modelos que emplean incrustaciones de palabras como datos de entrada. Por último, en vista a los resultados queda patente que los modelo BERT han supuesto realmente un salto cualitativo en el campo del procesamiento del lenguaje natural.
Descripción
Categorías UNESCO
Palabras clave
Citación
Centro
Facultades y escuelas::E.T.S. de Ingeniería Informática
Departamento
Inteligencia Artificial