Detección de postura en conjuntos de datos multilingüe

Ávila Gómez, Jorge Pablo. (). Detección de postura en conjuntos de datos multilingüe Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
AvilaGomezJorgePablo-TFM.pdf AvilaGomezJorgePablo-TFM.pdf application/pdf 1.26MB
Título Detección de postura en conjuntos de datos multilingüe
Autor(es) Ávila Gómez, Jorge Pablo
Resumen La detección de postura en el aprendizaje automático es la tarea de identificar automáticamente la actitud expresada en un texto hacia una proposición específica. Esto es fundamental para el procesamiento del lenguaje natural, ya que proporciona informació n valiosa sobre las opiniones de las personas hacia diferentes propuestas. Puede tener aplicaciones importantes en diversos campos, desde la gestión de la reputación en línea hasta la toma de decisiones políticas. Esta tarea se lleva a cabo mediante algori tmos de minería de texto y aprendizaje automático, que analizan características clave en el texto para determinar su postura. Sin embargo, la mayoría de las investigaciones se han centrado en el inglés, lo que limita la aplicabilidad de los modelos a otros idiomas. Algunos estudios han abordado esta limitación mediante conjuntos de datos en diferentes idiomas, pero se han enfrentado a desafíos debido a desequilibrios en clases y a grandes diferencias entre los contextos de cada idioma. En esta línea, se pre sentó la tarea de evaluación Intra Multilingual Multi Target Stance Classification 2023 . Su objetivo es clasificar la postura de textos en varios idiomas y con respecto a múltiples objetivos. La tarea implica clasificar comentarios sobre propuestas políticas como de apoyo, oposición o neutralidad. El conjunto de datos se construyó utilizando la plataforma de la Conferencia sobre el Futuro de Europa (CoFE), que incluye propuestas políticas y comentarios en cualquiera de los 24 idiomas oficiales de la Unión E uropea. Este conjunto de datos presenta una oportunidad atractiva para estudiar la detección de postura en un entorno verdaderamente multilingüe. Este trabajo presenta los resultados obtenidos en esta tarea. El objetivo principal de este estudio fue desarrollar e investigar diversos modelos de aprendizaje automático y aprendizaje profundo para la clasificación de la postura. Se exploraron técnicas c omo el transfer learning , data augmentation y label spreading , para ampliar el conjunto de datos de entrenamiento y aprovechar modelos preentrenados. Los resultados muestran que las estrategias empleadas en este trabajo mejoran significativamente los resultados de referencia proporcionados por la tarea. Estos resultados, después de su presentación en la tarea, se han publicado como parte de las actas de CLEF 2023 (Avila et al., 2023)
Notas adicionales Trabajo de Fin de Máster Universitario en Ingeniería y Ciencia de Datos. UNED
Materia(s) Ingeniería Informática
Palabra clave Detección de postura
procesamiento del lenguaje natural
aprendizaje automático
multilingüe
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Director/Tutor Rodrigo Yuste, Álvaro
Centeno Sánchez, Roberto
Identificador bibliuned:master-ETSInformatica-ICD-Javila
fecha fin de embargo 2023-09
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 50 Visitas, 13 Descargas  -  Estadísticas en detalle
Creado: Thu, 30 Nov 2023, 06:15:57 CET