Métodos y herramientas para la evaluación de resúmenes automáticos mediante feedback humano

Colás Romanos, David Celestino

Métodos y herramientas para la evaluación de resúmenes automáticos mediante feedback humano

Colás Romanos, David Celestino. (2023). Métodos y herramientas para la evaluación de resúmenes automáticos mediante feedback humano Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre			Descripción	Tipo MIME		Size
Celestino_David_TFM.pdf			Celestino_David_TFM.pdf		application/pdf	3.56MB

Título	Métodos y herramientas para la evaluación de resúmenes automáticos mediante feedback humano
Autor(es)	Colás Romanos, David Celestino
Resumen	A medida que avanzan los modelos de lenguaje natural, el entrenamiento y la evaluaci ón de estos se ven limitados por las métricas y los datos empleados para tareas específicas. En el contexto de la generación automática de resúmenes, comúnmente se utilizan métricas tradicionales como ROUGE y BLEU, entre otras, pero estas podrían no capturar la verdadera esencia de la calidad del resumen. En este trabajo, se revisa la validez de dichas métricas en el contexto actual, empleando un dataset innovador de OpenAI, compuesto por comparaciones de resúmenes anotados con feedback humano. Se observa que los resúmenes automáticos a menudo superan la calidad de los resúmenes de referencia humanos, llegando a ser casi indistinguibles de estos. Mediante diversos experimentos, se explora tanto la eficacia de las métricas de evaluación tradicionales como el impacto de ciertos rasgos y características en la calidad percibida de un resumen. Este estudio ofrece tres contribuciones significativas: en primer lugar, proporciona una evaluación crítica de las métricas estándar en el contexto actual, subrayando la necesidad de adaptaciones continuas. En segundo lugar, pone de relieve la importancia del feedback humano y cómo este puede enriquecer el proceso de evaluación, brindando percepciones valiosas que las métricas tradicionales podrían no capturar. Finalmente, introduce y valida métricas y herramientas innovadoras, como aquellas basadas en la similitud semántica, y la herramienta ExplainSumm, que han demostrado su eficacia en distintos contextos. Se espera que este trabajo no solo desafíe las nociones convencionales en la evaluación de resúmenes automáticos, sino que también proponga una ruta hacia una evaluación más holística y matizada, capaz de representar de manera más fiable la calidad y utilidad de los resúmenes en la era contemporánea.
Notas adicionales	Trabajo Final de Máster Universitario en Tecnologías del lenguaje. UNED
Materia(s)	Ingeniería Informática
Palabra clave	Machine Learning (cs.LG) Computation and Language (cs.CL) Machine Learning (stat.ML) FOS: Computer and information sciences, FOS: Computer and information sciences
Editor(es)	Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos
Director/Tutor	Cigarran Recuero, Juan Manuel Amigó Cabrera, Enrique
Fecha	2023
Formato	application/pdf
Identificador	bibliuned:master-ETSInformatica-TL-Dcolas http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-TL-Dcolas
Idioma	spa
Versión de la publicación	acceptedVersion
Nivel de acceso y licencia	http://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess
Tipo de recurso	master Thesis
Tipo de acceso	Acceso abierto

Tipo de documento:	master Tesis
Collections:	Máster Universitario en Tecnologías del Lenguaje (UNED) Set de openaire Set de items trabajo fin de máster

Contador de citas:	Search Google Scholar
Estadísticas de acceso:	56 Visitas, 34 Descargas - Estadísticas en detalle
Creado:	Mon, 11 Dec 2023, 19:33:17 CET

e-spacio

Métodos y herramientas para la evaluación de resúmenes automáticos mediante feedback humano