Publicación: Automatic Data Generation for Multiple Choice Question Answering
Cargando...
Fecha
2022-09-01
Autores
Editor/a
Director/a
Tutor/a
Coordinador/a
Prologuista
Revisor/a
Ilustrador/a
Derechos de acceso
info:eu-repo/semantics/openAccess
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos
Resumen
En este trabajo exploramos el uso de datos artificiales para mejorar el comportamiento de modelos de respuesta a preguntas multirespuesta en contextos de escasez de datos generados por humanos, con especial foco en los distractores de dichas preguntas. Primero proponemos un proceso a seguir para generar este tipo de datos para posteriormente medir de forma precisa y cuantificable el aporte de estos datos al entrenamiento. Finalizamos el trabajo con un caso concreto en el que mejoramos el rendimiento de nuestro modelo mediante este proceso, y finalizamos explorando las limitaciones que se nos presentan.
In this work we explore the use of artificially generated data to improve the behaviour of Question Answering models in the context of Multiple Choice Questions, focusing specially on the distractors of said questions.We propose a general course of action to take the original data, generate new data from it and measure the gain in learning that our model is able to extract from it. We then carry on with a specific example where we show our model indeed gets better with this process, to then spend some time studying the limits of this proposed approach.
In this work we explore the use of artificially generated data to improve the behaviour of Question Answering models in the context of Multiple Choice Questions, focusing specially on the distractors of said questions.We propose a general course of action to take the original data, generate new data from it and measure the gain in learning that our model is able to extract from it. We then carry on with a specific example where we show our model indeed gets better with this process, to then spend some time studying the limits of this proposed approach.
Descripción
Categorías UNESCO
Palabras clave
Citación
Centro
Facultades y escuelas::E.T.S. de Ingeniería Informática
Departamento
Lenguajes y Sistemas Informáticos