Osés Grijalba, Jorge2024-05-202024-05-202022-09-01https://hdl.handle.net/20.500.14468/14689En este trabajo exploramos el uso de datos artificiales para mejorar el comportamiento de modelos de respuesta a preguntas multirespuesta en contextos de escasez de datos generados por humanos, con especial foco en los distractores de dichas preguntas. Primero proponemos un proceso a seguir para generar este tipo de datos para posteriormente medir de forma precisa y cuantificable el aporte de estos datos al entrenamiento. Finalizamos el trabajo con un caso concreto en el que mejoramos el rendimiento de nuestro modelo mediante este proceso, y finalizamos explorando las limitaciones que se nos presentan.In this work we explore the use of artificially generated data to improve the behaviour of Question Answering models in the context of Multiple Choice Questions, focusing specially on the distractors of said questions.We propose a general course of action to take the original data, generate new data from it and measure the gain in learning that our model is able to extract from it. We then carry on with a specific example where we show our model indeed gets better with this process, to then spend some time studying the limits of this proposed approach.eninfo:eu-repo/semantics/openAccessAutomatic Data Generation for Multiple Choice Question Answeringtesis de maestría