Large Language Models (LLMs) para calidad y estandarización de datos

Herrando Moraira, Albert

Publication:
Large Language Models (LLMs) para calidad y estandarización de datos

Files

Herrando_Moraira_Albert_TFM.pdf (3.82 MB)

Date

2024

Authors

Herrando Moraira, Albert

Access rights

info:eu-repo/semantics/openAccess

Publisher

Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática.

Abstract

Actualmente, uno de los principales problemas de las empresas, organizaciones o gobiernos que gestionan datos es la calidad de los mismos. Éstos suelen contener una gran cantidad de errores con multitud de variaciones. En consecuencia, resulta difícil corregirlos para realizar análisis o pre- dicciones. Por otro lado, en los últimos años se han desarrollado grandes modelos del lenguaje con potencial para resolver este tipo de tareas de calidad de los datos. Este proyecto explora la viabilidad de la utilización de grandes modelos del lenguaje para la corrección y la estandarización de datos. Primero, se ha investigado el estado del arte de los modelos y de la calidad de los datos. Seguidamen- te, se ha diseñado una metodología para realizar experimentos con grandes modelos del lenguaje y tareas de calidad. En particular, se han llevado a cabo tres experimentos. El primero sobre corrección de valores, el segundo sobre estandarización de atributos, y el tercero sobre imputación de valores ausentes. Después de evaluar los experimentos, se ha observado que la aplicación de LLMs en tareas de calidad del dato puede obtener buenos resultados en determinados escenarios muy concretos. Por ejemplo, cuando la cantidad de datos a corregir es pequeña y la tarea es sencilla. Sin embargo, para grandes cantidades de datos o tareas complejas, han surgido dificultades relacionadas con los tiempos de ejecución, los costes económicos y la fiablidad de las respuestas.

Keywords

LLMs, Calidad del dato, Ingeniería de prompts, Corrección y estandarización de datos

Center

Facultades y escuelas::E.T.S. de Ingeniería Informática

Department

Inteligencia Artificial

Handle

https://hdl.handle.net/20.500.14468/22598

Collections

Trabajos de fin de máster (TFM)

Full item page

Publication:
Large Language Models (LLMs) para calidad y estandarización de datos

Files

Date

Authors

Editor

Director

Advisor

Coordinator

Commentator

Reviewer

Illustrator

Access rights

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Description

UNESCO Categories

Keywords

Citation

Center

Department

Research Group

Innovation Group

PHD Program

Professorship

Handle

DOI

Collections

Publication: Large Language Models (LLMs) para calidad y estandarización de datos

Files

Date

Authors

Editor

Director

Advisor

Coordinator

Commentator

Reviewer

Illustrator

Access rights

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Description

UNESCO Categories

Keywords

Citation

Center

Department

Research Group

Innovation Group

PHD Program

Professorship

Handle

DOI

Collections

Publication:
Large Language Models (LLMs) para calidad y estandarización de datos