Fecha
2025-06
Editor/a
Tutor/a
Coordinador/a
Prologuista
Revisor/a
Ilustrador/a
Derechos de acceso
info:eu-repo/semantics/openAccess
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Nacional de Educación a Distancia (UNED). E.T.S. de Ingeniería Informática

Citas

plumx
0 citas en WOS
0 citas en
Proyectos de investigación
Unidades organizativas
Número de la revista
Resumen
El carcinoma de mama es una de las causas principales de muerte entre las mujeres, lo que hace fundamental su detección temprana. Diversos estudios han destacado el uso de imágenes térmicas como una herramienta prometedora para la detección temprana. En un trabajo de fin de máster previo, se desarrollaron modelos de aprendizaje profundo con mecanismos de atención para detectar el cáncer de mama a partir de imágenes térmicas. Este arrojó buenos resultados pero se llevó a cabo con un conjunto de datos de 260 imágenes, lo que dificulta la generalización de los resultados. Este proyecto propone utilizar aumento de datos mediante Redes Generativas Adversativas (GANs por sus siglas en inglés) para generar imágenes nuevas al conjunto de datos y evaluar el impacto en los resultados obtenidos con el mejor modelo del anterior trabajo, que utiliza mecanismos de atención dura. Se selecciona StyleGAN como modelo generativo adversativo por la robustez durante el entrenamiento y la calidad de las imágenes generadas y se utiliza KID y FID Score como métricas de evaluación, ya que permiten comparar el rendimiento de los modelos y cuantificar la calidad de las imágenes generadas. Gracias a estas métricas, se define un procedimiento con el que poder seleccionar las mejores imágenes generadas para el aumento de datos y se realiza una afinación de hiperparámetros a los modelos que generan tanto las muestras sanas como las enfermas. Se diseña un procedimiento para evaluar el modelo de predicción que consiste en una validación cruzada y se repite 10 veces para evitar sesgos en los resultados. Se llevan a cabo experimentos incorporando distintas cantidades de imágenes generadas: 0 (datos reales más aquellos con transformaciones de aumento de datos), 768 (25 % del conjunto de datos), 1536 (50 %), 2304 (75 %) y 3072 (100 %). Este número de imágenes generadas se integran al conjunto de datos para analizar el impacto en el rendimiento del modelo predictivo. Para evaluar el modelo de predicción se emplean las mismas métricas que en el trabajo anterior: exactitud, especificidad, precisión, exhaustividad, puntuación F1, área bajo la curva ROC (AUC) y matriz de confusión. Los experimentos donde se incluyen imágenes generadas muestran mejores resultados que aquel donde se utiliza únicamente el conjunto de datos base. Se destaca el experimento donde se introduce un 50 % de imágenes generadas por obtener mejor valor AUC, menor tiempo de ejecución que otros experimentos y conseguir una exhaustividad media de 0.845 con una varianza/desviación de 0.008/0.09, con respecto al experimento del conjunto base que obtuvo una media, varianza y desviación típica de 0.838 y 0.006/0.08 respectivamente. Esos resultados sugieren el impacto positivo del aumento de datos mediante imágenes generadas en conjuntos de datos pequeños.
Breast cancer is one of the leading causes of death among women, making early detection essential. Several studies have highlighted the use of thermal images as a promising tool for early detection. In a previous master’s thesis, deep learning models with attention mechanisms were developed to detect breast cancer from thermal images. This yielded good results but was conducted on a dataset of 260 images, making generalization difficult. This project proposes using data augmentation using Generative Adversarial Networks (GANs) to generate new images for the dataset and evaluate the impact on the results obtained with the best model from the previous work, which uses hard attention mechanisms. StyleGAN is selected as the generative adversarial model due to its robustness during training and the quality of the generated images. KID and FID Score are used as evaluation metrics, as they allow comparing model performance and quantifying the quality of the generated images. Using these metrics, a procedure is defined to select the best generated images for data augmentation, and hyperparameter tuning is performed on the models that generate both healthy and sick samples. A procedure is designed to evaluate the prediction model, consisting of cross-validation and repeated 10 times to avoid bias in the results. Experiments are carried out incorporating different numbers of generated images: 0 (real data plus those with data augmentation transformations), 768 (25% of the dataset), 1536 (50%), 2304 (75%), and 3072 (100%). This number of generated images is integrated into the dataset to analyze the impact on the performance of the predictive model. The same metrics as in the previous work are used to evaluate the prediction model: accuracy, specificity, precision, recall, F1 score, area under the ROC curve (AUC) and confusion matrix. Experiments that include generated images show better results than the one that uses only the base dataset. The experiment that introduces 50% generated images stands out for obtaining a better AUC value, shorter runtime than other experiments, and achieving an average recall of 0.845 with a variance/deviation of 0.008/0.09, with respect to the base set experiment, which obtained mean, variance, and standard deviation of 0.838 and 0.006/0.08, respectively. These results suggest the positive impact of data augmentation using generated images on small datasets.
Descripción
Categorías UNESCO
Palabras clave
Cáncer de mama, imágenes térmicas, Aprendizaje profundo, mecanismos de atención, Redes generativas Adversativas, aumento de datos, afinación de hiperparámetros, validación cruzada, Breast cancer, thermal imaging, deep learning, attention mechanisms, generative adversarial networks, data augmentation, hyperparameter tuning, cross-validation
Citación
Román Aguilar, Rafael. Trabajo Fin de Máster: "Estudio del impacto del aumento de datos con GANs sobre imágenes térmicas en un modelo predictivo del cáncer de mama". Universidad Nacional de Educación a Distancia (UNED) 2025
Centro
E.T.S. de Ingeniería Informática
Departamento
Inteligencia Artificial
Grupo de investigación
Grupo de innovación
Programa de doctorado
Cátedra
DOI