Fecha
2024-06-01
Editor/a
Tutor/a
Coordinador/a
Prologuista
Revisor/a
Ilustrador/a
Derechos de acceso
info:eu-repo/semantics/openAccess
Título de la revista
ISSN de la revista
Título del volumen
Editorial

Citas

plumx
0 citas en WOS
0 citas en
Proyectos de investigación
Unidades organizativas
Número de la revista
Resumen
En este TFM, se investigan diferentes arquitecturas neuronales para desarrollar un sistema automático que permita realizar una clasificación multiclase de diferentes lesiones orales a partir de una imagen RGB. Concretamente, las redes neuronales que se analizan son las Redes Neuronales Convolucionales (CNNs), las Redes Neuronales Residuales (RNNs) y los Vision Transformers. Además de estos tres tipos de redes, se estudia una red “híbrida” llamada ConvNeXt, que está entre las Redes Neuronales Residuales y los Vision Transformers. Por otro lado, las clases que se han definido para realizar la clasificación multiclase según la gravedad de las lesiones orales son cuatro: healthy, benign, potentially malignant y malignant. Esta investigación ha permitido hacer una comparativa real entre las arquitecturas utilizadas por otros investigadores y una nueva propuesta, utilizando siempre el mismo dataset compuesto por un total de 3246 imágenes. Las imágenes de este dataset han sido capturadas mediante un dispositivo no profesional, por ejemplo, un smartphone o una cámara réflex convencional, desde cualquier perspectiva y sin seguir ningún tipo de protocolo. Y se ha experimentado con dos posibles entradas: la imagen completa y una Región de Interés (ROI) que contiene la lesión oral. Además, en el caso de uso de un ROI alrededor de la lesión oral como entrada al modelo, se han analizado los modelos obtenidos cuando se consideran cuatro clases y cuando se consideran tres clases, esto es, no se considera la clase healthy. El mejor modelo, tanto cuando se usa la imagen completa como cuando se usa un ROI que contenga la lesión oral, es ConvNeXt con un tamaño de imagen de 384x384 y 512x512 píxeles, respectivamente. En el primer caso, se superan los resultados presentados en otras investigaciones con un 85,53% de accuracy, un 85,02% de precision, un 85,50% de recall, un 84,92% de F1-score y un 97,40% de ROC AUC. En el segundo caso, los resultados se encuentran en el mismo orden de magnitud con 86,77% de accuracy, un 86,03% de precision, un 88,99% de recall, un 87,23% de F1-score y un 96,58% de ROC AUC, pero con la distinción de que el dataset empleado en este trabajo contiene un total de 39 tipos lesiones (sin contar con la cavidad oral sana) y, en general, mayor número de imágenes. Este trabajo se fundamenta en el gran potencial que tienen estos tipos de algoritmos para extraer patrones complejos, abstractos y no lineales de las imágenes. Estos patrones complejos permiten realizar un primer diagnóstico clasificando el tipo de lesión oral de una manera no invasiva, lo que permite ayudar a los médicos de atención primaria y odontólogos. Además, al no requerir usuarios profesionales especializados ni artilugios médicos de alto coste, este sistema también se puede incorporar en zonas con menos recursos, promoviendo el Objetivo de Desarrollo Sostenible (ODS) 3: Garantizar una vida sana y promover el bienestar para todos en todas las edades. Finalmente, indicar que este trabajo de investigación es fruto de la participación en un proyecto titulado, “Desarrollo de una aplicación como ayuda al diagnóstico precoz de las alteraciones orales potencialmente malignas y el cáncer oral”, financiado por el Ministerio de Ciencia e Innovación y dirigido por Dña. Rosa María López Pintor Muñoz. El objetivo del proyecto es desarrollar una herramienta útil para los odontólogos que permita el diagnóstico precoz de las lesiones orales potencialmente malignas y malignas, de manera que se aumente la tasa de supervivencia del paciente y la calidad de vida.
Descripción
Categorías UNESCO
Palabras clave
imágenes médicas, cáncer oral, aprendizaje profundo, Redes Neuronales Convolucionales, Redes Neuronales Residuales, Vision Transformers y Conv- NeXt
Citación
Redondo García, Alejandro. Trabajo Fin de Máster: Diseño de un clasificador multiclase de lesiones de la mucosa oral mediante Deep Learning a partir de imágenes clínicas sin aplicar restricciones. Universidad Nacional de Educación a Distancia (UNED), 2024
Centro
E.T.S. de Ingeniería Informática
Departamento
Inteligencia Artificial
Grupo de investigación
Grupo de innovación
Programa de doctorado
Cátedra
Datos de investigación relacionados
DOI