TFM, TFG y otros trabajos académicos
URI permanente para esta comunidad
Examinar
Examinando TFM, TFG y otros trabajos académicos por Autor "Aguilera Castro, David"
Mostrando 1 - 1 de 1
Resultados por página
Opciones de ordenación
Publicación Aplicación de algoritmos predictivos para la diferenciación de muestras alimentarias en base a su perfil químico(Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial, 2022-09-01) Aguilera Castro, David; Pastor Vargas, Rafael; Muñoz Redondo, José ManuelLa metabolómica es una rama de la ciencia que se basa en el estudio de las pequeñas moléculas orgánicas, denominadas metabolitos, que se hallan presentes en un organismo o muestra biológica. El estudio de la composición química de determinadas muestras biológicas permite establecer comparativas e identificar los compuestos representativos de cada una de ellas. Así, la metabolómica permite determinar los compuestos que diferencian las muestras y, de esta forma, establecer los más singulares (biomarcadores) para identificar una característica o expresión determinadas. Dado que los experimentos de metabolómica producen grandes cantidades de datos, se necesitan herramientas estadísticas avanzadas que puedan efectuar un procesamiento adecuado de los mismos, mediante un manejo eficiente que permita preservar la información biológicamente relevante. El objetivo del presente trabajo ha sido desarrollar una herramienta estadística en R que permita implementar de manera sencilla y ágil los principales pretratamientos y análisis estadísticos utilizados en datos de metabolómica. Con objeto de simplificar el uso de la herramienta, se definió un flujo basado en pasos de procesamiento que pueden encadenarse y que aportan flexibilidad a la programación de pretratamientos. Una vez creada esta herramienta, se aplicó sobre datos del perfil volátil de vinos espumosos de diferente tipología (Andaluz, Cavas y Champagnes). Mediante esta herramienta se consiguió establecer un flujo de pretratamiento óptimo, obteniendo una matriz final de datos a la que poder aplicar distintas técnicas de machine learning: proyección sobre estructuras latentes-análisis discriminante (PLS-DA), k vecinos más próximos (k-NN), Random Forest (RF) y análisis discriminante lineal (LDA). Los métodos de análisis multivariante permitieron reducir la complejidad de la matriz de datos y sintetizar la información de cara a poder realizar una interpretación más sencilla. Los modelos permitieron clasificar las muestras de vinos en base a su perfil volátil y se identificaron los principales compuestos marcadores de cada tipología de vino. A su vez, se aplicaron técnicas de selección de características, optimización de hiperparámetros y procesos de validación cruzada para obtener una comparativa de los resultados de las métricas obtenidos por los diferentes clasificadores.