Sistemas de clasificación automáticos con confianza y credibilidad en fusión termonuclear

Makili, Lázaro Emílio. Sistemas de clasificación automáticos con confianza y credibilidad en fusión termonuclear . 2014. Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Informática y Automática

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
Documento.pdf Pdf del documento application/pdf

Título Sistemas de clasificación automáticos con confianza y credibilidad en fusión termonuclear
Autor(es) Makili, Lázaro Emílio
Resumen En esta Tesis se aborda la problemática de asociar medidas de fiabilidad a las predicciones efectuadas al clasificar datos generados en los dispositivos de fusión termonuclear. Con tal fin, se analiza la aplicación de una serie de clasificadores, implementados en base a la teoría de la predicción conformal, a los datos generados en el estellarator TJ – II, tomándose como caso de estudio un conjunto de imágenes captadas por su diagnóstico de esparcimiento Thomson. Por otro lado, se estudia el problema de la selección de las muestras de datos más adecuadas para implementar un clasificador. Este estudio se realiza desde una perspectiva de aprendizaje activo. Se implementó un algoritmo que permite, con una cantidad reducida de datos, alcanzar en el proceso de clasificación tanto tasas de acierto como medidas de fiabilidad cualitativamente superiores (o al mismo nivel) de las alcanzadas al entrenar los clasificadores con una cantidad de datos mucho mayor, cuando se seleccionan de forma aleatoria. En los dispositivos de fusión, cada vez es más necesario implementar sistemas de aprendizaje automático que puedan funcionar en tiempo real. Por otro lado, la metodología de clasificación utilizada en la Tesis es transductiva, lo que lleva implícita una alta exigencia desde el punto de vista computacional al clasificar los datos. Considerando estos hechos, en la Tesis se ha puesto un énfasis particular en la reducción de la carga computacional en el proceso de clasificación analizado. Para lograrlo se han investigado dos alternativas: (i) la implementación de variantes del método de clasificación y (ii) la reducción del tamaño de los conjuntos de entrenamiento empleados, pero manteniendo siempre la efectividad, en el proceso de clasificación textual en comparación con la visual, seguida de la aplicación de algún algoritmo de fusión tardía o a nivel de decisiones (late fusion) de todos los resultados monomodales (la elección del algoritmo depende de las características de la colección y la tarea). A esta propuesta se le ha denominado Fusión Multimedia Semántica Tardía, o LSMF por sus siglas en inglés (Late Semantic Multimedia Fusion) (Benavent et al., 2013). Tras la experimentación realizada (Benavent et al., 2010) (Granados et al., 2011) se comprueba que con la aproximación LSMF, se cumplen los objetivos planteados al inicio del trabajo, porque se produce una mejora del rendimiento de las soluciones monomodales, a la vez que se simplifica el proceso de búsqueda visual en colecciones de imágenes anotadas, haciendo escalable la tarea sobre grandes colecciones, como se detallará a lo largo de esta memoria.
Abstract In this Thesis, the problem of associating reliability measures to automatic classification tasks in thermonuclear fusion devices has been tackled. To this end, a set of classifiers, whose implementation has been based on the conformal prediction theory, have been analyzed and applied to data generated in a specific fusion device, the TJ – II stellarator. In particular, the focus has been put on the set of images corresponding to the TJ – II’s Thomson scattering diagnostic. Also, it is important to note that the big amount of data stored in the databases of fusion devices makes essential the problem of selecting the most suitable samples to train a classifier. The aforementioned problem has been tackled in this Thesis from an active learning perspective. An active learning algorithm has been implemented to allow, with a reduced amount of training data, reaching both success rates and reliability measures that are better than, or as good as, the ones reached training the classifiers using a much bigger amount of randomly selected data. In fusion devices, more and more needs of real time signal classification are present. Bearing this kind of requirement in mind, methodologies for the reduction of the computational overload in the classification processes have been emphasized in this Thesis. This goal has been reached by two different ways. On the one hand, the implementation of variants of the classification method has been taken into account. On the other hand, the use of reduced but effective training sets has been analyzed.
Materia(s) Ingeniería Informática
Palabras clave predicción conformal
clasificación
confianza
credibilidad
aprendizaje activo
máquinas de vectores soporte
conformal prediction
classification
confidence
credibility
active learning
support vector machines
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Informática y Automática
Director de tesis Dormido Canto, Sebastián (Director de Tesis)
Vega Sánchez, Jesús Antonio (Codirector de Tesis)
Fecha 2014-05-28
Formato application/pdf
Identificador tesisuned:IngInf-Lemakili
http://e-spacio.uned.es/fez/view/tesisuned:IngInf-Lemakili
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 871 Visitas, 1538 Descargas  -  Estadísticas en detalle
Creado: Wed, 26 Nov 2014, 10:27:01 CET