Publicación:
Curvas de Aprendizaje en la Optimización Bayesiana de Hiperparámetros

dc.contributor.authorRuiz Sarrias, Oskitz
dc.contributor.directorHernández del Olmo, Félix
dc.contributor.directorGaudioso Vázquez, Elena
dc.date.accessioned2024-05-20T12:38:52Z
dc.date.available2024-05-20T12:38:52Z
dc.date.issued2021-09-01
dc.description.abstractLa optimización bayesiana (OB) es uno de los métodos más eficientes para la optimización de hiperparámetros (H) en los algoritmos de aprendizaje automático. Para evaluar el rendimiento de cada conguración de H, la OB utiliza la validación cruzada; lo que en entornos de grandes bases de datos supone un alto coste computacional. Para acelerar la OB en la literatura se han propuesto cuatro estrategias principales: (1) eliminación de combinaciones poco prometedoras, (2) terminación anticipada de evaluaciones innecesarias, (3) paralelización de los cálculos en diferentes unidades, (4) hacer uso de funciones de adquisición más eficientes. Las curvas de aprendizaje (CA) son funciones que enfrentan el número de datos con el que es entrenado un modelo al rendimiento que obtiene tras ser entrenado con dicha cantidad de datos. Poder predecir, partiendo de los puntos iniciales de la CA, el recorrido de la misma, permite estimar el rendimiento del modelo sin necesidad de entrenarlo con todos los datos disponibles. Por lo tanto, el uso de la predicción del rendimiento mediante CA, permitiría reducir el coste computacional de la OB al acelerar las evaluaciones de rendimiento. Y esto último es lo que intenta demostrar este trabajo. En la presente investigación se ha trabajado con problemas de clasicación binaria. Para ello, se han utilizado dos algoritmos de aprendizaje automático: el Support Vector Machine (SVM) y una red neuronal (RN) del tipo perceptrón multicapa. El objetivo final de la fase experimental de este trabajo, ha sido comparar el coste computacional requerido al realizar la OB midiendo el rendimiento con CA o con la validación cruzada. Con esto, se han obtenido resultados que muestran una reducción significativa en el tiempo de cómputo de la OB al usar la predicción por CA.es
dc.description.versionversión final
dc.identifier.urihttps://hdl.handle.net/20.500.14468/14669
dc.language.isoes
dc.publisherUniversidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
dc.relation.centerE.T.S. de Ingeniería Informática
dc.relation.degreeMáster universitario en Investigación en Inteligencia Artificial
dc.relation.departmentInteligencia Artificial
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject.keywordsoptimización de hiperparámetros
dc.subject.keywordsoptimización Bayesiana
dc.subject.keywordscurvas de aprendizaje
dc.titleCurvas de Aprendizaje en la Optimización Bayesiana de Hiperparámetroses
dc.typetesis de maestríaes
dc.typemaster thesisen
dspace.entity.typePublication
Archivos
Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Ruiz_Sarrias_Oskitz_TFM.pdf
Tamaño:
2.37 MB
Formato:
Adobe Portable Document Format