Publicación:
Resources usage prediction on parallel distributed infrastructures

dc.contributor.authorMartínez Garín, Antonio
dc.contributor.directorCaminero Herraez, Agustín Carlos
dc.contributor.directorCuadra Troncoso, José Manuel
dc.date.accessioned2024-05-20T12:25:29Z
dc.date.available2024-05-20T12:25:29Z
dc.date.issued2022-09-01
dc.description.abstractLos contenedores ligeros se están usando de forma extensiva para ejecutar aplicaciones basadas en contenedores llamadas trabajos. Estos trabajos son orquestados por sistemas encargados de administrar clústeres de gran tamaño que contienen cientos de miles de aplicaciones, y destacan por lograr una alta utilización del clúster. Sin embargo, definiciones deficientes de los requisitos de recursos en los contenedores de los trabajos tienen un impacto negativo en la eficiencia general del uso del clúster. El objetivo principal de este trabajo es encontrar y entrenar modelos para predecir el uso de recursos de los jobs cuando son enviados y analizar su capacidad de predicción. Esto se hará utilizando datos de grandes clústeres de producción que ejecutan contenedores ligeros. Este TFM se encuadra dentro del proyecto del FILE (efFIcient scheduLing of containErs), financiado por la UNED.es
dc.description.abstractLightweight containers are extensively used for running containerized applications as jobs. Jobs are orchestrated by systems which manage large clusters that contain hundreds of thousands of jobs from thousands of applications, and they excel at achieving high utilization of the cluster. However, poor container resource requirements negatively impact the overall efficiency of cluster usage. The main objective of this work is to find and train models to predict the resource usage of jobs at submission time and analyze their prediction power. This will be done using data from large production clusters running lightweight containers. This thesis is part of the FILE project (efFIcient scheduling of containErs) financed by UNED.en
dc.description.versionversión final
dc.identifier.urihttps://hdl.handle.net/20.500.14468/14211
dc.language.isoen
dc.publisherUniversidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
dc.relation.centerFacultades y escuelas::E.T.S. de Ingeniería Informática
dc.relation.degreeMáster universitario en Ingeniería y Ciencia de Datos
dc.relation.departmentInteligencia Artificial
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject.keywordsMachine Learning
dc.subject.keywordsRegression
dc.subject.keywordsLightweight Containers
dc.subject.keywordsTabular Data
dc.subject.keywordsResources Usage
dc.subject.keywordsRandom Forest
dc.titleResources usage prediction on parallel distributed infrastructureses
dc.typetesis de maestríaes
dc.typemaster thesisen
dspace.entity.typePublication
Archivos
Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
MartinezGarin_Antonio_TFM.pdf
Tamaño:
1.12 MB
Formato:
Adobe Portable Document Format