Resources usage prediction on parallel distributed infrastructures

Martínez Garín, Antonio. (2022). Resources usage prediction on parallel distributed infrastructures Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
MartinezGarin_Antonio_TFM.pdf MartinezGarin_Antonio_TFM.pdf application/pdf 1.11MB

Título Resources usage prediction on parallel distributed infrastructures
Autor(es) Martínez Garín, Antonio
Resumen Los contenedores ligeros se están usando de forma extensiva para ejecutar aplicaciones basadas en contenedores llamadas trabajos. Estos trabajos son orquestados por sistemas encargados de administrar clústeres de gran tamaño que contienen cientos de miles de aplicaciones, y destacan por lograr una alta utilización del clúster. Sin embargo, definiciones deficientes de los requisitos de recursos en los contenedores de los trabajos tienen un impacto negativo en la eficiencia general del uso del clúster. El objetivo principal de este trabajo es encontrar y entrenar modelos para predecir el uso de recursos de los jobs cuando son enviados y analizar su capacidad de predicción. Esto se hará utilizando datos de grandes clústeres de producción que ejecutan contenedores ligeros. Este TFM se encuadra dentro del proyecto del FILE (efFIcient scheduLing of containErs), financiado por la UNED.
Abstract Lightweight containers are extensively used for running containerized applications as jobs. Jobs are orchestrated by systems which manage large clusters that contain hundreds of thousands of jobs from thousands of applications, and they excel at achieving high utilization of the cluster. However, poor container resource requirements negatively impact the overall efficiency of cluster usage. The main objective of this work is to find and train models to predict the resource usage of jobs at submission time and analyze their prediction power. This will be done using data from large production clusters running lightweight containers. This thesis is part of the FILE project (efFIcient scheduling of containErs) financed by UNED.
Notas adicionales Trabajo de Fin de Máster Universitario en Ingeniería y Ciencia de Datos. UNED
Materia(s) Ingeniería Informática
Palabra clave Machine Learning
Regression
Lightweight Containers
Tabular Data
Resources Usage
Random Forest
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Director/Tutor Caminero Herraez, Agustín Carlos
Cuadra Troncoso, José Manuel
Fecha 2022-09-01
Formato application/pdf
Identificador bibliuned:master-ETSInformatica-ICD-Amartinez
http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-ICD-Amartinez
Idioma eng
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 145 Visitas, 52 Descargas  -  Estadísticas en detalle
Creado: Mon, 24 Oct 2022, 19:56:31 CET