Uso de algoritmos de machine learning para la detección de archivos malware

Sanz García, Sergio. (2022). Uso de algoritmos de machine learning para la detección de archivos malware Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Sistemas de Comunicación y Control

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
Sanz_Garcia_Sergio_TFM.pdf Sanz_Garcia_Sergio_TFM.pdf application/pdf 2.58MB

Título Uso de algoritmos de machine learning para la detección de archivos malware
Autor(es) Sanz García, Sergio
Resumen El siguiente proyecto de investigación aborda los problemas surgidos con el avance tecnológico y las consecuencias que ello provoca en la ciberseguridad. Con futuras amenazas cada vez más modernas, los actuales sistemas de detección como son los antivirus se encuentras obsoletos debido a que su tecnología en la detección de firmas no es eficaz a la hora de detectar estas nuevas amenazas. Para ello este proyecto de investigación abre la puerta al uso de algoritmos de machine learning para la detección de estas amenazas utilizando algoritmos que sean capaces de predecir la naturaleza de las archivos y así hacer frente a las nuevas y futuras amenazas. En este proyecto se implementará varios desarrollos de algoritmos de machine learning, que sean capaces de predecir la naturaleza de un archivo dado, para ello se ha utilizado las características PE de los archivos ejecutables para generar una base de datos rica en features que nos servirá para el desarrollo de los modelos de los algoritmos. En segundo lugar se utilizara las características almacenadas en la base de datos para generar modelos predictivos acorde con unos parámetros que se irán reajustando hasta obtener los resultados más óptimos en cada modelo. En tercer lugar, se compararán los resultados obtenidos de los modelos para concluir cual de los algoritmos utilizados es el más efectivo para el problema propuesto en estainvestigación. Para finalizar se implementará un servicio web que permita realizar pruebas de manera online a los modelos generados por los diferentes algoritmos, unido a la implementación de funcionales extras como puede ser la impresión de los informes de clasificación de cada modelo.
Abstract The following research project addresses those problems that have arisen with technological progress and the consequences that this causes in cybersecurity. With modern future threats, current detection systems such as antiviruses are obsolete because their signature detection technology is not effective in detecting these new threats. Therefore, this research project opens the door to the use of machine learning algorithms to detect these threats using algorithms that are capable of predicting the nature of the files, facing new and future threats thus. In this project, several developments of machine learning algorithms will be implemented. These are capable of predicting the nature of a given file, for which the PE characteristics of the executable files have been used to generate a database rich in features that will help us with the development of algorithm models. Secondly, the characteristics stored in the database will be used to generate predictive models according to parameters that will be readjusted until the most optimal results are obtained in each model. Third, the results obtained from the models will be compared to conclude which of the algorithms used is the most effective as a solution for the problem proposed in this research. Finally, a web service that allows online testing of the models generated by the different algorithms, together with the implementation of extra functions such as the printing of the classification reports of each model, will be implemented.
Notas adicionales Trabajo de Fin de Máster. Máster Universitario en Ciberseguridad. UNED
Materia(s) Ingeniería Informática
Palabra clave ciberseguridad
machine learning
árboles de decisión
red neuronal
bosques aleatorios
Naive Bayes
K Nearest Neighbor
Cybersecurity
decision trees
neural network
random forests
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Sistemas de Comunicación y Control
Director/Tutor Robles Gómez, Antonio
Fecha 2022-06-23
Formato application/pdf
Identificador bibliuned:master-ETSInformatica-CBS-Ssanz
http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-CBS-Ssanz
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 293 Visitas, 280 Descargas  -  Estadísticas en detalle
Creado: Tue, 28 Mar 2023, 22:25:50 CET