Uso de algoritmos de machine learning para la detección de archivos malware

Sanz García, Sergio

Uso de algoritmos de machine learning para la detección de archivos malware

Sanz García, Sergio. (2022). Uso de algoritmos de machine learning para la detección de archivos malware Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Sistemas de Comunicación y Control

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre			Descripción	Tipo MIME		Size
Sanz_Garcia_Sergio_TFM.pdf			Sanz_Garcia_Sergio_TFM.pdf		application/pdf	2.58MB

Título	Uso de algoritmos de machine learning para la detección de archivos malware
Autor(es)	Sanz García, Sergio
Resumen	El siguiente proyecto de investigación aborda los problemas surgidos con el avance tecnológico y las consecuencias que ello provoca en la ciberseguridad. Con futuras amenazas cada vez más modernas, los actuales sistemas de detección como son los antivirus se encuentras obsoletos debido a que su tecnología en la detección de firmas no es eficaz a la hora de detectar estas nuevas amenazas. Para ello este proyecto de investigación abre la puerta al uso de algoritmos de machine learning para la detección de estas amenazas utilizando algoritmos que sean capaces de predecir la naturaleza de las archivos y así hacer frente a las nuevas y futuras amenazas. En este proyecto se implementará varios desarrollos de algoritmos de machine learning, que sean capaces de predecir la naturaleza de un archivo dado, para ello se ha utilizado las características PE de los archivos ejecutables para generar una base de datos rica en features que nos servirá para el desarrollo de los modelos de los algoritmos. En segundo lugar se utilizara las características almacenadas en la base de datos para generar modelos predictivos acorde con unos parámetros que se irán reajustando hasta obtener los resultados más óptimos en cada modelo. En tercer lugar, se compararán los resultados obtenidos de los modelos para concluir cual de los algoritmos utilizados es el más efectivo para el problema propuesto en estainvestigación. Para finalizar se implementará un servicio web que permita realizar pruebas de manera online a los modelos generados por los diferentes algoritmos, unido a la implementación de funcionales extras como puede ser la impresión de los informes de clasificación de cada modelo.
Abstract	The following research project addresses those problems that have arisen with technological progress and the consequences that this causes in cybersecurity. With modern future threats, current detection systems such as antiviruses are obsolete because their signature detection technology is not effective in detecting these new threats. Therefore, this research project opens the door to the use of machine learning algorithms to detect these threats using algorithms that are capable of predicting the nature of the files, facing new and future threats thus. In this project, several developments of machine learning algorithms will be implemented. These are capable of predicting the nature of a given file, for which the PE characteristics of the executable files have been used to generate a database rich in features that will help us with the development of algorithm models. Secondly, the characteristics stored in the database will be used to generate predictive models according to parameters that will be readjusted until the most optimal results are obtained in each model. Third, the results obtained from the models will be compared to conclude which of the algorithms used is the most effective as a solution for the problem proposed in this research. Finally, a web service that allows online testing of the models generated by the different algorithms, together with the implementation of extra functions such as the printing of the classification reports of each model, will be implemented.
Notas adicionales	Trabajo de Fin de Máster. Máster Universitario en Ciberseguridad. UNED
Materia(s)	Ingeniería Informática
Palabra clave	ciberseguridad machine learning árboles de decisión red neuronal bosques aleatorios Naive Bayes K Nearest Neighbor Cybersecurity decision trees neural network random forests
Editor(es)	Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Sistemas de Comunicación y Control
Director/Tutor	Robles Gómez, Antonio
Fecha	2022-06-23
Formato	application/pdf
Identificador	bibliuned:master-ETSInformatica-CBS-Ssanz http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-CBS-Ssanz
Idioma	spa
Versión de la publicación	acceptedVersion
Nivel de acceso y licencia	http://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess
Tipo de recurso	master Thesis
Tipo de acceso	Acceso abierto

Tipo de documento:	master Tesis
Collections:	Máster Universitario en Ciberseguridad (UNED) Set de openaire Set de items trabajo fin de máster

Contador de citas:	Search Google Scholar
Estadísticas de acceso:	293 Visitas, 280 Descargas - Estadísticas en detalle
Creado:	Tue, 28 Mar 2023, 22:25:50 CET

e-spacio

Uso de algoritmos de machine learning para la detección de archivos malware