Evaluación Comparativa de las Arquitecturas Mamba y Transformers

Trujillo Trujillo, Iván

Publicación:
Evaluación Comparativa de las Arquitecturas Mamba y Transformers

dc.contributor.author	Trujillo Trujillo, Iván
dc.contributor.director	Pastor Vargas, Rafael
dc.contributor.director	Cuadra Troncoso, José Manuel
dc.date.accessioned	2024-10-28T12:45:02Z
dc.date.available	2024-10-28T12:45:02Z
dc.date.issued	2024-09
dc.description.abstract	Este trabajo se enfoca en el estudio comparativo de las arquitecturas de redes neuronales basadas en Transformers, ampliamente utilizadas en la actualidad, y una nueva propuesta denominada Mamba, la cual promete mejorar las capacidades de las arquitecturas tradicionales. El objetivo es evaluar el rendimiento de Mamba en dos áreas principales: la clasificación de texto, específicamente en tuits sobre desastres naturales, y el aprendizaje por refuerzo en juegos de Atari. Se plantea una comparación teórica y práctica de las dos arquitecturas, analizando sus ventajas y desventajas, con el objetivo de determinar su viabilidad y utilidad en aplicaciones reales. Los experimentos llevados a cabo para evaluar Mamba en la tarea de clasificación de texto muestran que los modelos preentrenados disponibles actualmente carecen de la compresión de texto suficiente para rivalizar con modelos como GPT-3.5 o Llama-3. En el ámbito del aprendizaje por refuerzo, Mamba ha mostrado resultados prometedores, aunque todavía se encuentra por detrás de otras arquitecturas consolidadas. Aunque Mamba es una propuesta innovadora, aún requiere de más investigación y refinamiento para igualar o superar a las arquitecturas Transformer en tareas específicas.	es
dc.description.abstract	This work focuses on the comparative study of neural network architectures based on Transformers, widely used today, and a new proposal called Mamba, which promises to enhance the capabilities of traditional architectures. The goal is to evaluate Mamba’s performance in two main areas: text classification, specifically in tweets about natural disasters, and reinforcement learning in Atari games. A theoretical and practical comparison of both architectures is proposed, analyzing their advantages and disadvantages to determine their feasibility and usefulness in real-world applications. The experiments conducted to evaluate Mamba in the text classification task show that the currently available pre-trained models lack sufficient text comprehension to rival models like GPT-3.5 or Llama-3. In the field of reinforcement learning, Mamba has shown promising results, although it still lags behind other established architectures. Although Mamba is an innovative proposal, it still requires further research and refinement to match or surpass Transformer architectures in specific tasks.	en
dc.identifier.citation	Trujillo Trujillo, Iván (2024) Evaluación Comparativa de las Arquitecturas Mamba y Transformers. Trabajo Fin de Máster. Universidad Nacional de Educación a Distancia (UNED)
dc.identifier.uri	https://hdl.handle.net/20.500.14468/24144
dc.language.iso	es
dc.publisher	Universidad Nacional de Educación a Distancia (UNED). E.T.S. de Ingeniería Informática
dc.relation.center	E.T.S. de Ingeniería Informática
dc.relation.degree	Máster universitario en Ingeniería y Ciencia de Datos
dc.relation.department	Sistemas de Comunicación y Control
dc.rights	info:eu-repo/semantics/openAccess
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject	1203.17 Informática
dc.subject.keywords	redes neuronales	es
dc.subject.keywords	Mamba	es
dc.subject.keywords	Transformer	en
dc.subject.keywords	clasificación de texto	es
dc.subject.keywords	aprendizaje por refuerzo	es
dc.subject.keywords	neural networks	en
dc.subject.keywords	text classification	en
dc.subject.keywords	reinforcement learning	en
dc.title	Evaluación Comparativa de las Arquitecturas Mamba y Transformers	es
dc.type	tesis de maestría	es
dc.type	master thesis	en
dspace.entity.type	Publication

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: TrujilloTrujillo_Ivan_TFM.pdf
Tamaño:: 1.6 MB
Formato:: Adobe Portable Document Format

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 3.62 KB
Formato:: Item-specific license agreed to upon submission
Descripción:

Descargar

Colecciones

Trabajos de fin de máster (TFM)

Publicación: Evaluación Comparativa de las Arquitecturas Mamba y Transformers

Archivos

Bloque original

Bloque de licencias

Colecciones

Publicación:
Evaluación Comparativa de las Arquitecturas Mamba y Transformers