Publicación:
Infraestructura para la automatización y procesamiento de datos de actividades físicas en Google Cloud

dc.contributor.advisorSantos, Olga C.
dc.contributor.authorAvendaño Palacios, Carlos
dc.date.accessioned2025-07-04T11:50:27Z
dc.date.available2025-07-04T11:50:27Z
dc.date.issued2025-06
dc.description.abstractEn la actualidad, tanto en el ámbito empresarial como en el científico, es cada vez más común enfrentarse a escenarios y situaciones caracterizadas por un crecimiento exponencial tanto en la generación como en la disponibilidad de datos. Este fenómeno, conocido como Big Data, se define por sus tres principales características: volumen, velocidad y variedad. Estas dimensiones exceden las capacidades de las tecnologías tradicionales de procesamiento y análisis de datos, haciendo necesario el empleo de nuevas arquitecturas y herramientas especializadas. A medida que aumenta dicha complejidad y cantidad de los datos, también se incrementa la necesidad de extraer valor e información útil de ellos, así como de facilitar su acceso e interpretación por parte de usuarios con distintos niveles de conocimientos técnicos, buscando la democratización del acceso al dato. Este Trabajo de Fin de Máster (TFM) propone y evalúa una arquitectura en Google Cloud Platform (GCP) para automatizar el procesamiento, análisis y visualización de datos inerciales orientados a modelar habilidades psicomotoras en entornos deportivos. A partir de datos previamente capturados mediante sensores, se ha implementado un pipeline completo desde la ingesta (utilizando Cloud Functions y Cloud Storage) hasta la capa analítica (con BigQuery, Dataform y Looker), integrando también funcionalidades de machine learning (ML) y generación de contenido con inteligencia artificial (IA) generativa a través de instrucciones en lenguaje natural. Se muestra cómo GCP no solo es una solución técnica eficaz por su escalabilidad y rendimiento, sino que ofrece un enfoque serverless que minimiza el mantenimiento y reduce costes. Uno de los aspectos más relevantes del proyecto es su orientación hacia la democratización del dato, permitiendo que tanto usuarios técnicos como no técnicos puedan beneficiarse de un entorno cloud potente y flexible, pudiendo explorar el dato de forma sencilla en Looker, crear modelos de Machine Learning en pocos pasos y sin necesidad de conocimientos previos, o creando tablas en Bigquery simplemente subiendo archivos locales; además de la automatización del proceso que limita la dependencia de usuarios técnicos o gestiones manuales. La arquitectura propuesta es fácilmente reproducible para iniciativas de ciencia de datos en contextos tanto empresariales como científicos, ya que se incluye un repositorio de Github con ficheros y videos de documentación, además de un anexo con capturas de las principales configuraciones realizadas; ya que el enfoque e interés de este trabajo es eminentemente práctico, basado en mostrar cómo se puede configurar este entorno de forma sencilla y escalable.es
dc.description.abstractIn both the business and scientific domains, it is increasingly common to encounter scenarios marked by an exponential growth in the generation and availability of data. This phenomenon, known as Big Data, is characterized by three main attributes: volume, velocity, and variety. These dimensions surpass the capabilities of traditional data processing and analysis technologies, making it essential to adopt new architectures and specialized tools. As the complexity and quantity of data increase, so does the need to extract valuable insights and actionable information, while also enabling broad and equitable access to data interpretation across users with varying levels of technical expertise—pursuing the democratization of data access. This Master’s Thesis proposes and evaluates an architecture based on Google Cloud Platform (GCP) aimed at automating the processing, analysis, and visualization of inertial data for modeling psychomotor skills in sports environments. Using sensor-captured data, a complete pipeline has been implemented—from ingestion (via Cloud Functions and Cloud Storage) to the analytical layer (with BigQuery, Dataform, and Looker)—also incorporating advanced functionalities such as machine learning (ML) and generative AI, which enables content creation through natural language instructions. The work demonstrates that GCP is not only a technically efficient solution due to its scalability and performance, but also provides a serverless approach that minimizes maintenance and reduces operational costs. A key strength of this project lies in its focus on data democratization, allowing both technical and non-technical users to benefit from a powerful and flexible cloud environment. Users can explore data intuitively in Looker, create machine learning models in just a few steps without prior expertise, or generate BigQuery tables simply by uploading local files—while automation across the process minimizes reliance on technical staff or manual interventions. The proposed architecture is easily reproducible for data science initiatives in both business and scientific contexts, since a Github repository with documentation files and videos is included, as well as an annex with screenshots of the main configurations made; since the focus and interest of this work is eminently practical, based on showing how this environment can be configured in a simple and scalable way.en
dc.identifier.citationAvendaño Palacios, Carlos. Trabajo fin de Máster: Infraestructura para la automatización y procesamiento de datos de actividades físicas en Google Cloud. Universidad Nacional de Educación a Distancia (UNED) 2025
dc.identifier.urihttps://hdl.handle.net/20.500.14468/27008
dc.language.isoes
dc.publisherUniversidad Nacional de Educación a Distancia (UNED). E.T.S. de Ingeniería Informática
dc.relation.centerE.T.S. de Ingeniería Informática
dc.relation.degreeMáster universitario en Ingeniería y Ciencia de Datos
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.uriAtribución-NoComercial-SinDerivadas 4.0 Internacional
dc.subject1203.17 Informática
dc.subject.keywordsActividades físicas,es
dc.subject.keywordsAikido,es
dc.subject.keywordsAutoMLes
dc.subject.keywordsAutomatizaciónes
dc.subject.keywordsBIes
dc.subject.keywordsBigQueryes
dc.subject.keywordsBokkenes
dc.subject.keywordsBusiness Intelligencees
dc.subject.keywordsCloud Functionses
dc.subject.keywordsDataformes
dc.subject.keywordsDemocratización del datoes
dc.subject.keywordsExpertisees
dc.subject.keywordsGCPes
dc.subject.keywordsGoogle Cloud Platformes
dc.subject.keywordsIA generativaes
dc.subject.keywordsGenAIes
dc.subject.keywordsLookeres
dc.subject.keywordsMachine Learninges
dc.subject.keywordsProcesamientoes
dc.subject.keywordsProcesamiento en la nubees
dc.subject.keywordsSensores inercialeses
dc.subject.keywordsShikkoes
dc.subject.keywordsVertex AIes
dc.subject.keywordsPhysical activitiesen
dc.subject.keywordsAutomationen
dc.subject.keywordsData democratizationen
dc.subject.keywordsProcessingen
dc.subject.keywordsCloud-based processing,en
dc.subject.keywordsInertial sensorsen
dc.titleInfraestructura para la automatización y procesamiento de datos de actividades físicas en Google Cloudes
dc.typetesis de maestríaes
dc.typemaster thesisen
dspace.entity.typePublication
Archivos
Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
AvendañoPalacios_Carlos_TFM_JORGE PEREZ MARTIN.pdf
Tamaño:
4.74 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.62 KB
Formato:
Item-specific license agreed to upon submission
Descripción: