Logotipo del repositorio
  • English
  • Español
  • Français
  • Iniciar sesión
    Identificación habilitada exclusivamente para personal de Biblioteca.
    ¿Has olvidado tu contraseña?
Logotipo del repositorio
  • Colecciones
  • Filtrar búsqueda
  • Depositar
  • English
  • Español
  • Français
  • Iniciar sesión
    Identificación habilitada exclusivamente para personal de Biblioteca.
    ¿Has olvidado tu contraseña?
  1. Inicio
  2. Buscar por autor

Examinando por Autor "Fresno Fernández, Víctor Diego"

Mostrando 1 - 20 de 20
Resultados por página
Opciones de ordenación
  • Cargando...
    Miniatura
    Publicación
    An improved fuzzy system for representing web pages in clustering tasks
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2012-10-23) Pérez García-Plaza, Alberto; Fresno Fernández, Víctor Diego; Martínez Unanue, Raquel
    Keeping information organized is an important issue to make information access easier. Although the information we need is sometimes available on the Web, this information is only useful if we have the ability to find it. With this aim, it is increasingly frequent to use automatic techniques for grouping documents. In this thesis we are interested in document clustering, that is, grouping doc- uments based on the similarity of their contents. In this regard, document repre- sentation plays a very important role in web page clustering and constitutes the central point of research of this dissertation. Web pages are commonly written in HTML language, that offers explicit information (tags, in this case) about their visual representation, the typography of the text or its structure, among others. It is also a widely used format on the Internet. The main goal of this thesis is to perform a deep study with the aim of making the most of a fuzzy model to represent HTML documents for clustering tasks. Our study deals with the idea of discovering whether any part of the system could be exploited in a different way to improve clustering results. We begin our work analyzing the parts of the system where there is room for improvement and then we study different alternatives to do so. Thereby, we do not propose a document representation from the beginning, but we build it trying to understand its different parts during each step. To evaluate our results and compare the different representation proposals, we use different web page collections previously gathered to be used as gold stan- dards. Clustering is performed by using state-of-the-art algorithms and our pro- posals are validated in environments of plain and hierarchical clustering. Lastly, we also test the usefulness of our approaches in two languages: English and Spanish
  • Cargando...
    Miniatura
    Publicación
    Aproximación al análisis pragmático en redes sociales mediante el uso de técnicas de enmarcado y Transformers
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2021-10-01) Álvarez Prieto, Raul; Fresno Fernández, Víctor Diego
    El objetivo de este proyecto de investigación es avanzar en el campo del Procesamiento del Lenguaje Natural (PNL) y el análisis pragmático mediante el uso de la teoría de marcos y Transformers (BERT en nuestro caso). Sobre la base de algunas características de los modelos de inserción de palabras, escalado de texto, análisis de sentimientos y vectores de pensamiento, argumentamos que los marcos cognitivos son una herramienta útil en PLN para el estudio de construcciones culturales, sociales y psicológicas, en particular también los rasgos políticos y mentales. Al igual que los embeddings representan relaciones semánticas entre palabras como relaciones entre vectores en un espacio de alta dimensión, argumentamos que los embeddings basados en marcos nos permiten reducir la complejidad de la mente humana al ubicar los marcos utilizados por una entidad (persona, grupo, texto) en un espacio vectorial multidimensional definido en términos de marcos.
  • Cargando...
    Miniatura
    Publicación
    Automatic Categorization of Electronic Health Records
    (Universidad Nacional de Educación a Distancia (España). Escuela Internacional de Doctorado. Programa de Doctorado en Sistemas Inteligentes, 2021) Almagro Cádiz, Mario; Martínez Unanue, Raquel; Fresno Fernández, Víctor Diego
  • Cargando...
    Miniatura
    Publicación
    Búsqueda de Respuestas en foros usando modelos basados en Transformers
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2022-03-11) Lasheras Navas, Javier; Fresno Fernández, Víctor Diego; Rodrigo Yuste, Álvaro
    Durante los últimos años se ha hecho más necesaria la búsqueda de información en internet. Debido a dicha necesidad, se han creado sitios web donde los usuarios tratan de ayudar a otros usuarios contestando sus preguntas. Estos sitios se llaman foros de respuesta colaborativa. Esto ha generado un problema: muchas de las preguntas que se plantean ya se han respondido previamente y es deseable poder recuperar respuestas a preguntas similares. Es por ello por lo que surgió la tarea de Community Question Answering (CQA), buscando permitir un acceso más cómodo a la información publicada en estos sitios web. Dentro de esta tarea han surgido varias subtareas y en este trabajo se aborda una de la más recurrentes: Dada una pregunta y un conjunto de respuestas, encontrar las respuestas que mejor encajan con la pregunta. Para ello se usarán técnicas de Deep Learning, y más en particular una nueva arquitectura de redes neuronales, los Transformers, que utilizan los mecanismos de atención. Mediante dicha técnica se ha intentado clasificar y ordenar las respuestas de distintos foros en función de la pregunta formulada. Se ha probado su validez en función de 3 colecciones distintas: SemEval 2015, 2017 y AmazonQA. Se ha concluido que los resultados extraídos con este tipo de métodos permiten superar los resultados anteriores, abriendo la posibilidad hacia una mayor implantación de estas tecnologías en sistemas reales.
  • Cargando...
    Miniatura
    Publicación
    Detection of toxicity in social media. A study on semantic orientation and linguistic structure
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2022-09-01) Nogués Graell, Jordina; Fresno Fernández, Víctor Diego
    Las redes sociales han crecido mucho en popularidad recientemente y esto ha permitido a los usuarios estar conectados con sus amigos y familiares, además de permitirles encontrar nuevos contactos tanto en el área personal como en la académica o personal. No cabe duda de que los beneficios de las redes sociales durante la pandemia de COVID-19 fueron increíbles, ya que permitieron un entorno virtual para encuentros sociales. Sin embargo, las redes sociales tienen una cara oscura que se muestra en forma de contenido tóxico. Esta toxicidad que está presente en muchas redes sociales ha alarmado tanto a los usuarios como a los investigadores y las compañías y por ello se ha dado un incremento en los estudios y trabajos relacionados con la detección y prevención de la toxicidad en las redes sociales. Aunque no es fácil de describir qué se entiendo por tóxico, la comunidad científica ha trabajado según su propio entendimiento de lo que abarca el término o según sus necesidades a cubrir para definir lo que se entiende por tóxico y qué formas de contenido tóxico existen en línea, además de cómo detectar la toxicidad utilizando diferentes aproximaciones de machine learning. Este trabajo se basa en la detección de toxicidad en las redes sociales y se centra en el uso del sesgo en la orientación semántica y la estructura lingüística de los mensajes para detectar contenido tóxico. En concreto, nos basamos en el término anisotropía: el significado de los vectores de palabras se distribuye según una orientación particular en el espacio semántico. Por ello, utilizamos embeddings estáticos (Static Word Emgeddings), ya que permiten mantener las propiedades semánticas del significado de las palabras que representan. Siguiendo esta idea hemos realizado varios experimentos en proximidad vectorial y proximidad de orientación para determinar y predecir contenido tóxico. El segundo pilar de este trabajo se basa en explorar si la estructura lingüística influencia la detección de contenido tóxico. Es decir, si hay categorías gramaticales o estructuras lingüísticas que tienen un impacto en la detección de la toxicidad y cómo se pueden crear vectores de frase mediante composición para abordar este mismo proceso a nivel de frases. Para ello, hemos realizado iv diferentes experimentos para demostrar qué estructura lingüística era más relevante para tener en cuenta. A nivel de palabra, hemos seleccionado los sustantivos, además de excluir las stopwords (ya que presentan sesgos inherentes en la orientación semántica); a nivel de frase, hemos compuesto los vectores de las palabras de manera linear utilizando una función de promedio general (global average), que nos ha permitido calcular el vector promedio de los vectores de las palabras que componen la frase para obtener el vector de la frase. Los resultados obtenidos de esta investigación nos han permitido afirmar que el contenido tóxico presenta una orientación direccional en el espacio semántico, además de permitirnos demostrar que la estructura lingüística también juega un papel relevante en este tipo de contenido.
  • Cargando...
    Miniatura
    Publicación
    DISCO PAL: Diachronic Spanish sonnet corpus with psychological and affective labels
    (Springer, 2021-10-13) Barbado, Alberto; Fresno Fernández, Víctor Diego; Manjarrés Riesco, Ángeles; Ros Muñoz, Salvador
    Nowadays, there are many applications of text mining over corpora from different languages. However, most of them are based on texts in prose, lacking applications that work with poetry texts. An example of an application of text mining in poetry is the usage of features derived from their individual words in order to capture the lexical, sublexical and interlexical meaning, and infer the General Affective Meaning (GAM) of the text. However, even though this proposal has been proved as useful for poetry in some languages, there is a lack of studies for both Spanish poetry and for highly-structured poetic compositions such as sonnets. This article presents a study over an annotated corpus of Spanish sonnets, in order to analyse if it is possible to build features from their individual words for predicting their GAM. The purpose of this is to model sonnets at an affective level. The article also analyses the relationship between the GAM of the sonnets and the content itself. For this, we consider the content from a psychological perspective, dentifying with tags when a sonnet is related to a specific term. Then, we study how GAM changes according to each of those psychological terms. The corpus used contains 274 Spanish sonnets from authors of different centuries, from fifteenth to nineteenth. This corpus was annotated by different domain experts. The experts annotated the poems with affective and lexico-semantic features, as well as with domain concepts that belong to psychology. Thanks to this, the corpus of sonnets can be used in different applications, such as poetry recommender systems, per- sonality text mining studies of the authors, or the usage of poetry for therapeutic purposes.
  • Cargando...
    Miniatura
    Publicación
    Diseño de un "datastore" sobre datos académicos de la UNED y su enriquecimiento vía Minería de Textos desde el corpus de Guías Docentes
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial, 2017-07-07) Arancón del Valle, Carlos; Fernández Vindel, José Luis; Fresno Fernández, Víctor Diego
    Este Trabajo de Fin de Máster se concibe bajo el desarrollo en tres etapas diferenciadas, con alcances distintos: 1. El diseño e implementación de un datastore RDF funcional, poblado con datos académicos de la UNED y sobre el que se puedan ejecutar consultas complejas. 2. La recopilación automática de recursos documentales referenciados en ese datastore, generando un corpus sobre el cual se realizará la extracción de información de interés desde estas fuentes no estructuradas, y su posterior estructuración e integración de vuelta en el datastore inicial. 3. Una reflexión sobre los vocabularios usados en esta experiencia y su alineamiento con ontologías más generales aplicables a los agentes, recursos y procesos académicos en la universidad. En la sección 3.1 se presenta la primera etapa con una prueba de concepto, muy guiada por las vistas públicas de los datos UNED a nuestro alcance, cuyas clases y relaciones se trasladan al modelo RDF. Se configura así un datastore exhaustivamente poblado: con todos los datos sobre estructura, personal y oferta académica de la UNED, con sus interrelaciones. La institución no dispone, hasta la fecha, de un punto público de consulta similar. A partir de este desarrollo, en la sección 3.2 se plantea el objetivo básico de investigación de este trabajo: el diseño y evaluación de funciones de extracción terminológica (para fines específicos) en el corpus de Guías de Estudio referenciadas desde el datastore. El datastore de partida contiene referencias a recursos que pueden ser automáticamente recuperados y analizados mediante técnicas de Minería de Datos, con las que llevar a cabo una extracción terminológica que desemboque en nueva información con la que enriquecer el datastore. Finalmente, el enriquecimiento del datastore con estos términos requería una mínima ampliación de los vocabularios iniciales, que además conviene alinear con ontologías externas para facilitar su uso. Esta revisión se produce en la sección 3.3, donde se configura una tercera etapa en la que se inicia una discusión integrada de ontologías relevantes para describir los procesos universitarios. Por acotación temporal se asume como un objetivo secundario, así como una descripción ampliada de trabajos futuros.
  • Cargando...
    Miniatura
    Publicación
    Eigenclusters for predicting users preferences
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial, 2019-09-25) Corral Bondia, Pedro José; Fresno Fernández, Víctor Diego; Centeno Sánchez, Roberto
  • Cargando...
    Miniatura
    Publicación
    Embedding Meaning Algebra into Distributional Semantics
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2023-09-24) Alonso Viñas, Carlos; Amigo Cabrera, Enrique; Fresno Fernández, Víctor Diego
    The field of distributional semantics has seen significant progress in recent years due to advancements in natural language processing techniques, particularly through the development of Neural Language Models like GPT and BERT. However, there are still challenges to overcome in terms of semantic representation, particularly in the lack of coherence and consistency in existing representation systems. This work introduces a framework defining the relationship between a probabilistic space, a set of meanings, and a vector space of static embedding representations; and establishes formal properties based on definitions that would be desirable for any distributional representation system to comply with in order to establish a common ground between distributional semantics and other approaches. This work also introduces an evaluation benchmark, defined on the basis of the formal properties introduced, which will allow to measure the quality of a representation system.
  • Cargando...
    Miniatura
    Publicación
    Enlazado de tuits con entidades
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial., 2014-09-24) Castro Barmina, Rafael; Martínez Unanue, Raquel; Fresno Fernández, Víctor Diego
    El enriquecimiento de textos con informacion relevante es hoy una tecnica fundamental para mejorar la calidad de muchas actividades de analisis de textos. Una manera de extraer informacion a partir de texto no estructurado es enriquecerlo con informacion relevante. En este trabajo se realiza un estudio del problema de enlazado de entidades en el contexto de los tuits y se hace una propuesta de un pipeline para el enlazado de tuits con entidades extradas desde Wikipedia.
  • Cargando...
    Miniatura
    Publicación
    Estudio de mejoras a la estimación de preferencias de usuario en sistemas de valoración online
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial, 2021-09-01) Konomi Pilkati, Manuel; Fresno Fernández, Víctor Diego; Centeno Sánchez, Roberto
    Este trabajo se centra en intentar encontrar un método de mejorar de la precisión en mecanismos de estimación de preferencias para usuarios de sistemas de reseñas online (ORS por sus siglas en inglés) utilizando exclusivamente los textos de los comentarios que dejan los usuarios en las propias reseñas. Para ello se intenta particularizar la elección de mecanismo de análisis de polaridad (MPC) que determina la estimación de preferencias de cada usuario en tiempo de ejecución. La elección del mecanismo MPC utilizado con cada usuario del sistema se realiza en base a información adicional extraída de los comentarios mediante técnicas de modelamiento de textos.
  • Cargando...
    Miniatura
    Publicación
    Estudio del orden de composición en el marco teórico ICDS: propuesta de orden para oraciones simples
    (Universidad de Educación a Distancia (UNED), 2024-06) Vázquez García, Carmen; Fresno Fernández, Víctor Diego
    En el ámbito del procesamiento del lenguaje natural (PLN), la representación del significado textual es un problema fundamental que implica codificar el lenguaje natural de manera que pueda ser manejado eficazmente por los sistemas de gestión de información. Esta investigación presenta una exploración integral de la semántica distribucional composicional basada en la teoría de la información (ICDS), un marco que tiene como objetivo integrar los principios de la hipótesis distribucional y el principio de composicionalidad. El objetivo es cerrar la brecha entre el espacio de representación y la teoría de la información, proporcionando restricciones formales para las funciones de embedding, composición y similitud. Este trabajo plantea la incorporación del orden sintáctico en las representaciones semánticas dentro del marco ICDS. Esto se debe a que en este marco ya se ha expuesto que el orden influye en la representación semántica, por lo que se ha planteado una propuesta de orden basada en el orden sintáctico. A través de una revisión del estado del arte dentro del marco ICDS, pero desde una perspectiva lingüística, se ha planteado que el orden y la estructura inherentes en los elementos lingüísticos podrían influir significativamente en la representación semántica. Inicialmente, esta investigación se centra en oraciones simples para establecer un enfoque fundamental de representación semántica. Sin embargo, también se plantea la posibilidad de extender el marco para incluir oraciones subordinadas, que funcionan como sustantivos, adjetivos o adverbios dentro de las oraciones principales. Cada oración subordinada posee su propia estructura interna e interactúa jerárquicamente con la oración principal, por lo que el enfoque es extrapolable a otro tipo de oraciones más complejas. El propuesto basado en el orden enfatiza la importancia de la estructuración sintáctica en la mejora de la coherencia semántica. Al basar el método en cómo se codifican y representan los elementos lingüísticos, se busca desarrollar un modelo que capture las complejas relaciones dentro y entre las oraciones. Este enfoque no solo se alinea con la teoría lingüística, sino que también aborda los desafíos prácticos en el PLN. Los hallazgos de esta investigación destacan la naturaleza esencial del orden sintáctico en la representación semántica y proponen una metodología estructurada para integrar estos elementos dentro del marco ICDS.
  • Cargando...
    Miniatura
    Publicación
    Harnessing folksonomies for resource classification
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2011-07-12) Zubiaga Mendialdua, Arkaitz; Fresno Fernández, Víctor Diego; Martínez Unanue, Raquel
    En esta tesis abordamos el problema de la clasificación automática de recursos, una tarea cada vez más frecuente e importante en nuestra vida diaria. El catalogado de libros o la organización de vídeos, entre otros, representan algunos ejemplos de actividades para las que un proceso automático de clasificación resulta cada vez más frecuente, necesario e importante. Aprovechamos la información contenida en las anotaciones que realizan los usuarios de sistemas de etiquetado social, en los cuales se recogen numerosos metadatos que detallan el contenido de diferentes tipos de recursos. Hasta el momento, son pocos los trabajos que han explotado estos metadatos con este fin, y los pocos que lo han hecho se han limitado a realizar análisis estadísticos. En esta tesis exploramos las características de estos sistemas, de los usuarios involucrados en ellos, así como de las anotaciones que aportan, con el fin de sacar el máximo partido a estas grandes colecciones, obteniendo un rendimiento lo más preciso posible de los clasificadores automáticos de recursos.
  • Cargando...
    Miniatura
    Publicación
    Is Anisotropy Really the Cause of BERT Embeddings not being Semantic?
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial, 2022-09-01) Fuster Baggetto, Alejandro; Fresno Fernández, Víctor Diego
    We conduct a set of experiments aimed to improve our understanding of the lack of semantic isometry (correspondence between the embedding and meaning spaces) of contextual word embeddings of BERT. Our empirical results show that, contrary to popular belief, the anisotropy is not the root cause of the poor performance of these contextual models’ embeddings in semantic tasks. What does affect both anisotropy and semantic isometry are a set of biased tokens, that distort the space with non semantic information. For each bias category (frequency, subword, punctuation, and case), we measure its magnitude and the effect of its removal. We show that these biases contribute but not completely explain the anisotropy and lack of semantic isometry of these models. Therefore, we hypothesise that the finding of new biases will contribute to the objective of correcting the representation degradation problem. Finally, we propose a new similarity method aimed to smooth the negative effect of biased tokens in semantic isometry and to increase the explainability of semantic similarity scores. We conduct an in depth experimentation of this method, analysing its strengths and weaknesses and propose future applications for it.
  • Cargando...
    Miniatura
    Publicación
    Meaning aggregation functions
    (Universidad de Educación a Distancia (UNED), 2024-06-23) Lucas Pérez, Gadea; Amigo Cabrera, Enrique; Fresno Fernández, Víctor Diego
    In the contemporary landscape of artificial intelligence and computational linguistics, Natural Language Processing (NLP) systems play a crucial role in understanding, interpreting, and generating human language. This work addresses the significant challenge posed by the black-box nature of deep learning models and the complexity of natural language, particularly the issue of polysemy. To address this challenge, one promising avenue is the concept of semantic distributional representation, which maps texts into a multidimensional semantic space. This approach enhances the visibility and manipulability of linguistic representations. In this work we introduce two novel semantic functions, fspec(v1, v2) and fgen(v1, v2), designed to specialise and generalise the concepts encapsulated by word vectors, respectively. Our research involves defining these functions, characterising their properties, developing an evaluation benchmark, and conducting a comprehensive comparison of candidate functions. The results indicate that while the sum function is most effective for specialisation, polysemy remains a significant source of noise in both specialisation and generalisation tasks. We propose future research directions, including the exploration of multilingual datasets and more sophisticated models to handle polysemy. The advancements from this research hold practical implications for improving the accuracy and applicability of NLP systems in various domains.
  • Cargando...
    Miniatura
    Publicación
    Pedagogía poética en sistemas recomendadores afectivos para entornos de e-learning
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial, 2019-09-26) Barbado González, Alberto; Manjarrés Riesco, Ángeles; Fresno Fernández, Víctor Diego
    Los sistemas de recomendación (RecSys) para aplicaciones de e-learning han supuesto un gran desarrollo en la educación personalizada, ya que pueden adaptar y ajustar los contenidos y el ritmo pedagógico a las necesidades de cada estudiante. Esto puede mejorarse aún más cuando estos sistemas consideran no solo el nivel de conocimiento de los estudiantes, sino también el contexto afectivo en un momento dado. A pesar de esto, el enfoque tradicional que incluye el contexto afectivo dentro de un RecSys normalmente reduce su aplicación a detectar un conjunto de estados del usuario y ajustar el mismo contenido con esa información. Otras soluciones clásicas incluyen el uso de información afectiva para enviar algunos mensajes predefinidos para, por ejemplo, reforzar la motivación. Sin embargo, como se ha demostrado en estudios filosóficos, psicológicos y pedagógicos, las dimensiones humanas están todas entrelazadas, lo que significa que el proceso de aprendizaje no sólo debe reducirse a las dimensiones racional e intelectual, sino que también debe abordarse directamente desde las afectivas. Esto es algo que sostiene la corriente de la pedagogía poética, defendiendo que la poesía puede usarse como un método complementario a los procesos de aprendizaje tradicionales, ya que puede contribuir al aprendizaje de conceptos, valores... y la forma de lograrlo es a través de la conexión afectiva establecida entre el alumno y el poema. La presente memoria muestra una investigación y propuesta de cómo incluir la poesía pedagógica dentro de un RecSys. Inicialmente se revisa la estructura genérica de un RecSys afectivo. Con ello se indican posibles extensiones de algunas de las ontologías bien establecidas en el campo de los RecSys para incorporar la poesía pedagógica dentro de ellos con el objetivo de facilitar la interoperabilidad. Después de eso, la memoria analiza uno de los componentes principales que deben incluirse, el análisis automático de poesía con técnicas de procesamiento del lenguaje natural (NLP) para recomendar poesía personalizada a los estudiantes. Esto se hace considerando conjuntamente dos enfoques para generar las recomendaciones de cada poema, la información semántica y la afectiva. El primer enfoque estudia diferentes técnicas de representación semántica del texto que abarcan desde los enfoques tradicionales, basados en semántica distribucional, hasta las soluciones contextuales más recientes, como BERT. La investigación en esta área también incluye la exploración de técnicas de composición semántica de textos, abordando aproximaciones de combinación de representaciones vectoriales de términos aislados (word embeddings) para encontrar representaciones semánticas de fragmentos de texto más largos. El segundo enfoque incluye, a partir de un corpus público en el que se asignan diferentes valores afectivos a palabras individuales, investigar la posibilidad de combinar esa información a nivel de palabra dentro de rasgos genéricos a nivel de texto, para usarlos después y poder seleccionar poemas según el estado afectivo del estudiante en un momento dado. Toda la investigación se realiza para el caso de uso específico de sonetos en castellano de los últimos cinco siglos. La valoración de propuestas se analiza gracias un equipo de expertos en el dominio poético de la UNED (POSTDATA). Ellos proporcionarán anotaciones afectivas a nivel de texto completo para los sonetos. Esto servirá para ver la relación de las anotaciones supervisadas globales respecto a las resultantes de agregar el valor afectivo de las palabras individuales. Junto con ello se incluyen anotaciones para estudiar la posible correlación entre la información afectiva de los sonetos, determinados trastornos psicológicos y si coinciden con la recuperación semántica. También proporcionarán anotaciones para estudiar las distintas alternativas de funciones de composición semántica. Las propuestas también se analizan con usuarios reales durante la feria AULA en IFEMA (Madrid) en un taller llamado "Te receto un soneto" mediante el uso de un asistente virtual que actúa como un sistema de recuperación de información que recomienda poesía personalizada dado una consulta de texto de entrada.
  • Cargando...
    Miniatura
    Publicación
    Querying the Depths: Unveiling the Strengths and Struggles of Large Language Models in SPARQL Generation
    (Sociedad Española para el procesamiento del lenguaje natural, 2024) Ghajari Espinosa, Adrián; Ros Muñoz, Salvador; Pérez Pozo, Álvaro; Fresno Fernández, Víctor Diego
    In the quest to democratize access to databases and knowledge graphs, the ability to express queries in natural language and obtain the requested information becomes paramount, particularly for individuals lacking formal training in query languages. This situation affects SPARQL, the standard for querying ontology-based knowledge graphs, posing a significant barrier to many, hindering their ability to leverage these rich resources for research and analysis. To address this gap, our research delves into harnessing the power of Large Language Models (LLMs) to facilitate the generation of SPARQL queries directly from natural language descriptions. For this purpose, we have explored the most popular prompt engineering techniques, a powerful tool in crafting queries that help generative AI models understand and produce specific or generalized outputs based on the quality of provided prompts, without the need of aditional training. By integrating few-shot learning (FSL), Chain-of-Thought (CoT) reasoning, and Retrieval-Augmented Generation (RAG), we devise prompts that streamline the creation of effective SPARQL queries, facilitating more straightforward access to ontology knowledge graphs. Our analysis involved prompts evaluated across three distinct LLMs: DeepSeek-Code 6.7b, CodeLlama-13b and GPT 3.5 TURBO. The comparative results revealed marginal variations in accuracy among these models, with FSL emerging as the most effective technique. Our results highlight the potential of LLMs to make knowledge graphs more accessible to a broader audience, but also that much more research is needed to get results comparable to human performance.
  • Cargando...
    Miniatura
    Publicación
    Speech gestural interpretation by applying word representations in robotics
    (IOS Press, 2018-12-03) Almagro Cádiz, Mario; Paz López, Félix de la; Fresno Fernández, Víctor Diego
    Human-Robot Interaction (HRI) is a growing area of interest in Artificial Intelligence that aims to make interaction with robots more natural. In this sense, numerous research studies on verbal and visual interactions with robots have appeared. The present paper will focus on non-verbal communication and, more specifically, gestures related to speech, which is an open question. With the aim of developing this part of Human-Robot Interaction or HRI, a new architecture is proposed for the assignment of gestures to speech based on the analysis of semantic similarities. In this way, gestures will be intelligently selected using Natural Language Processing (NLP) techniques. The conditions for gesture selection will be determined from an assessment of the effectiveness of different language models in a lexical substitution task applied to gesture annotation. On the basis of this analysis, the aim is to compare models based on expert knowledge and statistical models generated from lexical learning.
  • Cargando...
    Miniatura
    Publicación
    Test-driving information theory-based compositional distributional semantics: A case study on Spanish song lyrics
    (ELSEVIER, 2025-06-15) Ghajari Espinosa, Adrián; Benito Santos, Alejandro; Ros Muñoz, Salvador; Fresno Fernández, Víctor Diego; González Blanco, Elena
    Song lyrics pose unique challenges for semantic similarity assessment due to their metaphorical language, structural patterns, and cultural nuances - characteristics that often challenge standard natural language processing (NLP) approaches. These challenges stem from a tension between compositional and distributional semantics: while lyrics follow compositional structures, their meaning depends heavily on context and interpretation. The Information Theory-based Compositional Distributional Semantics framework offers a principled approach by integrating information theory with compositional rules and distributional representations. We evaluate eight embedding models on Spanish song lyrics, including multilingual, monolingual contextual, and static embeddings. Results show that multilingual models consistently outperform monolingual alternatives, with the domain-adapted ALBERTI achieving the highest F1 macro scores (78.92 ± 10.86). Our analysis reveals that monolingual models generate highly anisotropic embedding spaces, significantly impacting performance with traditional metrics. The Information Contrast Model metric proves particularly effective, providing improvements up to 18.04 percentage points over cosine similarity. Additionally, composition functions maintaining longer accumulated vector norms consistently outperform standard averaging approaches. Our findings have important implications for NLP applications and challenge standard practices in similarity calculation, showing that effectiveness varies with both task nature and model characteristics.
  • Cargando...
    Miniatura
    Publicación
    Word Embeddings para la anotación automática de gestos aplicada a Nao
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial, 2017-03-06) Almagro Cádiz, Mario; Fresno Fernández, Víctor Diego; Paz López, Félix de la
    En los últimos años, la integración progresiva de la robótica de servicios en los hogares ha despertado el interés de la comunidad científica por las interacciones de tipo robot-humano. Estudios recientes han arrojado nuevas líneas de investigación en torno a la expresión emocional y la gesticulación de los robots humanoides. Una herramienta que facilite la integración de la comunicación gestual y la comunicación verbal supondría un gran avance para el diseño de comportamientos naturales. Con afán de mejorar la interfaz social en el ámbito robótico, este trabajo plantea una metodología para la anotación gestual ante textos abiertos, englobando tanto la tokenización de las palabras, como el etiquetado gramatical o POS tagging y el uso de word embeddings con el fin de aplicar criterios semánticos a la asignación gestual. Esta metodología ha sido trasladada a un algoritmo encapsulado en una aplicación web, accesible desde el dominio http: // trasgu. lsi. uned. es: 8080/ MotionTags . Para concluir este trabajo, se ha empleado dicho algoritmo en un cuento, disponible en el enlace https: // www. youtube. com/ embed/ lzViIUvNyJM? rel= 0& hl= es& cc_ lang_ pref= es& cc_ load_ policy= 1 , con el objetivo de realizar una breve demostración mediante un robot tipo Nao.
Enlaces de interés

Aviso legal

Política de privacidad

Política de cookies

Reclamaciones, sugerencias y felicitaciones

Recursos adicionales

Biblioteca UNED

Depósito de datos de investigación

Portal de investigación UNED

InvestigaUNED

Contacto

Teléfono: 913986562 / 6643 / 6633 / 8766

Correo: repositoriobiblioteca@adm.uned.es