Persona:
García Serrano, Ana Mª

Cargando...
Foto de perfil
Dirección de correo electrónico
ORCID
0000-0003-0975-7205
Fecha de nacimiento
Proyectos de investigación
Unidades organizativas
Puesto de trabajo
Apellidos
García Serrano
Nombre de pila
Ana Mª
Nombre

Resultados de la búsqueda

Mostrando 1 - 4 de 4
  • Publicación
    Compendio sobre el foro de evaluación en español IberLEF2019
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos) García Serrano, Ana Mª
    Este resumen que intenta ser conciso y sustancial, es consecuencia de las aportaciones realizadas en una actividad de aprendizaje, en el marco de la asignatura “Semántica y pragmática en la web” del máster de Tecnologías de la Lengua de la UNED2, en el curso 2019-20, a partir del contenido disponible on-line3 del foro Iberian Languages Evaluation Forum IberLEF2019 (organizado en el marco de la SEPLN2019). IberLEF2019 es un foro de evaluación en el que se plantean retos o tareas competitivas de procesamiento de textos para las lenguas de la península ibérica (español, portugués, catalán, vasco y gallego). Este foro de evaluación está organizado a modo de competición entre los sistemas participantes que asumen un mismo reto, esto es la realización de una tarea o resolución de un problema con los mismos datos y en el mismo escenario. Los organizadores del reto deben aportar un dataset o corpus, definir el reto o tarea a resolver, indicar las medidas de evaluación de los resultados para que estos puedan ser comparados y en ocasiones se encargan del repositorio de reproducibilidad de los sistemas participantes con las diferentes aproximaciones. IberLEF 2019 ha consistido en las nueve líneas de trabajo o retos siguientes: descubrimiento de conocimiento en salud (eHealth-KD), análisis de eventualidad y clasificación (FACT), análisis de humor basado en anotaciones humanas (HAHA), detección de ironía en variantes del castellano (IroSvA), negación en castellano (NEGES), reconocimiento de entidades nombradas y extracción de relaciones en portugués (NER Portugués), detección de autoría y agresividad en Twitter para la variante del español en México (MEX-A3T), análisis de sentimiento (TASS) y anonimización de documentos médicos (MEDDOCAN).
  • Publicación
    A refinement of the well-founded Information Content models with a very detailed experimental survey on WordNet.
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos) Lastra-Díaz, Juan J.; García Serrano, Ana Mª
    In a recent paper, we introduce a new family of Information Content (IC) models based on the estimation of the conditional probability between child and parent concepts. This work is encouraged by the nding of two drawbacks in the computational method of our aforementioned family of IC models, as well as other two gaps in the literature. First gap is that two of our cognitive IC models do not satisfy the axiom that constrains the sum of probabilities on the leaf nodes to be 1, whilst some ontologies with multiple inheritance could prevent the IC model satisfying the growing monotonicity axiom in concepts with multiple parents. Second gap is the lack of a complete and updated experimental survey including a pairwise statistical signi cance analysis between most IC models and ontology-based similarity measures. Finally a third gap is the lack of replication and con rmation of previous methods and results in most works. The latest two gaps are especially signi cant in the current state of the problem, in which there is no convincing winner within the family of intrinsic IC-based similarity measures and the performance margin is very narrow. In order to bridge the aforementioned gaps, this paper introduces the following contributions: (1) a re nement of our recent family of well-founded Information Content (IC) models; (2) eight new intrinsic IC models and one new corpus-based IC model; and (3) a very detailed experimental survey of ontology-based similarity measures and Information Content (IC) models on WordNet, including the evaluation and statistical signi cance analysis on the ve most signi cant datasets of most ontology-based similarity measures and all WordNet-based IC models reported in the literature, with the only exception of the IC models recently introduced by Harispe et al. (2015a) and Ben Aouicha et al. (2016b). The evaluation is entirely based on a Java software library called HESML which has been developed by the authors in order to replicate all methods evaluated herein. The new IC models obtain rivaling results as regard the state-of-the-art methods and improve our previous mod- els, whilst the experimental survey allows a detailed and conclusive image of the state of the problem to be drawn by setting the new state of the art and quantifying the main achievements of the last three decades.
  • Publicación
    Simplificación léxica en español con aproximaciones basadas en modelos de IA: experimentos y resultados
    (2024) Sixto Cesteros, Juan; García Serrano, Ana Mª
    En este artículo se aborda el problema de la simplificación automática de textos en español, con el propósito de transformar documentos de texto en versiones que faciliten su comprensión a diferentes tipos de usuarios. La investigación se desarrolla afrontando la tarea de generación de sustitutos y su clasificación a través de herramientas recientes en el ámbito del aprendizaje automático profundo o modelos de Inteligencia Artificial (IA). La propuesta se realiza en el marco de la tarea TSAR2022, diseñando e implementando varias aproximaciones con modelos GPT disponibles y explorando nuevas opciones de parametrización e ingeniería de instrucciones. Finalmente, se concluye con un análisis de los resultados obtenidos de las diversas aproximaciones en español, cuyos resultados superan a los presentados.
  • Publicación
    Linked data-based conceptual modelling for recommendation : a FCA-based approach
    (2014-09-01) Castellanos, A.; Cigarrán Recuero, Juan Manuel; García Serrano, Ana Mª
    In a recommendation task it is crucial to have an accurate content-based description of the users and the items consumed by them. Linked Open Data (LOD) has been demonstrated as one of the best ways of obtaining this kind of content, given its huge amount of structured information. The main question is to know how useful the LOD information is in inferring user preferences and how to obtain it. In this context, we propose a novel approach for Content Modelling and Recommendation based on Formal Concept Analysis (FCA). The approach is based in the modelling of the user and content related information, enriched with Linked Open Data, and in a new algorithm, to analyze the models and recommend new content. The framework provided by the ESWC 2014 Recommendation Challenge is used for the evaluation of the proposal. The results are within the average range of other participants, so the suitability of FCA for this scenario seems to be addressed. Nevertheless, further work has to be carried out in order to propose a refined approach for the management of LOD information.