Persona:
García Serrano, Ana Mª

Cargando...
Foto de perfil
Dirección de correo electrónico
ORCID
0000-0003-0975-7205
Fecha de nacimiento
Proyectos de investigación
Unidades organizativas
Puesto de trabajo
Apellidos
García Serrano
Nombre de pila
Ana Mª
Nombre

Resultados de la búsqueda

Mostrando 1 - 2 de 2
  • Publicación
    Compendio sobre el foro de evaluación en español IberLEF2019
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos) García Serrano, Ana Mª
    Este resumen que intenta ser conciso y sustancial, es consecuencia de las aportaciones realizadas en una actividad de aprendizaje, en el marco de la asignatura “Semántica y pragmática en la web” del máster de Tecnologías de la Lengua de la UNED2, en el curso 2019-20, a partir del contenido disponible on-line3 del foro Iberian Languages Evaluation Forum IberLEF2019 (organizado en el marco de la SEPLN2019). IberLEF2019 es un foro de evaluación en el que se plantean retos o tareas competitivas de procesamiento de textos para las lenguas de la península ibérica (español, portugués, catalán, vasco y gallego). Este foro de evaluación está organizado a modo de competición entre los sistemas participantes que asumen un mismo reto, esto es la realización de una tarea o resolución de un problema con los mismos datos y en el mismo escenario. Los organizadores del reto deben aportar un dataset o corpus, definir el reto o tarea a resolver, indicar las medidas de evaluación de los resultados para que estos puedan ser comparados y en ocasiones se encargan del repositorio de reproducibilidad de los sistemas participantes con las diferentes aproximaciones. IberLEF 2019 ha consistido en las nueve líneas de trabajo o retos siguientes: descubrimiento de conocimiento en salud (eHealth-KD), análisis de eventualidad y clasificación (FACT), análisis de humor basado en anotaciones humanas (HAHA), detección de ironía en variantes del castellano (IroSvA), negación en castellano (NEGES), reconocimiento de entidades nombradas y extracción de relaciones en portugués (NER Portugués), detección de autoría y agresividad en Twitter para la variante del español en México (MEX-A3T), análisis de sentimiento (TASS) y anonimización de documentos médicos (MEDDOCAN).
  • Publicación
    A refinement of the well-founded Information Content models with a very detailed experimental survey on WordNet.
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos) Lastra-Díaz, Juan J.; García Serrano, Ana Mª
    In a recent paper, we introduce a new family of Information Content (IC) models based on the estimation of the conditional probability between child and parent concepts. This work is encouraged by the nding of two drawbacks in the computational method of our aforementioned family of IC models, as well as other two gaps in the literature. First gap is that two of our cognitive IC models do not satisfy the axiom that constrains the sum of probabilities on the leaf nodes to be 1, whilst some ontologies with multiple inheritance could prevent the IC model satisfying the growing monotonicity axiom in concepts with multiple parents. Second gap is the lack of a complete and updated experimental survey including a pairwise statistical signi cance analysis between most IC models and ontology-based similarity measures. Finally a third gap is the lack of replication and con rmation of previous methods and results in most works. The latest two gaps are especially signi cant in the current state of the problem, in which there is no convincing winner within the family of intrinsic IC-based similarity measures and the performance margin is very narrow. In order to bridge the aforementioned gaps, this paper introduces the following contributions: (1) a re nement of our recent family of well-founded Information Content (IC) models; (2) eight new intrinsic IC models and one new corpus-based IC model; and (3) a very detailed experimental survey of ontology-based similarity measures and Information Content (IC) models on WordNet, including the evaluation and statistical signi cance analysis on the ve most signi cant datasets of most ontology-based similarity measures and all WordNet-based IC models reported in the literature, with the only exception of the IC models recently introduced by Harispe et al. (2015a) and Ben Aouicha et al. (2016b). The evaluation is entirely based on a Java software library called HESML which has been developed by the authors in order to replicate all methods evaluated herein. The new IC models obtain rivaling results as regard the state-of-the-art methods and improve our previous mod- els, whilst the experimental survey allows a detailed and conclusive image of the state of the problem to be drawn by setting the new state of the art and quantifying the main achievements of the last three decades.