Persona:
Pérez Cabello de Alba, María Beatriz

Cargando...
Foto de perfil
Dirección de correo electrónico
ORCID
0000-0003-0477-6917
Fecha de nacimiento
Proyectos de investigación
Unidades organizativas
Puesto de trabajo
Apellidos
Pérez Cabello de Alba
Nombre de pila
María Beatriz
Nombre

Resultados de la búsqueda

Mostrando 1 - 2 de 2
  • Publicación
    Revisión de métodos para la desambiguación léxica automáticaaprendizaje automático y medidas de relación y similitud semánticas
    (Pontificia Universidad Católica de Chile, 2024) Núñez Torres, Fredy; Pérez Cabello de Alba, María Beatriz
    Dentro de las posibles soluciones para la desambiguación léxica automática en tareas del procesamiento del lenguaje natural encontramos los métodos basados en algoritmos de aprendizaje automático, en medidas de relación semántica y en medidas de similitud se-mántica. Mientras los métodos de aprendizaje automático utilizan fuentes endógenas de conocimiento, las medidas de relación y similitud semánticas recurren a fuentes exógenas de conocimiento, como son las glosas de las definiciones de un recurso lexicográfico, o una ontología o tesauro, que provee relaciones léxicas de significado en el marco de una jerarquía conceptual. En este trabajo presentamos y analizamos los distintos tipos de métodos para la desambiguación léxica automática divididos en cuatro grupos: basados en algoritmos de aprendizaje automático, basados en medidas de relación semántica, basados en medidas de similitud semánticas y basados en medidas híbridas. Se propone que la ventaja de los métodos basados en medidas de relación y similitud radica en el hecho de que sus resultados no se derivan únicamente de la eficiencia estadística, sino que se tiene en cuenta el conocimiento lingüístico dentro de los parámetros que conforman cada medida utilizada.
  • Publicación
    Desarrollo de un sistema de aprendizaje automático supervisado para la desambiguación léxica automática utilizando DAMIEN (Data Mining Encountered)
    (Asociación Española de Lingüística Aplicada, AESLA, 2022-12) Núñez Torres, Fredy; Pérez Cabello de Alba, María Beatriz
    Uno de los mayores desafíos que se nos presentan a la hora de acometer tareas relacionadas con el procesamiento del lenguaje natural y, en particular, con el tratamiento de recursos lingüísticos informatizados, es la ambigüedad léxica. En este trabajo abordamos el tratamiento de la desambiguación léxica dentro del entorno informático DAMIEN (Data Mining ENcountered), una herramienta que integra técnicas de múltiples disciplinas dentro de análisis de texto (i.e. lingüística de corpus, estadística y minería textual) para ayudar en tareas de investigación lingüística (i.e. recolección de datos, extracción de información, clasificación de textos, entre otras). A modo de experimento ilustrativo, llevamos a cabo un estudio de las unidades léxicas polisémicas “cabeza”, “cara” y “carta”, y presentamos los resultados del sistema de desambiguación automática desarrollado con la herramienta DAMIEN. Dentro de los modelos que ofrece el entorno, hemos elegido el método de aprendizaje automático supervisado mediante algoritmo bayesiano ingenuo por tratarse del método que mejores resultados ha dado para la desambiguación léxica automática. Se trata de un modelo matemático que consiste en extraer información de un corpus a partir de conjuntos de datos previamente etiquetados (corpus de entrenamiento) para que la máquina pueda clasificar automáticamente conjuntos de datos nuevos (corpus de prueba). Es importante resaltar la flexibilidad y riqueza del entorno DAMIEN tanto para el tratamiento de recursos lingüísticos informatizados como para el montaje de experimentos del procesamiento del lenguaje natural.