Persona:
Cabaleiro Barciela, Bernardo

Cargando...
Foto de perfil
Dirección de correo electrónico
ORCID
Fecha de nacimiento
Proyectos de investigación
Unidades organizativas
Puesto de trabajo
Apellidos
Cabaleiro Barciela
Nombre de pila
Bernardo
Nombre

Resultados de la búsqueda

Mostrando 1 - 2 de 2
  • Publicación
    Propositional Knowledge: Acquisition and Application to Syntactic and Semantic Parsing
    (Universidad Nacional de Educación a Distancia (España). Escuela Internacional de Doctorado. Programa de Doctorado en Filosofía, 2017) Cabaleiro Barciela, Bernardo; Peñas Padilla, Anselmo
    La interpretación de lenguaje natural es uno de los retos centrales en el desarrollo de la inteligencia artificial. En general, la interpretación requiere construir un contexto de información implícita e implicada (a partir del conocimiento antecedente del emisor y el oyente) que permite recuperar la intención comunicativa del emisor. Las tareas de procesamiento de lenguaje natural son realizaciones concretas de nuestra habilidad humana para comprender y usar lenguaje, y por lo tanto a largo plazo tendremos que proveer capacidades completas de interpretación a las máquinas, empezando con el desarrollo de métodos para adquirir y usar conocimiento antecedente. En concreto, exploramos el uso de proposiciones como conocimiento antecedente y su utilidad para la interpretación del lenguaje. Las proposiciones codifican conocimiento en forma de aserciones utilizando lenguaje natural, y proporcionan una manera directa de expresar conocimiento sin restricciones de dominio. El conocimiento proposicional puede ser derivado directamente desde representaciones semánticas del texto, que a su vez pueden ser obtenidas automáticamente a partir de texto. De esta manera, se abre la posibilidad de conectar de manera directa la representación de un texto con el conocimiento necesario para su interpretación. En esta tesis, proponemos la adquisición automática de conocimiento proposicional desde grandes corpus cuyos documentos son representados como grafos. Las frecuencias de ocurrencia permiten expresar un sentido de plausibilidad. El almacén de proposiciones resultante supone un término medio entre representaciones semánticas y bases de conocimiento estructuradas. Esto abre nuevas líneas de investigación que abordamos en este trabajo. Por una parte, la conexión entre la representación semántica y los almacenes de proposiciones de manera que estos jueguen el papel del conocimiento antecedente que habilita una inferencia. Por otra parte, la correspondencia (mapping) entre los almacenes de proposiciones y las bases de conocimiento estructurado. Exploramos estas líneas de investigación con sendas tareas específicas relacionadas con la comprensión del lenguaje: el análisis sintáctico y el análisis semántico. Específicamente para análisis sintáctico, abordamos el problema de la corrección de aposiciones. Las aposiciones son estructuras gramaticales que se usan frecuentemente para expresar que una instancia pertenece a una clase semántica. Usamos conocimiento proposicional para medir la compatibilidad semántica entre entidades y tipos de entidad con clases semánticas. Posteriormente empleamos esta información para desambiguar casos donde hay varios candidatos gramaticalmente válidos para gobernar una aposición. Respecto al análisis semántico, construimos un diccionario que permite enlazar expresiones en lenguaje natural en forma de proposiciones con relaciones de una base de datos estructurada, y mostramos cómo utilizar este recurso en un sistema de búsqueda de respuestas (Question Answering). Adicionalmente, proponemos un método para evaluar el proceso de enlazado (grounding) y el efecto en la tarea que tiene el diccionario obtenido, independientemente del proceso de entrenamiento y cableado de consultas. El uso de conocimiento proposicional en inferencias textuales representa un nuevo paradigma para la interpretación del lenguaje. El objetivo es validar este paradigma y explorar desde él las principales áreas involucradas: representación semántica de los textos, adquisición de conocimiento antecedente y habilitación de inferencias textuales. Los resultados obtenidos muestran que los almacenes de proposiciones son un recurso general que permite abordar tareas muy dispares relacionadas con la interpretación del lenguaje, abriendo así nuevas y prometedoras líneas de investigación.
  • Publicación
    Knowledge capture and textual inference
    (Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2014-02-27) Cabaleiro Barciela, Bernardo; Peñas Padilla, Anselmo
    The present and future information needs of the society rely on the ability of computers to understand and manage knowledge. The lack of this mechanism explains the problems of knowledge driven systems to effectively perform tasks as question answering and machine reading. One of the biggest bottlenecks is the automatic knowledge acquisition problem. In the actual stage of development, it seems obvious that only semisupervised or unsupervised techniques can scale to deal with large corpora of natural language like the Web. The trend has evolved from populating a predefined ontology to expressing knowledge through either unconstrained relations or propositions. The arrival of new deep language processing technologies let us think that we can annotate large collections of text with accurate predicates that can be used to extracting knowledge from text without tying it to any predefined logical schema. On the other hand, it is not clear which tasks can harness this knowledge and how it can be done. This master’s thesis proposes a new method of knowledge capture and textual inference based on three cornerstones: (1) First, we develop a procedure to turn plain text into a graph based representation taking advantage of existing tools. (2) Second, we develop a proposition extraction system. (3) Lastly, we study an unsupervised method for correction of appositive dependencies, as an example of the textual inferences that the generated proposition store enables. In addition, we generate two useful resources for future tasks of natural language processing: A corpus of 7 million documents represented as semantically enriched graphs and a proposition store of semantic classes with 8 million instances of entity-class relations.