Publicación: Diseño de un "datastore" sobre datos académicos de la UNED y su enriquecimiento vía Minería de Textos desde el corpus de Guías Docentes
Fecha
2017-07-07
Autores
Editor/a
Director/a
Tutor/a
Coordinador/a
Prologuista
Revisor/a
Ilustrador/a
Derechos de acceso
info:eu-repo/semantics/openAccess
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Resumen
Este Trabajo de Fin de Máster se concibe bajo el desarrollo en tres etapas diferenciadas, con alcances distintos: 1. El diseño e implementación de un datastore RDF funcional, poblado con datos académicos de la UNED y sobre el que se puedan ejecutar consultas complejas. 2. La recopilación automática de recursos documentales referenciados en ese datastore, generando un corpus sobre el cual se realizará la extracción de información de interés desde estas fuentes no estructuradas, y su posterior estructuración e integración de vuelta en el datastore inicial. 3. Una reflexión sobre los vocabularios usados en esta experiencia y su alineamiento con ontologías más generales aplicables a los agentes, recursos y procesos académicos en la universidad. En la sección 3.1 se presenta la primera etapa con una prueba de concepto, muy guiada por las vistas públicas de los datos UNED a nuestro alcance, cuyas clases y relaciones se trasladan al modelo RDF. Se configura así un datastore exhaustivamente poblado: con todos los datos sobre estructura, personal y oferta académica de la UNED, con sus interrelaciones. La institución no dispone, hasta la fecha, de un punto público de consulta similar. A partir de este desarrollo, en la sección 3.2 se plantea el objetivo básico de investigación de este trabajo: el diseño y evaluación de funciones de extracción terminológica (para fines específicos) en el corpus de Guías de Estudio referenciadas desde el datastore. El datastore de partida contiene referencias a recursos que pueden ser automáticamente recuperados y analizados mediante técnicas de Minería de Datos, con las que llevar a cabo una extracción terminológica que desemboque en nueva información con la que enriquecer el datastore. Finalmente, el enriquecimiento del datastore con estos términos requería una mínima ampliación de los vocabularios iniciales, que además conviene alinear con ontologías externas para facilitar su uso. Esta revisión se produce en la sección 3.3, donde se configura una tercera etapa en la que se inicia una discusión integrada de ontologías relevantes para describir los procesos universitarios. Por acotación temporal se asume como un objetivo secundario, así como una descripción ampliada de trabajos futuros.
Descripción
Categorías UNESCO
Palabras clave
Citación
Centro
Facultades y escuelas::E.T.S. de Ingeniería Informática
Departamento
Inteligencia Artificial