Procedimiento semi-automático para transformar la Web en Web Semántica

Criado Fernández, Luis. Procedimiento semi-automático para transformar la Web en Web Semántica . 2009. Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
Documento.pdf Pdf del documento application/pdf

Título Procedimiento semi-automático para transformar la Web en Web Semántica
Autor(es) Criado Fernández, Luis
Resumen El concepto de Web Semántica exige una representación formal de la información de acuerdo a ontologías de referencia que doten a la Web de semántica para los sistemas informáticos. Hay un acuerdo generalizado de que esto se haga a través de lenguajes estándar de etiquetado. Pero también exige que haya suficientes anotaciones semánticas de este tipo, es necesaria una cierta "masa crítica" para que tenga sentido global en la Web. Y esto no se ha conseguido fundamentalmente por la complejidad que plantea realizar la anotación de forma manual. Sólo cuando se tenga la facilidad de generar suficientes anotaciones semánticas, ya sea de forma automática o semi-automática, se podrá extender la semántica en los contenidos de la Web. A partir de esta situación ya se podrán desarrollar aplicaciones que aprovechen o saquen partido de esa semántica, las aplicaciones semánticas. Y hacia este problema se orienta, ya más particularmente, nuestra investigación. Así, la principal aportación específica de esta tesis es la propuesta de un procedimiento para contribuir en la extensión de la población de ontologías, que facilita a un usuario activo el etiquetado semántico de la información que gestiona, y que ya ha descrito en texto en su página HTML, de acuerdo a la ontología u ontologías que el sistema ha identificado como más afines a sus contenidos. En nuestro trabajo se tiene muy en cuenta esta última posibilidad, el contenido a etiquetar puede hacer referencia a diferentes temas o puede interpretarse desde diferentes puntos de vista, es decir, el proceso puede "poblar" diferentes ontologías desde el mismo contenido, lo que en este trabajo denominaremos generar diferentes "vistas semánticas". Hemos definido unas etapas de transformación que deben realizarse de forma secuencial. La primera que denominamos identificación permite asociar la ontología u ontologías que están más cercanas al contenido de la página web. Esta selección de ontologías es fundamental para que en la etapa siguiente, que denominamos extracción, se procese el texto a nivel morfológico y sintáctico. Finalmente, la última etapa que hemos denominado interpretación se encarga de la anotación semántica. La anotación se hace en nuestro estudio en OWL DL por ser el lenguaje estándar para la descripción de semántica en la Web y permitir las inferencias propias de la lógica descriptiva SROID(D) en el que se sustenta. Para realizar esta transformación o migración, se ha implementado una herramienta prototipo (sw2sws) que automatiza las tres etapas que hemos presentado. Se ha probado sobre sitios webs reales. Nuestra herramienta prototipo automatiza el proceso de anotación con las ontologías usadas en la tesis, pero es fácilmente adaptable para soportar otras. Además nuestro enfoque acepta la posibilidad de intervención del usuario (proceso semiautomático) que complete o mejore cualquiera de las fases del proceso global. Alcanzado el objetivo principal, para mostrar cómo explotar esta información que ya tiene semántica y cerrar todo la secuencia del proceso, nos hemos visto en la necesidad de diseñar e implementar un prototipo propio de buscador semántico, al que hemos denominado Vissem, capaz de interpretar preguntas en lenguaje natural y efectuar las búsquedas correspondientes sobre las instancias de los sitio web semánticos que hemos generado. Hemos implementado por completo la propuesta de esta tesis que puede ser verificada por cualquier investigador siguiendo las indicaciones del anexo A.
Materia(s) Ingeniería Informática
Palabras clave world wide web
sistema de recuperación de la información
web 2.0
internet
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Director de tesis Martínez Tomás, Rafael (Director de Tesis)
Fecha 2009-09-28
Formato application/pdf
Identificador tesisuned:IngInf-Lcriado
http://e-spacio.uned.es/fez/view/tesisuned:IngInf-Lcriado
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 2600 Visitas, 8155 Descargas  -  Estadísticas en detalle
Creado: Fri, 27 Nov 2009, 13:07:16 CET