Procedimiento semi-automático para transformar la Web en Web Semántica

Criado Fernández, Luis

Procedimiento semi-automático para transformar la Web en Web Semántica

Criado Fernández, Luis. Procedimiento semi-automático para transformar la Web en Web Semántica . 2009. Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre			Descripción	Tipo MIME		Size
Documento.pdf			Pdf del documento		application/pdf

Título	Procedimiento semi-automático para transformar la Web en Web Semántica
Autor(es)	Criado Fernández, Luis
Resumen	El concepto de Web Semántica exige una representación formal de la información de acuerdo a ontologías de referencia que doten a la Web de semántica para los sistemas informáticos. Hay un acuerdo generalizado de que esto se haga a través de lenguajes estándar de etiquetado. Pero también exige que haya suficientes anotaciones semánticas de este tipo, es necesaria una cierta "masa crítica" para que tenga sentido global en la Web. Y esto no se ha conseguido fundamentalmente por la complejidad que plantea realizar la anotación de forma manual. Sólo cuando se tenga la facilidad de generar suficientes anotaciones semánticas, ya sea de forma automática o semi-automática, se podrá extender la semántica en los contenidos de la Web. A partir de esta situación ya se podrán desarrollar aplicaciones que aprovechen o saquen partido de esa semántica, las aplicaciones semánticas. Y hacia este problema se orienta, ya más particularmente, nuestra investigación. Así, la principal aportación específica de esta tesis es la propuesta de un procedimiento para contribuir en la extensión de la población de ontologías, que facilita a un usuario activo el etiquetado semántico de la información que gestiona, y que ya ha descrito en texto en su página HTML, de acuerdo a la ontología u ontologías que el sistema ha identificado como más afines a sus contenidos. En nuestro trabajo se tiene muy en cuenta esta última posibilidad, el contenido a etiquetar puede hacer referencia a diferentes temas o puede interpretarse desde diferentes puntos de vista, es decir, el proceso puede "poblar" diferentes ontologías desde el mismo contenido, lo que en este trabajo denominaremos generar diferentes "vistas semánticas". Hemos definido unas etapas de transformación que deben realizarse de forma secuencial. La primera que denominamos identificación permite asociar la ontología u ontologías que están más cercanas al contenido de la página web. Esta selección de ontologías es fundamental para que en la etapa siguiente, que denominamos extracción, se procese el texto a nivel morfológico y sintáctico. Finalmente, la última etapa que hemos denominado interpretación se encarga de la anotación semántica. La anotación se hace en nuestro estudio en OWL DL por ser el lenguaje estándar para la descripción de semántica en la Web y permitir las inferencias propias de la lógica descriptiva SROID(D) en el que se sustenta. Para realizar esta transformación o migración, se ha implementado una herramienta prototipo (sw2sws) que automatiza las tres etapas que hemos presentado. Se ha probado sobre sitios webs reales. Nuestra herramienta prototipo automatiza el proceso de anotación con las ontologías usadas en la tesis, pero es fácilmente adaptable para soportar otras. Además nuestro enfoque acepta la posibilidad de intervención del usuario (proceso semiautomático) que complete o mejore cualquiera de las fases del proceso global. Alcanzado el objetivo principal, para mostrar cómo explotar esta información que ya tiene semántica y cerrar todo la secuencia del proceso, nos hemos visto en la necesidad de diseñar e implementar un prototipo propio de buscador semántico, al que hemos denominado Vissem, capaz de interpretar preguntas en lenguaje natural y efectuar las búsquedas correspondientes sobre las instancias de los sitio web semánticos que hemos generado. Hemos implementado por completo la propuesta de esta tesis que puede ser verificada por cualquier investigador siguiendo las indicaciones del anexo A.
Materia(s)	Ingeniería Informática
Palabras clave	world wide web sistema de recuperación de la información web 2.0 internet
Editor(es)	Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Inteligencia Artificial
Director de tesis	Martínez Tomás, Rafael (Director de Tesis)
Fecha	2009-09-28
Formato	application/pdf
Identificador	tesisuned:IngInf-Lcriado http://e-spacio.uned.es/fez/view/tesisuned:IngInf-Lcriado
Idioma	spa
Versión de la publicación	acceptedVersion
Nivel de acceso y licencia	http://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess
Tipo de recurso	Thesis
Tipo de acceso	Acceso abierto

Tipo de documento:	Doctoral Thesis
Collections:	Departamento de Inteligencia Artificial (UNED). Tesis Set de openaire Set de Tesis Doctorales de la UNED Tesis de la Escuela Técnica Superior de Ingeniería Informática (UNED)

Contador de citas:	Search Google Scholar
Estadísticas de acceso:	2604 Visitas, 8158 Descargas - Estadísticas en detalle
Creado:	Fri, 27 Nov 2009, 14:07:16 CET

e-spacio

Procedimiento semi-automático para transformar la Web en Web Semántica