Recomendación de Contenidos Digitales basada en divergencias del lenguaje: Diseño, Experimentación y Evaluación

Castellanos González, Ángel. (2013). Recomendación de Contenidos Digitales basada en divergencias del lenguaje: Diseño, Experimentación y Evaluación Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática.

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
Castellanos_Angel_TFM.pdf Full text (open access) application/pdf 5.14MB

Título Recomendación de Contenidos Digitales basada en divergencias del lenguaje: Diseño, Experimentación y Evaluación
Autor(es) Castellanos González, Ángel
Resumen Para enfrentar el problema del descubrimiento de información en grandes repositorios de datos, como Internet, surgieron los sistemas de recomendación. Estos sistemas ofrecen a los usuarios contenidos relevantes de acuerdo a su actividad previa. El funcionamiento de un sistema de recomendación consta de dos etapas: el modelado de la actividad previa de los usuarios, para identificar sus preferencias, y la recomendación de contenidos de acuerdo a estas preferencias. En el estado del arte de sistemas de recomendación, una de las aproximaciones seguidas es la de los sistemas basados en contenido, que recopilan los contenidos previamente vistos y recomiendan contenidos similares. En este contexto, el modelado de usuarios se plantea como una recopilación de términos de los contenidos vistos, ponderados de acuerdo a alguna aproximación. Este tipo de sistemas (basados en contenido) presentan un problema conocido como sobre-especialización (i.e. recomendación de contenidos muy similares entre sí), afectando sensiblemente a la satisfacción de los usuarios con este tipo de sistemas. A este respecto, en este trabajo se propone una aproximación utilizando técnicas de divergencias del lenguaje como método para modelar la actividad previa de los usuarios. Con ello se espera poder identificar los términos originales de los contenidos consultados previamente por los usuarios, favoreciendo la recomendación de contenidos originales. De esta manera se espera mejorar la satisfacción del usuario en aspectos relacionados con la sobre-especialización En el estado del arte, la evaluación en sistemas de recomendación habitualmente se ha llevado a cabo teniendo en cuenta únicamente la etapa de recomendación. Sin embargo, en este trabajo se ha tenido en cuenta también la etapa previa de modelado. Por ello, se ha planteado una metodología de evaluación para evaluar la representatividad de los modelos generados, utilizando una nueva métrica desarrollada para tal fin: representatividad normalizada. Los resultados han demostrado como la aproximación de modelado propuesta mejora el rendimiento de otras técnicas del estado del arte. El modelado propuesto ha sido aplicado a varias aproximaciones de recomendación de contenidos, basadas en Recuperación de Información. Para la evaluación de estas aproximaciones se ha planteado una tarea de evaluación con usuarios reales, mediante la utilización de un prototipo de evaluación, desarrollado para tal fin. Los resultados muestran como el rendimiento del sistema de recomendación mejoran los de un sistema de recuperación de información en términos de satisfacción de usuario, en un contexto susceptible de ser afectado por la sobre-especialización de las recomendaciones.
Abstract To face the information discovering problem in large data repositories, like Internet, it appeared the recommender systems in early 90s. These systems offer relevant contents to the users, according to their previous activity. The running of recommender systems consists of two steps: user modelling, to identify their preferences, and recommendation according to the identified preferences. In the state of the art of recommender systems, one of the most common approaches is the so-called content-based systems, which collects the contents previously viewed and recommends new similar contents. In this context, user modelling can be seen as a compilation of terms of the viewed contents, weighted according some approach. This kind of systems (content-based) presents a problem known as over-specialization (i.e. recommendation of contents very similar among them), significantly affecting to the user satisfaction. Respect to this, this work proposes a modelling approach using divergences techniques as method to model the previous activity of the users. With this it is expected to identify the original terms of the contents previously viewed by users, allowing the recommendation of new original contents. In this way it is expected to improve user satisfaction in aspects related to over-specialization. In the state of the art, the evaluation in recommender systems has been normally conducted taking into account only the recommendation step. However, in this work, the modelling step has been also taken into account. For this, an evaluation methodology has been proposed to evaluate the representativeness of the models, using a new measure, specially developed for this work: Normalized Representativeness. The results have demonstrated how the modelling approach improves the performance of other common techniques in the state of the art, in terms of representativeness. The proposed modelling has been applied in several recommendation approaches, based on Information Retrieval. To the evaluation of these approaches it has been posed an evaluation task with real users. The results show that the performance of the recommender system improves the results of an information retrieval system in terms of user satisfaction, in a context susceptible of being affected by over-specialization.
Notas adicionales Trabajo Fin de Máster en Lenguajes y Sistemas Informáticos (LSI) de la ETSI Informática.
Materia(s) Informática
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática.
Director/Tutor García Serrano, Ana (Directora)
Cigarrán Recuero, Juan Manuel (Director)
Fecha 2013-03-01
Formato application/pdf
Identificador bibliuned:master-ETSIInformatica-LSI-Acastellanos
http://e-spacio.uned.es/fez/view/bibliuned:master-ETSIInformatica-LSI-Acastellanos
Idioma spa
Versión de la publicación submittedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 243 Visitas, 139 Descargas  -  Estadísticas en detalle
Creado: Sat, 21 Mar 2015, 01:22:47 CET