Publicación:
Anotación semántica no supervisada

dc.contributor.authorFernández Amoros, David José
dc.date.accessioned2024-05-21T14:01:15Z
dc.date.available2024-05-21T14:01:15Z
dc.date.issued2004-11-29
dc.description.abstractEn esta tesis se trata el problema de la desambiguación del sentido de las palabras (i.e. dados un diccionario, una palabra y un contexto, decidir en qué sentido del diccionario se está usando la palabra en el contexto). Las diferentes fuentes de información utilizadas son : 1. La información de origen taxonómico basada en la relación es-un, por ejemplo, un águila es-un pájaro. 2. La información de coocurrencias. Tomando como punto de partida un corpus de casi 300 millones de palabras provinientes de libros en formato electrónico (Proyecto Gutenberg) estudiaremos pares de palabras cuyas apariciones en contextos cortos son estadísticamente dependientes. Utilizaremos varias medidas para calibrar ese grado de dependencia y emplearemos dicha información para desambiguar. 3. Información extraída de la WWW. La información de la glosas del inventario de sentidos serán complementadas con información extraída de la Web. Esta información ha sido extraída de un sistema de clasificación de documentos realizado por voluntarios (Open Directory Project) por Celina Santamaría. 4. Información proviniente de corpora bilingüe comparable. Partiendo de un corpus en inglés y otro en español se han buscado patrones sintácticos superficiales correspondientes a sintagmas nominales en ambos idiomas. A partir de este trabajo realizado por Anselmo Peñas y Fernando López Ostenero estudiaremos si es posible aprovechar las diferencias entre ambos idiomas para detectar estos sintagmas y desambiguar mediante las capacidades translingües de una base de conocimiento léxica (EuroWordNet). Se demostrará que la anotación semántica no supervisada puede lograr buenos resultados, y que hay lineas de investigación, con un importante potencial de mejora, que merecen exploradas.es
dc.description.versionversión final
dc.identifier.urihttps://hdl.handle.net/20.500.14468/21212
dc.language.isoes
dc.publisherUniversidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos
dc.relation.centerEscuela Internacional de Doctorado
dc.relation.departmentNo procede
dc.rightsAtribución-NoComercial-SinDerivadas 4.0 Internacional
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0
dc.subject.keywordsinteligencia artificial
dc.subject.keywordsinformática
dc.subject.keywordssemántica
dc.subject.keywordsmatemática aplicada
dc.titleAnotación semántica no supervisadaes
dc.typetesis doctorales
dc.typedoctoral thesisen
dspace.entity.typePublication
relation.isAuthorOfPublication60bb7374-7021-4fda-b2cb-ef7f923c64f4
relation.isAuthorOfPublication.latestForDiscovery60bb7374-7021-4fda-b2cb-ef7f923c64f4
Archivos
Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
999.65 KB
Formato:
Adobe Portable Document Format
Colecciones