Extracción de Eventos y Expresiones Temporales en Textos Clínicos

Vicente Cabero, Juan Manuel. (2021). Extracción de Eventos y Expresiones Temporales en Textos Clínicos Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
VicenteCabero_JuanManuel_TFM.pdf VicenteCabero_JuanManuel_TFM.pdf application/pdf 856.91KB

Título Extracción de Eventos y Expresiones Temporales en Textos Clínicos
Autor(es) Vicente Cabero, Juan Manuel
Resumen En el ambito clnico, la identicacion de eventos como la sintomatologa de un paciente, las enfermedades que pueda padecer o los tratamientos que se le han aplicado, es una necesidad comun entre los profesionales sanitarios e investigadores. Mas alla de la deteccion de los eventos, es necesario poder situarlos en una lnea temporal, pudiendo saber con facilidad el historial clnico del paciente, la sintomatologa que presenta y el tiempo que ha pasado desde que se le administro la ultima dosis de un determinado farmaco. La extraccion automatica del historial del paciente dado un informe sobre su ingreso en el hospital es un problema englobado dentro de la lnea de investigacion de la Extraccion de Informacion, concretamente por la tarea de Extraccion de Relaciones Temporales. Su aplicacion al dominio clnico ha recibido atencion especialmente en la ultima decada en varias ediciones de congresos como i2b2 y Clinical TempEval, en las que se han presentado corpus y metodologas de evaluacion para incentivar el desarrollo de la investigaci on del campo. Esta tarea tiene como antecedente la Extraccion de Eventos y Expresiones Temporales, dado que son los elementos necesarios para extraer las relaciones. En el presente documento se describe la tarea de Extraccion de Eventos y Expresiones Temporales en Textos Clnicos, evaluando 5 arquitecturas que puedan abordar el problema partiendo de informes de alta de pacientes del corpus i2b2. Las arquitecturas toman como referencia las consideradas como estado del arte, tomando una de ellas como base y aplicando modicaciones de forma progresiva a n de conseguir igualar o mejorar los resultados, a la par que se reducen el procesado y la cantidad de datos necesaria para entrenar dichos sistemas. Estas modicaciones dan lugar al sistema BertSR, que supone un planteamiento nuevo apoyado en un modelo BERT pre-entrenado, y que consigue igualar, e incluso superar en algunas subtareas, los resultados de los mejores sistemas del corpus i2b2.
Abstract The identication of events in the clinical domain, such as a patient's symptomatology, the diseases he/she may suer from or the treatments he/she has undergone, is a common need among healthcare professionals and researchers. Beyond the detection of events, it is necessary to be able to place them in a timeline, being able to easily know the patient's clinical record, the symptoms presented and the time that has passed since the last dose of a given drug was applied. The automatic extraction of the patient's record given a medical admission report is a problem encompassed within the Information Extraction research line, specically by the Temporal Relations Extraction task. Its application to the clinical domain has received attention especially in the last decade in several editions of conferences such as i2b2 and Clinical TempEval, where corpora and evaluation methodologies have been presented to encourage the development of research in the eld. This task is based on Event and Time Expression Extraction, since these are the necessary elements to correctly retrieve the relationships. This paper describes the task of Event and Temporal Expression Extraction in Clinical Texts, evaluating 5 architectures that can address the problem based on patient discharge reports from the i2b2 corpus. The architectures take as a reference those considered as state of the art, taking one of them as a base and applying modications progressively in order to achieve equal or better results, while reducing the processing and the amount of data needed to train these systems. These modications give rise to the BertSR system, which is a new approach to the problem, based on a pre-trained BERT model, and which manages to match, and even surpass in some subtasks, the results of the best systems in the i2b2 corpus.
Notas adicionales Trabajo Final de Máster Universitario en Tecnologías del lenguaje. UNED
Materia(s) Ingeniería Informática
Editor(es) Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos
Director/Tutor Araujo Serna, Lourdes
Martínez Romo, Juan
Fecha 2021-06-01
Formato application/pdf
Identificador bibliuned:master-ETSInformatica-TL-Jmvicente
http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-TL-Jmvicente
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 163 Visitas, 84 Descargas  -  Estadísticas en detalle
Creado: Wed, 11 Jan 2023, 22:57:48 CET