Extracción de Eventos y Expresiones Temporales en Textos Clínicos

Vicente Cabero, Juan Manuel

Extracción de Eventos y Expresiones Temporales en Textos Clínicos

Vicente Cabero, Juan Manuel. (2021). Extracción de Eventos y Expresiones Temporales en Textos Clínicos Master Thesis, Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre			Descripción	Tipo MIME		Size
VicenteCabero_JuanManuel_TFM.pdf			VicenteCabero_JuanManuel_TFM.pdf		application/pdf	856.91KB

Título	Extracción de Eventos y Expresiones Temporales en Textos Clínicos
Autor(es)	Vicente Cabero, Juan Manuel
Resumen	En el ambito clnico, la identicacion de eventos como la sintomatologa de un paciente, las enfermedades que pueda padecer o los tratamientos que se le han aplicado, es una necesidad comun entre los profesionales sanitarios e investigadores. Mas alla de la deteccion de los eventos, es necesario poder situarlos en una lnea temporal, pudiendo saber con facilidad el historial clnico del paciente, la sintomatologa que presenta y el tiempo que ha pasado desde que se le administro la ultima dosis de un determinado farmaco. La extraccion automatica del historial del paciente dado un informe sobre su ingreso en el hospital es un problema englobado dentro de la lnea de investigacion de la Extraccion de Informacion, concretamente por la tarea de Extraccion de Relaciones Temporales. Su aplicacion al dominio clnico ha recibido atencion especialmente en la ultima decada en varias ediciones de congresos como i2b2 y Clinical TempEval, en las que se han presentado corpus y metodologas de evaluacion para incentivar el desarrollo de la investigaci on del campo. Esta tarea tiene como antecedente la Extraccion de Eventos y Expresiones Temporales, dado que son los elementos necesarios para extraer las relaciones. En el presente documento se describe la tarea de Extraccion de Eventos y Expresiones Temporales en Textos Clnicos, evaluando 5 arquitecturas que puedan abordar el problema partiendo de informes de alta de pacientes del corpus i2b2. Las arquitecturas toman como referencia las consideradas como estado del arte, tomando una de ellas como base y aplicando modicaciones de forma progresiva a n de conseguir igualar o mejorar los resultados, a la par que se reducen el procesado y la cantidad de datos necesaria para entrenar dichos sistemas. Estas modicaciones dan lugar al sistema BertSR, que supone un planteamiento nuevo apoyado en un modelo BERT pre-entrenado, y que consigue igualar, e incluso superar en algunas subtareas, los resultados de los mejores sistemas del corpus i2b2.
Abstract	The identication of events in the clinical domain, such as a patient's symptomatology, the diseases he/she may suer from or the treatments he/she has undergone, is a common need among healthcare professionals and researchers. Beyond the detection of events, it is necessary to be able to place them in a timeline, being able to easily know the patient's clinical record, the symptoms presented and the time that has passed since the last dose of a given drug was applied. The automatic extraction of the patient's record given a medical admission report is a problem encompassed within the Information Extraction research line, specically by the Temporal Relations Extraction task. Its application to the clinical domain has received attention especially in the last decade in several editions of conferences such as i2b2 and Clinical TempEval, where corpora and evaluation methodologies have been presented to encourage the development of research in the eld. This task is based on Event and Time Expression Extraction, since these are the necessary elements to correctly retrieve the relationships. This paper describes the task of Event and Temporal Expression Extraction in Clinical Texts, evaluating 5 architectures that can address the problem based on patient discharge reports from the i2b2 corpus. The architectures take as a reference those considered as state of the art, taking one of them as a base and applying modications progressively in order to achieve equal or better results, while reducing the processing and the amount of data needed to train these systems. These modications give rise to the BertSR system, which is a new approach to the problem, based on a pre-trained BERT model, and which manages to match, and even surpass in some subtasks, the results of the best systems in the i2b2 corpus.
Notas adicionales	Trabajo Final de Máster Universitario en Tecnologías del lenguaje. UNED
Materia(s)	Ingeniería Informática
Editor(es)	Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos
Director/Tutor	Araujo Serna, Lourdes Martínez Romo, Juan
Fecha	2021-06-01
Formato	application/pdf
Identificador	bibliuned:master-ETSInformatica-TL-Jmvicente http://e-spacio.uned.es/fez/view/bibliuned:master-ETSInformatica-TL-Jmvicente
Idioma	spa
Versión de la publicación	acceptedVersion
Nivel de acceso y licencia	http://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess
Tipo de recurso	master Thesis
Tipo de acceso	Acceso abierto

Tipo de documento:	master Tesis
Collections:	Máster Universitario en Tecnologías del Lenguaje (UNED) Set de openaire Set de items trabajo fin de máster

Contador de citas:	Search Google Scholar
Estadísticas de acceso:	163 Visitas, 84 Descargas - Estadísticas en detalle
Creado:	Wed, 11 Jan 2023, 22:57:48 CET

e-spacio

Extracción de Eventos y Expresiones Temporales en Textos Clínicos