Persona: Morales Sánchez, Rodrigo
Cargando...
Dirección de correo electrónico
ORCID
0000-0002-2874-7427
Fecha de nacimiento
Proyectos de investigación
Unidades organizativas
Puesto de trabajo
Apellidos
Morales Sánchez
Nombre de pila
Rodrigo
Nombre
2 resultados
Resultados de la búsqueda
Mostrando 1 - 2 de 2
Publicación Reducción del diagnóstico tardío de la infección por VIH aplicando técnicas de Procesamiento del Lenguaje Natural(Universidad Nacional de Educación a Distancia (España). Escuela Técnica Superior de Ingeniería Informática. Departamento de Lenguajes y Sistemas Informáticos, 2023-09-01) Morales Sánchez, Rodrigo; Martínez Unanue, Raquel; Montalvo Herranz, SotoLa mejora en el diagnóstico de la infección por VIH es un tema vital para avanzar en el control de la epidemia. En España se estima que un 10% de pacientes infectados desconocen su estatus serológico. Además, alrededor del 50% de los nuevos diagnósticos cada año son detectados de manera tardía. Se han realizado varios estudios sobre estrategias de cribado y se reconoce como la mejor alternativa en relación coste-eficiencia, aquella basada en indicadores. Sin embargo, mientras el cribado en algunos ámbitos como las urgencias está bastante implantado, en otros como la hospitalización no ha recibido suficiente atención. Además, existen barreras por parte de los profesionales para la realización de serología de VIH como el tiempo o la falta de percepción de riesgo. En este trabajo se presentan dos propuestas para la ayuda en el diagnóstico basado en el uso de la información de la historia clínica electrónica de los pacientes, utilizando técnicas de aprendizaje automático y procesamiento del lenguaje natural. La primera consiste en una propuesta no supervisada basada en conocimiento experto a partir de una serie de indicadores. Y la segunda, una propuesta supervisada de clasificación binaria. No es mucha la literatura existente sobre la predicción de VIH utilizando técnicas de Procesamiento del Lenguaje Natural, por ello, este trabajo se postula como un enfoque novedoso en el que ambas propuestas consiguen unos resultados prometedores. La propuesta supervisada destaca por sus mejores resultados, mientras que la propuesta no supervisada tiene un interesante potencial por su mejor explicabilidad.Publicación Early diagnosis of HIV cases by means of text mining and machine learning models on clinical notes(ELSEVIER, 2024) Morales Sánchez, Rodrigo; Montalvo Herranz, Soto; Riaño Martínez, Adrián; Martínez Unanue, Raquel; Velasco Arribas, Maria; https://orcid.org/0000-0001-8158-7939; https://orcid.org/0009-0004-8755-255X; https://orcid.org/0000-0001-6554-2095Undiagnosed and untreated human immunodeficiency virus (HIV) infection increases morbidity in the HIV-positive person and allows onward transmission of the virus. Minimizing missed opportunities for HIV diagnosis when a patient visits a healthcare facility is essential in restraining the epidemic and working toward its eventual elimination. Most state-of-the-art proposals employ machine learning (ML) methods and structured data to enhance HIV diagnoses, however, there is a dearth of recent proposals utilizing unstructured textual data from Electronic Health Records (EHRs). In this work, we propose to use only the unstructured text of the clinical notes as evidence for the classification of patients as suspected or not suspected. For this purpose, we first compile a dataset of real clinical notes from a hospital with patients classified as suspects and non-suspects of having HIV. Then, we evaluate the effectiveness of two types of classification models to identify patients suspected of being infected with the virus: classical ML algorithms and two Large Language Models (LLMs) from the biomedical domain in Spanish. The results show that both LLMs outperform classical ML algorithms in the two settings we explore: one dataset version is balanced, containing an equal number of suspicious and non-suspicious patients, while the other reflects the real distribution of patients in the hospital, being unbalanced. We obtain F score figures of 94.7 with both LLMs in the unbalanced setting, while in the balance one, RoBERTa model outperforms the other one with a F score of 95.7. The findings indicate that leveraging unstructured text with LLMs in the biomedical domain yields promising outcomes in diminishing missed opportunities for HIV diagnosis. A tool based on our system could assist a doctor in deciding whether a patient in consultation should undergo a serological test.