Extreme multi-label deep neural classification of Spanish health records according to the International Classification of Diseases

  1. BLANCO GARCES, ALBERTO
Dirigida por:
  1. Arantza Casillas Rubio Directora
  2. Alicia Pérez Ramírez Directora

Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 20 de septiembre de 2022

Tipo: Tesis

Teseo: 777218 DIALNET lock_openADDI editor

Resumen

Este trabajo trata sobre la minería de textos clínicos, un campo del Procesamiento del Lenguaje Naturalaplicado al dominio biomédico. El objetivo es automatizar la tarea de codificación médica. Los registroselectrónicos de salud (EHR) son documentos que contienen información clínica sobre la salud de unpaciente. Los diagnósticos y procedimientos médicos plasmados en la Historia Clínica Electrónica estáncodificados con respecto a la Clasificación Internacional de Enfermedades (CIE). De hecho, la CIE es labase para identificar estadísticas de salud internacionales y el estándar para informar enfermedades ycondiciones de salud. Desde la perspectiva del aprendizaje automático, el objetivo es resolver unproblema extremo de clasificación de texto de múltiples etiquetas, ya que a cada registro de salud se leasignan múltiples códigos ICD de un conjunto de más de 70 000 términos de diagnóstico. Una cantidadimportante de recursos se dedican a la codificación médica, una laboriosa tarea que actualmente se realizade forma manual. Los EHR son narraciones extensas, y los codificadores médicos revisan los registrosescritos por los médicos y asignan los códigos ICD correspondientes. Los textos son técnicos ya que losmédicos emplean una jerga médica especializada, aunque rica en abreviaturas, acrónimos y erroresortográficos, ya que los médicos documentan los registros mientras realizan la práctica clínica real. Paraabordar la clasificación automática de registros de salud, investigamos y desarrollamos un conjunto detécnicas de clasificación de texto de aprendizaje profundo.