identificación priorizada de pacientes con enfermedades crónicas a través del análisis de...
TRANSCRIPT
Identificación priorizada de pacientes con enfermedades
crónicas a través del análisis de historias clínicas electrónicas
Estudiante:
David Elías Peña Clavijo
Director:
Ing. Alexandra Pomares Q. PhD
AGENDA
1. Problemática de Aplicación.
2. Objetivos.
3. Metodología de Investigación.
4. Estado del arte.
5. Modelo de Análisis de Historias Clínicas Electrónicas.
6. Aplicación – DISEARCH.
7. Evaluación Funcional.
8. Conclusiones y Trabajo Futuro.
PROBLEMÁTICA DE APLICACIÓNHISTORIA CLÍNICA
• Información depositada en las historias clínicas es de gran utilidad para médicos y pacientes.
• Describe:– Diagnóstico.– Tratamiento.– Seguimiento.
• De gran utilidad para realizar análisis que favorezcan la prestación y administración de servicios de salud.
PROBLEMÁTICA DE APLICACIÓNINVESTIGACIONES CLÍNICAS RETROSPECTIVAS
• Enfermedad crónica tiene tratamiento pero no cura.
• Orientan a enfermedades crónicas en historias clínicas.
• Identificación de historias médicas.
• Proceso manual, limitado y tedioso.
• Uso inadecuado del estándar CIE10.
PROBLEMA DE APLICACIÓN
Las historias clínicas contienen en gran medida texto narrativo o texto libre. Por lo tanto, un método fiable y eficiente para extraer información estructurada puede beneficiar en gran medida los esfuerzos de investigación.
PROBLEMA DE APLICACIÓN
La dificultad para realizar búsquedas y análisis sobre historias clínicas electrónicas, cuando contienen datos estructurados y no estructurados (como los textos narrativos) son el principal problema que aborda esta investigación.
OBJETIVO GENERAL
Identificar de manera priorizada pacientes con enfermedades crónicas a través del análisis de historias clínicas electrónicas.
Los resultados del trabajo de grado podrán ser empleados para el proyecto de “Búsqueda y análisis semiautomático de pacientes con enfermedades crónicas a partir de la exploración retrospectiva de las historias clínicas electrónicas” asociado al departamento de Ingeniería de sistemas y al hospital San Ignacio.
OBJETIVOS ESPECÍFICOS
Diseñar un modelo de análisis basado en técnicas de minería de datos que facilite la detección de pacientes con enfermedades crónicas.
Construir un prototipo funcional del modelo que analice historias clínicas electrónicas que contengan texto narrativo y datos estructurados para la detección priorizada de pacientes con enfermedades crónicas.
Validar el prototipo funcional usando como casos de estudio las enfermedades falla cardiaca, diabetes e hipertensión pulmonar.
METODOLOGÍA DE INVESTIGACIÓN
ESTADO DEL ARTECLASIFICACIÓN TAXONÓMICA
• Atributos relevantes dentro de la revisión de la bibliografía.
• Apoyar el análisis de la bibliografía.
ESTADO DEL ARTEANÁLISIS COMPARATIVO
• Análisis comparativo de los trabajos relacionados con base en la taxonomía obtenida.
ESTADO DEL ARTEIDENTIFICACIÓN DE MEJORAS
Proceso estándar y repetible en diferentes sistema de información hospitalario.
Enfoque en texto narrativo y tomar en cuenta los campos estructurados asociados a una HCE.
Permitir definición para diferentes enfermedades.
Enriquecimiento de definiciones de enfermedades.
Parámetros simples para la identificación de enfermedades.
Contemplar más que la “mejor” historia clínica.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICAS• Entrevistas, tanto con el
cuerpo médico como a los expertos del Sistema de Información Hospitalario
• Mejoras Identificadas en Estado del Arte.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASModelo propuesto• Definir enfermedad.
– Base de conocimiento de enfermedades.
• Preseleccionar HCE.– Historias clínicas
electrónicas.• Generar vista minable.• Analizar HCE.• Priorizar Resultados.• Mostrar Resultados.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASESTRATEGIA
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASD
efin
ir E
nfer
med
ad
Pre
sele
ccio
nar
de H
CE
Gen
erac
ión
vist
a m
inab
le
Aná
lisis
de
HC
E
Prio
rizar
R
esul
tado
s
Mos
trar
Res
ulta
dos
Subgrupo LiteralVocabulario Nombre científico del diagnóstico.
Nombre formal del diagnóstico. (Según el CIE 10)
Nombre informal del diagnóstico
Sinónimos diagnóstico
Acrónimo
Taxonomía de Vocabulario
Especializaciones del diagnóstico
Generalizaciones del diagnóstico
Exámenes confirmatorios (Si existen)
Nombre formal del examen
Nombre informal del examen
Exámenes Asociados Nombre formal del examen
Nombre informal del examen
Síntomas Síntomas característicos por género (en lenguaje científico, formal e informal)Síntomas característicos por etapa de vida (en lenguaje científico, formal e informal)
Medicamentos Nombre Formal
Nombre Genérico
Tratamiento Nombre Tratamiento
Antecedentes Antecedentes y Factores de Riesgo
Complicaciones o desenlaces
Elementos de Exclusión (si existen)
Términos excluyentes
Frases típicas de descarte que incluyan nombre del diagnóstico
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASDefinir Enfermedad
El propósito de esta plantilla es documentar todos los elementos necesarios para configurar la búsqueda automática de historias clínicas electrónicas que tienen como diagnóstico una enfermedad crónica establecida.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASD
efin
ir E
nfer
med
ad
Pre
sele
ccio
nar
de H
CE
Gen
erac
ión
vist
a m
inab
le
Aná
lisis
de
HC
E
Prio
rizar
R
esul
tado
s
Mos
trar
Res
ulta
dos
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASPRESELECCIONAR HCE
• Fase del modelo el cual transforma la información proveniente de un Sistema de Información Hospitalario, que contiene los registros médicos asociados a los pacientes.
• También define los parámetros para acotar el conjunto de historias clínicas a analizar.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASD
efin
ir E
nfer
med
ad
Pre
sele
ccio
nar
de H
CE
Gen
erac
ión
vist
a m
inab
le
Aná
lisis
de
HC
E
Prio
rizar
R
esul
tado
s
Mos
trar
Res
ulta
dos
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASGENERACIÓN VISTA MINABLE
• Fase que estructura y estandariza la información asociada a una historia clínica para su posterior análisis.
• Contiene campos estructurados asociados a una HCE.• Contiene el texto narrativo del diagnóstico asociado a una HCE.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASD
efin
ir E
nfer
med
ad
Pre
sele
ccio
nar
de H
CE
Gen
erac
ión
vist
a m
inab
le
Aná
lisis
de
HC
E
Prio
rizar
R
esul
tado
s
Mos
trar
Res
ulta
dos
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASANÁLISIS DE HCE
Análisis de texto no
estructurado o narrativo
Análisis de datos
estructurados
Análisis de historias clínicas
Electrónicas
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASANÁLISIS DE HCE
• Técnicas de minería de texto y de extracción de información (Information Extraction).
• No estructurado.– Proceso de preparación de datos.– Minería de texto– Extracción de información.
• Estructurado.– Consultas estructuradas.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASANÁLISIS DE HCE – PREPARACIÓN DE
DATOSSegmentación
Eliminación de palabras
irrelevantes
Etiquetado gramatical
• POSTagger
Lematización
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASANÁLISIS DE HCE – ANÁLISIS DE TEXTO
• Expresiones regulares– <Termino negativo>*<Conector>+(<Enfermedad>|<Sintoma>)– Ejemplos:
• Negativo de diabetes.• Descartar diabetes.• No hay curse de TEP.
• Proceso de etiquetado consiste en reconocer y asignar los hallazgos en una Historia Clínica Electrónica.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASANÁLISIS DE HCE – CONSULTAS SQL
SELECT [VALOR A RECUPERAR] FROM [ENTIDAD A CONSULTAR] WHERE [CONDICIONES DE BÚSQUEDA].
• Campos como:– Medicamentos.– Exámenes.– CIE10.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASD
efin
ir E
nfer
med
ad
Pre
sele
ccio
nar
de H
CE
Gen
erac
ión
vist
a m
inab
le
Aná
lisis
de
HC
E
Prio
rizar
R
esul
tado
s
Mos
trar
Res
ulta
dos
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASPriorizar Resultados
Distancia semántica• si
U es la utilidad del subgrupo para detectar una enfermedad, igual a psi.
• siH es el número de coincidencias del literal de un subgrupo.
• siI es la intensidad del literal de un subgrupo.
• Si es 1 si al menos uno de los literales de un subgrupo es encontrado en una historia clínica Mk, de lo contrario su valor es 0.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASPriorizar Resultados• La historia clínica con
la menor distancia es la primera en la lista priorizada.
• Las demás son organizadas de acuerdo al valor de la distancia, del menor al mayor.
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASD
efin
ir E
nfer
med
ad
Pre
sele
ccio
nar
de H
CE
Gen
erac
ión
vist
a m
inab
le
Aná
lisis
de
HC
E
Prio
rizar
R
esul
tado
s
Mos
trar
Res
ulta
dos
MODELO DE ANÁLISIS DE HISTORIAS CLÍNICAS
ELECTRÓNICASMostrar Resultados
• Resultados para evaluación por parte del experto médico.
• Permitan ajustar definición de enfermedad.
APLICACIÓN – DISEARCH
Arquitectura de tres capas: Componentes de DISEARCH• Capa de presentación
– Formularios y Consola.• Capa lógica.
– ETL.– Priorizador.– Motor de análisis.– Motor de Conocimiento
• Capa de datos– SAHI(Sistema del HUSI).– Vista minable.– Resultados.
APLICACIÓN – DISEARCH
Desarrollo de DISEARCH• JAVA y JPA.
– Java JDK 7.– EclipseLink JPA.
• MS SQL SERVER 2008.– ETL con SQL Server
Integration Services.• GATE.
– JAPE reconoce expresiones regulares en anotaciones sobre documentos.
APLICACIÓN – DISEARCHCAPA DE DATOS – VISTA MINABLE
• Preselección de HCE.– Acotar los resultados
almacenados en la vista minable.
• Vista minable.– Conjunto de tablas con
todos los atributos relevantes para el proceso de minera de datos.
– Proceso CRISP-DM.– Exploración de datos.– Migración de datos
usando ETL.
APLICACIÓN – DISEARCHCAPA DE DATOS – MODELO E/R
• Soporta el rol y especialización del investigador médico como usuario de DISEARCH.
• Implementa la definición de enfermedad.– Base de conocimiento
SNOMED CT.• Integra resultados del
análisis de HCE.• Persiste resultados de
priorización.
APLICACIÓN – DISEARCHCAPA LÓGICA
Diagrama de Clases• Patrones de Diseño:
– Cadena de responsabilidad.– Estrategia.
APLICACIÓN – DISEARCHCAPA DE PRESENTACIÓN
EVALUACIÓN FUNCIONALDEFINICIÓN DE ENFERMEDAD TEP
Grupo Literal Tromboembolismo Pulmonar.Vocabulario Nombre científico del diagnóstico. Tromboembolismo pulmonar
Nombre formal del diagnóstico. (Según el CIE 10) I26
Nombre informal del diagnóstico Embolismo Pulmonar
Sinónimos diagnóstico Embolia pulmonar
Acrónimo TEP
Taxonomía de Vocabulario
Especializaciones del diagnóstico Cor pulmonar secundario a embolia pulmonar
Generalizaciones del diagnóstico Tromboembolismo pulmonar
Exámenes confirmatorios (Si existen)
Nombre formal del examen Angiotomografía pulmonar
Nombre informal del examen AngioTac pulmonar
Exámenes Asociados Nombre formal del examen Doppler venoso de Miembros inferioresEcocardiograma
Nombre informal del examen Doppler de MMIRx de Tórax
Síntomas Síntomas característicos por género (en lenguaje científico, formal e informal)
TaquicardiaTaquipnea
Síntomas característicos por etapa de vida (en lenguaje científico, formal e informal)
Presencia de Hipotermia
Medicamentos Nombre Formal EnoxaparinaDalteparina
Nombre Genérico MetoprololDobutamina
Tratamiento Nombre Tratamiento Trombolisis
Antecedentes Antecedentes y Factores de Riesgo Trombofila
Complicaciones o desenlaces Falla cardíaca derecha
Elementos de Exclusión (si existen)
Términos excluyentes Angiotac negativo
Frases típicas de descarte que incluyan nombre del diagnóstico Se descarta TEP
EVALUACIÓN FUNCIONALRESULTADOS
Enfermedad HCE Relevantes
HCE Positivas
Total Relevantes
Precisión Exhaustividad
TEP 26 25 26 0,96 1
DM 36 33 36 0,91 1
HiPul 11 12 11 0,92 1
• Enfermedades:– Tromboembolismo
Pulmonar.– Hipertensión
Pulmonar.– Diabetes Mellitus.
• Preselección:– Hombre y mujer.– Mayores de edad.– Se limito a 1581.
• Resultados:– 150 HCE analizadas
cada hora y media.
CONCLUSIONES Y TRABAJO FUTURO
• Reducir los tiempos y aumentar la precisión en los resultados de las investigaciones médicas retrospectivas.
• Permitir al investigador médico dedique mayores esfuerzos al análisis de las historias clínicas con fines diferentes a la identificación de enfermedades.
• Lograr una mejora gradual en la calidad de vida de los pacientes con enfermedades crónicas.
CONCLUSIONES Y TRABAJO FUTURO
• Ofrecer la funcionalidad de detección de errores ortográficos al momento del análisis de texto narrativo, esto con el fin de mejorar la identificación de términos médico en las historias clínicas.
• Analizar dentro de los campos estructurados los resultados de exámenes y valores en las fórmulas médicas, y con base en reglas poder tener más elementos de juicio para identificar una enfermedad en una historia Clínica Electrónica.
BIBLIOGRAFÍA
• Chapman, W.W., Bridewell, W., Hanbury, P., Cooper, G.F., Buchanan, B.G.: A simple algorithm for identifying negated ndings and diseases in discharge summaries.Journal of Biomedical Informatics 34 (2001).
• Averbuch, M., Karson, T.H., Ben-Ami, B., Maimon, O., Rokach, L.: Contextsensitivemedical information retrieval. Studies in health technology and informatics107 (2004)
• Rokach, L., Romano, R., Maimon, O.: Negation recognition in medical narrative reports. Information Retrieval 11 (2008) 499{538 10.1007/s10791-008-9061-0.
• Han, H., Choi, Y., Choi, Y.M., Zhou, X., Brooks, A.D.: A generic framework: From clinical notes to electronic medical records. Computer-Based Medical Systems, IEEE Symposium on 0 (2006)
• Huang, M.J., Chen, M.Y., Lee, S.C.: Integrating data mining with case-based reasoning for chronic diseases prognosis and diagnosis. Expert Syst. Appl. 32 (2007) 856{867
• Zhou, X., Han, H., Chankai, I., Prestrud, A., Brooks, A.: Approaches to text mining for clinical medical records. In: Proceedings of the 2006 ACM symposium on Applied computing. SAC '06, New York, NY, USA, ACM (2006) 235{239
• Antal, P., Verrelst, H., Timmerman, D., Huel, S.V., de Moor, B., Vergote, I.: Bayesiannetworks in ovarian cancer diagnosis: Potentials and limitations. Computer- Based Medical Systems, IEEE Symposium on 0 (2000) 103
• Spasic, I., Ananiadou, S., McNaught, J., Kumar, A.: Text mining and ontologies in biomedicine: Making sense of raw text. Briengs in Bioinformatics 6 (2005)• Breault, J.L., Goodall, C.R., Fos, P.J.: Data mining a diabetic data warehouse. Articial Intelligence in Medicine 26 (2002)• Seyfried, L., Hanauer, D.A., Nease, D., Albeiruti, R., Kavanagh, J., Kales, H.C.: Enhanced identication of eligibility for depression research using an
electronic• medical record search engine. International Journal of Medical Informatics 78 (2009)• Antal, P., de Moor, B., Meszaros, T., Dobrowiecki, T.: Annotated bayesian networks: A tool to integrate textual and probabilistic medical knowledge. In:
Proceedingsof the Fourteenth IEEE Symposium on Computer-Based Medical Systems. CBMS '01, Washington, DC, USA, IEEE Computer Society (2001) 177{
• Claster, W., Shanmuganathan, S., Ghotbi, N.: Text mining of medical records for radiodiagnostic decision-making. JCP 3 (2008) • Kusiak, A., Dixon, B., Shah, S.: Predicting survival time for kidney dialysis patients: a data mining approach. Computers in Biology and Medicine 35 (2005)• Zhou, X., Han, H., Chankai, I., Prestrud, A.A., Brooks, A.D.: Converting semistructured clinical medical records into information and knowledge. In:
Proceedings of the 21st International Conference on Data Engineering Workshops. ICDEW '05, Washington, DC, USA, IEEE Computer Society (2005) 1162{• Hripcsak, G., Knirsch, C., Zhou, L., Wilcox, A., Melton, G.B.: Using discordance to improve classication in narrative clinical databases: An application to
communityacquired pneumonia. Comput. Biol. Med. 37 (2007) • Ginter, F., Suominen, H., Pyysalo, S., Salakoski, T.: Combining hidden markov models and latent semantic analysis for topic segmentation and labeling:
Method and clinical application. I. J. Medical Informatics 78 (2009)
Gracias.
?