development of text mining based classification of written ......3-keyword klassifikator svm...

14
Development of Text Mining Based Classification of Written Communication within a Telemedical Collaborative Network K. Gruber 1,* , R. Modre-Osprian 1 , K. Kreiner 1 , P. Kastner 1 , G. Schreier 1 1 AIT Austrian Institute of Technology GmbH, Safety & Security Department, Assistive Healthcare Information Technology, Graz, Austria * Kontakt: [email protected]

Upload: others

Post on 26-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Development of Text Mining Based Classification

of Written Communication within a Telemedical

Collaborative Network

K. Gruber1,*, R. Modre-Osprian1, K. Kreiner1, P. Kastner1, G. Schreier1

1 AIT Austrian Institute of Technology GmbH, Safety & Security Department, Assistive

Healthcare Information Technology, Graz, Austria

* Kontakt: [email protected]

Page 2: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Projekt HerzMobil Tirol

Versorgungsprogramm für Herzschwäche Patienten

Interdisziplinäre Kollaboration:

2 24.06.2015

Page 3: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Notizen als Mittel zur Kollaboration

Proof-of-Concept Phase mit 47 Patienten und 1.564 Notizen (55.737

Wörter)

Zusätzliche wichtige Informationen über den Patienten für dessen weitere

Behandlung

Evaluierung dieser Phase bestätigte hohe Bedeutung der textuellen

Information

Eine automatische Analyse dieser textuellen

Kommunikation wäre hilfreich.

3 24.06.2015

Beispielnotiz: Telefonat mit Frau Huber und Tochter Maria: Pat. isst mehr und fühlt

sich stärker – GW-Zunahme damit zu erklären, hat keine Beinödeme; darauf

hingewiesen, dass Medi. (40 mg) bestätigt werden soll.

Page 4: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Analysepipeline

4 24.06.2015

Page 5: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Analysepipeline – Preprocessing

5 24.06.2015

Page 6: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Preprocessing Schritte

6 24.06.2015

De-Identifikation: Telefonat mit Frau Patient<1458> und Tochter M: Pat. isst

mehr und fühlt sich stärker – GW-Zunahme damit zu erklären, hat keine

Beinödeme; darauf hingewiesen, dass Medi. (40 mg) bestätigt werden soll.

Normalisierung: Telefonat mit Frau Patient<1458> und Tochter M: Patient

isst mehr und fühlt sich stärker – Gewichtszunahme damit zu erklären, hat

keine Beinödeme; darauf hingewiesen, dass Medikation (40 mg) bestätigt

werden soll.

Notizenschnipsel 1: Telefonat mit Frau Patient<1458> und Tochter M:

Patient isst mehr und fühlt sich stärker – Gewichtszunahme damit zu

erklären, hat keine Beinödeme

Notizenschnipsel 2: darauf hingewiesen, dass Medikation (40 mg) bestätigt

werden soll

Page 7: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Analysepipeline – Datensatz Annotierung

7 24.06.2015

Page 8: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Annotationsergebnisse

8 24.06.2015

Statusinformation Annotierte Notizenschnipsel

Allg. Gesundheitszustand 1.388

Häusliches Umfeld 298

Compliance 295

Selbstständigkeit 285

Statusinformation Annotierte Notizenschnipsel

Allg. Gesundheitszustand 1.388

Häusliches Umfeld 298

Compliance 295

Selbstständigkeit 285

Aufgabe Annotierte Notizenschnipsel

Organisatorischer Task 362

Patientendeaktivierung 252

Medikationsanpassung 242

Hausbesuch 153

Technischer Helpdesk 136

Urlaubsvertretung 36

Page 9: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Analysepipeline – Feature Selektion

9 24.06.2015

Page 10: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Analysepipeline – Evaluierung

10 24.06.2015

Page 11: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Evaluierungsergebnisse

11 24.06.2015

Aufgaben 3 - Keyword Klassifikator SVM Klassifikator

Precision Recall F - Measure Precision Recall F - Measure

Hausbesuch 0,39 0,86 0,54 0,73 0,73 0,73

Patientendeaktivierung 0,30 0,23 0,26 0,60 0,55 0,58

Technischer Helpdesk

0,18 0,20 0,19 0,39 0,37 0,38

Medikationsanpassung 0,37 0,49 0,42 0,44 0,40 0,42

Organisatorische

Aufgabe

0,41 0,29 0,34 0,43 0,37 0,40

Urlaubsvertretung 0,34 0,64 0,46 0,47 0,28 0,35

Statusinformationen 3 - Keyword Klassifikator SVM Klassifikator

Precision Recall F - Measure Precision Recall F - Measure

Allg. Gesundheitszustand 0,91 0,12 0,21 0,80 0,71 0,76

Selbstständigkeit 0,92 0,99 0,95 0,56 0,40 0,47

Häusliches Umfeld 0,18 0,30 0,22 0,51 0,37 0,43

Compliance 0,23 0,04 0,06 0,28 0,23 0,25

Page 12: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Diskussion

Varianz bei der Anzahl an annotierten Notizen

Probleme bei der Annotierung der Kategorie „Compliance“

Für „Selbstständigkeit“ erzielte der 3-Keyword Klassifikator höhere Werte

In den meisten Kategorien erreichte der SVM-Klassifikator bessere Werte

als der einfache 3-Keyword Klassifikator

12 24.06.2015

Page 13: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

Schlussfolgerung

Klassifikatoren zur Extraktion von Statusinformationen und Aufgaben in den

unstrukturierten Textinformationen konnten gefunden werden

Großteil der Schritte der Pipeline erfolgten automatisch, vereinzelt manuelle

Interaktionen notwendig

Einsatz von Klassifkatoren in einem produktiven Netzwerk

Einsatz der Pipeline in anderen Telemonitoringsystemen um Adaptierbarkeit

für andere chronische Erkrankungen zu testen

13 24.06.2015

Ausblick

Page 14: Development of Text Mining Based Classification of Written ......3-Keyword Klassifikator SVM Klassifikator Precision Recall F-Measure Precision Recall F-Measure Allg. Gesundheitszustand

AIT Austrian Institute of Technology your ingenious partner

Katharina Gruber

[email protected]

AIT Austrian Institute of Technology GmbH

Assistive Healthcare Information Technology

Safety & Security Department

Reininghausstraße 13/1, 8020 Graz

www.ait.ac.at/eHealth