building and managing knowledge graphs · building and managing knowledge graphs —wolf-tilo balke...

Post on 07-Jul-2020

2 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Institut für InformationssystemeTechnische Universität Braunschweig

Building and Managing Knowledge Graphs

Jan-Christoph Kalo and Wolf-Tilo Balke

What is a Knowledge Graph?

2Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

• Knowledge graphs are structured informationrepositories– They contain entity-centric knowledge

• Knowledge graphs support severalapplications– Web search, question answering, machine

reading, recommendation

Representing Knowledge as a Graph

3

Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig Niedersachsen

Hannover

1946

Ulrich Markuth

248.292

gegründetLand

esha

upts

tadt

Bundesland

Bürgermeister

Einwohner

(Braunschweig, Bürgermeister, Ulrich Markuth)(Braunschweig, Bundesland, Niedersachsen)(Braunschweig, Einwohnerzahl, 248.292)(Niedersachsen, Landeshauptstadt, Hannover)(Niedersachsen, gegründet, 1946)(Ulrich Markuth, typ, Politiker)

• Knowledge is represented in subject, predicate, objecttriples called facts– Nodes represent entities, classes or literals– Edges represent relationships

Politiker

typ

• This seminar is about essential techniques for:– Building knowledge graphs by extracting information from

natural language texts• Entity Linking• Relation Extraction

– Managing large knowledge graph data• Ontology Alignment• Instance Matching• Rule Mining• Knowledge Graph Embeddings• Type Inference• Measuring Knowledge Graph Completeness

Seminar Topics

4Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

• Entity Linking is– Recognizing entity mentions in text, disambiguating and

linking it to the corresponding entity in a KG

Entity Linking

5Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig ist eine Großstadt im Südosten des Landes Niedersachsen. Mit 248.292 Einwohnern (Stand 31. Dezember 2018) ist sie nach Hannover die zweitgrößte Stadt Niedersachsens.

Braunschweig Niedersachsen

Hannover

1946

Ulrich Markuth

248.292

gegründetLand

esha

upts

tadt

Bundesland

Bürgermeister

Einw

ohne

r

• Given a knowledge graph and a text, we want to extract subject, predicate, object triples– Words from text have to be mapped to concepts in the

knowledge graph

Relation Extraction

6Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig ist eine Großstadt im Südosten des Landes Niedersachsen. Mit 248.292 Einwohnern (Stand 31. Dezember 2018) ist sie nach Hannover die zweitgrößte Stadt Niedersachsens. Die kreisfreie Stadt bildet mit den Städten Salzgitter und Wolfsburg eine Regiopolregion und eines der neun Oberzentren des Bundeslandes. Sie ist Teil der im Jahr 2005 gegründeten Metropolregion Hannover-Braunschweig-Göttingen-Wolfsburg.

(Braunschweig, ist, Großstadt)(Braunschweig, Bundesland, Niedersachsen)(Braunschweig Einwohnerzahl 248.292)(Hannover, Bundesland, Niedersachsen)

• Integrate several knowledge graphs into a singleknowledge graph– Find a matching between classes and relationships of two

knowledge graphs

Ontology Alignment

7Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig Niedersachsen

Bundesland

Stadt

typ

Liegt in

typ

Braunschweig Niedersachsen

Land

Großstadt

typ

bundeslandtyp

land

Deutschland

Bundesland

• Matching instances from two heterogeneous knowledgegraphs

Instance Matching

8Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig Niedersachsen

Hannover

1946

Ulrich Markuth

248.292

gegründetLand

esha

upts

tadt

Bundesland

Bürgermeister

Einw

ohne

r Stadt Braunschweig

Niedersachsen

Hannover

1.11.1946

Markuth, Ulrich

861

gegründet

Grö

ßte

Stad

t

Bundesland

Oberbürgerm

eister

gegr

ünde

t

Präs

iden

t

Weil, Stephan

• Mine logical rules from large knowledge graphs– Rules may be used to infer new knowledge

𝐵ü𝑟𝑔𝑒𝑟𝑚𝑒𝑖𝑠𝑡𝑒𝑟(𝑥, 𝑦)⋀Land(y, z) ⇒ 𝑆𝑡𝑎𝑎𝑡𝑠𝑏ü𝑟𝑔𝑒𝑟𝑠𝑐ℎ𝑎𝑓𝑡(𝑥, 𝑧)

Rule Mining in Knowledge Graphs

9Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig Deutschland 82,79 Millionen

Ulrich Markuth

248.292

EinwohnerzahlH

aupt

stad

tLand

Bürgermeister

Einw

ohne

r

Berlin

Staatsbürgerschaft

• Embed entities and relationships from knowledge graphsinto vector spaces– Vectors can be used to measure semantic similarities and

to predict new facts

Knowledge Graph Embeddings

10Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig

Niedersachsen

TU Braunschweig

Bundesland

Lieg

t in

Braunschweig

Niedersachsen

TU Braunschweig

Bunde

sland

Liegt in

Rostock Mecklenburg-Vorpommern

Bundesland

Mecklenburg-Vorpommern

Bunde

sland

Rostock

• Automatically learn entity types from a knowledge graph

Type Inference in Knowledge Graphs

11Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Braunschweig Niedersachsen

Hannover

1946

Ulrich Markuth

248.292

gegründetLand

esha

upts

tadt

Bundesland

Bürgermeister

Einw

ohne

r Braunschweig Niedersachsen

Hannover

1946

Ulrich Markuth

248.292

gegründetLand

esha

upts

tadt

Bundesland

Bürgermeister

Einw

ohne

r

Stadttyp

Politiker

typ

Stadt

typ

Bundesland

typ

• Predict missing facts in a knowledge graph to assess itscompleteness– Having a date of death, but having no death place, implies a

missing fact

Measuring Knowledge Graph Completeness

12Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

Heinrich der Löwe Welfen

Braunschweig

6.8.1195

Adelsgeschlecht

Ges

torb

en a

m

Gestorben in

Richard Löwenherz

Haus Plantagenet6.4.1199AdelsgeschlechtGestorben am

What is a Good Talk?

13Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig 13

A Good Talk

Gestures

Examples

Eye Contact

IntroductionInteraction

Conclusion

Pace

…and more!

Course of Action

14Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

24.10.

07.11.

14.11.

21.11.

28.11.

05.12.

12.12.

19.12.

09.01.

16.01.

23.01.

30.01.

06.02.

Introduction and Assignment of topics

Analyzing talks 1

8 Talks with Extensive Feedback

Analyzing talks I1

Presentation Training I

Presentation Training I1

• Building knowledge graphs by extracting informationfrom natural language texts– Entity Linking– Relation Extraction

• Managing large knowledge graph data– Ontology Alignment– Instance Matching– Rule Mining– Knowledge Graph Embeddings– Type Inference– Measuring Knowledge Graph Completeness

Choose your topic!

15Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

• We offer:– Guidance and Support– Active Discussion– Honest and constructive Feedback– Exciting Topics

• We require:– Intensive preparation of your own talk– Active participation– Attendance at all seminar dates– No written report

Conclusion

16Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig

top related