© 2003 ontoprise gmbh semantisches knowledge retrieval am beispiel des semanticminer™ wm2003...
TRANSCRIPT
© 2003 ontoprise GmbH
Semantisches Knowledge Retrievalam Beispiel des SemanticMiner™WM2003 Luzern, 03.04.2003
Eddie Mönch
2© 2003 ontoprise GmbH
Agenda – Semantisches Knowledge Retrieval
• Wissensmodelle• Knowledge Retrieval• Kollokationsanalyse
3© 2003 ontoprise GmbH
Wissensmodelle
Ontologien
TopicMaps
extended ER-Modell
Thesauri
Prädikatenlogik
Semantische Netze
Taxonomien
Menu
4© 2003 ontoprise GmbH
TaxonomieObjekt
Person Thema Dokument
AkademikerStudent Semantik
OntologieDoktorand
Taxonomie := Segmentierung, Klassifikation und Einordnung von Elementen in ein Kategoriensystem anhand ihrer definierten Beziehungen zueinander
PhD Student F-Logic
Menu
5© 2003 ontoprise GmbH
ThesaurusObjekt
Person Thema Dokument
AkademikerStudent Semantik
PhD StudentDoktorand
• Terminologie zu best. Domäne, keine Instanzen• Graph mit Primitiven, 2 feste Relationen (ähnlich, Synonym) • kommen ursprünglich aus der Bibliographie
ähnlichSynonym
OntologieF-Logic
Menu
6© 2003 ontoprise GmbH
Topic MapObjekt
Person Thema Dokument
AkademikerStudent Semantik
PhD StudentDoktorand
kennt behandelt_in
schreibt
NameAlter
• Topics (Knoten), Relationen und Occurences (zug. Dokumenten)• ISO-Standard• meist für Navigation- und Visualisierung eingesetzt
OntologieF-Logic
ähnlichSynonym
Menu
7© 2003 ontoprise GmbH
Ontologie (in unserem Sinne)Objekt
Person Thema Dokument
AkademikerStudent Semantik
Ontologie
NameAlter
PhD StudentDoktorand
kennt behandelt_in
schreibt
ähnlich
F-Logic
Synonym
Menu
8© 2003 ontoprise GmbH
Ontologie (in unserem Sinne)Objekt
Person Thema Dokument
AkademikerStudent Semantik Ontologie
NameAlter
PhD StudentDoktorand
kennt behandelt_in
schreibt
behandelt_in zu_Thema
kenntP schreibt D zu_Thema T P T
DT T D
Regeln
ähnlich
F-Logic
Unterthema
York Sure
York31
• Repräsentationssprache: Prädikatenlogik, nämlich F-Logic,• entstehende Standards sind: RDF, DAML+OIL, OWL
Menu
9© 2003 ontoprise GmbH
Ontologie (in unserem Sinne)Objekt
Person Thema Dokument
AkademikerStudent Semantik Ontologie
NameAlter
PhD StudentDoktorand
kennt behandelt_in
schreibt
behandelt_in zu_Thema
kenntP schreibt D zu_Thema T P T
DT T D
Regeln
ähnlich
F-Logic
Unterthema
York Sure
York31
• Repräsentationssprache: Prädikatenlogik, nämlich F-Logic,• entstehende Standards sind: RDF, DAML+OIL, OWL
Menu
10© 2003 ontoprise GmbH
Ontologie (in unserem Sinne)Objekt
Person Thema Dokument
AkademikerStudent Semantik Ontologie
PhD StudentDoktorand
F-Logic
A
B C Drel2 rel1
rel3
• Mapping auf Datenbanken und andere Ontologien• Instanzen werden bei Bedarf angefragt
Menu
11© 2003 ontoprise GmbH
Abgrenzung gegenüber relationalen Datenbanken
Relationale Datenbank Ontologie
Regeln
Vererbung
Veränderung der Struktur
Nicht möglich, muss in Applikation einprogrammiert werden
auf beliebiger Abstraktionsebene möglich
Nicht möglich, muss in Applikation einprogrammiert werden
Applikation muss geändert werden
Regel gilt für alle Unterkonzepte
Modell wird angepasst, Applikation muss nicht angepasst werden.
Menu
12© 2003 ontoprise GmbH
Agenda – Semantisches Knowledge Retrieval
• Wissensmodelle• Knowledge Retrieval• Kollokationsanalyse
13© 2003 ontoprise GmbH
&Vom Information- zum Knowledge Retrieval
• Gemeinsame Begrifflichkeit
• Logische Regeln
Knowledge Retrieval
Information Retrieval
SEMANTIK
WIR
KLIC
HKE
IT A
NSP
RUCH
FRAGE: Which Operating Systems are supported by this Tool?
ANTWORT
14© 2003 ontoprise GmbH
&Vom Information- zum Knowledge-Retrieval
• Gemeinsame Begrifflichkeit
• Logische Regeln
Knowledge Retrieval
Information Retrieval
SEMANTIK
Knowledge Retrieval
• Semantische Netze• Ontologien• TopicMaps
WIR
KLIC
HKE
IT A
NSP
RUCH
Information Retrieval ++
• Vorhandene Strukturen einbinden
• Lösungen für Kernprozesse
15© 2003 ontoprise GmbH
Bewertung von Retrieval-Systemen
Dokumentenbestand
Anzahl aller relevanten
Dokumente |(I)|
Anzahl aller gefundenen
Dokumente |(I)|
Anzahl aller relevanten, gefundenen Dokumente
|(q,I)|
• Recall = |(q,I)| / |(I)|• Precision = |(q,I)| / |(I)|
16© 2003 ontoprise GmbH
Bewertung des Knowledge Retrieval
Entwicklung der IR-Systeme „stagniert“ seit den letzten 5 Jahren (siehe TREC-Konferenzen)
Effiziente Verbesserung durchOntologie-basierten Query-Expansion Ansatz: Verbesserung von Recall
– es werden mehr relevante Dokumente gefunden Verbesserung der Precision
– Durch spezielles Ranking-Verfahren werden relevantere Dokumente hoch gerankt Erhöhung der „subjektiven Precision“,
da Benutzer nur ca. max. 20-30 der gefundenen Dokumente durchschauen
17© 2003 ontoprise GmbH
Beispiel einer Query Expansion
18© 2003 ontoprise GmbH
Navigation & Integration
19© 2003 ontoprise GmbH
Agenda – Semantisches Knowledge Retrieval
• Wissensmodelle• Knowledge Retrieval• Kollokationsanalyse
20© 2003 ontoprise GmbH
Kollokationsanalyse
• Kollokation (in unserem Sinne):Signifikantes Vorkommen zweier Muster (Wortformen) in einem gemeinsamen Kontext (unmittelbare Nachbarschaft)
• Kollokationsanalyse– Statistischer Ansatz (nicht syntaktisch)– Nachbarschaftskollokation
• Beispiel(Hund : bellen), (dunkel : Nacht)
21© 2003 ontoprise GmbH
Anwendung der Kollokationsanalyse
Integration (semi)strukturierter Daten:• Bildung der Kollokation von
(Suchbegriffe+Query Expansion : Daten)• Signifikanzmaß gibt Antwort auf Fragestellung:
Welche Unternehmen sind im Multimedia Markt tätig?
Wer kennt sich mit dem SemanticMiner aus?
22© 2003 ontoprise GmbH
SemanticMiner Architektur – modular
DBMS Index-server
WWWSearchEngines
Clients
Semantic Middleware
Data Sources
SemanticMiner(Wissensprozess)
Zope
Ontology-Server(frontside cached)
WWW-BrowserOntoEdit™
Information Retrieval
Web-Application Server
SemTalk
Search-Server(distributed)
Web-service interface Middleware
Wissensmetaprozess
23© 2003 ontoprise GmbH
Ausblick• Verbesserung des KR
– Clustering, Klassifikation der Ergebnisse• (semi)automatische Ontologie-Erweiterung
– Kollokationsanalyse• Ergebnisse für Ontologie-Erweiterung
z.B. Zuordnung von Begriffen zu Sachgebieten einer Ontologie (Kohyponyme) ([Konzept] : X)
• Ermittlung von Synonymen• Lernen von Relationen
– Adaptive Informations-Extraktion– Kombination verschiedener Extraktionsverfahren
• Anbindung neuer Datenquellen (Konnektoren)(PubMed, Morphologische Komponente, …)
• Integration in vorhandene IT-Systeme / Portale• … Vorschläge ?
24© 2003 ontoprise GmbH
Vielen Dank für Ihre Aufmerksamkeit!
www.ontoprise.de