germanet und uninet: ankn pfen an semantische netze...partielles indirektes indizieren des uninets...
TRANSCRIPT
![Page 1: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/1.jpg)
1
GermaNet und UniNet:Anknüpfen an semantische Netze
Simon ClematideInstitut für Computerlinguistik
Universität Zürich
![Page 2: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/2.jpg)
2
Überblick
UniNetInhalt, Struktur, Charakteristik
Vergleichende Mini-Evaluationen der AbdeckungHäufigste und zufällig gewählte Substantive: Germa- vs. UniNet
Verknüpfen von semantischen NetzenProblem und 3 Szenarien
Abgleich von Netz-Versionen
Integration von multilingualen Netzen
Integration von Teil-Netzen
Vom ILI zum INI: Interlingual-Index als ParadigmaAnknüpfen durch sparsames, explizites Indizieren
![Page 3: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/3.jpg)
3
UniNet (1999)
Ein deutsch(-schweizerisch-)es semantisches NetzSachgebiet: HochschulenStruktur: à la GermaNet
Lexikalischer Bestand
21'901 einteilige Substantive73 einteilige Eigennamen1'199 mehrteilige Substantive494 mehrteilige Eigennamen
Semantischer Bestand
12'385 Synonymklassen6'996 Synonymklassen haben mehr als 1 Oberbegriff22'514 Oberbegriffsbeziehungen2'648 Teil-Ganzes-Beziehungen
Inhalt: Weder mit GermaNet 1999 noch 2001 kompatibel…
![Page 4: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/4.jpg)
4
UniNet: special effects…
Automatisches Weiterspinnen des Netzes durch Wortbildungsmuster
Ca. 550 Bezeichnungen für Studienfächer und -gebieteund eine Handvoll Kompositabestandteile
Erstglieder wie "Hauptfach…"
Letztglieder wie "…professorin"
ergeben viele neue Synonymklassenmit den entsprechenden semantischenRelationen!
Problem: Übergenerierung im Stil von"Hauptfachkatastrophenmedizinstudentin"…
Rechtswissenschaft
Privatrecht Staatsrecht
@ @
+…"professorin"
=
Rechtswissenschafts-professorin
Privatrechts-professorin
@Staatsrechts-professorin
@
@
![Page 5: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/5.jpg)
5
Mini-Evaluation der Abdeckung I
12 häufigste Wortformen (9 Grundformen)in einem hochschulspezifischen Korpus (350 Sätze)GermaNet 01 und UniNet decken zusammen alle 9 Grundformen ab
"Studierende" fehlt in GN 01, "Paragraph" in UN
SynonymklassenZudem: Wegen der Mehrfachvererbung der Ober-begriffsrelation, gilt die Gleichung
1 Synset = 1 Lesartaus WordNet nicht mehr.
9876543210
Grundformen
UniNetGermaNet 01GermaNet 99
121086420
Synsets
![Page 6: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/6.jpg)
6
Mini-Evaluation der Abdeckung II
100 unterschiedliche zufällig gewählte Substantive21 Wörter im GN, aber nicht im UN
Aber nur 3 aus engerem Anwendungsgebiet von UN!
16 Wörter im UN, aber nicht im GN15 aus engerem Anwendungsgebiet von UN
Im Detail recht unterschiedliche Synonymklassen!UN liefert 82 Synonymklassen für 68 Wörter (1,2 W/S)GN liefert 126 Synonymklassenfür 73 Wörter (1,7 W/S)
100806040200
36
37
27UnbekanntNur GNUN & GN
100806040200
36
32
32UnbekanntNur UNUN & GN
Abdeckungsgrade
![Page 7: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/7.jpg)
7
Verknüpfen von semantischen Netzen
Utopie: Plug-And-Play mit semantischen NetzenAllgemeines Netz für Grundwortschatz und ontologische Grob-Organisation
GermaNet ist z.T. zu spezifisch und ohne Metainformation dazu!
Spezialisierte Netze für Anwendungsgebiete mit terminologischen Beständen und named entities
UniNet ist in der allgemeineren Strukturierung eine Insellösung!
Problem: Integration bestehender RessourcenSemantische Netze sind "selbstorganisierend" (leicht autistisch)
LösungsansätzeHandarbeit vs. Halbautomatisierung vs. Vollautomatisierung
![Page 8: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/8.jpg)
8
Szenario I: Netz-Versionen
Integration von unterschiedlichen Versionen desselben Netzes
Beispiel: Mapping von WordNet 1.5 zu WordNet 1.6 Vollautomatisch machbar (relaxation labelling) [Daudé et al. 01]
Direktes Verknüpfen von Netz-Elementen
Wichtige EigenschaftenHohe Strukturähnlichkeit
Grosse lexikalische Überschneidung
Direktes Verknüpfen
![Page 9: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/9.jpg)
9
Szenario II: Multilinguale Netze
Integration von Netzen über ähnlichem Grundwortschatz in verschiedenen Sprachen
Beispiel: EuroWordNet – Interlingual IndexWenig Automatisierungsmöglichkeit!
Indirektes Verknüpfen auf Referenzgrösse
Wichtige Eigenschaftenstabile Referenzgrösse
dokumentierte Grob-Ontologie
Nicht jedes Element des Netzes mussverknüpft sein
Indirektes Verknüpfen
![Page 10: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/10.jpg)
10
Szenario III: Teil-Netze
Integration von spezifischeren Netzen in allgemeinereBeispiele
Manuelles Einhängen kompakter Netzteile
Halbautomatisches Integrieren von Netzen [Magnini et al. 02]
Automatische Integration von zusätzlicher Terminologie [Buitelaar et al. 02]
Wichtige EigenschaftenOntologische Tiefe des spezifischeren Netzes
Gemeinsame Lexik@ @
@ @
Identifizieren von Anknüpfungspunkten
![Page 11: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/11.jpg)
11
Fazit: GermaNet und UniNet
Kritische Kriterien? Gemeinsame Lexik? Strukturähnlichkeit? Stabilität und ontologische Explizitheit von GermaNet
IdeePartielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verknüpft sind.inter-lingual index wird als inter-net index verwendet.
ProblemeVerfügbarkeit der GermaNet-seitigen ILI…
![Page 12: GermaNet und UniNet: Ankn pfen an semantische Netze...Partielles indirektes Indizieren des UniNets auf ILIs, welche mit GermaNet verkn pft sind. inter-lingual index wird als inter-net](https://reader035.vdocuments.net/reader035/viewer/2022070219/6128f4e7de53d722b3535f67/html5/thumbnails/12.jpg)
12
Schluss
OderLösen sich die klassischen semantischen Netze sowieso in moder-neren Formen und Formaten der semantischen Repräsentation ontologischer, begrifflicher und terminologischer Begebenheiten auf?