von der ein-datenbank-suche zum verteilten suchszenario: zum aufbau von crosskonkordanzen zwischen...
Post on 05-Jul-2015
174 Views
Preview:
DESCRIPTION
TRANSCRIPT
Von der Ein-Datenbank-Suche
zum verteilten Suchszenario Zum Aufbau von Crosskonkordanzen zwischen
der Fachklassifikation Sozialwissenschaften
und der Dewey-Dezimalklassifikation
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013
Dr. Andreas Oskar Kempf, M.A.(LIS)
Katrin Baum, Dipl.-Bibl.
GESIS – Leibniz-Institut für Sozialwissenschaften
Gliederung
Definition und Nutzen von Crosskonkordanzen
Vorstellung der verwendeten Klassifikationssysteme
Klassifikation Sozialwissenschaften (KlassSoz)
Dewey-Dezimalklassifikation (DDC)
Zum Vorgehen beim Crosskonkordanz-Aufbau
Relations- und Relevanztypen
Einfache und mehrfache Relationen
Exemplarische Klassenabbildungen
Gesamtübersicht und Ausblick
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 2
Definition Crosskonkordanzen
Crosskonkordanzen bezeichnen im Kontext der Inhaltserschließung Beziehungen zwischen Konzepten unterschiedlicher Erschließungssysteme (z.B. Thesaurus, Klassifikation). Die Beziehungen werden bilateral und somit richtungsabhängig festgelegt.(z.B. KlassSoz > DDC; DDC > KlassSoz).
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 3
Anwendungsszenario
Crosskonkordanz-Aufbau KlassSoz > DDC
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 4
KlassSoz
DDC DDC
SOLIS DNBKatalog SOLIS DNB
Katalog
RelationstypenSKOS-Mapping-Relationen
skos:exactMatch-Relation (A=B): Klasseninhalt Zielklassifikation (B) ist mit Klasseninhalt der Ausgangsklassifikation (A) identisch
skos:broadMatch-Relation (A<B): Klasseninhalt der Zielklassifikation (B) ist weiter gefasst als der Klasseninhalt der Ausgangsklassifikation (A)
skos:narrowMatch-Relation (A>B):Klasseninhalt der Zielklassifikation (B) ist enger gefasst als der Klasseninhalt der Ausgangsklassifikation (A)
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 5
Relevanztypen
Hohe Relevanz für das Retrieval: Klasseninhalt der Ausgangsklassifikation ist zentraler Klasseninhalt der Zielklassifikation
Mittlere Relevanz für das Retrieval:
Klasseninhalt der Ausgangsklassifikation ist ein nachrangiger, wenngleich nicht marginaler Bestandteil des Klasseninhalts der Zielklassifikation
Geringe Relevanz für das Retrieval:Klasseninhalt der Ausgangsklassifikation ist nur ein marginaler Bestandteil des Klasseninhalts der Ausgangsklassifikation
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 6
Klassifikation Sozialwissenschaften (KlassSoz)
Fachklassifikation in dieser Form seit 1996 für die GESIS Literatur- und Projekt-datenbank (SOLIS/SOFIS) verwendet
159 Klassen (5 Haupt- und 154 Unterklassen)
3 Hierarchieebenen
Variable Anzahl an Unterklassen
Vergabepraxis: 1 Hauptnotation und variable Anzahl an Nebennotationen
Klassifikation Sozialwissenschaften (KlassSoz)
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 9
Dewey-Dezimalklassifikation (DDC)
Universalklassifikation1873 von Melvil Dewey entwickelt und 1876 erstmals veröffentlichtwird in über 200.000 Bibliotheken in über 135 Länder verwendet
in über 30 Sprachen übersetzt
seit 2005 auch von der DNB verwendet
ca. 27.000 Klassen in den Haupttafelnca. 9.500 Klassen in den Hilfstafelnder Aufbau entspricht dem Dezimalsystem, d.h. max. 10 Unterklassen
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 10
Dewey-Dezimalklassifikation (DDC)
Crosskonkordanz-Aufbau
Einfache Relationen: für die Abbildung
der Klasseninhalte aufeinander wird
ausschließlich eine Relation verwendet
Mehrfache Relationen: für die Abbildung
der Klasseninhalte aufeinander werden
mehrere Relationen aufgebaut
(1:n-Relation, n:1-Relation)
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 11
Einfache Relationen (1/3)
Beispiel: skos:exactMatch-Relation
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 12
=: kongruente Klasseninhalte
h: Klassen-inhalt KlassSoz deckt sich sehr gut mit DDC-Klasse
Einfache Relationen (2/3)
Beispiel: skos:broadMatch-Relation
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 13
<: DDC-Klassen-inhalt ist weiter gefasst als Klas-seninhalt Klass-Soz
m: nur ein Teil des KlassSoz-Klasseninhaltsfindet sich in DDC-Klasse wieder
Einfache Relationen (3/3)
Beispiel: skos:narrowMatch-Relation
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 14
>: DDC-Klasseist enger ge-fasst als Klass-Soz-Klasse
m: Klassen-inhalt KlassSoz findet sich nurzu einem ge-wissen Teil in DDC-Klasse
Mehrfache Relationen (1/2)
Beispiel: 1:n-Relation
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 15
>/>: Inhalt der KlassSoz-Klasse findet sich in beiden DDC-Klassen
h/m: Inhalt der KlassSoz-Klasse deckt sich deutlich stärker mit der obigen DDC-Klasse
Mehrfache Relationen (2/2)
Beispiel: n:1-Relationen
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 16
</<: die Inhalte beider KlassSoz-Klassen sind in der DDC-Klasse enthalten
m/m: beide KlassSoz-Klassen machen ca. die Hälfte der DDC-Klasse aus
Gesamtübersicht (erste Hälfte KlassSoz)
Crosskonkordanz-Aufbau KlassSoz > DDCRelationenaufbau:78 KlassSoz-Klassen: 1 Hauptklasse, 77 Unterklassen (7 obere Hierarchie-
und 70 untere Hierarchieebene) 149 Relationen insgesamt + 1 Nullrelation:
45 exactMatch-Relationen (=)
15 broadMatch-Relationen (<)
89 narrowMatch-Relationen (>)
Relevanzbewertung:71x hohe Relevanz
40x mittlere Relevanz
38x geringe Relevanz
Relationenanzahl:Einfache Relationen: 20
Mehrfache Relationen: 57
(41x 1:n-Relationen + 16x n:1-Relationen)
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 17
Schwierigkeiten beim CK-Aufbau
Manche Klassen der Klassifikation Sozialwissenschaften lassen sich nicht abbilden (z.B. „10508 – spezielle Ressortpolitik“, darin u.a. Agrar-, Energie, Forschungs-und Innenpolitik).
Manche Unterschiede zwischen Klassen der Klassifikation Sozialwissenschaften sind in der DDC nicht vorgesehen (z.B. „DDC 372 Primarbildung“: Enthält Elementar- und Primarbildung.
Sammelklassen sind in der DDC vielfach nicht vorge-sehen (z.B. „10599 – Sonstiges zur Politikwissen-schaft“).
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 18
AusblickCrosskonkordanz-Aufbau DDC > KlassSoz
Nutzen für den Datenbankaufbau:
Übernahme der DDC-Notation bei DNB-Datenimport möglich
Interoperabilitätszunahme/Retrieval-Nutzen:
KlassSoz als Sucheinstieg für nach DDC erschlossener
Literatur
Repräsentation der Mappings in SKOS-Format
- Abbildung der Klassifikation Sozialwissenschaften in SKOS und
Modellierung der aufgebauten Crosskonkordanzen
- Verlinkung der Klassifikationssysteme über die in der SKOS-
Klassifikation hinterlegten URIs
- Suchraumerweiterung zu im Web verfügbaren Datenquellen
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 201319
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 20
Vielen Dank
für Ihre Aufmerksamkeit!
Dr. Andreas Oskar Kempf
GESIS – Leibniz-Institut für Sozialwissenschaften
andreas.kempf@gesis.org
www.gesis.org
Weiterführende Informationen DDC Deutsch – Dewey-Dezimalklassifikation Deutsch
http://www.dnb.de/DE/Wir/Projekte/Abgeschlossen/ddcDeutsch.html;jsessionid=26240F5AD055
C5315A99413A4929D7EB.prod-worker3 (Zugriff am 04. März 2013)
Klassifikation Sozialwissenschaften: http://www.gesis.org/fileadmin/upload/dienstleistung/tools_
standards/Klassifikation_Sozialwissenschaften.pdf (Zugriff am 04. März 2013).
Mayr, Philipp; Petras, Vivien (2008): Cross-concordances - terminology mapping and its effectiveness
for information retrieval: In: World Library and Information Congress: 64th IFLA General Conference and
Meeting, Québec http://archive.ifla.org/IV/ifla74/papers/129-Mayr_Petras-en.pdf.
Petras, Vivien (2010) Heterogenitätsbehandlung und Terminology Mapping durch Crosskonkordanzen –
eine Fallstudie. In: Sieglerschmidt, Jörg/Ohly, Peter (Hg.) Wissensspeicher in digitalen Räumen.
Nachhaltigkeit, Verfügbarkeit, semantische Interoperabilität. Würzburg: Ergon-Verlag, 91-102.
Schott, Hannelore/Schroeder, Albert (2004) Crosskonkordanzen von Thesauri und Klassifikationen. In:
Budin, G.;Ohly, Hans-Peter (Hg.) Wissensorganisation in kooperativen Lern- und Arbeitsumgebungen.
Würzburg: Ergon-Verlag, 41-49.
SKOS-Mapping-Relations http://www.w3.org/TR/2009/REC-skos-reference-20090818/ (Zugriff am
04.März 2013).
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 21
top related