optimierung, konsolidierung und anreicherung einer ... · Über das projekt termterm 7 zweiten...

87
Optimierung, Konsolidierung und Anreicherung einer Terminologiedatenbank für das TermTerm-ProjektMasterarbeit im Studiengang Terminologie und Sprachtechnologie angefertigt an der Fachhochschule Köln-Institut für Translation und Mehrsprachige Kommunikation Betreuer: Prof. Dr. Klaus-Dirk Schmitz vorgelegt von: Matilda-Iuliana Soare Matrikelnummer: 11078537 Datum der Abgabe: 18.12.2012

Upload: others

Post on 02-Jun-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

„Optimierung, Konsolidierung und

Anreicherung

einer Terminologiedatenbank

für das TermTerm-Projekt“

Masterarbeit

im Studiengang Terminologie und Sprachtechnologie

angefertigt an der Fachhochschule Köln-Institut für Translation und

Mehrsprachige Kommunikation

Betreuer: Prof. Dr. Klaus-Dirk Schmitz

vorgelegt von: Matilda-Iuliana Soare

Matrikelnummer: 11078537

Datum der Abgabe: 18.12.2012

Page 2: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Inhaltsverzeichnis

0 Einleitung......................................................................................................... 4

1 Über das Projekt TermTerm ........................................................................ 6

1.1 Beteiligte .............................................................................................. 6

1.2 Datenbestände ..................................................................................... 8

2 Theoretischer Rahmen ................................................................................ 9

2.1 Terminologielehre, Terminologiearbeit und Terminologiemanagement 9

2.1.1 Arten und Funktion der Terminologiearbeit ................................... 11

2.1.2 Gegenstand, Begriff, Benennung.................................................. 17

2.1.3 Definitionen ................................................................................... 21

2.2 Terminologiedatenbank und Terminologieverwaltungssystem ........... 26

2.2.1 Terminologischer Eintrag .............................................................. 28

2.2.2 Datenkategorien ........................................................................... 29

2.2.3 Grundprinzipien der Modellierung terminologischer Einträge ....... 34

2.2.4 Bereitstellung von Daten ............................................................... 36

2.2.5 Austausch von Daten .................................................................... 37

2.2.6 Qualitätssicherung und Validierung von Terminologieeinträgen ... 43

3 Optimierung der TermTerm- und der ELETO-Datenbank ......................... 47

3.1 Datenbankanalyse ............................................................................. 47

3.1.1 Auswertung der TermTerm-Datenbank ........................................ 47

3.1.2 Auswertung der ELETO-Datenbank ............................................. 53

3.2 Vorschlag für die Optimierung der TermTerm- Datenbankstruktur .... 55

3.3 Konzept für die Zusammenführung der TermTerm- mit der ELETO-

Datenbank .................................................................................................... 56

3.3.1 Export der Access-Datenbank ...................................................... 56

3.3.2 Konvertierung mit MultiTerm Convert ........................................... 57

3.3.3 Import in MultiTerm ....................................................................... 60

3.4 Konsolidierung des Datenbestandes.................................................. 61

3.4.1 Doubletten bereinigen ................................................................... 62

3.4.2 Inhalte konsolidieren und optimieren ............................................ 64

3.5 Bereitstellung der TermTerm-Datenbank ........................................... 68

3.6 Exemplarische TBX-konforme Exportdefinition .................................. 74

4 Zusammenfassung und Ausblick .............................................................. 80

Page 3: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

5 Abkürzungsverzeichnis ............................................................................. 82

6 Abbildungsverzeichnis............................................................................... 83

7 Literaturverzeichnis ................................................................................... 85

Page 4: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

0 Einleitung

4

0 Einleitung

Terminologie ist in aller Munde. Viele haben ihre Bedeutung erkannt und versu-

chen, sich in diesem Bereich zu spezialisieren, einzelne Begrifflichkeiten blei-

ben jedoch oftmals im Halbdunkel. Sagt man jetzt Terminus, Benennung, Be-

griff oder Bezeichnung oder redet man über Terminologiearbeit oder

Terminologiemanagement? Immer wieder hört man in den Fragerunden bei Ta-

gungen, die sich unter anderem mit Terminologie beschäftigen, Teilnehmer, die

die Begrifflichkeiten des Fachbereichs Terminologie noch nicht beherrschen.

Aus diesem Grund entstanden die Idee und der Wunsch die Terminologie der

Terminologie in einer Datenbank zu sammeln und zu verwalten und Terminolo-

gieinteressierten zur Verfügung zu stellen.

Nach der aktiven Mitarbeit bei der Erstellung der ersten Einträge für die Termi-

nologie der Terminologie im Rahmen des obligatorischen Terminologieprojekts

im 2. Semester des Masterstudiengangs Terminologie und Sprachtechnologie,

stellten sich die Studierenden die Frage, was jetzt weiter mit ihrer Arbeit passie-

ren würde. Es war eine große Freude zu erfahren, dass dieser terminologische

Bestand später in das TermTerm-Projekt übernommen wurde und dass ich die

Möglichkeit haben würde, mich mit der Optimierung dieser Datenbank zu be-

schäftigen.

Sehr bemerkenswert ist auch, dass der Bedarf nach einer einheitlichen Termi-

nologie der Terminologie auch von anderen Fachverbänden in anderen Län-

dern erkannt wurde. So wurde dem TermTerm-Projekt eine griechische Termi-

nologie der Terminologie zur Verfügung gestellt und in der Zukunft werden auch

andere dazu kommen.

Da die Datenbestände von verschiedenen Organisationen stammten und in un-

terschiedlicher Qualität vorhanden waren, war die fachliche Zielsetzung meiner

Arbeit die Optimierung und Konsolidierung der Terminologie der Terminologie

sowie die Anreicherung des deutschen Datenbestands mit den von ELETO er-

stellten Daten.

Auch wenn in der TermTerm-Datenbank selbst die wichtigsten Begrifflichkeiten

der Terminologie bereits dokumentiert wurden, wurde mit dieser Arbeit ange-

strebt, ein Grundkonzept zur Terminologiearbeit zu erarbeiten. Ein mögliches

Zielpublikum der Arbeit könnte aus Interessierten bestehen, die schnell und zu-

Page 5: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

0 Einleitung

5

sammengefasst Informationen zu den wichtigsten Aspekten der Terminologie

erfahren möchten.

So werden im ersten Kapitel allgemeine Informationen zu dem TermTerm-

Projekt, zu den Beteiligten und Datenbeständen, vorgestellt. Das nächste Kapi-

tel gibt eine kurze Einführung in die wichtigsten Aspekte der Terminologielehre,

Terminologiearbeit und des Terminologiemanagements. Dazu wurde eine

gründliche Literaturrecherche betrieben, um die wichtigsten Themen der Termi-

nologie auszufiltern. Berücksichtigt bei ihrer Auswahl wurde zusätzlich die Re-

levanz, die diese Themen für den praktischen Teil haben. So wurden Themen

wie die Grundsätze der Terminologiearbeit, die Modellierung und Validierung

von terminologischen Einträgen oder der Datenaustausch detaillierter ausge-

führt.

Im praktischen Teil dieser Arbeit wurden zunächst die bestehenden Daten ana-

lysiert und ausgewertet und dann Vorschläge für die Verbesserung der Daten-

bankstruktur ausgearbeitet. Im nächsten Schritt wurde ein Konzept für die Zu-

sammenführung der terminologischen Bestände aus den in Access und den in

MultiTerm verwalteten Daten erstellt und implementiert. Nach der Zusammen-

führung der Daten wurde eine Bereinigung vorgenommen, deren wichtigste

Schritte in Kapitel 3.4 vorgestellt werden.

Da diese Datenbank später Terminologieinteressierten zur Verfügung gestellt

werden soll, wird im vorletzten Kapitel eine Vorlage für den TBX-konformen Ex-

port dargestellt. Außerdem wird im letzten Kapitel eine mögliche technische Lö-

sung für eine kooperative Weiterarbeit an dieser Datenbank präsentiert.

Die im Rahmen dieser Masterarbeit bereinigten terminologischen Daten befin-

den sich auf der beiliegenden CD.

Page 6: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Über das Projekt TermTerm

6

1 Über das Projekt TermTerm

Obwohl in Deutschland vielfältige terminologische Aktivitäten in der Industrie, im

Ausbildungsbereich und auf Verbandsebene und auch die Auseinandersetzung

mit den Grundlagen und Prinzipien der Terminologie eine lange Tradition haben,

hat die Terminologiewelt ihre Hausaufgaben im Bereich der Terminologie der

Terminologie selbst noch nicht so gründlich gemacht. Selbst auf Terminologie-

und anderen Fachkongressen werden mitunter Begriff und Benennung falsch

bzw. synonym verwendet. So wird z. B. die Abkürzung TMS von vielen Men-

schen unterschiedlich verstanden. TMS steht für drei unterschiedliche Begriffe:

Translation Management System, Translation Memory System oder Terminolo-

gy Management System.

Ein weiteres Beispiel ist die Verwendung von Term, Terms oder Termen. Diese

Bezeichnungen sind falsch. Richtig ist laut DIN 2342 Benennung, Fachwort o-

der Terminus. Die Pluralform von Terminus lautet Termini. Ähnlich ist es mit

Begriff, für das im Deutschen häufig Konzept verwendet wird, was ebenso

falsch ist. Korrekt ist im Deutschen Begriff und im Englischen concept.

So werden auch bei manchen TVS-Anbietern verschiedene Benennungen für

identische Optionen verwendet, z.B. werden die Masken für die Erstellung ter-

minologischer Einträge bei einem als Eingabemodell bezeichnet, beim anderen

als Eintragsvorlage.

Die meisten Begriffe der Terminologielehre werden zwar in der DIN 2342 ge-

normt, sind aber nicht für alle Benutzer bekannt oder einfach abzurufen. Des-

wegen hat es sich im Rahmen mehrerer Projekte oder bei manchen Institutio-

nen als notwendig erwiesen, die Terminologie der Terminologie zu klären und

diese in einer Terminologiedatenbank aufzubereiten.

1.1 Beteiligte

Die Fachhochschule Köln bietet an der Fakultät für Informations- und Kommu-

nikationswissenschaften den Masterstudiengang Terminologie und Sprachtech-

nologie an. Nach einer wissenschaftlichen Vorlesung zum Thema Terminologie-

lehre erfolgt im 2. Semester auch ein praktisches Projekt. Wenn sich die

Studierenden im ersten Semester nicht im Klaren darüber waren, was Termino-

logie bedeutet, durften sie unter der Betreuung von Prof. Dr. K.-D. Schmitz im

Page 7: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Über das Projekt TermTerm

7

zweiten Semester die Begriffe der Terminologie der Terminologie klären und in

einer Datenbank dokumentieren. Die entstandene Datenbank soll später inte-

ressierten Nutzern zur Verfügung gestellt werden.

Das Internationale Terminologienetz TermNet hat im Jahr 2011 erfolgreich elcat

- ein innovatives E-Learning System für Terminologie - auf dem Markt gebracht.

elcat ist ein nach dem Baukastenprinzip entwickeltes E-Learning System, das

elf Lerneinheiten zum Thema Terminologie umfasst. Die Inhalte von elcat orien-

tieren sich an den einschlägigen Normen zur Terminologie. In der didaktischen

Aufbereitung wurde viel Wert auf Verständlichkeit und Anschaulichkeit gelegt

und alle Inhalte wurden mit Darstellungen und Abbildungen illustriert. Für die

Entwicklung der einzelnen Module benutzte man normenkonforme Terminologie

der Terminologie. Ein umfangreiches Glossar wurde erstellt, um das Verständ-

nis der in elcat verwendeten Terminologie zu erleichtern und um einen Über-

blick über die zentralen Begrifflichkeiten der Terminologie zu liefern (elcat-

Projekt beendet, Lernsystem für Terminologie verfügbar, 2012). Dieser termino-

logische Datenbestand ist Eigentum des TermNet- Internationales Terminolo-

gienetz, wurde aber für das TermTerm-Projekt zur Verfügung gestellt.

Für die Verwaltung und Pflege dieser Datenbestände benötigt man natürlich

auch ein Projekt und eine organisationale Einheit.

So wurde entschieden, ein TermTerm-Konsortium zu gründen, das sich um die

Bereitstellung und Pflege der Daten kümmert. Mitglieder des Konsortiums sind

Prof. Dr. Klaus-Dirk Schmitz von der Fachhochschule Köln, Stefan Gentz von

TRACOM OHG, Dr. Gabriele Sauberer von TermNet – Internationales Termino-

logienetz, Hans Pich von Document Service Center GmbH und Diana Brändle

von dbterm.

Für die Bereitstellung und Pflege der Daten wurde eine Online-Lösung ausge-

arbeitet. Dafür wurde vorgeschlagen, dass die Datenbestände bei mehreren

Online-TVS Anbieter in einer Datenbank zur Verfügung gestellt werden. Dazu

kommen Klaus Fleischmann von Kaleidoscope GmbH, Petra Dutz von SDL plc

und Wolfgang Zenk von acolada ins Konsortium für die technische Umsetzung.

(Informationen aus dem E-Mail-Verkehr mit Diana Brändle vom 07.09.2012)

Die Terminologen in Deutschland nehmen immer zur Kenntnis, was sich in an-

deren Ländern im Bereich Terminologie entwickelt. So bekam Prof. Dr. Schmitz

Page 8: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Über das Projekt TermTerm

8

einen Newsletter der Griechischen Gesellschaft für Terminologie-Ελληνικής

Εταιρείας Ορολογίας-Hellenic Society for Terminology (ELETO)- indem u.a. auch

über die neu erstellte griechische Terminologie der Terminologie berichtet wur-

de. So nahm Diana Brändle Kontakt mit Vertretern der ELETO auf und holte die

Erlaubnis ein, die griechischen Datenbestände mit den deutschen zusammen-

zuführen. Herausgeber und gleichzeitig Ansprechpartner für die griechische

TermTerm Datenbank ist der Geschäftsführer der ELETO, Kostas Valeontis.

1.2 Datenbestände

Bei den von den Studierenden im Master Terminologie und Sprachtechnologie

erstellten Datenbeständen handelt es sich um allgemeine Begrifflichkeiten der

Terminologie, die meistens aus Internetquellen oder aus dem Skript für die Vor-

lesung Grundlagen der Terminologie stammen. Die zu dokumentierenden Be-

griffe wurden erstmals im Seminar nach einem Brainstorming gesammelt und

dann alphabetisch jedem Studierenden zur Dokumentation zugeteilt. Deswegen

ist die Qualität dieser Daten sowohl inhaltlich als terminologisch sehr unter-

schiedlich. Im Seminar entstand ein Datenbestand von 241 Einträgen in

Deutsch, Englisch und teilweise auch Französisch. Die Datenbestände wurden

in dem TVS Trados Multiterm verwaltet und liegen als XML-Datei vor.

Von elcat gab es einen Datenbestand von 709 Einträgen, der die meistgenutz-

ten und bekannten Begriffe der Terminologie enthält, die nützlich und relevant

für die Arbeit und das Verständnis des E-Learning-Systems elcat sind. Auch

hier sind die Einträge meistens zweisprachig, Deutsch und Englisch und teil-

weise auch Französisch. Die Datenbestände von elcat wurden auch in dem

TVS Trados MultiTerm verwaltet und liegen auch in XML vor.

Die Datenbestände der griechischen Terminologie der Terminologie wurden

von dem Technischen Komitee 21 „Grundlagen der Terminologie“ (ELOT/TE21)

angelegt, das der griechischen Ingenieurskammer (TEE) untergeordnet ist. Es

sind insgesamt 1219 allgemeine und spezifische Begriffe der Terminologie auf-

gelistet. Die Datenbank ist aber nur in Form eines dreisprachigen Glossars vor-

handen (Griechisch, Englisch und Französisch). Quellen der Daten sind sowohl

die ISO Normen 1087-1: 2000, 1087-2: 2000, 704: 2000, ISO 860:2007 als

auch die übersetzten und angepassten griechischen Normen zu diesen Aspek-

ten.

Page 9: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

9

2 Theoretischer Rahmen

Gemäß DIN 2342 Teil 1 wird Terminologie wie folgt definiert: „Terminologie ist

der Gesamtbestand der Begriffe und ihrer Benennungen in einem Fachge-

biet.“ (DIN 2342, 2011).

Terminologie ist aber viel mehr als das; Manche benutzen das Wort Terminolo-

gie entweder für Terminologiearbeit, -verwaltung oder-management.

Da die Grundbegriffe der Terminologie schon in der zu bereinigenden Daten-

bank dokumentiert werden, werden in diesem Kapitel die Zusammenhänge zwi-

schen den verschiedenen Bereichen der Terminologie erläutert.

2.1 Terminologielehre, Terminologiearbeit und Terminolo-

giemanagement

Terminologielehre

„Terminologie“ ist in der Regel sehr zeitaufwendig und damit kostenintensiv.

Deshalb ist es erforderlich, mit den richtigen Methoden, Verfahren und Werk-

zeugen zu arbeiten. Dazu gehört auch, dass in verschiedenen Fachbereichen

nach einheitlichen Grundsätzen Terminologie erstellt wird, weil nur dann eine

gemeinsame Bearbeitung der Datenbestände und ein Austausch terminologi-

scher Daten möglich werden. Solche Grundlagen wurden von der Terminologie-

lehre etabliert.

Das wissenschaftliche Fundament der Terminologiearbeit, -normung und –

verwaltung sowie des Terminologiemanagements ist die Terminologielehre. Die

Terminologielehre wird in der Norm DIN 2342 als " Wissenschaft von den Be-

griffen und ihren Bezeichnungen in den Fachsprachen" bezeichnet. Die Benen-

nung Terminologie wird als Synonym für Terminologielehre abgelehnt, da sie im

Sinne von Fachwortschatz eingeführt ist (DIN 2342, 2011).

Auch wenn die ersten Schritte in der Terminologiearbeit in der Technik und den

Naturwissenschaften erfolgten, ist die Terminologielehre fachübergreifend kon-

zipiert. Die Grundsätze der Terminologielehre sind auf alle Fächer anwendbar.

Page 10: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

10

Die Terminologielehre ist ein interdisziplinär orientiertes Fach und ist mit der

Sprachwissenschaft, Normung und Sprachplanung, Philosophie, Information

und Dokumentation, Computerlinguistik und Wissenstechnik verbunden.

Im Bereich der Sprachwissenschaft spielt für die Terminologielehre die aktive

Beeinflussung der Sprachentwicklung, der aktuelle Wortschatz eine große Rol-

le.

Auch andere Zweige der Sprachwissenschaft wie Lexikologie, Lexikographie,

Semantik und Fachsprachenforschung sind für die Terminologielehre von gro-

ßer Bedeutung.

Mit der Fragestellung nach dem Wesen des Begriffs beschäftigt sich unter an-

derem auch die Philosophie, was auch für die Terminologie, bei der der Begriff

als Denk- und Wissenseinheit im Mittelpunkt steht, wichtig ist.

Mit der Bildung von Begriffen, ihrer Verknüpfungen und ihrer Zusammenfas-

sung in Systemen beschäftigt sich die philosophische Teildisziplin Logik. Die

Terminologielehre hat Symbole zur Bezeichnung von Begriffsbeziehungen aus

der formalen Logik übernommen und weitere Symbole analog zu diesen entwi-

ckelt.

Für die Information und Dokumentation ist die Anwendung terminologischer

Prinzipien beim Aufbau von Klassifikationssystemen und Thesauri besonders

wichtig. Diese Quellen werden aber auf der anderen Seite für die Informations-

suche in der Terminologiearbeit eingesetzt, zum Beispiel für die Zusammenstel-

lung von Dokumentationsmaterial zur Ausarbeitung von Terminologiebeständen

und deren Strukturierung.

Fragestellungen zu dem Begriff als Wissens- oder Denkeinheit, zu Beziehungs-

arten und Begriffsstrukturen, sowie Formen des Wissenserwerbs und der Wis-

sensrepräsentation beschäftigen sowohl die Terminologielehre als auch die

Computerlinguistik und Wissenstechnik (Arnzt/Picht/Mayer, 2009: S. 5 ff.).

Vor diesem Hintergrund kann Terminologielehre wie folgt definiert werden:

Page 11: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

11

„Interdisziplinär entwickelte Wissenschaft, deren Forschungsgegenstand einer-

seits der Gegenstand und der Begriff mit ihren Darstellungsformen sowie die

Beziehungen zwischen ihnen und andererseits deren systematische Darstel-

lung und die Anwendung derselben innerhalb vieler verschiedener Wissensge-

biete ist.“ (Arnzt/Picht/Mayer, 2009: S. 8).

Terminologiearbeit

Terminologiearbeit ist laut DIN 2342 die "auf der Terminologielehre aufbauende

Planung, Erarbeitung, Bearbeitung oder Verarbeitung, Darstellung oder Verbrei-

tung von Terminologie ".

Zur Terminologiearbeit gehört somit auch das Extrahieren von Termini, das Er-

stellen von Begriffssystemen, das Einpflegen von Termini in Texte sowie das

Veröffentlichen von Terminologien. Terminologiearbeit kann auch Normung um-

fassen und kann sich auf eine oder mehrere Sprachen und auf ein oder mehre-

re Fachgebiete beziehen (vgl. DIN 2342, 2011).

Terminologiemanagement

Terminologiemanagement oder die Terminologieverwaltung ist laut DIN 2342

der "Teil der Terminologiearbeit, der sich mit der Erfassung, Verarbeitung, Pfle-

ge und Bereitstellung von terminologischen Daten befasst" (DIN 2342, 2011).

Terminologiemanagement soll demnach ein Teil der Terminologiearbeit sein. In

der Praxis hat sich inzwischen jedoch der Gebrauch von Terminologiemanage-

ment als Synonym zu Terminologiearbeit etabliert.

2.1.1 Arten und Funktion der Terminologiearbeit

Die Form der Terminologiearbeit hängt von der jeweiligen Zielsetzung, dem Un-

tersuchungsgegenstand und dem Zeitpunkt der Erstellung ab.

Nach der Zielsetzung wird zwischen präskriptiver und deskriptiver oder nor-

mender Terminologiearbeit unterschieden.

Ziel der deskriptiven Terminologiearbeit ist es, den Ist-Zustand der Terminologie

in einem Text oder Fachbereich zu ermitteln und den Gebrauch von Begriffen,

Page 12: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

12

Benennungen und Definitionen zu beschreiben. In diesem Fall werden nur die

sprachliche Korrektheit und die Häufigkeit berücksichtigt, es werden aber keine

Empfehlungen für eine bestimmte Benennung gemacht.

Ziel der präskriptiven Terminologiearbeit ist es, den verwendeten Fachwort-

schatz zu vereinheitlichen und Benennungen vorzuschreiben. In diesem Fall

werden Benennungen, Begriffe und Definitionen festgelegt (vgl. Bauer, 2010: S.

M2-1).

Diese Art von Terminologiearbeit ist zu empfehlen, da dadurch die Corporate

Language im Unternehmen gepflegt wird und so zu einer besseren Kommuni-

kation innerhalb und außerhalb des Unternehmens beigetragen wird.

Mayer (Mayer, 1998) unterscheidet auch zwischen deskriptiver und präskripti-

ver Terminologiearbeit. Dabei werden unter der deskriptiven Terminologiearbeit

die punktuelle und die systematische Terminologiearbeit eingeordnet. Die sys-

tematische Terminologiearbeit kann dann spezifisch in sachgebiet- oder textbe-

zogene Terminologiearbeit unterteilt werden (vgl. Mayer, 1998: S.8).

Felber/Budin (Felber/Budin, 1989) unterscheiden nach Ziel der Terminologiear-

beit zwischen einer terminologischen Ist-Erhebung, feststellender Terminologie

und einer Herbeiführung eines terminologischen Soll-Zustandes, festlegender

Terminologiearbeit (vgl. Felber/Budin, 1989: S. 214 ff.).

Zu der feststellenden Terminologiearbeit gehört unter anderem auch die über-

setzungsbezogene Terminologiearbeit aber auch die von Terminologen, Lexi-

kographen oder Sprachdienstleistern betriebene Terminologie. Diese Termino-

logieart braucht trotzdem die Mitwirkung von Fachleuten aus dem

dokumentierten Gebiet, da diese sonst eine Terminologie aus zweiter Hand wä-

re, die sich nur auf Texte stützt und nicht auf Fachwissen.

Die festlegende Terminologie wird in Grundsatzarbeit und Terminologie-

Regelung bzw. –Normung eingeteilt. Die Grundsatzarbeit zielt auf eine einheitli-

che Behandlung der Terminologien. Die Terminologie-Regelung wird von inter-

nationalen oder nationalen Fachorganisationen betrieben. Die ausgearbeiteten

Terminologien werden dann als Empfehlung ausgegeben, können aber später

Page 13: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

13

auf einem technischen Gebiet als Norm übernommen werden (Felber/Budin,

1989: S. 214 ff).

Die Unterteilung in deskriptive und normende Terminologiearbeit greifen auch

Arnzt/Picht/Mayer (Arnzt/Picht/Mayer, 2009) auf. Sie verstehen unter deskripti-

ver Terminologiearbeit die Erfassung des bestehenden Sprachzustandes und

bewerten diese als stark übersetzungs- und zielsprachenorientiert

(Arnzt/Picht/Mayer, 2009: S. 216 ff.).

In der normenden Terminologie werden dann Definitionen und Benennungen

festgelegt und so die einheitliche Verwendung der Sprache gesichert.

Normende Terminologie wird aber nicht nur in den Normungsgremien geleistet,

sondern auch in Unternehmen, deren firmeneigene Terminologie in der Praxis

und über den Grenzen des Unternehmens hinaus eine wichtige Rolle spielt

(vgl. Arnzt/Picht/Mayer, 2009: S. 216 ff.). Als Beispiel einer im Unternehmen

betriebenen normenden Terminologie kann man die Terminologiedatenbank

von IBM oder Microsoft nennen.

Die normende Terminologiearbeit setzt aber die deskriptive Bearbeitung voraus,

da der aktuelle Sprachzustand bekannt sein muss.

Bei Arnzt/Picht/Mayer werden als Formen der Terminologiearbeit die punktuelle

und die systematische Terminologiearbeit erwähnt.

Von systematischer Terminologiearbeit spricht man, wenn ein Fachgebiet oder

ein Teilgebiet terminologisch erschöpfend untersucht und dokumentiert wird

und dann in einer Terminologiedatenbank zur Verfügung gestellt wird.

Da heutzutage wirtschaftliche und zeitliche Faktoren im Sprachendienst eine

enorm wichtige Rolle spielen, werden meistens Kompromisslösungen gefunden

und häufig für die Terminologieausarbeitung die punktuelle Untersuchung an-

gewendet. Das heißt, dass Termini gesucht, belegt oder geschaffen werden,

um nur ad hoc terminologische Fragen zu klären (vgl. Bauer, 2010: S. M2-1).

Page 14: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

14

So greifen S.E.Wright/ D.Wright (vgl. Wright., 1997: S. 147-160) die

Unterteilung in systematische Terminologiearbeit und ad hoc Terminologiearbeit

auf.

Die Arbeitsschritte bei der ad hoc Terminologiearbeit sind wie folgt: Termini

werden in einzelnen Texten identifiziert, danach werden Einträge erstellt und,

wenn es sich ergibt, die Benennungen mit Kontexten dokumentiert. Sollte die

Zeit ausreichen, werden auch auf dem Text basierende Begriffssysteme erstellt

(vgl. Wright, 1997: S. 150).

Für die systematische Terminologiearbeit werden von Arntz/Picht/Mayer fol-

gende Arbeitsschritte vorgeschlagen:

Organisatorische Vorüberlegungen (Festlegung der Arbeitssprachen,

Wahl des Fachgebiets, Zielsetzung und Zielgruppe, Veröffentlichung von

Daten, Lektüre, Kooperation mit Experten)

Abgrenzung und Aufteilung des Fachgebiets

Beschaffung und Analyse des Dokumentationsmaterials nach Mutter-

sprachenprinzip, Fachkompetenz und Aktualität

Suche nach existierenden Terminologiebeständen

Sammlung der gefundenen Benennungen; Erstellung einer einsprachi-

gen Fachwortliste, dabei Bestimmung der zu bearbeitenden Begriffe

Sammlung von Sekundärinformationen (Benennungen in anderen Spra-

chen, Definitionen, Kontexte usw.)

Erarbeitung der Begriffssysteme (ein Begriffssystem je Sprache)

Bearbeitung des Materials; terminologische Analyse:

o Überprüfung der Äquivalenten

o Abklärung von Synonymen, Abkürzungen usw.

o Ergänzung oder Anpassung der Definitionen

o Benennungsvorschläge (wenn eine Benennung fehlt)

o Dokumentation der Benennungen (Grammatik usw.)

o Graphische Darstellungen, Abbildungen usw.

o Anmerkungen zu Synonymie, Äquivalenz, Gebrauch usw.

Überprüfung (durch Experten) und Endredaktion

Page 15: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

15

Bereitstellung für Benutzer (in TVS) (vgl. Schmitz/Kaukonen, 2012)/

(Arnzt/Picht/Mayer, 2009: S. 216 ff.).

Die beschriebenen Arbeitsschritte gelten nach Schmitz (Schmitz/Kaukonen,

2012) sowohl für die deskriptive (beschreibende) wie auch für die präskriptive

(normende) Terminologiearbeit. Im Fall der präskriptiven Terminologiearbeit

werden nach der Überprüfung durch Experten noch bevorzugte, erlaubte sowie

abzulehnende Benennungen festgelegt.

Außerdem unterscheidet man je nach Zeitpunkt der Bearbeitung des terminolo-

gischen Datenbestandes zwischen nachgeschalteter und vorgeschalteter Ter-

minologiearbeit.

Die Erstellung und Konsolidierung des terminologischen Datenbestandes im

Fall der nachgeschalteten Terminologiearbeit erfolgt nach der Erstellung des zu

untersuchenden Textes, während bei der vorgeschalteten Terminologiearbeit

die terminologischen Datenbestände vor der Verwendung festgelegt werden.

(vgl. Bauer, 2010: S. M2-1).

Sowohl für die präskriptive als auch für die deskriptive Terminologiearbeit wird

je nach Untersuchungsgegenstand zwischen thematischer, textbezogener und

punktueller Terminologiearbeit differenziert.

Welche Art oder Methode der Terminologiearbeit in einem Unternehmen oder

einer Institution angewendet wird, hängt immer von der Zielsetzung und dem

erwünschten Umfang der Terminologiearbeit ab. Außerdem bestimmt die

Zielgruppe, für die Terminologie zur Verfügung gestellt wird, auch die Art der

Terminologiearbeit. Eine wichtige Rolle spielen auch die verfügbaren

Ressourcen wie Zeit, Geld, Mitarbeiterverfügbarkeit oder technische

Infrastruktur.

Einsatz von Terminologiearbeit

Das Betreiben von Terminologiearbeit im Unternehmen erleichtert die allgemei-

nen Abläufe in vielen Bereichen wie z. B. in der technischen Dokumentation, für

die Übersetzer oder in der Lokalisierung. Terminologiebestände werden von

vielen Experten in der Produktentwicklung, in der Dokumentation, Kundenbera-

Page 16: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

16

tung oder im Marketing verwendet und in verschiedene Tools eingebunden, wie

zum Beispiel maschinelle Übersetzungssysteme, Content Management Syste-

me, Translation Memorys, Lokalisierungstools oder Sprachprüfungstools.

Eine qualitative Terminologiearbeit wirkt sich positiv auf den Übersetzungspro-

zess, die Produkthaftung und Normenkonformität, die Kundenzufriedenheit, das

Produktmanagement, auf die Usability der Produkte usw. aus.

Terminologiearbeit ist zeit- und kostenaufwendig. Aber je mehr Personen oder

Anwendungen die Ergebnisse der Terminologiearbeit nutzen und je früher diese

in den Gesamtprozess der Terminologiearbeit eingebunden werden, desto eher

rechnet sich der Aufwand.

In der technischen Kommunikation steigt der Bedarf an technischer Informa-

tion und Dokumentation. Terminologiedatenbanken dienen als zentrale Wis-

sensplattform für technische Redakteure, wo sie knappe Präsentationen zu ei-

nem Begriff finden, ohne Zeit mit unendlichen Recherchen verbringen zu

müssen. Durch die Festlegung von bevorzugten und unerwünschten Benen-

nungen wird ein korrekter Sprachgebrauch seitens der technischen Redakteure

gewährleistet und dadurch die Normenkonformität und Rechtssicherheit ermög-

licht.

Außerdem verringert die Terminologie den Aufwand für die Qualitätskontrolle

der erstellten Dokumentation.

Wissenschaft und Technik haben in den letzten Jahrzehnten immer mehr an

Bedeutung gewonnen. Daher kommt der fachbezogenen Kommunikation heute

eine entscheidende Bedeutung zu. Die Globalisierung der Märkte erfordert

Kommunikation in der Landsprache, dafür werden auch Fachübersetzungen

angefertigt.

Das Übersetzen eines Fachtextes ist nur dann möglich, wenn man über den

Wortschatz des betreffenden Fachgebietes, d. h. seine Terminologie, verfügt.

Der Übersetzer muss sich deshalb vor dem eigentlichen Übersetzen mit der

Terminologie vertraut machen. Diese Vorarbeit kann sehr viel Zeit in Anspruch

nehmen. Für den Fachübersetzer ist es daher notwendig, sich mit den

Page 17: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

17

Grundsätzen der Terminologielehre, den terminologischen Arbeitsmethoden

und den Werkzeugen zur Verwaltung der Terminologie vertraut zu machen.

Eine qualitativ einheitliche Terminologie beschleunigt jedoch den Überset-

zungsprozess, da der Anzahl der Varianten in Texten reduziert werden, der Re-

chercheaufwand sinkt sowie die Verständlichkeit durch Ermittlung von Synony-

men oder Abkürzungen erhöht wird. Außerdem wird die Qualitätskontrolle nach

der Übersetzung weniger aufwendig.

Die Lokalisierung von Software umfasst meistens innovative Fachgebiete und

Themen. Durch eine einheitliche Benennung der Textelemente einer Software-

oberfläche wird eine stimmige Menüführung, Indexierung und dazu passende

Online-Hilfe gewährleistet und beschleunigt dadurch die Einarbeitung sowie die

Nutzung der Software, die Benutzerfreundlichkeit der Software steigt und so

auch die Usability des Produkts (vgl. Schmitz/Kaukonen., 2012).

Terminologie kann auch als ein Marketinginstrument betrachtet werden, da es

durch publizierte Terminologie die Möglichkeit gibt, sich von der Konkurrenz

abzugrenzen und Vorreiter in dem Fachgebiet zu sein.

2.1.2 Gegenstand, Begriff, Benennung

Wie oben erwähnt bezieht sich die klassische Methode der Terminologiearbeit

auf die Terminologielehre von Eugen Wüster (Wüster, 1991). Die

Terminologiearbeit befasst sich mit Begriffen und Benennungen in der

Fachsprache.

Der fachlichen Wortschatz wird nach dem semiotischen Dreieck von Ogden und

Richards in drei Elemente unterteilt: Begriff, Benennung und Gegenstand.

Abbildung 1: Semitoisches Dreieck

Page 18: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

18

Die Relationen zwischen Begriff, Benennung und Gegenstand wurden unter

unterschiedlichen Gesichtspunkten von mehreren Wissenschaftlern erweitert

und veranschaulicht.

So geht Wüster eher von einem statischen Sprachkonzept aus und veranschau-

licht die Zusammenhänge in zwei Ebenen: die langue-Ebene repräsentiert die

Welt der Begriffe und die parole-Ebene repräsentiert sowohl die sprachliche

Realität, die gesprochenen Wörter, als auch die außersprachlichen Phänome-

ne.

Abbildung 2: Wüsters Modell (Wüster, 1991)

Der Philosoph Oeser entwickelte in Anlehnung an das Modell von Wüster eine

Veranschaulichung auf vier Ebenen: Die erste Ebene ist eine erschöpfende

Sammlung von Gegenständen innerhalb eines Gebietes, auf der zweiten Ebene

geschieht eine Verdichtung von Merkmalen zu abstrahierten Denkeinheiten,

denen auf der dritten Ebene Denkeinheiten zugeordnet werden. Im vierten Feld

werden die Begriffe in verbaler oder nicht-verbaler Art repräsentiert (vgl.

Arnzt/Picht/Mayer, 2009:S.37 ff).

Abbildung 3: Oesers Modell (Schmitz K.-D., 2011)

Page 19: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

19

In der ISO-Norm 704 wird das Konzept von Wüster um ein viertes Element, die

Definition, erweitert. Diese Erweiterung wird in Anlehnung an Suonuuti modifi-

ziert, der begründet, dass Gegenstände in Begriffe abstrahiert werden, die dann

in Bezeichnungen repräsentiert und in Definitionen beschrieben werden (vgl.

Arnzt/Picht/Mayer, 2009: S. 39).

Abbildung 4:ISO-Norm Modell (Schmitz, 2011)

Außerdem wurde von Prof. Dr. Klaus Dirk Schmitz das Modell an die aktuellen

Methoden der Terminologiearbeit angepasst. Anstelle der Beziehung zu der

Definition wird bei Schmitz eine Beziehung zu dem terminologischen Eintrag

gesamt anderen terminologischen Informationen angedeutet (vgl. Schmitz K.-

D., 2011).

Abbildung 5:Schmitz-Modell (Schmitz, 2011)

Page 20: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

20

Begriff, Benennung und Gegenstand stehen in Bezug zueinander und werden

in der DIN 2342 wie folgt definiert:

Gegenstand oder Objekt: „beliebiger Ausschnitt aus der wahrnehmbaren oder

vorstellbaren Welt“ (DIN 2342, 2011).

In der Norm wird angemerkt, dass auch Geschehnisse, Sachverhalte und Be-

griffe Gegenstände sein können.

Benennung/Terminus/Fachausdruck: „sprachliche Bezeichnung eines Allge-

meinbegriffs aus einem Fachgebiet“ (DIN 2342, 2011).

Die Verbindung zwischen Benennung und Gegenstand ist eine Abstraktion,

eine Verallgemeinerung, deswegen sind Benennungen sprachunabhängig,

werden aber von dem gesellschaftlichen und kulturellen Hintergrund einer

Sprachgemeinschaft beeinflusst.

Ferner wird unterschieden zwischen Einwortbenennungen (z. B. "Dieselmotor")

und Mehrwortbenennungen (z. B. "Drehmomentwandler mit Wandlerüberbrü-

ckung").

Begriff: „Denkeinheit, die aus einer Menge von Gegenständen unter Ermittlung

der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion ge-

bildet wird.“ (DIN 2342, 2011).

Darüber hinaus wird in der DIN 2342 zwischen "Allgemeinbegriff" und

"Individualbegriff" unterschieden:

Individualbegriff: „Begriff, der ausgehend von einem einzelnen Gegenstand

durch Abstraktion gebildet wird.“ (DIN 2342, 2011).

Die Individualbegriffe werden normalerweise mit Namen bezeichnet und für den

einzelnen repräsentierten Gegenstand kann eine Position in Raum und Zeit an-

gegeben werden. Beispiel: "Eiffelturm"

Allgemeinbegriff: „Begriff, der ausgehend von mehr als einem Gegenstand

durch Abstraktion gebildet wird.“ (DIN 2342, 2011).

Beispiel: Turm

Einen Turm, den man nie zuvor gesehen hat, erkennt man anhand bestimmter

Merkmale, die alle Türme gemeinsam haben. Der Begriff "Turm" ist also eine

Abstraktion der bisherigen Erfahrungen mit Türmen.

Für die Einordnung von Begriffen in einem Begriffssystem spielen der Begriffs-

inhalt und –umfang eine entscheidende Rolle. Damit man den Begriffsinhalt und

Page 21: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

21

–umfang bestimmen kann, muss man die unterschiedlichen Merkmale eines

Begriffes erkennen.

Die DIN 2342 definiert Merkmal als eine "durch Abstraktion gewonnene Denk-

einheit, die eine Eigenschaft von Gegenständen wiedergibt, welche zur Be-

griffsbildung und -abgrenzung dient."(DIN 2342, 2011).

Die Gesamtheit der Merkmale, die ein Begriff hat - also sein Begriffsinhalt o-

der seine Intention -, entspricht dem Wissen über diesen Begriff. Die DIN 2330

unterteilt Merkmale in Beschaffenheitsmerkmale und Relationsmerkmale. Wäh-

rend Beschaffenheitsmerkmale Eigenschaften der unter einen Begriff fallenden

Gegenstände sind (so z. B. rot, quaderförmig, 10m hoch usw.), geben Relati-

onsmerkmale die Beziehung zwischen zwei Begriffen an, beispielsweise hin-

sichtlich Herkunft, Gebrauch, Vergleich und Bewertung. Beispiele: Hersteller

Siemens (Herkunftsmerkmal), leicht handhabbar (Gebrauchsmerkmal), klein

(Vergleichsmerkmal), teuer (Bewertungsmerkmal) (vgl. DIN 2330, 2011).

Die DIN 2342 unterscheidet zwischen dem wesentlichen Merkmal, das zum

Bestimmen eines Begriffs unverzichtbar ist und dem abgrenzenden Merkmal,

das zur Abgrenzung eines Begriffs von benachbarten Begriffen verwendet wird

(vgl. DIN 2342, 2011).

Der Begriffsumfang ist die Gesamtheit der einem Begriff "auf derselben Hie-

rarchiestufe untergeordneten Begriffe" (DIN 2342, 2011). Der Begriffsumfang

wird durch den Begriffsinhalt bestimmt: Je größer der Begriffsinhalt, also je

mehr Merkmale einen Begriff einschränken, desto geringer ist der Begriffsum-

fang, weil die Anzahl der Begriffe, die untergeordnet werden können, mit jedem

Merkmal abnimmt (vgl. DIN 2330, 2011). In der DIN 2342 wird außerdem an-

gemerkt: "Jeder Begriff auf dieser Hierarchiestufe ist dadurch mit seinem eige-

nen Begriffsumfang im Begriffsumfang des betrachteten Ausgangsbegriffs ent-

halten. Es ist zwischen dem Begriffsumfang und der Gesamtheit der

Unterbegriffe auf allen Hierarchiestufen zu unterscheiden" (DIN 2342, 2011).

2.1.3 Definitionen

Definitionen dienen dazu, einen möglichst eindeutigen Zusammenhang zwi-

schen Begriff und Benennung herzustellen. Sie grenzen einen Begriff ab, indem

Page 22: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

22

er zu anderen in Beziehung in einem Begriffssystem gesetzt wird (vgl. DIN

2330, 2011).

Eine Definition ist „eine Begriffsbestimmung mit sprachlichen Mitteln“ (DIN

2342, 2011).

Für die Terminologiearbeit sind Definitionen besonders wichtig: Begriffe stehen

im Mittelpunkt und müssen mit sprachlichen Mitteln beschrieben bzw. einge-

grenzt werden.

Eine Definition hat zwei Komponenten: Definiendum (was wird definiert) und

Definiens (wie wird etwas definiert).Das Definiendum entspricht dem Begriff, der

definiert werden soll und wird meist durch eine den Begriff repräsentierende

Benennung ausgedrückt. Das Definiens stellt die sprachliche Beschreibung des

Begriffs dar und erläutert das Wesentliche des Begriffs (Schmitz, 2011).

Zu den häufigsten Definitionsarten zählen: die Inhaltsdefinition, die Umfangsde-

finition und die Bestandsdefinition.

Inhaltsdefinition (intensionale Definition)

„Definition, die von dem Oberbegriff ausgeht und die einschränkenden Merkma-

le angibt, die den zu definierenden Begriff von anderen Begriffen derselben

Abstraktionsstufe unterscheiden“ (DIN 2342, 2011).

Es werden Merkmale genannt, die den Begriff kennzeichnen. Häufig werden

ausgehend von dem Oberbegriff die zusätzlichen charakteristischen Merkmale

aufgeführt.

Die Inhaltsdefinition ist folgendermaßen aufgebaut: Benennung = Oberbegriff +

einschränkende Merkmale

Beispiel: „Eine Glühlampe ist eine Lampe, bei der feste Stoffe durch elektri-

schen Strom so hoch erhitzt werden, dass sie Licht aussenden.“

Die Inhaltsdefinition ist die wichtigste für die Terminologiearbeit, da dadurch die

Einordnung in das Begriffssystem und die Abgrenzung von anderen Begriffen

ermöglicht wird (Arnzt/Picht/Mayer, 2009: S. 62 ff).

Page 23: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

23

Umfangsdefinition (extensionale Definition):

„Definition, bei der alle Unterbegriffe eines Begriffes aufgezählt werden, die

innerhalb des betreffenden Begriffssystems auf derselben Hierarchiestufe ste-

hen.“ (vgl. DIN 2342, 2011). Es werden alle unter einen Begriff fallenden Unter-

begriffe angegeben.

Beispiel: Bezeichnungen sind Benennungen, Ideogramme, Nummern und Nota-

tionen (DIN 2330, 2011).

Bestandsdefinition

„Definition, bei der alle auf derselben Hierarchiestufe stehenden Teilbegriffe

des Begriffs aufgezählt werden“ (vgl. DIN 2342,2011).

Es werden alle unter einen Begriff fallenden Gegenstände angegeben.

Beispiel: „Die Planeten des Sonnensystems sind Merkur, Venus, Erde, Mars,

Jupiter, Saturn, Uranus, Neptun.“ (DIN 2330, 2011).

Obwohl die Bestandsdefinitionen leichter verständlich sind, sind sie aber nur

zweckmäßig, wenn der Begriffsumfang eines Begriffs begrenzt ist.

Darüber hinaus werden in der Literatur folgende Definitionsarten erwähnt:

Kontextdefinition

Ein nicht ganz sinnloser Satz, der die Benennung enthält und etwas über den

Begriff aussagt (vgl. Schmitz, 2011).

Diese Definitionsart ist aber für die Terminologiearbeit nicht so relevant, da es

in einer Terminologiedatenbank eher geeignet ist, den Kontext in einer eigenen

Datenkategorie zu erfassen. Der Kontext stellt die sprachliche Verwendung des

Terminus dar, während die Definition über die Bedeutung des Terminus

informiert. Deswegen ist es sinnvoll, in einem terminologischen Eintrag eine

Inhaltsdefintion zu erfassen und den Kontext als extra Information anzugeben.

Nominaldefinition

In diesem Fall wird ein weniger bekanntes Wort durch ein besser verständliches

ersetzt. Eine solche Definition hat aber meistens keinen Mehrwert und liefert

keine konkreten Informationen über die Sache selbst.

Page 24: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

24

Beispiel: „Opazität = Lichtundurchlässigkeit“ (Arnzt/Picht/Mayer, 2009: S. 64 ff.).

Fehlerhafte Definitionen

Da die Definitionen in der Terminologiearbeit eine sehr wichtige Rolle spielen

und ein korrektes Definieren nicht so einfach ist, werden in der DIN 2330 (DIN

2330, 2011) Empfehlungen gemacht, welche Fehler bei der Definitionenbildung

vermieden werden sollen.

Zu enge Definition

Durch die Nennung zu sehr einschränkender Angaben kann eine Definition zu

eng werden. So kann man eine oder mehrere Gegenstände ausschließen, die

auch unter den zu definierenden Begriff fallen.

Beispiel: „Medizinflaschen sind Flaschen, die aus Glas hergestellt sind und zur

Aufbewahrung von vorwiegend flüssigen Medikamenten bestimmt sind.“ (vgl.

Arnzt/Picht/Mayer, 2009: S. 71). In diesem Fall werden z. B. die Plastikflaschen

ausgeschlossen, die auch zum Aufbewahren von Medikamenten verwendet

werden.

Zu weite Definition

Eine Definition wird dann zu weit, wenn bestimmte Angaben weggelassen wer-

den und dadurch andere Gegenstände mitumfasst werden, die die gleichen

Merkmale aufweisen.

Beispiel: „Kupfer ist ein chemisches Element, das zur Gruppe der Metalle ge-

hört.“ Diese Definition ist zu weit, da auch andere Metalle unter diese Gruppe

fallen, also die Definitionsgleichung nicht aufgeht (vgl. Arnzt/Picht/Mayer, 2009:

S. 70).

Zirkeldefinition

Eine Zirkeldefinition kommt dann zustande, wenn ein Begriff durch ein Synonym

oder durch einen Begriff definiert wird, der wiederrum mit Hilfe des Ausgangs-

begriffs definiert wird (vgl. DIN 2330, 2011).

Beispiel: „Ein Vertrag ist in der Regel ein zweiseitiger Kontrakt, bei dem durch

mindestens zwei überstimmende Willenserklärungen ein rechtlicher Erfolg er-

zielt werden soll“. Diese Definition ist fehlerhaft, da Vertrag und Kontrakt syno-

nym sind. Besser ist wenn man Kontrakt durch den Oberbegriff „Rechtsge-

schäft“ ersetzt. (vgl. Arnzt/Picht/Mayer, 2009: S. 69 ff.)

Page 25: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

25

Negativdefinition

Bei der Formulierung von Definitionen sollen nicht die Merkmale angegeben

werden, die ein Begriff nicht hat. Negative Merkmale können nur dann verwen-

det werden, wenn der Begriff selbst negativ ist.

Beispiel: „Ein Anhänger ist ein Fahrzeug ohne eigenen Antrieb.“

Negative Definitionen dürfen nur bei „negativen Begriffen“ verwendet werden,

Beispiel: Ein unflektierbares Wort ist ein Wort, das seine Gestalt nicht verän-

dert.“ (vgl. DIN 2330, 2011).

In der DIN 2330 werden Grundsätze für das Erstellen von Definitionen darge-

stellt. In erster Linie wird für die Terminologiearbeit die Inhaltsdefinition empfoh-

len, da sie die größte definitorische Leistungsfähigkeit hat (vgl. 2330, 2011).

Sehr wichtig für die Erstellung von Definitionen ist auch die Auswahl der

Merkmale. Die ausgewählten Merkmale müssen zur Abgrenzung des Begriffs

zu anderen Begriffen beitragen.

Die einheitliche Verwendung von Begriffen und Benennungen in einer De-

finition ist auch ein wichtiger Punkt. Für die Definition sollen, soweit möglich,

Benennungen, die im gleichen System vorkommen genutzt werden und es soll

für denselben Begriff immer die gleiche Benennung verwendet werden.

Die Definition soll sich an Zweck und Geltungsbereich orientieren. Wenn die

Zielgruppe, für die die Definition verfasst wurde, nicht bekannt ist, könnte es für

das Verständnis der Definition notwendig sein, den Geltungsbereich anzugeben.

Die Fachbezogenheit der Definitionen ist auch sehr wichtig. Die in eine Defi-

nition aufzunehmenden Merkmale müssen für das jeweilige Fachgebiet wesent-

lich sein. Die ausgewählten Merkmale müssen die Einordnung in das entspre-

chende Begriffssystem ermöglichen.

Die Systembezogenheit von Definitionen spielt auch eine wichtige Rolle, da

die Position eines Begriffs in einem Begriffssystem durch die Definition eindeu-

tig festgelegt werden muss. So müssen in einer Inhaltsdefinition der Oberbegriff

und die einschränkende Merkmale angegeben werden.

Eine Umfangsdefinition muss die Systembezogenheit durch die Angabe der

Unterbegriffe zum Ausdruck bringen. Eine Bestandsdefinition muss die Sys-

tembezogenheit durch die Angabe der Teilbegriffe zum Ausdruck bringen.

Page 26: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

26

Definitionen sollen so kurz wie möglich und so lang wie nötig sein. Beim Kürzen

sollte man darauf achten, dass nicht wesentliche Merkmale verloren gehen.

Eine Definition muss knapp und genau sein, also nur die Angaben enthalten,

die zur Beschreibung und Festlegung eines Begriffs in einem System nötig sind.

Außerdem müssen Definitionen regelmäßig aktualisiert werden, da sich das

menschliche Wissen ständig in Entwicklung befindet (vgl. DIN 2330, 2011/

Arnzt/Picht/Mayer, 2009: S. 68 ff.).

Bei der Erstellung von Definitionen sollte Folgendes beachtet werden: Im Ideal-

fall sollen existierende Definitionen (mit Angabe der Quelle) übernommen wer-

den (vor allem genormte Definitionen, z. B. nach DIN oder ISO). Definitionen

die selbst erstellt werden, sollten durch einen Experten des jeweiligen Fachge-

biets überprüft werden.

Für die Normung gelten zusätzliche Regeln für das Schreiben von Definitionen:

Sowohl die Benennung als auch die Definition sollen im Singular stehen, wenn

der Begriff selbst nicht im Plural ist. Die Definition soll nicht mit „Be-

griff/Benennung, der/die... bedeutet/bezeichnet/benutzt wird“ beginnen oder „...

ist...“ enthalten. Die Definition soll nicht (ohne besonderen Grund) mit einem

Artikel beginnen. Die Definition (bei Nicht-Substantiven) soll keinen Großbuch-

staben am Satzanfang und keinen Satzendepunkt haben (vgl. Schmitz/

Kaukonen, 2012).

2.2 Terminologiedatenbank und Terminologieverwaltungssys-

tem

Zur Dokumentation von Terminologie spielt die Terminologiedatenbank eine

sehr wichtige Rolle, unabhängig davon, ob für die technische Dokumentation,

die Übersetzung, Softwarelokalisierung oder Produktion.

Eine Terminologiedatenbank ist laut DIN 2342 die „Einheit aus terminologischer

Datenbasis und Terminologieverwaltungssystem“ (vgl. DIN 2342, 2011).

Die terminologische Datenbasis besteht aus dem terminologischen Datenbe-

stand in elektronischer Form. Die terminologischen Daten in einer Terminolo-

giedatenbank werden dann mit einem Terminologieverwaltungssystem, auch

Terminologieverwaltungsprogramm oder Terminologiemanagementssystem

genannt, verwaltet.

Page 27: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

27

Solche Systeme dienen dazu, terminologische Daten zu erstellen, zu bearbei-

ten, zu pflegen, zu speichern und den Nutzern zur Verfügung zu stellen.

Für die Verwaltung von terminologischen Daten werden unterschiedliche Werk-

zeuge verwendet.

Unter diesen befinden sich auch die klassischen Textverarbeitungssysteme wie

MS Word oder Kalkulationssysteme wie MS Excel. Diese Systeme sind eine

günstige Alternative zu Terminologieverwaltungssystemen, aber in der Regel zu

langsam und ohne die Funktionalitäten einer Datenbank, wie z. B. Einbindung

in ein Translation Memory.

Außerdem werden in der Terminologieverwaltung auch universelle Datenbank-

systeme wie MS Access verwendet. Sie ermöglichen einen schnellen Zugriff,

haben aber meistens eine feste Feld- und Satzlänge, komplexe Zugangsbefeh-

le und schwierige Textsystemkommunikation (vgl. Schmitz/Kaukonen, 2012).

Mit der Zeit wurde deutlich, dass es für die Verwaltung von terminologischen

Daten spezielle Verwaltungssysteme nötig werden. So haben viele Institutionen

oder Konzerne ihre eigenen Systeme entwickelt. Später entwickelten auch

Unternehmen unter Beratung von Experten, die sich mit der Terminologielehre

oder –arbeit auseinandersetzten, spezielle Terminologieverwaltungssysteme.

Manche Systeme wurden zusammen mit den Translation Memory Tools

entwickelt und blieben eine Komponente in einem integrierten System, wie es z.

B. bei across der Fall ist. Manche Systeme sind eigenständige Systeme, die

nicht mit anderen Werkzeugen zusammen benutzt werden und andere Systeme

können entweder autonom oder als Teil eines integrierten System benutzt

werden z. B. TermStar oder MultiTerm.

Die speziellen Terminologieverwaltungssysteme können auf der einen Seite

eine definierte Eintragsstruktur haben. In diesem Fall lassen sich die

Datenkategorien nicht oder nur geringfügig verändern. Diese Systeme sind

entweder einfach strukturiert und sprachenpaarorientiert oder komplex

strukturiert und mehrsprachig. Die Möglichkeit, alle Benennungen gleichartig zu

dokumentieren, ist nicht in allen Systemen möglich.

Auf der anderen Seite gibt es Terminologieverwaltungssysteme mit

strukturierbarer Eintragsstruktur. In diesem Fall kann der

Terminologieverantwortliche die Datenkategorien selbst anlegen und an die

Page 28: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

28

Bedürfnisse des Unternehmens anpassen. In diesen Systemen können

Einträge benennungsautonom und begriffsorientiert gestaltet werden.

Diese Terminologieverwaltungssysteme können für einzelne Anwender oder für

den Einsatz in einem Netzwerk vorgesehen sein. Es gibt aber auch Online-

Terminologieverwaltungsplattformen.

Für die Leistungsfähigkeit und Benutzerfreundlichkeit eines

Terminologieverwaltungssystems spielen mehrere Faktoren eine wichtige Rolle.

In einem Unternehmen ist es wichtig, dass die Dokumentation der Einträge

nach den Bedürfnissen des Unternehmens für alle Abteilungen angepasst wird.

So sollten in einem TVS die notwendigen Datenkategorien realisierbar oder

vorhanden sein.

Sehr wichtig ist auch die Anzahl der Sprachen, die in einem TVS verwaltet

werden können.

Ein weiterer wichtiger Aspekt ist das Rechtesystem, das besagt wer einen

Eintrag erfassen darf oder nicht.

Die Konsistenzkontrolle ist in einem TVS auch sehr wichtig, damit keine

redundanten Daten entstehen. Außerdem sind die Suche- und

Filtermöglichkeiten sehr wichtig. Auch die Kommunikation mit anderen

Systemen, wie Translation Memory Tools oder Textbearbeitungsprogrammen,

ist eine sehr wichtige Anforderung an ein TVS.

Die Bereitstellung von Daten sowie Export- und Import-Funktionalitäten und

Formate sind für die Verwaltung von terminologischen Daten auch von sehr

großer Bedeutung.

2.2.1 Terminologischer Eintrag

Der terminologische Eintrag wird in der DIN 2342 als „Teil eines terminologi-

schen Datenbestands, der terminologische Daten zu einem Begriff enthält“ de-

finiert (DIN 2342, 2011).

Ein terminologischer Eintrag enthält Datenelemente über den Begriff und

dessen Benennungen sowie Zusatzdaten für die Verwaltung und Pflege der

erfassten terminologischen Informationen.

In einem terminologischen Eintrag können Daten zu einem Begriff entweder in

einer Sprache oder in mehreren Sprachen erfasst werden. So wird von

Page 29: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

29

Begriffsorientierung eines terminologischen Eintrags gesprochen, wenn alle

äquivalenten Benennungen in mehreren Sprachen unter einem einzigen Eintrag

zu finden sind.

Sehr wichtig ist, dass sich der terminologische Eintrag an die Bedürfnisse der

Nutzer anpassen lässt. So ist es von wesentlicher Bedeutung, dass die Struktur

des terminologischen Eintrags frei definierbar ist, dass die zu bearbeiteten

Sprachen nicht limitiert sind und dass Datenkategorien in einem

terminologischen Eintrag einheitlich verwendet werden sollen, was meistens

durch Picklisten erreicht werden kann.

Der Umfang der terminologischen Daten in einem Eintrag muss auch nach der

Zielgruppe angepasst werden, so sind z. B. das Fachgebiet oder eine

Abbildung für Ingenieure sehr wichtig, während für Sprachlehrende vielleicht

auch die grammatikalischen Angaben zu einer Benennung relevant sind.

Sehr wichtig für den Erfolg der Terminologiearbeit in einem Unternehmen ist die

Akzeptanz der Datenbank sowie ihre Verwendbarkeit für vielfältige

Nutzergruppen. Das kann aber nur erreicht werden, wenn in den

terminologischen Einträgen relevante Daten für jede Nutzergruppe erfasst

werden. Es gilt die Theorie, je mehr Daten die Einträge erhalten, desto größer

ist der Informationswert der Datenbank. Aber auch hier muss darauf geachtet

werden, dass nicht zu viele Daten die Abfrage der Datenbank und die

Erarbeitung von Einträgen erschweren.

Daher ist es sehr wichtig, dass passende Datenkategorien für den

terminologischen Eintrag ausgewählt werden und die Daten nach

terminologischen Prinzipien modelliert werden (KÜDES, 2002: S. 27 ff.).

2.2.2 Datenkategorien

Ein Eintrag in einer Terminologiedatenbank besteht aus Datenkategorien mit

terminologischen und verwaltungstechnischen Informationen.

Eine terminologische Datenkategorie ist die kleinste organisatorische Einheit

einer terminologischen Datensammlung, die nur eine Art von Informationen

enthalten darf. Diese Informationen werden als Datenelemente bezeichnet und

in der ISO 12620 als „result of the specification of a given data

field“ (Schmitz/Straub, 2010: S.37 ff.).

Page 30: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

30

Die Auswahl von Datenkategorien sollte auf der Basis der ISO 12620 (Compu-

ter applications in terminology-Data Categories) erfolgen. Sie besteht aus ei-

nem Verzeichnis von mehr als 200 Datenkategorien für terminologische Daten-

bestände.

In der ISO 12620 werden die Datenkategorien in offene (open data categories),

geschlossene (closed data categories) und einfache oder erlaubte Datenkate-

gorien eingeteilt. Die Inhalte der offenen Datenkategorien sind frei formulierbar.

Diese können z. B. die Benennung, einen Kontext oder eine Anmerkung bein-

halten. Die geschlossenen Datenkategorien bestehen meistens aus vorher

festgelegten Werten, die in den meisten Fällen in Picklisten eingeordnet werden.

Die einfachen Datenkategorien sind Werte der geschlossenen Datenkategorien,

die mit „ja“ oder „nein“ wählbar sind.

In Arnzt/Picht/Mayer wird eine allgemeine Unterscheidung der Datenkategorien

in benennungsbezogenen, begriffsbezogenen und verwaltungsbezogenen

Datenkategorien, beschrieben (vgl. Arnzt/Picht/Mayer, 2009: S. 231 ff.).

In Schmitz/Straub wird zwischen Datenkategorien auf Eintrags-/Begriffsebene,

Sprach-, Benennungs- und Wortebene unterschieden (vgl. Schmitz/Straub,

2010: S. 37 ff.). Administrative Informationen können dann auf allen Ebenen

verwaltet werden. Schmitz erwähnt auch die speziellen Datenkategorien wie z.

B. strukturelle Elemente (Sprache,Benennung) oder „shared resources“ wie z. B.

der bibliographische Eintrag (Schmitz, 2011).

Außerdem wird in der ISO (ISO 26162, 2012) nach Eintragsart der

Datenkategorien zwischen „mandatory, optional, automatic, and default data

categories“ unterschieden.

Werden Datenkategorien wie z. B. Benennung oder Fachgebiet als

obligatorisch festgelegt, so kann ein Nutzer den terminologischen Eintrag ohne

Angabe dieser Datenkategorien nicht speichern.

Es ist aber nicht immer sinnvoll, komplexere Datenkategorien, wie Kontext oder

Definition als obligatorisch festzulegen, da die Recherche und Absprache mit

den Experten viel Zeit im Anspruch nehmen können und deswegen nicht

immer beim Anlegen eines Eintrags sofort verfügbar sind.

Manche Verwaltungsinformationen, wie z. B. Eintragsnummer,

Änderungsdatum oder Verfasser werden automatisch vom System vergeben.

Trotzdem werden diese Datenkategorien in den meisten TVS nur auf der

Page 31: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

31

Begriffsebene automatisch eingefügt, obwohl diese auch auf der

Benennungsebene nötig wären.

In manchen TVS gibt es die Möglichkeit, Standardwerte für Datenkategorien

festzulegen. Diese Funktion ist von Bedeutung, wenn z. B. Terminologie für ein

bestimmtes Projekt erstellt wird oder wenn in einer Datenbank die Mehrheit der

Einträge Substantive sind.

In manchen TVS können Datenkategorien mit unterschiedlichen Zugriffsrechten

versehen werden. So wird in der ISO 26162 zwischen „read-only, read-write,

and hidden data categories“ unterschieden.

Diese Einschränkungen werden entweder über das Rechte-/Rollensystem oder

direkt in der Struktur der Datenbank festgelegt. So wird z. B. für einen

technischen Redakteur die Datenkategorie Status eine read-only Kategorie sein

während Kontext oder Definition eine read-write Kategorie wird, damit der

technische Redakteur auch Vorschläge für Definitionen oder Kontexte machen

kann.

Vor der Definition und Auswahl der Datenkategorien muss genau festgelegt

werden, welche terminologischen und administrativen Informationen in der Da-

tenbank verwaltet werden, wer die Nutzer und wer die Verwalter der Terminolo-

giedatenbank sind.

Ein einfaches Erarbeiten, Pflegen, Auswerten und Filtern von Daten wird auch

durch möglich fein definierte Datenkategorien erzielt.

Die definierten Datenkategorien werden dann, soweit das TVS dies erlaubt, in

einer bestimmten Reihenfolge angeordnet. Für die Verwaltung terminologischer

Einträge haben sich mehrere sinnvolle Ebenen herauskristallisiert: Eintrags-

bzw. Begriffsebene, Sprachebene, Benennungsebene und Wortebene

(Schmitz/Straub, 2010: S. 37 ff.).

So wird in ISO 16642 ein Metamodell für die Verwaltung terminologischer

Einträge vorgeschlagen. Das Modell sieht wie folgt aus:

Page 32: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

32

Abbildung 6: terminologisches Metamodell ISO 16642

Ordnung der Datenkategorien

Eine der wichtigsten Eigenschaften in einem terminologischen Eintrag ist die

Begriffsorientierung. In einem terminologischen Eintrag wird ein Begriff meis-

tens mehrsprachig dokumentiert. Deswegen werden auf Eintrags- oder Be-

griffsebene eine Vielzahl von Datenkategorien, die sich auf den Begriff bezie-

hen, aber die sprachenunabhängig sind, wie z. B. Anlage- oder

Änderungsdatum, Verfasser, eingefügt. Diese Datenkategorien und eine fort-

laufende Eintragsnummer werden in den meisten TVS automatisch zugewie-

sen. Werden die Begriffe in einem Begriffssystem mit einer eindeutigen Notati-

on verwaltet, so wird zur Einordnung des Begriffs im entsprechenden

Begriffssystem die Datenkategorie Notation auf Begriffsebene erfasst.

Eine sinnvolle Datenkategorie auf Eintragsebene ist das Fachgebiet, in dem

der Begriff einzuordnen ist. Das Fachgebiet ist eine sehr wichtige Filterkategorie

z. B. beim Export einer Terminologie eines bestimmten Teilgebietes. Die Ein-

ordnung in Teilgebiete erfolgt entweder gemäß einer firmeninternen Einteilung

oder gemäß einer normierten Fachgebietsklassifikation.

Page 33: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

33

Eine graphische Darstellung eines Begriffs ist auch auf der Eintragsebene ein-

zufügen, da sie vor allem in den technischen Gebieten zu einer besseren Ver-

ständlichkeit beiträgt. Sind aber die Abbildungen kulturabhängig, so müssen

diese auf die Sprachebene unter der passenden Sprache erfasst werden.

Die Definition ist eine der wichtigsten Datenkategorien in einem terminologi-

schen Eintrag. Die Definition beschreibt einen Begriff mit sprachlichen Mitteln,

deswegen müsste sie eigentlich auf Eintragsebene platziert werden. Aber da

heutzutage meistens nur mehrsprachige Terminologiedatenbanken verwaltet

werden, werden die Definitionen dementsprechend in mehreren Sprachen er-

fasst und, wenn dies das TVS erlaubt, auf die Sprachebene aufgenommen. Gibt

es in einem TVS keine Sprachebene, so wird die Definition auf Benennungs-

ebene angesiedelt. Gibt es in einer Sprache mehrere Benennungen zu einem

Begriff, so erweist sich diese Vorgehensweise als ungünstig, da alle Benennun-

gen gleich dokumentiert werden müssen und keine doppelten Definitionen er-

laubt sind.

Beim Aufbau einer Datenbank können auch andere Datenkategorien auf Ein-

trags- bzw. Begriffsebene hinzugefügt werden, wie z. B. Kunde oder Projekt,

wenn diese Angaben sich auf den gesamten Begriff beziehen.

Auf der Sprachebene werden alle Benennungen zu einem Begriff sowie andere

sprachspezifische Informationen verwaltet. Wie bereits erwähnt, ist es sinnvoll,

Definitionen auf der Sprachebene zu verwalten, wenn diese in mehreren Spra-

chen erfasst werden müssen. Die Definitionen müssen mit Quellen belegt wer-

den, die entweder in Form von vollständigen Literaturangaben oder als Quer-

verweis zu einer „shared resource“, wie z. B. einen bibliografischen Eintrag

gestaltet werden. Sind die grafischen Darstellungen eines Begriffes kulturab-

hängig, so können diese auch auf der Sprachebene eingefügt werden.

Auf der Benennungsebene werden Informationen zu allen Benennungen eines

Begriffs verwaltet. Die Benennung ist meistens der Ausgangspunkt einer termi-

nologischen Recherche und deswegen eine sehr wichtige Datenkategorie in

einem terminologischen Eintrag. So gilt die Benennung in einer Terminologieda-

tenbank als obligatorische Datenkategorie.

Page 34: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

34

Die Dokumentation einer Benennung muss nach dem Prinzip der Benennungs-

autonomie erfolgen, d. h. alle Benennungen zu einem Begriff sollen als auto-

nome Blöcke von Datenkategorien verwaltet und mit allen notwendigen Daten-

kategorien dokumentiert werden können (ohne Bevorzugung einer bestimmten

Benennung).

Zu den Datenkategorien auf Benennungsebene zählen die Quelle der Benen-

nung, Kontext mit der entsprechenden Quelle; administrative Informationen wie

„Angelegt von“, „Geändert von“; Qualitätsstatus wie „freigegeben“, „abgelehnt“,

“veraltet“; Regionalcodes wie EN-UK, EN-US, Benennungstyp wie Vollform,

Kurzform, Abkürzung, Sprachebene wie umgangssprachlich, genormt.

Da Benennungen auch aus mehreren Wörtern bestehen können, ist es sinnvoll

in einem terminologischen Eintrag auch eine Wortebene einzubeziehen.

Auf Wortebene werden lexikalische und grammatikalische Angaben zu einzel-

nen Wörtern einer Benennung verwaltet. In der Praxis wird die Wortebene

meistens nicht implementiert und die wortbezogenen Informationen werden auf

der Benennungsebene verwaltet. Vor allem in den romanischen Sprachen, wo

Mehrwortbenennungen sehr verbreitet sind, ist eine Wortebene sehr sinnvoll

einzusetzen. Mögliche Datenkategorien auf der Wortebene sind Wortklasse,

Genus oder Numerus.

Für die Modellierung der terminologischen Einträge wurden in der Terminolo-

giearbeit Prinzipien festgelegt.

2.2.3 Grundprinzipien der Modellierung terminologischer Einträge

Bei der Konzeption und Einrichtung einer Terminologiedatenbank sollten die

Datenkategorien und die Modellierung des terminologischen Eintrags sehr sorg-

fältig geplant werden. Diese Überlegungen zur Konzeption einer Datenbank

müssen nicht abhängig von einem System gemacht werden. Jedoch ist in den

meisten Fällen festzustellen, dass die Art des TVS Auswirkungen auf die Aus-

wahl der Datenkategorien und auf die Modellierung der terminologischen Ein-

träge haben kann. Wenn man eine Lösung zur Terminologieverwaltung konzi-

Page 35: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

35

piert und einrichtet, müssen aber vor allem die Prinzipien der Begriffsorientie-

rung und der Benennungsautonomie befolgt werden.

Nach dem Prinzip der Begriffsorientierung enthält ein terminologischer Ein-

trag alle Informationen zu einem Begriff, einschließlich aller Benennungen in

allen Sprachen mit ihren begriffsbezogenen Informationen (Abbildung 7).

Abbildung 7: Begriffsorientierung (Schmitz, 2012)

Unter Benennungsautonomie versteht man, dass alle Benennungen zu einem

Begriff als autonome Blöcke von Datenkategorien verwaltet und mit allen not-

wendigen Datenkategorien dokumentiert werden müssen, ohne die Bevorzu-

gung einer Benennung. Daher ist es wichtig, dass es in einem TVS keine Ein-

schränkungen in der Anzahl von Benennungen gibt.

Außerdem müssen bei der Erstellung von terminologischen Einträgen auch die

Prinzipien der Elementarität und Granularität der Datenkategorien beachtet

werden.

Nach dem Prinzip der Elementarität, darf jede Datenkategorie nur einen, der

Definition der Datenkategorie entsprechenden Wert enthalten. So darf z. B. die

Definitionsquelle nicht im Definitionsfeld erfasst werden.

Unter Granularität versteht man, dass Datenkategorien so fein wie möglich

definiert werden müssen. So dürfen z. B. Genus und Numerus nicht unter der

Page 36: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

36

allgemeine Datenkategorie Grammatik erfasst werden (vgl. Schmitz/Straub,

2010: 36 ff./ Bauer, 2010: S. M2-6)

2.2.4 Bereitstellung von Daten

Die terminologischen Daten müssen einem möglichst weiten Interessentenkreis

zur Verfügung gestellt werden, damit alle von der Terminologiearbeit profitieren

können, d. h. sie werden entweder über eine Dantebank oder ein internes In-

formationsnetz verbreitet.

Neben den wichtigen terminologischen Grundsätzen der Datenmodellierung

von terminologischen Einträgen sollten die TVS auch über die unten beschrie-

benen zentralen Funktionen verfügen.

Die Datenerfassung wird vereinfacht, wenn die TVS über rollenabhängige Ein-

gabestrukturen verfügen, wie z. B. Eingabemodelle.

Die Daten in einem TVS sollten immer auf dem neuesten Stand sein, das heißt

die terminologischen Daten müssen ständig gepflegt, aktualisiert und verein-

heitlicht werden. Dafür müssen verschiedene Abteilungen an der Recherche

beteiligt werden, was eine kollaborative Terminologiearbeit voraussetzt. Dafür

eignen sich vor allem webbasierte Terminologieverwaltungssysteme, in denen

die Nutzer leicht über den Internet-Browser auf die Bestände auf einem zentra-

len Server zugreifen und diese kommentieren, aktualisieren oder pflegen kön-

nen.

Zwischen den einzelnen Einträgen sollte die Erstellung von Querverweisen und

Verweisen auf Ressourcen im Intranet/Internet ermöglicht werden.

Für die Bereitstellung der terminologischen Daten spielen auch die Such- und

Filterfunktionen eine wichtige Rolle. So müssen in den TVS komplexe Filter er-

laubt werden und die Suche im Volltext, mit Platzhaltern oder mit Booleschen

Operatoren (UND, ODER) möglich.

Für die verschiedenen Benutzergruppen sollte es auch die Möglichkeit geben,

unterschiedliche Layouts zu definieren, damit nur die benötigten Daten ohne

Filter angezeigt werden können.

In einer so komplexen Welt, in der Unternehmen weltweit Zweigstellen haben,

ist es sehr wichtig, dass aktuelle Daten über verschiedene Schnittstellen zur

Verfügung gestellt werden. Die Terminologie muss in anderen Umgebungen

oder über verschiedene Schnittstellen in den Textentstehungsprozess einge-

Page 37: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

37

bunden werden. Besonders wichtig ist die Einbindung in die Translation-

Memory-Systeme der Übersetzer, in die Redaktionssysteme der technischen

Redakteure oder in die Programme zur Terminologiekontrolle. Nur so wird die

richtige Terminologie direkt bei der Erstellung von Texten geprüft oder automa-

tisch vorgeschlagen.

Für die Einbindung aller Nutzer in die Aktualisierung und Pflege der Terminolo-

giedatenbank spielt die Verteilung von rollenspezifischen Zugriffsrechten auch

eine wichtige Rolle. So wird z. B. die Datenbank der Entwicklungsabteilung aus

Vertraulichkeitsgründen nur für bestimmte Nutzergruppen freigeschaltet. Auch

verschiedene Kategorien wie „Status“ oder „Gebrauch“ sollten z. B. nur von den

Terminologieverantwortlichen geändert werden können.

Damit die Terminologie sich über die erwünschte Akzeptanz im Unternehmen

freuen kann, muss man Benutzer auf die vielfältigste Art und Weise an der

Terminologiearbeit beteiligen, sei es in einem Terminologiekreis oder durch be-

nutzerfreundliche Möglichkeiten für das Einholen von Feedback. So sollte z. B.

eine Datenbank immer entweder über ein Vorschlagformular oder eine Kom-

mentarfunktion verfügen.

Ein TVS muss auch die proprietären und standardisierten Austauschformate

unterstützen.

Terminologie ist eine wichtige Ressource in einem Unternehmen. Durch Bereit-

stellung von Terminologie findet auch eine Wissensverteilung und-nutzung statt,

welche wichtige Elemente des Wissensmanagement darstellen (vgl. KÜDES,

2002: S. 67 ff./ Bauer, 2010: S. M2-20/ Reinke, 2012: S. 101ff.).

2.2.5 Austausch von Daten

Neben der oben erwähnten Interaktion zwischen TVS und verschiedenen ande-

ren Redaktions-, Translation-Memory-Systemen usw. ist in vielen Anwen-

dungsumgebungen der Datenaustausch (Import und Export) zwischen TVS und

anderen Systemen notwendig. Das Phänomen des Terminologieaustausches

tritt meistens in heterogenen Umgebungen, wenn z. B. die Übersetzer andere

TVS verwenden als die Sprachabteilung des Unternehmens, oder bei der Um-

stellung von einem TVS auf ein anderes oder wenn terminologische Daten

übernommen oder für andere Applikationen zur Verfügung gestellt werden

müssen.

Page 38: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

38

Mögliche Austauschformate, die von den meisten TVS-Herstellern angeboten

werden sind CSV (Comma Separated Values), MARTIF (Machine-readable

terminology interchange format), XML, OLIF (Open Lexicon Interchange Format)

oder das Standardformat TBX (Term Base eXchange).

Eine wichtige Rolle beim Terminologieaustausch spielt eine effektive und res-

sourcensparende Art der Terminologiearbeit, d. h. die Übernahme und Weiter-

gabe von Terminologiebeständen. Werden in einem Unternehmen die TVS oder

die Redaktionssysteme auf eine höhere Version upgedatet oder werden in den

unterschiedlichen Abteilungen eines Unternehmens mehrere TVS genutzt, so

muss der Übergang von einem System zu einem anderen angepasst werden.

Übernimmt das Unternehmen ein anderes Unternehmen, so können damit auch

neue terminologische Bestände entstehen. Wird der Übersetzungsdienstleister

gewechselt, so müssen die neuen Terminologiesammlungen harmonisiert und

allen anderen zur Verfügung gestellt werden. In diesen Fällen spielt der Daten-

austausch eine sehr wichtige Rolle.

Beim Terminologieaustausch können dennoch folgende Probleme auftreten:

Einhaltung der wirtschaftlichen und juristischen Aspekte (z. B. Information als

Kapital, Urheber- und Nutzungsrecht, Qualität der Terminologiebestände),

Hardware- und Software-Kompatibilität (z. B. Datenträger, Codierung und Zei-

chensätze). Wurden die Grundsätze der Terminologiearbeit beim Anlegen und

bei der Verwaltung der terminologischen Einträge nicht eingehalten, so können

auch Probleme bei der Anpassung der inhaltlichen Aspekte (z. B. Datenkatego-

rien, Eintragsstruktur, Datenfeldinhalte, Klassifikation) und bei der Einhaltung

der Integrationsaspekte (z. B. Philosophie des TVS (Begriffsorientierung, Be-

nennungsautonomie), Behandlung von Homographen, Synonymen, Doubletten

entstehen (vgl. Schmitz/Kaukonen, 2012).

Vor dem Einrichten von Schnittstellen für den Datenaustausch müssen

Vorüberlegungen bezüglich des Ziels des Datenaustausches, der zu

austauschenden Datenmengen und der Art der Daten angestellt werden.

So ist es wichtig zu wissen, ob die Daten zwecks Analyse zur

Qualitätssicherung oder zur Aktualisierung terminologischer Datenbanken

exportiert werden. Wichtig ist auch, ob nur ein Teil oder die ganze Datenbank,

ob ganze terminologischen Einträge oder nur Teile ausgetauscht werden. Für

Page 39: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

39

die Definition des Austauschformates ist auch sehr wichtig zu wissen, ob die

terminologischen Datenelemente sich identifizieren lassen, so dass ein

Datenaustausch wirtschaftlich realisierbar ist. Wenn dies nicht der Fall ist, muss

die Datenbank unter Einhaltung der terminologischen Modellierungsprinzipien

neu strukturiert oder neu erstellt werden.

Für den Datenaustausch ist es außerdem von besonderer Bedeutung, dass die

Terminologieverantwortlichen in das Thema Datenaustausch eingearbeitet sind

und sich ständig weiterbilden (Herwartz, 2010: M4-25 ff.).

Der Einsatz standardisierter Austauschformate erweist sich in der

Terminologiearbeit als sinnvoll. Dies setzt aber voraus, dass bereits bei dem

Anlegen und der Verwaltung der Datenbank die Grundsätze der

Terminologiearbeit berücksichtigt werden. So müssen verfügbare

terminologische Ressourcen nicht neu für den Datenaustausch erarbeitet

werden und die neu geschaffenen Mittel können für die Pflege der Daten

eingesetzt werden. Terminologiebestände könnten dann systemunabhängig

bearbeitet, ausgetauscht und genutzt werden. Die Hersteller von TVS werden

nicht mehr so viele Ressourcen in die Entwicklung der Schnittstellen, Formate

oder Konvertierungsfilter investieren, sondern eher in die Verbesserung

wichtiger Funktionen.

TBX-Format

TBX ist eine in XML ausgedrückte terminologische Auszeichnungssprache für

die Darstellung, Analyse und den Austausch terminologischer Daten zwischen

verschiedenen TVS oder aber zwischen TVS und entweder Translation Memory

Systemen, Sprachprüfungstools oder Systemen für die maschninelle

Übersetzung. TBX gründet auf den Arbeitsergebnissen des SALT-

Projektes (Standards-based Access to Lexicographical &Terminological

multiligual resources) und des Technischen Komittees ISO TC 37/SC3

und wurde von der Arbeitsgruppe OSCAR (Open Standards for

Container/content AlllowingReuse) der LISA (Localization Industry

Standards Association) im Jahr 2002 veröffentlicht. LISA hat im Jahr

2011 Konkurs angemeldet und wird ab 2012 unter dem Namen

Page 40: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

40

TerminOrgs (Terminology for Large Organizations) vertreten. Der TBX-

Standard entspricht der Norm ISO 30042, die im Jahr 2008 veröffentlicht wurde

und die TBX-Grundstruktur entspricht dem TMF Modell in der ISO 16642 (siehe

Abbildung 6). Die TBX-Grundstruktur wird in Abbildung 8 dargestellt.

Abbildung 8: TBX Grundstruktur ISO 30042

Das Wurzelelement eines TBX-Dokumentes ist das <martif>-Element, das dem

terminologischen Datenbestand in dem TMF-Metamodell entspricht. Dem <mar-

tif>-Element sind ein <text>-Element und ein <martifHeader>-Element unterge-

ordnet. Im <martifHeader>-Element werden allgemeine Informationen zur Ter-

minologiedatenbank abgelegt. Das <text>-Element enthält ein <back>-Element,

das dem Punkt zusätzliche Informationen (CI) im TMF-Metamodell entspricht,

und ein <body>-Element. Im <body>-Element werden die terminologischen Ein-

träge im jeweiligen <termEntry>-Element dokumentiert. Die terminologischen

Einträge entsprechen der Begriffsebene (TE) im TMF-Modell.

Page 41: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

41

Jeder terminologische Eintrag muss mindestens eine Sprachebene (LS) und

jede Sprache mindestens eine Benennungsebene (TS) enthalten. Im

<langSet>-Element werden die sprachbezogenen Informationen beschrieben.

Die Benennungen werden in <tig>- oder <ntig>-Elementen beschrieben. Das

<ntig>-Element (nested term information group) wird als Elternelement für die

Beschreibung einzelner Teile einer Mehrwortbenennung verwendet. Die einzel-

nen Teile der Mehrwortbenennung werden dann in Kindelemente <termCom-

pList>-Elemente dokumentiert. Die <termCompList>-Elemente entsprechen der

Benennungskomponentenebene (TCS) im TMF-Modell.

Die TBX-Datei besteht aus einem Prolog und einer Dokumentinstanz. Der Pro-

log enthält eine XML-Deklaration und Informationen zur Zeichenkodierung und

einen Verweis auf die Dokumenttypdefinition (DTD). Die DTD definiert die

Struktur des TBX-Dokuments und wird von einem Parser zur Validierung des

Dokuments herangezogen. Die Dokumentinstanz enthält Informationen zu der

Terminologiedatenbank selbst, den Verweis auf das zulässige Datenkategorie-

verzeichnis (XCS) und die eigentlichen terminologischen Einträge.

Elemente, Attribute und Datentypen der TBX-Grundstruktur sind in der Stan-

dard-DTD definiert. Die Datenkategorien einer TBX-Datei werden in einer sepa-

raten XML-Datei beschrieben, deren Regeln wiederrum in einer DTD festgelegt

sind.

Als Datenkategorieverzeichnis kann entweder das in der TBX-Spezifikationen

mitgelieferte Standard-Datenkategorieverzeichnis verwendet werden, das eine

Teilmenge des ISO-Datenkategorieverzeichnisses enthält, oder man kann ein

eigenes normenkonformes Datenkategorieverzeichnis definieren.

Terminologische Datenkategorien werden bis auf wenige Ausnahmen (/term/,

/date/, /note/ usw.) nicht direkt als Knoten, sondern über sogenannte Metada-

tenkategorien (descrip, admin, termNote usw.) und über den Wert des entspre-

chenden type-Attributs in der Grundstruktur implementiert.

Beispiel:

<descrip type=“definition“>…</descrip>

Dieses Verfahren bietet Flexibilität, um TBX in vielen Anwendungsszenarien zu

realisieren (vgl. ISO 30042, 2008/ Reineke, 2012: S. 193 ff.)

Ein einfaches Beispiel einer TBX-Datei sieht folgendermaßen aus:

Page 42: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

42

<text><body>

<termEntry id=`ID 007´>

<descrip type=´subjectField´>terminologyManagement</descrip>

<langSet lang=de>

<descrip type=´definition´>Dateiformat zum Austausch von Datei-

en, die von verschiendnen Translation-Memory-Systemen stam-

men</descrip>

<ntig>

<termGrp>

<term>TBX</term>

<termNote type=´partOfSpeech´>properNoun</termNote>

<termNote type=´grammaticalGender´>neuter</termNote>

<termNote type=´termType´>acronym</termNote>

</termGrp>

</ntig>

...

</langSet>

...

</termEntry>

...

</body></text>

Abbildung 9: TBX Beispiel

Validierung von TBX-Dateien

TBX-Dateien müssen wie alle anderen XML-Dateien gegen die DTD und gegen

die XCS-Datei validiert werden. Dazu empfiehlt sich das von LISA entwickelte

Validierungswerkzeug TBX Checker. Mit anderen XML-Validierungswerkzeugen

lassen sich nur Wohlgeformtheit und Strukturkonformität überprüfen. Eine Vali-

dierung gegen die separate XCS-Datei ist jedoch nicht möglich. Wenn die Ein-

tragsstruktur und die Datenkategorien in einem einzigen Schema zusammenge-

fasst werden, kann das TBX-Dokument auch mit anderen XML-

Validierungswerkzeugen überprüft werden.

TBX-Basic

TBX-Basic ist wie TBX eine in XML ausgedrückte terminologische Auszeich-

nungssprache und wird in der ISO 30042 als TBX konforme TML anerkannt.

TBX-Basic ist eine leichtere Version von TBX, die mit Rücksicht auf kleinere

und mittlere Unternehmen entwickelt wurde.

Die Grundstrukturen von TBX-Basic- und TBX-Dokumentinstanzen sind bis auf

die Benennungsebene identisch. Nicht zugelassen sind in TBX-Basic auf der

Page 43: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

43

Benennungseben die <ntig>-Elemente, sowie die Elemente, die den <ntig>-

Elementen zugeordnet werden können.

Die Zahl der zugelassenen Datenkategorien wurde in TBX-Basic gekürzt. Be-

stimmte Datenkategorien werden im Vergleich zu TBX als geschlossene Daten-

kategorien definiert. Diese Einschränkungen sollen den „blinden Austausch“,

ohne vorherige Rücksprachen ermöglichen.

In TBX-Basic können in dem <back>-Element nur wenige Informationen zu den

terminologischen Einträgen gemacht werden, wie z. B. Namen und Kontaktin-

formationen zu Autoren.

Das <descripGrp>-Element kann in TBX-Basic nur für die Aufnahme der Daten-

kategorie zur Angabe der Quelle eines Kontextes oder einer Definition verwen-

det werden (vgl. ISO 30042, 2008/ Reineke, 2012: S. 193 ff.).

2.2.6 Qualitätssicherung und Validierung von Terminologieeinträ-

gen

Terminologiebestände, die inhaltlich und formal nicht den Entwicklungen in dem

Fachgebiet entsprechend gepflegt werden, veralten und werden lücken- und

fehlerhaft. Diese Datenbanken werden meistens dann für unzuverlässig und

unbrauchbar gehalten. Voraussetzung für die Qualitätskontrolle der terminologi-

schen Datenbestände ist eine gute Organisation der terminologischen Einträge

nach Themen oder Sachgebieten, sowie eine entsprechende Arbeitsplanung

und Ressourcen für die Bearbeitung der Daten. Neben der inhaltlichen ist aber

auch die formale Pflege des Datenbestands notwendig. Die formale Pflege wird

auch als Datenvalidierung bezeichnet (vgl. KÜDES, 2002: S. 68 ff.).

Die Datenvalidierung ist laut DIN 2342 der „Prozess zur Bestimmung, ob Daten

formal richtig, kohärent, korrekt, vollständig und plausibel sind“ (DIN 2342,

2011). Laut DIN 2342 sind für die Datenvalidierung folgende Schritte nötig:

Doublettenkontrolle („Datenvalidierung zur Überprüfung, ob der gleiche Daten-

eintrag mehr als einmal vorhanden ist“), Konsistenzkontrolle („Plausibilitätskon-

trolle zur Überprüfung, ob Einträge terminographisch einheitlich und wider-

spruchsfrei sind“), Rechtschreibkontrolle („Formalkontrolle zur Überprüfung, ob

die Schreibweise der Wörter mit den festgelegten Rechtschreibregeln überein-

stimmt“), Vollständigkeitskontrolle („Formalkontrolle zur Überprüfung, ob die

Page 44: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

44

geforderten Daten vorhanden sind“), Formalkontrolle („Datenvalidierung zur

Überprüfung, ob die Daten den Vorgaben formal entsprechen“) und Formatkon-

trolle („Formalkontrolle zur Überprüfung, ob die Daten dem vorgegebenen For-

mat entsprechen“), Plausibilitätskontrolle („Datenvalidierung zur Überprüfung,

ob die Daten inhaltlich den vorgegebenen Kriterien entsprechen“) (vgl. DIN

2342, 2011).

Die Doublettenkontrolle ist ein sehr wichtiger Schritt in der Validierung des

terminologischen Datenbestands. Doubletten entstehen meist bei der

Zusammenführung mehrerer Datenbestände von verschiedenen Abteilungen

oder von verschiedenen Unternehmen. Werden die Doubletten nicht bereinigt,

so kostet dies die Nutzer beim Abruf der Datenbank mehr Zeit und verursacht

Kritik und Unzufriedenheit. Doubletten können entweder durch Fusion zweier

oder mehrerer Einträge oder durch Löschen der betreffenden Einträge bereinigt

werden.

Die Fusion mehrerer Einträge bietet sich an, wenn z. B. äquivalente

Benennungen in verschiedenen Sprachen in mehreren Einträgen dokumentiert

wurden oder wenn verschiedene Einträge, die den gleichen Begriff

dokumentieren einander ergänzende Informationen enthalten.

Viele TVS bieten die Funktion der automatischen Doublettenkontrolle. Die

Doubletten müssen aber trotzdem inhaltlich überprüft werden, da manche

Scheindoubletten sein könnten. So sind z. B. Einträge, die formgleiche Begriffe

aus dem Rechtsgebiet dokumentieren keine richtigen Doubletten, wenn die

Begriffsmerkmale sich nicht voll und ganz entsprechen. So bezeichnet z. B. in

der Schweiz die Benennung „Bundesrat“ die Regierung, während in

Deutschland und Österreich die Länder/Ständekammer des Bundesparlaments

gemeint ist.

Auch Homonyme sind Scheindoubletten und müssen entsprechend dem

Begriffsorientierungsprinzip in unterschiedlichen Einträgen dokumentiert werden.

Echte Doubletten können meist sehr gut erkannt werden, wenn man bei der

Bereinigung sachgebietsbezogen in den wichtigsten Sprachen filtern kann

(KÜDES, 2002: S. 67 ff.).

Page 45: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

45

In den Terminologiearbeit Best Practices (Bauer, 2010: S. M2-18 ff.) wird zwi-

schen eintrags- und bestandsbezogenen Validierungsaspekten unterschieden.

Die Validierung kann inhaltlich, methodisch-formal, sprachlich oder technisch

erfolgen.

Die inhaltliche Validierung sollte aus zwei verschiedenen Schritten bestehen:

die Aktualisierung und die inhaltliche Ergänzung. Erst muss überprüft werden,

ob die Benennung des zu dokumentierenden Begriffs übereinstimmt. Außerdem

muss übeprüft werden, ob die Benennungen nicht veraltet sind oder ob einer

Benennung eine andere Bedeutung unterlegt wurde. Wird dies festgestellt,

müssen diese Aspekte in die Definition übernommen werden und die

Benennung von der Datenbank nicht gelöscht sondern in der entsprechenden

Datenkategorie z. B. als „veraltet“ bezeichnet werden.

Im Rahmen der inhaltichen Validierung wird überprüft, ob in den Definitionen

die wesentlichen Merkmale aufgezählt sind und ob die Angaben in der

Definition dem aktuellen Stand der Entwicklungen im Fachgebiet entsprechen.

Laut dieser Prinzipien werden auch die zusäztlichen Informationen wie z. B.

Kontexte oder Anmerkungen überprüft. Diese Validierung erfordert eine enge

Zusammenarbeit der Terminologen mit den Fachstellen im Unternehmen oder

dass die Terminologen die Fachkenntnisse in dem bearbeiteten Bereich immer

auf dem aktuellsten Stand halten.

Mit einer inhaltlichen Ergänzung der terminologischen Einträge erhöht sich die

Akzeptanz und Anwendung des Terminologiebestandes. Werden einem Eintrag

zusätzliche Informationen zugewiesen, so werden Synonyme oder

Äquivalenzen besser nachvollzogen. Werden in einer Datenbank

entsprechende Benennungen in mehreren Sprachen erfasst, so erweitert sich

der potenzielle Benutzerkreis und damit auch die Nutzbarkeit der Datenbank.

Bei der methodisch-formalen Validierung wird z. B. überprüft, ob die

methodischen Vorgaben und Konventionen bei der Erstellung der

terminologischen Einträge oder die Freigabeprozesse bei der

Terminologieprüfung eingehalten wurden.

Sehr wichtig ist auch die methodisch-formale Validierung von Quellen, da diese

für die Nachvollziehbarkeit der Informationsherkunft und die Revision der

Einträge eine große Rolle spielen.

Page 46: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Theoretischer Rahmen

46

Damit die terminologischen Bestände verwendet und verstanden werden, muss

die Formulierung der Informationen (Kontext, Definition, Anmerkung usw.) je

nach Zielgruppe erfolgen. So erfolgt in der Phase der sprachlichen

Validierung sowohl die linguistische und redaktionelle Überprüfung der

Benennungen, der Definitionen oder Kontexte als auch eine

Rechtschreibprüfung. Die inhaltlichen Fehler müssen auch sobald als möglich

ausgemerzt werden, da sie die Qualität und die Zuverlässigkeit der

terminologischen Bestände beeinträchtigen können. Bei der Einführung neuer

Rechtschreibregel müssen jedoch alle Varianten in der Datenbank erhalten

bleiben und mit der entsprechenden Anmerkung, dass sie nicht mehr akzeptiert

werden, versehen werden, weil sie in früheren Texten immer noch vorkommen.

Mit einem Terminologieprüfprogramm können dann anhand dieser

Anmerkungen in der Datenbank die alten Texte korrigiert werden.

Da die meisten terminologischen Datenbestände nur elektronisch erstellt

werden, muss in jeder Datenbank auch eine technische Validierug erfolgen.

So müssen z. B. Querverweise zwischen verschiedenen Einträgen überprüft

werden und sichergestellt werden, dass die Links für die elektronischen Quellen

aktiv sind. Bei besonderen Sprachen muss auch die Sprachkodierung überprüft

werden. Verfügt das TVS über einen Rollen-Rechte-System, so müssen die

einzelnen Rollen mit den entsprechenden Rechten überprüft werden.

Die Pflege der terminologischen Bestände bleibt entsprechend der

Entwicklungen im Unternehmen und in den einzelnen Fachgebieten eine

ständige Aufgabe und erfordert deswegen eine gute Organisation.

Da die Pflege in der Regel sehr zeitaufwendig ist, sollten die

Terminologieverantwortlichen Prioritäten und Kriterien für die Bereinigung der

Daten festlegen und diese genauso wie bei der Erstellung von Daten in

Projekten organisieren.

Page 47: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

47

3 Optimierung der TermTerm- und der ELETO-

Datenbank

Im folgenden Kapitel werden auf Grundlage der im theoretischen Teil erläuter-

ten Grundsätze der Terminologie die Struktur der Datenbank und die Datenbe-

stände analysiert und Verbesserungen vorgeschlagen. Zunächst werden die

Datenbankstrukturen der ursprünglichen Datenbanken analysiert, dann wird ein

Vorschlag für die Verbesserung der Datenbankstruktur ausgesprochen und die

zusammengeführten Datenbestände bereinigt. Berücksichtigt werden immer

systemunabhängig die Prinzipien der Datenmodellierung, auch wenn die Daten

später in Trados MultiTerm zur Verfügung gestellt werden. Zum Zweck des Da-

tenaustausches zwischen mehreren unabhängigen TVS wird im letzten Kapitel

TBX-konform eine exemplarische Export-Definition erstellt.

3.1 Datenbankanalyse

Im folgenden Kapitel werden die terminologischen Datenbestände gemäß den

Prinzipien der Datenmodellierung und Datenbankstrukturierung analysiert.

3.1.1 Auswertung der TermTerm-Datenbank

FH-Datenbank

In Abbildung 7 wird die Datenbankdefinition der im Terminologieprojekt an der

Fachhochschule Köln entstandenen Datenbank dargestellt.

Die Datenbank ist auf drei Ebenen strukturiert: Begriffs- (Entry level), Sprach-

(Index level) und Benennungsebene (Term level). Auf der Sprachebene können

die Sprachen Deutsch, Englisch und Französisch verwaltet werden. Alle enthal-

tenen Datenkategorien können mehrfach eingetragen werden.

Nach dem Prinzip der Begriffsorientierung wurden alle relevanten Datenkatego-

rien, wie z. B. Fachgebiet oder Workflow, die sich auf den gesamten Begriff be-

ziehen, auf der Begriffsebene eingetragen. Die Datenkategorie Fachgebiet ist

vom Typ Text, was jedoch für ein eventuelles Filtern nicht von Vorteil ist. Hier

empfähle sich die Anwendung einer Pickliste mit mehreren vordefinierten Fach-

gebieten.

Der Workflow erscheint zusätzlich auch auf Sprachebene, da es beispielsweise

in einem Projekt von Bedeutung sein könnte zu filtern, in welcher Sprache es

die meisten noch zu bearbeitenden Einträge gibt. Sehr wichtig für das Filtern ist,

Page 48: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

48

dass die Datenkategorie keinen freien Text erlaubt, sondern nur ein Wert aus

der Pickliste ausgewählt werden kann.

Die Definition und die entsprechende Quelle werden in dieser Datenbank auf

der Sprachebene platziert. Die Quelle ist an die Definition angehängt, wird aber

dem Prinzip der Datenelementarität nach in einer eigenen Datenkategorie ver-

waltet.

Alle Informationen, die sich auf die Benennungen zu einem Begriff beziehen

werden auf der Benennungsebene verwaltet. Auch hier werden die Prinzipien

der Datenelementarität und der Granularität eingehalten. Daher werden die

grammatikalischen Angaben Gender, Part of speech und Term type in separa-

ten Datenkategorien verwaltet.

Für die Möglichkeit, dass Benennungen, die in einer Sprache gleich sind, aber

von einem Land zum anderen doch leicht voneinander abweichende Merkmale

aufweisen, wurde auf der Benennungsebene auch eine Definition und die ent-

sprechende Quelle eingefügt.

Auf dieser Ebene befinden sich für die einzelnen Benennungen noch Kontexte

mit der entsprechenden Quelle. Außerdem kann hier auch abgelegt werden, für

welchen Kunden oder für welches Projekt die entsprechende Benennung er-

stellt wurde oder ob die Benennung preffered, admitted, not recommended oder

obsolete ist.

Die Datenbank wurde nach den Prinzipien der Terminologiearbeit modelliert. So

werden dem Prinzip der Begriffsorientierung nach alle Sprachen und Benen-

nungen in einem Eintrag verwaltet. Dem Prinzip der Benennungsautonomie

nach wird jede Benennung gleichwertig dokumentiert und mit den entsprechen-

den Datenkategorien versehen. Die Prinzipien der Elementarität und Granulari-

tät wurden eingehalten, indem alle Datenkategorien so fein wie möglich definiert

wurden, so werden z. B. Gender und Part of speech nicht zusammen in einer

Datenkategorie verwaltet und die Quellen werden separat von Kontext oder De-

finition in eigenen Feldern eingefügt.

Eine Besonderheit dieser Datenbank ist, dass die Quellen immer dem dement-

sprechenden Kontext oder der entsprechenden Definition angehängt werden,

da so ein einfacheres Filtern ermöglicht wird.

Wie bereits in Kapitel 1.2 erwähnt sind die terminologischen Bestände aus dem

Projekt an der FH-Köln bezüglich der inhaltlichen Ausarbeitung sehr unter-

Page 49: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

49

schiedlicher Qualität. Für die Dokumentation der Einträge wurden oft Quellen

aus dem Internet verwendet, da die Studierenden oftmals nicht über genügend

genormte Literatur im Bereich Terminologie verfügten. So wurden z. B. sehr

wenige Definitionen aus den Normen oder den wichtigsten terminologischen

Arbeiten erfasst. Die Definitionen entsprachen aber meistens den Ansätzen der

Definitionserstellung.

Außerdem ist anzumerken, dass bei der Auswahl der Kontexte nicht immer der

Zweck eines Kontextes in einer terminologischen Datenbank berücksichtig wur-

de. Ein Kontext soll in einer Terminologiedatenbank nicht ein beliebiger Satz

sein, der die Benennung enthält, sondern ein Satz, der mehr Informationen über

den Begriff oder die Verwendung einer Benennung in einem Fachgebiet liefert.

So waren für viele Benennungen Kontexte ohne wirklichen terminologischen

Mehrwert eingefügt und mussten bei der Bereinigung aktualisiert werden.

Abbildung 10: Datenbankdefinition FH-Köln

Page 50: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

50

elcat-Datenbank

Die in dem Projekt elcat erstellte Datenbank sieht der Datenbank der Fach-

hochschule bezüglich der Datenbankstruktur sehr ähnlich. Auch in dieser Da-

tenbank werden die terminologischen Einträge auf allen drei Ebenen verwaltet.

Auf Sprachebene können neben den Sprachen Deutsch, Englisch und Franzö-

sisch auch die bibliografischen Eingaben verwaltet werden.

Auf Begriffsebene wurde in dieser Datenbank noch die Datenkategorie Graphic

vom Typ Multimedia hinzugefügt. Außerdem wird hier die Datenkategorie Defi-

nition und nicht Explanation benannt. Die Datenkategorie Subject ist in dieser

Datenbank vom Typ Pickliste und kann die Werte Terminology Management,

Linguistics, Software, Controlled Language, Standards and Law beinhalten.

Durch Festlegen von Werten wird das Filtern und der Datenaustausch erleich-

tert.

Die anderen Datenkategorien sind denen der FH-Köln-Datenbank ähnlich, nur

dass sie in einigen Fällen unterschiedlich benannt wurden.

Inhaltlich wurden die Datenbestände für das Glossar, das in dem E-Learning

Programm für Terminologie elcat eingebunden ist, unterschiedlich erarbeitet.

Die meisten Einträge sind nicht so ausführlich dokumentiert, sind aber immer

mit einer Quelle belegt, was eine Aktualisierung der Inhalte vereinfacht. Die

Quellen der terminologischen Bestände sind entweder Normen (ISO 12620,

ISO 704, ISO 1087) oder aktuelle terminologische Arbeiten, wie z. B. die tekom

Studie „Erfolgreiches Terminologiemanagement im Unternehmen“ (Schmitz K.-

D. S., 2010) oder KÜDES (KÜDES, 2002). Ungefähr 50% der Einträge wurden

auch mit einer Definition dokumentiert, die aber nicht immer nach den

Prinzipien der Definitionerstellung ausgearbeitet wurde. In der Datenkategorie

definition wurden die Prinzipien der Elementarität und Granularität der

Datenkategorien nicht immer eingehalten, da meist außer der tatsächlichen

Definition auch andere Informationen aufgenommen wurden, die normalerweise

in die Datenkategorie note gehören. So wurden z. B. die festgelegten Werte für

die Datenkategorie processStatus in der Definition mit aufgeführt und mussten

bei der Bereinigung in die Datenkategorie note übertragen werden. Außerdem

befanden sich die definition und die note in den meisten Einträgen auf

Benennungsebene und wurden bei der Bereinigung auf die Sprachebene

verschoben.

Page 51: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

51

Abbildung 11: Datenbankdefinition elcat

TermTerm-Datenbank

Die TermTerm-Datenbank ist, wie oben erwähnt, aus der Zusammenführung

der in dem Terminologieprojekt der Fachhochschule Köln erarbeiteten und der

für das E-Learning-Programm elcat erstellten Datenbanken entstanden. In den

beiden Projekten wurden die Datenbanken unter der Anwendung von SDL Mul-

tiTerm ausgearbeitet, hatten aber unterschiedliche Datenbankdefinitionen. Vor

der Zusammenführung der Datenbanken wurden die Daten exportiert und an-

hand eines Mapping-Tools TBX-konform geändert. Die Änderungen erfolgten

Page 52: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

52

anhand der XSL Transformation (XSLT). XSLT ist eine Programmiersprache

zur Transformation von XML-Dokumenten. XSLT dient der Definition von Um-

wandlungsregeln. Die XSLT-Programme oder auch XSLT-Stylesheets sind

selbst nach den Regeln des XML-Standards aufgebaut. Sie werden von spezi-

ellen XSLT-Prozessoren eingelesen, die dann die XML-Dokumente mit den ge-

wünschten Angaben und Struktur ausgeben. (vgl. XSL 12)

Um die Datenbestände anhand XSLT zu ändern, wurden diese zunächst in ei-

ner XML-Datei aus MultiTerm exportiert.

Die Daten wurden analysiert und eine neue Definition für die TBX konforme Da-

tenbank erstellt. Die Datenkategorien wurden dem ISO-Datenkategorienkatalog

entnommen (ISO, 2012) Anhand dieser Datenbankdefinition (Abbildung 12)

wurden von Diana Brändle und Wolfgang Zenk die folgenden Umwandlungsre-

geln für die XSLT erstellt.

Das Feld Workflowstatus wurde auf den Sprach- und Benennungsebene ge-

löscht.

Auf Begriffsebene wurde das Feld Subject in subjectField vom Typ Pickliste

geändert. Hierfür wurden die Werte controlledLanguage, dataCategory, law,

linguistics, other, standards, terminologyManagement, terminologyResources,

terminologyScience, tools und translationScience festgelegt

Die Datenkategorie Origin wurde in originatingInstitution vom Typ Pickliste mit

den Werten TermNet, CologneUniversity und ECQA geändert.

Auf Sprachebene wurde die Datenkategorie Explanation in der FH-Datenbank

und Definition in der elcat-Datenbank in definition vereinheitlicht und die ent-

sprechende Quelle in definitionSource umgewandelt.

Auf Benennungsebene wurde die Datenkategorie Context und Con-Source in

context und contextSource vereinheitlicht. Die Datenkategorie Usage status

wurde in die Datenkategorie normativeAuthorization vom Typ Pickliste mit den

möglichen Werten admittedTerm, notRecommendedTerm, supersededTerm

und preferredTerm geändert.

Die Datenkategorie Part of speech wurde TBX-konform in partOfSpeech und

Gender in grammaticalGender geändert.

Außerdem wurden die Datenkategorien Geographical Usage, Note, Term Type

und Source in geographicalUsage, note, termType und source geändert.

Page 53: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

53

Abbildung 12: Datenbankdefinition TermTerm

3.1.2 Auswertung der ELETO-Datenbank

Die griechische Terminologie der Terminologie besteht aus einer Sammlung

von Benennungen im Griechischen und deren Äquivalenten im Englischen und

Französischen. Die Datenbankstruktur entspricht der eines Glossars. Die Daten

werden tabellarisch dargestellt: für jede Sprache eine Spalte, eine Spalte für

Termcode, eine für die Kodierung der Quelle, eine für die griechische Quelle,

eine für die internationale Quelle und eine für das Erstelldatum des Eintrags.

Page 54: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

54

Die Prinzipien der Terminologiearbeit wurden in dieser Datenbank nicht einge-

halten. So werden Synonyme im gleichen Feld mit Komma getrennt und nicht

separat in einer eigenen Zeile verwaltet.

Wie in Abbildung 13 dargestellt, werden die Datenbestände in einer Access-

Datenbank verwaltet. Diese Daten können dann beliebig in Excel, TXT, XML

oder PDF exportiert werden.

Abbildung 13: Access-Datenbank ELETO

ELETO stellt die Daten auch in einem PDF-Format zum Herunterladen zur Ver-

fügung (Abbildung 14) (ELETO, 2012).

Abbildung 14: PDF-Glossar ELETO

Die Daten stammen aus den ISO-Normen ISO 1087, ISO 704 und ISO 860,

denen auch griechische Normen entsprechen. (Abbildung 15).

Page 55: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

55

Abbildung 15: Quellen in ELETO

3.2 Vorschlag für die Optimierung der TermTerm- Datenbank-

struktur

In diesem Kapitel werden Vorschläge für die Verbesserung der Struktur der

TermTerm-Datenbank vorgestellt. Die Struktur der Datenbank enthält Datenka-

tegorien, die TBX konform sind und auf allen drei Ebenen verteilt sind. Für die

präskriptive Terminologiearbeit sind Datenkategorien wie normativeAuthorizati-

on besonders wichtig. In dieser Datenkategorie wurden ISO-konform neben

admittedTerm, supersededTerm und preferredTerm die Werte standardized-

Term, deprecatedTerm, legalTerm und regulatedTerm hinzugefügt. Außerdem

fehlen einige Datenkategorien, die für die Bereitstellung der Daten für ein brei-

tes Publikum und eine kooperative Bearbeitung der Daten wichtig wären.

So werden auf Sprachebene (Index level) die Datenkategorien processStatus

vom Typ Pickliste, processStatusHistory und processStatusNote hinzugefügt.

Die Datenkategorie processStatus ist in ISO 12620 wie folgt definiert: “The sta-

tus of a lexical unit or term with respect to its advancement within the standardi-

zation process” (ISO 12620). In der ISO 12620 werden für diese

Datenkategorien die Werte finalized, provisionallyProcessed und unprocessed

vorgeschalgen (ISO, 2012).

Außerdem wurden auf Sprachebene die Datenkategorien note und noteSource

hinzugefügt, die für die Eingabe von zusätzlichen Informationen für alle

Benennungen in der entsprechenden Sprache vorgesehen sind. Hier werden

meist Informationen eingefügt, die nicht in eine Definition gehören, da sonst das

Prinzip der Datenelementarität verletzt würde.

Außerdem wurde in der Pickliste der Datenkategorie originatingInstitution noch

der mögliche Wert ELETO hinzugefügt.

Page 56: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

56

3.3 Konzept für die Zusammenführung der TermTerm- mit der

ELETO-Datenbank

In diesem Kapitel wird ein Konzept für die Zusammenführung von Datenbe-

ständen, die in verschiedenen Systemen verwaltet wurden, präsentiert. Es wer-

den die Datenbestände, die in der Access-Datenbank verwaltet wurden, mit den

in MultiTerm verwalteten Datenbeständen zusammengeführt. Dies geschieht

mittels Export und Konvertierung mit dem Tool MultiTerm Convert. Dieser Vor-

gang wird in den nächsten Unterkapiteln dargestellt.

3.3.1 Export der Access-Datenbank

Microsoft Access ist ein proprietäres Datenbankmanagementsystem des Soft-

wareherstellers Microsoft zur Verwaltung von Daten in Datenbanken und zur

Entwicklung von Datenbankanwendungen (vgl. Mic12).

Die terminologischen Datenbestände von ELETO wurden in einer einfachen

Access-Datenbank verwaltet. Die Struktur der Datenbank wird in Abbildung 14

dargestellt. Eine Access-Datenbank enthält normalerweise mehrere Objektarten.

Diese Datenbank enthält Tabellen zur Speicherung und Abfragen zur

Aufbereitung der Daten (Filterung, Sortierung etc.).

Abbildung 16: Struktur ELETO-Access-Datenbank

Page 57: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

57

Access bietet unter dem Menüpunkt Externe Daten die Option Bestände zu im-

portieren oder zu exportieren.

Die Tabellen können in Excel-, Text-, HTML-, PDF- oder dBase-Dateien expor-

tiert werden.

Für die Zusammenführung der Datenbestände wird die Tabelle TERM-

TERM_Ed1 in eine Excel-Datei exportiert (Abbildung 17). Diese Daten werden

dann anhand von MultiTerm Convert in eine XML-Datei konvertiert.

Abbildung 17: Excel-Export-Datei ELETO-Datenbank

Für die Konvertierung mit MultiTerm Convert wurden die Daten in Excel überar-

beitet. Die Informationen, die für die zusammengeführte TermTerm-Datenbank

keine Bedeutung haben, wie z. B. „Stage“ oder „RECNUM“ wurden gelöscht.

Die Datenkategorien TERMEN, TERMFR und TERMGR wurden den entspre-

chenden Sprachen nach in English, French und Greek umbenannt. STERMEN

und STERMGR wurden in source EN und source GR geändert, damit diese

Quellen beim Konvertieren ohne Verwechslungsgefahr den entsprechenden

Termini zugeordnet werden können. An dieser Stelle sei angemerkt, dass die

Abkürzung GR nicht die offizielle Abkürzung für Griechisch ist (richtig: EL).

3.3.2 Konvertierung mit MultiTerm Convert

SDL MultiTerm Convert ist ein Assistent, mit dem Terminologiedaten in das

MultiTerm XML-Format (MTF.XML) konvertiert werden können. Mit MultiTerm

Convert können folgende Formate in das MTF.XML-Format konvertiert werden:

MultiTerm 5 (MTW-Dateien), OLIF XML (Open Lexicon Interchange Format),

SDL Termbase Desktop (TDB-Dateien), SDL Termbase Online (MDB-Dateien),

Tabellenkalkulations- und Datenbankaustausch-Dateien, Microsoft Excel (XLS-

Dateien, TermBase eXchange-Format (TBX-Dateien) (SDL, 2012).

Page 58: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

58

MultiTerm Convert wurde für die Konvertierung der aus Access exportierten

Datenbestände eingesetzt. Das Excel-Format .xlsx wird von MultiTerm Convert

ohne weitere Änderungen unterstützt.

Nach dem Starten der Anwendung wird man von einem Assistenten durch den

Konvertierungsvorgang geleitet. Als erstes wählt man die passende

Konvertierungsoption aus, in unserem Fall das Microsoft Excel Format. Im

nächsten Schritt werden die Ausgangs- und Zieldateien für die Konvertierung

bestimmt. Wie in Abbildung 18 dargestellt, werden nach der Konvertierung

folgende Dateien erstellt: eine MTF.XML Datei, die die konvertierten Daten

enthält, eine .XDT-Datei, die Termbankdefinition, die Struktur der

Terminologiedaten beschreibt und eine Log-Datei.

Abbildung 18: MultiTerm Convert Bestimmen der Ausgangs- und Zieldateien

Im nächsten Schritt werden die Datenkategorietypen für die verfügbaren Felder

der Spaltenüberschriften angegeben. In diesem Schritt werden auch die Index-

felder festgelegt. Als Indexfelder für diese Datenbank wurden English, French

und Greek ausgewählt. Die Datenkategorien source EN und source GR werden

als beschreibendes Feld vom Typ Text festgelegt (Abbildung 19).

Page 59: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

59

Abbildung 19: MultiTerm Convert Datenkategorietypen festlegen

Nach dem Festlegen der Datenkategorien werden die beschriebenen Felder auf

der gewünschten Ebene hinzugefügt. In unserem Fall werden die Datenkatego-

rien source EN und source GR der Benennungsebene zugeordnet.

Abbildung 20: MultiTerm Convert Eintragsstruktur erstellen

Die Daten werden in XML konvertiert und haben die untenstehende Struktur

(Abbildung 21).

Page 60: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

60

Abbildung 21: Konvertierung in XML

Um diese Daten in die TermTerm-Datenbank in MultiTerm importieren zu

können, sollten einige Änderungen in der XML-Datei vorgenommen werden. So

wurden die Datenkategorien source EN und source GR mit source ersetzt,

damit diese Datenkategorien mit der entsprechenden Datenkategorie in

MultiTerm übereinstimmt. Da sich die source jeweils innerhalb des gleichen

<termGrp>-Tags unter dem entsprechenden <languageGrp>-Tag befindet, wird

die source dann beim Import der richtigen Sprache zugeordnet.

3.3.3 Import in MultiTerm

Für den Import in MultiTerm wurde zuerst eine Import-Definition mit Hilfe des

Import-Assistenten erstellt. Die neu zu importierenden Einträge wurden über die

Termini des Indexes „English“ mit bereits vorhandenen Einträgen synchronisiert.

War der Terminus in der Zieltermbank nicht vorhanden, wurde der Eintrag als

Neuer hinzugefügt, war der Terminus aber vorhanden, wurden die Einträge zu-

sammengeführt (Abbildung 22).

Page 61: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

61

Abbildung 22: MultiTerm: Import-Assistent

Nach der Erstellung der Importdefinition wurde der Import ausgeführt und die

Ergebnisse des Imports in einer Log-Datei beschrieben. In dieser Datei kann

man einsehen, ob Einträge nicht importiert wurden oder welche Einträge neu

hinzugefügt oder mit anderen Einträgen zusammengeführt wurden.

Bei den zusammengeführten Einträgen bestand dann die Notwendigkeit viele

Datenkategorien zu bereinigen, da diese meist auch doppelt ausgeführt wurden.

3.4 Konsolidierung des Datenbestandes

In diesem Kapitel wird ein Konzept für die inhaltliche Bereinigung und Konsoli-

dierung des zusammengeführten Datenbestandes erstellt. Die meisten termino-

logischen Einträge sind viersprachig vorhanden. Beim Zusammenführen der

Datenbestände sind Doubletten entstanden oder verschiedene Datenkategorien

wie Kontext oder Definition doppelt ausgeführt worden. Die Konsolidierung des

Datenbestandes erfolgte nach den Prinzipien der Terminologiearbeit und der

Terminologievalidierung. Im ersten Schritt wurden die Doubletten überprüft und

bereinigt, um dann mit der inhaltlichen Überprüfung und Konsolidierung fortzu-

fahren. Es wurde folgender Konsolidierungsbedarf festgestellt: Die Einträge

mussten terminographisch einheitlich ausgeführt werden; hierzu wurde über-

prüft, ob sich die Datenkategorien auf den entsprechenden Ebenen befinden.

Dann musste die Vollständigkeit der Einträge überprüft werden, so dass jede

eingetragene Benennung und jede eingegebene Definition, jeder Kontext und

jede Note auch mit der entsprechenden Quelle belegt wurden. Außerdem wur-

de auch eine Formalkontrolle unternommen, um zu gewährleisten, dass z. B.

die Formalien für die Definitionserfassung eingehalten wurden oder dass die

Page 62: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

62

Benennungen in der Grundform ausgeführt wurden. Während der Konsolidie-

rung wurde auch auf die Rechtschreibung geachtet.

Ein sehr wichtiger Schritt in der Konsolidierung war auch die Plausibilitätskon-

trolle. Viele der Einträge aus der griechischen Terminologie der Terminologie

stammten nämlich aus Normen, hatten aber nicht immer einen wirklichen termi-

nologischen Mehrwert, da es sich meistens um Begriffe aus der Allgemeinspra-

che oder um Begriffe, die aus einem komplexeren Kontext genommen wurden,

handelte. So musste überlegt werden, ob diese Einträge komplett aus der Da-

tenbank gelöscht werden sollten oder ob sie in der verbliebenen Zeit noch do-

kumentiert werden sollten. Es wurde die Entscheidung getroffen, diese Einträge

nicht zu löschen und so weit wie möglich in diesem Schritt zu dokumentieren

und vielleicht zu einem späteren Zeitpunkt kooperativ weiter zu bearbeiten.

In den folgenden Unterkapiteln werden zuerst der Vorgang der Doublettenbe-

reinigung und dann beispielhaft behobene Probleme bei der Konsolidierung des

Datenbestands vorgestellt.

3.4.1 Doubletten bereinigen

In MultiTerm gibt es die Möglichkeit über die Funktion „Suche nach Doublet-

ten“ unter der Registerkarte Suche Doubletten zu suchen und diese danach

manuell zu bereinigen. Die Doubletten wurden in der Hitliste-Ansicht angezeigt.

Die entsprechenden Doubletten mussten zunächst inhaltlich überprüft werden,

um feststellen zu können, ob es sich nicht um Scheindoubletten handelte, wie

es z. B. bei Homonymen der Fall ist oder ob die Einträge tatsächlich die glei-

chen Informationen beinhalten. Wurden Scheindoubletten gefunden, wie z. B.

der Begriff Sprachebene, der einmal Register und einmal Indexebene bedeuten

kann, so wurden diese gemäß dem Prinzip der Begriffsorientierung in der Da-

tenbank als separate Einträge verwaltet (Abbildung 23).

Page 63: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

63

Abbildung 23: Scheindoubletten

Wurde festgestellt, dass in den doppelten Einträgen unterschiedliche Informati-

onen vorhanden sind, so mussten diese echten Doubletten zusammengeführt

werden.

Für eine Bereinigung der echten Doubletten wird die Funktion Zusammenführen

über die Registerkarte Bearbeiten oder mit der Taste F9 ausgeführt.

Doubletten können allerdings sehr schwer in der Hitliste-Ansicht zusammenge-

führt und dort bearbeitet werden, da manchmal unerwartete Fehlermeldungen

angezeigt werden. Werden zwei Einträge zusammengeführt, so muss immer

nach der Speicherung des vollständigen Eintrags der unvollständige ursprüngli-

che Eintrag gelöscht werden.

Page 64: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

64

Abbildung 24: MultiTerm: Doubletten zusammenführen

3.4.2 Inhalte konsolidieren und optimieren

In diesem Kapitel werden anhand ausgewählter Beispiele aus der TermTerm-

Datenbank Einträge vorgestellt, bei denen ein hoher Bedarf an Konsolidierung

und Optimierung bestand.

Definitionen

Wie in Abbildung 25 hervorgehoben wird, wurde in den meisten Einträgen, die

aus der elcat-Datenbank stammten, die Definition auf der Benennungsebene

platziert. Diese wurde nach den Grundsätzen der Datenmodellierung auf die

Sprachebene verschoben, da es in den meisten Fällen mehrere Benennungen

zu einem Begriff in einer Sprache gibt und in der Definition der Begriff als Gan-

zes definiert werden soll und nicht nur separate Benennungen.

Page 65: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

65

Abbildung 25: Definition auf Benennungsebene

Anhand dieses Beispiels ist auch festzustellen, dass die Definition nicht nach

den Prinzipien der Definitionserstellung erfasst wurde. So wurden Beispiele ei-

ner Kurzform in die Datenkategorie definition mit eingefügt. In solchen Fällen

wurden in dieser Datenbank Beispiele zu einem Begriff oder mögliche Werte in

die Datenkategorie note verschoben.

Außerdem wurde bei den Definitionen überprüft, ob diese den inhaltlichen An-

forderungen entsprechen. Es wurden Inhaltsdefinitionen vorgezogen und wenn

keine Definitionen vorhanden waren, wurden die wichtigsten Begriffe mit pas-

senden Kontexten dokumentiert.

Die Definitionen wurden auch nach den orthographischen Regeln überprüft. So

wurden Artikel am Anfang einer Definition oder Satzpunkte am Ende gelöscht.

Definitionen sollen orthographisch so gestaltet werden, dass die Benennung im

Kontext durch die Definition ersetzt werden kann. Die Definitionen wurden im-

mer mit Quellen belegt und es wurde versucht, die meisten Definitionen aus

Normen oder aus wichtigen terminologischen Arbeiten zu recherchieren und in

der Datenbank hinzuzufügen.

Kontexte

In der Terminologiearbeit wird bei der Erstellung von terminologischen Einträ-

gen auch auf die Erfassung von Kontexten viel Wert gelegt. Kontexte sind

Satzbeispiele, die die typische Verwendung einer Benennung aufzeigen. Des-

wegen müssen Kontexte sorgfältig ausgewählt werden und nicht nur einfache

Sätze, die keinen Mehrwert für den terminologischen Eintrag aufweisen, in die

Datenbank kopiert werden. Überflüssige Kontexte werden den Nutzer nur unzu-

frieden stellen und erhöhen das Risiko, dass die Datenbank dadurch an Akzep-

tanz verliert.

Page 66: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

66

In der TermTerm-Datenbank waren meist entweder viele Einträge ohne Kontex-

te hinterlegt und bei den Einträgen von der Fachhochschule Köln meistens

auch überflüssige Kontexte (Abbildung 26).

Abbildung 26: Überflüssige Kontexte

In diesem Fall wurde versucht, für möglichst viele Begriffe auch passende Kon-

texte aus terminologischen Arbeiten oder Normen zu finden (Abbildung 27).

Abbildung 27: geeigneter Kontext

Kontexte können neben Definitionen auch dann sehr hilfreich sein, wenn es in

einer Datenbank für eine Benennung noch kein Äquivalent in einer Sprache gibt.

So erwies sich als sehr schwierig, das passende Äquivalent zu finden, wenn

überhaupt kein Kontext vorhanden war (Abbildung 28).

Äquivalente finden

In dem folgenden Beispiel musste eine passende Benennung im Deutschen

gefunden werden, was ohne eine Definition oder einen geeigneten Kontext

Page 67: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

67

nicht möglich ist. Im Deutschen könnte als Äquivalent für „abstract illustrati-

on“ „abstrakte Abbildung“, „abstraktes Bild“ oder „abstrakte Illustration“ verwen-

det werden. In der Norm wird allerdings die Abbildung als figure vorgegeben.

Abbildung 28: Äquivalent finden

Auch in dem folgenden Beispiel ist es ohne Kontext schwer zu entscheiden, ob

„Richtigkeit“ das deutsche Äquivalent von „accuracy“ ist oder ob „Genauig-

keit“ passender ist, was auf Englisch jedoch mit „conciseness“ übersetzt wird.

Anhand dieses Beispiels kann man erkennen, dass es in der Terminologiearbeit

nicht um die Übersetzung von Termini geht, sondern darum, zu recherchieren

ob derselbe Begriff in diesem Fachbereich vorhanden ist und welche Benen-

nungen diesen Begriff repräsentieren. So sucht man nach Äquivalenten und

versucht nicht den Terminus einfach in die andere Sprache zu transportieren.

Page 68: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

68

3.5 Bereitstellung der TermTerm-Datenbank

Die inhaltliche Aufbereitung, die Konsolidierung und die Bereinigung der Daten

wurden in SDL MultiTerm 2009 durchgeführt. SDL Multiterm ist ein Terminolo-

gieverwaltungssystem, das als eigenständiges System oder als Komponente

des SDL TRADOS Studio benutzt werden kann. Die Verwaltung von terminolo-

gischen Beständen in MultiTerm kann entweder über eine Client-Anwendung

oder über den MultiTerm Server vorgenommen werden.

Die Bereinigung der TermTerm-Datenbank wurde in einer Client-Anwendung

durchgeführt.

Sehr vorteilhaft in MultiTerm ist, dass die Datenbankdefinition nicht im Vorhinein

in der Software konfiguriert und fixiert ist, sondern sich durch den Benutzer oder

Termbankadministrator leicht verändern lässt. So konnten z. B. während der

Bereinigung der TermTerm-Datenbank neue Felder hinzugefügt und bereits

bestehende geändert oder gelöscht werden. Die Änderung verschiedener Da-

tenkategorien kann allerdings nur vorgenommen werden, wenn in diesen Da-

tenkategorien keine Inhalte gespeichert wurden. Wurden diese Datenkategorien

schon ausgefüllt, muss die Datenbank in eine XML-Datei exportiert werden,

eine neue Datenbankdefinition auf Basis der alten Datenbankdefinition erstellt

werden, die Datenkategoriennamen in XML geändert und dann wieder in Multi-

Term importiert werden.

Für die Eintragung von terminologischen Daten in einer Terminologiedatenbank

gibt es in MultiTerm nützliche Termbankobjekte wie z. B. Eingabemodelle oder

Layouts, womit man diesen Prozess steuern und kontrollieren kann.

Eingabemodell

Die Eingabemodelle (engl. Input models) gelten als Vorlagen, anhand derer die

Konsistenz der Daten sichergestellt werden kann.

Die Eingabemodelle sind Termbank-spezifisch, können aber gespeichert und in

eine andere Datenbank eingefügt und angepasst werden. In MultiTerm gibt es

ein Standard-Eingabemodell, aber es können auch zusätzlich benutzerdefinier-

te Eingabemodelle für bestimmte Termbanken und bestimmte Rollen erstellt

werden.

Da die Eingabemodelle zur Gewährleistung der Konsistenz der Datenbankein-

träge beitragen, wurde auch für die Eingabe und Bereinigung der Daten in der

Page 69: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

69

TermTerm-Datenbank vor dem Bearbeiten des Inhalts ein benutzerdefiniertes

Eingabemodell erstellt.

Wie in Abbildung 29 veranschaulicht, erfolgt die Erstellung eines Eingabemo-

dells in MultiTerm anhand eines Assistenten.

Es können Eingabemodelle für verschiedene Nutzerrollen definiert werden. So

werden z. B. unter Anwendung eines bestimmten Eingabemodells manche Da-

tenbankfelder gesperrt, so dass diese nicht bearbeitet werden können. Es kön-

nen Standard-Werte festgelegt werden, damit die Konsistenz der Daten ge-

währleistet wird oder es kann festgelegt werden, ob Datenkategorien mehrfach

belegt werden können. Bei der Definition eines Eingabemodells kann auch ent-

schieden werden, ob, wie oft und in welcher Reihenfolge Index-, Text- und be-

schreibende Felder erscheinen.

In dem benutzerdefinierten Modell für die TermTerm-Datenbank wurde z. B. für

mehrere Felder eine Mehrfachbelegung erlaubt oder z. B. für die Datenkatego-

rie partOfSpeech der Standardwert noun festgelegt, da die Mehrheit der Einträ-

ge in der Datenbank Substantive sind. Bei der Bereinigung der griechischen

Einträge wurde als Standardwert für die Datenkategorie originatingInstitution

ELETO ausgewählt, um so die Bearbeitung der Einträge zu erleichtern und da-

mit nicht alle Felder jedes Mal ausgefüllt werden müssen.

Abbildung 29: Eingabemodelldefinition in MultiTerm

Bei der Bereinigung der Daten in MultiTerm wurde aber leider festgestellt, dass

das Arbeiten mit Eingabemodellen die Bearbeitung erleichtern könnte, wenn

Page 70: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

70

nicht zwischendurch Fehlermeldungen erscheinen oder bereits gelöschte Fel-

der nicht wieder überraschend auftauchen würden. Es wurde in diesem Fall

unmöglich, mit einem Eingabemodell zu arbeiten, so dass jede Datenkategorie

einzeln angeklickt werden musste.

Layout

Ein anderes nützliches Datenbankobjekt für die Darstellung der Daten in Multi-

Term sind die Layouts. Es können rollenspezifische Layouts für die Präsentati-

on von Daten erstellt werden. Ist die Datenbankstruktur sehr komplex und auf-

wändig dokumentiert, kann man für bestimmte Benutzergruppen unter

Anwendung eines benutzerdefinierten Layouts nur bestimmte Datenkategorien

anzeigen lassen. So werden die Benutzer von der Komplexität der Daten nicht

überfordert und reagieren gegebenenfalls gegenüber der Einsetzung einer

Terminologiedatenbank positiver. Anhand dieser Layouts können z. B. für die

Entwicklerrolle nur die relevanten Daten angezeigt werden, wie z. B. Abbildung,

Fachgebiet, Produktlinie, Definition etc. und Metadaten wie Genus, Numerus

oder Termtyp ausgeblendet werden.

MultiTerm verfügt auch über Standardlayouts, wie z. B. „Flags layout“ (Abbil-

dung 30) oder „Full layout“. Anhand dieser Standardlayouts werden aber Da-

tenkategorien in der Reihenfolge ihrer Erfassung angezeigt.

Abbildung 30: Standard Flags Layout in MultiTerm

Page 71: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

71

Für die TermTerm-Datenbank wurde ein exemplarisches Layout anhand eines

Assistenten erstellt, anhand dessen alle Datenkategorien auf jeder Ebene

angezeigt werden (Abbildung 31).

Abbildung 31: TermTerm-Layout

quickTerm

Die Terminologielehre ist eine sehr junge Wissenschaft und deswegen ist eine

Terminologie der Terminologie lebendig und in ständiger Umwandlung. In

Deutschland und auf internationalem Niveau werden ständig neue Normen her-

ausgegeben und alte Normen aktualisiert oder neue Werkzeuge mit neuen

Funktionalitäten entwickelt. In manchen Ländern sind die Terminologiewissen-

schaft und die Terminologiearbeit im Allgemeinen noch nicht so bekannt oder

gerade in der Anfangsphase. Auch in diesen Sprachen wird später eine Termi-

nologie der Terminologie entstehen. Deshalb ist es unbedingt notwendig, le-

bendige Prozesse und technische Unterstützung für die Terminologie der Ter-

minologie zu gewährleisten, um immer mehr Terminologieinteressierte in die

Erstellung einer vollständigen und aktuellen Datenbank einzubinden.

In diesem Fall könnte man von einem Life-Cycle-Management der TermTerm-

Datenbank reden, was konkret Beantragung, Aufnahme, Ablehnung, Review,

Import und Export von terminologischen Daten in einer oder mehreren Spra-

chen bedeutet (vgl. Dutz/Fleischmann, 2012).

Page 72: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

72

Um ein sinnvolles Life-Cycle-Management für die TermTerm-Datenbank zu si-

chern, wird die Datenbank demnächst auf der Internetpräsenz des TermTerm-

Konsortiums mittels des Terminologiewerkzeugs quickTerm zur Verfügung ge-

stellt. quickTerm setzt auf der in MultiTerm bestehenden Terminologiedaten-

bank auf und kann aus jedem Windows-Programm per Tastenkombination auf-

gerufen werden. Für die Verwaltung der TermTerm-Datenbank wird quickTerm

über einen Webbrowser zur Verfügung gestellt und kann auch ohne Einloggen

als Gast unter limitierten Zugriffsrechten genutzt werden. Ein besonderes

Merkmal von quickTerm ist die transparente Abbildung des Terminologiebean-

tragungs- und Validierungsprozesses.

Für die Beantragung von Termini kann für jede Benutzergruppe konfiguriert

werden, welche Informationen aus MultiTerm die entsprechenden Benutzer

beim Termantrag mit ausfüllen können oder müssen. Termanträge können ein-

sprachig oder mehrsprachig sein, je nach Berechtigung.

Abbildung 32: Termantrag in quickTerm

Page 73: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

73

Jeder Termantrag geht zunächst an den Terminologen. Dieser entscheidet dar-

über, ob ein Antrag grundsätzlich in die Termbank aufgenommen wird. Danach

kann der Terminologe den Antrag gezielt Fachleuten zuweisen und anschlie-

ßend die Informationen von diesen in die Termbank übernehmen. Die vorberei-

teten Einträge können dann in vordefinierte Freigabeschleifen geschickt werden,

in denen sich die Zuständigen abstimmen.

Der Antragsteller wird immer per E-Mail über den Ausgang seines Antrags in-

formiert.

Sehr wichtig für das Freigabeverfahren in quickTerm ist der Abstimmungspro-

zess. Die Dokumentation des Prozesses kann auch in MultiTerm übertragen

werden. Im Konzept von quickTerm erfolgt der Freigabeprozess immer auf

Sprachebene, da sich in einer bestimmten Sprache durch Einfügen von neuen

Benennungen die Gesamtkonstellation von Vorzugsbenennungen verändern

kann und so die Sprache immer neu freigegeben werden muss. Dafür ist es

wichtig, die Sprachebene mit den entsprechenden Workflowfeldern zu versehen.

Wird eine Dokumentation des gesamten Freigabeprozesses in MultiTerm er-

wünscht, so müssen entsprechende Felder für den Gesamtworkflow jeder

Sprache auf Sprachebene eingefügt werden. Eine Empfehlung dafür wäre

Workflow-Status mit den Werten Neu, In Bearbeitung, Alle abgestimmt und Ab-

geschlossen. Für jeden einzelnen Freigabeworkflow (sprich für jede Freigabe-

gruppe) wird ein entsprechendes Feld mit der Freigabehistorie benötigt und für

die Kommentare, die zwischen den Freigebern ausgetauscht werden, ein Text-

feld auf Sprachebene (kaleidoscope, 2012).

Da die TermTerm-Datenbank TBX-konform gestaltet wurde, wurden für die Do-

kumentation auf Sprachebene die Datenkategorien processHistory, processSta-

tus mit den Werten: unprocessed, finalized und provisionallyProcessed und

processNote hinzugefügt. Die Datenkategorie processStatus stammt aus dem

Datenkategorieverzeichnis isocat.org und wird wie folgt definiert: „The status of

a lexical unit or term with respect to its advancement within the standardization

process” (ISO 12620)

Ein terminologischer Eintrag in quickTerm sieh wie folgt aus:

Page 74: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

74

Abbildung 33: terminologischer Eintrag in quickTerm

3.6 Exemplarische TBX-konforme Exportdefinition

Wie im vorherigen Kapitel beschrieben wurde, wurde die Terminologie der Ter-

minologie in MultiTerm erstellt und verwaltet. Damit die Datenbank auch ande-

ren Nutzern zur Verfügung gestellt werden kann, wurde anhand dieser Daten-

bankstruktur eine exemplarische Exportdefinition für TBX erstellt, die in diesem

Unterkapitel vorgestellt wird.

Auf der einen Seite stellt MultiTerm schon wesentliche Eigenschaften bereit, die

notwendig sind, um eine TBX-Schnittstelle zu erstellen, wie z. B. die Orientie-

rung nach dem ISO-Metamodell, bzw. die Möglichkeit, geschlossene und offene

Datenkategorien auf Begriffs-, Sprach- und Benennungsebene zu verteilen so-

wie die Begriffsorientierung und Benennungsautonomie.

Auf der anderen Seite wird durch die Möglichkeit, die Datenkategorien nutzer-

spezifisch zu modellieren, indem man den Sprachen oder den Datenkategorien

eigene Namen gibt sowie Picklisten mit eigenen Werten zu erstellen oder Da-

tenkategorien beliebig auf verschiedenen Ebenen hinzuzufügen, die Bereitstel-

lung einer exemplarischen Schnittstelle für alle User erschwert (vgl. Schmitz K.-

D., 2012).

In MultiTerm wird ein Standard TBX-Export-Format zur Verfügung gestellt, was

jedoch vom Nutzer bearbeitet werden muss, da bei diesem Export manche Da-

tenkategorien nicht in die in der TBX-Norm vorgesehenen Tags eingeordnet

Page 75: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

75

werden, keine Querverweise angezeigt werden oder Picklisten nicht erkannt

werden (Abbildung 34).

In MultiTerm wird das Export-Format TBX (LISA 2002) als „TBX XML file, com-

pliant with the TBX core structure, schema version file TBXcsV02.xsd, as re-

leased by LISA 13 May 2002” beschrieben.

Wie in Abbildung 34 dargestellt, werden in der exportierten TBX-Datei alle Da-

tenkategorien in <descripGrp> eingeordnet. Dies entspricht aber nicht den Spe-

zifikationen des TBX-Standards (ISO 30042, 2008).

Abbildung 34: Export mit dem vorhandenen TBX-Export-Format

Aus diesem Grund muss in MultiTerm eine benutzerdefinierte Export-Definition

erstellt werden. Die Modellierung dieser erfolgt anhand eines Assistenten (Ab-

bildung 35). Anhand dieses Assistenten können Datenkategorien aus der Da-

tenbankstruktur ausgewählt, in einer beliebigen Reihenfolge exportiert und mit

den konformen Tags versehen werden. Im Folgenden werden mögliche Ände-

Page 76: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

76

rungen des Standard TBX-Exports von MultiTerm in Reihenfolge der Ebenen

des TMF-Modells vorgestellt.

Abbildung 35: Export-Assistent MultiTerm

Auf Begriffsebene (<termEntry>) werden nach dem MultiTerm-Export alle Da-

tenkategorien im Tag <descripGrp> dargestellt:

Abbildung 36: <termEntry> im MultiTerm-TBX-Export

Laut ISO 30042 wird aber z. B. die Datenkategorie originatingInsitution anhand

des Tags <admin> dargestellt. Außerdem wurden die Datenkategorien note und

noteSource inerhalb des Tags <adminGrp> als <admin> und <adminNote>

dargestellt. Abbildung 37 zeigt im Vergleich die Änderungen auf Begriffsebene.

Abbildung 37: <termEntry> TBX-konform

Auch auf Sprachebene (<langSet>) werden nach MultiTerm-TBX-Export auch

alle Datenkategorien im Tag <descripGrp> dargestellt (Abbildung 38).

Page 77: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

77

Abbildung 38: <langSet> im MultiTerm-TBX-Export

Auf Sprachebene wurden die Datenkategorien definition und definitionSource

zusammen in einer <descripGrp> und die Datenkategorien note und no-

teSource in einer <adminGrp> eingeordnet. Die anderen Datenkategorien auf

Sprachebene wurden in einfachen <descrip> dargestellt (Abbildung 39).

Abbildung 39: <langSet> TBX-konform

Auf Benennungsebene (<tig>) werden im MultiTerm-Export auch alle Datenka-

tegorien in <descripGrp>-Tags dargestellt (Abbildung 40).

Abbildung 40: <tig> im MultiTerm-TBX-Export

Page 78: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

78

Anhand der Spezifikationen im TBX-Standard wurden alle Informationen, die

sich auf die Benennung beziehen in <termNote>-Tags eingeordnet. Die Daten-

kategorien context, contextSource und note, noteSource wurden in <descrip-

Grp> bzw. <adminGrp> eingeordnet. (Abbildung 41)

Abbildung 41: <tig> TBX-konform

Sehr schwer zu modellieren sind die Querverweise in den Datenkategorien

source, noteSource, definitionSource und contextSource. Diese werden bei

dem MultiTerm- TBX-Export nicht als Querverweise exportiert. In ISO 30042

(ISO 30042, 2008) werden mehrere Möglichkeiten für die Darstellung von Quel-

len vorgeschlagen. Es kann auf in TBX eingebettete oder auf externe Elemente

verwiesen werden. Für die externen Elemente oder auch Internetquellen wird

das <xref>-Tag verwendet. (Abbildung 42)

Abbildung 42: Querverweis Source in TBX (ISO 30042)

Außer auf externe Links kann man auch auf bibliografische Einträge oder zu-

ständige Personen verweisen, deren Daten in der TBX-Datei schon vorhanden

sind.

Eine Modellierung für die Ausgabe von Querverweisen war für die TermTerm-

Datenbank jedoch nicht möglich, da die Quellen sehr unterschiedlicher Art sind.

Es wäre empfehlenswert, für die Datenkategorien source, definitionSource, no-

Page 79: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Optimierung der TermTerm- und der ELETO-Datenbank

79

teSource und contextSource verschiedene Möglichkeiten für die Eintragung von

Quellen (Internetadressen, bibliographische Einträge oder zuständige Personen)

anzubieten. Dafür muss man z. B in der Datenbankdefinition für die Eintragung

von Internetquellen die Datenkategorie xSource ablegen.

Die exportierte TBX-Datei kann mittels des TBX-Checkers validiert werden.

Hierzu muss jedoch die DTD um die Datenkategorien, die nicht in der ISO-

Norm vordefiniert sind, aber in der vorliegenden Datenbank vorkommen, erwei-

tert werden.

Page 80: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Zusammenfassung und Ausblick

80

4 Zusammenfassung und Ausblick

Die in dem Projekt TermTerm entstandene Terminologie der Terminologie dient

als Wissensdatenbank, in der die wichtigsten Begriffe im Terminologiebereich

zu finden sind. Der Mehrwert dieser Datenbank liegt in der knappen Präsentati-

on der Informationen zu einem Begriff, so dass es nicht mehr nötig ist, die In-

formationen aus mehreren Quellen, wie z. B. Normen oder terminologischen

wissenschaftlichen Arbeiten zu recherchieren.

Außerdem wird dieser terminologische Datenbestand einem großen Zielpubli-

kum zur Verfügung gestellt und damit hoffentlich die Neugier geweckt, sich zu

vernetzen oder Terminologien der Terminologie auch in anderen Sprachen zu

erstellen.

Ziel der Systematisierung und des Festhaltens in einer Datenbank der Termino-

logie der Terminologie ist es letztendlich, diesen Fachwortschatz zu verteilen

und weiter zu entwickeln. Davon können mehrere Akteursgruppen profitieren,

sei es technische Redakteure oder Übersetzer, die sich auch im Terminologie-

bereich spezialisieren möchten oder Terminologen, die z. B. ihre Fachartikel

nach der festgelegten Terminologie überprüfen möchten.

Ziel dieser Masterarbeit war es unter anderem die Terminologie der Terminolo-

gie zu bereinigen und ein Konzept für die Zusammenführung mehrerer Bestän-

de zu erarbeiten. Dies kann später als Vorlage für die gleiche Arbeit in anderen

Sprachen gelten. Außerdem können die Struktur der Datenbank und die Ansät-

ze, nach denen die Bestände erarbeitet wurden, auch als Beispiel für normative

Terminologiearbeit für verschiedene Organisationen oder Unternehmen dienen.

Bis zur Freigabe und Veröffentlichung der Datenbank sind noch einige Aufga-

ben zu bewältigen. Da der Verfasserin während der Arbeit nicht alle Normen

und wissenschaftlichen Arbeiten zur Verfügung standen, konnten manche Ein-

träge nicht genügend dokumentiert werden. Es wäre wünschenswert, wenn die-

se Normen angeschafft würden und die Einträge um die fehlenden Informatio-

nen ergänzt würden. Dazu kommt auch, dass Normen und Technologien im

Bereich der Terminologie immer wieder ergänzt oder weiterentwickelt werden.

Dadurch wird es nötig, diese Datenbank immer auf den neuesten Stand zu

bringen. Außerdem konnte bei manchen Einträgen von der Verfasserin dieser

Arbeit die Entscheidung über die normative Verwendung mancher Benennun-

Page 81: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Zusammenfassung und Ausblick

81

gen nicht getroffen werden. Auch hier muss in einem folgenden Schritt be-

schlossen werden, wer die Freigabe übernimmt.

Außerdem sieht die Verfasserin es als eine sehr wichtige Aufgabe für die Zu-

kunft, einen Leitfaden für das kooperative Arbeiten an der Weiterentwicklung

der Terminologie der Terminologie (Erfassungsrichtlinien für vorgeschlagene

Einträge, Arbeiten mit quickTerm, Rollensystem etc.) zu erstellen, damit die

Konsistenz innerhalb der TermTerm-Datenbank gewährleistet werden kann.

Diese Informationen sollten dann auf der Webseite des TermTerm-Projekts zur

Verfügung gestellt werden (www.termterm.org).

Obwohl die Arbeit im Rahmen eines Hochschulprojekts und nicht in einem Un-

ternehmen verfasst wurde, war trotzdem durch realistische Arbeitsprozesse wie

z. B. Bereinigung, Zusammenführung oder Export-/Importvorgänge ein „lebens-

naher“ Praxisbezug vorhanden.

Die Verfasserin erachtet das Themengebiet dieser Arbeit mit der Abgabe der

Masterarbeit als für sie noch nicht abgeschlossen und äußert den Wunsch einer

neuen Möglichkeit, sich mit dem Thema weiter zu beschäftigen.

Page 82: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Abkürzungsverzeichnis

82

5 Abkürzungsverzeichnis

CI Complementary Information

DIN Deutsches Institut für Normung

DTD Document Type Definition

ELETO Hellenic Society for Terminology

ISO International Organization for Standardization

LISA Localization Industry Standards Association

LS Language Section

MS Microsoft

OSCAR Open Standards for Container/content

AlllowingReuse

SALT Standards-based Access to Lexicographical

&Terminological multiligual resources

TBX TermBase eXchange

TCS Terminology Component Section

TE Terminological Entry

TerminOrgs Terminology for Large Organizations

TMF Terminology Markup Framework

TMS Translation Memory System

TS Term Section

TVS Terminologieverwaltungssystem

XML Extensible Markup Language

XSL Extensible Stylesheet Language

XSLT Extensible Stylesheet Language Transformation

Page 83: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Abbildungsverzeichnis

83

6 Abbildungsverzeichnis

Abbildung 1: Semitoisches Dreieck _______________________________________________________ 17

Abbildung 2: Wüsters Modell (Wüster, 1991) _______________________________________________ 18

Abbildung 3: Oesers Modell (Schmitz K.-D., 2011) ___________________________________________ 18

Abbildung 4:ISO-Norm Modell (Schmitz, 2011) _____________________________________________ 19

Abbildung 5:Schmitz-Modell (Schmitz, 2011) _______________________________________________ 19

Abbildung 6: terminologisches Metamodell ISO 16642 _______________________________________ 32

Abbildung 7: Begriffsorientierung (Schmitz, 2012) ___________________________________________ 35

Abbildung 8: TBX Grundstruktur ISO 30042 ________________________________________________ 40

Abbildung 9: TBX Beispiel ______________________________________________________________ 42

Abbildung 10: Datenbankdefinition FH-Köln ________________________________________________ 49

Abbildung 11: Datenbankdefinition elcat __________________________________________________ 51

Abbildung 12: Datenbankdefinition TermTerm _____________________________________________ 53

Abbildung 13: Access-Datenbank ELETO ___________________________________________________ 54

Abbildung 14: PDF-Glossar ELETO ________________________________________________________ 54

Abbildung 15: Quellen in ELETO _________________________________________________________ 55

Abbildung 16: Struktur ELETO-Access-Datenbank ___________________________________________ 56

Abbildung 17: Excel-Export-Datei ELETO-Datenbank _________________________________________ 57

Abbildung 18: MultiTerm Convert Bestimmen der Ausgangs- und Zieldateien _____________________ 58

Abbildung 19: MultiTerm Convert Datenkategorietypen festlegen ______________________________ 59

Abbildung 20: MultiTerm Convert Eintragsstruktur erstellen __________________________________ 59

Abbildung 21: Konvertierung in XML ______________________________________________________ 60

Abbildung 22: MultiTerm: Import-Assistent ________________________________________________ 61

Abbildung 23: Scheindoubletten _________________________________________________________ 63

Abbildung 24: MultiTerm: Doubletten zusammenführen ______________________________________ 64

Abbildung 25: Definition auf Benennungsebene _____________________________________________ 65

Abbildung 26: Überflüssige Kontexte _____________________________________________________ 66

Abbildung 27: geeigneter Kontext ________________________________________________________ 66

Abbildung 28: Äquivalent finden _________________________________________________________ 67

Abbildung 29: Eingabemodelldefinition in MultiTerm ________________________________________ 69

Abbildung 30: Standard Flags Layout in MultiTerm __________________________________________ 70

Abbildung 31: TermTerm-Layout _________________________________________________________ 71

Abbildung 32: Termantrag in quickTerm __________________________________________________ 72

Abbildung 33: terminologischer Eintrag in quickTerm ________________________________________ 74

Abbildung 34: Export mit dem vorhandenen TBX-Export-Format _______________________________ 75

Abbildung 35: Export-Assistent MultiTerm _________________________________________________ 76

Abbildung 36: <termEntry> im MultiTerm-TBX-Export ________________________________________ 76

Abbildung 37: <termEntry> TBX-konform __________________________________________________ 76

Page 84: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

84

Abbildung 38: <langSet> im MultiTerm-TBX-Export __________________________________________ 77

Abbildung 39: <langSet> TBX-konform ____________________________________________________ 77

Abbildung 40: <tig> im MultiTerm-TBX-Export ______________________________________________ 77

Abbildung 41: <tig> TBX-konform ________________________________________________________ 78

Abbildung 42: Querverweis Source in TBX (ISO 30042) _______________________________________ 78

Page 85: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Literaturverzeichnis

85

7 Literaturverzeichnis

ISO 30042. (2008). Systems to manage terminology, knowledge and content--

TermBase eXchange (TBX). Geneva: ISO.

DIN 2330. (Juni 2011). Begriffe und Benennungen –Allgemeine Grundsätze.

DIN 2342. (08 2011). Begriffe der Terminologielehre. Berlin.

ISO 26162. (2012). Systems to manage terminology,knowledge and content-

Design,implementation and maintenance of terminology management

systems. Geneva: ISO.

XSL Transformation-Wikipedia. (11. 12 2012). (Wikipedia) Abgerufen am 09. 10

2012 von http://de.wikipedia.org/wiki/XSL_Transformation

Arnzt, R./Picht, H./Mayer, F. (2009). Einführung in der Terminologiearbeit.

Hildesheim: Olms.

Bauer, S. C./ Drewer, P./ Fähndrich, U./ Herwartz, R./ Massion, F./ Pulitano, D./

Schmitz, K-D (2010). Grundsätze und Methoden. In DTT e.V.,

Terminologiearbeit- Best Practices (S. M 2-1-M2-22). Köln: Deutscher

Terminologie Tag e.V.

Christer, L./ Myking, J./ Picht, H. (1998). Terminologie unter der Lupe. Vom

Grenzgebiet zum Wissenschaftszweig. Wien: TermNet (IITF-Series 9).

Dutz, P./Fleischmann, K. (2012). Terminologie Life-Cycle-Management-Ein

integrierter Einsatz. In S. K.-D. Mayer Felix, Terminologieprozesse und

Terminologiewerkzeuge: Akten des Symposions Heidelberg,19-21 April

2012 (S. 39-46). Köln/München: DTT.

DTT (2010). Terminologiearbeit- Best Practices. Köln: Deutscher Terminologie

Tag e.V.

ELETO. (06. Dezember 2012). ELETO. Von

http://www.eleto.gr/en/termbases.htm abgerufen

Felber, H/Budin, G. (1989). Terminologie in Theorie und Praxis. Tübingen: Narr.

Group, B. T. (10. 12 2012). LISA OSCAR Standards. Von TBX specification:

http://www.ttt.org/oscarStandards/tbx/ abgerufen

Herwartz, R./ Massion, F./Prusseit, I./ Pulitano, D./ Reineke, D./ Rösener, C./

Seewald-Heeg, U./ Zerfaß, A. (2010). Werkzeuge und Technologien. In

DTT, Terminologiearbeit- Best Practices (S. M4-1-M4-32). Köln: DTT e.V.

Page 86: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Literaturverzeichnis

86

kaleidoscope. (13. 12 2012). quickTerm Web 5.2. Von

http://quickterm.kaleidoscope.at/termterm/Pages/Help/de/index.html

abgerufen

KÜDES: Konferenz der Übersetzungsdienste europäsicher Staaten. (2002).

Empfehlungen für die Terminologiearbeit. Bern: Schweizer

Bundeskanzlei.

Mayer, F. (1998). Eintragsmodelle für terminologischen Datenbanken. Tübingen:

Narr.

Mayer, F./Schmitz K.-D. (2011). Terminologie vor neuen Ufer. Ausgewählte

Beiträge der DTT-Symposien 200-2010. München/ Köln: Deutscher

Terminologie-Tag e. V.

Mayer, F./Schmitz K.-D. (2012). Terminologieprozesse und

Terminologiewerkzeuge. Akten des Symposions Heidelberg, 19.-21. April

2012. München/ Köln: Deutscher Terminologie-Tag e. V.

Microsoft. (11. 12 2012). Microsoft Access. (wikipedia) Abgerufen am 16. 10

2012 von http://de.wikipedia.org/wiki/Microsoft_Access

Reineke, D. (2005). MARTIF und TBX- Terminologieaustauschformate für dei

Lokalisierung. In D. K.-D. Reineke, Einführung in die

Softwarelokalisierung (S. 177-188). Tübingen: Narr.

Reineke, D. (2012). TBX-Modellierung, Auszeichnung und Austausch

terminologischer Daten. In F. Mayer, & K.-D. Schmitz,

Terminologieprozesse und Terminologiewerkzeuge: Akten des

Symposions Heidelberg,19-21 April 2012 (S. 193-202). München/Köln:

Deutscher Terminologie-Tag e.V.

Reinke, U. (2012). Terminologiearbeit für und mit Sprachtechnlogie. In F. Mayer,

& K.-D. Schmitz, Terminologieprozesse und Terminologiewerkzeuge.

Akten des Symposions Heidelberg, 19-21 April 2012 (S. 101-119).

München/Köln: DTT.

Resources, I. T. (06. Dezember 2012). ISOcat-Data Category Registry.

Abgerufen am 18. 10 2012 von

https://catalog.clarin.eu/isocat/interface/index.html

Schmitz, K.-D. (2011). Skript Vorlesung Terminologiewissenschaft. Köln.

Schmitz, K.-D. (2012). elcat-Projekt beendet, Lernsystem für Terminologie

verfügbar. eDITion(1), 36-37.

Page 87: Optimierung, Konsolidierung und Anreicherung einer ... · Über das Projekt TermTerm 7 zweiten Semester die Begriffe der Terminologie der Terminologie klären und in einer Datenbank

Literaturverzeichnis

87

Schmitz, K.-D. (2012). TBX-ein Standard für den Austausch terminologischer

Daten: Anforderungen, Probleme, Verbesserungen. tekom-

Jahrestagung:Zusammenfassung der Referate (S. 338-340). Wiesbaden:

tcworld GmbH.

Schmitz, K.-D./Straub, D. (2010). Erfolgreiches Terminologiemanagement im

Unternehmen. Stuttgart: TC and more GmbH.

Schmitz, K.-D./Kaukonen, D. (11. 12 2012). E-Learning Terminologie. (FH-Köln)

Abgerufen am 04. 09 2012 von http://www.iim.fh-

koeln.de/dtp/eLearning/00_allgemeines.html

SDL. (11. 12 2012). Info zu SDL MultiTerm Convert. Abgerufen am 17. 10 2012

von

http://producthelp.sdl.com/SDL_MultiTerm_2011/client_de/SDL_MultiTer

m_Convert/About_MultiTerm_Convert.htm

Wright, S. E./Wright, L. (1997). Descriptive Terminology. In S. E. Wright,

Handbook of terminology management (S. 147-160). John Benjamins

B.V.

Wright, S. E. (1997). Handbook of terminology management. John Benjamins

B.V.

Wüster, E. (1991). Einführung in die allgemeine Terminologielehre und

terminologische Lexikographie. Bonn: Romanistischer Verlag.