lmt und personal translator einführung der personal translator ist ein auf lmt basierendes...
TRANSCRIPT
![Page 1: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/1.jpg)
LMT und Personal Translator
![Page 2: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/2.jpg)
Einführung
• Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC
• LMT (logic programming based maschine translation) wurde von IBM auf Großrechnern entwickelt und basiert auf der von McCord begründeten Slot-Grammar
• Die Slot-Grammar ist eine grammatische Beschreibungsform der Humangrammatik, die eine logische Analyse von Texten durch den Computer ermöglichen soll
![Page 3: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/3.jpg)
Entwicklungsgeschichte von LMT/PT
Erste Ausarbeitungen zur Slot-Grammar‘76-‘78
Erste Veröffentlichung von McCords Ausarbeitungen zur Slot-Grammar1980
1989Erscheinen einer aktualisierten Version der Slot-Grammar, jetzt im Framework von LMT
IBM greift McCords Ansätze auf und beginnt im Watson-Research-Center mit der Ausarbeitung eines Übersetzungssystems für das Sprachpaar Englisch-Deutsch als internationales Forschungsprojekt
1985
1995Veröffentlichung des Personal Translators als kostengünstige Home-User-Version auf Basis von LMT durch das Unternehmen Linguatec
![Page 4: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/4.jpg)
Fakten zu LMT
• Zunächst war die Software nur unter den Betriebssystemen OS/2, AiX und IBM-Unix lauffähig
• Die Software wurde in Prolog, einer menschliche Logik nachahmende Programmiersprache, entwickelt
• LMT ist ein BlackBox-System, das die internen Übersetzungsabläufe nicht offen legt
• Es handelt sich um einen modularen und somit sprachunabhängigen Aufbau; neue Sprachen können leicht hinzugefügt werden
• Komponenten von LMT sowie des PT sind:– die Shell (sprachunabhängiger Teil): das Steuerungsprogramm – spachabhängiger Teil
• Grammatiken für Ausgangs- und Zielsprache• Lexika (Pons)
• Die Slot-Grammar ist für Deutsch, Englisch und Dänisch verfügbar
![Page 5: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/5.jpg)
Wörterbücher und Lexika
Kleines Lexikon mit ca. 3.000 Einträgen für die am häufigsten gebrauchten englischen Wörter
Wörter, die dort nicht gefunden werden, stehen im UDICT Lex. (über 60.000 Lemmata) (jedes beliebige Wort kann innerhalb von 15 msek. abgerufen werden)
Im Systemlexikon ist enthalten:• Wortstämme (mit Angabe über Slots und Fillers,
Transferbedingung, strukturelle Änderungen)
• Eintragsform: WORT < wordframe(Info).
z.B. give < v(obj.iobj).
![Page 6: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/6.jpg)
Fakten zum Personal Translator
• Der Personal Translator ist eine „abgespeckte“ Version von LMT und hat somit einen verringerten Umfang
• Durch den geringeren Umfang der Software wurde das Produkt auch auf Home-PCs lauffähig
• Der Vertrieb und das Produktdesign wurde durch das Unternehmen Linguatec übernommen, IBM ist nach wie vor für die Entwicklung des Systems verantwortlich
• Nach Erscheinen der ersten Version des PTs (1995), kam der Ernst-Klett-Verlag als Kooperationspartner hinzu, der sein lexikalisches Know-How zur Verfügung stellte
• Es handelt sich um ein Transfersystem mit den 3 Stufen:– Analyse– Transfer– Generierung
![Page 7: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/7.jpg)
Die Slot-Grammar
Allgemeines:– Behandlung von Einzelsätzen
• eine Ausnahme bildet die Anaphernauflösung
– lexikalisch- und Dependenzen-orientiert
Begriffe der slot-grammar:– headword– wordframes – slots– slot-filler– slotframes– slot-rules
![Page 8: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/8.jpg)
Das „headword“
Grundprinzip der Slot-Grammar: jeder Satz hat einen head (Kopf des Satzes)
Ausrichtung aller weiteren Wörter des Satzes ist relativ zum headword
![Page 9: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/9.jpg)
Das „wordframe“
Ein wordframe besteht aus folgenden Elementen:– Wort
– Wortnummer
– Flexionsmerkmale
– grammatische Kategorie der Wortart
– mögliche slots im slotframe
– slot-filler
![Page 10: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/10.jpg)
Die „slots“
Definition eines slots:– slots sind mit syntaktischen Relationen beschriebene Leerstellen
– slots sind funktionell vergleichbar mit:• Ergänzungen
• Komplementen
• Objekten
• Attributen
– slots sind Wörter, die eine bestimmte Position im wordframe einnehmen
– In wordframes werden alle theoretisch möglichen Slots zu einem bestimmten Wort aufgelistet
– Treffen zwei wordframes mit jeweils dem gleichen offenen slot aufeinander, werden sie zu einer Phrase kombiniert
![Page 11: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/11.jpg)
Die „slot-filler“ und „slotframes“
slot-filler:– slot-filler sind Satzglieder, die zu dem jeweiligen slot
angegeben werden
slotframes:– Wörter mit mehreren slots haben einen slotframe
![Page 12: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/12.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Der Übersetzungsprozess
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische Suche
Syntaktische Analyse
Semantische Analyse
Lexikalischer Transfer
Struktureller Transfer
Morphologische Generierung
S P R A C H A B H Ä N G I G E K O M P O N E N T E N
![Page 13: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/13.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Wort- und Satzsegmentierung
Wort- & SatzsegmentierungWort- & Satzsegmentierung • Zerlegung des Ausgangstextes in Segmente (meist Sätze) nach Regeln der Interpunktion
• Zerlegung der Teilsätze in Wörter
• Feststellen der Wortgrenzen (für z.B. Komposita)
• Nummerierung der Wörter
S P R A C H A B H Ä N G I G E K O M P O N E N T E N
![Page 14: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/14.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S
H E L L
Morphologische Analyse
Wort- & Satzsegmentierung
Morphologische AnalyseMorphologische Analyse
• Reduktion der Wörter auf Stammformen durch Abtrennung von Affixen
• Konsultation des Verzeichnisses der unregelmäßigen Formen
• festgehalten wird:
• lexikal. Info. zur Stammform
• gram. Bedeutung der Flexionsform
=>Ausgabe von wordframes
S P R A C H A B H Ä N G I G E K O M P O N E N T E NAS-Analyse-Morphologie
![Page 15: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/15.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Lexikalische Suche
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische SucheLexikalische Suche
• Suche nach AS-ZS-Entsprechungen
• lexikalisches Filtern:
• Eliminierung von Mehrfach-bedeutungen
• Eliminierung von gram. unmög-lichen Varianten
=> Ausgabe nur noch weniger oder eines wordframes pro Wort
S P R A C H A B H Ä N G I G E K O M P O N E N T E NAS-ZS-Lexikon
![Page 16: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/16.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Syntaktische Analyse
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische Suche
Syntaktische AnalyseSyntaktische Analyse
• Grammatische Analyse anhand von vier Grundregeln:
1. declaration of adjunct-slots
2. slot-filler-rules
3. slot-ordering-rules
4. obligatory-slot-rules
S P R A C H A B H Ä N G I G E K O M P O N E N T E NAusgangssprachen-Analyse-Grammatik
Zu 1.: Es existieren zwei Haupt-slot-Arten: adjunct-&complement-slots
• adjunct-slots- sind Wortart-typische slots
- sind in der Grammatik verzeichnet
- sind als „Anhänge“ definiert
- sind immer optional
- können beliebig oft gefüllt werden
Zu 1.: Es existieren zwei Haupt-slot-Arten: adjunct-&complement-slots
• complement-slots- sind Wort-typische Slots
- sind im Lexikon verzeichnet
- sind als „Ergänzungen“ definiert
- sind nicht immer optional
- können nur einmal gefüllt werden
=> Definition der möglichen slots
Zu 2.: Es existieren zwei Hauptarten von slot-filler-rules:
• complement-filler-rule
• adjunct-filler-rule
• geben Auskunft über slot-Inhalte, nicht über Phrasenpositionen
=> Generierung der Dependenzstruktur
Zu 3.: Es existieren zwei Arten von slot-ordering-rules:
• head/slot - ordering-rule
• slot/slot - ordering-rule
• geben Auskunft über relative Position von Wörtern (slots) zum Head-Word oder zu einem anderen slot
=> Generierung der Linearstruktur
Zu 4.: obligatory-slot-rules
• definiert slots als obligatorisch
• diese slots müssen entweder direkt oder in einer vorgelagerten Position gefüllt werden
• bedingt durch einen bestimmten slot kann ein anderer obligato-risch werden
Schritte zum Ergebnis der synt.Analyse:
• Erstellen der AS-und ZS-wordframes
• Kombination der wordframes zu Sätzen (rekursiv)
• wahrscheinlichkeitsorientierte Auswahl des Satzes (pruning)
:::> vollständiger Strukturbau mit Dependenzstruktur und linearen Beziehungen der Konstituenten
![Page 17: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/17.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Semantische Analyse
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische Suche
Syntaktische Analyse
Semantische AnalyseSemantische Analyse
Semantische Analyse anhand von Anaphernbezügen
• Anapher:• referentielle Verweisform
• auf vorher Geäußertes verweisender sprachlicher Ausdruck (Rückwärtsverweisung)
• durch Verweisung wird Kohäsion hergestellt
• Beispiel: „... der Mann ... er ...“
S P R A C H A B H Ä N G I G E K O M P O N E N T E N
![Page 18: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/18.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Lexikalischer Transfer
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische Suche
Syntaktische Analyse
Semantische Analyse
Lexikalischer Transfer
• Überführung des AS- in den ZS-Baum
• Erzeugung der korrekten ZS-Wörter
• Abspeicherung der benötigten Flexionsinformationen der ZS
=> Das Resultat ist keine korrekte OberflächenstrukturLexikalischer Transfer
S P R A C H A B H Ä N G I G E K O M P O N E N T E NAS-ZS-Lexikon
![Page 19: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/19.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Struktureller Transfer
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische Suche
Syntaktische Analyse
Semantische Analyse
Lexikalischer Transfer
Struktureller Transfer
• Umformen der AS-Syntax durch bestimmte ZS-Transformations-regeln
• Umsetzung allgemeiner struktureller Unterschiede zwischen der AS und der ZS
Struktureller Transfer
S P R A C H A B H Ä N G I G E K O M P O N E N T E NAS-ZS-Transferregeln
![Page 20: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/20.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Morphologische Generierung
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische Suche
Syntaktische Analyse
Semantische Analyse
Lexikalischer Transfer
Struktureller Transfer
Morphologische GenerierungMorphologische Generierung
• Zusammensetzung von z.B. Präfix und Wortstamm
• Bildung von Flexionsendung
• Linearisierung zu einer Zeichenkette
• Überführung des Strukturbaumes in gültige Oberflächenstruktur
S P R A C H A B H Ä N G I G E K O M P O N E N T E NZS-Generierungs-Morphologie
![Page 21: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/21.jpg)
S P R A C H U N A B H Ä N G I G E ,
M O D U L A R E S H E L L
Wort- & Satzsegmentierung
Morphologische Analyse
Lexikalische Suche
Syntaktische Analyse
Semantische Analyse
Lexikalischer Transfer
Struktureller Transfer
Morphologische Generierung
S P R A C H A B H Ä N G I G E K O M P O N E N T E N
![Page 22: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/22.jpg)
Systemkomponenten des PT 2002
Systemlexikon [490.000 bis 620.000 Einträge]enthält das allgemeinsprachliche Vokabular und Fachterminologie aus 150 Sachgebieten
es existiert ein Lexikon pro Sprachpaar: Quellsprache-/Transferlexikon
Benutzerlexikon [primär leer]
Satzarchiveautomatische Archivierung von Satzpaaren aus Quell- und Zielsprache
können bei späteren Übersetzungen abgerufen und eingesetzt werden
Idiomatiklexikon [35.000 Redewendungen]wird nicht bei der automatischen Übersetzung verwendet (separat aktivierbar)
spezielle Fachwörterbüchernur in entsprechenden Versionen des PT vorhanden
![Page 23: LMT und Personal Translator Einführung Der Personal Translator ist ein auf LMT basierendes Übersetzungsprogramm für den Home-PC LMT (logic programming](https://reader036.vdocuments.net/reader036/viewer/2022062417/55204d6649795902118bb97a/html5/thumbnails/23.jpg)
Literatur
Slot GrammarMichael McCord: A System for Simpler Construction of Practical
Natural Language Grammars. Page 118-145
LMTMichael McCord: Design of LMT: A Prolog-Based Maschine
Translation System. In: Computational Linguistics, Volume 15, Number 1, March 1989, page 33-52.
Anaphora ResolutionMichael McCord & Shalom Lappin (IBM): Anaphora Resolution in
Slot Grammar. In: Computational Linguistics, Volume 16, Number 4, December 1990, page 197-212.
GMD Report 63Alice Tschöke: Eine linguistische Evaluation der maschinellen
Übersetzungssysteme T1 Professional 3.0 und PT Plus 98 anhand der Rohübersetzung von Nominalphrasen. GMD 1999, Seite 33-65