![Page 1: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/1.jpg)
Einführung Computerlinguistik
Morphologie I
Hinrich Schütze & Robert Zangenfeind
Centrum für Informations- und Sprachverarbeitung, LMU München
2013-10-21
1 / 62
![Page 2: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/2.jpg)
Take-away
Einleitung: Was ist Morphologie, Flexion, Derivation
Morpheme
Morphologie in der Sprachgeschichte / Diachronie
Lemmata: Definition, Motivation
Morphologische Paradigmen
2 / 62
![Page 3: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/3.jpg)
Overview
1 Einleitung
2 Morpheme
3 Diachrone Perspektive
4 Lemmata
5 Flexionsparadigmen
3 / 62
![Page 4: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/4.jpg)
Outline
1 Einleitung
2 Morpheme
3 Diachrone Perspektive
4 Lemmata
5 Flexionsparadigmen
4 / 62
![Page 5: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/5.jpg)
Morphologie
Formenlehre
griech. morphe ‘Form’
Wie werden Woerter aus kleineren Einheiten gebildet
interne Struktur der Wörter
Was sind die elementaren Einheiten des Wortes
Erste Annaeherung:kleinste sprachliche Einheiten, die Bedeutung habenEinheiten gleicher Bedeutung mit komplementärer Verteilung
5 / 62
![Page 6: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/6.jpg)
Die zwei Bereiche der Morphologie
Flexionslehre / Wortformbildung / inflectionAufbau von Wortformen aus Wortstamm und FlexionsendungWort als Flexionsparadigma
Wortbildungslehre / Wortstammbildungslehre / derivationKomposition, Präfigierung, Suffigierung
6 / 62
![Page 7: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/7.jpg)
Outline
1 Einleitung
2 Morpheme
3 Diachrone Perspektive
4 Lemmata
5 Flexionsparadigmen
7 / 62
![Page 8: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/8.jpg)
Morpheme
Morpheme bestehen aus Silben
mehr als 20 000 Morpheme im Dt.
Beispiel 1: {mann}, {männ}
Beispiel 2: {er}, {e}, {en}
Beispiel fuer Flexion: “Männer”
Beispiel 3: {garten}, {zwerg}
Beispiel fuer Derivation: “Gartenzwerg”
8 / 62
![Page 9: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/9.jpg)
Lexikalische vs grammatische Morpheme
lexikalisches Morphem: trägt lexikalische Bedeutung, z.B.{sag}
grammatisches Morphem (Grammem, funktionales Morphem):rein grammatische Funktion, z.B. {te} (→ sagte)
9 / 62
![Page 10: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/10.jpg)
Freie vs gebundene Morpheme
freies (ungebundenes) Morphem: kann ohne Vorhandenseinanderer Morpheme ein Wort bilden; z.B. {Garten}, {Zwerg}
gebundenes Morphem: kann nicht selbständig ein Wort bilden,z.B. {s} als Genitiv Singular
10 / 62
![Page 11: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/11.jpg)
Wurzel vs. Affix vs. Stamm
Wurzel = kleinste Einheit, die Bedeutung hat
Beispiel: “Familien”
kleinste Einheit, die Bedeutung hat: “familie”
“fam”, “fa”, “milie” haben keine Bedeutung
11 / 62
![Page 12: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/12.jpg)
Wurzel vs. Affix vs. Stamm
Affix = Morphem, das keine Wurzel ist
gebundenes Morphem
reihenbildend: modifiziert verschiedene Staemme in analogerWeise
Suffixe (nach dem Stamm); z.B. {te}: “sagte”, “konnte”,“machte”
Präfixe (vor dem Stamm); z.B. {auf}: “aufmachen”,“aufdrehen”, “aufreißen”
Infixe (im Stamm): “fan-fucking-tastic”, “abso-bloody-lutely”
Zirkumfixe (um den Stamm herum, diskontinuierlich); z.B.{ge- -t} (→ gesagt)
Beispiele aus anderen Sprachen?
12 / 62
![Page 13: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/13.jpg)
Wurzel vs. Affix vs. Stamm
Stamm = Bestandteil einer Wortform, der die Wurzel enthält
und eventuell weitere Teile, die keine Flexionsmorphemedarstellen
Beispiele“Heimat”. Stamm = “heimat”, Wurzel = “heim”Lateinisch “lector”. Stamm = “lector”, Wurzel = “leg”
Im Englischen und Deutschen sind Wurzel und Stamm oftgleich.
13 / 62
![Page 14: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/14.jpg)
Definition Morphem
(vgl. Def. von Mel’čuk, I.A.: Aspects of the Theory of Morphology.Berlin 2006, S. 388): Ein Morphem ist ein nicht-leeres Set vonallen Morphen m1, m2, . . . mn = {mi}, die folgende dreiBedingungen erfüllen:
Die Signifikate von allen mi sind identisch.
Alle mi gehören zur gleichen Klasse von Morphen, d.h. alle mi
sind entweder Wurzeln oder Affixe.
Alle mi stehen in komplementärer Distribution, die durchallgemeine Regeln beschrieben werden kann (Affixe könnenauch identische Distribution haben)
Allomorphe des Morphems {M}: alle Morphe mi , die zu {M}gehören
14 / 62
![Page 15: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/15.jpg)
Morphologisches Segmentieren
Zerlegen des Wortes in Morpheme
→ SMOR finite state morphology ist eine Möglichkeit derFormalisierung und Implementierung dieses Prozesses.
ohne Rest
meist intuitiv möglich
Beispiel: VersicherungsangestellterVer-sicher-ung-s-an-ge-stell-t-er
15 / 62
![Page 16: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/16.jpg)
Segmentieren & Klammern
Klammerung zur Darstellung der Struktur:
x
x
angestellter
x
x
s
x
Versicherung
16 / 62
![Page 17: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/17.jpg)
Segmentieren & Klammern
Segmentierung & Klammerung fuer: Straßenbahnfahrerin,Mädchenhandelsschule
Segmentierung in kleinstmögliche Einheiten:Straße-n-bahn-fahr-er-in
Talentwässerung, Gebirgstier, Wachstube, Tauschwert,Maisturm
falsche Trennung erschwert Segmentieren beim Lesen, z.B.:Talent-wässerung, Gebirg-stier, Wachs-tube, Tau-schwert,Mais-turm
17 / 62
![Page 18: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/18.jpg)
x
x
fahrerin
x
x
bahn
x
Straßen
18 / 62
![Page 19: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/19.jpg)
x
x
schule
x
x
s
x
x
handel
x
Mädchen
19 / 62
![Page 20: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/20.jpg)
x
x
x
schule
x
x
s
x
handel
x
Mädchen
20 / 62
![Page 21: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/21.jpg)
Outline
1 Einleitung
2 Morpheme
3 Diachrone Perspektive
4 Lemmata
5 Flexionsparadigmen
21 / 62
![Page 22: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/22.jpg)
Question: Why do we need something ascomplex as morphology? Why don’t we havean inventory of fixed unchangeable forms?This would be easier to learn and use.
22 / 62
![Page 23: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/23.jpg)
What is attractive about morphology
Morphology allows us to productively build a theoreticallyinfinite number of words from a limited number of morphemes.
This is very economical: We only need to learn the limitednumber of morphemes and the principles of combination, butstill have access to (theoretically) infinite many words inproduction and comprehension.
23 / 62
![Page 24: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/24.jpg)
Productivity in language
productivity = generating new linguistic expressions from alimited inventory of smaller parts
Traditionally, linguistic theory posits two different domains ofproductivity: morphology and syntax.
Syntax productively combines words into phrases andsentences.
Morphology productively combines morphemes into words.
Diachronic perspective: Where does this productivity comefrom historically? . . .
. . . and can it end (= language loses productivity in someareas)?
Diachronic: roughly the same as historical linguistics
24 / 62
![Page 25: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/25.jpg)
Example for things becoming less productive
Example for productivity that German is currently losing?
Genitive: especially if the forms are “awkward”: “Franz’Haus”, “Franzens Haus”; “der Ton dieser Debatte istniemandes wuerdig”, “ich machte in diesem Wirtshausjemandes Bekanntschaft”
Subjunctive: “er gab an, er kennte den Angeklagten nicht”
“hinterrücks” (alter Genitiv von “Ruecken”), frozen, cannotbe modified
25 / 62
![Page 26: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/26.jpg)
Grammatikalisierung
Beispiel: dt. Präteritum-Affix -t-: urspr. sagen-tat → sagte
Wort geht in Richtung grammatisches Morphem
Grammatik entsteht im Sprachwandel:
pragmatic mode: autonome Elemente werdenaneinandergereiht
vs. syntactic mode: (strengere grammatische Regulierung →normierte Standardsprache)
Morphem verliert lexikalische Bedeutung und Freiheit in derStellung
Inhaltswörter werden zu Funktionswörtern
freie Morpheme zu gebundenen
26 / 62
![Page 27: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/27.jpg)
Entstehung von Morphemen in der Derivation
Suffixe -keit, -heit, -tum, -lich: urspr. eigenständige Wörter:
-lich: ahd. ’Körper, Gestalt’
-keit, -heit: ’Art, Weise’
-tum: ’Würde, Stand’
derzeit im Übergang: Weise, frei, voll, mäßig, Zeug, Werk
27 / 62
![Page 28: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/28.jpg)
Entstehung von Morphemen in der Derivation: -er
Nomen auf -er: urspruenglich: Ableitungen von Verben:Bohrer, Spieler, Seufzer
jetzt auch abgeleitet von Nomen: Fußballer, Berliner, Politiker
(kein Suffix, Teil des Stammes: Mutter, Schulter, Fenster)
28 / 62
![Page 29: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/29.jpg)
Analog in der Grammatik: Neue
Konstruktionsmoeglichkeiten
bekommen: Er bekommt etwas geschenkt, aber auch Er
bekam den Zahn gezogen
franz. ne . . . pas: (nicht) ← ’keinen Schritt’
das Buch von Peter ← Peters Buch
29 / 62
![Page 30: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/30.jpg)
Outline
1 Einleitung
2 Morpheme
3 Diachrone Perspektive
4 Lemmata
5 Flexionsparadigmen
30 / 62
![Page 31: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/31.jpg)
Lemma
Das Lemma einer Wortform ist die Grundform eines Wortes.
Das Lemma dient als “Überschrift” im Eintrag einesWörterbuchs.
Was als Lemma verwendet wird, ist Konvention.
Deutsche Verben: Infinitiv
Lateinische Verben: erste Person Singular Präsenz AktivIndikativ
31 / 62
![Page 32: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/32.jpg)
Das Wörterbuch/Lexikon
Für konventionelle Lexika (i.e., als Bücher gedruckte)brauchen wir Lemmata, weil alle Wortformen explizitaufzulisten Platzverschwendung wäre und der Struktur derSprache nicht gerecht würde.
Um dem Benutzer das Finden eines bestimmten Wortes zuerleichtern, ist eine systematische Anordnung derLemmata/Einträge notwendig.
Meistens: alphabetische Anordnung
Der Duden ist ein Beispiel fuer ein einsprachigesStandardwörterbuch.
Für andere Wörterbuchtypen braucht man ebenfalls Lemmata:Synonymwörterbücher, Fremdwörterbücher etc.
32 / 62
![Page 33: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/33.jpg)
Ein Lexikoneintrag im Duden
33 / 62
![Page 34: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/34.jpg)
Aufbau eines Lexikoneintrags
Am Anfang oft historische, syntaktische, Genre-Information
Aufgeteilt in Bedeutungen / Unterpunkte
Kriterien zur Unterscheidung der Bedeutungen oft unklar
Splitters: Lexikonautoren, die zu feinen Unterscheidungen undvielen Unterpunkten neigen
Lumpers: Lexikonautoren, die zu groben Unterscheidungenund wenigen Unterpunkten neigen
34 / 62
![Page 35: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/35.jpg)
Ein Lexikoneintrag im Duden
35 / 62
![Page 36: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/36.jpg)
Are there two items in the definition thatcould potentially be merged? Is there an itemin the definition that could potentially besplit?
36 / 62
![Page 37: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/37.jpg)
Lemmatisierung
Wenn wir Sprache verarbeiten wollen, dann besteht der Inputaus Wortformen, nicht aus Lemmata.
Lemmatisierung = Zuordnung der Wortformen zu Lemmata
Diese Zuordnung ist kontextabhängig und nicht immereindeutig.
Beispiel?
SMOR ist ein Beispiel fuer einen Lemmatisierer (derAmbiguität aber nicht auflöst).
37 / 62
![Page 38: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/38.jpg)
Tokenisierung
Von Lemmatisierung zu unterscheiden ist Tokenisierung.
Tokenisierung = Aufteilung von Text in Token
Peter J. O’Neill’s house in San Francisco sold after anine-month period.
“Peter” “J.” “O’Neill” “’s” “house” “in” “San Francisco”“sold” “after” “a” “nine” “-” “month” “period” “.”
38 / 62
![Page 39: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/39.jpg)
How do people “store” words?
A simple model of how people store words is the “mentallexicon”.
In the simplest case, we assume that people have a type oflexicon in their heads.
Elaborated forms of this model can explain different thingspeople can do with words.
Look up the meaning of a word that we have read/heard incomprehension
Look up the right word to use for a particular meaning wewould like to convey in production
Look up the morphological and grammatical properties of aword that we want to use in a sentence
In reality, all of this is very complicated
39 / 62
![Page 40: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/40.jpg)
Example for complexity of the “mental lexicon”
40 / 62
![Page 41: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/41.jpg)
Outline
1 Einleitung
2 Morpheme
3 Diachrone Perspektive
4 Lemmata
5 Flexionsparadigmen
41 / 62
![Page 42: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/42.jpg)
Flexionsparadigmen
Flexion passt Wortformen an die Umgebung im Satz an.
Dies geschieht, indem Flexionsmorpheme mitStämmen/Wurzeln verbunden werden.
In der paradigmatischen Betrachtungsweise werden alleFormen eines bestimmten Stammes (oder eines Lemmas)systematisch angeordnet.
42 / 62
![Page 43: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/43.jpg)
Konstruktion von Paradigmen
systematische Zusammenstellung der Formen nach Funktion
Merkmale: Singular, Plural, Nominativ, Genitiv, . . . , maskulin,feminin, . . . , Präsens, Imperfekt, . . . , 1.Person, . . .
Zusammenfassen der Merkmale in Kategorien:
Numerus, Kasus, Genus, Tempus, (grammatische) Person
Kombination der Merkmale zu Zellen
43 / 62
![Page 44: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/44.jpg)
Konstruktion von Paradigmen
z.B. Tag:
sg plnom – egen es edat – enakk – e
Generalisierung der Paradigmen → lexikalische Kategorie
44 / 62
![Page 45: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/45.jpg)
Konstruktion von Paradigmen
Flexionsendungen haben unspezifisches Bedeutungspotential ,vgl. Mensch:
sg plnom – engen en endat en enakk en en
insgesamt 6 Phoneme für Flexive (genuin dt.) /e, m, n, r, s, t/
45 / 62
![Page 46: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/46.jpg)
Konstruktion von Paradigmen
Numerussysteme: auch z.B. zusätzlich Dual
Genussysteme: auch z.B. nur mask, fem
Kasus: große Differenzen in Sprachen
Person: Sprecher, Angesprochener, Besprochenes
Tempus: sprachspezifisch (Anzahl und Arten)
Beispiele aus anderen Sprachen?
46 / 62
![Page 47: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/47.jpg)
Nominale Paradigmen: Deklination
versch. (Heringer: 8) Flexionsklassen für Substantive,Adjektive, Pronomina, Numerale und Artikel
Flexionsklasse = Menge aller Stämme, die nach dem gleichenParadigma flektieren
Nominativ, Plural: -e, -en, -er, -s (als genuin dt. Endungen)→ in komplementärer Verteilung: Allomorphe (z.B. Ding-e vs.Mensch-en)
auffällige Klassen (Synkretismus): Klasse 6 “Mutti” (sg nur –,pl nur -s) , Klasse 7 “Welt” (sg nur –, pl nur -en)
einige Ausnahmen, z.B. Herz (gen -ens)
manche Lexeme nur im sg (z.B. Gold), nur im pl (z.B. Leute)→ defekte Paradigmen
Beispiele aus anderen Sprachen?
47 / 62
![Page 48: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/48.jpg)
Verbale Paradigmen: Konjugation
Kategorien:Person: 1., 2., 3.Numerus: sg, plTempus: Präsens, Präteritum (Imperfekt)Modus: Indikativ, Konjunktiv 1, Konjunktiv 2, Imperativ (+analytische Formen)
Infinitiv (flektiert wie Nomen)
Partizip (flektiert wie Adj.)
Komplizierung des Paradigmas durch:Vokalwechsel im Präsens (gebe, gibst, gibt) (starkes Verb)Stammalternationen (gebe, gab; singe, sang, sung-) → Ablaut
starke (Stammalternation) und schwache Konjugation(Wortstamm bleibt [meist] gleich)
bis zu 50 Flexionsklassen
48 / 62
![Page 49: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/49.jpg)
Verbale Paradigmen: Konjugation
suppletive Formen , z.B.
sein
sg pl1.p bin sind2.p bist seid3.p ist sind
49 / 62
![Page 50: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/50.jpg)
Aktiv Indikativ
50 / 62
![Page 51: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/51.jpg)
Aktiv Konjunktiv 1
51 / 62
![Page 52: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/52.jpg)
Aktiv Konjunktiv 2
52 / 62
![Page 53: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/53.jpg)
Imperativ
53 / 62
![Page 54: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/54.jpg)
Passiv Indikativ
54 / 62
![Page 55: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/55.jpg)
Passiv Konjunktiv 1
55 / 62
![Page 56: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/56.jpg)
Passiv Konjunktiv 2
56 / 62
![Page 57: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/57.jpg)
Schwach
57 / 62
![Page 58: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/58.jpg)
Stark
58 / 62
![Page 59: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/59.jpg)
Gemischt
59 / 62
![Page 60: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/60.jpg)
schwach: stark:
gemischt:
60 / 62
![Page 61: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/61.jpg)
smor
61 / 62
![Page 62: Einf hrung Computerlinguistik [0.5cm] Morphologie Ihs/teach/13w/intro/pdf/04morph.flat.pdf · Wurzel vs. Affix vs. Stamm Affix = Morphem, das keine Wurzel ist gebundenes Morphem reihenbildend:](https://reader030.vdocuments.net/reader030/viewer/2022040713/5e1a2a08f50ced0b46796251/html5/thumbnails/62.jpg)
Take-away
Einleitung: Was ist Morphologie, Flexion, Derivation
Morpheme
Morphologie in der Sprachgeschichte / Diachronie
Lemmata: Definition, Motivation
Morphologische Paradigmen
62 / 62