inf2820 datalingvistikk - universitetet i oslo · •morfologi: ordenes form •syntaks:...
TRANSCRIPT
![Page 1: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/1.jpg)
INF2820 Datalingvistikk – V2014 13. gang, 10.4.2014 Jan Tore Lønning
![Page 2: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/2.jpg)
I dag
• Introduksjon til semantikk
• Formell semantikk – grunnideene
• Logikk i NLTK
2
![Page 3: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/3.jpg)
Semantikk
Semantikk= studiet av mening • Lingvistisk semantikk =
studiet av mening i menneskespråk
• Det fins også semantikk for formelle språk: • Programmeringsspråk har semantikk • Logiske språk har semantikk
• Termen «semantikk» brukes både for • Fagfeltet • Studieobjektet:
• ”semantikken til utsagnslogikk” • ”semantikken =meningen) til den setningen”
3
![Page 4: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/4.jpg)
Et språkuttrykk ha to sider
Form
Studeres i
• Fonetikk: lyder
• Fonologi: kombinering av lyder
• Morfologi: Ordenes form
• Syntaks: Setningenes form
Innhold
• Semantikk
• Pragmatikk
4
Semantikk er ikke en ”modul” på samme nivå som fonetikk, fonologi, morfologi, syntaks Det er en annen dimensjon
![Page 5: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/5.jpg)
Et språkuttrykk ha to sider
Form
Studeres i
• Fonetikk: lyder
• Fonologi: kombinering av lyder
• Morfologi: Ordenes form
• Syntaks: Setningenes form
Innhold
• Semantikk
• Pragmatikk
5
Vi kan studere form uten mening (f.eks. et språk vi ikke forstår) Men er det mulig å se meningen uten formen?
![Page 6: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/6.jpg)
Hva er mening?
April 8, 2014 6
![Page 7: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/7.jpg)
Aspekter ved mening
• Can you please close the window?
• Kommunikasjon • Taler, tilhører, • En oppfordring
• Denotasjon(”om noe”) • Objektet utpekt: ”the window” • Personen(e) taleren snakker til: ”you” • Lukking
• ( Forståelse (kognisjon) • Er det en del av emningen? )
7
![Page 8: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/8.jpg)
Sirkularitet
• Vi ønsker å si i naturlig språk hva mening til et uttrykk i naturlig språk er
• Meningen av ”Kim sover” er …
• Men uansett hva vi setter inn for ”…” er det et språklig uttrykk, kall det α
• Dermed bruker vi meningen til α når vi skal definere meningen til «kim sover»
• Vi må forutsette at det er klart hva meningen til α er, eller mer generelt hva mening er, når vi prøver å forklare mening
• Dette er et dypt vitenskapsteoretisk problem for semantikk
8 8. april 2014
![Page 9: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/9.jpg)
Livet med sirkelen
1. Vi kan si at to uttrykk i språket A. betyr det samme/har samme mening (uten å si hva denne meningen er))
• Mary gave a book to John
• John received a book from Mary
B. mer generelt kan vi si at en setning medfører (eng: «entails») en annen • Every student has read Syntactic structures
• John has read a book by Chomsky
2. Vi kan si at et uttrykk i et språk betyr det samme som et uttrykk i et
annet språk (oversette ): • ”Kari is asleep” betyr at Kari sover
3. Vi kan prøve å relatere språklige uttrykk direkte til den ytre verden • Eks: et bilnavigeringssystem
9
![Page 10: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/10.jpg)
Forholdet til logikk
• (1) og (3) hva logikk prøver å studere • (1A) svarer til logisk ekvivalens • (1B) svarer til logisk konsekvens • Mens en lingvist vil være interessert i flere sammenhenger enn
de logikerne studerer, e.g. forholdet mellom: give og receive
• (3) er det logikeren prøver å fange gjennom ”modeller”: • En modell av hvordan tingenes tisltand i verden (logisk) kunne
vært
• Sammenheng: A er en konsekvens av B1, B2, …, Bn hviss A er sann i alle modeller hvor alle B1, B2, …, Bn er sanne
10
![Page 11: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/11.jpg)
I dag
• Introduksjon til semantikk
• Formell semantikk – grunnideene
• Logikk i NLTK
11
![Page 12: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/12.jpg)
Målet for (formell/denotasjonell) semantikk
1. Spesifisere de mulige modellene/tolkningene for språket
2. Spesifisere hvordan enhver setning i språket er tolket i enhver modell • Siden det er uendelig mange forskjellige setninger, må en
spesifisere rekursive regler som til sammen gir tolkningen av enhver setning
• Til sammen vil (1)+(2) formelt definere når • Setningen A er en konsekvens avB1, B2, …, Bn
12
Parallell til hvordan dette gjøres for formelle språk
![Page 13: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/13.jpg)
Direkte vs. Indirekte tolkning
• Ved indirekte tolkning går prosedyren i to skritt: • En gjør trinnene (1) og (2) for et formelt språk i stedet
for det naturlige språket
3. En definerer en oversetting fra det naturlige språket til det formelle språket: • Systematiske rekursive oversettelsesregler
13
![Page 14: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/14.jpg)
Eksempel
Model1 Model2 Model3 Model4
Daisy is reading R(a) False True False False
Donald is reading R(d) False True False False
Daisy is dancing D(a) True False False False
Donald is dancing D(d) True False False False
Daisy is speaking S(a) True True True False
Donald is speaking S(d) True False True False
Daisy is skating T(a) False False True False
Donald is skating T(d) False False True False
14
![Page 15: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/15.jpg)
Eksempel
Model1 Model2 Model3 Model4
Daisy is reading R(a) False True False False
Donald is reading R(d) False True False False
Daisy is dancing D(a) True False False False
Donald is dancing D(d) True False False False
Daisy is speaking S(a) True True True False
Donald is speaking S(d) True False True False
Daisy is skating T(a) False False True False
Donald is skating T(d) False False True False
15
![Page 16: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/16.jpg)
Daisy is reading R(a) True
Donald is reading R(d) True
Daisy is dancing D(a) False
Donald is dancing D(d) False
Daisy is speaking S(a) True
Donald is speaking S(d) False
Daisy is skating T(a) False
Donald is skating T(d) False
• Donald is reading and Daisy is speaking
• R(d) & S(a) • True
• Daisy is reading and Donald is speaking
• R(a) & S(d) • False
• Donald is not speaking • S(d) • True
• If Donald is not speaking than Daisy is • S(d) S(a) • True
16
Sammensatte setninger
![Page 17: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/17.jpg)
Konsekvenser
• Donald is speaking or Daisy is dancing • S(d) D(a)
• If Donald is not speaking then Daisy is dancing • S(d) D(a)
17
![Page 18: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/18.jpg)
Første-ordens logikk
• Every duck is dancing
• A duck is dancing
• There is a duck that
dances
• Donald loves a car
• Every duck that loves a
car is happy
• Every happy old duck
loves every car
Word Sym.
duck U
dance D
happy H
car C
loves L
old O
18
))()(( xDxUx
))()(( xDxUx
))()(( xDxUx
)),()(( xdLxCx
))()),()(()(( xHyxLyCyxUx
))),()(()()()(( yxLyCyxOxHxUx
![Page 19: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/19.jpg)
Tolkning – en modell: M1
19
M1(love)={
, ,
, ,
, , }
M1(old)
M1(duck) M1(car)
Domenet til M1
![Page 20: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/20.jpg)
Førsteordens logikk og
semantikk for naturlige språk
• Noen konsekvensrelasjoner i nat.spr er ikke representert i logikk
• F.eks. leksikalsk relasjon mellom give og receive
• Noen semantiske relasjoner i nat.spr. er ignorert i førsteordens logikk, f.eks.
• Tid (tempus) • He fainted and ran into a tree • He ran into a tree and fainted
• Setningskomplement: • Mary believed that John is a lawyer.
• Det finnes spesielle logikker utviklet for å modellere dette, jfr. J&M seksj. 17.4 (ikke i detalj)
20 April 8, 2014
![Page 21: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/21.jpg)
I dag
• Introduksjon til semantikk
• Formell semantikk – grunnideene
• Logikk i NLTK
21
![Page 22: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/22.jpg)
Første-ordens logikk
• Every duck is dancing
• A duck is dancing
• There is a duck that
dances
• Donald loves a car
• Every duck that loves a
car is happy
• Every happy old duck
loves every car
Word Sym.
duck U
dance D
happy H
car C
loves L
old O
22
))()(( xDxUx
))()(( xDxUx
))()(( xDxUx
)),()(( xdLxCx
))()),()(()(( xHyxLyCyxUx
))),()(()()()(( yxLyCyxOxHxUx
![Page 23: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/23.jpg)
Logikk i NLTK
• all x. (U(x) -> D(x))
• some x. (U(x) & D(x))
• exists x. (U(x) & D(x))
• exists x. (C(x) & L(d,x))
• all x. (U(x)& some y. (C(y) & L(x,y)) -> H(x))
• all x. (U(x) & H(x) & O(x) -> all y. (C(y) -> L(x,y))
23
))()(( xDxUx
))()(( xDxUx
))()(( xDxUx
)),()(( xdLxCx
))),()(()()()(( yxLyCyxOxHxUx
))()),()(()(( xHyxLyCyxUx
Word Sym.
duck U
dance D
happy H
car C
loves L
old O
![Page 24: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/24.jpg)
Modeller i NLTK
>>> dom = set(['d1','d2', 'd3','c1','c2','p'])
>>> v = """
d => d1
a => d2
duck => {d1, d2, d3}
car => {c1, c2}
old => {d3, c1}
love => {(d3, c1), (d1,d2), (d1, c2)}
"""
>>> val = nltk.parse_valuation(v)
>>> m = nltk.Model(dom, val)
April 8, 2014 24
M1(love)={
, ,
, ,
, , }
M1(old)
M1(duck) M1(car)
Domain of M1
>>> g = nltk.Assignment(dom)
>>> m.evaluate(’all x.(U(x)&O(x) ->some y. (C(y) & L(x,y)))’, g)
True
![Page 25: INF2820 Datalingvistikk - Universitetet i oslo · •Morfologi: Ordenes form •Syntaks: Setningenes form Innhold •Semantikk •Pragmatikk 4 Semantikk er ikke en ”modul” på](https://reader035.vdocuments.net/reader035/viewer/2022081617/6024365712e16e6aa87e81eb/html5/thumbnails/25.jpg)
Konsekvenser
• A er en konsekvens av B1, B2, …, Bn (= slutningen fra B1, B2, …, Bn til A er gyldig)
• hviss:
• enhver modell for B1, B2, …, Bn er en modell for A
• Vi kan ikke alltid sjekke alle modeller, kan være
• Uendelig mange • Endelig mange, men stort
antall, f.eks. alle mulige sjakkpartier
• Bevis er metoder for å sjekke om slutninger er gyldige
>>> b1=lp.parse(’S(d) | D(a)’) >>> a =lp.parse(’-S(d) -> D(a)’) >>> prover=nltk.TableauProver() >>> prover.prove(a,[b1]) True >>> c = lp.parse(’S(d)’) >>>prover.prove(c,[b1]) False
April 8, 2014 25