![Page 1: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/1.jpg)
Intelligenza Artificiale Semantica del linguaggio naturale
Prof. M.T. PAZIENZA
a.a. 2004-2005
Grazie a Jim Martin e a Dan Jurafsky per molte di queste slides
![Page 2: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/2.jpg)
Semantica
La semantica è lo studio del significato di generiche espressioni linguistiche
Modellare come il significato di un’espressione è collegato al significato di ciascuna frase, parola, ed al contesto in cui appare l’espressione
![Page 3: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/3.jpg)
Evoluzione?!?
• Dapprima si studiano le parole (morfologia)
• Poi si analizzano le relazioni sintattiche tra di esse (sintassi)
• Quindi si cerca di lavorare sul significato; in molti casi il processo di analisi è inverso
![Page 4: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/4.jpg)
Il significato
Si può studiare il significato da tre prospettive diverse:
1. il significato di singole parole (semantica lessicale)
2. come questi significati si combinano per dare significato a singole frasi
3. come questi significati si combinano per dare significato ad un testo o ad un discorso
![Page 5: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/5.jpg)
Il significato
Le parole di per sé non esprimono il significato del mondo, né ciò che uno sta pensando, né tantomeno ciò che pensano gli altri.
Possono essere considerate delle sequenze lineari di termini tali che quando altre persone le leggono, o sentono, possono capirle e venire a conoscenza di ciò che noi pensiamo del mondo e che è stato espresso da quelle parole.
![Page 6: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/6.jpg)
Rappresentazione del significato
Si può usare lo stesso approccio che è stato usato per la sintassi e per l’analisi morfologica. Necessità di creare una rappresentazione delle informazioni linguistiche per catturare il significato di quelle stesse informazioni.
A differenza degli alberi sintattici, queste rappresentazioni non sono descrizioni primarie delle strutture in ingresso. In genere esse sono contemporaneamente descrizioni
• dei significati delle espressioni linguistiche così come• di alcuni stati del mondo
Rappresentazione che permette o facilita l’elaborazione semantica
![Page 7: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/7.jpg)
Elaborazione semantica
Rappresentazioni che
Permettono di ragionare relativamente alla loro verità (relazioni con un qualche mondo)
Permettono di rispondere a domande basate sul loro contenuto
Permettono di fare inferenze (rispondere a domande e determinare la verità delle cose che non sappiamo ancora)
![Page 8: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/8.jpg)
Rappresentazione del significato
Logica per esprimere il significato del linguaggio naturale
Principio di composizionalità (il significato di una frase può essere ottenuto da operazioni composizionali sul significato delle sue parti)
Un approccio computazionale alla comprensione del linguaggio deve porre in essere filtri sintattici e semantici ->Selectional restrictions
![Page 9: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/9.jpg)
Selectional restrictions
• A ciascun “senso” di una parola è possibile associare markers semantici che specifichino features e condizioni sulle features dei sensi delle parole che possono combinarsi con questi ultimi.
• Un marker semantico può permettere di eliminare un’analisi sintattica che non la soddisfi.
• Marker semantici e selectional restrictions sono computazionalmente efficaci.
![Page 10: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/10.jpg)
Comprensione del linguaggio
Un qualunque modello di comprensione del linguaggio non può prescindere da un modello di rappresentazione della conoscenza
Conoscenza del mondo versus conoscenza del dominio
La conoscenza del dominio permette di scartare alcune interpretazioni di una frase perché fuori contesto.
Gestione delle metafore.
![Page 11: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/11.jpg)
Significato delle parole
Non basta conoscere il significato delle parole per arguire il significato delle frasi
Ruolo fondamentale dei verbi (template-like predicate argument structure)
Numero degli argomenti
Posizione e categoria sintattica
Nome degli argomenti
Nomi come costanti privi di significato
![Page 12: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/12.jpg)
L’approccio teorico
Cominceremo a guardare aLa struttura esterna relazionale tra le parole
(paradigmatica)
La struttura interna delle parole che determina dove esse possano essere e cosa possano fare (syntagmatica)
![Page 13: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/13.jpg)
Per cominciare…
• Cos’è una parola?– tipo, token, stem, root, forme flessse, etc....
– Lessema: un’entry in un lessico consistente in una coppia (forma, rappresentazione di un unico significato)
– Lessico: collezione di lessemi
![Page 14: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/14.jpg)
Omonimia
Lessemi che condividono la forma ma hanno significati distinti e non correlati
miglio misura e miglio graminacea (omografe e omofone)
pésca di pesci e pèsca frutto (omografe)
![Page 15: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/15.jpg)
Polisemia
Un singolo lessema con più significati associati ad esso.– Moltissime parole hanno più di un significato
(piano)– Anche i verbi tendono ad essere polisemici
(operare)
– La distinzione tra polisemia ed omonimia non è sempre facile (nè talvolta necessaria)
![Page 16: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/16.jpg)
Relazioni
Relazioni paradigmatiche
– Sinonimia– Antonimia – Iponimia – Metonimia– Metafora
![Page 17: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/17.jpg)
Metafora e Metonimia
Rappresentano casi specifici di polisemia • Metafora:
– Ho speso due ore su quell’esercizio.
• Metonimia – La Casa Bianca ha annunciato ieri che...– Questo capitolo parla della cinematica– La mia auto beve molta benzina
![Page 18: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/18.jpg)
Synonimia
• Due lessemi sono sinonimi se possono essere sostituiti in tutte le situazioni non alterando il significato della frase
• Parole che hanno lo stesso significato in alcuni (o in tutti) i contesti.– giovane adolescente
– grande largo …– automobile macchina …
![Page 19: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/19.jpg)
Antonimia
Parole che sono opposte rispetto ad un aspetto del loro significato, sono molto simili rispetto agli altri
• buio luce• ragazzo ragazza• caldofreddo• su giù• dentro fuori
![Page 20: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/20.jpg)
Calcolo della similarità tra parole
Per molte applicazioni è utile riconoscere parole che sono simili tra loro. Machine translation (to find near-synonyms)
Information retrieval (per fare “query expansion”)
Due modi per fare ciò:– Calcolo automatico basato sulle distribuzioni di
similarità
– Uso di un thesaurus che elenchi parole simili • WordNet (per esmpio)
![Page 21: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/21.jpg)
Iponimia/Iperonimia
Iponimia: il significato di un lessema è un subset del significato di un altro – Poichè i cani sono dei canidi
• cane è un iponimo di canide, mentre
• Canide è un iperonimo di cane
Similmente,
• Automobile è un iponimo di veicolo, mentre
• Veicolo è un iperonimo di automobile
![Page 22: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/22.jpg)
WordNet
• Databsa lessicale organizzato gerarchicamente
• On-line thesaurus + alcuni aspetti di un dizionario
• Versioni per altri linguaggi (EuroWordNet)
Category Unique Forms # of Senses
Noun 114,648 141,690
Verb 11,306 24,632
Adjective 21,436 31,015
Adverb 4,669 5808
![Page 23: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/23.jpg)
Format of Wordnet Entries
![Page 24: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/24.jpg)
WordNet Noun Relations
![Page 25: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/25.jpg)
WordNet Verb and Adj Relations
![Page 26: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/26.jpg)
WordNet Hierarchies
![Page 27: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/27.jpg)
Struttura interna delle parole
Per quanto attiene alla struttura interna delle parole, vediamo i seguenti aspetti:– Ruoli tematici nei lessemi – Selection restrictions sui ruoli tematici– Semantica decomposizionale dei predicati – Feature-structures per i nomi
![Page 28: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/28.jpg)
Ruoli tematici
– I ruoli tematici sono delle gneralizzazioni dei ruoli specifici che occorrono con verbi specifici
– I.e. Takers, givers, eaters, makers, doers, killers, hanno tutti in comune• -er (nella lingua inglese)• Sono tutti agenti delle rispettive azioni
– Si può generalizzare su altri ruoli oppure ci si può limitare ad un set finito di tali ruoli.
![Page 29: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/29.jpg)
Esmpi di Ruoli Tematici
![Page 30: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/30.jpg)
Linking
I ruoli tematici, le categorie sintattiche e le loro posizioni in più grandi strutture sinttiche, sono tutti interrelati in modi spesso complessi. Per esempio…– AGENTS sono spesso soggetti– In una regola VP->V NP NP, il primo NP è
spesso un GOAL e il secondo un THEME
![Page 31: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/31.jpg)
Ancora sul Linking
• John opened the door• AGENT THEME• The door was opened by John• THEME AGENT• The door opened• THEME• John opened the door with the key• AGENT THEME INSTRUMENT
![Page 32: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/32.jpg)
Inferenza
Dato un evento espresso da un verbo che esprime un trasferimento, che cosa può essere inferito (dedotto) circa ciò che è etichettato con THEME rispetto a ciò che è etichettato con GOAL?
![Page 33: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/33.jpg)
Problemi
• Cos’è esattamente un ruolo?
• Qual è il set corretto di ruoli da usare?
• I ruoli sono universali?
• I ruoli sono atomici?– I.e. Agents
– Animate, Volitional, Direct causers, etc
• Possiamo etichettare automaticamente i costituenti sintattici con i ruoli tematici?
![Page 34: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/34.jpg)
Selection Restrictions
– I want to eat someplace near campus– Usando i ruoli tematici noi non possiamo dire
ora che eat è un predicato che ha un AGENT e un THEME
• E cos’altro?
– Che AGENT deve essere capace di mangiare e THEME deve essere qualcosa che possa essere mangiato
![Page 35: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/35.jpg)
Logical Statements
• Per eat…– Eating(e) ^Agent(e,x)^ Theme(e,y)^Isa(y, Food)
![Page 36: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/36.jpg)
Back to WordNet
• Uso degli iponimi di WordNet per codificare le selection restrictions
![Page 37: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/37.jpg)
Selectional Restrictions come cattiva approssimazione di una semantica profonda
Sfortunatamente i verbi sono polisemici ed il linguaggio naturale molto creativo … esempi del WSJ …– … ate glass on an empty stomach accompanied only
by water and tea– you can’t eat gold for lunch if you’re hungry– … get it to try to eat Afghanistan
![Page 38: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/38.jpg)
Soluzioni
• Eat glass– Questo è un evento di mangiare, così si può
cambiare il modello di “mangiabile”.
• Eat gold– La presenza della negazione permette al THEME di
non essere “mangiabile”
• Eat Afghanistan– Questo è veramente molto difficile, perchè non è
“mangiabile” per niente.
![Page 39: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/39.jpg)
Word Sense Disambiguation (WSD)
Data una parola in un contesto, decidere quale senso della parola è assumibile come vero.
![Page 40: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/40.jpg)
Selection Restrictions per WSD
Le selectional rectritions possono essere utili per disambiguare:– Argomenti ambigui in predicati non ambigui– Predicati ambigui con argomenti non ambigui – Ambiguità totale
![Page 41: Intelligenza Artificiale Semantica del linguaggio naturale](https://reader033.vdocuments.net/reader033/viewer/2022061510/5681378e550346895d9f2c36/html5/thumbnails/41.jpg)
Problemi
Le selectional restrictions sono violate costantemente nel linguaggio
Ciò non significa che le frasi siano scorrette, o da non preferirsi rispetto ad altre
C’è bisogno di qualche processo di categorizzazione delle modalità con cui le selectional restrictions vengono violate