cours sur le traitement automatique des langues la sémantique (ii) violaine prince université de...

Post on 03-Apr-2015

118 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Cours sur le traitement automatique des languesLa sémantique (II)

Violaine Prince

Université de Montpellier 2

LIRMM-CNRS

2

Plan de l’exposé Les Graphes Conceptuels Les limites imposées par la langue

les problèmes lexicaux les problèmes syntagmatiques les problèmes phrastiques

3

Graphes conceptuels(Sowa 1984)

1. Introduction 2. Formalisme 3. Opérations sur les graphes

conceptuels

4

Introduction

La notion de cas sémantique (Fillmore 1968) identifier un ensemble restreint de cas

sémantiques mettre en évidence les relations de sens entre

les groupes nominaux et le verbe d'une phrase analogie entre cas syntaxique et cas

sémantique représentation profonde de la phrase

5

Exemples (I)

Jean ferme la porte.sujet syntaxique : JeanJean : instigateur de l'action

Le vent ferme la porte.sujet syntaxique : le ventle vent : instrument de l'action

6

Classification de Fillmore (71)

AGENT : instigateur animé d'un événement CONTRE-AGENT : la force contre laquelle

l'action est exécutée OBJET : l'entité qui bouge, change ou dont

la position ou l'existence est en question PATIENT : l'entité qui reçoit, accepte ou

subit les effets d'une action

7

Classification de Fillmore (71) (suite)

RESULTAT: l'entité créée par l'action en question

INSTRUMENT : le stimulus ou la cause physique de l'événement

SOURCE : lieu de départ de quelque chose qui bouge

BUT : lieu d'arrivée de quelque chose qui bouge

8

Formalisme des graphes conceptuels

Définition : un graphe conceptuel deux types de nœuds

concepts relations

fini : un nombre fini de relations et de concepts dans un cerveau humain ou dans une mémoire d'ordinateur

connexe : toute relation conceptuelle a un ou plusieurs arcs reliés à un concept

un concept peut former à lui seul un graphe conceptuel

9

Exemple Le père de Paul lui achète un bureau

métallique. Il l'a payé 3000F

ACHETER

AGNT

PERSONNE PERE PERSONNE : PAUL

OBJ BUREAU

INST ARGENT : @ 3000 F

RCPT

MATR METAL

10

Un réseau sémantique Un treillis de types

le type universel T, supérieur à tous les autres types

le type absurde , inférieur à tous les autres types une relation d'ordre partiel pour deux types

un plus petit sur-type commun un plus grand sous-type commun

11

référent : objet symbolique

type: objet du treillis objet référé: objet du monde

symbole

mondeBC

triangle aristotélicientriangle aristotéliciensimplifiésimplifié

Un concept est un couple (type, référent).

12

Exemple de treillis de typesextrait de Sowa 1985

T

Evénement

Action

Arriver Couper DonnerEnseigner

Recevoir Communiquer

Faire

Ordonner

Travailler

Caractéristique

Age

Animé

EntitéAttributEtat

Croire ObjetPhysique

Nourriture

Cake

Animal

Chat

CouleurContenir

Information

Outil EntitéMobile

Personne

Enseignant Enfant Parent

Téléphone

MessageSavoir

Aimer ChaudProposition

13

Les concepts(1) Les concepts génériques

[CHAT] ou [CHAT : *] un chat Les concepts individuels

[CHAT : #178] le chat, ce chat Les noms propres

[CHAT : Félix] Félix Un ensemble générique

[CHAT : {*} ] plusieurs chats

14

Les concepts(2) Un ensemble de cardinal spécifié

[CHAT : {*}@5 ] cinq chats Les mesures

[LONGUEUR : @2 m] une longueur de 2 m Un ensemble défini en extension

[CHAT : {Félix, Minou, Roxane}] Félix, Minou et Roxane

Un ensemble partiellement spécifié [CHAT : {Félix, *}] Félix et d'autres

15

Les concepts(3)

Les ensembles distributifs [HOMME : Dist {*} @ 3] Trois hommes

Le reste du graphe doit être appliqué à chaque élément de l'ensemble.ex : Trois hommes lisent chacun deux livres.

16

Les concepts(4)

Les ensembles respectifs [CHAT : Resp {Félix, Minou, Roxane}]

Félix, Minou et RoxaneChaque élément de l'ensemble entretient une relation avec un élément d'un autre ensemble ordonné. ex : Félix, Minou et Roxane appartiennent respectivement à Paul, Pierre et Jacques.

17

Les bases de connaissances

Le lexique

Le treillis des types

Les relations conceptuelles

Les graphes canoniques

18

Le lexique Mise en relation mots-concepts

un : article indéfini, pas de concept

être : verbe ,pas de concept

livre: nom commun, masc. sing.,LIVRE

donner: verbe transitif , DONNER

chaud : adjectif, masc., sing., CHAUD

à : préposition, pas de concept

19

Les relations conceptuelles(1)

agent (AGNT) relie [ACTION] à [ANIME] où le

concept ANIME représente l'acteur de l'ACTION.

« experienceur » (EXPR) relie [ETAT] à [ANIME] qui ressent cet

état. exemple : Paul a froid.

20

Les relations conceptuelles(2)

instrument (INST) relie [ENTITE] à [ACTION] dans laquelle

l'entité est impliquée de manière causale. exemple : la clé ouvre la porte. clé = instrument

objet (OBJ) relie [ACTION] à [ENTITE] sur laquelle

porte l'action.exemple : le chat avale le canari.canari = objet)

21

Les graphes canoniques

« Les graphes canoniques définissent des conditions d'emploi des concepts ou des possibilités de combinaisons de concepts.

Ce sont les unités de sens qui définissent le contexte environnant des concepts.

Les autres graphes seront dérivés à partir des graphes canoniques.

22

Exemples« DONNER < ACTION

[DONNER]-(AGNT) -> [ANIME](RCPT) -> [ANIME] (recipient =destinataire)(OBJ) -> [ENTITE]

DIFFICILE < MANIERE[DIFFICILE]-

(EXPR) -> [ANIME](MANR) <- [ACTION] (manner = manière)

23

Exemples SAVOIR < ETAT

[SAVOIR] -(EXPR) -> [ANIME](STAT) -> [PROPOSITION] (stat =

statement) ENSEIGNER < ACTION

[ENSEIGNER] -(AGNT) -> [ANIME](RCPT) -> [ANIME](OBJ) -> [SUJET]

24

Exemples ENSEIGNANT < PERSONNE

[ENSEIGNANT]-(AGNT) <- [ENSEIGNER]-

(RCPT) -> [ANIME](OBJ) -> [SUJET]

.

25

Connaissances nécessaires pour traiter la phrase :

« Les internes jugent important d’avoir la sympathie de la population. »

Dictionnaire interne : n.c. , masc. INTERNE sympathie: n.c., fém. SYMPATHIE juger: verbe JUGER population: n.c., fém. POPULATION avoir: verbe aux pas de concept

26

avoir: verbe POSSEDER important: adj. IMPORTANT de: prep. pas de concept le, la: art. déf. pas de concept

Graphes canoniques INTERNE < MEDECIN, ETUDIANT

[INTERNE]-(AGNT) <- [PRATIQUER] -

- (OBJ) -> [MEDECINE]- (LIEU) -> [HOPITAL]

27

JUGER < PENSER[JUGER] -

(AGNT) -> [PERSONNE](OBJ) -> [PROPOSITION]

SYMPATHIE < ETAT[SYMPATHIE] -

(EXPR)-> [PERSONNE](OBJ) -> [PERSONNE]

IMPORTANT< CARACTERISTIQUE[IMPORTANT]<- (ATTR) <- [PROPOSITION]

28

Méthode

rechercher les connaissances afférantes

recomposer le sens : graphe résultat => graphe des

connaissances de la phrase énoncée.

29

Connaissances afférentes

La population a de la sympathie pour les internes

[SYMPATHIE] -(EXPR) -> [POPULATION](OBJ) -> [INTERNE]

Les internes pratiquent la médecine à l'hôpital.[PRATIQUER] -

(AGNT) -> [INTERNE](OBJ) -> [MEDECINE](LIEU) -> [HOPITAL]

INTERNEPOPULATION

EXPRC

SYMPATHIEOBJET

30

Les internes jugent important une proposition.[JUGER] -

(AGNT) -> [INTERNE](OBJ) -> [PROPOSITION]-

(ATTR) -> [IMPORTANT]

PRATIQUER

MEDECINE HOPITAL

AGENT

LIEUOBJET

INTERNE

INTERNE

PROPOSITION

JUGERAGENT OBJET

ATTRIBUTIMPORTANT

31

forme graphique recomposée

INTERNE

PROPOSITION :

POPULATION

EXPRC

SYMPATHIEOBJET

PRATIQUER

MEDECINE HOPITAL

AGENT

LIEUOBJET

JUGER

AGENT

OBJET

ATTRIBUT

IMPORTANT

32

forme textuelle

[JUGER] -(AGNT) -> [INTERNE] -

(AGNT) <- [PRATIQUER] -

(OBJ) -> [MEDECINE] (LIEU) -> [HOPITAL]

(OBJ) -> [PROPOSITION :[ [SYMPATHIE] -

(EXPR) -> [POPULATION](OBJ) -> [INTERNE]] -

(ATTR) -> [IMPORTANT]

33

Opérations sur les graphes conceptuels

Copie Restriction Simplification Jointure

jointure maximale jointure dirigée

34

Restriction Restreindre un concept d'un graphe

restriction de typeremplacer le type d'un concept par un sous-type[PERSONNE : Jules ] remplacé par [ENFANT : Jules]à condition que Jules soit un enfant.

restriction de référenceindividualiser un concept générique[PERSONNE] remplacé par [PERSONNE : Jules]

35

Simplification Cette opération permet de simplifier les

informations redondantes du graphe (utile éventuellement suite à une autre opération)

X Y

R

R

X YR

36

Jointure On part de deux graphes possédant un concept

commun (même type et même référent). idée : joindre les deux graphes en partant de ce concept commun.

ACHETER

LIEU : marché

LOCOBJ

AGNT FEMME : Marie

POMME : @ 1kg

FEMME : MarieAPPRECIER

POMME ATTR COULEUR : verte

EXPR

OBJ

37

Jointure sur [FEMME : Marie]

FEMME : MarieAPPRECIER

POMME ATTR COULEUR : verte

EXPR

OBJ

ACHETER

LIEU : marché

LOCOBJ

AGNT

POMME : @ 1 kg

38

Jointure maximale

Restriction en cherchant pour chaque couple de concepts le plus grand sous-type commun

Joindre sur un concept commun Simplifier les relations dupliquées

39

Connaissances et méthode :exemple

Marie achète une robe en solde dans un grand magasin.

Connaissances afférentes : Marie achète une robe dans un grand

magasin. Marie achète des choses en solde.

Recherche des graphes canoniques Opération de jointure maximale

40

Jointure maximale : exemple

FEMMEACHETER AGNT

OBJ

PHYSOBJ

ACHETER

GRAND MAGASIN

LOCOBJ

AGNT FEMME : Marie

ROBE : #1

ATTR

EN SOLDE

C1

C2

41

1ère étape: Restriction

FEMME : MarieACHETER AGNT

OBJ

ROBE : #1

ACHETER

GRAND MAGASIN

LOCOBJ

AGNT FEMME : Marie

ROBE : #1

ATTR

EN SOLDE

42

2ème étape :Jointure sur [acheter]

OBJ

ACHETER

GRAND MAGASIN

LOC

OBJ

AGNT FEMME : Marie

ROBE : #1

AGNT

ATTREN SOLDE

43

3ème étape : Simplification

ACHETER

GRAND MAGASIN

LOC

OBJ

AGNT FEMME : Marie

ROBE : #1

ATTREN SOLDE

44

Difficultés Plusieurs graphes résultant de la jointure

maximale Il peut produire des boucles.

CARNIVORE AGNT MANGER

ANIMAL

LION

OBJ

Graphe G1

Graphe G2

45

AGNT

MANGER

OBJ

LION

un lion devient cannibale

alors que le texte aurait pu être :le lion mange un animal.

46

Jointure dirigée On joint deux graphes G1 et G2 suivant la

directive X+Y = Z. rechercher le concept C1 de G1 qui a l'étiquette

X, rechercher le concept C2 de G2 qui a l'étiquette

Y, vérifier que C1 < C2 sinon échec joindre G1 et G2 à partir de C1 attacher à C1 l'étiquette Z

47

Exemple Directive %X + %Y = %X

CARNIVORE AGNT MANGER

ANIMAL

LION%Y

OBJ

Graphe G1

Graphe G2

%X

%U

48

Exemple • La jointure dirigée correspond bien à :• le lion mange un animal.

AGNT MANGER

ANIMAL

OBJ

%U

LION%X

49

Jointure dirigée Des analyseurs sémantiques dirigés par la

syntaxe Directives pour passer d'un constituant à un

constituant de rang supérieur.

50

Conclusion sur les graphes conceptuels

Représentation des connaissances multi-modèle : treillis des types, treillis des

relations, graphes canoniques, graphes résultants

sémantique compositionnelle dénote la logique du premier ordre formalisme rigoureux

Analyse sémantique dirigée par la syntaxe

51

Les limites imposées sur la langue

Les problèmes lexicaux Les tropes

Les tropes sont des figures de style. Le principal trope lexical est la métonymie

La métonymie est une figure « économique » où l ’on désigne la partie pour le tout, l ’instrument pour l ’agent, le lieu pour l ’entité, etc.

Exemple de trope :• si on allait boire un verre• Paris a téléphoné.

52

En terme de graphes conceptuels, la métonymie viole les contraintes sémantiques. Ex: Paris : [LIEU] [TELEPHONER]

(AGNT) -> [PERSONNE] (OBJ)->[PERSONNE] (INST)->[TELEPHONE] (LIEU)->[LIEU]

Paris n ’est pas une sorte de personne.

53

Problèmes lexicaux (suite) La polysémie

La polysémie est la capacité d ’un même mot à avoir plusieurs sens.

On distingue cependant la polysémie de • l ’homographie : deux mots s ’écrivant de la

même manière• exemple : ferme (bâtiment) ferme (adjectif)• l ’homophonie : deux mots qui se prononcent de

la même manière• exemple : la voie et la voix

54

La polysémie Il existe des homographes homophones que

l ’on hésite à appeler polysèmes, parce qu ’ils n ’ont rien à voir sémantiquement entre eux

• avocat (homme) et avocat (fruit)• charme (arbre) et charme (enchantement)

on appellera polysèmes, des mots ayant plusieurs sens, mais tels que ces sens sont liés entre eux, même de façon lointaine.

55

La polysémie Il existe plusieurs types de polysémie. La polysémie fonctionnelle

• les sens diffèrent par la fonction attribuée, ou le cas sémantique considéré

• exemple :• l ’élection du président aura lieu demain

(processus électif)• l ’élection du président américain a été

controversée (résultat du processus électif)

La polysémie d ’acception• le mot désigne des champs sémantiques

différents, mais pouvant avoir été reliés dans le monde

56

• Exemple :• la maison des Habsbourg a longtemps régné sur

l ’Autriche (famille)• la maison de Pierre est près de la gare (bâtiment)• C ’est une très bonne maison de couture

(entreprise)

maison

famille

entreprise

bâtiment

57

En terme de graphes conceptuels, la polysémie introduit : la multiplication des graphes la multiplication des concepts

élection-1 : processus élection-2 : résultat maison-1: bâtiment etc.

mais aussi la violation de certaines contraintes syntaxiques sur lesquelles l ’analyse par GC est fondée

58

Exemple : c ’est un gâteau maison.

une solution pour résoudre le problème est de remplacer le mot par un autre mot, très différent, ayant les bonnes contraintes ou par une expression complète.

nom commun en position adjectif

59

Système GLACE (Prince 1991, 1997) polysémie d ’acception ne pas multiplier les graphes et les concepts mais remplacer par

un candidat ayant les bonnes propriétés:• C ’est une très bonne maison de couture• C ’est une très bonne entreprise de couture

une expression restituant l ’intégrité du graphe• C ’est un gâteau maison• C ’est un gâteau fait à la maison

– critère discriminant [SAVOIR_FAIRE]

60

Pompe :

lieu

appareil

extension par lien métonymiquepolysémie fonctionnelle

station d ’essence

schéma :STATION +ESSENCE

extension par lien de spécialisationpolysémie fonctionnelle

faste

exercice physique

chaussures

61

Les limites imposées sur la langue (suite)

Les problèmes syntagmatiques un syntagme est un ensemble de mots qui :

a une fonction grammaticale donnée • syntagme verbal• syntagme nominal

Exemple : le petit chat <syntagme nominal, groupe sujet> lape <syntagme verbal> son lait <syntagme nominal, groupe objet>

62

les problèmes Les syntagmes N de N peuvent être des

expressions figées moulin à prières pomme de terre

Les prédicats verbaux peuvent ne jamais être complètement argumentés

Je mange. Je mange des pommes de terre. Je mange des pommes de terre frites. Je mange une barquette de pommes de terre

frites, dans ma cuisine, sur la table sale.

63

les problèmes (suite)

Les verbes peuvent être éludés. Jean mange une pomme et Paul une

mandarine. Les verbes peuvent avoir comme argument un

autre verbe. je voudrais grandir.

ou quelque chose qui a un statut d ’adjectif je mange biologique

64

Les problèmes phrastiques

les graphes conceptuels reconnaissent un principe de compositionalité. Expression figées

il tourne autour du pot Métaphores centrées sur le verbe

il a dévoré le rayon de littérature russe Métaphores phrastiques (analogiques)

la technologie est à la science ce que l ’écume est à la vague.

65

Les problèmes phrastiques(suite)

Et ils relèvent d ’une dénotation de la logique des prédicats du premier ordre les verbes de la langue font figure de prédicat. Quid de phrases telles que

il faut pouvoir prendre son temps je veux me faire refaire le nez je ne cesse de devoir dire et recommencer à dire

la même chose.

66

Conclusion(provisoire)

le modèle des GC est peut-être un des modèles, relevant du paradigme logique, les plus descriptifs

Il reste cependant très en-dessous des subtilités de la langue

comme il fait appel à un principe de compositionalité au niveau de la phrase, il élude malheureusement de nombreuses figures de style

la langue est de toutes façon d ’ordre supérieur

top related