Pour un système formel de description linguistique
Lionel Clément - Benoît Sagot
Mosaïque - lundi 14 mai 2007Inria Futurs
Labri - Université Bordeaux 1
Pour un système formel ...
On est d’accord pour :– Distinguer constituance et dépendance syntaxique
(notion de tête, notion de fonctions grammaticales)– Distinguer ordre des mots (voire la structure
topologique) de la constituance– Séparer syntaxe et sémantique (distinguer les
variantes de valence des variantes de réalisations)– Donner un rôle important au lexique: valence,
contrôle, sélection
Pour un système formel ...
On est d’accord pour :– Un modèle de la compétence:
– Jugement d’acceptabilité– Paraphrase
– Une grammaire générative :– Engendre seulement phrases acceptables– Minimise « distance » entre paraphrases
– Distinguer des propriétés distributionnelles (relation entre un élément et son contexte syntaxique)
– Distinguer des propriétés inter-phrastiques (relation entre deux éléments d’un paradigme syntaxique)
Pour un système formel ...• Quelques points de divergence
– Langue / parole• « Choix » lexicaux ?• Structure informationnelle
– Place du lexique dans la grammaire– Aspects calculatoires des formalismes
• Système de description (contrairement à un formalisme basé sur une théorie linguistique)– Modulaire– Monotone– Déclaratif
Appareil formel proposé
• Opérateurs génériques:– Ordre linéaire: < << > >>– Constituants: C [ A B ] ; C [ A, B ]– Relations, dont les arguments sont des domaines (A–
>B équivaut à { !A, B } ; on peut vouloir { !A B })• Dépendance (étiquetées par un niveau et par un type): –
[SynP:OBJ]–> / {SynP:Obj ….. }Niveaux possibles: SynS, SynP, Sém, Disc ; relation de correspondance inter-niveaux et domaine/constituant:
• Rel. paradigmatique =>• Rel. focus, Rel. topic –f–> , –t–>• Rel. de co-référence directe (sans domaine correspondant) et
indirecte (y compris le domaine associé)
Etudes de cas
• Disloquées (avec pronom)• structure informationnelle, liage
• Passif• structure informationnelle, relation lexique grammaire,
modularité
• Figement lexical• Collocations, figées
• Contrôle• dépendance syntaxique versus dépendance sémantique
Etudes de cas - Disloquée (1)Dans le fossé, sa voiture, Jean, il l’a encore mise.
1. Relation de coréférence entre le pronom et son antécédent (non bornée, obligatoire).
Dans le fossé, son cheval, Jean, il l’a encore mis.
Son idée idiote, Jean, il croit pouvoir la proposer à la commission.
2. Relation de focalisation sur l’élément extraitJean, sa voiture, il l’a encore mise dans le fossé.
3. Relation de topicalisation sur l’élément antéposéSa voiture, il l’a encore mise dans le fossé, Jean.
• Relation d’ordre linéaire entre groupe extrait et structure « matrice »
• L’élément extrait n’est pas enchâssé dans la phrase matrice
Etude de cas - Disloquée (2)Objets
– Co-référence anaphore expression référentielle– Groupe « antécédent »– Groupe « phrase matrice »– Marque « focus », « topic » de l’élément extrait
Contraintes– Pronom co-référenciel de l’antécédent (accord, catégorie, valence)
• Jean (*lui)l’a remarqué, que Marie est partie sans rien lui dire.• Jean lui(*le) a fait part de son chagrin, à Marie.
Note: la proforme peut être un déterminant (« Jean, sa mobylette, elle est trop petite, la selle. »)
– La relation de co-réréfence est entre propositions (le focus définit donc un domaine)
Jean(i), il(i) lui donne un livre.*Jean(i) lui(i) donne un livre.
Etude de cas - Disloquée (3)Contraintes (suite)
– Ordre linéaire : structure informationnelle du type thème/rhème. Enchâssements croisés impossibles (stratification topologique et non en dépendances syntaxiques)
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
Jean, son vélo, le guidon, la rouille elle est partie
*Jean, son vélo,le guidon,la rouille elle est partie
– Les autres contraintes: pas spécifiques aux disloquées
*De son frère, il est connu que Jean peint le portrait.
De son frère, Jean peint le portrait.
Etude de cas - Disloquée (4)
Jean, sa mobylette, selle,la elle est mal réglée
co-référence co-référence
Constituence
Focus
Ordre linéaire, (thème/propos)
co-référence
lexique: réglée (N0,N1)
Insuffisamment lexique: mal (adverbe antéposé)
SUJET
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
N1 : "celui qui est réglé"
N0 : "celui qui règle"
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
Verbe fini----------------------
S [... [... V ... ] ... ]] ----------------------QuickTime™ et un
décompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
Choix d'un verbe
transitif : expulser
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
Choix de la diathèse passive :
démotion de l'agent
Léon a été expulsé par les autochtones.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
Construction avecl'auxiliaire être
----------------------V [Vaux ... Vpp] ----------------------
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
Choix de l'expression de
l'agent
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
Etude de cas - Passif (1)
Expulser (N0, N1)N0: "Celui qui expulse"N1: "celui qui est expulsé")
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
Voix passive
Contraintes satisfaites:1) Complétude et cohérence : (la complémentation du verbe respecte sa valence)2) La structure topologique est valide (pas de constituence croisée)3) etc, etc...
etc, etc...
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.Contrainte surles instances
Etude de cas - Passif (2)
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
C'est les autochtones,
a été expulsé.
Thème/propos
Focus
Léonque
Dépendance Syntaxique
Dépendance Syntaxique
par
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
...
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
...
Occurrences d’instances
Système formel (1)
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
Partie cohérente et complètede modules:Graphe acyclique
Portée des éléments
Système formel (2)
Contenu d’instance
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucune
sont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
QuickTime™ et undécompresseur Aucunesont requis pour visionner cette image.
Ensemble d'éléments linguistiques
(catégorie, groupe, mot,argument, place, etc.)et ensemble de relationssur ces termes.