améliorer l étiquetage de ``que'' - par les descripteurs...

62
Am´ eliorer l’´ etiquetage de “que” ´ Etiquetage morphosyn- taxique Des descripteurs ou des r` egles ? Les descripteurs cibl´ es Les r` egles Conclusions et perspectives Am´ eliorer l’´ etiquetage de “que” par les descripteurs cibl´ es et les r` egles Assaf URIELI UE TAL CLLE-ERSS - UMR 5263 Universit´ e de Toulouse et Joliciel Informatique Foix, France 13 octobre 2014 A. Urieli CLLE-ERSS Am´ eliorer l’´ etiquetage de “que” 1 / 18

Upload: danghuong

Post on 22-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Ameliorer l’etiquetage de “que”par les descripteurs cibles et les regles

Assaf URIELI

UE TAL

CLLE-ERSS - UMR 5263Universite de Toulouse

et

Joliciel InformatiqueFoix, France

13 octobre 2014

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 1 / 18

Page 2: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Problematique

Problematique

• Evolution du TAL francais depuis 10 ans :• Avant : methodes a base de regles et grammaires• Apres : methodes statistiques a base d’apprentissage

• Pour faire un etiqueteur statistique, prenez :• Un corpus annote (ex. French Treebank)• Un classifieur (ex. SVM)• Un algorithme (ex. gauche a droite sequentiel)• Quelques descripteurs

• Atouts :• Etat de l’art facile a atteindre• Systeme facile a maintenir

• Sacrifices :• Dependant du corpus d’apprentissage• Difficulte de regarder a l’interieur des boıtes noires• Beaucoup d’efforts pour gagner 0,10 % d’exactitude• Fosse creuse entre experts de l’apprentissage et linguistes

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 2 / 18

Page 3: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Problematique

Problematique

• Evolution du TAL francais depuis 10 ans :• Avant : methodes a base de regles et grammaires• Apres : methodes statistiques a base d’apprentissage

• Pour faire un etiqueteur statistique, prenez :• Un corpus annote (ex. French Treebank)• Un classifieur (ex. SVM)• Un algorithme (ex. gauche a droite sequentiel)• Quelques descripteurs

• Atouts :• Etat de l’art facile a atteindre• Systeme facile a maintenir

• Sacrifices :• Dependant du corpus d’apprentissage• Difficulte de regarder a l’interieur des boıtes noires• Beaucoup d’efforts pour gagner 0,10 % d’exactitude• Fosse creuse entre experts de l’apprentissage et linguistes

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 2 / 18

Page 4: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Problematique

Problematique

• Evolution du TAL francais depuis 10 ans :• Avant : methodes a base de regles et grammaires• Apres : methodes statistiques a base d’apprentissage

• Pour faire un etiqueteur statistique, prenez :• Un corpus annote (ex. French Treebank)• Un classifieur (ex. SVM)• Un algorithme (ex. gauche a droite sequentiel)• Quelques descripteurs

• Atouts :• Etat de l’art facile a atteindre• Systeme facile a maintenir

• Sacrifices :• Dependant du corpus d’apprentissage• Difficulte de regarder a l’interieur des boıtes noires• Beaucoup d’efforts pour gagner 0,10 % d’exactitude• Fosse creuse entre experts de l’apprentissage et linguistes

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 2 / 18

Page 5: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Problematique

Problematique

• Evolution du TAL francais depuis 10 ans :• Avant : methodes a base de regles et grammaires• Apres : methodes statistiques a base d’apprentissage

• Pour faire un etiqueteur statistique, prenez :• Un corpus annote (ex. French Treebank)• Un classifieur (ex. SVM)• Un algorithme (ex. gauche a droite sequentiel)• Quelques descripteurs

• Atouts :• Etat de l’art facile a atteindre• Systeme facile a maintenir

• Sacrifices :• Dependant du corpus d’apprentissage• Difficulte de regarder a l’interieur des boıtes noires• Beaucoup d’efforts pour gagner 0,10 % d’exactitude• Fosse creuse entre experts de l’apprentissage et linguistes

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 2 / 18

Page 6: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Problematique

Problematique : etiquetage morphosyntaxique de motsfonctionnels

• L’etiquetage morphosyntaxique atteint 97 % avec desdescripteurs generiques

• Facilement adaptable a n’importe quelle langue• Pas de connaissances linguistiques specifiques → limite les

gains d’exactitude possibles

• Mais les 3 % qui reste = 3 % erreurs en parsing

• Corriger des mots fonctionnels ambigus comme “que” parl’injection de connaissances linguistiques :

• Des descripteurs cibles• Des regles

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 3 / 18

Page 7: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Problematique

Problematique : etiquetage morphosyntaxique de motsfonctionnels

• L’etiquetage morphosyntaxique atteint 97 % avec desdescripteurs generiques

• Facilement adaptable a n’importe quelle langue• Pas de connaissances linguistiques specifiques → limite les

gains d’exactitude possibles

• Mais les 3 % qui reste = 3 % erreurs en parsing

• Corriger des mots fonctionnels ambigus comme “que” parl’injection de connaissances linguistiques :

• Des descripteurs cibles• Des regles

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 3 / 18

Page 8: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Problematique

Problematique : etiquetage morphosyntaxique de motsfonctionnels

• L’etiquetage morphosyntaxique atteint 97 % avec desdescripteurs generiques

• Facilement adaptable a n’importe quelle langue• Pas de connaissances linguistiques specifiques → limite les

gains d’exactitude possibles

• Mais les 3 % qui reste = 3 % erreurs en parsing

• Corriger des mots fonctionnels ambigus comme “que” parl’injection de connaissances linguistiques :

• Des descripteurs cibles• Des regles

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 3 / 18

Page 9: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Table of contents

1 Etiquetage morphosyntaxique

2 Des descripteurs ou des regles ?

3 Les descripteurs cibles

4 Les regles

5 Conclusions et perspectives

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 4 / 18

Page 10: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Je n’ ai bu que trois verres

CLS ADV V VPP ?

• Etiqueteur : Talismane (Urieli, 2013)• http://redac.univ-tlse2.fr/talismane.html

• Corpus :• Entraınement : SPMRL-fr (Seddah et al, 2013)• Evaluation : SPMRL + Sequoia (Candito et al, 2012)

• Tagset : Crabbe et Candito (2008)

• Lexique : Lefff (Sagot, 2010)

• Apprentissage :• SVM lineaire• Parametres : ε = 0, 01, C = 0.5, cutoff=3• Exactitude de 96,58 sur SPMRL-dev, et 96,55 sur

SPMRL-test

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 5 / 18

Page 11: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Je n’ ai bu que trois verres

CLS ADV V VPP ?

• Etiqueteur : Talismane (Urieli, 2013)• http://redac.univ-tlse2.fr/talismane.html

• Corpus :• Entraınement : SPMRL-fr (Seddah et al, 2013)• Evaluation : SPMRL + Sequoia (Candito et al, 2012)

• Tagset : Crabbe et Candito (2008)

• Lexique : Lefff (Sagot, 2010)

• Apprentissage :• SVM lineaire• Parametres : ε = 0, 01, C = 0.5, cutoff=3• Exactitude de 96,58 sur SPMRL-dev, et 96,55 sur

SPMRL-test

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 5 / 18

Page 12: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Je n’ ai bu que trois verres

CLS ADV V VPP ?

• Etiqueteur : Talismane (Urieli, 2013)• http://redac.univ-tlse2.fr/talismane.html

• Corpus :• Entraınement : SPMRL-fr (Seddah et al, 2013)• Evaluation : SPMRL + Sequoia (Candito et al, 2012)

• Tagset : Crabbe et Candito (2008)

• Lexique : Lefff (Sagot, 2010)

• Apprentissage :• SVM lineaire• Parametres : ε = 0, 01, C = 0.5, cutoff=3• Exactitude de 96,58 sur SPMRL-dev, et 96,55 sur

SPMRL-test

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 5 / 18

Page 13: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Je n’ ai bu que trois verres

CLS ADV V VPP ?

• Etiqueteur : Talismane (Urieli, 2013)• http://redac.univ-tlse2.fr/talismane.html

• Corpus :• Entraınement : SPMRL-fr (Seddah et al, 2013)• Evaluation : SPMRL + Sequoia (Candito et al, 2012)

• Tagset : Crabbe et Candito (2008)

• Lexique : Lefff (Sagot, 2010)

• Apprentissage :• SVM lineaire• Parametres : ε = 0, 01, C = 0.5, cutoff=3• Exactitude de 96,58 sur SPMRL-dev, et 96,55 sur

SPMRL-test

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 5 / 18

Page 14: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Je n’ ai bu que trois verres

CLS ADV V VPP ?

• Etiqueteur : Talismane (Urieli, 2013)• http://redac.univ-tlse2.fr/talismane.html

• Corpus :• Entraınement : SPMRL-fr (Seddah et al, 2013)• Evaluation : SPMRL + Sequoia (Candito et al, 2012)

• Tagset : Crabbe et Candito (2008)

• Lexique : Lefff (Sagot, 2010)

• Apprentissage :• SVM lineaire• Parametres : ε = 0, 01, C = 0.5, cutoff=3• Exactitude de 96,58 sur SPMRL-dev, et 96,55 sur

SPMRL-test

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 5 / 18

Page 15: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Etiquetage morphosyntaxique

Je n’ ai bu que trois verres

CLS ADV V VPP ?

• Etiqueteur : Talismane (Urieli, 2013)• http://redac.univ-tlse2.fr/talismane.html

• Corpus :• Entraınement : SPMRL-fr (Seddah et al, 2013)• Evaluation : SPMRL + Sequoia (Candito et al, 2012)

• Tagset : Crabbe et Candito (2008)

• Lexique : Lefff (Sagot, 2010)

• Apprentissage :• SVM lineaire• Parametres : ε = 0, 01, C = 0.5, cutoff=3• Exactitude de 96,58 sur SPMRL-dev, et 96,55 sur

SPMRL-test

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 5 / 18

Page 16: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Descripteurs de base

Descripteurs de base :

• W : la forme lexicale

• P : le pos-tag

• L : le lemme

• U : si le token est inconnu

• Sfxn / Prefn : les n dernieres/premieres lettres

• 1st / Last : si le token est le premier/dernier de la phrase

• 2- et 3-grammes aux tokens en position -2, -1, 0, +1, +2

Descripteurs (plus) “riches” :

• Distance < -2 ou 2 < distance

• Lemme < classe d’equivalence < pos-tag

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 6 / 18

Page 17: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Descripteurs de base

Descripteurs de base :

• W : la forme lexicale

• P : le pos-tag

• L : le lemme

• U : si le token est inconnu

• Sfxn / Prefn : les n dernieres/premieres lettres

• 1st / Last : si le token est le premier/dernier de la phrase

• 2- et 3-grammes aux tokens en position -2, -1, 0, +1, +2

Descripteurs (plus) “riches” :

• Distance < -2 ou 2 < distance

• Lemme < classe d’equivalence < pos-tag

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 6 / 18

Page 18: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage de “que”

Etiquetage morphosyntaxique de “que”

1 Conjonction de subordination (CS) : Je pense qu’il a trop bu.

2 Pronom relatif (PROREL) : Il boit le vin que j’ai achete.

3 Pronom interrogatif (PROWH) : Que buvez-vous ?

4 Adverbe negatif (ADV) : Je n’ai bu que trois verres.

5 Adverbe exclamatif (ADV) : Qu’il est bon, ce vin !

6 Construction comparative (CS) : Il est plus bourre que moi.

+ des clivees

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 7 / 18

Page 19: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage de “que”

Etiquetage morphosyntaxique de “que”

1 Conjonction de subordination (CS) : Je pense qu’il a trop bu.

2 Pronom relatif (PROREL) : Il boit le vin que j’ai achete.

3 Pronom interrogatif (PROWH) : Que buvez-vous ?

4 Adverbe negatif (ADV) : Je n’ai bu que trois verres.

5 Adverbe exclamatif (ADV) : Qu’il est bon, ce vin !

6 Construction comparative (CS) : Il est plus bourre que moi.

+ des clivees

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 7 / 18

Page 20: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage de “que”

Etiquetage morphosyntaxique de “que”

1 Conjonction de subordination (CS) : Je pense qu’il a trop bu.

2 Pronom relatif (PROREL) : Il boit le vin que j’ai achete.

3 Pronom interrogatif (PROWH) : Que buvez-vous ?

4 Adverbe negatif (ADV) : Je n’ai bu que trois verres.

5 Adverbe exclamatif (ADV) : Qu’il est bon, ce vin !

6 Construction comparative (CS) : Il est plus bourre que moi.

+ des clivees

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 7 / 18

Page 21: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage de “que”

Etiquetage morphosyntaxique de “que”

1 Conjonction de subordination (CS) : Je pense qu’il a trop bu.

2 Pronom relatif (PROREL) : Il boit le vin que j’ai achete.

3 Pronom interrogatif (PROWH) : Que buvez-vous ?

4 Adverbe negatif (ADV) : Je n’ai bu que trois verres.

5 Adverbe exclamatif (ADV) : Qu’il est bon, ce vin !

6 Construction comparative (CS) : Il est plus bourre que moi.

+ des clivees

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 7 / 18

Page 22: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage de “que”

Etiquetage morphosyntaxique de “que”

1 Conjonction de subordination (CS) : Je pense qu’il a trop bu.

2 Pronom relatif (PROREL) : Il boit le vin que j’ai achete.

3 Pronom interrogatif (PROWH) : Que buvez-vous ?

4 Adverbe negatif (ADV) : Je n’ai bu que trois verres.

5 Adverbe exclamatif (ADV) : Qu’il est bon, ce vin !

6 Construction comparative (CS) : Il est plus bourre que moi.

+ des clivees

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 7 / 18

Page 23: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage de “que”

Etiquetage morphosyntaxique de “que”

1 Conjonction de subordination (CS) : Je pense qu’il a trop bu.

2 Pronom relatif (PROREL) : Il boit le vin que j’ai achete.

3 Pronom interrogatif (PROWH) : Que buvez-vous ?

4 Adverbe negatif (ADV) : Je n’ai bu que trois verres.

5 Adverbe exclamatif (ADV) : Qu’il est bon, ce vin !

6 Construction comparative (CS) : Il est plus bourre que moi.

+ des clivees

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 7 / 18

Page 24: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Etiquetage de “que”

Etiquetage morphosyntaxique de “que”

1 Conjonction de subordination (CS) : Je pense qu’il a trop bu.

2 Pronom relatif (PROREL) : Il boit le vin que j’ai achete.

3 Pronom interrogatif (PROWH) : Que buvez-vous ?

4 Adverbe negatif (ADV) : Je n’ai bu que trois verres.

5 Adverbe exclamatif (ADV) : Qu’il est bon, ce vin !

6 Construction comparative (CS) : Il est plus bourre que moi.

+ des clivees

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 7 / 18

Page 25: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Etiquetage morphosyntaxique

Baseline pour “que”

Baseline pour “que”

ADV CS PROREL PROWH Total ErreursADV 90 44 4 1 139 49CS 37 1097 61 0 1195 98PROREL 0 69 244 0 313 69PROWH 0 4 2 23 29 6

Table : Matrice de confusion de base pour que

• 222 erreurs pour 1 676 occurrences

• Exactitude de 86,75 %

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 8 / 18

Page 26: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Des descripteurs ou des regles ?

Des descripteurs ou des regles ?

Des descripteurs ou des regles ?

• Descripteurs :• Information extraite du contexte• Definissent des tendances• Peuvent se contredire• S’appliquent pendant l’entraınement et l’analyse• Generalisent les regularites du corpus d’entraınement aux

autres corpus• Limites au cas trouves dans le corpus d’entraınement

• Regles :• Vrai/faux : si vrai, forcer ou interdire une etiquette• Definissent des verites• Deterministes• S’appliquent uniquement pendant l’analyse• Peuvent etre specifiques a chaque corpus• Traduisent les connaissances de la langue ou du corpus

analyse

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 9 / 18

Page 27: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Des descripteurs ou des regles ?

Des descripteurs ou des regles ?

Des descripteurs ou des regles ?

• Descripteurs :• Information extraite du contexte• Definissent des tendances• Peuvent se contredire• S’appliquent pendant l’entraınement et l’analyse• Generalisent les regularites du corpus d’entraınement aux

autres corpus• Limites au cas trouves dans le corpus d’entraınement

• Regles :• Vrai/faux : si vrai, forcer ou interdire une etiquette• Definissent des verites• Deterministes• S’appliquent uniquement pendant l’analyse• Peuvent etre specifiques a chaque corpus• Traduisent les connaissances de la langue ou du corpus

analyse

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 9 / 18

Page 28: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : analyse d’erreursDans le corpus SPMRL dev :

1 Mais cela ne represente dans cette mouture, pour un couple avec

deux enfants, qu’/ADV une prime maximale.

2 Pour cela, il n’est pas question que/CS le zloty, la monnaie

polonaise, soit “l’ancre de la stabilite” de l’economie polonaise.

3 . . . qui, faute de volonte politique, ne fut jamais que/ADV la

caricature du systeme francais.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 10 / 18

Page 29: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : analyse d’erreursDans le corpus SPMRL dev :

1 Mais cela ne represente dans cette mouture, pour un couple avec

deux enfants, qu’/ADV une prime maximale.

2 Pour cela, il n’est pas question que/CS le zloty, la monnaie

polonaise, soit “l’ancre de la stabilite” de l’economie polonaise.

3 . . . qui, faute de volonte politique, ne fut jamais que/ADV la

caricature du systeme francais.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 10 / 18

Page 30: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : analyse d’erreursDans le corpus SPMRL dev :

1 Mais cela ne represente dans cette mouture, pour un couple avec

deux enfants, qu’/ADV une prime maximale.

2 Pour cela, il n’est pas question que/CS le zloty, la monnaie

polonaise, soit “l’ancre de la stabilite” de l’economie polonaise.

3 . . . qui, faute de volonte politique, ne fut jamais que/ADV la

caricature du systeme francais.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 10 / 18

Page 31: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : descripteurs cibles

• Ne precedent sans autre particule negative

• Pas de ne precedent

• Que negatif possible : y a-t-il un ne, ne pas ou ne plus plustot dans la phrase, sans prendre en compte d’autresparticules negatives

• Combinaison de particules negatives a courte distance

Mais :

1 L’Amerique, moins superficielle qu’on ne l’imagine parfois, a entrepris

une reflexion sur son identite bien avant que/CS [. . . ]

2 [. . . ] ne peuvent ainsi eviter que/CS, en la matiere, l’histoire ne se

repete

3 Il lui manque que/ADV le sac a main de Maggie

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 11 / 18

Page 32: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : descripteurs cibles

• Ne precedent sans autre particule negative

• Pas de ne precedent

• Que negatif possible : y a-t-il un ne, ne pas ou ne plus plustot dans la phrase, sans prendre en compte d’autresparticules negatives

• Combinaison de particules negatives a courte distance

Mais :

1 L’Amerique, moins superficielle qu’on ne l’imagine parfois, a entrepris

une reflexion sur son identite bien avant que/CS [. . . ]

2 [. . . ] ne peuvent ainsi eviter que/CS, en la matiere, l’histoire ne se

repete

3 Il lui manque que/ADV le sac a main de Maggie

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 11 / 18

Page 33: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : descripteurs cibles

• Ne precedent sans autre particule negative

• Pas de ne precedent

• Que negatif possible : y a-t-il un ne, ne pas ou ne plus plustot dans la phrase, sans prendre en compte d’autresparticules negatives

• Combinaison de particules negatives a courte distance

Mais :

1 L’Amerique, moins superficielle qu’on ne l’imagine parfois, a entrepris

une reflexion sur son identite bien avant que/CS [. . . ]

2 [. . . ] ne peuvent ainsi eviter que/CS, en la matiere, l’histoire ne se

repete

3 Il lui manque que/ADV le sac a main de Maggie

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 11 / 18

Page 34: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : descripteurs cibles

• Ne precedent sans autre particule negative

• Pas de ne precedent

• Que negatif possible : y a-t-il un ne, ne pas ou ne plus plustot dans la phrase, sans prendre en compte d’autresparticules negatives

• Combinaison de particules negatives a courte distance

Mais :

1 L’Amerique, moins superficielle qu’on ne l’imagine parfois, a entrepris

une reflexion sur son identite bien avant que/CS [. . . ]

2 [. . . ] ne peuvent ainsi eviter que/CS, en la matiere, l’histoire ne se

repete

3 Il lui manque que/ADV le sac a main de Maggie

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 11 / 18

Page 35: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : descripteurs cibles

• Ne precedent sans autre particule negative

• Pas de ne precedent

• Que negatif possible : y a-t-il un ne, ne pas ou ne plus plustot dans la phrase, sans prendre en compte d’autresparticules negatives

• Combinaison de particules negatives a courte distance

Mais :

1 L’Amerique, moins superficielle qu’on ne l’imagine parfois, a entrepris

une reflexion sur son identite bien avant que/CS [. . . ]

2 [. . . ] ne peuvent ainsi eviter que/CS, en la matiere, l’histoire ne se

repete

3 Il lui manque que/ADV le sac a main de Maggie

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 11 / 18

Page 36: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : descripteurs cibles

• Ne precedent sans autre particule negative

• Pas de ne precedent

• Que negatif possible : y a-t-il un ne, ne pas ou ne plus plustot dans la phrase, sans prendre en compte d’autresparticules negatives

• Combinaison de particules negatives a courte distance

Mais :

1 L’Amerique, moins superficielle qu’on ne l’imagine parfois, a entrepris

une reflexion sur son identite bien avant que/CS [. . . ]

2 [. . . ] ne peuvent ainsi eviter que/CS, en la matiere, l’histoire ne se

repete

3 Il lui manque que/ADV le sac a main de Maggie

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 11 / 18

Page 37: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme adverbe negatif

“Que” comme adverbe negatif : descripteurs cibles

• Ne precedent sans autre particule negative

• Pas de ne precedent

• Que negatif possible : y a-t-il un ne, ne pas ou ne plus plustot dans la phrase, sans prendre en compte d’autresparticules negatives

• Combinaison de particules negatives a courte distance

Mais :

1 L’Amerique, moins superficielle qu’on ne l’imagine parfois, a entrepris

une reflexion sur son identite bien avant que/CS [. . . ]

2 [. . . ] ne peuvent ainsi eviter que/CS, en la matiere, l’histoire ne se

repete

3 Il lui manque que/ADV le sac a main de Maggie

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 11 / 18

Page 38: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : analyse d’erreurs

1 [. . . ] la Commission des operations de bourse (COB) a annonce le 14

janvier qu’/CS elle saisit la justice [. . . ]

2 Le gouvernement va presenter dans un delai de trois mois les

dispositions qu’/PROREL il entend retenir [. . . ]

3 Le fait qu’/CS ils aient accepte de reprendre les pourparlers est

interprete de facon positive.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 12 / 18

Page 39: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : analyse d’erreurs

1 [. . . ] la Commission des operations de bourse (COB) a annonce le 14

janvier qu’/CS elle saisit la justice [. . . ]

2 Le gouvernement va presenter dans un delai de trois mois les

dispositions qu’/PROREL il entend retenir [. . . ]

3 Le fait qu’/CS ils aient accepte de reprendre les pourparlers est

interprete de facon positive.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 12 / 18

Page 40: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : analyse d’erreurs

1 [. . . ] la Commission des operations de bourse (COB) a annonce le 14

janvier qu’/CS elle saisit la justice [. . . ]

2 Le gouvernement va presenter dans un delai de trois mois les

dispositions qu’/PROREL il entend retenir [. . . ]

3 Le fait qu’/CS ils aient accepte de reprendre les pourparlers est

interprete de facon positive.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 12 / 18

Page 41: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 42: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 43: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 44: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 45: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 46: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 47: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 48: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

“Que” comme pronom relatif

“Que” comme pronom relatif : descripteurs cibles

• Structure coordonnee : chercher l’etiquette du queprecedent.

• Apres nom explicatif : Le que suit-il un des mots{assurance, certitude, doute, espoir, fait, . . . } ?

• Verbe precedent sous categorise avec que : ex. penser

• Le verbe qui precede a un objet direct

• Le verbe qui suit a un objet direct

• Que suivi directement d’un verbe• L’exemple que/PROREL fournit Sombart est particulierement

eclairant

• Que suivi d’un verbe subjonctif

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 13 / 18

Page 49: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les descripteurs cibles

Descripteurs cibles : resultats

Descripteurs cibles : resultats

ADV CS PROREL PROWH Total ErreursADV 133 (+43) 6 (-38) 0 (-4) 0 (-1) 139 6 (-43)CS 10 (-27) 1135 (+38) 50 (-11) 0 (-1) 1195 60 (-38)PROREL 0 52 (-17) 261 (+17) 0 313 52 (-17)PROWH 0 0 (-4) 4 (+2) 25 (+2) 29 4 (-2)

Table : Matrice de confusion pour que avec les descripteurs cibles

• 139 nouvelles corrections pour 29 nouvelles erreurs

• 122 erreurs pour 1 676 occurrences

• Exactitude de 86,75 % a 92,72 %

• Taux d’erreur -45 %

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 14 / 18

Page 50: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les regles

Les regles

Les regles

• CS : apres s’attendre a ce que, veiller a ce que, n’empecheque. . .

• CS : pour toute expression de type “etre ADJ que”, tel que“il est probable que”.

• !PROREL : si que suit un verbe directement, ou separe duverbe uniquement par un commentaire entoure par desvirgules

• Sequoia/Europarl : Je sais, Madame la Presidente, que/CS

vous etes deja intervenue [. . . ]

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 15 / 18

Page 51: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les regles

Les regles

Les regles

• CS : apres s’attendre a ce que, veiller a ce que, n’empecheque. . .

• CS : pour toute expression de type “etre ADJ que”, tel que“il est probable que”.

• !PROREL : si que suit un verbe directement, ou separe duverbe uniquement par un commentaire entoure par desvirgules

• Sequoia/Europarl : Je sais, Madame la Presidente, que/CS

vous etes deja intervenue [. . . ]

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 15 / 18

Page 52: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les regles

Les regles

Les regles

• CS : apres s’attendre a ce que, veiller a ce que, n’empecheque. . .

• CS : pour toute expression de type “etre ADJ que”, tel que“il est probable que”.

• !PROREL : si que suit un verbe directement, ou separe duverbe uniquement par un commentaire entoure par desvirgules

• Sequoia/Europarl : Je sais, Madame la Presidente, que/CS

vous etes deja intervenue [. . . ]

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 15 / 18

Page 53: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les regles

Les regles

Les regles

• CS : apres s’attendre a ce que, veiller a ce que, n’empecheque. . .

• CS : pour toute expression de type “etre ADJ que”, tel que“il est probable que”.

• !PROREL : si que suit un verbe directement, ou separe duverbe uniquement par un commentaire entoure par desvirgules

• Sequoia/Europarl : Je sais, Madame la Presidente, que/CS

vous etes deja intervenue [. . . ]

• . . .

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 15 / 18

Page 54: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les regles

Les regles : resultats

Les regles : resultats

ADV CS PROREL PROWH Total ErreursADV 134 (+1) 5 (-1) 0 0 139 5 (-1)CS 10 1149 (+14) 36 (-14) 0 1195 46 (-14)PROREL 0 48 (-4) 265 (+4) 0 313 48 (-4)PROWH 0 0 2 (-2) 27 (+2) 29 2 (-2)

Table : Matrice de confusion pour que avec les regles

• 21 nouvelles corrections pour 0 nouvelles erreurs

• 101 erreurs pour 1 676 occurrences

• Exactitude de 86,75 % a 93,97 %

• Taux d’erreur -55 %

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 16 / 18

Page 55: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les regles

Les regles

Les regles : corpus non annotes200 000 mots de chacun des corpus suivants :

• Est Republicain : le journal regional Est Republicain del’annee 2003

• Leximedia : campagne presidentielle 2007 (CLLE-ERSS)

• Frantext : des textes litteraires francais du 20eme siecle

• Revues.org : une collection d’articles scientifiques dans lessciences sociales

Resultats :

• Une difference / 8 500 mots

• 46 corrections pour 5 erreurs dans les 51 premieres

• Je conteste, en tant que pere de famille, que/CS l’on vienne me dire

que l’argent est le corollaire du succes.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 17 / 18

Page 56: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Les regles

Les regles

Les regles : corpus non annotes200 000 mots de chacun des corpus suivants :

• Est Republicain : le journal regional Est Republicain del’annee 2003

• Leximedia : campagne presidentielle 2007 (CLLE-ERSS)

• Frantext : des textes litteraires francais du 20eme siecle

• Revues.org : une collection d’articles scientifiques dans lessciences sociales

Resultats :

• Une difference / 8 500 mots

• 46 corrections pour 5 erreurs dans les 51 premieres

• Je conteste, en tant que pere de famille, que/CS l’on vienne me dire

que l’argent est le corollaire du succes.

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 17 / 18

Page 57: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Conclusions et perspectives

Conclusions et perspectives

Conclusions et perspectives

• Descripteurs cibles : taux d’erreur -45 %

• + regles : taux d’erreur -55 %

• Complexite de maintenance ?

• Vitesse d’analyse ? (de 9 a 5 millions de mots par heure)

• D’autres mots fonctionnels (“de/des/du”, “soit”, . . . )

• Appliquer au parsing

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 18 / 18

Page 58: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Conclusions et perspectives

Conclusions et perspectives

Conclusions et perspectives

• Descripteurs cibles : taux d’erreur -45 %

• + regles : taux d’erreur -55 %

• Complexite de maintenance ?

• Vitesse d’analyse ? (de 9 a 5 millions de mots par heure)

• D’autres mots fonctionnels (“de/des/du”, “soit”, . . . )

• Appliquer au parsing

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 18 / 18

Page 59: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Conclusions et perspectives

Conclusions et perspectives

Conclusions et perspectives

• Descripteurs cibles : taux d’erreur -45 %

• + regles : taux d’erreur -55 %

• Complexite de maintenance ?

• Vitesse d’analyse ? (de 9 a 5 millions de mots par heure)

• D’autres mots fonctionnels (“de/des/du”, “soit”, . . . )

• Appliquer au parsing

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 18 / 18

Page 60: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Conclusions et perspectives

Conclusions et perspectives

Conclusions et perspectives

• Descripteurs cibles : taux d’erreur -45 %

• + regles : taux d’erreur -55 %

• Complexite de maintenance ?

• Vitesse d’analyse ? (de 9 a 5 millions de mots par heure)

• D’autres mots fonctionnels (“de/des/du”, “soit”, . . . )

• Appliquer au parsing

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 18 / 18

Page 61: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Conclusions et perspectives

Conclusions et perspectives

Conclusions et perspectives

• Descripteurs cibles : taux d’erreur -45 %

• + regles : taux d’erreur -55 %

• Complexite de maintenance ?

• Vitesse d’analyse ? (de 9 a 5 millions de mots par heure)

• D’autres mots fonctionnels (“de/des/du”, “soit”, . . . )

• Appliquer au parsing

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 18 / 18

Page 62: Améliorer l étiquetage de ``que'' - par les descripteurs ...w3.erss.univ-tlse2.fr/UETAL/2014-2015/TalismaneTALN2014Slides.pdf · Un algorithme (ex. gauche a ... Pas de connaissances

Ameliorerl’etiquetage

de “que”

Etiquetagemorphosyn-taxique

Desdescripteursou desregles ?

Lesdescripteurscibles

Les regles

Conclusionsetperspectives

Conclusions et perspectives

Conclusions et perspectives

Conclusions et perspectives

• Descripteurs cibles : taux d’erreur -45 %

• + regles : taux d’erreur -55 %

• Complexite de maintenance ?

• Vitesse d’analyse ? (de 9 a 5 millions de mots par heure)

• D’autres mots fonctionnels (“de/des/du”, “soit”, . . . )

• Appliquer au parsing

A. Urieli CLLE-ERSS Ameliorer l’etiquetage de “que” 18 / 18