les défis de l'accès à l'information juridique entre ... · l’effort a...

65
Les défis de l’accès à l’information juridique Entre annotation et recherche d’information sémantiques Adeline Nazarenko [email protected] LIPN, Université Paris13 – Sorbonne Paris Cité & CNRS 12 décembre 2016 — Journée IA & RI

Upload: others

Post on 23-May-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Les défis de l’accès à l’information juridiqueEntre annotation et recherche d’information sémantiques

Adeline [email protected]

LIPN, Université Paris13 – Sorbonne Paris Cité & CNRS

12 décembre 2016 — Journée IA & RI

Page 2: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Accès à l’information juridique

I Des besoins croissantsI Les citoyens

"Quels arrêtés municipaux existent concernant les chemins ruraux et lesvéhicules à moteurs?"

I Les personnels municipaux"Quels arrêtés municipaux concernant... ont fait l’objet d’un recours et ont étéannulés par décision de tribunal ?"

I Le juriste : "Quelle jurisprudence s’applique pour l’indemnisation de... ?"I Le législateur : "Comment la directive sur le droit d’auteur est-elle

transposée ?"

I Des acteurs de plus en plus présents

éditeurs juridiques, pouvoir publics, professionnels du droit

I Le mouvement général d’ouverture des données et de websémantique

A. Nazarenko Introduction 2/50

Page 3: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Les défis

I La recherche d’information sémantiqueI Quelles documents ?I Quelles requêtes ?

I L’annotation sémantiqueI Quel langage d’annotation ?I Comment annoter ?

Des réflexions plutôt que des résultats ou des conclusions...

A. Nazarenko Introduction 3/50

Page 4: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Retour d’expérience sur quelques projets

I ONTORULE project (FP7) François Lévy, Abdoulaye Guisé (PhD)

Ontologies meet Business Rules

ONTOR UL E

I projet FUI Légilocal Sylvie Salotti, Nada Mimouni (PhD)

I Labex "Empirical Foundations of Linguistics" (ANR)

I Mining Scottish Legislation (Aberdeen University) François Lévy, Adam Wyner

A. Nazarenko Introduction 4/50

Page 5: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Plan

Introduction

Accès à l’information juridique

Accéder aux sourcesAnnotation sémantique au regard d’une ontologiePrise en compte de l’intertextualité

Accéder aux règlesReformulationAnnotation à gros grain

Conclusion et perspectives

A. Nazarenko Introduction 5/50

Page 6: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Outline

Introduction

Accès à l’information juridique

Accéder aux sources

Accéder aux règles

Conclusion et perspectives

A. Nazarenko Accès à l’information juridique 5/50

Page 7: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

La RI juridique

I Statut particulier du documentI Le droit est d’abord un "discours"I Une décision juridique est un texte

I Enjeu de la sécurité juridiqueI Impératif d’exhaustivitéI Nécessité de pouvoir filtrer

A. Nazarenko Accès à l’information juridique 6/50

Page 8: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Exemple de Légifrance

A. Nazarenko Accès à l’information juridique 7/50

Page 9: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Systèmes existants

I ExemplesI LégifranceI NormattivaI UK LegislationI ...

I FonctionnalitésI Recherche en plein texte : Quels sont les décrets qui traitent du bruit ?I Recherche par attribut : Quelles lois sont abrogées ?I Navigation d’un document à l’autre à travers les liens hypertextesI Consultation de la version consolidée d’un texte

I MaisI Pas de normalisation lexicaleI Pas d’interrogation relationnelle

Quels sont les textes qui modifient un décret sur les nuisances sonores ?I pas de support à la décision juridique

Quelles règles s’appliquent sur quels cas ?A. Nazarenko Accès à l’information juridique 8/50

Page 10: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

L’effort a principalement porté sur

I Les recommandations de rédactionI L’ingénierie documentaire : des standards pour structurer

l’information juridiqueI MetaLex, CEN MetaLex [Winkels et al., 2003]I Akoma Ntoso [Sartor et al., 2011a]

I La modélisation ontologiqueI Micro-ontologies [Després and Szulman, 2005]I LKIF-Core Ontology [Hoekstra et al., 2007]I Patrons de conceptions [Gangemi, 2009]

I La modélisation du raisonnement ontologique AI & LawI Modélisation des modalitésI Langages de règles : LegalRuleML [Athan et al., 2015]

A. Nazarenko Accès à l’information juridique 9/50

Page 11: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Outline

Introduction

Accès à l’information juridique

Accéder aux sourcesAnnotation sémantique au regard d’une ontologiePrise en compte de l’intertextualité

Accéder aux règles

Conclusion et perspectives

A. Nazarenko Accéder aux sources 10/50

Page 12: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Qu’est-ce que l’annotation sémantique ?

I Annotation de textes : des métadonnées sont associées à desfragments de textes

note, commentaire, explication, marques de mise en formeI Annotation sémantique : les métadonnées relève d’une ressource

sémantiquevocabulaire contrôlé, terminologie, nomenclature, thesaurus, ontologie

[Popov et al., 2004]A. Nazarenko Accéder aux sources 11/50

Page 13: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Annotation sémantique : défis

L’accent a été mis au départ sur l’annotation des instances et lepeuplement d’ontologies [Vargas-Vera et al., 2002] [Popov et al., 2004]

[Amardeilh et al., 2005] [Magnini et al., 2006]

mais Il faut souventI Coupler acquisition et annotationI Proposer une annotation sémantique plus riche [Ma et al., 2010]

I Avec un grain variableI Exploitant toute la sémantique des ontologies [Lévy et al., 2010b]

individuals, concepts, roles/relations, rules

I Annoter automatiquemet

A. Nazarenko Accéder aux sources 12/50

Page 14: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Annotation au regard d’une ontologie

A. Nazarenko Accéder aux sources 13/50

Page 15: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Navigation dans le texte annoté

[Lévy et al., 2010a]A. Nazarenko Accéder aux sources 14/50

Page 16: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

L’annotation sémantique juridique...

I Un incontournableI Structure du texteI Vocabulaire et tournures juridiquesI Concepts-clés (du droit mais pas seulement)

I Un effort collectifI Ressources génériquesI Ontologies de domaineI Publication des sources et de leurs métadonnées

... toujours en chantier

A. Nazarenko Accéder aux sources 15/50

Page 17: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Plan

Introduction

Accès à l’information juridique

Accéder aux sourcesAnnotation sémantique au regard d’une ontologiePrise en compte de l’intertextualité

Accéder aux règles

Conclusion et perspectives

A. Nazarenko Accéder aux sources 16/50

Page 18: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

L’intertextualité

I Définition : [Genette, 1982]

« relation de coprésence entre deux ou plusieurs textes, c.-à-d. éidétiquement et leplus souvent, par la présence effective d’un texte dans un autre »

I Plagiat Illicite→ détectionI Citation explicite→ analyse, exploitationI Allusion, pastiche stylistique, génétique des textes

[Ganascia et al., 2014]

I Rôle : un texte ne s’interprète pas isolément mais en fonction detous les autres textes auxquels il fait référence et qui lui fontréférence

→ Prendre en compte l’intertextualité dans l’analyse de contenu

A. Nazarenko Accéder aux sources 16/50

Page 19: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Caractéristiques de l’intertextualité juridique

I Explicite, codifiée et normativeI Multiforme : liens de citation, jurisprudence, transposition, etc.I Omniprésente dans le raisonnement juridique

A. Nazarenko Accéder aux sources 17/50

Page 20: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Traitement de l’intertextualité juridique

I Détection, normalisation et formatage[Palmirani et al., 2009][Sartor et al., 2011b]

I Fonctionnalités de navigationI Risque de désorientation [Conklin, 1987]

I Analyse des réseaux de citations (normes, codes,jurisprudence)

I Analyse des la structure des réseaux[Bommarito and Katz, 2009]

[Winkels and de Ruyter, 2011][Boulet et al., 2011]I Calcul de notoriété [Fowler et al., 2007]I Aide à la visualisation [Gultemen and van Engers, 2013]

I Quid de l’interrogation ?

Normes, codes,

jurisprudence, etc.

A. Nazarenko Accéder aux sources 18/50

Page 21: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Intertextualité et recherche d’information

I Recherche d’information généralisteI Analyse de de la structure du web [Broder et al., 2000]I Calcul de notoriété [Brin and Page, 1998][Kleinberg, 1999]

I Recherche d’information juridique Légifrance, UK Legislation, etc.I Visualisation du lien et de son type

I Navigation (cliquer sur le lien)I Recherche par attributs: trouver les documents « modifiés »

→ Interrogation relationnelle

A. Nazarenko Accéder aux sources 19/50

Page 22: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Analyse des besoins des juristes

I Juristes : Meritxell Fernandez (CERSA), Ève Paul (Victoires Éditions)

I Exemples de requêtes : types de doc. + descripteur sém. + lien intertextuel

I Je cherche la décision qui a fait l’objet du jugement A de la Cours de cassation

I J’aimerais voir les arrêtés municipaux concernant les chemins ruraux qui ont faitl’objet d’un appel et ont été annulés par décision de jurisprudence

I Quels sont les articles de code cités par les arrêtés municipaux qui concernent leschemins ruraux et qui ont été confirmés?

I Je me demande si les textes visés par les arrêtés municipaux portant sur leschemins ruraux sont également cités par ceux concernant les véhicules à moteur

→ Intégrer l’interrogation relationnelle à la recherche d’information

A. Nazarenko Accéder aux sources 20/50

Page 23: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Formulation simple du problème

I Hypothèses de travailI Les documents sont annotésI Les liens intertextuels sont identifiésI Les documents et les liens sont typés

I Approche à base de graphesI Collection documentaire = Réseau sémantique de documentsI Requêtes = GraphesI Appariement de graphes

→ Intégrer l’interrogation relationnelle à la recherche d’information

A. Nazarenko Accéder aux sources 21/50

Page 24: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Collection

[Mimouni, 2015]

Multigraphe attribué et orientéI Noeuds : documentsI Attributs

I types de doc.I descripteurs sémantiques

I Arêtes : relations intertextuelles typées

PropriétésI Nombreux documentsI Nombreux descripteursI Plusieurs types de liensI Pas de contrainte topogique

d1 d2

d3d4

t1 t2

t1t2

s1

s2

s2

s3

s4

s1

s3

s4

s5

s3s4

r1

r1r2

r2

r3

r4

r5

A. Nazarenko Accéder aux sources 22/50

Page 25: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Modélisation: hiérarchies de propriétés

I Les descripteurs sont structurés en thesaurusI Le raisonnement sur la hiérarchie des normes et des documents

juridiques est au coeur du raisonnement juridiqueI Les relations intertextuelles sont elles-mêmes organisées en

hiérarchie

la décision de la cour X statue sur la décision antérieure de la cour YConfirmation ou annulation ?

→ Etendre le langage de requête

? ?s1 s4? → ?

? ??

?t3

?s4

?? r3

t1

s6

A. Nazarenko Accéder aux sources 23/50

Page 26: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Représentation des collections (RDF)

A. Nazarenko Accéder aux sources 24/50

Page 27: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Interrogation (SPARQL)

Je voudrais la dernière version (ou la version en vigueur) del’article L362-1 du code de l’environnement.

A. Nazarenko Accéder aux sources 25/50

Page 28: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Interrogation relationnelle : bilan

I Un mécanisme simple reposant surI les technologies du web sémantiqueI une forte structuration des sources juridiques (en cours)I l’annotation systématique des références (existant)

I Un savoir faire à généraliser

A. Nazarenko Accéder aux sources 26/50

Page 29: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Outline

Introduction

Accès à l’information juridique

Accéder aux sources

Accéder aux règlesReformulationAnnotation à gros grain

Conclusion et perspectives

A. Nazarenko Accéder aux règles 27/50

Page 30: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

L’accès aux règles

Un enjeu de sécurité juridiqueI Contrôler la sécurité juridique des décisionsI Gérer les droits attachés aux objets, données, personnesI Comparer et confronter des réglementations entre ellesI Vérifier et maintenir la cohérence des documents sources

→ Intégrer les textes juridiques et réglementaires à la prise de décision

A. Nazarenko Accéder aux règles 28/50

Page 31: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

L’accès aux règles

Deux approchesI La reformulation des règles discursives en règles formellesI L’annotation à gros grain des règles présentes dans les textes

A. Nazarenko Accéder aux règles 29/50

Page 32: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Le problème de la formalisation

I Les langages naturel et formel se situent aux deux extrémités ducontinuum de formalisation [Baumeister et al., 2011]

I les langues naturelles sont complexesI Information factuelle et éléments rhétoriquesI Information redondante et impliciteI Ambiguïté lexicale and structurelle

I La traduction directe et automatique en langage formel estimpossible

I Le choix du langage formel dépend du système cibleI Les approches existantes s’attaquent à des problèmes simplifiés

[Unger et al., 2012] [Dinesh et al., 2008] [Bajwa et al., 2011]

A. Nazarenko Accéder aux règles 30/50

Page 33: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

La formalisation, un processus collaboratif

A. Nazarenko Accéder aux règles 31/50

Page 34: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Annotation r/ ontologie et base de règles

A. Nazarenko Accéder aux règles 32/50

Page 35: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Un processus itératif

Candidate rule 1

Source documentation

XML Candidate rule 2 Candidate rule 3

Candidate rule 4Structural rule

Candidate rule 5 Candidate rule 6

ConclusionPremise

NORMALIZATIONSELECTION

revision revision

revisiondecomposition

Input Documentation source

Process Des fragments de règles sont extraits des textes sources (langage naturel)Des opérations de normalisation sont appliquées en séquence (contrôle man.)

Output Un ensemble de règles indépendantes, décontextualisées, désambiguïsées etéventuellement structurées en prémisses et conclusions (langage contrôlé)

IF a test has a duration less than 6 hours, THEN the test is InvalidTest

A. Nazarenko Accéder aux règles 33/50

Page 36: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

SemEx rule editor

[Guissé, 2013]A. Nazarenko Accéder aux règles 34/50

Page 37: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Sélection des règles à annoter

La sélection des règles requiert une bonne connaissance du contextemétier et de la documentation source

I L’annotation sémantique facilite la lecture des textes sourcesI La recherche de mots-clés permet d’identifier les fragments de texte

pertinents

ex. marqueurs modaux, connecteurs logiques

I L’expert peut appliquer des requêtes Sparql combinant desexpressions régulières et des étiquettes sémantiques

A. Nazarenko Accéder aux règles 35/50

Page 38: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Opérations de normalisation

I Normalisation lexicaleI Remplacement par les "termes préférés"I Désambiguisation

I Décontextualisation : pronoms, termes génériques, références

I Normalisation syntaxique :

ré-ordonnancement des phrases, segmentation des énumérations

décomposition des règles

I Restoration sémantique : entités implicites, intervalles de contraintes

A. Nazarenko Accéder aux règles 36/50

Page 39: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Expériences

Analyse détaillée de 2 ensemble de règles candidatesI American Airlines: 95 règles candidates

Opérations de normalisation % de règles candidates normaliséesLexicale 65%Contextuelle 64%Syntaxique 100%→Décomposition 30%→Restructuration 68%

I Audi : 100 règles candidatesOpérations de normalisation % de règles candidates normaliséesLexicale 61%Contextuelle 57%Syntaxique 100%→Décomposition 40%→Restructuration 32%

A. Nazarenko Accéder aux règles 37/50

Page 40: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Bilan

I Un outil pour guider l’extraction et la normalisation des règles (SemEx)[Lévy et al., 2010a][Guissé, 2013]

I Une approche de normalisation difficile à mettre en oeuvreI Variabilité des corpus et des patrons d’extractionI Langage cible mal défini SBVR Structured English

I Une étape cruciale pour la formalisation des règles métiersI Approche coûteuse dédiée à des contextes applicatifs précis

A. Nazarenko Accéder aux règles 38/50

Page 41: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Annotation à gros grain

I Objectif [Nazarenko et al., 2016][Wyner et al., 2016]

I Analyser un corpus réglementaireI Raisonner automatiquement sur les règles

Qui a le droit de faire quoi et où ?I Explorer et comprendre la loiI Aider les rédacteurs et le législateur à faire la loiI Faciliter l’accès à la loi pour les citoyens, les acteurs économiques et

publicsI Expériences [Wyner et al., 2017]

I Scottish Legal IntrumentsI Réglementation sur la vente et la distribution de tabacs manufacturés

A. Nazarenko Accéder aux règles 39/50

Page 42: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Annotation à gros grain

Analyst

coarse-grained analysis(1st step)

fine-grained analysis2nd stepAnalyst

Keyword queties

Basic structured

queriesHighly

structured queries

User

A. Nazarenko Accéder aux règles 40/50

Page 43: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Legal RuleML

I Bénéficier de l’interopérabilité d’un langage du web sémantiqueRuleML

I S’interfacer avec un langage de règles dédié Legal RuleML1

[Athan et al., 2015]

I Atom, if, then, Rule, Rel(ation), Ind(ividual), Formula, Var, slot, Time,Data, And, Or, Negation

I Agent, Authority, AuxiliaryParty, Bearer, ConstitutiveStatement,Context, DefeasibleStrength, FactualStatement, Jurisdiction,LegalSource, Obligation, Override, PenaltyStatement, Permission,Prohibition, Reparation, Right, Role, StrictStrength,TemporalCharacteristics, Violation

I Utiliser un LRML "à gros grain" pour l’annotation

1OASIS open access/open-source standard XML markup languageA. Nazarenko Accéder aux règles 41/50

Page 44: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Exemple de texte

A. Nazarenko Accéder aux règles 42/50

Page 45: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Objectifs

I Répondre aux questions des utilisateurs juristesI What are the offences and associated penalties or defences?I What prohibitions apply to tobacco products?I What obligations have been placed on what entities, e.g. shop

owners?I What permissions are given to Scottish MinistersI Given a provision, what are related overriding or reparation

provisions?I Annotation

I Comment catégoriser les différentes portions de textes ?

prohibition, obligation, penalty, etc.

I Comment relier ces portions de textes entre elles ?

exception, réparation, etc.

A. Nazarenko Accéder aux règles 43/50

Page 46: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Démarche

I EtapesI Annotation manuelle du corpus dans un langage d’annotation

"simple"I Segmentation du texte en fragmentsI Catégorisation des fragments pertinentsI Mise en relation des fragments

I Transformation en LegalRuleMLI Interrogation du corpus formellement annotéI Analyse de la règlementation

I ExpérienceI Approche agile, en ligne et collaborativeI 6 étudiants ont annoté une dizaine de textesI Mise au point incrémentale du guide d’annotation

I RésultatI Corpus annotéI Guide d’annotationI Outil d’interrogation

A. Nazarenko Accéder aux règles 44/50

Page 47: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Annotations

Le "smoking corpus" a été annoté avec2

I des éléments (∼ 600)I PrescriptiveStatement

I PermissionI ObligationI Prohibition

I ConstitutiveStatement : definitionI Penalty

I des relations entre élémentsI OverrideStatement : exceptionI ReparationStatement

relation entre une pénalité et la prescription associée

2Pour les definitions, voir le document LegalRuleML Core SpecificationA. Nazarenko Accéder aux règles 45/50

Page 48: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Outil d’interrogation

A. Nazarenko Accéder aux règles 46/50

Page 49: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

BilanI 1ère étape

I On peut répondre aux questions des utilisateursI L’approche globale est validée : langage et guide d’annotation

assimilables par des juristes, outil de consultation, etc.I Les difficultés d’interprétation sont identifiées

I Sémantique des modalités : must, may, shall notI Portée des opérateursI Formulation des exceptionsI Modélisation des réparations

I Mise en productionI Intégrer la structure des documents LegalDocMLI Mettre les outils aux mains des juristesI Evaluer la qualité des annotationsI Etendre l’expérience à d’autres corpus juridiques

I Travaux futursI Apprendre à annoter automatiquement ?I Affiner la granularité du langage d’annotation ?

A. Nazarenko Accéder aux règles 47/50

Page 50: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Outline

Introduction

Accès à l’information juridique

Accéder aux sources

Accéder aux règles

Conclusion et perspectives

A. Nazarenko Conclusion et perspectives 48/50

Page 51: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Conclusion

I L’accès à l’information juridique est un enjeuI Retrouver des documents, tous les documents sur un sujet donnéI Raisonner avec les règles exprimées dans les textes juridiques

I Cela passe par l’annotation sémantiqueI Structuration des documentsI Annotation des relations entre documentsI Annotation lexicale et conceptuelle (vocaculaires & ontologies)I Identification, normalisation, structuration des règles (6= Formalisation)

I Mais les défis restent nombreuxI Complexité et variabilité de la langue juridiqueI Diversité des usagesI Ouverture et partage de données, ressources et interprétations

Le Legal Semantic Web se construit mais il reste beaucoup à faire !

A. Nazarenko Conclusion et perspectives 49/50

Page 52: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

Merci de votre attention

A. Nazarenko Conclusion et perspectives 50/50

Page 53: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References I

Florence Amardeilh, Philippe Laublet, and Jean-Luc Minel.

Document annotation and ontology population from linguistic extractions.

In Proceedings of the 3rd international conference on Knowledge capture(K-CAP ’05), pages 161–168, New York, NY, USA, 2005. ACM.

Tara Athan, Guido Governatori, Monica Palmirani, Adrian Paschke, andAdam Z. Wyner.

Legalruleml: Design principles and foundations.

In Wolfgang Faber and Adrian Paschke, editors, Reasoning Web. WebLogic Rules - 11th Int. Summer School, Berlin, Germany, 2015, TutorialLectures, pages 151–188. Springer, 2015.

A. Nazarenko Conclusion et perspectives 38/50

Page 54: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References II

Imran Sarwar Bajwa, Mark G. Lee, and Behzad Bordbar.

Sbvr business rules generation from natural language specification.

In AAAI Spring Symposium 2011 Artificial Intelligence 4 Business Agility,pages 541–545, San Francisco, USA, 2011. AAAI.

Joachim Baumeister, Jochen Reutelshoefer, and Frank Puppe.

Engineering intelligent systems on the knowledge formalization continuum.

International Journal of Applied Mathematics and Computer Science(AMCS), 21(1), 2011.

Michael J. Bommarito and Daniel Martin Katz.

Properties of the united states code citation network.

ArXiv e-prints, November 2009.

A. Nazarenko Conclusion et perspectives 39/50

Page 55: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References III

Romain Boulet, Pierre Mazzega, and Danièle Bourcier.

A network approach to the french system of legal codes- part i: Analysis ofa dense network.

Journal of Artificial Intelligence and Law, 19:333–355, 2011.

Sergey Brin and Lawrence Page.

The anatomy of a large-scale hypertextual web search engine.

In Proceedings of the seventh international conference on World Wide Web(WWW7), pages 107–117, Amsterdam, The Netherlands, 1998. ElsevierScience Publishers B. V.

A. Broder, R. Kumar, F. Maghoul, P. Raghavan, S. Rajagopalan, R. Stata,A. Tomkins, and J. Wiener.

Graph structure in the Web.

Comput. Netw., 33(1-6):309–320, June 2000.

A. Nazarenko Conclusion et perspectives 40/50

Page 56: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References IV

Jeff Conklin.

Hypertext: An introduction and survey.

IEEE Computer, 20(9):17–41, 1987.

Sylvie Després and Sylvie Szulman.

Merging of Legal Micro-Ontologies from European Directives.

In IAAIL Workshop series, pages 149–155, 2005.

Nikhil Dinesh, Aravind Joshi, Insup Lee, and Oleg Sokolski.

Reasoning about conditions and exceptions to laws in regulatoryconformance checking,.

In Proc. of the 9th Int. Conf. on Deontic Logic in Computer Science, page16 pages, 2008.

A. Nazarenko Conclusion et perspectives 41/50

Page 57: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References V

James H. Fowler, Timothy R. Johnson, James F. Spriggs II, Sangick Jeon,and Paul J. Wahlbeck.

Network analysis and the law : Measuring the legal importance ofprecedents at the u.s. supreme court.

Political Analysis, 15:324–346, 2007.

Jean-Gabriel Ganascia, Pierre Glaudes, and Andrea Del Lungo.

Automatic detection of reuses and citations in literary texts.

CoRR, abs/1404.2997, 2014.

Aldo Gangemi.

Introducing pattern-based design for legal ontologies.

In Proceedings of the 2009 Conference on Law, Ontologies and theSemantic Web: Channelling the Legal Information Flood, pages 53–71,Amsterdam, The Netherlands, The Netherlands, 2009. IOS Press.

A. Nazarenko Conclusion et perspectives 42/50

Page 58: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References VI

Gérard Genette.

Palimpsestes.

Poétique. Le Seuil, 1982.

Abdoulaye Guissé.

Une plateforme d’aide à l’acquisition et à la maintenance des règles métierà partir de textes réglementaires.

PhD thesis, Université Paris 13, 2013.

Thèse de doctorat dirigée par Lévy, François, Informatique.

Dincer Gultemen and Tom van Engers.

Graph-based linking and visualization for legislation documents (glvd).

In Network Analysis in Law Workshop (NAiL2013@ICAIL) associated withthe International Conference on AI and Law (ICAIL 2013, Rome, Italy„ June2013.

A. Nazarenko Conclusion et perspectives 43/50

Page 59: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References VII

Rinke Hoekstra, Joost Breuker, Marcello Di Bello, and Alexander Boer.

The LKIF core ontology of basic legal concepts.

In Pompeu Casanovas, Maria Angela Biasiotti, Enrico Francesconi, andMaria Teresa Sagri, editors, Proceedings of the Workshop on LegalOntologies and Artificial Intelligence Techniques (LOAIT 2007), June 2007.

Jon M. Kleinberg.

Authoritative sources in a hyperlinked environment.

Journal of the acm, 46(5):604–632, 1999.

François Lévy, Adeline Nazarenko, Abdoulaye Guissé, Nouha Omrane, andSylvie Szulman.

An environment for the joint management of written policies and businessrules.

In Proceedings of the International Conference on Tools with ArtificialIntelligence (IEEE-ICTAI 10), pages 142–149, 2010.

A. Nazarenko Conclusion et perspectives 44/50

Page 60: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References VIII

François Lévy, Adeline Nazarenko, and Abdoulaye Guissé.

Annotation, indexation et parcours de documents numériques.

Revue des Sciences et Technologies de l’Information (Série IDocumentNumérique), 13(3/2010):121–152, December 2010.

Yue Ma, Adeline Nazarenko, and Laurent Audibert.

Formal description of resources for ontology-based semantic annotation.

In Proceedings of the International Conference on Language Resourcesand Evaluation, Malta, May 2010.

Bernardo Magnini, Emanuele Pianta, Octavian Popescu, and ManuelaSperanza.

Ontology population from textual mentions: Task definition and benchmark.

In Proceedings of the 2nd Workshop on Ontology Learning and Population:Bridging the Gap between Text and Knowledge, pages 26–32, Sydney,Australia, July 2006. Association for Computational Linguistics.

A. Nazarenko Conclusion et perspectives 45/50

Page 61: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References IX

Nada Mimouni.

Interrogation d’un réseau sémantique de documents : l’ntertextualité dansl’accès à l’information juridique, Thèse de Doctorat en Informatique.

PhD thesis, Université Paris 13 – Sorbonne Paris Cité, 2015.

Adeline Nazarenko, François Lévy, and Adam Wyner.

Towards a methodology for formalizing legal texts in legalruleml.

In Floris Bex and Serena Villata, editors, Legal Knowledge and InformationSystems - JURIX 2016: The Twenty-Ninth Annual Conference, volume 294of Frontiers in Artificial Intelligence and Applications. IOS Press, 2016.

Monica Palmirani, Luca Cervone, and Fabio Vitali.

Legal metadata interchange framework to match cen metalex.

In ICAIL, pages 232–233, 2009.

A. Nazarenko Conclusion et perspectives 46/50

Page 62: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References X

Borislav Popov, Atanas Kiryakov, Damyan Ognyanoff, Dimitar Manov, andAngel Kirilov.

Kim – a semantic platform for information extraction and retrieval.

Nat. Lang. Eng., 10(3-4):375–392, 2004.

G. Sartor, M. Palmirani, and E. Francesconi.

Legislative XML for the Semantic Web: Principles, Models, Standards forDocument Management.

Law, governance and technology series. Springer, 2011.

Giovanni Sartor, Monica Palmirani, Enrico Francesconi, and Maria AngelaBiasiotti.

Law, Governance and Technology: Legislative Xml for the Semantic Web:Principles, Models, Standards for Document Management.

Law, Governance and Technology Series, 4. Springer London, Limited,2011.

A. Nazarenko Conclusion et perspectives 47/50

Page 63: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References XI

Christina Unger, Lorenz Bühmann, Jens Lehmann, Axel-Cyrille NgongaNgomo, Daniel Gerber, and Philipp Cimiano.

Sparql template based question answering.

In 21st International World Wide Web Conference (WWW2012), April 2012.

Maria Vargas-Vera, Enrico Motta, John Domingue, Mattia Lanzoni, ArthurScutt, and Fabio Ciravegna.

Mnm: Ontology-driven tool for semantic markup.

In Siegfried Handschuh, Niegel Collier, Rose Dieng, and Steffen Staab,editors, Proceedings Workshop on Semantic Authoring, Annotation &Knowledge Markup (SAAKM 2002), pages 43–47, Lyon, France, 2002.

Radboud Winkels and Jelle de Ruyter.

Survival of the fittest: Network analysis of dutch supreme court cases.

In AICOL, pages 106–115, 2011.

A. Nazarenko Conclusion et perspectives 48/50

Page 64: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References XII

Radboud Winkels, A Boer, and R Hoekstra.

Metalex: An xml standard for legal documents.

In Proceedings of the XML Europe Conference, London (UK), 2003.

Adam Wyner, Adeline Nazarenko, and Francois Lévy.

Towards a high-level controlled language for legal sources on the semanticweb.

In Brian Davis, J. Gordon Pace, and Adam Wyner, editors, Proc. of the 5thInt. Workshop on Controlled Natural Language (CNL2016), pages 92–101,Aberdeen, UK, July 2016. Springer.

A. Nazarenko Conclusion et perspectives 49/50

Page 65: Les défis de l'accès à l'information juridique Entre ... · L’effort a principalement porté sur I Les recommandations de rédaction I L’ingénierie documentaire : des standards

References XIII

Adam Wyner, Fraser Gough, Francois Lévy, Matt Lynch, and AdelineNazarenko.

On annotation of the textual contents of scottish legal instruments.

In Adam Z. Wyner and Giovanni Casini, editors, Legal Knowledge andInformation Systems - JURIX 2017: The Thirtieth Annual Conference,Luxembourg, 13-15 December 2017, volume 302 of Frontiers in ArtificialIntelligence and Applications, pages 101–106. IOS Press, 2017.

A. Nazarenko Conclusion et perspectives 50/50