une vue "web sémantique" de l'évoluation d'ontologies

Post on 22-Nov-2014

2.040 Views

Category:

Technology

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

Presentation in French at the Ontology Evolution workshop of the IC 2010 conference.

TRANSCRIPT

Une vue « Web Sémantique » de l’évolution d’ontologies

Mathieu d’Aquin KMi, The Open University – m.daquin@open.ac.uk

Look at that! 4 years in England and can’t even speak French properly anymore!

Even the title sounds weird… and wait for all the English words in the talk.

L’évolution d’ontologies et le Web Sémantique

L’évolution d’ontologies

Plein de choses

Le Web Sémantique

1- Un peu

3- beaucoupaussi

2- beaucoup

L’évolution d’ontologies (niveau meta)

• International Workshop on Ontology Dynamics

– IWOD 2007: le premier, à ESWC 2007 – 8 papiers

– IWOD 2008: euh… le deuxieme, à ISWC 2008 – 5 papier + 1 expose invite

– IWOD 2009: l’année dernière, à ISWC 2009 – 7 papers

– IWOD 2010: le prochain, à ISWC 2010 – deadline en aout

• Atelier évolution d’ontologies a IC 2010 (d’autres avant ?)

• Numéros spéciaux de journaux

– Journal of Logic and Computation - volume 19, number 5, October 2009 on Ontology Dynamics

– Journal of Web Semantics on Semantic Web Dynamics – Date limite de soumission étendue au 15 juin !

• Le portail ontologydynamics.org

Thèmes

IWOD 2007-2008-2009

Ontology evolution

Ontology versioning

Formal aspects of ontology dynamics

Foundational issues

Extensions to ontology languages to better support change

Belief revision for ontologies and the Semantic Web

Inconsistency handling in evolving ontologies

Change propagation in ontologies and metadata

Ontologies for dynamic environments

Dynamic knowledge construction and exploitation

Requirements for ontology evolution (2009)

Case studies, software tools, use cases, applications

Open problems

JWD Special issue on Semantic Web DynamicsFoundational and formal aspects of Semantic Web dynamicsLanguage extensions for Semantic Web dynamicsReasoning with dynamic data and ontologiesEngineering dynamic data and ontologiesRequirements and practical issues for Semantic Web dynamicsApplications of dynamic data and ontologiesTheory for stream reasoningLogic language for stream reasoningScalability issues in stream reasoningOntologies for dynamic environmentsDynamic knowledge building, and (re-)useOntology evolution and versioningLanguage extensions for evolutionBelief revision for ontologiesChange propagation in ontologies dynamic datasets and ontologiesInconsistency in evolving semantic informationIncremental  reasoningCase studies and applications of ontology and knowledge evolutionTools to support dynamic data and ontologies

Atelier IC 2010repérer des causes d'évolution, détecter des changements apport de l'analyse de ressources externes apport du traitement automatique de langues et de la fouille de textes apport de l'analyse des logs et des interactions avec un utilisateur adaptation lors de la réutilisation, intégration ou fusion d’ontologies  décrire la nature des changements, typologies ou ontologies de changement décrire des solutions pour mettre en place et implémenter des processus évolutions utilisation de règles, de patrons, apports des systèmes multi-agents passage à l'échelle des processus d'évolution proposer une gestion des évolutions assurant un lien avec les artéfacts utilisant les ontologies, gérer les conséquences et répercussion des changements critères pour évaluer la "qualité" ou l'adéquation d'une ontologie (avant / après modification) méthodes ou techniques pour assurer la cohérence entre une ontologie et ses utilisations lien avec la recherche d'information, les annotations sémantiques, les web services aide à la gestion de version, aide à la gestion coopérative d'ontologies

JLC Special issueOntology evolution and versioningFoundations and formal aspects of ontology dynamicsExtensions to ontology languages to better support changeBelief revision for ontologies and the Semantic WebInconsistency handling in evolving ontologiesChange propagation in ontologies and metadata- Ontologies for dynamic environmentsDynamic knowledge construction and exploitationCase studies, software tools, use cases, applications

Thèmes Simplifiés

JWD Special issue on Semantic Web DynamicsFoundational and formal aspects, representation, dynamic reasoning, dynamics engineering, requirements, practical issues, applications, stream reasoning, scalability, dynamic environments, dynamic construction, evolution, versioning, representation, belief revision, change propagation, inconsistency, incremental  reasoning, applications, tools

Atelier IC 2010Detection, NLP, interaction, adaptation, representation, process, rules and patterns, agents, scalability, management and linking, impact, quality, inconsistency, IR, annotation, services, versioning, collaboration.

JLC Special issueEvolution, versioning, foundations and formal aspects, representation, belief revision, inconsistency, propagation, dynamic environments, dynamic construction, applications

IWOD 2007-2008-2009Evolution, versioning, Formal aspects, Foundational issues, representation, belief revision, inconsistency, propagation, dynamic environments, dynamic construction, applications, open problems

Thèmes en vraie

Tag cloud à partir des titres des articles de IWOD 07-09, numéro special JLC et Atelier Evolution d’Ontologies à IC 2010 (traduits)

Thèmes en vraie

IWOD 2007 IWOD 2008

IWOD 2009

JLC

Atelier IC 2010

Différentes tâches

IE / OL / NER

ExtractedSchema/Instances

RelationDiscovery

EvolvedOntology

RelationsList

PerformingChanges

ConsistencyCheck

ApprovedOntology

RecordingChanges

AdminControl

ChangePropagation

Transform-ation

QualityCheck

RawData

Information Discovery

Data Validation

OntologicalChanges

EvolutionManagement

Translation

DuplicationCheck

EvolutionValidation

TemporalReasoning

UnstructurdData

ExternalOntologies

DatabasesBackgrnd

KnowledgeBase

Ontology

= I/O Data

= Processes

QualityCheck

Schema/InstancesChanges

Intégrerer de nouvelles connaissances dans une ontologies

Ontology

Product

PlasmaTV

CRTTV

Phone TV

MobilePhone

Watch

LCDTV

Peut être facile

Ontology

Product

PlasmaTV

CRTTV

Phone TV

MobilePhone

Watch

LCDTV

Peut être facile

Ontology

Product

PlasmaTV

CRTTV

Phone

LEDTV

TV

MobilePhone

Watch

LCDTV

Un peu plus difficile

Ontology

Product

PlasmaTV

CRTTV

Phone

LEDTV

TV

MobilePhone

Watch

LCDTV

Un peu plus difficile

Ontology

Product

PlasmaTV

CRTTV

Phone

LEDTV

TV

MobilePhone

WatchPhone

Watch

LCDTV

Mais nécessite toujours des connaissances intermédiaires

Ontology

Product

PlasmaTV

CRTTV

Phone

LEDTV

TV

MobilePhone

WatchPhone

Watch

LCDTV

Mais nécessite toujours des connaissances intermédiaires

Product

PlasmaTV

CRTTV

Phone

Ontology

LEDTV

TV

MobilePhone

WatchPhone

Watch

LCDTV

?

Web Sémantique

Obtenir ces connaissances à partir du Web Sémantique

LED TV

Watch Phone

Truc bizarrePour sur la tête

Concepts candidats Ontology

?Ontology Intermédiaire

Comment on fait ca ? Watson et Scarlet.

http://watson.kmi.open.ac.uk• Un moteur de recherche pour le Web

Sémantique• Un outil pour la construction

d’applications s’appuyant sur les ontologies du Web Sémantique

Scarlet: découverte de relations utilisant le Web Sémantique

ka2.rdf

Researcher AcademicStaff

Sem

anti

c W

eb

Researcher

AcademicStaff

ISWC SWRCHam SeaFood

Sem

anti

c W

eb

HamSeaFood

Meat

Meat

SeaFood

Agrovoc NALT

pizza-to-go

wine.owl

NALT

Utilisation pour l’evolution d’ontologies

Exemple

• Ontologie: KMi ontology (256 Concepts)• Corpus: KMi news (20 documents)• 520 nouveaux concepts obtenus à partir d’un

mecanisme d’extraction d’informations (Text2Onto)

205 WordNet Relations(Random 50%)

240 Scarlet Relations(Random 50%)

Correct 76 (37%) 62 (26%)

False 26 (13%) 17 (7%)

Don’t Know 0 (0%) 8 (4%)

Precision 75% 79%

L’outil Evolva• Evolva est un plugin pour le NeOn Toolkit (http://neon-

toolkit.org)

Oui mais !

• Beaucoup de relations obtenues.

• OK, elles sont “corrects” la plupart du temps

• Mais elles ne sont pas toutes utiles, i.e., pertinentes.

• En fait, la plupart ne sont jamais selectionnées par l’utilisateur

• Et realiser cette selection est long et difficile

Ontology

Product

PlasmaTV

CRTTV

Phone

LEDTV

TV

MobilePhone

WatchPhone

Watch

LCDTV

Ontology

Product

PlasmaTV

CRTTV

Phone

LEDTV

TV

MobilePhone

WatchPhone

Watch

LCDTV

Ontology

Product

PlasmaTV

CRTTV

Phone

LEDTV

TV

MobilePhone

WatchPhone

Watch

LCDTV

Pizza

?

Une fois encore, besoin de connaissances• Juger de la pertinence d’une

resource est traditionellement realisé en utlisant le contexte de la resource

• Ici, on veux évaluer une assertion• Contexte : la où l’assertion apparait

?• Dans une ontologie… • Approche : comparer le contexte

de l’ontologie à evoluer avec le contexte dans lequel l’assertion apparait dans des ontologies du Web Sémantique

Pizza

Product

Pasta

4Fromages

Thing

Material

Technique initiale

Assertion

Trouver une ontologie qui contient l’assertion

Compare avec

l’ontologie a évoluer

Mesure la correspondence

Pertinent ?

Résultats

Pas terrible !

Résultats

• L’assertion peut apparaitre dans une très grosse ontologie qui couvre bien le domaine de celle a évoluer, mais aussi beaucoup d’autres

• Pas de prise en compte de la structure de l’ontologie et du role des entitées du contexte en rapport avec l’assertion

Solution : détection de patrons

Relevance Pattern 1 Example< Tutorial Event >

Statement Context:http://www.ifi.unizh.ch/ddis/fileadmin/pdf/service_broker/iswc.daml

Résultats !

Utile ?

= Relevant s

= Irrelevant s

= Don’t know s

Aléatoire

Recouv-rement

Patrons

Évolution sur le Web Sémantique

Étudier les ontologies du Web Sémantique

Watson nous fournit une base d’ontologies que l’on peut étudier et utiliser comme corpus pour l’étude de l’évolution d’ontogies

Nombre d’entités

Domaines couverts

Logique de descriptions

Et en plus, ca peut être utile !

Problèmes

• Idée : étudier les liens existants entre versions d’ontologies sur le Web Sémantique

• owl:preVersion, owl:backwardCompatibleWith, owl:incompatibleWith

• Mais ces liens ne sont que très rarement explicites

Nouvelle idée…

• Utiliser les informations encodées dans les identifiants (les URI) des ontologies

http://loki.cae.drexel.edu/wbs/ontology/2003/10/iso-metadata http://loki.cae.drexel.edu/wbs/ontology/2004/01/iso-metadata

• Il y a plusieurs variantes (patrons) mais ils sont généralement utilisés de façon consistante pour toutes les versions d’une ontologie.

• On définit donc 6 règles sur la difference entre les nombres présents dans 2 URI, pour prendre en compte ces variantes (numéro de version, dates, etc.)

Résultats

Pas terrible !

Résultats

• Test sur 6898 ontologies provenant de Watson

• Trouvé 155 501 liens supposés représenter la relation entre une ontologie et ses versions précedentes

• Représentent 1365 sequences de versions distinctes

• Mais…

Regle Precision Nb. Seq. AVG seq. long.

MAX seq. long.

R1 50% 511 80.05 230

R2 50% 843 71.13 154

R4 57% 7 2.2 3

R6 50% 4 2.75 3

Résultats

• Beaucoup de séquence détectées ne représentent pas des versions mais des enregistrements dans une liste numérotée

• Aussi, on obtient des fois des représentations de differentes versions d’un object, plutot que les differentes versions de la représentation d’un object:

http://ontolog.org/…#eswc2006

http://ontolog.org/…#eswc2007

• Besoin de plus d’informations pour classifier les couples d’ontologies trouvés selon qu’ils représentent des versions ou pas

Plus d’information ?

• La longueur de la séquence : On remarque que beaucoup de sequences “incorrectes” sont très longues. Mais des courtes sont aussi incorrectes.

• Similarité : On imagine facilement que les différentes versions d’une ontologie devrait être similaires. On utilise des mesures simples de similarité sur le vocabulaire et sur l’ensemble des assertions présentent dans les ontologies. La simple utilisation d’un seuil ne fonctionne pas.

• La règle utilisée pour sélectionner les URI comme candidats : Les differents patrons initiallement définis peuvent donner des résultats differents.

• Besoin d’une procedure prenant un couple d’ontologies avec ces informations en entrée, et détectant automatiquement si le couple représente un lien de version ou pas.

Utilisation de l’apprentisage supervisé

Comparaison de trois méthodes pour la classification automatique : Naïve Bayses, Support Vector Machine, Decision Tree

Résultats !

Méthode Précision Rappel

Naïve Bayes 71% 100%

SVM 87.2% 95%

Decision Tree 86% 93%

En pratique

• Permet de réduire le nombre de résultats en retour de Watson

• En fournissant la liste des versions d’une ontologie comme un seul element de la liste

Mais aussi…• Fournit une base pour l’étude de l’évolution des ontologies du Web

Sémantique

• Permettant par exemple de mieux comprendre la relation entre evolution et d’autres characteristiques comme la similarité

X : similarité de vocabulaire

Y : similarité syntaxique

Bleu : versions

Rouge : autres

KANNEL: un outil pour la gestion des relations entre ontologies

Conclusion : l’évolution d’ontologies et l’évolution du Web Sémantique• De plus en plus d’outils, de plus en plus de consideration pour les

aspects practiques• Aussi, de nouvelles methodologies prennant mieux en compte

l’évolution, et utilisant les resources du Web Sémantique (voir la NeOn methodology)

• Plus de consideration pour la gestion global des versions sur le Web Sémantique : meilleure representation, distribution des versions, variantes et branchements non lineaires, évolution du domaine vs évolution de la représentation

• Mieux comprendre les pratiques en evolution d’ontologies, extraire des partrons d’évolution.

• Lien avec les domaines du raisonement sur les “flux de données”, vers l’évolution dynamique d’ontologies

• Multi-lingualité !• Évolution des données liées !

Thank You!(euh… non, je veux dire, Merci!)

m.daquin@open.ac.ukhttp://people.kmi.open.ac.uk/mathieu

@mdaquin

Cette presentation inclue de nombreuses contributions de plusieurs personnes au KMi, (http://kmi.open.ac.uk) incluant en particulier

Fouad Zablith et Carlo Allocca

http://evolva.kmi.open.ac.uk/ http://kannel.kmi.open.ac.uk/

References

• d'Aquin, M., Allocca, C., Motta, E., (2010) A Platform for Semantic Web Studies. Poster, Web Science 2010.

• Zablith, F., d'Aquin, M., Sabou, M, Motta, E., (2009) Investigating the Use of Background Knowledge for Assessing the Relevance of Statements to an Ontology in Ontology Evolution. Workshop: International Workshop on Ontology Dynamics (IWOD), The International Semantic Web Conference (ISWC), Northern Virginia, USA.

• Allocca, C., d'Aquin, M., Motta, E., (2009) Detecting Different Versions of Ontologies in Large Ontology Repositories. Workshop: International Workshop on Ontology Dynamic, International Semantic Web Conference, 2009, Washington, DC.

• Allocca, C., d'Aquin, M., Motta, E., (2009) DOOR: Towards a Formalization of Ontology Relations. Proc.of International Conference on Knowledge Engineering and Ontology Development (KEOD)..

• d'Aquin, M., (2009) Formally Measuring Agreement and Disagreement in Ontologies. International Conference on Knowledge Capture - K-CAP 2009.

• d'Aquin, M., Gangemi, A., Motta, E., Dzbor, M, Haase, P., Erdmann, M., (2009) NeOn Tool Support for Building Ontologies by Reuse. Demo, International Conference on Biomedical Ontology, ICBO 2009.

• Zablith, F., Sabou, M, d'Aquin, M., Motta, E., (2009) Ontology Evolution with Evolva. Demo, European Semantic Web Conference (ESWC), Crete, Greece.

• Allocca, C., d'Aquin, M., Motta, E., (2009) Expliciting Semantic Relations Between Ontologies in Large Ontology Repositories. Poster, 6th European Semantic Web Conference 2009., Heraklion, Greece.

• Allocca, C., d'Aquin, M., Motta, E., (2008) Finding Equivalent Ontologies in Watson. Poster, International Semantic Web Conference, ISWC 2008.

• Sabou, M., d'Aquin, M., Sabou, M, (2008) Relation Discovery from the Semantic Web. Demo, International Semantic Web Conference, ISWC 2008.

• Sabou, M, d'Aquin, M., Motta, E., (2008) Using Background Knowledge for Ontology Evolution. Workshop: International Workshop on Ontology Dynamics (IWOD), The International Semantic Web Conference (ISWC), Karlsruhe, Germany.

• Sabou, M., d'Aquin, M., Motta, E., (2008) Exploring the Semantic Web as Background Knowledge for Ontology Matching. Journal of Data Semantics.

• Sabou, M., d'Aquin, M., Motta, E., (2008) SCARLET: SemantiC relAtion discoveRy by harvesting onLinE onTologies. Demo, European Semantic Web Conference, Tenerife, Spain.

• d'Aquin, M., Motta, E., Sabou, M, Angeletou, S., Gridinoc, L., Lopez, V., Guidi, D, (2008) Towards a New Generation of Semantic Web Applications. IEEE Intelligent Systems, Vol.23, 3, (20-28).

• d'Aquin, M., (2008) Building Semantic Web Based Applications with Watson. Demo, WWW2008 - The 17th International World Wide Web Conference - Developers' Track, Beijing, China.

• d'Aquin, M., Baldassarre, C., Gridinoc, L., Angeletou, S., Sabou, M, Motta, E., (2007) Characterizing Knowledge on the Semantic Web with Watson. Workshop: Evaluation of Ontologies and Ontology-based tools, 5th International EON Workshop, International Semantic Web Conference (ISWC'07), Busan, Korea.

• d'Aquin, M., Baldassarre, C., Gridinoc, L., Sabou, M, Angeletou, S., Motta, E., (2007) Watson: Supporting Next Generation Semantic Web Applications. WWW/Internet conference 2007, Vila real, Spain.

top related