Download - Ontologies pour le Web 2.0
1
Ontologies pour le Web 2.0IC2008, 19 Juin 2008
Alexandre Passant1,2, Philippe Laublet11 LaLIC, Université Paris-Sorbonne2 (ex-)EDF, Recherche & Développement
2
Objectifs
• Complémentarité entre Web 2.0 et Web Sémantique• Montrer en quoi les nouveaux usages introduits par le Web 2.0 ne sont pas
incompatibles avec la vision du Web Sémantique
• Comment ?• Extensions d’outils existants pour faire le lien entre les 2
bénéficier des usages et pratiques du Web 2.0 pour produire des données formalisées
bénéficier des données formalisées pour enrichir les services proposés par les outils du Web 2.0
• Plus particulièrement• De la production de documents et tagging associés à l’annotation
sémantique et l’indexation de contenus par des concepts du WS • De la capitalisation de connaissances avec les wikis au peuplement
d’ontologies pour la représentation formelle de connaissances• Contexte : Projet Hermès à EDF R&D, plate-forme Entreprise 2.0
3
Cohabitation entre Web 2.0 et Web Sémantique
1
4
Le Web 2.0 et l’Entreprise 2.0
• Web 2.0• Nouveaux usages et pratiques pour un Web centré sur la production de
données par les utilisateurs finaux D’un Web consultatif à un Web collaboratif
• Blogs pour la publication spontanée d’information• Wikis pour la capitalisation évolutive de connaissances• RSS pour la diffusion et agrégation• Tagging pour l’indexation libre de contenus par les utilisateurs
• Entreprise 2.0• “Enterprise 2.0 is the use of emergent social software platforms
within companies, or between companies and their partners or customers”, Andrew McAfee, Mai 2006
• Introduction de pratiques de plus en plus courantes dans la sphère personnelle au sein de l’entreprise
Remise en cause des processus traditionnels, une nouvelle philosophie pour les échanges de savoir en entreprise
5
Une complémentarité envisageable et nécessaire
• Envisager la complémentarité des deux mondes• Web 2.0 : pratiques et usages• Web Sémantique : formalismes et représentation de connaissances• Les deux domaines peuvent, et doivent, se compléter
Informations produites pas l’intermédiaire d’interactions sociales en utilisant des modèles de représentation formels
• “Le Web Sémantique n’est pas antisocial” - Gandon, IC2006• De nombreux travaux autour de cette complémentarité
• Vocabulaires : FOAF pour les personnes, SIOC pour leurs données• Outils : Wikis et blogs sémantiques• Services : Revyu, DBpedia mobile• Journal Of Web Semantics - Special Issue on Web 2.0, 2008
• “I think we could have both Semantic Web technology supporting online communities, but at the same time also online communities can support Semantic Web data by being the sources of people voluntarily connecting things together.” Tim Berners-Lee, ISWC2005 podcast
6
Exemple: Tags, annotations, indexation
• Tags, tagging et folksonomies• Pratiques popularisées avec les outils Web 2.0 : Flickr, del.icio.us• Contrôle du processus d’indexation et des termes utilisés par l’utilisateur,
sans recours à un vocabulaire ou schéma pré-défini• Evolution de la folksonomie en temps réel• Limites : Ambiguïté, Hétérogénéité, Absence d’organisation
• Annotation sémantique et indexation• Modélisation sémantique des métadonnées documentaires (en RDF)• Indexation de contenus ou les termes de l’index sont des classes ou
instances d’ontologies du domaine• Les termes d’indexation sont définis sans ambiguïté (via leurs URIs) et le
plus souvent interconnectés • Limites : complexité des modèles et du processus
• Comment conserver la souplesse de l’un (tagging) et bénéficier de la puissance de l’autre (annotation et indexation sémantique) ?
7
Représenter les contenus Web 2.0 avec des ontologies dédiées
2
8
SIOC : représentation des metadonnées Web 2.0
• Web 2.0 et structure de données• Modèle de représentation propre à chaque outil
Structure de bases de données, APIs spécifiques...• Interconnexion et requêtes complexes• Besoin d’un modèle commun pour représenter les métadonnées des
contenus Web 2.0 (billet de blog, page wiki), des outils (blog, wiki, forum), des utilisateurs et des relations (publication d’un billet sur un blog donné)
• SIOC: Semantically-Interlinked Online Communities • Définition d’un modèle RDFS pour les activités des communautés en ligne
Breslin et al., ESWC2005• Un noyau: User, Container, Item... et un module types : définition plus
précise des différents Container et Item (BlogItem, Blog, Wiki, WikiArticle...)
http://rdfs.org/sioc/spec• Member Submission au W3C - Juin 2007
• Représentation uniforme des différents contenus• Production automatique depuis différents outils (nombreux plug-ins)• Requête unifiée quelque soit l’origine des contenus (via SPARQL)
9
Exemple de contenus représentés avec SIOC
10
MOAT : représenter la signification des tags
• Modèles existants• Tag Ontology (Newman, 2005) - Notion de Tag et de Tagging (Utilisateur,
Ressource, Tag) Basée sur SKOS et FOAF
• SCOT (Kim et al. 2007) - Modélise les nuages de tags • Ne résolvent pas les problèmes classiques des folksonomies
• Définition d’un nouveau modèle: MOAT (Meaning Of A Tag)• Etend le modèle tripartite classique des folksonomies et actions de tagging• Prise en compte de la signification des tags
Globale (au sein de la folksonomie) - peut être multipleSignifications(Tag) = {(Signification, {Utilisateur})}
Locale (au sein d’une action de tagging) - uniqueTagging(Utilisateur, Ressource, Tag, Signification)
• Significations représentées par des URIs, instances d’ontologies de domaine ou de bases de connaissances publiques (DBpedia, Geonames) pour permettre l’indexation sémantique de contenus à partir des processus de tagging
Comment peupler ces ontologies du domaine ?
11
Significations globales et locales des tags avec MOAT
12
Processus client-serveur pour le tagging avec MOAT
13
Représentation d’un contenu taggué
14
Ontologies du domaine et wikis sémantiques
3
15
Pourquoi des wikis sémantiques ?
• Utilisation des wikis en entreprise• Construction collaborative et incrémentale de connaissance pérennes• Gestion de projets, référentiels encyclopédiques...• Edition libre, rétroliens, archivage des pages• Spécificités wiki à prendre en compte
Ouverture et absence de hiérarchie• Problèmes pour la recherche d’information
• Permet uniquement de répondre à des requêtes plein-texte 1 page wiki = 1 unique bloc de texte
• Impossible de répondre à des questions comme: Lister toutes les entreprises Ou est basé EDF ?
• Les wikis modélisent des documents et des liens hypertextes, pas des représentations formelles de données et leurs relations
16
De l’hypertexte aux données et relations
Représentation documentaire
(wiki)
France
EDF
Energiehyperlien
hyperlien
Représentation du monde réel
(Web Sémantique)
EDFEntreprise
France
Parys
Energie
est une
est un
produit
Différence de représentation
situé en
17
Wikis sémantiques
• Produire des annotations sémantiques à partir de wiki et en conservant la philosophie wiki (ouverture, simplicité, dynamisme ...)
• Peuplement et maintenance d’ontologies Annotation au sein de pages wikis (SemperWiki) Syntaxe particulière au sein des pages (Semantic MediaWiki) Assistance à la pose d’annotations (IkeWiki, OntoWiki)
• Modélisation des métadonnées pour augmenter le potentiel Organisation des tags (SweetWiki) Modélisation des pages de discussions (IkeWiki)
• Problématiques dans le premier cas• Usabilité dans un contexte d’entreprise (URIs, triplets...)• Problèmes d’hétérogénéité sémantique
Ouverture vs qualité des annotations
18
UfoWiki : un serveur de wikis sémantiques
• Ambitions• Faciliter le peuplement d’ontologies et l’évolution des instances pour les
utilisateurs non-technophiles• Utiliser SIOC pour représenter les documents et les interactions utilisateur
Intégration dans la “SIOC-o-sphere” d’entreprise• Combiner ces deux niveaux de modélisation
Qui a dit des choses sur EDF ?• Réutiliser les données disponibles sur le Web
Linking Open Data• Formulaires, templates et ontologies
• Définition de types de pages par les administrateurs Plein-texte + champs structurés
• Chaque type correspond à une classe d’ontologie du domaine Une page “Personne” -> foaf:Person
• Les différents champs correspondent à des propriétés ou relations Complétion à la volée avec restriction selon le type souhaité
• Possibilité de créer des instances au sein même d’une page
19
Exemple de création de page wiki
• Page ‘Association’• Classe foafplus:Association• Champs associés à différentes ontologies internes et externes
ex: foafplus:acronym, geonames:locatedIn
20
Pages wiki et annotations sémantiques
• Deux documents RDF produits pour chaque page créés• Métadonnées de la page (avec SIOC et MOAT)• Contenu de la page (Ontologies du domaine via les formulaires)
• Intégration des deux niveaux• Propriété embedsKnowledge pour tracer la source des données produites
Quelle page définit des assertions sur EDF ?
athena:EDF
http://sws.geonames.org/3017382geonames:locatedIn
Wiki page A
embedsKnowledge
sioct:WikiArticle
rdf:type
sioc:has_creator
http:://athena/alex
dc:title
EDF
Meta-data RDF file
Data RDF file
21
Utilisation des annotations au sein des wikis
• Macros sémantiques• Insertion de résultats de requête complexes utilisant les données produites
au sein même des pages wiki• Complexité des requêtes cachée à l’utilisateur
[onto|members] => liste les membres associés à l’instance courante en utilisant une requête SPARQL
Capacités d’inférence• “Rétro-liens sémantiques”
22
Bénéficier de ressources externes
• Profiter en entreprise de données disponibles librement sur le Web • Utilisation en interne de modèles existants : intégration de données
à moindre coût (LOD) Ex: Géolocation avec geonames.org
23
Intégration globale et utilisation des annotations produites
4
24
25
Tirer bénéfice des annotations produites
• Stockage RDF centralisé et moteur de recherche sémantique• Utilise les différents niveaux d’ontologies et d’annotations• Masque la complexité des modèles et des annotations
Graphes RDF et requêtes SPARQL cachées à l’utilisateur• Principe
• Du tag au concept, permet à l’utilisateur de valider sa recherche en choisissant l’instance d’ontologie correspondant au terme recherché
Résolution de l'ambiguïtéMOAT
• Récupère les contenus relatifs à ce concept (URI) grâce à l’indexation sémantique
Résolution de l’hétérogénéitéMOAT et SIOC
• Suggestion de contenus en fonction des relations existant entre les instances et les documents
Résolution de l’absence de relationsSIOC, ontologies et propriété embedsKnowledge
26
Résultat de recherche
SIOC + MOAT
Ontologies du domaine + SIOC + embedsKnowledge
MOAT
Ontologies du domaine + SIOC
27
Conclusion
5
28
Une approche complémentaire
• Web Sémantique et ontologies pour le Web 2.0• SIOC pour modéliser les activités et contenus des communautés en ligne• MOAT en support des tags et actions de tagging
• Web 2.0 pour le Web Sémantique• Des wikis comme outils de peuplement d’ontologies du domaine• Une communauté d’utilisateurs pour produire des connaissances
formalisées• Un cercle vertueux
• Réutiliser les données produites pour enrichir les outils et augmenter les possibilités de recherche d’information
• Données LOD intégrées dans une plate-forme Entreprise 2.0 pour augmenter son potentiel
• Perspectives• Personnalisation de l’information• Intégration de nouveaux services et données pour augmenter le
potentiel de la plate-forme (ex: OpenCalais, Eurostat / riese,...)
29
Merci !
Questions ?