sommario

19
Ontology dynamics for Semantic Web: the MOMIS approach Relatore Chiar. mo Prof. Sonia Bergamaschi Tesi di Laurea di Alain Fergnani Correlatore Dott. Ing. Francesco Guerra Controrelatore Chiar. mo Prof. Paolo Tiberi UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Dinamica delle ontologie per il Web Semantico: l’approccio di MOMIS

Upload: elton-vincent

Post on 31-Dec-2015

27 views

Category:

Documents


0 download

DESCRIPTION

Sommario. Il Web Semantico Le ontologie La dinamica delle ontologie Il sistema MOMIS L’inserimento di nuove sorgenti Conclusioni. Osservazioni Grande quantità di informazioni Difficoltà nel selezionare le informazioni interessanti Uso di HTML non comprensibile dai calcolatori. - PowerPoint PPT Presentation

TRANSCRIPT

Ontology dynamics for Semantic Web:the MOMIS approach

RelatoreChiar. mo Prof. Sonia Bergamaschi

Tesi di Laurea diAlain Fergnani

CorrelatoreDott. Ing. Francesco Guerra

ControrelatoreChiar. mo Prof. Paolo Tiberio

UNIVERSITA’ DEGLI STUDI DI MODENA EREGGIO EMILIA

Facoltà di Ingegneria – Sede di ModenaCorso di Laurea in Ingegneria Informatica

Dinamica delle ontologie per il Web Semantico: l’approccio di MOMIS

2Martedì, 18 Febbraio 2003 Alain Fergnani

SommarioSommario

Il Web SemanticoIl Web Semantico Le ontologieLe ontologie La dinamica delle ontologie La dinamica delle ontologie Il sistema MOMIS Il sistema MOMIS L’inserimento di nuove sorgentiL’inserimento di nuove sorgenti ConclusioniConclusioni

3Martedì, 18 Febbraio 2003 Alain Fergnani

Il WWW oggiIl WWW oggi

Conoscenze di base Conoscenze di base e conoscenza e conoscenza specifica del specifica del

dominiodominio

(interpretazione)

La ricerca di La ricerca di informazioni in rete…informazioni in rete…

click

OsservazioniOsservazioni Grande quantità di informazioniGrande quantità di informazioni Difficoltà nel selezionare le Difficoltà nel selezionare le

informazioni interessantiinformazioni interessanti Uso di HTML non comprensibile dai Uso di HTML non comprensibile dai

calcolatoricalcolatori

4Martedì, 18 Febbraio 2003 Alain Fergnani

(interpretazione)

Il WWW domaniIl WWW domani

Il Web SemanticoIl Web Semantico

(istruzioni)

AGENTE

La ricerca di La ricerca di informazioni in rete…informazioni in rete…

Ontologia

annotazione

(risultati)

annotazione

5Martedì, 18 Febbraio 2003 Alain Fergnani

Il Web SemanticoIl Web Semantico ““The Semantic Web is an extension of the current web in The Semantic Web is an extension of the current web in which information is given well-defined meaning, better which information is given well-defined meaning, better enabling computers and people to work in cooperation.enabling computers and people to work in cooperation.””

““The Semantic Web will bring structure to the meaningful The Semantic Web will bring structure to the meaningful content of Web pages, creating an environment where content of Web pages, creating an environment where software agents, roaming from page to page, can readily software agents, roaming from page to page, can readily carry out sophisticated tasks for users.”carry out sophisticated tasks for users.”[[Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001Scientific American, May 2001]]

Elementi chiave:Elementi chiave:– Rappresentazione della conoscenzaRappresentazione della conoscenza– AgentiAgenti– OntologieOntologie

6Martedì, 18 Febbraio 2003 Alain Fergnani

Il Web SemanticoIl Web Semantico

AgentiAgenti– Sono componenti software con le seguenti proprietà:Sono componenti software con le seguenti proprietà:

• autonomiaautonomia• reattivitàreattività• pro-attivitàpro-attività• abilità socialiabilità sociali

[M. Wooldridge and N.R. Jennings. Intelligent agents: Theories and[M. Wooldridge and N.R. Jennings. Intelligent agents: Theories and

practice. practice. The Knowledge Engineering ReviewThe Knowledge Engineering Review.].]

– Raccolgono contenuti dal Web da diverse sorgentiRaccolgono contenuti dal Web da diverse sorgenti– Elaborano informazioni Elaborano informazioni – Scambiano i risultati con altri programmiScambiano i risultati con altri programmi

7Martedì, 18 Febbraio 2003 Alain Fergnani

OntologieOntologie ““An ontology is an explicit specification of a An ontology is an explicit specification of a

conceptualization.”conceptualization.” [[Tom Gruber]Tom Gruber]

Idea di fondo delle ontologie:Idea di fondo delle ontologie:– descrizione di un particolare dominio,descrizione di un particolare dominio,– da un certo punto di vista,da un certo punto di vista,– descrizione esplicita,descrizione esplicita,– costruzione di un vocabolario per quel dominio,costruzione di un vocabolario per quel dominio,– un gruppo usa il vocabolario per accordarsi sul un gruppo usa il vocabolario per accordarsi sul

significato dei termini usati,significato dei termini usati,– fondamentale per la comunicazione.fondamentale per la comunicazione.

Il Web SemanticoIl Web Semantico

8Martedì, 18 Febbraio 2003 Alain Fergnani

Dinamica delle OntologieDinamica delle Ontologie Le ontologie evolvono durante il loro ciclo di vita Le ontologie evolvono durante il loro ciclo di vita

a causa di:a causa di:– cambiamenti nel dominiocambiamenti nel dominio– cambiamenti nella concettualizzazione cambiamenti nella concettualizzazione

condivisacondivisa– cambiamenti nell’espressione, specificazionecambiamenti nell’espressione, specificazione– nuovi requisitinuovi requisiti

9Martedì, 18 Febbraio 2003 Alain Fergnani

Strumenti per la gestione delle OntologieStrumenti per la gestione delle Ontologie Strumenti per lo sviluppoStrumenti per lo sviluppo

– OILEdOILEd– OntoEditOntoEdit– Protégé-2000Protégé-2000– WebODEWebODE

Strumenti per l’integrazione Strumenti per l’integrazione e la fusionee la fusione– ChimaeraChimaera– PROMPTPROMPT– ODEMergeODEMerge– FCA-MergeFCA-Merge

OsservazioniOsservazioni– Forniscono soluzioni parzialiForniscono soluzioni parziali– Hanno approcci diversi Hanno approcci diversi – Hanno diverse funzionalitàHanno diverse funzionalità– Hanno differenti capacità di aiutare l’utenteHanno differenti capacità di aiutare l’utente

OsservazioniOsservazioni– Forniscono soluzioni parzialiForniscono soluzioni parziali– Hanno approcci diversi Hanno approcci diversi – Hanno diverse funzionalitàHanno diverse funzionalità– Hanno differenti capacità di aiutare l’utenteHanno differenti capacità di aiutare l’utente

10Martedì, 18 Febbraio 2003 Alain Fergnani

MOMISMOMIS MOMISMOMIS MMediator envirediator envirOOnment for nment for MMultiple ultiple IInformation nformation SSourcesources

è un sistema intelligente per l’integrazione di dati è un sistema intelligente per l’integrazione di dati eterogenei e distribuiti.eterogenei e distribuiti.

Principali caratteristiche:Principali caratteristiche:– ““Approccio semantico” all’integrazioneApproccio semantico” all’integrazione– Common ThesaurusCommon Thesaurus– Global Virtual View (GVV)Global Virtual View (GVV)– Interrogazioni sulla Interrogazioni sulla Global Virtual ViewGlobal Virtual View– Un modello dei dati comune – ODMUn modello dei dati comune – ODMI3I3

– Un linguaggio per descrivere gli schemi delle sorgenti Un linguaggio per descrivere gli schemi delle sorgenti ODLODLI3I3 (Object Definition Language)(Object Definition Language)

http://www.http://www.dbgroupdbgroup..unimounimo.it/.it/MomisMomis

11Martedì, 18 Febbraio 2003 Alain Fergnani

MOMIS – ArchitetturaMOMIS – Architettura

Data level

WrapperWrapper

RelationalSource

RelationalSource

WrapperWrapper

XMLSourceXMLSource

WrapperWrapper

ObjectSource

ObjectSource

WrapperWrapper

genericSource

genericSource

legenda

CORBA Object

User

GUI

Software tools

CORBA interactionUser interaction

WordNetWordNet

Service level

ODB-ToolsODB-ToolsGlobal Schema

METADATA REPOSITORYGlobal Schema

METADATA REPOSITORY

Global Schema Builder

QueryManagerQueryManager

• SLIM WordNet interaction• SIM ODB-Tools validation • ARTEMIS Clustering• TUNIM Map. table tuning

• SLIM WordNet interaction• SIM ODB-Tools validation • ARTEMIS Clustering• TUNIM Map. table tuning

SI-Designer

MOMIS mediator

creates

UserUser

Application

IntegrationDesigner

IntegrationDesigner

USER level

12Martedì, 18 Febbraio 2003 Alain Fergnani

Processo di integrazioneProcesso di integrazione

CommonThesaurusCommon

Thesaurus

CalcoloClusterCalcoloCluster

XML<interface> <name=“student”>

OODB

RDBSchemiSorgenti

ODLI3

GloblalClass3

GloblalClass1

GloblalClass2

Mapping tra Schema Globale/Schemi Locali

Global Virtual View GVVGlobal Virtual View GVVGlobal Virtual View GVVGlobal Virtual View GVV

Common ThesaurusCommon Thesaurus– relazioni intra/inter schemarelazioni intra/inter schema– relazioni lessicalirelazioni lessicali

(annotazione schemi sorgenti)(annotazione schemi sorgenti)

– relazioni inserite dall’utenterelazioni inserite dall’utente– relazioni inferiterelazioni inferite

Tipi di rel.: SYN, NT, BT, RT.Tipi di rel.: SYN, NT, BT, RT.

Es: CS.Course SYN UNI.SectionEs: CS.Course SYN UNI.Section

Common ThesaurusCommon Thesaurus– relazioni intra/inter schemarelazioni intra/inter schema– relazioni lessicalirelazioni lessicali

(annotazione schemi sorgenti)(annotazione schemi sorgenti)

– relazioni inserite dall’utenterelazioni inserite dall’utente– relazioni inferiterelazioni inferite

Tipi di rel.: SYN, NT, BT, RT.Tipi di rel.: SYN, NT, BT, RT.

Es: CS.Course SYN UNI.SectionEs: CS.Course SYN UNI.Section

13Martedì, 18 Febbraio 2003 Alain Fergnani

MOMIS e la dinamicaMOMIS e la dinamica La gestione della dinamica consiste nella La gestione della dinamica consiste nella

capacità di far fronte a:capacità di far fronte a:– inserimento di nuove sorgenti,inserimento di nuove sorgenti,– aggiornamento oaggiornamento o– cancellazione di sorgenti già integrate.cancellazione di sorgenti già integrate.

MOMIS non è in grado di gestire la dinamica.MOMIS non è in grado di gestire la dinamica.

Nella tesi si è affrontato il problema Nella tesi si è affrontato il problema dell’inserimento di nuove sorgenti nel sistema.dell’inserimento di nuove sorgenti nel sistema.

14Martedì, 18 Febbraio 2003 Alain Fergnani

Annotazione della GVVAnnotazione della GVV La GVV deve essere annotata per aumentarne il La GVV deve essere annotata per aumentarne il

potere espressivo. potere espressivo.

La fase di annotazione assegna agli elementi La fase di annotazione assegna agli elementi dello schema globale (classi e attributi) un nome dello schema globale (classi e attributi) un nome e almeno un significato.e almeno un significato.

Sono stati individuati i casi che si possono Sono stati individuati i casi che si possono verificare per rendere il più possibile verificare per rendere il più possibile automatico automatico il processoil processo..

L’annotazione viene eseguita rispetto al DB L’annotazione viene eseguita rispetto al DB lessicale lessicale WordNetWordNet ( (www.cogsci.princeton.edu/~wn/www.cogsci.princeton.edu/~wn/).).

15Martedì, 18 Febbraio 2003 Alain Fergnani

Annotazione della GVVAnnotazione della GVV

UNI.ArticleUNI.Article NTNT CS.PublicationCS.Publication

CS.EssayCS.Essay NTNT CS.PublicationCS.Publication

CS.Essay=<essay, {essay#1}>

CS.Publication=<publication,{publication#2}>

UNI.Article=<article,{article#1}>

CS.Essay=<essay, {essay#1}>

CS.Publication=<publication,{publication#2}>

UNI.Article=<article,{article#1}>

GlobalClass1 = <publication, {essay#1,publication#2, article#1}>GlobalClass1 = <publication, {essay#1,publication#2, article#1}>

essay#1 = an analytic or interpretive literary compositionessay#1 = an analytic or interpretive literary composition publication#2 = a copy of a printed work offered for distributionpublication#2 = a copy of a printed work offered for distribution article#1 = nonfictional prose forming an independent part of a publicationarticle#1 = nonfictional prose forming an independent part of a publication

GlobalClass1 = <publication, {essay#1,publication#2, article#1}>GlobalClass1 = <publication, {essay#1,publication#2, article#1}>

essay#1 = an analytic or interpretive literary compositionessay#1 = an analytic or interpretive literary composition publication#2 = a copy of a printed work offered for distributionpublication#2 = a copy of a printed work offered for distribution article#1 = nonfictional prose forming an independent part of a publicationarticle#1 = nonfictional prose forming an independent part of a publication

La classe globale annotataLa classe globale annotata

GlobalClass1 CS.Essay CS.Publication UNI.Article

GlobalClass1 CS.Essay CS.Publication UNI.Article

La classe globaleLa classe globale

Le classi locali annotateLe classi locali annotate

Le relazioni nel CTLe relazioni nel CT

nomenome

significatisignificati

forma baseforma basesensosenso

16Martedì, 18 Febbraio 2003 Alain Fergnani

Nuovo processo di integrazioneNuovo processo di integrazione

CommonThesaurusCommon

Thesaurus

CalcoloClusterCalcoloCluster

XML

GVVGVVannotataannotata

OODB

RDBSchemiSorgenti

ODLI3

GloblalClass3

GloblalClass1

GloblalClass2

Mapping tra Schema Globale/Schemi Locali

Nuova GVVNuova GVVNuova GVVNuova GVV

Common ThesaurusCommon Thesaurus– relazioni intra/inter schema relazioni intra/inter schema (solo nuove sorgenti)(solo nuove sorgenti)– relazioni lessicali relazioni lessicali (GVV e nuove sorgenti annotate)(GVV e nuove sorgenti annotate)– relazioni inserite dall’utenterelazioni inserite dall’utente– relazioni inferiterelazioni inferite

Common ThesaurusCommon Thesaurus– relazioni intra/inter schema relazioni intra/inter schema (solo nuove sorgenti)(solo nuove sorgenti)– relazioni lessicali relazioni lessicali (GVV e nuove sorgenti annotate)(GVV e nuove sorgenti annotate)– relazioni inserite dall’utenterelazioni inserite dall’utente– relazioni inferiterelazioni inferite

NuovaNuova

NuovaNuova

17Martedì, 18 Febbraio 2003 Alain Fergnani

Vantaggi – SvantaggiVantaggi – Svantaggi VantaggiVantaggi

– Il processo non riparte da scratchIl processo non riparte da scratch– Il processo sfrutta le conoscenze delle precedenti Il processo sfrutta le conoscenze delle precedenti

sessioni di integrazionesessioni di integrazione– Riduzione dei tempi di integrazioneRiduzione dei tempi di integrazione– Riduzione degli effetti collaterali, preservando il più Riduzione degli effetti collaterali, preservando il più

possibile lo schema precedente possibile lo schema precedente – La metodologia di MOMIS viene conservataLa metodologia di MOMIS viene conservata

SvantaggiSvantaggi– La GVV deve essere annotataLa GVV deve essere annotata– Gli errori delle precedenti sessioni si possono propagareGli errori delle precedenti sessioni si possono propagare– Possibile scarsa rappresentatività del dominio integratoPossibile scarsa rappresentatività del dominio integrato– Riduzione dell’espressività dopo diverse sessioni di Riduzione dell’espressività dopo diverse sessioni di

integrazioneintegrazione

18Martedì, 18 Febbraio 2003 Alain Fergnani

ConclusioniConclusioni Difficoltà nell’implementazione del Web SemanticoDifficoltà nell’implementazione del Web Semantico La comunità scientifica non ha adottato una linea La comunità scientifica non ha adottato una linea

comune (linguaggi, strumenti, progetti)comune (linguaggi, strumenti, progetti) Difficoltà nella gestione della dinamica delle ontologieDifficoltà nella gestione della dinamica delle ontologie

Estensione di MOMIS per la gestione dell’inserimento Estensione di MOMIS per la gestione dell’inserimento di nuove sorgentidi nuove sorgenti

Sviluppo del codice per l’estensione del sistemaSviluppo del codice per l’estensione del sistema

Futura estensione della gestione ai casi di modifica e Futura estensione della gestione ai casi di modifica e cancellazione di sorgenti già integratecancellazione di sorgenti già integrate

Integrazione del lavoro svolto nel progetto SEWASIEIntegrazione del lavoro svolto nel progetto SEWASIE

19Martedì, 18 Febbraio 2003 Alain Fergnani

SEWASIESEWASIE SEWASIESEWASIE ( (SSemantic emantic WWebs and ebs and AAgentgentSS in in

IIntegrated ntegrated EEconomies) conomies) è un progetto finanziato dalla è un progetto finanziato dalla

Commissione EuropeaCommissione Europea (Maggio 2002/Aprile 2005).(Maggio 2002/Aprile 2005).

Goal: progettare e implementare un motore di Goal: progettare e implementare un motore di ricerca avanzato basato sulla semantica.ricerca avanzato basato sulla semantica.

I partecipanti:I partecipanti:• Università degli Studi di Modena e Reggio EmiliaUniversità degli Studi di Modena e Reggio Emilia (ITALY) (ITALY)• CNA SERVIZI Modena s.c.a.r.l.CNA SERVIZI Modena s.c.a.r.l. (ITALY) (ITALY)• Università degli Studi di Roma “La Sapienza”Università degli Studi di Roma “La Sapienza” (ITALY) (ITALY)• Rheinisch Westfaelische Technische Hochschule AachenRheinisch Westfaelische Technische Hochschule Aachen ( (GERMANYGERMANY))• Libera UniversitLibera Università di Bolzano (ITALY)à di Bolzano (ITALY)• Thinking Networks AGThinking Networks AG ( (GERMANYGERMANY))• Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung

eingetragener Vereineingetragener Verein ( (GERMANYGERMANY))• IBM Italia SPAIBM Italia SPA (ITALY) (ITALY)

Il sito web: Il sito web: http://www.http://www.sewasiesewasie.org/.org/