1 attivita di ricerca 2009-2010 carlo batini. 2 aree come costruire ed esprimere il contenuto...
TRANSCRIPT
1
Attivita’ di ricerca 2009-2010Carlo Batini
2
Aree
• Come costruire ed esprimere il contenuto informativo integrato di sistemi informativi complessi basati su DBMS Repositories di schemi concettuali e linguaggi ontologici light
• Come far evolvere la architettura dati di una organizzazione? Metodologia e strumenti SMART
• Come pianificare operativamente il progetto di servizi, ed in particolare servizi di eGovernment eGovernment
• Come progettare servizi che abbiano valore per la PA, l’utente, il provider Servizi a valore aggiunto
• Come estendere in concetto di qualita’ dai dati alla informazione? Non approfondito
3
The distribution issue is an example of data architecture and improvement of the
efficiency of a data architecture among a set of data bases
EmployeeEmployee #Salary
ProjectProject #Budget
Assigned-toEmployee #Project #Role Centralized DB
Distributed DB
Distributed DB
4
Il problema della evoluzione della architettura di una base di dati
Source 1
Source 7
Source 3
Source 5Source 4
Source 8
Source 2
Source 6
Come integrarle a livello logico?
Come integrarle a livello dati?
5
Livello logico concettuale
6
Hundreds of schemas
Why integration alone is not enough?
?
7
Schema integration
Goal: reconcile and obtain a common view
Schema 1 Schema 2
Integrated schema
8
Schema abstraction
Goal: Provide a compact view of the reality represented by the schema
Schema
Abstractschema
999
OWL-DLOntologies
ER with generalization
Thesauri Metadata
Terminologies, Vocabularies
Core BusinessData & Knowledge
IntegrationInference
Knowledge to be modeled
LanguageExpressiveness
Overall strategy for the use of the modeling languages
1010
Representing, abstracting and integrating Web schemas in the large
Problems with current approaches• Available languages lack loose integration/abstraction primitives• Light-weight languages such as RDFS cannot represent generic
abstractions between schema concepts (Palmonari & Batini SSWS 2009)
• Rich languages such as OWL-DL are “costly” to be used in the large• Integration Abstraction Primitives
• Understandability & Cost Effectiveness
• Legacy Models Compliance
• Web Compliance
• Semantics & Reasoning
Conceptual Modeling Languages
ER, UML M H - L L
Web Ontologies and Semantic Web Languages
Light (RDFS/DL-Lite) L M L H H
Rich (OWL-DL/Lite) L L H H H
ER/UML to OWL translations from the literature
Light (DL-Lite) L M L H H
Rich (OWL-DL) L L H H H
11
Livello dei dati
12
Tecnologie possibili
1. Integrazione nell’ interrogazione ai dati
a) Application integrationb) Consolidamentoc) Data Warehoused) Data Integration
2. Integrazione degli aggiornamentia) Publish & Subscribeb) Consolidamento
Application Int.
Data Integration
Publish&Subscribe
Consolidamento
Consolidamento.
Data Warehouse
13
DI
13
Consideriamo il seguente caso di basi di dati tutte centralizzate e indipendenti - 1
Source 1
Source 7
Source 3
Source 5Source 4
Source 8
Source 2
Source 6
Application Int.
Data Integration
Consolidamento.
Data Warehouse
PerInterrogazioni
PerAggiornamenti
Publish & Subscribe
Consolidamento.
Mono architettura
P&S
14
Consideriamo il seguente caso di basi di dati tutte centralizzate e indipendenti - 2
Source 1
Source 7
Source 3
Source 5Source 4
Source 8
Source 2
Source 6
Application Int.
Data Integration
Consolidamento.
Data Warehouse
PerInterrogazioni
PerAggioramenti
Publish & Subscribe
Consolidamento.
Piu’architetture
DW
P&S
P&S
DI
1515
Consideriamo il seguente caso di basi di dati tutte centralizzate e indipendenti - 3
Source 1
Source 7
Source 3
Source 5Source 4
Source 8
Source 2
Source 6
Application Int.
Data Integration
Consolidamento.
Data Warehouse
PerInterrogazioni
PerAggioramenti
Publish & Subscribe
Consolidamento.
Mono architettura
1616
Il problema
Source 2
Source 1Anagrafica
Clienti1
Source 3
Source 4
Source n
…..
QualeIntegrazione?
Nuova architettura
AnagraficaClienti2
Venditeretail
VenditeOn line
Altri
Come decidere?
17
Potential information content
Income
declares
Tax payer
Tax payer
Boathas
Sources
Tax payer
Boathas
Income
declares
Tax payer
Global schema
Find CF, Name of Tax Payer thatdeclares <= 30.000 € andhas >= 1 Boat
18
eGovernment
19
The old approach …
Technological
Juridical Economic
Social
Organizational
Technological
Juridical Economic
Organizational
Social
and the eG4M approach
20
The eG4M social & organzational system
Organization
Processes
Information
Technological infrastructures, Data, Applications, HW and Network Technologies
Requests Services
Complementary Organizational Resources
Process layer
Technological Resource layer
Resource layer
Organizational layer
Social system
Public Administrationorganizational
system
21
Libro eG4M