fesr trinacria grid virtual laboratory adat (archivi digitali antico testo) salvatore scifo trigrid...
TRANSCRIPT
FESR
www.trigrid.it
Trinacria Grid Virtual Laboratory
ADAT (Archivi Digitali Antico Testo)
Salvatore Scifo
TRIGRID
Second TriGrid Checkpoint Meeting
Catania, 30.06.2006
Catania, Trigrid, 30.06.2006
Supporter e Partner responsabili
• I.N.F.N. di Catania:– Salvatore Scifo ([email protected])
Supporter
Partner responsabili
• IR&T Engineering s.r.l.– Vincenzo Milazzo ([email protected])
Catania, Trigrid, 30.06.2006
L’applicazione
• ADAT (Archivi Digitali Antico Testo)
– Rappresenta un Modello di Processo costituito da: Metodologie Tecnologie Procedure Hardware e Software
– Tale modello è orientato alla conservazione del testo reale in se ed alla divulgazione del suo valore intrinseco anche tramite la sua rappresentazione virtuale.
– Ci focalizzeremo su due aspetti del processo: Catalogazione e Archiviazione su storage GRID; Restauro Digitale del Testo.
Restauro/Conservazione
Acquisizione /Restauro Digitale
Catalogazione/Archiviazione
Fruizione in rete
Catania, Trigrid, 30.06.2006
• Capacità di contenere e gestire enormi quantità di dati (ordine di Tera Byte)
• Distribuzione geografica dello storage
• Accessibilità via rete (modello web oriented) delle funzionalità (amministrative, operative, consultative)
• Protezione mediante un meccanismo di sicurezza centralizzato che identifichi chi può accedere alle risorse e con quali diritti, in base alla Organizzazione Virtuale di appartenenza
• Separazione aspetto gestionale e amministrativo dell’archivio digitale dalle problematiche di manutenzione dell’infrastruttura di rete e dello storage system
La problematica scientifica
Catania, Trigrid, 30.06.2006
Analisi del problema
• Analisi, progettazione e realizzazione di una piattaforma SW per l’interfacciamento con i servizi del DMS (Metadata Service e File Access Service)
– La piattaforma software deve permettere di implementare le funzionalità di base di un archivio digitale: Upload di file sullo SE Download di file dallo SE Cancellazione di file dallo SE Gestione Catalogo dei File Gestione delle Repliche Gestione dei Metadati descrittivi, acquisizione, catalogazione,
indicizzazione Gestione della coerenza tra le entry del catalogo (file) e i metadati
ad essi associati Browsing del catalogo dei file Ricerca dei file per metadati
Catania, Trigrid, 30.06.2006
Architettura a livelli del sistema
• L’idea base è realizzare una architettura distribuita e aperta, per garantire l’interoperabilità con i servizi di gestione dei dati e metadati della infrastruttura GRID (DMS – Data Management Services).
GRID FARM(Redundancy, High Availability, Data Backup&Recovery, High Storage Capability, Net Access Security)
GRID Metadata Service GRID File Service
Grid Access Framework
Archive Web Application
Catania, Trigrid, 30.06.2006
Deployment Plan
GRID Storage
AMGA Server
VOMS
Application Server
Metadata Service
Authentication Service
Storage Service LCG File Catalog
File Catalog Service
InternetGRID
Clients
Catania, Trigrid, 30.06.2006
Architettura Software
LFCFile Catalog
AMGAMetadata catalog
GFAL API LFC API AMGA API
GFAL API LFC API AMGA API
Grid DMS
GRID Access Framework Metadata Manager
Archive Application Search Engine
Digital Archive
SRM
Grid Access Framework
Storage Element
VO
MS
AP
I
VOMS/PROXY
Grid Security
VO
MS
AP
I
Catania, Trigrid, 30.06.2006
Scheda Tecnica Porting
• Storage– Storage : 50 GB per libro (circa 1000 immagini di elevata qualità)
• Configurazione Worker Node:– nessuna
• Servizi gLite 3.0– GFAL– LFC– AMGA
• Interazione tra l’applicazione e l’utente– Applicazione interattiva
• Controllo d’accesso:– Numero utenti: 5– Numero gruppi per VO: 1– Politica di accesso: gli utenti del gruppo hanno tutti gli stessi permessi,
accesso all’applicazione e accesso ai file– Crittografia dati: nessuna
Catania, Trigrid, 30.06.2006
Stato attuale del progetto
• Testati casi d’uso AMGA (server remoto)– Browsing directories
– Inserimento entry
– Cancellazione entry
• Testati casi d’uso GFAL (sulla UI)– Upload file sullo SE
– Download file dallo SE
– Rimozione file dallo SE
• Testati casi d’uso LFC (sulla UI)– Browsing catalogo
– Creazione entry nel catalogo
– Consultazione entry
Catania, Trigrid, 30.06.2006
Attività Future
• Analisi e progettazione architettura archivio
• Analisi e progettazione Grid Access Framework
• Casi d’uso AMGA (server remoto)– Creazione metadata schema
– Inserimento metadati
– Ricerca sui metadati
• Casi d’uso LFC (sulla UI)– Modifica entry
– Creazione repliche
– Consultazione repliche
– Rimozione repliche
Catania, Trigrid, 30.06.2006
Problematiche Porting
• Integrazione VOMS e/o Proxy Server
• Sviluppo web service (wrapper) per GFAL API (accesso da remoto)
• Svilupp web service per LFG Utils API (accesso da remoto)