nestor workshop im rahmen der ges 2007 digitale langzeitarchivierung und grid: gemeinsam sind wir...

16
nestor Workshop im Rahmen der GES 2007 “Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker?” “Synergiepotentiale zwischen GRID- und eScience- Technologien für die Langzeitarchivierung” Prof. Dr. W. Schiffmann FernUniversität Hagen Baden-Baden, 2. Mai 2007

Upload: liesl-bolding

Post on 05-Apr-2015

106 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

nestor Workshop im Rahmen der GES 2007“Digitale Langzeitarchivierung und Grid:

Gemeinsam sind wir stärker?”

“Synergiepotentiale zwischen GRID- und eScience-Technologien für die

Langzeitarchivierung”

Prof. Dr. W. SchiffmannFernUniversität Hagen

Baden-Baden, 2. Mai 2007

Page 2: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Ziele

Langzeitarchivierung (LZA) bedeutet: Digitale Information (Daten, Texte,

Multimedia, Software) langfristig speichern, wiederfinden und für die menschlichen Sinne

zugänglich machen.

Im Rahmen der Expertise sollen Ansatzpunkte für die Nutzung von Synergien zwischen existierenden F&E-Aktivitäten identifiziert, technische Integrationsmodelle abgeleitet und mögliche Kooperationsinfrastrukturen aufbereitet werden.

Page 3: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Vorgehen

Phasen:-Potentialanalyse-Varianten für zukünftige Integration-Organisatorische Kooperationsinfrastrukturen

Page 4: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Grid-Ressourcen

Der Zugriff auf die GRID-Ressourcen erfolgt über standardisierte Dienste (grid services), die mittels einer Middleware bereitgestellt werden.Im Wesentlichen können Compute- und Data-Grids unterschieden werden.Wichtige Funktionalitäten:• Workflows und Scheduling• RMS mit Advance Reservation• Service Level Agreements (SLA)

Page 5: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

eScience-Szenarien

1. Experimente oder Simulationen erzeugen Rohdaten2. Kollaborative Interpretation von Ergebnissen 3. Wissen organisieren und vernetzen4. Prozesse und Kontexte verwalten5. Große Datenmengen visualisieren6. ....

Page 6: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Architektur/Schichtenmodell

Verteilte Computersysteme

Grid

Grid-Middleware

eScience LZA

Page 7: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Prozessmodell

Page 8: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

LZA-Referenzmodell

OAIS-Referenzmodell (Open Archival Information System) klärt grundlegende Begriffe der Archivierung:

• Informationsmodell: Daten und deren Interpretation

• Prozessmodell: Erzeuger, Verbraucher, Management (DSEP=Deposit System for Electronic Publications)

Page 9: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

LZA-Kernprobleme

• Persistente Speicherung der Bitfolgen

• Charakterisierung der gespeicherten Inhalte

•Wiedergabe der digital codierten Information

Page 10: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

1. Persistente Speicherung der Bitfolgen

Wahl der Codierung: Verhältnis Dokumentinhalt : Dokumentbeschreibung• binäre vs. textuelle Formate (z.B. pdf vs. XML)• Lesbarkeit vs. Overhead• Auffrischung in regelmäßigen Abständen

Synergiepotentiale: • Data-GRID-Dienste können eingesetzt werden, um die Daten verteilt zu speichern. • Durch Repliken erreicht man Redundanz/Fehlertoleranz.

Page 11: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

2. Charakterisierung der gespeicherten Inhalte

Charakterisierung mit Hilfe von Metadaten = Daten über DatenSemantische Beschreibung unterstützt den Suchprozess• eingebettetes vs. externes Markup • manuelle vs. maschinelle Erstellung• URI (Uniform Resource Identifier): URN+URL (PURL, Resolutionsdienste)

Synergiepotentiale:•eScience kann Ontologien bereitstellen, die den manuellen Annotationsprozess unterstützen•Compute-GRIDs erlauben rechenintensive Operationen wie Datamining

Page 12: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

3. Wiedergabe der digital codierten Information

Bei Wechsel der Hardware-/Software-Plattform ist entweder Migration der gespeicherten Inhalte oder Emulation der alten Plattform notwendig. Migration: Authentizität ist eventuell gefährdet – Aktuelle Plattformen optimal nutzbarEmulation: Erheblicher Aufwand zur Bereitstellung sämtlicher „antiquierter“ Plattformen – Originale werden gespeichert.

Synergiepotentiale: • Migration bedeutet hohen Rechenaufwand zur Transformation großer Datenbestände. Hier bieten sich Compute-GRIDs an.• Emulation mit Hochleistungsrechnern des GRIDs. Remote Desktops bieten Zugang zu virtuellen „Lesesälen“

Page 13: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Analyse existierender F&E-Projekte

• Prioritäten– National (22)– Europa (63)– Weltweit (8)

• Kategorien– Grid– LZA– eScience– Grid & eScience

eScienceGrid

LZA

Synergiepotentiale

Page 14: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien
Page 15: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Zusammenfassung

• Kernprobleme der LZA• Architektur/Schichtenmodell• Prozessmodell• Synergiepotentiale identifiziert

• DataGrid – Dienste zur Speicherung• ComputeGrid – Dienste

• Migration• Metadaten • Abspielumgebungen

Page 16: Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien

Vielen Dank für Ihre Aufmerksamkeit.

Univ.-Prof. Dr.-Ing. Wolfram Schiffmann

Fernuniversität HagenFakultät für Mathematik und InformatikLehrgebiet RechnerarchitekturUniversitätsstrasse 1D-58087 Hagen

email: [email protected]: +49-2231-987-325Telefax: +49-2331-987-332