Vernetzung von verteiltenInformationssystemen
Michael HohlfeldMichael Hohlfeld
Institute for Science Networking Oldenburg Institute for Science Networking Oldenburg GmbHGmbH
an der C.V.O. Universität Oldenburgan der C.V.O. Universität Oldenburg
<[email protected]><[email protected]>
Iuk Tagung in Ulm, 10. bis 13. März 2002
Übersicht
Verteilte Informationssyteme
PhysNet-Aktivitäten– Das Projekt SINN– OAD: Open Archives Distributed– Ergebnisse aus CARMEN
Ein kleiner Ausblick ...
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Verteilte Informationssysteme Warum verteilte Informationssysteme?
– riesige Informationsmenge im WWW– Suchmaschinen nicht wissenschaftsspezifisch– zentrale Systeme benötigen große Rechenleistung
– Verteilte Dienste nutzen relevante
(fachspezifische) Webserver als verteilte Datenbank
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Vorteile verteilter Systeme
durch die Beschränkung des Daten-raumes sind Relevanz und Qualität sichergestellt
Inhalte verbleiben auf den Servern der Erzeuger, diese behalten so die Kontrolle
beliebig skalierbar
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Anforderungen an verteilte Systeme
Zugriff auf heterogene Datenräume
Vernetzung verschiedener fachspezifischer Informationsdienste
Stabilität und Schnelligkeit
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Das Projekt SINN
SINN: Suchmaschinennetzwerk im Internationalen
Naturwissenschaftlichen Netz
Aufbau eines weltweiten Spiegel-Systems von PhysNet
Vernetzung von global verteilten Harvest-Brokern und -Gatherern
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Aufgaben in SINN
Aufbau des Suchmaschinenetzwerkes mittels der Harvest-Replicator Technik
Entwicklung einer Sprache zum Anfragen-austausch (basierend auf XML-Query)
Kommunikation zwischen den Such-maschinen mittels eines XML-Protokolls
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
PhysNet Spiegel weltweit
weltweit neun Spiegel des PhysNet-Dienstes (HTML-Seiten)– in der Schweiz (EPS), den USA, England, Russland,
Frankreich, Indien, Niederlande, Deutschland
weitere Spiegel sind in Vorbereitung
dienen als Vorläufer des späteren Suchmaschinennetzwerkes
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Stand der Dinge
Einarbeitung in die interne Diskussion der W3C Arbeitsgruppe XML-Query– aktive Mitarbeit geplant– noch kein stabiler Standard
internationaler technischer Workshop im Dezember 2001– Erfahrungsaustausch und intensive Diskussionen
mit den internationalen Partnern von SINN/PhysNet
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Ergebnisse des Workshops
Verbesserung der Spiegelsoftware Netz-Topologie vorerst zu vernachlässigen regionale Gatherer und unabhängige Broker Synchronisation der Gatherer und Broker Austausch von Konfigurationsdateien bei Ausfall eines Brokers: Liste mit
Verweisen zu den alternativen Brokern der anderen Standorte
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
SINN 2002
Optimierung der Harvest-Suchmaschinen– Einbau eines Rankings– Programmierung eines Harvest-Moduls für die
Kommunikation zwischen den Brokern– Entwicklung eines XML-basierten Query- und
Anwserprotokolles und Programmierung eines Harvest-Moduls, welches XML-Qurey versteht
Planung und Durchführung einer weiteren internationalen Tagung
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Informationen zu SINN
SINN ist ein Vorhaben in Rahmen des DFN-Projektes „Einsatz von Netzdiensten im wissenschaftlichen Informationswesen“
Mittel des bmb+f und des Landes Niedersachsen
www.isn-oldenburg.de/projects/SINN
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Das Projekt OAD
Open Archives: Distributed services for physicists and graduate students
DFG/NSF Projekt, gemeinsam mit Virginia Tech
Zugriff auf verteilte Daten + Dokumente
als Austauschprotokoll das OAi-Protokoll
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
PhysDoc als Data-Provider
stellt als Data-Provider Daten OAi-konform zur Verfügung– Harvest-Gatherer sammelt – Daten werden offline konvertiert und in einem
Metadatencontainer (SQL-DB) gespeichert– Normalisierung der Daten– einfache Qualitätsfunktion
– OAi-konforme Ausgabe (XML on-the-fly)– beliebige Ausgabeformate möglich und für
andere Austauschprotokolle gewappnet
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
PhysDoc als Service-Provider stellt als Service-Provider eine
Suchfunktion zur Verfügung, welche die frei zugänglichen (und gut strukturierten) Dokumente bzw. Metadaten von PhysDoc Teilen des arXiv Eprint Archives und von IOPP
umfasst.
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Das Projekt CARMEN
Content Analysis, Retrieval and MetaData: Effective Networking
Sonderfördermaßnahme im Rahmen von Global-Info mit Mitteln des bmb+f
Weiterentwicklung der Inhaltserschließung durch neue Verfahrenstechniken mit starker Verbindung zum Retrieval
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Arbeitsbereiche in CARMEN (Weiter-)Entwicklung von Werkzeugen zur Erzeugung
von Metadaten mit Dokumentenupload
Methoden der Authentifizierung und der dauerhaften Adressierung (digitale Signaturen und Persistent Identifier)
Konkordanzen von Klassifikationen und Thesauri
Entwicklung von umfassenden Retrievalkomponenten– Retrieval auf Metadaten, Datensätzen mit XML-Struktur– Suchfunktionen für verschiedene Datentypen, Klassifikationen– automatische Klassifikation, ...
Fachübergreifende Informationssysteme
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Ergebnisse aus CARMEN
Verknüpfung der Dokumentendienste PhysDoc und MPRESS in AP9
Crosskonkordanzen zwischen PACS und MSC Klassifikationen
Entwicklung einer gemeinsamen Suchoberfläche für PhysDoc und MPRESS
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Neues PhysDoc Suchinterface findet Anwendung in PhysDoc zusätzlich Anbindung an das OAi-
Protokoll verschiedene Suchmöglichkeiten:
– Quick-Search über gesamten PhysDoc-Datenbestand– Strukturierte Suche über den gesamten Bestand von
PhysDoc und MPRESS– Strukturierte Suche über die mit Metadaten
versehenden Teile von PhysDoc, arXiv und IOPP
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Zum Schluss ein kleiner Ausblick ...
Iuk Tagung in Ulm, 10. bis 13. März 2002Vernetzung von verteilten Informationssystemen
Vortrag Online:
<www.isn-oldenburg.de/talks/ulm_maerz02/>
Weitere Informationen:
Institute for Science Networking <www.isn-oldenburg.de>
Projekt SINN<www.isn-oldenburg.de/projects/SINN>
Projekt CARMEN <www.mathematik.uni-osnabrueck.de/projects/CARMEN>
Projekt Open Archives distributed (OAD)<www.isn-oldenburg.de/projects/OAD>
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen
Vielen Dank für Ihre Aufmerksamkeit !
Iuk Tagung in Ulm, 10. bis 13. März 2002
Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen