Download - Suchmaschinen vs. OPAC
Suchmaschinen vs. OPAC
Prof. Dr. Dirk Lewandowski [email protected]
Arbeitstagung der Fraunhofer-Bibliotheken 2009 Bremen, 14.10.2009
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Gliederung
2 |
Web search: „Always different, always the same“
http://web.archive.org/web/19961023234631/http://altavista.digital.com/
AltaVista 1996
Universal Search
• x
Universal Search
• x
News results
ads
organic results
organic results (contd.)
image results
video results
Additional databases
5 |
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Gliederung
Herausforderungen für Bibliotheken
• Nutzer verwenden Suchmaschinen zur Suche nach „Bibliotheksinhalten“
• Suchmaschinen „erziehen“ Nutzer zu „schlechtem“ Rechercheverhalten.
• Suchmaschinen zielen auf Kernbereiche der Bibliotheken – Buchsuche – Wissenschaftliche Inhalte
„Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“
• Suchanfragen – Durchschnittliche Länge: 1,7 Wörter – Ca. 50% Einwort-Anfragen – kaum Verwendung von Operatoren und erweiterter Suche
• Ergebnisseiten – 80% der Nutzer gehen nicht über die erste Ergebnisseite hinaus. – Nutzer betrachten bevorzugt die ersten Ergebnisse (“über dem Knick”). – Pro Session werden bis etwa fünf Dokumente angesehen. – Sessions dauern i.d.R. weniger als 15 Minuten.
• Nutzer sind meist mit ihren Suchergebnissen zufrieden.
• Nutzer erwarten, dass alle Systeme so leicht zu bedienen sind wie Google.
(Machill et al. 2003)
9 |
Selektionsverhalten (Top11 Treffer)
(Granka et al. 2004)
10 |
„Most people are looking for quick wins.“
• Beispiele aus der wissenschaftlichen Suche • Nutzer kommen über Suchmaschinen, schauen herum und nehmen das mit, was
sie brauchen können. • Es wird eine Vielzahl von Quellen benutzt. • Die Hälfte der Nutzer betrachtet nur 1-3 Seiten. • 40% der Nutzer kommen innerhalb von sechs Monaten nicht mehr auf die Website
zurück. • Nutzer sehen sich Artikel online nur ein paar Minuten lang an, vor allem kurze
Artikel werden gelesen. • Nutzer sammeln zwar Artikel (als Ausdrucke oder Downloads), lesen sie dann aber nicht.
Was wäre, wenn Ihre Nutzer auch so suchen?
(Nicholas 2008)
(Nicholas 2008)
Wissenschaftliche Inhalte
• Recherche kostenlos - Inhalte kostenlos – Forschungsportal – Alle Open-Access-Suchmaschinen
• Recherche kostenlos - Inhalte kostenlos/kostenpflichtig – Google Scholar – Scirus
• Zugang zur Recherche kostenpflichtig – Thomson Scientific Web Plus
Google ist in der Lage, wissenschaftliche Inhalte in die reguläre Websuche einzubinden.
Google Scholar: Inhalte
Inhalte von Google Scholar
• Wissenschaftliche Literatur aus dem Web – Zeitschriftenaufsätze (peer review), Konferenzbeiträge – Bücher – Preprints, Postprints – Reports – Seminararbeiten – ...
• Quellen – freies Web – Verlage und Fachgesellschaften (Crawling; keine Feeds!) – Open-Access-Archive und -Zeitschriften – Kein Quellenverzeichnis; Umfang der Quellen unklar
Bücher
• Microsoft hat sein Engagement in der Buchsuche eingestellt.
• Google Book Search könnte durch die Einigung mit (US-)Verlegern/Autoren zum wichtigsten Anbieter von E-Books werden.
• Direkter Verkauf und Lizenzierung (z.B. an Bibliotheken).
• Die Buchsuche wird in die regulären Trefferlisten eingebunden.
Bücher
Fazit Teil 1
Nutzer suchen heute schon mit unterschiedlichen Werkzeugen • Universalsuchmaschinen • Spezialsuchmaschinen • Social Bookmarking / Empfehlungssysteme • Spezialdatenbanken • OPACs
OPACs müssen ihren Platz finden zwischen den anderen Diensten
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Gliederung
Welche Bedeutung hat heute eigentlich ein lokaler Bestand?
• OPAC verfolgt das Konzept des lokalen Bestandsnachweises.
Sucheinstieg „von oben“ vs. „von unten“ • Erst alle Literatur zum Thema recherchieren, dann ggf. nach Verfügbarkeit
auswählen? • Wann ist eigentlich eine Recherche nur im lokalen Bestand nötig? Irgendein Werk zum Thema (--> Überblick) Known Item
• Für welche Art von Suche ist der OPAC heute eigentlich geeignet?
Google Scholar
WorldCat
Wo liegen eigentlich die Stärken der OPACs?
OPAC Suchmaschine
Einfache Suche schwach, da Anordnung der Treffer nach Datum
stark, da gutes Ranking
Erweiterte Suche Guter Funktionsumfang Geringer Funktionsumfang, fehlerhafte Funktionen (!)
Trefferanordnung / Ranking
schlecht, da nur Anordnung nach Datum
gut, da durchdachtes Ranking und Durchmischung der Trefferlisten
Trefferpräsentation wenig flexibel durch Autor/Titel/Jahr
Trefferbeschreibung mit statischen und kontextabhängigen Elementen
Datenbestand nur ein Teilbestand des Bibliotheksangebots
Einbindung aller von der SM aufgebauterer Kolllektionen
Metadaten Mit hohem Aufwand erstellte Qualitätsdaten
Kaum Ausnutzung von Metadaten; keine eigene Erstellung
Wo liegen eigentlich die Stärken der OPACs?
OPAC Suchmaschine
Einfache Suche schwach, da Anordnung der Treffer nach Datum
stark, da gutes Ranking
Erweiterte Suche Guter Funktionsumfang Geringer Funktionsumfang, fehlerhafte Funktionen (!)
Trefferanordnung / Ranking
schlecht, da nur Anordnung nach Datum
gut, da durchdachtes Ranking und Durchmischung der Trefferlisten
Trefferpräsentation wenig flexibel durch Autor/Titel/Jahr
Trefferbeschreibung mit statischen und kontextabhängigen Elementen
Datenbestand nur ein Teilbestand des Bibliotheksangebots
Einbindung aller von der SM aufgebauterer Kolllektionen
Metadaten Mit hohem Aufwand erstellte Qualitätsdaten
Kaum Ausnutzung von Metadaten; keine eigene Erstellung
Probleme der OPACs
• Unvollständiger Datenbestand – Aufsätze, Literaturdatenbanken fehlen (weitgehend)
• “Elektronischer Zettelkatalog”?
• Das Nutzerverhalten hat sich geändert – Kurze Suchanfragen, schnelle Ergebnisse, ein Ergebnisset – Nutzererwartungen werden stark von den Web-Suchmaschinen beeinflusst.
• Known-Item-Suche vs. thematische Suche – OPACs müssen mit beidem klarkommen.
23 |
Fazit Teil 2
• OPAC als „echtes Rechercheinstrument“ erscheint nicht mehr zeitgemäß.
• Der Ansatz „erst Suche, dann lokale Beschränkung“ erscheint vielversprechender.
• Heutige OPACs setzten auf einen überholten Ansatz (Profirecherche).
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Gliederung
Wie der OPAC verbessert werden soll (“Katalog 2.0”)
• Nutzerpartizipation – Rezensionen – Bewertungen
• Anreicherung der bibliographischen Daten – Rezensionen – Inhaltsverzeichnisse
• Verbesserung der Navigation – Auswahlmenüs auf den Trefferseiten (Kombination von Suche und Browsing)
• Erweiterung der Datenbasis – Federated search
Kern aller Suchanwendungen: Relevanzranking
• Web 2.0 Anwendungen verbessern den Katalog, berühren aber den Kern (die Suche) nur am Rand.
• “Search must work”
• Nutzererwartungen – Schneller Weg zu den Ergebnissen. – Kein allzu großes Nachdenken über die Formulierung der Suchanfrage. – Keine Suche nach der passenden Datenbank vor der Suche. – Nachdem ein paar Ergebnisse auf der ersten Trefferseite angesehen wurden,
wird entschieden, wie/ob die Recherche fortgeführt wird.
Gemischte Trefferlisten
• Ranking-Algorithmen bevorzugen „das immer gleiche“. Nutzer verlangen aber nach einer gewissen Vielfalt in der Trefferliste.
• Beispiel: Allgemeine Anfrage – Nachschlagewerk – Lehrbuch – Einschlägige Datenbank – Aktuelle Literatur – Einschlägige Zeitschriften
28 |
Integration von/in Suchmaschinen
1) Suchmaschine als „zweite Meinung“ zum OPAC • „Probieren Sie Ihre Suche auch bei...“ - Google, Google Scholar, Google
Buchsuche, ... • Basis: Man erkennt, dass Nutzer in mehreren Systemen suchen (müssen). • Bedingung: OPAC liefert initial gute Ergebnisse.
2) Suchmaschinen als „Traffic-Lieferanten“ • Auslesen von OPAC-Treffern bzw. Trefferlisten in HTML • Basis: Man erkennt, dass wissenschaftliche Suche in Suchmaschinen stattfindet. • Bedingung: Suchmaschinen ranken die erstellten Seiten hoch; Konkurrenz nicht allzu
hoch.
29 |
Integration von/in Suchmaschinen
3) Aufbau eigener Wissenschaftssuchmaschinen • Basis: Man erkennt, dass Qualitätsinhalte aus dem Web mit den „eigenen“
Qualitätsinhalten kombiniert werden müssen. • Bedingung: Ranking muss funktionieren, Dienst muss eine echte Alternative
zu den allgemeinen Suchmaschinen sein.
4) Erweiterung des eigenen Systems durch Hinzunahme von Daten aus den Universalsuchmaschinen
• Basis: Man erkennt, dass man nicht alles selbst machen kann. • Ausnutzung der Suchmaschinen-APIs • Bedingung: Geeignete APIs stehen zur Verfügung
Einführung
Welche Rolle spielen Suchmaschinen im wissenschaftlichen Alltag?
Braucht der Wissenschaftler von heute/morgen da noch einen OPAC?
Wie kann die Suchmaschine praktisch in den Bibliotheksalltag integriert werden?
Fazit: Suchmaschinen - Untergang oder Hoffnungsschimmer?
Gliederung
31 |
OPACs waren einmal die Spitzenanwendung des Information Retrieval
- sie sollten es wieder werden.
Vielen Dank für Ihre Aufmerksamkeit.
www.bui.haw-hamburg.de/lewandowski.html
Aktuelles Buch: Handbuch Internet-Suchmaschinen (Akademische Verlagsgesellschaft Aka, 2009)
E-Mail: [email protected]