outline eindrapportage worldcat pilot

25
Bibliotheek van de Universiteit van Amsterdam Singel 425 Sector Acquisitie & Metadatadiensten 1012 WP Amsterdam Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC) Eindrapportage, versie 1.0, 18 augustus 2011 Martine van den Burg & Marianne Klerx

Upload: doanmien

Post on 11-Jan-2017

227 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: OUTLINE Eindrapportage WorldCat Pilot

Bibliotheek van de Universiteit van Amsterdam Singel 425 Sector Acquisitie & Metadatadiensten 1012 WP Amsterdam

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

Eindrapportage, versie 1.0, 18 augustus 2011

Martine van den Burg & Marianne Klerx

Page 2: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

2

Inhoud

1. Inleiding ................................................................................................................................ 3 1.1. Uitgangspunten ..................................................................................................... 3 1.2. Doelstelling pilot ................................................................................................... 4 1.3. Uitsluitingen .......................................................................................................... 4 1.4. Uitvoering .............................................................................................................. 5 1.5. Leeswijzer .............................................................................................................. 5

2. Aanpak.................................................................................................................................. 5 2.1. Uitgangssituatie..................................................................................................... 5 2.2. Randvoorwaarden pilot......................................................................................... 7 2.3. Projectteam en werkwijze..................................................................................... 8 2.4. Tussentijds gemaakte keuzes ................................................................................ 9

3. Resultaten .......................................................................................................................... 10 3.1. Catalogiseren in WorldCat .................................................................................. 10 3.2. Scenario's ............................................................................................................ 15 3.3. Workflows ........................................................................................................... 17 3.4. Beleidsbeslissingen.............................................................................................. 20 3.5. To do list voor implementatie ............................................................................. 21 3.6. OCLC enhancement issues .................................................................................. 23

4. Conclusies & aanbevelingen .............................................................................................. 24 4.1. Conclusies ............................................................................................................ 24 4.2. Aanbevelingen..................................................................................................... 25

Page 3: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

3

1. Inleiding

1.1. Uitgangspunten

Beleid catalogisering De Universiteitsbibliotheek Amsterdam (UBA) is de grootste wetenschappelijke bibliotheek van Nederland met een collectie van ruim 4,5 miljoen items. Eind 2007 nam de UBA landelijk het initiatief voor een overgang naar internationale metadatastandaarden en sinds medio 2009 werkt zij zelf volgens deze standaarden en maakt ze waar mogelijk gebruik van de 'best practices' van andere instellingen. In dat jaar werd namelijk gekozen voor resp. MARC21 als beschrijvingsformaat en de Anglo‐American Cataloguing Rules (AACR2) als content standaard voor de catalogisering. Hoewel deze laatste standaard het gebruik van Library of Congress Authority Files voorschrijft, wordt echter voor auteursnamen en onderwerpen op dit moment nog altijd een bijdrage geleverd aan het Nederlandse thesaurusbeheer in het GGC. De sector Acquisitie & Metadatadiensten (A&M) is binnen de UBA verantwoordelijk voor de ontsluiting van alle wetenschappelijke publicaties. Daarnaast draagt de sector zorg voor de bibliografische ontsluiting van de erfgoedcollecties. Het materiaal wordt veelal nog met het object in de hand gecatalogiseerd. Op deze wijze zijn in 2010 ruim 32.700 fysieke en 1.370 digitale objecten in het lokale bibliotheek systeem Aleph beschreven. Daarnaast zijn resp. 465 proefschriften en 5.684 wetenschappelijke publicaties ingevoerd in de UvA Repositories DARE en Metis. De Nederlandse Thesaurus Auteursnamen (NTA) is met 4.326 nieuwe naamsingangen verrijkt, terwijl 139 nieuwe descriptoren aan de thesaurus van de Gemeenschappelijke Onderwerpsontsluiting (GOO) zijn toegevoegd.

Voorgenomen verbetering workflow De sector A&M streeft er bij voortduring naar de workflows voor het bestellen en catalogiseren van het (papieren) materiaal efficiënter en effectiever te maken. Door titel‐ en onderwerpsgegevens tegelijk met het 'shelf ready' boek of tijdschrift aan te schaffen bij de leverancier, komt het materiaal sneller beschikbaar voor de klant. Door daarnaast ook toegang tot content in de vorm van abstracts en inhoudsopgaven in te kopen, hopen we beter aan de verwachtingen van onze klanten te voldoen. Met de inkoop van informatie die elders reeds voorhanden is, willen we bovendien capaciteit vrij maken voor andere activiteiten. Het toenemende belang, bijvoorbeeld, van e‐book management of de achterstanden in de ontsluiting van de erfgoedcollecties, nopen ons de focus waar mogelijk te verleggen. Ten slotte dwingt ook de aanstaande pensionering van een aantal zeer ervaren medewerkers ons tot een herbezinning op onze werkprocessen.

Verwachte baten deelname WorldCat Voorwaarde voor de realisatie van deze plannen is volledige participatie in WorldCat als ‘AACR2‐bibliotheek’. Doorgifte van onze titels via het GGC naar

Page 4: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

4

WorldCat vergroot weliswaar de zichtbaarheid van onze collecties, maar daarmee worden lang niet alle mogelijkheden benut. Door rechtstreeks te catalogiseren in WorldCat profiteren we immers direct van het werk dat door andere ‘AACR2‐deelnemers’ (zowel bibliotheken als leveranciers) wordt verricht. Ontlenen aan WorldCat verzekert ons van records die voldoen aan de MARC21/AACR2‐standaarden en die voorzien zijn van relevante onderwerpsgegevens. Maar de echte winst valt te behalen met behulp van de vele additionele diensten voor onder andere pakketverwerking die OCLC, al dan niet in samenwerking met verschillende leveranciers, te bieden heeft. Een niet te onderschatten rol is daarbij weggelegd voor het OCLC‐nummer, dat naast ISBN en ISSN steeds vaker dienst doet als identifier. WorldCat Collection Sets, WorldCat Selection, WorldCat Cataloging Partners, 'shelf‐ready book delivery', 'patron‐driven‐ acquisition' en het uitbesteden van de thesaurering zijn slechts een paar voorbeelden van diensten die ons kunnen helpen onze doelen te realiseren. Argumenten genoeg dus om directe participatie in WorldCat nader te onderzoeken. Eind 2010 is dan ook besloten, na een tweedaagse workshop in Amsterdam, een pilot Rechtstreeks catalogiseren in WorlCat te organiseren.

1.2. Doelstelling pilot

Haalbaarheidsonderzoek Doel van de pilot was te onderzoeken of direct catalogiseren in WorldCat haalbaar is. Inzet was volledige participatie als AACR2‐bibliotheek met daarnaast aandacht voor een Nederlandse bijdrage in enigerlei vorm.

Volledige participatie als AACR2‐bibliotheek Deelname als AACR2‐bibliotheek veronderstelt de vervaardiging van AACR2‐ titelbeschrijvingen, met naamsingangen volgens de Library of Congress Name Authority File (LCNAF) en ingangen op onderwerp volgens de Library of Congress Subject Headings (LCSH).

Nederlandse bijdrage in WorldCat Een Nederlandse bijdrage veronderstelt het gebruik van Nederlands als catalogiseertaal en het beheer en gebruik van de Nederlandse thesauri uit het GGC, zoals de Nederlandse Thesaurus Auteursnamen (NTA), Gemeenschappelijke Onderwerpsontsluiting (GOO) en de Nederlandse Basisclassificatie (NBC).

Koppeling lokaal bibliotheek systeem (Aleph) Op voorhand was duidelijk dat de test pas geslaagd genoemd kon worden, indien er ook voldoende mogelijkheden voorhanden waren om records heen en weer te sturen tussen WorldCat en Aleph. Onderzoek naar de verschillende opties om records in beide systemen up‐to‐date te houden (via item‐ dan wel batchgewijze downloads) was dan ook een belangrijk onderdeel van de test.

1.3. Uitsluitingen

Page 5: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

5

De focus was geheel gericht op de bestaande werkzaamheden bij de UB Amsterdam. Een inventarisatie van aanvullende diensten maakte geen deel uit van de pilot. Extra functionaliteiten en diensten zoals WorldCat Cataloging Partners, WorldCat Collection Sets, WorldCat Selection of Resource Sharing zijn niet onderzocht. Hoewel WorldCat juist ruime mogelijkheden biedt voor de gestandaardiseerde ontsluiting van erfgoedmaterialen, zijn deze vanwege de aparte workflow rond de aanschaf en ontsluiting nog niet meegenomen in dit project. Hetzelfde geldt voor de dissertaties aangezien OCLC de repository in de toekomst rechtstreeks zal harvesten. Ook de Hogeschool van Amsterdam (HvA), met een specifieke doelgroep en een specifiek lokaal ontsluitingssysteem is vooralsnog buiten beschouwing gelaten. Gekeken is vooral naar de technische haalbaarheid en de directe voordelen. Besprekingen over de licentie (kosten, re‐use policy etc.) zullen te zijner tijd voorafgaan aan een implementatietraject.

1.4. Uitvoering

Het onderzoek vond plaats tussen 18 maart en 15 juni 2011 in de UB Amsterdam en werd uitgevoerd in samenwerking met OCLC Dublin, Ohio en OCLC Leiden.

1.5. Leeswijzer

In dit rapport worden achtereenvolgens de aanpak (H2), de resultaten (H3) en de conclusies & aanbevelingen (H4) beschreven.

Hoofdstuk 2 begint met de beschrijving van enkele zaken die onze strategie mede bepaald hebben, zoals incompatibiliteitsproblemen tussen MARC21 en Pica+. Met de start van de pilot bleek dat niet aan alle randvoorwaarden kon worden voldaan. In paragraaf 2.2 is aangegeven welke gevolgen dit heeft gehad voor de uitvoering van de tests. Na een korte beschrijving van het projectteam en de gevolgde werkwijze (2.3) volgt dan nog een verantwoording van de tussentijds gemaakte keuzes die van invloed zijn geweest op het eindresultaat (2.4).

Hoofdstuk 3 start met een beknopte beschrijving van de functionaliteiten voor zover die van belang zijn voor een begrip van de scenario's en workflows. In paragraaf 3.2 en 3.3. volgen dan de geteste scenario's en de uitgewerkte workflows zelf. Als laatste volgen de overzichten van te nemen beleidsbeslissingen (3.4), noodzakelijke acties voor implementatie van de nieuwe workflows (3.5) en een lijst met 'enhancement issues' voor OCLC.

2. Aanpak

2.1. Uitgangssituatie

Page 6: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

6

Omdat hergebruik van informatie en uitwisseling van titelgevens met andere systemen steeds belangrijker wordt, werkt de UBA sinds medio 2009 met internationale standaarden voor de catalogisering. Het volledige titelbestand is dat jaar met de overgang naar een nieuw lokaal bibliotheek systeem geconverteerd van Pica+/FOBID naar MARC21/AACR2.

Met de conversie bleek dat het Pica+ formaat op onderdelen niet compatibel was met MARC21. Niet alleen zorgde de inbedding van specifieke Pica‐functionaliteit zoals meerdelige publicaties en convoluten voor problemen, ook kwam de regelgeving op onderdelen niet overeen (2‐recordmethode) of ontbrak de juiste content om noodzakelijke velden te kunnen vullen (fixed fields). Het resultaat van de conversie was dan ook een compromis: het Pica/Aleph‐conversieformaat. Om problemen met de uitwisseling van titelgegevens te voorkomen, was een vervolgtraject nodig. De 'Road Map to MARC21' zou tot het gewenste standaardformaat moeten leiden.

In diezelfde periode werkten de collega's van de UB Leiden aan de implementatie van een online update fetch (OUF) van het GGC naar Aleph. Met hen is gekeken of er gezamenlijk toegewerkt kon worden naar een nationale conversietabel Pica+>MARC21 aan de hand van een bestaande Australische mapping, maar daarbij bleek opnieuw dat er concessies aan de MARC21 standaard gedaan zouden moeten worden om de inbedding van specifieke Pica‐functionaliteit als bijvoorbeeld de MP‐ structuur mogelijk te maken. Vervolgens is door A&M besloten om voor de implementatie van het MARC21 formaat niet meer vanuit het Pica+ formaat te werken, maar de standaard zelf als vertrekpunt te nemen.

MARC21 is een specifieke toepassing van ISO 2709 Format for Information Exchange, ook wel kortweg aangeduid met MARC. Anders dan voor MARC, is voor MARC21 ook de inhoud en betekenis van de velden vastgelegd. Een titel die voldoet aan de MARC standaard voldoet dan ook lang niet in alle gevallen aan de MARC21 standaard. De keuze voor MARC21 houdt in dat de UBA zich bij de implementatie niet baseert op varianten waarvan de datastructuur wel gebaseerd is op ISO 2709, maar die qua content niet geheel compatibel zijn met MARC21 (zoals de Duitse MAB2/MARC21 of de Pica/MARC21‐tabellen).

Een vergelijking van de minimale en maximale MARC21‐formaten van de Library of Congress met die van OCLC/WorldCat wees uit dat bij beiden de velddefinities gelijk zijn. OCLC heeft alleen, in tegenstelling tot LOC ook enkele lokale velden uit de 9XX‐ reeks voorgedefinieerd voor specifiek gebruik in WorldCat. Er is slechts een klein verschil als het gaat om het belang dat gehecht wordt aan het gebruik van velden in het maximale formaat. Daar waar de LOC‐regels bepaalde velden als 'optional' bestempelen, zijn de OCLC‐regels met 'mandatory if applicable' iets strikter.

Page 7: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

7

Met de vaststelling van de minimale en maximale formaten voor catalogisering door de UBA, zijn uiteraard ook de first‐, second‐ and third‐level descriptions van de AACR2 meegenomen. Daarnaast zijn ook twee OCLC rapporten uit 2009 en 2010 van betekenis geweest.1 Het besef dat het publiek hele andere verwachtingen heeft van de catalogus, heeft tot een andere prioritering van velden geleid. Herkenbaar was de uitkomst van onderzoek waaruit blijkt dat slechts een kleine subset van alle beschikbare MARC21‐velden veelvuldig gebruikt wordt in WorldCat. (Met de conversie uit Pica was al gebleken dat ons eigen titelbestand in het GGC maar liefst 600 velden omvatte, waarvan het merendeel niet frequent was gebruikt). Deze uitkomst heeft ons gesterkt in de mening om meer te focussen op een kleine set van core velden en het gebruik van lokale velden zo veel mogelijk te vermijden.

Tot op de dag van vandaag worden met de catalogisering titels ontleend aan het GGC. Deze titels moeten vervolgens nog met de hand omgewerkt worden naar MARC21/AACR2. Reden genoeg dus om directe participatie in WorldCat nader te onderzoeken. Op een tweedaagse workshop in Amsterdam in 2010 vertelde Daniel Starr, Associate Chief Librarian van de Metropolitan Museum of Art te New York over zijn ervaringen met WorldCat. Hij liet niet alleen zien hoe efficiënt gebruik te maken van de verschillende uitwisselingsmogelijkheden voor uiteenlopende materiaalsoorten, maar uit zijn verhaal bleek ook duidelijk een hele andere mindset. "Maak WorldCat leidend onder het motto: wat goed is voor een ander, is goed genoeg voor ons."

2.2. Randvoorwaarden pilot

In twee verkennende gesprekken met OCLC Leiden en OCLC Dublin, Ohio in Amsterdam op 20 januari en 3 februari 2011 zijn afspraken gemaakt over de randvoorwaarden voor de test. In de eerste week van de pilot bleek echter dat niet aan alle voorwaarden was voldaan. Enkele issues konden binnen de pilot worden opgelost, maar sommige functionaliteiten konden hierdoor uiteindelijk niet worden getest.

De UBA kreeg de beschikking over vijf 'user accounts' met de benodigde bevoegdheden voor 'full cataloging'. Dat is inclusief de mogelijkheid tot thesaureren, maar exclusief het thesaurusbeheer. Voor toegang tot de 'authority files' in WorldCat zijn namelijk aparte licenties vereist die pas na intensieve training verkregen kunnen worden.

Hoewel de oplevering van een nieuwe versie van de invoermodule ophanden was, is in de pilot alleen getest met versie 2.1. van de Connexion Client. Een training door OCLC in het gebruik van de module maakte geen deel uit van de pilot. De UBA heeft gebruik gemaakt van tutorials en documentatie beschikbaar op de website van

1 OCLC Reports: Online Catalogs: What Users and Librarians Want, 2009; Implications of MARC Tag Usage on Library Metadata Practices, 2010

Page 8: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

8

OCLC Dublin, Ohio en vooralsnog afgezien van een (online) training door één van de officiëel erkende partners van OCLC.

Om NTA, GOO en NBC in WorldCat te kunnen gebruiken, is het noodzakelijk deze thesauri in enigerlei vorm beschikbaar te hebben in de Connexion Client. Aanvankelijk was het idee om de NTA als webservice aan te bieden via OCLC’s Terminology Service, maar de uitvoering hiervan was op korte termijn niet realiseerbaar. Het alternatief, een koppeling vanuit de Connexion Client naar de GGC‐webservice bleek ook niet haalbaar. Thesaurering met behulp van de Nederlande systemen kon dan ook niet worden getest. Tijdens het testen van de invoer van Nederlandse namen en onderwerpen zijn gegevens met de hand uit WinIBW of Aleph geknipt en in WorldCat geplakt. Daarbij deed zich nog een ander probleem voor. De Nederlandse thesauri zijn gebaseerd op 'authority control by reference' (koppeling op basis van de identifier (ID) van het thesaurusrecord), terwijl de Angelsaksische systemen gebruik maken van 'control by value' (koppeling op basis van de term/heading). Het MARC21 formaat voorziet wel in de opslag van het ID van het thesaurusrecord, maar het daartoe gereserveerde subveld is in WorldCat nog nooit in gebruik genomen. Tijdens de pilot was invoer in dat subveld dan ook nog niet mogelijk.

In de eerste week van de pilot bleek dat een cruciaal onderdeel voor het testen van de Aleph‐koppeling ontbrak. Ex Libris heeft onder de naam 'OCLC‐server' een aparte functionaliteit ontwikkeld voor het overhalen van titels uit WorldCat. Het gebruik van deze 'OCLC‐server' bleek echter buiten de bestaande Aleph‐licentie te vallen. Na enkele weken kon bij Ex Libris alsnog een test‐licentie aangeschaft worden.

Tussen het GGC en WorldCat vindt dagelijks een 'consistency check' plaats waarbij het GGC leidend is. Om te voorkomen dat rechtstreeks in WorldCat ingevoerde titels al na een dag weer verwijderd zouden worden, zijn de UvA/HvA‐titels in het GGC in week twee van de pilot uitgesloten van deze routine.

2.3. Projectteam en werkwijze

De projectgroep was samengesteld uit de volgende functionarissen: het sectorhoofd Acquisitie & Metadatadiensten, de coördinator Onderwerpsontsluiting, drie ervaren catalografen, twee metadataspecialisten, één system librarian en het afdelingshoofd Bibliotheek & Informatiesystemen (BIS). OCLC bood ondersteuning door middel van zes WebEx meetings en support via e‐mail, waarbij onze vragen met voorrang behandeld werden.

Gewerkt werd volgens een draaiboek dat was opgesteld aan de hand van de beschikbare tutorials en documentatie op de Amerikaanse OCLC‐website. Plenaire bijeenkomsten werden gebruikt voor het bekijken van de tutorials, het bespreken van de resultaten en de voortgang. De echte tests vonden plaats op de eigen werkplek, evenals het bestuderen van de benodigde documentatie. 'Hands on

Page 9: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

9

sessies' hadden tot doel input te verzamelen voor de rapportages en de WebEx sessies met OCLC.

De bevindingen in de pilot konden daarnaast ondersteund worden met informatie die binnenkwam via verschillende discussielijsten. Gedurende een aantal maanden zijn relevante discussies over workflows en scenario's gevolgd via OCLC‐CAT. En een oproep via de Aleph500‐list leverde nuttige informatie op over de Aleph‐ koppelingen van Duke University en University of California, Santa Barbara.

Vragen werden vastgelegd in een Issue report dat wekelijks werd opgestuurd naar Dublin, Ohio en Leiden. Van de knelpunten werden drie verschillende lijsten gemaakt; nog te nemen besluiten met mogelijke consequenties voor de scenario's en workflows (zie 3.4); nog te regelen praktische zaken voor implementatie' (zie 3.5) en verzoeken aan & verbeterpunten voor OCLC (zie 3.6).

Met het gebruik van de tutorials en documentatie van de OCLC Support website is ook gekeken in hoeverre het materiaal bruikbaar is voor de Nederlandse klant. In een aparte WebEx sessie met OCLC Dublin, Ohio aan het eind van de testperiode zijn de bevindingen gedeeld. OCLC zal de website onder meer uitbreiden met een algemene introductie en een step‐by‐step workflow. De UBA heeft toegezegd het resultaat in het najaar nog eens te bekijken.

2.4. Tussentijds gemaakte keuzes

Tijdens de pilot zijn enkele keuzes gemaakt die bepalend zijn geweest voor het verdere verloop en de uitkomst van de test.

Aanvankelijk lag de nadruk vooral op het verkennen van de werking van de database en de beide applicaties Connexion Client en Connexion Browser. Maar omdat al snel duidelijk werd dat de browser niet voldeed aan onze verwachtingen (omslachtig in het gebruik) en WorldCat bovendien niet het leidende systeem kan zijn voor holding records, is de browser verder niet uitgebreid getest.

Naarmate we meer vertrouwd raakten met de Connexion Client, kwam de nadruk te liggen op het verkennen van de mogelijkheden tot (her‐)gebruik van de metadata in WorldCat. Het ontlenen en invoeren van AACR2‐records was geen enkel probleem, maar het aanpassen van de titels aan de Nederlandse situatie bleek niet mogelijk. De AACR2‐regelgeving sluit namelijk het gebruik van de Nederlandse Thesaurus van Auteursnamen uit. En hybride meertalige records zijn, met uitzondering van het gebruik van verschillende trefwoordsystemen, niet toegestaan in WorldCat.

Uitgaande van directe catalogisering in WorldCat konden 3 scenario's worden uitgewerkt (zie 3.2); 1) participatie als AACR2‐bibliotheek (catalogiseertaal Engels),

Page 10: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

10

2) participatie als AACR2‐bibliotheek met aanvullende Nederlandse trefwoorden (en aanvullende Nederlandse auteursnamen in het lokale bibliotheeksysteem) 3) Nederlandse deelnemer in WorldCat (catalogiseertaal Nederlands).

In een plenaire sessie waaraan ook de afdelingshoofden 'metadadata' en 'acquisitie' deelnamen, zijn de verschillende opties besproken. Bepalend voor de uitkomst was de constatering dat alle aanpassingen aan een AACR2‐titel ons toch verder af brachten van ons oorspronkelijke doel: AACR2‐compliancy als voorwaarde voor maximale record‐ontlening en afname van additionele diensten. Het is immers niet realistisch te verwachten dat de grote internationale leveranciers hun producten en diensten aan zullen passen aan de kleine Nederlandse markt. Op het punt van het gebruik van de Nederlandse thesauri spitste de discussie zich toe op de vraag of het nog wel noodzakelijk is om ingangen in verschillende talen op te nemen in één catalogusrecord. Voor dit probleem zijn praktischer oplossingen voorhanden. De Virtual International Authority File (VIAF) en WorldCat Identities zijn mooie voorbeelden van diensten waar de koppeling tussen verschillende termen gemaakt wordt in het front end systeem. Omdat er binnen het projectteam consensus bleek te bestaan over het gebruik van het eerste scenario, werd besloten de workflows en de 'to do list' alleen voor dat scenario verder uit te werken.

3. Resultaten

3.1. Catalogiseren in WorldCat

Hieronder volgt een beknopte beschrijving van de geteste functionaliteiten. Een volledige functionele specificatie is niet beoogd. Doel is slechts die functies te beschrijven die nodig zijn voor een beter begrip van gemaakte keuzes.

WorldCat is de grootste bibliografische database in de wereld. Om deel te kunnen nemen aan WorldCat is het noodzakelijk een library profile aan te maken via het web. Dit profile voorziet o.m. in een instellingscode die noodzakelijk is om het eigen bezit te markeren in WorldCat.

OCLC Dublin gaat uit van twee gescheiden workflows voor het beheren van titelgegevens enerzijds en de 'local holdings maintenance' anderzijds en heeft daartoe twee verschillende applicaties ontwikkeld. De Connexion Client is een Windows‐based interface voor het invoeren en muteren van titelgegevens. De Connexion Browser is een Web browser‐based interface voor het invoeren en muteren van titel‐ en holdinggegevens. De browser heeft minder functies dan de Connexion Client en wordt vooral gebruikt voor het maken van 'detailed holdings' in het kader van 'resource sharing' (IBL).

Gevolg hiervan is dat, anders dan in het GGC, WorldCat op dit moment nog hoofdzakelijk is ingericht volgens het MARC21 Bibliographic format. Het BIB‐format

Page 11: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

11

is vergelijkbaar met het algemeen en lokaal niveau in het GGC (BIB‐records in Aleph). Het MARC21 Holdings format, vergelijkbaar met het exemplaarniveau in het GGC (HOL‐records in Aleph), wordt in WorldCat nog niet volledig ondersteund, maar er zijn wel plannen om dit te verbeteren. De invoer van tijdschriftholdings en bezitsgegevens die noodzakelijk zijn voor 'resource sharing' (IBL) is op dit moment wel mogelijk. Aanvullende bibliografische exemplaargevens zoals provenance zijn echter nog niet zichtbaar of vindbaar in WorldCat. De invoer van deze gegevens wordt alleen in de browser ondersteund, en dan slechts met het oog op export naar het lokale bibliotheeksysteem.

Het MARC21 Authority format wordt in WorldCat geheel ondersteund. 'Authority Control' is mogelijk aan de hand van verschillende gecontroleerde vocabularies: Dewey Decimal Classification (DDC), de Library of Congress Name Authority File (LCNAF) en de Library of Congress Subject Headings (LCSH). De LCNAF wordt gebruikt voor de standaardisatie van de namen van personen, corporaties, congressen, plaatsen en uniforme titels. De spelling van Nederlandse namen is niet verengelst, maar gelijk aan de gangbare Nederlandse vorm. De LCSH wordt gebruikt voor de uniformering van onderwerpen, in combinatie met de LCC voor de toekenning van classificatiecodes met het oog op kastplaatsing. Met de optie 'Control All Headings' in de Connexion Client kunnen alle ingevoerde ingangen in een record in één keer gethesaureerd worden. Dewey wordt onderhouden door OCLC. Het beheer van LCNAF en LCSH is in handen van deelnemers aan de Name‐ respectievelijk Subject Authority Cooperative Program (NACO en SACO). Instellingen zonder NACO‐ of SACO‐bevoegdheid kunnen via een webformulier desgewenst voorstellen doen voor aanvulling op of uitbreiding van de thesaurus.

Daarnaast bestaat de mogelijkheid om termen te ontlenen aan een selectie van gespecialiseerde thesauri. De WorldCat Terminology Service biedt toegang tot een toenemend aantal trefwoordsystemen zoals Art & Architecture Thesaurus (AAT), Getty Thesaurus of Geographic Names (TGN), Medical Subject Headings (MeSH) en Thesaurus for Graphic Materials (TGM). Termen kunnen eenvoudig met behulp van de 'copy & paste' functie toegevoegd worden aan een WorldCat record.

Om met de Connexion Client in WorldCat te kunnen werken, moet vooraf de 'user profile' geconfigureerd worden. Specifieke accountinstellingen zijn nodig om bijvoorbeeld titels te kunnen exporteren naar Aleph. Ook is het mogelijk de catalogiseerinstellingen aan te passen. Het gebruik van 'workforms' die voorzien zijn van 'constant data', kan de invoer aanzienlijk vereenvoudigen. De configuratie van de 'user profile' wordt lokaal op de pc opgeslagen en kan niet centraal beheerd worden.

WorldCat bevat een grote verscheidenheid aan records; titels uit verschillende landen, beschreven in uiteenlopende talen volgens verschillende catalogiseerregels.

Page 12: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

12

Naast de invoer van nieuwe titels, aangeduid met de term 'original cataloging' is er dan ook alle gelegenheid tot 'copy cataloging', het ontlenen van titelgegevens. Gedurende een week is het aantal mogelijke ontleningen bijgehouden en vergeleken met het percentage ontleningen uit het GGC. Gecontroleerd is alleen of een volledig AACR2‐record, dan wel een eenvoudig tot AACR2 om te werken record beschikbaar was. Er is geen analyse gemaakt van de herkomst van de records in WorldCat.

WorldCat records Aanwezig AACR2

Nederlandstalige publicaties 97% 13% Publicaties in andere talen 95% 69%

GGC records Aanwezig AACR2

Alle publicaties 80% 0%

Alvorens in WorldCat aan de slag te gaan, is het van belang om keuzes te maken over de te volgen 'cataloging rules' en de 'language of cataloging'. Deze gegevens zijn beslissend als het aankomt op de selectie van records voor eigen gebruik.

Het gebruik van 'encoding levels' is verplicht. Hiermee wordt de mate van compleetheid van een record weergegeven. Instellingen hebben de mogelijkheid om BIB‐records op enig moment te verrijken met aanvullende gegevens volgens de geldende normen. Zo is het bijvoorbeeld mogelijk om records te upgraden van 'core' naar 'full' level door er LC headings aan toe te voegen. Het encoding level speelt dan ook een rol bij het overhalen en inlezen van updates naar het lokale bibliotheek systeem.

Speciale aandacht verdienen de regels voor het dupliceren van titels en de rol daarbij van de 'language of cataloging'. Van parallelle records is sprake wanneer voor één titel twee of meer records aangemaakt zijn in een verschillende taal. Wanneer de richtlijn goed is toegepast, zijn beide records ook met elkaar gelinkt via Marc tag 936. Parallelle records zijn toegestaan en worden niet gezien als duplicaat records. Hybride records daarentegen, bevatten gegevens in meer dan één taal. Hybride records ontstaan veelal wanneer instellingen records dupliceren en deze aanpassen aan de eigen wensen. Meest in het oog lopend is het wanneer de taal van catalogiseren niet overeenkomt met de tekst in het record. Maar ook kleinere verschillen komen voor. Hybride records worden wel gezien als duplicaat records en zijn niet daarom toegestaan. Zelfs met deze regels wordt de invoer van duplicaat titels niet geheel voorkomen en daarom besteed OCLC veel aandacht aan de kwaliteit van de database. Met behulp van de geavanceerde Duplicate Detection and Resolution software (DDR) wordt WorldCat dagelijks ontdaan van een groot deel van de dubbel ingevoerde of ingelezen titelbeschrijvingen. Ook zijn er aparte formulieren beschikbaar voor het melden van hybride records bij de afdeling Quality Control van OCLC.

Page 13: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

13

Ondanks de grote hoeveelheid records, is het heel goed mogelijk gericht te zoeken in WorldCat. Connexion biedt ruime mogelijkheden voor commando‐ en menugestuurd zoeken. Ook zijn er voldoende opties voor het inperken van zoekresultaten. Zo is het mogelijk om zoekacties te beperken tot kwalitatief hoogwaardige PCC‐records (Program for Cooperative Cataloging), of op taal van catalogiseren. De webdocumentatie met betrekking tot de indexen is zeer uitgebreid en geeft een zeer gedetailleerde opsomming van de verschillende mogelijkheden tot op het niveau van het op subveld.

Is een geschikt record gevonden, dan kan met één druk op de knop het bezit van de instelling gemarkeerd worden. In de Connexion Client wordt de instellingscode met behulp van de functietoets 'update holdings' toegevoegd aan het record. De UBA heeft de instellingscode QGK toebedeeld gekregen. Aan de hand van de instellingsgegevens in de Library Profile wordt vervolgens automatisch een holding getoond in de publieksversie van WorldCat. Anders dan in het GGC, wordt slechts één holding getoond. Ook wanneer een instelling meerdere exemplaren bezit van één en hetzelfde werk. De holding bevat een link naar de lokale publiekscatalogus waar de exemplaargegevens bekeken kunnen worden.

Wanneer de titel voorzien is van een instellingscode kan het record met behulp van de functietoets 'export' eenvoudig weggeschreven worden. Connexion kent drie opties voor het exporteren van titelgegevens naar Aleph. Export via file: iedere catalograaf slaat de eigen productie op in een save file die periodiek weggeschreven wordt voor batchgewijze import in Aleph. Export via TCP/IP: titels worden na export rechtstreeks ingelezen in Aleph. In Aleph kan periodiek een 'error log report' worden gegenereerd. Export via Gateway: titels worden na export rechtstreeks ingelezen in Aleph. Eventuele foutmeldingen verschijnen direct in Connexion op het scherm waardoor foutherstel nog mogelijk is.

Er is geen functie voor het automatisch exporteren van Authority Records. Deze kunnen wel itemgewijs geselecteerd en geëxporteerd worden, maar dat is zeer arbeidsintensief. Gebruikelijker is het om thesaurusrecords af te nemen bij één van de drie beschikbare leveranciers in Amerika. Nieuwe titelbeschrijvingen kunnen periodiek, en al dan niet voorzien van de juiste thesaurering worden aangeleverd. De instelling ontvangt het hele bestand gethesaureerd en wel retour, inclusief bijbehorende thesaurus records. Het bijhouden van een administratie van reeds geleverde thesaurus records is bij de service inbegrepen.

Het is mogelijk om voorafgaand aan de export tijdelijk lokale velden uit de X9X‐ en 9XX‐reeks in te voeren in Connexion. Zo is het mogelijk om specifieke lokale waarden, zoals bijvoorbeeld het 'shelf number' over te halen naar het lokale bibliotheeksysteem. Wanneer het record na export in Connexion wordt afgesloten, worden de gegevens niet opgeslagen maar gewist. Bij de keuze van lokale velden moet rekening gehouden worden met het feit dat enkele velden gereserveerd zijn

Page 14: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

14

voor specifieke WorldCat functionaliteit. Een overzicht is beschikbaar op de website van OCLC.

Voor het inlezen van een WorldCat‐titel in Aleph zijn vier verschillende routines beschikbaar, fix, match, merge en overlay. Met de fix‐routine kan informatie in een record verplaatst worden naar een ander veld, of kunnen nieuwe gegevens toegevoegd worden aan het record. De match‐routine checkt het record aan de titels in de lokale database. Vindt er geen match plaats, dan wordt het WorldCat record ingelezen als nieuwe titel. Wanneer een record wel matcht met een titel in Aleph dan zijn er twee opties mogelijk. Met de merge‐routine worden beide titels samengevoegd, terwijl met de overlay‐routine één van beide records wordt overschreven. Alle vier de routines kunnen naar wens geconfigureerd worden.

Naast het overhalen van titels d.m.v. de export‐functie is het in Aleph ook mogelijk titels aan WorldCat te ontlenen via Z39.50. Voor het zoeken via Z39.50 is aparte documentatie beschikbaar op de website van OCLC. Het aantal zoekmogelijkheden is groter dan verwacht. Zoekresultaten worden standaard gesorteerd op de mate van gebruik, afgemeten aan de aanwezigheid van het aantal holdings van verschillende instelllingen.

Om kopieën van WorldCat titels in Aleph up‐to‐date te houden kan gebruikt gemaakt worden van de Bibliographic Notification Service van OCLC. Met deze service kunnen titels automatisch geupdate worden. Vooraf kan precies aangegeven worden welk type wijziging als een verrijking wordt beschouwd voor het lokale systeem. Te denken valt dan aan upgrades (hoger encoding level) of extra onderwerpsgegevens.

Er zijn verschillende manieren om informatie van Aleph naar WorldCat over te halen; records kunnen zowel itemgewijs als batchgewijs verwerkt worden. Zonder tussenkomst van OCLC via de upload functie in Connexion, of op aanvraag via een Batchload Service van het OCLC Online Service Center (OSC). Met de upload functie in Connexion worden BIB‐records naar een online save file weggeschreven, waarna een catalograaf de titels één voor één in WorldCat op kan slaan. Deze optie is alleen handig voor de verwerking van nieuwe, unieke titelbeschrijvingen die nog niet beschikbaar zijn in WorldCat. Een Batchload Service kan aangevraagd worden voor zowel éénmalige als periodieke inleesacties in WorldCat. Met het laden worden nieuwe titels gematcht en waar mogelijk gemerged met de titels in WorldCat. De instelling ontvangt vervolgens een outputfile met OCLC‐nummers retour voor inlezing in het lokale bibliotheeksysteem. Behalve voor het laden van nieuwe titels, wordt de service ook gebruikt voor het periodiek laten verwijderen of toevoegen van holdings in WorldCat.

De SRU2Way‐koppeling tussen WorldCat en het GGC verzorgt de doorgifte van informatie in twee richtingen. Aan de ene kant worden GGC‐titels vanuit WorldCat

Page 15: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

15

verrijkt met trefwoorden. Andersom worden GGC‐titels met weglating van de exemplaargegevens overgehaald naar WorldCat. Niet alle Amsterdamse titelbeschrijvingen zijn beschikbaar in WorldCat. Omdat de mapping tussen Pica+ en MARC21 nog niet compleet is, kunnen de onzelfstandige deeltitels nog niet doorgestuurd worden naar WorldCat. Hetzelfde geldt voor de titelbeschrijvingen van brieven. Vanwege het afwijkende formaat doen zich problemen voor met de matching, merging en deduplication van deze titels in WorldCat. Alle GGC‐records, dus ook AACR2‐titels, worden in WorldCat vooralsnog opgenomen als FOBID‐titel met catalogiseertaal Nederlands.

3.2. Scenario's

In totaal zijn drie scenario's uitgewerkt. Alle drie de scenario's hebben de catalogisering in WorldCat als uitgangspunt.

Scenario 1 ‐ participatie als AACR2‐bibliotheek

‐ Titelbeschrijving in het Engels ‐ AACR2‐compliant ‐ LC Authority Control (LCNAF, LCSH/LCC) ‐ WorldCat is leidend voor de bibliografische gegevens ‐ Aleph is leidend voor de holding informatie ‐ Thesaurusbeheer in WorldCat (LC Authority Control)

In dit scenario is WorldCat het leidende systeem voor zowel het beheer van bibliografische gegevens als ook voor de thesaurering. In het kort komt het erop neer dat BIB‐records beheerd worden in WorldCat. De taal van catalogiseren is Engels. Titelbeschrijvingen zijn AACR2‐compliant en altijd voorzien van een cataloging level. Full level records zijn bovendien voorzien van LC Authority Control. Dat wil zeggen dat naamsingangen gethesaureerd zijn volgens de Library of Congress Name Authority File (LCNAF) en onderwerpen volgens de Library of Congress Subject Headings (LCSH) in combinatie met de Library of Congress Classification (LCC). Iedere AACR2‐bibliotheek heeft de mogelijkheid om BIB‐records op enig moment te verrijken met aanvullende gegevens volgens de geldende normen. In het lokale bibliotheek systeem is slechts een kopie opgeslagen van het BIB‐record uit WorldCat. Via de Bibliographic Notification Service wordt dit record automatisch up‐to‐date gehouden. Om lokaal ingewikkelde merging‐operaties te vermijden, zijn wijzigingen in lokale BIB‐records niet toegestaan. Het WorldCat‐record moet het lokale record te allen tijde kunnen overschrijven. Ieder BIB‐record is in WorldCat volgens de geldende regels voorzien van de instellingscode QGK, zodat zichtbaar is dat de titel beschikbaar is bij de UvA. Het beheer van specifieke exemplaargegevens, de zogenaamde 'Local Holdings Maintenance' vindt echter lokaal plaats. Dit betekent dat alle HOL‐ en ITEM‐records

Page 16: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

16

aangemaakt en beheerd worden in Aleph. Het achteraf toevoegen of verwijderen van holdings in WorldCat geschiedt handmatig of via een batchload.

Scenario 2 ‐ participatie als AACR2‐bibliotheek met Nederlandse bijdrage

‐ Titelbeschrijving in het Engels ‐ AACR2‐compliant ‐ LC Authority Control (LCNAF, LCSH/ LCC) én Nederlandse trefwoorden (GOO/NBC) ‐ Lokale titel verrijkt met Nederlandse naamsingangen (NTA) ‐ Beheer bibliografische gegevens deels in WorldCat, deels in Aleph ‐ Aleph is leidend voor de holding informatie ‐ Thesaurusbeheer zowel in WorldCAT (LC) als GGC (NTA, GOO, NBC)

In dit scenario is uitgegaan van twee verschillende systemen voor het beheer van bibliografische gegevens en twee voor de thesaurering. BIB‐records zijn aangemaakt in WorldCat. De taal van catalogiseren is Engels. Titelbeschrijvingen zijn volledig AACR2‐compliant en altijd voorzien van een cataloging level. Full level records zijn bovendien voorzien van LC Authority Control. Dat wil zeggen dat naamsingangen gethesaureerd zijn volgens de Library of Congress Name Authority File (LCNAF) en onderwerpen volgens de Library of Congress Subject Headings (LCSH) in combinatie met de Library of Congress Classification (LCC). Daarnaast zijn de titels voorzien van Nederlandse onderwerpsgegevens uit de Gemeenschappelijke Onderwerpsontsluiting (GOO) en de Nederlandse Basisclassificatie (NBC). De benodigde informatie is uit het GGC gehaald waar tevens het thesaurusbeheer plaatsvindt. In het lokale bibliotheek systeem is de kopie van het BIB‐record uit WorldCat verrijkt met een lokaal veld waarin de naamsingang uit de Nederlandse Thesaurus Auteursnamen (NTA) is opgenomen. De benodigde informatie is uit het GGC gehaald waar tevens het thesaurusbeheer plaatsvindt. Iedere AACR2‐bibliotheek heeft de mogelijkheid om BIB‐records in WorldCat op enig moment te verrijken met aanvullende gegevens volgens de geldende normen. Via de Bibliographic Notification Service wordt het lokale record automatisch up‐to‐ date gehouden. Een merging‐proces in Aleph voorkomt dat de lokale velden met Nederlandse auteursnamen worden overschreven. Ieder BIB‐record is in WorldCat volgens de geldende regels voorzien van de instellingscode QGK, zodat zichtbaar is dat de titel beschikbaar is bij de UvA. Het beheer van specifiek exemplaargegevens, de zogenaamde 'Local Holdings Maintenance' vindt echter lokaal plaats. Dit betekent dat alle HOL‐ en ITEM‐records aangemaakt en beheerd worden in Aleph. Het achteraf toevoegen of verwijderen van holdings in WorldCat geschiedt handmatig of via een batchload.

Scenario 3 ‐ Nederlandse deelnemer in WorldCat

‐ Titelbeschrijving in het Nederlands ‐ Conform FOBID‐regels voor de titelbeschrijving

Page 17: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

17

‐ Voorzien van Nederlandse naamsingangen en trefwoorden (NTA, GOO en NBC) ‐ WorldCat is leidend voor de bibliografische gegevens ‐ Aleph is leidend voor de holding informatie ‐ Thesaurusbeheer in GGC (NTA, GOO/NBC)

In dit scenario is WorldCat het leidende systeem voor het beheer van bibliografische gegevens, terwijl het GGC gebruikt wordt voor het thesaurusbeheer. BIB‐records zijn aangemaakt in WorldCat. De taal van catalogiseren is Nederlands. Titelbeschrijvingen voldoen aan de regels voor de titelbeschrijving (FOBID‐rtb) en zijn altijd voorzien van een cataloging level. Full level records zijn voorzien van Nederlandse thesaurus‐informatie. Dat wil zeggen dat alle naamsingangen afkomstig zijn uit de Nederlandse Thesaurus Auteursnamen (NTA) en de Nederlandse onderwerpsgegevens uit de Gemeenschappelijke Onderwerpsontsluiting (GOO) en de Nederlandse Basisclassificatie (NBC). De benodigde informatie is uit het GGC gehaald waar tevens het thesaurusbeheer plaatsvindt. Iedere Nederlandse deelnemer heeft de mogelijkheid om BIB‐records in WorldCat op enig moment te verrijken met aanvullende gegevens volgens de geldende normen. In het lokale bibliotheek systeem is slechts een kopie opgeslagen van het BIB‐record uit WorldCat. Via de Bibliographic Notification Service wordt dit record automatisch up‐to‐date gehouden. Om lokaal ingewikkelde merging‐operaties te vermijden, zijn wijzigingen in lokale BIB‐records niet toegestaan. Het WorldCat‐record moet het lokale record te allen tijde kunnen overschrijven. Ieder BIB‐record is in WorldCat volgens de geldende regels voorzien van de instellingscode QGK, zodat zichtbaar is dat de titel beschikbaar is bij de UvA. Het beheer van specifieke exemplaargegevens, de zogenaamde 'Local Holdings Maintenance' vindt echter lokaal plaats. Dit betekent dat alle HOL‐ en ITEM‐records aangemaakt en beheerd worden in Aleph. Het achteraf toevoegen of verwijderen van holdings in WorldCat geschiedt handmatig of via een batchload.

3.3. Workflows

Onderstaande workflows voor bestellen en catalogiseren zijn gebaseerd op het scenario dat uitgaat van een volledige participatie in WorldCat als AACR2‐ bibliotheek.

Workflow Bestellen

‐ bestellen in Aleph ‐ waar mogelijk record ontlenen aan WorldCat via Z39.50 ‐ anders voorlopige besteltitel aanmaken ‐ resultaat: BIB, ITEM en ORDER in Aleph

Het bestelproces vindt plaats in het lokale bibliotheek systeem. Daarbij is het van belang om het OCLC‐nummer zo vroeg mogelijk over te halen naar Aleph. Titels

Page 18: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

18

worden daarom waar mogelijk via Z39.50 ontleend aan WorldCat. Gezocht wordt naar het 'best available record'. Eindresultaat van het proces is; een BIB‐, ORDER‐ en ITEM‐record in Aleph.

Wanneer een titel op het moment van bestellen noch in Aleph, noch in WorldCat beschikbaar is, dan wordt een beknopte besteltitel aangemaakt in Aleph. Ontlenen van FOBID‐titels aan het GGC is niet meer mogelijk.

Wanneer een titel op het moment van bestellen reeds beschikbaar is in Aleph, dan wordt het overhalen van de titel uitgesteld tot het catalogiseerproces. De reden hiervan is dat titels via Z39.50 alleen als duplicaat ingelezen kunnen worden in Aleph. De 'match & overlay‐functie' (zoek‐ en vervang‐functie) is alleen beschikbaar na rechtstreekse import uit WorldCat via Gateway.

Met het maken van het ORDER record wordt automatisch een ITEM record aangemaakt. Hierdoor heeft de klant de mogelijkheid om alvast een 'hold' te plaatsen op de titel.

De vakreferent of besteller kan Aleph en WorldCat (via Z39.50) tegelijkertijd doorzoeken. Er zijn 4 resultaten en vervolgacties mogelijk; 1 ‐ titel aanwezig in Aleph (niet in WorldCat). Indien niet afgezien wordt van bestellen, dan kan een nieuwe order geplaatst worden op de titel in Aleph. 2 ‐ titel zowel aanwezig in Aleph als WorldCat. Indien niet afgezien wordt van bestellen, dan kan een nieuwe order geplaatst worden op de titel in Aleph. 2 ‐ titel aanwezig in WorldCat (niet in Aleph). Titel wordt gedupliceerd en opgeslagen in Aleph. Vervolgens kan de order geplaatst worden op de duplicaattitel in Aleph. 3 ‐ titel noch in Aleph, noch in WorldCat aanwezig. Er wordt een beknopte besteltitel aangemaakt in Aleph bestaande uit ISBN/ISSN en titel (en auteur indien ISBN/ISSN ontbreekt). Vervolgens kan de order geplaatst worden op de besteltitel in Aleph.

Workflow Catalogiseren

‐ copy‐ dan wel original cataloging in Connexion ‐ 'better copy' exporteren naar Aleph ‐ local holdings maintenance in Aleph

resultaat: UvA holding in WorldCat, BIB, HOL en ITEM in Aleph

Het catalogiseerproces vindt plaats in Connexion en Aleph. Doel is een werk lokaal opvraagbaar te maken voor de klant en de aanwezigheid ook zichtbaar te maken in WorldCat. Eindresultaat van het proces is een AACR2‐record met UvA‐holding in WorldCat en een duplicaattitel (BIB) voorzien van HOL‐ en ITEM‐record in Aleph.

Page 19: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

19

In WorldCat wordt zo veel mogelijk gebruik gemaakt van 'copy cataloging', gezocht wordt naar het 'best available record'. Wanneer een titel ontbreekt in WorldCat, wordt deze ingevoerd volgens de eisen van AACR2 second‐level description (encoding level = OCLC Full Cataloging). Indien een ingang ontbreekt in één van de LC Authority files, dan wordt het encoding level van het record naar beneden bijgesteld. 'Core' indien enkele headings niet gethesaureerd kunnen worden, 'Minimal' indien geen enkele heading gethesaureerd kan worden.

WorldCat records worden naar Aleph geëxporteerd via Gateway. Als WorldCat op het moment van catalogiseren een 'better copy' bevat dan Aleph, dan wordt deze altijd overgehaald. De titel uit WorldCat overschrijft het lokale BIB‐record. Wanneer de 'better copy' een titel betreft met een ander OCLC‐nummer of ISBN/ISSN dan het Aleph‐record, dan kan het WorldCat record voorafgaand aan de export voorzien worden van het Aleph System Number voor een correcte matching. De criteria voor matching zijn in volgorde van prioritering: 1. Aleph System Number, indien dit niet aanwezig is: 2. OCLC‐nummer en indien dit ook ontbreekt: 3. ISBN/ISSN.

De catalograaf controleert de titelbeschrijving in Aleph op aanwezigheid van het OCLC‐nummer of het ISBN/ISSN. De volgende resultaten en vervolgacties zijn mogelijk; 1 ‐ OCLC‐nummer in Aleph, geen 'better copy' in WorldCat. De WorldCat titel hoeft niet voor een tweede keer overgehaald te worden naar Aleph. 2 ‐ OCLC‐nummer in Aleph, 'better copy' (update) in WorldCat. De titel in Aleph wordt vervangen via Gateway. 3 ‐ OCLC‐nummer in Aleph, 'better copy' (andere titel) in WorldCat. Het Aleph‐ recordnummer wordt aan het WorldCat record toegevoegd, waarna de titel in Aleph wordt vervangen via Gateway. 4 ‐ alleen ISBN/ISSN in Aleph, 'better copy' in WorldCat. De titel in Aleph wordt vervangen via Gateway. 5 ‐ alleen ISBN/ISSN in Aleph, 'better copy' (andere titel) in WorldCat. Het Aleph‐ recordnummer wordt aan het WorldCat record toegevoegd, waarna de titel in Aleph wordt vervangen via Gateway. 6 ‐ alleen ISBN/ISSN Aleph, geen record in WorldCat. In Connexion wordt een nieuwe AACR2‐titel gemaakt, waarna de titel in Aleph wordt vervangen via Gateway.

Thesaurusrecords worden niet één voor één met de catalogisering overgehaald naar Aleph. Daar zijn betere mogelijkheden voor. Besluitvorming op dit punt maakt deel uit van het verbetertraject na implementatie.

De UvA‐holdings in WorldCat worden vooralsnog met de catalogisering in Connexion aangemaakt. Eventuele mutaties in lokale holdings achteraf worden ook handmatig in WorldCat verwerkt. Batchgewijze aanlevering vanuit Aleph van in

Page 20: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

20

WorldCat toe te voegen, dan wel te verwijderen holdings, kan deel uitmaken van een verbetertraject na implementatie.

Met het inleesproces in Aleph wordt automatisch een lokaal HOL‐record aangemaakt, dat enkel de UvA instituutscode 'QGK' bevat. De catalograaf verrijkt dit record in Aleph met de waarden voor 'sublibrary', 'collection' & 'shelfnumber.' Waar nodig worden lokaal ook bibliografische exemplaargegevens toegevoegd. Na afronding van het HOL‐record wordt het ITEM record geüpdate en de item status op 'beschikbaar'gezet. Verdere automatisering van dit proces (bijvoorbeeld door in Connexion gebruik te maken van lokale velden voorafgaand aan de export) kan deel uitmaken van een verbetertraject na implementatie.

Eenmaal naar Aleph overgehaalde records, worden via OCLC's Bibliographic Notification Service voorzien van belangrijke updates.

3.4. Beleidsbeslissingen

Reeds genomen besluiten (pilot)

1 We accepteren een trendbreuk in de catalogus en maken in het vervolg onderscheid tussen 'MARC21 records' enerzijds en 'legacy records' anderszijds; 'MARC21 records' zijn geheel MARC21/AACR2 compliant; 'legacy records' zijn niet MARC21/AACR2 compliant, maar geconverteerd uit Pica+ of ingevoerd in het Pica/Aleph‐conversieformaat.

2 Onder het motto 'wat goed is voor een ander, is goed genoeg voor ons' is WorldCat het leidende systeem voor 'MARC21 records'. Het OCLC‐record kan het lokale record in Aleph te allen tijde overschrijven.

3 Aleph is het leidende systeem voor HOL‐Records, vooralsnog wordt dan ook geen gebruik gemaakt van OCLC's Connexion Browser

4 Aleph is vooralsnog het leidende systeem voor 'legacy records'. Streven is om in samenwerking met OCLC Leiden de omzetting naar MARC21 en de doorgifte naar WorldCat te verbeteren.

5 De voorgenomen efficiency verbetering valt alleen te realiseren als we aansluiting zoeken bij internationale partners en leveranciers. Om die reden is dan ook besloten om voor 'MARC21 records' over te stappen op het Engels als catalogiseertaal.

6 Besloten is om het lokale beheer en gebruik van de GGC‐thesauri voor nieuwe invoer in WorldCat geheel te staken, maar het beheer van de NTA in het kader van DAI (gebruik in METIS en DARE) voort te zetten.

7 Besloten is alleen de medewerkers van A&M rechtstreeks toegang te geven tot Connexion (= copy and original cataloging in Connexion). Vakreferenten en bestellers blijven de besteltitels invoeren in Aleph (= copy cataloging via Z39.50 and original cataloging in Aleph).

8 Besloten is een licentie te nemen op de 'OCLC Server' van Ex Libris. Voor het

Page 21: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

21

overhalen van titelgegevens via Gateway naar Aleph is deze “plugin” een vereiste.

9 Besloten is een licentie te nemen op de Connexion Client van OCLC. Voor het catalogiseren in WorldCat is dit een vereiste.

10 Connexion kent 3 verschillende mogelijkheden voor het exporteren van titelgegevens naar Aleph. Voorstel is gebruik te maken van de Gateway‐optie. Voordeel van deze methode is dat de catalograaf direct in Connexion een foutmelding krijgt wanneer een titel niet geladen wordt, waardoor foutherstel tijdig mogelijk is.

Nog voor te bereiden besluiten (verbetertraject)

11 Besluit over het al dan niet uitbesteden van de LC‐thesaurering aan een extern

bedrijf, zoals bijvoorbeeld LTI of Backstage. Wanneer niet tot uitbesteding overgegaan wordt, dan is de vraag of we ook een bijdrage willen leveren aan het thesaurusbeheer in WorldCat middels een NACO bevoegdheid.

12 Besluit over het verkrijgen, lokaal bewaren en aan de klant aanbieden van LC‐ thesaurusrecords. verkrijgen: De LC Authority Files zijn vrijelijk beschikbaar als Linked Open Data, leveranciers als LTI of Backstage leveren ook afzonderlijke records. lokaal bewaren: rechtstreeks naar PRIMO PNX‐formaat, of inlezen in Aleph. aanbieden: PRIMO

3.5. To do list voor implementatie

Onderstaande lijst bevat de actiepunten die nodig zijn om de nieuwe workflows voor bestellen en catalogiseren te kunnen implementeren. De acties zijn voorzien van een aanduiding ‐ tussen haakjes ‐ voor de uitvoerende sector.

Road Map MARC21 & AACR2

1 Definitief vaststellen (A&M) minimale‐ en maximale bibliografische formaten

voor boeken en tijdschriften, inclusief fixed fields. Duidelijk onderscheid in BIB en HOL informatie; lokale velden vermijden, tenzij strikt noodzakelijk als intern administratief veld; toevoegen cataloging rules, ‐levels en ‐language.

2 Voorstel en besluit (A&M) over te gebruiken thesauri; alleen de thesauri van de Library of Congress, of ook anderen uit OCLC's Terminology Services, zoals Dewey, MESH, AAT etc. (Gebruik differentiëren naar verschillende vakgebieden of domeinen). Uitwerking heeft consequenties voor het trainingstraject.

3 Voorstel en besluit (A&M) over te thesaureren LC‐velden; alleen persoonsnamen LC‐classificatie en trefwoorden, of ook reeksen en uniforme titels etc. Uitwerking heeft consequenties voor het trainingstraject.

4 Voorstel en besluit (A&M) over het gebruik van translitteraties. Omdat indexering en presentatie in Aleph nog niet geregeld zijn, is het voorstel om te

Page 22: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

22

accepteren wat met 'copy cataloging' meekomt uit WorldCat, maar met de invoer vooralsnog te wachten. Het invoeren van oorspronkelijk schrift kan na implementatie alsnog deel uit maken van een verbetertraject.

5 Uitwerken (A&M) consequenties trendbreuk voor PRIMO (en OPAC). Zuiver MARC21 als basis nemen voor de inrichting van de 'Aleph Pipe'. Afwijkingen t.b.v. 'legacy records' verwerken als aanvulling op de standaard specificatie.

OCLC, WorldCat en Connexion

6 Bespreken (A&M) licentie met OCLC (kosten, re‐use policy etc.) 7 Instellen (A&M en BIS) OCLC library profile en aanvragen user‐nummers 8 Vaststellen (A&M) en instellen (BIS) default catalogiseerinstellingen

medewerker voor werken in Connexion Client versie 2.30 met Workforms, Constant Data, User tools etc., inclusief procedures voor beheer en gebruik.

9 Instellen (BIS) noodzakelijke systeem instellingen in testversie Connexion Client versie 2.30, inclusief accountinstellingen voor inlog en autorisaties.

10 Upgrade (IC) Connexion Client in UvA‐werkplek profile van versie 2.10 naar 2.30, inclusief account‐ en catalogiseerinstellingen. Zie ook: 'client enhancements'

11 Instellen (A&M en BIS) OCLC Bibliographic Notification Service voor het overhalen van updates naar Aleph.

Aleph

12 Afhandelen (BIS) licentie op de 'OCLC Server' van Ex Libris, deze functionaliteit

is noodzakelijk voor het overhalen van titelgegevens naar Aleph. NB. De offerte loopt tot 1‐1‐2012.

13 Specificaties (A&M) en configuratie (BIS) van de Z39.50 tabel voor WorldCat in Aleph.

14 Specificaties (A&M) en configuratie (BIS) 'Fix, Match and Overlay Process' in Aleph voor records uit WorldCat.

15 Specificaties (A&M) en configuratie (BIS) van eventuele wijzigingen in de Aleph/GGC‐koppeling

Instructie en training Personeel

16 Vaststellen (A&M) criteria 'Best Available Record' voor de selectie van

titelgegevens in WorldCat door vakreferenten en bestellers via Z39.50. 17 Vaststellen (A&M) minimale eisen bestelrecord met oog op matching ‐ voor

overlay ‐ bij inlezen. Voor titels die tijdens het bestellen nog niet beschikbaar zijn in WorldCat, zou invoeren van ISBN/ISSN en Titel in Aleph afdoende moeten zijn volgens Metropolitan Museum of Art...[relatie met ACQ]

18 Opstellen (A&M) instructie 'Zoekstrategieën WorldCat via Z39.50' voor vakreferenten en bestellers. Zie OCLC's uitgebreide documentatie over de Z39.50 indexen.

19 Opstellen (A&M) lijst met aandachtspunten voor training van A&M‐

Page 23: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

23

medewerkers: Access points, cataloging programs, LC subject headings, analytical descriptions, fixed fields, gebruik 8XX velden en encoding levels (overgang naar zuiver MARC21 en AACR2). Inclusief instructie omtrent export‐ instellingen en het maken en terugzetten van back‐ups van lokale (PC‐ gebonden) configuratie (Personal Settings).

20 Opstellen (A&M) instructie 'Zoekstrategieën WorldCat via Connexion' voor catalografen. Zie OCLC's uitgebreide documentatie over de Connexion indexen.

21 Vaststellen (A&M) criteria 'Better Copy' voor het overhalen van een titel uit WorldCat ter vervanging van besteltitel.

22 Opstellen instructie (A&M) hoe om te gaan met 'legacy records', bijvoorbeeld in geval van reeds lopende seriewerken.

23 Organiseren (A&M) training Connexion Client voor catalografen door extern bureau, bijvoorbeeld Amigos, OCLC Certified Training Partner.

24 Organiseren (A&M) training gebruik (geen beheer) LC Authority Control voor catalografen door extern bureau.

25 Instructie (A&M) vakreferenten en bestellers met uitleg over belang van OCLC‐ nummer en toelichting op de wijzigingen in de workflow na het bestellen.

3.6. OCLC enhancement issues

Enhancements

1 In order to facilitate multilingual searching in the UvA OPAC, we would like the Dutch Name Authority File to be linked with VIAF as soon as possible. Availability of the GGC Authority File in OCLC's Terminology Services is no longer an issue for us.

2 We would like to phase out the Aleph‐GGC link and implement the OCLC Batchload Service. In order to participate in the GGC as well (for resource sharing and national collection management purposes), the SRU2WAY‐link from WorldCat to the GGC should be ready for full use. As an interim solution, we would like to simplify the delivery to the GGC by sending only the OCLC number, the Aleph number and the local holding information to OCLC Leiden (instead of the whole Aleph‐record).

3 OCLC Leiden has build a link from World.org to the Aleph OPAC. The client is redirected to the UvA Website via the GGC (www.pica.nl). Prior to implementation, we would like to have a direct link from World.org to Aleph. Otherwise a dead link is created for as long as a record isn't loaded into the GGC. Condition: See issue 5, availability of the OCLC‐numbers numbers in Aleph.

4 Eventually we would like to add our 'detailed holdings' in WorldCat. Full support (in terms of indexing and presentation) of the MARC21 format for Holdings Data would be necessary.

Requests for data enrichment

Page 24: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

24

5 Prior to implementation, we would like to obtain the OCLC‐numbers from WorldCat for all our legacy records (i.e. records uploaded form GGC to WorldCat).

6 Prior to implementation, we would like to enrich all our records in Aleph with LCC numbers and LC Subject Headings (and other authority information).

7 Eventually, we would like to upgrade our 'legacy records' from PicaMARC/FOBIDrtb to MARC21/AACR2‐compliant records.

Obsolete (issues based on scenario's 2 and 3)

‐ Availability of the GGC Authority File in OCLC's Terminology Services. ‐ For 1XX, 7XX, 6XX fields we would like to use $0 for storage of the ID of the

Dutch Authority Record (conform MARC21 documentation)

4. Conclusies & aanbevelingen

4.1. Conclusies

Direct catalogiseren in WorldCat is technisch haalbaar indien de UBA de beschikking heeft over de Connexion Client van OCLC en de OCLC‐server van Ex Libris.

De voorgenomen efficiencyverbetering kan alleen gerealiseerd worden indien de UBA in WorldCat participeert als AACR2‐bibliotheek en overgaat op het Engels als catalogiseertaal.

Directe winst: kon aan het GGC 80% van de titels worden ontleend, met 'copy cataloging' in WorldCat stijgt het percentage ontleningen naar 96%.

Beheer en gebruik van de Nederlandse thesauri compliceert en vertraagt de workflow voor Engelstalige AACR2‐records. Bovendien levert het gebruik van Nederlandse ingangen naast LC‐headings onnodige verdubbelingen op in de titelbeschrijving. Onnodig omdat de relatie tussen twee vertalingen van een term ook éénmalig vastgelegd kan worden op het niveau van de thesaurus.

Het overhalen van records van WorldCat naar Aleph valt eenvoudig te realiseren. Ook zijn er voldoende opties om batchgewijze uploades van Aleph naar WorldCat mogelijk te maken.

Catalografen zijn enthousiast over het gebruik van de Connexion Client.

Het ideale catalogusrecord is volledig uitwisselbaar met WorldCat en andere systemen. Het heeft een OCLC‐nummer, is in de Engelse taal gesteld, voldoet aan de AACR2‐regelgeving en is voorzien van een encoding level.

Page 25: OUTLINE Eindrapportage WorldCat Pilot

Pilot Rechtstreeks Catalogiseren in WorldCat (OCLC)

25

4.2. Aanbevelingen

Overgaan tot implementatie van de workflows voor het bestellen en catalogiseren van boeken en tijdschriften op basis van scenario 1.

Staken van het lokale beheer en gebruik van de GGC‐thesauri voor MARC‐records, maar het beheer van de NTA in het GGC voort te zetten in het kader van DAI (gebruik alleen voor METIS en DARE). Advies is om nationaal in te zetten op een koppeling van NTA met VIAF.

Vervolgacties:

Verkennen van aanvullende diensten die een verdere verbetering van de workflow opleveren, zoals WorldCat Collection Sets, WorldCat Selection en het importeren van vendor records (al dan niet via WorldCat Cataloging Partners).

Verkennen van de verschillende mogelijkheden voor LC‐Thesaurering (NACO‐ licentie, outsoursing etc.) inclusief het verkrijgen, lokaal bewaren en aan de klant beschikbaarstellen van LC‐Authority records (linked open data, leveranciers etc.).