paieškos sistemos primo taikymo galimybės lietuvos virtualioje … · 2011. 3. 7. ·...

213
Lietuvos virtualaus universiteto 2007–2012 metų programa (Patvirtinta Lietuvos Respublikos švietimo ir mokslo ministro 2007 m. balandţio 27 d. įsakymu Nr. ISAK-791) Lietuvos mokslo ir studijų integruotos informacinės erdvės plėtros uţdavinys PAIEŠKOS SISTEMOS PRIMO TAIKYMO GALIMYBĖS LIETUVOS VIRTUALIOJE BIBLIOTEKOJE STUDIJA (Pataisyta atsiţvelgiant į recenzentų pastabas) KAUNAS, 2009 m. gruodis

Upload: others

Post on 02-Feb-2021

5 views

Category:

Documents


0 download

TRANSCRIPT

  • Lietuvos virtualaus universiteto 2007–2012 metų programa

    (Patvirtinta Lietuvos Respublikos švietimo ir mokslo ministro

    2007 m. balandţio 27 d. įsakymu Nr. ISAK-791)

    Lietuvos mokslo ir studijų integruotos informacinės erdvės plėtros

    uţdavinys

    PAIEŠKOS SISTEMOS PRIMO TAIKYMO

    GALIMYBĖS LIETUVOS VIRTUALIOJE BIBLIOTEKOJE

    STUDIJA

    (Pataisyta atsiţvelgiant į recenzentų pastabas)

    KAUNAS, 2009 m. gruodis

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    2 Kaunas, 2009 m. gruodis

    Studijos bendraautoriai ir jų atlikti darbai rengiant nurodytus studijos skyrius

    Eil. Nr. Bendraautoriaus vardas,

    pavardė

    Atlikti darbai rengiant nurodytus studijos

    skyrius

    1. Antanas Štreimikis 1.2; 1.3; 1.4; 1.6; 1.9; 2; 3; 4

    2. Andrius Blaţinskas 1.2; 2; 3

    3. Lina Bloveščiūnienė 1.7; 1.9; 2; 3; 4

    4. Daiva Černytė 1.4; 1.5; 1.6; 1.7; 1.9; 2; 3; 4

    5. Vilija Dzingienė 1.3; 1.7; 1.9; 2; 3; 4

    6. Antanas Gilaitis 1.8; 2; 3

    7. Saulius Grigonis 1.2; 1.4; 1.6; 1.8; 2; 3; 4

    8. Daiva Jurkšaitienė 1.7; 1.9; 2; 3; 4

    9. Deividas Kančelkis 1.2; 2; 3

    10. Daiva Keraitė 1.3; 1.7; 1.9; 2; 3; 4

    11. Andrius Klimavičius 1.1; 1.2; 1.3; 1.4; 1.5; 1.6; 1.8; 2; 3; 4

    12. Vilius Kučiukas 1.1; 1.2; 1.4; 1.6; 1.8, 1.9; 2; 3; 4

    13. Mindaugas Muckus 1.8; 2; 3

    14. Rytis Rudelis 1.2; 1.5; 2; 3

    15. Linas Salelionis 1.8; 1.9; 2; 3; 4

    16. Lina Šarlauskienė 1.7; 1.9; 2; 3; 4

    17. Aleksandras Targamadzė 1.9; 2; 2.1; 3; 4

    18. Gintarė Tautkevičienė 1.3; 1.7; 1.9; 2; 3; 4

    19. Neringa Valytė 1.2; 1.6; 1.7; 1.9; 2; 3; 4

    20. Gintautas Ţemaitis 1.5; 1.7; 1.9; 2; 3; 4

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    3 Kaunas, 2009 m. gruodis

    TURINYS

    Įvadas ................................................................................................................................................... 6

    1. Primo galimybių taikymo išplėstoje LVB apţvalga ir apibendrinimai ........................................... 7

    1.1. Primo komponentai ir jiems vykdyti reikalingi skaičiavimo resursai ....................................... 7 1.1.1. Publikavimo platforma......................................................................................................... 7 1.1.2. Indeksatorius ........................................................................................................................ 9 1.1.3. Administravimo modulis ................................................................................................... 10 1.1.4. Paieškos koordinatorius ..................................................................................................... 11

    1.1.5. Paieškos agentai ................................................................................................................. 11 1.1.6. Paieškos valdiklis ............................................................................................................... 11 1.1.7. Vartotojo paieškos sąsaja ................................................................................................... 11 1.1.8. Primo duomenų bazė ......................................................................................................... 11 1.1.9. Paskirstytų sistemų principo taikymas Primo sistemoje .................................................... 11

    1.1.10. Primo administravimo modulio paskirstymas ................................................................. 12 1.1.11. Vartotojo paieškos sąsajų paskirstymas ........................................................................... 13

    1.1.12. PDS paskirstymas ............................................................................................................ 14

    1.1.13. Apkrovos stabilizatoriaus taikymas ................................................................................. 14 1.1.14. Primo konfigūracijos perkėlimas iš testinio į produkcinį serverį .................................... 16 1.1.15. Visų konfigūravimo duomenų kopijavimas ..................................................................... 16 1.1.16. Atvaizdavimo konfigūracijų kopijavimas ........................................................................ 16

    1.1.17. Atstatymas iš atsarginių duomenų kopijos ...................................................................... 17 1.1.18. Normalizavimo taisyklių rinkinių kopijavimas ............................................................... 17

    1.1.19. Visos duomenų bazės kopijavimas .................................................................................. 17

    1.2. Aleph, Metalib, SFX išteklių publikavimas Primo sistemai .................................................... 17 1.2.1. Aleph išteklių publikavimas .............................................................................................. 17

    1.2.2. MetaLib išteklių publikavimas .......................................................................................... 20 1.2.3. SFX išteklių publikavimas ................................................................................................. 20

    1.3. LABT institucijų konfigūravimas Primo sistemoje ................................................................. 21

    1.3.1. Primo administracinė struktūra .......................................................................................... 21

    1.3.2. Duomenų šaltiniai .............................................................................................................. 22 1.3.3. Paieškos sritys .................................................................................................................... 23 1.3.4. Ribotos paieškos sritys ....................................................................................................... 24

    1.4. Aleph, MetaLib ir SFX duomenų šaltinių konfigūravimas Primo sistemoje .......................... 25

    1.5. Normalizavimo taisyklės ir jų taikymas Primo sistemoje ....................................................... 26

    1.5.1. Normalizuoto įrašo struktūra ............................................................................................. 26 1.5.2. Normalizavimo taisyklių rinkiniai ..................................................................................... 31 1.5.3. Normalizavimo taisyklių rinkinių sąrašas .......................................................................... 32

    1.5.4. Sukurti naują rinkinį .......................................................................................................... 32 1.5.5. Redaguoti rinkinius ............................................................................................................ 32 1.5.6. Išdėstyti rinkinius (angl. deploy) ....................................................................................... 32 1.5.7. Ištrinti rinkinius .................................................................................................................. 32

    1.5.8. Normalizavimo taisyklių rinkinių redagavimas ................................................................. 32 1.5.9. Vartotojo sąsaja normalizavimo taisyklėms redaguoti ...................................................... 33 1.5.10. Veiksmų ADD, OR, MERGE pavyzdys .......................................................................... 33

    1.6. Publikavimo kanalų konfigūravimas, išteklių krovimas ir indeksavimas ............................... 34 1.6.1. Primo publikavimo kanalai ................................................................................................ 34 1.6.2. Primo publikavimo kanalų konfigūravimas ....................................................................... 35 1.6.3. Indeksavimas Primo sistemoje ........................................................................................... 36

    1.7 Rastų išteklių pateikimo konfigūravimas Primo sistemoje ...................................................... 36

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    4 Kaunas, 2009 m. gruodis

    1.7.1. Išteklių tipai ....................................................................................................................... 37 1.7.2. Riboto pateikimo sritys ...................................................................................................... 38

    1.7.3. GetIt! pateikimo nuoroda ................................................................................................... 38 1.7.4. Pateikimo nuorodų konfigūravimas ................................................................................... 39

    1.8. Registruotų Primo vartotojų duomenų konfigūravimas ir krovimas ....................................... 40 1.8.1. Kas yra PDS? ..................................................................................................................... 40

    1.8.2. Kas nėra PDS? ................................................................................................................... 40 1.8.3. PDS darbo eiga .................................................................................................................. 41 1.8.4. Kaip veikia PDS? ............................................................................................................... 41 1.8.5. PDS katalogų struktūra ...................................................................................................... 41 1.8.6. PDS tapatumo nustatymo metodai ..................................................................................... 41

    1.8.7. Vartotojų konfigūracijos vedlys ......................................................................................... 42 1.8.8. Vieningo prisijungimo konfigūravimas ............................................................................. 42 1.8.9. Naujos institucijos sukūrimas PDS sistemoje .................................................................... 43 1.8.10. Institucijos redagavimas PDS sistemoje .......................................................................... 43 1.8.11. Autentifikavimo metodo sukūrimas ................................................................................. 45

    1.8.12. Autentifikavimo metodo redagavimas ............................................................................. 45 1.8.13. Autentifikavimo metodo testavimas ................................................................................ 47 1.8.14. Vartotojo atributų metodo sukūrimas .............................................................................. 47

    1.8.15. Vartotojų atributų metodo redagavimas........................................................................... 48

    1.8.16. Autentifikavimas LABT sistemose .................................................................................. 50 1.8.17. Integracija su Primo ......................................................................................................... 51

    1.8.18. Tipinė Shibboleth funkcionavimo aplinka – vieningoji autentifikavimo sistema ........... 51 1.8.19. Vartotojo prisijungimo vardo maskavimas ...................................................................... 51

    1.9. Primo vartotojo sąsajos lietuvių ir anglų kalbomis konfigūravimas ....................................... 54

    1.9.1. Atvaizdavimų konfigūravimas ........................................................................................... 55 1.9.2. CSS konfigūravimas .......................................................................................................... 56

    1.9.3. Teksto konfigūravimas ...................................................................................................... 57 1.9.4. Piktogramų koregavimas ................................................................................................... 57

    1.9.5. Statinių HTML failų koregavimas ..................................................................................... 57 1.9.6. Pagalbos failų koregavimas ............................................................................................... 57

    1.9.7. Pateikimo konfigūravimas ................................................................................................. 57

    1.10 Primo galimybių taikymo išplėstoje LVB apibendrinimai ..................................................... 58

    2. Virtualių bibliotekų, įdiegusių primo sistemą, gerosios patirties analizė ...................................... 60

    2.1. Virtualių bibliotekų gerosios patirties analizės metodika ........................................................ 60

    2.2. Virtualių bibliotekų analizės rezultatai .................................................................................... 60 2.2.1. Boston College University Libraries (JAV) ...................................................................... 61 2.2.2. British Library (JK) ........................................................................................................... 65 2.2.3. CatalogPlus (JAV) ............................................................................................................. 67 2.2.4. Curtin University of Technology. New Library Catalogue, in Development (Australija) 70

    2.2.5. DiscoverLibrary. Jean and Alexander Heard Library (JAV) ............................................. 73 2.2.6. discoverE (JAV) ................................................................................................................ 76

    2.2.7. E–Knowledge (Airija) ........................................................................................................ 79 2.2.8. You and your Library. Primo (Kanada) ............................................................................. 82 2.2.9. Laurier Library. Primo (Kanada) ....................................................................................... 86 2.2.10. MNCAT PLUS. Libraries of University of Minnesota (JAV) ......................................... 89 2.2.11. National Library of New Zealand (Naujoji Zelandija) .................................................... 93

    2.2.12. NLB SearchPlus. Public Libraries. Singapore ................................................................. 96 2.2.13. OneSearch (Izraelis) ........................................................................................................ 99

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    5 Kaunas, 2009 m. gruodis

    2.2.14. REX. The Royal Library and Copenhagen University Library Information Service

    (Danija) ...................................................................................................................................... 103

    2.2.15. SearchFirst (Australija) .................................................................................................. 107 2.2.16. SOLO. Search Oxford Libraries Online (JK) ................................................................ 110 2.2.17. Southampton Solent University library (JK) ................................................................. 114 2.2.18. State Library of Queensland (Australia) ........................................................................ 116

    2.2.19. State Library of Victoria (Australija) ............................................................................. 120 2.2.20. The College of the Bahamas (Bahamų Sandrauga) ....................................................... 125 2.2.21. The University of Auckland Library. The Catalogue (Naujoji Zelandija) .................... 128 2.2.22. The University of Iowa Libraries (JAV) ........................................................................ 130 2.2.23. The University of Tennessee Libraries (JAV) ............................................................... 132

    2.2.24. TUG Primo (Kanada) ..................................................................................................... 135 2.2.25. Universitat Mannheim. Universitatsbibliothek Mannheim. Primo (Vokietija) ............. 137 2.2.26. University of East Anglia (JK) ...................................................................................... 141 2.2.27. UEL. University of East London. Library & Learning Services (JK) ........................... 144 2.2.28. Galimi klausimai LVB vartotojui .................................................................................. 147

    2.3. Rezultatų apibendrinimas ir rekomendacijos LVB tobulinimui ............................................ 148 2.3.1. Svetainės sąranka ............................................................................................................. 148 2.3.2. Paieškos kortelės .............................................................................................................. 148

    2.3.3. Paieškos sritys .................................................................................................................. 149

    2.3.4. Paieškos rezultatų vaizdavimas ....................................................................................... 150 2.3.5. Kiti vartotojo sąsajos elementai ....................................................................................... 150

    2.3.6. Kalbų sąsajos ................................................................................................................... 150

    3. Lietuvos virtualios bibliotekos panaudojamumo tyrimas ............................................................ 152

    3.1. Tyrimo planavimas ir organizavimas .................................................................................... 152

    3.1.1. Literatūros apţvalga ......................................................................................................... 152 3.1.2. Tyrimo metodologija ....................................................................................................... 153

    3.2. Lietuvos virtualios bibliotekos panaudojamumo tyrimo rezultatų analizė ....................... 155 3.2.1. Vartotojų atsakymų analizės rezultatai ............................................................................ 155

    3.2.2. Vartotojų pastabų ir pasiūlymų turinio analizės rezultatai .............................................. 167

    4. Išvados ir rekomendacijos Primo sistemai išplėstoje LVB konfigūruoti .................................... 175

    Literatūros sąrašas ........................................................................................................................ 176

    Priedai .............................................................................................................................................. 178 1.0 priedas. Techninė specifikacija ............................................................................................ 178 1.1 priedas. Primo konfigūravimo procedūros ........................................................................... 180

    1.2 priedas. Primo LABT institucijos ir bibliotekos .................................................................. 187 1.3 priedas. Primo vartotojo sąsajos vertimo fragmentas .......................................................... 197 1.4 priedas. PNX įrašo pavyzdys ............................................................................................... 200 1.5 priedas. Siūlomo sprendimo vartotojo prisijungimo vardui maskuoti programavimas ....... 202 3.1 priedas. Lietuvos virtualios bibliotekos portalo vertinimo anketa ....................................... 204

    3.2–3.5 prieduose naudojami ţymėjimai ................................................................................... 210

    3.2 priedas. Kintamųjų aprašomoji statistika bibliotekininkų imtyje ........................................ 210

    3.3 priedas. Kintamųjų aprašomoji statistika ekspertų imtyje ................................................... 211 3.4 priedas. Kintamųjų aprašomoji statistika studentų imtyje .................................................. 212 3.5 priedas. Respondentų laikas minutėmis, praleistas susipaţinimui su LVB portalu ............. 213

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    6 Kaunas, 2009 m. gruodis

    ĮVADAS

    Greita ir patogi prieiga prie mokslinės informacijos kasdien tampa vis svarbesnė. Tai

    aktualu tiek pradinių kursų studentui, tiek profesoriui. Lietuvoje akademinės institucijos kuria ir

    prenumeruoja įvairias duomenų bazes, kuriomis gali naudotis Lietuvos ir kitų šalių mokslininkai ir

    kita suinteresuota visuomenės dalis. Duomenų bazėse galima surasti bibliotekose esančius išteklius,

    mokslinių ţurnalų straipsnius, monografijas, disertacijas, baigiamuosius magistrantūros studentų

    darbus ir kitus dokumentus ar tų dokumentų bibliografinius aprašus. Informacijos paieška duomenų

    bazėse labai patogi ir greita, tačiau esant dideliam duomenų bazių skaičiui, visuomenei sudėtinga

    suţinoti apie visas naudingas duomenų bazes, atlikti informacijos paiešką kiekvienoje duomenų

    bazėje uţima gana daug laiko. Dėl šių prieţasčių kuriamos ir diegiamos integruotos paieškos

    įvairiose duomenų bazėse galimybės. Šiam tikslui Lietuvoje buvo teikiamos paslaugos Lietuvos

    virtualios bibliotekos portale (http://www.lvb.lt), naudojančiame MetaLib sistemą, tačiau jame

    nebuvo išplėtotų informacijos paieškos, rezultatų pateikimo ir kitų galimybių vartotojams. Norint

    patenkinti augančius informacijos vartotojų poreikius, suteikti galimybę aiškiai mokslinių rezultatų

    sklaidai ir panaudai, pradėtos diegti Primo sistemos galimybės Lietuvos virtualioje bibliotekoje.

    Šios studijos objektas − paieškos ir pateikimo sistemos Primo (toliau – Primo arba Primo

    sistema) galimybių analizė, demonstravimas ir taikymas išplėstoje Lietuvos virtualioje bibliotekoje

    (LVB), veikiančioje plačiai pasaulyje paplitusių produktų MetaLib, SFX ir Primo pagrindu.

    Studija skirta atsakingiems uţ LVB plėtrą, diegiantiems Primo sistemą ir galintiems

    tobulinti LVB portalą pagal studijos rekomendacijas, taip pat visiems Lietuvos akademinių

    bibliotekų tinklo (LABT) akademinės bendruomenės nariams, norintiems įsigilinti į Primo sistemos

    pritaikymo Lietuvos vartotojams galimybes, konfigūravimo priemones ir procesus.

    Studijos tikslas − išanalizuoti ir apibendrinti Primo galimybes, jų taikymą išplėstoje LVB,

    uţsienio bibliotekose ir, vadovaujantis ekspertų bei kitų tikslinės grupės atstovų apklausos

    rezultatais, suformuoti rekomendacijas Primo sistemai išplėstoje LVB konfigūruoti.

    Primo skirta surasti ir pateikti vartotojams informaciją apie spausdintus ir skaitmeninius

    informacijos šaltinius, neatsiţvelgiant į jų formatą ir saugojimo vietą. Primo gali pateikti paţangius

    aukštos kokybės paieškos rezultatus, pagrįstus metaduomenimis, kuriuos surenka iš integruotų

    bibliotekų sistemų ar kitų interneto paieškos bei pateikimo sistemų ir juos tinkamai indeksuoja.

    Primo sistemoje iš principo galima nustatyti tuos pačius e. išteklius (LABT bibliotekų katalogus,

    uţsienio katalogus, prenumeruojamas mokslines duomenų bazes ir pan.) ir taikyti jiems tuos pačius

    paieškos kriterijus kaip ir MetaLib sistemoje. Tačiau Primo iš esmės skiriasi nuo MetaLib, nes gali

    formuoti taip vadinamų lokalių bei kitų e. išteklių bendrą indeksą, kuris kokybiškai pagreitina

    paiešką ir suteikia vartotojui galimybę iš tikrųjų dirbti vieno langelio principu, taikomu Google

    stiliaus sistemose. Primo nepakeičia MetaLib, kuri naudojama atlikti paiešką nutolusiuose

    e. ištekliuose, pavyzdţiu, prenumeruojamose mokslinėse duomenų bazėse. Todėl įdiegus Primo, ji

    veiks kartu su anksčiau LABT bendruomenei įsigytais ir įdiegtais MetaLib bei SFX ir tokiu būdu

    gerokai išplės dabartinės LVB teikiamas paieškos galimybes LABT vartotojams. Primo turi

    išplėtotas surastų išteklių, esančių bibliotekų fonduose ar internete, pateikimo galimybes. Jei su

    Primo dirbama svečio teisėmis, tokiu atveju e. paslaugų tiekiama maţiau. Prie Primo galima

    prisijungti registruotu vartotoju, naudojant tuos pačius identifikavimo kodus, kaip ir jungiantis prie

    LABT integralios bibliotekų sistemos Aleph.

    Primo jau anksčiau yra įsigiję ir įdiegę tokios garsios pasaulyje institucijos, kaip British

    Library (Jungtinė Karalystė), The Royal Library (Danija) ir kiti. Primo suteikia daug paieškos ir

    rezultatų pateikimo galimybių, tačiau jas reikia ne tik įdiegti, bet ir tinkamai sukonfigūruoti,

    atsiţvelgiant į LABT naudojamus informacijos išteklius, duomenų bazes, vartotojų poreikius. Šiam

    tikslui pasiekti buvo atlikta Primo sistemos galimybių analizė, ekspertinė Primo taikymo pasaulio

    virtualiose bibliotekose gerosios patirties analizė ir šių rezultatų lyginamoji analizė su testuojamo

    LVB portalo funkcijomis, atlikta tikslinių vartotojų grupių anketinė apklausa ir suformuotos

    rekomendacijos Primo sistemai išplėstoje LVB konfigūruoti.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    7 Kaunas, 2009 m. gruodis

    1. PRIMO GALIMYBIŲ TAIKYMO IŠPLĖSTOJE LVB APŢVALGA IR

    APIBENDRINIMAI

    Šis skyrius parengtas naudojantis Ex Libris kompanijos išleista dokumentacija [1-6] ir

    LABT Primo ekspertų praktine patirtimi.

    1.1. PRIMO KOMPONENTAI IR JIEMS VYKDYTI REIKALINGI SKAIČIAVIMO

    RESURSAI

    Primo - tai universalus sprendimas, skirtas spausdintiems ir skaitmeniniams informacijos

    šaltiniams rasti ir pateikti, nepaisant jų formato ir saugojimo vietos.

    Primo siūlo kokybiškus paieškos rezultatus, pagrįstus egzistuojančiais metaduomenimis.

    Primo gali palengvinti egzemplioriaus pateikimą iš bibliotekos arba nedelsiant suteikti prieigą prie

    skaitmeninės kopijos.

    Primo - tai naršyklės sąsaja paremtas sprendimas, kuris veikia UNIX operacinėje sistemoje.

    Primo turi integruotą publikavimo platformą, kuri apdoroja metaduomenims (toliau – duomenis),

    pateiktus įvairiais standartiniais formatais (MARC 21, UNIMARC, MAB, Dublic Core) ir perveda

    juos į kvalifikuotą, suindeksuotą informaciją, saugomą PNX (angl. Primo Normalized XML)

    formatu. Duomenų šaltinio apdorojimą atlieka publikavimo kanalai (angl. Publishing Pipes), kurie

    supranta įvairius bibliotekų išteklių metaduomenų standartus. Paieškos variklis gali greitai ir

    lengvai surasti PNX įrašuose esančią informaciją.

    Primo sudaro šie komponentai:

    Publikavimo platforma (angl. Publishing Platform);

    Indeksatorius (angl. Indexer);

    Administravimo modulis (angl. Back Office);

    Paieškos koordinatorius (angl. Search Federator);

    Paieškos agentai (angl. Search Agents);

    Paieškos variklis (angl. Search Engine);

    Vartotojo paieškos sąsaja (angl. Front End);

    Duomenų bazė (angl. Database).

    Primo komponentai ir jų tarpusavio ryšiai pateikti 1.1.1 pav.

    1.1.1. Publikavimo platforma

    Publikavimo platforma leidţia apjungti didelę įvairovę institucijos išteklių, įskaitant

    spausdintas kolekcijas, skaitmenines talpyklas ir e. resursus. Publikavimo platforma valdo duomenų

    surinkimą ir jų transformavimą į kokybišką indeksuotą informaciją, saugomą PNX formate, kurią

    Primo paieškos variklis gali greitai ir efektyviai surasti iš įvairių duomenų šaltinių.

    Primo gali surinkti ir normalizuoti standartiniame XML formate bet kokius metaduomenis.

    Standartiniai duomenų formatai, pvz., MARC 21, MAB ir Dublin Core, turi integruotus

    normalizavimo šablonus. Šablonai gali būti adaptuoti Primo diegimo metu. Publikavimo kanalai

    atpaţįsta įvairius duomenų formatus ir atlieka duomenų šaltinių apdorojimą.

    Publikavimo platforma atlieka šias funkcijas:

    Sumanus duomenų surinkimas naudojant FTP (angl. File Transfer Protocol), failų kopijavimą ar OAI (angl. Open Archives Initiative) protokolą.

    Duomenų transformavimas į PNX formatą ir saugojimas Primo duomenų bazėje – normalizavimas.

    Duomenų praturtinimas (angl. Enrichment), remiantis algoritmais ir išorine informacija.

    Dubliuotos informacijas apdorojimas (angl. De-duplication).

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    8 Kaunas, 2009 m. gruodis

    Grupavimo procesas, kurio metu sistema atlieką įrašų grupavimą pagal FRBR (angl. Functional Requirements for Bibliographic Records) standartą.

    Darbuotas

    Galutinis

    vartotojas

    Primo

    administravimo

    modulis

    Publikavimo

    platforma

    Primo vartotojo paieškos sąsaja

    ir

    paieškos programa

    Aleph

    Digitool

    Voyager

    KitiPrimo

    duomenų

    bazė

    Paieškos agentas Paieškos agentasPaieškos agentas

    IndeksatoriusIndekso

    dalis

    IndeksatoriusIndekso

    dalis

    IndeksatoriusIndekso

    dalis

    Paieškos

    valdiklis

    Paieškos

    koordinatorius

    Duomenų šaltiniai

    Paieškos variklis

    1.1.1 pav. Primo komponentai ir jų tarpusavio ryšiai

    Normalizavimo šablonai ir duomenų praturtinimas konfigūruojami naudojant Primo

    administravimo modulį. Leidybos platforma palaiko reguliarų ir nenumatytą duomenų surinkimą ir

    skirtingų duomenų formatų apdorojimą, leidţia interaktyvų vykdomų darbų stebėjimą ir valdymą.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    9 Kaunas, 2009 m. gruodis

    1.1.2. Indeksatorius

    Indeksatorius yra paieškos variklio dalis naudojama indeksų dalims kurti. Paieškos variklis

    palaiko kelias paieškos duomenų dalis. Indeksų dalinimas yra efektyvus būdas išskirstyti, lygias

    pagal dydį, atminties dalis. Indeksatorius automatiškai susikeičia su paieškos mašinomis taip, kad

    indeksų dalys gali būti gaminamos nenutrūkstamai.

    Indeksatorius padalina faktinius duomenis į valdomas dalis, kurios uţkraunamos į atmintį.

    Kiekvienai daliai skirta atskira programinė gija (angl. thread). Kelios dalys gali būti toje pačiame

    serveryje, taip, kad visi jo procesoriai būtų išnaudojami efektyviai. Sistemai galima naudoti kelis

    serverius tam, kad ji nebūtų apribota uţimamos vietos atţvilgiu.

    1.1.2 paveiksle pateiktas Primo sistemos indeksavimo procesas.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    10 Kaunas, 2009 m. gruodis

    1.1.2 pav. Primo sistemos indeksavimo procesas

    1.1.3. Administravimo modulis

    Administravimo modulis su lengvai naudojama jo grafine sąsaja leidţia konfigūruoti ir stebėti

    visus Primo komponentus.

    Primo sistemos gyvavimo ciklas skirstomas į:

    pradinę konfigūraciją,

    nuolatinę prieţiūrą.

    Taip pat galima individualiai konfigūruoti sistemos elementus naudojant tam skirtus vedlius.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    11 Kaunas, 2009 m. gruodis

    1.1.4. Paieškos koordinatorius

    Koordinuoja paiešką, pasitelkdamas indeksų dalis ir apjungia paieškos rezultatus į vieningą

    rezultatų rinkinį.

    1.1.5. Paieškos agentai

    Paieškos agentai išdėstyti nutolusiose mašinose. Šie agentai stabdo ir paleidţia paiešką ir

    indeksavimo procesą. Agentui pasileidus, jis išsiunčia prisiregistravimo duomenis paieškos

    koordinatoriui. Agentai su koordinatoriumi komunikuoja naudodami Java RMI (angl. Remote

    Method Invocation) protokolą.

    1.1.6. Paieškos valdiklis

    Paieškos valdiklis išrenka bibliotekos metaduomenis iš vietinės Primo PNX duomenų bazės

    lentelės ir transformuoja ją į naudingą informaciją. Paieškos variklis paremtas Lucene technologija.

    Jis praplečia Lucene funkcionalumą, palaiko atminties dalijimą labai dideliems duomenų

    rinkiniams. Šias atminties dalis paruošia indeksuotojas. Taip pat paieškos varikliui priskiriamos šios

    funkcijos: rezultatų filtravimas, pasiūlymai patobulinti paiešką (angl.did u mean), puslapiavimas,

    rezultatų rikiavimas.

    1.1.7. Vartotojo paieškos sąsaja

    Vartotojo paieškos sąsaja atsakinga uţ Primo sąveiką su galutiniu vartotoju. Tai galingas ir

    lengvai naudojamas paieškos įrankis. Kiekviena institucija gali turėti jai pritaikytą atvaizdavimą.

    Kiekvienas atvaizdavimas gali turėti vieną ar daugiau kortelių. Kortelės leidţia padalinti Primo

    saugyklas (talpyklas) ir įrašus į grupes ar tipus. Kortelėje galima aprašyti kelias paieškos sritis. Šios

    sritys sugrupuoja įrašus.

    Galutinis vartotojas, naudodamasis vartotojo sąsaja, atlieka paiešką Primo PNX duomenų

    bazės lentelėje. Primo, naudodamasis surastais įrašais, patikrina prieinamumo prie resurso statusą

    šaltinio sistemoje (pvz., Aleph) ir sąveikauja su šaltinio sistema tam, kad galėtų pateikti daugiau

    informacijos vartotojui apie išteklių.

    1.1.3 paveiksle pavaizduotas paieškos procesas.

    1.1.8. Primo duomenų bazė

    Primo duomenų bazė naudoja Oracle 10 RDBVS, kurioje saugoma:

    Primo PNX įrašai ir vartotojo pateikta informacija (atsiliepimai, ţymės);

    stebėjimo informacija, statistika, detali paieškų informacija ir pan.;

    Primo konfigūracijos informacija.

    1.1.9. Paskirstytų sistemų principo taikymas Primo sistemoje

    Primo sistemą galima fiziškai išskaidyti į tokias dalis:

    Publikavimo platforma ir administravimo modulis, veikiantis JBoss aplikacijų serveryje.

    Vartotojo sąsaja ir paieškos valdikliai, veikiantys JBoss aplikacijų serveryje.

    Paieškos agentai (įskaitant indeksatorius), veikiantys RMI serveryje.

    Indeksų dalys, veikiančios RMI serveryje.

    Primo duomenų bazė, esanti Oracle serveryje.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    12 Kaunas, 2009 m. gruodis

    1.1.3 pav. Primo paieškos procesas

    Primo programinė įranga turi keturis skirtingus procesus (du JBoss serveriai, RMI serveris,

    Oracle serveris). Šie procesai gali būti paleisti skirtingose serveriuose ar tame pačiame serveryje,

    bei vieni − viename, kiti − kitame. Rekomenduojama turėti Oracle ir JBoss – publikavimo

    platformą ir Administravimo modulį viename serveryje, ir JBoss – vartotojo sąsajai bei RMI serverį

    paieškai kitame serveryje. 1.1.4 paveiksle pavaizduota fizinis sistemos vaizdas.

    1.1.4 pav. Primo sistemos fizinis vaizdas

    1.1.10. Primo administravimo modulio paskirstymas

    Diegiant Primo galima sukonfigūruoti keletą administravimo modulio instaliacijų. Tik

    vienas modulis yra aktyvus sistemos veikimo metu. Jei aktyvaus modulio darbas sutrinka, šį modulį

    galima pakeisti kitu. Tokiu atveju, kitą (neaktyvų) modulį reikia paleisti rankiniu būdu, nes

    dabartinė Primo versija (2.1.7) dar neturi galimybės automatiškai aptikti administravimo modulio

    sutrikimų ir į juos reaguoti.

    Konfigūruojant keletą administravimo modulių reikėtų atsiţvelgti šį tokius dalykus:

    Tik vienas administravimo modulis yra aktyvus sistemos veikimo metu, visi kiti privalo būti išjungti.

    Norint išvengti daugybės administravimo modulio nustatymų rankiniu būdu, visi jie turi būti susieti su ta pačia duomenų baze naudojant apkrovos stabilizatorių (ţiūr. skyrelį

    Apkrovos stabilizatoriaus taikymas). Jei apkrovos stabilizatorius nenaudojamas, tuomet

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    13 Kaunas, 2009 m. gruodis

    rankiniu būdu reikia atlikti susijusius su atitinkamo modulio mašinos adresu tokius

    nustatymus:

    pds_url, pds_configuration_url, Reports URL, Help Base URL, reporting_base, primo_admin_base, primo_base ir Search Statistics Report URL.

    Visi administravimo moduliai turi dalintis tuo pačiu katalogu, kuriame saugoma publikavimo kanalų informacija.

    Norint uţtikrinti, kad tik vienintelis administravimo modulis būtų aktyvus ir veikiantis, paleidimo paprogramėje reikia atlikti tokius nustatymus:

    patikrinti, ar kiti serveriai yra pasiekiami, bei paleisti jų išjungimo scenarijus; patikrinti, ar nėra prisijungimų prie kitų administravimo modulių prievadų; patikrinti, ar nėra paleidimo valdymo failo bendrame publikavimo kanalų kataloge.

    1.1.11. Vartotojo paieškos sąsajų paskirstymas

    Norint sumaţinti skaičiavimo apkrovas, kurias gali sukelti intensyvus akademinės

    bendruomenės naudojimasis Primo vartotojo paieškos sąsaja, galima įdiegti keletą vartotojų sąsajos

    serverių. Įmanomi šie vartotojo (paieškos) sąsajos diegimo variantai:

    Keletas vartotojo sąsajų serverių ir vienas paieškos valdiklis (Daug-su-vienu konfigūracija).

    Keletas vartotojo sąsajų serverių ir keletas paieškos valdiklių (Daug-su-daug konfigūracija).

    Daug-su-vienu konfigūracijoje (1.1.5 pav.), kiekviena vartotojo paieškos sąsaja turi tą pačią

    paieškos variklio konfigūraciją. Viena iš vartotojo paieškos sąsajų yra vadinama pagrindine, kuri

    gauna nurodymus iš administravimo modulio ir atlieka agentų stebėjimą. Kitos sąsajos vadinamos

    valdomosiomis ir vykdo komandas gautas iš pagrindinės sąsajos.

    1.1.5 pav. Daug-su-vienu konfigūracijos architektūra

    Daug-su-daug konfigūracijoje paskirstoma paieškų apkrova skirtingose paieškos varikliuose

    (1.1.6 pav.), tai sumaţina sistemos neveikimo laiką esant sutrikimams.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    14 Kaunas, 2009 m. gruodis

    1.1.6 pav. Daug-su-daug konfigūracijos architektūra

    Paleidus administravimo modulį, jis patikrina ar pagrindinė vartotojo paieškos sąsaja yra

    paleista. Jei ji nepaleista (ar neveikia, dėl klaidos), sistema apie tai pranešimu ţurnale ir periodiškai,

    pvz., kas 30 sekundţių, tikrina, kol ji bus paleista. Kai pagrindinė sąsaja paleista, administravimo

    modulis pasiima valdomųjų sąsajų sąrašą. Sutrikus pagrindinės sąsajos darbui, administravimo

    modulis atsitiktiniu būdu atrenka vieną valdomąją sąsają, kuriai priskiriamos pagrindinės sąsajos

    funkcijos.

    1.1.12. PDS paskirstymas

    Analogiškai administravimo moduliui, galima įdiegti keletą PDS (angl. Patron Directory

    services) paslaugų. Vienu metu gali veikti tik viena PDS paslauga. Konfigūravimo gairės keletui

    PDS:

    Visi PDS serveriai turi būti sukonfigūruoti naudojant administravimo modulio specialų vedlį.

    Visi PDS serveriai turi naudoti tą patį veikiančio PDS serverio adresą.

    Vienu metu vienintelis PDS serveris gali būti aktyvus.

    Visi vartotojo sąsajos serveriai turi būti perkrauti atlikus PDS nustatymus per administravimo

    modulį.

    1.1.13. Apkrovos stabilizatoriaus taikymas

    Turint keletą vartotojo paieškos sąsajų konfigūracijų, vadinamų Primo MFE (angl. Multiple

    Front End), naudojamas apkrovos stabilizatorius. Jis taikomas, kuomet yra Primo N+1 serverių su

    klaidos toleravimo technologija. Tipinę Primo MFE konfigūraciją sudaro dvi vartotojo paieškos

    sąsajos. Kaip vyksta stabilizatoriaus darbas įvykus gedimui paieškos sąsajose, pateikiama 1.1.7,

    1.1.8 ir 1.1.9 paveiksluose.

    Bet kuri iš Primo vartotojo paieškos sąsajų gali būti pašalinta iš stabilizatoriui priklausančios

    grupės prieţiūros tikslais. Pastaroji grupė turi būti perkonfigūruota tam, kad apkrovos stabilizatorius

    nustotų siųsti uţklausas, pašalintam serveriui. Rekomenduojama pašalinti sąsają tik tada, kai nėra

    aktyvių sesijų veikiančiame serveryje. Atitinkamai, jei norima pridėti serverį, reikia įtraukti jį į

    grupę.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    15 Kaunas, 2009 m. gruodis

    1.1.7 pav. Sistemos veikimas be sutrikimų

    1.1.8 pav. Sistema veikimas įvykus vartotojo sąsajos 1 gedimui

    1.1.9 pav. Sistemos veikimas sutvarkius vartotojo sąsajos 1 gedimą

    Apkrovos stabilizatorius vykstant vieno vartotojo sesijai, nukreipia vartotojus pagal jo IP

    adresą į tą patį serverį. Vartotojų uţklausų apkrova paskirstoma pagal serverių galią. Jei du serveriai

    turi tą pačią galią, jiems paskiriama po pusę visų vartotojų sesijų.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    16 Kaunas, 2009 m. gruodis

    1.1.14. Primo konfigūracijos perkėlimas iš testinio į produkcinį serverį

    Primo turi galimybę kopijuoti visus konfigūravimo duomenis, tokius kaip normalizavimo

    taisyklių rinkiniai, suderinimo lentelės, vidinės pusės nustatymai ar kodų lentelės iš vienos Primo

    instaliacijos į kitą. Tai paprastai daroma reguliaraus diegimo proceso metu pereinant nuo testinio

    instaliavimo prie produkcinio instaliavimo.

    Tam yra parengti reikalingi importavimo ir eksportavimo scenarijai, leidţiantys atskirai

    kopijuoti šiuos duomenis: normalizavimo taisyklių rinkinius, atvaizdavimo nustatymus ir visą

    duomenų bazę.

    Toliau apibūdinamos tokios procedūros:

    Visų konfigūravimo duomenų kopijavimas;

    Atvaizdavimo konfigūravimo duomenų kopijavimas;

    Normalizavimo taisyklių rinkinių kopijavimas;

    Visos duomenų bazės kopijavimas.

    1.1.15. Visų konfigūravimo duomenų kopijavimas

    Norint išeksportuoti/importuoti visą Primo konfigūraciją, reikia atlikti:

    visų konfigūravimo lentelių ir konfigūravimo failų eksportavimą ir pakavimą testinėje aplinkoje;

    importuoti visas konfigūravimo lenteles ir konfigūravimo failus produkcinėje aplinkoje.

    Prieš importavimą jo scenarijai patikrina, ar produkcinė instaliacija turi tos pačios versijos

    atnaujinimų paketus kaip ir testinė instaliacija. Prieš pradedant importavimą, visos egzistuojančios

    konfigūravimo lentelės yra ištrinamos.

    Procedūros eksportuoja ir importuoja šią informaciją:

    Oracle duomenų bazėje esančias lenteles (ţiūr. 1.1 priedą);

    Visus duomenis iš konfigūravimo failų, esančių kataloguose: o /exlibris/primo/p_/ng/primo/home/system/thirdparty/openserver/server/sear

    ch/deploy/primo_library-app.ear/primo_library-libweb.war/

    o css/ o help/ o images/ o static_htmls/

    Visus su PDS konfigūravimu susijusius duomenis iš: o /exlibris/primo/p_/pds/conf_table

    Visų konfigūravimo duomenų kopijavimo procedūra pateikta 1.1 priede.

    1.1.16. Atvaizdavimo konfigūracijų kopijavimas

    Atvaizdavimo konfigūracijos, apima šią informaciją:

    Atvaizdavimo konfigūracijos suderinimo ir kodų lenteles, susijusias su atvaizdavimu.

    Duomenis iš konfigūravimo failų, esančių vidiniuose

    /exlibris/primo/p_/ng/primo/home/system/thirdparty/openserver/server/search/

    deploy/primo_library‐app.ear/primo_library‐libweb.war kataloguose: o css/ o help/ o images/

    o static_htmls/

    Prieš importuojant atvaizdavimus, specialūs scenarijai sukuria atsargines atvaizdavimų ir

    susijusių lentelių kopijas, įvykdo patikrinimo procedūras, kurios uţtikrina, kad atvaizdavimai bus

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    17 Kaunas, 2009 m. gruodis

    funkcionalūs naujoje aplinkoje. Taip pat patikrina, ar produkcinė instaliacija turi tos pačios versijos

    atnaujinimų paketus kaip ir testinė instaliacija.

    Atvaizdavimai yra susiję su daugybe kitų elementų, įskaitant institucijas ir sritis – šie

    elementai nėra eksportuojami. Importavimo programa patikrina, ar institucijos ir sritys

    produkciniame serveryje yra tokios pačios kaip ir testiniame.

    Atvaizdavimo konfigūravimo duomenų kopijavimo procedūra pateikta 1.1 priede.

    1.1.17. Atstatymas iš atsarginių duomenų kopijos

    Prieš importuojant atvaizdavimą, importavimo/eksportavimo scenarijai sukuria atsargines

    egzistuojančių atvaizdavimų ir susijusių lentelių kopijas.

    Atvaizdavimų atsarginės kopijos failas yra išsaugomas $primo_dev/prm00/files kataloge

    naudojant tokį formatą:

    views_tables_import_backup..export.gz_aa

    Atstatymo iš atsarginių duomenų kopijos procedūra pateikta 1.1 priede.

    1.1.18. Normalizavimo taisyklių rinkinių kopijavimas

    Primo turi specialius scenarijus, kurie naudojami normalizavimo taisyklių rinkinių

    kopijavimui iš testinio serverio į produkcinį serverį.

    Šie scenarijai eksportuoja visus normalizavimo taisyklių rinkinius arba pasirinktus

    normalizavimo taisyklių rinkinius ir suderinimo lenteles iš „normalizavimo“ posistemės.

    Eksportavimui/importavimui vykdyti naudojamos tokios procedūros:

    export_nm_config.sh

    import_nm_config.sh

    Čia yra taisyklių rinkinio pavadinimas, o katalogas, kurį sukuria

    export_nm_config procedūra. Detali veiksmų seka pateikiama 1.1 priede.

    1.1.19. Visos duomenų bazės kopijavimas

    Visą duomenų bazę galima nukopijuoti naudojant /exlibris/primo/p_/primo/proc

    kataloge esančias procedūras (scenarijus):

    exp_c_g_conf.csh

    exp_schema.csh

    imp_schema.csh

    Prieš atliekant šias procedūras, rekomenduojama pasikonsultuoti su Ex Libris programinės

    įrangos palaikymo skyriumi. Detali veiksmų seka pateikiama 1.1 priede.

    1.2. ALEPH, METALIB, SFX IŠTEKLIŲ PUBLIKAVIMAS PRIMO SISTEMAI

    1.2.1. Aleph išteklių publikavimas

    Integralioje bibliotekos sistemoje Aleph yra numatyti du išteklių (bibliografinių bibliotekėlių)

    publikavimo būdai:

    pradinis (angl. initial) publikavimas,

    tęstinis (angl. ongoing) publikavimas.

    Pradinis publikavimas yra skirtas visų ištekliuje esančių bibliografinių įrašų publikavimui, o

    tęstinis publikavimo procesas skirtas publikuoti tik tuos bibliografinius įrašus kurie buvo

    atnaujinti/pasikeitė po pradinio publikavimo. Aleph sistemoje esančių išteklių publikavimo, į Primo

    paieškos sistemą, procesai yra šie:

    Publikuojamų išteklių aibių saugyklos konfigūravimas;

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    18 Kaunas, 2009 m. gruodis

    Bibliografinių bibliotekėlių publikavimo aibių ir bibliografinių įrašų papildymo (angl. expand) autoritetiniais ir administraciniais duomenimis konfigūravimas;

    Saugyklos aibių uţpildymas duomenimis ir publikavimas: o Pradinis (angl. initial) aibių publikavimas; o Tęstinis aibių pildymas ir publikavimas.

    1.2.1.2. Publikuojamų išteklių aibių saugyklos konfigūravimas

    Publikuojamų išteklių saugykla konfigūruojama sukuriant specialią Oracle duomenų bazės

    lentelę Z00P (joje yra saugojami visų publikuotų išteklių aibės), kuri yra sukuriama LBT00 (Aleph

    vartotojų bibliotekėlė). Svarbu atsiţvelgti į numatytų publikuoti bibliografinių duomenų dydį, ir

    numatyti pakankamai vietos kuriant Oracle duomenų bazės lentelę.

    1.2.1.3. Bibliografinių bibliotekėlių publikavimo aibių ir bibliografinių įrašų papildymo

    (enrichment/expand) autoritetiniais ir administraciniais duomenimis konfigūravimas

    Bibliografinių bibliotekėlių publikavimo aibės konfigūruojamos suteikiant bibliografinei

    bibliotekėlei publikuojamos aibės pavadinimą (aibės pavadinimas turi būti unikalus), nustatyti

    procedūras reikalingas bibliografinių įrašų papildymo autoritetiniais ir administraciniais

    duomenimis (jos aprašomos kitame konfigūraciniame faile tab_expand, todėl nurodomas

    identifikatorius esantis tame faile) ir nustatyti konfigūruojamos aibės saugyklos formatą.

    Publikuojamos aibės konfigūracijos parametrai saugomi tab_publish faile: ! 1 2 3 4 5

    !!!!!!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!-!-!!!!!-!!!!!!!!!!!!!!!

    KMU01 N FULL MARC_XML

    Pirmas stulpelis nurodo publikuojamos aibės pavadinimą, antrame stulpelyje galima nurodyti

    loginę bazę jei tokia yra nustatyta ištekliuje, ketvirtame stulpelyje nurodoma bibliografinių įrašų

    papildymo procedūrų identifikatorius, kuris aprašytas tab_expand faile, penktajame stulpelyje

    nurodoma išteklių saugykloje saugomos aibės formatas.

    tab_expand faile nustatoma, kokios bibliografinio įrašo papildymo procedūros bus

    naudojamos įrašant bibliografinį įrašą į publikuojamų išteklių saugyklą: ! 1 2 3

    !!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!!!!!!!!!!>

    FULL expand_doc_bib_avail

    FULL expand_doc_bib_accref_1

    Pirmame stulpelyje nurodomas bibliografinių įrašų papildymo procedūrų identifikatorius,

    antrajame stulpelyje nurodomas vykdomos procedūros pavadinimas, trečiajame stulpelyje nurodomi

    parametrai, jei tokie yra, kurie perduodami vykdomai procedūrai.

    1.2.1.4. Išteklių saugyklos aibių uţpildymas duomenimis ir publikavimas

    Išteklių saugyklos aibės uţpildomos atliekant pradinį publikavimą, kuris yra vykdomas vieną

    kartą ir vykdant tęstinio publikavimo procedūras (šios procedūros yra vykdomos foniniu reţimu).

    Pradiniam išteklių saugyklos aibių uţpildymui naudojama Aleph p_publish_04 procedūra. Ši

    procedūra turi būti vykdoma tiek kartų, kiek yra numatytų publikuoti išteklių aibių. LABT projekto

    rėmuose Aleph serveryje yra sukurtas ir įdiegtas scenarijus (angl. script) labt_publish_full,

    automatizuojantis pradinį visų išteklių saugyklos aibių uţpildymo procesą.

    1.2.1.5. Pradinis išteklių saugyklos publikavimas

    Pradiniam publikavimui naudojama Aleph p_publish_06 procedūra. Ši procedūra skirta

    publikuotų aibių turiniui (įrašams) išsaugoti archyvuose (suspaustame UNIX archyvo failo formate

    – tar.gz) , kiekvieną įrašą išsaugant atskiruose failuose esančiuose tame archyve. Pradiniame

    publikavime ši procedūra taip pat turi būti vykdoma tiek kartų, kiek yra numatytų publikuoti

    išteklių aibių. LABT projekto rėmuose sukurtame scenarijuje labt_publish_full numatytas šios

    procedūros vykdymas kiekvienam iš numatytų publikuoti įrašų aibių.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    19 Kaunas, 2009 m. gruodis

    1.2.1.6. Tęstinis išteklių saugyklos aibių pildymas ir publikavimas

    Tęstinis aibių pildymas ir publikavimas skirtas bibliografinių įrašų, kurie buvo

    atnaujinti/pakeisti, atnaujinimui išteklių saugyklos aibėse ir publikavimui. Atnaujinti/pasikeitę

    bibliografiniai įrašai yra registruojami ir atnaujinami išteklių saugyklos aibėse naudojant Aleph

    ue_21 procedūrą, kuri yra vykdoma kiekvienam publikuotam ištekliui (ši procedūra yra paleidţiama

    po pradinio publikavimo ir yra vykdoma, kol ją sustabdo Aleph sistemos

    administratorius/bibliotekininkas ar vykdant p_publish_04 procedūrą. Tęstinis publikavimas

    atliekamas vykdant Aleph p_publish_06 procedūrą tam tikrais nustatytais laiko tarpais. LABT

    projekto rėmuose Aleph serveryje automatizuojant tęstinį publikavimą, yra sukurtas ir įdiegtas

    scenarijus labt_check_publish. Skirtingai nuo pradinio publikavimo, tęstinis publikavimas

    suformuoja archyvą tik iš atnaujintų/pasikeitusių įrašų.

    Aleph sistemoje publikuojami ištekliai (2009-12-10 duomenys):

    LABT institucija/projektas Išteklius (Aleph

    bibliotekėlė)

    Aibės pavadinimas

    išteklių saugykloje

    Publikuotų

    įrašų kiekis

    eLABa-ETD projektas ETD01 ETD01 11927

    eLABa projektas ELB01 ELB01 3849

    HSM projektas HSM01 HSM01 121

    LIT projektas LIT01 LIT01 20739

    LABT LBT02 LBT02 36381

    Kolegijos KOL01 KOL01 53588

    Kauno technologijos universitetas

    KTU01 KTU01 93456

    KPI01 KPI01 16082

    KTU02 KTU02 37114

    KTU03 KTU03 650

    Kauno medicinos universitetas KMU01 KMU01 38433

    KMU02 KMU02 72332

    Vadybos ir ekonomikos universitetas ISM01 ISM01 4048

    ISM02 ISM02 328

    Klaipėdos universitetas KUB01 KUB01 104493

    KUB02 KUB02 5943

    Generolo Jono Ţemaičio Lietuvos

    karo akademija

    LKA01 LKA01 13457

    LKA02 LKA02 71

    Lietuvos kūno kultūros akademija LKK01 LKK01 11231

    LKK02 LKK02 4211

    Lietuvos muzikos ir teatro akademija LMT01 LMT01 21178

    Lietuvos veterinarijos akademija LVA01 LVA01 12738

    LVA02 LVA02 2078

    Lietuvos ţemės ūkio universitetas

    LZU01 LZU01 27325

    LZU02 LZU02 23720

    LZU03 LZU03 3

    Lietuvos mokslų akademijos

    biblioteka

    MAB01 MAB01 214361

    MAB03 MAB03 2956

    MAB04 MAB04 56372

    MAB05 MAB05 32818

    Mokslo institutai

    MIB01 MIB01 61585

    MIB03 MIB03 292

    MIB04 MIB04 65

    MIB05 MIB05 40

    Mykolo Romerio universitetas MRU01 MRU01 42400

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    20 Kaunas, 2009 m. gruodis

    MRU02 MRU02 5790

    Šiaulių universitetas SUB01 SUB01 69480

    SUB02 SUB02 6234

    Vilniaus dailės akademija VDA01 VDA01 22289

    Vytauto Didţiojo universitetas

    VDU01 VDU01 80124

    VDU02 VDU02 7383

    VDU03 VDU03 5174

    VDU04 VDU04 365

    VDU05 VDU05 4326

    VDU06 VDU06 7

    Vilniaus Gedimino technikos

    universitetas

    VGT01 VGT01 71477

    VGT02 VGT02 19733

    VGT03 VGT03 10286

    VGT04 VGT04 4964

    VGT05 VGT05 25230

    Vilniaus pedagoginis universitetas

    VPU01 VPU01 74626

    VPU02 VPU02 7009

    VPU03 VPU03 3167

    Vilniaus universitetas

    VUB01 VUB01 389381

    VU301 VU301 2386

    VUB02 VUB02 34609

    VUB03 VUB03 4573

    VUB05 VUB05 11560

    VUB06 VUB06 2505

    VUB07 VUB07 12230

    Springer SPR01 SPR01 9373

    Viso publikuotų įrašų 1910666

    1.2.2. MetaLib išteklių publikavimas

    Primo gali naudoti LVB komponentą, veikiantį MetaLib programinės įrangos pagrindu,

    atliekant informacijos paiešką unifikuotoje formoje iš įvairių bibliotekinės paskirties informacijos

    sistemų ir duomenų bazių (prenumeruojamų ir laisvai prieinamų) on-line (nutolusiu) būdu. Primo,

    naudodama MetaLib, vykdo paiešką LVB paieškos aibėje (angl. quick-set), kurioje nurodyti

    išoriniai ištekliai. Ši paieška vykdoma lygiagrečiai (paieška vykdoma visuose paieškos aibėje

    nurodytuose ištekliuose vienu metu).

    Kiekvienai paieškos aibei turi būti suteiktas pavadinimas (kodas), atitinkantis institucijos,

    aprašytos MetaLib konfigūracijoje, kodą. Ši sąlyga uţtikrina Primo paiešką išoriniuose ištekliuose.

    MetaLib CKB (angl. Central Knowledge Base) publikavimui skirtos procedūros neturi

    tęstinio publikavimo galimybės. MetaLib CKB yra visada visa publikuojama. Publikavimo procesai

    yra vykdomi inicijuojant juos per MetaLib valdymo sąsają. Prieš uţkraunant publikuotą MetaLib

    CKB į Primo, jau esami duomenys turi būti ištrinti.

    1.2.3. SFX išteklių publikavimas

    Primo gali naudoti MARC 21 įrašus, kuriuose aprašomi SFX KB (angl. Knowledge Base)

    saugojami e. ţurnalų (angl. e-journal) ir e. knygų (angl. e-books) ištekliai. Šie įrašai turi būti

    publikuojami su papildoma informacija, apimančia aktyvius (naudojamus) visateksčių (angl. Full-

    text) ţurnalų ir knygų išteklius. Šių įrašų publikavimui naudojama speciali SFX vidinė

    procedūra/programa SFX2Primo, leidţianti publikuoti visus aktyvius išteklius aprašančius įrašus,

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    21 Kaunas, 2009 m. gruodis

    esančius SFX KB, pradiniam (angl. initial) publikavimui arba naujus/atnaujintus išteklius,

    aprašančius įrašus tęstiniam (angl. ongoing) publikavimui.

    1.3. LABT INSTITUCIJŲ KONFIGŪRAVIMAS PRIMO SISTEMOJE

    1.3.1. Primo administracinė struktūra

    Vieną Primo įdiegimą gali naudoti viena institucija arba kelios institucijos, sudarančios

    konsorciumą. Keletas konsorciumų gali sudaryti superkonsorciumą. Primo institucija yra

    pagrindinis administracinis Primo vienetas. Institucija taip pat yra pagrindinis vienetas išteklių

    pateikimo atţvilgiu. Vienas Primo portalas gali turėti daug duomenų pateikimo sistemų ir Primo

    turi turėti informaciją, į kurią pateikimo sistemą nukreipti vartotoją. Pvz., Primo gali nukreipti

    vartotoją į specifinį SFX įdiegimą arba į integruotos bibliotekų sistemos (pvz., Aleph) serverį.

    Primo institucijas galima prilyginti „plytoms“ – jas galima įvairiai dėlioti tam, kad patenkinti

    įvairius poreikius.

    Kiekviena institucija turi ribotą IP adresų skaičių. Vartotojas yra priskirtas vienai Primo

    institucijai, kuri nustatoma pagal vartotojo prisijungimo vardą per PDS paslaugas. Jei vartotojas

    neprisijungęs, Primo bando nustatyti instituciją iš vartotojo IP adreso. Jei to padaryti negalima,

    Primo nukreipia vartotoją į iš anksto nustatytą instituciją.

    Institucija turi ne tik vietinius, bet ir nutolusius išteklius. Primo vykdo nutolusių išteklių

    paiešką per MetaLib.

    Institucija gali turėti daug bibliotekų ir/arba talpyklų. Primo biblioteka yra smulkesnis

    institucijos padalinys, kuriam priklauso fiziniai ištekliai. Išteklius Primo sistemoje yra aprašomas

    normalizuotu Primo įrašu (angl. Primo Normalized XML) (PNX). Kiekviena biblioteka turi

    priklausyti vienai institucijai.

    Jei yra daugelio institucijų Primo portalas, reikia apsvarstyti, ar nebūtų tikslinga nurodyti taip

    vadinamą centrinę instituciją tokiais atvejais:

    1. Yra vienas Primo atvaizdavimas, kuris priklauso visoms institucijoms arba konsorciumo

    centrinei administracijai. Kiekvienas atvaizdavimas turi būti susietas su numatyta institucija,

    kuri gali būti viena iš junginį sudarančių institucijų arba centrinė institucija.

    2. Egzistuoja duomenų šaltinis, kuris priskiriamas keletui ar visoms institucijoms.

    Vartotojai yra priskirti institucijoms tinklo narėms, o ne centrinei institucijai. Ribotos

    paieškos sritys ir pateikimo sritys nustatomos tik institucijoms – konsorciumo narėms (toliau –

    institucijoms narėms), kadangi jos yra vartotojų institucijos.

    Apsibrėţus institucijos administracinę struktūrą, Primo sistemoje ji sukonfigūruojama

    naudojant Pradinį konfigūravimo vedlį (angl. Initial Configuration Wizard).

    LABT struktūroje aukščiausias hierarchijos laiptelis yra Lietuvos akademinių bibliotekų

    tinklas LABT. Atlikus pradinį konfigūravimą, LABT Primo įdiegime išskirta 19 institucijų, kurios

    turi savo bibliotekas.

    1.2 priede pateikiamos LABT institucijos, 1.3 priede pateikiamos institucijų bibliotekos.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    22 Kaunas, 2009 m. gruodis

    Nacionalinis

    katalogas

    1 Konsorciumas 1 Konsorciumas 1 Konsorciumas

    1 Universitetas1 Universitetas1 Universitetas

    Centrinė

    biblioteka

    Skaitmeninė

    talpykla

    Farmacijos

    biblioteka

    Superkonsorciumas

    Konsorciumas

    Primo institucija

    Primo bibliotekos

    1.3.1 pav. Primo administracinė struktūra

    1.3.2. Duomenų šaltiniai

    Primo duomenų bazėje gali būti duomenys iš daugelio šaltinių. Pvz., galima įtraukti

    bibliografinius ir fondų duomenis iš LABT bibliotekų informacijos sistemų (BIS), veikiančių

    integruotos bibliotekų sistemos Aleph pagrindu, skaitmeninius ir elektroninius išteklius iš

    skaitmeninės talpyklos ir nutolusius išteklius.

    Diegiant Primo reikia nustatyti esamus ir planuojamus duomenų šaltinius LABT institucijoje,

    kurių duomenys bus pateikiami Primo sistemai. Tam, kad efektyviai vykdyti išteklių paieškos ir

    pateikimo funkcijas, Primo surenka duomenis ir transformuoja juos į paprastą arba praturtintą įrašą

    PNX formatu.

    Kadangi visi įrašai iš duomenų šaltinių paprastai yra surenkami ir apdorojami pradinio

    duomenų įkėlimo metu, o duomenų gali būti labai daug ir siekiant taupyti perkėlimo laiką, Primo

    kūrėjai (kompanija Ex Libris) rekomenduoja kopijuoti iš Primo serverio lokalaus disko. Atlikus

    pradinę migraciją, vėliau surenkami tik nauji, atnaujinti ir ištrinti įrašai.

    Visi informaciniai laukai, įtraukiami į kiekvieną PNX įrašą, turi būti randami viename

    duomenų šaltinio įraše, kurį galima identifikuoti unikaliu identifikatoriumi. Todėl bet kokia

    informacija, kuri yra įrašuose, susijusiuose su pagrindiniu įrašu, turi būti prijungta prie pagrindinio

    įrašo.

    Pvz., kai fondų informacija yra saugoma viename ar keliuose įrašuose, susijusiuose su

    pagrindiniu bibliografiniu įrašu, šią fondų informaciją reikės prijungti prie bibliografinio įrašo.

    Kai duomenys gaunami iš Aleph, visa atitinkama informacija apie fondus ir prieinamumą

    prijungiama prie bibliografinių įrašų specialia programa. Autoritetinių duomenų bazių informacija

    prijungiama naudojant kitą specialią programą.

    Kiekvieno duomenų šaltinio įrašo struktūra turi atitikti vieną iš standartinių formatų:

    MARCXML;

    MARC Exchange format (ISO 2709);

    Dublin Code XML.

    PNX įraše gali būti ir nestandartinių laukų.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    23 Kaunas, 2009 m. gruodis

    1.3.3. Paieškos sritys

    Paieškos srityje grupuojami įrašai tam, kad būtų ieškoma tik juose. Paieškos sritis gali būti

    dviejų tipų: vietinių ir nutolusių išteklių.

    Vietinių išteklių paieškos sritis – Primo talpyklos poaibis (tai analogiška Aleph loginei bazei). Pradiniuose nustatymuose vietiniai ištekliai apima visą Primo talpyklą. Vienas

    Primo įrašas gali priklausyti kelioms vietinėms paieškos sritims.

    Daugeliui institucijų papildomos paieškos sritys gali būti nereikalingos. Kai Primo diegiamas

    konsorciumuose, kiekviena institucija gali turėti savo atskiras paieškos sritis, kuriose yra tik tos

    institucijos ištekliai. Be to, bendra sritis apims visos talpyklos išteklius.

    Skaitmeninė talpykla Skaitmeninė talpykla

    Bibliotekos

    katalogas

    Bibliotekos

    katalogas

    A institucija B institucija

    Konsorciumo

    katalogas

    Primo talpykla

    1.3.2. pav. Vietinių išteklių paieškos sritys

    Nutolusių išteklių paieškos sritys – nutolusių įrašų išteklių poaibis. Nutolusių išteklių sritis sudaroma iš MetaLib Quick Sets, t. y. nutolusių išteklių sąrašų, kurie

    sukonfigūruojami pagal specifines vartotojų grupes. Rasti ištekliai yra konvertuojami į

    PNX įrašus ir pateikiami per Primo sistemą.

    Pvz., konsorciumas, kuriame yra trys institucijos, gali turėti skirtingą atvaizdavimą kiekvienai

    institucijai arba galima nuspręsti, kad norima turėti keturis atvaizdavimus – po vieną kiekvienai

    institucijai ir vieną bendrą. Atskirai institucijai iš anksto numatytos sritys yra šios: institucijos

    vietinių išteklių komplektas (institucijos katalogas, specialieji institucijos katalogai, publikacijos ir

    kt.), papildomi bendri konsorciumo ištekliai, kuriais dalijasi visos konsorciumo institucijos, ir

    nutolę ištekliai, kuriuos sudaro MetaLib Quick Sets sąrašas.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    24 Kaunas, 2009 m. gruodis

    Vartotojai

    Institucija

    Bibliotekos katalogas

    Skaitmeninė talpykla

    SFX

    Publikacijos

    2. Nutolusių išteklių paieška ir

    pateikimas

    MetaLib

    1. Pateikimas

    1.3.3 pav. Institucijos išteklių schema

    1.3.4. Ribotos paieškos sritys

    Ribotos paieškos sritys – tai ribotos paieškos sritys specifiniams vartotojams. Tik vartotojai,

    kuriems suteikti įgaliojimai perţiūrėti ribotos prieigos įrašus, galės juose atlikti paiešką ir jos

    rezultatus matyti per Primo. Pvz., paieškos sritį „Rankraščiai“ galima apriboti, kad joje ieškoti ir

    matyti rezultatus galėtų tik absolventai.

    Apriboti galima tokius parametrus:

    „Institucija“ – prieiga prie išteklių leidţiama tik tam tikros institucijos vartotojams.

    „Vartotojų grupė“ – prieiga prie išteklių leidţiama tik tam tikroms vartotojų grupėms. Viena iš grupių gali būti „ne svečias“, tai reiškia, kad vartotojas nebūtinai turi

    priklausyti tam tikrai grupei, bet jis turi prisijungti prie sistemos.

    „Universiteto intranetas/ne universiteto intranetas“ leidţia prieigą prie išteklių pagal tai, ar vartotojas jungiasi iš universiteto intraneto – t. y. ar vartotojo IP adresas priklauso

    institucijai.

    Įvairiai nustatant šiuos parametrus, galima nustatyti norimą prieigos statusą, pvz., kad

    universiteto vartotojai prenumeruojamos duomenų bazės išteklius galėtų gauti tik jungdamiesi iš

    universiteto intraneto.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    25 Kaunas, 2009 m. gruodis

    Skaitmeninė

    talpyklaSkaitmeninė

    talpykla

    Bibliotekos

    katalogas

    Bibliotekos

    katalogas

    A institucija B institucija

    Primo

    talpykla

    Apribota paieškos sritisPaieškos sritis

    1.3.4. pav. Ribotos paieškos sritys

    1.4. ALEPH, METALIB IR SFX DUOMENŲ ŠALTINIŲ KONFIGŪRAVIMAS

    PRIMO SISTEMOJE

    Primo gali surinkti duomenis iš Aleph, MetaLib, SFX ir kitų sistemų.

    Aleph atveju, duomenys yra surenkami panaudojant Aleph publikavimo mechanizmą.

    Pastarasis yra teikiamas nuo Aleph 16 versijos. Šis mechanizmas suteikia galimybę Aleph sistemoje

    paskirstytus duomenis pateikti Primo priimtinu būdu (vieno objekto, pvz., leidinio) duomenis

    viename įraše, pridedant OAI-PMH antraštę ir pan.

    Prenumeruojamoms duomenų bazėms įtraukti į Primo, yra galimybė surinkti IRD (angl.

    Information Resource Description) įrašus iš MetaLib sistemos. MetaLib sistema tuo tikslu (nuo

    MetaLib 4 versijos) turi specialią duomenų eksportavimo galimybę. MetaLib atveju nėra galimas

    tęstinis surinkimas ir kaskart pateikus duomenų uţklausą yra gaunamas pilnas duomenų rinkinys.

    Tam, kad uţtikrinti duomenų suderinamumą tarp Primo ir MetaLib sistemų, prieš vykdant naujų

    duomenų įkėlimą, reikia išvalyti „senus“ Primo duomenis. Primo sistema duomenis iš MetaLib gali

    surinkti ir paieškos metu, todėl juos nebūtina saugoti Primo sistemoje. Surenkant duomenis

    paieškos metu, juos reikia papildomai apdoroti, todėl paieškos trukmė gali gerokai išaugti ir tuo

    sukelti nepatogumų galutiniam vartotojui.

    SFX atveju, duomenų pateikimui kitoms sistemoms yra naudojama specialiai tam sudaryta

    programa SFX2Primo, kuri suteikia galimybę išeksportuoti tiek visus duomenis pradiniam įkėlimui,

    tiek ir po pradinio įkėlimo laike pakitusius duomenis tęstiniam duomenų surinkimui. SFX tokiu

    būdu gali pateikti duomenis apie e. ţurnalus ir e. knygas. Pastebėsime, jog dabartinė SFX versija 3

    automatiškai neprideda Primo sistemai reikalingų OAI-PMH antraščių kiekviename įrašo faile,

    todėl tokiai antraštei suformuoti reikia panaudoti specialiai tam skirtą XSL (angl. Extensible

    Stylesheet Language) transformaciją (SFXOAI.xsl).

    Duomenų šaltinių konfigūravimas prasideda nuo institucijų sąrašo sudarymo.

    Institucija yra apibrėţiama nurodant jos pavadinimą, kodą, aprašymą ir, jei reikia, kitą su

    MetaLib, SFX ir Aleph sistemomis susijusią informaciją.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    26 Kaunas, 2009 m. gruodis

    1.4.1 pav. Institucijų konfigūravimo lango fragmentas

    Nustačius institucijas, kuriami duomenų šaltiniai. Tam yra nurodomas šaltinio pavadinimas,

    aprašymas, pateikiamų duomenų formatas (arba tiesiog XML jei duomenys struktūrizuoti paprastu

    XML), šaltinio sistema, institucija (sukurta prieš tai), XSL transformacijos failas (jei reikia) ir kita

    informacija.

    1.4.2 pav. Duomenų šaltinio konfigūravimo lango fragmentas

    Parinkus duomenų šaltinius, galima kurti publikavimo kanalus, kurie ir atlieka visą reikiamą

    duomenų surinkimą iš išorinių publikavimo sistemų.

    1.5. NORMALIZAVIMO TAISYKLĖS IR JŲ TAIKYMAS PRIMO SISTEMOJE

    1.5.1. Normalizuoto įrašo struktūra

    PNX įrašas yra struktūrizuotas, kur kiekviena sekcija turi savo paskirtį. Duomenys gali

    dubliuotis, tačiau duomenų manipuliavimui Primo tikslams tai suteikia lankstumo.

    PNX struktūra:

    Control – ši sekcija apima duomenis, naudojamus kontrolės tikslams. Control sekcijos turinys (sąrašas):

    o sourceid – šaltinio ID. Identifikuoja Primo šaltinio saugyklą (talpyklą). Kiekviena šaltinio saugykla turi konfigūracijos failą, kuriame uţfiksuota sourceid ir kita šaltinio

    saugyklos informacija.

    o originalsourced – pradinio šaltinio ID. Šaltinio sistemoje identifikuoja šaltinio saugyklą. Tai nėra tas pats, kas šaltinio saugyklos identifikatorius Primo sistemoje

    (pvz., USM01).

    o sourcerecorid – šaltinio įrašo ID. Identifikuoja įrašą šaltinio saugykloje (taip kaip Aleph sistemos numeris pateiktas MARC 21 tag 001). Šis ID privalo būti unikalus ir

    nuolatinis (pastovus) šaltinio saugykloje. sourcerecordid yra pateikiamas iš OAI-

    PMH antraštės (angl. header).

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    27 Kaunas, 2009 m. gruodis

    o addsrcrecordid – papildomo šaltinio įrašo ID. o recordid – įrašo ID. Primo saugyklos unikalus įrašo identifikatorius. recordid

    sukuriamas apjungiant sourceid ir sourcerecordid (pvz., Aleph sistemos numeris +

    tag 001).

    o sourcetype – šaltinio tipas. Kol kas jis nenaudojamas. o sourceformat – šaltinio formatas. Identifikuoja šaltinio įrašo pradinį formatą, kaip,

    pvz., MARC 21, Dublin Core, MAB2 ir pan.

    o sourcesystem – šaltinio sistema. Identifikuoja šaltinio saugyklos naudojamą sistemą, kaip, pvz., Aleph, MetaLib, SFX ir pan.

    o recordtype – įrašo tipas. Kol kas jis nenaudojamas. o lastmodified – paskutinės modifikacijos data. Kol kas jis nenaudojamas.

    Display – ši sekcija saugo duomenis naudojamus vartotojo sąsajos vaizdavimo formatams. Šioje sekcijoje naudojamų duomenų bazė yra Dublin Core elementų

    rinkinys. Dublin Core buvo pasirinktas kaip metaduomenų standartas, kuris skirtas

    palaikyti plačiam tikslų ir išteklių tipų diapazonui. Kai kuriais atvejais, Dublin Core

    elementų pavadinimai buvo modifikuoti ir papildyti tam tikru skaičiumi papildomų

    laukų. PNX Link laukas apima duomenis grįstus nuorodos tipu:

    o Statinis – Link laukas saugo URL. Statiniam URL gali prireikti kelių institucijos, kuriai priklauso ir teksto atvaizdavimo, atributų. Šie atributai yra paţymėti polaukio

    skyrikliais, pvz.,$$uURL$$dDisplay text$$iInstitution).

    o Suplanuotas (sukurtas, dinaminis) – šie URL yra sukurti iš šablonų, kurie apibrėţti Primo administraciniame modulyje. Link laukas turi URL šablono kodą, šablono

    (savininko) vietos ir institucijos duomenis (jei keletas to paties tipo laukų yra pridėti

    skirtingoms institucijoms).

    Display sekciją sudaro tokie laukai:

    o type; o source; o title; o vertitle; o unititle; o creator; o contributor; o description; o edition; o format; o identifier; o language; o publisher; o creationdate; o subject; o coverage; o relation; o ispartof; o rights; o availlibrary; o availinstitution; o availpnx; o userreview; o userrank.

    Links – ši sekcija kaupia nuorodas (ryšius, sąsajas), kurios gali būti panaudotos GetIt! funkcijos kūrimui ir/arba įrašo vaizdavimo nuorodų kūrimui (pvz., nuoroda į turinio

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    28 Kaunas, 2009 m. gruodis

    lentelę). Link sekcija apima keletą laukų, iš kurių kiekvienas simbolizuoja Primo

    funkciją. Šią sekciją sudaro tokie laukai:

    o openurl; o openurlfullt; o openurlservice; o linktoholdings; o linktorequest; o backlink; o linktorsrc; o linktotoc; o linktoabstract; o linktoreview; o linktoprice; o linktoextract; o thumbnail; o linktofindingaid; o linktouc; o additionallinks.

    Search – ši sekcija saugo duomenis (įskaitant metaduomenis ir pilnus duomenis [full-text]), kurie buvo suindeksuoti paieškos metu. Šią sekciją sudaro tokie laukai:

    o Creatorcontrib; o title; o alttitle; o addtitle; o description; o subject; o isbn; o issn; o fulltext; o toc; o rsrctype; o creationdate; o usertag; o recordtype; o sourceid; o recorded; o general; o addsrcrecordid; o searchscope; o ressearscope; o scope; o pnxtype; o matched; o frbrid; o syndetics_fulltext; o syndetics_toc.

    Facets – ši sekcija naudojama aspektinio (angl. faceted) naršymo vartotojo sąsajoje sukūrimui. Aspektai skirti padėti vartotojui tikslinti rezultatus (rezultatų sąrašą). Vienas

    įrašas gali turėti daugelį aspektų tipų. Šią sekciją sudaro tokie laukai:

    o rsrctype; o language; o creatorcontrib;

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    29 Kaunas, 2009 m. gruodis

    o topic; o genre, classificationlcc, classificationddc, classificationudc; o classificationrvk; o creationdate; o format; o filesize; o collection; o library; o toplevel; o prefilter; o related; o pnxdate.

    Sort – laukai šioje sekcijoje gali būti naudojami kaip pagrindas rezultatų rūšiavimui. Šią sekciją sudaro tokie laukai:

    o Creation Date; o Popularity; o Title.

    Duplicate Record Detection – dublikatų aptikimo ar atitikimo (matching) procesas, kuris yra grindţiamas kiekvieno PNX įrašo dublikato šalinimo vektoriaus kūrimu Primo

    duomenų bazėje. Vektorius apima visus duomenis, reikalingus dublikatų aptikimo

    algoritmui, kuriuo metu nustatoma ar du įrašai yra ekvivalentūs.

    Dubliuotiems įrašams priskiriami tie patys matchID. Kiekvienai dubliuotų įrašų grupei,

    dublikatų šalinimo procesas sukuria sulietą įrašą. Paieškos mašina nuskaito ir

    indeksuoja tiktai sulietus įrašus.

    Dublikatų šalinimo vektorius yra sukuriamas normalizavimo proceso metu. Dubliuoto

    įrašo aptikimas yra atskiras procesas, vykdomas po to, kai įrašai yra uţkraunami į Primo

    duomenų bazę. Dubliuotos informacijos įrašo turinys:

    o Control section – dauguma laukų sulieti. o Display section – source ir availlibrary laukai yra sulieti; availinstitution ir availpnx

    laukai yra perskaičiuoti.

    o Links section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Search section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Sort section – imama tik iš pageidautinų (from preferred) laukų. o Facets section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Dedup section – nėra svarbus (neaktualus). o FRBR section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Delivery section – visi laukai sulieti. o Ranking section – imamas didţiausią reikšmę turintis įrašas. o Enrichment section – nėra svarbus (neaktualus). o Additional data section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti.

    FRBR – grupavimo procesas, kurio metu sistema atlieką įrašų grupavimą pagal FRBR standartą. Grupavimo procesas paremtas kiekvieno įrašo vektoriaus kūrimu. Vektorius

    apima vieną ar kelis raktus, kurių pagalba identifikuojama grupė. Įrašai, kurie turi

    atitikimo raktą, yra dedami į FRBR grupę ir paţymimi grupės ID (FrbrID). Kiekvienas

    įrašas gali priklausyti tik vienai grupei. Todėl, kai tik įrašas yra priderintas (angl.

    matched) prie egzistuojančios grupės, Primo šiam įrašui nutraukia grupavimo procesą.

    Vartotojo paieškos sąsajoje Primo dinamiškai iš grupės parinks vieną įrašą, kuris bus

    vaizduojamas kaip bendras rezultatų sąrašas – tai yra „pageidautinas“ įrašas.

    Pageidautinas įrašas rezultatų sąraše turi aukščiausią reitingą (įvertinimą).

    FRBR sekcija turi FRBR vektorių. Vektorius turi dvi dalis:

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    30 Kaunas, 2009 m. gruodis

    o Type (T) – tipas gali būti naudojamas įrašų rinkinio grupavimui pagal FRBR standartą, naudojant skirtingus FRBR algoritmus.

    o Keys (Kn) – raktas yra sukurtas iš specifinio įrašo šaltinio lauko, pagal kurį galima nustatyti grupę, kuriai priklauso šis įrašas. Raktai yra tikrinami pradedant K1 raktu.

    Duomenys privalo būti normalizuoti.

    Delivery – ši sekcija apima informaciją, kuri reikalinga (rezultatų) pateikimui (pateikimo valdymui). Primo naudojamas institucinių (angl. institutional) išteklių

    radimui ir pateikimui. Iš principo, Primo teikia pateikimo paslaugas susiejant vartotojus

    su kitomis programomis, pvz., Aleph – uţklausų išdėstymui, skaitmeninė talpykla –

    skaitmeninių objektų perţiūrai. Prieiga prie tokių išteklių yra kontroliuojama vietinės

    programos, bet ne Primo. Tačiau Primo turi informaciją apie elemento tinkamumą ir

    bando pateikti ryšį (sąsają) į geriausią galimą pateikimo parinktį (GetIt! funkcija). Šią

    sekciją sudaro tokie laukai:

    o institution; o delcategory; o resdelscope; o fulltext.

    Ranking – ši sekcija apima du „spartintojo“ (angl. booster) laukus, kurie gali būti panaudoti pagreitintam įrašų klasifikavimui (rikiavimui). Šią sekciją sudaro tokie

    laukai:

    o Booster1; o Booster2.

    Enrichment – ši sekcija apima duomenis, kurie reikalingi rezultatų gerinimo (praturtinimo) procese. Pastarojo proceso rezultatai nėra kaupiami šioje sekcijoje, bet

    yra kaupiami viename iš tokių laukų: Display, Search, Facets arba Links. Šią sekciją

    sudaro tokie laukai:

    o classificationlcc, classificationddc, classificationudc, classificationrvk; o fulltext; o toc; o abstract; o review; o availability; o rankparentchild; o ranknocopies; o rankdatefirstcopy; o ranknoloans.

    Additional Data – ši sekcija susideda iš duomenų elementų, kurie reikalingi kai kurioms Primo funkcijoms ir kurių negalima išgauti iš kitų PNX sekcijų. Šią sekciją sudaro tokie

    laukai:

    o Author last; o Author first; o Author initials; o Author first initial; o Author middle initial; o Author suffix; o Author; o Author; o Corporate author; o Additional author; o Series author; o Book title;

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    31 Kaunas, 2009 m. gruodis

    o Article title; o Journal title; o Short title; o Additional title; o Series title; o Date; o RISDate; o Additional Date; o Volume; o Issue; o Part; o Season; o Quarter; o Start page; o End page; o Pages; o Article number; o ISSN; o eISSN; o ISBN; o DOI; o CODEN; o SICI; o Metadata format; o Genre; o RISType; o RISType; o Abstract; o City of Publication; o Publisher; o Miscellaneous1; o Miscellaneous2; o Miscellaneous3; o URL; o Additional ID; o Object ID; o OCLC ID; o Local fields 1-5.

    1.5.2. Normalizavimo taisyklių rinkiniai

    Normalizavimo taisyklių rinkinys apibrėţia kaip specifinių duomenų šaltinis ar šaltinių grupė

    turi būti konvertuojama iš šaltinio formato į Primo normalizuotą XML įrašą – „PNX“. Primo turi

    keletą šablonų suderinimo rinkinių, kuriuos galima naudoti publikavimo kanalų rinkinių kūrimui.

    Šiuo metu yra prieinami tokie šablonai:

    o Generic MARC; o Generic Dublin Core; o ALEPH MARC; o ALEPH MAB; o Voyager MARC; o DigiTool – Dublin Core; o DigiTool – MARC;

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    32 Kaunas, 2009 m. gruodis

    o SFX; o MetaLib.

    Skirtingi publikavimo kanalai ir duomenų šaltiniai gali dalytis tais pačiais normalizavimo

    taisyklių rinkiniais.

    1.5.3. Normalizavimo taisyklių rinkinių sąrašas

    Kai pasirinktas „Normalizavimo taisyklių konfigūravimo“ nustatymas, administravimo

    modulis pateikia esamų rinkinių sąrašą. Šia Primo paslauga galima sukurti naujus rinkinius,

    redaguoti, ištrinti ar išdėstyti jau turimus.

    1.5.4. Sukurti naują rinkinį

    Siekiant sukurti naują taisyklių rinkinį, atliekamas kaţkurio jau egzistuojančio rinkinio

    dubliavimas (kopijavimas) – tai arba „įneštinio“ (angl. out of the box) šablono rinkinio, arba lokaliai

    sukurto rinkinio kopijavimas. Nurodomas rinkinio pavadinimas ir parenkama „Sukurti“ komanda.

    Naujas rinkinys bus įkeltas į sąrašą, kurį jau galima redaguoti.

    Pastaba: nenaudokite „Template“ termino naujų rinkinių pavadinimuose. Norint susieti

    normalizavimo taisyklių rinkinį su publikavimo kanalu, rinkinys turi būti pirmiau tinkamai

    išdėstytas (angl. deploy).

    1.5.5. Redaguoti rinkinius

    Tam, kad būtų galima redaguoti rinkinius, reikia pasirinkti „Redaguoti“ (angl. Edit) komandą.

    1.5.6. Išdėstyti rinkinius (angl. deploy)

    Normalizavimo taisyklės yra saugomos Primo Oracle duomenų bazėje. Primo publikavimo

    kanalas naudoja XML failus, sugeneruotus taisyklių, esančių šioje duomenų bazėje. Norint sukurti

    XML failus ir panaudoti atnaujintas (naujausias) taisykles, rinkinius reikia tinkamai išdėstyti.

    Kai rinkiniai yra tinkamai išdėstyti, XML failai sukuriami normalizationExport/ kataloge,

    kuris yra /exlibris/primo/p1_n/ng/primo/primo_publishing/home/profile/publish/production/conf.

    normalizationExport kataloge. Atitinkami reikalingi katalogai yra sukuriami kiekvienam

    normalizavimo rinkiniui. Jei normalizavimo rinkinys naudojamas kanalo, XML failai kuriami ir

    publikavimo kanalo conf kataloge.

    1.5.7. Ištrinti rinkinius

    Naudojamas normalizavimo rinkiniui ištrinti. Šablono normalizavimo rinkiniai negali būti

    ištrinti.

    1.5.8. Normalizavimo taisyklių rinkinių redagavimas

    Normalizavimo taisyklės susideda iš 3 dalių:

    1. Šaltinis – tai yra duomenų šaltinis, normalizuotas taisyklėmis. Šaltinis gali būti kelių tipų. Paprastai šaltinis yra normalizuotas iš įrašo šaltinio, bet šaltinis gali būti ir konstanta. Be

    to, Primo reikalingas šaltinio įrašo formatas, kadangi skirtingiems formatams taikomi

    skirtingi atvaizdavimai ekrane. Galimi tokie šaltinių tipai:

    o MARC – šaltinio įrašo laukas standartiniu MARC 21 formatu. Galima apibrėţti (nustatyto) ţymę (tag), indikatorius ir polaukius.

    o MAB – šaltinio įrašo laukas MAB formatu. Galima apibrėţti ţymę, indikatorius ir polaukius.

    o XML – šaltinio įrašo laukas iš XML įrašo. Galima apibrėţti kelią (path), atributą ir reikšmę.

    o PNX – PNX įrašo laukas. Būtina apibrėţti sekciją/lauką iš PNX įrašo.

  • Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“

    33 Kaunas, 2009 m. gruodis

    o Konstanta – šaltinis yra tam tikros rūšies konstanta. o Config – šaltinis yra laukas iš konfigūravimo failo/lentelės. Būtina apibrėţti lauko

    kelią.

    2. PNX laukas (ar „objektas“) – tai PNX įrašo sekcija/laukas sukurtas pagal taisyklę. Vienas PNX laukas gali būti sukurtas vienos ar kelių taisyklių.

    3. Konvertavimas – tai yra ką reikia padaryti, kad duomenų šaltinis būtų konvertuotas į PNX lauką. Konvertavimas gali turėti keletą komponentų, įskaitant ir sąlygas, ir

    transformavimo šablonus (paprogrames).

    1.5.9. Vartotojo sąsaja normalizavimo taisyklėms redaguoti

    Normalizavimo taisyklėms redaguoti prieinami 2 redaktoriai:

    Bazinis;

    Paţangus.

    Bazinio redaktoriaus ypatybės:

    Kiekvienam PNX laukui galima specifikuoti (tiksliai apibrėţti) daugialypes (sudėtines) taisykles (jei to reikia).

    Kiekvienai taisyklei specifikuojamas šaltinis.

    Kiekvienai taisyklei specifikuojama transformacija.

    Specifikuojamas vienas (bendras) veiksmas, kuris apima visas taisykles: o ADD (pridėti) – nauji PNX laukai turėtų būti pridėti kiekvienam srauto laukui; o OR (arba) – sukuriamas tiktai vienas PNX laukas. Kitaip sakant, kai tik laukas

    sukuriamas, Primo sistema nustoja tikrinti likusias taisykles;

    o MERGE (sulieti) – sulieja visus šaltinio laukus į vieną bendrą PNX lauką. Jei panaudota suliejimo komanda, tai turi būti padėtas skyriklis, kuris dedamas visada

    prieš reikšmę.

    Negalima pritaikyti sąlygų.

    Paţangaus redaktoriaus ypatybės:

    Kiekvienam PNX laukui galima specifikuoti (tiksliai apibrėţti) daugialypes (sudėtines) taisykles (jei tai reikalinga).

    Kiekvienai taisyklei specifikuojamas šaltinis.

    Kiekvienai taisyklei specifikuojama transformacija.

    Specifikuojamas veiksmas kiekvienai taisyklei: o ADD; o OR; o MERGE;

    Galima pritaikyti sąlygas.

    1.5.10. Veiksmų ADD, OR, MERGE pavyzdys

    Srauto įrašas, kuris tu