udział biblioteki narodowej w bieżących projektach europeany
DESCRIPTION
Udział Biblioteki Narodowej w bieżących projektach Europeany. Katarzyna Ślaska Biblioteka Narodowa. Europeana. - PowerPoint PPT PresentationTRANSCRIPT
Udział Biblioteki Narodowej w bieżących projektach Europeany
Katarzyna Ślaska
Biblioteka Narodowa
Europeana
„Europeana daje nam okazję do podróżowania w czasie, ponad granicami i w głąb nowych koncepcji dotyczących definicji naszej kultury. Co więcej, pozwala stworzyć więź między ludźmi i ich historią oraz, dzięki interaktywnym stronom i narzędziom, także budować więzi międzyludzkie.”
Vivianne Reading, Komisarz UE ds. Społeczeństwa informacyjnego
Współpraca BN i Europeany
EDLnet: Thematic Networks (2007-2009)
Europeana v.1.0 (2009-2011) EuropeanaTravel (2009-2011) Europeana v.2.0 (2011-2014) Europeana Newspapers Online (2012-
2015)
Europeana v.2.0
Projekt finansowany w ramach ICT PSP Work Programme
Koordynatorem jest Europeana Foundation
Realizowany w latach 2011-2014
Partnerzy projektu
Europeana Foundation Biblioteka Brytyjska Biblioteka Narodowa Austrii Uniwersytet Humboldta w Berlinie Ministerstwo Kultury, Hiszpania Biblioteka Narodowa Polski Instytut Audiowizualny, Holandia Narodowy Instytut Audiowizualny, Francja Consiglio Nazionale delle Ricerche, Italy Department of Tourism, Culture and Sport, Ireland
Cele projektu Europeana v.2.0
Rozwój portalu Europeana, wzbogacenie jego zawartości cyfrowej i poprawa funkcjonalności
Poprawa satysfakcji użytkownika Lepsza koordynacja prac i poszerzenie
sieci współpracujących z Europeaną instytucji i organizacji
European Cultural Commons
European Cultural Commons to strategia rozumiana jako zespół działań zakładający masowe udostępnianie cyfrowe dziedzictwa kulturowego Europy.
Jest jednym z najważniejszych zadań zdefiniowanych w Europejskiej Agendzie Cyfrowej 2020.
Różnorodność …
… i współdziałanie
Konferencja European Cultural Commons, 12.10.2011
Konferencja European Cultural Commons
Celem konferencji było wypracowanie wizji realizacji strategii European Cultural Commons poprzez zapewnienie powszechnego dostępu do zdigitalizowanego dziedzictwa kulturowego, zaspokajającego potrzeby i oczekiwania zróżnicowanych grup użytkowników. Efektem prac ekspertów będzie analiza problemów w zakresie cyfrowego udostępniania dziedzictwa wraz z sugestiami sposobów ich rozwiązania.
Second European Cultural Commons Strategic Briefing
30 października 2012 Limassol, Cypr Kontynuacja dyskusji
zainicjowanej na konferencji w Warszawie
Przygotowanie rekomendacji do omówienia podczas Europeana Annual General Meeting
Projekt Europeana Newspapers online
Europeana Newspapers – dlaczego prasa?
„Gazety są wskazówką sekundową historii"
Arthur Schopenhauer
Dlaczego gazety?• Interesujące dla różnych grup odbiorców
• Projekt wpisuje się w politykę UE oraz realizuje cele Europeany
• W bibliotekach czasopisma są pomiędzy:• niebem = pełne ciągi zasobów, mikrofilmy wysokiej jakości• i piekłem = niska jakość oryginałów, brakujące numery i dodatki,
kopie mikrofilmowe złej jakości, prawa autorskie do współczesnych gazet
Europeana Newspapers: Plany i zamierzenia
• Agregacja i poprawa jakości reprodukcji cyfrowych gazet w Bibliotece Europejskiej i w portalu Europeana
• Zastosowanie nowoczesnych narzędzi wspierających OCR, OLR (segmentacja tekstu na artykuły) i rozpoznawanie nazw własnych (NER)
• Biblioteki biorące udział w projekcie dostarczą do Europeany 18 milionów stron gazet
• Kolejne biblioteki będą zachęcane do przekazywania reprodukcji gazet do Biblioteki Europejskiej i Europeany
Założenia projektu Europeana Newspapers
• Konsorcjum składa się z 17 partnerów reprezentujących 12 państw
• Biblioteki narodowe• Biblioteki uniwersyteckie• Inne jednostki
• Projekt zakłada zaangażowanie bibliotek nie wchodzących w skład konsorcjum
• Finansowany jest w ramach Best Practice Network programu ICT PSP Komisji Europejskiej
• Realizowany jest od lutego 2012 do lutego 2015 r.
Konsorcjum Europeana Newspapers
NLF
SBBONB
NLP
BnF
NLE
SUB HH
USAL
NLL
KB
LIBER
CCS
NLT
UB
UIBK
LFT
BL
Partnerzy projektu
9. Uniwersytet w Salford10. CCS Content Conversion Specialists GmbH11. LIBER12. Biblioteka Narodowa Łotwy13. Biblioteka Narodowa Turcji14. Biblioteka Uniwersytecka w Belgradzie
15. Uniwersytet w Innsbrucku16. Biblioteka Dr. Friedricha Tessmanna17. Biblioteka Brytyjska
1. Biblioteka Państwowa w Berlinie (koordynator)2. Biblioteka Narodowa Holandii3. Biblioteka Narodowa Estonii4. Biblioteka Narodowa Austrii5. Biblioteka Narodowa Finlandii6. Biblioteka Uniwersytecka w Hamburgu7. Biblioteka Narodowa Francji8. Biblioteka Narodowa Polski
Cele European Newspapers Online
1) Wybór, obróbka cyfrowa i agregacja prasy europejskiej• Europeana stanie się największą biblioteką cyfrową gazet• Wzbogacenie Europeany o 18 milionów stron gazet, w większości
przeszukiwalnych pełnotekstowo• Przeprowadzenie procesów OCR i segmentacji tekstu2) Analiza istniejących zasobów prasy • Zgromadzenie informacji o europejskich kolekcjach gazet3) Przygotowanie rekomendacji i zestawu dobrych praktyk• Opracowanie wzorcowej ścieżki digitalizacji prasy• Przygotowanie rekomendacji dotyczących digitalizacji, obróbki cyfrowej,
ścieżki digitalizacji, metadanych oraz narzędzi ewaluacyjnych 4) Udostęnienie gazet z możliwością przeszukiwania
pełnotekstowego• Poprawa dostępu do kolekcji prasy w Europeania
1) Wybór, obróbka cyfrowa i agregacja zasobów
• Agregacja 18 milionów stron gazet do European oraz Biblioteki Europejskiej
• 8 milionów stron bez obróbki cyfrowej
• 10 milionów stron z przeprowadzonym procesem OCR (Uniwersytet w Insbrucku)
• 2 miliony stron z przeprowadzonym procesem OCR oraz OLR (segmentacja tekstu) (CCS, Germany)
• Analiza dostarczonych zasobów prasy w postaci cyfrowej i wybór tytułów, przeznaczonych do obróbki cyfrowej
www.europeana.eu/
www.theeuropeanlibrary.org/
1) Obróbka cyfrowa – OCR i OLR
• 10 milionów stron z OCR: Uniwersytet w Insbrucku
• 2 miliony stron z OCR iOLR (firma CCS)
• Uniwersytet w Insbrucku wzbogaca OCR o informacje strukturalne na podstawie Document Understanding Platform
• CCS wykonuje pliki OCR i weryfikuje rozpoznaje szpalt, strukturyzację, segmentację na artykuły i typ strony
• CCS dostarcza bibliotekom oprogramowanie umożliwiające wprowadzanie poprawek rozpoznawania tekstu i jego segmentacji
CCS: Rozpoznawanie tekstu, segemntacja
Innsbruck: Rozpoznawanie nagłówków i przypisów oraz spisów treści
1) Obróbka cyfrowa - Named Entity Recognition
Biblioteka Narodowa Holandii prowadzi badania w zakresie rozpoznawania nazw własnych (NER) dla zasobów prasy publikowanych w języku holenderskim, angielskim oraz niemieckim
2) Analiza istniejących zasobów prasy
• Do połowy 2012 r. partnerzy projektu dokonają analizy zasobów czasopiśmienniczych w swoich zbiorach
• Dane zostaną udostępnione w “Zeitschriftendatenbank” (Centralnym Katalogu Czasopism) Biblioteki Państwowej w Berlinie
• Zaproponują również potencjalnych nowych partnerów projektu, którzy mogą swoimi zasobami wzbogacić kolekcję Europeana Newspapers
• Analiza będzie obejmowała również ocenę jakości technicznej zdigitalizowanych zasobów prasy i metadanych opisowych
• Kontaktowy adres mailowy dla instytucji zainteresowanych współpracą z projektem: [email protected]/
3) Przygotowanie rekomendacji i zestawu dobrych praktyk
• Analiza formatów metadanych stosowanych przez partnerów projektu w opisie gazet i czasopism
• Zestawienie modeli metadanych ze standardami METS/ALTO i opracowanie rekomendacji dobrych praktyk w zakresie formatów stosowanych do opisu gazet i czasopism przeznaczonych do digitalizacji i obróbki cyfrowej
• Przygotowane rekomendacje zostaną przetestowane i poddane ewaluacji
• Przygotowanie rekomendacji i zestawu dobrych praktyk w zakresie obróbki cyfrowej reprodukcji cyfrowych gazet przeznaczonych do zamieszczania w portalu Europeana
4) Udostępnienie zasobów prasy
• W ramach projektu w portalu TEL zostanie udostępniona przeglądarka umożliwiająca:
• Przeszukiwanie pełnotekstowe przez m.in.
• terminy wyszukiwawcze,
• nazwy własne,
• kolekcje gazet,
• daty ….
• Przeglądanie reprodukcji cyfrowych gazet• Przejście do zasobów cyfrowych macierzystej biblioteki • Po zakończeniu projektu przeglądarka zostanie przeniesiona do Europeany
Gazety polskie w Newspapers Online