la digitalizzazione tra sfide e opportunità. digitunito ... · progetti di digitalizzazione delle...
Post on 18-Feb-2019
223 Views
Preview:
TRANSCRIPT
La digitalizzazione tra sfide e opportunità. DigitUniTO: interoperabilità, metadati, aspetti legali
Cristina Ferrus, Giulia Scarcia
GdP “Digitalizzazione”, SBA Università di Torino
Paola Laguzzi Direzione Studenti e Servizi Web, Università di Torino
Strategie di digitalizzazione all’Università di Torino
2010: si costituisce un Gruppo di Progetto sulla digitalizzazione, conservazione e progetti europei in seno alla Divisione SBA
Obiettivi: Definire politiche organiche, linee guida, linee di indirizzo per i
progetti di digitalizzazione delle biblioteche di Ateneo
Formare un set di competenze
Aggregare progetti significativi realizzati in Ateneo e risorse digitalizzate di varie tipologie in un’unica piattaforma di accesso
Individuare soluzioni per la conservazione a lungo termine delle risorse digitalizzate
Aspetto cruciale della digitalizzazione e della fruizione delle collezioni digitali
2011 (set.): Università di Torino e Città di Torino firmano una Convenzione nell’ambito del progetto Museo Torino
Fase di selezione delle risorse dal vasto e ricco patrimonio bibliografico dell’Ateneo > frammentazione Sviluppo di strategie di cooperazione: Grazie all’accordo con MT vengono digitalizzate circa 50 opere relative
alla città di Torino appartenenti alle biblioteche e parte dell’Annuario Conservazione e accesso in collaborazione con la Divisione Sistemi
Informativi UniTO
Come nasce DigitUniTO
http://www.omeka.org/
Omeka is a free, flexible, and open source web-
publishing platform for the display of library, museum,
archives, and scholarly collections and exhibitions.
La scelta open source
Open source (in inglese “codice sorgente aperto”) indica un software i cui autori (più precisamente i detentori dei diritti) ne permettono e favoriscono il libero studio e l'apporto di modifiche da parte di altri programmatori indipendenti. Questo è realizzato mediante l'applicazione di apposite licenze d'uso. (da Wikipedia)
3 parole chiave di Omeka (2008)
Open: supporto immediato team di sviluppo molto attivo forum
interoperabilità
Free: tutti possono contribuire (anche UniTo l’ha fatto con un plug-in), tutti possono utilizzarlo e migliorarlo (Licenza Pubblica Generica GNU è intesa a garantire la libertà di condividere e modificare tutte le versioni di un programma per assicurarsi che rimanga software libero per tutti i suoi utenti. Dal sito Omeka)
Flexible: flessibile e personalizzabile
Temi (aspetto fisico della piattaforma) – Plug-in
6
Plug-in
Installati
Collection Tree CSV Import Dropbox Hide Elements Oai‐PMH Repository Simple Contact Form Purl Simple Pages
Disponibili
Commenting User Profiles Reports and Barcodes Embed Codes Zotero Import Social Bookmarking BeamMeUp to SoundCloud …
Lato amministratore
• Sono istituzionalmente orientate
• Sono estensibili
• Sono ad accesso aperto
• Possono raccogliere oggetti digitali di natura diversa:
Monografie, seriali
Materiale di archivio
Immagini digitali di mostre, esposizioni permanenti, ecc.
Video
Le collezioni in DigitUniTo:
Il lavoro di postproduzione
Il Gruppo di Progetto si è occupato di: Personalizzazione Omeka OCR (controllato o no)
Creazione Indici (ove necessario) Metadatazione (DC)
Caricamento in rete tramite piattaforma DigitUnito
Licenze e diritti
Il Dublin Core e le ragioni di un successo
• SEMPLICE = concepito per una descrizione semplice e veloce. Permette anche a non specialisti di creare record descrittivi.
• FLESSIBILE = si adatta agevolmente a tutte le tipologie di materiale. Inoltre permette di integrare e sviluppare la struttura dei dati con significati diversi ed appropriati al contesto di applicazione
• ESTENSIBILE = consente di estendere l’insieme degli elementi per le esigenze di ricerca
• SEMANTICA CONDIVISA = è composto da un insieme di elementi comuni la cui semantica è facilmente comprensibile da diverse comunità professionali e di ricerca. La convergenza su un insieme di elementi comuni accresce la visibilità e l’accessibilità delle risorse
• E’ orientato INTERNAZIONALMENTE. Nato in inglese, ma tradotto in moltissime lingue; dal febbraio 2009 è standard ISO 15836: 2009
• Omeka supporta il DC Simple
Traduzione ad hoc dei campi DC Simple
Creato un “profilo di applicazione” per l’utilizzazione del DC Simple per il materiale bibliografico Utilizzata mappatura UNIMARC/ DC realizzata dall’ICCU
E’ allo studio un “profilo di applicazione” per l’utilizzazione del DC Simple per il materiale di archivio (tipo documento)
Mappatura Library of Congress DC /EAD
• Necessità di modificare il Plug-in OAI-PMH per esportare un set di metadati più ricco del solo DC Simple
• Omeka consente l’esportazione
automatica in XML dei 15 elementi DC
I metadati
Il DC Simple in DigitUnito: alcune scelte
• Collegamento al record del catalogo UniTO: campo DC Relation
• Soggetti nel campo DC Subject desunti dal Soggettario di Firenze
• Note e descrizione fisica: campo DC Description
• Biblioteche che possiedono l’opera: campo DC Source
Le scelte sono state pensate in funzione dell’integrazione con il discovery tool
Le schede descrittive in DigitUniTo
15
Licenze e diritti L’incertezza è il peggior nemico della riutilizzazione
Quali licenze utilizzare per il materiale digitalizzato? Quali diritti garantire? Opere in pubblico dominio (Public Domain calculation (Europa); Copyright term calculator (US)
Opere ancora protette da copyright Opere orfane (Direttiva 2012/28/UE del 25 ottobre 2012) Materiale d’archivio
Direttiva 2013/37/UE > riutilizzo dell’informazione del settore
pubblico esteso anche alle biblioteche universitarie Libro bianco per il riutilizzo dell’informazione del settore pubblico
(progetto EVPSI (Extracting Value from Public Sector Information, http://www.evpsi.org), finanziato dalla Regione Piemonte e attivo tra il 2009 e il 2012)
Accesso – riutilizzo
Le licenze non sono obbligatorie, ma servono a chiarire agli utenti quale utilizzo dei materiali possono fare
Creative commons (italia: http://www.creativecommons.it/)
L’adozione di licenze è opportuna e fortemente consigliata per un servizio istituzionale come DigitUnito
Tutte le licenze Creative Commons condividono molte importanti caratteristiche. Ogni licenza: e' valida in tutto il mondo; dura per la durata del diritto d'autore connesso all'opera; non e' revocabile. Per DigitUnito, tra le 6 licenze abbiamo scelto come base > CC-BY 3.0 che richiede un'attribuzione. Ma: Collezioni diverse possono richiedere licenze diverse
Creative commons: libro moderno a stampa e documenti d’archivio
OCR = Optical Character Recognition “I sistemi di OCR sono programmi dedicati alla conversione di un'immagine contenente testo, solitamente acquisite tramite scanner, in testo digitale modificabile” (da wikipedia) L’OCR è la possibilità di estrarre del TESTO (editabile e ricercabile) da un’IMMAGINE. I documenti digitalizzati sottoposti ad OCR diventano leggibili con un lettore automatico di sintesi vocale (dislessia). Le percentuali di accuratezza dell’OCR vanno dal 72% al 98% (risultati di uno studio effettuato su periodici del XIX e XX secolo)
L’uso dell’ OCR
controllo accurato di: Annuario dell’Università (sono stati verificati e, dove necessario, corretti tutti i nomi di persone presenti in tutte le annate dell’Annuario);
tutti i testi con rilevante importanza dei nomi propri (nomi di persone e di luoghi negli almanacchi o in altri repertori storici, nomi di piante e minerali nei testi storico-geografici, ecc.)
OCR in DigitUnito
Il Plug-in del PURL per DigitUniTo
E’ possibile aggiungere funzionalità ad Omeka installando plug-in ad hoc
È possibile scaricare e installare plug-in sviluppati dalla Community Omeka
E’ possibile creare plug-in secondo proprie e specifiche esigenze
Omeka quindi è del tutto personalizzabile e interoperabile
Estensione funzionale di Omeka
Plug-in
Installati
Collection Tree CSV Import Dropbox Oai‐PMH Repository Simple Contact Form
Purl
“A persistent uniform resource locator (PURL) is a uniform resource locator (URL) that is used to redirect to the location of the requested web resource” (wikipedia) I PURL introducono un livello di indirezione: la risorsa viene puntata mediante un identificativo persistente. Il PURL è un indirizzo web (URL) che punta ad un altro indirizzo web (URL)
Cosa è il PURL
Se una risorsa cambia percorso Web (e quindi URL), un PURL che punta ad esso può essere aggiornato (ma URL per l’utente non cambia…)
Occorrono componenti software per costituire e mantenere l’insieme dei PURL assegnati alle risorse e fare in modo che i PURL siano risolti quando richiesti. I PURL non vivono in Omeka ma all’interno di un server detto PURLZ. Il server PURLZ attualmente utilizzato è OCLC (purl.org). Nel server PURLZ di OCLC è stato creato un dominio /unito/digitunito
Perché utilizzare il PURL
Il PURL plugin per Omeka aggiunge ad Omeka la capacità di creare e gestire, per ciascuno degli item pubblici memorizzati in Omeka, un PURL. I PURL non vivono in Omeka ma all’interno di un server detto PURLZ. Il server PURLZ attualmente utilizzato è OCLC (purl.org). Nel server PURLZ di OCLC è stato creato un dominio /unito/digitunito Il PURL plugin per Omeka è un progetto Open Source https://github.com/aemilius77/omeka-purl-plugin
PURL – Plugin per Omeka
Ringraziamenti
• Ai componenti del Gruppo di Progetto Maria Cassella (coordinatore) Oriana Bozzarelli Mosè Conte Cristina Ferrus Alessandro Leccese Amelia Margiotta Donatella Mutti Paola Novaria Claudio Ruggeri Giulia Scarcia Lorella Spertino
• Museo Torino • Biblioteca civica centrale: Davide Monge, Valeria Calabrese • Direzione Studenti e Servizi Web: Angelo Saccà, Paola Laguzzi, Emilio
Remogna • Accademia di Medicina dell’Università di Torino
top related