richtlijnen voor betrouwbare data bewaarplaatsen; rollen en verantwoordelijkheden - laurents sesink...

36
Richtlijnen voor betrouwbare data bewaarplaatsen Rollen en verantwoordelijkheden Laurents Sesink ‘Seminar De uitdaging van het delen van medische onderzoeksdata (3)’ Utrecht, 15 mei 2013

Upload: surfnet

Post on 18-Dec-2014

320 views

Category:

Health & Medicine


6 download

DESCRIPTION

Richtlijnen voor betrouwbare data bewaarplaatsen Rollen en verantwoordelijkheden Laurents Sesink (DANS) ‘Seminar De uitdaging van het delen van medische onderzoeksdata (3)’ Utrecht, 15 mei 2013

TRANSCRIPT

Page 1: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Richtlijnen voor betrouwbare data bewaarplaatsen

Rollen en verantwoordelijkheden

Laurents Sesink

‘Seminar De uitdaging van het delen van medische onderzoeksdata (3)’

Utrecht, 15 mei 2013

Page 2: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Waarom wetenschappelijke data delen }  Validatie van onderzoek

}  Gedragscode. Data tot 5 jaar na onderzoek beschikbaar houden.

Page 3: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Niederlande Renommierter Psychologe gesteht Fälschungen

Page 4: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Hergebruik van data

}  De laatste 10 jaar is er een verandering met betrekking tot het principe van het delen van onderzoeksdata.

}  Overheid: OECD Principles and Guidelines for Access to Research Data from Public Funding.

}  Wetenschappelijke organisaties: Berlin Declaration on Open Access.

}  DANS wordt gefinancierd om dit beleid te implementeren in het wetenschappelijke domein.

Page 5: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Wat is DANS? }  Een instituut van de Koninklijke Nederlandse

Academie van Wetenschappen (KNAW) en de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO).

}  Voorgangers DANS: Steinmetz archief (1964), Nederlands Historisch Data Archief (1989).

}  Missie: de permanente toegang van wetenschappelijke data in Nederland voor de toekomst garanderen. (beginnend met data van de humaniora and sociale wetenschappen).

Page 6: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

DANS Beleid

}  Het is niet belangrijk waar data gearchiveerd wordt als de repository voldoet aan internationale standaarden en richtlijnen met betrekking tot trustworthiness

}  Onderzoek financiers moeten onderzoekers verplichten om hun data in een TDR te deponeren.

}  Onderzoekers moeten hun data deponeren/delen: Open als het kan, beschermd als het moet.

Page 7: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Rollen en verantwoordelijkheden }  Onderzoek financiers: Stimuleer en verplicht ◦  Audit en certificering van digitale repositories ◦  Data management paragraaf in projectvoorstellen ◦  Data contract ◦  Deponeren of delen van onderzoek data in een TDR

}  Data repositories: ◦  Conformeer aan de richtlijnen van een TDR ◦  Geef permanente toegang tot onderzoek data

}  Data producenten: ◦  Produceer excellente data ◦  Deponeer data in een TDR

}  Data consumenten: ◦  Gebruik data op een betrouwbare wijze

◦  Geef wetenschappelijke waardering aan de producent van de data (refereer!)

Page 8: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Data is hot! }  Neelie Kroes (Vice-

President of the European Commission responsible for the Digital Agenda): “Data is the new gold”

}  Rome, April 2012: Open science culture – open sharing of data, software, publications, educational materials

}  DMP in Horizon 2020

Page 9: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)
Page 10: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  ARVODI }  KADASTER }  CBS

Nederlandse overheid en wetenschappelijke data

Page 11: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Data repositories: Conformeer aan internationale standaarden en richtlijnen. •  BASIC CERTIFICATION is granted to repositories

which obtain DSA certification •  EXTENDED CERTIFICATION is granted to Basic

Certification repositories which in addition perform a structured, externally reviewed and publicly available self-audit based on ISO 16363 or DIN 31644

•  FORMAL CERTIFICATION is granted to repositories which in addition to Basic Certification obtain full external audit and certification based on ISO 16363 or equivalent DIN 31644.

See: www.trusteddigitalrepository.eu

Page 12: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

5 Kriteria 16 Richtlijnen

Onderzoek data: }  Kunnen gevonden

worden op het Internet }  Zijn toegankelijk

(duidelijke rechten en licenties)

}  Zijn in in bruikbaar formaat

}  Zijn betrouwbaar }  Zijn refereerbaar

(persistent identifier) 22-05-13

Data Seal of Approval

www.datasealofapproval.org

Page 13: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  (1) The data producer deposits the research data in a data repository with sufficient information for others to assess the scientific and scholarly quality of the research data and compliance with disciplinary and ethical norms.

}  (2) The data producer provides the research data in formats recommended by the data repository

}  (3) The data producer provides the research data together with the metadata requested by the data repository

Data producent: 3 richtlijnen

Page 14: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  (4) The data repository has an explicit mission in the area of digital archiving and promulgates it

}  (5) The data repository uses due diligence to ensure compliance with legal regulations and contracts including, when applicable, regulations governing the protection of human subjects.

}  (6) The data repository applies documented processes and procedures for managing data storage

}  (7) The data repository has a plan for long-term preservation of its digital assets

}  (8) Archiving takes place according to explicit workflows across the data life cycle

Data repository: 10 richtlijnen

Page 15: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  (9) The data repository assumes responsibility from the data producers for access and availability of the digital objects

}  (10) The data repository enables the users to utilize the research data and refer to them

}  (11) The data repository ensures the integrity of the digital objects and the metadata

}  (12) The data repository ensures the authenticity of the digital objects and the metadata

}  (13) The technical infrastructure explicitly supports the tasks and functions described in internationally accepted archival standards like OAIS

Data repository: 10 richtlijnen

Page 16: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  (14) The data consumer complies with access regulations set by the data repository

}  (15) The data consumer conforms to and agrees with any codes of conduct that are generally accepted in higher education and research for the exchange and proper use of knowledge and information

}  (16) The data consumer respects the applicable licenses of the data repository regarding the use of the research data

Data consument: 3 richtlijnen

Page 17: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  Data archief is als organisatie verantwoordelijk voor het implementeren van de guidelines.

}  Een assesment kan online aangevraagd worden. }  De assesment aanvraag wordt aanvaard of afgewezen. }  De organisatie beschrijft hoe voldaan wordt aan de

richtlijnen. }  De DSA board reviewed de assesment. }  Er worden categorieën toegekend in welke mate een

richtlijn afdoende geïmplementeerd is. }  Bij voldoende score krijgt men het DSA Seal. }  Het Seal moet periodiek vernieuwd worden.

Assesment proces

Page 18: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  Repository is verantwoordelijk voor de implementatie van alle richtlijnen behalve 4,6,7,8 and 13;

}  Bewaar een kopie van de data in een Trusted Digital Repository (TDR) met een DSA Seal die alle 16 richtlijnen geimplementeerd heeft (inclusief 4, 6, 7, 8 en13).

}  16 repositories hebben op dit moment een SEAL }  DANS assesment.

Gedelegeerde verantwoordelijkheid

Page 19: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  Bij DANS in het Elektronische Archivering Systeem (EASY)

}  Elders in een TDR (3TU.datacentre, The Language Archive)

Hiervoor zijn nodig: }  Data archiverings richtlijnen }  Onderzoeksdata management training en

advies

Data producent: Onderzoekers moeten hun data delen/deponeren in een TDR

Page 20: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  Digitale data zijn in grote aantallen aanwezig

}  Nieuwe onderzoeksvragen }  Nieuwe methoden en technieken }  Nieuwe zoek, browse, analyse en

visualisatie tools

Data intensieve wetenschap

Page 21: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  Meer informatie }  Publicaties }  Datasets }  Onderzoek informatie

}  Onderzoeker }  Organizatie }  Projecten

}  Contextuele informatie is nodig om het vinden en waarderen van informatie

Informatie in context

Page 22: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Projects

Koppelen van data, publicaties, onderzoek informatie

Data

Publications

Researchers

Page 23: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Research information in context

!

Page 24: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Benodigde infrastructuur

Research Infrastructures

Research Information

Research Data

Research Publications

Educational Resources

Software

Page 25: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Interoperabiliteit: standaarden & systemen

Persistent Identifiers

Metadata

Page 26: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  Domein specifieke diensten ◦  CLARIN, DARIAH, CESSDA etc.

}  Gemeenschappelijke diensten ◦  DASISH, EUdat

}  Digitale duurzaamheid ◦  APARSEN, Planets

Rollen en verantwoordelijkheden

Page 27: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Scholarly communication semantic data landscape

Trusted Data Repositories Ingest

Research information in

context

Interoperability Integrity E-Architecture Agreements

Policy, standards

Implementation

Metadata PI’s (object, author)

Narcis OpenAire Europeana

Data Publications Research Informations

Service Providers

Data Providers

Page 28: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Required infrastructure

Research infrastructure

Research information

Research data

Research publications

Educational material

Software

Page 29: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

}  Domein specifieke diensten ◦  CLARIN, DARIAH, CESSDA etc.

Rollen en verantwoordelijkheden

}  CLARIN centers }  CESSDA leden }  DARIAH partners }  Minimale eisen

}  DSA

Page 30: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

BIG SCIENCES

TECHNICAL SCIENCES

SOCIAL SCIENCES& HUMANITIES(designated community)

Basic Infrastructure

Federated Dataservice Network

SURFSara Datacenter

3TU Datacenter

FEDERATED DATASERVICE INFRASTRUCTURE

StorageComputing Networking

Virtualization GRIDCloud Computing Lightpaths

Producer

VRE-X

SharePointDataVerse

Consumer

DANS

Ingest Access

Administration

Management

Storage

ERIC-YCLARIN

DARIAH

VRE-X

SharePointDataVerse

ERIC-YCLARIN

DARIAH

Disk

Services

Internet

Preservation

Research Curation + Preservation Reuse

Discovery

AAIVisualization

Open Archival Information System (OAIS): A n A r c h i v e t h a t h a s a c c e p t e d t h e responsibility to preserve information and make i t avai lable for a Designated Community.

Administration

Preservation Planning

Data Management

Ingest AccessArchival StorageSIP AIP AIP DIP

Descriptive Info

Descriptive Info

queriesresult setsorders

MANAGEMENT

PRODUCER

CONSUMER

OAIS Cooperating: Archives with potential common producers, common submission standards, and common dissemination standards, but no common finding aids.

OAIS Shared resources: Archives that have entered into agreements with other Archives to share resources, perhaps to reduce cost.

The aim of a Virtual Research Environment is to provide an integrated environment that supports the work of a community of collaborating researchers.

OAIS Shared Resources

OAIS

Cooperating

Research DataCESSDA, GBIFCLARIAH, Life-Watch

Scholarly communicationOpenaire, NARCIS

Cultural HeritageEuropeana

OAIS Federated: Archives with both a Local Community and a Global Community which has interests in the holdings of several OAIS Archives and has influenced those Archives to provide access to their holdings via one or more common finding aids.

OAIS Federated

Maa

rten

Hoo

gerw

erf, La

uren

ts S

esin

k23 A

pril

2013,

Dat

a Arc

hivi

ng a

nd N

etw

orke

d Ser

vice

s (D

AN

S)

Page 31: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Evolution of the internet

time

Driver of innovation - Technology - Social use

1.0: web of information

2.0: web of people

3.0: semantic web

4.0: ?

2000 1990

0.0: desktop

2010 2020

expectations

Page 32: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Machine executable information

A set of standards and best practices for sharing data and the semantics of data over the web for use by applications. -  Publication of vocabularies. -  Dissemination for humans and machines. -  ………..

Semantic data landscape

Interoperability

Page 33: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Service Providers

Data providers

Digital Humanities semantic data landscape

Trusted Data Repository (DSA)

Ingest

Machine executable information

Re-use of data (authority files, vocabularies, data etc.)

Interoperability Integrity E-Architecture Agreements

Policy, standards

Implementation

Metadata Data PI’s (object, author)

Silo’s

No borders

Page 34: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Machine executable information

Semantic data landscape

e-Science & Cloud services High performance computing Large scale-high speed storage

Page 35: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

en.wikipedia.org 300 × 429 - Girl with a Pearl Earring

ReadFile.aspx mauritshuis.nl 375 × 441 - Girl with a pearl earring. period ca. c.1665.

girl‑with‑a‑pearl‑earring‑gretchen‑matta.jpg fineartamerica.com 521 × 700 - Girl with a Pearl Earring Painting - Girl with a

Page 36: Richtlijnen voor betrouwbare data bewaarplaatsen; Rollen en verantwoordelijkheden - Laurents Sesink (Dans)

Machine executable information

Digital Humanities semantic data landscape

Integriteit