le dépôt fédéré de données de ... - portage network

39
Le Dépôt fédéré de données de recherche Maintenant disponible en production intégrale! Lee Wilson, gestionnaire de services Kelly Stathis, coordonnatrice de la découverte et des métadonnées Erin Clary, coordonnatrice de la curation Beth Knazook, coordonnatrice de la préservation 3 février 2021

Upload: others

Post on 23-Apr-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Le Dépôt fédéré de données de ... - Portage Network

Le Dépôt fédéré de données de recherche

Maintenant disponible en production intégrale!

Lee Wilson, gestionnaire de servicesKelly Stathis, coordonnatrice de la découverte et des métadonnées

Erin Clary, coordonnatrice de la curationBeth Knazook, coordonnatrice de la préservation

3 février 2021

Page 2: Le Dépôt fédéré de données de ... - Portage Network

DFDR : un effort collaboratif

Une collaboration entre bibliothèques, établissements et organismesfédéraux faisant appel à divers intervenants des milieux de la GDR etdu CIP

Presenter
Presentation Notes
Le DFDR représente une collaboration entre divers partenaires, notamment des bibliothèques, des établissements de recherche et d'enseignement supérieur et des organisations fédérales et régionales des secteurs de la GDR et du CIP. Il a été développé grâce à un partenariat entre la Fédération Calcul Canada et ses partenaires régionaux et le réseau Portage de l'ABRC. Il est hébergé sur une infrastructure nationale d'informatique à rendement élevé dont Calcul Canada en assure le développement et le soutien technique. Le service, qui comprend un soutien à la curation et à la gestion des données, est exploité par Portage, avec l'aide et la contribution de l'ABRC, du réseau d'experts de Portage et des établissements individuels. Le DFDR est soutenu par un financement de la Nouvelle organisation d'infrastructure de recherche numérique, également connue sous le nom de NOIRN.
Page 3: Le Dépôt fédéré de données de ... - Portage Network

DFDR = Dépôt fédéré de données de recherche

https://www.DFDR -dfdr.ca/

Une plateforme évolutive et fédérée pour la gestion des données de recherche numériques et la découverte des

données de recherche canadiennes

Découverte Dépôt Préservation

Presenter
Presentation Notes
DFDR est une plateforme fédérée et évolutive pour la gestion des données de recherche numériques et la découverte des données de recherche canadiennes. Il comporte trois composantes principales : Il s'agit d'un catalogue central de métadonnées pour la recherche de données de recherche canadiennes Il s'agit d'une plateforme de dépôt évolutive, basée sur une infrastructure nationale, qui utilise le transfert de fichiers Globus pour faciliter les dépôts de données volumineux, Et le dépôt se connecte à une instance du logiciel Archivematica d'Artefactual qui effectue un traitement de préservation pour transformer les paquets de données déposés dans le DFDR en formats compatibles avec les archives.
Page 4: Le Dépôt fédéré de données de ... - Portage Network

● Publication de données de recherche en libre accès dans un dépôt nat ional bilingue de proprié té canadie nne

● P ris e e n charge d’e ns e mble s de donné e s de ta ille m oye nne à grande via Globus

● Stockage dans un dé pôt s é curis é , ré part i gé ographique m e nt s ur plus ie urs s ite s d’hé be rge me nt de la Fé dé ra t ion Calcul Canada

● Sout ie n à la cura t ion de s donné e s offe rt par P ortage

● Collabora t ion e nt re dive rs inte rve nants sur une m ê m e soum is s ion

● Donné e s pouvant ê t re dé couve rte s ave c d’aut re s colle ct ions canadie nne s dans le porta il de dé couve rte du DFDR

Pourquoi utiliser le DFDR?

Page 5: Le Dépôt fédéré de données de ... - Portage Network
Page 6: Le Dépôt fédéré de données de ... - Portage Network
Page 7: Le Dépôt fédéré de données de ... - Portage Network

● Stockage et calcul dédié dans deux sites nationaux d’hé be rge m e nt de la FCC (Ce dar & Graham )

○ Stockage gé oré pliqué sur disque e t bande dans de ux s ite s

○ Copie s d’archive s conse rvé e s dans un t rois iè m e s ite

● Gouve rnance as suré e par le Com ité de pilotage du DFDR

○ Mise e n place d’un com ité consulta t if de s ut ilis a te urs aprè s le lance m e nt

● Équipe de dé ve loppe m e nt e t de fonct ionne m e nt de 14 pe rsonne s ré part ie s dans tout le Canada

● L’é quipe com pre nd 3 nouve aux pos te s d’age nt de curat ion de puis octobre 20 20

Architecture, gouvernance et soutien

Presenter
Presentation Notes
Au cours de l'année dernière, nous avons travaillé avec deux partenaires nationaux du site d'accueil d'ISDE, le système Cedar de l'université Simon Fraser et le système Graham de l'université de Waterloo, pour acheter et installer du matériel de stockage et de calcul dédié au DFDR. Cela signifie que les ensembles de données du DFDR seront géographiquement reproduits sur disque sur les deux sites avec des sauvegardes supplémentaires sur bande à l'université Simon Fraser. Les bibliothèques de l'Université de Toronto, le Scholars Portal et SciNet ont participé à un projet pilote visant à mettre en place un nœud de stockage d'archives distribué pour les ensembles de données du DFDR. La gouvernance du DFDR est assurée par le comité directeur du DFDR, où sont représentés les principaux partenaires, Portage de l'ABRC et la FCC, les sites d'hébergement, le réseau d'experts et la NOIRN. Peu après le lancement, nous mettrons en place un comité consultatif des utilisateurs composé de représentants des chercheurs, des gestionnaires de données et des bibliothèques L'équipe actuelle du DFDR est composée de 14 spécialistes du développement et du soutien à la gestion des données du secrétariat de Portage; nous venons aussi d'embaucher 3 nouveaux agents de curation cet automne.
Page 8: Le Dépôt fédéré de données de ... - Portage Network

● Qui peut utiliser le DFDR? ○ N’im porte qui pe ut ut ilis e r le DFDR pour che rche r e t té lé charge r de s donné e s

dans le s dé pôts canadie ns .

● Qui pe ut dé pose r de s donné e s dans le DFDR?○ Le s m e m bre s du corps profe s soral ou le urs re pré se ntants de s é tablis s e m e nts ou

de s organism e s canadie ns adm is s ible s au finance m e nt de s t rois organism e s subve nt ionnaire s pe uve nt dé pose r.

● Com bie n d’e space de s tockage dans le DFDR ont le s ut ilis a te urs?○ Le s dé posants adm is s ible s ont 1 To de s tockage par dé faut s ans fra is .○ Du s tockage supplé m e ntaire pe ut ê t re offe rt au be soin, m oye nnant ce rta ine s

jus t ifica t ions .

○ Le s de m ande s dé pas sant large m e nt le s tockage par dé faut s e ront soum ise s à un proce s sus de ré vis ion

Comment puis -je l’utiliser?

Page 9: Le Dépôt fédéré de données de ... - Portage Network
Presenter
Presentation Notes
Les grands organismes et établissements de recherche peuvent demander une collection spéciale qui leur fournit une page dédiée dans le DFDR, une description de projet avec une marque, et qui regroupe tous leurs ensembles de données en un seul endroit. Les collections spéciales auront un stockage par défaut plus grand que les utilisateurs individuels; des travaux sont également en cours pour développer un cadre d'allocation à plusieurs paliers semblable à ceux pour les collections.
Page 10: Le Dépôt fédéré de données de ... - Portage Network

Obtention d’un compte

Presenter
Presentation Notes
Je vais maintenant vous montrer comment obtenir un compte sur le site web du DFDR. Commencez par vous rendre sur le site web du DFDR à l'adresse www.DFDR-dfdr.ca.
Page 11: Le Dépôt fédéré de données de ... - Portage Network
Presenter
Presentation Notes
Sélectionnez ensuite "Se connecter" dans le menu en haut à droite.
Page 12: Le Dépôt fédéré de données de ... - Portage Network
Presenter
Presentation Notes
Vous serez dirigé vers la page de connexion à Globus où vous pourrez soit créer un nouvel identifiant Globus, soit vous connecter avec un identifiant existant. Notez que votre compte Globus sera votre compte DFDR.
Page 13: Le Dépôt fédéré de données de ... - Portage Network
Presenter
Presentation Notes
Vous disposez de plusieurs options pour vous connecter au DFDR. Nous recommandons d'utiliser soit : Votre identifiant institutionnel s'il est disponible dans le menu déroulant; Votre compte Calcul Canada; Un identifiant ORCID s'il se connecte à un courriel institutionnel; Ou vous pouvez créer un compte Globus. Quel que soit votre choix, veillez à ce qu'il soit relié à un courriel affilié à un établissement ou un organisme d'enseignement supérieur canadien. Nous devront vérifier votre admissibilité au dépôt à l'étape suivante.
Page 14: Le Dépôt fédéré de données de ... - Portage Network

Demande de dépôt

Presenter
Presentation Notes
Après avoir créé un compte et vous être connecté, vous serez invité à faire une demande de dépôt. Si vous souhaitez uniquement télécharger des ensembles de données du DFDR, vous n'avez pas besoin de soumettre cette demande. Afin de vérifier votre admissibilité, nous aurons besoin du nom de votre établissement ou organisation et d'une adresse électronique affiliée. Si vous préférez que votre future correspondance se fasse en français, vous pouvez choisir le français comme langue de prédilection.
Page 15: Le Dépôt fédéré de données de ... - Portage Network

Demande de dépôt

Presenter
Presentation Notes
La deuxième partie du formulaire vous demande d'identifier votre rôle. Je vous rappelle que le DFDR est ouvert au dépôt par les membres du corps enseignant et les bibliothécaires affiliés aux établissements d'enseignement supérieur admissibles au financement des trois organismes subventionnaires. Les chercheurs du secteur public et les chercheurs affiliés à des organisations à but non lucratif peuvent également être admissibles en fonction de leur organisation et de leurs besoins. Les utilisateurs parrainés, tels que les étudiants diplômés, les postdoctorants ou le personnel de soutien à la recherche doivent indiquer le nom et l'adresse électronique de leur professeur parraineur. L'équipe du DFDR examinera votre demande dans les deux jours ouvrables et pourra demander des informations supplémentaires si nécessaire ; vous recevrez invariablement un courriel de confirmation une fois votre demande traitée.
Page 16: Le Dépôt fédéré de données de ... - Portage Network

Commencer une soumission

Page 17: Le Dépôt fédéré de données de ... - Portage Network

Ajouter des métadonnées

● Métadonnées = informations descriptives sur votre jeu de données

● Les métadonnées robustes favorisent la conformité de vos données aux principes FAIR : Faciles à trouver, Accessibles, Interopérables et Réutilisables.

● Trois sections :

○ Métadonnées obligatoires

○ Métadonnées recommandées

○ Métadonnées géographiques

● Pour des instructions détaillées, consultez https://www.DFDR -dfdr.ca/docs/en/describing_your_data/

Presenter
Presentation Notes
Après avoir commencé votre soumission, vous serez invité à ajouter des métadonnées - soit des informations descriptives sur votre ensemble de données. Les de métadonnées détaillées et robustes contribuent à rendre vos données plus conformes aux principes FAIR : faciles à trouver, accessibles, interopérables et réutilisables. Dans le formulaire de soumission, le DFDR sépare les métadonnées en trois sections : une pour les métadonnées obligatoires, une pour les métadonnées recommandées et une pour les métadonnées géographiques qui est facultative. Je vais maintenant passer brièvement en revue le formulaire de soumission. Pour des conseils beaucoup plus détaillés sur la façon de fournir des métadonnées, vous pouvez consulter nos lignes directrices dans la documentation sous la rubrique "Décrire vos données". Nous organisons également un autre webinaire plus détaillé le 10 février prochain sur la curation.
Page 18: Le Dépôt fédéré de données de ... - Portage Network

Métadonnées requises

● Titre● Description

○ un résumé pour votre jeu de données● Auteur(s)

○ Affiliations des auteurs○ Identifiant ORCID (facultatif)

● Personne -ressource● Adresse courriel● Droits

○ licence —CC0, CC BY, etc.

Presenter
Presentation Notes
Voici les champs de métadonnées obligatoires dans le DFDR. Titre : En premier, le titre. Idéalement, le titre devrait concerner les données elles-mêmes, au lieu du titre d'une publication associée uniquement. Description : Le champ suivant est la description. Vous pouvez considérer la description comme un résumé de vos données, notamment ce qu'elles sont, comment elles ont été recueillies, etc. Pour plus d'informations sur ce qui constitue une bonne description, vous pouvez consulter le récent webinaire de Dan Phillips avec Portage, dont le lien sera affiché dans la sections de clavardage. https://www.youtube.com/watch?v=kUIoX3OB130&ab_channel=CanadianAssociationofResearchLibraries Auteur : Pour le champ auteur, entrez les noms des auteurs du jeu de données et leurs affiliations. Vous pouvez ajouter plusieurs auteurs ici. Si vous disposez d'un identifiant ORCID, ce serait un bon endroit pour l'utiliser dans le champ ORCID iD. Nom et adresse courriel de la personne-ressource Pour le nom et l'adresse courriel de la personne-ressource, nous vous demandons de fournir une personne unique pour le jeu de données. Contrairement aux autres champs, ces champs ne seront pas affichés dans les métadonnées. Il sert à une liste de personnes liée à la page de renvoi du jeu de données permettant aux utilisateurs de vous envoyer un courriel pour toute question concernant les données - sans révéler votre adresse électronique publiquement.. Droits Le dernier champ de métadonnées obligatoire est l'information sur les droits ou la licence. Nous recommandons de choisir le domaine public (CC0) ou la licence Creative Commons Attribution, CC BY. Vous pouvez consulter les autres options de licence Creative Commons disponibles en cliquant sur "Plus", ou de communiquez avec nous si vous avez besoin d'une licence personnalisée qui n'est pas couverte par Creative Commons.
Page 19: Le Dépôt fédéré de données de ... - Portage Network

Métadonnées recommandées

● Mots -clés● Période de collecte● Bailleurs de fonds

○ Numéro d’attribution○ Titre d’attribution

● Contributeurs○ p. ex. collecteur de données,

gestionnaire de données, groupe de recherche, superviseur

● Identifiants connexes○ p. ex. les publications pour

lesquelles le jeu de données «est cité par».

Presenter
Presentation Notes
La page suivante du formulaire de soumission comprend des champs de métadonnées qui ne sont pas obligatoires, mais recommandés, le cas échéant. Mots-clés En premier, les mots-clés. Il s'agit d'un endroit pour tous les sujets, termes clés, codes de classification et/ou phrases clés décrivant le jeu de données. On recommande fortement d'inclure des mots-clés dans votre soumission. Période de collecte Ensuite, la période de collecte correspond aux dates durant lesquelles les données ont été collectées. Bailleurs de fonds Ensuite, vous pouvez ajouter des informations sur le financement, le cas échéant, y compris le nom des bailleurs de fonds, le numéro et le titre de la bourse. Contributeurs En dessous des informations sur le financement se trouve le champ des contributeurs. Vous pouvez utiliser le champ Contributeurs pour les personnes ou les groupes supplémentaires qui ne sont pas les auteurs du jeu de données, tels qu'un collecteur de données, un gestionnaire de données ou un groupe de recherche. Nous avons quelques options dans le menu déroulant. Identifiants connexes Le dernier champ de cette page est le champ "Identifiants connexes". Dans la plupart des cas, vous devez utiliser ce champ pour indiquer la publication par laquelle le jeu de données "est cité". Il existe quelques autres types de relations dans le menu déroulant qui vous permettent d'indiquer les ressources que le jeu de données "cite", de montrer que l'ensemble de données "fait partie" d'un autre ensemble de données, et plus encore. Dans la mesure du possible, vous voudrez utiliser un identifiant permanent dans ce champ, comme un DOI - bien que si aucun DOI n'est disponible, une URL est également acceptée..
Page 20: Le Dépôt fédéré de données de ... - Portage Network

Métadonnées géographiques

● Lieu géographique○ Nom du lieu, par exemple «Stanley Park,

Vancouver, C.-B., Canada».

● Point de géolocalisation (Lat., Lon .)

● Cadre de géolocalisation (S O N E)

Dans quel lieu les données ont -elles été recueillies?

Sur quel lieu les données sont -elles centrées?

Presenter
Presentation Notes
La dernière page sur les métadonnées du formulaire de soumission concerne les métadonnées géographiques. Vous voudrez utiliser ces champs pour indiquer le lieu où les données ont été recueillies ou sur lequel elles portent. Vous pouvez indiquer un nom de lieu, une latitude et une longitude, et/ou un cadre englobant. Ces champs sont également répétables, de sorte que vous pouvez fournir plusieurs lieux.
Page 21: Le Dépôt fédéré de données de ... - Portage Network

Identifiants persistants

● Les identifiants persistants (PIDs) sont des références permanentes et durables à des éléments particuliers —publications, jeux de données, personnes, organisations, etc.○ DOI = Digital Object Identifier ( identifiant d’objet numérique )○ ORCID iD = Open Researcher and Contributor ID (identifiant ouvert de chercheur et

de contributeur)● Le DFDR accepte les identifiants ORCID pour identifier de manière

unique les auteurs des jeux de données.● Nous encourageons les DOI et autres identifiants persistants dans le

champ «Identifiants connexes».● Après l’approbation de votre jeu de données, le DFDR générera un

identifiant DOI.

Presenter
Presentation Notes
Maintenant que nous avons parcouru le formulaire de soumission, j'aimerais prendre un peu de recul pour parler plus largement des normes que nous utilisons dans les métadonnées du DFDR. Nous sommes de fervents partisans des identifiants persistants, ou "PID", qui sont des références permanentes et durables à des éléments particuliers - tels que des publications, des jeux de données, des personnes et des organisations. Si vous souhaitez en savoir plus sur les identifiants persistants, nous avons prévu une série de webinaires en mars et avril; nous vous donnerons bientôt plus de détails à ce sujet sur le site web de Portage. Il existe quelques endroits où vous pouvez utiliser les PID dans les métadonnées de votre jeu de données. Comme je l'ai mentionné, le DFDR accepte les identifiants ORCID dans nos métadonnées pour identifier de manière unique les auteurs des jeux de données. Nous encourageons également vivement les utilisateurs à fournir des DOI ou d'autres identifiants persistants (tels que des pseudonymes) dans le champ "Identifiants connexes" lorsqu'ils indiquent des publications, des jeux de données et d'autres produits de recherche connexes. Je dois également noter qu'une fois que votre jeu de données est approuvé, le DFDR génère un DOI que vous pouvez utiliser pour citer votre jeu de données de manière persistante.
Page 22: Le Dépôt fédéré de données de ... - Portage Network

Vocabulaires et registres contrôlés

Le DFDR prévoit de mettre en place les vocabulaires et registres suivants :

● Classification canadienne de la recherche et développement (CCRD)○ Vale urs cont rôlé e s pour le (s ) dom aine (s ) de re che rche○ Chaque cham p a un code unique e t de s nom s e n anglais e t e n français

● Registre d’organisations de recherche (ROR) ○ Vale urs suggé ré e s pour le s affilia t ions de s aute urs○ Chaque organism e de re che rche dispose d’un ide nt ifiant ROR pour l’ide nt ificat ion

pe rm ane nte

● Registre des bailleurs de fonds Crossref○ Vale urs suggé ré e s pour le s nom s de s baille urs de fonds○ Chaque baille ur de fonds a un DOI as socié pour l’ide nt ifica t ion pe rm ane nte

Presenter
Presentation Notes
Le DFDR s'est également engagé à utiliser des vocabulaires et des registres normalisés et contrôlés. CCRD : Nous travaillons à la mise en œuvre de la nouvelle Classification canadienne de la recherche et développement qui a été élaborée par les trois organismes subventionnaires, la Fondation canadienne pour l'innovation et Statistique Canada. Cette classification fournit une liste des différents domaines de recherche ou disciplines. Ce sera un nouveau domaine que nous prévoyons d'ajouter en plus des "mots-clés" non contrôlés que nous collectons actuellement. ROR: Nous travaillons également à l'ajout du registre des organismes de recherche (Research Organization Registry - ROR) pour les affiliations des auteurs. Nous utiliserons le registre pour obtenir les noms préférés des institutions et sauvegarder l'identifiant ROR pour l'identification permanente de chaque affiliation. RBFC: De même, nous prévoyons d'incorporer les noms et les identifiants du registre des bailleurs de fonds Crossref pour les noms des bailleurs de fonds. Une fois mis en place, ces vocabulaires et registres contrôlés contribueront à rendre les métadonnées du DFDR plus interopérables avec d'autres systèmes.
Page 23: Le Dépôt fédéré de données de ... - Portage Network

Découverte de donnéesService de découverte du DFDR

● Le s dé pôts de donné e s sont inte rroge able s parallè le m e nt aux donné e s de plus de 70 dé pôts canadie ns

● Exposé à plus ie urs agré gate urs de donné e s via le flux OAI-P MH

OAI-PMHpour tous le s

je ux de donné e s dé posé s e t

m oissonné s par le DFDR P roQue s t Ce nt ral

Discove ry Inde x (CDI)

Data Citat ion Inde x

Presenter
Presentation Notes
Toutes ces métadonnées contribuent à favoriser la découverte et l'accessibilité de vos données. Les jeux de données déposés dans le DFDR sont interrogeables dans le service de découverte du DFDR.. En plus de ces jeux de données, le service de découverte du DFDR comprend des enregistrements de métadonnées moissonés dans plus de 70 autres dépôts de données de recherche canadiens. Cela permet aux utilisateurs d'effectuer des recherches dans les différents dépôts à la fois, améliorant ainsi la découverte des données de recherche canadiennes et aidant à décloisonner les dépôts. Un autre avantage du service de découverte du DFDR est notre flux de métadonnées OAI-PMH qui nous permet de partager les métadonnées avec d'autres agrégateurs. Les métadonnées du DFDR sont désormais incluses dans le graphique de recherche OpenAIRE qui est une initiative de l'UE et l'une des plus grandes collections de produits de recherche en libre accès. Nous fournissons également un flux au Data Citation Index, rendant les métadonnées du DFDR disponibles via le Web of Science. Enfin, les métadonnées du DFDR sont désormais disponibles via le ProQuest Central Discovery Index, qui permet aux bibliothèques d'ajouter facilement le flux DFDR au service de recherche de leur établissement.. Maintenant que nous avons passé en revue les métadonnées obligatoires et la manière dont elles permettent la découverte de données, je voudrais céder la parole à Erin qui expliquera comment transférer des données vers le DFDR et ce que le processus de curation implique.
Page 24: Le Dépôt fédéré de données de ... - Portage Network

Transfert de données

Presenter
Presentation Notes
Je vais vous décrire le processus de téléversement ou de "transfert de données" et ce qui se passe après que vous ayez finalisé et soumis votre jeu de données au DFDR. Il existe plusieurs options pour le téléversement des données. Si votre jeu de données contient moins de 300 fichiers ou si vos fichiers individuels font moins de 5 gigaoctets, vous pouvez choisir de téléverser vos données directement via notre interface de soumission en utilisant soit la fonction glisser-déposer, soit en parcourant les fichiers sur votre appareil local et en choisissant les fichiers que vous voulez téléverser. Le DFDR maintient des hiérarchies de fichiers, vous pouvez donc glisser des fichiers dans un dossier ouvert avec des sous-dossiers et des fichiers et le contenu s'affichera dans notre interface exactement comme il a été organisé sur votre ordinateur.
Page 25: Le Dépôt fédéré de données de ... - Portage Network

Transfert de données : soum is s ions volum ine use s

Presenter
Presentation Notes
Pour les soumissions plus volumineuses, vous devrez utiliser Globus pour transférer les fichiers de données depuis leur source - sur un ordinateur personnel, un groupe de secteurs HPC, un stockage dans le nuage, etc. -vers un point de destination sur les serveurs du DFDR. Pour ceux d'entre vous qui ont déjà utilisé Globus pour transférer des fichiers entre des terminaux, notre configuration sera légèrement différente de celle à laquelle vous êtes habitués. Lorsque vous cliquez sur le bouton "Globus File Transfer" ...
Page 26: Le Dépôt fédéré de données de ... - Portage Network

Gestionnaire de fichiers Globus

Presenter
Presentation Notes
... une nouvelle fenêtre s'ouvrira avec le gestionnaire de fichiers Globus et le point de destination sera déjà défini pour vous - sur cette fenêtre, la destination est affichée à gauche - il s'agit d'un dossier sur le serveur du DFDR qui est associé à votre nouvelle soumission non publiée. Vous ne devez pas toucher au point de destination. Il vous suffira de sélectionner la source, où se trouvent actuellement vos fichiers. Pour ce faire, cliquez sur "Rechercher" dans la case Collection affichée ici dans le coin supérieur gauche de l'image.
Page 27: Le Dépôt fédéré de données de ... - Portage Network

Globus: Recherche de Collection

Presenter
Presentation Notes
Choisissez la "collection" ou l'appareil où se trouvent vos fichiers (il peut s'agir de votre ordinateur personnel, d'un serveur de Calcul Canada, d'un disque dur externe - tout appareil sur lequel vous avez installé et configuré Globus), puis naviguez jusqu'à vos fichiers sur cet appareil - Une fois que vous avez sélectionné vos fichiers, vous pouvez cliquer sur "démarrer" pour commencer le processus de transfert.
Page 28: Le Dépôt fédéré de données de ... - Portage Network

Globus: Sélection de fichiers

Presenter
Presentation Notes
Pour les chercheurs qui n'ont pas encore installé Globus, nous avons des instructions dans notre documentation ainsi qu'une série de courtes vidéos qui vous guideront à travers le processus de téléchargement, d'installation et de configuration de Globus. Si vous avez des questions ou si vous avez besoin d'aide à n'importe quelle étape, veuillez envoyer un courriel à notre service de soutien.
Page 29: Le Dépôt fédéré de données de ... - Portage Network

Transfert de données : t rans fe rt e n cours

Presenter
Presentation Notes
Vous ne pourrez pas finaliser et soumettre votre jeu de données avant que le téléversement via votre navigateur ou le processus de transfert Globus ne soit terminé. Toutefois, si vous utilisez Globus pour transférer vos fichiers, vous pourrez enregistrer et quitter votre envoi pendant le transfert - Globus continuera de fonctionner en arrière-plan tant que la machine où se trouvent les fichiers sera éveillée et connectée à l'internet. Si vous éteignez votre ordinateur ou si vous perdez votre connexion à l'internet, votre transfert sera mis en pause et il reprendra dès que votre ordinateur sera réveillé et reconnecté. Vous pouvez également interrompre manuellement votre transfert à tout moment.
Page 30: Le Dépôt fédéré de données de ... - Portage Network

Accès à la soumission en cours● Cliquez «Modifier» à côté d’une soumission pour la modifier ou si vous êtes

prêt à la finaliser et à la soumettre● Votre DOI est disponible, mais veuillez noter que :

○ Celui-ci ne sera ni enregistré ni fonctionnel tant que vos données n’auront pas été examinées et publiées en ligne;

○ Si vous devez partager votre DOI plus tôt, notre équipe de curation peut vérifier les fichiers pour vous informer si nous prévoyons un problème qui pourrait compromettre la publication.

Presenter
Presentation Notes
Vous recevrez un courriel de Globus lorsque votre transfert aura été effectué avec succès. Vous pourrez alors vous reconnecter au DFDR pour finaliser votre envoi. Tous vos jeux de données seront répertoriés dans votre "tableau de bord de publication" lorsque vous vous connecterez. Vous pouvez cliquer " modifier " à côté d'une soumission pour y accéder à nouveau. Notre système attribue un DOI dès que vous commencez une nouvelle soumission. Vous pouvez voir ce DOI dans votre tableau de bord, lorsque vous vous connectez au DFDR. Il sera répertorié sous le titre du jeu de données. Bien que vous puissiez partager le DOI immédiatement, sachez que celui-ci ne sera pas actif, ou ne mènera pas à votre page de renvoi de données, tant que votre ensemble de données n'aura pas passé par le processus de curation et n'aura pas été approuvé pour publication. Nous vous recommandons de ne pas partager le DOI à grande échelle tant que vous n'êtes pas certain que le jeu de données est conforme à nos conditions d'utilisation et que nous pouvons procéder à sa publication. Si vous avez besoin des données du DOI pour un manuscrit en cours de production, vous pouvez nous envoyer un courriel et nous serons heureux de faire quelques vérifications ponctuelles pour vous informer si nous prévoyons des problèmes potentiels qui pourraient retarder ou empêcher la publication.
Page 31: Le Dépôt fédéré de données de ... - Portage Network

Finalisation et soumission

Presenter
Presentation Notes
Une fois que vous avez cliqué "Modifier" pour accéder de nouveau à votre soumission, vous devrez vérifier que tout semble correct, puis finaliser et soumettre votre jeu de données. La dernière page de l'interface de soumission contient un aperçu des métadonnées que vous avez saisies. Vous pouvez cliquer "Modifier" pour revenir en arrière et apporter des modifications si nécessaire. Autrement, si tout vous semble correct, vous pouvez faire défiler la page jusqu'en bas et cliquer "Terminer" pour soumettre votre jeu de données. Une fois que vous avez envoyé vos données, vous recevrez un message électronique qui vérifiera si nous avons bien reçu votre dépôt. Toutes les données déposées dans le DFDR seront ensuite examinées par un membre de notre équipe de curation.
Page 32: Le Dépôt fédéré de données de ... - Portage Network

Processus de curation du DFDR

Adapté des étapes CURATED du Data Curation Network (DCN) https://datacurationnetwork.org/outputs/workflows/

Presenter
Presentation Notes
Notre équipe de curation évalue les nouveaux dépôts de données en utilisant un flux de travail basé sur les étapes CURATED du réseau de curation des données. Ce cadre nous guide tout au long du processus pour vérifier et comprendre un jeu de données, demander au chercheur les informations manquantes ou les modifications, augmenter les métadonnées pour la découverte et éventuellement transformer les fichiers pour une accessibilité à long terme. Nous pouvons aider les déposants à dépister les enjeux potentiels des données, tels que les droits d'auteur ou les risques de divulgation qui pourraient limiter la capacité à partager les données dans le DFDR. Nous pouvons également travailler avec les chercheurs pour offrir des conseils dans des domaines tels que la création de la documentation, la nomenclature et la structure des fichiers et la sélection des formats de fichiers qui peuvent être les plus appropriés pour le partage et la préservation à long terme. Selon la taille du jeu de données et les autres soumissions que nous examinons, il faudra environ 2 à 5 jours ouvrables pour achever le processus de curation. Nous enverrons un courriel au déposant pour lui faire part de toute modification demandée ou recommandée. Notez : le chercheur fait partie intégrante du processus de curation et le chercheur *doit* approuver tout changement - nos curateurs n'apportent pas de changements aux dépôts que nous recevons - nous suggérons ou recommandons des changements et travaillons avec le chercheur afin qu'il puisse mettre en œuvre ces changements. Vous pouvez également envoyer un courriel à service de soutien pour toute question ou si vous avez besoin d'aide pour préparer un jeu de données à déposer.
Page 33: Le Dépôt fédéré de données de ... - Portage Network

Publication de jeux de données

Presenter
Presentation Notes
Lorsque le processus de révision est terminé et que les modifications nécessaires sont en place, le jeu de données est approuvé et publié. Un DOI est enregistré pour le jeu de données, et l'élément est indexé pour être découvert. À moins que vous n'ayez choisi un embargo pour protéger temporairement les fichiers contre le téléchargement, vos données sont désormais disponibles au téléchargement dans notre interface publique. La résolution de votre DOI peut prendre jusqu'à deux heures, mais après cela, il devrait conduire directement à la page de renvoi de vos données. Au moment de la publication, votre jeu de données passe également dans le processus de préservation du DFDR. Notre coordinatrice de la préservation, vous expliquera le processus de préservation du DFDR et comment vos données de recherche sont protégées.
Page 34: Le Dépôt fédéré de données de ... - Portage Network
Presenter
Presentation Notes
L'une des nombreuses raisons pour lesquelles les chercheurs peuvent choisir de déposer leurs données dans le DFDR est que ce dépôt permet la préservation à long terme des jeux de données; je vais donc en parler brièvement ici.
Page 35: Le Dépôt fédéré de données de ... - Portage Network
Presenter
Presentation Notes
La préservation commence pendant le processus de soumission, lorsque les curateurs travaillent avec les chercheurs pour comprendre leurs jeux de données. Au cours de ce processus d'évaluation, ils examineront la pérennité de certains formats de fichiers ainsi que l'intégrité des fichiers eux-mêmes, et ils pourront travailler avec les chercheurs pour obtenir les données sous d'autres formes. Ces fichiers sont ensuite regroupés avec les métadonnées descriptives et administratives fournies dans l'interface de soumission, ainsi qu'avec les métadonnées de préservation générées par une suite d'outils de préservation, dans un ensemble appelé Archival Information Package (AIP) [En français : une Trousse d’information sur l’archivage (TIA)]. Ces paquets sont entretenus selon les meilleures pratiques du secteur de la préservation, ce qui inclut le contrôle de l'intégrité, la migration pour éviter l'obsolescence et la reproduction des paquets sur un stockage géographiquement distribué. Le DFDR met également en place un réseau de préservation qui garantirait que les données sont conservées indéfiniment par des partenaires établis.
Page 36: Le Dépôt fédéré de données de ... - Portage Network

Projet de processus pour la préservation du DFDR

Les données sontsurveillées

Les données sontréparties

géographiquement

Presenter
Presentation Notes
Cette diapositive donne un aperçu des intervenants dans le réseau de préservation en développement. Au cours de l'année dernière, nous avons travaillé avec les bibliothèques de l'Université de Toronto, le portail Scholars Portal d'OCUL et SciNet sur un "processus de préservation" qui permettrait de transférer les AIP du DFDR vers le stockage géré par SciNet, et les copies gérées par les bibliothèques de l'Université de Toronto. Ce projet pilote a fourni une preuve de concept technique qui est en train d'être reproduite et qui s'inscrit dans une vision plus large d'un réseau distribué de fournisseurs de services de préservation au Canada.
Page 37: Le Dépôt fédéré de données de ... - Portage Network
Presenter
Presentation Notes
Ce que nous pouvons faire avec vos fichiers dépend du produit que nous recevons.
Page 38: Le Dépôt fédéré de données de ... - Portage Network

● Des vidéos d’information et de formation sur le DFDR sont maintenant disponibles sur la chaîne YouTube de l’ABRC :

○ https://youtube.com/playlist?list=PLX9EpizS4A0suoSV2N0nn9parl96xHPkz

● Des documents de formation supplémentaires sont disponibles sur la page Zenodo de Portage :○ https://zenodo.org/communities/portage -network/?page=1&size=20

● De la documentation est disponible sur le site web du DFDR :○ https://www.DFDR -dfdr.ca/docs/en/about/

Souhaitez -vous en savoir plus?

Presenter
Presentation Notes
Et il y aura des versions françaises des vidéos en février - liste de lecture, documentation et Zenodo
Page 39: Le Dépôt fédéré de données de ... - Portage Network

Lee Wilson , gestionnaire de servicesKelly Stathis , coordonnatrice des métadonnées et de la découverte

Erin Clary , coordonnatrice de la curationBeth Knazook , coordonnatrice de la préservation

support@f rdr-dfdr.ca

Merci! Questions?