repositório de dados na u.porto: um fluxo de curadoria suportado numa extensão ao dspace
DESCRIPTION
Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace. - Cristina Ribeiro, João Rocha da Silva, Maria Eugénia Matos Fernandes, João Correia LopesTRANSCRIPT
![Page 1: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/1.jpg)
Repositório de dados na U.Porto
Um fluxo de curadoria suportado numa extensão ao DSpace
Cris:na Ribeiro DEI-‐ FEUP/ INESC TEC
João Rocha da Silva FEUP
Eugénia Matos Fernandes Reitoria da Universidade do Porto
João Correia Lopes DEI-‐ FEUP/ INESC TEC
![Page 2: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/2.jpg)
Conteúdo
• Obje:vos • Auditoria de dados na U.Porto • Desenho de um workflow de gestão de dados • Construção de um protó:po de repositório • Conclusões e trabalhos futuros
![Page 3: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/3.jpg)
Obje:vos
• Determinar as necessidades de gestão de dados dos inves:gadores da U.Porto
• Desenhar e implementar um repositório de dados para sa:sfazer estas necessidades
• Procurar uma solução que não esteja limitada às necessidades de um só grupo
![Page 4: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/4.jpg)
Objetivo
Status Quo
Sa:sfazer obje:vos
• Representar dados tabulares em formatos próprios para preservação – XML
• Interrogação online • Reu:lização de descritores nos metadados
![Page 5: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/5.jpg)
Fase 1 : Entrevistas
Recolha de dados e de casos de uso
Especificação do workflow
Construção da plataforma
Depósito de dados
![Page 6: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/6.jpg)
Auditoria de dados
• Entrevistas com inves:gadores – Engenharia, ciências sociais, educação, ciências da terra, biologia, economia, …
• Recolha de amostras de dados • Recolha de casos de uso • Relatório e resultados subme:dos a aprovação dos inves:gadores
![Page 7: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/7.jpg)
Os inves:gadores dizem
• … a gestão de dados é complexa • … a gestão de dados não deveria distraí-‐los do seu trabalho
• … precisam de apoio profissional na gestão de dados
• … “o que ganho em guardar os meus dados num repositório? Os discos externos são tão baratos!”
![Page 8: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/8.jpg)
Os inves:gadores dizem
• … já perderam dados devido a formatos que foram abandonados
• … precisam de sí:o para par:lhar dados com parceiros, em vez de usarem o email
• … precisam de ferramentas para manipulação de dados online
![Page 9: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/9.jpg)
Preocupações e necessidade dos inves:gadores
• “Os repositórios não podem ser cemitérios de dados”
• “O principal obje:vo na preservação de dados é a par:lha/ reu:lização/ citação”
• “Os dados têm de ser bem anotados ou não podem ser usados para validar resultados
![Page 10: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/10.jpg)
Fase 2 : Modificar o workflow
Recolha de dados e de casos de uso
Especificação do workflow
Construção da plataforma
Depósito de dados
![Page 11: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/11.jpg)
O Papel do “Curador de Dados”
Dados
CuradorInvestigador
![Page 12: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/12.jpg)
Reunião de curadoria
Reunião
Dados Curados
![Page 13: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/13.jpg)
Anotação de dados
Silva, João Rocha
Azores GPS Run
01-01-2011
License: CC ShareAlike
dc:contributor.author
dc:lastModified
dc:title
dc:rights
38.760267493 -27.084113746 488500.999190
38.760267489 -27.084113743488499.999191
-27.084113739 488498.999192 38.760267506
488497.999193 38.760267485 -27.084113744
-27.084113730 488496.999194 38.760267507
time.gps_sow latitude longitude
Terceira
Flores
Table-level metadata
Data
Dimensions
END_METADATA
-107.391006-93.994527-80.584969-67.168032-53.750371
gravity.specific
Elementos do XML Schema do domínio como descritores e colunas
![Page 14: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/14.jpg)
Depois da reunião
Dados+Metadados em formato Excel
Repositório
![Page 15: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/15.jpg)
Dados disponíveis
• Explorar, filtrar e descarregar só o necessário
Investigador
Repositório de dados de investigação
![Page 16: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/16.jpg)
Fase 3 : Construir ferramentas de suporte ao workflow
Recolha de dados e de casos de uso
Especificação do workflow
Construção da plataforma
Depósito de dados
![Page 17: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/17.jpg)
Módulo de dados de investigação UPData
TransformaçãoXSLT
CoreDSpace
TabelaDinâmica
Tabela Formatada
Tradutorde
Interrogações
Interrogação XQuery FLWOR
Ficheiro Original
Folha Excel correctamente
preenchida
5
4
3
Documento Traduzido
(XML)
Página dedepósito
Interrogação(JSON)
XML Manager
Resultados (Dados + Metadados)
1
Acesso a
dados
Leitor XLSX
2
Investigador Curador
Pedido de filtragem de dados
![Page 18: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/18.jpg)
![Page 19: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/19.jpg)
Fase 4 : Testar ferramenta com dados reais
Recolha de dados e de casos de uso
Especificação do workflow
Construção da plataforma
Depósito de dados
![Page 20: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/20.jpg)
Conclusões e Trabalho Futuro • Recolhemos requisitos e casos de uso dos inves:gadores da U.Porto
• Casos de uso mais importantes foram implementados em repositório DSpace
• U:lizadores podem navegar sobre dados online no repositório e descarregar subconjuntos selecionados
• Futuro: – Validação de ferramentas com u:lizadores – Métodos mais simples de interação entre inves:gadores e repositório
![Page 21: Repositório de dados na U.PORTO: um fluxo de curadoria suportado numa extensão ao DSpace](https://reader033.vdocuments.net/reader033/viewer/2022052820/54c497cf4a795904788b471a/html5/thumbnails/21.jpg)
Contactos e ligações
Cris:na Ribeiro [email protected]
João Rocha da Silva [email protected]
Eugénia Matos Fernandes [email protected]
João Correia Lopes [email protected]
Repositório: hjp://sciencedata.up.pt/
Documentos: hjp://sciencedata.up.pt/doc