interop metadata tony
TRANSCRIPT
Interoperabilidad, metadatos y datos de investigaciónTony Hernández – Eva Méndez19 de enero de 2016
Maredata - Seminario sobre Gestión de Datos de Investigación
Barcelona - Infraestructuras y aspectos legales
Fuente: https://ec.europa.eu/digital-agenda/en/open-science
AGENDA DIGITAL EUROPEA
Sobre las e-infraestructuras• Ciencia basada en uso
intensivo de datos (sensores, scaners, telescopios, satélites, fotografías, análisis lingüísticos, datos económicos, sociológicos…)
• Las e-infraestructuras fomentan la emergencia de una ciencia abierta. La recolección y preparación de datos es cara y lleva mucho tiempo. Eficiencia de costes.
ESFRI Roadmap (European Strategy Forum on Research Infr)
Research Infrastructures
European Strategy Forum on Research Infrastructures
European Strategy Forum on
H2020 - EINFRA• H2020 - EINFRA 12-2017 - Data and Distributed
Computing e-infrastructures for Open Science.
• El reto: hacer los datos de investigación “descubribles”, accesibles, evaluables, inteligibles, usables y, cuando sea posible, interoperables. To make research data discoverable, accessible, assessable, intelligible, useable, and wherever possible interoperable.
• ¿Tendremos repositorios temáticos e institucionales como en los repositorios de resultados de investigación o serán un servicio de las editoriales de revistas repositorios de revistas?
Repositorios de datos de investigación: no hay demanda pero sí necesidad
● Las agencias financiadoras (EU, NSF, NIH, Wellcome Trust…) presionan cada vez más para que se diseñen planes de gestión de datos. Y eso incluye la preservación a largo plazo para su reutilización y, por tanto, repositorios.
● Sean los repositorios que sean, temáticos, generales, institucionales… lo importante será que sean interoperables.
Interoperabilidad de datasetsInteroperabilidad: función o característica de dos o más sistemas o componentes para intercambiar información y utilizar la información intercambiada (IEEE)
Datasets: una colección de datos curados, publicados y disponibles en uno o varios formatos que permiten que puedan ser reutilizados con el fin de replicar un análisis o un experimento o tomarlos para crear otros nuevos.
La interoperabilidad de datos es una característica de los datasets -y de los servicios de información que dan acceso a esos datasets- en donde los datos pueden ser fácilmente descubiertos, recuperados, procesados, reutilizados y re-empaquetados, en el sentido de operados por otros sistemas.
OAI-PMH
Algunos metadatos de másAdemás de la información común a cualquier tipo de recurso (nombre, autor, fecha de publicación, etc.) las aplicaciones, la interoperabilidad de este tipo de recurso exige encontrar más metadatos para poder comprenderlos y procesarlos.
Cobertura del dataset: tipo de datos, cobertura temática, geográfica, cronológica, etc.Especificación técnica para recuperar, analizar y poder representar el dataset (formato, protocolo, instrumentos, etc)Condiciones de reutilización (derechos, licencias)Dimensiones cubiertas por el dataset (temperatura, salinidad, coordenadas…)Semántica de las dimensiones (unidades de medida, granularidad temporal, sintaxis, taxonomías…)
Diversidad de los datasets
• La diversidad estructural de los datasets varía mucho en función del dominio por lo que se requiere que los modelos de datos de los repositorios puedan manejar distintos tipos de registros.
• Dublin Core, Ecological Metadata Language, ISO 19115:2003 Geographic information – Metadata (Federal Geographic Data Committe), Data Catalog Vocabulary (DCAT), Component Metadata Initiative (CMDI - CLARIN.EU), Data Documentation Intiative (DDI -ICPSR)
EJEMPLO CMDI
Construcción de datasets en ciencias sociales
Datos cuantitativos• Nombres de variables• Etiquetas de
variables• Valores perdidos o
nulos• Identificadores
geograf.• Datos geoespaciales• Pesos de las variables
Datos cualitativos• Métodos y prácticas
utilizadas• Detalles sobre el diseño de
la entrevista.• Copia en blanco del
consentimiento informado• Detalles sobre la selección
de los sujetos.• Instrucciones que se
dieron a los entrevistadores.
• Copia de guiones o cuestionarios
GraciasTony Hernández - Eva Méndez@tonyatlanticoUniversidad Carlos III de Madrid