coleções biológicas e sistemas de informação cgee, mct – julho de 2005
TRANSCRIPT
Coleções Biológicas e Sistemas de Informação
CGEE, MCT – Julho de 2005
Coleções Biológicas - missão
Documentar, compreender e educar o mundo sobre a vida no nosso planeta no passado e no presente e projetar o futuro
Construção do conhecimento sobre biodiversidade
Coletiva, multi e inter-disciplinar Requer um ambiente de cooperação
global Depende de uma base comparativa de
dados e de conhecimento
Dados e Computação hoje
Novos instrumentos para observar a natureza Satélites, micro eletrônica, computação de alta
performance etc.
Habilidade de criar cenários virtuais Ferramentas para modelagem, visualização,
matemática avançada
Gerando uma grande quantidade de dados de qualidade
Novas descobertas científicas e dados
Tamanho ou quantidade Terabytes
Complexidade Taxonomia, genética, ecologia, clima,
sociologia, economia, ...
Análise Computador Multi-disciplinar
Dados
Ontem:
• pessoas responsáveis por seus dados
• dados “lidos” por indivíduos
• dados interpretados por indivíduos
• descobertas feitas através do pensamento, através da análise de um indivíduo ou de algumas pessoas
Futuro
• grupos / instituições responsáveis pela gestão dos dados de provedores múltiplos
• impossível para uma pessoa “ler” os dados
• interpretação com o auxílio de software
• descobertas feitas com o uso de computadores, verificadas pelas pessoas
Dados precisam ser digitais e estar disponíveis on-line
Sistemas em Operação: Programa Biota/Fapesp
SinBiota Alimentado por pesquisadores: provedor tem
controle dos dados (pode incluir, corrigir, apagar)
Centralizado Ficha padrão de coleta e lista de espécies
associada (padronização dos campos)
Rede speciesLink
Provedores: coleções biológicas com total domínio sobre os dados
Sistema Distribuído Modelo de dados: DarwinCore Protocolo de comunicação: DiGIR
Mirror(SOAP server)
Sistema deGerenciamento
Provider(PHP)
Dados
dados
Dados(PostgreSQL)
speciesLinksite lib
DiGIRPortal
Provider(PHP)
spLinker(Java)
Sistema de Gerenciamento
Conectividade rápida e estável
Conectividade lenta ou instável
Coleção A ServidorRegional
soap/http/xml
Repositóriode dados
http/xml
http/xml
registro
SQL
SQL
SQL
Coleção D
Coleção CColeção B Coleção CColeção B
acacia
Tabebuia
Perfil dos Acervos: Distribuição Geográfica MZUSP (peixes)
Perfil dos Acervos: Famílias ESA
Cenário envolvendo o uso de padrões e protocolosCenário envolvendo o uso de padrões e protocolos
dados descritivos
nomenclatura taxonomia
modelagem
qualidade de dados
mapas
dadosprimários
educaçãopesquisa
tomada dedecisão
coleçãobiológica
Conceitos
Característica internacional dos dados de coleções biológicas
Compartilhamento de dados exige um esforço coordenado
Interoperabilidade: facilita a cooperação e o uso efetivos dos dados
Impedimento digital: impacta toda a comunidade científica
Considerar evolução de hardware, software, da tecnologia de comunicação e do pensamento e da organização científica
O desenvolvimento e manutenção de sistemas de informação não é tarefa para amadores
Conceitos
Coleções biológicas: São centros de informação Precisam ter um sistema de gestão de seus
dados São “nós” de uma rede interoperável de
dados (via conexões dinâmicas ou através do espelhamento dos dados – mirror)
Conceitos
Pesquisadores ou Grupos de Pesquisa São importantes componentes de uma rede
de informação, mas não são “nós” Necessitam de um sistema onde possam
“depositar” os seus dados
Desafios
inventariar e aumentar substancialmente a base de conhecimento sobre a diversidade biológica em país de megadiversidade, carente de recursos humanos e financeiros;
disseminar a cultura de compartilhamento de dados e conhecimento de acesso público e aberto;
integrar pessoas, grupos de pesquisa e instituições dos setores público e privado em redes cooperativas de pesquisa e informação voltadas para a criação de uma infra-estrutura de dados sobre espécies e espécimes comum, de acesso aberto e livre;
organizar e integrar dados, informação e conhecimento em bases de dados e sistemas de informação de acesso aberto e livre;
Desafios
usar a informação obtida no passado e no presente para prever e planejar o futuro;
garantir a preservação de dados primários por tempo indeterminado, para uso presente e futuro;
criar ambiente legal favorável ao processo de inovação científica e tecnológica, que facilite e estimule o acesso e uso dos componentes da diversidade em bases sustentáveis; e
possibilitar a apropriação do conhecimento sobre a diversidade biológica por tomadores de decisão e responsáveis pelo desenvolvimento e harmonização de políticas públicas.
Pontos Fortes
Uma rede de comunicação (RNP e parceiros como a ANSP e Rede Rio) distribuída por todo o país ligando as principais instituições de pesquisa e universidades;
Coleções biológicas abrangentes já estabelecidas; Recursos humanos especializados tanto em taxonomia e
ecologia como também em informática; A existência de padrões e protocolos que viabilizam a
implementação de sistemas distribuídos de dados; O envolvimento das sociedades científicas na discussão da
implementação de um sistema aberto de disseminação de dados;
A experiência bem sucedida do programa Biota/Fapesp com sistemas distribuídos de dados de acervos de coleções biológicas.
Pontos Fracos
Infra-estrutura em informática nas coleções (hardware, software, rede de comunicação);
A precariedade de grande parte das redes de campi de universidades e centros de pesquisa, carentes de uma rede interna adequada ao uso de aplicações avançadas
Ausência de equipe capacitada ou de apoio em informática na maioria das coleções;
Lacunas de conhecimento taxonômico e geográficos; Ausência ou insuficiência de recursos humanos
capacitados para trabalharem com determinados grupos taxonômicos;
Pontos Fracos (cont.)
Dificuldades na contratação de especialistas nas instituições de pesquisa do país;
Impossibilidade de contratar especialistas em projetos apoiados por agências de fomento do Brasil;
Ausência de uma política de disseminação de dados e informações de acesso aberto nas principais agências de C&T do país;
Ausência de uma política inter-agências para a disseminação de dados e informações de acesso aberto;
Ausência de políticas governamentais para a preservação e disseminação de dados que já nascem digitais;
Ausência de um sistema de arquivo permanente de dados.
Oportunidades
A mega biodiversidade brasileira A legislação sobre o acesso público a dados e
informações ambientais no Brasil; A inovação tecnológica em informática: maior
capacidade de armazenamento de dados, maior velocidade na transmissão de dados, quantidade de dados em rede disponíveis, etc.
O programa de pesquisa em Internet avançada, TIDIA, que prevê a criação de uma infra-estrutura de rede exclusivamente dedicada à pesquisa no Estado de São Paulo;
Oportunidades (continuação)
A implantação de uma nova geração do backbone nacional, RNPng, prevista para interligar dez estados (RS, SC, PR, SP, RJ, MG, DF, BA, PE, CE) em uma rede multigigabit;
o sucesso da implantação de RedCLARA pelo Projeto ALICE – America Latina Interconectada com Europa - no âmbito do Programa @LIS;
Os programas da Convenção sobre Diversidade Biológica como o 2010 Biodiversity Target, o GTI (Global Taxonomy Initiative), o IPI (International Pollinators Initiative) e o GSPC (Global Strategy for Plant Conservation);
As iniciativas internacionais de open access e data commons;
Oportunidades (continuação)
O trabalho colaborativo e cooperativo desenvolvido pelo TDWG (International Working Group on Taxonomic Databases);
Os trabalhos desenvolvidos pelo GBIF (Global Biodiversity Information Facility) e os resultados obtidos tanto do ponto de vista do desenvolvimento de padrões, protocolos e ferramentas como também do número de registros já disponíveis de acesso livre e aberto;
O projeto financiado pelo GEF para o desenvolvimento de áreas temáticas na IABIN;
A integração com outras iniciativas nas Américas (Conabio/Remib, Siamazonia, INBio, NYBG)
Oportunidades (continuação)
A existência da Rede Temática de Pesquisa em Modelagem da Amazônia (GEOMA)
O Plano Estratégico do MCT (2004-2007) que inclui ações como apoio a redes de inventários, a difusão de conhecimentos científicos e a a implementação de sistema integrado de gestão da informação para cooperação internacional;
a implantação do Instituto Nacional do Semi-Árido e a Rede Giga–Nordeste (RNP);
a existência de programas e projetos importantes, geradores de dados e informações sobre espécies e espécimes como o Probio, PROANTAR, PPG7, Revizee, entre outros
Ameaças
A rapidez da inovação tecnológica: obsolescência dos sistemas, dificuldade na recuperação de dados
Ausência de políticas permanentes de apoio à acervos científicos;
Ausência de políticas coordenadas inter-agências para a estruturação e manutenção de uma infra-estrutura de dados sobre espécies e espécimes;
Ausência de políticas de longo prazo para a manutenção de banco de dados e sistemas de informação;
Ameaças (continuação)
A legislação sobre o acesso a recursos genéticos; A descontinuidade de programas; A falta de formação em microinformática nos cursos
de biologia e áreas afins; A ausência de pessoal qualificado para a gestão dos
acervos biológicos; A falta de uma cultura e política de compartilhamento
de dados; A ausência de um “plano B”: mecanismos para a
transferência de acervos, bancos de dados, sistemas de informação e data archiving
Recomendações
que o ponto focal do GTI no Brasil seja o Ministério da Ciência e Tecnologia
que o Brasil seja um membro participante do GBIF que o MCT estabeleça uma política clara sobre o
acesso aberto a dados obtidos com financiamento público.
que todo projeto apoiado pelo MCT e suas agências, que gere dados sobre espécies ou espécimes, tenha na proposta um componente de estruturação e disseminação de um banco de dados ou do depósito de dados em uma fonte de acesso público.
Estratégia
Arquitetura Modelo de Gestão Produtos Custo
portal
Sistema de preservação de dados para gerações futuras (long term data archive)
data commons space
servidor regional
coleções biológicas dados de observação
data commonsspace
dados taxonômicos
Serviços Web•Mapas•Modelagem•Datacleaning•Georeferenciamento automático•Outros serviços
Instituição(s) Gestora(s): Características desejáveis
Ter como missão o desenvolvimento e manutenção de uma infra-estrutura de dados sobre coleções científicas de acesso livre e aberto
Ser sustentável, com apoio permanente ou de longo prazo garantido;
Ter flexibilidade para poder contratar e demitir mão-de-obra necessária, alterar tecnologias, incluir novas prioridades, e manter um plano estratégico dinâmico;
Ter alta capacidade de articulação e de estabelecimento de parcerias
Ter transparência para garantir a sua credibilidade e, Contar com equipe altamente especializada.
Instituição Pública ou Privada?
Instituição pública relativa estabilidade financeira com a possibilidade de
manutenção de longo prazo normalmente é uma administração mais “engessada”,
com possíveis problemas de contratação menor facilidade para a articulação e para o
estabelecimento de parcerias. Susceptível à descontinuidade de programas com as
mudanças de governos dificultando a implementação de políticas de longo prazo.
Instituições privadas de interesse público
OS e OSCIP precisam: ter transparência, prestar contas ao Poder Executivo; e executar as atividades estatutárias.
Apresentam maior facilidade para mobilizar recursos, sinergizar iniciativas promover parcerias em prol de seus objetivos e
metas. Com objetivos e metas claras é também mais simples
desenvolver um planejamento de longo prazo com indicadores claros e mensuráveis.
Instituições privadas de interesse econômico
Não foi analisada a opção de instituição privada com fins lucrativos por entendermos que não se trata de um serviço econômico competitivo e sustentável e sim de um fim público.
Aspectos importantes
Estabelecer um acordo de gestão ou de um termo de parceria com o Poder Público.
• apoio de longo prazo à Instituição com avaliações periódicas • apoio permanente ao sistema e dados associados. • O não cumprimento das cláusulas estabelecidas implica na
transferência dos sistemas e dados para uma instituição capaz de assegurar a integridade do patrimônio digital e o seu acesso público e aberto.
Estabelecimento de um comitê científico para orientar os trabalhos com relação às prioridades do conteúdo, padrões de qualidade e outras questões técnicas e científicas.
Instituição gestora do sistema (direção, equipe técnica, equipe administrativa)
Parcerias:• RNP• Coleções Biológicas• Instituições de Pesquisa• Instituições de Informática
Poder Público
Assembléia
Conselho Fiscal
Conselho Administrativo
OSCIP
OS
Comitê Científico
Comitê Científico
Acordo deGestão
Termo deParceria
Produtos
Catálogo da Vida / Brasil Rede de dados de espécimes em coleções biológicas
do Brasil Banco ou rede de dados de observação em campo Redes temáticas (polinizadores, espécies invasoras,
espécies ameaçadas, …) Ferramentas: visualização, georeferenciamento, data
cleaning, modelagem, … Centro(s) depositário(s) de dados (data archiving) de
longo termo
Custos primeiros 3 anos
Atividade Custo
(3 anos)
Estudo do modelo de gestão 100.000
Estudo do sistema de data archiving 100.000
Programa de digitalização de acervos (60 coleções, apoio de 2 anos cada)
3.780.000
Infra-estrutura de comunicação e de rede 1.350.000
Programa induzido para a ampliação da rede speciesLink para incluir 20 coleções biológicas por ano
3.000.000
Projetos especiais 1.800.000
Total (3 anos) 10.130.000
Custo para 10 anosAção Ano (R$ 1.000)
1 2 3 4 5 6 7 8 9 10 Total
Estudo do modelo de gestão 100 100
Estudo do sistema de data archiving
100 100
Programa de digitalização de acervos
1.260 1.260 1.260 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.780
Infra-estrutura de comunicação e de rede
450 450 450 450 450 450 450 450 450 450 4.500
Programa induzido para a ampliação da rede speciesLink para incluir 20 coleções biológicas por ano
1.000 1.000 1.000
3.000
Projetos especiais 600 600 600 1.000 1.000 1.000 1.000 1.000 1.000 1.000 8.800
Instituição Gestora da Rede 4.163 4.163 4.163 4.163 4.163 4.163 4.163 29.141
Instituição responsável pelo Data Archiving
1.000 1.000 1.000 1.000 1.000 1.000 1.000 7.000
Total 3.510 3.310 3.310 7.613 7.613 7.613 7.613 7.613 7.613 7.613 63.421