organizaÇÃo e representaÇÃo da informaÇÃo (digitalizada) arquivos, bibliotecas e museus nuno...
Post on 18-Apr-2015
113 Views
Preview:
TRANSCRIPT
I Encontro de Arquivos Contemporâneos 1
ORGANIZAÇÃO E REPRESENTAÇÃO DA INFORMAÇÃO (DIGITALIZADA)
Arquivos, Bibliotecas e Museus
nuno oliveiraUniversidade do Minho
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 2
A Internet e a Web
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 3
Um pouco de história...
25 e 26 de Outubro de 2012
Vinton Cerf Robert Kahn
Timothy Berners-Lee
Internet
1990 Web
1974
IP
1974
TCP
I Encontro de Arquivos Contemporâneos 4
Um pouco de história…
25 e 26 de Outubro de 2012
1º Website Info.cern.ch foi criado em hypertexto (a primeira forma básica do HTML)
HTML (HyperText Markup Language) conjunto de marcas para descrever a estrutura de um documento na web.
HTML foi baseado no SGML (Standard Generalized Markup Language), usada para descrever dialetos de anotação
I Encontro de Arquivos Contemporâneos 5
Um pouco de história…
25 e 26 de Outubro de 2012
1994 - Criado o W3C (World Wide Web Consortium)
de onde nasce
XML (eXtensible Markup Language)
Inicia projeto: criar uma linguagem interpretável por software, e integrável com outras linguagens
a metalinguagem para a criação de linguagens de
anotação
I Encontro de Arquivos Contemporâneos 6
Um pouco de história…
25 e 26 de Outubro de 2012
Larry Page Sergey Brin
1998
Redesenho do acesso à informação!
A importância de uma página web:- não depende do número de acessos com
que conta...- depende do número de páginas que lhe
apontam (e sua importância)Pag
eR
an
k
I Encontro de Arquivos Contemporâneos 7
Um pouco de história…
25 e 26 de Outubro de 2012
Steven ChenYoutube(com Chad Hurley)
Mark ZuckerbergFacebook
Ramu YalamanchiHi5
2003 2004 20052001 2006
Even WilliamsTwiterBlogger (1999)
Jimmy WalesWikipedia
Redesenho do uso da web
WEB 2.0Informação é criada pelos utilizadores!
Cooperação!
I Encontro de Arquivos Contemporâneos 8
Um pouco de história...
25 e 26 de Outubro de 2012
WEB 3.0 ou WEB Semântica
Projeto iniciado em 2001
Relacionamento semântico entre
dados
Dados na web interpretáveis por
computadores
Atribuição de significado aos conteúdos na
web
Interoperabilidade e Cooperação
Ontologias
Inteligência Artificial
Anotação e Metadados
Redesenho da Web
I Encontro de Arquivos Contemporâneos 9
Os Arquivos e a Informação
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 10
No início era o documento!
• O Documento era o centro do arquivo
• O interesse no arquivo era por parte da história
• O arquivo era visto como auxílio a historiadores
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 11
Mas o documento foi custodiado…• Nacionalização de bens• Custódia de bens nacionalizados
• Arquivos centralizados em edifícios pertencentes ao estado • Arquivos públicos e privados são destruídos• Perde-se a identidade do documento como um elemento no seu contexto original
• Mudança no paradigma arquivístico• Mas investigação histórica continua a ser o mote para o
arquivo
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 12
E depois foi bifurcado...• Evolução da sociedade• Evolução das organizações, administrações e instituições• Produção de informação não histórica
• Separação dos arquivos em Históricos e Administrativos
• Arquivos administrativos • Novo paradigma arquivístico• Pragmatismo• Novas técnicas para organização e tratamento de informação• Facilitação no acesso à informação
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 13
No final era a Informação!• O documento deixa de ser o foco do arquivo• A informação passa a ser o objeto de trabalho dos arquivistas
• Tratamento de informação passa a ser visto como ciência• Não só no contexto de arquivos mas (e até primeiro) em
museus e bibliotecas
• Informática e Ciências da Informação e da Documentação caminham de mãos dadas• Técnicas de Preservação, Anotação, Digitalização e
Pesquisa• Uniformização da Informação para interoperabilidade• Etc.
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 14
A disponibilização da informação• Evolução da Web• Maior disponibilidade de informação• Acesso facilitado à informação• Aparecimento de standards para representação de
informação• Facilitação da Interoperabilidade entre sistemas de
informação
• Evolução da mentalidade arquivista• Necessidade de aceder pragmaticamente à Informação• Aparecimento de novos tipos de “documentos”• Necessidade de rever métodos de gestão de informação
• Desejo de troca de informação entre sistemas de informação arquivada
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 15
Em busca da Interoperabilidade
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 16
Uniformização de Arquivos
25 e 26 de Outubro de 2012
Modelo OAIS (Open Archival Information System)
Arquitetura standard para a construção de repositórios e arquivos digitais
Modelo para acesso aberto a informação a ser preservada a longo-termo
I Encontro de Arquivos Contemporâneos 17
Comunicação entre Arquivos
25 e 26 de Outubro de 2012
Arquivos não necessitam mais de estar de costas voltadas
arquivo arquivoTroca de Informação
Implementação de Protocolos de Comunicação
OAI – PMH (Open Archive Initiative – Protocol for Metadata Harvesting)
SWORD (Simple Web-service Offering Repository Deposit)
Arquivos importam e exportam informação nestes standardsProviders e Harvesters
Auxiliam a comunicação e integração de software com agregadores de informação
I Encontro de Arquivos Contemporâneos 18
Pesquisa Federada
25 e 26 de Outubro de 2012
arquivo
Ponto de Acesso
SRU/CQL(Search Retrieval via URL / Context Query Language)
arquivo arquivo
arquivoarquivo
Protocolo para queries de procura sobre a internet
CQL define a sintaxe para a escrita de queries
- Um ponto de acesso- Uma query- Resultados de procura provenientes de várias portais agregadores de informação
I Encontro de Arquivos Contemporâneos 19
Dados, Informação e Conhecimento
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 20
Dados, Informação e Conhecimento
25 e 26 de Outubro de 2012
Dados
Informação
Conhecimento
Entidades sintáticas (valores, quantidades, etc.) passíveis de serem “medidas” e processados
Relacionamento semântico entre os dados atribuindo-lhes um significado
Estruturação e organização da informação adquirida como resultado de um processo cognitivo
Apren
dizag
em
I Encontro de Arquivos Contemporâneos 21
Informação, o segredo!
25 e 26 de Outubro de 2012
Um bombeiro dos Voluntários da Aguda
(Gaia), de 49 anos, morreu, esta
segunda-feira de manhã, na sequência
de um acidente com uma ambulância da
corporação, na A29, em Arcozelo.notícia retirada do JN a 2012-10-22
I Encontro de Arquivos Contemporâneos 22
Informação, o segredo!
25 e 26 de Outubro de 2012
Um bombeiro dos Voluntários da Aguda
(Gaia), de 49 anos, morreu, esta
segunda-feira de manhã, na sequência
de um acidente com uma ambulância da
corporação, na A29, em Arcozelo.notícia retirada do JN a 2012-10-22
I Encontro de Arquivos Contemporâneos 23
Informação, o segredo!
25 e 26 de Outubro de 2012
Um bombeiro dos Voluntários da Aguda
(Gaia), de 49 anos, morreu, esta
segunda-feira de manhã, na sequência
de um acidente com uma ambulância da
corporação, na A29, em Arcozelo.
<corporação> <localidade>
<idade> <data>
<autoestrada><localidade>
notícia retirada do JN a 2012-10-22
<evento>
<motivo>
I Encontro de Arquivos Contemporâneos 24
Informação, o segredo!
25 e 26 de Outubro de 2012
Anotação(interna) de documentos
Inscrição de notas, comentários ou marcas num documento que ajudam a clarificar/normalizar o seu conteúdo.
Marcas dão significado aos dados
I Encontro de Arquivos Contemporâneos 25
Informação, o segredo (2)!
25 e 26 de Outubro de 2012
Um bombeiro dos Voluntários da Aguda (Gaia), de 49 anos, morreu, esta segunda-feira de manhã, na sequência de um acidente com uma ambulância da corporação, na A29, em Arcozelo.
Título = “Bombeiro morre em acidente na A29”
Criador = “Jornal de Notícias”
Tema = “Acidente Mortal”
Descrição = “Notícia sobre morte de bombeiro na sequência de um acidente em autoestrada.”
Editor = “Jornal de Notícias”
Data = “2012-10-22”
Tipo = “Texto”
Formato = “text/plain”
Identificador = “http://goo.gl/e84GL”
Linguagem = “PT”
I Encontro de Arquivos Contemporâneos 26
Informação, o segredo (2)!
25 e 26 de Outubro de 2012
MetadadosDados sobre os dados
Definem a semântica dos dados externos ao documento
Enriquecimento da informaçãocom
Anotação (externa) de documentos usando
... que não são expressos no conteúdo do documento ...
I Encontro de Arquivos Contemporâneos 27
Metadados e os Documentos
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 28
Documentos
25 e 26 de Outubro de 2012
Cada tipo pode ser descrito de várias formas...
O que é considerado um documento?
Os tipos de documento são variados!
Artigo Científico
LivroRelatório
Fotografia
Biografia
Filme
Fatura
Certificado
Gravação ÁudioPassaporte
... depende, claramente, do contexto e da sua utilização
Página Web
I Encontro de Arquivos Contemporâneos 29
Metadados do Documento
25 e 26 de Outubro de 2012
Três grandes tipos de metadados...
DescritivosDescrevem os dados essenciais do recurso.E.g., título, autor, etc.
AdministrativosDescrevem dados administrativos que ajudam na manutenção do documento.E.g., a data de criação, como foi a criação, etc.
EstruturaisDescrevem como o recurso é composto.E.g., ordenação de páginas, organização em sistema de ficheiros
I Encontro de Arquivos Contemporâneos 30
Esquemas de Metadados
25 e 26 de Outubro de 2012
Conjunto de metadados desenhado em específico para um dado propósito
ex. descrever um determinado relatório...
Tem, geralmente, um contexto de utilização associado!
Podem completar-se, descrevendo um documento para vários propósitos
Definem a semântica (e sintaxe) dos metadados e seus conteúdos
I Encontro de Arquivos Contemporâneos 31
Esquemas de Metadados
25 e 26 de Outubro de 2012
- Dublin Core – para simples descrição de um documento
- TEI (Text Encoding Initiative) – para anotação de textos eletrónicos (e.g., romances)
- METS (Metadata Encoding and Transmission Standard) – para expressar estrutura de um objeto digital assim como para o descrever e localizar os ficheiros que o compõem
- EAD (Encoded Archival Description) – para anotar dados em inventários ou índices em linha
- LOM (Learning Object Metadata) – para fomentar o uso de recursos didáticos suportados por tecnologia
- CDWA (Categories for Description of Works of Art) – para descrever objetos visuais como pinturas ou esculturas
- ISAD(g) (General International Standard Archival Description ) – guias para descrever arquivos
I Encontro de Arquivos Contemporâneos 32
Uma questão de Semântica
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 33
Nem só de pão vive o homem...
25 e 26 de Outubro de 2012
A anotação de documentos ajuda o humano a perceber com maior exatidão o conteúdo e o próprio documento
As marcas de anotação por si só fornecem o significado ao valor marcado
Nesta perspetiva
E as relações semânticas que entre elas existem...
Porque (melhor ou pior) o humano conhece o domínio
MASAs máquinas
NÃO!!!É necessário “ensinar-lhes” o domínio!
I Encontro de Arquivos Contemporâneos 34
Organização semântica da Informação
25 e 26 de Outubro de 2012
Ontologias
“Uma ontologia é um artefacto que
define um conjunto de conceitos,
relações e axiomas para um domínio de
saber específico, representando e
organizando o conhecimento implícito (de
forma a que um conjunto de sistemas cooperativos
concordem e o partilhem).”Retirado, traduzido e adaptado de “Ontological Adaptive Integration Of Reverse Engineering Tools”
I Encontro de Arquivos Contemporâneos 35
Organização semântica da Informação
25 e 26 de Outubro de 2012
Ontologias O = (C, R, A)
- C – Entidades da Ontologia- CC – Conceitos (Ex: Mãe)- CI – Instâncias dos conceitos (Ex: Teresa)
- R – Relações entre entidades da Ontologia- RH – Relações taxonómicas/hierárquicas entre conceitos (Ex:
Mãe ‘é_uma’ Pessoa)- RI – Relações entre conceitos e Instâncias (Ex: Teresa ‘é_uma’
Mãe)- RS – Relações não taxonómicas entre conceitos (Ex: Mãe
‘tem_filho’ Filho)- RP – Propriedades dos conceitos (Ex: Pessoa
‘data_de_nascimento’ 1986-02-26)
- A – Axiomas. Dão consistência à ontologia e são usados para inferir novo conhecimento (Ex: “Se duas Filhas têm a mesma mãe então são Irmãs”)
I Encontro de Arquivos Contemporâneos 36
Ontologias…Metadados… Cooperação?
25 e 26 de Outubro de 2012
CooperaçãoSó haverá cooperação entre sistemas (de arquivos) se todos falarem a mesma língua!
XML é a língua franca para a interoperabilidade (de informação)!
Mas o conteúdo em XML pode ser interpretado de várias maneiras!
MetadadosMas os metadados têm um significado bem definido!
No entanto o significado depende do domínio específico...
OntologiasAs ontologias descrevem um domínio!
Os metadados (conceitos nas ontologias) podem ser relacionados de forma unívoca numa tal estrutura...
Uma vez aceites as relações inter-metadados , os sistemas podem cooperar porque se percebem mutuamente!
I Encontro de Arquivos Contemporâneos 37
Os nossos Projetos
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 38
Metadados na Pesquisa Semântica
• Criação de Ontologia para uma área jurídica• Levantamento de metadados associados a documentos dessa área• Relacionamento entre metadados e conceitos ontológicos
• Implementação da pesquisa de documentos baseada na ontologia
• Benefícios da pesquisa ontológica na obtenção de informação jurídica
25 e 26 de Outubro de 2012
De documentos Jurídicos!
I Encontro de Arquivos Contemporâneos 39
Povoamento Automático de Ontologias
• Área jurídica do direito de família• Criação de Ontologia para representar conhecimento
sobre a área
• Utilização de processamento de linguagem natural para reconhecer padrões e anotar textos jurídicos
• Informação anotada usada para povoar ontologias
• Diminuição dos custos e esforços na construção de bases de conhecimento
25 e 26 de Outubro de 2012
A partir da anotação de documentos Jurídicos!
I Encontro de Arquivos Contemporâneos 40
Geração Automática de Museus Virtuais
• Base de dados de espólio (de museus e arquivos) anotado
• Ontologia geral para descrever o conhecimento anotado
• Construção de salas de exposição virtuais para aprendizagem a partir de especificações sobre a vistas da ontologia e os documentos anotados
• Navegação dirigida pela semântica• Uso de browsers semânticos
• Projeto CoNVEM / Geny
25 e 26 de Outubro de 2012
A partir da anotação de espólio de arquivos e museus
I Encontro de Arquivos Contemporâneos 41
Geração Automática de Museus Virtuais
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 42
Geração Automática de Museus Virtuais
• Projeto siME, Projeto de Mestrado, Genio• Museu da Emigração e das Comunidades (Fafe)
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 43
Geração Automática de Museus Virtuais
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 44
Outros Projetos
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 45
Qwiki
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 46
Google Art Project
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 47
Sumário
25 e 26 de Outubro de 2012
I Encontro de Arquivos Contemporâneos 48
Sumário
25 e 26 de Outubro de 2012
Tim Berners-Lee adaptou-se à (na altura) nova tendência da comunicação entre computadores e revolucionou-a!
Tal revolução levou à criação de espaços partilhados de informação, acessíveis por todo o mundo!
Os arquivos e os seus profissionais também evoluíram com o tempo, adaptando-se às demandas da sociedade e à própria evolução tecnológica!
A Web continuou a evoluir ao ponto de se estar agora a preparar para a sua terceira fase, onde as máquinas irão compreenderão o conteúdo dos recursos documentais...
A noção de anotações e metadados como o segredo para a obtenção de informação, e o seu relacionamento semântico com base em ontologias, parece estar em consonância com a noção semântica que a web quer para si.A uniformização de arquivos como repositórios de Informação, aumentam a possibilidade de cooperarem, promovendo a troca de informação (em tempos custodiada)
I Encontro de Arquivos Contemporâneos 49
ORGANIZAÇÃO E REPRESENTAÇÃO DA INFORMAÇÃO
Arquivos, Bibliotecas e Museus
nuno oliveiraUniversidade do Minho
25 e 26 de Outubro de 2012
top related