lívia relatório curso_biblioteca_digital_bn

21
Relatório de participação no “1 o . Curso de Gestão de Bibliotecas Digitais: uma abordagem prática e teórica”. Participante: Lívia Lopes Garcia Data: de 02/07/2012 a 06/07/2012 Local: Biblioteca Nacional, no Rio de Janeiro Promovido: Biblioteca Nacional Digital 02/07 Abertura com a Coord. da Biblioteca Digital Nacional (BND) Angela Bettencourt O curso tem por objetivo auxiliar as instituições do Brasil a gerir a digitalização de seus acervos com intuito de formar um Portal Digital Nacional. O curso representou o primeiro fruto da BND que tem como objetivos principais: - Preservação - Possibilitar acesso não físico - Reunir conteúdos e coleções dispersas em vários acervos - Divulgar o acervo - Democratizar o acesso 02/07 Bibliotecas Digitais e suas utopias por Prof. Luiz Fernando Sayão E-mail: [email protected] Sayão começa falando sobre o desejo antigo do homem de reunir todo o conhecimento em um só lugar, formando a idéia de “bibliotecas totais”, concretizada pela Biblioteca de Alexandria. Contudo, com o passar dos séculos, ironicamente a humanidade foi para o lado inverso, o da fragmentação do conhecimento. As Bibliotecas Digitais (BD), retomam a idéia de bibliotecas totais, mas não totalmente, por meio delas, somente o acesso é único, mas os acervos podem estar dispersos em outras instituições. A microfilmagem foi mencionada como a base tecnológica das BDs, pois ampliou o acesso e reduziu o espaço ocupado, além da possibilidade de se fazer duplicatas e distribuir o conteúdo a outras instituições. Posteriormente Sayão apresentou os pensadores relevantes na evolução das BDs: - Otlet: Propôs “motor de busca analógica” com as fichas catalográficas. - H.G.Wells (1930): Acreditava que toda a memória seria acessível através do microfilmes. - Vanevar Bush (1945): Desenvolveu o projeto do Memex, que nunca saiu do papel. Tratava- se de um equipamento que armazenaria todos os conteúdos (livros, vídeos, fotos, etc.), se opondo a rigidez dos sistemas tradicionais da época. Início do hipertexto. Seria o IPAD de hoje. - Ted Nelson (1960): Criou os termos hipertexto e a hipermídia, interligando informações. - Licklider (1960): Biblioteca baseada em computador. - Lancaster (1980): Com computadores pode-se dispensar o papel. - Barnes-Lee (1990): Inventou a World Web Wide (1990) e a Web Semântica (2004). Para Sayão os desafios para se criar uma BD são mais gerenciais do que tecnológicos como: espaço de memória, novos documentos, coleções digitais, metadados, interoperabilidade, preservação, curadoria, acesso, serviços e autenticidades. E salienta que a Web não substitui o conceito de biblioteca, mas o expande. Para ele, as áreas possuem visões diferentes a respeito das BDs: - Biblioteconomia: menos como sistema, mais como instituição, além de significar um outro passo da automação e ampliação dos serviços prestados. - Tecnologia da Informação: ampliação dos sistemas em rede. - Editores: novo mercado, nova economia da informação. - Governo: facilidade e visibilidade dos serviços. - Professores: novo recurso de aprendizado, ensino à distancia. - Arquivologia: alternativa ao microfilme, fim Fo dilema entre acesso e preservação. - Comércio eletrônico: informação inserida na economia global. - Pesquisador: espaço dinâmico voltado para o compartilhamento e disseminação de conhecimento.

Upload: marcio-bezerra

Post on 05-Jun-2015

474 views

Category:

Technology


5 download

DESCRIPTION

Relatório do curso de Biblioteca Digital, proferido pela Biblioteca Nacional em julho de 2012, na cidade do Rio de Janeiro. Relatos da participante Lívia Lopes Garcia.

TRANSCRIPT

Page 1: Lívia relatório curso_biblioteca_digital_bn

Relatório de participação no “1o. Curso de Gestão de Bibliotecas Digitais: uma abordagem prática e teórica”. Participante: Lívia Lopes Garcia Data: de 02/07/2012 a 06/07/2012 Local: Biblioteca Nacional, no Rio de Janeiro Promovido: Biblioteca Nacional Digital 02/07 Abertura com a Coord. da Biblioteca Digital Nacional (BND) Angela Bettencourt O curso tem por objetivo auxiliar as instituições do Brasil a gerir a digitalização de seus acervos com intuito de formar um Portal Digital Nacional. O curso representou o primeiro fruto da BND que tem como objetivos principais: - Preservação - Possibilitar acesso não físico - Reunir conteúdos e coleções dispersas em vários acervos - Divulgar o acervo - Democratizar o acesso 02/07 Bibliotecas Digitais e suas utopias por Prof. Luiz Fernando Sayão E-mail: [email protected] Sayão começa falando sobre o desejo antigo do homem de reunir todo o conhecimento em um só lugar, formando a idéia de “bibliotecas totais”, concretizada pela Biblioteca de Alexandria. Contudo, com o passar dos séculos, ironicamente a humanidade foi para o lado inverso, o da fragmentação do conhecimento. As Bibliotecas Digitais (BD), retomam a idéia de bibliotecas totais, mas não totalmente, por meio delas, somente o acesso é único, mas os acervos podem estar dispersos em outras instituições. A microfilmagem foi mencionada como a base tecnológica das BDs, pois ampliou o acesso e reduziu o espaço ocupado, além da possibilidade de se fazer duplicatas e distribuir o conteúdo a outras instituições. Posteriormente Sayão apresentou os pensadores relevantes na evolução das BDs: - Otlet: Propôs “motor de busca analógica” com as fichas catalográficas. - H.G.Wells (1930): Acreditava que toda a memória seria acessível através do microfilmes. - Vanevar Bush (1945): Desenvolveu o projeto do Memex, que nunca saiu do papel. Tratava-se de um equipamento que armazenaria todos os conteúdos (livros, vídeos, fotos, etc.), se opondo a rigidez dos sistemas tradicionais da época. Início do hipertexto. Seria o IPAD de hoje. - Ted Nelson (1960): Criou os termos hipertexto e a hipermídia, interligando informações. - Licklider (1960): Biblioteca baseada em computador. - Lancaster (1980): Com computadores pode-se dispensar o papel. - Barnes-Lee (1990): Inventou a World Web Wide (1990) e a Web Semântica (2004). Para Sayão os desafios para se criar uma BD são mais gerenciais do que tecnológicos como: espaço de memória, novos documentos, coleções digitais, metadados, interoperabilidade, preservação, curadoria, acesso, serviços e autenticidades. E salienta que a Web não substitui o conceito de biblioteca, mas o expande. Para ele, as áreas possuem visões diferentes a respeito das BDs: - Biblioteconomia: menos como sistema, mais como instituição, além de significar um outro passo da automação e ampliação dos serviços prestados. - Tecnologia da Informação: ampliação dos sistemas em rede. - Editores: novo mercado, nova economia da informação. - Governo: facilidade e visibilidade dos serviços. - Professores: novo recurso de aprendizado, ensino à distancia. - Arquivologia: alternativa ao microfilme, fim Fo dilema entre acesso e preservação. - Comércio eletrônico: informação inserida na economia global. - Pesquisador: espaço dinâmico voltado para o compartilhamento e disseminação de conhecimento.

Page 2: Lívia relatório curso_biblioteca_digital_bn

- Profissionais de Cultura: visibilidade, curadoria virtual. Definição de BDs da Digital Library Federation (DLF): “Bibliotecas digitais são organizações que disponibilizam os recursos, incluindo pessoal especializado para selecionar, estruturar, oferecer acesso intelectual, interpretar, distribuir, preservar a integridade e assegurar a persistência ao longo do tempo de coleções de trabalhos digitais, de forma que eles estejam prontamente e economicamente disponíveis para uso de uma comunidade definida ou um conjunto de comunidades.” Para Sayão, a web não tem memória, é preciso construí-la intencionalmente através de tecnologia e gestão. Deve-se mudar com a tecnologia, mas manter a autenticidade e confiança em ambientes certificados. Sayão seguiu falando de documentos essenciais para certificação como OAIS (Reference Model for an Open Archival Information System) - ISO 1472:2003 Sayão menciona o DRIVER que reúne todos os repositórios digitais da Europa. http://www.driver-repository.eu/ Sayão segue falando sobre objetos digitais, defende que estes são conceitualmente equivalentes aos itens do acervo de bibliotecas, arquivos, coleções de museus, etc. Acrescenta que um objeto digital deve ser representado para se tornar um item de informação. Os objetos digitais podem ser simples (completos em um só arquivo), como arquivos de textos, imagens ou complexos (formado por um conjunto de arquivos e metadados) como páginas de web. Sayão afirma que o texto por si não conta mais toda a história, ela está distribuída em várias camadas. Os documentos estão se tornando complexos demais, dificultando seu gerenciamento. Hoje, cada artigo de uma revista científica, por exemplo, é composto por video, blog, gráficos interativos, etc. Os objetos digitais não falam por si, requerem interpretações (hardwares e softwares) para torná-los visíveis aos sentidos humanos. E como no mundo tecnológico as mudanças são constantes, metadados devem acompanhar o documento para interpretações futuras. Por exemplo: que software usar para a leitura de um documento? O metadado informará. Uma BD sem metadados tem tudo para se tornar bits de impossível interpretação no futuro. Precisamos de informação para interpretação futura: estrutural e semântica. Sayão finaliza afirmando que as BDs exigem uma biblioteconomia muito mais precisa, exige muito mais biblioteconomia. O processo tecnológico está mudando a forma como a biblitoeca faz seu trabalho e não a razão do seu trabalho que sempre foi conectar pessoas com informações. 02/07 Políticas de preservação digital por Prof. Luiz Fernando Sayão E-mail: [email protected] Segundo Sayão preservação não consiste em preservar mídias, mas sim conteúdo. Embora a mídia sobreviva é preciso também preservar os equipamentos (hardware e software) para leitura destas mídias. No meio físico, preserva-se o suporte, no digital, é preciso preservar o suporte, o acesso e a possibilidade de reprodução do conteúdo. No meio digital a preservação e acesso se confundem, mas caminham juntos! A norma mais importante da preservação, a OAIS (Reference Model for an Open Archival Information System) - ISO 1472:2003, foi desenvolvida pela NASA, pois a instituição estava perdendo muitos dados. Os objectivos principais da OAIS são: identificar os componentes funcionais que devem fazer parte de um arquivo dedicado à preservação da informação digital e descrever as entidades internas e externas desses sistema, bem como os objectos de informação que são manipulados no seu interior.

Page 3: Lívia relatório curso_biblioteca_digital_bn

Segundo Sayão, com acervos digitais houve algumas mudanças no registro da informação: gerir registros invisíveis (gerir algo que não estamos vendo, os bits), desmaterialização dos suportes e gestão feita por profissionais de diversas áreas. Completa que quanto mais densa é a mídia, quanto mis caracteres ela possui, mais frágil e instável ela é, por exemplo, HDs externos, Pendrives, etc. Sayão indicou a leitura da “Carta para a Preservação do Patrimônio Arquivístico Digital” do Conarq. Sayão defende que nossa compulsão em produzir informações é maior que nossa capacidade em garantir sua preservação. Para hoje nossa meta principal deve ser produzir informação para durar, a curto prazo devemos salvar materiais em perigo, a médio prazo devemos desenvolver políticas de preservação digital (definir se serão preservados os documentos e suas funcionalidades, softwares e hardwares, etc. além de detalhar nos metadados o que foi definido pela política). Para Sayão a informação digital se perde por dois motivos: obsolência e degradação física. Ameaças aos Acervos Digitais: - Rápido crescimento do número de objetos digitais - Complexidade dos objetos digitais - Falta planejamento de preservação digital - Ausência de padrões - Direitos Autorais - Falta expertise técnica - Dependência forte do ambiente tecnológico - Ciclo rápido da inovação tecnológica - Acompanhar as mudanças tecnológicas De acordo com Sayão, para preservar objetos digitais é preciso preservar a cadeia de bits que o forma e sua interpretação (software) que interpreta e lê o conteúdo da cadeia de bits. Cadeia de Bits Interpretador (Software) Conteúdo Sayão sugere uma política de preservação: - Informação: intensidade das camadas de informação a serem preservadas - Estratégias de preservação - Formatos de arquivos - Metadados – descrição - Armazenamento - Software: plataforma (produção, manipulação, gestão, preservação dos objetos digitais) - Segurança: sistema de backups Para Sayão, a política não é uniforme para todos os tipos de documentos, o que faz variar regras e formatos, mas que fique claro a necessidade de privilegiar formatos abertos, pois a preservação não é algo marcado no tempo (com formatos proprietários de empresas que podem sumir), mas um processo contínuo. Sayão afirma que 3 níveis de preservação: a preservação intelectual (foco no conteúdo e autenticidade da obra), a preservação lógica (foco nos formatos: softwares e hardwares necessários) e a preservação física. Faz um adendo: “há algumas instituições financeiras que já estão voltando ao microfilme, por se tratar de uma tecnologia mais barata e com grau de legalidade e autenticidade.”. Há situações onde se volta do digital para o analógico, devido a este ser mais barato. Assim, deve-se pensar bem antes de iniciar um projeto de digitalização. Menciona ainda o HD Rosetta, placa de níquel com 2 polegadas, que armazena até 196.000 páginas digitais e não requer software para leitura do conteúdo, este pode ser acessado facilmente por microscópio. Sayão sugere algumas soluções parciais: fazer backups periódicos, investir na renovação das mídias (migrar de suporte), usar mídias duráveis, arqueologia digital (procedimentos para

Page 4: Lívia relatório curso_biblioteca_digital_bn

salvar conteúdos HDs). Menciona ainda estratégias de preservação digital (conservar o contexto tecnológico): manutenção de museus de equipamentos em estado de uso, sistemas operacionais, plataformas de hardware (preservação tecnológica), emulação da tecnologia (computador emulador de computador obsoleto – emulador faz, simulador não faz, no caso de emuladores, os computadores serão novos, mas farão operações de computadores antigos também). Sayão sugere que quando não se tem certeza da necessidade de preservar, deixa-se a solução para o futuro mantendo o dado, software, hardwares, manuais, ou seja, cria-se uma cápsula de metadados para cada objeto digital, com todas as informações necessárias para que um sujeito no futuro, se preciso, crie seu próprio emulador para acessar o conteúdo. Para Sayão a função dos metadados é preservar a cadeia de bits e a interpretação dos dados. Sayão diz que a migração é considerada a mais promissora forma de preservação segundo alguns especialistas, pois possibilita a manutenção do conteúdo, evita a obsolência tecnológica e utiliza tecnologia corrente. Sugere que sejam utilizados formatos mais estáveis e aberto (não proprietários) e de uso disseminado como PDF, no lugar de formato que mudam a cada versão, como o Word. Centralizar os objetos digitais na menor variedade possível de formatos. Salienta também os problemas da migração: não preserva os originais, as multimídias (ob. digitais complexos) sofrem perdas de funcionalidades, deve ser aplicada repetidamente para cada documento individualmente. Produtor Arquivo OAIS Consumidor | | Gestão Voltando à política, Sayão enfatiza que é preciso documentar os formatos utilizados na BD, assim como equipamentos, softwares, decisões, direitos de uso, licenciamentos, etc. Por fim sugere consulta ao PREMIS (PREservation Metadata: Implementation Strategies). 02/07 Imagem Digital I e II por Prof. Joaquim Marçal Marçal define imagem digital como um código numérico formado por bits (bynary digit 0 e 1) e acrescenta que 8 bits = 1 byte. Sendo assim 8, 16, 24 bits são respectivamente 1, 2, 3 bytes. Seguiu diferenciando a imagem vetorial (composta por retas, curvas, elipses e polígonos gerada a partir da descrição geométrica, não perdem qualidade, pois as funções matemáticas se adequam à ampliação) da imagem bit-mapeada (tridimensional produzida a partir de um documento digital ou de um cenário qualquer, a imagem original é transformada numa malha de pontos de pixel - picture elements, perde definição ao ser ampliada). As BDs utilizam a imagem bit-mapeada, nela cada pixel (menor elemento da imagem) recebe um valor tonal (branco, azul, tons de cinza, etc.) que é representado em código binário 0 e 1, origem na imagem reticulada1. Há as cores de luz e as de impressão (pigmento), a soma das cores de luz dá branco, a soma dos pigmentos dá preto. A cor uniforme do pixel vem de uma palheta de cores e neste aspecto é bom observar que temos as cores de luz e as de impressão. As cores de luz primárias são o vermelho, o verde e o azul, ou o conhecido RGB, enquanto que na impressão temos o amarelo, magenta e ciano (aquelas aprendidas pela maioria na escola primária). Para imprimir corretamente é necessário ter o perfil de cores adequado. A soma das luzes dá branco, a soma dos pigmentos dá preto. Marçal indica consulta ao tutorial “Moving Theory Into Practice Cornell University” http://www.library.cornell.edu/preservation/tutorial/contents.html Marçal prossegue com conceitos básicos sobre imagem digital: - Dimensão de imagens: cmxcm - Tamanho de arquivo: KB, MB, GB, TB

                                                                                                               1  Formada por pontos. A variação tonal pode acontecer pela variação de tamanho dos pontos eqüidistantes ou pela variação da distância entre pontos de mesmo tamanho.  

Page 5: Lívia relatório curso_biblioteca_digital_bn

- Resolução: número de pixels por área determinada. 10 ppis = 1 polegada com 10 pixels - Profundidade de bits: cada bit possui um bit de profundidade, ou 2, 3, 8 bits de profundidade (informação). - Alcance dinâmico: faixa de luminância que uma câmera consegue capturar. - Compressão: capacidade de armazenamento, escreve o conteúdo de uma forma que ocupe menos bits. Quando se comprime, ao descomprimir há perda. - Formato de arquivo: doc, xls, ppt, pdf, tiff, jpeg, etc. (As BDs utilizam o formato TIFF sem compressão) Marçal menciona os itens de controle de qualidade das imagens digitais: - Cores: RGB (red, green, blue) são as cores de luz, a visualização digital e CMYK (Cyan, Magenta, Yelloy, Key-Black) são as cores pigmento, impressão. Há perfis de cores de entrada, visualização e saída. - Calibragem dos monitores: para que fiquem compatíveis - Resolução: depende da utilização a que se destina a imagem - Identificação dos arquivos: os caracteres permitidos são 0 – 9 (todos os números), A – Z (todas as letras maiúsculas e minúsculas), _ (underline ou sublinhado), - (hífen) e . (ponto, apenas para separar nome da extensão). SEM ESPAÇOS para que as pastas nos servidores virem links diretos ao conteúdo. Nomear arquivos com 11 caracteres para graver CDs ou 30 caracteres para nomear arquivos. - Nitidez: aumento da nitidez provoca grandes mudanças na imagem ou arquivo que não podem ser desfeitas. - Entrega: pode ser em mídias removíveis como pendrive, CDs, DVDs, ou mesmo por e-mail e via FTP. Marçal sugere que não se use CDs e DVDs por uma questão de sustentabilidade. - Armazenamento e manutenção: backups e manutenções periódicas Pro fim, Marçal menciona que a reprodução de materiais gráficos iconográficos consisteem 3 grandes etapas: - Configurações de Captura - Curadoria digital e controle de qualidade - Preservação dos arquivos master derivados 03/07 BNDigital: Trajetórias e perspectivas por Profa. Ângela Bettencourt E-mail: [email protected] Ângela começa falando sobre a Biblioteca Nacional (BN) como responsável pela guarda e preservação do patrimônio documental do pais. Segue esclarecendo que a Biblioteca Nacional Digital (BND) é uma extensão na BN e cita algumas de suas características como: reunir coleções de autores que estão dispersas em diversos países (convênios entre BDs do Brasil, Argentina, Portugal e França), preservação não só física, mas também do conteúdo e disponibilização de acesso. Ângela faz uma breve apresentação sobre a BND: - 1991: surgimento da Web - 1998: criação do Portal de Web da BN - 2001/2003: Primeiros projetos de digitalização (Atualmente a BND conta com 25 mil itens digitalizados num total de 6 milhões de páginas) - 2006: lançamento da BND reunindo os projetos de digitalização até então concluídos. Uso do DublinCore (DC), que se tornou ISO 15836 em 2006. - 2008: a BND entra na Biblioteca Digital Mundial - 2009: Projeto França-Brasil em DSpace, OAI e com aporte financeiro do MINC - 2012: lançamento da Hemeroteca Digital Brasileira A BND conta com 250.000 acessos por mês e sua equipe é formada por 14 contratados, 5 bibliotecários, 4 historiadores, 1 profissional de letras, 1 arquiteto e 10 digitalizadores. O acervo contempla até o momento: 2.500 atlas, 20.000 mapas, 165 álbuns de fotografias (total de 9724 fotografias), 800 documentos sonoros, 1013 textuais, 5 milhões de páginas de

Page 6: Lívia relatório curso_biblioteca_digital_bn

periódicos e 2573 manuscritos. Ângela esclarece que a BND digitaliza somente as obras que estão em domínio público. Algumas músicas são disponibilizadas somente um trecho de 10 segundos. Os arquivos utilizados para digitalização de documentos sonoros é o WAVE para preservação (máster) e MP3 para acesso (compactação). Já as imagens são em TIFF para preservação (máster) e JPEG e PDF para acesso (compactação). Para ter uma boa qualidade de zoom é utilizado o aplicativo Zoomify. As másters são atualmente armazenadas em DVDs e HDs e suas localizações fazem parte dos metadados administrativos, assim é possível saber em qual DVD ou HD a imagem está. É indicada a leitura do livro “Bibliotecas Digitais: saberes e práticas” de Carlos Marcondes, Hálio Kuramoto, Lídia Brandão Toutain e Luís Sayão para entender mais sobre padrões, normas e protocolos envolvidos na gestão de BDs. Ângela segue falando sobre os itens da Gestão da BND: 1) Política de Seleção: estado de conservação, raridade, demanda dos usuários, domínio público, seleção temática 2) Padrões de conversão para digital: captura em 300 ppi obedecendo o tamanho original do documento (fac-símile do original), arquivos em TIFF para imagens e WAVE para sonoros, scanners são escolhidos de acordo com o tipo de material (obras raras e materiais de grande porte são digitalizados por 3 máquinas fotográficas back digitais, os microfilmes são digitalizados por 2 scanners de microfilmes FelxScan, os periódicos são digitalizados por 4 scanners planetários da Zeutschel modelo 12.000) 3) Padrões de compressão/compactação para transmissão web: Texto (PDF + OCR Fine Reader), Som (MP3), Imagem Multiparte (PDF), Imagem Simples (JPG – não tem zoom, mas deixa salvar e Zoomify – tem zoom, mas não deixa salvar e não precisa de plugin) 4) Normas de descrição/organização de informação: DublinCore com acréscimo de outros elementos além dos 15, Autoridades (Base BN), Terminologia (Base BN, assuntos em português e inglês!), linguagem de marcação XML, controle dos pontos de acesso (autoria e assunto). A CDD também passou a ser utilizada com o intuito de futuramente oferecer a navegação por grandes áreas. 5) Armazenagem: DVDs e HDs com nomes dos arquivos. Todos os DVDs e HDs acompanham um livreto no qual estão relacionados os arquivos que contempla e os metadados do suporte e formato. A BN está finalizando seu Data Center com capacidade de 150 TB para onde irão todo o conteúdo dos HDs e DVDs (mencionado em detalhe na aula de 06/07). 6) Padrões de Interoperabilidade: OAI-PMH (substituindo o Z39.50), DublinCore e DSpace (em desenvolvimento e padronização de metadados, BN junto ao IBICT deve trabalhar com o DSpace para interoperar). Ângela afirma que o MARC não é aceito em outras BDs, como a da França, por exemplo, por isso adotaram o DublinCore, que não exige o rigor do MARC e é aceito (interoperabilidade) por grande parte das instituições, tornando possível reunir obras de autores e coleções entre várias instituições. Ângela aponta uma distinção importante entre documento físico e digital, no físico havia separação entre descrição (ficha catalográfica) e material físico, já no digital o acesso é direto ao documento, por tanto não é preciso detalhar tanto a descrição. Esclarece que no passado a BN cometeu erros adotando aplicativos que necessitavam de plugin para a visualização, como o Djvu, e isto é algo que vem sendo corrigido e não é indicado a nenhuma BD. Segundo Ângela primeiramente o material a ser digitalizado é preparado pelo setor de conservação ou restauro e planilhado com as indicações das páginas que serão escaneadas. Sobre o scanner de microfilme menciona que a BN vem produzindo 30.000 imagens/dia, contudo, o desempenho do equipamento pode ser superior, mas é necessário limitar o volume de imagens/dia de acordo com a possibilidade de produção dos demais processos que envolve a digitalização destes materiais. Por fim Ângela respondeu a algumas questões da equipe da BMA: - Os objetos digitais estão separados do catálogo eletrônico de obras físicas, assim como a

Page 7: Lívia relatório curso_biblioteca_digital_bn

Galica. - Garantiu que a microfilmagem (principalmente de periódicos por conta da baixa qualidade do papel) é política básica da BN e estão pensando em comprar uma microfilmadora de digitais. - São digitalizados os jornais em domínio público e extinção. - Sobre a gestão dos formatos originais (físicos), microfilmes e digitais esclarece que há dois caminhos: 1) fazer uma base com a descrição dos suportes físicos e outra base digital (com descrição dos objetos digitais e com os próprios objetos digitais) ou 2) acrescentar ao campo #093 do Marc a informação sobre microfilmes e ao campo #856 a URL do documento digital. A BN optou pelo primeiro caminho e criou uma BND separada do catálogo eletrônico da BN de documentos físicos. Possuem ainda uma outra base só com o catálogo de microfilmes. 03/07 Disseminação da Cultura em Meio Digital por Prof. Vinícius Pontes Martins E-mail: [email protected] A Rede Memória é um braço colaborativo da BND, que busca concretizar parcerias, além de agregar valor ao material digitalizado. A Rede apresenta textos de especialistas que fogem da linguagem acadêmica apresentando conteúdos inéditos e relevantes. A intenção é atrair público leigo à BND com navegação intuitiva. Há hiperlinks pelos quais as pessoas podem se aprofundar nos assuntos caso queiram através de biografias, bibliografias, etc. Dado importante: a Rede Memória tem equipamento portátil que pode ser levado a instituições para digitalizar acervos relevantes que poderiam colaborar com a BND e com a Rede Memória. Segundo Vinícius, o grande desafio da Rede é interoperar com outros acervos e reunir em um único universo de busca, vários conteúdos que se completam. A Rede Memória foi criada em 2006 junto com a BND. A primeira fase seguiu até 2008, quando seu buscou novas parcerias, também com universidades, além da ampliação da base temática (segunda fase). Em uma terceira fase, iniciada em 2010, a Rede de Memória passa a integrar alguns elementos da web 2.0 visando participação e interatividade. Neste momento, a rede abandonou as páginas estáticas somente em HTML passando a utilizar um CMS, com links para redes sociais, fóruns, além de espaço para que os usuários comentem as publicações. Aproveitou-se o curso para lançar também a nova versão da Rede Memória, acessível a partir de hoje, em http://redememoria.bn.br/ 03/07 Plataformas de desenvolvimento de sites de Bibliotecas Digitais e Exposições Virtuais por Prof. André Pfeiffer (Desenvolvedor do site da BND) André menciona que o necessário para se fazer um website é HTML padronizado pela W3C, mas sabendo que nenhum navegador aceita o HTML padrão. Os navegadores criam seus próprios HTMLs o que gera problemas de compatibilidade de um site para vários navegadores. O sites se preocupam em aparecer no ranking do Google, contudo o Google precisa interpretar o conteúdo e para isto é preciso que o site esteja nos parâmetros da W3C. Segundo André é possível fazer um site da forma mais correta possível com HTML (HyperText Markup Language) e CSS (Content Management System). O HTML é uma linguagem de marcação que determina onde começa e termina um conteúdo. CSS é a folha de estilo, o visual do site. A forma mais correta é utilizar o CSS para inserir a formatação do site e o HTML para marcar, assim programadores (através da HTML) e designers ou pessoas leigas (através do CSS) podem trabalhar simultâneamente sem depender necessariamente uns dos outros. André segue falando sobre linguagem na utilização de servidor, que segundo ele é o item mais importante do site, pois executa no servidor o processamento e não no navegador, permite a criação de sites com conteúdo dinâmico e se comunica com o banco de dados. Existem diversas soluções tanto de banco de dados quanto de linguagem de programação de

Page 8: Lívia relatório curso_biblioteca_digital_bn

servidor. A dica é escolher soluções livres que proporcionam custo reduzido, maior segurança e liberdade. Sugere ainda 2 formas de se diminuir o custo no desenvolvimento de sites: frameworks (scripts prontos) e CMS (sistemas com estruturas prontas para gerenciar e formatar vários tipos de conteúdos: EAD, galerias de imagens, fóruns, exposição de acervos, etc.). É importante saber o tipo de conteúdo que se quer organizar para escolher um CMS adequado. Quando o conteúdo é misto, a saída é utilizar CMS para portais, pois todos eles contemplam: administrador de usuários, criação de diversos tipos de conteúdo, maneira de expandir suas funcionalidades, customização do layout, categorização de conteúdo e ferramentas de busca. André exibe algumas opções de CMS para portais, o WordPress, Joomla!, Plone e por fim o Drupal. Sugere que o Drupal e WordPress são considerados os melhores CMS para bibliotecas, principalmente o Drupal que possui um código bem escrito, muitos componentes disponíveis, fácil de ser estendido e adaptado, muito versátil e seguro, há contudo, pouco material em português. Por fim, André menciona alguns sites que utilizam o CMS Drupal: - U.S.A. White House - Portal do Governo Francês - Portal Governo Inglês - Portal da Cidade de Londres - Harvard University - M.I.T. University - Portal da BBC - NASA 03/07 Visita ao Laboratório de Digitalização da BN O Laboratório foi inaugurado em 2001 com parceria da LC, hoje é o laboratório mais bem equipado do pais. Seu principal objetivo é acesso contínuo e preservação dos objetos digitais independentemente do seu uso. Não há informação precisa sobre a durabilidade dos discos rígidos, eles nunca foram destinados para armazenamento a longo prazo, mas sim trânsito de informações. Sobre as mídias há alguns estudos que mostram: - Pendrive: 10 anos - DVDR: 27 anos - CD áudio: 26 anos - CD RW: 7 anos - CD-R ouro: 100 anos Alertam que o foco não deve estar somente na compra de equipamentos, mas também em garantir o acesso a longo prazo aos objetos digitais. Contudo, ainda não há estratégias sólidas que garantam o acesso a longo prazo. Sugestão: acompanhar as novas tecnologias e manter a migração dos dados para novas plataformas, evitando a obsolescência. A BND captura as imagens em RAW e guarda em TIFF. Ou seja, são guardadas as imagens processadas e não as in loco. Defendem que a profundidade de bits (mencionada na aula de 02/07 por Marçal), aumenta a gradação da cor, tornando o objeto digital mais parecido com o original. Reforçam que o HD Rossetta (mencionado na aula de 02/07 por Sayão) é imune às variações de tempo e umidade. O Laboratório é composto por: - 11 técnicos - 2 Scanners Zeutschel OS 12.000 HQ (Para periódicos, são mais rápidos e com menos qualidade que as Back Digitais, mas ainda sim a qualidade é altíssima. Os periódicos são digitalizados em JPEG e não em TIFF) - 9 computadores Power Mac G5 (recomendado para imagens) - 4 PCs Windows

Page 9: Lívia relatório curso_biblioteca_digital_bn

- 3 Back Digital Hasselblad (equipamentos fotográficos, que garantem melhor qualidade, mas menor produtividade processo mais lento). Conectadas por Wifi aos computadores. - Escala de Cores da Tiffen e Tarjetas de Foco da Microdak - 2 Scanners digitalizadores de microfilmes (trabalho vem sendo realizado pela DocPro) Processo das imagens capturadas: 1) Captura 2) Revelação (transforma em TIFF) 3) Renomear Arquivos (Sigla da Seção + No. Tombo) 4) Controle Imagem (verificar se as cores estão certas e qualidade da imagem, se estiver ruim volta para captura) 5) Revisor (confere nomes dos arquivos com conteúdo) 6) Armazenamento em HDs e DVDs (cofre junto com microfilmes) 7) Tratamento de imagem e conversão em JPG e cortes (edição) 8) Criação dos Derivados (PDF, ZOOMIFY, etc.) 9) Metadados dos arquivos derivados 10) Web A BND possui um total de 161 HDs (320 GB) e 4037 DVDs até o momento. Todo este conteúdo será migrado para o Data Center na Caixa Cofre assim que estiver finalizado. A BN trabalha com a Scansystem (mesma empresa do Projeto UNESP BD). O técnico do laboratório menciona ser crucial pensar na qualidade dos equipamentos, iluminação com alta potência, isos mais baixos que não perdem tanto em cor e definição (os mais altos são indicados para noite), qualidade dos computadores (Power Mac G5), abertura de diafragma (ideal meio aberto meio fechado), velocidade do obturador (não pode ser baixo demais para que a imagem não fique “tremida”), fotômetro (cálculo da luz), sala totalmente preta, cortinas pretas e funcionários com jalecos pretos (buscando neutro). Materiais de grande porte, como mapas, são digitalizados em 4 partes e são guardados os arquivos das 4 partes separadas e o arquivo delas unidas. A obra já chega ao laboratório restaurada e planilhada (planilha de cada obra compreende muitas páginas), muitas vezes a seção de restauro desmonta a obra e a deixa com as folhas soltas. A planilha contem 3 colunas: - Número da página - ID da página e se é frente ou verso (Ex: pág. 1, pág. 1v) - Descrição/ indicação para páginas sem paginação (observações ou instruções) Enfatizaram que os scanners que possuem são para digitalização em massa dos microfilmes não servem para atendimento, no qual é preciso digitalizar poucas páginas de cada rolo selecionadas pelo usuário. Para atendimento o mais indicado é a leitora digitalizadora que alugamos para a BMA. A DocPro digitaliza em media 40 rolos, na BN mesmo, e realiza na empresa o tratamento das imagens e OCR. 04/07 Metadados/Linguagens de marcação por Profa. Ana Pavani Segundo Pavani, as BDs possuem disciplinas e padrões ISO que precisam ser seguidos como em acervos físicos. Os conceitos de Bibliotecas Tradicionais são os mesmos das BDs. As Bibliotecas Tradicionais utilizaram o formato MARC e intercâmbio de registros por meio da ISO2709, que possibilitaram a criação de catálogos coletivos. As BDs utilizam o formato DublinCore (DC) e intercâmbio de registros por meio do XML, permitindo intercâmbio de metadados. Metadados são dados sobre dados, ou informações sobre informações, termo que surgiu no contexto da Tecnologia de Informação para descrição de itens de acervos digitais. Os metadados são o resultado do processamento técnico de acervos digitais. Segundo Pavani, metadados seria a ficha catalográfica e conjunto de metadados seria o equivalente ao catálogo de fichas.

Page 10: Lívia relatório curso_biblioteca_digital_bn

O DC é ISO15836/2003, existe desde 1995, desenvolvido por um grupo liderado pela OLCC para nomear arquivos na internet. Pavani sugere que uma BD baixe o selinho digital do DC e cole na sua página principal quando faz uso do formato. Pavani esclarece que o DC não especifica onde devem ficar os metadados, podendo ser usadas duas soluções: metadados junto ao objeto digital, no cabeçalho ou metadados separados em um banco de dados. BDs geralmente utilizam a segunda solução, pois permite o uso dos metadados para qualquer tipo de material digital (lógica do catálogo) como acervo de livros + catálogo de fichas. Há ainda outros conjuntos de metadados como o DC: - Library Of Congress MDC: bom, pois possui muito campos administrativos - ETD-ms: padrão para teses - MTD-BR: padrão brasileiro para teses e dissertações - e-ARQ: padrão para gestão arquivística - PREMIS: padrão para preservação digital (não descreve tîtulo, autor, mas sim campos de preservação, sendo assim, não é utilizado sozinho, mas junto com DC, por exemplo) Pavani afirma que o DC é mais geral e pode ser utilizado junto com estes padrões mais específicos. O DC agrupa os elementos em 3 grandes áreas, que totalizam 15 elementos: 1) Conteúdo ou recurso: são elementos que descrevem as características intelectuais - Título: escrito em formato livre - Assunto: usar vocabulário controlado ou cabeçalho de assunto. Recomenda-se classificar formalmente (CDD, CDU) - Descrição: resumo, sumário, nota de catalogação - Fonte: referência do todo ou parte de um conteúdo. Não é URL, é conteúdo! Ex: Baseado na obra de Shakespeare. - Língua: DC recomenda usar tabela ISO 639 (idiomas) e ISO 3166 (país no qual é falada). Ex: pt-BR, outra opção seria utilizar a tabela da ALA (American Library Association) - Relação: em casos de adaptações de obras ou traduções. Ex: “parte de” nos registros secundários e “tem partes” no registro principal. Ex: a BN utiliza para álbuns de fotografias ou periódicos. - Cobertura: temporal, geográfica, jurisdicional, descreve a abrangência do conteúdo em termos temporais (datas, épocas, períodos, etc.), em termos geográficos (países, continentes, regiões, etc.) e em termo jurisdicional. 2) Propriedade intelectual: autoria e propriedade intelectual - Autor ou Criador: responsável pela criação do conteúdo corresponde aos campos #100, #110 e #111 do MARC. - Editor: responsável pela disponibilização do conteúdo do suporte físico e do digital. - Contribuidores: orientações, membros das bancas, ilustradores, animadores (responsáveis por contribuir ao conteúdo) - Direitos: detentores dos direitos autorais ou patrimoniais do conteúdo ou referencia sobre onde eles possam ser encontrados. Identificados numericamente e depois traduzidos. Aqui Pavani indica o Creative Commons. 3) Instanciação (descrição física): peso do arquivo digital, características, se precisa de plugin, etc. - Data: contém data associada ao conteúdo, podendo ser de sua criação e disponibilização na web. Este elemento precisa ser desdobrado. - Tipo: há uma tabela da DC que também precisa ser desdobrada. - Formato: natureza física (digital) podendo dizer respeito ao software ou hardware, equipamento necessários para acesso do conteúdo. - Identificador: identificação única ao objeto digital e não pode ser ambígua. Ex: DOI (Digital Object Identifier), que corresponde ao ISBN no material físico. O DOI é pago, mas o ISBN também é! Ainda não há regionais de DOI, mas a tendência é que o IBICT será nossa agência nacional. O IBICT libera o ISSN, já o ISBN é liberado pela BN. Aqui surge uma discussão importante sobre o DOI. Como será o DOI para objetos digitais digitalizados por instituições diferentes? Ex: Debret está sendo digitalizado pela BN e pela Brasiliana. Será o utilizado o mesmo número de DOI nas duas instituições? A conclusão foi que obras digitalizadas em laboratórios diferentes precisam ter DOIs diferentes, pois a qualidade da digitalização é

Page 11: Lívia relatório curso_biblioteca_digital_bn

diferente (ajuste da luz, palheta de cores, foco, enfim, objetos digitais diferentes). Outra questão levantada pelo público, mas não muito debatida por não fazer parte do tema da apresentação era a necessidade de um controle para que duas instituições não tivessem o mesmo trabalho em digitalizar a mesma obra. Pavani faz uma importante observação após apresentar os campos do DC, os campos MARC são numéricos, já no DC os campos são identificados com palavras, essa é a parte chatinha, segunda ela, do DC. A aula segue sobre os Qualificadores do DC, que são os desdobramentos dos elementos principais, ele refinam os elementos. Pavani destaca que o DC sugere o uso de alguns instrumentos e posteriormente faz algumas sugestões de refinamento da BN e da DC: - Autor: seguir ABNT e fazer remissivas. - Assunto: CDD, CDU, LCSH, LCC (Comentário Lívia: vale notar como não há diferenciação entre lista de cabeçalho de assuntos, tesauros e sistemas de classificação, são todos vocabulários controlados de assuntos.) - Data: data da publicação física e data da publicação digital - Tipo: DCMI Vocabulary (Tabela do DC) - Formato: IMT (Internet Media Type) - Identificador: URI (Uniform Resource Identifier) - Fonte: URI ou DOI - Língua: ISO 639-2 (idioma) e ISO 3166(país) - Relação: codificação URI (tem versão, é versão de, tradução de, etc.) Pavani segue falando que a interoperabilidade permite que os sistemas se falem entre si maximizando o intercâmbio e a re-utilização da informação. Para integrar os conteúdos, os sistemas devem falar entre si, deve haver interoperabilidade. A melhor ferramenta que temos para interoperar é o XML. Menciona dois tipos de linguagem de marcação: descritivas que dizem que naquele campo há tal conteúdo, como o HTML, e as formativas, dizem que tal conteúdo está em tal tamanho, se negrito, cor, etc, como CMS. Desta forma é possível separar o conteúdo da formatação (estilo), como já havia mencionado André Pfeiffer na aula de 03/07. Pavani diz que cada objeto digital possui todo o seu contexto de metadados em XML grudado nele, pois se for perdido o banco de dados com os metadados, o objeto digital mantém seus dados. Menciona o DTD (Document Type Definition), padrão para escrever DC em XML. Há vários formatos escritos em XML: MetsXML, MARCXML, DCXML e outros, cada biblioteca pode escolher o seu formato, o importante é que esteja em XML pois assim, o formato que escolheram não será um empecilho para interoperar com outros sistemas. 04/07 Livros eletrônicos por Prof. Claudio Soares E-mail: [email protected] Claudio inicia sua aula afirmando que não faz mais sentido criar produtos fora da lógica de internet. As bibliotecas ainda não estão focadas em disseminar informação, mas em trancar, proteger seus livros. Segue falando sobre Meme, unidade de informação que se multiplica de cérebro em cérebro como informações virais. Características de um meme: - propagado por imitação - sobrevive ao hospedeiro - mudado intencionalmente Se os livros são memes e o memes são idéias, logo livros são idéias. Segundo Claudio nós estamos acostumados com informação assíncrona, mas a nova geração não, ela necessita de mais velocidade. Os livros digitais dizem menos respeito aos livros impressos do que às idéias. A produção do livro independente sempre existiu, com a tecnologia só ficou mais fácil.

Page 12: Lívia relatório curso_biblioteca_digital_bn

Completa que a o pai do Open Archives é o Santos Dummont, que liberou em 1910 gratuitamente suas patentes do avião. Claudio defende que leitura é muito mais do que ler livros, pois há os periódicos, a internet com blog, revistas, fóruns, colunistas, etc. Diz que ainda não há padrão para construção de livros eletrônicos, mas indica uma boa aplicação no “On the Road”, Jack Kerouac. Esta falta de padronização será um problema para o bibliotecário. E-books X Livros impressos: a geração atual quer liberdade, direito de consumir com liberdade, customização, integração entre outros elementos e os recursos existentes no e-Book não são diferentes dos recursos da web, então porque pensar o e-book através do modelo do impresso? Aconselha que não devemos nos concentrar no problema e sim observar o contexto, pois geralmente a solução está no contexto. Uma pesquisa de 06/2012 mostra nos EUA são comprados mais e-books do que livros em papel. No Brasil já há 9.5 milhões de leitores de e-books. Outro número interessante é que 45 milhões de brasileiros estão nas redes sociais e estas pessoas são leitores. Segue mostrando o ranking das Redes Sociais no Brasil, Facebook, Orkut, MSN, Twiteer, etc. A leitura online está crescendo. Mas as editoras nacionais e bibliotecas não observam o crescimento da leitura digital, não analisam o jornal, o livro como suportes que utilizam tecnologia, assim como um ipad. Claudio segue afirmando que os softwares estão engolindo o mundo, tudo hoje é software, os livros, as revistas, compras, etc. Segue mostrando as tendências tecnológicas relacionadas ao livro: - Cloud Computing - Virtualization - Social Business - Móbile Computing Menciona um sistema da Amazon que aluga livros aos leitores, mais do que isso, os clientes podem comprar livros e colocá-los para alugar usando o sistema da Amazon. Tem editoras, por exemplo, que vendem o livro mais barato antes da revisão, depois de publicado você recebe o livro. Você é o financiador da produção do livro. Isto é um modelo diferenciado. Por fim, indica plataformas publicadoras de livros como Pressbooks (da Obliq empresa de Claudio) que possibilita que um livro seja feito com a facilidade de um blog (escrito em XML) e no final você obtém um PDF, há também o IfBook da Apple e EPUB (software livre). Menciona o DITA que consolida o reuso no processo de criação de conteúdo, definindo uma arquitetura XML para projeto, redação, gerenciamento e publicação de vários tipos de informação em forma impressa ou na Web. Menciona também o Single Sourcing Publishing, método que permite reutilizar informações, economizando tempo, dinheiro, eliminando o trabalho duplicado. 04/07 Visita Técnica Guiada pela BN A BN dispõe de um Serviço de Informação Documental, que atende o usuário à distancia, enviando cópia do material que ele precisa mediante pagamento, o contato é [email protected] Os acervos de microfilmes estão distribuídos pelas seções de periódicos e obras raras, há leitoras de microfilmes nas áreas de atendimento das seções, junto às mesas. Os originais em prata ficam em um cofre com temperatura e umidade controladas. Há na BN Laboratórios de Digitalização (visita em 03/07), de Encadernação e Restauro. A seguir serão comentadas as visitas aos dois últimos.

Page 13: Lívia relatório curso_biblioteca_digital_bn

O Setor de Encadernação conta com 31 funcionários e é responsável por preservar, higienizar e encadernar obras. De 27 a 31 de agosto haverá um curso, estão disponíveis 70 vagas, o custo é de R$350,00. Interessados entrar em contato por [email protected]. No setor são monitoradas a umidade e temperatura de todas as seções por sensores. Há uma tela de monitoramento desde 2009 e o sistema utilizado é MT-530 Super, da Sitrad. Contam ainda com o apoio de um climatologista da UFRJ. Segundo o bibliotecário, o sistema é bastante barato, de fácil implementação e uso. O Setor de Restauro trabalha somente com papel, fotografias e outros documentos são restaurados pela Funarte. O foco está no restauro de obras entre os séculos XIV e XIX. Após restauradas as obras passam pela microfilmagem, digitalização e voltam aos seus acervos de origem. Ao chegarem no Setor, as obras recebem uma ficha, na qual serão anotadas todas as intervenções realizadas (tipo de papel utilizado, cola, colorações, etc.), além de fotos de antes e depois do restauro. Cada técnico trabalha na obra do começo ao fim, somente a encadernação é feita por um único profissional. Vale mencionar que os laboratórios são muito limpos e organizados, por outro lado, o Setor de Tratamento da Informação é bastante bagunçado, caixas de livros empilhadas em todos os lados, layout da sala segue ao redor das caixas empilhadas, móveis velhos... A BN possui aproximadamente 500 bibliotecários e 700 funcionários. 05/07 Arquitetura da Informação e Usabilidade por Prof. Luiz Agner Agner inicia a aula falando sobre Richard Saul Wurman, o arquiteto que cunhou o termo Arquitetura da Informação (AI). Wurman estava preocupado com o Information Overload, segundo ele há mais informação em um dia na internet do que os mortais do século XVII podiam receber durante toda a vida. Para Agner o sistema básico da organização de um website é a hierarquia, é preciso pesquisar para se saber como melhor elaborar esta hierarquização dentro de cada contexto e objetivo. Menciona algumas características da AI: - Design estrutural de um espaço de informação para facilitar a conclusão de tarefas e acesso intuitivo ao conteúdo - Rotulação e organização de um sistema de informações - Trazer para o contexto digital conceitos de design e arquitetura - Encontrabilidade, ou seja, estrutura centrada no usuário - Taxonomia intuitiva Os Sistemas de AI são: - Organização: hierarquia (taxonomia, níveis de topo, modelos mentais, etc.), banco de dados (conteúdo relacionado) e hipertexto (conteúdos cruzados) - Rotulagem: verbal (palavras e expressões) e icônico (ícones) -Navegação: global (onde estou?), local (o que há próximo?) e contextual (o que há relacionado?) - Busca: focada na resposta, palavras-chave (que devem ser aquelas buscadas pelo usuário) e o sistema deve dar uma resposta mesmo que o usuário digite uma palavra-chave errada. A resposta de busca deve ser clara, com título, descrição, URL, rank dos resultados. Agner deu exemplo do campo de busca do IBGE, empresa onde trabalha, lá inseriu o mecanismo de busca do Google, assim o usuário sempre terá uma resposta e as mesmas estarão ranqueadas por relevância com o conteúdo do IBGE. A formação do arquiteto da informação é interdisciplinar: ciência cognitiva, engenharia de software, desenho industrial, ciência da computação, educação, psicologia, ciências sociais, ciência da informação, biblioteconomia e outras. No gráfico apresentado não tem ergonomia, mas o palestrante considera esta área importante. Papel do arquiteto da informação – clarificar a visão e missão do website fazendo o

Page 14: Lívia relatório curso_biblioteca_digital_bn

balanceamento entre necessidades da organizadora do website e do usuário, determinar conteúdo relevante, especificar como usuários irão encontrar a informação e planejar o crescimento do website. Primeira fase do projeto de AI – Pesquisa, seguida de estratégia, design, implementação, avaliação, sendo esta metodologia um ciclo contínuo. Alguns produtos de AI: - Navegação: blueprints, wireframes, taxonomias - Organização e Rotulação: esquema de metadados, vocabulários controlados e tesauros - Navegação suplementar: mapa do site, indices Segundo Agner a AI não está concentrada nos recursos visuais da interface. Ela organiza a estrutura de informação. O tripé da área está nos seguintes aspectos: pesquisa de contexto, conteúdo e usuários. O contexto está relacionado a instituição, o conteúdo a uma série de documentos e usuário ao comportamento de busca. Não se deve estruturar um site espelhando a estrutura da empresa (organograma) ou a forma como ela olha sua própria informação. Agner sugere ainda o uso de Google Analytics. Algumas ferramentas que podem auxiliar a AI: Card sorting é uma abordagem de AI centrada no usuário para a classificação de itens do website. Procedimentos: escrever os nomes dos itens, misturar os cartões, solicitar ao participante que separe agrupando e no final nomear as pilhas. O resultado final do card sorting é uma taxonomia centrada no usuário. Testes de usabilidade, interação homem computador com 4 componentes: usuário, tarefa, contexto, sistema. O teste parte do princípio de que o usuário tem uma tarefa para usar aquele sistema e assim, são levantadas as finalidades, selecionados os usuários alvos e então estes são colocados para interagir com o sistema, gravando esta interação em áudio, video, movimentações de tela. Segundo Jacob Nielsen, o teste aplicado a 4 ou 5 usuários já é suficiente para encontrar 80 % dos problemas. Testes de usabilidade são necessários quando o usuário tem dificuldade para realizar as tarefas. 05/07 Os desafios da Interoperabilidade por Prof. Carlos Henrique Marcondes E-mail: [email protected] Há atualmente várias BDs disponíveis, isto exige que o usuário aprenda as interfaces de todas elas para poder explorá-las. Muitas vezes elas possuem coleções parecidas ou mesmo iguais. A interoperabilidade foca uma única interface web, possibilitando consulta a várias BDs simultaneamente. Acervos distribuídos, compartilhados e reunidos em uma unida interface web. Marcondes segue definindo a interoperabilidade como capacidade de diferentes sistemas trabalharem em conjunto (troca de conteúdo ou metadados) através de padrões, acordos e protocolos. A troca de metadados pode ser síncrona (através de protocolos) ou assíncrona (através de arquivos). A interoperabilidade pode ocorrer em 2 níveis: - Sintática: mais simples através de intercâmbio de dados -Semântica: mais complexa através de dados com significado (tesauros, vocabulários controlados, etc.) O MARC é a primeira linguagem de marcação existente, focando em marcar conteúdos para identificá-los independentemente do software. O primeiro protocolo de interoperabilidade foi o Z39.50, no início dos anos 1990, no lugar de interagir com cada interface, o usuário interage com um catálogo que centraliza vários catálogos. Trata-se de um protocolo cliente-servidor. O Z39.50 é caro e complicado computacionalmente, além, de ser muito sensível. Está em desenvolvimento pela LOL o Protocolo SRU em XML para substituir o Z39.50. Repositório digital é um tipo de BD, foi criado nos anos de 1990. Os pesquisadores realizavam suas pesquisas com verba pública e os repositórios de editoras científicas cobravam assinaturas caríssimas para se ter acesso. Então surgiu o movimento Open

Page 15: Lívia relatório curso_biblioteca_digital_bn

Archives, no qual os repositórios devem ter acesso livre para pesquisas realizadas com verba pública, permite que qualquer um se cadastre e faça upload de seus trabalhos (auto-arquivamento). Marcondes afirma ser o Open Archives, ou mais especificamente OAI-PMH (Open Archives Protocol for Metadata Harvesting) o mais recente, simples, barato e promissor protocolo para bibliotecas, arquivos e museus., pois liga provedores de dados (acervos) a provedores de serviço (metabuscadores), gerando uma busca unificada. A figura mostra as diferenças na interoperabilidade com o uso do protocolo Z39.50 X o OAI-PMH:

Através do OAI-PMH os repositórios centralizam somente os metadados e um dos metadados é o link para o documento, que remete ao acervo de origem, funciona como um catálogo de referência. A interoperabilidade de metadados é feita com DC + XML e o Harvesting é programa coletor dos metadados. Marcondes usa o SCIELO como exemplo de provedor de dados, qualquer um pode coletar os metadados do SCIELO e reutilizá-los sem os dirigentes do SCIELO saberem. Importante destacar, OAI-PMH torna livre o acesso aos metadados, mas não ao documento. Caso o usuário queira acessar o documento, o mesmo será direcionado ao acervo que possui o documento. METALIS exemplo de provedor de serviço, é um metabuscador em Library Information Science que busca metadados em vários repositórios da área. 05/07 Repositórios DSpace I e II por Prof. Milton Shintaku E-mail: [email protected] Shintaku inicia a aula com um conjunto de definições de BDs: - Acesso remoto via web - Compartilhar documentos - Fornecer serviços de biblioteca ou centro de informação - Acesso ao conteúdo integral organizado em coleções - Acesso a outras fontes de informações - Documentos multimídia - Facilidade para o acesso à informação E complementa com definições de Repositórios Digitais: - Tipos: acadêmicos, temáticos e institucionais - Estar disponível em web e ter acervo acumulativo e preservado de acesso livre e interoperável

Page 16: Lívia relatório curso_biblioteca_digital_bn

- Auto-arquivamento como prioridade de alimentação - Facilitar a disseminação da informação científica - Possibilidade de personalização dos repositórios - Ferramentas de Gestão do Conhecimento Segue falando sobre DSpace, software de implantação de repositórios nascido em 2000, permanece como projeto na versão atual é a 1.8.2, mas a 2.0 já está em desenvolvimento. Surgiu da necessidade do MIT em compartilhar documentos da própria instituição. Características: altamente customizável, utilizado para muitas finalidades, software livre e de código aberto, múltiplas plataformas (windows, linux, java utilizando sempre o mesmo DSpace em qualquer um destes sistemas), utilizado por bibliotecas jurídicas, bibliotecas de música, etc. Suporta uma grande variedade de suportes tais como videos, fotografias, teses, dissertações, livros, áudio, programas de computador e outros. Há universidades que já possuem 2 e até mesmo 3 DSpace para criar repositórios, separando os científicos do não científicos ou outros. Esta estrutura facilita os relatórios das métricas (estatísticas), depois é possível desenvolver um metabuscador que varra todos os repositórios. Shintaku afirma que quase metade dos repositórios mundiais são em DSpace, o segundo mais utilizado é o E-Prints. A maioria dos usos de DSpace é ainda em universidades, no Brasil 60% do uso, por exemplo, é pelas universidades. O DSpace utiliza um servidor de web (Apache Tomcat – software livre) para gerenciar as páginas exibidas aos usuários e um gerenciador de banco de dados (Postgre SQL – software livre) para armazenar as informações do sistema. O DSpace possui 2 interfaces, XMLUI, baseada em XML e a JSPUI, clássica do DSpace. É possível ter mais de uma interface no mesmo repositório, personalizando com temas diferentes. O DSpace já vem com padrão DC. A estrutura do DSpace é hierárquica para facilitar a organização e permitir navegação. Compreende: Comunidades > Subcomunidades > Coleções > Itens (menor unidade do DSpace metadados + objeto digital). As comunidades e as subcomunidades representam a estrutura funcional, os grandes temas, não contendo objetos digitais diretamente. As coleções são as tipologias dos documentos, pois abarcam os objetos digitais. Aconselha-se então que as coleções sejam formadas por tipo de arquivo (periódicos, livros, etc.) ou por formato (videos, áudios, etc), mas não por assuntos. As comunidades e subcomunidades são mais apropriadas para representar assuntos. O DSpace trabalha com acesso de usuário e grupos. O usuário é quem acessa o DSpace, os grupos podem ser anônimos (sem acesso, não podem depositar documentos) e administradores (com permissão, podem fazer tudo). Estes 2 grupos já existem e não podem ser apagados, mas podem ser criados grupos intermediários. Há 3 opções de permissões para acesso: - Aberto: acesso aberto para acessar metadados e objetos digitais - Restrito: acesso restrito para acessar metadados e objetos digitais - Embargado: data limite de acesso ao item As instituições geralmente liberam acesso somente aos metadados, mas não aos objetos digitais, ou liberam para depósito de objetos digitais com preenchimento de metadados básicos. O login é seu e-mail cadastrado. Pode ser utilizado o protocolo L-DAP (Lightweight Directory Access Protocol) para gerenciar os logins. O DSpace avisa por e-mail todas as atualizações, quem logou, quem depositou, reporta erros, etc. Estas notificações podem ser configuradas para recebimento ou não, de acordo com a responsabilidade de cada administrador.

Page 17: Lívia relatório curso_biblioteca_digital_bn

A entrada de documentos se dá por 4 meios: - Fluxo de submissão: autoarquivamento - Importação/ migração: permite depósito em lotes (batch) - Sword: protocolo de comunicação, depósito automático oriundo dos periódicos - Harvesting: coleta automática No auto-arquivamento o autor preenche um formulário com os metadados, faz o upload do objeto digital, seleciona o licenciamento e disponibiliza no repositório. O auto arquivamento não funcionou muito bem no Brasil até hoje, pois nas universidades os professores dizem não ter tempo ou delegam esta função aos seus estagiários. O fluxo do autoarquivamento é ajustável para cada coleção, pode-se por exemplo liberar o autoarquivamento até o upload do objeto digital, assim um bibliotecário poderia avaliar a pertinência do documento, conferir os metadados e disponibilizar. Pode-se ainda acrescentar ao fomulário campos com controle de vocabulário, controle de autoridade, etc. Tesauros e Vocabulários Controlados devem ser inseridos já estruturados no DSpace (sinonímias, relações, etc.) Para fazer a relação entre os arquivos criou-se o protocolo OAI-ORE (Object Reuse and Exchange), que coleta não apenas os metadados, mas também os recursos contido nos itens, principalmente objetos digitais compostos como websites. O DSPACE vem tanto com o protocolo OAI-PMH, como o protocolo OAI-ORE, permitindo capturar metadados ou metadados e documentos. Há ainda o Sword para depósito automático em repositórios. O DSpace oferece ferramentas de busca simples e avançada e possibilita customização dos campos de busca. Para DSpace interface XMLUI (Discovery) é possível ainda aplicar navegação facetada, aplicação de filtros para refinar os resultados e a ferramenta de auto complete baseada na base de dados. Por fim, Shintaku fala da curadoria do DSpace e sugere que se aplique vírus scan nos objetos digitais. 06/07 Curadoria Digital por Prof. Moreno Barros Segundo Moreno a abordagem de projetos de digitalização deveriam se dividir entre preservação e disponibilização (trabalho em web), eles se concentram muito em digitalização (preservação) e pouco em divulgação (web). Curadoria digital deveria entrar no início do projeto de digitalização. Gasta-se muito para dar acesso, mas pouco para tornar isto conhecido, resumindo, é muito investimento financeiro de todos para poucos usuários (os especializados). Moreno menciona que poucos sites estão abertos para que o Google rastreie seus conteúdos. A biblioteca deve ir aonde está o usuário nestes novos tempos, o catálogo deve aparecer no Google. Deve-se estar visível. Instituições passam horas catalogando e indexando suas obras para no final das contas o robô do Google não conseguir acessar a informação, o usuário precisa ir até o site da biblioteca (quando ele tem conhecimento do site), procurar o catálogo e acessar. Moreno questiona: “De que adianta tanta catalogação e indexação bem feita?”. Os catálogos precisam ser rastreados pelo Google. Assim quando o usuário clica no link, o Google o joga ao catálogo da Biblioteca. A Hemeroteca Digital da BN, por exemplo, está em Drupal e já é possível ter seu catálogo rastreado pelo Google. Comentário da Lívia: de fato pesquisei alguns títulos de periódicos e o primeiro resultado exibido pelo Google é o do site da Hemeroteca da BND. Afirma também que poucas instituições usam o Facebook como ferramenta para facilitar o trabalho de difusão e interação. Completa que grane parte dos usuários estão lá, alem de ser uma ferramenta com baixo custo de implantação e manutenção. Geralmente as redes sociais são tocadas por uma só pessoa nas bibliotecas e tampouco estão articuladas com a estratégia das bibliotecas.

Page 18: Lívia relatório curso_biblioteca_digital_bn

A curadoria seria um novo termo para atacar um velho problema. De cara as bibliotecas não conseguiram, por meio das redes sociais, melhorar o relacionamento com o usuário. Segundo Moreno, a curadoria seria uma segunda chance. Para ele, as BDs resolvem o problema da acessibilidade e a curadores de conteúdo resolvem a barreira da participação, pois pega conteúdos e refina para públicos específicos, seria um novo nome para DSI (Disseminação Seletiva de Informação). Para Moreno, redes sociais são somente ferramentas, elas não emburrecem as pessoas até porque o conteúdo das redes sociais é construído pelos próprios usuários. O problema dos usuários está na educação, na formação para utilizar as redes sociais de melhor maneira. Moreno questiona “seu filho fica o dia inteiro no facebook?”. Este não é o problema. A questão é a falta de filtros, algo que vem de um problema educacional e os bibliotecários poderiam levar a estes os tesouros que possuem em seus acervos por meios das redes sociais. Segue falando que as redes sociais fracassaram na biblioteconomia por falta de bibliotecários para realizar especificamente este trabalho. Moreno sugere que a BN seja depósito legal digital também, já que terá um Data Center a prova de incêndio, terremotos, inundações e falta de energia. Acredita que nenhum acervo do pais tenha algo assim guarda seus “tesouros digitais”. Assim as instituições estariam protegidas contra a mudança de planos de seus financiadores. Indica para conhecimento o www.archive.org, organização sem fins lucrativos que visa preservar o conhecimento humano, conta com cópias arquivadas de páginas da Web, mostrando assim a evolução da Web. O arquivo inclui também softwares, filmes, livros, e gravações de áudio (inclusive gravações de shows/concertos ao vivo de bandas que o permitem). Já foi comparada com a Biblioteca de Alexandria. O canal Viva, por exemplo, é um canal para exibir os tesouros da Rede Globo. Há curadoria quando se decide o que entra no Viva. Moreno dá o exemplo da Library of Congress de imagens que tinham poucos acessos em seu catálogos por falta de informação sobre elas, mas que passou a ganhar muitos quando a instituição criou um perfil no Flickr (Rede Social onde os usuários postam suas fotografias) e nos comentários da ferramenta usuários começaram a dar informações sobre as fotos que a biblioteca não tinha conhecimento. Serviu também para a LOC divulgar seus catálogos de imagens. Para conhecer: http://www.flickr.com/photos/library_of_congress/ Para Moreno, o Flickr é o melhor modelo de Web 2.0. A Europeana possui pesfil no Twitter. A curadoria digital visa estudar e solucionar as seguintes questões: Quem é o público alvo? Qual conteúdo? Impedimentos legais? Quanto tempo dura? Como as pessoas vão acessar? Onde ele vai ficar? Quem vai ser o curador? Moreno alerta ainda que as bibliotecas brasileiras ainda não criam aplicativos de Smartphone e Tablets para seus eventos, excluem este meio de divulgação e ampliação no fornecimento de conteúdo. Não percebem que se trata de um investimento para sua própria sobrevivência. É importante existir um curador que monitore as redes sociais e a dispersão do conteúdo deve entrar em pauta. A estatística deve ser divulgada. Deve-se buscar retornar novas informações para a sua comunidade social (intervenção e feedback). Exemplificando este último item: a biblioteca não sabe os dados de uma obra? Coloque na web, em ferramenta não formal, mesmo sem dados levantados e tente conseguir os dados por interação junto com os próprios usuários. Faça o usuário colaborar até mesmo com a catalogação. Vale lembrar que as instituições precisam informar os direitos de uso, licenças, para que um curador externo possa saber o que pode usar. Moreno utiliza a ferramenta Pinterest – http://pinterest.com/morenobarros/ - para divulgar imagens, inclusive de bibliotecas, como em http://pinterest.com/morenobarros/biblioteca-nacional-digital/

Page 19: Lívia relatório curso_biblioteca_digital_bn

06/07 A Web e a Cultura Digital por Prof. Carlos Henrique Marcondes Para Marcondes a internet é a plataforma universal para troca, publicação e disseminação das culturas (cultura digital), não só de acervo físico convertido em digital, mas também daqueles que já nascem no digital. A internet representa informação a qualquer hora, qualquer lugar e para qualquer usuário com acesso à ela. Seu surgimento e constante aprimoramento, implica no desenvolvimento de novas políticas, novos relacionamentos entre pessoas, entre pessoas e informações, etc. Às bibliotecas cabe o desafio de desenvolver a crescente autonomia dos usuários, estruturação de serviços via rede, integração com outras instituições e gestão do conhecimento (ensino à distancia). Marcondes sugere para conhecimento o aplicativo ICA-Atom, gratuito e de código-fonte aberto para gerenciamento de descrição arquivística, em conformidade com os padrões do Conselho Internacional de Arquivos (ICA). O objetivo é disponibilizar um aplicativo fácil de usar, multilíngue, e totalmente baseado na web, permitindo que instituições possam representar seus acervos arquivísticos em meio eletrônico.

Segue afirmando que o OPAC (Online Public Access Catalog), utilizado hoje pelas bibliotecas, sistema que aparentemente resolve todas as questões, possui pouca interpretação semântica, depende de pessoas que entendem o modelo de entrada de dados (bibliotecários), ou seja, não conseguem interpretar o que o usuário busca. Não refletem a necessidade atual de proporcionar mais autonomia de pesquisa aos usuários. Padrões como o Marc, protocolos como o Z39.50 somados aos softwares de bibliotecas, mantêm o registro preso ao catálogo sem integração com a web.

A web semântica não é outra web, mas sim uma extensão na atual. Na web semântica o sentido da informação é melhor definido, as pessoas trabalham em cooperação (self describing documents e better enabling computers). Se bem conduzida, a web semântica pode apoiar/mudar o conhecimento humano como um todo.

A atual web faz uso da lógica formal (dedução), considerada muito pobre já que se baseia na forma, já a web semântica utiliza a lógica ontological, baseada no conteúdo. Evolução da web chegando a web semântica: - HTML: define onde o conteúdo vai estar (Ex. No topo, centro, lateral, etc.) - XML: define o que é o conteúdo (Ex: título, autor, etc.) - RDF: define a ordem do conteúdo (Ex: sujeito, predicado, objeto – a sintaxe do conteúdo) Ex de RDF: João da Silva é o diretor do site http://www.amazon.com.br Sujeito (Recurso) http://www.amazon.com.br Predicado (Propriedade) Diretor Objeto (literal) João da Silva As camadas da web semântica são: URI, XML e XML Schema, RDF e RDF Schema, Ontologia, SPARQL, RIF, Lógica Unificadora, Proof, Criptografia, Confiança, Interface com usuário e aplicações.

Page 20: Lívia relatório curso_biblioteca_digital_bn

Linguagens de Web Semântica: -RDF: Pressuposto semântico (sujeito, predicado e objeto) -RDF Schema: Extensão Semântica da RDF, define classes e propriedades dos termos da RDF. -OWL: Pressupostos Semânticos independente do conteúdo (classes, subclasses, propriedade, domínio, escopo, cardinalidade, etc). Marcondes comenta sobre a proposta de dados abertos, o Linked Open Data (Dados Abertos Interligados). São links semânticos e abertos que substituiriam os links tradicionais, do campo 856 do Marc. A grande questão dos dados abertos, da web semântica, é poder reutilizar os dados. A Europeana utiliza Linked Data por RDF. A Web semântica, por meio dos dados interligados, incentiva o reuso da informação em outros contextos. Se pagarmos a obra Dom Casmurro do catálogo de uma biblioteca, por exemplo, esta poderia estar ligada à minissérie “Capitu” da Rede Globo no Youtube, à definição de Capitu no Wikipedia, à biografia de Machado de Assis e vice-versa, o Youtube, Wikipedia e a biografia estariam ligados ao catálogo da biblioteca, seriam mais caminhos para se chegar aos conteúdos das bibliotecas. Recomendação da Lívia: Leitura do artigo “The Strongest Link: Libraries and Linked Data” http://www.dlib.org/dlib/november10/byrne/11byrne.html Marcondes sugere para conhecimento o VIAF (The Virtual International Authority File), que desenvolve em conjuto com várias bibliotecas do mundo um catálogo de autoridades mantido pela OCLC. O obejtivo unir em um único catálogo virtual vários catálogos nacionais de autoridades. O VIAF iniciou apenas com pontos de acesso para pessoas, mas cobre hoje também entidades coletivas, obras, expressões e nomes geográficos. Teste feito por Lívia: ao digitar no campo de busca o nome que deseja, o sistema retorna a ficha com URL ou link permanente deste nome. Abaixo segue resultado da pesquisa realizada para Machado de Assis, vale mencionar que não há ainda nenhuma biblioteca brasileira envolvida no projeto.

Marcondes também menciona diversos vocabulários que já são utilizados: - DublinCore: namespace - Europeana: namespace - FRBR: namespace - OWL: namespace 06/07 Repositórios institucionais como estratégia para o acesso livre ao conhecimento por Profa. Simone Witzel Witzel começa a aula colocando duas soluções para problemas de acesso: domínio de tecnologias e acesso livre. Ressalta alguns elementos do novo modelo (acesso aberto): - Metadados (DublinCore), compatibilização com MARC21, Mods e Mets - Protocolo OAT-PMH (livre), que substitui o Z39.50 (pago) - Provedores de dados: acervos de metadados (uso do protocolo OAI-PMH para interoperabilidade e DSpace para expor seus dados)

Page 21: Lívia relatório curso_biblioteca_digital_bn

- Provedores de serviços: coletores de metadados (catálogos coletivos) - Convivência com modelo anterior, baseado em bases de dados comerciais, hospedeiros, etc. Segue falando sobre o modelo OAI (Open Archives Initiative): - Reconstrução de práticas e processos de comunicação - Auto-arquivamento (disseminação) - Revisão pelos pares (fidedignidade) - Interoperabilidade (acessibilidade) Os provedores de dados são as instituições que criam os metadados e possuem os documentos. Os provedores de serviços podem ser: OAISTER, OASIS BR (IBICT), Metalis, DLHarvest, Homes, etc. O software mais utilizado para provedores de serviços é Open Harvester Systems (PKP). Witzel cometa que o IBICT dá treinamentos de DSpace. E segue falando sobre o ranking de repositórios na web, em 2010 a USP estava no 40o lugar, este ano pulou para 8o. Menciona o projeto Diadorim do IBICT, um serviço de informações relativas às autorizações concedidas para o armazenamento e o acesso dos artigos das revistas brasileiras em repositórios digitais de acesso aberto. Por fim, menciona os instrumentos avançados relacionados a repositórios: - DOI - LemonX - Sword - RICCA - Creative Commons - Lockss 06/07 Armazenagem Digital: O centro de processamento de dados da Biblioteca Nacional e Vista ao Data Center da BN por Prof. Geraldo Chaves Júnior O Data Center da BN é um projeto em parceria com o BNDES, a HP e a AcecoTI, que visa salvaguardar, preservar e dar acesso ao acervo de 8 terabytes de arquivos digitais em permanente crescimento. Está em construção a sala segura à prova de incêndio, inundação, terremotos, roubo, falta de energia e falta de climatização, possui controle de acesso, certificações nacionais e internacionais. Os equipamentos a serem instalados comportam 500 terabytes iniciais, cloud computing HP Cloud system Matrix. Servidores Blade HP. HP 3PAR storages e será possível crescer até 2 petabytes. Suits de 10 GB conexões por fibra ótica. Trata-se do primeiro Data Center da área cultural na América Latina e a previsão é já esteja funcionando em setembro. Com este Data Center a BN quer alavancar parceiros para agregar conteúdo às suas coleções oferecendo a digitalização e armazenamento.

Lívia Lopes Garcia 15/07/2012