novos paradigamas da descoberta da informação bibliográfica
DESCRIPTION
Catálogos de nova geração, Next Generation Catalogs, Web Scale Discovery ServicesTRANSCRIPT
NOVOS PARADIGMAS DA DESCOBERTA DA INFORMAÇÃO BIBLIOGRÁFICA
Paulo Leitão I FCG-Biblioteca de Arte I CIDHEUS (UÉ) I FCSH (UNL)
Workshop BAD I Biblioteca Nacional de Portugal I 27 Junho 2012
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
1. Catálogos em linha: críticas, críticas e mais críticas
1.1. 1ª geração de catálogos (final dos anos 70/ princípio dos anos 80)Catálogos construídos sem ter em conta o comportamento depesquisa dos utilizadores
1.2. 2ª Geração de Catálogos (anos 80)Alguns desenvolvimentos significativos, MAS duas áreas fundamentaisproblemáticas:- Pesquisa por assunto- Operadores booleanos
2
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
1.3. 3ª geração de catálogos (finais dos anos 80/princípios dos anos 90)
Uma operação de cosmética.
“Library catalogs still offered mostly only second
generation functionality and that the changes had been
made merely on the surface and not in the core
functionality where they where most needed”
(MERCUN, 2008, p. 244).
3
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
E, no entanto, até meio dos anos 90 oscatálogos eram valorizados pelos utilizadores,até porque eram dos poucos interfaces emlinha disponíveis.
4
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
2. O Problema ganha novos contornos e complexidade
2.1. Aumento e diversidade dos recursos em linha disponíveis nas bibliotecas
Bases de dados de referência e em texto integral
Recursos eletrónicos de vário tipo / Bibliotecas Digitais
RESULTADO: multiplicidade de sistemas de pesquisa, ausência de integração.
5
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
2.2. A Web
Novo modelo de pesquisa de informação
Facilitação das tarefas do utilizador no acesso à informação
Desenvolvimento de mecanismos de produção e gestão de resultados que resolvem (em parte!) os problemas:
CÁLCULO DA RELEVÂNCIA DOS RESULTOS
PESQUISA/NAVEGAÇÃO FACETADA
6
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
2.3. O fenómeno 2.0
Interação e participação dos utilizadores nos sistemas de informação
Serviços com base na interação / participação
O “modelo” Amazon
7
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
3. Tentativas (infrutíferas!) de mudança
O caso das propostas inovadoras de Hildred (1988):
- Cálculo da relevância dos resultados
- Navegação
- Alargamento da cobertura em termos de recursos de informação
- Integração do comportamento dos utilizadores
8
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
4. Resultado
Drástica dimuição da utilização dos catálogos pelos utilizadores emtodos os tipos de biblioteca.
“We asked information consumers in 2005 where they
were most likely to start their search for information.
Eighty-two percent (82%) reported that they began their
information search on a search engine. One percent (1%)
indicated that they started their search for information ona library Web site.
9
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
4. Resultado
When we surveyed information consumers in 2010, they
were just as strongly tied to search engines as the starting
point for information, with 84% beginning on a search
engine. Not a single survey respondent began their
information search on a library Web site.”
(OCLC – Perceptions of Libraries, 2010, p.32)
10
I- Um problema antigo
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
5. Encontar uma explicação
“Two traditions of information organization at work—one
from librarianship and the other from the Web. Librarians’
perspectives about data quality remain highly influenced
by their profession’s classical principles of information
organization, while end users’ expectations of data quality
arise largely from their experiences of how information is
organized on popular Web sites”
(CALHOUN - Online catalogs: what users and librarians want. 2009, p. V)
11
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
1. Os Catálogos de Nova Geração (NGC) ou o Catálogo 2.0: características
a) Ponto de acesso centralizado a todo o tipo de recursos de informação disponibilizados pela biblioteca;
b) Preponderância da pesquisa simples sobre a pesquisa avançada;
c) Cáculo da relevância dos resultados;
d) Pesquisa/Navegação facetada;
12
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
e) Sugestão de termos alternativos (“did you mean”)
f) Sistemas de recomendação
g) RSS
h) Enriquecimento do conteúdo do registo bibliográfico
13
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
i) Participação dos utilizadores: os aspetos sociais do catálogo
Palavras-Chave (“tag’s”) – Folksonomias
Comentários
“Rating’s”
14
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
2. As características (mais relevantes) dos NGC’s passo a passo
2.1. PONTO DE ACESSO CENTRALIZADO
a) A solução Pesquisa Federada: vantagens e inconvenientes
b) A solução motor de pesquisa sobre índice centralizado:
- Vantagens e questões
- A solução preferencialmente implementada
15
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
2.2. RELEVÂNCIA DOS RESULTADOS
Critérios possíveis para o cálculo da relevância(origem: ambiente de pesquisa na WWW):
- Correspondência textual
- Proximidade entre os termos
- Popularidade
- Atualidade
- Localização
16
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
2.2. RELEVÂNCIA DOS RESULTADOS
No entanto, algoritmos tradicionalmente utilizados para o cálculo dacorrespondência textual e proximidade entre os termos não podemser aplicados diretamente.
Ter em linha de conta as características da informação bibliográfica
17
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
EXEMPLO de um caso desenvolvido pela Biblioteca Nacional daAustrália:
“1. Matches in the title, author and subject fields, and
those fields which describe the format, nature of the item
or form of the item, are more important than general
matches within the record;
2. Matches in multiples of the above fields are more
important than matches in just one of those fields. ”
(DELLIT, 2007, p. 6)
18
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
A questão da popularidade:
Comportamentos explícitos : palavras-chave, rating’s
Comportamentos implícitos: empréstimo
UTILIZADORES
19
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
PESQUISA/NAVEGAÇÃO FACETADA
Combinação da pesquisa por palavra com a navegação facetada
As potencialidades da informação bibliográfica, para além da estritarepresentação do assunto
O problema da utilização de linguagens de indexação: acomplexidade dos cabeçalhos
Um exemplo de aplicação no sentido da simplificação: FAST (FacetedApplication of Subject Terminology)
20
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
RSS (Really Simple Sindication ou Rich Site Summary ou ainda RDF Site Summary)
um formato, baseado em XML , para subscrição e sindicação deconteúdos na Web
O formato permite dividir a informação de um sítio Web em partesdistintas e entregá-las automaticamente em outros sistemas deinformação, desde sítios Web (por exemplo, AGREGADORES de RSS)até mensagens de correio electrónico.
21
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
Funcionamento de um “serviço” de RSS
22
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
Exemplo de Canais de RSS num catálogo
Biblioteca Municipal de Santa Maria da Feira:http://www.biblioteca.cm-feira.pt:8080/
Exemplo de um canal para Novidadeshttp://www.biblioteca.cm-feira.pt:8080/ipac20/rss.jsp?session=M3406W7939962.207634&profile=bmsmf&menu=home&aspect=subtab11&npp=20&index=.GW&term=BIBNOV
23
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
PROPOSTA DE ATIVIDADE EM GRUPO
Subscrição de canais de RSS e criação de um serviço de acesso com base num agregador
NETVIBES - http://www.netvibes.com/
24
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
SISTEMAS DE RECOMENDAÇÃO
Os sistemas de recomendação constituem uma forma de, baseando-se no comportamentos dos utilizadores num dado sistema de informação, sugerir alternativas para um determinado resultado.A sua eficiência depende da capacidade em distinguir informação relevante no imenso número de clicks que um utilizador produz num dado sistema e numa sessão.
NO CASO DAS BIBLIOTECAS
Que Comportamentos utilizar? Empréstimos, Visualizações25
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
SUGESTÃO DE TERMOS ALTERNATIVOS
“A good recommendation system will use spelling
corrections, phonetic indexing, related terms from
authority records and many other techniques to help
guide the user into formulating a query that matches
their intent”
(BREEDING, 2010, p. 21).
26
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
ENRIQUECIMENTO DO CONTÉUDO DOS REGISTOS BIBLIOGRÁFICOS
- Capas
- Sumários
- “Reviews”
- Outros conteúdos
27
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
PARTICIPAÇÃO DOS UTILIZADORES
Palavras-Chave Geração (ou não!) de uma Folksonomia
- Complemento à indexação tradicional
- Vantagens (do ponto de vista do utilizador): organização de um espaço informativo pessoal, socialização, recuperação da informação, sentimento de pertença
- Desvantagens (do ponto de vista do utilizador): exige esforço
28
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
- Vantagens (do ponto de vista da Biblioteca): aumento dadiversidade de informação bibliográfica disponível, enriquecimentodo processo de aprendizagem sobre e com os utilizadores
- Desvantagens (do ponto de vista da Biblioteca): exigências degestão
29
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
Questões de implementação não resolvidas:
- Relação com a indexação tradicional
- Utilização no contexto da recuperção
- Utilização na “relação” entre utilizadores
30
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
3. Formas de implementação
I N T E R F A C E S I D E I D E S C O B E R T A
Uma nova camada aplicacional sobre os sistemas existentes
31
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
CATÁLOGOOUTROS
CONTEÚDOSBIBLIOTECA
DIGITAL
INTERFACE DE DESCOBERTARecolha de metados
(re) Indexação – Índice CentralInterface de Descoberta e Acesso
Disponibilização de metadados
32
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
PRINCIPAIS PRODUTOS DISPONÍVEIS
- AQUABROWSER (Serials Solution)
- PRIMO (Ex-Libris)
- VUFIND (Villanova University)
- BIBLIOCOMMONS (BiblioCommons)
33
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
4. Outras soluções dentro do mesmo “conceito”:
- Evolução dos SGB’s – Novos OPAC’s
“The ILS OPAC still has a long way to go toward the next-
generation catalog”
(Yang, 2010, 149)
34
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
-Utilização de conteúdos e serviços com origem em plataformas da Web Social
O caso exemplar do serviço LTFL (LibraryThing for Libraries) (http://www.librarything.com/forlibraries)
Exemplo: http://library.wofford.edu/search/i?SEARCH=0151327653&searchscope=1&searchscope=1#
Ou soluções comerciais
35
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
5. Os Catálogos de nova geração do ponto de vista dos utilizadores
5.1. Perspetiva geral
Poucas evidências, mas parece existir uma boa recetividade
Impactos positivos sobre a circulação e a utilização dos catálogos
36
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
5.2. O catálogo social
Poucos estudos / Poucas evidências
Reduzida participação? (a confirmar!)
Distinguir participação ativa de passiva, mas
“While both types of use are valid and important, unless
people contribute to content the level of social
engagement will be limited and a critical mass of
tags, ratings and reviews may not be achieved”(SPITERI, 2001, p. 28).
37
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
Tentativas de explicação:
- A questão das motivações para a participação: transferência das plataformas da web social para os catálogos?
- Produtos exploram pouco o resultado da participação
- A desmotivação de sistemas que obrigam ao registo
38
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
- A tradição
- Comunidades das bibliotecas são reduzidas
Necessidade de ter em conta as dinâmicascomportamentais demonstradas pelos indivíduos nasplataformas de participação para melhor compreendereste caso.
39
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
A participação vista pelos próprios:
- Maior valorização pelos utilizadores mais novos.
- Utilizadores mais velhos valorizam mais os conteúdos profissionais e o CGU com informação sobre a autoria
(CALHOUN, 2009)
40
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
5.2. Aspetos valorizados pelos utilizadores
- Pesquisa simples por palavra
- Enriquecimento dos registos bibliográficos, como forma de avaliar a adequabilidade de um item às necessidades
- Cálculo da relevância nos resultados
41
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
- Facilitar o percurso da descoberta ao acesso ao conteúdo
“This is the reality that the end users expect from
libraries: the links that connect them from the metadata
describing online content to the content itself”
(CALHOUN, 2009, p. 13).
42
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
- Pesquisa Facetada
a) As facetas são úteis para criar estruturas de navegação;
b) A categorização por facetas facilita a recuperação eficiente em bases de dados;
c) Os utilizadores encontram mais resultados num sistema com facetas;
43
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
d) Os utilizadores parecem gostar de facetas, embora nem sempre tenham, inicialmente pelo menos, uma resposta positiva;
e) Os utilizadores preferem os resultados organizados em hierarquias previsíveis e multidimensionais;
f) A satisfação dos participantes nas experiências é maior com sistemas que disponibilizam facetas.
(FAGAN, 2010).
44
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
- A questão das facetas temáticas
“Given that facets in general are often used, but subject
facets in particular see less use, there needs to be more
consideration given to normalizing subject headings in a
way that works better with a faceted navigation scheme”
(BAUER e PETERSON-HART, 2011)
45
II – Soluções: modelo catálogos de nova geração
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
6. Limitações das soluções que implementam o conceito de NGC
Principal limitação:
Dificuldade em integrar conteúdos diversificados vindos de sistemas de informação diferentes;
Utilização da solução pesquisa federada para tentar assegurar a integração;
Reduzida granularidade da indexação de recursos eletrónicos : “thearticle level retrieval problem” 46
III– Soluções: Web Scale Discovery Services
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
1. Características
a) Conteúdos
- Diferentes fontes
- Indexado ao nível do artigo
- Índice centralizado
- “Esquema” descritivo normalizado
- Indexação de metadados e/ou texto completo
47
III– Soluções: Web Scale Discovery Services
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
b) Descoberta
Pesquisa Simples
Pesquisa Avançada
c) Resultados
Relevância
Pesquisa facetada
d) Flexibilidade
48
III– Soluções: Web Scale Discovery Services
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
2. Principais produtos /soluções
WORLD CAT LOCAL (OCLC)
SUMMON (Serials Solutions)
EBSCO DISCOVERY SERVICES (EBSCO)
PRIMO CENTRAL (Ex-Libris)
49
III– Soluções: Web Scale Discovery Services
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
3. Aspetos diferenciadores das soluções
- Conteúdos
- Metadados e relevância
- Interfaces de pesquisa muito similares
- Nível de integração com os SGB: os problemas da disponibilidade dos itens e das reservas por exemplo.
50
CONLUSÕES
Novos paradigmas da descoberta da informação bibliográfica | BAD | 2012
“In the early half of the 2000
decade, federated search was the next big
thing; in 2006, the NGC came to the library
market with a slow but steady adoption
rate: in 2009, web-scale discovery explode
as the solution to discovery in the library.
But it is safe to say that we will see
something bigger and better in the coming
years”
NAGGY, 201151