motores de búsqueda y sistemas de información en la web: la situación actual lluís codina upf...
TRANSCRIPT
Motores de Búsqueda y Sistemas de Información en la
Web: La Situación actual
Lluís CodinaUPF
IDECBarcelona, Abril 2007
Abril 2007 L. Codina - IDEC/UPF
Presentación - I
Primera parte El paradigma actual
Análisis de enlaces (PageRank, WebRank) Posibilidades y limitaciones El posicionamiento web
Las alternativas Yahoo Search Windows Live A9 Multibuscadores: Metacrawler, Kartoo, Copernic
Búsqueda multimedia
Abril 2007 L. Codina - IDEC/UPF
Presentación - II
Segunda Parte Google para usos profesionales y académicos
Google Books Google Scholar
Las alternativas Scirus Live Academic
Abril 2007 L. Codina - IDEC/UPF
Primera Parte: El modelo actual
El paradigma Google
¿Es el motor de búsqueda más usado?
¿Es el mejor?
¿A qué debe su supremacía?
¿Cuáles son sus puntos débiles?
¿Hay alternativas?
Abril 2007 L. Codina - IDEC/UPF
Google - Iwww.google.com
Puntos fuertes: Mayor índice de cobertura de la Web (entre el 40
y el 80 por ciento de la web visible según diversas estimaciones)
Análisis de enlaces como componente más prestigioso de su algoritmo de ranking (PageRank)
Sencillez de uso + Uso avanzado… pero en segundo plano
Abril 2007 L. Codina - IDEC/UPF
Google - IIwww.google.com
Puntos débiles: Su ranking ha demostrado ser vulnerable ante
manipulaciones externas (Spaming en posicionamiento Web, Google bombing,…)
Alta prioridad a parecer eficientes antes que serlo (no se pueden consultar todos los resultados, no aplican álgebra booleana, etc.)
El comercio electrónico como background de su estrategia
Abril 2007 L. Codina - IDEC/UPF
Google - IIIwww.google.com
Algunos mitos sobre Google: Google “lo sabe todo” Si no está en Google es que no está en la Web Si no está en su primera página de resultados, es
que no me interesa No hay otras fuentes de información en la Web
(que merezcan la pena)
Abril 2007 L. Codina - IDEC/UPF
¿Hay vida más allá de Google?
Sí, y muy recomendable: Yahoo Search > La mejor competencia
search.yahoo.com Live > La competencia más peligrosa
www.live.com Alexa > La información añadida
www.alexa.com A9 > La búsqueda más completa
a9.com
Práctica - 11. Entrar en Ranking Thumbshots:
http://ranking.thumbshots.com/ Comparar Google con Yahoo usando una misma frase o palabra clave
2. Buscar una misma frase o palabra clave, p.e. “marketing”, en Google.es y en Google.com y comparar resultados
3. Seleccionar una frase o palabra clave y realizar búsquedas en: Windows Live > www.live.com Google > www.google.com A9 > a9.com Comparar: (1) relevancia, (2) página de resultados, (3) opciones de
búsqueda.
4. Descargar Copernic Basic y realizar pruebas comparativas con Metacrawler para una misma frase o palabra clave: (1) relevancia, (2) página de resultados, (3) utilidades
Abril 2007 L. Codina - IDEC/UPF
Abril 2007 L. Codina - IDEC/UPF
Búsqueda Multimedia (I) Dimensiones del fenómeno
Cuantitativa - I: ¿Cuántas imágenes?75 mil millones de fotografías en un año en todo el mundo900 mil millones de fotografías almacenadas en total en todo el mundo31 millones de horas de programas de televisión al año y 71 millones de programas de radioFuente: How Much Information 2003 www.sims.berkeley.edu/research/projects/how-much-info-2003
Abril 2007 L. Codina - IDEC/UPF
Búsqueda Multimedia (II) Dimensiones…
Cuantitativa – II: ¿Qué dimensión económica? Mercado en EE.UU. de bancos de imágenes calculado en unos
3000 millones de dólares (2005). Tres datos concretos: Facturación de Corbis: 228 millones de dólares en 2005 (unos
100 millones en 2004) y 70 millones de imágenes Facturación de Getty: 733 millones de dólares en 2005 (unos
400 millones en 2004) y 70 millones de imágenes y 30.000 horas de metraje (video)
Facturación de JupiterImages (2005): 124 millones de dólares (7 millones de imágenes)
Fuente: Hoovers (www.hoovers.com)
Abril 2007 L. Codina - IDEC/UPF
Dimensiones…
Cualitativa: segmentación del mercado Editorial (revistas, libros) Prensa (diarios) Publicidad y relaciones públicas Packaging Multimedia (dvd, internet) Televisión, vídeo y cine Corporaciones (folletos y memorias de empresas) Investigación: arte, historia, sociología,
antropología, etc. Uso personal (invitaciones, tarjetas, webs, etc.)
Abril 2007 L. Codina - IDEC/UPF
Búsqueda multimedia – (III)
Motores de búsqueda convencionales El problema esencial
Derechos de autor Problemas añadidos
Baja calidad imágenes, limitaciones en las opciones de búsqueda y ausencia de metadatos
La alternativa profesional Bases de datos Repositorios Buscadores especializados “open access”
Abril 2007 L. Codina - IDEC/UPF
Búsqueda multimedia – (IV)
Bases de datos GettyImages > www.gettyimages.es Corbis > www.corbis.com AGE Fotostock > www.agefotostock.com
Repositorios Internet Archive > www.archive.org MorgueFile > www.morguefile.com
Buscadores especializados Creative Commons > es.creativecommons.org/ YotoPhoto > www.yotophoto.com
Abril 2007 L. Codina - IDEC/UPF
Fuenteswww.tasi.ac.uk
Abril 2007 L. Codina - IDEC/UPF
Alexawww.alexa.com
Abril 2007 L. Codina - IDEC/UPF
StockIndex Online
Práctica - 2
Seleccione tres frases o palabras clave que consistan en: Un elemento icónico Un concepto Un nombre propio (nombre de persona, empresa,
topónimo, etc.) Haga búsquedas con estas frases o palabras clave en
Getty y en Corbis para poder preparar un breve informe comparativo que incluya: (1) relevancia de los resultados, (2) presentación y (3) opciones de búsqueda.
Abril 2007 L. Codina - IDEC/UPF
Abril 2007 L. Codina - IDEC/UPF
Segunda Parte: Motores de búsqueda para usos académicos
Las dudas de la Web ante “misiones críticas”: ¿Es fiable? ¿Quién controla la calidad de la información? ¿Cómo filtrar la desinformación? ¿Sirven los modelos anteriores de control
editorial? ¿Cuál es la respuesta de los motores de
búsqueda?
Abril 2007 L. Codina - IDEC/UPF
La respuesta de los motores
Google Google Books
books.google.com Google Scholar
scholar.google.com MS
Live Academicacademic.live.com
Abril 2007 L. Codina - IDEC/UPF
Google Books Inputs
Digitalizaciones de colecciones libres de derechos (Bibliotecas) Contratos con editoriales
Consulta Búsqueda simple y avanzada
Navegación Sumario e Índice temático
Acceso Libro completo Número limitado de página
Opciones específicas Adquisición Localización en bibliotecas
Abril 2007 L. Codina - IDEC/UPF
Google Scholar vs. Academic Live
Inputs La Web (Google Scholar) Editoriales científicas (ambos) Acuerdos con Bibliotecas (Google Scholar)
Consultas Búsqueda avanzada (Google Scholar)
Acceso Resolución de enlaces (ambos)
Exportación de resultados Formatos bibliográficos (ambos)
Abril 2007 L. Codina - IDEC/UPF
Alternativas
Amazon www.amazon.com > Search Inside A9
www.a9.com > books
Abril 2007 L. Codina - IDEC/UPF
Práctica - 3 Seleccione una frase o una palabra clave de su interés y
compare resultados y prestaciones de: Scirus Google Scholar Windows Live
Prepare un breve informe sobre los siguientes aspectos. Relevancia Página de resultados Tipología de los documentos Opciones de búsqueda Utilidades