necesito un buscador
DESCRIPTION
Si su organización, bien sea para uso interno o externo o con el fin de vender o informar, detecta la necesidad de poner en marcha un buscador, este documento tiene por objetivo facilitarle una síntesis de los factores determinantes al éxito.Conocer la necesidad, las oportunidades, los riesgos e implicaciones, constituir y liderar el equipo adecuado, seleccionar la tecnología correcta o medir el éxito, son cuestiones que a continuación se presentan.TRANSCRIPT
Necesito un Buscador
Resumen ejecutivo
Si su organización, bien sea para uso interno o externo o con el
fin de vender o informar, detecta la necesidad de poner en
marcha un buscador, este documento tiene por objetivo
facilitarle una síntesis de los factores determinantes al éxito.
Conocer la necesidad, las oportunidades, los riesgos e
implicaciones, constituir y liderar el equipo adecuado,
seleccionar la tecnología correcta o medir el éxito, son
cuestiones que a continuación se presentan.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Resumen ejecutivo.................................................................................2
La necesidad y las oportunidades............................................................4
Oportunidades.............................................................................................................................5
Necesidades.................................................................................................................................5
Tipos de proyecto de búsqueda..............................................................6
¿Es posible prever el tipo de búsquedas de los usuarios?............................................................6
¿Cuál es el nivel de estructura de la información?.......................................................................7
Selección de tecnología...........................................................................8
Software Comercial......................................................................................................................8
¿Cuáles son las restricciones de las licencias comerciales?......................................................9
Open Source...............................................................................................................................11
¿Que aspectos definen la oferta Open Source?......................................................................11
El equipo.............................................................................................. 13
Los riesgos............................................................................................14
Diseño funcional....................................................................................................................14
Diseño agregación.................................................................................................................15
Diseño técnico........................................................................................................................16
Medir el éxito.......................................................................................17
La continuidad......................................................................................18
Conclusiones.........................................................................................19
Sobre Colbenson...................................................................................20
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
La necesidad y las oportunidades
Son muchas las formas en las que la
necesidad de un buscador se presenta y
sin embargo, el requisito se comunica en términos tales como:
“Necesitamos un Google”, “hay que poner un cajón de búsqueda”
o simplemente: “Necesitamos un buscador”.
Hoy en día, en cualquier ecosistema empresarial o institucional,
la información dirige multitud de escenarios de los cuales surgen
infinidad de problemas que la búsqueda trata, haciendo del
buscador un componente crítico.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
“Necesitamos un Google”
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Necesidades
Las necesidades han de
valorarse en el contexto
de la mejora de
productividad o
incremento de ventas.
¿Cómo puede
mejorar el
buscador la
productividad de
mi organización?
¿Cómo puedo
potenciar las
ventas online?
Oportunidades
El objetivo es reducir
el tiempo y el
esfuerzo que distancia
a los datos de sus
usuarios, lo que
presenta a su vez
numerosas
oportunidades.
Dotar de mayor
agilidad y dinamismo
a los datos tiene un
impacto directo en
muchos aspectos de la
operativa, el reto es
identificar y priorizar.
Tipos de proyecto de búsqueda
Cada proyecto responde naturalmente a
objetivos específicos, sin embargo es
posible clasificarlos de según el tipo de
uso y según el tipo de datos.
¿Es posible prever el tipo de búsquedas de los
usuarios?
El buscador de una tienda online recibe más de un 50% de
búsquedas con lenguaje coloquial distinto al que describe los
productos, cuando el buscador de un Web de gobierno puede
recibir cientos de miles de búsquedas al mes y sin embargo
solamente 3 temas tales como ayudas, becas o transporte
pueden copar más del 70% del total de la demanda.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
¿Cuál es el nivel de estructura de la
información?
Véase por ejemplo el buscador de un Web de reservas de vuelos
con datos altamente estructurados (fecha, origen y destino),
mientras que los datos publicados en un Web de gobierno son
principalmente des-estructurados.
Cuanto más estructurados son los datos, mayor es la
probabilidad de convertir una búsqueda en una experiencia
satisfactoria.
Estructurar o enriquecer debe de responder fielmente a una
demanda de uso y a unos niveles de mantenimiento o
actualización coherentes con el sentido y futuro del proyecto.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Selección de tecnología
La selección de una u otra tecnología no es un factor
determinante del éxito, sin embargo marca una ruta de
posibilidades o limitaciones en el futuro y continuidad.
A continuación se presentan los aspectos fundamentales a tener
en cuenta durante la selección tecnologías abiertas o
comerciales.
Software Comercial
El mercado de Software Comercial de búsqueda se ha
consolidado en los últimos años, la oferta tecnológica es muy
similar y las diferencias funcionales inapreciables.
Son muchas las empresas que ofrecen licencias, ya sean
dedicadas como Autonomy, Endeca o Exaleed o la oferta de
grandes fabricantes de software al efecto como Google GSA,
Microsoft Fast o Oracle Enterprise Search.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
La decisión de optar por Software licenciado o comercial tiene
numerosas ventajas, desde la estandarización con el resto de
plataformas comerciales hasta la negociación contractual de
modelos de soporte Gold o Premium sin duda más extendidos y
maduros que en la oferta de código abierto o Open Source.
Sin embargo, la introducción de código objeto o de autor en
modo de licencias de uso comerciales, conlleva una serie de
restricciones que han de valorarse y formar parte de la
negociación durante el proceso de compra.
¿Cuáles son las restricciones de las licencias
comerciales?
Sobrepasar cualquiera de las siguientes limitaciones o que
nuevos interlocutores comerciales las re-definan implica nuevas
negociaciones e incrementos en el TCO (Total Cost of
Ownership).
Definición de uso: Acota el uso del software a ámbitos
internos y/o externos. Dentro de cada uno de estos
ámbitos es también limitable a número usuarios,
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
departamentos, divisiones, dominios, zonas geográficas,
etc.
Volumen de documentos, tamaño/número de índices,
consultas concurrentes o CPUs: Sin lugar a dudas una de
las limitaciones más confusas. ¿Qué es un documento?
¿Cuentan las consultas intra-procesos, paramétricas o de
personalización? ¿De qué sirve tener índices grandes sino
pueden escalarse a nuevas instancias?
Funcionalidades: El software viene limitado,
evidentemente por sus funcionalidades. El problema radica
en que los nombres de éstas cambian con frecuencia aun
respondiendo a las mismas funciones de API.
Escalabilidad/Distribución/Alta Disponibilidad: Del mismo
modo, las licencias controlan cómo pueden distribuirse,
balancearse y en definitiva definir arquitectura.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Open Source
Las posibilidades de maximizar los
objetivos y las oportunidades de su
proyecto de búsqueda son
proporcionales a al grado de flexibilidad que la infraestructura y
solución de búsqueda ofrezcan.
Open Source, en el lado positivo, ofrece dicha adaptabilidad y sin
embargo es en esa virtud en donde también se encuentra su
defecto, ofreciendo tal espectro de opciones y configuración que
los requisitos técnicos, humanos y de conocimientos son
comparativamente más complejos y sofisticados.
¿Que aspectos definen la oferta Open Source?
Sin restricciones: A diferencia de la oferta de Software
comercial, Open Source en proyectos de búsqueda
presenta una oportunidad de explotación libre de toda
restricción volumétrica, funcional, idomática o de uso.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Investigación y Desarrollo: Desarrolladores por todo el
mundo evolucionan el software. Estos programadores y
arquitectos son movidos por su pasión por las tecnologías
de agregación, conexión, enriquecimiento y procesado de
información. El hecho de que Lucene/Solr esté en boca de
todos es precisamente consecuencia del desarrollo
acelerado que experimenta y de la rápida evolución técnica
y funcional hasta el punto de haber alcanzado a las
soluciones comerciales.
Lucene/Solr es desarrollado desde hace más de 10 años bajo el
proyecto Apache. Los grandes proyectos de éxito en búsqueda
como Linkedin, Twitter o Data.gov corren sobre esta tecnología.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
El equipo
A los perfiles experimentados en tecnologías de búsqueda y
agregación de aquellas tipologías de fuentes a agregar, es
imprescindible sumar experiencia en diseño de patrones de
encontrabilidad.
El diseño de arquitecturas de búsqueda de alto rendimiento,
gestión de caches, compresión y tipologías de índices,
securización y eficiencia de todo el espectro de acciones de
búsqueda necesita de un conjunto de perfiles multidisciplinar,
desde encontrabilidad hasta arquitectura pasando por
administración de sistemas, documentación y desarrollo.
La tecnología de búsqueda coexiste en un ecosistema variado de
aplicaciones y tipologías documentales con el que debe
interactuar de forma coherente. Materializar dichas
interacciones resulta en un claro proyecto de integración que
demanda elevados conocimientos más allá del buscador en sí
hacia los sistemas que le rodean.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Los riesgos
¿Cuáles son las razones por las que el proyecto puede fracasar?
Diseño funcional
Diseño agregación
Diseño técnico
Diseño funcional
Un correcto diseño funcional del proyecto buscador ha de
contemplar los denominados patrones de búsqueda o conjunto
de casos de uso del buscador según la tipología de información y
las propias características del usuario.
La disponibilidad de funcionalidades no justifica su
incorporación. Cada función de búsqueda ha de atender a un
comportamiento común de la mayoría de usuarios y a
intenciones de búsqueda definibles y diseñables.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Mitigación: Es preciso definir indicadores de éxito del buscador o
KPIs (Key Performance Indicators). Sobre dichos parámetros es
posible cuantificar objetivamente mediante Analítica de
Búsqueda el éxito o fracaso de la casos de uso planteados,
permitiendo adaptarlos o crear nuevos cuyo diseño sí
corresponda y en efecto se disuelva con el comportamiento de
sus usuarios.
Diseño agregación
Otra causa común de fracaso y un riesgo de gran potencial es la
falta de un diseño apropiado de los procesos de agregación, bien
por la introducción de ruido o por ignorar simples vías de
enriquecimiento de información y datos que a su vez habilitan
búsquedas efectivas.
Mitigación: Evaluar la normalización mediante la suma y el
enriquecimiento de meta-datos de forma automática. Definir los
ciclos de vida de contenidos e información para cada tipología.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Diseño técnico
Es frecuente que las arquitecturas lógicas y físicas planteadas no
satisfagan los requisitos de rendimiento, disponibilidad y
escalabilidad. Bien por la falta de previsión de los volúmenes de
consultas (que muchas veces incluyen infinidad de acciones más
allá de la búsqueda), o bien por el desconocimiento de los
volúmenes y ciclos de indexación (tanto desde el punto de vista
de unidades documentales como términos/idiomas).
Mitigación: Un correcto estudio de los ciclos de vida de los
contenidos y de las previsiones de crecimiento ha de traducirse
en arquitecturas que asignan diferentes responsabilidades a
diferentes motores que pueden perfectamente inter-operar,
cruzar y re-ordenar consultas y resultados.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Medir el éxito
Los indicadores de éxito deben ser duros y medibles.
Por ejemplo, si el objetivo del proyecto
es promover la venta cruzada, la
métrica debe ser predefinida entorno
a los índices de click-through rate
(CTR).
Al otro lado del espectro, cuando el proyecto es interno,
podemos medir por ejemplo el grado de conversión de
búsquedas en el sistema de preguntas y respuestas y como se
refleja en el numero de llamadas atendidas por el Centro de
Atención al Usuario o CAU en dicho periodo.
La clave reside en analizar y cuantificar el impacto que a nivel
de negocio tienen los clicks en contenidos y acciones como por
ejemplo contratar un producto, pedir un presupuesto, o emplear
un simulador de hipotecas.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Los indicadores de éxito deben ser duros y medibles
La continuidad
Sobre una métrica dura que permite cuantificar el éxito del
buscador, el proyecto ha de planificar una continuidad diseñada
para elevar dichos resultados y obtener por otros cauces nuevos
réditos.
Dos son los factores que fundamentan la previsión de
continuidad de un proyecto de búsqueda:
Las propiedades volumétricas y tipológicas de la información
Las expectativas y casos de uso
Tanto en cuanto ambos factores cambian y evolucionan, los
servicios de búsqueda asociados han de adaptarse y
actualizarse, no hacerlo resulta en ignorar la verdadera
naturaleza viva de los servicios de búsqueda y con ello
abandonarlos a un deterioro continuado (a medida que
volúmenes y tipologías se agregan y las intenciones de uso
evolucionan).
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Conclusiones
Bien para uso interno o externo, tanto en organismos públicos
como privados, un buscador tiene la responsabilidad de
simplificar y reducir el tiempo y el esfuerzo que distancia a los
usuarios de la información que de forma inmediata precisan.
Tratar dicho objetivo, no es una cuestión exclusivamente
tecnológica, sino metodológica. El éxito depende de analizar y
comprender la demanda de información, en apreciar cómo
buscan.
Diseñando sobre esos comportamientos el buscador
proporcionará experiencias satisfactorias y medibles
cuantitativamente, tanto en cuanto es posible calcular cuando
una búsqueda ha fracasado, es igualmente posible detectar
cuándo no lo ha hecho, pudiendo establecer un ratio de
encontrabilidad medible y cuya maximización depende
principalmente de la Analítica de Búsqueda y el Diseño de
Patrones de Búsqueda.
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.
Sobre Colbenson
Colbenson desarrolla y aplica metodologías y tecnologías que
dotan a sus contenidos de mayor agilidad y rentabilidad,
anticipándose a las necesidades de sus usuarios según sus
patrones de comportamiento.
Desde Colbenson Software Factory se desarrollan productos y
widgets de búsqueda y recomendación como OSP (Open&Search
Platform) y de analítica, adaptación y optimización de
buscadores, usuarios y contenidos como SearchBroker, con
impacto directo en la productividad y conversión de indicadores
de negocio para clientes como Casa del Libro, Mango, Caja
Madrid/ Bankia, Acceso, Europa Press, Banco de España,
Biblioteca Nacional, Poder Judicial o Gobierno Vasco.
Colbenson.com y @colbenson
Encontrabilidad.org
OpenandSearch.com
2011 Colbenson SL. Colbenson Group.
Este documento es confidencial y protegido por copyright por Colbenson Group y es la propiedad de Colbenson Group a no ser que sea indicado de
otra forma.