búsqueda de información y bibliografía anotada claudia j. becerra c. seminario de investigación...

32
Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Upload: rita-banos

Post on 28-Jan-2016

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Búsqueda de Información y Bibliografía Anotada

Claudia J. Becerra C.

Seminario de Investigación I

Page 2: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Busqueda de Información

Baeza-Yates, R., Ribeiro-Neto, B. Modern Information Retrieval. © Addison Wesley Longman Publishing Co.Inc, Chapter 10:257-

323, First edition. 1999.

Page 3: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

En donde empezar? – libros de texto

Page 4: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Interés – Enfoques Gráficos para especificación de Queries Interactivos La especificación de queries interactivos "ayudados por

visualizaciones inteligentes de los datos" seleccionadas de acuerdo al perfil de quién consulta y una ontología de datos de un dominio específico, puede constituirse en una valiosa herramienta de utilización intensiva de un sistema, que reduzca la decepción que genera el enfrentarse a resultados de consultas con cero (o millones de) registros recuperados y disminuya considerablemente el número de iteraciones para llegar a una respuesta aceptable.. Mi interés se centra en la exploración de las posibilidades de navegación interactivas que puedan ofrecer los sistemas de visualización de información, ayudados por un perfil de usuario y una definición ontológica de los datos a visualizar

Page 5: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Recolección Inicial de Referencias

Page 6: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Recolección Inicial de Referencias

Page 7: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Grupos de Investigación

Page 8: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Herramientas de Apoyo - Excel

Page 9: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Herramientas de Apoyo - JabRef

Page 10: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Clasificación de artículos

TAXONOMIA INICIAL

EXPLORACION DE DATOS MULTIVARIADOS

10 Historia

15 Herramientas de interacción visual

20 Técnicas de visualización de dimensiones (de tipos de datos) especiales

30 Métodos de visualización de datos multivariados

40Especificación formal de gráficos (aproximaciones a la graficación no asistida, no diseñada por el usuario)

50 Toolkits de visualización de datos multidimensionales

60 Técnicas de reducción de dimensionalidad

70 Herramientas de evaluación de interfaces

90 Taxonomías propuestas

80 Retos

Page 11: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I
Page 12: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Bibliografía Anotada

Page 13: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Bade, R., Schlechtweg, S., and Miksch, S. 2004. Connecting time-oriented data and information to a coherent interactive visualization. In Proceedings of the ACM SIGCHI Conference on Human Factors in Computing Systems.

Stefan Schlechtweg es asistente de investigación, desde el año 1999, del Departamento de Simulación y Graficas de la Universidad de Otto-von-Guericke en Magdeburg, en el grupo de investigación de Computer Graphics y Sistemas Interactivos. PHD Silvia Miksch es profesora asociada de la Universidad de Tecnología de Viena.

El Artículo explora y propone respuestas a los retos y desafíos particulares que implica desarrollar una interface de visualización interactiva de datos orientados en el tiempo . Utilizando como guía el desarrollo de un sistema de cuidado de pacientes de una unidad médica de cuidado intensivo.

Dentro de los retos para los cuales proponen soluciones están:1. Visualización cualitativa de datos orientados en el tiempo, para lo cual propone un sistema de Línea de

tiempo ""TimeLine"" propuesto por Eduard Tufte [Tufte1983-The-Visual] pero al cual se le agregan colores que dan información semántica del valor de la variable en el tiempo y al cual llama Color-coded TimeLine (Ver Figura 1), la segunda variación denominada ""Height-coded timeline"" propone utilizar altos variables que a manera de un gráfico de barras permitan deducir el valor aproximado de la variable (Ver Figura 2 y 3), y la tercera opción que es una mezcla de las 2 anteriores llamada Colored Version of the height coded timeline (Ver Figura 4).

2. Visualización cualitativa y cuantitativa de datos orientadas en el tiempo: En este tipo de gráficos se propone la visualización del significado del valor de la variable sin sacrificar la visualización del valor de la variable en cada punto , esta visualización se puede ver en la Figura 5, en la Figura 6, no se colorea la grafica y solo se delimitan regiones semánticas, en la figura No. 7 a cambio de colorear el área debajo de la curva se colorean el eje y se extienden marcadores para los límites de cada nivel de significado.

Page 14: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

… “Connecting time oriented data and information to a coherent interactive visualization”

Page 15: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

… “Connecting time oriented data and information to a coherent interactive visualization”

3. Visualización de Incertidumbre y confiabilidad en la información graficada: Para graficar la incertidumbre en el eje x en la toma de cada dato, se utiliza la visualización mostrada en la Figura 8, mientras que para la desviación en el eje y se utiliza la representación ilustrada en la Figura 9, y para representar la confiabilidad se utiliza una ""filled bar"" visualizada en la Figura 10. En la figura 11 se muestra una gráfica que grafica datos que poseen valor, tiempo de ocurrencia, tiempo durante el cual es valida la medición, desviación en el tiempo de medición, tolerancia del instrumento de medición y confiabilidad. La representación abordó la representación de variables con 6 dimensiones.

Page 16: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

… “Connecting time oriented data and information to a coherent interactive visualization”

4. Visualización de datos de alta frecuencia: Se propone un rediseño a la visualización tradicional ilustrada en las Figuras 12 y 13, de Tukey box plots [Tukey1972-Some-Graph]. En esta propuesta las medidas estadísticas máxima, mima, mediana, y percentiles 75 y 25% se colorean de la manera ilustrada en la figura 14 y se ensamblan para obtener la visualización de la figura 15, que supone una nueva forma de visualización de datos de alta frecuencia.

Page 17: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

… “Connecting time oriented data and information to a coherent interactive visualization”

5. Interacción con Datos: Para la interacción con datos se propone una interfaz de resizing/zooming , la cual combina las diferentes técnicas de visualización cualitativa y cuantitativa arriba ilustrados, brindando progresivamente mayor nivel de detalle a medida que el usuario lo requiere. El procedimiento se ilustra en la Figura 16.

Page 18: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

… “Connecting time oriented data and information to a coherent interactive visualization” 6. Interacción con Tiempo: Para la interacción en el tiempo se propone una interface focus+context que

muestra tres niveles de detalle, que utilizados mediante deformaciones permite mostrar en primer plano el área de interés y deformar las áreas adyacentes con el objeto de contextualizar la información. Ver Figuras 18 y 19.

Page 19: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I
Page 20: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

… “Connecting time oriented data and information to a coherent interactive visualization”

Conclusión: La conclusión con la cual justifican la adecuada contribución de las técnicas introducidas para el éxito del proyecto la traducen en seguir los consejos de Ben Schneiderman (The visual information seeking Mantra) en [Shneiderman1996-The-Eyes-H]:

• Overview first, • zoom and filter, • then details-on-demand"

Page 21: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Ahlberg C., Williamson C., Shneiderman B. Dynamic queries for information exploration: an implementation and evaluation. In Proceedings of CHI'92.El artículo es escrito por Ben Schneiderman, quien en 1982 fundó el laboratorio de Human Computer Interaction de la

Universidad de Maryland . Christopher Williamson, viene de realizar el sistema de queries dinámicos HomeFinder [Christopher Williamson, Ben Shneiderman: The Dynamic HomeFinder: Evaluating Dynamic Queries in a Real-Estate Information Exploration System. SIGIR 1992: 338-346], el cual hoy en día esta disponible como muestra de trabajo preliminar en el área en el HCIL.

El paper conduce un experimiento de consulta de propiedades de una una base de datos de elementos químicos en forma interactiva (Dynamic Query Interface). Se comparan los resultados obtenidos con el uso de dos tipos de interfaces semi dinámicas y totalmente textuales, con el fin de dimensionar la real indicencia de cada interface en los tiempos de respuesta de los usuarios para la realización de tareas específicas de comparación y búsqueda de información, detección de tendencias y detección de excepciones en las tendencias.

Los autores realizan una caracterización de una interfaz de queries dinámicos como una interfaz que posea las propiedades enumeradas a continuación:1. Representar el query gráficamente,2. Proveer limites visibles del rango de la consulta.3. Permitir una representación gráfica de la base de datos y de los resultados de las consultas 4. Suministrar retroalimentación inmediata de los resultados visualizados una vez modificados los parámetros de consulta, y ser usada y explorada por usuarios sin experiencia, a la vez de proveer poderosas características a usuarios experimentados..

Utilidad para el Proyecto: 1. Define que es una Interfaz de Queries dinámicos. 2. Introduce los sliders como elementos útiles para la especificación de rangos de consultas (operador booleano menor o igual). 3. Ilustra una metodología objetiva de evaluación de interfaces gráficas

Limitaciones:: Si bién el artículo hace una definición de lo que correspondería a una interfaz de queries dinámicos, la frase:""In dynamic queries the query is represented by a number of widgets such as sliders"" está parcialmente desarrollada. Cuales son los otros widgets que pueden ser utilizados para modelar los otros operadores booleanos?, porque no se tratan en el marco teórico para comparar queries completos? Los querys planteados no son completamente expresivos, y no permiten recuperar cualquier conjunto de datos..

Page 22: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Wilkinson, L., Rope, D.J., Carr, D.B., and Rubin, M.A. The language of graphics. Journal of Computational and Graphical Statistics, Sept 2000, 530-543.Leland Wilkinson es profesor adjunto de estadísticas de la Universidad de Northwestern en Chicago, el desarrolló el algebra de gráficos más conocida como "The grammar of Graph" [Wilkinson1999-The-Gramma], la cual es propiedad de SPSS Inc y está en proceso de ser patentada. El artículo es una breve introducción descriptiva del modelo de datos desarrollado en el Java toolkit nVizn (en el año 2000 este se denominaba GPL - Graphics Production Library) para desarrollo de visualizaciones de datos gráficas en Internet incluido dentro del paquete estadístico SPSS™, el cual se ilustra en la Figura 1.

Page 23: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Wilkinson, L., Rope, D.J., Carr, D.B., and Rubin, M.A. The language of graphics. Journal of Computational and Graphical Statistics, Sept 2000, 530-543.El proceso de Visualización de Información dentro del nuevo paradigma propuestos por Willkison comprende 9

objetos funcionales que operan sobre ciertos conjuntos de datos estos son:

1. Vistas de Datos - "DataView". El cual operando sobre un DataSource, permite conectar un grafo a cualquier forma heterogénea y/o distribuida de fuentes de datos, vinculando los datos con sus fuentes.

2. Analisis - "Analytics". El proceso analítico implica filtrar, recodificar, agregar, segmentar, modelar o resumir (summarizing) la información inicial. Estas operaciones operan en un objeto llamado StarTree que además de poseer la versión de datos arrojada por el DataView, contiene los resultados de los análisis dependientes. En la figura 2 se muestra la representación en forma de árbol de los nodos hijos de los análisis realizados y los nodos padre del procedimiento analítico utilizado.

3. Mapeo de Variables - "Var Map". Este extrae el objeto de datos VarSet del StarTree, el cual consiste en una matriz cuyas columnas son variables y sus filas son las entidades del conjunto de datos inicial.

4. Algebra - La definición del álgebra consiste en determinar el conjunto P de puntos que interceptan el grafo {(x,fx)) / x....} con el espacio de datos F = {XminXmax} x {YminYmax} dado un conjunto de coordenadas seleccionada . Para definir esta intersección Wilkinson definió tres operadores: Cruz (*), Nest (/) y Blend (+), los cuales pueden ser observados en la gráfica

Page 24: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Operador Cross (*)

City*(Pop2000)

Page 25: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Operador Nest (/)

City/Group*(Pop2000)

Page 26: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Operador Blend (+)

City*(Pop1980+Pop2000)

Page 27: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Operador Blend (+)

(City/Group)*(Pop1980+Pop2000)

Page 28: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Wilkinson, L., Rope, D.J., Carr, D.B., and Rubin, M.A. The language of graphics. Journal of Computational and Graphical Statistics, Sept 2000, 530-543.5. Estadísticas - Statistics: Una vez tenemos los datos y el marco a visualizar, necesitamos a partir del VarSet

obtener un grafo estadístico, llamado un SGraph, la idea en este fase es para una tupla de entrada, generar una tupla de salida o un conjunto de tuplas de salida. Esta definición permite ya ampliar los grafos utilizados a no solo gráficos estadísticos. En esta etapa se computan los cálculos propias del grafo deseado, así como los pesos, valores faltantes, y se calculan los datos necesarios de acuerdo a la geometría del grafo a visualizar.

6. Geometria: En esta etapa se convierte el SGraf en un GGraf, esto es un grafo que posee una geometría ya definida de visualización (ej: líneas, punto, histogramas, barra, esquemas, contornos , caminos o links) , La figura 3 ilustra la situación. Otro problema abordado en esta etapa es el muestreo de los puntos que realmente van a ser visualizados .

7. Coordenadas: En esta fase se converte el GGraf en un CGraf (Composite Graph), este grafo es el grafo geométrico visualizado en el sistema de coordenadas elegido. En la figura No. 4 se muestra la visualización de datos en un sistema curvado . En la figura 5, se muestra una visualización de ojo de pezcado para que el usuario pueda detallar la información entre 1995 y 1996 sin perder contexto.

8. Estética - Aesthetics : En esta capa se centran en el manejo de la percepción de la información, que se ocupa de la posicióm, el tamaño, la forma, la rotación, el color, la textura, la difuminación (o contraste), y la transparencia. Otros aspectos menos obvios incluyen los labels, como color, textura y otros atributos que hacen el grafo percibible por el lector.

9. Controladores: En esta última fase el toolkit permite conectar los eventos de usuario a las visualizaciones del grafo, en la figura 4 se muestra un ejemplo de controladores adicionados al grafo para permitir la interacción, entre ellos jerarquías drill-down, zooming (fisheye projections), panning, querying, parametrización de variables visualizadas, etc. En la figura 6, se muestra un ejemplo aun más interesante aplicado al comercio electrónico.

Page 29: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I

Wilkinson, L., Rope, D.J., Carr, D.B., and Rubin, M.A. The language of graphics. Journal of Computational and Graphical Statistics, Sept 2000, 530-543.

AporteWilkinson propone un cambio de paradigma en la visualización de información, basados en tres ideas fundamentales: 1. Las gráficas nos son visualizaciones auxiliares de resultados estadísticos, son un medio de percibir relaciones estadísticas directamente, 2. Los elementos gráficos deben estar vivos , de manera que la información pueda ser excavada (drill-down), limpiada, encadenada, rotada, filtrada, ampliada, directamente en la pantalla, y 3. La definición formal del modelo de gráficos [Wilkinson1999-The-Gramma]: las visualizaciones no son arreglos visuales circunstanciales de los datos, ellos reflejan un modelo cualitativo o cuantitativo de las variables mostradas.

Conclusión Los gráficas generadas por computador han sido por mucho tiempo consideradas como visualizaciones de

estructuras de datos predeterminadas, ya es tiempo de considerar la posibilidad de estructurar los datos para colocarlos en la vista en lugar de estructurar la vista para colocar los datos. Lograr esta meta requiere un "lenguaje de gráficos".

Page 30: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I
Page 31: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I
Page 32: Búsqueda de Información y Bibliografía Anotada Claudia J. Becerra C. Seminario de Investigación I