Validación de visualizaciones. Como se indicó al presentar el modelo de Munzner, el espacio de diseño es amplio. Y existen grandes posibilidades de tomar decisiones que desemboquen en visualizaciones de datos poco eficientes. Por eso es importante validar nuestros diseños. Pero la validación tampoco es un proceso simple. El modelo anidado de visualización de Munzner propone entonces, además de las tres etapas para el diseño, cuatro niveles para validación de visualizaciones de datos. En esta clase veremos esas cuatro etapas. En esta clase se revisaran los siguientes temas. Tema 1, cuatro niveles para validación. Tema 2, problemas en cada nivel. Tema 1, cuatro niveles para validación. En esta imagen se presentan los cuatro niveles de validación de visualizaciones de datos. Y su relación con las tres preguntas o etapas vistas anteriormente para diseñar visualizaciones. Los cuatro niveles de validación son situación de dominio. En este nivel se consideran los detalles del dominio de aplicación en particular. Abstracción de datos y tareas. En este nivel esperamos abstraer el problema del dominio de aplicación. Es decir, abordar el problema de forma independiente del dominio. Codificación visual e interacciones. En este nivel se decide la manera especÃfica de crear y manipular la representación visual. Es decir, responder la pregunta ¿cómo? Algoritmo. En este último nivel se trabaja en implementar la visualización a partir de la codificación visual. Y en los mecanismos de interacción elegidos en el nivel anterior. A continuación te invitamos a responder la siguiente pregunta. Situación de dominio, corresponde al primer nivel del modelo. En este nivel esperamos comprender el dominio de aplicación y las necesidades de los usuarios. Por esto, en él se define el grupo de usuarios objetivos, su vocabulario, sus preguntas y sus datos. Con tal información, se espera entender en su completitud el problema que el usuario quiere solucionar mediante el uso de visualización. Además, en este nivel se estudian las diversas herramientas o visualizaciones existentes para enfrentar este problema. Y cuál es el uso que le dan los usuarios. En este nivel se responden dos de las tres preguntas fundamentales del modelo anidado, qué y por qué. Para lograr este objetivo, se mapean los datos y las necesidades del usuario con un vocabulario especÃfico del modelo anidado. Que es independiente del dominio de aplicación. Por ejemplo, si una empresa desea ver cómo cambian las ventas de un cierto producto en el tiempo. Y, por otro lado un investigador desea ver cómo cambian las precipitaciones en el tiempo. Ambas situaciones se mapean a un vocabulario en común. Identificar la tendencia de un atributo cuantitativo en el tiempo. De este modo, las decisiones de diseño aplicadas a un problema pueden llegar a ser aplicadas a otros diferentes. Si es que comparten la misma abstracción de datos y o tareas. En relación a la fracción de datos, que recordemos que consiste en identificar el tipo de dataset, tabular, geométrico, red, entre otros. El tipo de dato, Ãtem, atributo, enlace, posición, entre otros. La disponibilidad de los datos, estático o dinámico. Y para el caso de los atributos, una descripción más detallada de ellos, categórico, ordenado o cuantitativo. Respecto a la abstracción de tareas, recordemos que esta abstracción se divide en dos elementos. El propósito de la visualización, acción, y el aspecto del dato de interés, objetivo, para el usuario final. En relación al propósito de la visualización, el trabajo de Munzner propone tres niveles. Tipo de análisis, presentar, descubrir, anotar grabar, disfrutar. Tipo de búsqueda, ubicar, navegar, explorar, averiguar. Y el tipo de consulta, identificar, comparar, resumir. En el caso de aspectos del dato de interés, este puede ser un aspecto que involucra toda la información, caracterÃstica, patrón, datos atÃpicos. Solo información de un atributo, extremo, distribución. O información de más de un atributo, correlación, similaridad, dependencia. En caso de ser un dato geométrico o de red, el usuario puede estar interesado en ver la forma, topologÃa o caminos entre dichos datos. En esta etapa se decide la forma especÃfica de diseñar y manipular la visualización. Para mostrar los datos a partir de las tareas abstractas identificadas en el nivel anterior. Existen dos principales elecciones a realizar en este nivel, la codificación visual y las interacciones. La codificación visual corresponde al mapeo de los datos a alguna representación visual de ellos. Es decir, se determina cómo se verán los datos en la visualización. En este punto se puede elegir entre mostrar los datos con una cierta disposición, separados, ordenados, alineados, georeferenciados, entre otros. O con algún canal visual, color, largo, volumen, forma, entre otros. La interacción corresponde a determinar cómo el usuario controla lo que ve. En este punto, se decide entre permitir una manipulación de los datos, navegar, seleccionar o cambiar. Utilizar diferentes vistas, yuxtaposición, superposición o partición. Y/o aplicar una reducción de la información, filtros, segregación o uso de ventanas embebidas. En este nivel se valida teórica y empÃricamente la implementación de la visualización a partir de la codificación visual elegida en el nivel anterior. Aquà es necesario estudiar formas que aseguren un manejo eficiente de los datos. Estructuras de datos adecuadas, la codificación visual y los mecanismos de interacción. Una visualización bien diseñada pero poco eficiente puede ocasionar una mala experiencia al usuario. Provocando un rechazo a la visualización. Un ejemplo son los algoritmos para visualizaciones de redes o grafos. Donde las implementaciones tienen un alto nivel de complejidad computacional. Y por lo tanto, su visualización se vuelve muy lenta al tener una gran cantidad de nodos y de enlaces. El ejemplo de la diapositiva muestra un algoritmo basado en fuerzas para dibujar el diagrama nodo enlace de un grafo. Tema 2, problemas en cada nivel. Si una visualización existente presenta problemas. Y provoca que los usuarios no la usen o la perciban como inefectiva, se puede usar el modelo anidado de validación para identificar el problema. Estos pueden ser. A nivel de dominio, no se comprendieron las necesidades del dominio de aplicación. A nivel de datos tareas, los datos que se muestran no son los más apropiados. A nivel visual, el gráfico o la selección de marcas y canales no es la adecuada. A nivel de algoritmo, la implementación. A nivel de software, no es eficiente. A continuación te invitamos a responder la siguiente pregunta. Para los problemas identificados, esta imagen resume las distintas amenazas. Y da cuenta de las estrategias de validación para cada una. Existen estrategias de validación que se usan antes de la implementación de la visualización. Otras que se usan durante la implementación y otras que se usan de manera posterior. A continuación lo revisaremos en detalle. Preimplementación de visualización. En la situación de dominio, observar y entrevistar a los usuarios. En la codificación visual, justificar diseño de codificación visual y de interacción. Durante la implementación, a nivel de algoritmo analizar complejidad computacional del algoritmo. También a nivel de algoritmo, medir el tiempo y memoria del sistema. Posimplementación, en cuanto a codificación visual, podemos hacer un estudio de usabilidad informal con usuarios preliminares. También podemos hacer un estudio en laboratorio, medir tiempo y errores por tarea visual. En cuanto a la abstracción de datos y tareas, podemos testear en usuarios finales obteniendo evidencia anecdótica. También podemos hacer un estudio de campo con visualización en producción. Y en cuanto la situación de dominio, podemos observar tasas de adopción de la visualización de datos. En esta clase, hemos revisado las etapas y el proceso de validación de visualizaciones de datos del modelo de Tamara Munzner. Son cuatro niveles. A, situación de dominio. B, abstracción de datos y tareas. C, codificación visual e interacciones. Y D, algoritmo. Hay una conexión entre las tres preguntas de diseño y los cuatro niveles de validación. Identificamos amenazas a cada nivel de validación asà como herramientas para abordarlas. Las estrategias de validación se aplican en tres momentos. Antes de implementar, durante la implementación del algoritmo y postimplementación del algoritmo.