[MÚSICA] [MÚSICA] En este módulo os explicaremos buenas y malas prácticas a la hora de visualizar datos y los límites de gráficos. Como veis, los contenidos principales son los límites de gráfico y las buenas prácticas. Primero, para conocer lo datos debemos conocer qué tipo de dato tenemos. Principalente tenemos cuatro categorías, cuantitativo, discreto, continuo y categórico. Cuantitativo podríamos decir que es todo lo que puede ser contado numéricamente. Discreto disponemos de un número de finito de valores posibles, por ejemplo, los empleados de una oficina. Continuo está limitado a un rango, en este caso, podemos tener el ejemplo de la lluvia en un año. Y categórico estaríamos hablando de categorías, en este caso podríamos hablar de productos vendido de una empresa. El siguiente punto interesante que deberíamos tener en mente a la hora de visualizar datos es cómo son las relaciones de estos datos. Normalmente encontraremos estas siete relaciones que serían comparar, series temporales en en cual el valor cambiando en el tiempo, por ejemplo, venta de una empresa en los últimos cinco años, correlaciones, cómo están correlacionados dos valores, por ejemplo, criminalidad y paro, si estos dos valores realmente están unidos y cuando aumenta el paro aumenta la criminalidad, por ejemplo, ranking, que es ordenar de mayor a menor, desviación, en este caso estamos hablando de un valor que se desvía de la media de los siguientes valores, distribución, estamos hablando de valores que se distribuyen a través de un valor central, y partes dentro de un todo, que es la típica gráfica de tarta. Es importante conocer que cuando estamos visualizando estamos facilitando la comprensión. Por lo cual, no debemos decorar. Aquí tenéis un ejemplo en el cual tenemos dos gráficos de tarta, con las mismas porciones. Todas tienen un 33 por ciento, pero si bien miramos el gráfico de la izquierda veremos que lo que percibe el ojo es ese equilibrio de esas tres partes. Si miramos el gráfico de la derecha, en el cual hay una parte que tiene tres dimensiones, y además tiene un ángulo, lo que percibe el ojo y lo que percibiríamos es que la parte blanca es mucho más grande que las partes rosa o azul, que, en este caso, sería completamente falso. Esto nos permite introducirnos en malas praxis en la visualización de datos. Empezaremos, por ejemplo, en las malas praxis con las gráficas de barras. Las gráficas de barras son gráficas que nos permiten comparar y, en este caso, estamos viendo que tenemos barras en tres dimensiones, que no podemos ver las barras de las siguientes categorías, que tenemos un grid o una línea horizontal que no nos permite ver bien los valores, que tenemos los valores encima de las barras solapados, es decir, no hay una claridad, no hay una comprensión. ¿Qué pistas, qué tips podríamos tener para visualizar los datos correctamente? Por ejemplo, en este caso, os doy cinco tips y cinco buenas prácticas. Primer, etiquetar al final de la barra de forma horizontal, es decir, facilitar la comprensión. Si lo pongo de forma vertical no podré leer estos valores. Segundo, la distancia entre las barras debe ser como máximo la mitad de la anchura de la barra. Normalmente las herramientas que os hemos introducido en este curso os lo hacen automáticamente, pero si lo quisierais crear deberíais seguir este patrón. Tercero, todos los ejes deben empezar a cero. Muchas de los errores es que falseamos los ejes. Cuarto, utilizar calores de forma consistente, en este caso, no puedo elegir colores aleatoriamente que puedan distraerme. Y quinto, sería una buena práctica ordenar las barras de una forma fácil de lectura. En este caso, por ejemplo, alfabéticamente. Siguiente error o mala praxis que os propongo son los gráficos de tarta. En este caso, estamos viendo un muy mal gráfico de tarta. Hemos visto que está en tres dimensiones, hemos visto que, además, fijaos en la parte final donde donde hay un montón de categorías que es casi imposible leer el valor. Fijaos que una tarta estamos hablando del cien por cien y aquí you en esta parte de la tarta you nos está poniendo 1.189 por ciento. Es decir, horroroso. No hay una comprensión fácil de este gráfico. ¿Qué buenas praxis podemos tener en los gráficos de tarta? Aquí estaríamos hablando de que las porciones no deberían ser superiores a cinco para facilitar la comprensión. Segundo, cuando queramos comparar diversas tartas es mejor, es más fácil para el ojo utilizar gráficas de barras apiladas que gráficas de tarta una al lado de la otra. Tercero, ordenar las porciones en función de mayor a menor. Normalmente, eso facilita mejor la comprensión. Y cuarto, este orden tiene que ser en sentido de las agujas del reloj o al revés, pero tiene que haber un orden. Por lo cual, no puedo utilizar una estructura no lógica. Yo os propongo, por ejemplo, utilizar siempre el sentido horario. Otro ejemplo que os quiero proponer son las malas prácticas de gráficos de lineas. Aquí vemos que es bastante imposible entender los valores que nos están poniendo. ¿Qué buenas prácticas tenemos en las gráficas de líneas? En este caso estamos hablando de empezar los ejes a cero, correctamente. Segundo, no poner más de cuatro valores, más de cuatro líneas, porque visualmente después no podremos comprender. Tercero, utilizar formas sólidas, no utilizar formas discontinuas. Cuarto, etiquetar siempre las líneas las categorías al final de la línea. En este caso, la leyenda abajo los hace un segundo nivel de lectura, por lo cual es má fácil cuando acabamos de ver la línea ver la categoría, la etiqueta. Y cuarto, utilizar el grosor adecuado. Si yo cojo y el eje de las equis lo pongo a cien cuando el valor máximo es diez, va a quedar muy comprimida, con lo cual, estoy como falseando la realidad. Malas prácticas en gráficas de dispersión. Aquí tenéis una gráfica en la que tiene salinidad y temperatura y habéis visto que aquí no hay facilidad de comprensión. Entonces, lo que os propongo son algunos tips. En este caso, el primero sería utilizar los ejes correctamente, siempre a cero. Segundo, codificar algún valor más de los dos valores de la dispersión. Tercero sería utilizar líneas de tendencia, en este caso que nos muestren las tendencias Y cuarto, no utilizar más de dos líneas de tendencia. Fijaos que cuando ponemos cuatro líneas you es más difícil para el ojo discernir y comprender. Y el siguiente mala praxis que os quiero explicar serían los mapas. Fijaos en este mapa que está hablando sobre la distribución en este caso de las leyes de marihuana en Estados Unidos, fijaos que es muy difícil comprender porque nos están codificando muchísima información en un solo mapa, nos hacen hacer mucho trabajo. Aquí tenemos una leyenda sobre el tema del cultivo, aquí tenemos un mapa con el tema de posesión, aquí tenemos unos iconos misceláneos. Es decir, fijaos que lo que queremos hacer es comparar entre los diversos estados y nos están poniendo como muchas pistas visuales que tenemos que leer, identificar, memorizar, y es muy difícil que acabemos sacando la comprensión de lo que queremos. Los buenos tips que os estoy ofreciendo con los mapas, primero, si por ejemplo no poner etiquetas redundantes. Si you sabemos que esta zona por ejemplo es California no hace falta poner las iniciales. Segundo, utilizar colores consistentes. Evidentemente, un degradado de color facilita más la comprensión que unos colores aleatoriamente. Tercero, marcar las áreas que son destacables por ejemplo con este rayado, más que dejarlas sin marcar. Y cuarto, utilizar digamos la leyenda de una forma coherente, en este caso, fijaos que los saltos no son correlativos. Aquí pongo 75, 81, 81, 82, por lo cual, no mantengo la misma distancia. Os propongo que siempre que hagamos esta leyenda en la cual tengamos valores, que tengan el mismo rango. Finalizado este bloque de buenas prácticas y malas prácticas, sobre todo con los gráficos, os voy a dar unos consejos, unas buenas praxis a la hora de visualizar. Primero, siempre priorizar la funcionalidad versus la estética. Que sea bonito y que sea entendedor sería lo ideal, pero fijaos en el gráfico de la izquierda, en el cual estamos comparando Facebook versus Twitter, Tenemos una gráfica así como de tarta irregular, en la cual hay muchos valores, en la cual hay muchas categorías. Es muy difícil percibir y comprender de una forma intuitiva, aunque visualmente es atractivo. Si vamos a la derecha, veremos que nos podría parecer inicialmente aburrido, porque son gráficas de barras y unas tablas, pero nos permite comprender con máximo detalle. El siguiente caso es representar versus narrativa. Lo importante es que aquí yo por ejemplo tenéis un caso en el que estoy representando cuando rompen las parejas durante un año, que es una gráfica de líneas, es una gráfica de serie temporal. Inicialmente parece correcta, pero fijaos lo diferente que es cuando yo le pongo narrativa, cuando realmente explico el porqué, el contexto, de estos picos o esto valles dentro de la gráfica. Por ejemplo, podemos ver aquí que en Navidades pues las rupturas no son muy amplias, quiere decir que la familia está reunida, por lo cual las decisiones se toman posteriormente. Interesante es entender el proceso de cómo visualizar los datos. ¿Es interesante para visualizar datos conocer todo el proceso? Primero adquirimos estos datos, después los parseamos, entendido el parsear como estructurar esos datos y analizarlos, posteriormente los filtramos. Finalmente, en el paso del medio lo que haríamos sería una minería, que es una extracción y transformación de esos datos, los representamos gráficamente, los refinamos, una gráfica no queda nada más con poner los datos en una herramienta y generar la gráfica, sino que hay que hacer un paso de refinado visual, y, finalmente, interactuamos con esos datos. Hay algunos pasos que fijaos que la representación y la adquisición están ligados, por lo cual, yo puedo adquirir más datos para representarlos con más precisión. La representación y el filtrado también están ligados, estos pasos pueden ser recursivos. Y la interacción y la minería también, en este caso, fijaos en pasos que suelen ser bastante cíclicos. Modas y funciones, eso es interesante entender qué modos y funciones tenemos en la visualización de datos. Principalmente, recordad que hay dos partes: una parte más explicativa y una parte más explorativa. En la parte explicativa la historia está guiada por el autor. Aquí estaría dentro del rango que hemos comentado en anteriores módulos de la infografía, en la parte más de presentar más, de explicar una historia. Por lo cual, fijaos que la manipulación que puede hacer el lector es más indirecta o directa. Una parte directa sería el scroll telling, simplemente hacer scroll en esa presentación, o si estamos hablando de un vídeo o de una presentación simple es ir paso a paso, es más secuencial. Si nos vamos al mundo más visualización pura y dura, es explorativo, la historia no me la cuentan, la historia la descure el usuario realmente a la hora de explorar esos datos. Entonces, aquí tendremos unos criterios de manipulación indirecta con un filtrado, con una búsqueda de ciertos valores, o más un filtrado a través de manipulación directa, como puede ser una selección o un zoom y pam sobre una gráfica o un mapa en este caso. Un tema importante es el tema del ratio tinta. El ratio tinta es una teoría en la cual lo que hace es enfatizar de tener el mínimo número de tinta, o en este caso el menor número de píxeles, para representar el máximo número de información. Fijaos en la gráfica de la izquierda, en la cual tenemos una gráfica que nos presenta las calorías de diferentes tipos de comidas en el cual hay muchos componentes que decoran. Fijaos el trabajo final de esa misma gráfica representada teniendo en cuenta la teoría de ratio tinta, en la cual hemos eliminado el fondo, hemos eliminado los marcos, hemos consolidado colores, hemos destacado la barra que realmente nos aporta más valor y, finalmente, hemos etiquetado los valores de las barras dentro. Resumiendo, hay que quitar todo lo que sea posible: fondos, marcos, negritas. Etiquetar dentro quitar las líneas de referencia y, siempre que podamos, destacar lo relevante. Por lo cual, fijaos que desde representar la gráfica a dejar la gráfica finalmente acabada es un proceso de refinado, limpieza y claridad visual. Y, para finalizar, tengo dos diapositivas en las cuales quiero explicaros visiones de lo que es visualizar. Visualizar también es personalizar, visualizar no solo es poner un conjunto de datos y un gran dashboard, sino es dar la posibilidad al usuario de identificarse con la gráfica. En este caso, fijaos que es una tabla, que es una tabla muy simple en la cual tenemos días y meses, y los datos que estamos representando son la frecuencia de cuando hay más nacimientos, en qué meses y en qué días determinados. Por lo cual, todos hemos nacido en un día determinado del año, por lo cual nos podemos identificar y personalizar. Cuando más cercano al usuario sea, mas facilidad de interactuar con esos datos, más facilidad de recepción y comprensión tendremos. Y la última diapositiva que os pongo es que visualizar también es analizar. En este caso, es una visualización que nos explica las películas más exitosas, en la cual nosotros podemos personalizar por diversos criterios: podemos personalizar por presupuestos, por géneros, podemos personalizar por el beneficio que ha generado ea película. Por lo cual, es una gráfica de dispersión, es una gráfica de burbujas en este caso, en la cual nos permite a nosotros ir a cada uno de lo detalles y combinar diversos filtros para ir a diversos enfoques de los datos. Pues hasta aquí el módulo de buenas y malas prácticas. [MÚSICA]