[MUSIC] Hola. En esta segunda lección vamos a hablar sobre las correlaciones. ¿Qué es una correlación? Si vamos al Diccionario de la lengua española, y hacemos publicidad no voluntaria de una captura que hemos hecho de su página electrónica, podemos ver la definición básica que es la correspondencia o relación recíproca entre dos o más cosas o series de cosas. En el entorno más económico, de las matemáticas, es la medida de la dependencia existente entre variables aleatorias. De hecho, si vamos a ver una definición, incluso un poco más técnica, tampoco es tan complicado. Una correlación es una relación lineal entre variables cuantitativas. Es decir, tenemos un evento al cual definimos numéricamente, lo contamos, lo seccionamos, lo analizamos y obtenemos unos números de este evento. Tenemos otro evento que también tiene números, entonces lo que hacemos es ver que los números de este evento y los de este otro evento están relacionadas. Es decir, que hay una forma de conectar estos números con estos otros números. Normalmente, las correlaciones se utilizan en la explicación de fenómenos causales. Saber que de un punto vamos a otro punto, que si yo ingiero una cosa, sucede otra. A partir de aquí, tratamos de hacer estudios con muchas repeticiones o muchos datos de estos dos eventos, para ver si hay una conexión que sea evidente o no. ¿Qué sucede? Que las correlaciones se pueden establecer sobre cualquier cosa si uno tiene la capacidad de tener inventiva imaginación, e incluso mala voluntad en conectar el evento. Esto no quiere decir que una correlación a algo negativo, simplemente que las correlaciones tienen esta opción. Ejemplos de correlaciones complejas. Durante diversos años, hubo un estudiante de la Universidad de Harvard que, por hobby, y también en parte porque finalmente su trabajo ha tenido que ver con análisis estadístico. Se dedicaba a establecer divertidas correlaciones espurias entre diversos conjuntos de datos. Tal vez la más famosa es la que establece una unión causal entre la tasa de divorcio en Maine, en Estados Unidos [COUGH] relacionada con el consumo per capita de margarina. De manera que, sorprendentemente, parece que hubiera una relación entre los divorcios y el consumo de margarina, ¿no? Como si, por algún motivo oculto, se divorcian más cuanto más consumen y se divorcian menos cuanto menos se consume margarina. Como si llegara a una conclusión que la margarina contiene alguna sustancia o el hecho de consumir margarina tuviera una relación con los entornos en los cuales se producen, o no, los divorcios. De hecho, esto es una correlación espuria, una correlación totalmente falsa, pero que si sentamos los números en un entorno gráfico concreto y vemos estas uniones, podemos llegar de forma rápida y falsa a pensar que hay una relación causal entre estos dos elementos. Otro tipo de correlación que explica él en su web, habéis podido ver la diapositiva anterior. Podemos ver los gastos de Estados Unidos en ciencia y tecnología aeroespacial, correlacionados con los suicidios por ahorcamiento, estrangulación. Wow, hay una correlación muy directa de manera que uno podría pensar, ostras, en cuanto el gobierno gasta una cantidad de forma automática, más cantidad de gente se empieza a suicidar o empieza a morir por este tipo de causas. ¿Es cierto? No es cierto. El problema va a ser cómo vamos a poder discernir si esta correlación es correcta o no es correcta. Por ello es importante que cuando veamos datos, digamos estadística, digamos correlaciones pensemos en algunos elementos. Para empezar, tenemos que ser críticos con las correlaciones estadísticas. Además, tenemos que pensar en cuáles podrían ser los mecanismos causales que hay detrás de este posible evento, para compensar si es una conexión que no habíamos pensado. Y que es correcta, podría suceder, no sería la primera vez, o si por contrario, en realidad, lo que sucede es que estamos ante un hecho fortuito que puede ser manipulado para que arroje unas coincidencias que no son tales. Pero si fuéramos crédulos podríamos caer en esto. Por tanto, tenemos también que pensar quién y por qué ha analizado estos datos, es decir, cuáles son las fuentes, cuáles son los expertos. No se trata de entrar en la teoría de la conspiración constante pero tenemos que entender por qué se hacen las investigaciones. Nunca se hacen porque si hay unos motivos de tipo epistemológico, económico, político, cultural que determina qué estudios se hacen o no. Y al fin y al cabo, un gráfico que lo que hace es ilustrar de forma visual, agradable, grupos de datos numéricos que son mucho más abstractos y complejos de comprender. No es más que una simplificación visual de algo mucho más complejo. Por lo tanto, tenemos que pensar que esto tiene que ser puesto entre comillas, hasta una mayor explicación. Por lo tanto, podemos entender que existen correlaciones correctas, otras incorrectas. Por ello no tenemos que aceptar sin más cualquier dato que podamos entender, tenemos que recurrir a nuestro sentido común y a nuestra capacidad de entender y analizar los datos y, Querer ver e ir más allá, y confrontar las fuentes, es el gran beneficio y el gran problema de Internet. Cuando no eres un usuario experto y acabas entrando en temas que tal vez no controlas pero [COUGH] es interesante, por lo menos, intentarlo. Y al fin y al cabo, y con esto acabo, la visualización de datos es un proceso que realmente es necesario. Es muy complicado entender las cosas sin estos sistemas visuales, pero al mismo tiempo implican una redención, una idealización. Y jugando con el tipo de diseño, los colores, los gráficos, las distancias, es posible acomodar las mentes de las personas que están recibiendo esta información a lo que nosotros queremos. Tenéis diversas referencias disponibles. Muchas gracias y hasta la próxima clase, adiós.