Buenos días, buenas tardes, buenas noches. Donde quiera que estén, sean bienvenidos a un capítulo más del Máster online de humanidades digitales. ¿Qué es el Big Data? Una definición estricta implica aquel conjunto de datos tan masivo, que no puede almacenarse en un solo disco duro. El problema de una definición así es que está a remolque de las capacidades tecnológicas del momento actual. Según la definición, en la época en que las informaciones digitales se almacenaban en un diskette, las obras completas de Shakespeare you serían Big Data. Y lo que ahora cabe en el disco duro de un portátil, la semana que viene podría almacenarse en una memoria flash oculta en un llavero. Entonces, una definición más interesante propone que Big Data son aquellos datos que, por su cantidad y complejidad, solo pueden analizarse mediante una computadora. Un humano sería incapaz de darle sentido a tal cantidad de datos. Y bien, pues este Big Data está presente en cada vez más facetas de nuestras vidas. La bioinformática usa complejas técnicas matemáticas para procesar Big Data de medicina y biología, y así descubrir nuevos tratamientos para enfermedades diferentes, extrañas, o entender mejor cómo las proteínas vienen codificadas en el genoma. Las altas finanzas, la física de partícula, las campañas políticas y de marketing, o la meteorología, por poner unos pocos ejemplos, usan de forma sistemática esos Big Data para construir modelos y llevar a cabo predicciones. Lo bueno es que el Big Data también puede ser muy relevante para las humanidades de muchas formas diferentes, pero que podríamos organizar en dos categorías clave. Por un lado, la reflexión, reflexionar sobre el Big Data y sus implicaciones. Como hemos dicho antes, cada vez confiamos más en el Big Data, y está presente en cada vez más facetas de nuestras vidas. Pero esas interacciones con el Big Data no son siempre inocuas. Tenemos, por un lado, problemas epistemológicos como, por ejemplo, hasta qué punto podemos confiar en un resultado experimental que un algoritmo ha conseguido procesando millones de datos en paralelo, como sucede actualmente en los aceleradores de partículas. Si un humano es incapaz de seguir ese proceso algorítmico, ¿cómo sabemos que es cierto? ¿Dejarán los científicos de hacer ciencia y dejarán el trabajo de construir hipótesis a las máquinas? También hay una gran cantidad de problemas asociados a cuestiones éticas. Facetas de nuestra personalidad como qué libros leemos, qué música nos gusta, cómo nos gustaría nuestra pareja ideal, eran hasta hace nada detalles íntimos de nuestras vidas, sobre los que teníamos un control prácticamente completo. Ahora, sin embargo, esos datos personales están almacenados en redes sociales como Facebook o Twitter, recopilados en aplicaciones que nos ofrecen música en streaming, o que nos ayudan en nuestra búsqueda de nuestra media naranja. Aquello que normalmente considerábamos privado, ha pasado a ser público, y tenemos que tomar medidas importantes para protegerlo de terceros intrusos. En capítulos futuros de este curso, exploraremos más en detalle las implicaciones epistemológicas y éticas del Big Data, porque, además de reflexionar sobre el Big Data, las humanidades también pueden usar el Big Data para construir modelos. Internet tiene millones de páginas web en centenares de idiomas diferentes, y eso es el sueño de un lingüista, que necesite un corpus amplio para establecer la funcionalidad de sus hipótesis de gramática, semántica, pragmática, de cualquier lengua. Esto ahora es muy accesible. Pero, sobre todo, el Big Data ofrece al investigador en humanidades, datos y más datos sobre cómo los humanos actuamos, planificamos y nos comunicamos. Pensemos en un investigador en ciencias políticas, por ejemplo. Hasta la revolución del Big Data, si esa persona quería obtener información sobre qué opinaban los ciudadanos sobre una determinada alcaldesa, un problema económico, o la manera en que los precios del alquiler están subiendo en una ciudad, la única forma de saberlo era haciendo encuestas. Bien. Pero las encuestas presentan problemas. Veamos unos cuantos. En primer lugar, una encuesta siempre nos da una muestra pequeña de la población. No es funcional preguntar a varios millones de personas qué opinan sobre un tema. Eso está claro. En segundo lugar, esto es más problemático, son datos que nos ofrecen de manera indirecta. Cuando votamos, llevamos a cabo una acción y es real; cuando nos preguntan qué vamos a votar, damos una información sobre una posible acción nuestra, que quizá luego la llevemos a cabo. Hay muchas maneras en que nuestra respuesta en una encuesta y nuestra acción real difieran. Quizás cambiamos de opinión al tener nueva información, o mentimos al entrevistador para quedar bien o confundirlo, las razones pueden ser infinitas. Todos estos problemas quedan minimizados con el Big Data. Las redes sociales nos ofrecen centenares de millones de acciones llevadas a cabo por millones de usuarios que, además, interactúan entre sí, y podemos ver cómo van cambiando a medida que nuevos fenómenos aparecen, surge nueva información, etcétera. Así, you no estamos tan limitados por el tamaño de la muestra, como en el caso de una encuesta, casi podríamos aspirar a tener la población completa. Pero, sobre todo, buena parte de los datos que nos ofrece las tecnologías digitales son sobre acciones y no sobre opiniones, de manera que son datos mucho más fiables que los obtenidos en una encuesta. Podemos mentir al entrevistador y decirle que nos encanta el cine clásico y los documentales de ciencia, pero nuestra historia de visionado en Netflix muestra que, muy a las claras, que nos pasamos el día mirando películas de superhéroes. Acciones versus opiniones. Las humanidades se están transformando completamente, gracias a estos Big Data, facilitando la creación de modelos y el desarrollo de predicciones sobre los hábitos sociales, culturales y políticos de la gente. Es un gran momento para ser investigador en humanidades. Buenos días, buenas tardes, buenas noches. Ha sido un placer, y hasta la próxima sesión. [AUDIO_EN_BLANCO]