[MÚSICA] [MÚSICA] Durante esta semana hemos visto qué es el Big Data desde el punto de vista de modelo de datos y hemos visto a alto nivel la metodología de modelado de grandes volúmenes de información. En este video vamos a resumir de una forma muy breve todas las fases de esa metodología. Para empezar vamos a recordar Las V`s del Big Data, recordamos. Gracias a la evolución tecnológica podemos almacenar muchísima información, volumen. Además, podemos tratarla a mayor velocidad y también las comunicaciones han mejorado, por lo tanto, vemos velocidad dentro de los ordenadores y entre los ordenadores. Todo esto ha permitido ha permitido que tengamos muchísima variedad de información. Los retos que surgen del Big Data, pues hemos comentado que son, el valor, la veracidad, la visualización y la variabilidad. La metodología de procesamiento tiene cuatro componentes, la componente de negocio que engloba las dos primeras fases que son, la comprensión de negocio, la comprensión de datos y la última fase puesta en valor, la componente tecnológica que engloba la fase de plataforma tecnológica de despliegue, la componente científica que engloba las fases de tratamiento de datos y moderado, y por último la componente de comunicación que engloba la fase de presentación de resultados. La primera fase de comprensión de negocio, es muy importante que tengamos claro los cuatro objetivos. Primero, identificar el problema del negocio y el objetivo de negocio, después identificar las áreas implicadas, y por último trasladar el problema de negocio a un problema analítico. En la comprensión de datos partimos del folio en blanco y tenemos que identificar cuál es la información que nos gustaría disponer, cuál son las fuentes de información donde se encuentra esa información, qué información está disponible, cómo se relaciona esa información, y después cómo vamos a poder representar toda esa información. En la siguiente fase de plataforma tecnológica, tenemos que establecer cuáles son las componentes necesarias para poder capturar, almacenar, tratar, modelizar, y explotar todos esos datos. En la siguiente fase de tratamiento de datos, a partir de esas fuentes de información, vamos a tener que hacer una serie de tratamientos que nos permitan introducir esa información en el almacén de datos, hacer análisis y correcciones, y tratamientos para que tengamos toda la información resumida en un tablón de datos, lista y dispuesta para el modelado. En la fase modelado de datos, tenemos que hacer un primer tratamiento para construir el modelo analítico y después tendremos que evaluar; somos los analíticos, para elegir el modelo final, y conocer la capacidad predictiva de ese modelo. En la fase de presentación de resultados, cogeremos todos esos datos, todo ese conocimiento que hemos tenido del modelo y querremos presentarlo a los interlocutores en un formato adecuado y un lenguaje adecuado, trasladando lo importante más que lo interesante. En la fase de despliegue, tendremos que introducir nuestro modelo desde un punto de vista tecnológico en la arquitectura de la compañía para que se pueda operativizar y explotar de forma periódica el modelo que hemos construído. En la fase puesta en valor, tenemos que introducir nuestro modelo dentro de las operaciones de la compañía, trasladando ese conocimiento que nos da el modelo a las distintas aplicaciones que puede tener dentro de la compañía, o bien toma de decisiones, o bien campañas, o bien decisiones autónomas. Y por último, es muy importante,me quedo con una frase de Walter Edwards Deming que decía; que sin datos, no eras más que una persona con una opinión. Es muy importante que tengamos claro que las compañías tienen que basarse en sus decisiones en datos, tienen que convertirse en compañías Data Driven. [MÚSICA] [MÚSICA]