Acerca de este Curso
100 % en línea

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Nivel intermedio

Horas para completar

Aprox. 17 horas para completar

Sugerido: 8 horas semana en promedio...
Idiomas disponibles

Español (Spanish)

Subtítulos: Español (Spanish)...
100 % en línea

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Nivel intermedio

Horas para completar

Aprox. 17 horas para completar

Sugerido: 8 horas semana en promedio...
Idiomas disponibles

Español (Spanish)

Subtítulos: Español (Spanish)...

Programa - Qué aprenderás en este curso

Semana
1
Horas para completar
1 hora para completar

INTRODUCCIÓN

...
Reading
1 video (Total: 3 min), 8 readings
Reading8 lecturas
BIENVENIDA1m
Contenidos del curso (Temario)3m
Organización del curso y evaluación7m
Sobre el certificado2m
FAQs - Generales10m
FAQs - Cuestionarios y ejercicios2m
FAQs - Certificado10m
Links relacionados2m
Horas para completar
1 hora para completar

LA MÁQUINA VIRTUAL

A lo largo de estos cursos vamos a trabajar con un conjunto de herramientas contenidas en la máquina virtual Cloudera. En este apartado te explicamos cómo descargar e instalar dicha máquina virtual en tu ordenador. <br><br>La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco. <br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>...
Reading
4 videos (Total: 16 min), 4 readings
Video4 videos
Instalación de la máquina virtual - Import start4m
Instalación de la máquina virtual - Tips3m
Instalación de la máquina virtual - Pyspark setup4m
Reading4 lecturas
Link para la descarga de la MV_Cloudera20m
Instalación de la MV - Import start20m
Instalación de la MV - Tips10m
Instalación de la MV - Pyspark set up10m
Horas para completar
2 horas para completar

MÓDULO 1 - Introducción al ecosistema Apache Hadoop

En este módulo se van a introducir los conceptos básicos sobre el uso de Apache Hadoop y su utilización para plantear análisis de grandes conjuntos de datos. Se van a presentar las herramientas principales y la arquitectura del sistema.<br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza el ejercicio práctico sobre Hadoop y HDFS, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
7 videos (Total: 55 min), 1 reading, 2 quizzes
Video7 videos
El ecosistema Hadoop11m
Modelo Map Reduce11m
HDFS: Hadoop Distributed File System7m
Arquitectura HDFS8m
YARN: Yet Another Resource Negotiator8m
HADOOP6m
Reading1 lectura
LEEME10m
Quiz2 ejercicios de práctica
Cuestionario ecosistema Hadoop20m
Ejercicio práctico Hadoop y HDFS30m
Semana
2
Horas para completar
2 horas para completar

MÓDULO 2 - Tecnologías SQL y NoSQL. Consistencia, fiabilidad y escalabilidad

En este módulo se introducen conceptos básicos sobre la naturaleza de los datos a tratar y de qué forma los sistemas NoSQL se diferencian de las bases de datos relacionales. Se presenta el teorema CAP y se muestra su importancia en el contexto de los sistemas distribuidos. Finalmente, se muestran una serie de sistemas junto con su uso en la industria actual. <br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
7 videos (Total: 76 min), 1 quiz
Video7 videos
Tipos de datos8m
Tecnologías SQL y NoSQL12m
Consistencia, fiabilidad y escalabilidad7m
Tecnologías de BBDD NoSQL I11m
Tecnologías de BBDD NoSQL II22m
Introducción a BBDD analíticas y orientadas a grafos12m
Quiz1 ejercicio de práctica
Bases de datos NoSQL18m
Semana
3
Horas para completar
2 horas para completar

MÓDULO 3 - Adquisición de datos

En este módulo se presentan los desafíos que hay que resolver a la hora de incorporar datos a los sistemas NoSQL y una breve introducción a las herramientas asociadas al ecosistema Hadoop más importantes. <br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza el ejercicio práctico sobre Apache Scoop, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
6 videos (Total: 44 min), 1 reading, 2 quizzes
Video6 videos
Adquisición de datos13m
Apache Flume6m
Apache Sqoop6m
Apache Kafka7m
SQOOP7m
Reading1 lectura
LEEME10m
Quiz2 ejercicios de práctica
Adquisición de datos18m
Ejercicio práctico Apache Sqoop20m
Semana
4
Horas para completar
3 horas para completar

MÓDULO 4 - Herramientas para el análisis de datos industrial

En este módulo se presenta el análisis industrial de grandes volúmenes de datos y se introducen una serie de herramientas y sistemas de segunda generación dedicados a resolver necesidades específicas de la industria.<br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza los ejercicios prácticos sobre Apache Hive y Sparck, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total: 102 min), 1 reading, 3 quizzes
Video10 videos
Bases de datos analíticas10m
Business Intelligence14m
Apache Impala8m
Apache Hive11m
Apache Spark14m
Graph processing (I)11m
Graph processing (II)13m
HIVE6m
SPARK8m
Reading1 lectura
LEEME10m
Quiz3 ejercicios de práctica
Bases de datos analíticas18m
Ejercicio Apache Hive6m
Ejercicio sesión básica con Apache Spark30m

Instructores

Avatar

Antonio Espinosa

Profesor Agregado Interino
Departamento de Arquitectura de Computadores y Sistemas Operativos
Avatar

Tomás Margalef

Catedrático
Dept. de Arquitectura de Computadores y Sistemas Operativos
Avatar

Andrés Cencerrado

Profesor
Área de Arquitectura y de Tecnología de Computadores

Acerca de Universitat Autònoma de Barcelona

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

Acerca del programa especializado Big Data – Introducción al uso práctico de datos masivos

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

Preguntas Frecuentes

  • Una vez que te inscribes para obtener un Certificado, tendrás acceso a todos los videos, cuestionarios y tareas de programación (si corresponde). Las tareas calificadas por compañeros solo pueden enviarse y revisarse una vez que haya comenzado tu sesión. Si eliges explorar el curso sin comprarlo, es posible que no puedas acceder a determinadas tareas.

  • Cuando te inscribes en un curso, obtienes acceso a todos los cursos que forman parte del Programa especializado y te darán un Certificado cuando completes el trabajo. Se añadirá tu Certificado electrónico a la página Logros. Desde allí, puedes imprimir tu Certificado o añadirlo a tu perfil de LinkedIn. Si solo quieres leer y visualizar el contenido del curso, puedes auditar el curso sin costo.

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.