Acerca de este Curso
5.0
1 calificaciones
100 % en línea

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Nivel intermedio

Horas para completar

Aprox. 16 horas para completar

Sugerido: Se estima una dedicación de 6 a 8 horas por semana....
Idiomas disponibles

Español (Spanish)

Subtítulos: Español (Spanish)...
100 % en línea

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Nivel intermedio

Horas para completar

Aprox. 16 horas para completar

Sugerido: Se estima una dedicación de 6 a 8 horas por semana....
Idiomas disponibles

Español (Spanish)

Subtítulos: Español (Spanish)...

Programa - Qué aprenderás en este curso

Semana
1
Horas para completar
1 hora para completar

INTRODUCCIÓN

...
Reading
2 videos (Total: 10 min), 8 readings
Video2 videos
Presentación del curso6m
Reading8 lecturas
Bienvenida1m
Contenidos del curso (Temario)1m
Organización del curso y evaluación5m
Sobre el certificado2m
FAQs - Generales10m
FAQs - Cuestionarios y ejercicios2m
FAQs - Certificado10m
Enlaces relacionados1m
Horas para completar
1 hora para completar

LA MÁQUINA VIRTUAL

<b>ATENCIÓN: Si ya te instalaste la máquina virtual en el curso anterior de la Especialización no es necesario que vuelvas a hacerlo. En caso contrario, sigue leyendo.</b><br><br>Los ejercicios y sesiones prácticas pretenden mostrar un caso práctico de procesamiento y análisis de datos en el contexto de Big Data. En este sentido, será necesario trabajar con una máquina virtual que ya trae configuradas e instaladas una serie de componentes habituales al manejar Big Data. En este apartado te explicamos cómo descargar e instalar la máquina virtual Cloudera en tu ordenador. La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco.<br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>...
Reading
4 videos (Total: 16 min), 4 readings
Video4 videos
Instalación de la máquina virtual - Import start4m
Instalación de la máquina virtual - Tips3m
Instalación de la máquina virtual - Pyspark setup4m
Reading4 lecturas
Link para la descarga de la MV_Cloudera10m
Instalación de la MV - Import start10m
Instalación de la MV - Tips10m
Instalación de la MV - Pyspark setup10m
Horas para completar
2 minutos para completar

MATERIAL DE PRÁCTICAS Y FICHEROS DE TRABAJO

Para poder seguir la parte aplicada del curso, responder a los cuestionarios y trabajar con las herramientas que te explicamos, necesitarás acceder a una serie de ficheros de código, así como las bases de datos de trabajo, que hemos recopilado y comprimido. Verás que algunos vídeos llevan un código entre paréntesis que coincide con el nombre de alguno de estos ficheros. Esto significa que en el vídeo correspondiente se trabaja con dicho fichero. <br><br>A continuación te explicamos como incorporarlos en la máquina virtual....
Reading
2 readings
Reading2 lecturas
FICHEROS DE TRABAJO Y PAQUETES - IMPORTANTE1m
INICIO DE LA SESIÓN - IMPORTANTE1m
Horas para completar
2 horas para completar

MÓDULO 1 - Análisis Exploratorio de Datos

Durante la primera semana del curso se introducen el curso y las herramientas que se emplearán. Además también se presentan las tareas relacionadas con el Análisis Exploratorio de Datos. Cada pocos temas tratados en los vídeos encontrarás un pequeño custionario de 5 preguntas. <br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total: 84 min), 6 quizzes
Video10 videos
Datos - Fuentes de información4m
Distintos problemas y técnicas8m
Caso de estudio y herramientas4m
Introducción a Jupyter Notebook y Pyspark (S1E4.ipynb)5m
Exploración de la estructura de datos (S1E5.ipynb)14m
Primera etapa del análisis exploratorio (S1E6.ipynb)11m
Preproceso de datos (I) - (S1E7.ipynb)11m
Preproceso de datos (II) - (S1E8.ipynb)6m
Segunda etapa del análisis exploratorio (S1E9.ipynb)14m
Quiz6 ejercicios de práctica
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Semana
2
Horas para completar
3 horas para completar

MÓDULO 2 - MODELOS DE REGRESIÓN

En el módulo 2 del curso se introducen conceptos de modelización generales (calibración y validación) y en particular los modelos de regresión lineal y regresión logística. Desde la perspectiva de Big Data, se incluyen aspectos relacionados con la regularización de los modelos para su simplificación. <br><br><i>Como en el módulo anterior, visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total: 89 min), 7 quizzes
Video10 videos
Objetivo de la Modelización8m
Calibración del modelo10m
Resultado de la Modelización11m
Regresión Simple (S2E4.ipynb)11m
Nuevas variables (S2E5.ipynb)8m
Regresión Múltiple (I) (S2E6.ipynb)7m
Regresión Múltiple (II) (S2E7.ipynb)11m
Regresión Logística (I) (S2E8.ipynb)8m
Regresión Logística (II) (S2E9.ipynb)10m
Quiz7 ejercicios de práctica
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario 710m
Semana
3
Horas para completar
3 horas para completar

MÓDULO 3 - ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN

En el módulo 3 del curso se introduce la família de modelos basada en árboles (clasificación, regresión, bosques) y aspectos generales sobre la incertidumbre y el sobreajuste. Después de cada tema, o de unos pocos temas, encontrarás un cuestionario para comprobar tu nivel de comprensión de los mismos.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total: 89 min), 7 quizzes
Video10 videos
Introducción a la Modelización5m
Medir la Incertidumbre10m
Concepto de Árbol8m
Árboles de Regresión11m
Modelización con Árboles de Regresión (S3E5.ipynb)9m
Árboles de Clasificación9m
Modelización con Árboles de Clasificación (S3E7.ipynb)9m
Bosques Aleatorios14m
Modelización con Bosques Aleatorios (S3E9.ipynb)9m
Quiz7 ejercicios de práctica
Cuestionario 18m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario 710m
Semana
4
Horas para completar
3 horas para completar

MÓDULO 4 - REDES NEURONALES Y TÉCNICAS NO SUPERVISADAS

En el módulo 4 del curso se introduce la família de modelos basada en redes neuronales así como se introducen las técnicas básicas no supervisadas, tanto de clasificación automática como de reducción de la dimensionalidad. En este módulo, además de los cuestionarios convencionales, tendrás que realizar un trabajo práctico en el que trabajarás las técnicas aprendidas hasta el momento.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, realiza el ejercicios práctico, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total: 75 min), 1 reading, 7 quizzes
Video10 videos
Redes Neuronales12m
Modelización con redes neuronales (S4E2.ipynb)6m
Introducción al reconocimiento de patrones5m
Reducción dimensión11m
Análisis de componentes principales (S4E6.ipynb)10m
Clasificación automática8m
Análisis de clústers (S4E8.ipynb)7m
Revisión de la ciencia de datos (I)5m
Revisión de la ciencia de datos (II)6m
Reading1 lectura
TRABAJO PRÁCTICO - Enunciado30m
Quiz7 ejercicios de práctica
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario del Ejercicio Práctico30m

Instructores

Avatar

Llorenç Badiella

Director Servei d'Estadística Aplicada UAB
Universitat Autònoma de Barcelona
Avatar

Isabel Serra

Doctora
Centre de Recerca Matemàtica

Acerca de Universitat Autònoma de Barcelona

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

Acerca del programa especializado Big Data – Introducción al uso práctico de datos masivos

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

Preguntas Frecuentes

  • Una vez que te inscribes para obtener un Certificado, tendrás acceso a todos los videos, cuestionarios y tareas de programación (si corresponde). Las tareas calificadas por compañeros solo pueden enviarse y revisarse una vez que haya comenzado tu sesión. Si eliges explorar el curso sin comprarlo, es posible que no puedas acceder a determinadas tareas.

  • Cuando te inscribes en un curso, obtienes acceso a todos los cursos que forman parte del Programa especializado y te darán un Certificado cuando completes el trabajo. Se añadirá tu Certificado electrónico a la página Logros. Desde allí, puedes imprimir tu Certificado o añadirlo a tu perfil de LinkedIn. Si solo quieres leer y visualizar el contenido del curso, puedes auditar el curso sin costo.

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.