Acerca de este Curso
10,737 vistas recientes

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.

Nivel intermedio

Aprox. 16 horas para completar

Sugerido: 4 weeks of study, 2-5 hours/week...

Inglés (English)

Subtítulos: Inglés (English)

Qué aprenderás

  • Check

    U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Check

    Use Spark UI to analyze performance and identify bottlenecks

  • Check

    Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • Check

    B​uild a linear regression model and make predictions using SparkSQL

Habilidades que obtendrás

Data ScienceApache SparkSQL

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.

Nivel intermedio

Aprox. 16 horas para completar

Sugerido: 4 weeks of study, 2-5 hours/week...

Inglés (English)

Subtítulos: Inglés (English)

Programa - Qué aprenderás en este curso

Semana
1
3 horas para completar

Introduction to Spark

6 videos (Total 32 minutos), 3 lecturas, 2 cuestionarios
6 videos
Why Distributed Computing?7m
Spark DataFrames6m
The Databricks Environment8m
SQL in Notebooks3m
Import Data2m
3 lecturas
A Note From UC Davis10m
Readings and Resources40m
Assignment #1 - Queries in Spark SQL30m
2 ejercicios de práctica
Assignment #1 Quiz - Queries in Spark SQL30m
Module 1 Quiz30m
Semana
2
2 horas para completar

Spark Core Concepts

6 videos (Total 25 minutos), 2 lecturas, 2 cuestionarios
6 videos
Spark Terminology3m
Caching5m
Shuffle Partitions7m
Spark UI3m
Broadcast Joins3m
2 lecturas
Readings30m
Assignment #2 - Spark Internals30m
2 ejercicios de práctica
Assignment #2 Quiz - Spark Internals30m
Module 2 Quiz30m
Semana
3
3 horas para completar

Engineering Data Pipelines

7 videos (Total 43 minutos), 2 lecturas, 2 cuestionarios
7 videos
Spark as a Connector6m
Accessing Data10m
File Formats8m
Schemas and Types4m
Writing Data6m
Managed and Unmanaged Tables4m
2 lecturas
Readings20m
Assignment #3 - Engineering Data Pipelines30m
2 ejercicios de práctica
Assignment #3 Quiz - Engineering Data Pipelines30m
Module 3 Quiz30m
Semana
4
4 horas para completar

Machine Learning Applications of Spark

7 videos (Total 35 minutos), 2 lecturas, 3 cuestionarios
7 videos
Applications of Machine Learning4m
Machine Learning Fundamentals6m
Linear Regression6m
Training Linear Regression Model8m
Applying Machine Learning with UDFs4m
Course Summary3m
2 lecturas
Readings20m
Assignment #4 - Logistic Regression Classifier10m
2 ejercicios de práctica
Assignment #4 Quiz - Logistic Regression Classifier30m
Module 4 Quiz30m

Instructores

Avatar

Brooke Wenig

Machine Learning Practice Lead at Databricks
Continuing and Professional Education
Avatar

Conor Murphy

Data Scientist at Databricks
Continuing and Professional Education

Acerca de Universidad de California, Davis

UC Davis, one of the nation’s top-ranked research universities, is a global leader in agriculture, veterinary medicine, sustainability, environmental and biological sciences, and technology. With four colleges and six professional schools, UC Davis and its students and alumni are known for their academic excellence, meaningful public service and profound international impact....

Acerca de Programa especializado Learn SQL Basics for Data Science

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

Preguntas Frecuentes

  • Una vez que te inscribes para obtener un Certificado, tendrás acceso a todos los videos, cuestionarios y tareas de programación (si corresponde). Las tareas calificadas por compañeros solo pueden enviarse y revisarse una vez que haya comenzado tu sesión. Si eliges explorar el curso sin comprarlo, es posible que no puedas acceder a determinadas tareas.

  • Cuando te inscribes en un curso, obtienes acceso a todos los cursos que forman parte del Programa especializado y te darán un Certificado cuando completes el trabajo. Se añadirá tu Certificado electrónico a la página Logros. Desde allí, puedes imprimir tu Certificado o añadirlo a tu perfil de LinkedIn. Si solo quieres leer y visualizar el contenido del curso, puedes auditar el curso sin costo.

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.