Acerca de este Curso

66,079 vistas recientes
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio
Aprox. 13 horas para completar
Inglés (English)
Subtítulos: Inglés (English)

Qué aprenderás

  • U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Use Spark UI to analyze performance and identify bottlenecks

  • Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • B​uild a linear regression model and make predictions using SparkSQL

Habilidades que obtendrás

Data ScienceApache SparkSQL
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio
Aprox. 13 horas para completar
Inglés (English)
Subtítulos: Inglés (English)

ofrecido por

Logotipo de Universidad de California, Davis

Universidad de California, Davis

Programa - Qué aprenderás en este curso

Semana
1

Semana 1

3 horas para completar

Introduction to Spark

3 horas para completar
6 videos (Total 32 minutos), 3 lecturas, 2 cuestionarios
6 videos
Why Distributed Computing?7m
Spark DataFrames6m
The Databricks Environment8m
SQL in Notebooks3m
Import Data2m
3 lecturas
A Note From UC Davis10m
Readings and Resources40m
Assignment #1 - Queries in Spark SQL30m
2 ejercicios de práctica
Assignment #1 Quiz - Queries in Spark SQL30m
Module 1 Quiz30m
Semana
2

Semana 2

2 horas para completar

Spark Core Concepts

2 horas para completar
6 videos (Total 25 minutos), 2 lecturas, 2 cuestionarios
6 videos
Spark Terminology3m
Caching5m
Shuffle Partitions7m
Spark UI3m
Broadcast Joins3m
2 lecturas
Readings30m
Assignment #2 - Spark Internals30m
2 ejercicios de práctica
Assignment #2 Quiz - Spark Internals30m
Module 2 Quiz30m
Semana
3

Semana 3

3 horas para completar

Engineering Data Pipelines

3 horas para completar
7 videos (Total 43 minutos), 2 lecturas, 2 cuestionarios
7 videos
Spark as a Connector6m
Accessing Data10m
File Formats8m
Schemas and Types4m
Writing Data6m
Managed and Unmanaged Tables4m
2 lecturas
Readings1h
Assignment #3 - Engineering Data Pipelines30m
2 ejercicios de práctica
Assignment #3 Quiz - Engineering Data Pipelines30m
Module 3 Quiz30m
Semana
4

Semana 4

5 horas para completar

Machine Learning Applications of Spark

5 horas para completar
7 videos (Total 35 minutos), 2 lecturas, 3 cuestionarios
7 videos
Applications of Machine Learning4m
Machine Learning Fundamentals6m
Linear Regression6m
Training Linear Regression Model8m
Applying Machine Learning with UDFs4m
Course Summary3m
2 lecturas
Readings1h
Assignment #4 - Logistic Regression Classifier10m
2 ejercicios de práctica
Assignment #4 Quiz - Logistic Regression Classifier30m
Module 4 Quiz30m

Revisiones

Principales revisiones sobre DISTRIBUTED COMPUTING WITH SPARK SQL

Ver todos los comentarios

Acerca de Programa especializado: Learn SQL Basics for Data Science

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

Preguntas Frecuentes

  • Access to lectures and assignments depends on your type of enrollment. If you take a course in audit mode, you will be able to see most course materials for free. To access graded assignments and to earn a Certificate, you will need to purchase the Certificate experience, during or after your audit. If you don't see the audit option:

    • The course may not offer an audit option. You can try a Free Trial instead, or apply for Financial Aid.
    • The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
  • Cuando te inscribes en un curso, obtienes acceso a todos los cursos que forman parte del Programa especializado y te darán un Certificado cuando completes el trabajo. Se añadirá tu Certificado electrónico a la página Logros. Desde allí, puedes imprimir tu Certificado o añadirlo a tu perfil de LinkedIn. Si solo quieres leer y visualizar el contenido del curso, puedes auditar el curso sin costo.

  • Si estás suscrito, obtienes una prueba gratis de 7 días, que podrás cancelar cuando desees sin ningún tipo de penalidad. Una vez transcurrido ese tiempo, no realizamos reembolsos. No obstante, puedes cancelar tu suscripción cuando quieras. Consulta nuestra política completa de reembolsos.

  • Sí, Coursera ofrece ayuda económica a los estudiantes que no pueden pagar la tarifa. Solicítala haciendo clic en el enlace de Ayuda económica que está debajo del botón “Inscribirse” a la izquierda. Se te pedirá que completes una solicitud. Recibirás una notificación en caso de que se apruebe. Deberás completar este paso para cada uno de los cursos que forman parte del Programa especializado, incluido el proyecto final. Obtén más información.

  • Este Curso no otorga crédito universitario, pero algunas universidades pueden aceptar los Certificados del curso para obtener crédito. Consulta con tu institución para obtener más información. Los Títulos en línea y los Certificados Mastertrack™ de Coursera brindan la oportunidad de obtener créditos universitarios.

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.