En règle générale, les pipelines de données fonctionnent sur le modèle "Extraction et chargement" (EL), "Extraction, chargement et transformation" (ELT), ou "Extraction, transformation et chargement" (ETL). Dans ce cours, vous apprendrez où et quand appliquer ces différents modèles à des lots de données. Vous découvrirez également plusieurs technologies Google Cloud Platform permettant de transformer des données, y compris BigQuery, Spark exécuté sur Cloud Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement de données sans serveur avec Cloud Dataflow. Vous aurez en outre l'occasion de créer les composants d'un pipeline de données sur Google Cloud Platform dans le cadre d'un atelier pratique QwikLabs.
Este curso forma parte de Programa Especializado - Data Engineer, Big Data and ML on Google Cloud en Français
ofrecido por
Acerca de este Curso
ofrecido por

Google Cloud
We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success.
Programa - Qué aprenderás en este curso
Introduction
Dans ce module, nous présentons le cours et son programme.
Introduction aux pipelines de données par lots
Ce module présente les différentes méthodes de chargement de données (EL, ELT et ETL) et leurs cas d'utilisation.
Exécuter Spark sur Cloud Dataproc
Dans ce module, vous apprendrez à exécuter Hadoop sur Cloud Dataproc, à exploiter GCS et à optimiser vos tâches Dataproc.
Gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer
Dans ce module, vous apprendrez à gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer.
Traiter des données sans serveur avec Cloud Dataflow
Dans ce module, vous apprendrez à créer vos pipelines de traitement de données avec Cloud Dataflow.
Résumé
Ce module récapitule les sujets abordés dans ce cours.
Acerca de Programa especializado: Data Engineer, Big Data and ML on Google Cloud en Français
Cette formation de spécialisation en ligne d'une durée de cinq semaines présente en pratique comment concevoir et développer des systèmes de traitement des données sur Google Cloud. À travers un ensemble de présentations, de démonstrations et d'ateliers pratiques, les participants apprennent à concevoir des systèmes de traitement de données, à créer des pipelines de données de bout en bout, à analyser des données et à exécuter des tâches de machine learning.

Preguntas Frecuentes
¿Puedo acceder a una vista preliminar del curso antes de inscribirme?
¿Qué recibiré cuando me inscriba?
¿Cuándo recibiré mi Certificado de curso?
¿Por qué no puedo participar como oyente en este curso?
Is financial aid available?
¿Recibiré crédito universitario por completar el Curso?
¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.