Os pipelines de dados geralmente se encaixam em um dos três paradigmas: extração-carregamento, extração-carregamento-transformação ou extração-transformação-carregamento. Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
Este curso forma parte de Programa especializado: Data Engineer, Big Data and ML on Google Cloud em Português
Ofrecido Por
Acerca de este Curso
Qué aprenderás
Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL (e quando cada um deve ser usado)
Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc
Usar o Dataflow para criar pipelines de processamento de dados
Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer
Ofrecido por
Programa - Qué aprenderás en este curso
Introdução
Introdução à criação de pipelines de dados em lote
Como executar o Spark no Dataproc
Processamento de dados sem servidor com o Dataflow
Reseñas
- 5 stars78,57 %
- 4 stars14,28 %
- 3 stars7,14 %
Principales reseñas sobre BUILDING BATCH DATA PIPELINES ON GCP EM PORTUGUÊS BRASILEIRO
Apresentação fantastica sobre as principais ferramentas para criação e gerenciamento de pipelines.
Acerca de Programa especializado: Data Engineer, Big Data and ML on Google Cloud em Português

Preguntas Frecuentes
¿Puedo acceder a una vista preliminar del curso antes de inscribirme?
¿Qué recibiré cuando me inscriba?
¿Cuándo recibiré mi Certificado de curso?
¿Por qué no puedo participar como oyente en este curso?
¿Hay ayuda económica disponible?
¿Tienes más preguntas? Visita el Centro de Ayuda al Estudiante.