De forma geral, os pipelines de dados se enquadram em um dos seguintes modelos: extrair-carregar, extrair-carregar-transformar ou extrair-transformar-carregar. Neste curso, descrevemos qual modelo deve ser usado e quando usá-lo para os dados em lote. Também tratamos de diversas tecnologias de transformação de dados disponíveis no Google Cloud Platform, como o BigQuery, a execução do Spark no Cloud Dataproc, os gráficos de pipeline no Cloud Data Fusion e o processamento de dados sem servidor com o Cloud Dataflow. Na atividade prática do Qwiklabs, os participantes criarão componentes de pipeline de dados no Google Cloud Platform.
Este curso forma parte de Programa especializado: Data Engineer, Big Data and ML on Google Cloud em Português
ofrecido por
Acerca de este Curso
ofrecido por

Google Cloud
We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success.
Programa - Qué aprenderás en este curso
Introdução
Neste módulo, apresentaremos o curso e a programação
Introdução aos pipelines de dados em lote
Neste módulo, falaremos sobre os diferentes métodos de carregamento de dados: EL, ELT e ETL, e quando usar cada um deles
Como executar o Spark no Cloud Dataproc
Neste módulo, mostraremos como executar o Hadoop no Cloud Dataproc, como usar o GCS e como otimizar seus jobs do Dataproc
Gerencie pipelines de dados com o Cloud Data Fusion e o Cloud Composer
Neste módulo, mostraremos como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
Processamento de dados sem servidor com o Cloud Dataflow
Neste módulo, explicaremos como usar o Cloud Dataflow para criar pipelines de processamento de dados
Resumo
Neste módulo, revisaremos os temas abordados no curso
Reseñas
- 5 stars78,57 %
- 4 stars14,28 %
- 3 stars7,14 %
Principales reseñas sobre BUILDING BATCH DATA PIPELINES ON GCP EM PORTUGUÊS BRASILEIRO
Apresentação fantastica sobre as principais ferramentas para criação e gerenciamento de pipelines.
Acerca de Programa especializado: Data Engineer, Big Data and ML on Google Cloud em Português
Nesta especialização on-line intensiva de cinco semanas, os participantes terão uma introdução prática sobre como projetar e criar sistemas de processamento de dados no Google Cloud Platform. Por meio de uma combinação de apresentações, demonstrações e laboratórios práticos, os participantes aprenderão a projetar sistemas de processamento de dados, criar canais completos e análises de dados e desenvolver soluções de aprendizado de máquina. Neste curso, abordamos dados estruturados, não estruturados e de streaming.

Preguntas Frecuentes
¿Puedo acceder a una vista preliminar del curso antes de inscribirme?
¿Qué recibiré cuando me inscriba?
¿Cuándo recibiré mi Certificado de curso?
¿Por qué no puedo participar como oyente en este curso?
¿Hay ayuda económica disponible?
¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.