Sobre o curso
Este curso gratuito da Databricks ensina a otimizar o desempenho de códigos na plataforma Databricks. É abordado o uso de recursos para melhoria da performance de aplicações e análises que utilizam grandes volumes de dados.nnNo curso, você aprenderá a executar tarefas de desenvolvimento de código no Databricks, como criar clusters e usar notebooks. Será capaz de extrair dados de diversas fontes, aplicar transformações para limpar, remodelar e manipular dados complexos com funções avançadas de PySpark. Adicionalmente, você irá trabalhar com o Delta Lake para criar tabelas, realizar atualizações e restaurar versões anteriores.nnEste curso oferece a oportunidade de desenvolver habilidades com Databricks e PySpark, que são essenciais para otimização de performance em dados e inteligência artificial.
Ao longo do curso você vai aprender:
- Capacidade de executar tarefas básicas de desenvolvimento de código utilizando Databricks (criar clusters, executar código em notebooks, utilizar operações básicas de notebook, importar repositórios do Git, etc.)
- Experiência intermediária em programação com o PySpark, como extrair dados de diversas fontes de dados em formatos de ficheiro, aplicar várias transformações comuns para limpar dados e remodelar e manipular dados complexos utilizando funções avançadas integradas.
- Experiência intermediária em programação com Delta Lake (criar tabelas, realizar atualizações completas e incrementais, comprimir ficheiros, restaurar versões anteriores, etc.)
Sobre a Databricks