Skip to content

orlandojsjunior/Engenharia_de_Dados-Pipeline_de_dados-Python_e_orientacao_a_objeto

Repository files navigation

A formação "Primeiros Passos com Engenharia de Dados" é voltada para iniciantes e busca prepará-los para os desafios profissionais da área, utilizando ferramentas essenciais como Python, SQL, NoSQL e Airflow.

Ferramentas e Tópicos Abordados:

  • Python: Construção de pipelines ETL (Extract, Transform, Load) e aplicação de Programação Orientada a Objetos (POO) para melhorar a legibilidade do código.

  • SQL e NoSQL: Compreensão das diferenças e conceitos fundamentais dos bancos de dados relacionais e não relacionais.

  • Airflow: Introdução ao gerenciamento de fluxos de dados, consolidando os conhecimentos adquiridos ao longo da formação.

Essa formação oferece uma base sólida em Engenharia de Dados, preparando os alunos para enfrentar desafios reais na área.

Principais tópicos o curso

  • Construa um pipeline de dados com Python
  • Refatore um código com orientação a objeto
  • Transforme dados utilizando apenas Python
  • Reconheça os benefícios de criar um pipeline reutilizável
  • Estruture códigos Python em funções

PRÉ-REQUISITOS PARA FAZER ESSA FORMAÇÃO

Para aproveitar melhor esse conteúdo, é importante que você já tenha conhecimento dos conceitos-chave do Python aplicados à área de Data Science de forma abrangente.

Jornada_em_Engenharia_de_dados

Passo a passo da Formação

1 - Python para Engenharia de Dados.

Neste passo inicial, o objetivo é que você se familiarize com a área da Engenharia de Dados, explorando o uso da linguagem Python e várias ferramentas de análise e gerenciamento de dados.

Na primeira etapa dessa jornada, você irá descobrir os fundamentos da Engenharia de Dados, aprenderá a importância de uma pessoa Engenheira de Dados no mundo atual, e como Python se aplica nesta área, aprendendo a criar seus próprios pipelines ETL.

Você também vai aprender a usar o WSL para executar programas e comandos Linux no Windows e a criar e gerenciar ambientes virtuais em Python. Além disso, terá uma introdução à Programação Orientada a Objetos (POO) e ao uso da biblioteca requests do Python para trabalhar com APIs. No final desta etapa, você será capaz de utilizar os principais recursos do Python para montar seus próprios pipelines e extrair, transformar e armazenar diferentes tipos de dados.

Próximos Passos

2 - Sistemas de armazenamento de dados

3 - Iniciando um projeto de Engenharia de Dados

4 - Conhecendo ferramentas de Big Data

Releases

No releases published

Packages

No packages published