Semana | Tópico/Ferramenta | Conteúdo/Atividades |
---|---|---|
1 | Git (Básico) | Instalação e configuração. Conceitos básicos: repositorio, commit, branch. |
2 | Git (Intermediário) | Branches, GitHub, pull requests, stashing, cherry-picking. |
3-4 | Python (Básico) | Básico de Python, Estruturas de Dados, Loops, Funções. |
5-6 | Python (Intermediário) | Bibliotecas Pandas e Numpy. Leitura/escrita de arquivos CSV, Excel e DB. |
7 | SQL (Básico) | Introdução ao SQL: SELECT, WHERE, JOIN, GROUP BY. |
8 | SQL (Projeto) | Projeto prático com bancos de dados. |
9 | Hadoop e HDFS | Instalação e conceitos básicos de armazenamento distribuído. |
10-11 | Spark (Básico) | Instalação, RDDs, DataFrames. Operações de transformação e ação. |
12 | Spark (Projeto) | Projeto prático de processamento de dados. |
13-14 | Apache Kafka | Instalação e conceitos de tópicos, producers e consumers. |
15-16 | Apache Airflow | Instalação e criação de DAGs simples. |
17-18 | Data Warehouse (Cloud) | Introdução a Amazon Redshift ou Google BigQuery. |
19-20 | Pipelines de Dados | Criação de pipelines simples e complexos com as ferramentas aprendidas. |
21-22 | Projeto Integrado | Sistema completo: ingestão, processamento e visualização de dados. |