Desenvolver estratégias para uma empresa fictícia que atua desde 2012, é uma rede de varejo que vende produtos eletrônicos e eletrodomésticos com lojas espalhadas por diversas cidades do Brasil, que busca tomar suas decisões sob a óptica da evolução dos seus dados de vendas. Sendo necessário organiza-los de forma a compreende-los com precisão e em tempo real, acompanhando as principais metas e podendo obter insights para ações futuras.
A empresa está montando a estratégia de vendas para o próximo ano e precisa saber qual dos fabricantes dos produtos vendidos, apresenta melhor desempenho nas vendas. O objetivo é descartar os fabricantes cujos produtos possuem poucas vendas e tentar negociar melhores condições com os principais fabricantes. Em paralelo a isso, a empresa gostaria de ter diferentes visões das vendas realizadas nos últimos 4 anos (período de 2012 a 2015). Deve ser possível segmentar os relatórios de vendas por diferentes informações e por diferentes ângulos. Estas informações irão suportar as estratégias da empresa para o próximo ano.
Os dados foram extraídos de diferentes tabelas de um banco de dados transacional e como a empresa vai usar os relatórios todos os meses, alguns consultores recomendaram o uso de um Data Warehouse. Aqui as colunas disponíveis nos arquivos txt:
Haverá diversas reuniões para definição da estratégia de vendas e os relatórios poderão ser extraídos sob demanda, de acordo com a necessidade dos gestores. Por conta disso, é necessário criar um modelo de dados que permita a extração de relatórios a qualquer momento e que permita extrair dados por diferentes visões e ângulos. Os dados devem ser alimentados em um banco de dados consolidado, que será atualizado mensalmente com novos dados.
Contribuir com um trabalho analítico extraindo informações e storytelling baseados em dados para insights e tomada de decisão bem como, uma forma de consolidar meus conhecimentos no campo da análise de dados e Business Intelligence desenvolvendo um projeto com o uso das ferramentas Microsoft PowerBI e PostgreSQL.
Base de dados em arquivos ".csv", tendo como fonte a plataforma de cursos da Data Science Academy (link nas referencias). Estes arquivos foram tratados no Sistema gerenciador de Banco de Dados PostgreSQL e guardados em um Datawarehouse. Feito conexão direta do PowerBI com o PostgreSQL.
Dashboard construído com base em um modelo/protótipo do site da Data Science Academy, seguindo estas etapas:
-
Download dos datasets ".csv". Clique aqui
-
Criação de um Banco de Dados no PostgreSQL
- Importação dos arquivos .csv para o SGBD
- Implementação do Datawarehouse
- Tratamento de dados no SGBD
- Conexão do PowerBI com o Postgres
- Tratamento dos dados no Power Query
- Tratamento de erros e conjuntos nulos
- Criação de medidas, estruturas condicionais e cálculos com funções DAX e programação em linguagem M
- Criação de dashboard interativos com os seguintes gráficos:
* Barras clusterizadas
* Colunas empilhadas
* Cartões informativos
* KPI (Indicador chave de perfomance)
* Gráfico de área
* Principais influenciadores
- Visualização
- Atualização
-
Configurações do meu computador pessoal utilizado neste projeto:
- Sistema Operacional: Windows 10 - 64 bits
- Processador: Intel(R) Core(TM) i7-5500U CPU @ 2,40GHz 2,40GHz
- Memória: 8,00 GB
- HD: SSD 250 GB
-
Softwares.
- Git: Utilizado para fazer o controle de versão do código gerado ao longo do projeto;
- Github Desktop: Utilizado para fazer a interface do Git para controle de versão do código gerado ao longo do projeto;
- Notepad++: Utilizado para geração e edição dos arquivos ".txt", ".md";
- Microsoft PowerBI: Utilizado para tratamento de dados, visualização e criação do dashboard interativo.
- PostgreSQL: SGBD utilizado para modelagem dos dados, implementação de DW, processo ETL e scripts SQL.
MIT License Copyright (c) 2020 Aron Marcus