Este projeto demonstra uma análise completa de dados de vendas de um e-commerce, utilizando Python para extrair insights estratégicos que podem orientar decisões de negócio. O foco está na limpeza, exploração e visualização de dados para gerar recomendações acionáveis, com um dashboard interativo web para análise em tempo real.
- Python 3.8+
- Pandas: Manipulação e análise de dados
- NumPy: Computação numérica e álgebra linear
- Matplotlib: Visualizações estáticas
- Seaborn: Visualizações estatísticas avançadas
- Plotly: Gráficos interativos
- Streamlit: Dashboard web interativo
- Jupyter Notebook: Desenvolvimento interativo
- Git: Controle de versão
ecommerce-analysis/
│
├── data/
│ ├── raw/ # Dados brutos (Excel/CSV)
│ ├── processed/ # Dados limpos e processados
│ └── sample/ # Dados de exemplo
│
├── docs/
│ └── screenshots/ # Screenshots do dashboard
│ ├── 01_visao_geral.png
│ ├── 02_distribuicao.png
│ ├── 03_insights.png
│ ├── 05_produtos_graficos.png
│ ├── 06_produto_destaque.png
│ ├── 07_categorias.png
│ ├── 08_categorias_tabela.png
│ ├── 09_geografia_receita.png
│ ├── 10_geografia_metricas.png
│ ├── 11_canais.png
│ ├── 12_canais_tabela.png
│ └── 13_clientes.png
│
├── notebooks/
│ └── analise_vendas_interativa.md # Template para análise
│
├── data_processing.py # Processamento e limpeza de dados
├── visualization.py # Visualizações com Matplotlib/Seaborn
├── business_analysis.py # Análises estratégicas e insights
├── main.py # Executor principal do projeto
├── dashboard_app.py # 🎯 Dashboard interativo Streamlit
├── setup.py # Configuração do ambiente
│
├── reports/
│ ├── figures/ # Gráficos gerados
│ ├── insights/ # Relatórios de insights
│ └── RELATORIO_EXECUTIVO_VENDAS.md
│
├── requirements.txt # Dependências do projeto
└── README.md # Este arquivo
O dataset contém informações de vendas com as seguintes colunas:
| Coluna | Tipo | Descrição |
|---|---|---|
pedido_id |
string | Identificador único do pedido |
data_pedido |
datetime | Data de realização do pedido |
cliente_id |
int | Identificador do cliente |
produto |
string | Nome do produto |
categoria |
string | Categoria do produto |
quantidade |
int | Quantidade vendida |
preco_unitario |
float | Preço unitário do produto |
valor_total |
float | Valor total do pedido |
estado |
string | Estado do cliente |
canal_venda |
string | Canal de venda utilizado |
- Dados Simulados: Para demonstração do projeto
- Dados Reais: Substitua pela importação de planilhas Excel/CSV reais
- Estatísticas descritivas
- Identificação de valores nulos
- Detecção e tratamento de outliers
- Distribuição das variáveis numéricas
- 💰 Receita Total: Faturamento geral da empresa
- 🎫 Ticket Médio: Valor médio por pedido
- 📦 Volume de Pedidos: Quantidade total de transações
- 🏆 Top Produtos: Ranking por vendas e receita
- 📊 Análise por Categoria: Performance de cada segmento
- 📅 Sazonalidade: Identificação de padrões sazonais
- 📈 Tendências: Evolução das vendas ao longo do tempo
- 🔥 Heatmap: Vendas por dia da semana e mês
- 🗺️ Vendas por Estado: Distribuição geográfica da receita
- 🎯 Concentração Regional: Identificação de mercados principais
- 📱 Performance por Canal: Online, Marketplace, Mobile
- 💹 Comparativo de Eficiência: Ticket médio por canal
- 👥 Análise RFV: Recência, Frequência, Valor
- 🎖️ Segmentação: Champions, Loyal Customers, At Risk, etc.
- 💎 Top Clientes: Identificação dos principais compradores
- 🏆 Identificação dos produtos com maior potencial de receita
- 📊 Categorias com melhor performance financeira
- 🎯 Oportunidades de cross-selling e up-selling
- 📱 Canais de venda mais eficazes
- 🗺️ Regiões com maior potencial de expansão
- 📅 Períodos sazonais para campanhas
- 📦 Padrões de demanda para gestão de estoque
- 🚚 Otimização logística por região
- 💰 Estratégias de precificação
git clone https://github.com/costaendriw/ecommerce-analysis.git
cd ecommerce-analysispip install -r requirements.txtstreamlit run dashboard_app.pyO dashboard abrirá automaticamente em: http://localhost:8501
- ✅ Upload de arquivos CSV/Excel pela interface
- ✅ Geração de dados simulados para teste
- ✅ Filtros interativos (categoria, canal, período)
- ✅ 6 abas de análise detalhada
- ✅ Gráficos interativos com Plotly
- ✅ Exportação de dados (CSV, Excel, Relatório)
- ✅ Insights estratégicos automáticos
python main.pyIsso executará a análise completa e gerará:
- Dados processados em
data/processed/ - Gráficos em
reports/figures/ - Relatórios em
reports/insights/ - Dashboard executivo em
reports/figures/executive_dashboard.png
jupyter notebook notebooks/analise_vendas_interativa.mdInterface principal com métricas em tempo real e análises consolidadas.
Análise visual da distribuição de receita por categoria e canal de vendas.
Sistema automatizado de geração de insights, oportunidades e recomendações.
Ranking completo dos produtos mais vendidos por receita e volume.
Produto em Destaque:
Performance detalhada de cada categoria com métricas comparativas.
Detalhamento por Categoria:
Distribuição de vendas por estado e análise regional.
Métricas por Estado:
Performance comparativa entre canais de venda (Online, Marketplace, App Mobile).
Performance Detalhada:
Análise completa baseada em Recência, Frequência e Valor com segmentação automática.
# Core Data Science Libraries
pandas>=1.5.0
numpy>=1.21.0
# Visualization Libraries
matplotlib>=3.5.0
seaborn>=0.11.0
plotly>=5.0.0
# Jupyter Environment
jupyter>=1.0.0
notebook>=6.0.0
ipywidgets>=7.6.0
# Excel/CSV Processing
openpyxl>=3.0.0
xlrd>=2.0.0
# Statistical Analysis
scipy>=1.7.0
statsmodels>=0.13.0
scikit-learn>=1.0.0
# Utility Libraries
python-dateutil>=2.8.0
pytz>=2021.3
# Interactive Dashboard
streamlit>=1.28.0Funcionalidades:
- ✅ Interface intuitiva com sidebar de configurações
- ✅ Dados simulados ou upload de arquivos próprios
- ✅ Filtros dinâmicos por categoria, canal e período
- ✅ 6 abas de análise completamente interativas
- ✅ Gráficos Plotly com zoom, hover e exportação
- ✅ Insights automáticos gerados pela IA de análise
- ✅ Exportação de dados em CSV, Excel e relatórios
- ✅ Métricas em tempo real atualizadas dinamicamente
Abas disponíveis:
- 📊 Visão Geral: KPIs principais e evolução temporal
- 🏆 Produtos: Ranking e análise de performance
- 📂 Categorias: Comparativo entre categorias
- 🗺️ Geografia: Distribuição por estados
- 📱 Canais: Performance por canal de venda
- 👥 Clientes: Segmentação RFV e comportamento
- Evolução da receita (diária/semanal/mensal/trimestral)
- Top produtos por diferentes métricas
- Análise completa por categoria
- Análise geográfica detalhada
- Análise de canais de venda
- Padrões sazonais e heatmaps
- Segmentação RFV de clientes
- Todos os gráficos com zoom, hover e filtros
- Exportação em PNG de alta qualidade
- Visualizações responsivas
1. Carregamento de Dados
↓
2. Limpeza e Validação
↓
3. Análise Exploratória
↓
4. Geração de Métricas
↓
5. Análise de Negócio
↓
6. Visualizações
↓
7. Insights e Recomendações
↓
8. Relatórios Executivos
- Machine Learning: Previsão de vendas com ARIMA/Prophet
- Análise de Coorte: Comportamento de clientes ao longo do tempo
- Market Basket Analysis: Produtos frequentemente comprados juntos
- Modelagem Preditiva: Previsão de churn de clientes
- Clustering: Segmentação automática de clientes com K-means
- Dashboard Interativo: Streamlit implementado
- Automatização: Scripts para atualização automática de dados
- API REST: Endpoint para consultas em tempo real
- Deploy: Hospedagem em Streamlit Cloud/Heroku
- Testes: Implementação de testes unitários
- CI/CD: Pipeline de integração contínua
- Alertas: Notificações para anomalias nas vendas
- Relatórios Agendados: Envio automático por email
- Integração: Conexão com APIs de e-commerce
- Mobile: Versão otimizada para dispositivos móveis
Endriw Costa
- 📧 Email: endriwcosta3@gmail.com
- 💼 LinkedIn: linkedin.com/in/endriwcosta
- 🌐 Portfolio: github.com/costaendriw
Cientista de Dados com foco em análise exploratória, visualização de dados e geração de insights de negócio.
Este projeto está sob a licença MIT. Veja o arquivo LICENSE para mais detalhes.
Contribuições são sempre bem-vindas! Para contribuir:
- Fork o projeto
- Crie uma branch para sua feature (
git checkout -b feature/AmazingFeature) - Commit suas mudanças (
git commit -m 'Add some AmazingFeature') - Push para a branch (
git push origin feature/AmazingFeature) - Abra um Pull Request
- ✅ Dashboard interativo com Streamlit
- ✅ Gráficos interativos com Plotly
- ✅ Exportação de dados e relatórios
- ✅ Filtros dinâmicos
- ✅ Análise RFV de clientes
- ✅ Análise exploratória completa
- ✅ Visualizações estáticas
- ✅ Relatórios em PDF/Markdown
- ✅ Sistema modular de análise
Este projeto demonstra:
- ✅ Competência Técnica: Domínio de Python, Pandas, visualização e web apps
- ✅ Pensamento Analítico: Capacidade de extrair insights de dados
- ✅ Visão de Negócio: Conexão entre dados e decisões estratégicas
- ✅ Comunicação: Apresentação clara de resultados complexos
- ✅ Engenharia: Código limpo, modular e bem documentado
- Limpeza e tratamento de dados reais
- Análise exploratória sistemática
- Criação de dashboards interativos
- Storytelling com dados
- Automação de processos de análise
- Deploy de aplicações web
⭐ Se este projeto foi útil para você, não esqueça de dar uma estrela!
📧 Dúvidas ou sugestões? Entre em contato: endriwcosta3@gmail.com











