Bem-vindo(a)! Este repositório reúne trabalhos e desafios realizados durante o curso de Formação em Dados da Escola DNC. Cada desafio foca em uma etapa ou técnica específica dentro do universo de Dados, desde visualizações em Power BI, análises com SQL, até modelos de regressão e classificação em Python.
- Desafio 1: Painel de E-commerce em Power BI
- Desafio 2: Painel Gerencial Automatizado em Power BI
- Desafio 3: Planos de Ação a partir de Análises com SQL
- Desafio 4: Modelo de Regressão para Marketing
- Desafio 5: Preparando Dataset para Modelagem de Dados (RFM)
- Desafio 6: Previsão de Churn em Plataforma de Streaming
- Desafio 7: Modelo de Análise das Métricas RFV (Clustering)
Objetivo:
Criar um painel gerencial para um e-commerce que deseja estudar as suas vendas e, a partir disso, traçar a melhor estratégia para alavancar resultados.
Tarefas:
- Receber duas bases de dados (vendas e clientes);
- Criar duas páginas de relatório com as principais métricas;
- Elaborar métricas de:
- Quantidade total de vendas
- Valor total de vendas
- Cotagem (ou contagem) e valor total de vendas por data
- Quantidade e valor total por categoria
- Criar filtros para aprimorar a experiência do usuário;
- Aplicar storytelling e um bom layout para maior atratividade.
Visão do Painel:
Objetivo:
A empresa de Marketing Digital "X" quer alcançar uma meta ambiciosa neste trimestre e identificar planos de ação para atingi-la. Para isso, precisa de um dashboard que permita acompanhar indicadores de desempenho de cada campanha, facilitando a análise e a tomada de decisões estratégicas.
Tarefas:
- Criar um dashboard em Power BI que exiba os KPIs das campanhas;
- Avaliar e comparar o desempenho de cada campanha;
- Identificar oportunidades de otimização para alcançar a meta do quarter;
- Garantir atualizações automatizadas dos dados.
Visão do Painel:
Cenário:
Você é um analista de dados em uma Edtech, focada em crescimento do número de usuários cadastrados. Foi solicitado que você analise diversos aspectos da aquisição de clientes para avaliar o status de crescimento da base de usuários.
Tarefas:
- Manipular bases de dados usando SQL;
- Criar queries que mostrem insights sobre o comportamento dos novos usuários;
- Identificar oportunidades de crescimento e gargalos no funil de aquisição;
- Propor planos de ação para acelerar o crescimento.
Exemplo de Análise (Printscreen):
Cenário:
Uma empresa investe em diferentes plataformas de publicidade online (YouTube, Facebook, newspaper) para gerar leads. Eles registram todos os gastos em publicidade e retornos de vendas gerados.
Objetivos:
- Entender a relação entre as variáveis (investimentos e retornos).
- Identificar os fatores que mais impactam a geração de leads.
- Criar um modelo de predição para estimar o retorno de vendas a partir de um determinado investimento.
Tarefas:
- Explorar a base de dados para encontrar correlações;
- Construir um modelo de regressão (por exemplo, Regressão Linear);
- Avaliar a performance do modelo (Métricas como MSE, RMSE, R², etc.);
- Gerar insights para otimizar gastos em publicidade.
Exemplo de Visualização:
Cenário:
Uma empresa de e-commerce deseja levantar indicadores de Recência (R), Frequência (F) e Ticket Médio (M) de seus clientes (RFM). Você recebe uma base de dados e deve gerar como saída um novo CSV contendo apenas a identificação do cliente e as métricas RFM.
- Recency (R): Tempo em dias desde a última compra do cliente.
- Frequency (F): Quantidade de compras realizadas pelo cliente.
- Monetary (M): Ticket médio gasto pelo cliente (valor total gasto dividido pelo número de pedidos).
Tarefas:
- Ler a base de dados original em Python;
- Calcular as métricas RFM para cada cliente;
- Salvar em um novo CSV com colunas: ID do cliente, R, F, M.
Imagens Ilustrativas:
Cenário:
Você atua em uma plataforma de streaming com alto índice de churn (cancelamento). A diretoria acredita ser possível prever se um usuário tem maiores chances de cancelar a assinatura antes que isso aconteça, para agir preventivamente.
Objetivo:
Criar um modelo de classificação (ex.: Regressão Logística, Árvore de Decisão, Random Forest etc.) que preveja se um usuário pode cancelar ou não sua assinatura.
Tarefas:
- Receber uma base de dados em CSV com características dos clientes;
- Explorar os dados para entender potenciais variáveis preditivas;
- Treinar e avaliar modelos de classificação;
- Fazer propostas de ação para reduzir o churn.
Exemplo de Visualização:
Cenário:
Uma empresa de e-commerce quer entender melhor o comportamento de seus clientes para personalizar campanhas de marketing. Você recebe um CSV com dados sobre clientes, produtos e transações realizadas entre 2010 e 2011.
Objetivo:
Agrupar (clusterizar) clientes com base em RFV (Recência, Frequência e Valor Monetário), a fim de identificar padrões e segmentar clientes que:
- Compram os mesmos produtos;
- Têm a mesma frequência de compras;
- Gastam mais (ou menos) dinheiro nas compras.
Tarefas:
- Calcular métricas RFV (ou RF e Valor total para o clustering);
- Aplicar técnicas de clusterização (K-means, por exemplo);
- Gerar insights para segmentar e direcionar campanhas de marketing.
Exemplo de Visualização:
Desenvolvido com 💛 por @mayasrl.








