🗳️ Análise de Correspondência Múltipla (ACM) e Clusterização K-Means — Perfil dos Eleitores com Deficiência no Brasil
Projeto desenvolvido durante o MBA em Data Science e Analytics
Explorando dados eleitorais e padrões regionais de inclusão e acessibilidade
Compreender os perfis sociodemográficos dos eleitores com deficiência no Brasil, analisando como variáveis como:
🧓 Faixa etária · 💍 Estado civil · 🧬 Raça · 🚻 Gênero · 🗺️ Estado · 🌎 Região · 🦽 Tipo de deficiência
se relacionam entre si e formam agrupamentos distintos de eleitores.
A análise combina:
- Análise de Correspondência Múltipla (ACM) — redução da dimensionalidade e descoberta de padrões;
- K-Means Clustering — segmentação em grupos com características semelhantes.
| 🧱 Etapa | 📝 Descrição |
|---|---|
| 1. Limpeza e preparação dos dados | Tratamento, filtragem e padronização das variáveis |
| 2. ACM (Análise de Correspondência Múltipla) | Redução dimensional e obtenção das coordenadas fatoriais |
| 3. K-Means Clustering | Identificação de grupos homogêneos de eleitores |
| 4. Visualização e interpretação | Mapas perceptuais e clusters por estado e região |
| 5. Geração de insights | Interpretação dos perfis regionais e variáveis predominantes |
| 📊 Métrica | 🔍 Resultado |
|---|---|
| Número de Clusters (k) | 3 |
| Método de Definição | Método do Cotovelo |
| Variância Explicada | ~63% nas duas primeiras dimensões |
| Variáveis Utilizadas | Coordenadas fatoriais da ACM (CS1, CS2) |
🔸 Representa a variação da soma dos erros quadrados (WSS) para diferentes valores de k.
🧩 Representa graficamente a relação entre as variáveis e a proximidade dos perfis de eleitores com deficiência.
✨ Visualização cinematográfica dos agrupamentos formados via ACM + K-Means.
📊 Mostra a proporção de cada tipo de deficiência em cada cluster.
📈 Mostra a distribuição dos grupos (clusters) por macrorregião brasileira.
A Análise de Correspondência Múltipla (ACM) revelou padrões relevantes de associação entre variáveis sociodemográficas e a distribuição dos eleitores com deficiência no Brasil.
| 🧠 Insight | 💬 Interpretação |
|---|---|
| Diferenças regionais marcantes | Regiões Sul e Sudeste apresentaram maior escolaridade e predominância de deficiência visual. |
| Norte e Nordeste | Concentram eleitores com deficiência física/locomoção, menor escolaridade e maior faixa etária. |
| Associação tipo de deficiência x faixa etária | Deficiências auditivas surgem em faixas etárias mais elevadas; múltiplas deficiências entre jovens. |
| Agrupamentos homogêneos | O K-Means evidenciou três grupos distintos, alinhados às diferenças regionais e educacionais. |
| Categoria | Ferramenta |
|---|---|
| Linguagem | R |
| Pacotes | FactoMineR, ade4, ggplot2, ggrepel, dplyr, sjPlot |
| Ambiente | RStudio |
| Visualizações | Mapas perceptuais, gráficos 2D e constelação de clusters |
Projeto desenvolvido por Cibelly Viegas
📧 [email protected]
🎓 MBA em Data Science e Analytics