Skip to content

Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).

Notifications You must be signed in to change notification settings

dg2c4/Bank-Marketing-Big-Data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 

Repository files navigation

Bank-Marketing-Big-Data

Bank-Marketing-Data-Illustration

Objetivo:

Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y). El trabajo se divide en tres componentes principales:

1. Análisis Exploratorio:

- Formulación de preguntas de investigación.
- Creación de hipótesis basadas en un problema específico.
- Análisis inicial del conjunto de datos seleccionado.

2. Preprocesamiento de Datos:

- Limpieza de datos.
- Transformación de variables.
- Reducción de datos cuando sea necesario.
- Discretización de datos según corresponda.

3. Modelado y Evaluación:

- Implementación de modelo de regresión lineal o logística
- Selección y cálculo de métricas de evaluación
- Análisis del rendimiento del modelo

Conjunto de datos:

Contiene datos sobre campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa.

https://archive.ics.uci.edu/dataset/222/bank+marketing

Ejercicio:

A. Realizar un análisis exploratorio al conjunto de datos entregado, para ello debe crear diferentes preguntas e hipótesis a resolver en los datos partiendo de un problema que cada grupo debe plantear.
B. Después de realizar el análisis exploratorio, debe hacer el preprocesamiento de los datos según como considere: limpieza, transformación, reducción de datos o discretización de los datos.
C. Debe realizar un entrenamiento del modelo de machine learning.

Algunos algoritmos de clustering:

· K-Means-Clustering.
· DBSCAN (Density-Based Spatial Clustering of Applications with Noise).
· Hierarchical Clustering.
· Gaussian Mixture Model (GMM).
· Principal Component Analysis (PCA).

Evaluación:

Ítem Puntos
Análisis exploratorio de los datos y uso de algoritmos de cluster 20 pts
Efectividad del modelo (Mínimo 70%) 10 pts
Entrenamiento 10 pts
Justificación 10 pts
Total 50 pts

Systems engineering:

User: David Gutierrez Chaves
Code: 506222728
Subject: Big Data Electiva-I
Institution: Fundación Universitaria Konrad Lorenz
Institutional email [email protected]

Created By:

https://github.com/dg2c4

Date: 05/04/2025 - 26/04/2025

About

Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published