Skip to content

Repositorio de material práctico de la materia Análisis de Datos de la Carrera de Especialización en Inteligencia Artificial de la FIUBA

Notifications You must be signed in to change notification settings

FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos

Repository files navigation

Bienvenidos al repositorio de la materia Análisis de Datos! Aquí encontrarán los materiales de clase, notebooks, datasets y recursos adicionales.


📂 Estructura del Repositorio

  • notebooks/ → Contiene las notebooks con los ejemplos y ejercicios de cada clase.
  • datasets/ → Conjunto de datos utilizados en los ejemplos y prácticas.
  • recursos/ → Ejericios, reportes y otros materiales útiles.
  • scripts/ → One-offs / no reutilizable.
  • utils/ → Funciones auxiliares utilizadas en las notebooks.

⚠️ Recordá que las diapositivas de las clases y los enunciados de los TPs se encuentran en el Campus posgrado de la FIUBA.


🎓 ¿Sos alumno de una cohorte anterior? Encontrá aquí las instrucciones para descargar los contenidos correspondientes a tu curso y bimestre.


📝 Contenido del Curso

Atención! Las notebooks se agregan antes de cada clase

Clase Tema Notebooks
1️⃣ Introducción al Análisis de Datos notebook_clase_1
2️⃣ Análisis exploratorio de datos (EDA). Análisis de datos faltantes y outliers notebook_clase_2_EDA
notebook_clase_2_faltantes_outliers
3️⃣ Taller práctico parte 1 (EDA) enunciado-salas-1-2-3
enunciado-salas-4-5-6
enunciado-salas-7-8-9
actividad-resuelta
4️⃣ Preprocesamiento y limpieza de datos notebook_clase_4_codificacion
notebook_clase_4_tratamiento_datos_faltantes
notebook_clase_4_tratamiento_outliers
notebook_clase_4_discretizacion
5️⃣ Procesamiento de datos (continuación) notebook_clase_5_normalizacion_estandarizacion
notebook_clase_5_tratamiento_avanzado_faltantes
notebook_clase_5_tratamiento_avanzado_outliers
notebook_clase_5_desbalance
6️⃣ Reducción de la dimensionalidad + Bonus notebook_clase_6_seleccion_features
notebook_clase_6_correlacion
notebook_clase_6_extraccion_features_parte1
notebook_clase_6_extraccion_features_parte2
notebook_clase_6_bonus_audio
notebook_clase_6_bonus_texto
notebook_clase_6_bonus_imagenes
notebook_clase_6_bonus_PCA_imagenes
7️⃣ Taller práctico - parte 2
notebook_clase_7_bonus_EDA_automatico
notebook_clase_7_bonus_preproc_automatico

📚 Bibliografía recomendada aquí.


📅 Fechas importantes

  • Plazo para compartir las diapositivas del trabajo final: martes 09/12/25 23:59 ART

  • Presentación del trabajo práctico final:

    • Sesión 1: jueves 11 de diciembre de 2025.
    • Sesión 2: lunes 15 de diciembre de 2025.


⚙️ Instalación y Configuración del Entorno

En esta sección se explican los pasos para utilizar este repositorio.

➡️ Opción 1: Usar un env de Conda

Prerrequisitos

  • Anaconda o miniconda
  • Git

1. Clonar el repositorio:

git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos

2. Crear y activar el environment:

conda env create -f environment.yml
conda activate add-env

3. Abrir Jupyter:

jupyter notebook

➡️ Opción 2: Usar un env de Poetry o UV

Este proyecto también permite usar Poetry o UV para manejo de dependencias. Seguir los pasos detallados a continuación para crear un environment a partir del archivo pyproject.toml proporcionado.

Prerrequisitos

A1/B1. Clonar el repo:

git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos

Opción A - Poetry

A2. Crear el environment (ejemplo con Python 3.11, ajustar a 3.12 de ser necesario):

  • macOS/Linux
poetry env use python3.11  
  • Windows
poetry env use py -3.11 

A3. Instalar dependencias (Linux/MacOS/Windows):

poetry install --no-root

A4. Verificar que el environment se instaló correctamente:

poetry env list

Este comando devuelve todos los environments asociados al proyecto (verificar que ceia-analisis-de-datos-xxxxxxx-py3.11 aparece en la lista)

poetry env info

Este comando muestra detalles tales como la versión de Python y el path (ej., /Users/<username>/Library/Caches/pypoetry/virtualenvs/... en macOS o C:\Users\<username>\AppData\Local\pypoetry\... en Windows).

A5. Activar el environment:

  • macOS/Linux (zsh/bash) y Windows (PowerShell/CMD):
poetry shell 

Después de ejecutar el comando, el nombre del environment debería aparecer en el prompt de la terminal entre paréntesis (ej., ceia-analisis-de-datos-py3.11).

A6. Verificar activación:

python --version

Debería mostrar Python 3.11.X o 3.12.X.

Luego, ejecutar:

which python  # macOS/Linux
where python  # Windows

Debería apuntar al Pyhton del env. de Poetry (ej., /Users//Library/Caches/pypoetry/virtualenvs/ceia-analisis-de-datos-xxxxx-py3.11/bin/python o C:\Users<username>\AppData\Local\pypoetry\Cache\virtualenvs\ceia-analisis-de-datos-xxxxx-py3.11\Scripts\python.exe).

Saltar al paso A7/B6 para registrar el environment en Jupyter.


Opción B - UV

B2. Crear el environment (ejemplo con Python 3.11, ajustar a 3.12 de ser necesario):

  • macOS/Linux/Windows
uv venv --python 3.11 

B3. Activar el environment:

  • macOS/Linux (zsh/bash):
source .venv/bin/activate 
  • Windows (PowerShell):
.venv\Scripts\activate
  • Windows (CMD):
.venv\Scripts\activate.bat

B4. Instalar dependencias (Linux/MacOS/Windows):

uv pip install -e .

B5. Verificar activación:

python --version

Debería mostrar Python 3.11.X o 3.12.X.

Luego, ejecutar:

which python  # macOS/Linux
where python  # Windows

Debería apuntar al Pyhton del env. de UV (ej., /path/to/CEIA_Analisis_de_datos/.venv/bin/python en macOS/Linux o C: C:\path\to\CEIA_Analisis_de_datos.venv\Scripts\python.exe en Windows).

Continuar al paso A7/B6 para registrar el environment en Jupyter.


A7/B6. Registrar el environment en Jupyter:

python -m ipykernel install --user --name=ceia-analisis-de-datos --display-name "Python (CEIA)"

A8/B7. Abrir Jupyter y seleccionar el kernel correcto:

jupyter notebook

Una vez abierto Jupyter, ir a KernelChange Kernel y seleccionar "Python (CEIA)".


➡️ Opción 3: Usar Google Colab

Al momento de la actualización de este repositorio (Marzo 2025) Colab utiliza Python 3.11 y no debería haber inconvenientes para ejecutar las notebooks de la materia con esta herramienta. Pasos a seguir:

  1. Desde Colab, ir al menú File y hacer click en Open Notebook.

  2. En la nueva ventana que se abre, ir a la opción GitHub (en el menú de la derecha).

  3. En la barra buscadora, copiar el nombre del repo:

FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos
  1. Asegurarse que en Repository aparezca el nombre correcto (FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos) y la branch sea main. Hacer click en la notebook deseada para abrir.

📫 Contacto

Packages

No packages published

Contributors 3

  •  
  •  
  •