Este repositorio contiene los códigos utilizados para la extracción, preprocesamiento y análisis de datos para la Datatón "Exprésate con Datos Perú 2024" organizada por la Presidencia del Consejo de Ministros de Perú. El proyecto final se encuentra disponible aquí:
- 📊 Tablero Power BI: https://lnkd.in/eyCudCPs
- 📅 codigos: Los codigos utilizados, en formato jupyter.
01_Extraccion_Datos
: Se extrae la base de datos directamente la página web mediante web scrapping utilizando la librería sellenium.02_Preprocesamiento
: Se limpia la base y crean nuevas columnas con variables categoricas para un análisis más profundo.03_Analisis_Exploratorio
: Se hace un análisis visual de las variables categóricas y dicotómicas.04_Tasa_Ingreso
: Se crea un nuevo dataframe con la tasa de ingreso por departamento, para mayor análisis.
- 📊 data: Contiene las bases de datos extraidos y procesadas en los códigos.
- Email: aranda.paola@pucp.edu.pe
- GitHub Profile:
- Email: esteban.cabrera@pucp.edu.pe
- GitHub Profile:
- Email: ochoa.lucia@pucp.edu.pe
- GitHub Profile: