El presente repositorio se refiere a un curso sobre árboles de decisión, impartido en colaboración con el Colegio de Matemáticas Bourbaki
Se realiza un análisis para la retención de clientes de una empresa de telecomunicaciones, utilizando árboles de decisión y bosque aleatorio para entender las características más relevantes para la retención de clientes de una empresa de telecomunicaciones.
El conjunto de datos se tomó de Kaggle. Éste cuenta con 3,333 renglones y 20 columnas.
El conjunto de datos disponible aquí, incluye los registros tanto el conjunto de entrenamiento (churn-bigml80.csv), como del conjunto de evaluación (churn-bigml20.csv). Cabe además señalar que para facilitar la interpretación tanto del análisis exploratorio como del modelo, los nombres de las columnas del conjunto de datos se tradujo al español.