Los objetivos de esta práctica son:
- Aplicar los conocimientos adquiridos sobre clasificación, técnicas de imputación de valores faltantes y validación cruzada.
- Ser capaz de comparar diferentes modelos de clasificación.
- Ser capaz de realizar la búsqueda de hiperparámetros.
- Entender e implementar la validación cruzada.
- Analizar detalladamente los resultados obtenidos durante el aprendizaje de los diferentes modelos.
En esta práctica utilizaremos la base de datos del Titanic. El atributo que predeciremos es "Survived", el cual nos indica si cada pasajero sobrevivió o no.
Enlace a la base de datos: Titanic Dataset
- Análisis de tamaño y tipología de datos.
- Primera valoración de correlaciones.
- Análisis del atributo target.
- Eliminación de valores nulos.
- Codificación de variables categóricas.
- Otras técnicas (PCA, normalización, etc.).
- Selección de la mejor métrica para el problema.
- Visualización de ROC/AUC.
- Selección del mejor modelo.
- Búsqueda de hiperparámetros.