El objetivo es cambiar las reglas del campeón de europa para establecer las normas del boxeo, quien gane al campeón es el actual 'Rey de Europa' y así conocer quién es en cada momento, quién lo ha sido más y cuando lo ha sido y hacer las estadísticas de partidos como campeón de cada equipo y país.
Todos los datos necesarios están subidos en un repositorio de Kaggle (https://www.kaggle.com/datasets/willfitzhugh/european-soccer-data) Datos de 2002 a oct/2022
Todo el análisis en R, paquetes principales: tidyverse, dplyr, tidyr, ggplot2, lubridate, forcats y viridis.
- Limpieza de datos (nulls y cambios de formato)
- Creación de columna de campeón con condicional autoreferencial
- Creación de gráficos por equipos
- Cálculo del país por mayoría de partidos de cada equipo y gráficos por país
- Formular un condicional con autoreferencia
- Visualización de datos de nuevas formas (ggplot)
- Formular una columna en base a valor más repetido (str) para calcular país sin otra tabla de referencia
Este dataset me ha encantado, me ha costado mucho porque la elaboración para saber si el 'Rey de Europa' juega y, si juega comparar para saber si ha ganado o no, me ha parecido bastante difícil y he inverido bastantes horas, aunque ha merecido la pena. También estoy muy orgulloso de haber conseguido el país de cada uno sin tener que añadir otra tabla a mano. Me encantan los datos de deportes e intentar llevar sistemas de puntuación o clasificación a otros, puedo sacarle aún mucho juego a este dataset como saber cuándo pierden los campeones, contra quién (matagigantes) y quién consigue mayor racha sin perder, ya que en este dataset se cuentan todos los partidos (ya que en todos parte como campeón pero no en todos juega)