Questo progetto si concentra sull'analisi dei dati dei giocatori di calcio utilizzando un DataSet ottenuto da Transfermarkt. Sono state utilizzate tecnologie come HIVE, Databricks, Colab e PySpark per eseguire analisi avanzate sui dati dei giocatori.
Il DataSet utilizzato per questo progetto è stato ottenuto da Transfermarkt. Contiene informazioni dettagliate sui giocatori di calcio, tra cui dati biografici, statistici e storici. (Link Dataset: https://www.kaggle.com/datasets/davidcariboo/player-scores)
- HIVE: Utilizzato per l'archiviazione e la gestione dei dati.
- Databricks: Piattaforma cloud per l'analisi dei dati che offre un ambiente integrato per eseguire analisi su larga scala.
- Colab: Ambiente di sviluppo basato su Jupyter Notebook offerto da Google, utilizzato per l'esplorazione e l'analisi dei dati.
- PySpark: Libreria Python per l'elaborazione parallela dei dati utilizzata con Apache Spark per l'analisi dei Big Data.
Per eseguire l'analisi dei dati sui giocatori di calcio, seguire i passaggi seguenti:
- Download del DataSet: Scaricare il DataSet dai link forniti sopra e salvarlo nel percorso appropriato sul sistema locale.
- Setup dell'ambiente: Assicurarsi di avere Python, PySpark e le altre dipendenze necessarie installate nel proprio ambiente.
- Esecuzione del codice: Utilizzare i notebook Colab forniti per eseguire l'analisi dei dati sui giocatori di calcio.
- Esplorazione dei risultati: Esplorare i risultati dell'analisi e le visualizzazioni generate per ottenere insights sui dati dei giocatori.
I contributi a questo progetto sono più che benvenuti! Sentiti libero di aprire una pull request per segnalare bug, proporre miglioramenti o aggiungere nuove funzionalità.