Le projet de ce notebook a été réalisé dans le cadre de la formation d'ingénieur machine learning proposé par Openclassrooms.
Il portait sur les développement d'une API de suggestion de tags à destination des utilisateur de Stack Overflow. Il a étét l'occasion de mettre en oeuvre des méthodes de NLP / TAL. Ce repository porte sur le développement de l'API poru rpondre au besoin. Un second repository contient les travaux de pré-traitement des documents et l'entrainement des modèles.
Il était demandé de réaliser:
- Le fitrage des données issue de l'API stackexchange explorer
- Réaliser le pétraitement des documents
- Comparer des approches suppervisées (KNN, SVM, Random Forest, Gradient Boosting) et non supervisées (LDA) afin de prédire des tags
- Réaliser les fonctions et classes nécessaire à l'implémentation de l'API.
- Développer une API et la mettre en production
- Le code de l'API
- Python
- FastAPI
- Uvicorn
- Heroku