- Installation des bibliothèques : Utilisez les commandes pip pour installer les bibliothèques nécessaires, telles que aaransia, nltk, tashaphyne, arabic-reshaper, et wordcloud.
pip install aaransia
pip install nltk
pip install tashaphyne
pip install --upgrade arabic-reshaper
pip install wordcloud
import nltk
nltk.download('stopwords')
nltk.download('punkt')
- Chargement des données :
- Données d'entraînement et de test à partir de fichiers CSV.
- Prétraitement des données :
- Translittération, normalisation, nettoyage, suppression des stopwords.
- Entraînement du modèle :
- Modèle de Naive Bayes multinomial pour l'analyse des sentiments.
- API Flask :
- Points d'extrémité pour la classification de texte et le téléchargement de fichiers CSV.
- Page d'accueil :
- Présentation du projet et de l'équipe.
- Analyse des Sentiments de Phrases :
- Saisie d'une phrase en arabe pour une analyse immédiate.
- Téléchargement de Fichier :
- Téléchargement d'un fichier texte (.txt) pour une analyse en masse.
- Styles CSS :
- Mise en page de la page web.
- Script JavaScript :
- Envoi de requêtes au backend et manipulation des résultats.
- Utilisation du jeu de données ArSarcasm-v2.
- Exécution du Serveur Flask :
python backend.py
- Utilisation de l'Interface Utilisateur :
- Ouvrez
home.html
dans un navigateur.
- Classification de Texte :
- Saisissez un texte en arabe et cliquez sur "Classify" pour obtenir le résultat.
- Téléchargement de Fichier :
- Sélectionnez un fichier texte (.txt) et cliquez sur "Upload File" pour analyser et télécharger le résultat en CSV.
Vous pouvez retrouver le code complet de l'analyse des sentiments en arabe sur mon profile. Voici le lien vers le code source :
Analyse des Sentiments en Arabe sur Kaggle
- OUARAS Khelil Rafik
Si vous utilisez le dataset ArSarcasm-v2 dans votre projet de recherche, veuillez citer l'article original et le dataset de la manière suivante :
@inproceedings{abufarha-etal-2021-arsarcasm-v2,
title = "Overview of the WANLP 2021 Shared Task on Sarcasm and Sentiment Detection in Arabic",
author = "Abu Farha, Ibrahim and Zaghouani, Wajdi and Magdy, Walid",
booktitle = "Proceedings of the Sixth Arabic Natural Language Processing Workshop",
month = "April",
year = "2021",
}