Détection de fausses nouvelles surtout sur les articles peu fiables
Description : Ce projet est une API web construite avec Flask pour prédire la fiabilité d'un texte donné en utilisant un modèle de machine learning pré-entraîné. L'API permet de soumettre des données JSON comprenant un titre, un auteur et un texte. Le texte est prétraité et traduit en anglais si nécessaire avant que la prédiction soit effectuée par le modèle. Les prédictions sont renvoyées sous forme de labels lisibles ("Fiable" ou "Peu Fiable").
Objectif : L'objectif de ce projet est de développer une API web capable de déterminer la fiabilité d'un texte en utilisant un modèle de machine learning pré-entraîné. Cette API facilite l'intégration de la classification des textes dans des applications ou des services en ligne. Voici les objectifs spécifiques :
- **Prédiction de Fiabilité** : Évaluer si un texte est fiable ou peu fiable en utilisant un modèle de machine learning.
- **Traduction Automatique** : Traduire le texte en anglais si nécessaire avant l'analyse, pour permettre une évaluation uniforme quel que soit la langue originale du texte.
- **Prétraitement des Textes** : Nettoyer et préparer le texte pour améliorer la précision des prédictions du modèle.
- **Accessibilité via API** : Fournir un endpoint HTTP pour recevoir des données au format JSON, traiter les demandes, et retourner les résultats en JSON, facilitant ainsi l'intégration dans divers systèmes et applications.
- **Facilité d'Utilisation** : Offrir une interface simple pour tester et intégrer des fonctionnalités de détection de fiabilité des textes dans des projets ou des services en ligne.
Langages utilisés : Python
Technologies et Bibliothèques :
- pandas
- requests,zipfile, io, os, shutil, wordcloud, sklearn
- matplotlib
- Flask
- Joblib
- Googletrans
- Transformers & Torch
- tqdm
Modèles et outils :
- BERT (BertTokenizer, BertForSequenceClassification)
- Optimiseur AdamW
- Planificateur de taux d'apprentissage (get_linear_schedule_with_warmup)
Étapes du Projet :
- Chargement et nettoyage des données
- Prétraitement et normalisation
- Construction du modèle
- Entraînement d'un modèle de réseau de neurones
- Évaluation du modèle à l'aide de courbes de perte et d'accuracy
- Matrice de confusion et visualisation des performances
Code source : Retrouvez le code complet de ce projet sur Detection_FakeNews_IA.
Voir le Dashboard Interactif