Détection de fausses nouvelles

Détection de fausses nouvelles surtout sur les articles peu fiables

Description : Ce projet est une API web construite avec Flask pour prédire la fiabilité d'un texte donné en utilisant un modèle de machine learning pré-entraîné. L'API permet de soumettre des données JSON comprenant un titre, un auteur et un texte. Le texte est prétraité et traduit en anglais si nécessaire avant que la prédiction soit effectuée par le modèle. Les prédictions sont renvoyées sous forme de labels lisibles ("Fiable" ou "Peu Fiable").

Objectif : L'objectif de ce projet est de développer une API web capable de déterminer la fiabilité d'un texte en utilisant un modèle de machine learning pré-entraîné. Cette API facilite l'intégration de la classification des textes dans des applications ou des services en ligne. Voici les objectifs spécifiques :

**Prédiction de Fiabilité** : Évaluer si un texte est fiable ou peu fiable en utilisant un modèle de machine learning.
**Traduction Automatique** : Traduire le texte en anglais si nécessaire avant l'analyse, pour permettre une évaluation uniforme quel que soit la langue originale du texte.
**Prétraitement des Textes** : Nettoyer et préparer le texte pour améliorer la précision des prédictions du modèle.
**Accessibilité via API** : Fournir un endpoint HTTP pour recevoir des données au format JSON, traiter les demandes, et retourner les résultats en JSON, facilitant ainsi l'intégration dans divers systèmes et applications.
**Facilité d'Utilisation** : Offrir une interface simple pour tester et intégrer des fonctionnalités de détection de fiabilité des textes dans des projets ou des services en ligne.

Langages utilisés : Python

Technologies et Bibliothèques :

pandas
requests,zipfile, io, os, shutil, wordcloud, sklearn
matplotlib
Flask
Joblib
Googletrans
Transformers & Torch
tqdm

Modèles et outils :

BERT (BertTokenizer, BertForSequenceClassification)
Optimiseur AdamW
Planificateur de taux d'apprentissage (get_linear_schedule_with_warmup)

Étapes du Projet :

Chargement et nettoyage des données
Prétraitement et normalisation
Construction du modèle
Entraînement d'un modèle de réseau de neurones
Évaluation du modèle à l'aide de courbes de perte et d'accuracy
Matrice de confusion et visualisation des performances

Code source : Retrouvez le code complet de ce projet sur Detection_FakeNews_IA.

Voir le Dashboard Interactif