Reconnaissance de Chiffres Manuscrits

Reconnaissance de Chiffres Manuscrits avec un Réseau de Neurones Convolutif (CNN) sur le Jeu de Données MNIST

Description : Le projet consiste à construire un modèle de réseau de neurones convolutif (CNN) pour la classification d'images à partir du jeu de données MNIST. MNIST contient des images de chiffres manuscrits (de 0 à 9), et l'objectif est de reconnaître ces chiffres à partir des images en utilisant un modèle de deep learning.

Objectif : L'objectif principal est de :

Construire et entraîner un modèle CNN pour classer les images de chiffres du jeu de données MNIST.
Évaluer les performances du modèle en termes de précision sur les jeux de test.
Tester le modèle en chargeant des images manuscrites personnalisées et prédire le chiffre représenté sur l'image.

Langages utilisés : Python

Technologies et Bibliothèques :

NumPy : pour le traitement des données sous forme de tableaux.
Matplotlib : pour la visualisation des résultats d'entraînement et des prédictions./li>
PIL (Python Imaging Library) : pour le traitement des images téléchargées.
Google Colab : utilisé pour exécuter le code et charger des images directement.
TensorFlow/Keras : pour la création et l'entraînement du modèle CNN.

Modèles et outils :

Réseau de Neurones Convolutif (CNN):

Un modèle de deep learning conçu pour le traitement d'images. Il se compose de couches convolutives pour extraire les caractéristiques des images, de couches de pooling pour réduire la taille des cartes de caractéristiques, et de couches entièrement connectées pour effectuer la classification.

Architecture spécifique utilisée :
Couches Convolutives : Extraction des caractéristiques via des filtres 2D.
Couches MaxPooling : Réduction de la dimension des caractéristiques extraites.
Couche Dense : Classification finale en utilisant une fonction d'activation softmax.

Étapes du Projet :

Chargement du Jeu de Données MNIST :

Le jeu de données MNIST est chargé via mnist.load_data(). Il contient 60 000 images pour l'entraînement et 10 000 images pour les tests.

Prétraitement et normalisation

Les images du jeu de données sont : Redimensionnées pour correspondre au format (28x28x1). Normalisées en divisant les pixels par 255 afin que les valeurs soient entre 0 et 1. Les labels (chiffres de 0 à 9) sont convertis en format catégoriel via to_categorical().

Création du Modèle CNN :

Un modèle CNN est créé avec les étapes suivantes : Couches convolutives (Conv2D) pour l'extraction des caractéristiques. Couches de sous-échantillonnage (MaxPooling2D) pour réduire la taille des cartes de caractéristiques. Une couche entièrement connectée (Dense) pour la classification finale. Utilisation de la régularisation par Dropout pour éviter le surapprentissage.

Compilation du Modèle :

Le modèle est compilé avec l'optimiseur Adam et la fonction de perte categorical_crossentropy. La métrique choisie est la précision (accuracy).

Évaluation du modèle à l'aide de courbes de perte et d'accuracy

Après l'entraînement, le modèle est évalué sur le jeu de données de test pour obtenir la précision finale.

Matrice de confusion et visualisation des performances

Les courbes de précision et de perte sont tracées pour les phases d'entraînement et de validation, permettant de voir l'évolution des performances du modèle.

Chargement et Prédiction sur des Images Personnalisées :

Les utilisateurs peuvent télécharger leurs propres images manuscrites, qui sont prétraitées et redimensionnées en 28x28 pixels. Le modèle prédit ensuite le chiffre sur l'image, et les résultats sont affichés.

Code source : Retrouvez le code complet de ce projet sur Classification_Conv2net_MNIST.

Voir le Dashboard Interactif