Analyse d’images avec un Raspberry PI5

La présentation suivante et le programme présenté ont été réalisés à l’aide de Chat Gpt. L’application a été expérimentée sur un raspberry pi5 possédant 8 GO de ram. Les temps de réponse sont de l’ordre de quelques dizaines de secondes pour décrire une image et d’une dizaine de secondes pour répondre à une question.

Présentation du Programme d’Analyse Interactive d’Images

Le programme présenté est une application interactive développée avec Tkinter, conçue pour analyser des images à l’aide de modèles d’intelligence artificielle. Il offre deux fonctionnalités principales : la génération de descriptions d’images et la réponse à des questions posées en rapport avec ces images. Voici un aperçu détaillé des modules d’intelligence artificielle utilisés dans ce programme ainsi que les modules nécessaires à installer.

Modules d’Intelligence Artificielle Utilisés

  1. BLIP (Bootstrapping Language Image Pre-training)
    • Modules : BlipProcessor, BlipForConditionalGeneration, BlipForQuestionAnswering
    • Description : BLIP est utilisé pour deux tâches distinctes. D’une part, le modèle BlipForConditionalGeneration génère des descriptions d’images. D’autre part, le modèle BlipForQuestionAnswering répond à des questions spécifiques posées sur les images.
  2. MarianMT (Marian Machine Translation)
    • Modules : MarianMTModel, MarianTokenizer
    • Description : MarianMT est utilisé pour la traduction automatique entre l’anglais et le français. Les modèles Helsinki-NLP/opus-mt-en-fr et Helsinki-NLP/opus-mt-fr-en permettent de traduire les descriptions générées et les réponses des questions de l’anglais vers le français et vice versa.

Modules Python à Installer

Pour faire fonctionner ce programme, vous devez installer les modules suivants via pip :

certifi==2024.7.4
charset-normalizer==3.3.2
click==8.1.7
Cython==3.0.11
filelock==3.15.4
fsspec==2024.6.1
huggingface_hub==0.24.5
idna==3.7
Jinja2==3.1.4
joblib==1.4.2
MarkupSafe==2.1.5
mpmath==1.3.0
networkx==3.3
numpy==2.1.0
opencv-python-headless==4.10.0.84
packaging==24.1
pillow==10.4.0
PyYAML==6.0.2
regex==2024.7.24
requests==2.32.3
sacremoses==0.1.1
safetensors==0.4.4
sentencepiece==0.2.0
sympy==1.13.2
tokenizers==0.19.1
torch==2.4.0
torchaudio==2.4.0
torchvision==0.19.0
tqdm==4.66.5
transformers==4.44.0
typing_extensions==4.12.2
urllib3==2.2.2
Python

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *