La présentation suivante et le programme présenté ont été réalisés à l’aide de Chat Gpt. L’application a été expérimentée sur un raspberry pi5 possédant 8 GO de ram. Les temps de réponse sont de l’ordre de quelques dizaines de secondes pour décrire une image et d’une dizaine de secondes pour répondre à une question.
Présentation du Programme d’Analyse Interactive d’Images
Le programme présenté est une application interactive développée avec Tkinter, conçue pour analyser des images à l’aide de modèles d’intelligence artificielle. Il offre deux fonctionnalités principales : la génération de descriptions d’images et la réponse à des questions posées en rapport avec ces images. Voici un aperçu détaillé des modules d’intelligence artificielle utilisés dans ce programme ainsi que les modules nécessaires à installer.
Modules d’Intelligence Artificielle Utilisés
- BLIP (Bootstrapping Language Image Pre-training)
- Modules :
BlipProcessor
,BlipForConditionalGeneration
,BlipForQuestionAnswering
- Description : BLIP est utilisé pour deux tâches distinctes. D’une part, le modèle
BlipForConditionalGeneration
génère des descriptions d’images. D’autre part, le modèleBlipForQuestionAnswering
répond à des questions spécifiques posées sur les images.
- Modules :
- MarianMT (Marian Machine Translation)
- Modules :
MarianMTModel
,MarianTokenizer
- Description : MarianMT est utilisé pour la traduction automatique entre l’anglais et le français. Les modèles
Helsinki-NLP/opus-mt-en-fr
etHelsinki-NLP/opus-mt-fr-en
permettent de traduire les descriptions générées et les réponses des questions de l’anglais vers le français et vice versa.
- Modules :
Modules Python à Installer
Pour faire fonctionner ce programme, vous devez installer les modules suivants via pip :
certifi==2024.7.4
charset-normalizer==3.3.2
click==8.1.7
Cython==3.0.11
filelock==3.15.4
fsspec==2024.6.1
huggingface_hub==0.24.5
idna==3.7
Jinja2==3.1.4
joblib==1.4.2
MarkupSafe==2.1.5
mpmath==1.3.0
networkx==3.3
numpy==2.1.0
opencv-python-headless==4.10.0.84
packaging==24.1
pillow==10.4.0
PyYAML==6.0.2
regex==2024.7.24
requests==2.32.3
sacremoses==0.1.1
safetensors==0.4.4
sentencepiece==0.2.0
sympy==1.13.2
tokenizers==0.19.1
torch==2.4.0
torchaudio==2.4.0
torchvision==0.19.0
tqdm==4.66.5
transformers==4.44.0
typing_extensions==4.12.2
urllib3==2.2.2