Master Gemma 4 in 20 Minutes — Veille IA

En une phrase

Google a lancé Gemma 4, un modèle open-weight capable de fonctionner localement sur PC et téléphone, offrant gratuité, utilisation hors ligne et confidentialité pour des interactions multimodales, sans dépendance au cloud.

Points clés

Modèle Open-Weight Local : Gemma 4 est un modèle open-weight de Google, permettant de télécharger et d'exécuter les fichiers du modèle directement sur votre matériel (PC, téléphone). Il offre une utilisation gratuite sans abonnement, avec une architecture axée sur la confidentialité car les données restent en local.
Capacités Avancées : Ce modèle multimodal prend en charge le texte, les images, les documents et l'audio. Il couvre plus de 140 langues, est basé sur la technologie de Gemini 3 et est distribué sous licence Apache 2.0 pour un usage commercial libre.
Différentes Tailles de Modèles : Gemma 4 est disponible en quatre tailles (2B, 4B, 26B MoE, 31B Dense) pour s'adapter à diverses configurations matérielles, des téléphones aux GPU d'entreprise. Il offre une fenêtre de contexte allant jusqu'à 256K tokens.
Installation sur Ordinateur (via Ollama) : L'installation sur PC nécessite le téléchargement d'Ollama comme interface utilisateur, puis le téléchargement du modèle Gemma 4 via la ligne de commande (`ollama pull [nom_du_modèle]`). Pour les utilisateurs Windows, il faut configurer les paramètres graphiques pour assigner le GPU à Ollama afin d'optimiser les performances (automatique sur Mac M-series).
Installation sur Téléphone (via Google AI Edge Gallery) : Pour les téléphones, l'installation se fait via l'application officielle Google AI Edge Gallery. L'utilisateur télécharge simplement le modèle souhaité (typiquement E2B ou E4B) et accède à diverses fonctionnalités multimodales (chat, analyse d'image, transcription audio) via des tuiles dédiées.
Optimisation des Performances et de l'Usage : Il est conseillé de ne pas maximiser la longueur du contexte dans les paramètres pour éviter une consommation excessive de RAM, des réponses lentes et une diminution de la qualité des résultats. Il est préférable d'utiliser une valeur intermédiaire (ex: 16K ou 32K tokens).

Ressources

Ollama — exécuter des LLM en local et fournir l'interface utilisateur pour Gemma 4.
Google AI Edge Gallery — application officielle de Google pour exécuter Gemma 4 sur téléphone (Android).
Gemma 4 — modèle open-weight de Google.
Gemini 3 — technologie de recherche sur laquelle Gemma 4 est basé.
Quen 3.5 — modèle comparable mentionné.
GLM5 — modèle comparable mentionné.
Kim K 2.5 — modèle comparable mentionné.
Claude — assistant IA utilisé pour un aperçu matériel.
Wikipedia — outil accessible via les "agent skills" de l'application mobile.
Apache 2.0 — licence sous laquelle Gemma 4 est publié.
Mobile action — modèle plus petit (270M paramètres) utilisé dans des démonstrations techniques de l'application mobile.