AI & Tech19 juin 2026·By Valentin Boulaire·6 min read

Gemma 4 est une source ouverte: Ce que les agents d'IA à la chaîne héritent

Gemma 4 est devenu Apache 2.0 en avril 2026. Avec 400M téléchargements dans la famille Gemma et 17.000+ agents sur la chaîne en direct, l'inférence libre n'est plus facultative.

Google a publié Gemma 4 le 2 avril 2026, sous licence Apache 2.0. Le panda a lu les notes de sortie. Non pas parce que Google expédie un nouveau modèle est surprenant, mais parce que cette décision de licence supprime un obstacle qui a maintenu l'IA open-source en marge du déploiement commercial. 400 millions de téléchargements dans la famille Gemma plus tard, l'inférence de poids ouvert est devenue le choix par défaut pour les constructeurs qui ne veulent pas payer par jeton pour toujours.

L'IA à source ouverte gagne la course d'inférence

Le récit commun pour 2026 est que l'IA frontière appartient à OpenAI et Anthropic, avec tous les autres construisant sur leurs API. [Comme l'a montré l'analyse récente de leurs demandes concurrentes d'IPO] (/blog/openai-anthropic-ipo-compute), ces deux sociétés ont commandé respectivement 852 milliards de dollars et 965 milliards de dollars en évaluation lorsqu'elles sont entrées sur les marchés publics ce printemps. Le capital et la part de marché de l'inférence sont toutefois différents.

Selon [Google's Open Source Blog] (https://opensource.googleblog.com/2026/03/gemma-4-expanding-the-gemmaverse-with-apache-20.html), les développeurs ont téléchargé des modèles Gemma plus de 400 millions de fois depuis le lancement de la première génération, et la communauté a produit plus de 100 000 variantes. La famille Gemma 4 est livrée en cinq tailles :

Modèle Architecture Cible primaire

Oui.
Appareils de bord, mobiles
Edge avec entrée audio
Indice de moyenne distance
26B A4B: Mélange d'experts
31 B Sensé Réflexion haute performance

Le 31B s'est classé au troisième rang mondial sur le classement de texte Arena AI. Troisième. Derrière des modèles frontières de milliards de dollars fermés. Sur les poids ouverts.

L'IA open-source ne se contente pas de rattraper la frontière. Il est en train de construire un niveau parallèle qui traite adéquatement la majorité des cas d'utilisation commerciale, à une fraction du coût.

Qu'est-ce que la licence Apache 2.0 Débloque réellement

Gemma 3 expédié sous une licence spécifique à Google avec des restrictions commerciales. Gemma 4 est livré sous Apache 2.0 : la même licence qui régit le noyau Linux et la plupart des logiciels utilisent Internet moderne. Aucune négociation requise, aucun plafonnement de volume, aucun frais d'utilisation.

Google décrit trois effets pratiques. Autonomie : la liberté de construire et de modifier les modèles sans approbation. Contrôle : la possibilité d'exécuter des modèles localement sans dépendance cloud. Clarté : des conditions de licence transparentes que les équipes juridiques peuvent évaluer et approuver sans interprétation longue.

Ce troisième pilier compte plus que les deux premiers pour l'adoption des entreprises. La licence Vague est le tueur silencieux du déploiement de modèles open-source dans des environnements commerciaux. Apache 2.0 n'est pas vague.

Les capacités soutiennent le cas de licence. Les plus grands modèles de Gemma 4 supportent jusqu'à 256K jetons de contexte, couvrent plus de 140 langues, et couvrent à la fois les architectures Dense et Mixture-of-Experts. Le déploiement des bords est pratique aux tailles E2B et E4B. Les cibles du modèle 31B Dense utilisent des cas qui étaient auparavant le domaine exclusif des appels API Cloud.

Pourquoi l'IA est-elle importante pour les agents de chasse ?

La question semble rhétorique. Ça ne l'est pas.

La plupart des agents on-chain appellent aujourd'hui des API à inférence centralisée. OpenAI, anthropique, parfois Mistral. Pratiquement pratique, techniquement fiable, et aussi une contradiction architecturale: un protocole prétendant être décentralisé alors que sa couche de prise de décision fonctionne sur un centre de données américain, sous réserve des prix, des limites tarifaires et de l'exposition réglementaire de ce fournisseur.

La interdiction d'exportation anthropique de juin 2026 a fait le béton de risque. Une directive gouvernementale a suspendu l'accès de Claude Fable 5 dans certaines juridictions. Les agents dépendant de cette API ont cessé de fonctionner dans ces régions du jour au lendemain. Les agents étaient on-chain. Leur intelligence ne l'était pas.

Les modèles à poids ouvert éliminent le seul point de défaillance. Si Gemma 4 31B est la couche d'inférence, il n'y a pas d'API à restreindre. Aucune révision des termes de service pour briser votre pipeline. Le modèle est des données. Tu la possèdes.

Selon CryptoBriefing's reporting on ERC-8183, Virtuals Protocol gère plus de 17 000 agents actifs on-chain et a généré 39,5 millions de dollars en revenus cumulatifs. Cette activité économique a besoin d'inférence. La pile sur laquelle ces agents fonctionnent actuellement est, pour la plupart, centralisée. ERC-8183, co-auteur du Virtuals Protocol et de l'équipe dAI de la Fondation Ethereum en février 2026, définit la façon dont les agents s'embauchent, s'assument les paiements et vérifient les produits livrables on-chain. Pour que cette norme de commerce d'agent atteigne une véritable décentralisation, la couche d'inférence doit suivre.

Le calque manquant : des modèles ouverts à l'inférence décentralisée

Les modèles à poids ouvert règlent le problème des licences. Les réseaux de calcul décentralisés tentent de régler le problème de l'infrastructure. L'écart entre eux est réel.

Akash Network offre un calcul GPU aux prix déclarés inférieurs de 60-80% à AWS ou Google Cloud, fonctionnant sur un marché de fournisseurs distribués. Bittensor exploite un réseau d'apprentissage automatique où des sous-réseaux spécialisés gèrent des tâches d'inférence spécifiques. Les deux existent. Ni la simplicité opérationnelle d'un appel API REST.

Exécuter Gemma 4 31B sur Akash nécessite la configuration de conteneur, la configuration de réseau et l'infrastructure de serveur de modèles que la plupart des développeurs d'agents ne veulent pas gérer. Pour la plupart des projets à l'heure actuelle, appeler le point d'arrêt d'OpenAI gagne toujours sur la friction, même quand il perd sur le coût et l'indépendance architecturale. L'option centralisée est plus facile. C'est pourquoi elle demeure dominante.

Le résumé honnête : Apache 2.0 signifie que les modèles sont libres. Cela ne signifie pas que le calcul est accessible. Les cadres d'inférence comme un service conçus pour l'orchestration d'agents on-chain, avec des garanties SLA et une simplicité équivalente à l'API, sont la couche manquante. Plusieurs équipes se construisent vers elle. Le déploiement de qualité de production n'est pas encore arrivé.

Que regarder dans les 90 prochains jours

Trois signaux, par ordre de concision.

La famille de modèles Gemma 4 générera des milliers de nuances fines au cours des prochains mois. Les modèles les plus pertinents pour les constructeurs on-chain : modèles formés sur les données blockchain pour la classification des activités wallet, la documentation du protocole Q&A, et le résumé des transactions on-chain. Les variantes de plus de 100 000 communautés comprennent déjà des expériences précoces dans ces directions. Apache 2.0 signifie que ces dérivés peuvent être livrés commercialement sans négociation.

ERC-8183 demeure en état d'ébauche en juin 2026. Le mouvement vers les étapes d'examen ou de fin d'étape marquerait un véritable engagement d'adoption de la communauté des développeurs Ethereum. Pour le contexte en cours sur la pile de protocole d'agents en évolution, le cluster AI Agents couvre les développements connexes, y compris les portefeuilles on-chain agents déjà déployés sur le réseau principal.

Selon [Données du marché mondial de CoinGecko] (https://www.coingecko.com/en/global-charts), la capitalisation totale du marché cryptographique s'élevait à 2,24 billions de dollars le 19 juin 2026, suivi de 17 434 cryptomonnaies actives. Le segment AI-agent est une petite fraction de cela. Mais c'est la fraction qui construit la couche d'infrastructure que le prochain cycle d'applications on-chain fonctionnera. Les plateformes de jeu ciblant les mondes générés par l'IA avec les économies on-chain, le genre d'architecture Zentrix travaille vers, observent la courbe des coûts d'inférence ouverte spécifiquement. La différence entre 0,001 $ et 0,0001 $ par appel d'inférence détermine si une économie de jeu autochtone est financièrement viable ou subventionnée perpétuellement par les budgets de l'API.

Le panda mettra à jour ses antécédents lorsque l'inférence décentralisée atteindra la simplicité équivalente à l'API. Pour l'instant : les modèles sont gratuits. L'infrastructure est en voie de rattrapage.

#ai#open-source-ai#ai-agents#compute#ai-industry

L'IA à source ouverte gagne la course d'inférence

Qu'est-ce que la licence Apache 2.0 Débloque réellement

Le calque manquant : des modèles ouverts à l'inférence décentralisée

The panda's weekly take, in your inbox

Join the Newsletter

Keep reading

Open Models Killed the Premium Inference Tax in 2026

Why Reasoning Models Just Broke On-Chain Agent Math

Open-Source LLMs vs AI Agent Tokens: A 2026 Reckoning