AI & Tech01 juin 2026·By Valentin Boulaire·5 min read

Les modèles mondiaux d'IA mangent la robotique: 2026 Calculer la taxe

Les modèles mondiaux sont passés des jouets vidéo aux simulateurs de robots en 18 mois. La facture du GPU a triplé. Pourquoi le calcul décentralisé n'est pas encore le sauvetage facile.

Le panda regarde des mannequins du monde depuis dix-huit mois. Ils ont commencé en tant que jouets vidéo mignons que cadre halluciné par cadre. Ils sont maintenant en train d'entraîner des simulateurs pour les robots humanoïdes, avec des factures GPU qui ferait un petit pli de pays. Il vaut la peine de s'arrêter, avant qu'une autre plate-forme de calcul décentralisé prétende avoir résolu le problème.

Qu'est-ce qu'un modèle mondial, et pourquoi est-ce important maintenant?

Un modèle mondial est un réseau neuronal qui apprend à prédire l'état suivant d'une scène. Feed it pixels, actions et un peu de physique, et il hallucine ce qui devrait arriver une seconde à partir de maintenant, deux secondes, dix secondes. C'est la chose la plus proche de l'IA moderne à un moteur de physique interne, appris plutôt que codé.

Selon l'équipe de recherche de DeepMind, [Genie 2 a été le premier modèle à générer des environnements 3D jouables à partir d'une seule impulsion d'image] (https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/), avec jusqu'à une minute de déploiement cohérent. Les photos marketing ressemblaient à une démo Minecraft. L'implication réelle était différente: un environnement d'entraînement gratuit pour tout agent que vous pointez.

Les laboratoires de robotique l'ont remarqué en premier. Entraîner un humanoïde dans le monde réel est lent, coûteux, et tend à briser l'humanoïde. Un modèle mondial vous donne des épisodes synthétiques infinis pour le coût des heures GPU. Pas cher, en termes de robotique. C'est cher, en tous autres termes.

De Génie 2 aux piles de robots industriels

NVIDIA a lancé la même idée au CES 2025, mais à destination de l'industrie. [Cosmos est une famille de modèles de fondation qui génèrent de la vidéo de physique pour former des robots et des piles auto-conduites] (https://www.nvidia.com/en-us/ai/cosmos/). Le cadrage était contondant : vous n'avez pas besoin d'un million de miles réels, vous avez besoin d'un million de miles simulés qui semblent assez réels pour être transférés.

Dix-huit mois plus tard, le modèle est partout. Wayve forme des politiques de conduite dans les mondes latents. L'Intelligence Physique a expédié [Pi-Zero, une politique de robot généraliste ouverte qui a appris d'un mélange de données réelles et synthétiques] (https://www.physicalintelligence.company/blog/pi0). 1X Technologies et Figure reconnaissent discrètement, dans l'entrevue après l'entrevue, que leur pile humanoïde est à moitié de données réelles et demi déploiements de simulateur.

Le changement intéressant n'est pas l'existence d'un grand modèle. C'est que la pile assume maintenant l'expérience synthétique comme une entrée primaire. Les pixels sont des données de formation. Les actions sont des données de formation. Le modèle mondial lui-même est devenu l'infrastructure d'entraînement, en dessous de la politique qu'une équipe de robotique veut réellement expédier.

La taxe de calcul personne ne crayonne

Voici la partie qui se glisse dans les keynotes. Un cadre de déploiement de modèle mondial est à peu près un ordre de grandeur plus cher par jeton qu'un jeton LLM texte. Le système prédise la vidéo compressée à des taux d'images élevés, conditionnés par des actions, avec une consistance temporelle étendue sur une minute. Ça fait beaucoup de FLOPs par pixel.

Les écritures de l'industrie de la fin de 2025 ont mis l'écart de coûts d'inférence entre les générateurs vidéo frontaliers et les LLM de texte équivalents à des multiples, et non des pourcentages, et les écarts de coûts de formation sont encore plus importants. La formation d'une seule politique robotisée qui se généralise est maintenant fermement dans la gamme à sept chiffres GPU-heure, avant de compter le simulateur qui a produit ses données.

Le contexte macro n'aide pas. Le chiffre total market cap se situe à [2,57 billions de dollars au 1er juin, la Bitcoin demeurant dominante à 57,26 %] (https://www.coingecko.com/en/global-charts). Nombres ronds qui n'ont rien à voir avec l'allocation des puces à Santa Clara. La vraie vente aux enchères est de savoir si un laboratoire robotique peut surenchèrer un hedge fund ou un cloud souverain pour le même cluster H200. Spoiler : le hedge fund gagne généralement, et le cloud souverain gagne le reste.

Cette vente aux enchères crée une ouverture évidente pour les réseaux de calcul cryptographique. S'ils s'adaptent à cette ouverture est la question la plus difficile, et la partie la plupart des ponts sautent.

Où DePIN calcule en fait

Render, Akash, io.net et Bittensor calculent tous la même ligne : les GPU oisifs du monde entier, loués moins cher que AWS ou CoreWeave. Pour les charges de travail à inférence, cela est parfois vrai. Nous avons couvert [le débat sur l'économie de l'inférence Cerebras et Groq la semaine dernière] (/blog/2026-05-31-cerebras-groq-inference-bet), et la même logique s'applique aux modèles mondiaux au moment de l'inférence. Toutefois, pour former un modèle mondial de fondation, la ligne est essentiellement de la fiction.

La formation nécessite une connexion à haut débit entre les GPU, les tissus NVLink ou InfiniBand à faible latence et les grappes qui restent cohérentes pendant des semaines. Louer vingt H100 de vingt sous-sols différents ne produit pas une course d'entraînement utilisable. Il produit vingt poids de papier avec un canal Discord partagé.

[Akash Network publie des pannes de charge de travail sur son blog] (https://akash.network/blog) et est honnête dans les discussions sur la feuille de route: les marchés GPU gagnent sur l'inférence et sur le réglage fin, pas sur la pré-formation. Où DePIN calcule est aujourd'hui la queue longue. Chercheurs exécutant des ablations, studios de jeux indépendants générant des actifs, agents on-chain nécessitant une inférence effrénée pendant quelques secondes à la fois. Cette queue est réelle, et elle grandit. Ce n'est pas non plus le marché de la formation de base.

La division des questions pour les projets d'IA-gaming. Les mondes synthétiques pour un studio de jeu sont un cas d'utilisation quasi parfait [compute décentralisé] (/blog/topic/ai-agents), car chaque scène est indépendante et tolérante à la latence. La formation générale en politique humanoïde ne l'est pas. Nous avons fait valoir dans notre [thèse sur les chaînes de cheap pour les agents de l'IA] (/blog/2026-05-18-ai-agents-cheap-chains-thesis) que le bon ajustement entre les charges de travail de l'IA et les rails cryptographiques est spécifique à la charge de travail. Les modèles mondiaux le prouvent encore une fois, cette fois à haute résolution.

Que regarder après

Trois signaux au cours du prochain trimestre. Tout d'abord, si un laboratoire majeur publie des chiffres complets de coûts de formation pour un modèle mondial de robot, pas seulement le coût d'inférence. Deuxièmement, si les réseaux DePIN commencent à publier des données d'utilisation ventilées par type de charge de travail, au lieu d'un chiffre agrégé qui flatte tout le monde. Troisièmement, si les projets de création de chaînes de l'IA construisent des économies de on-chain, y compris des [plates-formes de type Zentrix] (/) liées à des actifs de on-chain, commencez à souder la capacité du simulateur à partir de rails de calcul cryptographique pour les tranches qui conviennent réellement.

Le panda ne parie pas sur une réponse propre ce trimestre. Les modèles mondiaux sont réels, la taxe de calcul est réelle, et la couche marketing au-dessus des deux est, comme toujours, exactement ce qu'elle a toujours été.

#ai#robotics#compute#depin#ai-gaming

La taxe de calcul personne ne crayonne

Related reading

The panda's weekly take, in your inbox

Join the Newsletter

Keep reading

io.net Burns 12M Tokens: Why Crypto Compute Just Got Real

Humanoid Robots Shipped in 2026: The Compute Bottleneck

NVIDIA Paid $20B for Groq. Cerebras Still Got $5.5B.