AI & Tech01 juin 2026·By Valentin Boulaire·5 min read

Los modelos mundiales de AI son robótica de alimentación: 2026 Compute Tax

Los modelos mundiales pasaron de juguetes de vídeo a simuladores robot en 18 meses. La cuenta de GPU se triplicó silenciosamente. Por qué el cálculo descentralizado aún no es el fácil rescate.

El panda ha estado viendo modelos mundiales durante dieciocho meses. Comenzaron como lindos juguetes de vídeo que alucinaban marco por marco. Ahora están entrenando simuladores para robots humanoides, con facturas de GPU que harían un pequeño parpadeo. Worth pausing on, before another decentralized compute pitch deck afirma que ha resuelto el problema.

¿Qué es un modelo mundial, y por qué importa ahora?

Un modelo mundial es una red neuronal que aprende a predecir el siguiente estado de una escena. Alimentarlo píxeles, acciones y un poco de física, y alucina lo que debe pasar un segundo de ahora, dos segundos, diez segundos. Es lo más cercano que la AI moderna tiene a un motor de física interno, aprendido en lugar de codificado.

Según el equipo de investigación de DeepMind, [Genie 2 fue el primer modelo para generar entornos 3D jugables desde un solo impulso de imagen] (https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/), con hasta un minuto de despliegue consistente. Las imágenes de marketing parecían una demo Minecraft. La implicación real era diferente: un entorno de entrenamiento gratuito para cualquier agente que usted señala.

Los laboratorios de robótica se dieron cuenta primero. La formación de un humanoide real es lenta, costosa y tiende a romper el humanoide. Un modelo mundial le da episodios sintéticos infinitos para el costo de las horas de GPU. barato, en términos robóticos. Expensivo, en cualquier otro sentido.

From Genie 2 to industrial robot stacks

NVIDIA lanzó la misma idea en CES 2025, pero dirigida a la industria. [Cosmos es una familia de modelos de fundación que generan vídeo de conciencia física para entrenar robots y pilas de autoconducción] (https://www.nvidia.com/en-us/ai/cosmos/). El encuadre fue contundente: no necesitas un millón de millas reales, necesitas un millón de millas simuladas que parecen lo suficientemente reales para transferir.

Dieciocho meses después, el patrón está en todas partes. Wayve entrena las políticas de conducción en mundos latentes. Inteligencia Física enviada [Pi-Zero, una política de robot generalista abierta que aprendió de una mezcla de datos reales y sintéticos] (https://www.physicalintelligence.company/blog/pi0). 1X Technologies y Figure admiten silenciosamente, en entrevista después de la entrevista, que su pila humanid es mitad de datos reales y medio simulador.

El cambio interesante no es la existencia de un modelo grande. Es que la pila ahora asume experiencia sintética como una entrada primaria. Los píxeles son datos de entrenamiento. Las acciones son datos de capacitación. El modelo mundial en sí se ha convertido en infraestructura de entrenamiento, sentado una capa debajo de la política que un equipo robótico realmente quiere enviar.

The compute tax none pencils in

Aquí está la parte que se enfría en las notas. Un marco de despliegue del modelo mundial es aproximadamente un orden de magnitud más caro por token que un texto LLM token. El sistema está prediciendo vídeo comprimido a altas tasas de marco, condicionado a acciones, con consistencia temporal estirada durante un minuto completo. Eso es un montón de FLOPs por pixel.

Los escritos de la industria a finales de 2025 pusieron la brecha costo-inferencia entre los generadores de vídeo fronterizos y los LLM de texto equivalente en múltiples, no porcentajes, y las brechas de costos de capacitación son aún más amplias. Entrenar una sola política de robots que en realidad generaliza ahora está firmemente en el rango de siete cifras GPU-hora, antes de contar el simulador que produjo sus datos.

El contexto macro no ayuda. Total crypto market cap se sienta a [$2.57 billones al 1 de junio, con Bitcoin todavía 57.26% dominante] (https://www.coingecko.com/en/global-charts). Números redondos que no tienen nada que ver con la asignación de chips en Santa Clara. La subasta real es si un laboratorio robótico puede superar un fondo de cobertura o una nube soberana para el mismo grupo H200. Spoiler: el fondo de cobertura generalmente gana, y la nube soberana gana el resto.

Esa subasta crea una apertura obvia para las redes criptográficas. Si encajan a través de esa apertura es la pregunta más difícil, y la parte más decks saltan.

Where DePIN compute actually fits

Render, Akash, io.net y Bittensor compute subnets todos lanzan la misma línea: idle GPUs en todo el mundo, alquilado más barato que AWS o CoreWeave. Para las cargas de trabajo de inferencia, a veces es cierto. Cubrimos el debate [Cerebras y Groq inference economics la semana pasada] (/blog/2026-05-31-cerebras-groq-inference-bet), y la misma lógica se aplica a los modelos mundiales a tiempo de inferencia. Para la formación de un modelo mundial de fundación, sin embargo, la línea es principalmente ficción.

La formación requiere una interconexión de alta ancho de banda entre las GPU, tejidos NVLink de baja latencia o InfiniBand, y grupos que permanecen coherentes durante semanas. Alquilar veinte H100s de veinte sótanos diferentes no produce una carrera de entrenamiento usable. Produce veinte pesos de papel con un canal de discordia compartido.

[Akash Network publica los desglose de la carga de trabajo en su blog] (https://akash.network/blog) y es honesto en las discusiones de la hoja de ruta: los mercados de GPU ganan en la inferencia y en el ajuste fino, no en la preparación previa. Donde el computador DePIN encaja hoy es la cola larga. Investigadores que ejecutan ablaciones, estudios indie que generan activos, agentes de on-chain que necesitan una inferencia explosiva durante unos segundos a la vez. Esa cola es real, y está creciendo. Tampoco es el mercado de formación de fundaciones.

La división importa para proyectos de IA. Mundos sintéticos para un estudio de juego son un caso de uso cercano [computación descentralizada] (/blog/topic/ai-agents), porque cada escena es independiente y tolerante a latencia. La formación de políticas humanoides generalistas no lo es. Discutimos en nuestra [tesis de cadenas de bits para agentes de IA] (/blog/2026-05-18-ai-agents-cheap-chains-thesis) que el derecho adecuado entre las cargas de trabajo de IA y los cripto raíles es específico para la carga de trabajo. Los modelos mundiales demuestran el punto de nuevo, esta vez en mayor resolución.

What to watch next

Tres señales en el próximo trimestre. En primer lugar, si cualquier laboratorio importante publica números completos de costos de entrenamiento para un modelo mundial robot, no sólo costo de inferencia. En segundo lugar, si las redes DePIN comienzan a publicar datos de utilización desglosados por tipo de volumen de trabajo, en lugar de una cifra agregada que aplana a todos. En tercer lugar, si los proyectos de IA construyen economías on-chain, incluyendo [ plataformas de estilo zentrix] (/) atadas a activos on-chain, comience la capacidad de simulador de cripto para las rebanadas que realmente encajan.

El panda no está apostando por una respuesta limpia este trimestre. Los modelos mundiales son reales, el impuesto de cómputo es real, y la capa de comercialización sobre ambos es, como siempre, exactamente lo que siempre ha sido.

#ai#robotics#compute#depin#ai-gaming