Los navegadores solían ser ventanas. En 2026, están aprendiendo a conducir. Perplejidad enviada Cometa, OpenAI envió ChatGPT Agent (el remarcado de Operador), y Antropopic's Computer Use permite a Claude hacer clic, escribir y desplazarse como un interno con permisos. El panda ha estado viendo este convertirse en una categoría real. No porque las demos sean bonitas. Porque la economía de la unidad finalmente tiene sentido.
¿Qué es un navegador AI, exactamente?
Un navegador AI no es un chatbot pegado en Chrome. Es un tiempo de ejecución donde un modelo de lenguaje sostiene el teclado y el ratón, lee la página renderizada, decide qué hacer a continuación, y actúa directamente o pide al humano permiso. Tres productos concretos definen el espacio.
Perplejidad Cometa envía un navegador agente-primer construido en Chromium, con investigación, sumamarización y automatización de tareas conectado a la barra de direcciones. OpenAI ChatGPT El agente se ejecuta en una pestaña remota en la nube y expone un "ver trabajo" que permite tareas como reservar, comprar o rellenar formularios. Antropopic's Computer Use ofrece capturas de pantalla, clic y primitivos de tipo a través de la API, permitiéndoles construir su propio navegador-agente sin una interfaz de usuario alojada.
Tres arquitecturas diferentes. La misma dirección de viaje. El humano gradualmente deja de hacer clic. Si eso es progreso o falta de ayuda aprendida depende del día.
Comet, ChatGPT Agent, Claude: who does what
La superficie del producto es convergente. El embalaje no lo es.
Silencio Producto Silencio Uso primario Silencio Hosted UI
Silencio...
← Perplejidad Comet Silencio Investigación, hojear, automatizar Silencio Sí, Chromium-based Silencio Vivir Silencio Persistent profile
Silencio OpenAI ChatGPT Agent Silencioso Tareas, compras, formularios Silencio Sí, nube sandbox Silencio Vivir Silencio Per-task VM Silencio
Silencio Antropopic Computer Use ← Intección de Dev, aplicaciones personalizadas ← No, API solamente ← Caller-supplied
Según [Punto de lanzamiento de Uso Informático de Antrópico] (https://www.anthropic.com/news/3-5-models-and-computer-use), el modelo se expone intencionadamente como un primitivo de bajo nivel, no un producto terminado. Según [el anuncio Operador de OpenAI] (https://openai.com/index/introducing-operator/), la apuesta es delegar tareas de usuario final en sitios comerciales reales. Perplejidad, mientras tanto, las posiciones vienen alrededor de flujos de trabajo de investigación persistentes. La cobertura de la categoría es ahora tarifa estándar en [The Verge's AI desk] (https://www.theverge.com/ai-artificial-intelligence), que dice algo sobre dónde va el presupuesto de marketing.
El precio es la parte que nadie pone en el puesto de lanzamiento. ChatGPT El agente se sienta detrás de los diezmos pagados. El cometa es actualmente libre en la mayoría de las regiones. Las facturas de uso de computadora por token, y las capturas de pantalla comen el presupuesto de salida de la forma en que el vídeo HD comió ancho de banda en 2009. La demo más barata es raramente el despliegue de producción más barato.
Where the magic still breaks
Los demos se ven geniales. Los parámetros son más suaves. La propia evaluación publicada de Antrópico reporta que el modelo hace mal clic en vincula aproximadamente el siete por ciento del tiempo en tareas del mundo real. Ese es el número publicado. El inédito, después de CAPTCHAs, rebotes antibot y paredes de inicio de sesión, es menos halagador.
Tres modos de fallo aparecen en los tres productos. Latency: each step is a screenshot plus reasoning plus action, and even with the routing tricks covered in our reasoning-models collapse, a five-step task runs into multiple minutes of wall-clock time. Bouncers: cualquier sitio con Cloudflare, hCaptcha, o "eres un humano" bloques de fricción agentes de forma directa, y las paredes de consentimiento de galletas duplican el recuento de clics antes de que empiece el trabajo. Autoridad deriva: los agentes llenarán felizmente formularios con datos alucinados, y una tasa de alucinación de cuatro por ciento es aceptable en un chatbot e inaceptable en un flujo de checkout.
Ese último es el modo de fracaso que nadie quiere en una cubierta de marketing. El agente es útil hasta que presente la dirección de envío incorrecta en una compra real de $400.
What to watch next
Tres señales nos dirán que esta categoría está madurando en lugar de narrar. En primer lugar, precios por-tarea. Si los laboratorios más importantes envían un nivel "X cents per completed task" más alto que una facturación por cuenta propia, la demanda empresarial seguirá en un trimestre. La facturación per-token es hostil a las cargas de trabajo de agente con profundidad variable.
En segundo lugar, API de uso de herramientas reemplazando capturas de pantalla. El [Protocolo de Contexto Modelo] (https://www.anthropic.com/news/model-context-protocol) ya está anulando agentes hacia llamadas de herramientas estructuradas en lugar de raspado de pantalla. Los sitios que envían puntos finales de MCP serán mucho más fáciles para los agentes que los sitios que no lo hacen. Espere que los sitios del MCP-primer para anunciar el hecho de que una vez anuncian diseños optimizados para móviles.
Tercero, identidad con sandbox. El perfil persistente de Comet es una historia de privacidad esperando que suceda. La primera filtración credencial de un navegador de agente dará forma a la categoría más que cualquier punto de referencia.
Why this matters for crypto and Zentrix-style game
El agente on-chain meta de 2026 presupone que una AI puede mantener un navegador, firmar una transacción y parecer un "usuario" desde el punto de vista de un dApp. Los navegadores AI son la pila previa. Tres implicaciones siguen directamente.
La fricción a bordo es el más grande embudo matar en cripto, y un agente que lee un dApp UI entonces desencadena un impulso wallet elimina el fallo "No sabía qué botón hacer clic". Según [los datos globales de CoinGecko] (https://www.coingecko.com/en/global-charts), el cripto total market cap se encuentra en $2.20 billones al 7 de junio de 2026, con 17.354 activos activos rastreados, y el embudo de "curioso" a "primera transacción" todavía se filtra a cada paso. Los navegadores de IA son una cuña creíble en ese embudo, como esbozamos en [la guía criptográfica más amplia del agente AI] (/blog/ai-agent-crypto-2026-guide).
El tráfico impulsado por agentes también se ve diferente del tráfico humano, y los protocolos comenzarán a segmentar los niveles de tarifas y los límites de tarifas en consecuencia. Esperar atestaciones "humanas verificadas" y "este agente posee este wallet" afirma converger en los mismos primitivos de la ERC, que es parte de los agentes más amplios de la IA on-chain] (/blog/topic/ai-agents).
Y luego hay juegos. En mundos de estilo Zentrix donde los jugadores generan experiencias a través de los avisos, un navegador AI no es sólo el creador. También es el público. Una base de usuarios de agentes que pueden jugar, votar y pagar artículos en el juego es estructuralmente un embudo diferente de una base de usuarios de humanos. Ni Steam ni App Store tienen un lenguaje de política para ello.
La vista del panda: Los navegadores AI son producto real, no sólo narrativo. Ellos serán la capa donde la mayoría de los casos de "agente de IA cripto" usan realmente tierra. El navegador era el primer tiempo de funcionamiento de Internet. También se está convirtiendo en el primer agente en tiempo de ejecución.



