Les navigateurs étaient des fenêtres. En 2026, ils apprennent à se conduire. Perplexité expédié Comet, OpenAI expédié ChatGPT Agent (la remarque de l'opérateur), et Anthropic's Computer Use permet à Claude de cliquer, de taper et de défiler comme un interne avec des permissions. Le panda a regardé ce tour en une vraie catégorie. Pas parce que les démos sont jolies. Parce que l'économie unitaire a finalement un sens.
Qu'est-ce qu'un navigateur AI, exactement ?
Un navigateur AI n'est pas un chatbot collé sur Chrome. C'est un runtime où un modèle de langue tient le clavier et la souris, lit la page rendue, décide quoi faire ensuite, et soit agit directement ou demande la permission de l'homme. Trois produits en béton définissent l'espace.
Perplexity Comet expédie un premier navigateur d'agent construit sur Chrome, avec la recherche, la synthèse et l'automatisation des tâches câblé dans la barre d'adresse. OpenAI ChatGPT Agent fonctionne dans un onglet à distance en boîte de nuages et expose un "watch me work" des moyens pour des tâches comme la réservation, le shopping, ou remplir des formulaires. L'utilisation informatique d'Anthropic donne aux développeurs une capture d'écran, un clic et un type primitifs à travers l'API, leur permettant de construire leur propre agent de navigateur sans interface utilisateur hébergée.
Trois architectures différentes. Même direction de voyage. L'humain cesse progressivement de cliquer. Que ce soit le progrès ou l'impuissance apprise dépend du jour.
Qui fait quoi ?
La surface du produit est convergente. L'emballage ne l'est pas.
Produit d'utilisation principale d'interface utilisateur hébergée d'accès Web d'accès
- Oui.
Perplexité Comète Recherche, navigation, automatisme Oui, basé sur le chrome
OpenAI ChatGPT Agent (en anglais seulement) Tâches, shopping, forms (en anglais seulement) Oui, cloud sandbox (en anglais seulement) Live (en anglais seulement)
Utilisation de l'ordinateur anthropique Intégration de Dev, applications personnalisées
Selon [Anthropic's Computer Use launch post] (https://www.anthropic.com/news/3-5-models-and-computer-use), le modèle est intentionnellement exposé comme un produit primitif de faible niveau, et non un produit fini. Selon l'annonce de l'opérateur d'OpenAI (https://openai.com/index/introducing-operator/), le pari porte sur la délégation des tâches de l'utilisateur final sur de vrais sites de vente au détail. La perplexité, quant à elle, place Comet autour de flux de travail de recherche persistants. La couverture de la catégorie est désormais le tarif standard à [Le bureau AI de Verge] (https://www.theverge.com/ai-artificial-intelligence), qui dit quelque chose sur l'évolution du budget marketing.
Le prix est la partie que personne ne met dans le poste de lancement. ChatGPT L'agent est assis derrière les niveaux payés. La comète est actuellement gratuite dans la plupart des régions. Ordinateur Utilisez les factures par jeton, et les captures d'écran mangent le budget de sortie comme la vidéo HD a mangé la bande passante en 2009. La démo la moins chère est rarement le déploiement de production la moins chère.
Là où la magie éclate encore
Les démos sont superbes. Les repères sont plus doux. Les propres rapports d'évaluation publiés par Anthropic indiquent que le modèle fait un faux clic sur environ 7 % du temps consacré aux tâches réelles. C'est le numéro publié. Celui qui n'a pas été publié, après CAPTCHAs, les anti-bots et les murs de connexion, est moins flatteur.
Trois modes de défaillance apparaissent dans les trois produits. Latence: chaque étape est une capture d'écran plus le raisonnement plus l'action, et même avec les astuces de routage couvertes dans [nos modèles de raisonnement de la panne] (/blog/reasoning-models-agent-latency), une tâche en cinq étapes court dans plusieurs minutes de l'heure de l'horloge-mur. Bounceurs: n'importe quel site avec Cloudflare, hCaptcha, ou "êtes-vous un humain" des agents de friction, et les murs de cookie-consent doublent le nombre de clics avant même que le travail commence. Dérivation d'autorité : les agents rempliront volontiers des formulaires de données hallucinées, et un taux d'hallucination de 4 % est acceptable dans un chatbot et inacceptable dans un flux de caisse.
Ce dernier est le mode d'échec que personne ne veut dans un jeu de marketing. L'agent est utile jusqu'à ce qu'il soumette la mauvaise adresse d'expédition sur un achat réel $400.
Que regarder après
Trois signaux nous diront que cette catégorie mûrit plutôt que de narrer. Premièrement, le prix par tâche. Si les grands laboratoires expédient un niveau de « X cents par tâche terminée » plutôt que de facturer par jeton, la demande de l'entreprise suivra dans un quart. La facturation par jeton est hostile aux charges de travail des agents avec une profondeur variable.
Deuxièmement, utiliser des API pour remplacer les captures d'écran. Le Model Context Protocol est déjà en train d'orienter les agents vers les appels d'outils structurés au lieu du grattage d'écran. Les sites qui expédient des paramètres de CPM seront nettement plus faciles pour les agents que les sites qui ne le sont pas. Attendez-vous à ce que les premiers sites du MCP annoncent le fait qu'ils ont annoncé des mises en page optimisées pour les mobiles.
Troisièmement, l'identité en boîte de sable. Le profil persistant de Comet est une histoire de vie privée qui attend. La première fuite d'identification d'un navigateur mandataire façonnera la catégorie plus que n'importe quelle référence.
Pourquoi ça compte pour les jeux de type crypto et Zentrix
L'agent on-chain méta de 2026 présuppose qu'une AI peut tenir un navigateur, signer une transaction et ressembler à un "utilisateur" du point de vue d'un dApp. Les navigateurs AI sont la pile préalable. Trois implications suivent directement.
Le frottement à bord est le plus gros tueur d'entonnoir dans crypto, et un agent qui lit une interface utilisateur dApp déclenche ensuite une invitation wallet supprime l'échec "Je ne savais pas quel bouton cliquer". Selon [Données mondiales de CoinGecko] (https://www.coingecko.com/en/global-charts), le chiffre total market cap se situe à 2,20 billions de dollars au 7 juin 2026, avec 17 354 actifs suivis, et l'entonnoir de "curieux" à "première transaction" fuit toujours à chaque étape. Les navigateurs AI sont un coin crédible dans cet entonnoir, comme nous l'avons esquissé dans [le guide crypto plus large de l'agent AI] (/blog/ai-agent-crypto-2026-guide).
Le trafic dirigé par l'agent semble également différent du trafic humain, et les protocoles commenceront à segmenter les niveaux de droits et les limites de tarifs en conséquence. S'attendre à des attestations "humaines vérifiées" et "celui-ci possède ce wallet" prétend converger sur les mêmes primitifs ERC, qui fait partie de l'histoire plus large des [agents d'AI on-chain] (/blog/topic/ai-agents).
Et puis il y a le jeu. Dans les mondes de style Zentrix où les joueurs génèrent des expériences via des invites, un navigateur AI n'est pas seulement le créateur. C'est aussi le public. Une base d'utilisateurs d'agents qui peuvent jouer, voter et payer pour les éléments dans le jeu est structurellement un entonnoir différent d'une base d'utilisateurs d'humains. Ni Steam ni l'App Store n'ont encore de langage politique.
La vue du panda : les navigateurs AI sont un produit réel, pas seulement narratif. Ils seront la couche où la plupart des « agents d'AI crypto » utilisent des cas effectivement atterrir. Le navigateur était le premier fonctionnement d'Internet. Il devient aussi le premier agent.



