Les PNC sont devenus plus intelligents deux fois cette décennie. Une fois dans les remorques, jamais dans les jeux d'expédition. En 2026 qui a finalement fissuré: NVIDIA ACE, Inworld AI, et une poignée de piles internes à Krafton, Sony et Ubisoft mettent des personnages générateurs réels dans de vraies constructions. Le panda a regardé ces démos pendant des années et est légèrement intéressé à nouveau.
"Livraison" signifie encore quelques titres phares et beaucoup de mises en garde. Latence, coût, droits de voix et hallucination font en 2026 le travail que le budget polygone a fait en 2003: vous dire ce qui est techniquement possible et ce qui est économiquement possible, puis rire de l'écart.
Qu'est-ce qu'un PNC d'IA, et pourquoi a-t-il pris vingt ans ?
Un NPC AI est un personnage non-joueur dont le dialogue, le comportement, ou les deux sont produits par un modèle génératif à l'exécution, au lieu d'un designer écriture à la main chaque ligne et chaque branche d'arbre de comportement. Le personnage peut répondre à quelque chose d'un écrivain jamais prévu. Il peut changer d'humeur en fonction du contexte. Dans certaines démos, il se souvient de ce que vous avez dit il y a trois fois.
C'était théoriquement faisable depuis GPT-2. Pratiquement, trois problèmes l'ont tué. D'abord, latence : la réponse sous 800 ms se sent conversationnelle, tout ce qui est au-dessus se sent cassé. Deuxièmement, coût : l'inférence LLM en temps réel par NPC, par joueur concurrent, multipliée sur un jeu en direct avec un million d'utilisateurs quotidiens, n'est pas un élément de ligne que la facture cloud de votre studio est prête à absorber. Troisièmement, le contrôle : un personnage qui peut dire n'importe quoi peut aussi dire quelque chose qui se termine dans un procès. Les studios ont promis des NPC intelligents depuis Half-Life. Les renseignements signifient généralement "vous suivra dans un couloir".
Ce qui a changé en 2026, c'est que les petits modèles sont devenus plus rapides, l'inférence des bords a été moins chère, et l'outillage de garde-corps est passé de rire.
Les Trois Stacks Expédition en 2026
Les groupes de travail sérieux en trois endroits.
NVIDIA ACE est le jeu de plateforme. La [suite de microservices ACE] (https://developer.nvidia.com/ace) de NVIDIA regroupe la reconnaissance automatique de la parole, un petit modèle de langue appelé Nemotron, text-to-speech neuronal, et Audio2Face pour lip-sync, conçu pour fonctionner sur un processeur RTX local avec repli nuageux. Le tangage est sous-une seconde de latence sur une carte de génération actuelle. NVIDIA a montré Mecha BREAK avec des coéquipiers de l'ACE à GDC. Les démos ont marché, dans une salle de démo.
Inworld AI est la plate-forme de jeu avec une forme différente. Inworld vend un runtime qui gère persona de caractère, mémoire, sécurité et voix, abstrait de n'importe quel modèle fournisseur. Par [Documentation du développeur Inworld] (https://docs.inworld.ai/), les caractères sont configurés avec des motivations, des défauts et des règles cérébrales, puis exposés via SDKs for Unity, Unreal et le web. Disney, Niantic et Ubisoft sont sur la liste des partenaires. Le concept NEO NPC d'Ubisoft à GDC 2024 a fonctionné sur ce genre de pile.
Le chemin intérieur est ce que les studios choisissent quand ils expédient à l'échelle. La vie de Krafton sim inZOI est livrée avec ce qu'elle appelle Smart Joy, un petit modèle on-device qui permet au Zoi (le caractère sim) de réagir en-caractère aux choix des joueurs. Le groupe de recherche de Sony a publié sur des pipelines locaux similaires. L'économie ne fonctionne que lorsque vous contrôlez votre propre modèle, votre propre quantification et votre propre budget d'inférence. Les diapositives marketing à ce sujet sont nettement plus courtes.
Où les démos se brisent encore
Trois murs empêchent les NPC d'autres jeux.
La voix est le premier mur. Une ligne de dialogue générative parlée par une voix générative clonée d'un acteur SAG-AFTRA sans consentement se termine par une grève. La grève des artistes du jeu vidéo de 2024 était en grande partie à propos de cela. Par [la couverture par le Verge des retombées de la grève] (https://www.theverge.com/games/sag-aftra-video-game-strike), les clauses AI demeurent la clause litigieuse. La plupart des titres actuels utilisent du texte génératif avec des acteurs vocaux embauchés enregistrant les branches les plus probables, ce qui est un compromis plus qu'une solution.
Latence est le deuxième mur. L'inférence de bord sur une console s'améliore, mais un compagnon bavard NPC dans un monde ouvert doit partager les cycles GPU avec le rendeur et le moteur de physique. Un studio avec un budget de 16 ms frame n'aime pas ajouter un aller-retour de 300 ms LLM chaque fois que vous passez devant un bargarde.
Le coût est le troisième mur. Inworld's public pricing page commence pas cher pour les prototypes et les balances rapidement au volume de production. NVIDIA ACE fonctionne localement évite les coûts par appel mais décharge la taxe d'inférence sur le GPU du joueur, ce qui signifie que beaucoup d'utilisateurs vont le déplacer. La conclusion honnête de conception de jeu: NPC AI en 2026 sont une fonctionnalité de luxe, pas un défaut. Spoiler : les diapositives marketing ne diront pas "luxury".
Pourquoi ça compte pour Crypto, DePIN et AI Gaming
Deux fils convergent ici, et non par coïncidence.
D'abord, l'histoire du calcul. Edge LLM inférence à l'échelle du jeu a besoin de beaucoup d'heures GPU que personne ne veut payer rack-rate prix cloud pour. C'est exactement l'écart DePIN calculent les marchés comme Akash, Render et io.net continuent à lancer. Si Inworld-style runtimes peut cibler un bassin d'inférence décentralisé avec un prix prévisible par seconde, AI NPCs cessent d'être une fonctionnalité de luxe. Aucun des principaux moteurs de jeu n'a intégré DePIN en juin 2026. La thèse reste une thèse.
Deuxièmement, l'histoire d'identité on-chain. Un caractère AI avec une mémoire persistante, des motivations et un wallet est une étape de ce que notre pilier sur agents AI on-chain a suivi pendant un an. Une fois que le NPC a un wallet, le NPC se négocie. Une fois qu'il trade, vous avez besoin d'une attestation d'identité on-chain pour que le jeu sache que wallet appartient à ce NPC et non à un joueur exploiter. ERC-8004 a été conçu pour cette forme exacte.
La bande plus large est essentiellement sans rapport, à l'exception de la pression macro. Selon [le tableau de bord mondial du marché de CoinGecko] (https://www.coingecko.com/en/global-charts), la capitalisation totale du marché cryptographique s'élevait à 2,13 billions de dollars le 6 juin 2026, en baisse de 5,9% le jour, avec la domination de Bitcoin à 56,13 %. DeFi TVL se situe à 69,7 milliards de dollars par [le classement de la chaîne de DefiLlama] (https://defillama.com/chains). Lorsque la bande saigne, les récits de convergence de l'IA-gaming sont généralement les derniers à attirer des capitaux frais, c'est pourquoi la plupart des constructeurs crédibles expédient discrètement des produits au lieu de se lancer dans des podcasts. Le projet adjacent de Dadacoin Zentrix se trouve dans cette colonne du constructeur : les jeux générés par l'IA sur BSC, sur la même logique qui conduit maintenant les NPC AI dans les titres expédiés (le moteur agentique de Roblox est l'analogue le plus proche, juste avec un ZQ008QZ de $50B attaché).
Le panda continuera de compter les éléments de ligne sur la facture en nuage. Jusqu'à présent, les éléments de la ligne gagnent.



