Sebep modelleri, AI yeteneğinde bir sonraki adım olarak satıldı. Onlardır. Ayrıca en yüksek 2025 kullanım vakalarından biri için yavaş, pahalı ve yapısal olarak gariptir: Özerk ajan. Panda, transput kriterlerini okuyor. The arithmetic is unkind.
Sebep Modelleriyle Ne Değiştirilir?
Sebep modelleri, OpenAI'nın o3 ailesi, Anthropic'in Claude genişletilmiş düşünce ile, DeepSeek R1 ve Google'ın Gemini 2.5 düşünce değişkeni, inference zamanında ekstra hesaplamak. Hızlı bir cevap üretmek yerine, görünür yanıttan önce içsel "düşük" jetonlar oluştururlar. Anthropic'in araştırma indeksine göre, genişletilmiş düşünce, matematik, kodlama ve çok adımlı planlamada, daha uzun yanıtların ve daha yüksek token faturaların fiyatında anlamlı bir şekilde artış gösteriyor.
Laboratuvarlar ticaret konusunda samimi olmuştur. OpenAI'nın o serisi araştırma yazısı yeni bir ölçekleme ekseni olarak test-zaman hesaplaması: daha fazla düşünme, daha iyi cevaplar. Bir kodlama lideri üzerinde güzel. Bir sistem hareket etmek için 400 milisaniye sahip olduğunda daha az iyi.
Tech basını yakalandı. Verge'nin AI dikeyi, modellerin yanıt başına on otuz saniyeye kadar uzatabileceğini, makine zaman ölçeklerinde sonsuza kadar uzatabileceğini savundu. Karşılaştırma puanları gelişmiştir. latency zemin kenarlara taşındı ve sonra yukarı. İki şey nadiren çip çevrimlerinde birlikte gerçekleşir. Bu kişi yaptı.
The Latency Tax on A Özerk Agents
2024 ve 2025 arasındaki ajan anlatı tek bir varsayım üzerinde sert bir şekilde eğildi: İnference daha ucuz ve daha hızlı kalacaktır, bu yüzden algı, karar ve eylem döngüsü birkaç yüz milisaniye kadar küçülecektir. Bu, 2025'te yaklaşık olarak doğruydu. En yetenekli modeller için artık doğru değil. Ars Technica'nın AI kapsamına göre, tek bir neden sorgulama standarttan daha fazla büyüklükte bir düzene mal olabilir, yanıt süreleri buna göre genişletilebilir.
Sayılar evet diyor. Panda bir kaş yaratır.
Daha sıkı bir zaman bütçesi içinde hareket etmek zorunda olan herhangi bir ajan için, müşteri hizmetleri botları zirvede, tarayıcı kontrol ajanları, otomatik ticaret sistemleri, 15 saniyelik sebep döngüsü olmayan bir durumdur. 2025 ajanı tez yanlış maliyet eğrisini üstlendi ve fatura 2026'ya ulaştı.
Daha az açık bir maliyet de var: variance. Sebep modelleri daha uzun süre daha fazla hızlı düşünüyor, bu, arama süresi düz bir sayı değil, uzun bir kuyrukla bir dağıtımdır. Şimdi deterministik bir döngü etrafında inşa edilen Agents, outliers için planlamalıdır. Ürün özelliklerine girmek için kullanılan mühendislik zamanı, kuyruk mantığına, kısmi-result geri çekilmelere ve "N saniyeden sonra" zamanlayıcılara dönüşür. Boring altyapı çalışması, kötü yapmak için pahalı.
# Slow thinking Aslında Offs Off
Yavaş her zaman kötü değildir. Sebep modelleri planlama, kod nesli ve multi-document sentez konusunda hızlı modelleri yendi. Google DeepMind'in araştırma blogu zor matematik ve yapısal akıl yürütmedeki yakın boşlukların nasıl ortaya çıktığını göstermiştir. Bu haritalar haftalık olarak kullanılan iş insanlara temizliyor: strateji yazmak, kontrol kodu, karmaşık kısaları sentezlemek.
Başka bir deyişle: modeller haftalık yapmak için kullanılan iş insanlarında iyidir. İkinci olarak yapmak için kullanılan iş insanlarında kötüler.
Kazanan mimarlık görünür hale geliyor. Yavaş bir sebep modeli planı yazıyor. Hızlı ucuz bir model planı uygular. Bir routing katmanı hangi olduğuna karar verir. Mistral'in açık ağırlık yayınları hızlı katmanı çok ucuz hale getiriyor. Yavaş katmanlı amaç için pahalı kalır. Kazanan ürün, yönlendiricinin kalibre edildiği bir üründür, model kartının en yoğun göründüğü kişi değil.
Three Things Builders Next
İlk olarak, To reasoning token: mutlak sayı, söz değil. Çoğu laboratuvarlar, Jetonları görünür jetler üzerinde premium bir oranta bırakıyor. Bu premium yarılar varsa, yavaş tiers orta katmanlı ürünler için dağıtılabilir. Değilse, neden prim kararları için bir araç kalır.
İkincisi, Yönlendirme standartları: MCP gibi protokollerin artık ajanlar çok sayıda modeli temiz bir şekilde aramasına izin vermesine izin verin. [Açık kaynak AI ekosisteminde] (/blog/2026-05-29-open-source-ai-three-schools) hızla genişliyor. İlk sınıf bir problem gemisi olarak tedavi eden modeller, onu tesisat olarak tedavi edenlerden daha iyi ürünler.
Üçüncüsü, inferans donanımları: NVIDIA Blackwell ölçeğinde, artı Groq, Cerebras ve SambaNova'dan gelen inference çipleri, matematiği değiştiren bir faktörle gecikmenin nedenini sıkıştırabilir. Teknoloji AI kategorisi nakliye programlarını izler. 2026 veya 2027'de gelen kompresyon, ajanların orta piyasa ürünlerinde bir niş veya ölçek kalmalarına karar verir.
The On-Chain Angle: Routing Ürün
Kripto piyasaları AI laboratuvarları için yavaşlamaz. CoinGecko'nun küresel verilerine göre, toplam kripto piyasası 5 Haziran 2026'da, %44'ün üzerinde, 24 saat içinde 128 milyar doların üzerinde. Bitcoin $ 63.5K ve Ethereum 1.74K'ye kadar, CoinGecko'nun Ethereum sayfası. Bu ölçekdeki Volume, düşünmek için 15 saniyeye ihtiyaç duyan bir ajan için marj bırakmaz.
Bu, daha akıllı on-chain AI-agent projeler arazisinin nerede olduğu. Ürün "en iyi modeli kullanıyoruz" değil. Ürün "Doğru karara doğru modeli rotalıyoruz, önemli ölçüde hızlı." Bu, pazarlamanın istediğinden daha haklı. Aynı zamanda maliyet eğrisini hayatta tutan tek versiyondur. AI kodlama ajanları Solidity'yi denetim ediyor yavaş ve sol şeritte sıkı bir şekilde oturuyor. Ticaret ajanları hızlı kalır. Çoğu takım hala bir tane varsa “A AI ajanı” duruyor.
Platformlar için, BSC tabanlı projeler dahil olmak üzere, Zentrix yörüngesinde, kaçış aynı. Sebeple planlayın. Hızla idam edilir. Bill aslında ne yedikleri için kullanıcı. Ekonomi, her katmanın iyi olduğu konusunda dürüst olduğunda çalışır.
Panda hala izliyor. Sayılar hala aynı nefeste daha büyük ve daha yavaşlaşıyor. İlk önce ortaya çıkan ajanlar, sadece daha büyük bir model satın alan olanları yiyeceğiz.



