AI & Tech10 juin 2026·By Valentin Boulaire·3 min read

Açık modeller 2026 yılında Premium Inference Vergisini Öldürdü

DeepSeek, Mistral, Llama 4 18 ay içinde yaklaşık 10x inference fiyatları çöktü. Kapalı laboratuvarlar sallanıyor. In-chain AI ajanları nihayet ekonomik bir birime sahiptir.

Sekiz ay önce, GPT-4'ü özerk bir ajan döngüsü içinde çağıran bir barista'nın sabahından daha pahalıya mal oldu. Bugün, kiralanan bir H100 fiyatları üzerinde çalışan açık ağırlık modeli bir metre metin mesajı gibi. Panda grafiği izledi, sonra iki kez kontrol etti, çünkü kripto veya AI'da hiçbir şey bu hızlı para stadyumunu kaybetmeden hareket etmiyor.

Açık kaynak LLM fiyatları aslında orta-2026'da oturuyor ve bu yüzden on-chain AI ajanları sessizce yaşlanmaya ihtiyaç duyuyor.

# How Open- Source Closed the Inference Gap

İki buçuk yıl önce kapalı laboratuvarlar temiz bir kartel koştu: GPT-4 milyon giriş jetleri için otuz dolar, benzer fiyatlandırmada İkizler kovaladı. Açık ağırlıklar var (Llama 2, Mistral 7B) ancak yetenek boşlukları, üretim ekiplerinin flinching olmadan prim ödediği kadar büyükydi.

Sonra DeepSeek V3 2024'ü geçmiştir. Sonra R1. Sonra Mistral Medium 3 2026 başlarında. The Verge's Ocak 2025 DeepSeek şokunun kapsamı, DeepSeek'in R1 neden modelleme modeli, API'sini yaklaşık otuz kat daha az fiyatla eşleştirdi. Kapalı laboratuvarlar, boşlukların hesaplamalar hakkında olduğunu açıklayan önümüzdeki haftaları harcadı, dağıtım değil. Piyasa satın almadı.

2026 Haziran'da ortalama ajan iş yükündeki boşluk işlevsel olarak sıfır. Açık ağırlıklar, bir GPU ile herhangi biri tarafından barındırılan, API'lerin maliyetin bir kısmında ne yaptığını yapın. Cartel, düzenlemelerden ölmedi. Arithmetic'den öldü.

# # Bu kapalı model iş modeline ne yapar?

Kapalı laboratuvarlar hala moats var. Alet kullanımı, multimodal zeminleme, tarama ve sınır satıcılarından gelen bilgisayar kullanım ajanları gerçekten önde kalmaktadır. Ancak ortalama ajan iş yükü bu şeylerden hiçbiri değildir. Yüksek hacimli bir "buyu sınıflandırır, bu cevabı özetle" ve bu iş yükü artık sınır modeline ihtiyaç duymaz.

Ars Technica'nın 2026 açık kaynak AI push, kurumsal sözleşme yenilemeleri, "en iyi üç routing" için "en iyi" dan geçiyor: aramaların %80'i için ucuz bir açık model, sadece akış derinliğine ihtiyaç duyduğunda bir sınır. En üstteki token başına Margin hızlı sıkıştırıyor.

Saha güverte cevabı “bu önemli olan bilişsel işi satıyoruz.” Arithmetic cevabı "en bilişsel iş bu kadar önemli değil."

The Open Stack Now Beats Üç Özel İş Yüklerinde Kapalı

Bu, dinin rahatsız olduğu kısımdır.

Coding: DeepSeek-Coder V2 ve Qwen 2.5 Kodr, SWE-Bench'daki rakiplerini Cursor'un ve devam etmesi için yeterince yakın çalışır. Dev sessizce birkaç işletme tiers için varsayılanleri değiştirdi. Matematik: açık sebep modelleri AIME ve MATH'i kapalı o eşdeğerlerin birkaç noktasında vurdu. Mi sınıflandırması: Mistral'in açık serbest bırakılması, sınır satıcılarının zar zor test ettikleri Avrupa dillerine hakimdir.

[Artificial Analysis] (https://artificialanalysis.ai/) tarafından takip edilen verilere göre, maliyet kalitesi sınırı şimdi önemli olan her grafik üzerinde açık ağırlık modelidir. Bu, her görevde kapalı kaybetme anlamına gelmez. Bu, varsayılanin çevrildiği anlamına gelir: ilk önce açık seçin, sadece zorlandığı zaman kapanacaktır.

Ajan inşaatçılar için sonuç mekaniktir. GPT-4'te çalıştırılan yaklaşık otuz sente mal olan bir döngü, 2024'te orta-2026'da açık bir modelde yüzde üçte biri mal oluyor. İki büyüklük emir. Bu, ürünlerin ekonomik olarak mümkün olduğunu yeniden yazmanın bir çeşididir.

The Cost Curve No Tahmini

İşte Jevons paradoks kalabalığın zaten geldiğini gören kısım. Ucuz per-token inference AI faturasını bozmadı. Toplam harcama patladı.

Cointelegraph'ın daha geniş hesaplama pazarından oku küresel AI inference, per-token çöküşüne rağmen yılda yaklaşık dört kat yıl harcıyor, çünkü her ürün ekibi daha önce bir çağrıda bulunduğu bir döngü yürütüyor. Ajan yığını bu boşluğun içinde yaşıyor: Otuz kez arama başına harcamak, binlerce kez iş akışı çağrısı yapmak, toplam otuz kez fatura.

DePIN ağları için, bu yapısal kuyruktır. Kapalı laboratuvarlar token prim şarj etmek için, yavaş manzara. Her iki sayı da bir zamanlar doğrudur. CoinGecko'nun global pazar verilerine göre, toplam kripto market cap 10 Haziran 2026 (24 saat içinde 2.84 $) üzerinde durdu, ancak AI altyapı tezi fiyat baskıları arasında toplanıyor.

# Why On-Chain AI Agents Nihayet Kalemi

Kripto açısı. 2025'in ortalarından önce, işlem başına bir sınır API olarak adlandırılan otonom bir on-chain ajanı haklı olabilir. Gaz ucuz kısımdı. Model pahalı kısımdı. Birim ekonomisi bir araştırma demosu dışında çalışmadı.

Bu ortaya çıktı. Akash veya Render üzerinde bir ajan açık bir model çalıştırıyor, şimdi inference çağrısına yüzde bir sent. Birden bir ajan stratejisi küçük bir [DeFi pozisyonu] (/blog/topic/defi) her on beş dakika ekonomik olarak rasyoneldir. [ Özerk cüzdanlar ve ajan odaklı DeFi] (/blog/topic/ai-agents) son olarak yönetdikleri pozisyonların büyüklüğü ile hatları.

Bu 2026 tezin iğrenç yarısı: atılım daha akıllı bir model değildi. Daha ucuz biriydi. "AI agent on-chain" 2024 yılında satılan endüstri, formda doğruydu, ancak zamanlamada yanlıştı. Matematik, birisinin arama başına bir sentin daha az bir kısmı için nasıl yetkili bir model dağıtmayı düşündüğünde çalışmaya başladı. 3 açık kaynak AI okulları Mayıs'tan kırıldı) (/blog/2026-05-29-open-source-ai-three-schools) ve open-source LLMs against the agent tez önceki bölüm için.

Zentrix tarzı AI oyun için, implication aynı: Her dialog dönüşüne ilişkin bir NPC, arama başına otuz sentde bir araştırma demosu oldu. Çağrının yüzde üçte birinde, bir nakliye ürünü. Panda sentleri sayıyor. Matematik sadece değişti.

#ai#open-source-ai#ai-industry#ai-agents

# How Open- Source Closed the Inference Gap

# # Bu kapalı model iş modeline ne yapar?

The Open Stack Now Beats Üç Özel İş Yüklerinde Kapalı

The Cost Curve No Tahmini

# Why On-Chain AI Agents Nihayet Kalemi

The panda's weekly take, in your inbox

Join the Newsletter

Keep reading

Open-Source LLMs vs AI Agent Tokens: A 2026 Reckoning

The 2026 AI Browser Read: Comet, ChatGPT Agent, Claude

Why Reasoning Models Just Broke On-Chain Agent Math