A CNN processou Perplexity em 28 de maio mais de 17.000 artigos supostamente raspados e revendidos como resumos de IA. Os relógios de panda. Na mesma semana, Snowflake e Anthropic assinaram um acordo de US $ 200 milhões para empurrar Claude em 12.000 empresas sob a bandeira de "AI governada". Dois andares, uma direção de viagem. A indústria de IA precisa de um rasto de papel que nunca construiu, e as pessoas que passaram uma década a construir rastos de papel imutáveis estão, por uma vez, na sala certa.
# CNN, Perplexidade, e a conta a chegar
A denúncia da CNN, apresentada no Distrito Sul de Nova Iorque em 28 de maio de 2026, acusa Perplexidade de copiar e redistribuir mais de 17.000 histórias, fotos e vídeos. De acordo com o [relatório próprio da CNN sobre o caso] (https://www.cnn.com/2026/05/28/media/cnn-sues-perplexity-ai-copyright), a rede está a solicitar indemnizações legais e uma injunção.
O chefe de comunicação da Perplexity empurrou para trás com uma mordida sonora: "Você não pode copyright fatos." Bonito. O processo não é sobre factos. Trata-se de treinar dados, recuperação e um modelo de redistribuição que canaliza discretamente a receita da editora em uma página de assinatura do chatbot.
A CNN junta-se ao New York Times, Dow Jones, e o New York Post em empilhamento contra Perplexity, per [o rastreador da Press Gazette] (https://pressgazette.co.uk/platforms/news-publisher-ai-deals-lawsuits-openai-google/). Camada no caso New York Times v. OpenAI, ainda pendente desde dezembro de 2023, e existem agora mais de cinquenta processos de direitos autorais ativos visando a indústria de IA. Sabíamos que isto ia acontecer.
# # O que a procedência de dados realmente significa on-chain?
Tira as palavras. A procedência de dados é um registro verificável de onde um conjunto de dados veio, quem consentiu, qual licença se aplica e quais saídas derivadas são permitidas. Hoje, esse registro vive em slides, em PDFs assinados e no arquivo de email de alguém. Boa sorte em auditá-lo na escala de 50 trilhões de fichas de treino.
Colocar proveniência em um blockchain faz duas coisas específicas. Primeiro, torna o registo de consentimento evidente. Em segundo lugar, torna programável o pagamento, royalties e revogações em vez de negociado caso a caso.
De acordo com o Projeto de Lei de Assembleia da Califórnia 2013, qualquer modelo de IA generativo disponibilizado publicamente após 1 de janeiro de 2026 deve publicar documentação de seus dados de treinamento. O texto não especifica on-chain. Mas especifica "documentação que sobrevive à auditoria". Duas coisas em que os desenvolvedores historicamente falham: sobreviver às auditorias e escrever documentação.
O resultado é uma abertura estrutural. A indústria de criptografia construiu trilhos de procedência por uma década perseguindo royalties NFT e recibos de governança DAO. Esses trilhos acabaram por se encaixar num problema diferente.
# Vana, Protocolo de História, e o meio não glamoroso
Duas redes estão apostando seu token nesta convergência. Ambos merecem um olhar sóbrio, não um rascunho.
[Vana mainnet] (https://www.vana.org/posts/accelerating-ai-data-revolution) foi ao vivo em dezembro de 2024 e tem integrado cerca de um milhão de usuários em DataDAOs, conjuntos onde os membros depositam dados pessoais criptografados e licenciam para construtores de IA. Onde o panda levanta uma sobrancelha: Vana sofreu problemas mainnet suficientemente sérios que Bithumb e Upbit pausaram a negociação da VANA em fevereiro de 2026. Um protocolo cujo campo inteiro está intermediando dados de treinamento de IA não pode se dar ao luxo de parar de emitir blocos. Os investidores repararam.
[Story Protocol] (https://www.story.foundation/blog/introducing-ip) arrecadou $140 milhões em rodadas lideradas por a16z, lançou sua principal rede e token IP em fevereiro de 2025, e agora está girando de mídia tokenized em direção a dados "inescraváveis" e licenciamento empresarial. A equipe [atrasou o token principal desbloqueia até agosto de 2026] (https://www.coindesk.com/markets/2026/02/09/story-co-founder-defends-token-unlock-delay-says-project-needs-more-time), citando a necessidade de construir o uso real antes da oferta chegar ao mercado.
Ambos os projetos estão lutando com a mesma tensão. A prova é canalização. A canalização não bombeia. Mas no momento em que um regulador pede uma cadeia de custódia auditável, a canalização torna-se o produto.
# Snowflake, Anthropic, e a atração empresarial
Aqui está a leitura contrariana. O maior catalisador não é o litígio. É a forma de aquisição da empresa.
Em 1o de junho de 2026, [Snowflake e Anthropic anunciaram uma parceria expandida] (https://www.snowflake.com/en/news/press-releases/snowflake-and-anthropic-accelerate-enterprise-ai-adoption-driven-by-rising-demand-for-governed-ai/) incorporando Claude na nuvem de dados do Snowflake para 12 mil clientes empresariais, com um compromisso de vários anos relatado em torno de 200 milhões de dólares. No dia seguinte, a Anthropic disse à TechCrunch tinha expandido o Project Glasswing para 150 organizações em 15 países.
O que significa "I.A. governada" na linguagem de aquisição? Registros de linhagem, políticas de retenção, atestados de treinamento-dados e a capacidade de provar um modelo específico nunca tocou em um conjunto de dados específico. As empresas não implantarão um modelo na infraestrutura crítica sem essa prova. Vão precisar de recibos.
É aqui que a procedência on-chain deixa de ser uma novidade criptográfica e se torna uma caixa de verificação de conformidade de fornecedores. Não é glamoroso. É inevitável.
# O que ver no final do ano
Três sinais que valem a pena rastrear:
- O docket Perplexity: uma decisão processual sobre se recuperação-e-summary conta como uso justo irá remodelar cada produto de busca de IA no mercado.
- ** Estabilidade de Vana**: outra falha estendida e a tese de dados-DAO perde seu token âncora.
- ** Atestados da empresa**: qualquer implantação de IA Fortune 500 que publique um certificado de proveniência on-chain fecha a lacuna de credibilidade para toda a pilha.
O cenário do mercado de criptografia importa aqui. De acordo com CoinGecko, o total de criptografia market cap é de US$ 2,32 trilhões em 4 de junho, com domínio Bitcoin em 55,49%. DeFi TVL detém $73,86 bilhões através de cadeias por [DefiLlama] (https://defillama.com/chains), com [BSC para baixo 5,48% semana-por-semana para $5,21 bilhões] (https://defillama.com/chain/BSC). Tradução: ninguém está de humor eufórico. É precisamente quando narrativas de infraestrutura como a procedência são adotadas. A era Hype compra especulações. Era sóbria compra canalização.
No lado de jogos e BSC, a mesma lógica se aplica. Zentrix, a plataforma de jogos de IA em que o Dadacoin se conecta, funciona com ativos gerados pelo jogador. Se esses ativos entrarem em um conjunto de treinamento, o jogador precisa de um recibo verificável e o estúdio precisa de uma cadeia de custódia defensável. Isso é exatamente o que [on-chain AI agent infrastructure] (/blog/topic/ai-agents) foi construído para entregar, e o que a peça da semana passada sobre [agentes de codificação e auditorias Solidity] (/blog/2026-06-02-ai-coding-agents-solidity-audits) sugeriu no lado desenvolvedor. As [três escolas de IA de código aberto] (/blog/2026-05-29-open-source-ai-three-schools) acabam por pousar no mesmo lugar: alguém tem que provar o que o modelo viu.
Crypto não precisa ganhar a corrida de IA. Tem de ser a camada em que a corrida de IA pousa quando os advogados, reguladores e oficiais de compras aparecem. Acabaram de aparecer. Os juízes do panda. Não é uma opinião. Só a aritmética.



