Pesquise o nome da sua empresa no ChatGPT. A IA provavelmente conhece sua marca — mas cita um concorrente como fonte.
Dados de 28 auditorias GEO realizadas pela InboundCycle entre janeiro e maio de 2026 a empresas na Espanha, Chile e Brasil revelam que em 60% dos casos as IAs mencionam a marca, mas apontam outro site como referência (InboundCycle, 2026). O problema não é falta de conteúdo — é que a maioria dos sites não fala a língua dos agentes de IA.
Uma série de protocolos abertos surgiu entre 2025 e 2026 para resolver isso: NLWeb, A2A, Agent Skills e Content-Signal. Juntos, eles transformam sites em participantes ativos da web agêntica — em vez de fontes passivas que as IAs garimpam quando querem. Este é o único guia em português que coloca os 5 protocolos na mesma página.
O que é NLWeb e por que seu site deveria conversar com agentes
NLWeb é um projeto open source da Microsoft, licença MIT, lançado em maio de 2025 por R.V. Guha — cocriador do Schema.org, RSS e RDF. Transforma qualquer site que já publique dados estruturados em um endpoint conversacional para agentes de IA, sem alterar a experiência do usuário humano.
De onde vem e o que faz
R.V. Guha não é um nome qualquer. A pessoa que cocriou o Schema.org — presente em mais de 100 milhões de sites — e o RSS agora constrói a camada conversacional em cima desses mesmos dados (Microsoft Source, 2025). Ele entrou na Microsoft em 2025 como Corporate VP e Technical Fellow especificamente para liderar o NLWeb.
Na prática, NLWeb pega o conteúdo estruturado que seu site já publica (Schema.org, RSS, JSON-LD), ingere em um banco de dados vetorial e conecta a um LLM. O resultado: seu site responde perguntas em linguagem natural tanto para humanos quanto para agentes de IA.
A Microsoft posiciona NLWeb como "o HTML da web agêntica". A analogia inspira, mas merece um caveat: HTML é um padrão universal governado pelo W3C; NLWeb é uma implementação liderada por um único vendor, sem fundação neutra. A comparação é retórica, não arquitetônica.
Como funciona o pipeline
O pipeline segue três passos. Primeiro, dados estruturados do site (Schema.org, RSS, JSON-LD) são ingeridos em um banco vetorial — Qdrant, pgvector, Milvus, Elasticsearch ou Cloudflare AutoRAG, entre outros.
Segundo, consultas em linguagem natural são processadas pelo LLM escolhido (OpenAI, Gemini, Anthropic, DeepSeek). Terceiro, as respostas são servidas por dois endpoints: /ask para humanos e /mcp para agentes de IA.
Dados que seu site
já publica
Milvus, AutoRAG
Anthropic, DeepSeek
Ambos os endpoints compartilham o mesmo pipeline de recuperação. O servidor é estritamente stateless (sem estado de sessão — cada consulta é processada do zero, sem lembrar a anterior) (NLWeb GitHub, 2025). Para o responsável de marketing, isso significa que um único investimento em indexação serve dois canais: o chat do site e agentes externos como ChatGPT ou Gemini.
Quem já usa — e o que ainda falta
Tripadvisor, Shopify, Eventbrite, Hearst e O'Reilly estão entre os early adopters. O Tripadvisor, por exemplo, integrou o NLWeb ao seu banco vetorial Qdrant "com mudanças mínimas" (Microsoft Community Hub, 2025).
Mas atenção, porque tem uma nuance importante aqui: nenhum desses early adopters publicou KPIs de impacto — nem conversão, nem engajamento, nem parcela de tráfego vindo de agentes. Constellation Research estima 2 a 3 anos para adoção substancial (VentureBeat, 2025). NLWeb é uma aposta promissora, não um resultado comprovado.
NLWeb resolve como expor seu conteúdo a agentes. Mas o que acontece quando dois agentes de empresas diferentes precisam coordenar uma tarefa?
A2A — quando os agentes precisam conversar entre si
A2A (Agent-to-Agent) é um protocolo aberto que permite a agentes de IA de diferentes fornecedores colaborarem em tarefas sem revelar sua lógica interna. Lançado pelo Google Cloud em abril de 2025 e doado à Linux Foundation em junho do mesmo ano, opera sobre HTTP, JSON-RPC 2.0 e SSE — padrões que sua equipe de infraestrutura já conhece.
Identidade e building blocks
O conceito central do A2A é o de "agentes opacos": eles colaboram sem expor memória interna, ferramentas ou código proprietário (GitHub a2aproject, 2025). Na prática, isso significa que o agente de marketing da sua empresa pode coordenar com o agente de um fornecedor sem que nenhum dos dois revele como funciona por dentro.
O protocolo tem 7 building blocks. O mais importante é o Agent Card — um documento JSON que funciona como o "LinkedIn do agente": descreve o que ele faz, como autenticar e onde encontrá-lo.
Os outros componentes são: Client (quem pede), Server (quem executa), Task (unidade de trabalho com ciclo de vida), Message, Artifact (resultado da tarefa) e Part (unidade de conteúdo).
A fusão do Agent Communication Protocol (ACP) da IBM com o A2A consolidou o protocolo como padrão da indústria (IBM Think, 2025). Hoje está sob a Linux Foundation com Apache 2.0 e um comitê técnico que inclui AWS, Cisco, Google, IBM, Microsoft e Salesforce.
Workflow e ecossistema
O fluxo de trabalho segue três passos — descoberta, autenticação e comunicação. Um agente encontra outro via Agent Card, autentica com mecanismos padrão (OAuth 2.0, JWT, mTLS) e se comunica via HTTPS com JSON-RPC 2.0.
Se isso parece sopa de siglas, fica comigo — na prática, é como integrar uma API, mas o cliente do outro lado é outro agente, não um humano.
A escala do ecossistema impressiona. O Google Developers Blog registrou mais de 50 parceiros tecnológicos no lançamento — entre eles Salesforce, SAP, ServiceNow, PayPal e Workday, mais consultoras como Accenture, Deloitte, McKinsey e PwC. Em abril de 2026, esse número ultrapassava 150 organizações (Linux Foundation, 2026).
Mas a pergunta pragmática de 2026 é direta: seus parceiros têm endpoints A2A? Se a resposta é não, A2A é conversa para 2027.
Os protocolos que vimos até aqui resolvem como expor conteúdo e como agentes conversam entre si. Falta uma peça: como distribuir capacidades reutilizáveis entre agentes.
Agent Skills — o npm dos agentes de IA
Agent Skills é um formato aberto para empacotar capacidades reutilizáveis que estendem agentes de IA. A especificação foi publicada pela Anthropic em dezembro de 2025, e a Vercel lançou o CLI e o diretório skills.sh em janeiro de 2026. Funciona com 18 ou mais agentes, de Claude Code a GitHub Copilot.
A anatomia de um skill é simples: um arquivo SKILL.md com instruções em markdown, uma pasta scripts/ com automações opcionais e uma pasta references/ com documentação de apoio. Pense como um plugin para seu agente, mas open source e agnóstico de fornecedor.
O design usa progressive disclosure (revelação progressiva): o agente carrega apenas o cabeçalho YAML do skill na inicialização (~80 tokens). Quando a tarefa do usuário coincide com o skill, o corpo completo é carregado.
Scripts só são executados quando necessários. Isso significa que um agente pode ter centenas de skills instalados sem penalidade no uso de contexto.
O diretório skills.sh é o marketplace público — mais de 90 mil skills indexados no primeiro trimestre de 2026, com 147 novos publicados por dia (Snyk, 2026). A comunidade chamou de "npm para agentes de IA", e a analogia é precisa: o Model Context Protocol resolve como agentes chamam ferramentas; Skills resolve como desenvolvedores compartilham e descobrem capacidades (InfoQ, 2026).
Aqui é onde a maioria se perde: o ecossistema cresce rápido, mas a qualidade é desigual. Uma análise da Snyk escaneou 3.984 skills e encontrou que 13,4% continham pelo menos um problema crítico de segurança — incluindo distribuição de malware, injeção de prompt e credenciais expostas (Snyk, 2026). Trate o skills.sh como o npmjs.com: fixe versões, audite antes de instalar e prefira skills de vendors verificados (Vercel, Anthropic, Microsoft, Stripe) sobre contribuições anônimas.
Os protocolos anteriores resolvem como agentes acessam conteúdo, conversam entre si e compartilham capacidades. Mas nenhum deles responde a uma pergunta fundamental: quem autorizou a IA a usar seu conteúdo?
Content-Signal — declarar as regras do jogo para seu conteúdo
Content-Signal é um framework aberto da Cloudflare, lançado em setembro de 2025, que permite a qualquer publisher declarar como agentes de IA podem usar seu conteúdo — se podem indexar, usar como insumo para respostas ou treinar modelos. Funciona via robots.txt e headers HTTP, com licença CC0, e é a camada de consentimento do stack agêntico.
O mecanismo define três sinais: search (indexação e snippets tradicionais), ai-input (uso como insumo para RAG e AI Overviews) e ai-train (treinamento de modelos). Você pode permitir um e negar outro — por exemplo, search=yes, ai-train=no, ai-input=yes.
Para empresas brasileiras sob a LGPD, essa é a camada de consentimento do stack agêntico. Dados de abril de 2026 mostram que apenas 4% dos 200 mil sites mais visitados declararam suas preferências via Content Signals (Cloudflare, 2026). A adoção é incipiente — o que significa oportunidade para quem agir primeiro.
Um aviso: os sinais são preferências, não enforcement. A Cloudflare é explícita nisso. Mas declará-los é um movimento de risco quase zero com benefício legal claro.
Cada protocolo tem sua função. Mas como eles se encaixam na prática?
O stack completo — como os 5 protocolos se encaixam
Os 5 protocolos não competem entre si — ocupam camadas distintas de um mesmo stack, como as camadas de um sanduíche onde cada ingrediente tem seu papel e nenhum substitui o outro. Entender qual camada cada protocolo ocupa é o que separa uma estratégia agêntica de uma coleção de siglas.
O mapa das 5 camadas
Imagine um sanduíche com 5 camadas. A base é o pão — seus dados estruturados (Schema.org, JSON-LD, RSS). Sem essa base, nada acima funciona.
A segunda camada é a descoberta — NLWeb e Content-Signal tornam seu conteúdo visível e governável para agentes. A terceira é a de ferramentas — o MCP conecta agentes a APIs e bancos de dados.
A quarta é a comunicação entre agentes — A2A permite que agentes de diferentes fornecedores colaborem. E no topo, Agent Skills empacota capacidades em pacotes reutilizáveis e distribuíveis.
Consenso de Google, IBM, Microsoft, Vercel e Web4Agents (2025–2026)
Os vendors repetem que os protocolos "se complementam". O Google disse que A2A complementa MCP. A IBM demonstrou os dois operando juntos.
Os protocolos lado a lado
| Protocolo | Quem impulsiona | Tipo | Pergunta que responde | Licença | Tração (maio 2026) | Relação com MCP |
|---|---|---|---|---|---|---|
| NLWeb | Microsoft (R.V. Guha) | Protocolo + framework Python | Como meu site conversa com agentes? | MIT | ~6,2k stars; Tripadvisor, Shopify, O'Reilly | Cada instância NLWeb É um servidor MCP |
| A2A | Google → Linux Foundation | Protocolo de comunicação inter-agente | Como meus agentes colaboram com os de terceiros? | Apache 2.0 | 23,9k stars; 150+ organizações; IBM ACP fusionado | Complementa MCP (inter-agente vs ferramentas) |
| Agent Skills | Anthropic (spec) / Vercel (CLI) | Formato de empacotamento | Como distribuir capacidades entre agentes? | MIT | 27k stars; 90k+ skills; 18+ agentes compatíveis | Resolve eixo distinto (discovery vs comunicação) |
| Content-Signal | Cloudflare | Framework de sinalização de preferências | Quem pode usar meu conteúdo e como? | CC0 | 4% dos top 200k sites | Ortogonal |
| MCP | Anthropic | Protocolo de ferramentas | Como um agente chama ferramentas? | Open source | Amplamente adotado | — |
E agora vem a parte que realmente importa: a maioria dos sites não tem sequer a base desse stack. Dados da InboundCycle mostram que 0% das 26 webs auditadas implementam Schema de tipo Article ou BlogPosting (InboundCycle, 2026). Protocolos como NLWeb dependem de Schema.org para funcionar — sem essa base, o stack inteiro fica sem chão.
MCP é o único protocolo desse stack que já usamos em produção diária na InboundCycle. NLWeb e A2A estão em nosso roteiro de avaliação. Agent Skills usamos internamente para empacotar workflows da equipe, mas ainda não os oferecemos como serviço para clientes.
O stack é promissor — mas não está isento de riscos que a maioria dos artigos prefere ignorar.
O que pode dar errado — riscos que ninguém conta
Cada protocolo do stack agêntico carrega riscos específicos de segurança, governança e maturidade que precisam ser avaliados antes de qualquer implementação em produção — desde vulnerabilidades sem CVE formal até taxas de vazamento de dados que crescem exponencialmente em cadeias de agentes.
Agora, é justo fazer a pergunta contrária: se esses protocolos são tão promissores, por que não sair implementando tudo agora?
NLWeb: em maio de 2025, pesquisadores descobriram uma vulnerabilidade crítica na implementação de referência que permitia a qualquer pessoa ler arquivos sensíveis do servidor — incluindo credenciais de APIs de LLMs — com uma URL manipulada. Em contexto agêntico, roubar essas chaves equivale a roubar o cérebro do agente.
A Microsoft corrigiu, mas não emitiu um CVE formal — o que significa que scanners automáticos de vulnerabilidade não detectam o problema (FPT Software, 2025). A governança permanece centralizada na Microsoft, sem fundação neutra.
A2A: um estudo acadêmico (arXiv 2505.12490, Louck, Stulman e Dvir, 2025) analisou configurações padrão do A2A e encontrou taxas de vazamento de dados entre 60% e 100%. O risco cresce com cada agente na cadeia: se cada um tem 10% de chance de ser comprometido, com 5 agentes em sequência o risco acumulado sobe para 41%.
Agent Skills: os 13,4% de skills com problemas críticos que a Snyk identificou incluem malware, injeção de prompt e segredos expostos — riscos reais para quem instala sem auditar.
Para empresas sob a LGPD, existe um ponto positivo: o A2A permite usar provedores de identidade in-region, alinhados com a legislação brasileira. O modelo de agentes opacos mitiga vazamento de propriedade intelectual, mas cria desafios de auditabilidade.
Protocolos emergentes como A2UI (Google, UI declarativa para agentes), ANP (identidade descentralizada) e API Catalog (RFC 9727) sinalizam que o stack continua crescendo — mas nenhum deles está maduro o suficiente para produção em 2026.
Perguntas frequentes
O que é NLWeb?
NLWeb é um projeto open source da Microsoft (MIT, 2025) criado por R.V. Guha — cocriador do Schema.org. Transforma qualquer site com dados estruturados (Schema.org + RSS) em um endpoint conversacional para agentes de IA, sem modificar a experiência do usuário humano. Funciona como servidor MCP.
Qual a diferença entre NLWeb, A2A e MCP?
MCP (Anthropic) conecta agentes a ferramentas e dados externos, A2A (Google/Linux Foundation) permite que agentes de diferentes fornecedores colaborem sem expor sua lógica interna, e NLWeb (Microsoft) transforma sites em endpoints conversacionais. Não competem: são camadas distintas do stack agêntico que se complementam.
O que são Agent Skills?
Agent Skills é um formato aberto (especificação da Anthropic, CLI da Vercel) para empacotar capacidades reutilizáveis que estendem agentes de IA — cada skill contém um SKILL.md com instruções e scripts. Compatível com 18+ agentes (Claude Code, Cursor, Copilot). São o "npm dos agentes de IA": descoberta e distribuição de comportamentos production-ready.
NLWeb é seguro para usar em produção?
NLWeb ainda está em fase inicial — em maio de 2025, uma vulnerabilidade crítica de path-traversal expôs credenciais cloud e a Microsoft corrigiu sem emitir CVE formal. A governança está centralizada na Microsoft, sem fundação neutra, e Constellation Research estima 2 a 3 anos para adoção substancial. Avalie em ambiente de desenvolvimento antes de colocar em produção.
O que fazer agora — seu roadmap agêntico em 3 fases
- Agora (Stage 1): implemente Schema.org e JSON-LD em todas as páginas de receita do site. Declare Content-Signal no robots.txt (
search=yes, ai-train=no, ai-input=yes). Audite RSS e sitemap. Custo baixo, risco zero. - Segundo semestre de 2026 (Stage 2): pilote NLWeb via Cloudflare AutoRAG em uma subseção do site (catálogo ou base de conhecimento). Meça a parcela de tráfego vindo de agentes.
- 2027 (Stage 3): avalie A2A quando seu ecossistema de parceiros tiver endpoints A2A expostos. Avalie Agent Skills se sua equipe técnica usa Claude Code ou Cursor e quer workflows repetíveis.
Se você é CEO de uma empresa de 10 a 50 pessoas, apenas o Stage 1 pertence ao orçamento de 2026. O resto é conversa para o ano que vem.
Se preferir acelerar com quem já mapeia esse stack na prática, converse com nossos especialistas em web agêntica.
O stack agêntico não é o futuro — é a infraestrutura que define quem será citado pelas IAs nos próximos 3 anos.