Inicio
Blog
NLWeb, A2A y Agent Skills: los protocolos de la web agéntica

NLWeb, A2A y Agent Skills: los protocolos de la web agéntica

Q: ¿Qué es NLWeb?

NLWeb es un proyecto open source de Microsoft (MIT, 2025) creado por R.V. Guha, el co-creador de Schema.org. Convierte cualquier web con datos estructurados (Schema.org + RSS) en un endpoint conversacional para agentes de IA, sin modificar la experiencia del usuario humano. Funciona como servidor MCP.

Q: ¿De quién es NLWeb?

NLWeb es un proyecto open source con licencia MIT, concebido por R.V. Guha como Corporate VP y Technical Fellow de Microsoft. Tiene un W3C Community Group, pero no está en el standards track (vía de estandarización) del W3C ni cuenta con una fundación neutral independiente de Microsoft, a diferencia de A2A, que fue donado a la Linux Foundation.

Escrito por Mònica Bon

12 minutos de lectura 12 de julio, 2026

Las inteligencias artificiales ya conocen tu marca. ChatGPT, Perplexity y Gemini mencionan tu empresa cuando alguien pregunta por tus servicios. Pero hay un problema: citan a otros como fuente. Tu web aparece como referencia indirecta, no como origen del dato.

Según datos de InboundCycle, obtenidos de 28 auditorías GEO realizadas a empresas en España, Chile y Brasil entre enero y mayo de 2026, el 60% de las webs analizadas presenta esta situación: la IA reconoce la marca pero no enlaza ni atribuye la información a la web del cliente (C-062). La razón es técnica: tu web no habla el idioma de los agentes de IA.

La solución viene de una historia que empieza en 2011, cuando R.V. Guha co-creó Schema.org, el vocabulario de datos estructurados que hoy usan más de 100 millones de sitios web. Sobre ese sustrato, en apenas 18 meses (de mayo de 2025 a enero de 2026), han aparecido cinco protocolos que forman un stack (conjunto de capas tecnológicas apiladas): NLWeb, A2A, Agent Skills, Content-Signal y MCP. Todo parte de un concepto más amplio: la web agéntica, el ecosistema que conecta tu web con agentes de IA.

Qué es NLWeb y por qué tu web debería hablar con agentes

NLWeb es un proyecto open source (código abierto) de Microsoft que convierte cualquier web con datos estructurados en un punto de acceso conversacional para agentes de IA, sin modificar la experiencia del usuario humano. Piensa en ello como añadir una capa de idioma que los agentes entienden, encima de la web que ya tienes.

NLWeb en 60 segundos

NLWeb (Natural Language Web) es un proyecto open source en Python, con licencia MIT y más de 6.200 estrellas en GitHub, creado por R.V. Guha. Si el nombre te suena, es porque Guha co-creó RSS, RDF, Schema.org y fue arquitecto del Google Knowledge Graph. Su propia descripción del proyecto: «lo que más me ha emocionado construir en toda mi vida» (Microsoft Source, 2025).

La línea temporal es corta pero intensa: Microsoft lo presentó en Build 2025, en octubre de 2025 se propuso un W3C Community Group, y en el primer trimestre de 2026 Cloudflare lanzó AutoRAG con despliegue NLWeb en un clic (Cloudflare, 2026). En marzo de 2026, Yoast integró Schema Aggregation para WordPress (TheRepository, 2026).

Microsoft y Guha usan una analogía potente: «NLWeb es a MCP y A2A lo que HTML fue a HTTP». Pero cuidado con la comparación: HTML es un estándar universal gobernado por el W3C; NLWeb es una implementación impulsada por Microsoft sin fundación neutral independiente. La analogía es retórica, no arquitectónica.

Cómo funciona el pipeline (cadena de procesamiento)

NLWeb toma los datos estructurados que tu web ya publica (Schema.org, JSON-LD, RSS) y los ingiere en una base de datos vectorial. A partir de ahí, los expone a través de dos endpoints (puntos de acceso): /ask para humanos y /mcp para agentes de IA.

Ambos comparten el mismo pipeline de recuperación. El servidor es estrictamente stateless (sin memoria de sesión), así que cada consulta se procesa de forma independiente.

Por debajo, NLWeb coordina cinco componentes internos (AskAgent, AgentFinder, DataFinder, ModelRouter y NLWebScorer) que ejecutan más de 50 llamadas a modelos de lenguaje por cada consulta. Ese dato es relevante: el coste operativo no es trivial.

Los campos clave que puedes configurar son tres: query (la pregunta del usuario), mode (listar resultados, resumir o generar respuesta) y streaming (respuesta en tiempo real o de golpe). El detalle completo está en el repositorio de NLWeb.

Si esto te suena a sopa de siglas, quédate. En 5 minutos lo tendrás claro.

Quién lo usa (y qué sabemos de verdad)

Tripadvisor, Shopify, Eventbrite, Hearst, O'Reilly y Snowflake figuran como early adopters (adoptantes tempranos) (Microsoft Source, 2025). Tripadvisor describió la integración como «cambios mínimos» sobre su base de datos vectorial existente. Un ejemplo real: un usuario pregunta «hoteles familiares cerca de Roma con desayuno incluido» y NLWeb devuelve resultados conversacionales del catálogo de Tripadvisor.

Ahora, es justo hacerse la pregunta contraria: ¿hay datos de impacto real? No. Ningún adopter ha publicado KPIs de conversión ni tráfico procedente de agentes a mayo de 2026.

Constellation Research estima que la adopción sustancial tardará 2-3 años (Constellation Research, 2025). Lo que vemos es señal de interés, no ROI probado.

A2A — cuando los agentes necesitan hablar entre sí

A2A (Agent-to-Agent) es un protocolo abierto que permite a agentes de IA de distintos proveedores comunicarse y colaborar en tareas complejas sin revelar su lógica interna ni sus datos privados.

Qué es A2A y de dónde viene

Si NLWeb resuelve cómo tu web habla con agentes, A2A resuelve algo distinto: cómo los agentes hablan entre ellos. Lo lanzó Google Cloud el 9 de abril de 2025 y lo donó a la Linux Foundation el 23 de junio de 2025, bajo licencia Apache 2.0.

IBM fusionó su protocolo ACP (Agent Communication Protocol) con A2A, consolidándolo como estándar de industria (GitHub A2A, 2026). A mayo de 2026: 23.900 estrellas, versión 1.0 estable, más de 150 organizaciones participando.

La diferencia conceptual con Model Context Protocol es clave: MCP dice «llama a mis herramientas»; A2A dice «delega el objetivo». Los agentes A2A son «opacos»: colaboran sin revelar su memoria interna, su lógica ni sus herramientas. Para empresas B2B, esto significa que dos organizaciones pueden coordinar agentes sin riesgo de exponer propiedad intelectual.

Un dato que importa: A2A reutiliza HTTP, SSE y JSON-RPC 2.0 (Google Developers Blog, 2025). Esto quiere decir que tu infraestructura existente de monitorización y seguridad sirve.

Cómo funciona (building blocks y workflow)

A2A se construye sobre siete piezas:

Client y Server: los dos roles en cada interacción.
Agent Card: la «tarjeta de presentación» del agente, publicada en /.well-known/agent.json. IBM la describe como «el LinkedIn del agente» (IBM Think, 2025).
Task: la unidad de trabajo, con ciclo de vida claro (enviado → en proceso → necesita input → completado/fallido).
Message, Artifact y Part: los contenedores de datos intercambiados.

El workflow tiene tres pasos: descubrimiento (el cliente lee las Agent Cards), autenticación (OAuth 2.0, JWT o mTLS) y comunicación (HTTPS con JSON-RPC 2.0 y SSE para streaming).

El ecosistema es robusto. Más de 50 partners (socios tecnológicos) en el lanzamiento, 150+ a abril de 2026: Atlassian, Salesforce, SAP, ServiceNow, PayPal (Google Developers Blog; Linux Foundation, 2026).

Las seis grandes consultoras (Accenture, Deloitte, McKinsey, PwC, BCG, KPMG) están dentro. Y DeepLearning.AI publicó un curso oficial con Google Cloud e IBM Research.

Mira este dato: la pregunta pragmática en 2026 no es si A2A es bueno, sino si tu ecosistema de partners tiene endpoints A2A. Si no los tiene, A2A es conversación de 2027.

Agent Skills — el npm de los agentes de IA

Agent Skills es una especificación abierta de Anthropic (diciembre de 2025) con CLI de Vercel y directorio público skills.sh (20 de enero de 2026). Con 27.000 estrellas y compatibilidad con más de 18 agentes (Claude Code, Cursor, GitHub Copilot, Gemini...), Skills resuelve un problema que ni MCP ni A2A tocan: cómo los equipos empaquetan y comparten capacidades reutilizables entre agentes (Vercel, 2026).

La anatomía es sencilla: cada skill es un archivo SKILL.md (instrucciones en YAML + markdown), una carpeta scripts/ y opcionalmente references/. El sistema usa progressive disclosure (revelación progresiva): al inicio solo carga el frontmatter (~80 tokens), luego el cuerpo cuando la tarea coincide, luego los scripts cuando se necesitan. Instalación: npx skills add <owner/repo>.

Skills.sh, el directorio público, indexa más de 4.200 skills a primer trimestre de 2026, con 147 nuevos cada día (Snyk, 2026).

Pero cuidado, porque hay un matiz importante aquí: el 36,82% de los skills comunitarios tienen al menos un fallo de seguridad, y el 13,4% tiene issues (problemas) críticos de seguridad según Snyk (Snyk, 2026). La recomendación es la misma que con npmjs.com: fijar versiones, auditar antes de instalar y preferir skills de vendors verificados (Vercel, Anthropic, Microsoft, Stripe, Prisma) sobre contribuciones anónimas.

La posición en el stack queda clara con esta frase de InfoQ: «MCP resolvió cómo un agente habla con herramientas. Skills resuelve cómo los equipos comparten y descubren capacidades. El ganador no será uno u otro, sino ambos» (InfoQ, 2026). Skills es, además, el formato más «legible organizacionalmente»: legal y compliance (cumplimiento normativo) pueden leer el SKILL.md y aprobar lo que el agente puede hacer.

Content-Signal — declarar las reglas del juego para tu contenido

Content-Signal es un marco de señalización de Cloudflare (septiembre de 2025) que permite declarar qué pueden hacer los sistemas de IA con tu contenido. Funciona con tres directivas que se añaden al robots.txt o como cabecera HTTP: search=yes (indexar y mostrar snippets), ai-train=no (no usar para entrenar modelos) y ai-input=yes (sí usar como fuente en respuestas de IA).

Aquí es donde muchos se pierden: Content-Signal no es un protocolo de transporte como MCP o A2A. Es una capa de consentimiento. Para una empresa B2B en Europa bajo el RGPD, es la declaración de derechos de uso del stack agéntico.

La adopción todavía es temprana. Cloudflare midió que solo el 4% de los 200.000 sitios más visitados ha declarado sus preferencias de IA, frente al 78% que tiene robots.txt (Cloudflare, 2026). La brecha entre la existencia de estándares y su adopción real es enorme.

La configuración recomendada para B2B: search=yes, ai-train=no, ai-input=yes. Caveat obligatorio: son preferencias, no enforcement (cumplimiento obligatorio). El IETF trabaja en la estandarización a través del grupo AIPREF (enero de 2025), pero ningún motor se ha comprometido públicamente a respetar todos los signals.

El stack completo — cómo encajan los 5 protocolos

El stack agéntico (la pila completa de protocolos que conecta tu web con agentes de IA) se organiza en cinco capas complementarias, donde cada protocolo ocupa una posición específica y resuelve un problema distinto. Con cuatro protocolos encima de la mesa y MCP como referencia, la pregunta natural es: ¿compiten o se complementan?

Las 5 capas del stack agéntico

Piensa en un sándwich de cinco capas. Cada protocolo ocupa una capa distinta: se componen, no compiten.

Capa 1 — Datos: Schema.org, JSON-LD, RSS, bases de datos vectoriales. El sustrato. Sin esta capa, nada funciona.
Capa 2 — Descubrimiento: NLWeb, llms.txt, Content-Signal. Cómo los agentes encuentran tu contenido y saben qué pueden hacer con él.
Capa 3 — Herramientas: MCP, WebMCP. Cómo un agente ejecuta acciones contra tus APIs y datos.
Capa 4 — Inter-agente: A2A. Cómo los agentes de distintos proveedores se coordinan.
Capa 5 — Empaquetado: Agent Skills. Cómo los equipos distribuyen capacidades reutilizables.

Las 5 capas del stack agéntico

Cada protocolo ocupa una capa — se componen, no compiten

Empaquetado

Cómo los equipos distribuyen capacidades reutilizables

Agent Skills

Inter-agente

Cómo los agentes de distintos proveedores se coordinan

A2A

Herramientas

Cómo un agente ejecuta acciones contra tus APIs y datos

MCP WebMCP

Descubrimiento

Cómo los agentes encuentran tu contenido y saben qué pueden hacer con él

NLWeb llms.txt Content-Signal

Datos

El sustrato — sin esta capa, nada funciona

Schema.org JSON-LD RSS Vector DBs

Fuente: Google, IBM, Microsoft, DeepLearning.AI (2025-2026)

Y ahora viene la parte que realmente importa: según datos de InboundCycle, obtenidos de 28 auditorías GEO realizadas a empresas en España, Chile y Brasil entre enero y mayo de 2026, el 0% de las webs analizadas implementa Schema de tipo Article o BlogPosting (C-062). Esto significa que protocolos como NLWeb — que se apoyan en Schema.org para funcionar — no tienen sustrato sobre el que operar en la inmensa mayoría de webs hispanas. Solo el 27% tiene llms.txt, y el AEO Score medio es de 55 sobre 100. Un dato más: las webs que sí tienen llms.txt bien implementado obtienen un AEO Score medio de 66, frente a 51 en las que no lo tienen. Correlación, no causalidad, pero la dirección es clara.

Nuestra posición es transparente: MCP es el único protocolo del stack que ya usamos en producción diaria. NLWeb y A2A están en nuestra hoja de ruta de evaluación. Agent Skills lo usamos internamente para empaquetar workflows (flujos de trabajo) de equipo.

Tabla comparativa — qué resuelve cada protocolo

Comparativa: 5 protocolos del stack agéntico

Qué resuelve cada uno y quién lo impulsa

	NLWeb	A2A	Agent Skills	Content-Signal	MCP
Quién lo impulsa	Microsoft (R.V. Guha)	Google → Linux Foundation	Anthropic (spec) + Vercel (CLI)	Cloudflare	Anthropic
Año	2025	2025	2025-2026	2025	2024
Pregunta que responde	¿Cómo hago que mi web hable con agentes?	¿Cómo hago que mis agentes hablen entre sí?	¿Cómo empaqueto capacidades para agentes?	¿Qué puede hacer la IA con mi contenido?	¿Cómo conecto mi agente a herramientas?
Tipo	Framework open source	Protocolo abierto	Formato de empaquetado	Vocabulario de señalización	Protocolo de herramientas
Licencia	MIT	Apache 2.0	MIT	CC0	Open spec
Tracción (mayo 2026)	6,2k ★ · 6 early adopters	23,9k ★ · 150+ orgs	27k ★ · 90k+ skills	4% top 200k sitios	Estándar de facto
Gobernanza neutral	No (Microsoft)	Sí (Linux Foundation)	Parcial (spec abierta)	Sí (CC0, IETF)	Parcial (spec abierta)

Fuentes: Microsoft, Google, Vercel, Cloudflare, Anthropic (2024-2026)

El consenso de Google, IBM, Microsoft y DeepLearning.AI es que estos protocolos son capas complementarias. IBM lo explica con una analogía de retail: MCP permite que el agente de inventario hable con su base de datos; A2A permite que ese agente hable con agentes de proveedores externos (IBM Think, 2025). Y DeepLearning.AI lo resume: «MCP conecta agentes con datos; A2A conecta agentes entre sí» (DeepLearning.AI, 2026).

El mapa político también importa: Microsoft impulsa NLWeb, Google donó A2A a la Linux Foundation, Anthropic creó la especificación de MCP y Skills, Vercel desarrolla el CLI y el marketplace de Skills, y Cloudflare lidera Content-Signal. El riesgo real no es que un vendor domine todo, sino la fragmentación entre capas. La carga de integración cae en el adoptante.

El stack sigue creciendo, y la herramienta isitagentready.com de Cloudflare permite auditar la preparación agéntica de cualquier dominio.

Con el mapa del stack claro, toca hablar de lo que nadie más cubre en español: los riesgos reales.

Qué puede salir mal — riesgos que nadie te cuenta

Cada protocolo del stack agéntico tiene riesgos documentados que afectan a la seguridad, la gobernanza y el coste operativo. Ningún artículo en español los cubre. Aquí van.

NLWeb presenta cuatro frentes de riesgo. El primero es el más llamativo: una vulnerabilidad path-traversal (acceso a rutas no autorizadas) descubierta en mayo de 2025. Un atacante podía leer archivos sensibles del servidor con una URL manipulada, incluyendo claves API de los modelos de lenguaje.

Microsoft parcheó el problema pero no emitió un CVE formal, lo que significa que es invisible para escáneres automáticos de seguridad. Segundo, la gobernanza está centralizada en Microsoft sin fundación neutral.

Tercero, las más de 50 llamadas a LLMs por consulta generan un coste operativo significativo. Cuarto, la preparación organizacional requiere alinear marketing, IT y cumplimiento normativo.

¿Te suena exagerado? Los datos dicen lo contrario.

A2A amplía la superficie de ataque. Un estudio académico de arXiv (2505.12490, 2025) modeló el riesgo de filtración de datos en cadenas multi-agente: si cada agente tiene un 10% de riesgo de filtración, con 5 agentes encadenados el riesgo acumulado sube al 41%.

También hay puntos ciegos de compliance (cumplimiento normativo): cuando los datos cruzan agentes de distintas organizaciones, la trazabilidad de soberanía de datos se complica. A2A permite proveedores de identidad en región (útil para RGPD), pero los agentes opacos crean desafíos de auditabilidad.

Agent Skills tiene su propio riesgo: el 13,4% de los skills analizados por Snyk presentan problemas críticos de seguridad (Snyk, 2026).

Tres caveats de transparencia. Los datos de estrellas y socios cambian semanalmente (datos a mayo de 2026). Las afirmaciones sobre NLWeb proceden mayoritariamente de Microsoft y sus socios directos. Y no existen datos del INE sobre adopción de protocolos agénticos en España.

La migración de A2A v0.3 a v1.0 tuvo cambios incompatibles, aunque existe un indicador de compatibilidad retroactiva. Protocolos emergentes como A2UI (Google), ANP (identidad descentralizada) y API Catalog (RFC 9727) siguen ampliando el stack.

Si has llegado hasta aquí, ya tienes una visión más completa del stack que el 99% de los artículos en español. Vamos con las dudas más frecuentes.

Preguntas frecuentes

¿Qué es NLWeb?

NLWeb es un proyecto open source de Microsoft (MIT, 2025) creado por R.V. Guha, el co-creador de Schema.org. Convierte cualquier web con datos estructurados (Schema.org + RSS) en un endpoint conversacional para agentes de IA, sin modificar la experiencia del usuario humano. Funciona como servidor MCP.

¿Cómo funciona NLWeb?

NLWeb ingiere el contenido estructurado de tu web (JSON-LD, Schema.org, RSS) en una base de datos vectorial y lo expone a través de dos endpoints: /ask para humanos y /mcp para agentes de IA. Cada consulta pasa por un pipeline de más de 50 llamadas a modelos de lenguaje que recupera, clasifica y sintetiza la respuesta.

¿De quién es NLWeb?

NLWeb es un proyecto open source con licencia MIT, concebido por R.V. Guha como Corporate VP y Technical Fellow de Microsoft. Tiene un W3C Community Group, pero no está en el standards track (vía de estandarización) del W3C ni cuenta con una fundación neutral independiente de Microsoft, a diferencia de A2A, que fue donado a la Linux Foundation.

¿Qué diferencia hay entre NLWeb, A2A y MCP?

MCP (Anthropic) conecta agentes con herramientas y datos externos. A2A (Google/Linux Foundation) permite que agentes de distintos proveedores colaboren entre sí sin exponer su lógica interna. NLWeb (Microsoft) convierte webs en endpoints conversacionales. No compiten: son capas distintas del stack agéntico que se complementan.

Con las FAQs resueltas, lo que queda es pasar a la acción.

Qué hacer ahora — tu roadmap (hoja de ruta) agéntico en 3 fases

Tu roadmap agéntico en 3 fases

De cimientos a multi-agente — avanza al ritmo de tu ecosistema

Ahora

Cimientos

Schema.org (Article, BlogPosting, FAQPage)
Content-Signal en robots.txt
Higiene de RSS

CEO 10-50 emp.: suficiente para 2026

H2 2026

Piloto NLWeb

Cloudflare AutoRAG
Evaluar coste: 50+ llamadas LLM/query
Medir tráfico de agentes

Dir. Marketing 50-500 emp.: plan staged

2027

Multi-agente

A2A si partners tienen endpoints
Agent Skills para workflows
Trigger: fundación neutral o CVE

Solo si el ecosistema lo justifica

Fuente: InboundCycle, basado en Cloudflare, Microsoft, Google (2025-2026)

Fase 1 (ahora): implementa Schema.org (Article, BlogPosting, FAQPage), declara Content-Signal en tu robots.txt (search=yes, ai-train=no, ai-input=yes) y revisa la higiene de tu RSS. Coste bajo, impacto inmediato en descubrimiento por agentes.
Fase 2 (segundo semestre de 2026): pilota NLWeb con Cloudflare AutoRAG. Evalúa el coste operativo de las 50+ llamadas LLM por consulta antes de escalar.
Fase 3 (2027): evalúa A2A y Agent Skills solo si tu ecosistema de partners tiene endpoints A2A activos. Si no, no hay con quién hablar.

Si diriges una empresa de 10-50 personas, con la Fase 1 tienes suficiente para 2026. Si lideras marketing en una empresa de 50-500, un plan por fases te permite avanzar sin comprometer presupuesto en protocolos que aún no tienen masa crítica.

El trigger de cambio que marca el paso a la siguiente fase: que NLWeb se done a una fundación neutral o que se emita un CVE formal con auditoría independiente. NLWeb es un sustrato de descubrimiento, no un botón mágico de visibilidad ante IAs.

Si prefieres que un equipo con experiencia en implementación agéntica diseñe este roadmap contigo, nuestros expertos en web agéntica pueden ayudarte a priorizar lo que tu web necesita hoy.

Actualizado: julio de 2026

Mònica Bon

¿Y tú qué opinas? ¡Déjanos aquí tus comentarios!

Suscríbete al Blog

Suscríbete por email y recibe además un pack de bienvenida con nuestros 5 mejores artículos

NLWeb, A2A y Agent Skills: los protocolos de la web agéntica

Qué es NLWeb y por qué tu web debería hablar con agentes

NLWeb en 60 segundos

Cómo funciona el pipeline (cadena de procesamiento)

Quién lo usa (y qué sabemos de verdad)

A2A — cuando los agentes necesitan hablar entre sí

Qué es A2A y de dónde viene

Cómo funciona (building blocks y workflow)

Agent Skills — el npm de los agentes de IA

Content-Signal — declarar las reglas del juego para tu contenido

El stack completo — cómo encajan los 5 protocolos

Las 5 capas del stack agéntico

Tabla comparativa — qué resuelve cada protocolo

Qué puede salir mal — riesgos que nadie te cuenta

Preguntas frecuentes

¿Qué es NLWeb?

¿Cómo funciona NLWeb?

¿De quién es NLWeb?

¿Qué diferencia hay entre NLWeb, A2A y MCP?

Qué hacer ahora — tu roadmap (hoja de ruta) agéntico en 3 fases

Mònica Bon

Mònica Bon

Acerca de

Nuestros servicios

Recursos de utilidad

Legal

Nuestras sedes

España

México

Chile

Brasil