Abstract
La evolución de la web, desde un repositorio de documentos para humanos hacia un ecosistema de acciones para agentes, exige una nueva capa de infraestructura técnica. Este trabajo presenta el WebMCP (Web Model Context Protocol), un protocolo diseñado para estandarizar la forma en que los agentes de IA —LLMs, agentes autónomos y scripts CLI— descubren, validan y operan sobre activos digitales.
A diferencia de los modelos de lenguaje probabilísticos, WebMCP propone un marco determinístico de auditoría basado en señales técnicas verificables. Se formaliza el WebMCP Readiness Score (WRS) y el Agent-Agnostic Sub-Score (AAS) como métricas fundamentales para la transición hacia una web de ejecución total.
Introducción: La Crisis del Contexto
En la actual Economía de la Inferencia, la visibilidad ya no es suficiente. El éxito de una entidad digital depende de su operabilidad. Los agentes de IA enfrentan actualmente dos barreras críticas que impiden la ejecución autónoma:
| Barrera | Descripción | Impacto |
|---|---|---|
| Entropía de Contexto | Dificultad de extraer datos estructurados de interfaces diseñadas para humanos | El agente no puede leer con precisión |
| Incapacidad de Acción | Falta de protocolos estandarizados para ejecutar transacciones de forma segura | El agente no puede actuar sin alucinaciones |
El Modelo Determinístico de WebMCP
A diferencia de las respuestas generativas de los LLMs, el protocolo WebMCP opera bajo una lógica determinística: el resultado es una función directa de señales técnicas replicables. No hay interpretación. No hay probabilidades. Solo validación.
3.1 Filosofía de Validación
El modelo no "interpreta" si un sitio es apto; valida la existencia de archivos, cabeceras y respuestas de API. Una capacidad se considera activa solo si supera la prueba de ejecución real: petición HTTP + respuesta JSON válida.
3.2 WebMCP Readiness Score (WRS)
El nivel de preparación global se calcula mediante la siguiente ecuación de pesos ponderados:
Los cuatro componentes del WRS
Factor crítico. Mide la activación de WebMCP, manifiestos y contratos de herramientas.
Evalúa la citabilidad: Schema.org, etiquetas HTML5 semánticas, llms.txt.
Mide la accesibilidad y documentación de la REST API. Verifica endpoints activos.
Verifica HTTPS, autenticación por tokens y rate limiting para operación agéntica segura.
Los Tres Niveles de Preparación
El protocolo organiza la madurez técnica en tres niveles acumulativos. Cada nivel supone la consolidación del anterior. No hay saltos: la ejecución requiere citabilidad, y la autonomía requiere ejecución.
El agente puede leer y citar el contenido sin errores. Se logra mediante etiquetas HTML5 semánticas y el archivo llms.txt, que sirve como resumen ejecutivo para el modelo.
El agente puede realizar acciones. Introduce los Tool Contracts: mapean intenciones del agente (GET_PRICE, BOOK_SLOT) a endpoints técnicos validados que devuelven JSON.
Nivel máximo de autonomía. El sitio es operable por cualquier agente o script independiente sin depender de interfaz visual ni middleware específico. Se formaliza mediante el AAS.
Agent-Agnostic Sub-Score (AAS)
| Variable | Descripción | Implementación |
|---|---|---|
| Headless-First (HF) | Descubrimiento sin interfaz visual | ai-plugin.json + ai-instructions.md |
| Auth Tokens (AT) | Autenticación programática | Bearer tokens, App Passwords |
| Verbosity Control (VC) | Economía de tokens | GraphQL o filtrado ?fields= |
El Estándar ai-instructions.md
Para alcanzar el Nivel 3, el ecosistema debe proporcionar un "Manual de Operaciones" que el agente consume vía curl. Este archivo es el system prompt local del sitio: le dice al agente quién es, qué puede hacer y cómo hacerlo.
Las cuatro secciones obligatorias
Qué es el sitio y qué rol debe asumir el agente al interactuar con él.
Lista de rutas directas para cada acción disponible. Sin ambigüedad.
Instrucciones para pedir solo los datos necesarios (Token Economy).
Protocolo de respuesta ante fallos: 429 rate limit, 401 auth, 500 server.
Performance Agéntica: Time to Action
En WebMCP, el rendimiento no se mide por la satisfacción humana, sino por la latencia de ejecución de la máquina. El usuario es el agente. Su tiempo de respuesta es el TTA.
| Métrica | Definición operacional | Threshold |
|---|---|---|
| Time to Action (TTA) | Suma del tiempo de descubrimiento del manifiesto y el TTFB de la respuesta JSON | < 500ms |
| Manifest Discovery | Tiempo hasta localizar ai-plugin.json o ai-manifest.json | < 200ms |
| JSON Response | Tiempo al primer byte de respuesta válida desde el endpoint | < 300ms |
Gestión de Gaps y Señalética
El protocolo implementa un sistema de visualización para la toma de decisiones. Los gaps se priorizan por su impacto en el WRS: un error en Infraestructura siempre es de impacto Crítico dado su peso del 50%.
Sistema de Badges
Matriz de Prioridad de Gaps
| Cuadrante | Peso WRS | Impacto de Gap | Acción Recomendada |
|---|---|---|---|
| Infraestructura | 50% | 🔴 Crítico | Implementar inmediatamente. Bloquea todos los niveles. |
| Semántica | 20% | 🟡 Alto | Priorizar llms.txt y JSON-LD en sprint actual. |
| APIs | 20% | 🟡 Alto | Activar openapi.json y validar respuestas JSON. |
| Seguridad | 10% | 🟢 Medio | Implementar Bearer + rate limiting headers. |
Roadmap de Evolución: WebMCP V6.0
Hacia el futuro, el protocolo proyecta tres fases de maduración que extienden WebMCP desde la operabilidad hacia la gobernanza y el descubrimiento instantáneo.
Implementación de agent-logs.json para que el sitio web sea una "caja negra" que audite la eficacia de los agentes. El sitio no solo ejecuta — aprende de cada interacción agéntica.
Uso de registros DNS TXT para descubrimiento instantáneo a nivel de red. El agente no necesita analizar HTML ni buscar manifiestos: la infraestructura DNS expone la capacidad directamente.
Creación del Context & Injection Shield, una capa de seguridad que valida los comandos del agente antes de procesarlos, previniendo prompt injection y comandos maliciosos a nivel de infraestructura.
Anexo Técnico: Las 58 Señales de Ejecución
La auditoría de WebMCP Readiness V5.1 se fundamenta en la validación de 58 señales distribuidas en cuatro cuadrantes. Cada señal se evalúa mediante una petición HTTP real — no inferencia, no interpretación.
I. Infraestructura y Discovery — 15 señales
- Endpoint activo
?format=mcp - Archivo
/.well-known/ai-plugin.jsondetectable - Presencia de
ai-manifest.jsonen raíz - Cabecera HTTP
Linkconrel="mcp-manifest" - Directorio
/.well-known/accesible por agentes - Detección de prefijo
wp-json/para WordPress REST - + 9 señales adicionales de cabeceras y rutas de descubrimiento
II. Semántica y Citabilidad — 14 señales
- Archivo
/llms.txt— Resumen ejecutivo para LLMs - Archivo
/llms-full.txt— Documentación extendida - JSON-LD con tipo
@WebAPI - Schema con
potentialActionytarget.urlTemplate - Etiquetas HTML5 semánticas:
<article>,<main>,<nav> - Atributos
data-mcp-*mapeados a intenciones - + 8 señales adicionales de estructura y etiquetado semántico
III. Capacidad de API y Acción — 16 señales
- Endpoint
/openapi.jsono/openapi.yamlactivo - Soporte para parámetros de filtrado
?_fields=o?fields= - Disponibilidad de endpoint GraphQL
/graphql - Respuestas en formato
application/jsonpuro - Contratos de herramientas vinculados a POST/PUT funcionales
- Validación de formularios vía REST (Calendly, Cal.com, HubSpot API)
- + 10 señales adicionales de interoperabilidad y ejecución de datos
IV. Gobernanza y Seguridad — 13 señales
- Soporte para
Authorization: Bearer - Implementación de Application Passwords (WordPress)
- Cabeceras de Rate Limiting (
X-RateLimit-Limit) - Reglas específicas para
User-agent: GPTBoten robots.txt - Soporte para cabeceras CORS para agentes externos
- + 8 señales adicionales de control de flujo y autenticación agéntica
Referencias
Amaya, J. (2026). La Teoría de la Soberanía Semántica: Hacia un nuevo paradigma de autoridad en la Economía de la Inferencia.
Anthropic. (2024). Model Context Protocol (MCP): Specification and Implementation Guide.
Berners-Lee, T. (2001). The Semantic Web. Scientific American.
Fielding, R. T. (2000). Architectural Styles and the Design of Network-based Software Architectures. Doctoral dissertation, UC Irvine.
Google Developers. (2025). Web Vitals for Machine Consumability: Beyond LCP and CLS.
W3C. (2020). JSON-LD 1.1: A JSON-based Serialization for Linked Data.
Sobre el Autor
Siguiente paso
¿Tu sitio está listo para ejecutar?
Audita el WebMCP Readiness Score de tu sitio y descubre qué señales de las 58 están activas, cuáles fallan y cuál es tu ruta hacia el Nivel 3.
Auditar mi sitio →WebMCP Readiness V5.1 · Jairo Amaya · Bogotá, Colombia, 2026