--- WEBMCP AGENT VIEW --- SPEC: WebMCP/1.0 PROVIDER: Jairo Amaya Consulting PROVIDER_URL: https://jairoamaya.co MCP_MANIFEST: https://jairoamaya.co/wp-content/uploads/2026/02/mcp-config.json --- DOCUMENT --- TITLE: Adiós al Scraping: Cómo preparar tu web para la era de los Agentes de IA (WebMCP) URL: https://jairoamaya.co/webmcp-agentes-ia-scraping/ AUTHOR: Jairo DATE_PUBLISHED: 2026-02-15 DATE_MODIFIED: 2026-02-19 LANGUAGE: es DESCRIPTION: Adiós al Scraping: Cómo preparar tu web para la era de los Agentes de IA (WebMCP) ¿Por qué el scraping web ya no es suficiente? Hasta hoy, cuando un agente de IA visitaba tu web, se comportaba como un turista ciego tratando de leer braille en una pared rugosa. Tenía que “s CATEGORIES: WebMCP --- CONTENT --- # Adiós al Scraping: Cómo preparar tu web para la era de los Agentes de IA (WebMCP) ## ¿Por qué el scraping web ya no es suficiente? Hasta hoy, cuando un agente de IA visitaba tu web, se comportaba como un turista ciego tratando de leer braille en una pared rugosa. Tenía que “scrapear” todo el código, adivinar qué botón hacía qué y cruzar los dedos para no romper nada. Este modelo está llegando a su límite. La era de “adaptar la web para humanos” ha ganado un nuevo jugador: el Agente Autónomo. Y si no hablas su idioma, simplemente no existes para él. Durante años, el scraping web fue la única forma en que los sistemas automatizados interactuaban con sitios diseñados para humanos. Un agente de IA debía: • Analizar el DOM completo • Inferir la función de botones y formularios • Adaptarse a cambios visuales inesperados Cada modificación en la estructura HTML puede romper la automatización, cada cambio de clase, id o layout obliga al agente a reinterpretar el entorno. Aquí el problema no es la IA, el cuello de botella es que seguimos desarrollando exclusivamente para humanos. ## La nueva etapa: Agentes de IA que ejecutan acciones Los agentes autónomos de IA ya no solo consumen contenido: ejecutan tareas. Pueden: • Comparar productos • Completar formularios • Reservar servicios • Realizar compras • Consultar disponibilidad Pero para hacerlo de forma eficiente necesitan acceso estructurado a las capacidades del sistema. Aquí es donde surge WebMCP. ## ¿Pero qué es WebMCP? WebMCP es un enfoque estructurado que permite declarar qué acciones puede ejecutar un agente dentro de tu sistema. En lugar de interpretar visualmente la interfaz, el agente: • Descubre capacidades disponibles • Comprende parámetros requeridos • Ejecuta funciones con datos estructurados Pasamos de: Interpretación del DOM → Invocación directa de herramientas Por si no sabes qué es el DOM (Document Object Model): es la estructura interna que el navegador crea a partir del HTML, organizando todos los elementos de la página como un árbol que puede ser leído y manipulado. El lío hoy es que este modelo está pensado para renderizar y modificar interfaces visuales, no para exponer capacidades funcionales a agentes de IA. Acá es donde entendemos que WebMCP no es simplemente una API REST tradicional. Es un contrato explícito de capacidades orientado a agentes autónomos. O de una manera menos técnica, imagina que en lugar de que la IA pierda tiempo interpretando visualmente tu página, tu web le entrega un Contrato de Herramientas vía WebMCP que a diferencia de las API REST que conocemos y que requieren integraciones rígidas, aquí la IA lee tus funciones, parámetros y respuestas de inmediato. Pasamos de la suposición visual a la ejecución directa con datos estructurados. ## El ecosistema MCP en febrero 2026: dos protocolos, un mismo objetivo El ecosistema ha evolucionado con una bifurcación importante que vale la pena entender con precisión. ### 1. MCP — Model Context Protocol (Anthropic, noviembre 2024) El protocolo original, creado por Anthropic y hoy gestionado como estándar abierto bajo la Linux Foundation junto a Block y OpenAI. • Dónde opera: Backend / servidor • Cómo conecta: JSON-RPC entre plataformas de IA y fuentes de datos • Adopción actual: Más de 97 millones de descargas mensuales del SDK, más de 10,000 servidores activos, integrado en ChatGPT, Claude, Gemini y Microsoft Copilot • Fuente técnica oficial: modelcontextprotocol.io En palabras de Anthropic: “MCP proporciona una interfaz universal para leer archivos, ejecutar funciones y manejar prompts contextuales.” ### 2. WebMCP — Web Model Context Protocol (Google + Microsoft, febrero 2026) La adaptación del concepto MCP al navegador, desarrollada conjuntamente por Google y Microsoft e incubada en el W3C Web Machine Learning Community Group. • Dónde opera: Cliente / navegador (Chrome 146, Early Preview) • Cómo conecta: API nativa del navegador navigator.modelContext • Qué introduce: Tool Contracts declarados directamente en el HTML o mediante JavaScript • Fuente primaria: Chrome Developers Blog — André Cipriani Bandarra, Google (10 feb 2026) ## Cómo implementar WebMCP hoy (Early Preview) Google ofrece dos caminos de implementación: Declarative API — Para acciones estándar, directo en HTML:
Imperative API — Para flujos complejos, con JavaScript: navigator.modelContext.registerTool({ name: “buscar_articulos”, description: “Busca artículos por tema en jairoamaya.co”, parameters: { query: { type: “string”, required: true } }, handler: async ({ query }) => { const res = await fetch(`/wp-json/wp/v2/posts?search=${query}`); return await res.json(); } }); Puedes solicitar acceso al Chrome Early Preview Program directamente en developer.chrome.com. Más abajo vas a encontrar el caso de estudio que hice con este sitio, no podía quedarme sin validar en carne propia, ahí vas a encontrar como documenté los gaps detectados. GAP | PROTOCOLO QUE LO RESUELVE --- | --- Ausencia de mcp-config.json | MCP (modelcontextprotocol.io) Falta de Tool Contracts | WebMCP (Declarative o Imperative API) Formularios sin semántica agéntica | WebMCP (atributo toolname en forms) Sin API estructurada de contenidos | MCP + WordPress REST API Selectores dinámicos de Elementor | WebMCP (atributos estables en HTML) Si necesitas café, es buen momento. Lo que sigue ya es arquitectura. ## El archivo clave: mcp-config.json Para que tu sitio sea realmente compatible con agentes de IA, necesitas un manifiesto de capacidades. El archivo mcp-config.json cumple esa función. Es el equivalente moderno de un robots.txt, pero enfocado en ejecución, no en rastreo. Define tres pilares: ### 1. Descubrimiento de acciones Qué puede hacer el agente: • Comprar • Filtrar • Agendar • Consultar datos ### 2. Validación estructurada Uso de JSON-LD y esquemas formales para: • Reducir ambigüedad • Minimizar errores • Disminuir alucinaciones ### 3. Seguridad y Gobernanza Control granular sobre: • Permisos • Autenticación • Límites de ejecución El agente solo puede ejecutar lo que declares explícitamente. #### WebMCP en la práctica: Datos que cierran conversiones En marketing, la claridad es conversión. Mientras un humano procesa banners y diseño, un Agente de IA necesita claridad absoluta. Así es como tu web le debería responder a una IA para eliminar cualquier margen de error: { “status”: “success”, “action”: “reserve_consultation”, “data”: { “@context”: “https://schema.org”, “@type”: “ScheduleAction”, “actionStatus”: “https://schema.org/CompletedActionStatus”, “result”: { “@type”: “Reservation”, “reservationId”: “IA-2026-X99”, “reservationStatus”: “https://schema.org/Confirmed”, “startTime”: “2026-03-10T15:00:00-05:00”, “provider”: { “@type”: “ProfessionalService”, “name”: “Jairo Amaya Consulting”, “url”: “https://jairoamaya.co” } } }, “mcp_tokens_consumed”: 124, “next_steps”: [“add_to_calendar”, “send_confirmation_email”] } Esta estructura permite que el agente pase del descubrimiento a la ejecución en milisegundos, optimizando tu tasa de éxito en automatizaciones. ### Conectividad Robusta: Más allá del Request/Response Aunque WebMCP se apoya en la infraestructura web existente, su verdadera potencia reside en la eficiencia del transporte de datos. A diferencia del modelo tradicional request/response de HTTP, donde cada interacción es independiente, la arquitectura WebMCP se optimiza mediante el uso de Server-Sent Events (SSE). Esto permite que, una vez que el agente de IA invoca una herramienta, el sistema mantenga un canal unidireccional abierto para enviar actualizaciones de estado en tiempo real sobre la ejecución de la tarea. De esta forma, si una acción (como procesar un pago o consultar una base de datos externa) toma tiempo, el agente no queda en un estado de espera ciega, sino que recibe un flujo constante de contexto estructurado, minimizando la latencia y eliminando el riesgo de desconexiones por timeout. Beneficio para tu arquitectura: • Persistencia controlada: Permite reportar avances parciales sin reabrir conexiones repetidamente. • Eficiencia de red: Reduce el overhead de cabeceras HTTP en interacciones largas entre el agente y la web. ## Checklist técnico para hacer tu web AI-Ready Tres fundamentos que necesitas para operar con estos agentes: ### 1. Formularios HTML semánticos Evita nombres ambiguos. Incorrecto: Correcto: La claridad semántica reduce fricción en automatización. ### 2. Datos estructurados con Schema.org Implementar Schema.org ya no es solo SEO para buscadores como Google. Es la base para que los agentes comprendan: • Productos • Servicios • Entidades • Relaciones Sin datos estructurados, tu contenido es texto.Con datos estructurados, tu contenido es contexto. ### 3. Desacoplamiento entre lógica y UI Tu lógica de negocio debe poder ejecutarse sin depender de: • Posición visual • Color del botón • Jerarquía del layout Si la acción depende de la apariencia, no es robusta para automatización. La separación entre lógica y presentación es obligatoria en la era de la IA autónoma. Estos ajustes sin duda hacen que la visión del marketing digital se transforme o evolucione, durante muchos años muchas de las estrategias estaban pensadas para optimizar los clics de los usuarios (humanos). En esta nueva era, entra una variable en que se optimiza también para ejecución por agentes. Los usuarios comenzarán a delegar tareas como: • Comparar precios • Reservar servicios • Gestionar compras recurrentes • Programar citas Y ahora la pregunta estratégica deja de ser: ¿Tu web es atractiva? Cambia a: ¿Tu sistema es operable por agentes? Y este punto de partida puede cambiar radicalmente nuestra forma de estructurar nuestros proyectos. ## Mi conclusión: Pasamos de webs visuales a web ejecutables El scraping fue una solución transitoria. El futuro es la declaración estructurada de capacidades. WebMCP representa el paso de una web pensada para leera una web diseñada para ejecutar. #### Humano vs. Agente: El Cambio de Juego CARACTERíSTICA | WEB PARA HUMANOS | WEB PARA AGENTES (WEBMCP) --- | --- | --- Interfaz Primaria | Visual (GUI / DOM) | Lógica (JSON-LD / Contrato) Navegación | Clics y Menús | Invocación de Herramientas Estabilidad | Frágil | Robusta Eficiencia | Baja (Megabytes) | Altísima (Kilobytes) Costo IA | Alto (~9,000 tokens) | Mínimo (~150 tokens) ### ¿Quieres saber si tu web está preparada? • Como parte de esta era de Agentes Autónomos, creé una aplicación ### WebMCP Readiness Mejora tu arquitectura para que agentes autónomos operen en tu web. Pasa de scraping ineficiente a ejecución directa por contrato. • Reducir consumo innecesario de tokens (-98%). • Evaluar tu arquitectura actual • Validar Tool Contracts. • Prepararte para la economía de agentes. QUIERO SABER MÁS ## Caso de Estudio 🔍 He pasado mi propio dominio por el motor de IA para identificar qué tan preparado está para la era de los agentes. Estos son los resultados reales que arroja la herramienta: Score de Preparación: 68/100 Estado: NECESITA MEJORAS La web es excelente para humanos, pero presenta “puntos ciegos” para la ejecución autónoma de agentes. ### Gaps Críticos Detectados (Top 3) • Ausencia de mcp-config.json: No existe un manifiesto que declare capacidades funcionales, obligando al agente a usar scraping ineficiente. • Falta de Esquema de Acciones: Los formularios no están vinculados a Schema.org/Action, lo que genera ambigüedad en la intención de conversión. • Dependencia de Selectores Dinámicos: Los IDs de Elementor pueden cambiar, rompiendo la estabilidad de las herramientas para agentes externos. ### Impacto de la eficiencia MéTRICA | SIN WEBMCP (SCRAPING) | CON WEBMCP (CONTRATO) --- | --- | --- Consumo de Tokens | ~9,200 tokens | ~150 tokens Tasa de Éxito | 35% (Inestable) | 99% (Ejecución Directa) Latencia | Alta (Interpretación DOM) | Instantánea (Lógica Pura) Métricas estimadas en simulación de ejecución de formulario estándar bajo condiciones controladas. Prueba de concepto en vivo ## Esto no es magia, es arquitectura. ¿Quieres ver cómo me lee un agente de IA ahora mismo? Solo tienes que añadir este parámetro al final de la URL de este artículo o de mi Home: ?format=mcp Verás mi web en su estado más puro: Lógica sobre diseño. Barry Schwartz, 11 feb 2026 resume las experiencias agénticas están redefiniendo el futuro del SEO, y explorar estos protocolos ahora es una ventaja competitiva real. ### Referencias técnicas • MCP oficial: modelcontextprotocol.io • Chrome Blog: developer.chrome.com/blog/webmcp-epp • Especificación W3C: webmcp.link • Cobertura SEO: Search Engine Land, 11 feb 2026 • Análisis técnico: VentureBeat Contenido optimizado con criterios de autoridad semántica para AI Overview. 🤖 WebMCP Chrome 146 JSON-LD ## ROADMAP DE ADAPTACIÓN AGÉNTICA Sigue los pasos técnicos para transformar tu web de una interfaz visual a una central de ejecución para agentes de IA. Explora ahora → ✕ #### Título del Paso ✅ #### ¡Listo! Guía descargada Ya tienes lo necesario para optimizar tu marca para AI Overview. He simplificado todo para que sea fácil de seguir. Mira esto: Mira la página 5 para el tema del código de identidad. Si te trabas en algún paso, ya sabes dónde encontrarme. CERRAR Y VOLVER AL BLOG --- AVAILABLE ACTIONS --- CONTACT: https://jairoamaya.co/contacto/ SCHEDULE: https://jairoamaya.co/contacto/?service=estrategia WEBMCP_AUDIT: https://jairoamaya.co/contacto/?service=webmcp-audit SEARCH_CONTENT: https://jairoamaya.co/wp-json/wp/v2/posts?search={query} LIST_POSTS: https://jairoamaya.co/wp-json/wp/v2/posts?per_page={count}&page={page} GET_CATEGORIES: https://jairoamaya.co/wp-json/wp/v2/categories --- METRICS --- ESTIMATED_TOKENS: ~2722 FORMAT: text/plain+webmcp CACHE_SECONDS: 3600 --- END WEBMCP ---