Model Context Protocol (MCP) Breve introducción

Model Context Protocol (MCP) es un protocolo de estandarización diseñado para facilitar la comunicación entre aplicaciones de inteligencia artificial (IA) y herramientas externas

Aptos apuesta USD $50 millones a la AI y los mercados institucionales on-chain

Binance Lanza la Agentic Wallet: La Era de las Carteras Diseñadas para Agentes de IA

Midnight (NIGHT) Avanza en Abril 2026: Nuevos Proyectos de I+D, Bitcoin Yield Privado y Adopción Institucional

Ethereum avanza en su roadmap 2026 con upgrades modulares: Glamsterdam (H1) y Hegota (H2)

Publicado

1 año ago

17 de abril de 2025

por

Claudio R Parrinello

Model Context Protocol (MCP) es un protocolo de estandarización diseñado para facilitar la comunicación entre aplicaciones de inteligencia artificial (IA) y herramientas externas. Similar a protocolos como HTTP (para la transferencia de datos en internet) o SMTP (para el envío de correos electrónicos), MCP busca ser el estándar para la integración de agentes de IA con servidores y aplicaciones, reduciendo el tiempo de desarrollo y simplificando las conexiones. MCP permite que los agentes de IA interactúen con herramientas externas de manera autónoma, utilizando un formato estandarizado que elimina la necesidad de integraciones personalizadas.

MCP se basa en un marco que utiliza formatos de datos interoperables, como JSON o YAML, para definir las capacidades de las herramientas y sus métodos de interacción. Esta estandarización permite una integración fluida en diversas plataformas, convirtiéndolo en una piedra angular para la automatización de IA escalable.

¿Quién lo creó?

Fue desarrollado por Anthropic, una empresa fundada por ex-investigadores de OpenAI, conocida por su trabajo en modelos de IA seguros y éticos como Claude. Anthropic lanzó MCP en noviembre de 2024, aprovechando su experiencia en la construcción de sistemas de IA que priorizan la interpretabilidad y la facilidad de integración. Su objetivo era abordar las limitaciones de las integraciones basadas en APIs, que a menudo son fragmentadas y requieren un esfuerzo significativo de los desarrolladores.

¿Por qué se creó?

El objetivo principal de MCP es estandarizar la integración de aplicaciones de IA, permitiendo una comunicación fluida entre clientes, servidores y herramientas externas. Esto elimina la necesidad de crear integraciones personalizadas para cada acción, agilizando el desarrollo y mejorando la eficiencia. MCP responde a la creciente demanda de agentes de IA que puedan operar en entornos dinámicos, interactuando con múltiples servicios (como correo electrónico, mensajería o bases de datos) sin configuraciones complejas. Además, fomenta la interoperabilidad, permitiendo que diferentes plataformas de IA adopten un estándar común, lo que podría impulsar la colaboración en la comunidad de desarrolladores.

Arquitectura del MCP

MCP opera con tres componentes clave:

Host MCP: Son los agentes de IA o aplicaciones de modelos de lenguaje (LLM) como Claude, ChatGPT o Cursor, que necesitan interactuar con datos o herramientas externas. Estos hosts actúan como el cerebro de la operación, procesando solicitudes y generando respuestas basadas en las interacciones con herramientas externas.

Cliente MCP: Plataformas intermediarias (como N8n o Zapier) que facilitan la comunicación bidireccional entre el Host MCP y el Servidor MCP, transmitiendo datos y comandos. Los clientes MCP gestionan el flujo de información, asegurando que las solicitudes y respuestas sean coherentes y estén formateadas correctamente.

Server MCP: Server que exponen las capacidades de aplicaciones específicas (como Slack, Gmail o GitHub) y explican cómo usarlas, actuando como un «traductor» para los agentes de IA. Estos servidores proporcionan una interfaz estandarizada que describe las funcionalidades disponibles, permitiendo que los agentes de IA descubran y utilicen herramientas de manera autónoma.

Esta arquitectura permite una comunicación bidireccional, donde los agentes de IA pueden leer correos, interactuar con plataformas como GitHub o Slack, y crear eventos en calendarios, todo de manera estandarizada. La bidireccionalidad asegura que los agentes puedan no solo enviar comandos, sino también recibir retroalimentación en tiempo real, mejorando su capacidad para manejar tareas complejas.

MCP vs. APIs tradicionales

Aunque las APIs han sido la solución tradicional para conectar herramientas, presentan desafíos significativos:

APIs tradicionales: Requieren integraciones específicas para cada herramienta, aprender diferentes documentaciones, manejar autenticaciones únicas, gestionar errores personalizados y mantener actualizaciones. Esto es como aprender un nuevo idioma para cada aplicación. Por ejemplo, integrar un agente de IA con Gmail requiere dominar la API de Google Cloud, mientras que Outlook exige conocimientos de Microsoft Azure, lo que aumenta la carga de trabajo del desarrollador.

MCP: Actúa como un «traductor universal», eliminando la necesidad de aprender cada API. Los agentes de IA se comunican con el servidor MCP, descubren automáticamente las capacidades de la herramienta, aprenden a usarla, gestionan errores de forma consistente y se adaptan a actualizaciones sin reescribir código. MCP utiliza un protocolo unificado que abstrae las complejidades de las APIs, permitiendo que los agentes de IA operen con mayor autonomía.

Por ejemplo, para enviar un correo con Gmail o Outlook usando APIs, un desarrollador debe dominar las documentaciones específicas y configurar autenticaciones. Con MCP, el agente de IA se conecta al servidor MCP correspondiente, descubre las funciones disponibles (como «enviar correo») y las ejecuta sin intervención manual, reduciendo significativamente el tiempo de desarrollo.

La evolución de los LLMs y el rol de MCP

Fase 1: LLM Básico

Los primeros modelos de lenguaje (LLMs) eran como un «genio atrapado en una lámpara». Podían generar textos y responder preguntas, pero estaban limitados a su conocimiento interno, sin acceso al mundo exterior (como noticias actuales o aplicaciones). Esta falta de conectividad los hacía ideales para tareas de procesamiento de texto, pero inútiles para interactuar con servicios en tiempo real.

Fase 2: LLMs con APIs

En la era actual, los LLMs se conectan a herramientas externas mediante APIs, permitiéndoles realizar tareas como leer correos, consultar calendarios o interactuar con redes sociales. Sin embargo, cada integración requiere configuraciones específicas, lo que crea un ecosistema frágil y complejo. Los desarrolladores deben construir flujos de trabajo detallados, manejar errores específicos de cada API y actualizar constantemente las integraciones, lo que limita la escalabilidad.

Fase 3: LLMs con MCP

MCP representa el futuro, donde los LLMs operan con un «traductor universal». Los agentes descubren y aprenden a usar herramientas automáticamente, ejecutando tareas complejas sin necesidad de prompts detallados o configuraciones manuales. Esto transforma a los LLMs en «ciudadanos digitales» autónomos, capaces de navegar por el ecosistema digital con fluidez. Por ejemplo, un agente puede decidir cómo enviar un mensaje a Slack o consultar una base de datos sin que el desarrollador especifique cada paso.

Ejemplo práctico: MCP en N8n

En un flujo de N8n con MCP, un agente de IA puede:

Conectarse a un servidor MCP de Slack con solo dos nodos: uno para descubrir las herramientas disponibles (como «enviar mensaje» o «listar canales») y otro para ejecutarlas.

Realizar tareas como buscar una receta de como hacer un «estigghiole» en Brave y enviarla a un canal de Slack, sin necesidad de prompts específicos. El agente identifica el canal correcto, maneja los parámetros necesarios y ejecuta la acción de forma autónoma.

Resolver tareas mediante comunicación bidireccional con el servidor MCP, identificando canales, manejando errores (como traducciones incorrectas) y ejecutando acciones sin intervención manual.

En contraste, con APIs tradicionales, el mismo flujo requeriría nodos específicos para cada acción (por ejemplo, extraer el ID de un canal de Slack), prompts detallados para guiar al agente y configuraciones manuales para conectar las herramientas. MCP simplifica este proceso al permitir que el agente descubra y ejecute las acciones por sí mismo.

Caso de uso ampliado

Más allá de N8n, MCP tiene aplicaciones en sectores como la atención al cliente, donde los agentes de IA pueden integrar múltiples plataformas (como CRM, correo electrónico y mensajería) para responder consultas en tiempo real. En la gestión de proyectos, MCP permite a los agentes coordinar tareas entre herramientas como Trello, Google Calendar y GitHub, automatizando flujos de trabajo complejos sin configuraciones personalizadas.

Beneficios de MCP

Simplicidad: Reduce la complejidad de las integraciones al estandarizar la comunicación, eliminando la necesidad de aprender múltiples APIs.

Autonomía: Los agentes de IA descubren y aprenden a usar herramientas sin intervención manual, aumentando su capacidad para manejar tareas complejas.

Escalabilidad: Agregar nuevas herramientas es tan fácil como conectar un dispositivo USB-C, lo que permite expandir rápidamente las capacidades de los agentes.

Eficiencia: Minimiza el tiempo de desarrollo al abstraer las complejidades de las APIs, permitiendo a los desarrolladores centrarse en la lógica de negocio.

Limitaciones actuales

Aunque MCP es prometedor, tiene limitaciones en su etapa actual (2025):

Disponibilidad: Solo está disponible en la versión comunitaria de N8n, no en la versión de pago, lo que restringe su uso en entornos empresariales.

Compatibilidad: Presenta problemas de compatibilidad con algunos servidores MCP, con errores frecuentes al conectar ciertas herramientas. Por ejemplo, la integración con plataformas menos comunes puede fallar debido a la falta de servidores MCP maduros.

Recursos: Exige mayor capacidad computacional, lo que puede ser un desafío para sistemas con recursos limitados.

Seguridad: Existen preocupaciones sobre la transmisión de credenciales a servidores MCP, especialmente en entornos donde la privacidad es crítica. Los desarrolladores deben implementar medidas adicionales para proteger los datos sensibles.

Estado de adopción

A abril de 2025, MCP está ganando tracción en comunidades de desarrolladores, particularmente entre aquellos que utilizan herramientas de automatización como N8n. Sin embargo, la adopción sigue siendo limitada debido a su estado inicial de desarrollo. Foros de desarrolladores y repositorios como GitHub muestran un creciente interés, pero también reportan problemas de estabilidad y compatibilidad. Empresas de automatización y startups de IA están comenzando a experimentar con MCP, pero su uso en producción sigue siendo raro.

¿Vale la pena MCP?

Sí, MCP es un avance significativo que transforma a los LLMs en asistentes autónomos capaces de interactuar con el mundo digital. Aunque no reemplaza completamente a las APIs, que siguen siendo útiles para proyectos que requieren control preciso, alta predictibilidad y rendimiento optimizado, MCP simplifica tareas complejas y repetitivas. Su capacidad para abstraer las complejidades de las APIs lo convierte en una herramienta poderosa para desarrolladores que buscan escalar sus aplicaciones de IA.

Dado que MCP está en sus primeras etapas, es recomendable familiarizarse con la tecnología ahora para estar preparado cuando madure. A medida que más plataformas adopten servidores MCP y se resuelvan las limitaciones actuales, es probable que se convierta en un estándar de facto para la integración de IA.

MCP es el «USB-C del mundo digital», un conector universal que simplifica la integración de agentes de IA con herramientas externas. Al eliminar las barreras de las APIs tradicionales, MCP permite a los desarrolladores centrarse en crear soluciones innovadoras, mientras los agentes de IA se convierten en exploradores autónomos del ecosistema digital. Con el respaldo de Anthropic y un creciente interés en la comunidad de desarrolladores, MCP está posicionado para liderar la próxima ola de automatización impulsada por IA. La revolución de los agentes autónomos ha comenzado, y MCP es la infraestructura que la hará posible.

Saludos

Claudio R. Parrinello

Post Views: 51

AI

Qué piensa NVIDIA de RFID, blockchain, IoT y otras tecnologías

Publicado

1 semana ago

25 de junio de 2026

por

Claudio R Parrinello

La postura general de NVIDIA: todo pasa por la IA

Antes de ir tecnología por tecnología, hay que entender el lente con el que NVIDIA mira el mundo. Jensen Huang tiene un único mensaje central: los datos centers ya no son instalaciones de IT sino «fábricas de IA», sistemas industriales diseñados para convertir electricidad en tokens. «Los tokens son la nueva commodity», dijo en el GTC 2026. Todo lo que no encaja en esa visión, NVIDIA lo ignora. Lo que sí encaja, lo abraza. Data Center Frontier

IoT — Aquí sí están metidos a fondo

IoT es el territorio donde NVIDIA tiene más presencia concreta. Su apuesta se llama Jetson, la familia de computadoras de borde para IA industrial.

La serie Jetson de NVIDIA es la plataforma dominante para inferencia de IA de alto rendimiento en el borde, con el Jetson AGX Orin entregando 275 TOPS, posicionado como el módulo de IA en el borde de mayor rendimiento disponible actualmente, orientado a robótica, vehículos autónomos y sistemas de visión industrial. E&ICT Academy

En el Computex 2026, NVIDIA anunció JetPack 7.2 y soporte de NemoClaw en Jetson, haciendo la plataforma «agentic-ready» para robótica, inspección y automatización industrial. NVIDIA Blog

Los casos de uso reales ya están desplegados: inspección de fábricas con visión artificial, cámaras inteligentes en retail, monitoreo en tiempo real de infraestructura de salud, agricultura inteligente y vehículos autónomos. Socios como ABB, KUKA, Caterpillar y Medtronic ya usan Jetson en sus productos.

La visión de NVIDIA para IoT es clara: no le interesa el IoT de sensores baratos que mandan datos a la nube. Le interesa el IoT con IA embebida en el borde, donde el dispositivo mismo procesa, razona y actúa. Eso requiere sus chips.

RFID — Silencio total

Este es el dato más revelador. NVIDIA no habla de RFID. En ningún anuncio, keynote, blog post ni comunicado oficial de 2025/2026 Jensen Huang o algún ejecutivo de NVIDIA menciona la tecnología de identificación por radiofrecuencia.

¿Por qué? Porque RFID es una tecnología de identificación pasiva, de bajísimo cómputo, que no necesita GPUs ni IA sofisticada para funcionar. Es el opuesto de lo que NVIDIA vende. Para NVIDIA, si un sistema de logística usa RFID para trackear pallets, la parte interesante no es el RFID — es el modelo de IA que analiza los patrones de movimiento, predice demanda o detecta anomalías. El RFID es infraestructura previa que simplemente alimenta datos a sus sistemas.

En la visión de NVIDIA, RFID es un sensor más en el ecosistema de datos que sus plataformas consumen. No es un competidor ni un aliado — es invisible.

Blockchain y crypto — Una relación peculiar

Acá la postura es interesante y un poco esquiva. En ningún momento durante el earnings call ni en el GTC 2026 Huang hizo referencia a blockchain, criptomonedas o activos digitales. Crypto Briefing

Sin embargo, hay dos conexiones indirectas que el mercado crypto aprovecha permanentemente:

1. Las GPUs de NVIDIA son la infraestructura de minería. La empresa nunca lo promueve activamente, pero sus chips son los que mueven una parte del ecosistema crypto. Huang una vez describió el bitcoin mining como «tomar energía excedente y almacenarla en una nueva forma llamada moneda» — una descripción técnica neutral, no un endoso. The Cool Down

2. La IA descentralizada lo entusiasma más. En el podcast All-In, Huang comparó a Bittensor — una red de entrenamiento de IA descentralizada en blockchain — con «una versión moderna de folding@home», el proyecto de computación distribuida para investigación científica. Dentro de las 48 horas del episodio, el sector de tokens de IA saltó un 40% en un solo día. Fue el comentario más cercano a un endoso que jamás dio sobre crypto. Phemex

Lo que sí quedó claro en el GTC 2026 es que cuando Huang habla de «tokens» no habla de blockchain: habla de unidades de output de modelos de IA. «Los tokens son ahora rentables» declaró en la conferencia de resultados — refiriéndose a que las empresas cobran más por la inferencia de IA de lo que les cuesta generarla. Crypto Briefing

La postura real de NVIDIA sobre blockchain: no le importa la tecnología en sí. Le importa si usa sus GPUs. El mining lo acepta sin entusiasmo. La IA descentralizada sobre blockchain le parece fascinante porque requiere exactamente lo que vende.

Quantum computing — Presente pero todavía lejos

En el GTC 2026, quantum computing apareció en el programa como vertical propio, con sesiones específicas sobre computación cuántica y su intersección con IA. NVIDIA está desarrollando NVQLink para conectar GPUs con QPUs (unidades de procesamiento cuántico) en sistemas híbridos. No es el centro de su negocio hoy, pero lo están monitoreando de cerca. NVIDIA Corporation

El patrón de fondo

NVIDIA tiene una regla no escrita muy consistente: si una tecnología necesita sus GPUs para escalar, la abraza. Si no, la ignora. IoT con IA en el borde: sí. Telco con AI-RAN: sí. Robots, autos autónomos, digital twins: sí. RFID, blockchain sin IA, sensores pasivos, bases de datos tradicionales: indiferencia total.

Jensen Huang lo resume en una frase que repite constantemente: «La IA está redefiniendo la computación e impulsando la mayor construcción de infraestructura de la historia de la humanidad.» Todo lo que no es parte de esa construcción, sencillamente no está en su radar.

Post Views: 27

AI

Por qué NVIDIA quiere meterse en las redes telco — y qué está haciendo

Publicado

1 semana ago

25 de junio de 2026

por

Claudio R Parrinello

La razón estratégica de fondo: el edge es la próxima gran oportunidad

NVIDIA ya ganó la batalla de los centros de datos. Ahora necesita el siguiente frente. Y ese frente es el borde de la red — el lugar donde los datos se crean, antes de llegar a cualquier servidor.

Jensen Huang lo dijo sin vueltas: «La IA está redefiniendo la computación e impulsando la mayor construcción de infraestructura de la historia de la humanidad — y las telecomunicaciones son las siguientes.» NVIDIA Corporation

La lógica es la siguiente: hoy la IA corre mayormente en centros de datos en la nube. Pero la próxima ola — robots, vehículos autónomos, drones, fábricas inteligentes, ciudades conectadas — necesita que la IA corra cerca de donde pasan las cosas, con latencia mínima. Y quien controla esa infraestructura de borde son las telcos, con sus miles de antenas distribuidas por todo el mundo.

«Las telecomunicaciones poseen el espacio más valioso para la IA: el borde, donde se crean los datos. Los operadores que modernicen su infraestructura serán las fábricas distribuidas de la red de IA», dijo Michael Dell de Dell Technologies, parte del ecosistema que NVIDIA está construyendo. Nokia

La plataforma de edge computing de NVIDIA generó 6.400 millones de dólares en ingresos en un trimestre, con un crecimiento del 29% interanual, impulsado por workstations Blackwell y contribuciones crecientes de robótica y automotive. El telco es la extensión natural de ese negocio. SiliconANGLE

Qué es AI-RAN y por qué es el corazón de la estrategia

RAN significa Radio Access Network — la red de acceso por radio, es decir, las antenas base que conectan los celulares. Tradicionalmente, esas antenas corren con hardware propietario especializado y cerrado.

NVIDIA quiere reemplazar ese hardware con sus GPUs, convirtiendo las antenas en plataformas de computación general que puedan hacer dos cosas al mismo tiempo: manejar el tráfico de radio y correr cargas de trabajo de IA. Eso es AI-RAN.

La propuesta de NVIDIA busca convertir la red celular en un ordenador distribuido de alto rendimiento — una de las piedras angulares de la visión de «IA física» de Jensen Huang. Laecuaciondigital

La ventaja es enorme para las telcos: en lugar de tener infraestructura de red ociosa en horarios de baja demanda, esa capacidad de cómputo podría venderse como servicio de IA a terceros. SoftBank demostró en el MWC 2026 cómo la capacidad de cómputo sobrante en sus antenas, identificada por su orquestador AITRAS, puede usarse para correr tareas de IA de terceros — una señal de cómo los operadores podrían monetizar su infraestructura RAN más allá de la conectividad. Artificial Intelligence News

La inversión de 1.000 millones en Nokia

En octubre de 2025, NVIDIA hizo su movimiento más concreto: invirtió 1.000 millones de dólares en Nokia a 6,01 dólares por acción, anunciando una alianza estratégica para incorporar productos AI-RAN de grado comercial con tecnología NVIDIA en la cartera de RAN de Nokia, el mayor proveedor de equipos de red del mundo. AppsUser

«El próximo salto en telecomunicaciones no se limita al paso del 5G al 6G, sino a un rediseño fundamental de la red para ofrecer conectividad impulsada por IA capaz de procesar inteligencia desde el centro de datos hasta el borde», declaró Justin Hotard, CEO de Nokia. «Nuestra alianza con NVIDIA pondrá un centro de datos de IA al alcance de todos.» Infobae

Con esa inversión, NVIDIA no solo compra acciones — compra acceso directo a la cadena de suministro global de infraestructura de red y se posiciona como tecnología habilitante dentro de los equipos que las telcos ya despliegan.

La coalición del MWC 2026: el club más selecto de las telco

En el Mobile World Congress de Barcelona en marzo de 2026, NVIDIA formalizó la alianza más ambiciosa del sector. Anunció el compromiso de Booz Allen, BT Group, Cisco, Deutsche Telekom, Ericsson, MITRE, Nokia, SK Telecom, SoftBank y T-Mobile para construir la próxima generación de redes inalámbricas sobre plataformas abiertas, nativas de IA, seguras y confiables. NVIDIA Newsroom

La AI-RAN Alliance, el organismo que nuclea este ecosistema, ya cuenta con más de 130 empresas participantes. En el MWC 2026 se presentaron el triple de demos de AI-RAN que el año anterior, con 26 de las 33 demos del evento construidas sobre la plataforma NVIDIA AI Aerial. Crnasia

Los resultados de campo ya no son promesas: T-Mobile demostró procesamiento simultáneo de IA y RAN en la plataforma de NVIDIA corriendo streaming de video, IA generativa y subtítulos automáticos junto con 5G en vivo. SoftBank logró un hito técnico histórico: el primer Massive MIMO de 16 capas totalmente definido por software en hardware NVIDIA. Crnasia

El modelo para 6G y las herramientas de red autónoma

Más allá del 5G, NVIDIA está construyendo la arquitectura base para el 6G. En el MWC 2026, la compañía lanzó el Nemotron Large Telco Model (LTM), un modelo open source de 30 mil millones de parámetros desarrollado junto con AdaptKey AI, entrenado en datasets abiertos de telecomunicaciones, diseñado para razonar sobre flujos de trabajo de gestión de red y avanzar hacia redes autónomas que no solo automatizan tareas predefinidas sino que entienden la intención del operador y toman decisiones propias. Crnasia

La plataforma que NVIDIA construyó para esto se llama NVIDIA ARC — un stack tecnológico de wireless nativo de IA para 6G centrado en tecnología estadounidense, que integra CPUs Grace, GPUs Blackwell y componentes de red avanzados. 36Kr

Por qué a las telcos les conviene

El negocio tradicional de las telcos está en presión: los ingresos por conectividad pura se estancan mientras los costos de red suben. La reconversión de sus antenas en plataforma de cómputo distribuido les abre un negocio completamente nuevo. Según el propio reporte de NVIDIA sobre el estado de la IA en telecomunicaciones, el 77% de los encuestados anticipa un cronograma de despliegue significativamente más rápido para la arquitectura de redes nativas de IA que para generaciones de red anteriores. Crnasia

La apuesta de NVIDIA en telco no es filantropía tecnológica: es el intento de convertirse en la capa de GPU de toda la infraestructura inalámbrica del planeta — exactamente lo que hizo con los centros de datos entre 2020 y 2025, pero ahora repartido en millones de antenas distribuidas por el mundo.

Post Views: 39

AI

Skills y agentes de IA: el nuevo estándar que cambió cómo trabaja la industria

Publicado

1 semana ago

25 de junio de 2026

por

Claudio R Parrinello

El formato Agent Skills, creado por Anthropic y liberado como estándar abierto en diciembre de 2025, se convirtió en cuestión de meses en la manera dominante de darle memoria procedimental a los agentes de inteligencia artificial. Más de 35 herramientas lo adoptaron, el ecosistema creció de cero a más de 500.000 skills disponibles en menos de seis meses, y gigantes como Google, Microsoft, OpenAI y Elastic ya lo integraron en sus plataformas. La pregunta que define el trabajo con IA en 2026 ya no es «¿puede el modelo hacer esto?», sino «¿sabe el modelo cómo hacerlo de la forma correcta para mi contexto?».

El problema que Agent Skills vino a resolver es uno que cualquier persona que trabaje con herramientas de IA reconoce de inmediato: cada vez que abrís una conversación, empezás de cero. Tenés que volver a explicar quién sos, qué hacés, cómo querés las cosas, cuál es el formato de salida esperado. La IA produce algo brillante. Y al día siguiente, amnesia total. Este ciclo de repetición constante no es solo frustrante: tiene un costo económico real. Cuando se paga por uso de API en dólares, cargar el mismo contexto una y otra vez significa tokens tirados a la basura antes de que el agente haga nada productivo. Un servidor MCP con muchas herramientas puede consumir más de 50.000 tokens solo en definiciones al inicio de cada sesión. Los skills resolvieron esto con una lógica elegante que la industria abrazó a una velocidad inusual.

La mecánica es simple al punto de parecer obvia en retrospectiva. Un skill es una carpeta con un archivo obligatorio llamado SKILL.md, que contiene metadatos mínimos (nombre y descripción) e instrucciones sobre cómo ejecutar una tarea específica. Opcionalmente puede incluir subcarpetas con scripts ejecutables, documentación de referencia, templates y otros recursos. Lo central del diseño es el concepto de «progressive disclosure»: los agentes no cargan el contenido completo de todos los skills al arrancar, sino que en la etapa de descubrimiento solo leen el nombre y la descripción de cada skill disponible, lo que consume apenas entre 30 y 50 tokens por skill inactivo. Cuando una tarea coincide con la descripción de un skill, recién entonces el agente carga el SKILL.md completo al contexto, con instrucciones de entre 500 y 5.000 tokens. Esto permite tener decenas de skills instalados sin que el costo de contexto explote. La comparación con el enfoque anterior es contundente: un desarrollador puede tener 40 skills disponibles con un impacto mínimo en el contexto cuando no son relevantes, algo que antes era estructuralmente imposible.

Anthropic publicó la especificación como estándar abierto el 18 de diciembre de 2025, replicando el mismo movimiento que había hecho con el Model Context Protocol (MCP), que también fue donado como estándar abierto a la Agentic AI Foundation bajo la Linux Foundation junto con OpenAI y Block. La reacción del ecosistema fue inmediata y masiva. En las primeras 24 horas del lanzamiento, un repositorio de skills en GitHub pasó de 85 a más de 250 entradas. Vercel Labs publicó skills oficiales de Next.js y React el mismo día. En las semanas siguientes, Google adoptó el formato en Gemini CLI y en su IDE Antigravity, construido sobre el equipo de Windsurf que adquirió por 2.400 millones de dólares. Microsoft lo integró nativamente en VS Code y GitHub Copilot. OpenAI, competidor directo de Anthropic, adoptó una arquitectura idéntica en ChatGPT y Codex CLI, replicando la estructura de archivos y metadatos de forma exacta. Hoy el formato es compatible con más de 35 herramientas, entre ellas Claude Code, Cursor, Gemini CLI, GitHub Copilot, Roo Code, Goose, Amp, Tabnine, Letta, OpenHands, Spring AI, Laravel Boost, Kiro, Factory, Qodo, Databricks Genie Code, Snowflake Cortex Code y varias más. La ruta más compatible entre agentes es .claude/skills/, que reconocen Cursor, OpenCode y GitHub Copilot además de su propio directorio nativo.

La dimensión empresarial del formato es donde el impacto se vuelve más tangible. En la mayoría de los equipos de desarrollo, el conocimiento sobre «cómo hacemos las cosas acá» vive en la memoria de las personas: convenciones no escritas, decisiones de arquitectura tomadas años atrás, criterios de code review que varían según quién los aplica. Cuando alguien se va, se lleva sus prompts. Cuando alguien nuevo entra, empieza de cero. Los skills permiten externalizar ese conocimiento en artefactos versionables y compartibles que el agente aplica automáticamente. Un desarrollador nuevo puede instalar el set de skills de la empresa y tener acceso inmediato a los estándares y convenciones vigentes sin que ningún colega tenga que explicárselos. Elastic, por ejemplo, lanzó un conjunto de skills bajo licencia Apache 2.0 que cubre cinco áreas del Elastic Stack, desde interacciones con la API de Elasticsearch hasta la gestión de dashboards en Kibana, y lo publicó bajo el argumento de que «el conocimiento de los agentes debe ser abierto». La comunidad de ciberseguridad, por su parte, ya cuenta con un repositorio de 754 skills en producción repartidas en 26 dominios, que incluyen desde Cloud Security y Threat Hunting hasta Web Application Security, todas siguiendo la especificación abierta de agentskills.io y compatibles con Claude Code, Codex CLI, Cursor y OpenCode.

El uso práctico demuestra hasta dónde puede llegar el formato cuando está bien implementado. Un skill correctamente escrito permite pedirle al agente que entre a Stripe, recopile datos de un trimestre completo y genere automáticamente los importes para las declaraciones impositivas con el detalle por casilla, o que limpie y deduplique un dataset de scraping en JSON y produzca un informe Excel listo para presentar, o que siga el proceso interno de code review del equipo sin que el desarrollador tenga que volver a explicarlo. Las únicas reglas que la comunidad identificó como críticas para que un skill funcione bien son dos: la descripción tiene que ser específica sobre qué hace y cuándo se activa (una descripción genérica como «ayuda con datos» confunde al agente), y no puede haber dos skills con descripciones superpuestas dentro del mismo proyecto. Un skill mal escrito no solo no ayuda: consume tokens sin aportar valor y puede producir resultados inconsistentes. La especificación recomienda que el SKILL.md completo no supere los 5.000 tokens para mantener el balance entre riqueza de instrucciones y eficiencia de contexto. Para instalar skills desde repositorios externos, el ecosistema cuenta con una CLI que se ejecuta con npx skills y detecta automáticamente qué agentes están instalados en el sistema para colocar los archivos en el lugar correcto sin intervención manual.

El equipo de Claude Code en Anthropic, que desarrolló el formato originalmente, tiene hoy cientos de skills en uso activo interno y lo describe como el punto de extensión más utilizado de la herramienta. La especificación vive en agentskills.io, con documentación pública que cubre el quickstart, la especificación completa del formato, buenas prácticas de escritura, evaluación de calidad de output, optimización de descripciones para activación confiable, uso de scripts dentro de skills, y una guía para desarrolladores que quieren integrar el formato en sus propios agentes. El código fuente y la comunidad se concentran en github.com/agentskills/agentskills, con un servidor de Discord activo para discusión y soporte. En menos de seis meses, lo que empezó como una feature de Claude Code se convirtió en el estándar de facto para darle expertise de dominio a los agentes de IA, independientemente de qué modelo o herramienta se use.

Fuentes:

Agent Skills (sitio oficial): https://agentskills.io/home

Neuronic — Guía definitiva Agent Skills 2026: https://neuronic.com.ar/blog/agent-skills-guia-definitiva

Web Reactiva — Agent Skills para Claude Code, Codex, Cursor y OpenCode: https://www.webreactiva.com/blog/skills-programadores-agentes-ia

Ecosistema Startup — Agent Skills el estándar abierto: https://ecosistemastartup.com/agent-skills-el-estandar-abierto-ia-para-startups-tech/

AI Mafia Substack — Skills: guía definitiva: https://aimafia.substack.com/p/skills-ia

Tacos de Datos — Agent Skills: más poder, menos tokens: https://www.tacosdedatos.com/p/agent-skills-mas-poder-menos-tokens

Elastic Labs — Agent Skills para Elastic: https://www.elastic.co/search-labs/es/blog/agent-skills-elastic

Web Reactiva — 754 skills de ciberseguridad: https://www.webreactiva.com/blog/skills-ciberseguridad

onext — Skills para agentes de IA, guía práctica: https://www.onext.es/es/insights/skills-ia-agentes-guia-practica-equipos-desarrollo/

OpenReplay — Capacidades reutilizables con skills.sh: https://blog.openreplay.com/es/capacidades-reutilizables-agentes-ia-skills-sh/

Post Views: 44