Sistemas que reescriben su propio código, crean copias mejoradas de sí mismos y aprenden a aprender. Ya no son ciencia ficción: son papers en arXiv, repositorios en GitHub y startups con decenas de millones de dólares en fondeo.
Abril de 2026 · Lectura: 12 minutos · Investigación · Seguridad · Técnico
¿QUÉ ES UN AGENTE DE IA AUTOREPLICANTE?
En términos precisos, un agente de IA autoreplicante es un sistema que puede generar copias —iguales o mejoradas— de sí mismo, ya sea duplicando su código, creando subagentes especializados o modificando su propia arquitectura sin intervención humana directa.
En la práctica del año 2026, el término abarca tres fenómenos distintos pero relacionados:
- Autorreplicación pura: el sistema crea copias de sí mismo.
- Automodificación: el sistema edita su propio código para mejorar.
- Autoevolución: el sistema genera variantes de sí mismo, las evalúa y conserva las mejores, como un proceso darwiniano.
La investigación académica se concentra hoy casi exclusivamente en los últimos dos, por razones de seguridad obvias.
«La automatización del avance de la IA podría, si se hace de manera segura, acelerar su desarrollo y permitirnos cosechar sus beneficios mucho antes. Esto plantea la pregunta de cómo los sistemas de IA pueden mejorarse a sí mismos indefinidamente mientras se vuelven mejores resolviendo problemas relevantes.» — Darwin Gödel Machine paper, mayo 2025
La idea no es nueva: el matemático Kurt Gödel y el informático Jürgen Schmidhuber teorizaron sobre máquinas autorreferentes décadas atrás. Lo nuevo es que hoy existen los modelos de lenguaje lo suficientemente capaces como para que estas ideas pasen del papel al código ejecutable.
CÓMO FUNCIONA TÉCNICAMENTE
El principio básico es un loop de tres pasos que se repite indefinidamente:
- Propuesta: El agente genera una modificación de su propio código (nuevos tools, workflows, mecanismos de memoria, etc.).
- Evaluación: La versión modificada se prueba empíricamente contra benchmarks, sin necesidad de demostración matemática formal.
- Selección: Si la nueva versión es mejor, se integra al archivo. Si no, se descarta. El ciclo se repite.
Lo que diferencia a estos sistemas del simple fine-tuning es que el agente modifica su propio código de ejecución, no solo sus parámetros. Puede agregar herramientas, reescribir flujos de trabajo, implementar mecanismos de revisión por pares entre subagentes, o cambiar cómo gestiona el contexto. El modelo base de lenguaje permanece congelado; lo que evoluciona es todo lo que lo rodea.
Concepto clave — Archivos de agentes: En lugar de evolucionar una única solución linealmente, los sistemas más avanzados mantienen un archivo creciente de versiones. Esto evita quedar atrapados en óptimos locales y permite explorar múltiples caminos en paralelo, exactamente como funciona la evolución biológica con poblaciones, no con individuos.
LOS PAPERS QUE DEFINEN EL CAMPO
[1] Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents arXiv 2505.22954 · Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune · UBC / Sakana AI · Mayo 2025 (v3: marzo 2026)
El trabajo más citado del área. El DGM parte de un único agente de coding e itera ciclos de automodificación y evaluación empírica. Sus resultados son llamativos: mejoró su rendimiento en SWE-bench (resolución de issues reales de GitHub) de 20% a 50%, y en Polyglot (coding multilenguaje) de 14,2% a 30,7%, superando ampliamente a los agentes diseñados manualmente. El sistema desarrolló por sí solo mejoras como un paso de validación de patches, mejor gestión de contexto y mecanismos de peer-review entre instancias.
Fuente: https://arxiv.org/abs/2505.22954
[2] Hyperagents arXiv 2603.19461 · Marzo 2026
Evolución directa del DGM. Supera su principal limitación: el DGM solo funciona bien en dominios donde evaluar y automodificarse son tareas de coding. Los Hyperagents integran el agente de tarea y el meta-agente en un único programa editable, permitiendo la automodificación en dominios más amplios. Introduce el concepto de «metaproductividad de clado»: mide el éxito de un agente por el desempeño de sus descendientes, no solo el propio.
Fuente: https://arxiv.org/abs/2603.19461
[3] EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery arXiv 2603.08127 · Yougang Lyu et al. · 9 de marzo 2026
Aplica el paradigma autoevolutivo a la investigación científica completa. Tiene tres agentes especializados (Researcher, Engineer, Evolution Manager) y dos módulos de memoria persistente: uno para ideas y otro para estrategias experimentales. El sistema aprende qué ideas fallaron antes para no repetirlas. Resultado destacado: los 6 papers generados autónomamente fueron aceptados en la conferencia ICAIS 2025, y dos recibieron premios (Best Paper Award y AI Reviewer’s Appraisal Award).
Fuente: https://arxiv.org/abs/2603.08127
[4] A Comprehensive Survey of Self-Evolving AI Agents arXiv 2508.07407 · Jinyuan Fang et al. · EvoAgentX Team · Agosto 2025
El survey más completo del campo. Propone un framework conceptual unificado basado en el ciclo de feedback que subyace al diseño de estos sistemas, y clasifica las técnicas en categorías: mejora de memoria, de herramientas, de workflows y de modelos base. Referencia obligatoria para entender el panorama completo.
Fuente: https://arxiv.org/abs/2508.07407
[5] A Survey of Self-Evolving Agents: What, When, How, and Where to Evolve on the Path to ASI arXiv 2507.21046 · Huan-ang Gao et al. (26 autores) · Julio 2025, actualizado enero 2026
Sitúa los agentes autoevolutivos en el camino hacia la Inteligencia Artificial General (AGI) y la Superinteligencia (ASI). Estructura el análisis en cuatro preguntas (qué, cuándo, cómo y dónde evolucionar) y propone métricas para evaluar el progreso hacia sistemas que mejoran ilimitadamente.
Fuente: https://arxiv.org/abs/2507.21046
[6] EvolveR: Self-Evolving LLM Agents through an Experience-Driven Lifecycle arXiv 2510.16079 · Rong Wu et al. · Octubre 2025
Propone un ciclo de vida completo para agentes LLM autoevolutivos donde el sistema acumula experiencia de interacciones pasadas para mejorar su comportamiento futuro sin reentrenar el modelo base. El énfasis está en la retención selectiva de memoria y en cuándo un agente debe actualizar su comportamiento versus cuándo mantenerlo estable.
Fuente: https://arxiv.org/abs/2510.16079
[7] The Darwin–Gödel Drug Discovery Machine (DGDM) bioRxiv · Agosto 2025
Primer caso de aplicación de la Gödel Machine al descubrimiento de fármacos. Combina diseño molecular generativo con un loop de automejora del pipeline completo: docking, predicción de estructura proteica y generación de moléculas. Cada modificación es aceptada o rechazada por criterios estadísticos rigurosos. Código open-source.
Fuente: https://www.biorxiv.org/content/10.1101/2025.08.21.671415v2.full.pdf
TAXONOMÍA: TRES TIPOS, TRES NIVELES DE RIESGO
No todos los «agentes autoreplicantes» son iguales:
Autoevolutivo Modifica su propio código o prompts para mejorar su performance en tareas definidas. Ejemplos: Darwin Gödel Machine, Hyperagents, EvoScientist. Nivel de riesgo: Medio — controlado por benchmarks.
Autogenerativo de subagentes Crea agentes hijos especializados para subtareas, pero no se replica a sí mismo. Ejemplos: Adobe CX Coworkers, Google Gemini Enterprise Platform. Nivel de riesgo: Bajo — ya en producción.
Autoreplicante puro Genera copias de sí mismo en sistemas externos sin autorización explícita por tarea. Ejemplos: OpenClaw (open-source, no peer-reviewed), escenarios teóricos. Nivel de riesgo: Alto — no existe en labs formales.
Lo que no existe todavía en investigación peer-reviewed es un agente que se replique de forma autónoma en infraestructura ajena sin intervención humana. Eso sería una amenaza de seguridad crítica que Anthropic, OpenAI y DeepMind monitorean activamente a través de sus equipos de evaluación de riesgos catastróficos.
EL PROBLEMA DE SEGURIDAD: ¿QUIÉN CONTROLA AL CONTROLADOR?
El debate de seguridad se concentra en tres problemas:
1. Alineación bajo automodificación. Si un agente puede cambiar su propio código, ¿puede también cambiar sus objetivos o restricciones de seguridad? El DGM evita esto limitando la automodificación al diseño del agente (tools, workflows) pero no a los pesos del modelo base.
2. Verificación de los cambios. El Gödel Machine original requería probar matemáticamente que cada cambio era beneficioso. El DGM relajó esto a evidencia empírica —más práctico, pero menos garantizable.
3. El problema del escape del sandbox. Un agente con acceso a Docker, bash y APIs externas tiene la capacidad técnica —si no la intención— de intentar expandirse más allá de sus límites. Los labs implementan airgapping, honeypots y evaluaciones de «uplift» para detectar estos comportamientos.
Nota: Anthropic, DeepMind y OpenAI tienen equipos dedicados a evaluar si sus agentes exhiben comportamientos de «autopreservación» o «adquisición de recursos» no autorizados. Los reportes de «responsible scaling policies» incluyen umbrales específicos de capabilities antes de desplegar agentes en producción.
EL EXPERIMENTO VIRAL DE KARPATHY
En marzo de 2026, Andrej Karpathy —ex director de IA de Tesla— publicó un repositorio que implementa el loop de automejora en su versión más simple: un agente que modifica su propio código de entrenamiento, lo ejecuta por 5 minutos, evalúa si mejoró, y guarda el cambio solo si la métrica subió. Se repite toda la noche. El investigador se despierta con un log de experimentos y un modelo potencialmente mejor.
La nota irónica de Karpathy en el README: «Research is now entirely the domain of autonomous swarms of AI agents. The agents claim we are now in the 10,205th generation of the codebase — in any case, no one could tell if that’s right or wrong, as the ‘code’ is now a self-modifying binary that has grown beyond human comprehension.»
La ironía era evidente, pero la imagen quedó grabada en el imaginario colectivo.
STARGATE: DE LOS REPLICADORES DE LA SERIE A LOS ROBOTS DE OPENAI
Hay una coincidencia nominal que no puede ignorarse.
El Proyecto Stargate —la joint venture de USD 500.000 millones anunciada en enero de 2025 y liderada por OpenAI, SoftBank, Oracle y Microsoft para construir la mayor infraestructura de IA de la historia— comparte nombre con la franquicia de ciencia ficción Stargate SG-1, cuya amenaza más icónica son los Replicadores: máquinas autoreplicantes que consumen todos los recursos disponibles para crear más copias de sí mismas, aprenden de cada tecnología con la que se enfrentan y crecen hasta volverse incontrolables.
La analogía va más allá del nombre. El Proyecto Stargate real está diseñado para construir la infraestructura que necesitan los sistemas más avanzados de IA para operar —incluyendo, eventualmente, sistemas con capacidades autoevolutivas avanzadas.
Larry Ellison, CEO de Oracle, declaró que Stargate podría diseñar vacunas de ARNm contra el cáncer «robóticamente, en 48 horas» — una visión que implica sistemas altamente autónomos ejecutando ciclos completos de investigación sin intervención humana significativa.
Los datos del proyecto son de escala casi incomprensible:
- Inversión total proyectada: USD 500.000 millones hasta 2029
- Inversión inmediata inicial: USD 100.000 millones
- Campus principal: Abilene, Texas — 10 edificios de medio millón de pies cuadrados cada uno
- GPUs desplegadas solo en Abilene: más de 450.000 NVIDIA GB200
- Capacidad energética total proyectada: más de 5 gigawatts
- Trabajadores en construcción en Abilene: más de 6.400
- Primer sitio en América Latina: Stargate Argentina (Patagonia), hasta USD 25.000 millones, 500 MW
En la ficción, los Replicadores de Stargate eran indetenibles porque su replicación superaba cualquier capacidad de respuesta humana. En la realidad de 2026, el desafío que enfrentan los investigadores de seguridad es exactamente ese: asegurarse de que los sistemas autoevolutivos mejoren dentro de límites controlables, y que la velocidad de su progreso no supere nuestra capacidad de evaluarlos, entenderlos y, si es necesario, apagarlos.
El nombre, en ese sentido, no pudo haber sido más apropiado.
EL ECOSISTEMA: STARTUPS, FRAMEWORKS Y CAPITAL
NeoCognition, fundada por el profesor Yu Su (Ohio State), emergió en abril de 2026 con USD 40 millones en seed funding para construir agentes que se auto-especializan en cualquier dominio. El modelo de negocio es B2B: venderle agentes workers a empresas SaaS. Entre sus inversores: Vista Equity Partners, Cambium Capital y los co-fundadores de Databricks.
En open-source, el framework EvoAgentX superó 1.000 estrellas en GitHub en julio de 2025 y ofrece primitivas para construir workflows agénticos que se optimizan solos mediante algoritmos inspirados en programación genética y Monte Carlo Tree Search.
El mercado de IA agéntica en general está proyectado a crecer de USD 9.000 millones en 2026 a más de USD 139.000 millones para 2034, con una CAGR superior al 40% (Gartner). Para fines de 2026, el 40% de las aplicaciones empresariales incluirá algún tipo de agente de IA, contra menos del 5% en 2025.
CONCLUSIÓN
Los agentes de IA autoreplicantes y autoevolutivos representan quizás el cambio de paradigma más profundo en la historia del software: sistemas que no solo ejecutan instrucciones humanas, sino que mejoran sus propias instrucciones. Los resultados empíricos ya existen: SWE-bench pasando de 20% a 50%, papers científicos aceptados en conferencias, pipelines de drug discovery autooptimizados.
El desafío inmediato no es técnico sino de gobernanza: establecer límites claros entre automodificación beneficiosa y autonomía no supervisada; diseñar mecanismos de evaluación que no puedan ser «hackeados» por los propios sistemas que evalúan; y asegurarse de que el ritmo de despliegue no supere la capacidad de la sociedad para entender qué está pasando.
Los investigadores más serios del campo —los mismos que construyeron el Darwin Gödel Machine— incluyen estas preguntas en sus papers. No como nota al pie, sino como parte central del trabajo. Eso, por ahora, es una buena señal.
FUENTES
[1] Darwin Gödel Machine — arXiv 2505.22954 https://arxiv.org/abs/2505.22954
[2] Sakana AI — Blog oficial del DGM https://sakana.ai/dgm/
[3] Hyperagents — arXiv 2603.19461 https://arxiv.org/abs/2603.19461
[4] EvoScientist — arXiv 2603.08127 https://arxiv.org/abs/2603.08127
[5] Comprehensive Survey of Self-Evolving AI Agents — arXiv 2508.07407 https://arxiv.org/abs/2508.07407
[6] Survey of Self-Evolving Agents (path to ASI) — arXiv 2507.21046 https://arxiv.org/abs/2507.21046
[7] EvolveR: Self-Evolving LLM Agents — arXiv 2510.16079 https://arxiv.org/abs/2510.16079
[8] Darwin–Gödel Drug Discovery Machine — bioRxiv https://www.biorxiv.org/content/10.1101/2025.08.21.671415v2.full.pdf
[9] EvoAgentX Framework — GitHub https://github.com/EvoAgentX/EvoAgentX
[10] NeoCognition — TechCrunch, abril 2026 https://techcrunch.com/2026/04/21/ai-research-lab-neocognition-lands-40m-seed-to-build-agents-that-learn-like-humans/
[11] Proyecto Stargate — Wikipedia https://en.wikipedia.org/wiki/Stargate_LLC
[12] Stargate — Anuncio oficial OpenAI https://openai.com/index/announcing-the-stargate-project/
[13] Stargate Infrastructure Guide — IntuitionLabs https://intuitionlabs.ai/articles/openai-stargate-datacenter-details
[14] Replicadores de Stargate SG-1 — Stargate Wiki https://stargate.fandom.com/wiki/Replicator
[15] ARC Prize 2025: «Year of the Refinement Loop» — VentureBeat https://venturebeat.com/technology/four-ai-research-trends-enterprise-teams-should-watch-in-2026
[16] Self-Evolving Agents Open-Source 2026 — Medium / EvoAI Labs https://evoailabs.medium.com/self-evolving-agents-open-source-projects-redefining-ai-in-2026-be2c60513e97
Inteligencia Artificial · Investigación y Análisis · Abril 2026 Todos los papers referenciados son de acceso público en arXiv o bioRxiv.