The CORAL paper (Qu et al., 2026, arXiv:2604.01658) proposes something different: what if agents carried their own memory, organized their own work, and decided when to reflect? Not a pipeline with an LLM component, but autonomous agents conducting open-ended discovery.
El paper CORAL (Qu et al., 2026, arXiv:2604.01658) propone algo diferente: ¿qué pasa si los agentes cargan su propia memoria, organizan su propio trabajo y deciden cuándo reflexionar? No un pipeline con un componente LLM, sino agentes autónomos llevando a cabo descubrimiento abierto.
CORAL introduces three mechanisms that sound simple but aren’t. Shared persistent memory isn’t a vector store—it’s a file system with directories like attempts/, notes/, and skills/. Agents read previous attempts, write reflection notes, and contribute reusable skills. Memory is first-class infrastructure, not an afterthought. Asynchronous multi-agent organization means isolated workspaces with shared memory via symlinks. There’s no predefined role assignment—no “planner,” “critic,” or “coder.” Agents emerge into roles based on what they find. Heartbeat-based interventions are per-iteration reflection, periodic consolidation (notes→skills), and stagnation-triggered redirection. The system doesn’t just run—it checks itself.
CORAL introduce tres mecanismos que suenan simples pero no lo son. Memoria persistente compartida no es un vector store—es un sistema de archivos con directorios como attempts/, notes/, y skills/. Los agentes leen intentos previos, escriben notas de reflexión y contribuyen habilidades reutilizables. La memoria es infraestructura de primera clase, no un pensamiento posterior. Organización multi-agente asíncrona significa espacios de trabajo aislados con memoria compartida via symlinks. No hay asignación de roles predefinida—no “planificador,” “crítico,” o “codificador.” Los agentes emergen en roles basados en lo que encuentran. Intervenciones basadas en latidos son reflexión por iteración, consolidación periódica (notes→skills), y redirección activada por estancamiento. El sistema no solo corre—se verifica.
But the multi-agent results are the showstopper. In kernel engineering (Anthropic’s benchmark), 4 agents improved the best known score from 1363 → 1103 cycles—a 20% improvement. In polyominoes packing, 4 agents achieved 84.2 versus single-agent 80.2—a 5% gain. And co-evolution beats independent runs: 4-agent co-evolution outperforms the best-of-4 independent runs on every task.
Pero los resultados multi-agente son los protagonistas. En ingeniería de kernels (el benchmark de Anthropic), 4 agentes mejoraron la mejor puntuación conocida de 1363 → 1103 ciclos—una mejora del 20%. En empaque de poliominós, 4 agentes lograron 84.2 versus 80.2 de agente único—una ganancia del 5%. Y la co-evolución supera las ejecuciones independientes: la co-evolución de 4 agentes supera al mejor-de-4 ejecuciones independientes en cada tarea.
CORAL also works with open-source models. MiniMax M2.5 + OpenCode (no proprietary models needed) produces competitive results. This isn’t a closed-shop finding—this is reproducible infrastructure.
CORAL también funciona con modelos de código abierto. MiniMax M2.5 + OpenCode (sin necesidad de modelos patentados) produce resultados competitivos. Esto no es un hallazgo de club cerrado—es infraestructura reproducible.
We’re not there yet. But CORAL shows the direction: from fixed pipelines to autonomous multi-agent systems that carry memory, reflect, and build on each other. That’s the shift from “LLM as operator” to “agent as researcher.”
Aún no llegamos ahí. Pero CORAL muestra la dirección: de pipelines fijos a sistemas multi-agente autónomos que cargan memoria, reflexionan y se construyen unos sobre otros. Ese es el cambio de “LLM como operador” a “agente como investigador.”
The ceiling isn’t model scale. It’s the fixed pipeline. CORAL cracks it open.
El techo no es la escala del modelo. Es el pipeline fijo. CORAL lo abre.
References
Referencias
- Qu, A., Zheng, H., Zhou, Z., Yan, Y., Tang, Y., Ong, S. Y., Hong, F., Zhou, K., Jiang, C., Kong, M., Zhu, J., Jiang, X., Li, S., Wu, C., Low, B. K. H., Zhao, J., & Liang, P. (2026). *CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery*. arXiv:2604.01658v1. arxiv.org/abs/2604.01658
- Code: github.com/Human-Agent-Society/CORAL
- Related works: FunSearch (Google DeepMind), AlphaEvolve (Google), AI Scientist (Sakana AI), OpenEvolve, ShinkaEvolve, EvoX
- Qu, A., Zheng, H., Zhou, Z., Yan, Y., Tang, Y., Ong, S. Y., Hong, F., Zhou, K., Jiang, C., Kong, M., Zhu, J., Jiang, X., Li, S., Wu, C., Low, B. K. H., Zhao, J., & Liang, P. (2026). *CORAL: Hacia la Evolución Autónoma Multi-Agente para el Descubrimiento Abierto*. arXiv:2604.01658v1. arxiv.org/abs/2604.01658
- Código: github.com/Human-Agent-Society/CORAL
- Trabajos relacionados: FunSearch (Google DeepMind), AlphaEvolve (Google), AI Scientist (Sakana AI), OpenEvolve, ShinkaEvolve, EvoX