Sub-agentes y Paralelismo en Claude Code
Miles Morales y el multiverso de sub-agentes • D3 Claude Code • 20% del examen CCA-F
Into the Agent-Verse: Miles y sus sub-agentes
En Spider-Man: Into the Spider-Verse, Miles Morales descubre que no está solo. Hay docenas de Spider-People en dimensiones paralelas, cada uno especializado, cada uno con sus poderes únicos. Miles no puede hacer todo solo — la solución es invocar a cada Spider-Person para una misión específica, dejar que trabajen en paralelo en sus dominios, y coordinar los resultados.
Eso es exactamente lo que hacen los sub-agentes en Claude Code. Sin ellos, el agente trabaja secuencialmente — una tarea, luego la siguiente, luego la siguiente. Con sub-agentes, puede lanzar múltiples instancias independientes en paralelo, cada una con su propio contexto, y sintetizar los resultados cuando todas terminan.
El concepto central: cada sub-agente (Task) es una instancia Claude separada con contexto completamente aislado. Opera en su propia 'dimensión'. No sabe que los otros sub-agentes existen. Solo conoce su tarea y lo que el orquestador decidió pasarle. Miles coordina desde el centro — pero no interfiere en cómo cada Spider-Person hace su trabajo.
Sub-agente vs. tool call: la diferencia crítica
El examen CCA-F distingue explícitamente entre una llamada de herramienta (tool call) y un sub-agente. Son dos cosas completamente distintas:
Tool call = síncrona, ocurre dentro del mismo contexto de la conversación, ejecuta una función y devuelve el resultado inmediatamente. Sub-agente = instancia Claude independiente con su propio contexto, puede ejecutarse en paralelo con otros sub-agentes, y se usa para tareas que requieren razonamiento complejo autónomo — no solo ejecutar una función.
En Claude Code, el mecanismo para crear sub-agentes es la herramienta Task. Cuando Claude Code usa Task, literalmente lanza otra instancia de Claude con el prompt que vos definís. Esa instancia trabaja de forma autónoma hasta completar la tarea y devolver su respuesta al orquestador.
Pensalo como los portales inter-dimensionales de Miles: abre el portal (Task tool), define el universo de destino (descripción de la tarea), elige qué Spider-Person invocar (prompt específico), y espera que vuelvan con resultados.
💡 Podés guiar a Claude Code sobre cuándo y cómo usar Tasks desde el CLAUDE.md del proyecto, describiendo el workflow de paralelización esperado para ese codebase.
Ejemplo en CLAUDE.md — instruir cuándo usar sub-agentes
Aislamiento de contexto: cada dimensión tiene sus propias leyes
Cuando Miles abre un portal a la dimensión de Spider-Gwen, ella llega sin saber nada de la historia de Miles. Contexto fresco, sin contaminar. Eso es el aislamiento de contexto en sub-agentes.
Cada sub-agente recibe SOLO el contexto que el orquestador decide pasarle en el prompt. No hereda el historial de conversación del agente principal. No ve los resultados de otros sub-agentes (a menos que el orquestador se los pase explícitamente). Trabaja desde cero con la información que recibe.
Los beneficios del aislamiento son cuatro: sin contaminación cruzada entre sub-agentes (el análisis de seguridad no está 'influenciado' por el análisis de rendimiento), ventanas de contexto limpias para cada tarea, reproducibilidad (mismo prompt = resultados consistentes), y sin efectos secundarios entre sub-agentes.
Pero el aislamiento tiene un costo: el orquestador (Miles) tiene responsabilidades claras. Primero, preparar el contexto correcto para cada sub-agente — Peter necesita saber sobre la arquitectura, Gwen sobre el framework de testing, Peni sobre las dependencias. Segundo, recolectar y sintetizar los resultados cuando todos vuelven. Tercero, resolver conflictos si dos sub-agentes llegan a conclusiones diferentes.
Este patrón — preparar contexto, delegar, sintetizar — es el patrón canónico de orquestación multi-agente. Aparece constantemente en el examen. Si tenés que describir cómo funciona un orquestador, esta es la respuesta.
El test de independencia: ¿cuándo paralelizar?
La pregunta clave antes de usar sub-agentes: ¿las tareas son independientes? La regla del Spider-Verse: si Peter NECESITA lo que Gwen encontró para hacer su trabajo, no pueden ir en paralelo. Hay una dependencia — son secuenciales.
Regla de oro: si el output de Task A es input de Task B, son secuenciales. Si A y B pueden trabajar con la misma información inicial sin depender del resultado del otro, son candidatos para paralelización.
Los 3 patrones de ejecución
Patrón 1: Paralelo puro — todos al mismo tiempo
Miles llama a TODOS los Spider-People al mismo tiempo. Todos trabajan en paralelo. Miles espera a que todos terminen y después sintetiza. El tiempo total es el del sub-agente más lento — no la suma de todos.
Patrón paralelo en CLAUDE.md
Patrón 2: Secuencial — uno a la vez
Miles llama a Peter, espera que vuelva, y con esa información llama a Gwen. Necesario cuando cada tarea depende del resultado de la anterior. Más lento, pero correcto cuando hay dependencias.
Patrón 3: Fan-Out/Fan-In — el más común
Miles primero recopila información (Fan-Out en paralelo), sintetiza los resultados (Fan-In), y en base a esa síntesis lanza una segunda ronda de sub-agentes. El patrón más poderoso y más frecuente en el examen:
Fan-Out/Fan-In — ejemplo completo
🎯 TRAMPA DE EXAMEN: El examen pregunta frecuentemente sobre Fan-Out/Fan-In. Fan-Out = lanzar Tasks en paralelo. Fan-In = sintetizar resultados. No confundir con el patrón paralelo puro (una sola ronda sin síntesis intermedia).
Demo: Spider-Verse Coordinator
Este código simula el patrón de orquestación que Claude Code usa internamente cuando trabaja con sub-agentes. Construimos un 'Spider-Verse Coordinator' que demuestra paralelismo real, aislamiento de contexto, y síntesis de resultados:
spider_verse_coordinator.py — Orquestador y sub-agentes
Fan-Out: lanzar todos en paralelo
Fan-In: Miles sintetiza el multiverso
Observá el speedup en las métricas: si cada sub-agente tarda ~3 segundos, secuencial sería ~12 segundos. En paralelo son ~3-4 segundos (el más lento + overhead mínimo). Speedup de 3-4x. Para tareas grandes de análisis o generación en producción, la diferencia puede ser de minutos vs decenas de minutos.
Anti-patrones: cuando el Spider-Verse falla
En Spider-Man: No Way Home, cuando demasiados Spider-People actúan sin coordinación, el caos es total. Lo mismo con sub-agentes. No todo debe ser paralelo:
El principio del overhead vs. beneficio: usá sub-agentes cuando el beneficio del paralelismo supera el costo de la orquestación. Vale la pena cuando las tareas son largas (análisis complejo, generación extensa), hay 3 o más tareas independientes, el tiempo de respuesta es crítico, o las tareas son exploratorias. No vale cuando las tareas son rápidas, simples, o tienen dependencias entre sí.
🎯 TRAMPA DE EXAMEN: '¿Cuándo es preferible una tool call secuencial sobre un sub-agente Task?' Cuando la tarea es simple (no requiere razonamiento independiente extenso), cuando necesita el contexto completo de la conversación actual, o cuando hay dependencias estrictas de orden. Sub-agentes son para razonamiento complejo autónomo — no para operaciones simples.
Trampas de examen
🎯 TRAMPA DE EXAMEN: '¿Cuál es la diferencia entre un sub-agente y una tool call?' Tool call = síncrona, mismo contexto. Sub-agente = instancia Claude separada, contexto aislado, puede ejecutarse en paralelo. Si el examen pregunta qué usar para 'razonamiento complejo independiente', la respuesta es sub-agente.
🎯 TRAMPA DE EXAMEN: '¿Puede un sub-agente ver el historial de conversación del orquestador?' No. Solo ve lo que el orquestador le pasa explícitamente en el prompt del Task. El aislamiento es total.
🎯 TRAMPA DE EXAMEN: 'Tenés 5 tareas: A→B→C (dependencias), D y E (independientes). ¿Cómo las ejecutás?' A, B, C secuenciales. D y E en paralelo. Nunca paralelizar cuando hay dependencias de orden.
🎯 TRAMPA DE EXAMEN: '¿Qué es Fan-Out/Fan-In?' Fan-Out = lanzar múltiples Tasks en paralelo. Fan-In = recolectar y sintetizar los resultados. Es el patrón más común de orquestación y el más preguntado en el examen.
🎯 TRAMPA DE EXAMEN: 'Si lanzás 4 sub-agentes en paralelo y cada uno tarda 5 segundos, ¿cuánto tarda el proceso?' ~5 segundos más el overhead de orquestación (no 20 segundos). El tiempo es el del sub-agente más lento, no la suma.
Con gran poder viene gran responsabilidad de orquestación
Miles Morales aprende que la verdadera fuerza no viene de trabajar solo — viene de saber cuándo llamar al Spider-Verse, darles el contexto correcto, y sintetizar sus perspectivas en acción. Eso es la orquestación multi-agente: no hacer todo solo, sino coordinar inteligencias independientes hacia un objetivo común.
Los sub-agentes no reemplazan el razonamiento del orquestador — lo potencian. Miles sigue siendo quien decide qué misión asignar a cada Spider-Person, qué contexto pasarle, y cómo integrar los resultados en un plan coherente.
Resumen para el examen: Sub-agente = instancia Claude separada + contexto aislado + Task tool. 3 patrones: paralelo puro, secuencial, Fan-Out/Fan-In (el más común). Condición necesaria para paralelizar: independencia entre tareas. El orquestador prepara contexto, delega, y sintetiza. Overhead vs. beneficio: no todo debe ser paralelo.
En el próximo módulo arrancamos con Prompt Engineering (D4, 20% del examen): cómo escribir prompts que maximizan la calidad del razonamiento de Claude, las técnicas de chain-of-thought, few-shot learning, y cómo estructurar instrucciones para sistemas multi-agente.