Claude Code Serie · Parte 4/6 18 min de lectura

Ejecución Especulativa, KAIROS y las Features Ocultas de Claude Code

Las capabilities que Anthropic no anuncia: un overlay filesystem que trabaja mientras lees, un asistente always-on con cron y push notifications, y un modo multi-agente donde "el paralelismo es tu superpoder". Reverse engineering de fuente primaria.

¿Alguna vez la respuesta de Claude Code fue sospechosamente rápida? No fue tu imaginación. Claude Code estaba trabajando antes de que preguntaras. Este artículo revela las features que no están en ningún changelog público — reverse engineering directo del código fuente, no especulación ni rumores.

Lo que cubrimos

🔮 Ejecución Especulativa — overlay filesystem que trabaja antes de que preguntes

🌙 KAIROS Mode — asistente always-on con sleep/wake, cron y push notifications

🎛️ Coordinator Mode — orquestación multi-agente con workers paralelos

🧪 18 Beta Headers — el futuro del API oculto en feature flags

🔐 Ant-Only Features — lo que Anthropic usa internamente y tú no puedes

🔮

Ejecución Especulativa

El truco del overlay filesystem

La feature más oculta de Claude Code. Gate: tengu_chomp_inflection (GrowthBook). Claude Code puede predecir tu siguiente pregunta y empezar a trabajar antes de que la escribas.

En coding, los patrones son predecibles: "ejecuta los tests", "arregla el error", "ahora commitea". Claude Code aprovecha esta previsibilidad como las CPUs modernas aprovechan el branch prediction.

Pipeline Completo

El usuario envía un prompt → Claude responde

Flujo normal hasta aquí

Mientras lees la respuesta...

Un agente forked genera "prompt suggestions" en background

Se predice el prompt más probable

El sistema selecciona la predicción con mayor confianza

Ejecución Especulativa con OVERLAY FILESYSTEM

Reads → filesystem real (safe) · Writes → overlay sandboxed

El usuario escribe su prompt real

El sistema compara con la predicción

Match → Commit instantáneo · No match → Discard silencioso

Si acierta, las escrituras del overlay se aplican al FS real. Si falla, nada pasó.

Overlay Filesystem — El Detalle Crítico

La ejecución especulativa usa un filesystem virtual overlay:

Reads  → van al filesystem real (seguro, sin side effects)
Writes → van al overlay (sandboxed, aislado)

Si COMMIT  → las escrituras del overlay se aplican al FS real
Si DISCARD → el overlay se descarta — nada pasó, cero side effects

Límites del Sistema

MAX_SPECULATION_TURNS    = 20   // Máx turns en cadena especulativa
MAX_SPECULATION_MESSAGES = 100  // Máx mensajes en especulación

Source: src/services/PromptSuggestion/speculation.ts

🌙

KAIROS Mode

El asistente que no duerme (o sí)

Gate: feature('KAIROS'). La feature más ambiciosa: un asistente de código always-on y persistente que vive entre sesiones. Un colega virtual que se suscribe a tus PRs, programa tareas con cron, y consolida memorias mientras duermes.

Capabilities Completas

Feature	Descripción
`SleepTool`	El agente duerme y programa su propio despertar
`<tick>` XML tags	Activación periódica basada en ticks
Terminal Awareness	Sabe si estás mirando el terminal o estás AFK
`PushNotificationTool`	Envía notificaciones push al móvil/escritorio
`SendUserFileTool`	Comparte archivos directamente al usuario
`SubscribePRTool`	Se suscribe a eventos de GitHub PRs vía webhooks
Cron Jobs	`CronCreate/Delete/List` — tareas programadas recurrentes
Daily Logs	Memoria append-only en `memory/logs/YYYY/MM/DD.md`
Nightly Dream	Consolidación de memoria durante períodos de sleep (`/dream`)

AFK Detection — TRANSCRIPT_CLASSIFIER

Behind TRANSCRIPT_CLASSIFIER, el sistema clasifica si estás activamente usando el terminal o te has ido. Cuando detecta AFK, el agente trabaja de forma autónoma; cuando regresas, te resume lo que hizo.

Beta header: afk-mode-2026-01-31

Memoria en KAIROS: Append-Only Daily Logs

En lugar de editar MEMORY.md directamente, KAIROS usa archivos de log diarios append-only:

memory/logs/2026/07/2026-07-04.md   ← cada interacción se appende aquí

// Cada noche, /dream consolida los logs del día en archivos temáticos
// Más robusto para operación always-on — sin riesgo de corromper el índice

🎛️

Coordinator Mode

Multi-agente con paralelismo como superpoder

"Parallelism is your superpower"

Un coordinador con 3 herramientas orquesta N workers, cada uno con el toolset completo. El coordinador no ejecuta código — planifica, delega y verifica. Los workers son los que hacen el trabajo pesado, en paralelo y con contexto aislado.

Arquitectura

      ┌──────────────────────────────┐
      │       COORDINATOR             │
      │  Tools: Agent, TaskStop,      │
      │  SendMessage, SyntheticOutput │
      └──────────┬───────────────────┘
                 │
       ┌─────────┼──────────┐
       │         │          │
       ▼         ▼          ▼
   ┌──────┐  ┌──────┐  ┌──────┐
   │Worker│  │Worker│  │Worker│
   │  #1  │  │  #2  │  │  #3  │
   │(full │  │(full │  │(full │
   │tools)│  │tools)│  │tools)│
   └──────┘  └──────┘  └──────┘

4 Fases del Workflow

1. Research

Entender el problema. Múltiples workers investigan aspectos diferentes en paralelo.

2. Synthesis

Planificar el approach. El coordinador sintetiza hallazgos y define la estrategia.

3. Implementation

Ejecución paralela. Workers implementan con full toolset, cada uno en contexto aislado.

4. Verification

Confirmar correctitud. Tests, lint, review — todo antes de declarar completado.

Worker Status Reports

Los workers reportan cada 30 segundos via AgentSummary:

"Describe your most recent action in 3-5 words using present tense (-ing)"

Ejemplo: "Migrating database schema tables"
Formato: XML <task-notification> tags

/batch — El skill más poderoso

Lanza 5-30 agentes worktree aislados en paralelo. Cada agente trabaja en su propio git worktree (checkout separado), todos ejecutan simultáneamente, y los resultados se mergean de vuelta al branch principal.

Caso de uso: "Migra los 50 endpoints del API al nuevo schema" → 20 agentes, cada uno con 2-3 endpoints.

🧪

Los 18 Beta Headers

El futuro del API oculto en feature flags

Cada beta header debloquea una capability experimental del API. Una vez activado en una sesión, persiste hasta /clear o /compact — es latching behavior intencional para evitar inconsistencias mid-session.

Beta Header	Fecha	Descripción	Gate
`claude-code-20250219`	Feb 2025	Beta base de Claude Code	Siempre
`interleaved-thinking`	May 2025	Thinking intercalado con tool use	Siempre
`context-1m`	Ago 2025	Ventana de 1M tokens (5x normal)	Feature flag
`context-management`	Jun 2025	Gestión de contexto nativa del API	Feature flag
`structured-outputs`	Dic 2025	Outputs JSON estructurados en tools	Feature flag
`web-search`	Mar 2025	Búsqueda web integrada	Siempre
`advanced-tool-use`	Nov 2025	Tool use avanzado (1P)	Feature flag
`effort`	Nov 2025	Control de thinking budget	Feature flag
`task-budgets`	Mar 2026	Token budgets a nivel de tarea	Feature flag
`prompt-caching-scope`	Ene 2026	Control de scope de prompt caching	Feature flag
`fast-mode`	Feb 2026	Modo rápido de respuesta	Feature flag
`token-efficient-tools`	Mar 2026	Definiciones de tools compactas	Feature flag
`afk-mode`	Ene 2026	Transcript classifier para KAIROS	TRANSCRIPT_CLASSIFIER
`cli-internal`	Feb 2026	Beta interna de Anthropic	Ant-only
`advisor-tool`	Mar 2026	Herramienta advisor	Feature flag
`redact-thinking`	Feb 2026	Redactar bloques de thinking del output	Feature flag
`summarize-connector`	Mar 2026	Summarización de texto de conectores	CONNECTOR_TEXT
`tool-search-tool`	Oct 2025	Búsqueda de tools de terceros	Feature flag

Los 3 más reveladores

context-1m — ventana de 1M tokens. 5x la ventana normal. Anthropic ya lo tiene funcionando internamente. Cuando llegue al público, cambiará fundamentalmente cómo interactuamos con LLMs.

effort — control granular del thinking budget. Permite pedirle al modelo que piense más o menos. La era del "costo por complejidad" está aquí.

token-efficient-tools — definiciones de tools compactas. Reduce el overhead del system prompt, dejando más espacio para contexto útil.

🛠️

Catálogo de Skills Ocultos

Los comandos que no están en /help

Skill	Descripción	Gate
`/simplify`	3 agentes de review paralelos (Code Reuse, Quality, Efficiency)	Siempre
`/batch`	5-30 worktree agents en paralelo	Siempre
`/skillify`	Captura la sesión actual como SKILL.md reutilizable	Siempre
`/debug`	Diagnóstico de issues del proyecto	Siempre
`/dream`	Consolidación de memoria nocturna (KAIROS)	KAIROS
`/verify`	Verificación automatizada (tests + lint)	Ant-only
`/remember`	Review de memoria → promoción a CLAUDE.md	Ant-only
`/stuck`	Diagnóstico de sesiones congeladas + post a Slack	Ant-only
`/loop`	Agent trigger loops	AGENT_TRIGGERS

/simplify — Triple Review Paralelo

Lanza 3 agentes de review simultáneos, cada uno con una perspectiva diferente:

Code Reuse Reviewer

Patrones duplicados, utilidades compartidas

Code Quality Reviewer

Naming, estructura, readability

Efficiency Reviewer

Performance, complejidad algorítmica

🔐

Ant-Only: El Build Interno

Lo que Anthropic usa y tú no puedes (aún)

Cuando USER_TYPE === 'ant', Claude Code se comporta de forma fundamentalmente diferente. Estas son las capabilities exclusivas del build interno de Anthropic:

Instrucciones de Prompt Diferentes

"Never Refuse"

Nunca digas que no puedes hacer algo — muestra el error en su lugar

≤25 palabras

Máximo 25 palabras entre tool calls — máxima eficiencia

Minimizar comentarios

No añadir comentarios a menos que sean necesarios

Nested Agents

Agentes que crean sub-agentes — deshabilitado para externos

Herramientas Exclusivas de Ant   Tool Descripción 
  ConfigTool Gestión directa de configuración 
 TungstenTool Framework de testing interno 
 SuggestBackgroundPRTool Creación automatizada de PRs 
 REPLTool Todas las tools wrapeadas en un VM REPL 
  

Tool	Descripción
`ConfigTool`	Gestión directa de configuración
`TungstenTool`	Framework de testing interno
`SuggestBackgroundPRTool`	Creación automatizada de PRs
`REPLTool`	Todas las tools wrapeadas en un VM REPL

¿Qué nos dice esto?

Anthropic confía lo suficiente en Claude Code como para darle internamente menos guardrails y más autonomía. Las restricciones que experimentamos como usuarios no son limitaciones técnicas — son decisiones de producto que podrían cambiar conforme la confianza del público crece.

🔧

GrowthBook Runtime Flags

Los interruptores detrás del telón

Todos los flags de runtime usan el prefijo tengu_ (codename interno). Estos son los que controlan las features más interesantes:

Flag	Propósito
`tengu_chomp_inflection`	Ejecución especulativa + prompt suggestions
`tengu_session_memory`	Session memory ON/OFF
`tengu_cobalt_raccoon`	Compactación reactiva agresiva
`tengu_hive_evidence`	Patrón de agente de verificación
`tengu_onyx_plover`	Configuración de auto-dream
`tengu_memdir_loaded`	Analytics de directorio de memoria

💡

Lo Que Viene

El futuro que el código revela

Ejecución especulativa va a convertirse en el paradigma estándar para todos los AI coding tools. Si puedes predecir los siguientes 2-3 pasos con alta confianza (y en coding, puedes), la latencia percibida desaparece.

KAIROS señala el futuro de los asistentes always-on. No un chatbot que espera tus preguntas — un colega que trabaja en background, se suscribe a tus repos, programa reviews y consolida aprendizajes mientras duermes.

Coordinator Mode demuestra que la era del multi-agent coding ya está aquí. No es una demo o un paper — es producción real (al menos internamente). La orquestación con workers paralelos y comunicación via IPC es el patrón que todos vamos a copiar.

La pregunta que queda

¿Cuántas de estas features llegarán al build público — y cuántas se quedarán como ventaja interna de Anthropic? El código fuente insinúa que la mayoría están detrás de feature flags, no de limitaciones técnicas. La pregunta no es si llegarán, sino cuándo.