Volver al Blog
Claude Code Serie · Parte 4/6 18 min de lectura

Ejecución Especulativa, KAIROS y las Features Ocultas de Claude Code

Las capabilities que Anthropic no anuncia: un overlay filesystem que trabaja mientras lees, un asistente always-on con cron y push notifications, y un modo multi-agente donde "el paralelismo es tu superpoder". Reverse engineering de fuente primaria.

¿Alguna vez la respuesta de Claude Code fue sospechosamente rápida? No fue tu imaginación. Claude Code estaba trabajando antes de que preguntaras. Este artículo revela las features que no están en ningún changelog público — reverse engineering directo del código fuente, no especulación ni rumores.

Lo que cubrimos

🔮 Ejecución Especulativa — overlay filesystem que trabaja antes de que preguntes

🌙 KAIROS Mode — asistente always-on con sleep/wake, cron y push notifications

🎛️ Coordinator Mode — orquestación multi-agente con workers paralelos

🧪 18 Beta Headers — el futuro del API oculto en feature flags

🔐 Ant-Only Features — lo que Anthropic usa internamente y tú no puedes

🔮

Ejecución Especulativa

El truco del overlay filesystem

La feature más oculta de Claude Code. Gate: tengu_chomp_inflection (GrowthBook). Claude Code puede predecir tu siguiente pregunta y empezar a trabajar antes de que la escribas.

En coding, los patrones son predecibles: "ejecuta los tests", "arregla el error", "ahora commitea". Claude Code aprovecha esta previsibilidad como las CPUs modernas aprovechan el branch prediction.

Pipeline Completo

1

El usuario envía un prompt → Claude responde

Flujo normal hasta aquí

2

Mientras lees la respuesta...

Un agente forked genera "prompt suggestions" en background

3

Se predice el prompt más probable

El sistema selecciona la predicción con mayor confianza

4

Ejecución Especulativa con OVERLAY FILESYSTEM

Reads → filesystem real (safe) · Writes → overlay sandboxed

5

El usuario escribe su prompt real

El sistema compara con la predicción

6

Match → Commit instantáneo · No match → Discard silencioso

Si acierta, las escrituras del overlay se aplican al FS real. Si falla, nada pasó.

Overlay Filesystem — El Detalle Crítico

La ejecución especulativa usa un filesystem virtual overlay:

Reads  → van al filesystem real (seguro, sin side effects)
Writes → van al overlay (sandboxed, aislado)

Si COMMIT  → las escrituras del overlay se aplican al FS real
Si DISCARD → el overlay se descarta — nada pasó, cero side effects

Límites del Sistema

MAX_SPECULATION_TURNS    = 20   // Máx turns en cadena especulativa
MAX_SPECULATION_MESSAGES = 100  // Máx mensajes en especulación

Source: src/services/PromptSuggestion/speculation.ts

🌙

KAIROS Mode

El asistente que no duerme (o sí)

Gate: feature('KAIROS'). La feature más ambiciosa: un asistente de código always-on y persistente que vive entre sesiones. Un colega virtual que se suscribe a tus PRs, programa tareas con cron, y consolida memorias mientras duermes.

Capabilities Completas

Feature Descripción
SleepTool El agente duerme y programa su propio despertar
<tick> XML tags Activación periódica basada en ticks
Terminal Awareness Sabe si estás mirando el terminal o estás AFK
PushNotificationTool Envía notificaciones push al móvil/escritorio
SendUserFileTool Comparte archivos directamente al usuario
SubscribePRTool Se suscribe a eventos de GitHub PRs vía webhooks
Cron Jobs CronCreate/Delete/List — tareas programadas recurrentes
Daily Logs Memoria append-only en memory/logs/YYYY/MM/DD.md
Nightly Dream Consolidación de memoria durante períodos de sleep (/dream)

AFK Detection — TRANSCRIPT_CLASSIFIER

Behind TRANSCRIPT_CLASSIFIER, el sistema clasifica si estás activamente usando el terminal o te has ido. Cuando detecta AFK, el agente trabaja de forma autónoma; cuando regresas, te resume lo que hizo.

Beta header: afk-mode-2026-01-31

Memoria en KAIROS: Append-Only Daily Logs

En lugar de editar MEMORY.md directamente, KAIROS usa archivos de log diarios append-only:

memory/logs/2026/07/2026-07-04.md   ← cada interacción se appende aquí

// Cada noche, /dream consolida los logs del día en archivos temáticos
// Más robusto para operación always-on — sin riesgo de corromper el índice
🎛️

Coordinator Mode

Multi-agente con paralelismo como superpoder

"Parallelism is your superpower"

Un coordinador con 3 herramientas orquesta N workers, cada uno con el toolset completo. El coordinador no ejecuta código — planifica, delega y verifica. Los workers son los que hacen el trabajo pesado, en paralelo y con contexto aislado.

Arquitectura

      ┌──────────────────────────────┐
      │       COORDINATOR             │
      │  Tools: Agent, TaskStop,      │
      │  SendMessage, SyntheticOutput │
      └──────────┬───────────────────┘
                 │
       ┌─────────┼──────────┐
       │         │          │
       ▼         ▼          ▼
   ┌──────┐  ┌──────┐  ┌──────┐
   │Worker│  │Worker│  │Worker│
   │  #1  │  │  #2  │  │  #3  │
   │(full │  │(full │  │(full │
   │tools)│  │tools)│  │tools)│
   └──────┘  └──────┘  └──────┘

4 Fases del Workflow

1. Research

Entender el problema. Múltiples workers investigan aspectos diferentes en paralelo.

2. Synthesis

Planificar el approach. El coordinador sintetiza hallazgos y define la estrategia.

3. Implementation

Ejecución paralela. Workers implementan con full toolset, cada uno en contexto aislado.

4. Verification

Confirmar correctitud. Tests, lint, review — todo antes de declarar completado.

Worker Status Reports

Los workers reportan cada 30 segundos via AgentSummary:

"Describe your most recent action in 3-5 words using present tense (-ing)"

Ejemplo: "Migrating database schema tables"
Formato: XML <task-notification> tags

/batch — El skill más poderoso

Lanza 5-30 agentes worktree aislados en paralelo. Cada agente trabaja en su propio git worktree (checkout separado), todos ejecutan simultáneamente, y los resultados se mergean de vuelta al branch principal.

Caso de uso: "Migra los 50 endpoints del API al nuevo schema" → 20 agentes, cada uno con 2-3 endpoints.

🧪

Los 18 Beta Headers

El futuro del API oculto en feature flags

Cada beta header debloquea una capability experimental del API. Una vez activado en una sesión, persiste hasta /clear o /compact — es latching behavior intencional para evitar inconsistencias mid-session.

Beta Header Fecha Descripción Gate
claude-code-20250219 Feb 2025 Beta base de Claude Code Siempre
interleaved-thinking May 2025 Thinking intercalado con tool use Siempre
context-1m Ago 2025 Ventana de 1M tokens (5x normal) Feature flag
context-management Jun 2025 Gestión de contexto nativa del API Feature flag
structured-outputs Dic 2025 Outputs JSON estructurados en tools Feature flag
web-search Mar 2025 Búsqueda web integrada Siempre
advanced-tool-use Nov 2025 Tool use avanzado (1P) Feature flag
effort Nov 2025 Control de thinking budget Feature flag
task-budgets Mar 2026 Token budgets a nivel de tarea Feature flag
prompt-caching-scope Ene 2026 Control de scope de prompt caching Feature flag
fast-mode Feb 2026 Modo rápido de respuesta Feature flag
token-efficient-tools Mar 2026 Definiciones de tools compactas Feature flag
afk-mode Ene 2026 Transcript classifier para KAIROS TRANSCRIPT_CLASSIFIER
cli-internal Feb 2026 Beta interna de Anthropic Ant-only
advisor-tool Mar 2026 Herramienta advisor Feature flag
redact-thinking Feb 2026 Redactar bloques de thinking del output Feature flag
summarize-connector Mar 2026 Summarización de texto de conectores CONNECTOR_TEXT
tool-search-tool Oct 2025 Búsqueda de tools de terceros Feature flag

Los 3 más reveladores

context-1m — ventana de 1M tokens. 5x la ventana normal. Anthropic ya lo tiene funcionando internamente. Cuando llegue al público, cambiará fundamentalmente cómo interactuamos con LLMs.

effort — control granular del thinking budget. Permite pedirle al modelo que piense más o menos. La era del "costo por complejidad" está aquí.

token-efficient-tools — definiciones de tools compactas. Reduce el overhead del system prompt, dejando más espacio para contexto útil.

🛠️

Catálogo de Skills Ocultos

Los comandos que no están en /help

Skill Descripción Gate
/simplify 3 agentes de review paralelos (Code Reuse, Quality, Efficiency) Siempre
/batch 5-30 worktree agents en paralelo Siempre
/skillify Captura la sesión actual como SKILL.md reutilizable Siempre
/debug Diagnóstico de issues del proyecto Siempre
/dream Consolidación de memoria nocturna (KAIROS) KAIROS
/verify Verificación automatizada (tests + lint) Ant-only
/remember Review de memoria → promoción a CLAUDE.md Ant-only
/stuck Diagnóstico de sesiones congeladas + post a Slack Ant-only
/loop Agent trigger loops AGENT_TRIGGERS

/simplify — Triple Review Paralelo

Lanza 3 agentes de review simultáneos, cada uno con una perspectiva diferente:

Code Reuse Reviewer

Patrones duplicados, utilidades compartidas

Code Quality Reviewer

Naming, estructura, readability

Efficiency Reviewer

Performance, complejidad algorítmica

🔐

Ant-Only: El Build Interno

Lo que Anthropic usa y tú no puedes (aún)

Cuando USER_TYPE === 'ant', Claude Code se comporta de forma fundamentalmente diferente. Estas son las capabilities exclusivas del build interno de Anthropic:

Instrucciones de Prompt Diferentes

"Never Refuse"

Nunca digas que no puedes hacer algo — muestra el error en su lugar

≤25 palabras

Máximo 25 palabras entre tool calls — máxima eficiencia

Minimizar comentarios

No añadir comentarios a menos que sean necesarios

Nested Agents

Agentes que crean sub-agentes — deshabilitado para externos

Herramientas Exclusivas de Ant

Tool Descripción
ConfigTool Gestión directa de configuración
TungstenTool Framework de testing interno
SuggestBackgroundPRTool Creación automatizada de PRs
REPLTool Todas las tools wrapeadas en un VM REPL

¿Qué nos dice esto?

Anthropic confía lo suficiente en Claude Code como para darle internamente menos guardrails y más autonomía. Las restricciones que experimentamos como usuarios no son limitaciones técnicas — son decisiones de producto que podrían cambiar conforme la confianza del público crece.

🔧

GrowthBook Runtime Flags

Los interruptores detrás del telón

Todos los flags de runtime usan el prefijo tengu_ (codename interno). Estos son los que controlan las features más interesantes:

Flag Propósito
tengu_chomp_inflection Ejecución especulativa + prompt suggestions
tengu_session_memory Session memory ON/OFF
tengu_cobalt_raccoon Compactación reactiva agresiva
tengu_hive_evidence Patrón de agente de verificación
tengu_onyx_plover Configuración de auto-dream
tengu_memdir_loaded Analytics de directorio de memoria
💡

Lo Que Viene

El futuro que el código revela

Ejecución especulativa va a convertirse en el paradigma estándar para todos los AI coding tools. Si puedes predecir los siguientes 2-3 pasos con alta confianza (y en coding, puedes), la latencia percibida desaparece.

KAIROS señala el futuro de los asistentes always-on. No un chatbot que espera tus preguntas — un colega que trabaja en background, se suscribe a tus repos, programa reviews y consolida aprendizajes mientras duermes.

Coordinator Mode demuestra que la era del multi-agent coding ya está aquí. No es una demo o un paper — es producción real (al menos internamente). La orquestación con workers paralelos y comunicación via IPC es el patrón que todos vamos a copiar.

La pregunta que queda

¿Cuántas de estas features llegarán al build público — y cuántas se quedarán como ventaja interna de Anthropic? El código fuente insinúa que la mayoría están detrás de feature flags, no de limitaciones técnicas. La pregunta no es si llegarán, sino cuándo.

Newsletter

No te pierdas ninguna historia

Suscríbete para recibir nuevos lanzamientos, capítulos exclusivos y contenido detrás de cámaras.

  • Insights y artículos semanales
  • Contenido exclusivo y acceso anticipado
  • Sin spam, cancela cuando quieras

Respetamos tu privacidad. Puedes darte de baja cuando quieras.