Ejecución Especulativa, KAIROS y las Features Ocultas de Claude Code
Las capabilities que Anthropic no anuncia: un overlay filesystem que trabaja mientras lees, un asistente always-on con cron y push notifications, y un modo multi-agente donde "el paralelismo es tu superpoder". Reverse engineering de fuente primaria.
¿Alguna vez la respuesta de Claude Code fue sospechosamente rápida? No fue tu imaginación. Claude Code estaba trabajando antes de que preguntaras. Este artículo revela las features que no están en ningún changelog público — reverse engineering directo del código fuente, no especulación ni rumores.
Lo que cubrimos
🔮 Ejecución Especulativa — overlay filesystem que trabaja antes de que preguntes
🌙 KAIROS Mode — asistente always-on con sleep/wake, cron y push notifications
🎛️ Coordinator Mode — orquestación multi-agente con workers paralelos
🧪 18 Beta Headers — el futuro del API oculto en feature flags
🔐 Ant-Only Features — lo que Anthropic usa internamente y tú no puedes
Ejecución Especulativa
El truco del overlay filesystem
La feature más oculta de Claude Code. Gate: tengu_chomp_inflection
(GrowthBook). Claude Code puede predecir tu siguiente pregunta
y empezar a trabajar antes de que la escribas.
En coding, los patrones son predecibles: "ejecuta los tests", "arregla el error", "ahora commitea". Claude Code aprovecha esta previsibilidad como las CPUs modernas aprovechan el branch prediction.
Pipeline Completo
El usuario envía un prompt → Claude responde
Flujo normal hasta aquí
Mientras lees la respuesta...
Un agente forked genera "prompt suggestions" en background
Se predice el prompt más probable
El sistema selecciona la predicción con mayor confianza
Ejecución Especulativa con OVERLAY FILESYSTEM
Reads → filesystem real (safe) · Writes → overlay sandboxed
El usuario escribe su prompt real
El sistema compara con la predicción
Match → Commit instantáneo · No match → Discard silencioso
Si acierta, las escrituras del overlay se aplican al FS real. Si falla, nada pasó.
Overlay Filesystem — El Detalle Crítico
La ejecución especulativa usa un filesystem virtual overlay:
Reads → van al filesystem real (seguro, sin side effects) Writes → van al overlay (sandboxed, aislado) Si COMMIT → las escrituras del overlay se aplican al FS real Si DISCARD → el overlay se descarta — nada pasó, cero side effects
Límites del Sistema
MAX_SPECULATION_TURNS = 20 // Máx turns en cadena especulativa MAX_SPECULATION_MESSAGES = 100 // Máx mensajes en especulación
Source: src/services/PromptSuggestion/speculation.ts
KAIROS Mode
El asistente que no duerme (o sí)
Gate: feature('KAIROS').
La feature más ambiciosa: un asistente de código always-on y persistente
que vive entre sesiones. Un colega virtual que se suscribe a tus PRs, programa tareas con cron,
y consolida memorias mientras duermes.
Capabilities Completas
| Feature | Descripción |
|---|---|
SleepTool | El agente duerme y programa su propio despertar |
<tick> XML tags | Activación periódica basada en ticks |
| Terminal Awareness | Sabe si estás mirando el terminal o estás AFK |
PushNotificationTool | Envía notificaciones push al móvil/escritorio |
SendUserFileTool | Comparte archivos directamente al usuario |
SubscribePRTool | Se suscribe a eventos de GitHub PRs vía webhooks |
| Cron Jobs | CronCreate/Delete/List — tareas programadas recurrentes |
| Daily Logs | Memoria append-only en memory/logs/YYYY/MM/DD.md |
| Nightly Dream | Consolidación de memoria durante períodos de sleep (/dream) |
AFK Detection — TRANSCRIPT_CLASSIFIER
Behind TRANSCRIPT_CLASSIFIER, el sistema clasifica si estás activamente
usando el terminal o te has ido. Cuando detecta AFK, el agente trabaja de forma autónoma; cuando regresas,
te resume lo que hizo.
Beta header: afk-mode-2026-01-31
Memoria en KAIROS: Append-Only Daily Logs
En lugar de editar MEMORY.md directamente, KAIROS usa
archivos de log diarios append-only:
memory/logs/2026/07/2026-07-04.md ← cada interacción se appende aquí // Cada noche, /dream consolida los logs del día en archivos temáticos // Más robusto para operación always-on — sin riesgo de corromper el índice
Coordinator Mode
Multi-agente con paralelismo como superpoder
"Parallelism is your superpower"
Un coordinador con 3 herramientas orquesta N workers, cada uno con el toolset completo. El coordinador no ejecuta código — planifica, delega y verifica. Los workers son los que hacen el trabajo pesado, en paralelo y con contexto aislado.
Arquitectura
┌──────────────────────────────┐
│ COORDINATOR │
│ Tools: Agent, TaskStop, │
│ SendMessage, SyntheticOutput │
└──────────┬───────────────────┘
│
┌─────────┼──────────┐
│ │ │
▼ ▼ ▼
┌──────┐ ┌──────┐ ┌──────┐
│Worker│ │Worker│ │Worker│
│ #1 │ │ #2 │ │ #3 │
│(full │ │(full │ │(full │
│tools)│ │tools)│ │tools)│
└──────┘ └──────┘ └──────┘ 4 Fases del Workflow
1. Research
Entender el problema. Múltiples workers investigan aspectos diferentes en paralelo.
2. Synthesis
Planificar el approach. El coordinador sintetiza hallazgos y define la estrategia.
3. Implementation
Ejecución paralela. Workers implementan con full toolset, cada uno en contexto aislado.
4. Verification
Confirmar correctitud. Tests, lint, review — todo antes de declarar completado.
Worker Status Reports
Los workers reportan cada 30 segundos via AgentSummary:
"Describe your most recent action in 3-5 words using present tense (-ing)" Ejemplo: "Migrating database schema tables" Formato: XML <task-notification> tags
/batch — El skill más poderoso
Lanza 5-30 agentes worktree aislados en paralelo. Cada agente trabaja en su propio git worktree (checkout separado), todos ejecutan simultáneamente, y los resultados se mergean de vuelta al branch principal.
Caso de uso: "Migra los 50 endpoints del API al nuevo schema" → 20 agentes, cada uno con 2-3 endpoints.
Los 18 Beta Headers
El futuro del API oculto en feature flags
Cada beta header debloquea una capability experimental del API.
Una vez activado en una sesión, persiste hasta /clear o
/compact — es latching behavior
intencional para evitar inconsistencias mid-session.
| Beta Header | Fecha | Descripción | Gate |
|---|---|---|---|
claude-code-20250219 | Feb 2025 | Beta base de Claude Code | Siempre |
interleaved-thinking | May 2025 | Thinking intercalado con tool use | Siempre |
context-1m | Ago 2025 | Ventana de 1M tokens (5x normal) | Feature flag |
context-management | Jun 2025 | Gestión de contexto nativa del API | Feature flag |
structured-outputs | Dic 2025 | Outputs JSON estructurados en tools | Feature flag |
web-search | Mar 2025 | Búsqueda web integrada | Siempre |
advanced-tool-use | Nov 2025 | Tool use avanzado (1P) | Feature flag |
effort | Nov 2025 | Control de thinking budget | Feature flag |
task-budgets | Mar 2026 | Token budgets a nivel de tarea | Feature flag |
prompt-caching-scope | Ene 2026 | Control de scope de prompt caching | Feature flag |
fast-mode | Feb 2026 | Modo rápido de respuesta | Feature flag |
token-efficient-tools | Mar 2026 | Definiciones de tools compactas | Feature flag |
afk-mode | Ene 2026 | Transcript classifier para KAIROS | TRANSCRIPT_CLASSIFIER |
cli-internal | Feb 2026 | Beta interna de Anthropic | Ant-only |
advisor-tool | Mar 2026 | Herramienta advisor | Feature flag |
redact-thinking | Feb 2026 | Redactar bloques de thinking del output | Feature flag |
summarize-connector | Mar 2026 | Summarización de texto de conectores | CONNECTOR_TEXT |
tool-search-tool | Oct 2025 | Búsqueda de tools de terceros | Feature flag |
Los 3 más reveladores
context-1m — ventana de 1M tokens. 5x la ventana normal. Anthropic ya lo tiene funcionando internamente. Cuando llegue al público, cambiará fundamentalmente cómo interactuamos con LLMs.
effort — control granular del thinking budget. Permite pedirle al modelo que piense más o menos. La era del "costo por complejidad" está aquí.
token-efficient-tools — definiciones de tools compactas. Reduce el overhead del system prompt, dejando más espacio para contexto útil.
Catálogo de Skills Ocultos
Los comandos que no están en /help
| Skill | Descripción | Gate |
|---|---|---|
/simplify | 3 agentes de review paralelos (Code Reuse, Quality, Efficiency) | Siempre |
/batch | 5-30 worktree agents en paralelo | Siempre |
/skillify | Captura la sesión actual como SKILL.md reutilizable | Siempre |
/debug | Diagnóstico de issues del proyecto | Siempre |
/dream | Consolidación de memoria nocturna (KAIROS) | KAIROS |
/verify | Verificación automatizada (tests + lint) | Ant-only |
/remember | Review de memoria → promoción a CLAUDE.md | Ant-only |
/stuck | Diagnóstico de sesiones congeladas + post a Slack | Ant-only |
/loop | Agent trigger loops | AGENT_TRIGGERS |
/simplify — Triple Review Paralelo
Lanza 3 agentes de review simultáneos, cada uno con una perspectiva diferente:
Code Reuse Reviewer
Patrones duplicados, utilidades compartidas
Code Quality Reviewer
Naming, estructura, readability
Efficiency Reviewer
Performance, complejidad algorítmica
Ant-Only: El Build Interno
Lo que Anthropic usa y tú no puedes (aún)
Cuando USER_TYPE === 'ant', Claude Code se comporta
de forma fundamentalmente diferente. Estas son las capabilities exclusivas del build interno de Anthropic:
Instrucciones de Prompt Diferentes
"Never Refuse"
Nunca digas que no puedes hacer algo — muestra el error en su lugar
≤25 palabras
Máximo 25 palabras entre tool calls — máxima eficiencia
Minimizar comentarios
No añadir comentarios a menos que sean necesarios
Nested Agents
Agentes que crean sub-agentes — deshabilitado para externos
Herramientas Exclusivas de Ant
| Tool | Descripción |
|---|---|
ConfigTool | Gestión directa de configuración |
TungstenTool | Framework de testing interno |
SuggestBackgroundPRTool | Creación automatizada de PRs |
REPLTool | Todas las tools wrapeadas en un VM REPL |
¿Qué nos dice esto?
Anthropic confía lo suficiente en Claude Code como para darle internamente menos guardrails y más autonomía. Las restricciones que experimentamos como usuarios no son limitaciones técnicas — son decisiones de producto que podrían cambiar conforme la confianza del público crece.
GrowthBook Runtime Flags
Los interruptores detrás del telón
Todos los flags de runtime usan el prefijo tengu_ (codename interno).
Estos son los que controlan las features más interesantes:
| Flag | Propósito |
|---|---|
tengu_chomp_inflection | Ejecución especulativa + prompt suggestions |
tengu_session_memory | Session memory ON/OFF |
tengu_cobalt_raccoon | Compactación reactiva agresiva |
tengu_hive_evidence | Patrón de agente de verificación |
tengu_onyx_plover | Configuración de auto-dream |
tengu_memdir_loaded | Analytics de directorio de memoria |
Lo Que Viene
El futuro que el código revela
Ejecución especulativa va a convertirse en el paradigma estándar para todos los AI coding tools. Si puedes predecir los siguientes 2-3 pasos con alta confianza (y en coding, puedes), la latencia percibida desaparece.
KAIROS señala el futuro de los asistentes always-on. No un chatbot que espera tus preguntas — un colega que trabaja en background, se suscribe a tus repos, programa reviews y consolida aprendizajes mientras duermes.
Coordinator Mode demuestra que la era del multi-agent coding ya está aquí. No es una demo o un paper — es producción real (al menos internamente). La orquestación con workers paralelos y comunicación via IPC es el patrón que todos vamos a copiar.
La pregunta que queda
¿Cuántas de estas features llegarán al build público — y cuántas se quedarán como ventaja interna de Anthropic? El código fuente insinúa que la mayoría están detrás de feature flags, no de limitaciones técnicas. La pregunta no es si llegarán, sino cuándo.