Guía de prompts para Claude Fable 5: claves de migración para tareas largas, agentes y alto effort

Resumen práctico de la guía oficial de prompts para Claude Fable 5 de Anthropic: effort, tareas largas, verificación de progreso, límites, sub-agentes, memoria y puntos de migración.

Anthropic publicó una guía de prompt engineering para Claude Fable 5 y Claude Mythos 5. El foco del documento no es explicar las capacidades del modelo, sino avisar a los desarrolladores de que al migrar un flujo antiguo de Claude Opus 4.8 a Fable 5 quizá haya que ajustar prompts, Agent harness, estrategia de timeouts y fallback de seguridad.

El cambio de Fable 5 se puede resumir así: encaja mejor con tareas largas, complejas y de extremo a extremo, pero con effort alto también puede dedicar más tiempo a planificar, comprobar y ampliar contexto. Para usarlo bien, la clave no es mover los prompts antiguos tal cual, sino rediseñar límites de tarea, métodos de verificación e interacción en tareas largas.

Primero prueba con tareas más difíciles

Anthropic recomienda no probar Fable 5 solo con tareas simples. Sus ventajas aparecen con más claridad en trabajos que antes requerían horas, días o incluso semanas de una persona, como grandes migraciones de código, análisis de varias fases, flujos complejos de Agent, investigación entre documentos y comprensión visual de alta precisión.

Si lo evalúas solo con preguntas cortas, resúmenes simples o funciones pequeñas de una sola vez, es fácil subestimar Fable 5. Una prueba más razonable es tomar un tipo de tarea que a los modelos anteriores les costaba y dejar que el modelo complete la cadena completa: entender, planificar, ejecutar y verificar.

Tareas adecuadas para probarlo:

  • hacer que el modelo lea una base de código y complete cambios entre módulos;
  • pedirle que implemente una función a partir de una especificación, añada pruebas y ejecute comprobaciones;
  • dejar que un Agent gestione un flujo de investigación o análisis de varios días;
  • hacer que extraiga información estructurada desde capturas, tablas, PDF y gráficos;
  • dividir tareas independientes entre varios sub-agentes y hacer que el Agent principal resuma.

effort es el control principal

En Fable 5, effort es el parámetro principal para controlar inteligencia, latencia y coste. La recomendación oficial es empezar la mayoría de tareas en high, usar xhigh para cargas más sensibles a capacidad y usar medium o low para trabajo rutinario.

Un punto importante es que los niveles bajos de effort en Fable 5 pueden superar a niveles altos de effort en modelos anteriores. Es decir, al migrar no hace falta poner todas las tareas al máximo por defecto. Una estrategia mejor es:

  • usar high para problemas difíciles y tareas de alto valor;
  • usar xhigh para razonamiento complejo crítico o tareas largas;
  • usar medium o low para preguntas normales, reescrituras ligeras y llamadas simples a herramientas;
  • bajar effort si la tarea termina pero tarda demasiado;
  • subir effort si la verificación de salida es débil o el razonamiento no profundiza lo suficiente.

El effort alto mejora razonamiento y autoverificación, pero el modelo también puede recopilar más contexto, explicar de más o hacer limpiezas innecesarias. En tareas de código conviene limitar el alcance explícitamente:

1
不要添加超出任务所需的功能、重构或抽象。修复 bug 不需要顺手清理周边代码;一次性操作通常不需要额外 helper。做最简单且可靠的实现。

Las tareas largas requieren cambiar timeouts, streaming y progreso

En tareas difíciles, una sola solicitud a Fable 5 puede ejecutarse durante muchos minutos, y las ejecuciones autónomas pueden durar horas. Es uno de los puntos más fáciles de pasar por alto durante la migración.

Si tu aplicación fue diseñada para solicitudes cortas, revisa primero:

  • timeouts del cliente y del servidor;
  • si hay soporte para streaming;
  • si la interfaz puede mostrar progreso;
  • si el Agent harness permite comprobaciones asíncronas;
  • si hace falta usar sondeos programados en lugar de bloquear todo el tiempo.

Para evitar que el modelo planifique en exceso cuando la tarea es ambigua, añade una restricción breve:

1
当你已经有足够信息可以行动时,直接行动。不要重新推导对话中已经确认的事实,也不要反复讨论用户已经决定的选项。

Este tipo de instrucción funciona mejor que una larga lista de conductas porque Fable 5 sigue instrucciones con más fuerza.

Los informes de progreso deben basarse en evidencia real

En ejecuciones largas de Agent, un problema común es que el modelo puede dar un estado que suena razonable, pero sin respaldo en resultados de herramientas. Anthropic recomienda pedir en el prompt que el modelo audite el progreso antes de informar al usuario.

Puedes usar una restricción como esta:

1
在汇报进度前,先把每个声明和本轮会话中的工具结果对齐。只汇报有证据支持的工作;如果某件事尚未验证,就明确说明。测试失败就报告失败输出;步骤跳过就说明跳过;完成并验证后再直接说完成。

Esto es importante para agentes de código, agentes de procesamiento de datos y tareas largas de investigación. El usuario no necesita optimismo: necesita avances trazables y verificables.

Define claramente los límites

Fable 5 es más proactivo y puede hacer acciones extra sin que se le pidan explícitamente, como redactar un correo, crear una rama de respaldo o ampliar el alcance de la tarea. Al migrar prompts antiguos, hay que dejar claro cuándo solo debe dar una evaluación y cuándo puede actuar.

Por ejemplo:

1
当用户只是在描述问题、提问或思考,而没有要求修改时,交付物是你的判断。报告发现后停止,不要主动修复。运行会改变系统状态的命令前,先确认证据确实支持这个动作。

Esta regla aplica a soporte al cliente, operaciones, herramientas de desarrollo y trabajo de conocimiento empresarial. Cuanto más capaz es el modelo, más claramente hay que definir sus permisos.

Usa sub-agentes de forma más activa

La documentación oficial menciona que Fable 5 es mejor que los modelos anteriores al despachar y mantener sub-agentes paralelos. En tareas complejas, no hace falta que el Agent principal complete todos los pasos en orden. Un patrón mejor es delegar subtareas independientes, mantener la línea principal avanzando e intervenir si un sub-agente se desvía.

Tareas adecuadas para sub-agentes:

  • buscar implementaciones relacionadas en diferentes módulos de una base de código;
  • verificar de forma independiente si una corrección cumple la especificación;
  • analizar documentos o fuentes de datos distintas;
  • comparar visualmente una implementación frontend con el objetivo;
  • revisar la salida final con fresh-context.

Para tareas largas, Anthropic también recomienda usar sub-agentes verificadores independientes en lugar de depender solo de la autocrítica del modelo. Puedes pedirlo así:

1
在构建过程中,每隔 [X] 建立一次自检方法,并用子 Agent 对照规格验证你的工作。

Esto reduce el problema de que el modelo simplemente se convenza a sí mismo de que tiene razón.

Un sistema de memoria mejora el rendimiento a largo plazo

Fable 5 funciona bien en flujos con memoria. La recomendación oficial es darle al modelo un lugar donde registrar aprendizajes, aunque sea un archivo Markdown. La clave es guardar lecciones reutilizables, no copiar el historial del chat.

Una regla sencilla:

1
每个文件只保存一条经验,顶部写一句摘要。记录修正和已验证的方法,并说明它为什么重要。不要保存仓库或聊天历史已经包含的信息;能更新旧笔记就不要创建重复笔记;后来发现错误的笔记要删除。

Esto es especialmente útil para mantenimiento continuo de código, proyectos largos de investigación, bases de conocimiento empresariales y flujos de automatización complejos. Fable 5 no es solo un ejecutor de una vez; encaja mejor cuando puede acumular contexto entre tareas.

No pidas al modelo que reproduzca el razonamiento interno

Al migrar a Fable 5, revisa prompts, skills e instrucciones de sistema antiguas en busca de frases como “muestra tu proceso de pensamiento”, “repite tu razonamiento” o “explica tu reasoning interno”. La documentación oficial advierte que estas instrucciones pueden activar la categoría de rechazo reasoning_extraction, lo que provoca más fallbacks a Claude Opus 4.8.

Si la aplicación necesita visibilidad de razonamiento, debería leer bloques estructurados thinking en lugar de pedir al modelo que escriba su razonamiento interno como texto normal de respuesta. En tareas largas donde hay que mostrar progreso al usuario, también conviene crear una herramienta como send_to_user, para que el Agent envíe información que deba mostrarse literalmente sin interrumpir la ejecución.

Vigila clasificación de seguridad y fallback

Fable 5 ejecuta clasificadores de seguridad para dominios de alto riesgo, incluidos técnicas ofensivas de ciberseguridad, contenido de biología y ciencias de la vida, y solicitudes para extraer pensamiento resumido del modelo. Incluso tareas legítimas de ciberseguridad o ciencias de la vida pueden activar protecciones.

Si una solicitud se rechaza o se enruta, el lado API debe configurar fallback server-side o client-side a Claude Opus 4.8. Es decir, migrar a Fable 5 no es solo cambiar el nombre del modelo. También hay que revisar manejo de fallos, stop_reason: "refusal", mensajes al usuario y rutas de facturación.

La respuesta final al usuario debe ser más clara

Después de muchas llamadas a herramientas y flujos de Agent, el modelo puede acumular mucho contexto interno, y el resumen final puede convertirse en shorthand que solo entiende quien ejecutó el trabajo. Anthropic recomienda añadir una restricción separada para el estilo de respuesta final: primero el resultado, luego los detalles clave, sin volcar abreviaturas internas, cadenas con flechas o etiquetas de trabajo al usuario.

Puedes escribir el requisito así:

1
最终总结面向没有看到中间过程的读者。先说明发生了什么或完成了什么,再给必要细节。用完整句子,不要使用箭头链、堆叠连字符或临时发明的标签。简短和清楚冲突时,选择清楚。

Esto es clave para la experiencia de Agent dentro de un producto. El usuario no necesita ver todas las huellas del trabajo del modelo; necesita resultado, evidencia, riesgos y siguiente paso.

Qué cambiar primero al migrar

Si ya tienes un Agent de Claude o un sistema de prompts, revisa esto primero al migrar a Fable 5:

  • cambia las pruebas a tareas más difíciles, largas y completas;
  • reevalúa effort, sin poner todas las tareas al máximo por defecto;
  • ajusta timeouts, streaming y comprobaciones asíncronas;
  • añade auditoría de progreso basada en resultados de herramientas para tareas largas;
  • define cuándo el modelo puede actuar y cuándo solo debe informar una evaluación;
  • delega verificación independiente a sub-agentes con fresh-context;
  • añade un sistema simple de memoria para guardar aprendizajes entre tareas;
  • elimina instrucciones antiguas que pidan reproducir razonamiento interno;
  • configura fallback a Opus 4.8 tras rechazos o enrutamientos de Fable 5;
  • reescribe el estilo del resumen final para que el usuario entienda rápido el resultado.

El prompt engineering de Fable 5 no consiste en escribir reglas más largas, sino en diseñar flujos que encajen con un modelo más fuerte: tareas más difíciles, límites más claros, verificación más real e interacción más asíncrona. Cosas que antes requerían muchas restricciones pequeñas pueden controlarse a menudo con principios más breves en Fable 5. Pero las tareas largas, los límites de permisos y el fallback de seguridad necesitan más diseño en la capa de harness.

Fuente: Anthropic: Prompting Claude Fable 5

记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy