Anthropic publicó una guía de prompt engineering para Claude Fable 5 y Claude Mythos 5. El foco del documento no es explicar las capacidades del modelo, sino avisar a los desarrolladores de que al migrar un flujo antiguo de Claude Opus 4.8 a Fable 5 quizá haya que ajustar prompts, Agent harness, estrategia de timeouts y fallback de seguridad.
El cambio de Fable 5 se puede resumir así: encaja mejor con tareas largas, complejas y de extremo a extremo, pero con effort alto también puede dedicar más tiempo a planificar, comprobar y ampliar contexto. Para usarlo bien, la clave no es mover los prompts antiguos tal cual, sino rediseñar límites de tarea, métodos de verificación e interacción en tareas largas.
Primero prueba con tareas más difíciles
Anthropic recomienda no probar Fable 5 solo con tareas simples. Sus ventajas aparecen con más claridad en trabajos que antes requerían horas, días o incluso semanas de una persona, como grandes migraciones de código, análisis de varias fases, flujos complejos de Agent, investigación entre documentos y comprensión visual de alta precisión.
Si lo evalúas solo con preguntas cortas, resúmenes simples o funciones pequeñas de una sola vez, es fácil subestimar Fable 5. Una prueba más razonable es tomar un tipo de tarea que a los modelos anteriores les costaba y dejar que el modelo complete la cadena completa: entender, planificar, ejecutar y verificar.
Tareas adecuadas para probarlo:
- hacer que el modelo lea una base de código y complete cambios entre módulos;
- pedirle que implemente una función a partir de una especificación, añada pruebas y ejecute comprobaciones;
- dejar que un Agent gestione un flujo de investigación o análisis de varios días;
- hacer que extraiga información estructurada desde capturas, tablas, PDF y gráficos;
- dividir tareas independientes entre varios sub-agentes y hacer que el Agent principal resuma.
effort es el control principal
En Fable 5, effort es el parámetro principal para controlar inteligencia, latencia y coste. La recomendación oficial es empezar la mayoría de tareas en high, usar xhigh para cargas más sensibles a capacidad y usar medium o low para trabajo rutinario.
Un punto importante es que los niveles bajos de effort en Fable 5 pueden superar a niveles altos de effort en modelos anteriores. Es decir, al migrar no hace falta poner todas las tareas al máximo por defecto. Una estrategia mejor es:
- usar
highpara problemas difíciles y tareas de alto valor; - usar
xhighpara razonamiento complejo crítico o tareas largas; - usar
mediumolowpara preguntas normales, reescrituras ligeras y llamadas simples a herramientas; - bajar effort si la tarea termina pero tarda demasiado;
- subir effort si la verificación de salida es débil o el razonamiento no profundiza lo suficiente.
El effort alto mejora razonamiento y autoverificación, pero el modelo también puede recopilar más contexto, explicar de más o hacer limpiezas innecesarias. En tareas de código conviene limitar el alcance explícitamente:
|
|
Las tareas largas requieren cambiar timeouts, streaming y progreso
En tareas difíciles, una sola solicitud a Fable 5 puede ejecutarse durante muchos minutos, y las ejecuciones autónomas pueden durar horas. Es uno de los puntos más fáciles de pasar por alto durante la migración.
Si tu aplicación fue diseñada para solicitudes cortas, revisa primero:
- timeouts del cliente y del servidor;
- si hay soporte para streaming;
- si la interfaz puede mostrar progreso;
- si el Agent harness permite comprobaciones asíncronas;
- si hace falta usar sondeos programados en lugar de bloquear todo el tiempo.
Para evitar que el modelo planifique en exceso cuando la tarea es ambigua, añade una restricción breve:
|
|
Este tipo de instrucción funciona mejor que una larga lista de conductas porque Fable 5 sigue instrucciones con más fuerza.
Los informes de progreso deben basarse en evidencia real
En ejecuciones largas de Agent, un problema común es que el modelo puede dar un estado que suena razonable, pero sin respaldo en resultados de herramientas. Anthropic recomienda pedir en el prompt que el modelo audite el progreso antes de informar al usuario.
Puedes usar una restricción como esta:
|
|
Esto es importante para agentes de código, agentes de procesamiento de datos y tareas largas de investigación. El usuario no necesita optimismo: necesita avances trazables y verificables.
Define claramente los límites
Fable 5 es más proactivo y puede hacer acciones extra sin que se le pidan explícitamente, como redactar un correo, crear una rama de respaldo o ampliar el alcance de la tarea. Al migrar prompts antiguos, hay que dejar claro cuándo solo debe dar una evaluación y cuándo puede actuar.
Por ejemplo:
|
|
Esta regla aplica a soporte al cliente, operaciones, herramientas de desarrollo y trabajo de conocimiento empresarial. Cuanto más capaz es el modelo, más claramente hay que definir sus permisos.
Usa sub-agentes de forma más activa
La documentación oficial menciona que Fable 5 es mejor que los modelos anteriores al despachar y mantener sub-agentes paralelos. En tareas complejas, no hace falta que el Agent principal complete todos los pasos en orden. Un patrón mejor es delegar subtareas independientes, mantener la línea principal avanzando e intervenir si un sub-agente se desvía.
Tareas adecuadas para sub-agentes:
- buscar implementaciones relacionadas en diferentes módulos de una base de código;
- verificar de forma independiente si una corrección cumple la especificación;
- analizar documentos o fuentes de datos distintas;
- comparar visualmente una implementación frontend con el objetivo;
- revisar la salida final con fresh-context.
Para tareas largas, Anthropic también recomienda usar sub-agentes verificadores independientes en lugar de depender solo de la autocrítica del modelo. Puedes pedirlo así:
|
|
Esto reduce el problema de que el modelo simplemente se convenza a sí mismo de que tiene razón.
Un sistema de memoria mejora el rendimiento a largo plazo
Fable 5 funciona bien en flujos con memoria. La recomendación oficial es darle al modelo un lugar donde registrar aprendizajes, aunque sea un archivo Markdown. La clave es guardar lecciones reutilizables, no copiar el historial del chat.
Una regla sencilla:
|
|
Esto es especialmente útil para mantenimiento continuo de código, proyectos largos de investigación, bases de conocimiento empresariales y flujos de automatización complejos. Fable 5 no es solo un ejecutor de una vez; encaja mejor cuando puede acumular contexto entre tareas.
No pidas al modelo que reproduzca el razonamiento interno
Al migrar a Fable 5, revisa prompts, skills e instrucciones de sistema antiguas en busca de frases como “muestra tu proceso de pensamiento”, “repite tu razonamiento” o “explica tu reasoning interno”. La documentación oficial advierte que estas instrucciones pueden activar la categoría de rechazo reasoning_extraction, lo que provoca más fallbacks a Claude Opus 4.8.
Si la aplicación necesita visibilidad de razonamiento, debería leer bloques estructurados thinking en lugar de pedir al modelo que escriba su razonamiento interno como texto normal de respuesta. En tareas largas donde hay que mostrar progreso al usuario, también conviene crear una herramienta como send_to_user, para que el Agent envíe información que deba mostrarse literalmente sin interrumpir la ejecución.
Vigila clasificación de seguridad y fallback
Fable 5 ejecuta clasificadores de seguridad para dominios de alto riesgo, incluidos técnicas ofensivas de ciberseguridad, contenido de biología y ciencias de la vida, y solicitudes para extraer pensamiento resumido del modelo. Incluso tareas legítimas de ciberseguridad o ciencias de la vida pueden activar protecciones.
Si una solicitud se rechaza o se enruta, el lado API debe configurar fallback server-side o client-side a Claude Opus 4.8. Es decir, migrar a Fable 5 no es solo cambiar el nombre del modelo. También hay que revisar manejo de fallos, stop_reason: "refusal", mensajes al usuario y rutas de facturación.
La respuesta final al usuario debe ser más clara
Después de muchas llamadas a herramientas y flujos de Agent, el modelo puede acumular mucho contexto interno, y el resumen final puede convertirse en shorthand que solo entiende quien ejecutó el trabajo. Anthropic recomienda añadir una restricción separada para el estilo de respuesta final: primero el resultado, luego los detalles clave, sin volcar abreviaturas internas, cadenas con flechas o etiquetas de trabajo al usuario.
Puedes escribir el requisito así:
|
|
Esto es clave para la experiencia de Agent dentro de un producto. El usuario no necesita ver todas las huellas del trabajo del modelo; necesita resultado, evidencia, riesgos y siguiente paso.
Qué cambiar primero al migrar
Si ya tienes un Agent de Claude o un sistema de prompts, revisa esto primero al migrar a Fable 5:
- cambia las pruebas a tareas más difíciles, largas y completas;
- reevalúa
effort, sin poner todas las tareas al máximo por defecto; - ajusta timeouts, streaming y comprobaciones asíncronas;
- añade auditoría de progreso basada en resultados de herramientas para tareas largas;
- define cuándo el modelo puede actuar y cuándo solo debe informar una evaluación;
- delega verificación independiente a sub-agentes con fresh-context;
- añade un sistema simple de memoria para guardar aprendizajes entre tareas;
- elimina instrucciones antiguas que pidan reproducir razonamiento interno;
- configura fallback a Opus 4.8 tras rechazos o enrutamientos de Fable 5;
- reescribe el estilo del resumen final para que el usuario entienda rápido el resultado.
El prompt engineering de Fable 5 no consiste en escribir reglas más largas, sino en diseñar flujos que encajen con un modelo más fuerte: tareas más difíciles, límites más claros, verificación más real e interacción más asíncrona. Cosas que antes requerían muchas restricciones pequeñas pueden controlarse a menudo con principios más breves en Fable 5. Pero las tareas largas, los límites de permisos y el fallback de seguridad necesitan más diseño en la capa de harness.