La línea actual de modelos Claude de Anthropic ya no se resume en “Haiku es rápido, Sonnet es equilibrado y Opus es el más fuerte”. En julio de 2026, los modelos principales incluyen Claude Fable 5, Claude Opus 4.8, Claude Sonnet 5, Claude Haiku 4.5 y Claude Mythos 5 con disponibilidad limitada.
Si quieres una regla rápida: usa Sonnet 5 primero para desarrollo diario y la mayoría de tareas de Agent; Opus 4.8 para Agents empresariales complejos y programación difícil; Fable 5 cuando necesites la máxima capacidad; Haiku 4.5 para baja latencia y costes sensibles; Mythos 5 no es una opción general, solo para clientes aprobados.
Modelos principales actuales
| Modelo | API ID / alias | Posición | Contexto | Salida máxima | Latencia | Precio estándar |
|---|---|---|---|---|---|---|
| Claude Fable 5 | claude-fable-5 |
Máxima capacidad entre los modelos ampliamente publicados de Anthropic, adecuado para Agents largos | 1M tokens | 128k tokens | Más lento | Entrada $10 / MTok, salida $50 / MTok |
| Claude Opus 4.8 | claude-opus-4-8 |
Programación Agent compleja, workflows empresariales, uso de navegador/computadora | 1M tokens | 128k tokens | Media | Entrada $5 / MTok, salida $25 / MTok |
| Claude Sonnet 5 | claude-sonnet-5 |
Mejor equilibrio entre velocidad, capacidad y precio; buen modelo por defecto | 1M tokens | 128k tokens | Rápido | Hasta 2026-08-31: entrada $2 / MTok, salida $10 / MTok; luego $3 / $15 |
| Claude Haiku 4.5 | claude-haiku-4-5 |
Más rápido y barato, para tareas ligeras de alto volumen | 200k tokens | 64k tokens | Más rápido | Entrada $1 / MTok, salida $5 / MTok |
| Claude Mythos 5 | claude-mythos-5 |
Mismas especificaciones y precio que Fable 5, pero limitado | 1M tokens | 128k tokens | Más lento | Entrada $10 / MTok, salida $50 / MTok |
MTok significa million tokens, es decir, un millón de tokens. Los precios también pueden depender de prompt caching, batch, residencia de datos, plataforma cloud y región. La tabla muestra solo los precios base más comunes.
Fable 5: máxima capacidad, pero no el valor por defecto
Claude Fable 5 es el modelo de mayor capacidad entre los que Anthropic publica ampliamente. Su posición oficial es next-generation intelligence for long-running agents.
Encaja con:
- Workflows de Agent largos, de varios pasos y con autonomía.
- Investigación compleja, migración de código y planificación entre sistemas.
- Tareas empresariales que requieren máximo razonamiento y contexto amplio.
- Tareas de alto valor menos sensibles a coste y latencia.
Pero Fable 5 no siempre debe ser el modelo por defecto. Es el más caro y más lento. Salvo que la tarea necesite realmente el techo más alto, suele ser más estable empezar con Sonnet 5 u Opus 4.8.
Además, Fable 5 usa adaptive thinking y está always on. Decide automáticamente cuándo razonar y cuánto. Esto ayuda en tareas complejas, pero hace que coste y tiempo de respuesta dependan más de la tarea.
Opus 4.8: opción sólida para programación compleja y Agents empresariales
Claude Opus 4.8 está entre Fable 5 y Sonnet 5. Anthropic sugiere empezar con Opus 4.8 cuando no sepas qué modelo usar para programación Agent compleja y trabajo empresarial.
Sus ventajas:
- Contexto de 1M tokens.
- Salida máxima de 128k tokens.
- Buen rendimiento en programación compleja, browser Agents, computer use y workflows empresariales.
- Cuesta la mitad que Fable 5.
- Soporta adaptive thinking.
Opus 4.8 encaja como “modelo por defecto para tareas difíciles”. Refactors a nivel de repositorio, PR complejos, análisis de datos empresariales, Agents con varias herramientas y razonamiento sobre documentos largos pueden empezar aquí.
Si la tarea es extremadamente difícil, sube de Opus 4.8 a Fable 5. Si el volumen es grande y el coste pesa, baja a Sonnet 5.
Sonnet 5: el mejor valor por defecto diario
Claude Sonnet 5 es hoy el candidato por defecto más interesante. Su posición es best combination of speed and intelligence.
Encaja con:
- Programación diaria y revisión de código.
- Documentación, asistencia de investigación y trabajo de conocimiento.
- Agents de complejidad media.
- Automatización interna empresarial.
- Aplicaciones API que necesitan controlar costes sin perder demasiada calidad.
El mayor cambio de Sonnet 5 es que muchas capacidades de Agent que antes parecían más cercanas a Opus llegan ahora al precio de Sonnet. También soporta contexto de 1M tokens y salida máxima de 128k tokens, con menor latencia que Opus.
Hasta el 31 de agosto de 2026 tiene precio inicial: entrada $2 / MTok y salida $10 / MTok. Desde el 1 de septiembre de 2026 vuelve al precio estándar: entrada $3 / MTok y salida $15 / MTok. Incluso al precio estándar, sigue siendo bastante más barato que Opus 4.8.
Para la mayoría de equipos, empezaría con Sonnet 5: cubrir 70% a 80% de las tareas con él y escalar lo realmente difícil a Opus 4.8 o Fable 5.
Haiku 4.5: alto volumen, baja latencia, bajo coste
Claude Haiku 4.5 es el modelo más rápido de la línea principal Claude. Anthropic lo posiciona como fastest model with near-frontier intelligence.
Encaja con:
- Clasificación, extracción, resumen y conversión de formato.
- Procesamiento por lotes de texto corto.
- Soporte, tickets, moderación y escenarios de alto volumen.
- Productos interactivos muy sensibles a la latencia.
- Tareas ligeras que no necesitan contexto de 1M.
Sus límites también son claros: contexto de 200k tokens y salida máxima de 64k tokens, por debajo del 1M / 128k de Fable, Opus y Sonnet. No debería ser la primera opción para repositorios largos, análisis complejo de varios documentos o Agents largos.
Pero si la tarea es “mucha, simple y rápida”, Haiku 4.5 tiene una relación coste-rendimiento directa: entrada $1 / MTok y salida $5 / MTok.
Mythos 5: no es una opción normal
Claude Mythos 5 comparte especificaciones y precio con Fable 5, pero no está disponible de forma general. La documentación de Anthropic lo marca como limited availability, solo para clientes aprobados en Project Glasswing.
En otras palabras, si haces selección normal de modelos API, normalmente no necesitas incluir Mythos 5. Salvo que ya estés aprobado o consigas acceso mediante Anthropic, AWS o Google Cloud, no es un reemplazo directo de Fable 5.
Cómo elegir: segmentar por complejidad de tarea
Puedes usar este orden:
-
Probar Sonnet 5 por defecto
Adecuado para la mayoría de programación, documentación, Agents y automatización empresarial. -
Subir a Opus 4.8 cuando la tarea sea claramente compleja
Repositorios largos, varias herramientas, varios pasos y necesidad de ejecución estable con razonamiento fuerte. -
Probar Fable 5 cuando se necesite la máxima capacidad
Tareas de alto valor, largas, con alto coste de fallo y menos sensibilidad al precio. -
Usar Haiku 4.5 para tareas ligeras de alto volumen
Clasificación, extracción, resumen, soporte, procesamiento por lotes e interacción de baja latencia. -
Considerar Mythos 5 solo si tienes acceso
No es una opción por defecto para desarrolladores comunes.
Dos detalles de migración y coste
Primero, los modelos Claude más nuevos usan un tokenizer nuevo. La documentación de Anthropic indica que Opus 4.7 y posteriores, Fable 5, Mythos 5, Mythos Preview y Sonnet 5 pueden producir alrededor de 30% más tokens para el mismo texto. No estimes costes solo con el precio por millón de tokens.
Segundo, tener contexto de 1M no significa que debas llenarlo siempre. Fable 5, Opus 4.8 y Sonnet 5 soportan 1M tokens, pero llamadas a herramientas, caché, salida y Agents multivuelta suman coste. En despliegue real conviene:
- Usar prompt caching para system prompts comunes y contexto largo.
- Dividir documentos largos primero y usar modelos fuertes para síntesis.
- Enviar pasos simples a Haiku o Sonnet y escalar decisiones clave a Opus / Fable.
- Probar con muestras reales, no solo con benchmarks oficiales.
Conclusión simple
La línea Claude actual queda bastante clara:
- Fable 5: máxima capacidad para las tareas más difíciles y valiosas.
- Opus 4.8: opción fuerte para Agent coding complejo y tareas empresariales.
- Sonnet 5: mejor valor por defecto diario, equilibrando capacidad, velocidad y precio.
- Haiku 4.5: más rápido y barato para tareas ligeras a gran escala.
- Mythos 5: disponibilidad limitada, no una opción normal.
Si eliges modelos Claude para un producto o workflow interno, la estrategia práctica no es perseguir el modelo más alto. Divide tareas: Haiku para lotes ligeros, Sonnet 5 como capa de ejecución por defecto, Opus 4.8 para Agents complejos y programación difícil, y Fable 5 para el pequeño conjunto de tareas más difíciles, caras y valiosas.
Recomendación de routing
Al elegir modelos Claude, conviene no tener un único modelo por defecto. Es más útil diseñar reglas de routing: lotes ligeros a Haiku, programación diaria y trabajo de conocimiento a Sonnet, tareas complejas de repositorio y Agents de varios pasos a Opus, y tareas de máximo valor o dificultad a Fable.
La regla puede empezar simple. Resumen, clasificación y extracción de campos prefieren Haiku. PR review, generación de documentación y cambios normales de código prefieren Sonnet. Refactors entre módulos, postmortems y planificación compleja prefieren Opus. Si Opus falla repetidamente o la tarea tiene mucho valor, usar Fable.
Cada capa también necesita condiciones de salida. Salida incierta, fallos de herramientas, tests que fallan repetidamente, contexto por encima del umbral o tareas con permisos/datos de producción deberían activar confirmación humana, no automatización continua.
Método para evaluar costes
La tabla de precios solo sirve como aproximación. El coste real depende de longitud de contexto, tasa de acierto de caché, reintentos, longitud de salida y tiempo de retrabajo humano. Un modelo más caro que termina a la primera puede ser más barato que varios reintentos con uno barato.
Para cada tipo de tarea, registra tres datos: coste medio en tokens, tiempo medio de revisión humana y proporción de fallos que requieren escalar modelo. Tras dos semanas suele quedar claro qué tareas van en Sonnet y cuáles merecen Opus o Fable.
Referencias: