<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Model Selection on KnightLi Blog</title>
        <link>https://knightli.com/es/tags/model-selection/</link>
        <description>Recent content in Model Selection on KnightLi Blog</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>es</language>
        <lastBuildDate>Thu, 02 Jul 2026 07:27:14 +0800</lastBuildDate><atom:link href="https://knightli.com/es/tags/model-selection/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Cómo elegir los modelos Claude actuales de Anthropic: Fable, Opus, Sonnet y Haiku</title>
        <link>https://knightli.com/es/2026/07/02/anthropic-claude-models-comparison/</link>
        <pubDate>Thu, 02 Jul 2026 07:27:14 +0800</pubDate>
        
        <guid>https://knightli.com/es/2026/07/02/anthropic-claude-models-comparison/</guid>
        <description>&lt;p&gt;La línea actual de modelos Claude de Anthropic ya no se resume en “Haiku es rápido, Sonnet es equilibrado y Opus es el más fuerte”. En julio de 2026, los modelos principales incluyen Claude Fable 5, Claude Opus 4.8, Claude Sonnet 5, Claude Haiku 4.5 y Claude Mythos 5 con disponibilidad limitada.&lt;/p&gt;
&lt;p&gt;Si quieres una regla rápida: usa Sonnet 5 primero para desarrollo diario y la mayoría de tareas de Agent; Opus 4.8 para Agents empresariales complejos y programación difícil; Fable 5 cuando necesites la máxima capacidad; Haiku 4.5 para baja latencia y costes sensibles; Mythos 5 no es una opción general, solo para clientes aprobados.&lt;/p&gt;
&lt;h2 id=&#34;modelos-principales-actuales&#34;&gt;Modelos principales actuales
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;Modelo&lt;/th&gt;
          &lt;th&gt;API ID / alias&lt;/th&gt;
          &lt;th&gt;Posición&lt;/th&gt;
          &lt;th&gt;Contexto&lt;/th&gt;
          &lt;th&gt;Salida máxima&lt;/th&gt;
          &lt;th&gt;Latencia&lt;/th&gt;
          &lt;th&gt;Precio estándar&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Fable 5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-fable-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;Máxima capacidad entre los modelos ampliamente publicados de Anthropic, adecuado para Agents largos&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;Más lento&lt;/td&gt;
          &lt;td&gt;Entrada $10 / MTok, salida $50 / MTok&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Opus 4.8&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-opus-4-8&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;Programación Agent compleja, workflows empresariales, uso de navegador/computadora&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;Media&lt;/td&gt;
          &lt;td&gt;Entrada $5 / MTok, salida $25 / MTok&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Sonnet 5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-sonnet-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;Mejor equilibrio entre velocidad, capacidad y precio; buen modelo por defecto&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;Rápido&lt;/td&gt;
          &lt;td&gt;Hasta 2026-08-31: entrada $2 / MTok, salida $10 / MTok; luego $3 / $15&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Haiku 4.5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-haiku-4-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;Más rápido y barato, para tareas ligeras de alto volumen&lt;/td&gt;
          &lt;td&gt;200k tokens&lt;/td&gt;
          &lt;td&gt;64k tokens&lt;/td&gt;
          &lt;td&gt;Más rápido&lt;/td&gt;
          &lt;td&gt;Entrada $1 / MTok, salida $5 / MTok&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Mythos 5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-mythos-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;Mismas especificaciones y precio que Fable 5, pero limitado&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;Más lento&lt;/td&gt;
          &lt;td&gt;Entrada $10 / MTok, salida $50 / MTok&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;MTok significa million tokens, es decir, un millón de tokens. Los precios también pueden depender de prompt caching, batch, residencia de datos, plataforma cloud y región. La tabla muestra solo los precios base más comunes.&lt;/p&gt;
&lt;h2 id=&#34;fable-5-máxima-capacidad-pero-no-el-valor-por-defecto&#34;&gt;Fable 5: máxima capacidad, pero no el valor por defecto
&lt;/h2&gt;&lt;p&gt;Claude Fable 5 es el modelo de mayor capacidad entre los que Anthropic publica ampliamente. Su posición oficial es next-generation intelligence for long-running agents.&lt;/p&gt;
&lt;p&gt;Encaja con:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Workflows de Agent largos, de varios pasos y con autonomía.&lt;/li&gt;
&lt;li&gt;Investigación compleja, migración de código y planificación entre sistemas.&lt;/li&gt;
&lt;li&gt;Tareas empresariales que requieren máximo razonamiento y contexto amplio.&lt;/li&gt;
&lt;li&gt;Tareas de alto valor menos sensibles a coste y latencia.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Pero Fable 5 no siempre debe ser el modelo por defecto. Es el más caro y más lento. Salvo que la tarea necesite realmente el techo más alto, suele ser más estable empezar con Sonnet 5 u Opus 4.8.&lt;/p&gt;
&lt;p&gt;Además, Fable 5 usa adaptive thinking y está always on. Decide automáticamente cuándo razonar y cuánto. Esto ayuda en tareas complejas, pero hace que coste y tiempo de respuesta dependan más de la tarea.&lt;/p&gt;
&lt;h2 id=&#34;opus-48-opción-sólida-para-programación-compleja-y-agents-empresariales&#34;&gt;Opus 4.8: opción sólida para programación compleja y Agents empresariales
&lt;/h2&gt;&lt;p&gt;Claude Opus 4.8 está entre Fable 5 y Sonnet 5. Anthropic sugiere empezar con Opus 4.8 cuando no sepas qué modelo usar para programación Agent compleja y trabajo empresarial.&lt;/p&gt;
&lt;p&gt;Sus ventajas:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Contexto de 1M tokens.&lt;/li&gt;
&lt;li&gt;Salida máxima de 128k tokens.&lt;/li&gt;
&lt;li&gt;Buen rendimiento en programación compleja, browser Agents, computer use y workflows empresariales.&lt;/li&gt;
&lt;li&gt;Cuesta la mitad que Fable 5.&lt;/li&gt;
&lt;li&gt;Soporta adaptive thinking.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Opus 4.8 encaja como “modelo por defecto para tareas difíciles”. Refactors a nivel de repositorio, PR complejos, análisis de datos empresariales, Agents con varias herramientas y razonamiento sobre documentos largos pueden empezar aquí.&lt;/p&gt;
&lt;p&gt;Si la tarea es extremadamente difícil, sube de Opus 4.8 a Fable 5. Si el volumen es grande y el coste pesa, baja a Sonnet 5.&lt;/p&gt;
&lt;h2 id=&#34;sonnet-5-el-mejor-valor-por-defecto-diario&#34;&gt;Sonnet 5: el mejor valor por defecto diario
&lt;/h2&gt;&lt;p&gt;Claude Sonnet 5 es hoy el candidato por defecto más interesante. Su posición es best combination of speed and intelligence.&lt;/p&gt;
&lt;p&gt;Encaja con:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Programación diaria y revisión de código.&lt;/li&gt;
&lt;li&gt;Documentación, asistencia de investigación y trabajo de conocimiento.&lt;/li&gt;
&lt;li&gt;Agents de complejidad media.&lt;/li&gt;
&lt;li&gt;Automatización interna empresarial.&lt;/li&gt;
&lt;li&gt;Aplicaciones API que necesitan controlar costes sin perder demasiada calidad.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;El mayor cambio de Sonnet 5 es que muchas capacidades de Agent que antes parecían más cercanas a Opus llegan ahora al precio de Sonnet. También soporta contexto de 1M tokens y salida máxima de 128k tokens, con menor latencia que Opus.&lt;/p&gt;
&lt;p&gt;Hasta el 31 de agosto de 2026 tiene precio inicial: entrada $2 / MTok y salida $10 / MTok. Desde el 1 de septiembre de 2026 vuelve al precio estándar: entrada $3 / MTok y salida $15 / MTok. Incluso al precio estándar, sigue siendo bastante más barato que Opus 4.8.&lt;/p&gt;
&lt;p&gt;Para la mayoría de equipos, empezaría con Sonnet 5: cubrir 70% a 80% de las tareas con él y escalar lo realmente difícil a Opus 4.8 o Fable 5.&lt;/p&gt;
&lt;h2 id=&#34;haiku-45-alto-volumen-baja-latencia-bajo-coste&#34;&gt;Haiku 4.5: alto volumen, baja latencia, bajo coste
&lt;/h2&gt;&lt;p&gt;Claude Haiku 4.5 es el modelo más rápido de la línea principal Claude. Anthropic lo posiciona como fastest model with near-frontier intelligence.&lt;/p&gt;
&lt;p&gt;Encaja con:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Clasificación, extracción, resumen y conversión de formato.&lt;/li&gt;
&lt;li&gt;Procesamiento por lotes de texto corto.&lt;/li&gt;
&lt;li&gt;Soporte, tickets, moderación y escenarios de alto volumen.&lt;/li&gt;
&lt;li&gt;Productos interactivos muy sensibles a la latencia.&lt;/li&gt;
&lt;li&gt;Tareas ligeras que no necesitan contexto de 1M.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Sus límites también son claros: contexto de 200k tokens y salida máxima de 64k tokens, por debajo del 1M / 128k de Fable, Opus y Sonnet. No debería ser la primera opción para repositorios largos, análisis complejo de varios documentos o Agents largos.&lt;/p&gt;
&lt;p&gt;Pero si la tarea es “mucha, simple y rápida”, Haiku 4.5 tiene una relación coste-rendimiento directa: entrada $1 / MTok y salida $5 / MTok.&lt;/p&gt;
&lt;h2 id=&#34;mythos-5-no-es-una-opción-normal&#34;&gt;Mythos 5: no es una opción normal
&lt;/h2&gt;&lt;p&gt;Claude Mythos 5 comparte especificaciones y precio con Fable 5, pero no está disponible de forma general. La documentación de Anthropic lo marca como limited availability, solo para clientes aprobados en Project Glasswing.&lt;/p&gt;
&lt;p&gt;En otras palabras, si haces selección normal de modelos API, normalmente no necesitas incluir Mythos 5. Salvo que ya estés aprobado o consigas acceso mediante Anthropic, AWS o Google Cloud, no es un reemplazo directo de Fable 5.&lt;/p&gt;
&lt;h2 id=&#34;cómo-elegir-segmentar-por-complejidad-de-tarea&#34;&gt;Cómo elegir: segmentar por complejidad de tarea
&lt;/h2&gt;&lt;p&gt;Puedes usar este orden:&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;Probar Sonnet 5 por defecto&lt;br&gt;
Adecuado para la mayoría de programación, documentación, Agents y automatización empresarial.&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Subir a Opus 4.8 cuando la tarea sea claramente compleja&lt;br&gt;
Repositorios largos, varias herramientas, varios pasos y necesidad de ejecución estable con razonamiento fuerte.&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Probar Fable 5 cuando se necesite la máxima capacidad&lt;br&gt;
Tareas de alto valor, largas, con alto coste de fallo y menos sensibilidad al precio.&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Usar Haiku 4.5 para tareas ligeras de alto volumen&lt;br&gt;
Clasificación, extracción, resumen, soporte, procesamiento por lotes e interacción de baja latencia.&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Considerar Mythos 5 solo si tienes acceso&lt;br&gt;
No es una opción por defecto para desarrolladores comunes.&lt;/p&gt;
&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;dos-detalles-de-migración-y-coste&#34;&gt;Dos detalles de migración y coste
&lt;/h2&gt;&lt;p&gt;Primero, los modelos Claude más nuevos usan un tokenizer nuevo. La documentación de Anthropic indica que Opus 4.7 y posteriores, Fable 5, Mythos 5, Mythos Preview y Sonnet 5 pueden producir alrededor de 30% más tokens para el mismo texto. No estimes costes solo con el precio por millón de tokens.&lt;/p&gt;
&lt;p&gt;Segundo, tener contexto de 1M no significa que debas llenarlo siempre. Fable 5, Opus 4.8 y Sonnet 5 soportan 1M tokens, pero llamadas a herramientas, caché, salida y Agents multivuelta suman coste. En despliegue real conviene:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Usar prompt caching para system prompts comunes y contexto largo.&lt;/li&gt;
&lt;li&gt;Dividir documentos largos primero y usar modelos fuertes para síntesis.&lt;/li&gt;
&lt;li&gt;Enviar pasos simples a Haiku o Sonnet y escalar decisiones clave a Opus / Fable.&lt;/li&gt;
&lt;li&gt;Probar con muestras reales, no solo con benchmarks oficiales.&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;conclusión-simple&#34;&gt;Conclusión simple
&lt;/h2&gt;&lt;p&gt;La línea Claude actual queda bastante clara:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Fable 5: máxima capacidad para las tareas más difíciles y valiosas.&lt;/li&gt;
&lt;li&gt;Opus 4.8: opción fuerte para Agent coding complejo y tareas empresariales.&lt;/li&gt;
&lt;li&gt;Sonnet 5: mejor valor por defecto diario, equilibrando capacidad, velocidad y precio.&lt;/li&gt;
&lt;li&gt;Haiku 4.5: más rápido y barato para tareas ligeras a gran escala.&lt;/li&gt;
&lt;li&gt;Mythos 5: disponibilidad limitada, no una opción normal.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Si eliges modelos Claude para un producto o workflow interno, la estrategia práctica no es perseguir el modelo más alto. Divide tareas: Haiku para lotes ligeros, Sonnet 5 como capa de ejecución por defecto, Opus 4.8 para Agents complejos y programación difícil, y Fable 5 para el pequeño conjunto de tareas más difíciles, caras y valiosas.&lt;/p&gt;
&lt;h2 id=&#34;recomendación-de-routing&#34;&gt;Recomendación de routing
&lt;/h2&gt;&lt;p&gt;Al elegir modelos Claude, conviene no tener un único modelo por defecto. Es más útil diseñar reglas de routing: lotes ligeros a Haiku, programación diaria y trabajo de conocimiento a Sonnet, tareas complejas de repositorio y Agents de varios pasos a Opus, y tareas de máximo valor o dificultad a Fable.&lt;/p&gt;
&lt;p&gt;La regla puede empezar simple. Resumen, clasificación y extracción de campos prefieren Haiku. PR review, generación de documentación y cambios normales de código prefieren Sonnet. Refactors entre módulos, postmortems y planificación compleja prefieren Opus. Si Opus falla repetidamente o la tarea tiene mucho valor, usar Fable.&lt;/p&gt;
&lt;p&gt;Cada capa también necesita condiciones de salida. Salida incierta, fallos de herramientas, tests que fallan repetidamente, contexto por encima del umbral o tareas con permisos/datos de producción deberían activar confirmación humana, no automatización continua.&lt;/p&gt;
&lt;h2 id=&#34;método-para-evaluar-costes&#34;&gt;Método para evaluar costes
&lt;/h2&gt;&lt;p&gt;La tabla de precios solo sirve como aproximación. El coste real depende de longitud de contexto, tasa de acierto de caché, reintentos, longitud de salida y tiempo de retrabajo humano. Un modelo más caro que termina a la primera puede ser más barato que varios reintentos con uno barato.&lt;/p&gt;
&lt;p&gt;Para cada tipo de tarea, registra tres datos: coste medio en tokens, tiempo medio de revisión humana y proporción de fallos que requieren escalar modelo. Tras dos semanas suele quedar claro qué tareas van en Sonnet y cuáles merecen Opus o Fable.&lt;/p&gt;
&lt;p&gt;Referencias:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.anthropic.com/en/docs/about-claude/models/overview&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Claude Models overview&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.anthropic.com/en/docs/about-claude/pricing&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Claude Pricing&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
