Claude Sonnet 5: más capacidad de Agent con una barrera de uso menor

Anthropic lanzó Claude Sonnet 5 el 30 de junio de 2026. Es la nueva generación de la línea Sonnet. Su posición no es simplemente buscar la máxima capacidad, sino llevar mejores capacidades de Agent, programación y uso de herramientas a una franja de precio más práctica para el uso diario.

Según Anthropic, Sonnet 5 supera claramente a Sonnet 4.6 en razonamiento, uso de herramientas, programación y trabajo de conocimiento. Algunas tareas se acercan a Opus 4.8, pero con un precio más bajo. Para desarrolladores, el cambio más directo es que Claude Code, Claude Platform y Claude API pueden usar claude-sonnet-5.

Disponibilidad y precios

Claude Sonnet 5 está disponible en todos los planes de Claude:

Los usuarios Free y Pro usan Sonnet 5 por defecto.
Los usuarios Max, Team y Enterprise pueden usar Sonnet 5.
Claude Code y Claude Platform ya lo admiten.
Los desarrolladores pueden usar el nombre de modelo claude-sonnet-5 en Claude API.

El precio de API tiene una fase inicial más baja antes de pasar al precio estándar:

Período	Precio de entrada	Precio de salida
Antes del 31 de agosto de 2026	2 dólares / millón de tokens	10 dólares / millón de tokens
Precio estándar posterior	3 dólares / millón de tokens	15 dólares / millón de tokens

Anthropic también señala que Sonnet 5 usa un tokenizer actualizado. La misma entrada puede convertirse en más tokens con el nuevo tokenizer, aproximadamente entre 1,0 y 1,35 veces según el tipo de contenido. Uno de los objetivos del precio inicial es suavizar el coste de migrar desde Sonnet 4.6.

Mejora principal: Sonnet se parece más a una capa de ejecución

La palabra clave de Sonnet 5 es Agent. Anthropic destaca que puede planificar, usar herramientas como navegador y terminal, y continuar tareas más largas.

Para desarrolladores y empresas, esto tiene varias implicaciones:

Las tareas de programación no se quedan en completar fragmentos; encajan mejor con cambios de varios pasos, depuración y validación.
El uso de herramientas es más estable, útil para navegador, terminal, aplicaciones empresariales y flujos internos.
Con effort medio, Sonnet 5 ofrece mejor relación coste-capacidad; con effort más alto, algunas tareas se acercan a Opus 4.8.
Para usuarios de Claude Code, se parece más a un modelo de ejecución diario que a un modelo caro reservado para pocas tareas difíciles.

Anthropic cita comentarios de socios tempranos en bases de código complejas, proyectos brownfield, procesos de seguros, investigación legal y análisis de datos. La idea común es que Sonnet 5 puede seguir una tarea de forma más completa, en vez de detenerse a mitad o limitarse a aconsejar.

Evaluación de seguridad: más seguro, pero no sin riesgo

La evaluación de seguridad de Anthropic tiene dos lados.

Por un lado, Sonnet 5 es más estable que Sonnet 4.6. Mejora en seguridad de Agent, rechazo de solicitudes maliciosas, resistencia a prompt injection, reducción de alucinaciones y menor complacencia. Las auditorías automáticas de Anthropic también muestran una tasa menor de comportamientos indeseados que Sonnet 4.6.

Por otro lado, no es más estable que modelos más fuertes como Opus 4.8 o Mythos Preview. En evaluaciones de la misma categoría, Sonnet 5 todavía muestra una tasa de comportamiento indeseado superior a esos dos modelos.

En ciberseguridad, Anthropic dice que no entrenó Sonnet 5 intencionadamente con tareas de ciberseguridad. Puede hacer algunas tareas comunes y benignas, pero en evaluaciones de capacidades potencialmente peligrosas queda claramente por debajo de Opus 4.8 y Mythos 5. En la evaluación de exploits de Firefox mencionada por Anthropic, Sonnet 5 no logró generar un exploit completo y usable, aunque tuvo más éxitos parciales que Sonnet 4.6.

Por eso, Sonnet 5 activa protecciones de ciberseguridad por defecto. Estas protecciones detectan y bloquean en tiempo real usos peligrosos de ciberseguridad. Su intensidad es similar a Claude Opus 4.7 y Opus 4.8, pero menor que las protecciones más estrictas de Fable 5.

Qué revisar al migrar

Si ya usas Claude API o Claude Code, Sonnet 5 puede verse como un candidato directo para actualizar desde Sonnet 4.6. Aun así, conviene revisar tres puntos.

Primero, el nombre del modelo debe cambiar a:

1

claude-sonnet-5

Segundo, el coste no se calcula solo con el precio unitario. El precio estándar de Sonnet 5 es mayor que el precio inicial, y el cambio de tokenizer puede hacer que algunas entradas consuman más tokens. Para contextos largos, análisis de logs y escaneo de repositorios, conviene recalcular con solicitudes reales.

Tercero, el ajuste de effort afecta la relación coste-capacidad. Sonnet 5 puede cubrir un rango más amplio de coste y capacidad con distintos niveles de effort. Programación diaria, documentación y tareas ligeras de Agent no siempre necesitan el effort máximo; es más razonable subirlo cuando la tarea exige planificación larga y colaboración con varias herramientas.

Relación con Opus 4.8

Sonnet 5 no reemplaza a Opus 4.8. Es más preciso decir que una parte de la capacidad de Agent que antes se sentía más cercana a Opus baja ahora al nivel Sonnet.

Si una tarea necesita el techo más alto, especialmente investigación compleja, razonamiento profundo, cadenas largas de Agent y programación difícil, Opus 4.8 sigue teniendo sitio. Si la tarea prioriza volumen diario, precio y ejecución estable, Sonnet 5 encaja mejor como modelo por defecto.

Ese es el punto más interesante del lanzamiento. Sonnet ya no es solo el modelo medio “rápido y barato”; empieza a asumir mucho trabajo real de ejecución. Para empresas y desarrolladores, la selección de modelo puede pasar de “Opus por defecto y bajar si es caro” a “Sonnet 5 por defecto y subir a Opus cuando haga falta”.

Resumen

Claude Sonnet 5 muestra que Anthropic está moviendo capacidades de Agent desde los modelos insignia hacia capas más usadas. Su valor principal no es un benchmark aislado, sino una ejecución de tareas más completa, un precio aceptable y una disponibilidad por defecto más amplia.

A corto plazo, merece la pena observar tres escenarios:

Programación de varios pasos, depuración y cambios en bases de código con Claude Code.
Agents internos, análisis de datos, documentación y automatización de workflows empresariales.
Aplicaciones API que necesitan equilibrar coste y capacidad con más detalle.

Si ya usas Sonnet 4.6, Sonnet 5 merece una prueba. Si dependes sobre todo de Opus 4.8, puedes mover algunas tareas de complejidad media a Sonnet 5 y observar costes y tasa de finalización.

Guía práctica de migración: probar por niveles de tarea

Si tu equipo ya usa Sonnet 4.6, no conviene cambiar todas las llamadas a Sonnet 5 el primer día. Una forma más estable es dividir las tareas por dificultad y riesgo: preguntas ligeras, resúmenes, explicación de código, cambios de un archivo, refactors multiarchivo, Agents largos y automatización con herramientas. Prepara muestras para cada grupo.

En la primera ronda, mira tasa de finalización y retrabajo, no solo si la respuesta parece más inteligente. En Claude Code, por ejemplo, compara si omite menos pruebas, entiende mejor la estructura del repositorio y pregunta cuando no está seguro.

En la segunda ronda, mide coste. El tokenizer de Sonnet 5 puede producir más tokens con la misma entrada, así que usa logs reales y no solo el precio publicado. Contextos largos, análisis documental y tareas sobre repositorios son especialmente sensibles a este cambio.

Solo en la tercera ronda decide el modelo por defecto. Mi sugerencia: poner Sonnet 5 como candidato para tareas diarias de Agent y programación, dejar Opus/Fable para reintentos o tareas de alto valor, y reservar Haiku para procesos ligeros por lotes. Así la migración es más suave y se ve mejor dónde está la mejora real.

Métricas a observar

Al probar Sonnet 5, registra cuatro métricas: finalización en el primer intento, tiempo de edición humana, tasa de fallo en llamadas a herramientas y coste por tarea. Los benchmarks pueden engañar porque las tareas reales mezclan código, documentos, entornos, permisos y memoria de contexto.

Si Sonnet 5 es más estable que el modelo anterior en un tipo de tarea, migra primero ese tipo. Si solo responde más largo pero edita con más riesgo, conviene mantener aprobación humana o usar prompts más conservadores.

Original: Introducing Claude Sonnet 5