
Anthropic no baja el ritmo. La desarrolladora acaba de presentar Claude Sonnet 4.6, la nueva versión de su modelo de IA que equilibra rendimiento, rapidez y rentabilidad para un uso en tareas cotidianas. Este anuncio se produce menos de dos semanas después de que Anthropic lanzase Claude Opus 4.6, su IA más potente orientada a la resolución de problemas complejos que exijan un nivel superior de razonamiento.
Sonnet 4.6 ya se encuentra disponible en todos los planes de Claude, incluyendo el plan Gratis. Así mismo, se ha activado como modelo predeterminado en claude.ai y Claude Cowork. Por último, también es accesible en las principales plataformas en la nube asociadas con Anthropic y en su API con un precio que parte de $3/$15 por millón de tokens (el mismo que su predecesora, la versión Sonnet 4.5).
Sumado a esto, la tecnológica ha anunciado que al integrar Sonnet 4.6 en el plan Gratis, ha liberado el acceso a funciones avanzadas como la creación de archivos, conectores, habilidades y compactación, que antes estaban limitadas.
Un repaso por las ramas familiares de Anthropic
Antes de comenzar a explicar las mejoras que integra Sonnet 4.6 con respecto a sus antecesores, vamos a realizar un breve repaso por las familias de modelos de Claude. Y es que, entendemos que leer sin cesar que “este nuevo modelo tiene mejores capacidades de razonamiento”, de todas las IAs de una empresa, pueda resultar confuso.
Podríamos decir que Anthropic tiene tres ramas familiares: Haiku, Sonnet y Opus. Cada una de ellas está pensada para cubrir necesidades diferentes, aportando recursos y capacidades distintas, pero adecuadas según cual sea el contexto.
- Opus: el modelo con mayor capacidad de razonamiento profundo y comprensión de matices de Anthropic. Destaca por su habilidad para manejar tareas de investigación abierta, análisis estratégico de datos y escritura creativa altamente sofisticada. Su mejor caso de uso es la resolución de problemas científicos o financieros complejos donde la precisión del razonamiento es más crítica que la velocidad de respuesta.
- Sonnet: diseñado para ser significativamente más rápido que Opus. Su mejor caso de uso es el despliegue de herramientas empresariales de uso diario, generación de contenido de alta calidad y asistencia técnica en desarrollo de software.
- Haiku: la opción más ligera y económica, optimizada para ofrecer respuestas casi instantáneas y procesar volúmenes masivos de información con una latencia mínima. Su mejor caso de uso es la automatización de tareas repetitivas a gran escala, como la clasificación de correos electrónicos, la moderación de contenido, el etiquetado de datos o la extracción de información específica de documentos sencillos.
Ahora sí, qué ofrece Sonnet 4.6
Anthropic busca posicionar Sonnet 4.6 como el nuevo estándar para el trabajo diario, destacando sus (sí, voy a decirlo) capacidades de razonamiento mejoradas, su habilidad superior en codificación, en “computer use“, en planificación de agentes y en la ejecución de tareas que implican conocimiento y creatividad.
La desarrolladora ha señalado que Sonnet 4.6 ha logrado alcanzar (y a veces superar) la inteligencia de la gama Opus, pero manteniendo la agilidad y el coste reducido de la familia Sonnet. Entre sus mejoras más potentes destaca una ventana de contexto de 1 millón de tokens (en fase beta), lo que permite a la IA “leer” y procesar de una sola vez libros enteros, bases de código masivas o extensos informes de marketing sin perder el hilo.
Otra de las grandes actualizaciones de Claude Sonnet 4.6 es su capacidad mejorada de “computer use“, una función que permite a la IA manejar software tal como lo harías tú: moviendo el cursor, haciendo clic y escribiendo en un teclado virtual. A diferencia de otras integraciones que requieren conexiones técnicas complejas (APIs), este modelo simplemente “mira” la pantalla y actúa sobre aplicaciones reales como Chrome, VS Code o LibreOffice.
De acuerdo con Anthropic, en pruebas de rendimiento como OSWorld, Sonnet 4.6 demuestra una capacidad casi humana para navegar por hojas de cálculo complejas o completar formularios web de varios pasos saltando entre pestañas del navegador. Aunque Anthropic admite que su IA aún no supera a los usuarios más expertos, la mejora en precisión y seguridad es drástica.
- Podría interesarte: Este nuevo estudio de Harvard concluye que la IA no reduce el trabajo, lo intensifica (constantemente)
Evaluaciones de seguridad
Así mismo, la capacidad de “computer use” trae consigo posibles riesgos de seguridad como los ataques de prompt injection (cuando un ciberdelincuente manipula un sistema de IA generativa introduciendo prompts maliciosos como si fuesen instrucciones legítimas).
Conscientes de ello, desde Anthropic han tomado medidas para reducir este riesgo: «hemos estado trabajando para mejorar la resistencia de nuestros modelos al prompt injection. Nuestras evaluaciones de seguridad muestran que Sonnet 4.6 representa una mejora significativa en comparación con su predecesor, Sonnet 4.5, y tiene un rendimiento similar al de Opus 4.6».
Por otra parte, las investigaciones de seguridad también han concluido que Sonnet 4.6 es menos propenso a la “pereza” en tareas largas y posee un «carácter cálido, honesto, prosocial y, en ocasiones, divertido, con comportamientos de seguridad muy sólidos».
Comparativa con otros grandes modelos
Junto a su comunicado de lanzamiento, Anthropic incluye una comparativa del rendimiento de Sonnet 4.6 con respecto a otros potentes modelos, tanto suyos como de competidores. De acuerdo con estos datos, Sonnet 4.6 ha logrado ofrecer una inteligencia que los usuarios prefieren el 59% de las veces frente a Opus 4.5, destacando por ser menos propenso a la “pereza” y a la sobreingeniería. En el ámbito del desarrollo, los programadores lo eligen el 70% de las veces sobre su predecesor (Sonnet 4.5) gracias a su capacidad para consolidar lógica en lugar de duplicarla.

Al medirlo con sus rivales directos, la batalla es de especialización. Claude Sonnet 4.6 obtiene los mejores resultados de todas las IAs en pruebas de análisis financiero agéntico (Finance Agent v1.1: 63,3%) y en tareas de oficina (GDPval-AA Elo: 1.633). Mientras que GPT-5.2 lidera en razonamiento de nivel graduado (GPQA Diamond: 93.2%), comprensión visual (MMMU-Pro: 80,4% con herramientas) y programación en terminal (Terminal-Bench 2.0: 64.7%), Sonnet 4.6 se impone con autoridad en el uso autónomo del ordenador (72.5% vs 38.2%) y en tareas de oficina (1633 Elo vs 1462).
Por su parte, Gemini 3 Pro destaca en comprensión multilingüe (MMMLU: 91.8%) y en comprensión visual sin herramientas (MMMU-Pro: 81% sin herramientas). Queda claro que estamos lejos de encontrarnos ante un único gran modelo que sea capaz de superar al resto en la amplia mayoría de campos, y que la batalla de la IA continúa muy reñida.
Foto: Anthropic
[…]
La entrada Así es Claude Sonnet 4.6: la IA de uso diario más potente de Anthropic, que competirá con GPT y Gemini se publicó primero en Marketing4eCommerce.