
Anthropic acaba de presentar dos nuevas versiones de Claude, su famosa IA conversacional. La más destacada es Claude Opus 4, su modelo de codificación más avanzado hasta la fecha y experto en la resolución de problemas complejos. Por otra parte encontramos a Claude Sonnet 4, la evolución del modelo Sonnet 3.7, que presenta grandes capacidades de codificación y razonamiento, orientada a un uso cotidiano.
Ambas IAs son modelos híbridos, es decir, ofrecen la opción de activar o no sus capacidades de razonamiento avanzado, dependiendo de la complejidad de la tarea a realizar. Cabe destacar que Claude Sonnet 3.7, presentada en febrero de este año, fue el primer modelo híbrido creado por Anthropic.
Claude Opus 4 y Claude Sonnet 4 ya se encuentran disponibles en los planes Pro, Max, Team y Enterprise de Claude, mientras que el plan gratuito solo incluye Sonnet 4. Así mismo, ambas IAs se incluyen en la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud.
Así son los nuevos modelos Claude 4
Los modelos Claude 4 son los más potentes de la familia Claude hasta la fecha, estableciendo nuevos estándares en materia de codificación, razonamiento profundo e IA agéntica. Ambas IAs también se han optimizado para evitar que utilicen atajos o lagunas para completar tareas, habiéndose reducido las probabilidades de que presenten este comportamiento en un 65%.
Cabe destacar que estos modelos pueden utilizar herramientas, como la búsqueda web, mientras aplican su razonamiento extendido. Esto les permite alternar entre razonamiento y uso de herramientas para ofrecer mejores resultados y respuestas. Aunque, de momento, esta capacidad aún se encuentra en fase beta.
Tal y como explican desde Anthropic, tanto Claude Opus 4 como Claude Sonnet 4, «pueden usar herramientas en paralelo, seguir instrucciones con mayor precisión y, cuando los desarrolladores les dan acceso a archivos locales, demuestran capacidades de memoria significativamente mejoradas, extrayendo y guardando datos clave para mantener la continuidad y generar conocimiento tácito a lo largo del tiempo».
Claude Opus 4
Claude Opus 4 está diseñado para ofrecer un rendimiento sostenido en tareas complejas y de larga duración, las cuales exigen un esfuerzo concentrado y ejecución de miles de pasos. Esta IA tiene la capacidad de trabajar de forma continuada durante horas, marcando un antes y un después en la familia de modelos Claude.
Además, cuenta con una memoria notablemente superior a la de modelos anteriores. Lo cual, sumado a las habilidades mencionadas anteriormente, le han ayudado a mejorar su experiencia de juego al jugar a Pokemon. Un experimento que ya se probó con Claude 3.7 Sonnet.
Otro aspecto destacado es su potencial para impulsar flujos de trabajo de agentes de IA, logrando ampliar de forma significativa la capacidad de estos agentes. Todas estas características la convierten en una herramienta orientada a abordar tareas de elevada complejidad en diversos campos, como la programación, la investigación, la ciencia o la escritura, entre otros.
Anthropic define Claude Opus 4 como «el mejor modelo de codificación del mundo», y para justificar sus declaraciones ha compartido algunos de los resultados obtenidos por el modelo en diferentes pruebas. Por ejemplo, Claude Opus 4 logró una puntuación del 72,5% en SWE-bench y un 43,2% en Terminal-bench.
Sumado a esto, la desarrolladora también ha compartido la experiencia de compañías como Cognition, Cursor, Replit, Block o Rakuten, usando Claude Opus 4 para diversas tareas.
Claude Sonnet 4
Por su parte, Claude Sonnet 4 es menos avanzado que Claude Opus 4, pero es el modelo más puntero de la gama Sonnet. Sus capacidades de razonamiento profundo y de codificación son altamente precisas y presenta grandes mejoras en cuanto a su habilidad para responder a las instrucciones que se le dan.
De acuerdo con los datos presentados por Anthropic, Claude Sonnet 4 obtuvo un resultado del 72,7% en pruebas de codificación SWE-bench. «El modelo equilibra el rendimiento y la eficiencia para casos de uso internos y externos, con una mayor manejabilidad para un mayor control sobre las implementaciones. Si bien no iguala a Opus 4 en la mayoría de los dominios, ofrece una combinación óptima de capacidad y practicidad», explican desde la desarrolladora.
Si bien el modelo Opus 4 está pensado para casos de uso altamente profesionales, Sonnet 4 «aporta rendimiento de vanguardia a los casos de uso cotidianos como una actualización instantánea de Sonnet 3.7».
Otras novedades presentadas por Anthropic
La desarrolladora de IA ha aprovechado el lanzamiento de sus nuevos modelos para presentar otras mejoras:
- Claude Code ya está disponible para el público general: debido al feedback positivo obtenido tras su vista previa de investigación, Anthropic ha ampliado la colaboración entre desarrolladores y Claude. Ahora, Claude Code admite tareas en segundo plano mediante GitHub Actions e integraciones nativas con VS Code y JetBrains, mostrando las ediciones directamente en tus archivos para ofrecer una programación en pareja fluida.
- Nuevas capacidades de API: se han presentado cuatro nuevas capacidades en la API Anthropic con las que los desarrolladores y desarrolladoras podrán crear agentes de IA más potentes. Estas son, la herramienta de ejecución de código, la API de archivos, el conector MCP y la capacidad de almacenar en caché las indicaciones durante hasta una hora.
Foto: Anthropic
[…]
La entrada Anthropic conquista la codificación y el pensamiento profundo con Claude Opus 4 y Claude Sonnet 4 se publicó primero en M4C NET.