
OpenAI ha anunciado el lanzamiento de gpt-oss-120b y gpt-oss-20b, dos modelos de lenguaje de código abierto que marcan un avance significativo en la capacidad de razonamiento de este tipo de modelos. Disponibles bajo la flexible licencia Apache 2.0, según la compañía destacan por su rendimiento superior a otros modelos abiertos de tamaño similar en tareas de razonamiento, sus capacidades de uso de herramientas y su optimización para una implementación eficiente en hardware de consumo.
Se trata de los primeros modelos abiertos de OpenAI desde GPT 2, lanzado en 2020.
Tal y como ha explicado Sam Altman durante la presentación: «Estamos entusiasmados de poner este modelo, fruto de miles de millones de dólares en investigación, al alcance del mundo, para que la IA llegue al mayor número posible de personas. Con este lanzamiento, confiamos en que se habiliten nuevas líneas de investigación y se creen nuevos tipos de productos. (…) Nos entusiasma que el mundo pueda construir sobre una infraestructura de IA abierta, creada en Estados Unidos, basada en valores democráticos, disponible de forma gratuita y orientada al beneficio colectivo».
OpenAI asegura que, dado su tamaño, estos modelos suponen avances significativos tanto en capacidad de razonamiento como en seguridad y que su objetivo liberándolos es acelerar la investigación de vanguardia y permitir un desarrollo de IA más seguro y transparente. La idea es que estos open models también ayuden a reducir las barreras para los mercados emergentes, los sectores con recursos limitados y las organizaciones más pequeñas que quizás no disponen del presupuesto o la flexibilidad necesarios para adoptar modelos propietarios.
Cómo son los nuevos modelos abiertos de OpenAI
El modelo gpt-oss-120b casi iguala al modelo de OpenAI o4-mini en las pruebas de razonamiento centrales y puede funcionar eficientemente en una sola GPU de 80 GB. Por su parte, gpt-oss-20b ofrece resultados similares a los de OpenAI o3-mini en evaluaciones comunes y solo requiere 16 GB de memoria. Ambos modelos admiten una longitud de contexto de hasta 128k y fueron entrenados con un conjunto de datos de texto de alta calidad, centrado en STEM, programación y conocimientos generales.
Ambos modelos han sido entrenados con una combinación de aprendizaje por refuerzo y técnicas avanzadas inspiradas en los modelos internos de OpenAI. En evaluaciones, gpt-oss-120b supera a o3-mini y, en algunos casos, iguala o supera a o4-mini en áreas como la programación competitiva, la resolución de problemas generales, el uso de herramientas y la atención médica.

Por otra parte, la seguridad es un componente fundamental en el enfoque de OpenAI para estos lanzamientos. Los modelos se sometieron a una formación y evaluación de seguridad exhaustivas, y se probó una versión ajustada de forma adversa de gpt-oss-120b para evaluar los riesgos de un uso malicioso. Como parte de esta iniciativa, OpenAI también organizará un desafío de “Red Teaming” con un premio de 500.000 dólares para que la comunidad identifique nuevas vulnerabilidades de seguridad.
Los archivos para ambos modelos están disponibles para su descarga gratuita en Hugging Face.
Imagen: OpenAI
[…]
La entrada OpenAI lanza gpt-oss: dos nuevos modelos abiertos (y potentes) que ya puedes descargar en tu ordenador se publicó primero en Marketing4eCommerce.