
OpenAI fue de los primeros gigantes en presentar su propio agente de IA de navegación web, Operator, y ahora que el resto de tecnológicas están desplegando los suyos, la desarrolladora ha vuelto a tomar la delantera con su último gran lanzamiento: ChatGPT agent.
Este se trata de un sistema de agencia unificado que combina las capacidades de Operator y el razonamiento profundo de Deep Research. Lo que traducido vendría a significar: un agente de IA conversacional mucho más inteligente capaz navegar de forma autónoma por la web para realizar tareas por ti, ejecutar código, conectarse a tus aplicaciones y crear presentaciones y hojas de cálculo.
ChatGPT can now do work for you using its own computer.
Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ
— OpenAI (@OpenAI) July 17, 2025
ChatGPT agent ya se encuentra disponible para todos los usuarios y usuarias del plan Pro de ChatGPT. OpenAI ha confirmado que esta capacidad llegará a los planes Plus y Team a partir del lunes 21 de julio, mientras que los planes Enterprise y Edu deberán esperar algunas semanas.
ChatGPT agent, la suma de grandes fuerzas
OpenAI presentó Operator a finales de enero de 2025 y Deep Research a principios de febrero. Estas dos herramientas eran muy potentes, pero la desarrolladora acabó concluyendo que, si se combinasen, lo serían todavía más. Así es como nació ChatGPT agent.
«Operator no podía profundizar en el análisis ni generar informes detallados, y Deep Research no podía interactuar con sitios web para refinar resultados ni acceder a contenido que requiriera autenticación del usuario», explica OpenAI en su blog.
De este modo, ChatGPT agent se basa en el poder de tres de las tecnologías más relevantes de OpenAI. Por una parte está Operator, que le permite interactuar con sitios web; por otra Deep Research, que dota al agente de la capacidad de ejecutar investigaciones profundas, analizando y sintetizando información compleja; y, finalmente, el propio ChatGPT, que aporta la fluidez conversacional en la interacción.
El resultado es un agente de IA que puede navegar por la web, razonando cuáles son los mejores pasos a seguir para realizar la tarea que le encomiendes. Gracias a ello, ChatGPT agent puede desde consultar tu calendario e informarte sobre tus próximas reuniones, hasta investigar una receta y comprar los ingredientes necesarios, o hacer un benchmarking sobre tus competidores directos y plasmarlo en una presentación.
«ChatGPT lleva a cabo estas tareas utilizando su propia computadora virtual, cambiando fluidamente entre el razonamiento y la acción para manejar flujos de trabajo complejos de principio a fin, todo basado en sus instrucciones», afirma OpenAI.
Por supuesto, esto no significa que vayas a dejar a ChatGPT agent al mando de la web, tus aplicaciones y tus datos. Cada vez que el agente tenga que realizar acciones sensibles, como iniciar sesión, te solicitará permiso primero. Además, siempre tendrás el control absoluto, pudiendo interrumpir la actividad del agente.
Cómo activar ChatGPT agent
Para utilizar ChatGPT agent debes seleccionar el «modo agente» en el menú desplegable de herramientas ubicado en en cajón de texto donde introduces los prompts. Puedes hacerlo en cualquier momento de tu conversación con ChatGPT, tan solo tienes que describir la tarea que quieras que realice.
A medida que el agente trabaja, aparecerá una narración en pantalla en la que se indiquen los pasos que está siguiendo. Puedes interrumpirlo o pausar su actividad cuando quieras, tomando tú el control del navegador. «El agente ChatGPT está diseñado para flujos de trabajo iterativos y colaborativos, y es mucho más interactivo y flexible que los modelos anteriores. Asimismo, ChatGPT puede solicitarte información adicional de forma proactiva cuando sea necesario para garantizar que la tarea se mantenga alineada con tus objetivos».
Durante su actividad, ChatGPT agent puede aprovechar los conectores de ChatGPT para acceder a aplicaciones como Gmail o Github. También podrá iniciar sesión en cualquier sitio web desde su propio navegador. «Al ofrecer a ChatGPT estas diferentes vías para acceder e interactuar con la información web, puede elegir la ruta óptima para realizar tareas de la forma más eficiente.
Por ejemplo, puede recopilar información sobre tu calendario mediante una API, analizar grandes cantidades de texto de forma eficiente mediante el navegador basado en texto y, al mismo tiempo, interactuar visualmente con sitios web diseñados principalmente para usuarios».
Si tienes instalada la app de ChatGPT, una vez que el agente haya finalizado la tarea, recibirás una notificación.
Una mayor capa de seguridad para un producto más complejo
Este producto presenta también nuevos riesgos derivados de sus sorprendentes capacidades. El hecho de que pueda realizar tareas por ti en la web, trabajar con tus datos o iniciar sesión en plataformas implica una serie de peligros potenciales que OpenAI se ha esforzado por mitigar.
«Hemos reforzado los controles robustos de la vista previa de investigación de Operator y hemos añadido protecciones para desafíos como el manejo de información confidencial en la web en vivo, un mayor alcance de usuarios y el acceso (limitado) a la red de terminales. Si bien estas mitigaciones reducen significativamente el riesgo, las herramientas ampliadas y el mayor alcance de usuarios del agente de ChatGPT implican un perfil de riesgo general más alto», explican desde la compañía.
Adelantándose a posibles amenazad, OpenAI ha implementado mitigaciones en el modelo que lo capacitan para solicitar la confirmación explícita del usuario o usuaria para acciones sensibles (inicios de sesión, compras…), pedir una supervisión activa en actividades como enviar mails, y rechazar tareas consideradas de alto riesgo (transferencias bancarias, por ejemplo).
Sumado a esto, también se han añadido los siguientes controles adicionales:
- Controles de privacidad: puedes borrar todos los datos de navegación y cerrar sesión en todos los sitios web con un solo clic en la configuración de ChatGPT.
- Modo seguro de control del navegador: si interactúas con la web mediante el navegador de ChatGPT (modo de control), tus datos se mantienen privados y no se almacenan en ninguna parte.
Un futuro en el que los agentes de IA realizarán cada vez más tareas por nosotros
El anuncio de ChatGPT agent llegó tan solo un día después de que Google lanzase su nueva función en la Búsqueda que permite que un agente de IA haga llamadas telefónicas a negocios locales por ti para obtener información o realizar reservas.
Queda claro que los gigantes tecnológicos quieren avanzar hacia un futuro en el que sus herramientas sean un puente directo hacia los resultados, librándonos del proceso previo. ¿Qué quieres reservar en un restaurante? Google llama y realiza la reserva por ti, tú solo tienes que ir y disfrutar de la comida, ¿qué necesitas organizar un viaje a Roma y comprar billetes de avión y reservar un hotel? Un agente de IA de navegación web investigará combinaciones de vuelos y ubicaciones de hoteles.
Por supuesto, este es el objetivo, pero antes de alcanzarlo hay que pasar por una fase de adopción, en la que la gente no solo se acostumbre a este nuevo paradigma, sino que confíe en delegar estas tareas en la IA. En esto también influirá el nivel de desarrollo por parte de las compañías y las garantías que ofrezcan.
Lo que queda claro es que en medio año hemos sido testigos de una evolución impresionante en cuanto a agentes de IA de navegación web se refiere, por lo que el futuro plantea muchas posibilidades. Además de Operator, también hemos conocido a Amazon Nova Act, una IA presentada en abril que permite crear agentes capaces de realizar acciones dentro de un navegador web.
Otro ejemplo es Project Mariner de Google, un agente de IA para navegación web capaz de observar la información del navegador, interpretar tus peticiones, razonar, establecer un plan y llevarlo a cabo. Este se presentó como prototipo de investigación en diciembre de 2024, pero no fue hasta mayo de 2025 que se activó oficialmente en Estados Unidos para las personas suscritas al plan AI Ultra de Google.
Foto: OpenAI
[…]
La entrada El nuevo ChatGPT agent de OpenAI lo hará todo por ti: combina navegación web autónoma y razonamiento profundo se publicó primero en Marketing4eCommerce.