OpenAI lanza ChatGPT Agent, una IA que ya no solo responde, sino que actúa por ti

La compañía ha especificado que el agente solicita permiso antes de realizar cualquier acción importante, y los usuarios pueden interrumpir la tarea y tomar el control del navegador en cualquier momento

Guardar
El funcionamiento de ChatGPT Agent
El funcionamiento de ChatGPT Agent se apoya en un navegador visual integrado. (Composición Infobae: Jim Clyde Monge / ChatGPT)

La inteligencia artificial da un nuevo paso con la llegada de ChatGPT Agent, la herramienta autónoma de OpenAI que promete transformar la manera en que las personas interactúan con la web y gestionan tareas cotidianas y profesionales. El lanzamiento, que ha comenzado en el Reino Unido y prevé su expansión a España, marca el inicio de una nueva etapa en la automatización inteligente, según informó OpenAI en un comunicado publicado en su sitio web.

ChatGPT Agent se presenta como un sistema capaz de navegar por internet, razonar y ejecutar acciones de forma independiente, abriendo la puerta a una productividad sin precedentes para los usuarios de los planes Pro, Plus y Team.

El asistente de inteligencia artificial representa la evolución de las herramientas desarrolladas previamente por OpenAI, al combinar en un solo sistema las funciones de Operator, el razonamiento web en múltiples pasos y el modelo conversacional de ChatGPT.

Hasta ahora, Operator permitía interactuar con sitios web mediante acciones como desplazarse, hacer clic o escribir, mientras que el razonamiento web destacaba en el análisis y la síntesis de información. Sin embargo, estas capacidades operaban de manera separada y no podían integrarse en una sola experiencia.

En el proceso de navegación,
En el proceso de navegación, el agente filtra resultados de manera inteligente y consulta al usuario cuando es necesario iniciar sesión de forma segura en algún sitio web. (ChatGPT)

Funcionamiento técnico de ChatGPT Agent

El funcionamiento de ChatGPT Agent se apoya en un navegador visual integrado, que interactúa con la web a través de una interfaz gráfica de usuario. Además, incorpora un navegador basado en texto para consultas que requieren razonamiento y acceso directo a la API, lo que amplía su rango de acción y flexibilidad. Según detalló OpenAI, todas las acciones se ejecutan “desde el propio ordenador de ChatGPT”, y el contexto relevante se mantiene a lo largo de la tarea, sin importar la combinación de herramientas empleada.

Para lograr una mayor eficiencia, velocidad y precisión, ChatGPT Agent utiliza un modelo desarrollado específicamente para estas funciones. Este modelo aprende durante la ejecución de las tareas y optimiza su enfoque, seleccionando las herramientas más eficaces para cada paso. Así, el sistema puede adaptarse a diferentes tipos de solicitudes y mejorar su rendimiento con el uso continuado.

En el proceso de navegación, el agente filtra resultados de manera inteligente y consulta al usuario cuando es necesario iniciar sesión de forma segura en algún sitio web. Además, tiene la capacidad de ejecutar código y generar documentos “pulidos y editables”, como presentaciones y hojas de cálculo que resumen las conclusiones obtenidas durante la tarea.

OpenAI ha especificado que el
OpenAI ha especificado que el agente solicita permiso antes de realizar cualquier acción importante. (ChatGPT)

Ejemplos prácticos para aprovechar ChatGPT Agent

La versatilidad de ChatGPT Agent se refleja en la variedad de tareas que puede asumir de manera autónoma. Entre los ejemplos proporcionados por OpenAI, se encuentra la posibilidad de consultar el calendario del usuario y preparar un resumen de las próximas reuniones con clientes, lo que facilita la organización y el seguimiento de compromisos profesionales.

Otra aplicación destacada es el análisis de empresas competidoras, donde el agente recopila información relevante y elabora una presentación con los datos obtenidos, agilizando procesos de investigación y comunicación en entornos laborales. Además, ChatGPT Agent puede planificar y comprar los ingredientes necesarios para preparar un desayuno, gestionando tanto la búsqueda de recetas como la adquisición de productos en línea.

ChatGPT Agent y sus medidas de seguridad y control

La autonomía de ChatGPT Agent va acompañada de un conjunto de medidas de seguridad diseñadas para proteger al usuario y prevenir usos indebidos. OpenAI ha especificado que el agente solicita permiso antes de realizar cualquier acción importante, y los usuarios pueden interrumpir la tarea y tomar el control del navegador en cualquier momento. Esta función garantiza que el usuario mantenga el control sobre las acciones ejecutadas por el sistema.

El acceso a ChatGPT Agent
El acceso a ChatGPT Agent se realiza mediante la selección del “modo agente” en el selector de herramientas de ChatGPT. (ChatGPT)

Para ciertas tareas fundamentales, el agente ofrece un modo observación, en el que el usuario supervisa activamente cada paso y debe aprobarlo antes de que se lleve a cabo. Además, ChatGPT Agent rechaza tareas de alto riesgo, como transacciones financieras o interacciones legales delicadas, y se niega sistemáticamente a ejecutar solicitudes dañinas o ilegales.

La compañía también ha implementado mecanismos para identificar intentos de manipulación por parte de terceros, como instrucciones maliciosas que busquen alterar el comportamiento del agente.

El acceso a ChatGPT Agent se realiza mediante la selección del “modo agente” en el selector de herramientas de ChatGPT. Por el momento, la herramienta ha comenzado a desplegarse en el Reino Unido y está disponible para los usuarios de los planes Pro, Plus y Team. OpenAI ha confirmado que trabaja en la extensión de su lanzamiento a España, aunque no ha especificado una fecha concreta para su llegada.