Únase a boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo para cubrir la inteligencia artificial líder en la industria. Obtenga más información


OpenAi pone un Una nueva colección de aplicaciones y programación de herramientas Está diseñado para ayudar a los desarrolladores e instituciones a construir agentes internacionales de amnistía más eficientes. Se entrega a la cima de la misma tecnología que opera agentes de inteligencia artificial en el primer extremo (que deambula de forma independiente para desarrollar informes de investigación bien y bien organizados) y el operador (su rendimiento para controlar el índice de navegador web en función de las instrucciones y procedimientos de texto del usuario como procedimientos deportivos).

Ahora, con acceso a bloques de construcción detrás de los fuertes agentes Operai en el primer extremo, los desarrolladores pueden construir a sus competidores en el tercero o más productos y servicios para el campo de uso y el público.

Los recientes desarrollos de OpenAI en el pensamiento multimedia y los mecanismos de tratamiento y seguridad han desarrollado la base de estas capacidades, especialmente la familia de pensamiento «O» (O1 y O3).

«Es difícil exagerar la importancia de pensar modelos para permitir agentes de inteligencia artificial», dijo Olivier, jefe de la plataforma Operai, en una videollamada con VentureBeat. «Una de las mayores restricciones antes era lidiar con tareas de horizonte largas como la planificación».

Pero la compañía dice que los desarrolladores aún no han tenido las herramientas necesarias para establecerlas fácilmente en aplicaciones listas para la producción para instituciones y sus clientes hasta ahora.

El flujo de trabajo que hace lo que el usuario quiere de forma independiente

Para abordar estos obstáculos, OpenAI ofrece muchas ofertas nuevas: respuestas de API, herramientas integradas para buscar en la web y los archivos, la herramienta de uso de la computadora y las herramientas SDK de código abierto. Si bien API permite a los desarrolladores crear agentes además de su tecnología, los agentes de SDK pueden ayudarlos a vincular los agentes con otras herramientas y operaciones web, y realizar el «flujo de trabajo» que hace lo que el usuario quiere o trabaja de forma independiente.

Estas herramientas tienen como objetivo simplificar el desarrollo de agentes de inteligencia artificial al reducir la necesidad de una ingeniería amplia y amplia y la lógica de la sincronización asignada. También deben hacer una propuesta atractiva para continuar construyendo una plataforma Operai incluso frente a la creciente competencia de jugadores chinos como Manus, el Qwen, Deep Speek y Local de Alibaba, como Anthropor y Google.

Aunque estos otros jugadores proporcionan herramientas y productos de los desarrolladores, el desarrollo continuo de la plataforma de desarrolladores de Operai hace que sea difícil superar una «una tienda» para aquellos que buscan aprovechar el último progreso en inteligencia artificial de una manera limpia, fácil de usar y rápida.

En un paso, seguramente enviará la blogósfera de IA y Space Social, Operai regresa al código abierto con el lanzamiento de sus agentes SDK, un grupo de herramientas diseñado para ayudar a los desarrolladores a administrar, coordinar y mejorar el progreso de los agentes, incluso de los modelos familiares, o antes, mesa, o antes, Misam, Mesa, Mesa, Mesa, Mesa, Mesa, Mesa,

«Cliente de SDK de código abierto, lo que permite a las instituciones mezclar y combinar diferentes modelos», dijo Godement. «No queremos obligar a nadie a usar solo modelos Operai».

SDK proporciona características principales como:

  • Agentes entrenablesModelos de inteligencia artificial con instrucciones pre -definidas y acceso a herramientas.
  • INatiloueta: Mecanismos para transferir tareas entre agentes sobre la base del contexto.
  • Construido en pasamanosMedidas de seguridad para verificar la validez de las entradas y el contenido moderado.
  • Seguimiento y observaciónHerramientas para corregir errores y mejorar el rendimiento del agente.

«Con los agentes de SDK, los desarrolladores pueden seguir exactamente lo que hace el agente: qué tareas crea, qué datos recopilan y cómo nacen las respuestas», esto es lo que dijo Niconda Handa en el equipo de API en OpenAI, para VentureBeat.

Lo que ofrece la interfaz de programación de las nuevas respuestas

En el centro de esta actualización, hay una interfaz para programar las respuestas, que combina las características de completar el chat en OpenAI con las funciones de usar herramientas en asistentes de API, que se descuidarán a mediados de 2026, Según la compañía.

Esta integración permite a los desarrolladores aprovechar múltiples herramientas garantizadas dentro de una llamada API, facilitando la creación de aplicaciones que requieren interacciones complejas de múltiples pasos.

API inicialmente admite tres herramientas compactas:

  • Buscar en InternetProporciona respuestas en el tiempo real trayendo información de la web.
  • Busque el archivoInformación relacionada de grandes depósitos de documentos utilizando datos descriptivos de filtrado y procesamiento de la consulta mejorada.
  • Herramienta de uso de la computadoraLos agentes de IA habilitan procedimientos en una computadora, como navegación, entrada de datos e interfaces móviles.

Handa dijo: «A través de las respuestas de la interfaz de programación de aplicaciones, los desarrolladores obtienen más claridad en lo que hace el modelo: cuáles son las herramientas que llama y por qué los invita a ellos y a las decisiones que toma antes y después de estas llamadas».

A través de estas capacidades, OpenAI imagina las respuestas de la API que funcionan como base para las aplicaciones de agentes, eliminando la necesidad de múltiples integraciones externas. API ahora está disponible para todos los desarrolladores, con el uso de tasas de uso y herramientas estándar en OpenAI.

Además, Openai señala que, aunque la API para completar el chat continuará recibiendo actualizaciones, las respuestas de la API son superset. Los desarrolladores que necesitan herramientas integradas o interacciones modelo múltiples deben usar API para nuevas respuestas de integración.

OpenAI también recopila herramientas de búsqueda web, busca archivos y usa la computadora directamente a través de la interfaz de programación de la interfaz. Estas herramientas permiten que los agentes de inteligencia artificial accedan a la información real, recuperen el contexto de los documentos e interactúen con entornos digitales de manera más efectiva.

La investigación web proporciona a los desarrolladores en tiempo real con categorías

La nueva herramienta de búsqueda web permite a los desarrolladores integrar las capacidades de búsqueda de tiempo reales en sus aplicaciones, haciéndola útil para asistentes de investigación, guías de compras y herramientas de ensamblaje de contenido. Proporciona fuentes para sus respuestas, asegurando que los usuarios puedan verificar la precisión de la información.

Handa dijo: «Lo primero que lanzamos son las herramientas compactas, como la web de búsqueda, que permite que los modelos accedan a la información en el tiempo real», dijo Handa. «Es la misma herramienta que ejecuta una búsqueda en ChatGPT, y ahora la estamos llevando a la interfaz de programación de aplicaciones».

OpenAI también confirmó que los resultados de búsqueda en la web en la interfaz de programación de aplicaciones incluirán mártires claros, lo que permitirá a los usuarios hacer clic en las fuentes originales. Los desarrolladores pueden aplicar la búsqueda web como parte de un sistema de recuperación más amplio que incluye fuentes de datos de propiedades.

Búsqueda de archivos: recupere el documento inteligente en nubes especiales

Utilizando una herramienta de búsqueda de archivos, los agentes de inteligencia artificial pueden recuperar rápidamente la información de grandes colecciones de documentos. Esta herramienta admite múltiples formatos de archivo e incluye características como mejorar la consulta, filtrar datos descriptivos y una clasificación dedicada para resultados más precisos.

«La tercera herramienta que lanzamos es buscar archivos, lo que facilita a los desarrolladores tomar todos sus datos, almacenarlos en nuestro sistema y extraer la información correcta con alta precisión», explicó Handa.

El precio de la herramienta de búsqueda de archivos es de $ 2.50 por mil consultas, con una tarifa de almacenamiento de $ 0.10 por GB por día (el primer GB gratis).

Las lecciones ahora pueden acceder al uso de la computadora, OpenAI Technical Operator

La herramienta de uso de la computadora expande las capacidades del agente más allá de las tareas simples en función del texto al permitir interactuar con las fachadas de la computadora.

Compatible con el modelo OpenAI que funciona para usar la computadora (CUA), esta herramienta traduce los procedimientos creados desde la inteligencia artificial en órdenes ejecutables, lo que permite automatizar tareas como la entrada de datos y la movilidad web.

«También lanzamos la herramienta de uso de una computadora, permitiendo que los modelos interactúen con las interfaces gráficas del usuario cuando no hay interfaz de programación de solicitantes para una tarea», notó Handa.

La herramienta de uso de la computadora está actualmente disponible como una inspección de investigación para los desarrolladores elegidos en 3-5 niveles de uso. El precio se determina en $ 3 por millón de símbolos de entrada y $ 12 por millón de símbolos de salida.

¿Qué significa para los líderes de las instituciones?

Para los líderes del equipo de TI, los CTO y los gerentes de nivel medio que buscan mejorar el flujo de trabajo, las nuevas herramientas de OpenAI proporcionan un camino claro hacia la automatización y la expansión de las operaciones de IA sin la necesidad de desarrollar un amplio asignado.

Las capacidades de la investigación en la web y los archivos permiten a las instituciones fusionar la recuperación de la actuación en nombre de sus sistemas actuales, mientras que la herramienta de uso de la computadora permite reacciones mecánicas con aplicaciones antiguas que carecen del acceso de la interfaz de programación de aplicaciones.

SDK de los agentes de código abierto de SDK permite a las instituciones coordinar el flujo de trabajo de que la inteligencia artificial se mueve a través de los equipos, facilitando la publicación de agentes que mejoran la eficiencia en áreas como la atención al cliente, el procesamiento documental y la investigación de mercado.

A través de la seguridad de la institución y una nota en estas herramientas, los tomadores de decisiones pueden adoptar soluciones de inteligencia artificial con más transparencia y control, garantizar el cumplimiento generalizado y el monitoreo del rendimiento.

¿Qué sigue?

Operai cree que estas nuevas versiones son el primer paso para construir una plataforma integral para agentes de inteligencia artificial. La compañía planea ofrecer herramientas e integración adicionales en los próximos meses para ayudar a los desarrolladores a publicar, evaluar aplicaciones y ampliar su alcance de manera más efectiva.

«Creemos que los próximos meses serán cruciales para publicar más y más agentes a gran escala», dijo Godment. «Ya hicimos esto con los agentes de primera parte como Deep Research, pero OpenAI no construirá todos los agentes por esta razón por la que tenemos una plataforma de desarrollador».

Operai también ha declarado que continuará mejorando las características de seguridad de los agentes, incluidas las garantías de inyección rápida y el acceso a datos no autorizados.

Los desarrolladores interesados ​​en construir con nuevas herramientas pueden explorar el estadio Operai y API para comenzar hoy.


Enlace de origen