OpenAI最近發布了一套新開發人員工具,旨在使創建可以自主執行複雜任務的AI代理更容易。該更新於上周宣布,引入了響應API,開源代理SDK以及用於Web搜索,文件搜索和計算機控制的內置工具 – 所有這些都旨在簡化AI Systems如何與現實世界中的信息和應用程序進行交互。
Openai將這些代理描述為“代表用戶獨立完成任務的系統”,這意味著他們可以在人類的指導下執行多步驟過程(例如研究主題或更新數據庫)。該公司的目標是降低開發人員和企業部署強大的AI驅動助手的障礙,從而擴大對高級AI功能的可訪問性。
響應API:簡化代理交互
Openai宣布的核心是新的回复API,它是建造AI代理的統一界面。該API將OpenAI聊天完成API的對話能力與以前的助手API的工具功能相結合。實際上,這意味著單個API調用現在可以處理複雜的多步驟任務,可能涉及調用各種工具或知識源。
Openai表示,通過減少自定義代碼和及時修補的需求來簡化API的響應API來簡化代理的開發。 “響應API是為希望輕鬆將OpenAI模型和內置工具組合到其應用中的開發人員而設計的,而沒有集成多個API或外部供應商的複雜性” 該公司在其公告博客文章中解釋了。以前,開發人員經常不得不編排多個API呼叫,並精心製作的提示使AI代理做一些有用的事情,這是充滿挑戰且耗時的。使用新的API,例如,代理可以與用戶進行對話,通過Web搜索查找信息,然後編寫摘要 – 全部在一個工作流程中。
值得注意的是,所有開發人員都可以使用響應API以超出標準使用費用的無額外費用。它也是向後兼容的:OpenAI確認它將繼續支持其流行的聊天完成API,以簡單用例,而老年助手API將在2026年中期逐步淘汰,因為其功能被折疊為響應API。
開源代理SDK流線工作流編排
該發布還包括代理SDK,該工具包用於管理一個甚至多個交互AI代理的工作流程。以顯著的舉動,OpenAI使此SDK開源了,使開發人員和企業可以檢查代碼,甚至將非Openai模型集成到其代理系統中。這種靈活性意味著公司可以協調使用OpenAI的GPT-4與另一個由其他AI模型提供動力的代理,所有代理都在同一框架內。
Adents SDK專注於工作流程編排 – 本質上,跟踪代理商在做什麼以及如何完成任務。它為諸如:
- 可配置的代理: 設置具有預定義角色或特定任務的指令的AI代理。
- 智能交接: 基於上下文之間的多個代理或過程之間的任務(例如,一個代理收集數據,然後對其進行分析的另一個代理)。
- 安全性安全: 通過輸入驗證和內容調節工具,確保代理保持在某些範圍內,以防止不必要的輸出。
- 跟踪和可觀察性: 逐步監視和調試代理商的行動的工具,可幫助開發人員了解決策並提高績效。
根據OpenAI的說法,該工具包可以簡化複雜的用例,例如客戶支持機器人,多步研究助理,內容生成工作流程,代碼審核代理或銷售勘探自動化。通過開放SDK,OpenAI還鼓勵社區貢獻和在企業環境中採用,在這種環境中,透明度和自助宿主組件的能力通常很重要。包括Coinbase和Box等公司在內的早期採用者已經嘗試了Adents SDK來構建AI驅動的研究和數據提取工具。
內置工具增強了AI功能
為了使AI代理在開箱即用的功能上更具功能性,OpenAI的響應API配備了三個內置工具,可將AI連接到外部數據和操作。這些工具大大擴展了代理可以做的事情,而不僅僅是生成文本。
啟動時可用的內置工具是:
- 網絡搜索: 允許AI代理執行實時網絡搜索並檢索最新信息,並附有引用的來源。這意味著代理可以使用互聯網上的最新新聞或事實回答問題,並提供透明度的參考。該工具對於需要實時信息的研究助理,購物指南或旅行計劃者等建築代理很有用。
- 文件搜索: 讓代理商快速篩選開發人員提供的大量文檔或數據,以找到相關信息。這實際上是一種私人知識基礎查詢工具 – 代理可以通過查找策略文檔來回答客戶支持問題,或通過從文件庫中檢索段落來幫助法律研究。該工具可以部署在需要參考專有信息的客戶服務機器人或內部公司助理等方案中。
- 計算機使用: 一個新的功能(目前正在研究預覽中),它允許AI代理在計算機上執行操作,就好像它是操作機器的人用戶一樣。該工具由OpenAI的計算機使用代理(CUA)模型提供支持,將AI的意圖轉化為鍵盤和鼠標操作,以導航軟件,網站或其他數字接口。本質上,它可以自動化不容易API的任務 – 例如,將數據輸入傳統系統,單擊Web應用程序進行測試或檢查圖形接口上的信息。
通過整合這些工具,AI代理不僅可以通過問題思考,還可以採取行動 – 是否意味著搜索信息,檢索特定數據或操縱數字環境。這大大擴展了代理的功能,並使其對現實世界應用程序更有用。
Openai設想開發人員將根據需要組合這些工具;例如,代理商可能會使用Web搜索收集公共信息和文件搜索以提取內部數據,然後使用該組合知識起草報告或執行任務。所有這些都可以通過統一的響應API進行策劃,而不是需要單獨的服務或手動集成。
對AI採用和可訪問性的更廣泛影響
分析人士說,此次發射可以通過降低技術障礙來加速在行業中採用AI代理商。對於企業而言,這些新工具的吸引力在於能夠在沒有廣泛的自定義開發的情況下自動化和擴展流程。
如今,使用OpenAI的構建塊,AI代理可能會處理信息檢索,表單處理或跨應用數據輸入(可能需要大量編碼或多個軟件系統)之類的例行任務。例如,內置的搜索工具幾乎立即將AI插入其知識數據庫或Web,並且計算機使用工具提供了一種與沒有API的舊應用程序交互的方法。同時,代理商SDK的開源性質使企業更具控制權,使他們能夠將這些AI代理集成到現有的基礎架構中,甚至根據需要使用不同的AI模型。
Openai的舉動是一項更廣泛的競賽的一部分,旨在使開發人員具有代理建設能力。競爭性的科技公司和初創公司一直在推出自己的AI代理平台,OpenAI的全面工具包可能會幫助它脫穎而出。實際上,在全球自治AI代理商的興趣激增的同時,時間到了 – 例如,中國初創企業莫妮卡(Monica)最近以其代理人的手感引起了人們的關注,聲稱它可以在某些任務中勝過Openai自己的原型代理。通過其平台的開放式關鍵部分和提供內置工具,OpenAI似乎在響應競爭壓力,同時還促進了更廣泛的AI採用。
從可訪問性的角度來看,這些工具可以民主化誰可以構建高級AI系統。較小的公司甚至個人開發人員現在可能會發現創建AI驅動的助手或工作流程而無需大型研究團隊是可行的。集成方法(一個API調用可以處理多個步驟),並且OpenAI文檔中的示例可用性降低了新移民的入口屏障。 OpenAI還為開發人員提供了一個可觀察性界面,以追踪和檢查代理商在做什麼,這對於對AI輸出的調試和建立信任至關重要。預計這種關注可用性和安全性(使用護欄和監視)有望鼓勵更多的企業對AI代理進行試驗,因為他們知道他們有監督和控制。
人工智能代理人可能變得與擁有互聯網的存在一樣普遍和必不可少。 OpenAI的最新工具通過使代理開發更加平易近人,可以通過使開發人員和組織社區能夠建立自己的代理商來幫助將該願景變為現實。