OpenAI推出Operator替您上網辦事

ChatGPT Pro訂戶可使用Operator,代為上網辦事例如購物。OpenAI

OpenAI與Instacart合作,讓Operator整合到Instacart平台,可為用戶選購食品雜貨。Instacart

本報訊

OpenAI本周發布網誌,讓外界了解一款能夠在網頁瀏覽器上導航的新工具Operator。它是由該公司所指的「電腦使用代理人」(CUA)支援,將率先向ChatGPT Pro訂戶推出。

科技新聞網站Engadget報道,OpenAI指出,CUA被訓練與人們在螢幕上所看到的按鈕、選單和文字輸入格等「圖形使用者介面」(GUIs)進行互動,正如真人所做的那樣,「此舉讓它靈活地進行任務,毋須使用作操作系統或網絡應用程式開介面(API)」。

Operator目前版本建立於OpenAI的GPT-4o模型之上,將這種運算法的視覺功能與透過強化學習(RL)訓練的「進階推理」結合起來。OpenAI指出,Operator 具備能力將任務分成多重步驟的計劃,遇上挑戰時適時自我修正。根據OpenAI說法,這種能力代表AI開發的下一個階段。

正如過去研究預覽一樣,OpenAI警告Operator「仍在早期階段和有限制」,又指「還沒有辦法在所有場景下可靠地執行工作」。舉例說,取決於任務和所涉及的用戶介面的複雜性,這個代理人非常受益於用戶多花時間來寫更仔細的提示。

根據The Verge報道,如果Operator執行任務時遇上困難,它就會將控制交給用戶。當網站需要登入認證等敏感資料時,它也會將控制交出來。OpenAI表示,此舉旨在拒絕有害的要求和阻止未經允許的內容。

OpenAI首先向每月繳付200元費用的ChatGPT Pro訂戶開放使用Operator。它又跟生鮮電商平台Instacart等公司合作,在對方平台提供這個代理人,但用戶必須擁有ChatGPT Pro帳號才能進行測試這項整合。

越來越多公司開發AI代理人,可利用網頁瀏覽器或甚至整個作業系統。另一家AI公司Anthropic去年10月推出同類模型Claude 3.5 Sonnet,是首家推出這種功能的公司。谷歌最新也推出Gemini 2.0和Project Mariner,支援類似功能。

科技-三藩市版