訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
OpenAI發佈全新AI代理「Operator」 可操作網頁執行複雜任務
CTimes籃貫銘
獲取產業訊息零時差!立即訂閱電電公會電子報。

OpenAI日前推出名為 「Operator」的AI代理服務,它能夠像人類一樣操作網頁瀏覽器,執行包括預訂旅行、訂購外賣、填寫表單等在內的各種線上任務,甚至可以同時處理多項任務。

Operator建立在OpenAI的多模態大型語言模型GPT-4o之上,並結合了名為 ?Computer-Using Agent (CUA)?的全新模型。CUA模型賦予Operator與圖形用戶界面(例如按鈕、文字框、菜單)互動的能力,使其能夠像人類一樣瀏覽網頁、點擊按鈕、輸入文字等,從而完成各種線上任務。

OpenAI聲稱Operator的性能超越了Anthropic的Computer Use和Google DeepMind的Mariner等競爭對手的類似工具。在一系列業界基準測試中,CUA 在完成線上任務方面的得分均高於 Computer Use 和 Mariner。

OpenAI 計劃在未來利用API向開發者開放CUA的功能,以便他們構建自己的應用程式,進一步擴展Operator的應用範圍,並推動AI代理技術的發展。

雖然Operator目前仍處於實驗階段,但它展現了AI技術的巨大潛力。可以預見未來將會有更多像Operator這樣的AI代理出現,影響人們的生活和工作方式。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。