Operator AI 智慧體技術詳解與線上自動化應用全指南
Operator 是 OpenAI 推出的首款 AI 智慧體,能夠像人類一樣操作網頁流覽器,並自動執行各種線上任務,例如預訂餐廳、購買機票、填寫表單等。該技術基於 Computer-Using Agent(CUA)模型,結合 GPT-4o 的視覺能力與強化學習的推理能力,通過螢幕截圖識別網頁元素,使用虛擬滑鼠與鍵盤進行操作。目前,Operator 正處於研究預覽階段,僅對 美國的 ChatGPT Pro 用戶 開放,未來將擴展至更廣泛的使用者群體並集成至 ChatGPT。