用於計算機使用代理的 GPT-5。
社群文章 釋出於 2025 年 8 月 8 日
任務相同,基礎模型也相同,我們只是將思考模型從 GPT-4o 換成了 GPT-5。
左 = 4o,右 = 5。
看 GPT-5 遙遙領先。
推理模型:OpenAI GPT-5
基礎模型:Salesforce GTA1-7B
操作空間:CUA 雲實例 (macOS/Linux/Windows)
任務是:“導航到 {random_url} 並玩遊戲,直到得分達到 5/5”……每個任務都是透過讓 Claude 從預定義的提示列表(多項選擇題、表格填寫或顏色匹配)中生成一個隨機應用來設定的。
在這裡親自嘗試:https://github.com/trycua/cua
文件:https://docs.trycua.com/docs/agent-sdk/supported-agents/composed-agents