用於計算機使用代理的 GPT-5。

社群文章 釋出於 2025 年 8 月 8 日

任務相同,基礎模型也相同,我們只是將思考模型從 GPT-4o 換成了 GPT-5。

左 = 4o,右 = 5。

看 GPT-5 遙遙領先。

推理模型:OpenAI GPT-5

基礎模型:Salesforce GTA1-7B

操作空間:CUA 雲實例 (macOS/Linux/Windows)

任務是:“導航到 {random_url} 並玩遊戲,直到得分達到 5/5”……每個任務都是透過讓 Claude 從預定義的提示列表(多項選擇題、表格填寫或顏色匹配)中生成一個隨機應用來設定的。

在這裡親自嘗試:https://github.com/trycua/cua

文件:https://docs.trycua.com/docs/agent-sdk/supported-agents/composed-agents

社群

註冊登入 以發表評論

© . This site is unofficial and not affiliated with Hugging Face, Inc.