智慧體課程文件
觀察:整合反饋以反思和調整
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
觀察:整合反饋以反思和調整
觀察是智慧體如何感知其行動結果的方式。
它們提供了關鍵資訊,為智慧體的思維過程提供動力並指導未來的行動。
它們是來自環境的訊號——無論是來自 API 的資料、錯誤訊息還是系統日誌——它們指導下一個思維週期。
在觀察階段,智慧體
- 收集反饋:接收資料或確認其行動是否成功。
- 附加結果:將新資訊整合到其現有上下文中,有效地更新其記憶體。
- 調整其策略:使用此更新的上下文來完善後續的思想和行動。
例如,如果天氣 API 返回資料“部分多雲,15°C,溼度 60%”,則此觀察結果將附加到智慧體的記憶體中(在提示符的末尾)。
然後,智慧體使用它來決定是否需要額外的資訊,或者是否已準備好提供最終答案。
這種迭代地整合反饋確保了智慧體與其目標保持動態一致,根據實際結果不斷學習和調整。
這些觀察可以採取多種形式,從讀取網頁文字到監控機器人手臂的位置。這可以被視為工具“日誌”,它們提供行動執行的文字反饋。
觀察型別 | 示例 |
---|---|
系統反饋 | 錯誤訊息、成功通知、狀態碼 |
資料更改 | 資料庫更新、檔案系統修改、狀態更改 |
環境資料 | 感測器讀數、系統指標、資源使用情況 |
響應分析 | API 響應、查詢結果、計算輸出 |
基於時間的事件 | 達到截止日期、預定任務完成 |
結果如何附加?
執行操作後,框架按以下步驟操作
- 解析操作以識別要呼叫的函式和要使用的引數。
- 執行操作。
- 將結果附加為觀察結果。
我們現在已經學習了智慧體的思想-行動-觀察週期。
如果某些方面仍然有點模糊,請不要擔心——我們將在未來的單元中重新審視和深化這些概念。
現在,是時候透過編寫您的第一個智慧體來將您的知識付諸實踐了!
< > 在 GitHub 上更新