智慧體課程文件

觀察:整合反饋以反思和調整

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

觀察:整合反饋以反思和調整

觀察是智慧體如何感知其行動結果的方式。

它們提供了關鍵資訊,為智慧體的思維過程提供動力並指導未來的行動。

它們是來自環境的訊號——無論是來自 API 的資料、錯誤訊息還是系統日誌——它們指導下一個思維週期。

在觀察階段,智慧體

  • 收集反饋:接收資料或確認其行動是否成功。
  • 附加結果:將新資訊整合到其現有上下文中,有效地更新其記憶體。
  • 調整其策略:使用此更新的上下文來完善後續的思想和行動。

例如,如果天氣 API 返回資料“部分多雲,15°C,溼度 60%”,則此觀察結果將附加到智慧體的記憶體中(在提示符的末尾)。

然後,智慧體使用它來決定是否需要額外的資訊,或者是否已準備好提供最終答案。

這種迭代地整合反饋確保了智慧體與其目標保持動態一致,根據實際結果不斷學習和調整。

這些觀察可以採取多種形式,從讀取網頁文字到監控機器人手臂的位置。這可以被視為工具“日誌”,它們提供行動執行的文字反饋。

觀察型別 示例
系統反饋 錯誤訊息、成功通知、狀態碼
資料更改 資料庫更新、檔案系統修改、狀態更改
環境資料 感測器讀數、系統指標、資源使用情況
響應分析 API 響應、查詢結果、計算輸出
基於時間的事件 達到截止日期、預定任務完成

結果如何附加?

執行操作後,框架按以下步驟操作

  1. 解析操作以識別要呼叫的函式和要使用的引數。
  2. 執行操作。
  3. 將結果附加觀察結果

我們現在已經學習了智慧體的思想-行動-觀察週期。

如果某些方面仍然有點模糊,請不要擔心——我們將在未來的單元中重新審視和深化這些概念。

現在,是時候透過編寫您的第一個智慧體來將您的知識付諸實踐了!

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.