智慧體課程文件

觀察：整合反饋以反思和調整

Agents 課程

第 0 單元：課程歡迎辭

直播 1. 課程運作方式及問答

單元 1. 智慧體簡介

簡介什麼是智慧體？小測驗 1 什麼是大型語言模型？訊息和特殊標記什麼是工具？小測驗 2 透過思想-行動-觀察週期理解人工智慧智慧體思想、內部推理和 Re-Act 方法行動，使智慧體能夠與其環境互動觀察：整合反饋以反思和調整虛擬智慧體庫讓我們使用 smolagents 建立第一個智慧體第一單元最終測驗結論

單元 2. AI 智慧體框架

單元 2.1 The smol-agents 框架

單元 2.2 The LlamaIndex 框架

單元 2.3 The LangGraph 框架

單元 3. Agentic RAG 用例

單元 4. 最終專案 - 建立、測試和認證你的智慧體

附加單元 1. 為函式呼叫微調大語言模型

附加單元 2. 智慧體的可觀測性與評估

附加單元 3. 在寶可夢遊戲中使用智慧體

加入 Hugging Face 社群

並獲得增強的文件體驗

在模型、資料集和 Spaces 上進行協作

透過加速推理獲得更快的示例

切換文件主題

開始使用

觀察：整合反饋以反思和調整

觀察是智慧體如何感知其行動結果的方式。

它們提供了關鍵資訊，為智慧體的思維過程提供動力並指導未來的行動。

它們是來自環境的訊號——無論是來自 API 的資料、錯誤訊息還是系統日誌——它們指導下一個思維週期。

在觀察階段，智慧體

收集反饋：接收資料或確認其行動是否成功。
附加結果：將新資訊整合到其現有上下文中，有效地更新其記憶體。
調整其策略：使用此更新的上下文來完善後續的思想和行動。

例如，如果天氣 API 返回資料“部分多雲，15°C，溼度 60%”，則此觀察結果將附加到智慧體的記憶體中（在提示符的末尾）。

然後，智慧體使用它來決定是否需要額外的資訊，或者是否已準備好提供最終答案。

這種迭代地整合反饋確保了智慧體與其目標保持動態一致，根據實際結果不斷學習和調整。

這些觀察可以採取多種形式，從讀取網頁文字到監控機器人手臂的位置。這可以被視為工具“日誌”，它們提供行動執行的文字反饋。

觀察型別	示例
系統反饋	錯誤訊息、成功通知、狀態碼
資料更改	資料庫更新、檔案系統修改、狀態更改
環境資料	感測器讀數、系統指標、資源使用情況
響應分析	API 響應、查詢結果、計算輸出
基於時間的事件	達到截止日期、預定任務完成

結果如何附加？

執行操作後，框架按以下步驟操作

解析操作以識別要呼叫的函式和要使用的引數。
執行操作。
將結果附加為觀察結果。

我們現在已經學習了智慧體的思想-行動-觀察週期。

如果某些方面仍然有點模糊，請不要擔心——我們將在未來的單元中重新審視和深化這些概念。

現在，是時候透過編寫您的第一個智慧體來將您的知識付諸實踐了！

< > 在 GitHub 上更新

←行動，使智慧體能夠與其環境互動虛擬智慧體庫→

© . This site is unofficial and not affiliated with Hugging Face, Inc.