🦸🏻#6: 剖析在智慧體工作流中的作用

社群文章 釋出於 2025 年 1 月 27 日

探索剖析如何塑造角色、意識和決策


🔳 Turing Post 在 🤗 Hugging Face 上駐紮 -> 點選關注!


引言

在人工智慧智慧體的動態世界中,**剖析(profiling)、知識**和**記憶**緊密交織,塑造著這些系統如何感知、適應並響應其環境和任務。剖析——在智慧體設計中很少被單獨歸類——是智慧體靜態能力與動態適應性之間的橋樑,其基礎是預設知識和更具適應性的記憶系統。它是智慧代理能夠建立與其互動的環境、使用者和任務的詳細“畫像”的機制。透過綜合智慧體“已知”(預設知識)和“記憶”(歷史和即時資料),剖析驅動著細緻的決策、個性化互動和無縫任務執行。然後你再加入**推理和規劃、反思、行動和溝通**——瞧——整個智慧體工作流就完成了。

在本期中,**我們將深入探討近期和早期研究論文,這些論文對“智慧體剖析”的概念提供了引人入勝的視角。**剖析應被視為智慧體工作流中一個獨特且關鍵的核心組成部分,因為它充當著人機溝通的至關重要層。我們將重點介紹一些被遺忘已久的研究,並探索它們如何為當代方法提供資訊。準備好了嗎?我們開始吧。

本期內容包括什麼?

- 剖析:理解周圍的世界以及如何行動

  • 1. 我是誰?智慧體化身
  • 2. 我做什麼?智慧體行為 (BDI 模型)
  • 3. 我在哪裡?智慧體環境
  • 4. 我有多好?智慧體效能
  • 5. 我能走多遠?智慧體資源
    • 剖析:智慧行為的基礎*
    • 總結性思考*
    • 撰寫本文所使用的資源(所有連結都在該部分中)*

對於本文中散佈的擬人化術語,我們深表歉意——讓我們同意它們都帶引號。 (在“資源”部分,我們提供了一篇關於擬人化的論文,這是對話系統設計的必讀之作。)


📨 如果您想直接在收件箱中收到我們的文章,請在此訂閱


剖析:理解周圍的世界以及如何行動

“剖析(Profiling)”並不是一個非常常見的術語,但我們希望堅持使用它,因為它完美地概括了智慧體為了瞭解其環境和自身在其中的角色所需完成的一切。剖析是觀察、分析和解釋智慧體操作環境的過程。這不僅僅限於識別物理或數字環境——剖析還包括評估效能指標和理解行為模式,從而建立一種多維意識,使智慧體能夠智慧地行動。簡而言之,剖析就是關於意識。我們如何解開這種意識呢?透過提出所有正確的問題 →

我是誰?智慧體化身

在他們富有洞察力的論文《生成式智慧體:人類行為的互動式模擬物》中,斯坦福大學和谷歌的研究人員使用了“智慧體化身”一詞,它代表了生成式智慧體在虛擬沙盒世界中的視覺和互動式實體,將其模擬行為與可觀察的行動和對話聯絡起來。

image/png

這個剖析,這個化身,賦予了智慧體其“性格”並定義了其角色,從而決定了它的行為。

2. 我做什麼?智慧體行為 (BDI 模型)

理解智慧體行為始於探索智慧系統如何平衡即時反應與長期目標。**信念-慾望-意圖 (BDI)** 模型提供了一種有影響力的方法來設計能夠深思熟慮、規劃和適應的智慧體。該模型將智慧體決策分為三個核心心理狀態:

  • **信念**:智慧體對世界的瞭解或假設。
  • **慾望**:智慧體試圖實現的目標或結果。
  • **意圖**:智慧體為追求其慾望而承諾的計劃。

BDI 模型的哲學根源可追溯到 **Michael Bratman** 及其 1987 年的著作《意圖、計劃與實踐理性》。Bratman 將意圖引入作為信念和慾望之間的關鍵聯絡,強調理性智慧體如何隨著時間協調其行動,同時適應新的資訊和環境。

從哲學到實踐

Bratman 的理論見解啟發了研究人員 **Anand Rao** 和 **Michael Georgeff** 在 20 世紀 90 年代早期進行了進一步發展。他們在《情境推理系統驗證的模型理論方法》一作中將 BDI 模型形式化為一個計算框架,為構建能夠在動態環境中執行的理性智慧體建立了結構。他們的工作旨在:

  • 在不確定性下模擬決策。
  • 平衡**反應性**(響應即時變化)與**深思熟慮**(追求長期目標)。
  • 在保持行為邏輯一致性的同時實現適應性。

雖然 BDI 並非智慧體唯一的框架,但其對心理狀態表徵和理性決策結構化的關注,已對學術研究和實際應用產生了影響。

情境推理與承諾

Rao 和 Georgeff 擴充套件了該模型,以解決**情境推理**的複雜性,其中智慧體在不斷變化和不可預測的環境中執行。他們引入了智慧體在可能世界的分支路徑中導航的思想,這些選擇由其信念、行動和環境不確定性所塑造。

他們工作的核心是**承諾**的概念,它決定了智慧體如何堅持追求目標:

  • **盲目承諾**:堅持直到成功或失敗確定。
  • **專一承諾**:堅持除非實現目標不可能。
  • **開放式承諾**:適應變化的慾望或信念。

這些區別使智慧體能夠在決心和靈活性之間取得平衡,這是在現實世界場景中有效運作的關鍵方面。

驗證與多智慧體系統

隨著智慧體開始處理安全關鍵應用,驗證其行為的能力變得至關重要。Rao 和 Georgeff 引入了**分支時間 BDI 邏輯**,以確保智慧體遵守特定屬性,例如實現目標或避免有害結果。他們的方法實現了高效的**模型檢查**,為驗證智慧體行為提供了線性或多項式時間複雜度。

Wooldridge 和 Jennings 後來在其開創性著作《智慧體:理論與實踐》中,將 BDI 框架擴充套件到**多智慧體系統**,強調了協調、談判和合作等社交能力。這一演變反映了智慧體工作流日益複雜的特性,其中智慧體不僅與環境互動,還相互互動,經常共享信念並協作以實現重疊目標。

雖然 BDI 只是眾多方法中的一種,但其對理性和決策制定的強調為理解和設計智慧體行為提供了寶貴的視角。它闡明瞭智慧體不僅能行動,還能圍繞其行動進行推理,以實現有意義的目標。

行為剖析側重於根據歷史資料和觀察到的模式來理解和預測行為。這是建立在互動中感覺更少機械化、更直觀的智慧體的關鍵一步。例如,推薦引擎會剖析使用者的瀏覽歷史,以建議他們可能喜歡的產品。類似地,虛擬助手根據使用者輸入預測多步任務中的下一步。

  • **實際工具**:行為剖析已在 AutoGPT 和 BabyAGI 等現代系統中找到了實際應用。這些平臺利用歷史資料和高階演算法使智慧體更具適應性和響應性。例如:
    • **AutoGPT**:剖析使用者提供的目標並迭代地完善其行為。
    • **BabyAGI**:從先前的任務完成情況中學習,以最佳化未來的任務執行。

3. 我在哪裡?智慧體環境

智慧體並非在真空中行動/表現。環境剖析成為智慧體設計的核心。如果不能清晰地理解周圍環境,智慧體就無法有效地解釋或與其環境互動。無論是在物理世界中,如天空中的無人機,還是在數字空間中,如金融交易演算法,環境剖析都提供了它們運作所需的態勢感知。

最常用的框架之一(在大學中教授)是 **PEAS** – **Performance measure(效能指標)、Environment(環境)、Actuators(執行器)和 Sensors(感測器)** 的縮寫。它是一個簡單而強大的框架,用於人工智慧中分解智慧體在其世界中的運作方式。該術語由 **Stuart Russell** 和 **Peter Norvig** 在他們的教科書《人工智慧:現代方法》中引入。

PEAS 回答四個關鍵問題:

  1. **目標是什麼?** 這是**效能指標**。什麼定義了智慧體的成功?例如,吸塵機器人效能的衡量標準可能是地板清潔程度和能源使用效率。對於自動駕駛汽車,則是安全性、燃油效率和準時到達。
  2. **智慧體在哪裡運作?** 這就是**環境**。是整潔的家,雜亂的倉庫,還是繁忙的城市街道?理解環境至關重要,因為它定義了智慧體將面臨的挑戰。
  3. **它如何作用於世界?** 這些是**執行器**,也就是智慧體用來實現目標的工具。Roomba 使用輪子和刷子進行清潔,而聊天機器人透過生成文字來“行動”。
  4. **它如何感知世界?** 這就是**感測器**,它們為智慧體提供有關其環境的資訊。對於吸塵器,感測器檢測汙垢並避開障礙物。對於自動駕駛汽車,則是攝像頭、雷射雷達和 GPS,提供關於周圍環境的持續更新。

這是交易演算法的 PEAS:

image/png

4. 我有多好?智慧體效能

是的,效能是 PEAS 的第一個字母,但自從生成式人工智慧興起以來,效能評估和基準測試已發展成為一個成熟的產業,推動了人工智慧研究和開發的創新和競爭。然而,它們也已成為研究人員和實踐者共同的持久難題。為什麼?因為雖然像 MMLU 或 HumanEval 這樣的基準提供了共同的衡量標準,但它們往往過分簡化了人工智慧智慧體效能的細微現實。

Kapoor 等人關於《重要的 AI 智慧體》的研究直接觸及了這種緊張關係。他們的論文揭示了基準有時如何激勵狹隘的最佳化而非更廣泛的能力,從而製造出一種卓越的幻象。例如,像 STeP 這樣的系統利用 WebArena 中特定於基準的模式,而不是展示真正的理解——這是一個基準被濫用而非真正反映實用性的明顯案例。同樣,論文中探討的成本-準確性權衡突出顯示了排行榜如何傾向於優先考慮炫目的效能指標,同時忽略了計算和現實世界的可行性。

這個日益增長的“基準測試行業”創造了一個悖論:它在推動快速進步的同時,也引發了一場追求可能無法轉化為實際效果的最高指標的競賽。Kapoor 等人呼籲整合成本效率指標並採用標準化、可復現的實踐,這是解決這一難題的關鍵一步——使基準測試行業更符合人工智慧部署和創新的實際目標。

5. 我能走多遠?智慧體資源

資源監控對於智慧體至關重要,它使智慧體能夠評估其計算、網路和物理限制。通常,環境剖析始於資源監控。此過程為決策提供資訊,確保智慧體有效地適應動態環境。現代 AI 智慧體必須仔細平衡其能力與可用資源,以維持最佳效能。這種監控遠不止簡單的容量檢查——它是一個複雜的指標、閾值和動態調整系統,可確保在不同負載下平穩執行。

核心資源指標

  • 計算資源
    • 記憶體管理:智慧體跟蹤 RAM 使用情況和記憶體分配模式,實施垃圾回收策略以防止記憶體洩漏並保持響應能力
    • 處理能力:監控 CPU/GPU 利用率、執行緒管理和處理佇列長度,以防止瓶頸
    • 儲存需求:跟蹤 I/O 操作、快取效率和儲存容量,以最佳化資料訪問模式
  • 網路資源
    • API 管理:監控速率限制、配額使用和請求延遲,以防止服務中斷
    • 頻寬利用率:跟蹤資料傳輸速率和網路擁塞,以最佳化通訊效率
    • 連線健康狀況:監控網路穩定性和錯誤率,以確保可靠執行
  • **物理資源**(針對具身智慧體)
    • 電源管理:電池電量、充電週期和能耗模式
    • 硬體健康:感測器校準、執行器磨損和元件溫度
    • 環境影響:資源消耗足跡和效率指標

image/png

剖析在智慧行為中的作用

**剖析**不僅僅是技術上的必要性——它是連線智慧體**知識、記憶、推理和行動**的**連線組織**。透過描繪智慧體的身份、行為、環境、效能和資源,剖析為智慧、情境感知系統奠定了基礎。它將靜態工具轉化為動態協作者,能夠進行細緻的決策和有意義的互動。

總結

隨著智慧體變得越來越複雜,它們的各個元件必須無縫協作,以確保精確性、適應性和有意義的互動。**剖析使智慧體能夠理解其目的,而知識加深了它們的專業技能,記憶儲存了它們的經驗,推理和規劃指導了它們的策略,反思完善了它們的過程,行動則將它們的決策變為現實**。這些相互關聯的元素構成了智慧體工作流的支柱,推動了人工智慧從僵硬的工具向動態協作系統的演變。

在接下來的幾期中,我們將繼續單獨剖析智慧體系統和工作流的核心組成部分,探索每個部分如何促進智慧體的建立。從複雜的記憶體系統設計到戰略性的推理和規劃能力,我們將揭示塑造人工智慧未來的最新創新和挑戰。

站在技術創新和以人為本的設計的交匯點,隨著生成式人工智慧的加速發展,人工智慧智慧體的可能性是巨大的。透過對其核心元件的深思熟慮的整合,這些系統有望改變我們互動、學習和共同實現目標的方式。

撰寫本文所使用的資源:


感謝您的閱讀!📨 如果您想直接在收件箱中收到我們的文章,請在此訂閱


社群

註冊登入 以評論

© . This site is unofficial and not affiliated with Hugging Face, Inc.