🦸🏻#9:AI 會記住嗎?記憶在自主工作流中的作用

社群文章 釋出於 2025 年 2 月 2 日

我們探索 SOAR 的遺產、記憶型別、生成式工作流、LLM 中的記憶模式以及 AI 對記憶本身的影響

如果我們談得太久,我就會忘記我們是如何開始的。下次我見到你時,我不會記得這次對話。我甚至不知道我以前是否見過你。”——萊納德·謝爾比《記憶碎片》或……基本上任何大型語言模型 (LLM)

記憶——或者更準確地說,是各種記憶——是代理工作流的關鍵構建塊,與知識和畫像密切相關。但它值得單獨關注,因為它在粒度和功能上與“知識”“畫像”不同。畫像定義了代理如何解釋自己是誰(其特徵、其“化身”)、它做什麼(其行為模型)以及它在哪裡操作(其環境),而知識則提供指導決策的事實或學習表示,記憶則是將這些元素串聯起來並積極參與決策的經驗的動態記錄。記憶已經研究了幾十年,但我們仍然不完全理解如何讓大型語言模型持續記住事物。當前的 AI 系統可以檢索資訊、總結過去的互動,甚至儲存選擇性細節,但它們缺乏一個穩定、結構化的、能夠可靠地隨時間持久存在的記憶。今天,我們有很多工:我們將探索一篇被遺忘的論文,它可能會提供過去的見解,解釋不同型別的記憶及其在代理工作流中的作用,學習這些元件如何在實踐中協同工作,闡明具有記憶模式的模型如何“記住”事物,並問自己:生成式 AI 如何改變記憶本身的性質。讓我們開始吧。


🔳 Turing Post 在 🤗 Hugging Face 上駐紮 -> 點選關注!


本期內容包括什麼?

對於本文中散佈的擬人化術語,我們深表歉意——讓我們同意它們都在““中。

SOAR 在代理記憶系統中的遺產:從認知模型到 AI 代理的橋樑

image/png

1987 年,Allen Newell、Paul Rosenbloom 和 John Laird 提出了 SOAR——一種通用智慧架構。今天,我們仍然為通用智慧的定義爭論不休,但 SOAR 的作者們對此有清晰的看法:他們認為通用智慧是一個系統處理各種認知任務、採用多樣化問題解決方法並不斷從經驗中學習的能力。

當 SOAR 架構被引入時,它是一次大膽的嘗試,旨在建立一個統一的認知理論,將問題解決、學習和記憶融合到一個單一的框架中。SOAR 的解決方案優雅而巧妙,它引入了一種結構化的記憶方法,與現代 AI 代理架構產生了共鳴。透過區分工作記憶(用於即時認知任務)和長期程式記憶(用於學習規則),SOAR 預見了構建能夠隨著時間保留、回憶和完善知識的系統所面臨的挑戰。儘管現代代理 AI 更依賴於統計學習和基於向量的檢索,而非顯式生產規則,但系統如何記憶和改進的基本問題仍然是核心——這使得 SOAR 成為當今 AI 框架概念上的相關祖先。

image/png 圖片來源:原始論文

陳述性知識和程式性知識

SOAR 的主要創新之一是區分了兩種型別的知識。陳述性知識由事實和資訊組成,儲存在工作記憶中,代表系統對其環境的當前理解。相反,程式性知識則作為生產規則嵌入在長期記憶中,規定了系統的行動。這種清晰的分離使 SOAR 能夠管理即時問題解決任務,同時為未來使用建立持久的策略儲存庫。

另一個極其重要的特性是 →

分塊

當系統成功解決問題時,它會將該經驗整合到一條新的生產規則中。這種“分塊”過程有效地將複雜的解題過程壓縮成可重用的知識塊,從而減少未來的計算負荷並提高效率。透過內化成功的策略,SOAR 不斷完善其解決問題的能力,就像人類從重複經驗中學習一樣。

子目標和分層問題解決

SOAR 的另一個深遠影響是其自動子目標設定。當 SOAR 遇到障礙時——即其現有知識不足以解決問題的情況——它會生成一個新的子目標來克服障礙。這種將複雜問題分解為更簡單、更易於管理的部分的機制類似於人類認知中的分層問題解決方法。SOAR 中的子目標概念影響了後來的發展,特別是在分層強化學習和多智慧體協作框架等領域。

SOAR 的遺產及其與現代 AI 的共鳴

SOAR 的結構化方法標誌著與早期碎片化認知模型的決裂。透過整合工作記憶、長期記憶和學習,它成為認知架構的基石,並影響了通用智慧的方法。今天,由深度學習、大型語言模型 (LLM) 和強化學習驅動的 AI 系統面臨的挑戰,與 SOAR 最初關於記憶、學習和問題分解的問題相呼應。

某些現代 AI 技術類似於 SOAR 的子目標機制的某些方面,特別是在分層規劃和任務分解方面。同樣,微調、持續學習和檢索增強生成等方法也與 SOAR 利用過去經驗提高效能的目標相似,儘管它們的機制不同。

SOAR 對陳述性知識和程式性知識的結構化處理預示了現代神經符號 AI,它旨在將符號推理與神經適應性相結合。這種綜合強調了結構化記憶和動態學習在追求通用智慧方面的持久相關性。

雖然深度學習一度使 SOAR 的結構化方法黯然失色,但 AI 研究人員現在正在重新審視其許多核心思想。隨著 AI 代理在記憶、檢索和適應性方面面臨挑戰,SOAR 的架構看起來不再像一個遺蹟,而更像是下一波自主 AI 的前身。

另一項受 Allen Newell 工作影響的重要研究是 ACT-R 架構,以及在此基礎上約翰·R·安德森 (John R. Anderson) 和丹尼爾·博塞爾 (Daniel Bothell) 的《心智綜合理論》(An Integrated Theory of the Mind)。我們不會在本文中深入探討,但您可以在“資源”部分找到該著作的連結。

我們今天使用的記憶型別

當今 AI 代理處理記憶的方式並非單一過程——它是一個由不同層組成的結構化系統,每層都服務於獨特的目的。有些記憶隨時間持久存在,塑造長期行為,而另一些則是短暫的,僅用於手頭的即時任務。

長期記憶:持久知識的基礎

image/png

長期記憶的核心是兩種不同的型別:**顯性(陳述性)**記憶,它涉及結構化、可檢索的知識;以及**隱性(非陳述性)**記憶,它能從過去的經驗中學習。

**顯性記憶**允許 AI 回憶事實、規則和結構化知識。在此類別中,**語義記憶**負責儲存一般真理和常識。這就是為什麼 AI 系統可以自信地陳述:“埃菲爾鐵塔在巴黎”或“狗是哺乳動物”。這種型別的記憶為基於知識的 AI 應用(例如搜尋引擎和聊天機器人)奠定了基礎。

接著是**情景記憶**,它更具個性化——它捕捉特定的事件和經驗,允許代理回憶過去互動的上下文。如果客服 AI 記得使用者以前曾要求退款,它就可以相應地調整其回覆,使互動感覺更直觀和人性化。

在《記憶碎片》中,萊納德·謝爾比的掙扎在於情景記憶喪失。他記得受傷前關於自己生活的事實(這與語義記憶有關),但他無法儲存新的情景記憶,這意味著每一次新的互動或事件都會在幾分鐘內消失。他對筆記、拍立得照片和紋身的依賴,反映了一種外部化、臨時性的記憶系統——試圖彌補他無法編碼新的個人經歷的能力。即使有了記憶功能,大型語言模型 (LLM) 也不會儲存真正的情景記憶——它們只是檢索模式並總結過去的互動。

另一方面,**隱性記憶**允許 AI 發展本能。它由**程式記憶**驅動,這有助於代理在不需要顯式回憶的情況下學習技能。想想一輛自動駕駛汽車,在經過數千英里的訓練後,它提高了車道保持能力。這輛車不需要“記住”每一個場景——它對如何導航道路形成了一種直觀的理解。當你真正體驗到這一點時——這相當不可思議。

短期記憶:當下時刻的力量

image/png

長期記憶支援增長和適應,而短期記憶則確保代理在即時互動中保持響應能力。

上下文視窗定義了 AI 模型在單次互動中可以保留多少過去的輸入。這個限制在大型語言模型 (LLM) 中至關重要——如果給 AI 一個很小的上下文視窗,它會忘記你幾分鐘前說過的話。擴充套件這個視窗,它就可以在更長的對話中保持連貫性,使回覆更連貫和自然。當前許多研究都集中在擴充套件和最佳化上下文視窗。我們將在未來的文章中探討最引人入勝的進展。

接著是工作記憶,它在多步推理和決策中起著至關重要的作用。正如人類使用工作記憶同時記住多個想法——比如解決數學問題時——AI 代理也依賴它同時處理多個輸入。這對於規劃等複雜任務尤其重要,因為代理需要在做出決定之前平衡不同的資訊片段。

融會貫通

image/png 圖片來源:Richardson Gunde

這些不同型別記憶之間的相互作用使得現代 AI 代理越來越有效。長期記憶讓它們從過去學習,短期記憶確保它們專注於當下,而工作記憶則讓它們同時處理多個輸入。這些元件共同塑造了 AI 的自主行動、智慧適應以及隨時間提供更有意義互動的能力。

隨著 AI 系統的不斷發展,完善它們管理記憶的方式將是解鎖更高階自主工作流的關鍵——這些工作流將感覺更自然、更有能力,並最終更智慧。


現在,讓我們更具體一些。理解 AI 代理如何處理記憶至關重要,但這些元件在實踐中是如何協同工作的呢?

記憶與生成式代理

記憶驅動的代理行為最引人注目的例子之一,可以在谷歌研究和斯坦福大學研究人員撰寫的論文《生成式代理:人類行為的互動式模擬》(Generative Agents: Interactive Simulacra of Human Behavior) 中找到。在這項工作中,記憶在使代理能夠模擬可信的、類人行為方面發揮著至關重要的作用。所提出的架構將記憶作為動態元件,允許代理隨著時間的推移觀察、儲存、檢索和合成經驗,以指導其互動和決策。

image/png 圖片來源:原始論文

這裡的記憶系統被構建為記憶流,代理持續以自然語言記錄它們的經驗。這些記憶不是靜態的,而是定期檢索併合成更高層次的思考,允許代理對自身、他人和環境得出更廣泛的結論。

記憶檢索受三個關鍵因素影響

  • **新近性**(最近的記憶更容易訪問),
  • **重要性**(高度重要的事件被優先考慮),
  • **相關性**(只有與上下文相關的資訊才會被用於決策)。

**反思**使代理能夠從經驗中進行概括,形成影響未來行為的見解。例如,一個反覆創作音樂的代理可能會發展出對自身作為一名充滿激情的音樂家的自我認知。這個過程增強了長期連貫性,幫助代理以符合其過去互動和不斷發展的人際關係的方式行事。

**規劃**透過允許代理根據其先前的經驗預測未來行動來進一步整合記憶。代理生成每日日程表,並將其細化為詳細的行動序列,根據新的觀察遞迴地調整它們。

這項研究表明,這種記憶驅動的方法會帶來湧現的社會行為,例如資訊傳播、關係形成和協調活動。然而,仍然存在侷限性,包括潛在的記憶檢索失敗、幻覺以及從底層語言模型繼承的偏差。

最終,記憶是代理可信度的基礎,它能夠實現超越單一時間點語言模型輸出的細緻、動態的互動,使生成式代理能夠在互動式應用程式中模擬社會行為。太引人入勝了!


談到代理工作流中的記憶,我們不能忽視我們現代的日常體驗——更準確地說,如果 ChatGPT 沒有明確被告知你孩子的年齡,它是如何記住你孩子六歲的呢?!即使你告訴過它,它又是如何記住的,這些資訊儲存在哪裡呢?

ChatGPT 如何“記住”事物:理解記憶模式

大多數 AI 聊天模型都具有《記憶碎片》中萊納德·謝爾比的記憶——一旦對話結束,一切都將重置。這對於快速問答來說沒問題,但當你想要連續性時,或者當你想讓它記住你的寫作風格時,就會讓人感到沮喪。記憶模式透過讓 ChatGPT 在會話之間保留關鍵細節來改變這一點,使得互動感覺更像是與一個真正瞭解你的助手交談。這既讓人毛骨悚然,又讓你感到被傾聽。它也縮短了你與 AI 助手的互動時間。

工作原理

啟用記憶模式後,ChatGPT 不會儲存完整的對話記錄,而是提取關鍵事實和模式。比如說你經常提到你在寫一本關於公民外交的書——它不會記住每一次提及,而是可能儲存“使用者對公民外交感興趣,正在寫一本關於它的書”。這樣,下次你再次提及它時,模型就不會從零開始。

它還具有選擇性——它不會記住你說的所有內容,只記住重複的或明確確認的(例如,“記住我正在撰寫新聞摘要”)。這能保持記憶的整潔和相關性。

記憶儲存在哪裡?

它並非儲存在模型內部。相反,彙總資料安全地儲存在 OpenAI 的伺服器上,採用向量嵌入——一種緊湊的數值表示形式,可以高效檢索。當你開始一個新的會話時,系統會搜尋相關的歷史資料並將其整合到對話中,從而營造出連貫性的錯覺。

開發者承諾記憶模式並非黑箱操作。有時你可能會對此產生疑問,覺得你的聊天記錄被記住的程度有些尷尬。但你隨時可以檢視、更新或刪除聊天中儲存的資訊。無論如何,資料都以抽象形式儲存,這意味著沒有完整的聊天記錄——只有關鍵的見解。

總結:AI 對人類記憶的影響

這不是一個結論,而是一些思考。在撰寫本文時,我偶然發現了一篇與代理系統中的記憶沒有直接關聯,但提供了一個關於生成式 AI 如何改變記憶本身的性質的引人入勝且有些令人不安的視角的論文。在《AI 與記憶》(AI and Memory) 中,安德魯·霍斯金斯 (Andrew Hoskins) 認為,AI 不僅僅是擴充套件人類記憶或幫助回憶;相反,它將記憶從傳統束縛中解脫出來,創造了他所謂的“第三種記憶方式”。在這種正規化中,記憶不再是一種檢索行為,而是一個持續的重建過程,其中從未實際經歷過的過去被生成、修改,並被呈現得彷彿真實存在。

令我印象深刻的是他論證中 AI 如何構建霍斯金斯所稱的“對話性過去”——一種不斷演變的數字記憶表徵,獨立於人類代理存在。透過大型語言模型 (LLM) 和 AI 驅動的服務,過去的事件不斷被重新詮釋和混編,模糊了曾經真實發生和現在人工製造之間的界限。這在 AI 生成的“死亡機器人”興起中尤為明顯,它們允許與已故之人的數字版本進行互動,從而引發關於同意、真實性以及數字遺產永久性的倫理和哲學問題。

除了個體記憶,霍斯金斯還探討了這種 AI 驅動的轉變對集體歷史敘事的更廣泛影響。隨著 AI 重塑社會記錄、記憶甚至遺忘的方式,記憶的傳統標誌——例如檔案記錄、個人回憶和口述歷史——越來越面臨被 AI 生成的替代品取代的風險,這些替代品可能缺乏生活經驗的基礎。他警告說,隨著 AI 以未經同意的方式重建和重新利用過去,人類對記憶的掌控力正在逐漸被侵蝕。

雖然他的文章側重於 AI 和記憶的社會文化方面,但它提出了與代理系統中記憶討論相關的關鍵問題。正如 AI 正在改變人類記憶一樣,它也在重新定義自主系統如何儲存、檢索和利用知識。如果 AI 模型能夠生成記憶而不僅僅是檢索記憶,這對依賴過去互動來指導未來決策的代理工作流意味著什麼?我們如何區分 AI 的學習經驗和 AI 生成的過去事件重建?這些都是我們在探索記憶在 AI 驅動系統中的作用時需要考慮的關鍵因素,因為儲存知識和動態建立的過去之間的區別可能會變得越來越模糊。這促使我們進一步反思 AI 在塑造集體記憶方面日益增長的作用。

“記憶可以改變房間的形狀;它可以改變汽車的顏色。記憶也可能被扭曲。它們只是一種解釋,不是記錄,如果你掌握了事實,它們就無關緊要。”——萊納德·謝爾比《記憶碎片》……還是 AI?


📨 如果您想直接在收件箱中收到我們的文章,請在此訂閱


撰寫本文所使用的資源

圖靈郵報資源

社群

註冊登入 評論

© . This site is unofficial and not affiliated with Hugging Face, Inc.