智慧體課程文件

從LLM到AI智慧體

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

從LLM到AI智慧體

我們在這門課程的第一單元中瞭解到,AI智慧體能夠進行規劃和決策。
雖然LLM使得與NPC的互動更加自然,但智慧體AI更進一步,允許角色做出決策、規劃行動並適應不斷變化的環境。

為了說明這種差異,請設想一個經典的RPG遊戲中的NPC

  • 有了LLM:NPC可能會以更自然、更多樣化的方式回答你的問題。這對於對話來說非常棒,但NPC仍然是靜態的,除非你先做些什麼,否則它不會行動。
  • 有了智慧體AI:即使你不直接與NPC互動,NPC也可以決定去尋求幫助、設定陷阱或完全避開你。

這個小小的轉變改變了一切。我們正在從指令碼響應者轉向遊戲世界中的自主行動者。

這一轉變意味著NPC現在可以透過目標導向的行為直接與環境互動,最終帶來更動態和不可預測的遊戲玩法。

智慧體AI賦予NPC以下能力

  • 自主性:根據遊戲狀態做出獨立決策。
  • 適應性:根據玩家行為調整策略。
  • 永續性:記住過去的互動以指導未來的行為。

這將NPC從被動實體(響應你的輸入)轉變為遊戲世界中積極的參與者,為創新遊戲玩法打開了大門。

智慧體的主要限制:目前它很慢

然而,我們現在還不能過於樂觀。儘管智慧體AI潛力巨大,但目前在即時應用中仍面臨挑戰。

推理和規劃過程會引入延遲,使其不適合像《毀滅戰士》或《超級馬里奧兄弟》這樣的快節奏遊戲。

克勞德玩寶可夢為例。如果你考慮到思考所需的令牌數量,再加上行動所需的令牌數量,就會清楚地發現,我們需要完全不同的解碼策略才能實現即時遊戲。

Claude plays Pokémon

大多數遊戲需要以每秒30幀左右的速度執行,這意味著即時AI智慧體需要每秒行動30次,這對於當前的智慧體LLM來說是不可行的。

然而,像《寶可夢》這樣的回合制遊戲是理想的選擇,因為它們允許AI有足夠的時間進行思考並做出戰略決策。

這就是為什麼在下一節中,你將構建自己的AI智慧體,在寶可夢風格的回合制戰鬥中進行對戰,甚至可以親自挑戰它。讓我們開始吧!

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.