深度強化學習課程文件

值得嘗試的有趣環境

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

值得嘗試的有趣環境

在這裡,我們提供了一些有趣的強化學習環境,您可以在其中訓練您的智慧體

DIAMBRA Arena

diambraArena

DIAMBRA Arena 是一個軟體包,其中包含一系列用於強化學習研究和實驗的高質量環境。它為流行的街機模擬影片遊戲提供了標準介面,提供了完全符合 OpenAI Gym/Gymnasium 格式的 Python API,使其採用流暢而直接。

它支援所有主流作業系統(Linux、Windows 和 MacOS),並且可以透過 Python PIP 輕鬆安裝。它完全免費使用,使用者只需在官方網站註冊即可。

此外,它的 GitHub 儲存庫提供了涵蓋主要感興趣用例的示例集合,只需幾個步驟即可執行。

主要功能

所有環境都是回合制強化學習任務,具有離散動作(遊戲手柄按鈕)和由螢幕畫素以及附加數值資料(RAM 值,如角色生命條或角色舞臺側面)組成的觀察結果。

它們都支援單人(1P)和雙人(2P)模式,使其成為探索標準強化學習、競爭性多智慧體、競爭性人機、自玩、模仿學習和人在迴路的完美資源。

介面遊戲是從最流行的格鬥復古遊戲中選擇的。雖然它們共享相同的基礎機制,但它們提供了不同的挑戰,具有特定功能,例如不同型別和數量的角色、如何執行連擊、生命條充能等。

DIAMBRA Arena 旨在最大限度地相容所有主要的強化學習庫。它原生提供了與兩個最重要的軟體包的介面:Stable Baselines 3Ray RLlib,而 Stable Baselines 也可用但已棄用。它們的用法在官方文件DIAMBRA Agents 示例儲存庫中都有說明。它可以透過類似的方式輕鬆地與任何其他軟體包連線。

競賽平臺

DIAMBRA 還提供了一個與 Hugging Face Hub 完全整合的競賽平臺,您可以在其中提交您訓練的智慧體,並在史詩般的影片遊戲錦標賽中與全球其他程式設計師競爭!

它設有一個公共排行榜,使用者根據其智慧體在我們不同環境中獲得的最佳分數進行排名。

它還提供了根據您的智慧體效能解鎖酷炫成就的可能性。

提交的智慧體將接受評估,其回合將在 DIAMBRA Twitch 頻道上進行直播。

參考資料

要開始使用此環境,請檢視以下資源

MineRL

MineRL

MineRL 是一個 Python 庫,它提供了一個 Gym 介面,用於與影片遊戲 Minecraft 互動,並附帶人類遊戲玩法資料集。每年都會有與此庫相關的挑戰。檢視網站

要開始使用此環境,請檢視以下資源

DonkeyCar 模擬器

Donkey Car Donkey 是一個用於愛好遙控汽車的自動駕駛汽車平臺。此模擬器版本基於 Unity 遊戲平臺構建。它使用其內部物理和圖形,並連線到 Donkey Python 程序,以使用我們訓練的模型控制模擬的 Donkey(汽車)。

要開始使用此環境,請檢視以下資源

星際爭霸 II

Alphastar

星際爭霸 II 是一款著名的即時戰略遊戲。DeepMind 曾使用這款遊戲進行深度強化學習研究,其成果為 Alphastar

要開始使用此環境,請檢視以下資源

作者

本節由 Thomas Simonini 撰寫

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.